loading annotations into memory... loading annotations into memory... Done (t=1.53s) creating index... index created! Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... Done (t=1.55s) creating index... loading annotations into memory... index created! Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... Done (t=1.51s) creating index... index created! Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... Done (t=3.62s) creating index... index created! Done (t=1.59s) creating index... loading annotations into memory... index created! Done (t=1.59s) creating index... index created! Done (t=3.66s) creating index... Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json index created! Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... loading annotations into memory... Done (t=1.78s) creating index... index created! loading annotations into memory... Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... loading annotations into memory... Done (t=1.51s) creating index... index created! Done (t=3.58s) creating index... index created! Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... loading annotations into memory... Done (t=3.70s) creating index... Done (t=3.64s) creating index... index created! index created! Done (t=3.59s) creating index... index created! loading annotations into memory... loading annotations into memory... Done (t=3.58s) creating index... loading annotations into memory... index created! loading annotations into memory... Done (t=11.58s) creating index... Done (t=11.78s) creating index... index created! Done (t=11.51s) creating index... index created! index created! Done (t=11.54s) creating index... Done (t=12.37s) creating index... Done (t=11.97s) creating index... index created! Done (t=11.47s) creating index... index created! index created! index created! loading annotations into memory... Done (t=1.49s) creating index... index created! Filtered 1978 from /mnt/petrelfs/share_data/zhangwenwei/data/glip/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... Done (t=3.50s) creating index... index created! loading annotations into memory... Done (t=11.18s) creating index... index created! normal_vcr 212923 normal_vcr 212923 normal_vcr 212923 normal_vcr 212923 normal_vcr 212923 normal_vcr 212923 normal_vcr 212923 normal_vcr 212923 single_region 53816 single_region filter 0 single_region 53816 single_region filter 0 single_region 53816 single_region filter 0 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 single_region 53816 single_region filter 0 normal_vcr 53816 single_region 53816 single_region filter 0 normal_vcr 53816 single_region 53816 single_region filter 0 single_region 53816 single_region filter 0 normal_vcr 53816 normal_vcr 53816 single_region 53816 single_region filter 0 normal_vcr 53816 multi_region 40855 multi_region filter 419 multi_region 40855 multi_region filter 419 normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ multi_region 40855 multi_region filter 419 normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ multi_region 40855 multi_region filter 419 normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ multi_region 40855 multi_region filter 419 normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ multi_region 40855 multi_region filter 419 multi_region 40855 multi_region filter 419 normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ multi_region 40855 multi_region filter 419 normal_vcr 40855 all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ {'loss': 1.048, 'learning_rate': 4.066666666666667e-06, 'epoch': 0.0} {'loss': 1.0931, 'learning_rate': 4.133333333333333e-06, 'epoch': 0.0} {'loss': 0.8966, 'learning_rate': 4.2000000000000004e-06, 'epoch': 0.0} {'loss': 1.006, 'learning_rate': 4.266666666666668e-06, 'epoch': 0.0} {'loss': 1.0355, 'learning_rate': 4.333333333333334e-06, 'epoch': 0.0} {'loss': 0.8914, 'learning_rate': 4.4e-06, 'epoch': 0.0} {'loss': 1.0509, 'learning_rate': 4.4666666666666665e-06, 'epoch': 0.0} {'loss': 1.0984, 'learning_rate': 4.533333333333334e-06, 'epoch': 0.0} {'loss': 1.0106, 'learning_rate': 4.600000000000001e-06, 'epoch': 0.0} {'loss': 1.1401, 'learning_rate': 4.666666666666667e-06, 'epoch': 0.0} {'loss': 1.2222, 'learning_rate': 4.7333333333333335e-06, 'epoch': 0.0} {'loss': 0.9798, 'learning_rate': 4.800000000000001e-06, 'epoch': 0.0} {'loss': 1.2462, 'learning_rate': 4.866666666666667e-06, 'epoch': 0.0} {'loss': 1.016, 'learning_rate': 4.933333333333334e-06, 'epoch': 0.0} {'loss': 1.0733, 'learning_rate': 5e-06, 'epoch': 0.0} {'loss': 1.1633, 'learning_rate': 5.0666666666666676e-06, 'epoch': 0.0} {'loss': 0.9683, 'learning_rate': 5.133333333333334e-06, 'epoch': 0.0} {'loss': 0.9427, 'learning_rate': 5.2e-06, 'epoch': 0.0} {'loss': 0.9589, 'learning_rate': 5.2666666666666665e-06, 'epoch': 0.0} {'loss': 0.9498, 'learning_rate': 5.333333333333334e-06, 'epoch': 0.0} {'loss': 1.1106, 'learning_rate': 5.400000000000001e-06, 'epoch': 0.0} {'loss': 1.0524, 'learning_rate': 5.466666666666667e-06, 'epoch': 0.0} {'loss': 0.8441, 'learning_rate': 5.533333333333334e-06, 'epoch': 0.0} {'loss': 1.0443, 'learning_rate': 5.600000000000001e-06, 'epoch': 0.0} {'loss': 1.0784, 'learning_rate': 5.666666666666667e-06, 'epoch': 0.0} {'loss': 1.1236, 'learning_rate': 5.733333333333334e-06, 'epoch': 0.0} {'loss': 1.2644, 'learning_rate': 5.8e-06, 'epoch': 0.0} {'loss': 0.9996, 'learning_rate': 5.8666666666666675e-06, 'epoch': 0.0} {'loss': 1.0201, 'learning_rate': 5.933333333333335e-06, 'epoch': 0.0} {'loss': 0.879, 'learning_rate': 6e-06, 'epoch': 0.0} {'loss': 0.9998, 'learning_rate': 6.066666666666667e-06, 'epoch': 0.0} {'loss': 1.0138, 'learning_rate': 6.133333333333334e-06, 'epoch': 0.0} {'loss': 0.9985, 'learning_rate': 6.200000000000001e-06, 'epoch': 0.0} {'loss': 1.0069, 'learning_rate': 6.266666666666668e-06, 'epoch': 0.0} {'loss': 0.9494, 'learning_rate': 6.333333333333333e-06, 'epoch': 0.0} {'loss': 1.0607, 'learning_rate': 6.4000000000000006e-06, 'epoch': 0.0} {'loss': 1.053, 'learning_rate': 6.466666666666667e-06, 'epoch': 0.0} {'loss': 0.9934, 'learning_rate': 6.533333333333334e-06, 'epoch': 0.0} {'loss': 1.0204, 'learning_rate': 6.600000000000001e-06, 'epoch': 0.0} {'loss': 1.1335, 'learning_rate': 6.666666666666667e-06, 'epoch': 0.0} {'loss': 0.964, 'learning_rate': 6.733333333333334e-06, 'epoch': 0.0} {'loss': 0.978, 'learning_rate': 6.800000000000001e-06, 'epoch': 0.0} {'loss': 0.9383, 'learning_rate': 6.866666666666667e-06, 'epoch': 0.0} {'loss': 0.9342, 'learning_rate': 6.9333333333333344e-06, 'epoch': 0.0} {'loss': 1.1474, 'learning_rate': 7e-06, 'epoch': 0.0} {'loss': 0.9228, 'learning_rate': 7.066666666666667e-06, 'epoch': 0.0} {'loss': 1.1845, 'learning_rate': 7.133333333333334e-06, 'epoch': 0.0} {'loss': 1.0458, 'learning_rate': 7.2000000000000005e-06, 'epoch': 0.0} {'loss': 0.9346, 'learning_rate': 7.266666666666668e-06, 'epoch': 0.0} {'loss': 0.8477, 'learning_rate': 7.333333333333333e-06, 'epoch': 0.0} {'loss': 1.0105, 'learning_rate': 7.4e-06, 'epoch': 0.0} {'loss': 0.9449, 'learning_rate': 7.4666666666666675e-06, 'epoch': 0.0} {'loss': 0.7877, 'learning_rate': 7.533333333333334e-06, 'epoch': 0.0} {'loss': 1.0448, 'learning_rate': 7.600000000000001e-06, 'epoch': 0.0} {'loss': 0.9843, 'learning_rate': 7.666666666666667e-06, 'epoch': 0.0} {'loss': 1.0752, 'learning_rate': 7.733333333333334e-06, 'epoch': 0.0} {'loss': 1.0625, 'learning_rate': 7.800000000000002e-06, 'epoch': 0.0} {'loss': 0.9191, 'learning_rate': 7.866666666666667e-06, 'epoch': 0.0} {'loss': 0.9757, 'learning_rate': 7.933333333333334e-06, 'epoch': 0.0} {'loss': 0.9998, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.0} {'loss': 1.0591, 'learning_rate': 8.066666666666667e-06, 'epoch': 0.0} {'loss': 1.1196, 'learning_rate': 8.133333333333334e-06, 'epoch': 0.0} {'loss': 1.1051, 'learning_rate': 8.2e-06, 'epoch': 0.0} {'loss': 1.0412, 'learning_rate': 8.266666666666667e-06, 'epoch': 0.0} {'loss': 0.8831, 'learning_rate': 8.333333333333334e-06, 'epoch': 0.0} {'loss': 0.9713, 'learning_rate': 8.400000000000001e-06, 'epoch': 0.0} {'loss': 1.0684, 'learning_rate': 8.466666666666668e-06, 'epoch': 0.0} {'loss': 1.12, 'learning_rate': 8.533333333333335e-06, 'epoch': 0.0} {'loss': 0.9949, 'learning_rate': 8.6e-06, 'epoch': 0.0} {'loss': 1.0676, 'learning_rate': 8.666666666666668e-06, 'epoch': 0.0} {'loss': 1.021, 'learning_rate': 8.733333333333333e-06, 'epoch': 0.0} {'loss': 1.106, 'learning_rate': 8.8e-06, 'epoch': 0.0} {'loss': 0.9628, 'learning_rate': 8.866666666666668e-06, 'epoch': 0.0} {'loss': 0.9365, 'learning_rate': 8.933333333333333e-06, 'epoch': 0.0} {'loss': 0.8287, 'learning_rate': 9e-06, 'epoch': 0.0} {'loss': 1.0279, 'learning_rate': 9.066666666666667e-06, 'epoch': 0.0} {'loss': 0.9721, 'learning_rate': 9.133333333333335e-06, 'epoch': 0.0} {'loss': 0.8502, 'learning_rate': 9.200000000000002e-06, 'epoch': 0.0} {'loss': 0.9346, 'learning_rate': 9.266666666666667e-06, 'epoch': 0.0} {'loss': 1.0981, 'learning_rate': 9.333333333333334e-06, 'epoch': 0.0} {'loss': 1.0921, 'learning_rate': 9.4e-06, 'epoch': 0.0} {'loss': 1.0232, 'learning_rate': 9.466666666666667e-06, 'epoch': 0.0} {'loss': 0.997, 'learning_rate': 9.533333333333334e-06, 'epoch': 0.0} {'loss': 0.8543, 'learning_rate': 9.600000000000001e-06, 'epoch': 0.0} {'loss': 1.0009, 'learning_rate': 9.666666666666667e-06, 'epoch': 0.0} {'loss': 1.1117, 'learning_rate': 9.733333333333334e-06, 'epoch': 0.0} {'loss': 1.0812, 'learning_rate': 9.800000000000001e-06, 'epoch': 0.0} {'loss': 0.9548, 'learning_rate': 9.866666666666668e-06, 'epoch': 0.0} {'loss': 0.8481, 'learning_rate': 9.933333333333334e-06, 'epoch': 0.0} {'loss': 0.9347, 'learning_rate': 1e-05, 'epoch': 0.0} {'loss': 1.0304, 'learning_rate': 1.0066666666666666e-05, 'epoch': 0.0} {'loss': 1.1428, 'learning_rate': 1.0133333333333335e-05, 'epoch': 0.0} {'loss': 0.975, 'learning_rate': 1.02e-05, 'epoch': 0.0} {'loss': 0.8812, 'learning_rate': 1.0266666666666668e-05, 'epoch': 0.0} {'loss': 1.0226, 'learning_rate': 1.0333333333333335e-05, 'epoch': 0.0} {'loss': 0.7442, 'learning_rate': 1.04e-05, 'epoch': 0.0} {'loss': 1.0814, 'learning_rate': 1.0466666666666668e-05, 'epoch': 0.0} {'loss': 1.0132, 'learning_rate': 1.0533333333333333e-05, 'epoch': 0.0} {'loss': 0.9421, 'learning_rate': 1.0600000000000002e-05, 'epoch': 0.0} {'loss': 1.04, 'learning_rate': 1.0666666666666667e-05, 'epoch': 0.0} {'loss': 1.0052, 'learning_rate': 1.0733333333333333e-05, 'epoch': 0.0} {'loss': 1.0889, 'learning_rate': 1.0800000000000002e-05, 'epoch': 0.0} {'loss': 0.9612, 'learning_rate': 1.0866666666666667e-05, 'epoch': 0.0} {'loss': 1.0639, 'learning_rate': 1.0933333333333334e-05, 'epoch': 0.0} {'loss': 1.0467, 'learning_rate': 1.1000000000000001e-05, 'epoch': 0.0} {'loss': 0.9869, 'learning_rate': 1.1066666666666669e-05, 'epoch': 0.0} {'loss': 0.9869, 'learning_rate': 1.1133333333333334e-05, 'epoch': 0.0} {'loss': 0.7803, 'learning_rate': 1.1200000000000001e-05, 'epoch': 0.0} {'loss': 1.0845, 'learning_rate': 1.1266666666666668e-05, 'epoch': 0.0} {'loss': 0.8584, 'learning_rate': 1.1333333333333334e-05, 'epoch': 0.0} {'loss': 1.0344, 'learning_rate': 1.14e-05, 'epoch': 0.0} {'loss': 1.0511, 'learning_rate': 1.1466666666666668e-05, 'epoch': 0.0} {'loss': 1.014, 'learning_rate': 1.1533333333333334e-05, 'epoch': 0.0} {'loss': 0.9547, 'learning_rate': 1.16e-05, 'epoch': 0.0} {'loss': 0.8245, 'learning_rate': 1.1666666666666668e-05, 'epoch': 0.0} {'loss': 1.1702, 'learning_rate': 1.1733333333333335e-05, 'epoch': 0.0} {'loss': 1.0601, 'learning_rate': 1.18e-05, 'epoch': 0.0} {'loss': 1.1008, 'learning_rate': 1.186666666666667e-05, 'epoch': 0.0} {'loss': 0.8651, 'learning_rate': 1.1933333333333335e-05, 'epoch': 0.0} {'loss': 0.9592, 'learning_rate': 1.2e-05, 'epoch': 0.0} {'loss': 0.7626, 'learning_rate': 1.206666666666667e-05, 'epoch': 0.0} {'loss': 0.8542, 'learning_rate': 1.2133333333333335e-05, 'epoch': 0.0} {'loss': 0.9301, 'learning_rate': 1.22e-05, 'epoch': 0.0} {'loss': 1.0951, 'learning_rate': 1.2266666666666667e-05, 'epoch': 0.0} {'loss': 1.0031, 'learning_rate': 1.2333333333333334e-05, 'epoch': 0.0} {'loss': 1.023, 'learning_rate': 1.2400000000000002e-05, 'epoch': 0.0} {'loss': 0.9829, 'learning_rate': 1.2466666666666667e-05, 'epoch': 0.0} {'loss': 0.947, 'learning_rate': 1.2533333333333336e-05, 'epoch': 0.0} {'loss': 1.0179, 'learning_rate': 1.2600000000000001e-05, 'epoch': 0.0} {'loss': 0.9749, 'learning_rate': 1.2666666666666667e-05, 'epoch': 0.0} {'loss': 0.8787, 'learning_rate': 1.2733333333333336e-05, 'epoch': 0.0} {'loss': 1.1742, 'learning_rate': 1.2800000000000001e-05, 'epoch': 0.0} {'loss': 0.9343, 'learning_rate': 1.2866666666666667e-05, 'epoch': 0.0} {'loss': 1.0553, 'learning_rate': 1.2933333333333334e-05, 'epoch': 0.0} {'loss': 1.091, 'learning_rate': 1.3000000000000001e-05, 'epoch': 0.0} {'loss': 1.0132, 'learning_rate': 1.3066666666666668e-05, 'epoch': 0.0} {'loss': 0.8568, 'learning_rate': 1.3133333333333334e-05, 'epoch': 0.0} {'loss': 0.9503, 'learning_rate': 1.3200000000000002e-05, 'epoch': 0.0} {'loss': 0.983, 'learning_rate': 1.3266666666666668e-05, 'epoch': 0.0} {'loss': 1.1102, 'learning_rate': 1.3333333333333333e-05, 'epoch': 0.0} {'loss': 1.0571, 'learning_rate': 1.3400000000000002e-05, 'epoch': 0.0} {'loss': 0.9027, 'learning_rate': 1.3466666666666668e-05, 'epoch': 0.0} {'loss': 0.9555, 'learning_rate': 1.3533333333333333e-05, 'epoch': 0.0} {'loss': 1.0153, 'learning_rate': 1.3600000000000002e-05, 'epoch': 0.0} {'loss': 1.0988, 'learning_rate': 1.3666666666666667e-05, 'epoch': 0.0} {'loss': 0.9729, 'learning_rate': 1.3733333333333335e-05, 'epoch': 0.0} {'loss': 0.7677, 'learning_rate': 1.38e-05, 'epoch': 0.0} {'loss': 0.9661, 'learning_rate': 1.3866666666666669e-05, 'epoch': 0.0} {'loss': 0.9145, 'learning_rate': 1.3933333333333334e-05, 'epoch': 0.0} {'loss': 0.9908, 'learning_rate': 1.4e-05, 'epoch': 0.0} {'loss': 1.0865, 'learning_rate': 1.4066666666666669e-05, 'epoch': 0.0} {'loss': 1.0862, 'learning_rate': 1.4133333333333334e-05, 'epoch': 0.0} {'loss': 1.0964, 'learning_rate': 1.4200000000000001e-05, 'epoch': 0.0} {'loss': 1.0028, 'learning_rate': 1.4266666666666668e-05, 'epoch': 0.0} {'loss': 1.1504, 'learning_rate': 1.4333333333333334e-05, 'epoch': 0.0} {'loss': 0.9481, 'learning_rate': 1.4400000000000001e-05, 'epoch': 0.0} {'loss': 0.964, 'learning_rate': 1.4466666666666668e-05, 'epoch': 0.0} {'loss': 1.0466, 'learning_rate': 1.4533333333333335e-05, 'epoch': 0.0} {'loss': 0.9866, 'learning_rate': 1.46e-05, 'epoch': 0.0} {'loss': 0.9902, 'learning_rate': 1.4666666666666666e-05, 'epoch': 0.0} {'loss': 0.8933, 'learning_rate': 1.4733333333333335e-05, 'epoch': 0.0} {'loss': 1.0182, 'learning_rate': 1.48e-05, 'epoch': 0.0} {'loss': 0.8472, 'learning_rate': 1.4866666666666668e-05, 'epoch': 0.0} {'loss': 0.8436, 'learning_rate': 1.4933333333333335e-05, 'epoch': 0.0} {'loss': 1.0383, 'learning_rate': 1.5000000000000002e-05, 'epoch': 0.0} {'loss': 0.9978, 'learning_rate': 1.5066666666666668e-05, 'epoch': 0.0} {'loss': 1.0658, 'learning_rate': 1.5133333333333335e-05, 'epoch': 0.0} {'loss': 1.1244, 'learning_rate': 1.5200000000000002e-05, 'epoch': 0.0} {'loss': 1.0518, 'learning_rate': 1.5266666666666667e-05, 'epoch': 0.0} {'loss': 1.0326, 'learning_rate': 1.5333333333333334e-05, 'epoch': 0.0} {'loss': 1.1641, 'learning_rate': 1.54e-05, 'epoch': 0.0} {'loss': 1.1373, 'learning_rate': 1.546666666666667e-05, 'epoch': 0.0} {'loss': 0.9426, 'learning_rate': 1.5533333333333333e-05, 'epoch': 0.0} {'loss': 0.9296, 'learning_rate': 1.5600000000000003e-05, 'epoch': 0.0} {'loss': 1.0401, 'learning_rate': 1.5666666666666667e-05, 'epoch': 0.0} {'loss': 1.0997, 'learning_rate': 1.5733333333333334e-05, 'epoch': 0.0} {'loss': 0.9865, 'learning_rate': 1.58e-05, 'epoch': 0.0} {'loss': 1.0638, 'learning_rate': 1.586666666666667e-05, 'epoch': 0.0} {'loss': 0.9161, 'learning_rate': 1.5933333333333336e-05, 'epoch': 0.0} {'loss': 1.0182, 'learning_rate': 1.6000000000000003e-05, 'epoch': 0.0} {'loss': 0.9243, 'learning_rate': 1.606666666666667e-05, 'epoch': 0.01} {'loss': 0.9027, 'learning_rate': 1.6133333333333334e-05, 'epoch': 0.01} {'loss': 0.7222, 'learning_rate': 1.62e-05, 'epoch': 0.01} {'loss': 0.862, 'learning_rate': 1.6266666666666668e-05, 'epoch': 0.01} {'loss': 1.0003, 'learning_rate': 1.6333333333333335e-05, 'epoch': 0.01} {'loss': 1.202, 'learning_rate': 1.64e-05, 'epoch': 0.01} {'loss': 1.0585, 'learning_rate': 1.646666666666667e-05, 'epoch': 0.01} {'loss': 0.9742, 'learning_rate': 1.6533333333333333e-05, 'epoch': 0.01} {'loss': 1.0391, 'learning_rate': 1.66e-05, 'epoch': 0.01} {'loss': 0.8865, 'learning_rate': 1.6666666666666667e-05, 'epoch': 0.01} {'loss': 0.8379, 'learning_rate': 1.6733333333333335e-05, 'epoch': 0.01} {'loss': 1.0696, 'learning_rate': 1.6800000000000002e-05, 'epoch': 0.01} {'loss': 1.0099, 'learning_rate': 1.686666666666667e-05, 'epoch': 0.01} {'loss': 1.0796, 'learning_rate': 1.6933333333333336e-05, 'epoch': 0.01} {'loss': 0.9938, 'learning_rate': 1.7e-05, 'epoch': 0.01} {'loss': 1.0077, 'learning_rate': 1.706666666666667e-05, 'epoch': 0.01} {'loss': 0.9377, 'learning_rate': 1.7133333333333334e-05, 'epoch': 0.01} {'loss': 1.0046, 'learning_rate': 1.72e-05, 'epoch': 0.01} {'loss': 0.974, 'learning_rate': 1.726666666666667e-05, 'epoch': 0.01} {'loss': 1.008, 'learning_rate': 1.7333333333333336e-05, 'epoch': 0.01} {'loss': 0.9901, 'learning_rate': 1.7400000000000003e-05, 'epoch': 0.01} {'loss': 1.0618, 'learning_rate': 1.7466666666666667e-05, 'epoch': 0.01} {'loss': 1.0143, 'learning_rate': 1.7533333333333337e-05, 'epoch': 0.01} {'loss': 0.9338, 'learning_rate': 1.76e-05, 'epoch': 0.01} {'loss': 1.0976, 'learning_rate': 1.7666666666666668e-05, 'epoch': 0.01} {'loss': 1.0657, 'learning_rate': 1.7733333333333335e-05, 'epoch': 0.01} {'loss': 1.0056, 'learning_rate': 1.7800000000000002e-05, 'epoch': 0.01} {'loss': 0.9463, 'learning_rate': 1.7866666666666666e-05, 'epoch': 0.01} {'loss': 0.9088, 'learning_rate': 1.7933333333333333e-05, 'epoch': 0.01} {'loss': 0.9948, 'learning_rate': 1.8e-05, 'epoch': 0.01} {'loss': 1.0448, 'learning_rate': 1.8066666666666668e-05, 'epoch': 0.01} {'loss': 1.0951, 'learning_rate': 1.8133333333333335e-05, 'epoch': 0.01} {'loss': 0.8209, 'learning_rate': 1.8200000000000002e-05, 'epoch': 0.01} {'loss': 0.9588, 'learning_rate': 1.826666666666667e-05, 'epoch': 0.01} {'loss': 0.9417, 'learning_rate': 1.8333333333333333e-05, 'epoch': 0.01} {'loss': 1.327, 'learning_rate': 1.8400000000000003e-05, 'epoch': 0.01} {'loss': 1.037, 'learning_rate': 1.8466666666666667e-05, 'epoch': 0.01} {'loss': 1.1337, 'learning_rate': 1.8533333333333334e-05, 'epoch': 0.01} {'loss': 1.1995, 'learning_rate': 1.86e-05, 'epoch': 0.01} {'loss': 0.9992, 'learning_rate': 1.866666666666667e-05, 'epoch': 0.01} {'loss': 1.085, 'learning_rate': 1.8733333333333336e-05, 'epoch': 0.01} {'loss': 1.0537, 'learning_rate': 1.88e-05, 'epoch': 0.01} {'loss': 0.9836, 'learning_rate': 1.886666666666667e-05, 'epoch': 0.01} {'loss': 1.0396, 'learning_rate': 1.8933333333333334e-05, 'epoch': 0.01} {'loss': 0.9449, 'learning_rate': 1.9e-05, 'epoch': 0.01} {'loss': 0.9714, 'learning_rate': 1.9066666666666668e-05, 'epoch': 0.01} {'loss': 1.0201, 'learning_rate': 1.9133333333333335e-05, 'epoch': 0.01} {'loss': 0.9342, 'learning_rate': 1.9200000000000003e-05, 'epoch': 0.01} {'loss': 1.077, 'learning_rate': 1.926666666666667e-05, 'epoch': 0.01} {'loss': 1.0753, 'learning_rate': 1.9333333333333333e-05, 'epoch': 0.01} {'loss': 1.0336, 'learning_rate': 1.94e-05, 'epoch': 0.01} {'loss': 0.8854, 'learning_rate': 1.9466666666666668e-05, 'epoch': 0.01} {'loss': 1.0098, 'learning_rate': 1.9533333333333335e-05, 'epoch': 0.01} {'loss': 1.1292, 'learning_rate': 1.9600000000000002e-05, 'epoch': 0.01} {'loss': 1.019, 'learning_rate': 1.9666666666666666e-05, 'epoch': 0.01} {'loss': 1.0113, 'learning_rate': 1.9733333333333336e-05, 'epoch': 0.01} {'loss': 0.902, 'learning_rate': 1.98e-05, 'epoch': 0.01} {'loss': 1.0329, 'learning_rate': 1.9866666666666667e-05, 'epoch': 0.01} {'loss': 0.9531, 'learning_rate': 1.9933333333333334e-05, 'epoch': 0.01} {'loss': 1.0223, 'learning_rate': 2e-05, 'epoch': 0.01} {'loss': 0.9566, 'learning_rate': 1.999999999464205e-05, 'epoch': 0.01} {'loss': 0.8796, 'learning_rate': 1.9999999978568198e-05, 'epoch': 0.01} {'loss': 1.0286, 'learning_rate': 1.9999999951778443e-05, 'epoch': 0.01} {'loss': 0.9846, 'learning_rate': 1.999999991427278e-05, 'epoch': 0.01} {'loss': 1.0446, 'learning_rate': 1.999999986605122e-05, 'epoch': 0.01} {'loss': 1.0668, 'learning_rate': 1.9999999807113757e-05, 'epoch': 0.01} {'loss': 0.8498, 'learning_rate': 1.9999999737460388e-05, 'epoch': 0.01} {'loss': 0.9956, 'learning_rate': 1.9999999657091124e-05, 'epoch': 0.01} {'loss': 1.108, 'learning_rate': 1.999999956600595e-05, 'epoch': 0.01} {'loss': 0.9, 'learning_rate': 1.999999946420488e-05, 'epoch': 0.01} {'loss': 0.9539, 'learning_rate': 1.9999999351687906e-05, 'epoch': 0.01} {'loss': 1.0838, 'learning_rate': 1.9999999228455027e-05, 'epoch': 0.01} {'loss': 1.1185, 'learning_rate': 1.999999909450625e-05, 'epoch': 0.01} {'loss': 1.0514, 'learning_rate': 1.999999894984157e-05, 'epoch': 0.01} {'loss': 0.8584, 'learning_rate': 1.999999879446099e-05, 'epoch': 0.01} {'loss': 0.998, 'learning_rate': 1.9999998628364507e-05, 'epoch': 0.01} {'loss': 0.9275, 'learning_rate': 1.9999998451552122e-05, 'epoch': 0.01} {'loss': 1.0717, 'learning_rate': 1.999999826402384e-05, 'epoch': 0.01} {'loss': 0.8656, 'learning_rate': 1.9999998065779653e-05, 'epoch': 0.01} {'loss': 0.9669, 'learning_rate': 1.9999997856819566e-05, 'epoch': 0.01} {'loss': 0.7785, 'learning_rate': 1.999999763714358e-05, 'epoch': 0.01} {'loss': 1.0331, 'learning_rate': 1.9999997406751696e-05, 'epoch': 0.01} {'loss': 0.9613, 'learning_rate': 1.999999716564391e-05, 'epoch': 0.01} {'loss': 1.0253, 'learning_rate': 1.9999996913820222e-05, 'epoch': 0.01} {'loss': 0.8596, 'learning_rate': 1.999999665128064e-05, 'epoch': 0.01} {'loss': 1.139, 'learning_rate': 1.9999996378025157e-05, 'epoch': 0.01} {'loss': 1.0803, 'learning_rate': 1.9999996094053773e-05, 'epoch': 0.01} {'loss': 1.1419, 'learning_rate': 1.9999995799366495e-05, 'epoch': 0.01} {'loss': 0.9552, 'learning_rate': 1.9999995493963314e-05, 'epoch': 0.01} {'loss': 1.0927, 'learning_rate': 1.9999995177844238e-05, 'epoch': 0.01} {'loss': 0.9839, 'learning_rate': 1.9999994851009264e-05, 'epoch': 0.01} {'loss': 0.905, 'learning_rate': 1.9999994513458395e-05, 'epoch': 0.01} {'loss': 1.0098, 'learning_rate': 1.9999994165191627e-05, 'epoch': 0.01} {'loss': 1.0109, 'learning_rate': 1.999999380620896e-05, 'epoch': 0.01} {'loss': 0.889, 'learning_rate': 1.9999993436510402e-05, 'epoch': 0.01} {'loss': 1.1098, 'learning_rate': 1.999999305609595e-05, 'epoch': 0.01} {'loss': 0.9127, 'learning_rate': 1.99999926649656e-05, 'epoch': 0.01} {'loss': 0.8931, 'learning_rate': 1.9999992263119353e-05, 'epoch': 0.01} {'loss': 1.1193, 'learning_rate': 1.9999991850557215e-05, 'epoch': 0.01} {'loss': 0.8776, 'learning_rate': 1.999999142727918e-05, 'epoch': 0.01} {'loss': 0.9863, 'learning_rate': 1.9999990993285255e-05, 'epoch': 0.01} {'loss': 1.1106, 'learning_rate': 1.9999990548575434e-05, 'epoch': 0.01} {'loss': 1.0233, 'learning_rate': 1.9999990093149725e-05, 'epoch': 0.01} {'loss': 1.0031, 'learning_rate': 1.9999989627008118e-05, 'epoch': 0.01} {'loss': 0.9948, 'learning_rate': 1.9999989150150625e-05, 'epoch': 0.01} {'loss': 1.0741, 'learning_rate': 1.9999988662577237e-05, 'epoch': 0.01} {'loss': 1.1139, 'learning_rate': 1.999998816428796e-05, 'epoch': 0.01} {'loss': 1.0125, 'learning_rate': 1.9999987655282797e-05, 'epoch': 0.01} {'loss': 1.0069, 'learning_rate': 1.999998713556174e-05, 'epoch': 0.01} {'loss': 0.9412, 'learning_rate': 1.9999986605124796e-05, 'epoch': 0.01} {'loss': 0.8309, 'learning_rate': 1.9999986063971963e-05, 'epoch': 0.01} {'loss': 1.2807, 'learning_rate': 1.9999985512103242e-05, 'epoch': 0.01} {'loss': 0.8327, 'learning_rate': 1.9999984949518636e-05, 'epoch': 0.01} {'loss': 1.0405, 'learning_rate': 1.999998437621814e-05, 'epoch': 0.01} {'loss': 1.0433, 'learning_rate': 1.9999983792201762e-05, 'epoch': 0.01} {'loss': 1.0219, 'learning_rate': 1.9999983197469498e-05, 'epoch': 0.01} {'loss': 1.0972, 'learning_rate': 1.9999982592021348e-05, 'epoch': 0.01} {'loss': 1.0146, 'learning_rate': 1.9999981975857317e-05, 'epoch': 0.01} {'loss': 0.9093, 'learning_rate': 1.99999813489774e-05, 'epoch': 0.01} {'loss': 1.0543, 'learning_rate': 1.99999807113816e-05, 'epoch': 0.01} {'loss': 0.939, 'learning_rate': 1.9999980063069918e-05, 'epoch': 0.01} {'loss': 1.0028, 'learning_rate': 1.9999979404042357e-05, 'epoch': 0.01} {'loss': 1.086, 'learning_rate': 1.9999978734298915e-05, 'epoch': 0.01} {'loss': 0.9842, 'learning_rate': 1.9999978053839594e-05, 'epoch': 0.01} {'loss': 0.9447, 'learning_rate': 1.9999977362664392e-05, 'epoch': 0.01} {'loss': 1.2526, 'learning_rate': 1.9999976660773312e-05, 'epoch': 0.01} {'loss': 0.9711, 'learning_rate': 1.9999975948166353e-05, 'epoch': 0.01} {'loss': 0.9115, 'learning_rate': 1.999997522484352e-05, 'epoch': 0.01} {'loss': 1.1368, 'learning_rate': 1.999997449080481e-05, 'epoch': 0.01} {'loss': 1.1012, 'learning_rate': 1.9999973746050226e-05, 'epoch': 0.01} {'loss': 1.032, 'learning_rate': 1.9999972990579765e-05, 'epoch': 0.01} {'loss': 0.95, 'learning_rate': 1.9999972224393432e-05, 'epoch': 0.01} {'loss': 1.107, 'learning_rate': 1.9999971447491225e-05, 'epoch': 0.01} {'loss': 0.9452, 'learning_rate': 1.999997065987315e-05, 'epoch': 0.01} {'loss': 0.9587, 'learning_rate': 1.99999698615392e-05, 'epoch': 0.01} {'loss': 0.9628, 'learning_rate': 1.999996905248938e-05, 'epoch': 0.01} {'loss': 0.8299, 'learning_rate': 1.999996823272369e-05, 'epoch': 0.01} {'loss': 1.0537, 'learning_rate': 1.9999967402242135e-05, 'epoch': 0.01} {'loss': 1.0455, 'learning_rate': 1.999996656104471e-05, 'epoch': 0.01} {'loss': 1.1143, 'learning_rate': 1.9999965709131415e-05, 'epoch': 0.01} {'loss': 1.0956, 'learning_rate': 1.999996484650226e-05, 'epoch': 0.01} {'loss': 0.8807, 'learning_rate': 1.9999963973157238e-05, 'epoch': 0.01} {'loss': 0.9696, 'learning_rate': 1.9999963089096354e-05, 'epoch': 0.01} {'loss': 1.1868, 'learning_rate': 1.99999621943196e-05, 'epoch': 0.01} {'loss': 0.9854, 'learning_rate': 1.999996128882699e-05, 'epoch': 0.01} {'loss': 0.9392, 'learning_rate': 1.999996037261852e-05, 'epoch': 0.01} {'loss': 1.007, 'learning_rate': 1.9999959445694184e-05, 'epoch': 0.01} {'loss': 0.89, 'learning_rate': 1.9999958508053994e-05, 'epoch': 0.01} {'loss': 1.0431, 'learning_rate': 1.9999957559697946e-05, 'epoch': 0.01} {'loss': 1.0145, 'learning_rate': 1.9999956600626036e-05, 'epoch': 0.01} {'loss': 0.9807, 'learning_rate': 1.9999955630838276e-05, 'epoch': 0.01} {'loss': 1.0586, 'learning_rate': 1.9999954650334657e-05, 'epoch': 0.01} {'loss': 1.0554, 'learning_rate': 1.9999953659115184e-05, 'epoch': 0.01} {'loss': 0.9063, 'learning_rate': 1.999995265717986e-05, 'epoch': 0.01} {'loss': 1.1403, 'learning_rate': 1.9999951644528685e-05, 'epoch': 0.01} {'loss': 0.8431, 'learning_rate': 1.9999950621161656e-05, 'epoch': 0.01} {'loss': 1.0668, 'learning_rate': 1.999994958707878e-05, 'epoch': 0.01} {'loss': 1.1135, 'learning_rate': 1.9999948542280053e-05, 'epoch': 0.01} {'loss': 0.91, 'learning_rate': 1.999994748676548e-05, 'epoch': 0.01} {'loss': 1.0467, 'learning_rate': 1.999994642053506e-05, 'epoch': 0.01} {'loss': 1.1577, 'learning_rate': 1.99999453435888e-05, 'epoch': 0.01} {'loss': 1.0209, 'learning_rate': 1.999994425592669e-05, 'epoch': 0.01} {'loss': 0.9978, 'learning_rate': 1.999994315754874e-05, 'epoch': 0.01} {'loss': 1.0506, 'learning_rate': 1.9999942048454946e-05, 'epoch': 0.01} {'loss': 1.0431, 'learning_rate': 1.9999940928645315e-05, 'epoch': 0.01} {'loss': 1.0371, 'learning_rate': 1.9999939798119842e-05, 'epoch': 0.01} {'loss': 0.8327, 'learning_rate': 1.9999938656878532e-05, 'epoch': 0.01} {'loss': 0.9425, 'learning_rate': 1.9999937504921384e-05, 'epoch': 0.01} {'loss': 1.1204, 'learning_rate': 1.9999936342248402e-05, 'epoch': 0.01} {'loss': 1.0955, 'learning_rate': 1.9999935168859583e-05, 'epoch': 0.01} {'loss': 0.8631, 'learning_rate': 1.9999933984754933e-05, 'epoch': 0.01} {'loss': 1.0682, 'learning_rate': 1.9999932789934452e-05, 'epoch': 0.01} {'loss': 1.061, 'learning_rate': 1.9999931584398137e-05, 'epoch': 0.01} {'loss': 1.0904, 'learning_rate': 1.9999930368145998e-05, 'epoch': 0.01} {'loss': 1.0038, 'learning_rate': 1.9999929141178028e-05, 'epoch': 0.01} {'loss': 0.8113, 'learning_rate': 1.999992790349423e-05, 'epoch': 0.01} {'loss': 1.0902, 'learning_rate': 1.999992665509461e-05, 'epoch': 0.01} {'loss': 1.0527, 'learning_rate': 1.999992539597916e-05, 'epoch': 0.01} {'loss': 1.0306, 'learning_rate': 1.9999924126147892e-05, 'epoch': 0.01} {'loss': 0.9138, 'learning_rate': 1.9999922845600802e-05, 'epoch': 0.01} {'loss': 0.9783, 'learning_rate': 1.9999921554337896e-05, 'epoch': 0.01} {'loss': 0.9825, 'learning_rate': 1.9999920252359168e-05, 'epoch': 0.01} {'loss': 0.9696, 'learning_rate': 1.9999918939664623e-05, 'epoch': 0.01} {'loss': 1.0195, 'learning_rate': 1.999991761625426e-05, 'epoch': 0.01} {'loss': 1.0255, 'learning_rate': 1.9999916282128086e-05, 'epoch': 0.01} {'loss': 1.0975, 'learning_rate': 1.9999914937286096e-05, 'epoch': 0.01} {'loss': 0.8909, 'learning_rate': 1.99999135817283e-05, 'epoch': 0.01} {'loss': 1.0447, 'learning_rate': 1.999991221545469e-05, 'epoch': 0.01} {'loss': 1.0297, 'learning_rate': 1.9999910838465272e-05, 'epoch': 0.01} {'loss': 1.1579, 'learning_rate': 1.9999909450760048e-05, 'epoch': 0.01} {'loss': 0.9327, 'learning_rate': 1.999990805233902e-05, 'epoch': 0.01} {'loss': 0.9933, 'learning_rate': 1.9999906643202184e-05, 'epoch': 0.01} {'loss': 1.1583, 'learning_rate': 1.9999905223349546e-05, 'epoch': 0.01} {'loss': 1.0775, 'learning_rate': 1.9999903792781107e-05, 'epoch': 0.01} {'loss': 1.0849, 'learning_rate': 1.999990235149687e-05, 'epoch': 0.01} {'loss': 1.1118, 'learning_rate': 1.9999900899496838e-05, 'epoch': 0.01} {'loss': 1.0901, 'learning_rate': 1.9999899436781005e-05, 'epoch': 0.01} {'loss': 1.2782, 'learning_rate': 1.9999897963349378e-05, 'epoch': 0.01} {'loss': 1.0094, 'learning_rate': 1.9999896479201958e-05, 'epoch': 0.01} {'loss': 1.0459, 'learning_rate': 1.9999894984338748e-05, 'epoch': 0.01} {'loss': 0.9212, 'learning_rate': 1.9999893478759748e-05, 'epoch': 0.01} {'loss': 1.1644, 'learning_rate': 1.9999891962464958e-05, 'epoch': 0.01} {'loss': 1.1352, 'learning_rate': 1.999989043545438e-05, 'epoch': 0.01} {'loss': 0.9999, 'learning_rate': 1.999988889772802e-05, 'epoch': 0.01} {'loss': 1.0539, 'learning_rate': 1.9999887349285876e-05, 'epoch': 0.01} {'loss': 0.9444, 'learning_rate': 1.999988579012795e-05, 'epoch': 0.01} {'loss': 1.102, 'learning_rate': 1.9999884220254243e-05, 'epoch': 0.01} {'loss': 1.0759, 'learning_rate': 1.9999882639664756e-05, 'epoch': 0.01} {'loss': 1.0086, 'learning_rate': 1.9999881048359492e-05, 'epoch': 0.01} {'loss': 1.0828, 'learning_rate': 1.9999879446338456e-05, 'epoch': 0.01} {'loss': 0.897, 'learning_rate': 1.9999877833601643e-05, 'epoch': 0.01} {'loss': 1.0875, 'learning_rate': 1.9999876210149063e-05, 'epoch': 0.01} {'loss': 1.1475, 'learning_rate': 1.999987457598071e-05, 'epoch': 0.01} {'loss': 0.9889, 'learning_rate': 1.9999872931096588e-05, 'epoch': 0.01} {'loss': 1.0354, 'learning_rate': 1.9999871275496702e-05, 'epoch': 0.01} {'loss': 0.9673, 'learning_rate': 1.999986960918105e-05, 'epoch': 0.01} {'loss': 1.016, 'learning_rate': 1.999986793214964e-05, 'epoch': 0.01} {'loss': 0.9823, 'learning_rate': 1.999986624440246e-05, 'epoch': 0.01} {'loss': 0.9498, 'learning_rate': 1.9999864545939527e-05, 'epoch': 0.01} {'loss': 1.1081, 'learning_rate': 1.9999862836760834e-05, 'epoch': 0.01} {'loss': 0.7749, 'learning_rate': 1.9999861116866387e-05, 'epoch': 0.01} {'loss': 1.1087, 'learning_rate': 1.9999859386256188e-05, 'epoch': 0.01} {'loss': 1.0201, 'learning_rate': 1.9999857644930233e-05, 'epoch': 0.01} {'loss': 0.9289, 'learning_rate': 1.999985589288853e-05, 'epoch': 0.01} {'loss': 0.9331, 'learning_rate': 1.999985413013108e-05, 'epoch': 0.01} {'loss': 0.941, 'learning_rate': 1.999985235665788e-05, 'epoch': 0.01} {'loss': 1.0341, 'learning_rate': 1.9999850572468943e-05, 'epoch': 0.01} {'loss': 1.0252, 'learning_rate': 1.9999848777564254e-05, 'epoch': 0.01} {'loss': 1.0325, 'learning_rate': 1.9999846971943832e-05, 'epoch': 0.01} {'loss': 0.9811, 'learning_rate': 1.9999845155607668e-05, 'epoch': 0.01} {'loss': 1.1064, 'learning_rate': 1.9999843328555768e-05, 'epoch': 0.01} {'loss': 0.8739, 'learning_rate': 1.9999841490788135e-05, 'epoch': 0.01} {'loss': 1.051, 'learning_rate': 1.9999839642304767e-05, 'epoch': 0.01} {'loss': 1.047, 'learning_rate': 1.9999837783105666e-05, 'epoch': 0.01} {'loss': 0.968, 'learning_rate': 1.999983591319084e-05, 'epoch': 0.01} {'loss': 0.8362, 'learning_rate': 1.9999834032560286e-05, 'epoch': 0.01} {'loss': 1.1008, 'learning_rate': 1.999983214121401e-05, 'epoch': 0.01} {'loss': 0.9151, 'learning_rate': 1.999983023915201e-05, 'epoch': 0.01} {'loss': 0.6541, 'learning_rate': 1.9999828326374288e-05, 'epoch': 0.01} {'loss': 0.943, 'learning_rate': 1.9999826402880846e-05, 'epoch': 0.01} {'loss': 1.0859, 'learning_rate': 1.999982446867169e-05, 'epoch': 0.01} {'loss': 1.1085, 'learning_rate': 1.999982252374682e-05, 'epoch': 0.01} {'loss': 1.0508, 'learning_rate': 1.9999820568106237e-05, 'epoch': 0.01} {'loss': 1.0441, 'learning_rate': 1.999981860174994e-05, 'epoch': 0.01} {'loss': 1.0985, 'learning_rate': 1.999981662467794e-05, 'epoch': 0.01} {'loss': 1.115, 'learning_rate': 1.9999814636890232e-05, 'epoch': 0.01} {'loss': 1.0427, 'learning_rate': 1.999981263838682e-05, 'epoch': 0.01} {'loss': 0.9943, 'learning_rate': 1.9999810629167706e-05, 'epoch': 0.01} {'loss': 1.0, 'learning_rate': 1.9999808609232892e-05, 'epoch': 0.01} {'loss': 1.1281, 'learning_rate': 1.9999806578582383e-05, 'epoch': 0.01} {'loss': 0.9184, 'learning_rate': 1.9999804537216175e-05, 'epoch': 0.01} {'loss': 0.9444, 'learning_rate': 1.9999802485134275e-05, 'epoch': 0.01} {'loss': 0.9947, 'learning_rate': 1.9999800422336687e-05, 'epoch': 0.01} {'loss': 1.1415, 'learning_rate': 1.9999798348823407e-05, 'epoch': 0.01} {'loss': 1.1402, 'learning_rate': 1.999979626459444e-05, 'epoch': 0.01} {'loss': 1.0815, 'learning_rate': 1.9999794169649794e-05, 'epoch': 0.01} {'loss': 1.0272, 'learning_rate': 1.9999792063989462e-05, 'epoch': 0.01} {'loss': 0.8202, 'learning_rate': 1.9999789947613452e-05, 'epoch': 0.01} {'loss': 1.1112, 'learning_rate': 1.999978782052176e-05, 'epoch': 0.01} {'loss': 1.1366, 'learning_rate': 1.99997856827144e-05, 'epoch': 0.01} {'loss': 0.8899, 'learning_rate': 1.999978353419136e-05, 'epoch': 0.01} {'loss': 1.1792, 'learning_rate': 1.9999781374952655e-05, 'epoch': 0.01} {'loss': 1.0306, 'learning_rate': 1.9999779204998277e-05, 'epoch': 0.01} {'loss': 1.0225, 'learning_rate': 1.9999777024328235e-05, 'epoch': 0.01} {'loss': 0.9895, 'learning_rate': 1.999977483294253e-05, 'epoch': 0.01} {'loss': 0.9543, 'learning_rate': 1.9999772630841162e-05, 'epoch': 0.01} {'loss': 1.1127, 'learning_rate': 1.999977041802414e-05, 'epoch': 0.01} {'loss': 0.946, 'learning_rate': 1.9999768194491457e-05, 'epoch': 0.01} {'loss': 1.1247, 'learning_rate': 1.999976596024312e-05, 'epoch': 0.01} {'loss': 0.8244, 'learning_rate': 1.9999763715279134e-05, 'epoch': 0.01} {'loss': 0.9862, 'learning_rate': 1.9999761459599496e-05, 'epoch': 0.01} {'loss': 1.1013, 'learning_rate': 1.9999759193204213e-05, 'epoch': 0.01} {'loss': 0.8502, 'learning_rate': 1.9999756916093282e-05, 'epoch': 0.01} {'loss': 1.0548, 'learning_rate': 1.9999754628266714e-05, 'epoch': 0.01} {'loss': 1.1143, 'learning_rate': 1.9999752329724502e-05, 'epoch': 0.01} {'loss': 1.1384, 'learning_rate': 1.9999750020466655e-05, 'epoch': 0.01} {'loss': 1.1676, 'learning_rate': 1.9999747700493174e-05, 'epoch': 0.01} {'loss': 0.9627, 'learning_rate': 1.999974536980406e-05, 'epoch': 0.01} {'loss': 1.024, 'learning_rate': 1.9999743028399316e-05, 'epoch': 0.01} {'loss': 1.0613, 'learning_rate': 1.9999740676278946e-05, 'epoch': 0.01} {'loss': 0.8625, 'learning_rate': 1.9999738313442948e-05, 'epoch': 0.01} {'loss': 1.0069, 'learning_rate': 1.999973593989133e-05, 'epoch': 0.01} {'loss': 1.07, 'learning_rate': 1.9999733555624094e-05, 'epoch': 0.01} {'loss': 0.9964, 'learning_rate': 1.9999731160641237e-05, 'epoch': 0.01} {'loss': 0.9505, 'learning_rate': 1.9999728754942767e-05, 'epoch': 0.01} {'loss': 1.1359, 'learning_rate': 1.9999726338528686e-05, 'epoch': 0.01} {'loss': 0.931, 'learning_rate': 1.9999723911398995e-05, 'epoch': 0.01} {'loss': 1.0969, 'learning_rate': 1.99997214735537e-05, 'epoch': 0.01} {'loss': 1.2535, 'learning_rate': 1.9999719024992798e-05, 'epoch': 0.01} {'loss': 1.1026, 'learning_rate': 1.9999716565716295e-05, 'epoch': 0.01} {'loss': 0.8576, 'learning_rate': 1.9999714095724196e-05, 'epoch': 0.01} {'loss': 0.8695, 'learning_rate': 1.9999711615016496e-05, 'epoch': 0.01} {'loss': 0.839, 'learning_rate': 1.9999709123593205e-05, 'epoch': 0.01} {'loss': 1.0536, 'learning_rate': 1.999970662145432e-05, 'epoch': 0.01} {'loss': 0.9732, 'learning_rate': 1.9999704108599855e-05, 'epoch': 0.01} {'loss': 0.8462, 'learning_rate': 1.9999701585029797e-05, 'epoch': 0.01} {'loss': 1.0155, 'learning_rate': 1.999969905074416e-05, 'epoch': 0.01} {'loss': 1.093, 'learning_rate': 1.999969650574294e-05, 'epoch': 0.01} {'loss': 1.0096, 'learning_rate': 1.9999693950026145e-05, 'epoch': 0.01} {'loss': 1.118, 'learning_rate': 1.9999691383593774e-05, 'epoch': 0.01} {'loss': 0.9411, 'learning_rate': 1.999968880644583e-05, 'epoch': 0.01} {'loss': 0.8415, 'learning_rate': 1.9999686218582323e-05, 'epoch': 0.01} {'loss': 1.0299, 'learning_rate': 1.9999683620003243e-05, 'epoch': 0.01} {'loss': 1.0805, 'learning_rate': 1.9999681010708603e-05, 'epoch': 0.01} {'loss': 1.1834, 'learning_rate': 1.99996783906984e-05, 'epoch': 0.01} {'loss': 0.9456, 'learning_rate': 1.999967575997264e-05, 'epoch': 0.01} {'loss': 0.926, 'learning_rate': 1.9999673118531328e-05, 'epoch': 0.01} {'loss': 0.8485, 'learning_rate': 1.999967046637446e-05, 'epoch': 0.01} {'loss': 0.9182, 'learning_rate': 1.9999667803502044e-05, 'epoch': 0.01} {'loss': 0.9272, 'learning_rate': 1.999966512991408e-05, 'epoch': 0.01} {'loss': 0.9447, 'learning_rate': 1.999966244561057e-05, 'epoch': 0.01} {'loss': 0.9605, 'learning_rate': 1.9999659750591523e-05, 'epoch': 0.01} {'loss': 1.0216, 'learning_rate': 1.999965704485694e-05, 'epoch': 0.01} {'loss': 1.1315, 'learning_rate': 1.9999654328406815e-05, 'epoch': 0.01} {'loss': 1.0424, 'learning_rate': 1.9999651601241164e-05, 'epoch': 0.01} {'loss': 1.2051, 'learning_rate': 1.999964886335998e-05, 'epoch': 0.01} {'loss': 1.1057, 'learning_rate': 1.9999646114763274e-05, 'epoch': 0.01} {'loss': 1.0406, 'learning_rate': 1.9999643355451042e-05, 'epoch': 0.01} {'loss': 1.0195, 'learning_rate': 1.999964058542329e-05, 'epoch': 0.01} {'loss': 0.9955, 'learning_rate': 1.999963780468002e-05, 'epoch': 0.01} {'loss': 0.9595, 'learning_rate': 1.9999635013221235e-05, 'epoch': 0.01} {'loss': 1.0586, 'learning_rate': 1.999963221104694e-05, 'epoch': 0.01} {'loss': 0.9297, 'learning_rate': 1.9999629398157137e-05, 'epoch': 0.01} {'loss': 0.9357, 'learning_rate': 1.999962657455183e-05, 'epoch': 0.01} {'loss': 0.9926, 'learning_rate': 1.9999623740231017e-05, 'epoch': 0.01} {'loss': 0.8988, 'learning_rate': 1.9999620895194707e-05, 'epoch': 0.01} {'loss': 1.054, 'learning_rate': 1.99996180394429e-05, 'epoch': 0.01} {'loss': 0.9283, 'learning_rate': 1.99996151729756e-05, 'epoch': 0.01} {'loss': 0.8274, 'learning_rate': 1.9999612295792806e-05, 'epoch': 0.01} {'loss': 1.0942, 'learning_rate': 1.999960940789453e-05, 'epoch': 0.01} {'loss': 0.8925, 'learning_rate': 1.9999606509280766e-05, 'epoch': 0.01} {'loss': 0.9841, 'learning_rate': 1.999960359995152e-05, 'epoch': 0.01} {'loss': 1.0731, 'learning_rate': 1.99996006799068e-05, 'epoch': 0.01} {'loss': 0.8458, 'learning_rate': 1.9999597749146607e-05, 'epoch': 0.01} {'loss': 0.8603, 'learning_rate': 1.999959480767094e-05, 'epoch': 0.01} {'loss': 1.0779, 'learning_rate': 1.9999591855479807e-05, 'epoch': 0.01} {'loss': 1.0329, 'learning_rate': 1.9999588892573207e-05, 'epoch': 0.01} {'loss': 1.032, 'learning_rate': 1.9999585918951143e-05, 'epoch': 0.01} {'loss': 0.9501, 'learning_rate': 1.9999582934613625e-05, 'epoch': 0.01} {'loss': 1.1724, 'learning_rate': 1.9999579939560644e-05, 'epoch': 0.01} {'loss': 1.1504, 'learning_rate': 1.9999576933792216e-05, 'epoch': 0.01} {'loss': 1.0833, 'learning_rate': 1.999957391730834e-05, 'epoch': 0.01} {'loss': 0.8288, 'learning_rate': 1.9999570890109013e-05, 'epoch': 0.01} {'loss': 0.9175, 'learning_rate': 1.9999567852194248e-05, 'epoch': 0.01} {'loss': 0.9506, 'learning_rate': 1.9999564803564042e-05, 'epoch': 0.01} {'loss': 0.9283, 'learning_rate': 1.9999561744218398e-05, 'epoch': 0.01} {'loss': 0.9399, 'learning_rate': 1.9999558674157323e-05, 'epoch': 0.01} {'loss': 0.9293, 'learning_rate': 1.9999555593380818e-05, 'epoch': 0.01} {'loss': 0.9432, 'learning_rate': 1.9999552501888884e-05, 'epoch': 0.01} {'loss': 0.9889, 'learning_rate': 1.999954939968153e-05, 'epoch': 0.01} {'loss': 0.9945, 'learning_rate': 1.999954628675876e-05, 'epoch': 0.01} {'loss': 0.9337, 'learning_rate': 1.9999543163120566e-05, 'epoch': 0.01} {'loss': 0.9949, 'learning_rate': 1.999954002876696e-05, 'epoch': 0.01} {'loss': 1.1689, 'learning_rate': 1.9999536883697946e-05, 'epoch': 0.01} {'loss': 1.1783, 'learning_rate': 1.999953372791353e-05, 'epoch': 0.01} {'loss': 1.1229, 'learning_rate': 1.9999530561413708e-05, 'epoch': 0.01} {'loss': 0.9126, 'learning_rate': 1.9999527384198486e-05, 'epoch': 0.01} {'loss': 1.0333, 'learning_rate': 1.9999524196267867e-05, 'epoch': 0.01} {'loss': 1.0964, 'learning_rate': 1.9999520997621858e-05, 'epoch': 0.01} {'loss': 1.0072, 'learning_rate': 1.9999517788260455e-05, 'epoch': 0.01} {'loss': 0.9157, 'learning_rate': 1.9999514568183672e-05, 'epoch': 0.01} {'loss': 0.9819, 'learning_rate': 1.9999511337391502e-05, 'epoch': 0.01} {'loss': 1.1549, 'learning_rate': 1.9999508095883956e-05, 'epoch': 0.01} {'loss': 0.9568, 'learning_rate': 1.999950484366103e-05, 'epoch': 0.01} {'loss': 0.8852, 'learning_rate': 1.999950158072274e-05, 'epoch': 0.01} {'loss': 1.0763, 'learning_rate': 1.9999498307069073e-05, 'epoch': 0.01} {'loss': 1.0774, 'learning_rate': 1.9999495022700046e-05, 'epoch': 0.01} {'loss': 1.0007, 'learning_rate': 1.9999491727615656e-05, 'epoch': 0.01} {'loss': 0.8876, 'learning_rate': 1.999948842181591e-05, 'epoch': 0.01} {'loss': 0.9989, 'learning_rate': 1.9999485105300808e-05, 'epoch': 0.01} {'loss': 1.0447, 'learning_rate': 1.9999481778070356e-05, 'epoch': 0.01} {'loss': 0.9266, 'learning_rate': 1.9999478440124557e-05, 'epoch': 0.01} {'loss': 0.9081, 'learning_rate': 1.9999475091463413e-05, 'epoch': 0.01} {'loss': 1.1062, 'learning_rate': 1.9999471732086932e-05, 'epoch': 0.01} {'loss': 0.9897, 'learning_rate': 1.9999468361995108e-05, 'epoch': 0.01} {'loss': 0.9104, 'learning_rate': 1.999946498118796e-05, 'epoch': 0.01} {'loss': 1.1044, 'learning_rate': 1.9999461589665473e-05, 'epoch': 0.01} {'loss': 0.9408, 'learning_rate': 1.9999458187427665e-05, 'epoch': 0.01} {'loss': 0.9628, 'learning_rate': 1.9999454774474538e-05, 'epoch': 0.01} {'loss': 1.0278, 'learning_rate': 1.9999451350806088e-05, 'epoch': 0.01} {'loss': 1.064, 'learning_rate': 1.9999447916422326e-05, 'epoch': 0.01} {'loss': 0.9601, 'learning_rate': 1.9999444471323254e-05, 'epoch': 0.01} {'loss': 0.9837, 'learning_rate': 1.999944101550887e-05, 'epoch': 0.01} {'loss': 0.9475, 'learning_rate': 1.999943754897919e-05, 'epoch': 0.01} {'loss': 0.8987, 'learning_rate': 1.9999434071734204e-05, 'epoch': 0.01} {'loss': 1.1481, 'learning_rate': 1.9999430583773924e-05, 'epoch': 0.01} {'loss': 1.0984, 'learning_rate': 1.9999427085098352e-05, 'epoch': 0.01} {'loss': 1.0753, 'learning_rate': 1.999942357570749e-05, 'epoch': 0.01} {'loss': 0.913, 'learning_rate': 1.9999420055601345e-05, 'epoch': 0.01} {'loss': 0.9434, 'learning_rate': 1.9999416524779917e-05, 'epoch': 0.01} {'loss': 0.9809, 'learning_rate': 1.999941298324321e-05, 'epoch': 0.01} {'loss': 0.9144, 'learning_rate': 1.9999409430991236e-05, 'epoch': 0.01} {'loss': 0.952, 'learning_rate': 1.9999405868023986e-05, 'epoch': 0.01} {'loss': 0.9391, 'learning_rate': 1.9999402294341475e-05, 'epoch': 0.01} {'loss': 1.1262, 'learning_rate': 1.9999398709943695e-05, 'epoch': 0.01} {'loss': 1.0012, 'learning_rate': 1.999939511483066e-05, 'epoch': 0.01} {'loss': 1.1441, 'learning_rate': 1.9999391509002375e-05, 'epoch': 0.01} {'loss': 1.0414, 'learning_rate': 1.9999387892458838e-05, 'epoch': 0.01} {'loss': 0.9208, 'learning_rate': 1.999938426520005e-05, 'epoch': 0.01} {'loss': 0.9267, 'learning_rate': 1.9999380627226023e-05, 'epoch': 0.01} {'loss': 0.8504, 'learning_rate': 1.9999376978536755e-05, 'epoch': 0.01} {'loss': 0.9641, 'learning_rate': 1.9999373319132256e-05, 'epoch': 0.01} {'loss': 1.0228, 'learning_rate': 1.999936964901252e-05, 'epoch': 0.01} {'loss': 0.7962, 'learning_rate': 1.9999365968177562e-05, 'epoch': 0.01} {'loss': 0.9491, 'learning_rate': 1.9999362276627377e-05, 'epoch': 0.01} {'loss': 0.9286, 'learning_rate': 1.9999358574361975e-05, 'epoch': 0.01} {'loss': 1.0642, 'learning_rate': 1.9999354861381358e-05, 'epoch': 0.01} {'loss': 0.9975, 'learning_rate': 1.999935113768553e-05, 'epoch': 0.01} {'loss': 0.9993, 'learning_rate': 1.9999347403274492e-05, 'epoch': 0.01} {'loss': 0.9367, 'learning_rate': 1.9999343658148253e-05, 'epoch': 0.01} {'loss': 0.957, 'learning_rate': 1.9999339902306814e-05, 'epoch': 0.01} {'loss': 0.9899, 'learning_rate': 1.999933613575018e-05, 'epoch': 0.01} {'loss': 1.1037, 'learning_rate': 1.9999332358478358e-05, 'epoch': 0.01} {'loss': 0.9884, 'learning_rate': 1.9999328570491347e-05, 'epoch': 0.01} {'loss': 0.9198, 'learning_rate': 1.999932477178915e-05, 'epoch': 0.01} {'loss': 0.9569, 'learning_rate': 1.999932096237178e-05, 'epoch': 0.01} {'loss': 0.9129, 'learning_rate': 1.999931714223923e-05, 'epoch': 0.01} {'loss': 1.215, 'learning_rate': 1.999931331139151e-05, 'epoch': 0.01} {'loss': 0.8994, 'learning_rate': 1.999930946982862e-05, 'epoch': 0.01} {'loss': 0.8954, 'learning_rate': 1.9999305617550574e-05, 'epoch': 0.01} {'loss': 1.0428, 'learning_rate': 1.9999301754557366e-05, 'epoch': 0.01} {'loss': 0.9277, 'learning_rate': 1.9999297880849005e-05, 'epoch': 0.01} {'loss': 0.9426, 'learning_rate': 1.9999293996425494e-05, 'epoch': 0.01} {'loss': 1.0654, 'learning_rate': 1.9999290101286834e-05, 'epoch': 0.01} {'loss': 1.1188, 'learning_rate': 1.9999286195433034e-05, 'epoch': 0.01} {'loss': 0.7754, 'learning_rate': 1.9999282278864098e-05, 'epoch': 0.01} {'loss': 1.004, 'learning_rate': 1.9999278351580025e-05, 'epoch': 0.01} {'loss': 1.0213, 'learning_rate': 1.9999274413580827e-05, 'epoch': 0.01} {'loss': 0.9201, 'learning_rate': 1.99992704648665e-05, 'epoch': 0.01} {'loss': 1.012, 'learning_rate': 1.9999266505437055e-05, 'epoch': 0.01} {'loss': 0.9718, 'learning_rate': 1.9999262535292493e-05, 'epoch': 0.01} {'loss': 0.874, 'learning_rate': 1.9999258554432817e-05, 'epoch': 0.01} {'loss': 0.9816, 'learning_rate': 1.9999254562858036e-05, 'epoch': 0.01} {'loss': 1.0024, 'learning_rate': 1.999925056056815e-05, 'epoch': 0.01} {'loss': 0.9572, 'learning_rate': 1.9999246547563164e-05, 'epoch': 0.01} {'loss': 0.9308, 'learning_rate': 1.9999242523843082e-05, 'epoch': 0.01} {'loss': 1.1486, 'learning_rate': 1.999923848940791e-05, 'epoch': 0.01} {'loss': 1.1253, 'learning_rate': 1.999923444425765e-05, 'epoch': 0.01} {'loss': 1.017, 'learning_rate': 1.999923038839231e-05, 'epoch': 0.01} {'loss': 1.0332, 'learning_rate': 1.999922632181189e-05, 'epoch': 0.01} {'loss': 0.9911, 'learning_rate': 1.99992222445164e-05, 'epoch': 0.01} {'loss': 0.9436, 'learning_rate': 1.9999218156505836e-05, 'epoch': 0.01} {'loss': 0.9614, 'learning_rate': 1.9999214057780212e-05, 'epoch': 0.01} {'loss': 0.9632, 'learning_rate': 1.9999209948339526e-05, 'epoch': 0.01} {'loss': 0.9875, 'learning_rate': 1.9999205828183784e-05, 'epoch': 0.01} {'loss': 1.0202, 'learning_rate': 1.999920169731299e-05, 'epoch': 0.01} {'loss': 0.9726, 'learning_rate': 1.999919755572715e-05, 'epoch': 0.01} {'loss': 1.0368, 'learning_rate': 1.9999193403426266e-05, 'epoch': 0.01} {'loss': 0.9425, 'learning_rate': 1.9999189240410342e-05, 'epoch': 0.01} {'loss': 1.0188, 'learning_rate': 1.9999185066679388e-05, 'epoch': 0.01} {'loss': 0.885, 'learning_rate': 1.9999180882233406e-05, 'epoch': 0.01} {'loss': 0.9015, 'learning_rate': 1.9999176687072396e-05, 'epoch': 0.01} {'loss': 1.036, 'learning_rate': 1.999917248119636e-05, 'epoch': 0.01} {'loss': 0.9913, 'learning_rate': 1.9999168264605316e-05, 'epoch': 0.01} {'loss': 1.0826, 'learning_rate': 1.999916403729926e-05, 'epoch': 0.01} {'loss': 1.1171, 'learning_rate': 1.9999159799278196e-05, 'epoch': 0.01} {'loss': 0.9985, 'learning_rate': 1.9999155550542132e-05, 'epoch': 0.01} {'loss': 0.99, 'learning_rate': 1.9999151291091067e-05, 'epoch': 0.01} {'loss': 0.9336, 'learning_rate': 1.9999147020925012e-05, 'epoch': 0.01} {'loss': 1.0199, 'learning_rate': 1.9999142740043966e-05, 'epoch': 0.01} {'loss': 0.9403, 'learning_rate': 1.9999138448447937e-05, 'epoch': 0.01} {'loss': 0.9302, 'learning_rate': 1.9999134146136927e-05, 'epoch': 0.01} {'loss': 1.077, 'learning_rate': 1.9999129833110947e-05, 'epoch': 0.01} {'loss': 0.9842, 'learning_rate': 1.9999125509369993e-05, 'epoch': 0.01} {'loss': 0.9861, 'learning_rate': 1.9999121174914073e-05, 'epoch': 0.01} {'loss': 0.991, 'learning_rate': 1.9999116829743196e-05, 'epoch': 0.01} {'loss': 1.0584, 'learning_rate': 1.9999112473857355e-05, 'epoch': 0.01} {'loss': 1.1023, 'learning_rate': 1.9999108107256572e-05, 'epoch': 0.01} {'loss': 0.8032, 'learning_rate': 1.9999103729940835e-05, 'epoch': 0.01} {'loss': 0.8447, 'learning_rate': 1.999909934191016e-05, 'epoch': 0.01} {'loss': 0.8248, 'learning_rate': 1.9999094943164546e-05, 'epoch': 0.01} {'loss': 1.0636, 'learning_rate': 1.9999090533704e-05, 'epoch': 0.01} {'loss': 0.8613, 'learning_rate': 1.9999086113528525e-05, 'epoch': 0.01} {'loss': 0.9462, 'learning_rate': 1.9999081682638127e-05, 'epoch': 0.01} {'loss': 1.1581, 'learning_rate': 1.9999077241032814e-05, 'epoch': 0.01} {'loss': 0.9385, 'learning_rate': 1.9999072788712584e-05, 'epoch': 0.01} {'loss': 0.8682, 'learning_rate': 1.9999068325677445e-05, 'epoch': 0.01} {'loss': 0.8493, 'learning_rate': 1.9999063851927404e-05, 'epoch': 0.01} {'loss': 1.0732, 'learning_rate': 1.999905936746246e-05, 'epoch': 0.01} {'loss': 0.9818, 'learning_rate': 1.9999054872282624e-05, 'epoch': 0.01} {'loss': 1.1319, 'learning_rate': 1.9999050366387896e-05, 'epoch': 0.01} {'loss': 1.1084, 'learning_rate': 1.9999045849778285e-05, 'epoch': 0.01} {'loss': 0.9823, 'learning_rate': 1.9999041322453793e-05, 'epoch': 0.02} {'loss': 1.1446, 'learning_rate': 1.9999036784414425e-05, 'epoch': 0.02} {'loss': 1.0352, 'learning_rate': 1.999903223566019e-05, 'epoch': 0.02} {'loss': 1.0005, 'learning_rate': 1.9999027676191084e-05, 'epoch': 0.02} {'loss': 0.9438, 'learning_rate': 1.999902310600712e-05, 'epoch': 0.02} {'loss': 1.1421, 'learning_rate': 1.9999018525108306e-05, 'epoch': 0.02} {'loss': 1.0597, 'learning_rate': 1.9999013933494633e-05, 'epoch': 0.02} {'loss': 0.8418, 'learning_rate': 1.999900933116612e-05, 'epoch': 0.02} {'loss': 1.041, 'learning_rate': 1.999900471812276e-05, 'epoch': 0.02} {'loss': 1.0871, 'learning_rate': 1.999900009436457e-05, 'epoch': 0.02} {'loss': 1.1228, 'learning_rate': 1.9998995459891547e-05, 'epoch': 0.02} {'loss': 0.9887, 'learning_rate': 1.9998990814703694e-05, 'epoch': 0.02} {'loss': 1.201, 'learning_rate': 1.9998986158801023e-05, 'epoch': 0.02} {'loss': 0.9145, 'learning_rate': 1.9998981492183538e-05, 'epoch': 0.02} {'loss': 0.9775, 'learning_rate': 1.999897681485124e-05, 'epoch': 0.02} {'loss': 1.0856, 'learning_rate': 1.9998972126804132e-05, 'epoch': 0.02} {'loss': 1.0463, 'learning_rate': 1.9998967428042227e-05, 'epoch': 0.02} {'loss': 0.8507, 'learning_rate': 1.9998962718565526e-05, 'epoch': 0.02} {'loss': 0.9117, 'learning_rate': 1.9998957998374033e-05, 'epoch': 0.02} {'loss': 0.95, 'learning_rate': 1.9998953267467754e-05, 'epoch': 0.02} {'loss': 1.0693, 'learning_rate': 1.9998948525846694e-05, 'epoch': 0.02} {'loss': 0.974, 'learning_rate': 1.999894377351086e-05, 'epoch': 0.02} {'loss': 0.9877, 'learning_rate': 1.9998939010460253e-05, 'epoch': 0.02} {'loss': 0.8169, 'learning_rate': 1.9998934236694882e-05, 'epoch': 0.02} {'loss': 1.1313, 'learning_rate': 1.999892945221475e-05, 'epoch': 0.02} {'loss': 0.9799, 'learning_rate': 1.9998924657019864e-05, 'epoch': 0.02} {'loss': 1.0158, 'learning_rate': 1.9998919851110226e-05, 'epoch': 0.02} {'loss': 0.8657, 'learning_rate': 1.9998915034485842e-05, 'epoch': 0.02} {'loss': 1.0646, 'learning_rate': 1.9998910207146722e-05, 'epoch': 0.02} {'loss': 1.0516, 'learning_rate': 1.999890536909286e-05, 'epoch': 0.02} {'loss': 0.8647, 'learning_rate': 1.9998900520324275e-05, 'epoch': 0.02} {'loss': 0.9289, 'learning_rate': 1.9998895660840962e-05, 'epoch': 0.02} {'loss': 0.849, 'learning_rate': 1.9998890790642933e-05, 'epoch': 0.02} {'loss': 0.9846, 'learning_rate': 1.999888590973019e-05, 'epoch': 0.02} {'loss': 1.0697, 'learning_rate': 1.9998881018102735e-05, 'epoch': 0.02} {'loss': 1.0042, 'learning_rate': 1.9998876115760578e-05, 'epoch': 0.02} {'loss': 1.2303, 'learning_rate': 1.9998871202703726e-05, 'epoch': 0.02} {'loss': 0.8943, 'learning_rate': 1.9998866278932177e-05, 'epoch': 0.02} {'loss': 1.0586, 'learning_rate': 1.999886134444594e-05, 'epoch': 0.02} {'loss': 1.0677, 'learning_rate': 1.9998856399245025e-05, 'epoch': 0.02} {'loss': 0.9763, 'learning_rate': 1.9998851443329427e-05, 'epoch': 0.02} {'loss': 0.9666, 'learning_rate': 1.9998846476699163e-05, 'epoch': 0.02} {'loss': 0.9564, 'learning_rate': 1.9998841499354228e-05, 'epoch': 0.02} {'loss': 0.9844, 'learning_rate': 1.9998836511294634e-05, 'epoch': 0.02} {'loss': 1.0467, 'learning_rate': 1.9998831512520382e-05, 'epoch': 0.02} {'loss': 1.0645, 'learning_rate': 1.999882650303148e-05, 'epoch': 0.02} {'loss': 0.9319, 'learning_rate': 1.9998821482827936e-05, 'epoch': 0.02} {'loss': 0.9782, 'learning_rate': 1.9998816451909753e-05, 'epoch': 0.02} {'loss': 1.0957, 'learning_rate': 1.999881141027693e-05, 'epoch': 0.02} {'loss': 0.8977, 'learning_rate': 1.9998806357929485e-05, 'epoch': 0.02} {'loss': 1.1342, 'learning_rate': 1.999880129486741e-05, 'epoch': 0.02} {'loss': 1.0524, 'learning_rate': 1.9998796221090725e-05, 'epoch': 0.02} {'loss': 0.9109, 'learning_rate': 1.999879113659942e-05, 'epoch': 0.02} {'loss': 0.9755, 'learning_rate': 1.9998786041393508e-05, 'epoch': 0.02} {'loss': 1.0064, 'learning_rate': 1.9998780935473e-05, 'epoch': 0.02} {'loss': 0.9283, 'learning_rate': 1.999877581883789e-05, 'epoch': 0.02} {'loss': 1.0417, 'learning_rate': 1.9998770691488195e-05, 'epoch': 0.02} {'loss': 1.0244, 'learning_rate': 1.9998765553423908e-05, 'epoch': 0.02} {'loss': 0.9234, 'learning_rate': 1.9998760404645047e-05, 'epoch': 0.02} {'loss': 0.9102, 'learning_rate': 1.9998755245151612e-05, 'epoch': 0.02} {'loss': 0.9157, 'learning_rate': 1.9998750074943604e-05, 'epoch': 0.02} {'loss': 1.0185, 'learning_rate': 1.9998744894021035e-05, 'epoch': 0.02} {'loss': 0.905, 'learning_rate': 1.9998739702383907e-05, 'epoch': 0.02} {'loss': 1.0565, 'learning_rate': 1.9998734500032228e-05, 'epoch': 0.02} {'loss': 0.9406, 'learning_rate': 1.9998729286966002e-05, 'epoch': 0.02} {'loss': 1.1688, 'learning_rate': 1.9998724063185237e-05, 'epoch': 0.02} {'loss': 1.1205, 'learning_rate': 1.9998718828689935e-05, 'epoch': 0.02} {'loss': 1.0915, 'learning_rate': 1.9998713583480104e-05, 'epoch': 0.02} {'loss': 0.9433, 'learning_rate': 1.999870832755575e-05, 'epoch': 0.02} {'loss': 0.9692, 'learning_rate': 1.9998703060916875e-05, 'epoch': 0.02} {'loss': 1.1349, 'learning_rate': 1.999869778356349e-05, 'epoch': 0.02} {'loss': 1.211, 'learning_rate': 1.9998692495495596e-05, 'epoch': 0.02} {'loss': 0.9783, 'learning_rate': 1.99986871967132e-05, 'epoch': 0.02} {'loss': 1.0387, 'learning_rate': 1.9998681887216312e-05, 'epoch': 0.02} {'loss': 1.0454, 'learning_rate': 1.999867656700493e-05, 'epoch': 0.02} {'loss': 0.905, 'learning_rate': 1.9998671236079063e-05, 'epoch': 0.02} {'loss': 1.1532, 'learning_rate': 1.999866589443872e-05, 'epoch': 0.02} {'loss': 0.9814, 'learning_rate': 1.9998660542083904e-05, 'epoch': 0.02} {'loss': 1.1196, 'learning_rate': 1.999865517901462e-05, 'epoch': 0.02} {'loss': 0.8837, 'learning_rate': 1.9998649805230874e-05, 'epoch': 0.02} {'loss': 1.0473, 'learning_rate': 1.999864442073267e-05, 'epoch': 0.02} {'loss': 0.9894, 'learning_rate': 1.999863902552002e-05, 'epoch': 0.02} {'loss': 1.0792, 'learning_rate': 1.9998633619592928e-05, 'epoch': 0.02} {'loss': 0.9848, 'learning_rate': 1.9998628202951393e-05, 'epoch': 0.02} {'loss': 0.9018, 'learning_rate': 1.9998622775595427e-05, 'epoch': 0.02} {'loss': 0.8734, 'learning_rate': 1.9998617337525033e-05, 'epoch': 0.02} {'loss': 0.8427, 'learning_rate': 1.999861188874022e-05, 'epoch': 0.02} {'loss': 1.1189, 'learning_rate': 1.9998606429240988e-05, 'epoch': 0.02} {'loss': 0.901, 'learning_rate': 1.999860095902735e-05, 'epoch': 0.02} {'loss': 1.1706, 'learning_rate': 1.9998595478099312e-05, 'epoch': 0.02} {'loss': 1.1624, 'learning_rate': 1.9998589986456873e-05, 'epoch': 0.02} {'loss': 0.8165, 'learning_rate': 1.9998584484100043e-05, 'epoch': 0.02} {'loss': 1.0252, 'learning_rate': 1.9998578971028825e-05, 'epoch': 0.02} {'loss': 1.0471, 'learning_rate': 1.999857344724323e-05, 'epoch': 0.02} {'loss': 1.0948, 'learning_rate': 1.999856791274326e-05, 'epoch': 0.02} {'loss': 0.9872, 'learning_rate': 1.9998562367528922e-05, 'epoch': 0.02} {'loss': 0.8225, 'learning_rate': 1.9998556811600222e-05, 'epoch': 0.02} {'loss': 1.0625, 'learning_rate': 1.9998551244957166e-05, 'epoch': 0.02} {'loss': 0.9934, 'learning_rate': 1.999854566759976e-05, 'epoch': 0.02} {'loss': 0.9869, 'learning_rate': 1.999854007952801e-05, 'epoch': 0.02} {'loss': 0.8966, 'learning_rate': 1.9998534480741923e-05, 'epoch': 0.02} {'loss': 0.9717, 'learning_rate': 1.99985288712415e-05, 'epoch': 0.02} {'loss': 0.9667, 'learning_rate': 1.9998523251026757e-05, 'epoch': 0.02} {'loss': 1.1285, 'learning_rate': 1.9998517620097687e-05, 'epoch': 0.02} {'loss': 1.0028, 'learning_rate': 1.999851197845431e-05, 'epoch': 0.02} {'loss': 0.927, 'learning_rate': 1.999850632609662e-05, 'epoch': 0.02} {'loss': 0.9496, 'learning_rate': 1.999850066302463e-05, 'epoch': 0.02} {'loss': 1.1477, 'learning_rate': 1.9998494989238343e-05, 'epoch': 0.02} {'loss': 0.9017, 'learning_rate': 1.9998489304737767e-05, 'epoch': 0.02} {'loss': 0.9467, 'learning_rate': 1.9998483609522905e-05, 'epoch': 0.02} {'loss': 1.1489, 'learning_rate': 1.9998477903593768e-05, 'epoch': 0.02} {'loss': 0.9616, 'learning_rate': 1.9998472186950358e-05, 'epoch': 0.02} {'loss': 0.9519, 'learning_rate': 1.9998466459592686e-05, 'epoch': 0.02} {'loss': 0.9232, 'learning_rate': 1.9998460721520753e-05, 'epoch': 0.02} {'loss': 0.9848, 'learning_rate': 1.9998454972734564e-05, 'epoch': 0.02} {'loss': 0.9248, 'learning_rate': 1.9998449213234133e-05, 'epoch': 0.02} {'loss': 1.0665, 'learning_rate': 1.9998443443019457e-05, 'epoch': 0.02} {'loss': 0.9274, 'learning_rate': 1.999843766209055e-05, 'epoch': 0.02} {'loss': 0.9089, 'learning_rate': 1.999843187044741e-05, 'epoch': 0.02} {'loss': 0.9977, 'learning_rate': 1.999842606809005e-05, 'epoch': 0.02} {'loss': 0.9184, 'learning_rate': 1.9998420255018476e-05, 'epoch': 0.02} {'loss': 0.871, 'learning_rate': 1.999841443123269e-05, 'epoch': 0.02} {'loss': 0.967, 'learning_rate': 1.9998408596732702e-05, 'epoch': 0.02} {'loss': 1.0953, 'learning_rate': 1.9998402751518514e-05, 'epoch': 0.02} {'loss': 1.0807, 'learning_rate': 1.9998396895590138e-05, 'epoch': 0.02} {'loss': 0.7853, 'learning_rate': 1.9998391028947578e-05, 'epoch': 0.02} {'loss': 0.8009, 'learning_rate': 1.999838515159084e-05, 'epoch': 0.02} {'loss': 0.9737, 'learning_rate': 1.9998379263519926e-05, 'epoch': 0.02} {'loss': 1.1453, 'learning_rate': 1.9998373364734848e-05, 'epoch': 0.02} {'loss': 1.0718, 'learning_rate': 1.9998367455235612e-05, 'epoch': 0.02} {'loss': 0.826, 'learning_rate': 1.999836153502222e-05, 'epoch': 0.02} {'loss': 1.1163, 'learning_rate': 1.9998355604094684e-05, 'epoch': 0.02} {'loss': 0.9839, 'learning_rate': 1.9998349662453008e-05, 'epoch': 0.02} {'loss': 0.8444, 'learning_rate': 1.9998343710097195e-05, 'epoch': 0.02} {'loss': 0.9007, 'learning_rate': 1.9998337747027253e-05, 'epoch': 0.02} {'loss': 1.0738, 'learning_rate': 1.9998331773243197e-05, 'epoch': 0.02} {'loss': 0.9593, 'learning_rate': 1.999832578874502e-05, 'epoch': 0.02} {'loss': 0.9799, 'learning_rate': 1.9998319793532737e-05, 'epoch': 0.02} {'loss': 1.0776, 'learning_rate': 1.999831378760635e-05, 'epoch': 0.02} {'loss': 1.0458, 'learning_rate': 1.9998307770965865e-05, 'epoch': 0.02} {'loss': 1.02, 'learning_rate': 1.9998301743611296e-05, 'epoch': 0.02} {'loss': 0.8282, 'learning_rate': 1.9998295705542644e-05, 'epoch': 0.02} {'loss': 1.1319, 'learning_rate': 1.9998289656759912e-05, 'epoch': 0.02} {'loss': 0.9062, 'learning_rate': 1.9998283597263112e-05, 'epoch': 0.02} {'loss': 0.871, 'learning_rate': 1.999827752705225e-05, 'epoch': 0.02} {'loss': 0.9733, 'learning_rate': 1.9998271446127332e-05, 'epoch': 0.02} {'loss': 0.9927, 'learning_rate': 1.9998265354488363e-05, 'epoch': 0.02} {'loss': 1.0921, 'learning_rate': 1.9998259252135348e-05, 'epoch': 0.02} {'loss': 0.9541, 'learning_rate': 1.9998253139068295e-05, 'epoch': 0.02} {'loss': 1.0655, 'learning_rate': 1.9998247015287213e-05, 'epoch': 0.02} {'loss': 0.9982, 'learning_rate': 1.999824088079211e-05, 'epoch': 0.02} {'loss': 0.7909, 'learning_rate': 1.9998234735582985e-05, 'epoch': 0.02} {'loss': 0.9977, 'learning_rate': 1.999822857965985e-05, 'epoch': 0.02} {'loss': 1.0606, 'learning_rate': 1.9998222413022712e-05, 'epoch': 0.02} {'loss': 1.0227, 'learning_rate': 1.9998216235671578e-05, 'epoch': 0.02} {'loss': 1.0733, 'learning_rate': 1.999821004760645e-05, 'epoch': 0.02} {'loss': 1.1341, 'learning_rate': 1.999820384882734e-05, 'epoch': 0.02} {'loss': 1.124, 'learning_rate': 1.9998197639334247e-05, 'epoch': 0.02} {'loss': 0.8929, 'learning_rate': 1.999819141912719e-05, 'epoch': 0.02} {'loss': 1.089, 'learning_rate': 1.9998185188206164e-05, 'epoch': 0.02} {'loss': 0.9042, 'learning_rate': 1.999817894657118e-05, 'epoch': 0.02} {'loss': 0.8924, 'learning_rate': 1.9998172694222245e-05, 'epoch': 0.02} {'loss': 0.8665, 'learning_rate': 1.999816643115937e-05, 'epoch': 0.02} {'loss': 1.0098, 'learning_rate': 1.9998160157382552e-05, 'epoch': 0.02} {'loss': 0.9544, 'learning_rate': 1.9998153872891805e-05, 'epoch': 0.02} {'loss': 1.0177, 'learning_rate': 1.9998147577687135e-05, 'epoch': 0.02} {'loss': 1.0384, 'learning_rate': 1.9998141271768546e-05, 'epoch': 0.02} {'loss': 0.9437, 'learning_rate': 1.9998134955136046e-05, 'epoch': 0.02} {'loss': 1.1647, 'learning_rate': 1.999812862778964e-05, 'epoch': 0.02} {'loss': 0.8742, 'learning_rate': 1.9998122289729342e-05, 'epoch': 0.02} {'loss': 0.9224, 'learning_rate': 1.999811594095515e-05, 'epoch': 0.02} {'loss': 0.9514, 'learning_rate': 1.9998109581467077e-05, 'epoch': 0.02} {'loss': 1.0321, 'learning_rate': 1.9998103211265124e-05, 'epoch': 0.02} {'loss': 1.1271, 'learning_rate': 1.9998096830349302e-05, 'epoch': 0.02} {'loss': 0.8334, 'learning_rate': 1.9998090438719617e-05, 'epoch': 0.02} {'loss': 0.8265, 'learning_rate': 1.9998084036376074e-05, 'epoch': 0.02} {'loss': 0.9194, 'learning_rate': 1.9998077623318682e-05, 'epoch': 0.02} {'loss': 0.9192, 'learning_rate': 1.9998071199547452e-05, 'epoch': 0.02} {'loss': 1.1099, 'learning_rate': 1.9998064765062383e-05, 'epoch': 0.02} {'loss': 1.092, 'learning_rate': 1.9998058319863486e-05, 'epoch': 0.02} {'loss': 0.9909, 'learning_rate': 1.9998051863950764e-05, 'epoch': 0.02} {'loss': 0.9383, 'learning_rate': 1.999804539732423e-05, 'epoch': 0.02} {'loss': 0.8079, 'learning_rate': 1.9998038919983888e-05, 'epoch': 0.02} {'loss': 0.9406, 'learning_rate': 1.9998032431929745e-05, 'epoch': 0.02} {'loss': 1.0402, 'learning_rate': 1.9998025933161808e-05, 'epoch': 0.02} {'loss': 1.1781, 'learning_rate': 1.9998019423680082e-05, 'epoch': 0.02} {'loss': 1.047, 'learning_rate': 1.9998012903484576e-05, 'epoch': 0.02} {'loss': 1.1168, 'learning_rate': 1.99980063725753e-05, 'epoch': 0.02} {'loss': 0.951, 'learning_rate': 1.9997999830952255e-05, 'epoch': 0.02} {'loss': 1.0469, 'learning_rate': 1.999799327861545e-05, 'epoch': 0.02} {'loss': 1.1295, 'learning_rate': 1.9997986715564895e-05, 'epoch': 0.02} {'loss': 0.9675, 'learning_rate': 1.9997980141800592e-05, 'epoch': 0.02} {'loss': 1.0003, 'learning_rate': 1.9997973557322553e-05, 'epoch': 0.02} {'loss': 0.9779, 'learning_rate': 1.9997966962130784e-05, 'epoch': 0.02} {'loss': 1.2211, 'learning_rate': 1.999796035622529e-05, 'epoch': 0.02} {'loss': 0.936, 'learning_rate': 1.9997953739606078e-05, 'epoch': 0.02} {'loss': 0.8874, 'learning_rate': 1.999794711227316e-05, 'epoch': 0.02} {'loss': 0.9382, 'learning_rate': 1.9997940474226537e-05, 'epoch': 0.02} {'loss': 0.9996, 'learning_rate': 1.9997933825466215e-05, 'epoch': 0.02} {'loss': 1.0305, 'learning_rate': 1.9997927165992207e-05, 'epoch': 0.02} {'loss': 0.9913, 'learning_rate': 1.999792049580452e-05, 'epoch': 0.02} {'loss': 0.9816, 'learning_rate': 1.9997913814903157e-05, 'epoch': 0.02} {'loss': 1.014, 'learning_rate': 1.999790712328813e-05, 'epoch': 0.02} {'loss': 1.0188, 'learning_rate': 1.9997900420959437e-05, 'epoch': 0.02} {'loss': 0.9299, 'learning_rate': 1.9997893707917094e-05, 'epoch': 0.02} {'loss': 1.05, 'learning_rate': 1.9997886984161105e-05, 'epoch': 0.02} {'loss': 0.9103, 'learning_rate': 1.999788024969148e-05, 'epoch': 0.02} {'loss': 1.0091, 'learning_rate': 1.9997873504508222e-05, 'epoch': 0.02} {'loss': 0.9902, 'learning_rate': 1.999786674861134e-05, 'epoch': 0.02} {'loss': 0.9812, 'learning_rate': 1.9997859982000846e-05, 'epoch': 0.02} {'loss': 1.1257, 'learning_rate': 1.999785320467674e-05, 'epoch': 0.02} {'loss': 0.9863, 'learning_rate': 1.999784641663903e-05, 'epoch': 0.02} {'loss': 0.9523, 'learning_rate': 1.9997839617887723e-05, 'epoch': 0.02} {'loss': 1.0452, 'learning_rate': 1.9997832808422832e-05, 'epoch': 0.02} {'loss': 1.0399, 'learning_rate': 1.9997825988244363e-05, 'epoch': 0.02} {'loss': 0.9889, 'learning_rate': 1.9997819157352317e-05, 'epoch': 0.02} {'loss': 1.0723, 'learning_rate': 1.9997812315746706e-05, 'epoch': 0.02} {'loss': 0.8692, 'learning_rate': 1.999780546342754e-05, 'epoch': 0.02} {'loss': 1.0118, 'learning_rate': 1.9997798600394817e-05, 'epoch': 0.02} {'loss': 0.8202, 'learning_rate': 1.9997791726648558e-05, 'epoch': 0.02} {'loss': 0.8537, 'learning_rate': 1.999778484218876e-05, 'epoch': 0.02} {'loss': 1.0864, 'learning_rate': 1.999777794701543e-05, 'epoch': 0.02} {'loss': 1.0872, 'learning_rate': 1.999777104112858e-05, 'epoch': 0.02} {'loss': 1.0394, 'learning_rate': 1.9997764124528217e-05, 'epoch': 0.02} {'loss': 1.0379, 'learning_rate': 1.9997757197214348e-05, 'epoch': 0.02} {'loss': 0.8967, 'learning_rate': 1.9997750259186976e-05, 'epoch': 0.02} {'loss': 1.1199, 'learning_rate': 1.9997743310446118e-05, 'epoch': 0.02} {'loss': 1.0541, 'learning_rate': 1.9997736350991773e-05, 'epoch': 0.02} {'loss': 1.1643, 'learning_rate': 1.999772938082395e-05, 'epoch': 0.02} {'loss': 1.1552, 'learning_rate': 1.999772239994266e-05, 'epoch': 0.02} {'loss': 0.9382, 'learning_rate': 1.9997715408347904e-05, 'epoch': 0.02} {'loss': 0.9803, 'learning_rate': 1.9997708406039696e-05, 'epoch': 0.02} {'loss': 0.8883, 'learning_rate': 1.9997701393018042e-05, 'epoch': 0.02} {'loss': 1.0303, 'learning_rate': 1.9997694369282946e-05, 'epoch': 0.02} {'loss': 1.0577, 'learning_rate': 1.9997687334834422e-05, 'epoch': 0.02} {'loss': 1.0236, 'learning_rate': 1.9997680289672473e-05, 'epoch': 0.02} {'loss': 0.8664, 'learning_rate': 1.9997673233797105e-05, 'epoch': 0.02} {'loss': 0.8563, 'learning_rate': 1.999766616720833e-05, 'epoch': 0.02} {'loss': 1.1479, 'learning_rate': 1.999765908990615e-05, 'epoch': 0.02} {'loss': 0.8418, 'learning_rate': 1.999765200189058e-05, 'epoch': 0.02} {'loss': 1.0113, 'learning_rate': 1.999764490316162e-05, 'epoch': 0.02} {'loss': 1.0539, 'learning_rate': 1.9997637793719282e-05, 'epoch': 0.02} {'loss': 0.9403, 'learning_rate': 1.9997630673563576e-05, 'epoch': 0.02} {'loss': 0.8769, 'learning_rate': 1.9997623542694503e-05, 'epoch': 0.02} {'loss': 1.0455, 'learning_rate': 1.9997616401112073e-05, 'epoch': 0.02} {'loss': 1.0805, 'learning_rate': 1.99976092488163e-05, 'epoch': 0.02} {'loss': 1.0078, 'learning_rate': 1.999760208580718e-05, 'epoch': 0.02} {'loss': 0.9547, 'learning_rate': 1.9997594912084732e-05, 'epoch': 0.02} {'loss': 1.0464, 'learning_rate': 1.9997587727648957e-05, 'epoch': 0.02} {'loss': 1.1481, 'learning_rate': 1.9997580532499865e-05, 'epoch': 0.02} {'loss': 0.9905, 'learning_rate': 1.999757332663746e-05, 'epoch': 0.02} {'loss': 1.073, 'learning_rate': 1.9997566110061757e-05, 'epoch': 0.02} {'loss': 0.9761, 'learning_rate': 1.9997558882772755e-05, 'epoch': 0.02} {'loss': 1.0724, 'learning_rate': 1.999755164477047e-05, 'epoch': 0.02} {'loss': 0.9837, 'learning_rate': 1.9997544396054906e-05, 'epoch': 0.02} {'loss': 0.8564, 'learning_rate': 1.999753713662607e-05, 'epoch': 0.02} {'loss': 0.9502, 'learning_rate': 1.999752986648397e-05, 'epoch': 0.02} {'loss': 0.8381, 'learning_rate': 1.9997522585628615e-05, 'epoch': 0.02} {'loss': 0.9384, 'learning_rate': 1.9997515294060014e-05, 'epoch': 0.02} {'loss': 0.969, 'learning_rate': 1.9997507991778168e-05, 'epoch': 0.02} {'loss': 1.0044, 'learning_rate': 1.9997500678783096e-05, 'epoch': 0.02} {'loss': 1.0275, 'learning_rate': 1.9997493355074796e-05, 'epoch': 0.02} {'loss': 0.9964, 'learning_rate': 1.9997486020653277e-05, 'epoch': 0.02} {'loss': 0.882, 'learning_rate': 1.9997478675518556e-05, 'epoch': 0.02} {'loss': 1.0658, 'learning_rate': 1.999747131967063e-05, 'epoch': 0.02} {'loss': 0.9828, 'learning_rate': 1.9997463953109514e-05, 'epoch': 0.02} {'loss': 0.8757, 'learning_rate': 1.999745657583521e-05, 'epoch': 0.02} {'loss': 0.8973, 'learning_rate': 1.999744918784773e-05, 'epoch': 0.02} {'loss': 0.9298, 'learning_rate': 1.999744178914708e-05, 'epoch': 0.02} {'loss': 0.8937, 'learning_rate': 1.999743437973327e-05, 'epoch': 0.02} {'loss': 1.0934, 'learning_rate': 1.9997426959606306e-05, 'epoch': 0.02} {'loss': 0.8789, 'learning_rate': 1.9997419528766197e-05, 'epoch': 0.02} {'loss': 1.013, 'learning_rate': 1.999741208721295e-05, 'epoch': 0.02} {'loss': 0.9396, 'learning_rate': 1.9997404634946577e-05, 'epoch': 0.02} {'loss': 1.0624, 'learning_rate': 1.999739717196708e-05, 'epoch': 0.02} {'loss': 1.0062, 'learning_rate': 1.999738969827447e-05, 'epoch': 0.02} {'loss': 0.9165, 'learning_rate': 1.999738221386875e-05, 'epoch': 0.02} {'loss': 1.0549, 'learning_rate': 1.999737471874994e-05, 'epoch': 0.02} {'loss': 1.1086, 'learning_rate': 1.9997367212918037e-05, 'epoch': 0.02} {'loss': 1.03, 'learning_rate': 1.9997359696373054e-05, 'epoch': 0.02} {'loss': 0.8654, 'learning_rate': 1.9997352169114995e-05, 'epoch': 0.02} {'loss': 1.2014, 'learning_rate': 1.9997344631143876e-05, 'epoch': 0.02} {'loss': 0.9506, 'learning_rate': 1.9997337082459695e-05, 'epoch': 0.02} {'loss': 1.0451, 'learning_rate': 1.9997329523062467e-05, 'epoch': 0.02} {'loss': 1.0247, 'learning_rate': 1.9997321952952198e-05, 'epoch': 0.02} {'loss': 1.0634, 'learning_rate': 1.9997314372128896e-05, 'epoch': 0.02} {'loss': 1.1166, 'learning_rate': 1.999730678059257e-05, 'epoch': 0.02} {'loss': 1.001, 'learning_rate': 1.9997299178343227e-05, 'epoch': 0.02} {'loss': 0.8839, 'learning_rate': 1.9997291565380873e-05, 'epoch': 0.02} {'loss': 0.9489, 'learning_rate': 1.9997283941705524e-05, 'epoch': 0.02} {'loss': 0.8824, 'learning_rate': 1.999727630731718e-05, 'epoch': 0.02} {'loss': 1.0174, 'learning_rate': 1.9997268662215852e-05, 'epoch': 0.02} {'loss': 1.1226, 'learning_rate': 1.999726100640155e-05, 'epoch': 0.02} {'loss': 0.9941, 'learning_rate': 1.9997253339874278e-05, 'epoch': 0.02} {'loss': 0.912, 'learning_rate': 1.999724566263405e-05, 'epoch': 0.02} {'loss': 0.9064, 'learning_rate': 1.9997237974680867e-05, 'epoch': 0.02} {'loss': 1.0313, 'learning_rate': 1.9997230276014747e-05, 'epoch': 0.02} {'loss': 0.7875, 'learning_rate': 1.9997222566635686e-05, 'epoch': 0.02} {'loss': 0.8562, 'learning_rate': 1.99972148465437e-05, 'epoch': 0.02} {'loss': 0.9519, 'learning_rate': 1.99972071157388e-05, 'epoch': 0.02} {'loss': 0.9242, 'learning_rate': 1.9997199374220985e-05, 'epoch': 0.02} {'loss': 1.0055, 'learning_rate': 1.999719162199027e-05, 'epoch': 0.02} {'loss': 1.0121, 'learning_rate': 1.9997183859046665e-05, 'epoch': 0.02} {'loss': 0.9877, 'learning_rate': 1.9997176085390174e-05, 'epoch': 0.02} {'loss': 0.884, 'learning_rate': 1.9997168301020803e-05, 'epoch': 0.02} {'loss': 1.1432, 'learning_rate': 1.999716050593857e-05, 'epoch': 0.02} {'loss': 0.9049, 'learning_rate': 1.9997152700143473e-05, 'epoch': 0.02} {'loss': 1.1439, 'learning_rate': 1.9997144883635524e-05, 'epoch': 0.02} {'loss': 1.1541, 'learning_rate': 1.9997137056414732e-05, 'epoch': 0.02} {'loss': 1.0604, 'learning_rate': 1.999712921848111e-05, 'epoch': 0.02} {'loss': 0.9366, 'learning_rate': 1.999712136983466e-05, 'epoch': 0.02} {'loss': 1.0376, 'learning_rate': 1.9997113510475388e-05, 'epoch': 0.02} {'loss': 1.0993, 'learning_rate': 1.9997105640403308e-05, 'epoch': 0.02} {'loss': 1.0501, 'learning_rate': 1.9997097759618433e-05, 'epoch': 0.02} {'loss': 0.9576, 'learning_rate': 1.999708986812076e-05, 'epoch': 0.02} {'loss': 0.7374, 'learning_rate': 1.99970819659103e-05, 'epoch': 0.02} {'loss': 0.9342, 'learning_rate': 1.999707405298707e-05, 'epoch': 0.02} {'loss': 1.1008, 'learning_rate': 1.999706612935107e-05, 'epoch': 0.02} {'loss': 1.0293, 'learning_rate': 1.9997058195002313e-05, 'epoch': 0.02} {'loss': 0.7713, 'learning_rate': 1.9997050249940804e-05, 'epoch': 0.02} {'loss': 0.9221, 'learning_rate': 1.9997042294166557e-05, 'epoch': 0.02} {'loss': 1.1435, 'learning_rate': 1.9997034327679573e-05, 'epoch': 0.02} {'loss': 0.9608, 'learning_rate': 1.9997026350479865e-05, 'epoch': 0.02} {'loss': 0.9144, 'learning_rate': 1.999701836256744e-05, 'epoch': 0.02} {'loss': 0.917, 'learning_rate': 1.999701036394231e-05, 'epoch': 0.02} {'loss': 0.915, 'learning_rate': 1.999700235460448e-05, 'epoch': 0.02} {'loss': 0.9933, 'learning_rate': 1.999699433455396e-05, 'epoch': 0.02} {'loss': 0.8748, 'learning_rate': 1.999698630379076e-05, 'epoch': 0.02} {'loss': 0.8585, 'learning_rate': 1.9996978262314884e-05, 'epoch': 0.02} {'loss': 0.934, 'learning_rate': 1.9996970210126346e-05, 'epoch': 0.02} {'loss': 0.9873, 'learning_rate': 1.999696214722515e-05, 'epoch': 0.02} {'loss': 0.8517, 'learning_rate': 1.9996954073611306e-05, 'epoch': 0.02} {'loss': 0.764, 'learning_rate': 1.9996945989284827e-05, 'epoch': 0.02} {'loss': 0.9338, 'learning_rate': 1.9996937894245716e-05, 'epoch': 0.02} {'loss': 0.9897, 'learning_rate': 1.9996929788493983e-05, 'epoch': 0.02} {'loss': 1.2239, 'learning_rate': 1.9996921672029637e-05, 'epoch': 0.02} {'loss': 0.9975, 'learning_rate': 1.999691354485269e-05, 'epoch': 0.02} {'loss': 1.0644, 'learning_rate': 1.9996905406963148e-05, 'epoch': 0.02} {'loss': 0.9394, 'learning_rate': 1.9996897258361017e-05, 'epoch': 0.02} {'loss': 0.9092, 'learning_rate': 1.999688909904631e-05, 'epoch': 0.02} {'loss': 0.9941, 'learning_rate': 1.999688092901903e-05, 'epoch': 0.02} {'loss': 0.88, 'learning_rate': 1.9996872748279194e-05, 'epoch': 0.02} {'loss': 0.9001, 'learning_rate': 1.9996864556826808e-05, 'epoch': 0.02} {'loss': 0.9888, 'learning_rate': 1.9996856354661878e-05, 'epoch': 0.02} {'loss': 1.0512, 'learning_rate': 1.999684814178441e-05, 'epoch': 0.02} {'loss': 0.9159, 'learning_rate': 1.9996839918194423e-05, 'epoch': 0.02} {'loss': 0.9739, 'learning_rate': 1.9996831683891918e-05, 'epoch': 0.02} {'loss': 1.0182, 'learning_rate': 1.9996823438876902e-05, 'epoch': 0.02} {'loss': 0.9995, 'learning_rate': 1.999681518314939e-05, 'epoch': 0.02} {'loss': 1.135, 'learning_rate': 1.9996806916709387e-05, 'epoch': 0.02} {'loss': 1.1068, 'learning_rate': 1.999679863955691e-05, 'epoch': 0.02} {'loss': 1.0177, 'learning_rate': 1.9996790351691953e-05, 'epoch': 0.02} {'loss': 0.9568, 'learning_rate': 1.999678205311453e-05, 'epoch': 0.02} {'loss': 0.9902, 'learning_rate': 1.9996773743824664e-05, 'epoch': 0.02} {'loss': 0.9143, 'learning_rate': 1.9996765423822343e-05, 'epoch': 0.02} {'loss': 0.9736, 'learning_rate': 1.999675709310759e-05, 'epoch': 0.02} {'loss': 1.0469, 'learning_rate': 1.999674875168041e-05, 'epoch': 0.02} {'loss': 1.0298, 'learning_rate': 1.9996740399540807e-05, 'epoch': 0.02} {'loss': 0.9633, 'learning_rate': 1.99967320366888e-05, 'epoch': 0.02} {'loss': 1.0694, 'learning_rate': 1.9996723663124392e-05, 'epoch': 0.02} {'loss': 1.1427, 'learning_rate': 1.999671527884759e-05, 'epoch': 0.02} {'loss': 0.9396, 'learning_rate': 1.9996706883858404e-05, 'epoch': 0.02} {'loss': 1.1055, 'learning_rate': 1.9996698478156843e-05, 'epoch': 0.02} {'loss': 1.0138, 'learning_rate': 1.9996690061742922e-05, 'epoch': 0.02} {'loss': 1.065, 'learning_rate': 1.9996681634616643e-05, 'epoch': 0.02} {'loss': 0.9805, 'learning_rate': 1.999667319677802e-05, 'epoch': 0.02} {'loss': 1.0421, 'learning_rate': 1.9996664748227058e-05, 'epoch': 0.02} {'loss': 1.0295, 'learning_rate': 1.9996656288963766e-05, 'epoch': 0.02} {'loss': 0.8548, 'learning_rate': 1.9996647818988153e-05, 'epoch': 0.02} {'loss': 0.9712, 'learning_rate': 1.9996639338300234e-05, 'epoch': 0.02} {'loss': 0.9805, 'learning_rate': 1.999663084690001e-05, 'epoch': 0.02} {'loss': 0.8697, 'learning_rate': 1.9996622344787497e-05, 'epoch': 0.02} {'loss': 1.1831, 'learning_rate': 1.99966138319627e-05, 'epoch': 0.02} {'loss': 1.0103, 'learning_rate': 1.9996605308425626e-05, 'epoch': 0.02} {'loss': 1.0164, 'learning_rate': 1.9996596774176293e-05, 'epoch': 0.02} {'loss': 0.8641, 'learning_rate': 1.99965882292147e-05, 'epoch': 0.02} {'loss': 0.9101, 'learning_rate': 1.999657967354086e-05, 'epoch': 0.02} {'loss': 1.0056, 'learning_rate': 1.9996571107154782e-05, 'epoch': 0.02} {'loss': 1.1159, 'learning_rate': 1.999656253005648e-05, 'epoch': 0.02} {'loss': 0.9085, 'learning_rate': 1.9996553942245955e-05, 'epoch': 0.02} {'loss': 0.923, 'learning_rate': 1.9996545343723223e-05, 'epoch': 0.02} {'loss': 1.2045, 'learning_rate': 1.999653673448829e-05, 'epoch': 0.02} {'loss': 1.0128, 'learning_rate': 1.9996528114541166e-05, 'epoch': 0.02} {'loss': 0.9836, 'learning_rate': 1.9996519483881858e-05, 'epoch': 0.02} {'loss': 1.1213, 'learning_rate': 1.9996510842510376e-05, 'epoch': 0.02} {'loss': 0.8224, 'learning_rate': 1.9996502190426735e-05, 'epoch': 0.02} {'loss': 0.9762, 'learning_rate': 1.9996493527630936e-05, 'epoch': 0.02} {'loss': 0.8406, 'learning_rate': 1.9996484854122993e-05, 'epoch': 0.02} {'loss': 0.9752, 'learning_rate': 1.9996476169902915e-05, 'epoch': 0.02} {'loss': 0.9145, 'learning_rate': 1.999646747497071e-05, 'epoch': 0.02} {'loss': 0.9158, 'learning_rate': 1.9996458769326388e-05, 'epoch': 0.02} {'loss': 1.0345, 'learning_rate': 1.9996450052969955e-05, 'epoch': 0.02} {'loss': 0.9656, 'learning_rate': 1.9996441325901428e-05, 'epoch': 0.02} {'loss': 1.1255, 'learning_rate': 1.999643258812081e-05, 'epoch': 0.02} {'loss': 0.9633, 'learning_rate': 1.999642383962811e-05, 'epoch': 0.02} {'loss': 0.8948, 'learning_rate': 1.9996415080423347e-05, 'epoch': 0.02} {'loss': 0.9346, 'learning_rate': 1.9996406310506517e-05, 'epoch': 0.02} {'loss': 0.8979, 'learning_rate': 1.9996397529877637e-05, 'epoch': 0.02} {'loss': 0.8472, 'learning_rate': 1.9996388738536715e-05, 'epoch': 0.02} {'loss': 0.9748, 'learning_rate': 1.9996379936483756e-05, 'epoch': 0.02} {'loss': 1.0286, 'learning_rate': 1.9996371123718782e-05, 'epoch': 0.02} {'loss': 0.7181, 'learning_rate': 1.999636230024179e-05, 'epoch': 0.02} {'loss': 0.929, 'learning_rate': 1.999635346605279e-05, 'epoch': 0.02} {'loss': 1.1007, 'learning_rate': 1.99963446211518e-05, 'epoch': 0.02} {'loss': 0.9471, 'learning_rate': 1.999633576553882e-05, 'epoch': 0.02} {'loss': 0.9962, 'learning_rate': 1.9996326899213868e-05, 'epoch': 0.02} {'loss': 1.0821, 'learning_rate': 1.9996318022176945e-05, 'epoch': 0.02} {'loss': 1.1061, 'learning_rate': 1.999630913442807e-05, 'epoch': 0.02} {'loss': 0.9066, 'learning_rate': 1.9996300235967245e-05, 'epoch': 0.02} {'loss': 0.979, 'learning_rate': 1.9996291326794482e-05, 'epoch': 0.02} {'loss': 1.1264, 'learning_rate': 1.9996282406909794e-05, 'epoch': 0.02} {'loss': 1.1911, 'learning_rate': 1.9996273476313182e-05, 'epoch': 0.02} {'loss': 0.9526, 'learning_rate': 1.9996264535004663e-05, 'epoch': 0.02} {'loss': 0.9658, 'learning_rate': 1.9996255582984247e-05, 'epoch': 0.02} {'loss': 1.0635, 'learning_rate': 1.9996246620251937e-05, 'epoch': 0.02} {'loss': 0.9299, 'learning_rate': 1.9996237646807746e-05, 'epoch': 0.02} {'loss': 0.7534, 'learning_rate': 1.9996228662651686e-05, 'epoch': 0.02} {'loss': 0.8785, 'learning_rate': 1.9996219667783766e-05, 'epoch': 0.02} {'loss': 0.9739, 'learning_rate': 1.9996210662203993e-05, 'epoch': 0.02} {'loss': 0.9399, 'learning_rate': 1.999620164591238e-05, 'epoch': 0.02} {'loss': 0.9911, 'learning_rate': 1.999619261890893e-05, 'epoch': 0.02} {'loss': 0.9895, 'learning_rate': 1.9996183581193663e-05, 'epoch': 0.02} {'loss': 0.9739, 'learning_rate': 1.9996174532766582e-05, 'epoch': 0.02} {'loss': 1.1201, 'learning_rate': 1.9996165473627696e-05, 'epoch': 0.02} {'loss': 1.0128, 'learning_rate': 1.9996156403777018e-05, 'epoch': 0.02} {'loss': 0.9137, 'learning_rate': 1.9996147323214554e-05, 'epoch': 0.02} {'loss': 0.9964, 'learning_rate': 1.9996138231940315e-05, 'epoch': 0.02} {'loss': 0.9494, 'learning_rate': 1.9996129129954315e-05, 'epoch': 0.02} {'loss': 0.9479, 'learning_rate': 1.999612001725656e-05, 'epoch': 0.02} {'loss': 0.9611, 'learning_rate': 1.999611089384706e-05, 'epoch': 0.02} {'loss': 0.9038, 'learning_rate': 1.999610175972582e-05, 'epoch': 0.02} {'loss': 0.9262, 'learning_rate': 1.9996092614892863e-05, 'epoch': 0.02} {'loss': 0.9646, 'learning_rate': 1.9996083459348187e-05, 'epoch': 0.02} {'loss': 0.9327, 'learning_rate': 1.9996074293091803e-05, 'epoch': 0.02} {'loss': 1.0828, 'learning_rate': 1.9996065116123725e-05, 'epoch': 0.02} {'loss': 1.0268, 'learning_rate': 1.9996055928443964e-05, 'epoch': 0.02} {'loss': 0.944, 'learning_rate': 1.9996046730052522e-05, 'epoch': 0.02} {'loss': 0.9262, 'learning_rate': 1.9996037520949417e-05, 'epoch': 0.02} {'loss': 0.8995, 'learning_rate': 1.9996028301134653e-05, 'epoch': 0.02} {'loss': 1.128, 'learning_rate': 1.9996019070608245e-05, 'epoch': 0.02} {'loss': 0.9658, 'learning_rate': 1.9996009829370197e-05, 'epoch': 0.02} {'loss': 0.9397, 'learning_rate': 1.9996000577420527e-05, 'epoch': 0.02} {'loss': 0.9311, 'learning_rate': 1.9995991314759234e-05, 'epoch': 0.02} {'loss': 1.0177, 'learning_rate': 1.999598204138634e-05, 'epoch': 0.02} {'loss': 1.0753, 'learning_rate': 1.9995972757301848e-05, 'epoch': 0.02} {'loss': 1.0481, 'learning_rate': 1.9995963462505768e-05, 'epoch': 0.02} {'loss': 1.0557, 'learning_rate': 1.999595415699811e-05, 'epoch': 0.02} {'loss': 0.7666, 'learning_rate': 1.9995944840778886e-05, 'epoch': 0.02} {'loss': 0.8078, 'learning_rate': 1.9995935513848104e-05, 'epoch': 0.02} {'loss': 0.9011, 'learning_rate': 1.9995926176205774e-05, 'epoch': 0.02} {'loss': 1.0072, 'learning_rate': 1.999591682785191e-05, 'epoch': 0.02} {'loss': 0.9333, 'learning_rate': 1.9995907468786517e-05, 'epoch': 0.02} {'loss': 0.9361, 'learning_rate': 1.9995898099009607e-05, 'epoch': 0.02} {'loss': 0.806, 'learning_rate': 1.999588871852119e-05, 'epoch': 0.02} {'loss': 0.9189, 'learning_rate': 1.9995879327321278e-05, 'epoch': 0.02} {'loss': 1.1792, 'learning_rate': 1.9995869925409876e-05, 'epoch': 0.02} {'loss': 1.0214, 'learning_rate': 1.9995860512787e-05, 'epoch': 0.02} {'loss': 1.0178, 'learning_rate': 1.9995851089452655e-05, 'epoch': 0.02} {'loss': 1.1559, 'learning_rate': 1.9995841655406852e-05, 'epoch': 0.02} {'loss': 0.9738, 'learning_rate': 1.9995832210649606e-05, 'epoch': 0.02} {'loss': 0.94, 'learning_rate': 1.999582275518092e-05, 'epoch': 0.02} {'loss': 0.7869, 'learning_rate': 1.9995813289000813e-05, 'epoch': 0.02} {'loss': 1.054, 'learning_rate': 1.999580381210929e-05, 'epoch': 0.02} {'loss': 0.897, 'learning_rate': 1.9995794324506358e-05, 'epoch': 0.02} {'loss': 0.9203, 'learning_rate': 1.999578482619203e-05, 'epoch': 0.02} {'loss': 1.0379, 'learning_rate': 1.9995775317166318e-05, 'epoch': 0.02} {'loss': 0.9332, 'learning_rate': 1.9995765797429224e-05, 'epoch': 0.02} {'loss': 0.9397, 'learning_rate': 1.9995756266980772e-05, 'epoch': 0.02} {'loss': 1.0877, 'learning_rate': 1.9995746725820965e-05, 'epoch': 0.02} {'loss': 0.9495, 'learning_rate': 1.999573717394981e-05, 'epoch': 0.02} {'loss': 0.7838, 'learning_rate': 1.999572761136732e-05, 'epoch': 0.02} {'loss': 0.9954, 'learning_rate': 1.999571803807351e-05, 'epoch': 0.02} {'loss': 1.0142, 'learning_rate': 1.9995708454068384e-05, 'epoch': 0.02} {'loss': 0.9316, 'learning_rate': 1.9995698859351954e-05, 'epoch': 0.02} {'loss': 1.0187, 'learning_rate': 1.9995689253924227e-05, 'epoch': 0.02} {'loss': 0.9597, 'learning_rate': 1.9995679637785223e-05, 'epoch': 0.02} {'loss': 0.8597, 'learning_rate': 1.999567001093494e-05, 'epoch': 0.02} {'loss': 1.0307, 'learning_rate': 1.9995660373373397e-05, 'epoch': 0.02} {'loss': 0.9121, 'learning_rate': 1.9995650725100605e-05, 'epoch': 0.02} {'loss': 1.0551, 'learning_rate': 1.9995641066116567e-05, 'epoch': 0.02} {'loss': 1.0007, 'learning_rate': 1.99956313964213e-05, 'epoch': 0.02} {'loss': 1.0059, 'learning_rate': 1.999562171601481e-05, 'epoch': 0.03} {'loss': 1.178, 'learning_rate': 1.999561202489711e-05, 'epoch': 0.03} {'loss': 1.17, 'learning_rate': 1.999560232306821e-05, 'epoch': 0.03} {'loss': 0.914, 'learning_rate': 1.9995592610528115e-05, 'epoch': 0.03} {'loss': 1.0264, 'learning_rate': 1.9995582887276844e-05, 'epoch': 0.03} {'loss': 1.0707, 'learning_rate': 1.999557315331441e-05, 'epoch': 0.03} {'loss': 1.0704, 'learning_rate': 1.9995563408640807e-05, 'epoch': 0.03} {'loss': 1.1548, 'learning_rate': 1.999555365325606e-05, 'epoch': 0.03} {'loss': 1.0917, 'learning_rate': 1.9995543887160177e-05, 'epoch': 0.03} {'loss': 1.044, 'learning_rate': 1.999553411035316e-05, 'epoch': 0.03} {'loss': 0.8081, 'learning_rate': 1.9995524322835035e-05, 'epoch': 0.03} {'loss': 0.8665, 'learning_rate': 1.99955145246058e-05, 'epoch': 0.03} {'loss': 1.0404, 'learning_rate': 1.999550471566547e-05, 'epoch': 0.03} {'loss': 0.7787, 'learning_rate': 1.9995494896014053e-05, 'epoch': 0.03} {'loss': 0.9887, 'learning_rate': 1.999548506565156e-05, 'epoch': 0.03} {'loss': 0.929, 'learning_rate': 1.9995475224578003e-05, 'epoch': 0.03} {'loss': 1.0342, 'learning_rate': 1.9995465372793392e-05, 'epoch': 0.03} {'loss': 0.7845, 'learning_rate': 1.999545551029774e-05, 'epoch': 0.03} {'loss': 0.9383, 'learning_rate': 1.9995445637091052e-05, 'epoch': 0.03} {'loss': 1.0735, 'learning_rate': 1.9995435753173346e-05, 'epoch': 0.03} {'loss': 0.8897, 'learning_rate': 1.9995425858544623e-05, 'epoch': 0.03} {'loss': 1.0892, 'learning_rate': 1.9995415953204905e-05, 'epoch': 0.03} {'loss': 0.9597, 'learning_rate': 1.9995406037154194e-05, 'epoch': 0.03} {'loss': 0.9069, 'learning_rate': 1.9995396110392504e-05, 'epoch': 0.03} {'loss': 1.0754, 'learning_rate': 1.999538617291984e-05, 'epoch': 0.03} {'loss': 0.9758, 'learning_rate': 1.9995376224736224e-05, 'epoch': 0.03} {'loss': 0.9429, 'learning_rate': 1.9995366265841655e-05, 'epoch': 0.03} {'loss': 1.0294, 'learning_rate': 1.9995356296236154e-05, 'epoch': 0.03} {'loss': 1.0279, 'learning_rate': 1.9995346315919722e-05, 'epoch': 0.03} {'loss': 1.1517, 'learning_rate': 1.999533632489238e-05, 'epoch': 0.03} {'loss': 0.9635, 'learning_rate': 1.999532632315413e-05, 'epoch': 0.03} {'loss': 0.9101, 'learning_rate': 1.9995316310704985e-05, 'epoch': 0.03} {'loss': 0.9341, 'learning_rate': 1.9995306287544956e-05, 'epoch': 0.03} {'loss': 1.0535, 'learning_rate': 1.9995296253674056e-05, 'epoch': 0.03} {'loss': 1.1555, 'learning_rate': 1.9995286209092292e-05, 'epoch': 0.03} {'loss': 0.9212, 'learning_rate': 1.9995276153799678e-05, 'epoch': 0.03} {'loss': 0.9565, 'learning_rate': 1.9995266087796224e-05, 'epoch': 0.03} {'loss': 0.8328, 'learning_rate': 1.999525601108194e-05, 'epoch': 0.03} {'loss': 1.0455, 'learning_rate': 1.9995245923656833e-05, 'epoch': 0.03} {'loss': 0.8088, 'learning_rate': 1.9995235825520923e-05, 'epoch': 0.03} {'loss': 1.0531, 'learning_rate': 1.9995225716674214e-05, 'epoch': 0.03} {'loss': 1.0511, 'learning_rate': 1.999521559711672e-05, 'epoch': 0.03} {'loss': 0.9638, 'learning_rate': 1.9995205466848445e-05, 'epoch': 0.03} {'loss': 0.9279, 'learning_rate': 1.999519532586941e-05, 'epoch': 0.03} {'loss': 1.0706, 'learning_rate': 1.999518517417962e-05, 'epoch': 0.03} {'loss': 0.8878, 'learning_rate': 1.9995175011779087e-05, 'epoch': 0.03} {'loss': 0.8641, 'learning_rate': 1.9995164838667822e-05, 'epoch': 0.03} {'loss': 1.0452, 'learning_rate': 1.9995154654845836e-05, 'epoch': 0.03} {'loss': 0.9846, 'learning_rate': 1.9995144460313138e-05, 'epoch': 0.03} {'loss': 0.9633, 'learning_rate': 1.9995134255069743e-05, 'epoch': 0.03} {'loss': 0.9878, 'learning_rate': 1.999512403911566e-05, 'epoch': 0.03} {'loss': 1.0733, 'learning_rate': 1.9995113812450896e-05, 'epoch': 0.03} {'loss': 0.7665, 'learning_rate': 1.9995103575075468e-05, 'epoch': 0.03} {'loss': 0.9961, 'learning_rate': 1.9995093326989384e-05, 'epoch': 0.03} {'loss': 0.9911, 'learning_rate': 1.9995083068192652e-05, 'epoch': 0.03} {'loss': 0.9303, 'learning_rate': 1.9995072798685294e-05, 'epoch': 0.03} {'loss': 0.8449, 'learning_rate': 1.999506251846731e-05, 'epoch': 0.03} {'loss': 1.005, 'learning_rate': 1.999505222753871e-05, 'epoch': 0.03} {'loss': 0.9357, 'learning_rate': 1.9995041925899514e-05, 'epoch': 0.03} {'loss': 0.861, 'learning_rate': 1.9995031613549724e-05, 'epoch': 0.03} {'loss': 0.953, 'learning_rate': 1.999502129048936e-05, 'epoch': 0.03} {'loss': 1.0193, 'learning_rate': 1.9995010956718427e-05, 'epoch': 0.03} {'loss': 1.0928, 'learning_rate': 1.999500061223694e-05, 'epoch': 0.03} {'loss': 1.0111, 'learning_rate': 1.9994990257044904e-05, 'epoch': 0.03} {'loss': 1.0402, 'learning_rate': 1.9994979891142337e-05, 'epoch': 0.03} {'loss': 0.9786, 'learning_rate': 1.9994969514529245e-05, 'epoch': 0.03} {'loss': 1.0695, 'learning_rate': 1.999495912720564e-05, 'epoch': 0.03} {'loss': 1.0063, 'learning_rate': 1.9994948729171537e-05, 'epoch': 0.03} {'loss': 0.9688, 'learning_rate': 1.999493832042694e-05, 'epoch': 0.03} {'loss': 0.7212, 'learning_rate': 1.999492790097187e-05, 'epoch': 0.03} {'loss': 0.9449, 'learning_rate': 1.999491747080633e-05, 'epoch': 0.03} {'loss': 0.9777, 'learning_rate': 1.9994907029930336e-05, 'epoch': 0.03} {'loss': 0.8496, 'learning_rate': 1.9994896578343894e-05, 'epoch': 0.03} {'loss': 0.9874, 'learning_rate': 1.999488611604702e-05, 'epoch': 0.03} {'loss': 0.9151, 'learning_rate': 1.9994875643039725e-05, 'epoch': 0.03} {'loss': 0.8385, 'learning_rate': 1.9994865159322013e-05, 'epoch': 0.03} {'loss': 0.8466, 'learning_rate': 1.9994854664893906e-05, 'epoch': 0.03} {'loss': 1.1025, 'learning_rate': 1.9994844159755405e-05, 'epoch': 0.03} {'loss': 0.9411, 'learning_rate': 1.9994833643906533e-05, 'epoch': 0.03} {'loss': 0.9393, 'learning_rate': 1.999482311734729e-05, 'epoch': 0.03} {'loss': 1.0414, 'learning_rate': 1.9994812580077693e-05, 'epoch': 0.03} {'loss': 0.8064, 'learning_rate': 1.9994802032097757e-05, 'epoch': 0.03} {'loss': 1.048, 'learning_rate': 1.9994791473407482e-05, 'epoch': 0.03} {'loss': 0.9586, 'learning_rate': 1.9994780904006886e-05, 'epoch': 0.03} {'loss': 1.0432, 'learning_rate': 1.9994770323895985e-05, 'epoch': 0.03} {'loss': 0.906, 'learning_rate': 1.9994759733074783e-05, 'epoch': 0.03} {'loss': 0.988, 'learning_rate': 1.9994749131543293e-05, 'epoch': 0.03} {'loss': 0.8648, 'learning_rate': 1.9994738519301525e-05, 'epoch': 0.03} {'loss': 0.99, 'learning_rate': 1.9994727896349497e-05, 'epoch': 0.03} {'loss': 1.0151, 'learning_rate': 1.9994717262687214e-05, 'epoch': 0.03} {'loss': 1.0951, 'learning_rate': 1.9994706618314688e-05, 'epoch': 0.03} {'loss': 0.9127, 'learning_rate': 1.9994695963231935e-05, 'epoch': 0.03} {'loss': 1.2404, 'learning_rate': 1.9994685297438963e-05, 'epoch': 0.03} {'loss': 0.9091, 'learning_rate': 1.999467462093578e-05, 'epoch': 0.03} {'loss': 0.8002, 'learning_rate': 1.9994663933722404e-05, 'epoch': 0.03} {'loss': 0.8217, 'learning_rate': 1.9994653235798843e-05, 'epoch': 0.03} {'loss': 0.9938, 'learning_rate': 1.9994642527165112e-05, 'epoch': 0.03} {'loss': 0.8839, 'learning_rate': 1.9994631807821215e-05, 'epoch': 0.03} {'loss': 0.8345, 'learning_rate': 1.999462107776717e-05, 'epoch': 0.03} {'loss': 1.0973, 'learning_rate': 1.9994610337002985e-05, 'epoch': 0.03} {'loss': 0.988, 'learning_rate': 1.9994599585528673e-05, 'epoch': 0.03} {'loss': 0.9765, 'learning_rate': 1.9994588823344245e-05, 'epoch': 0.03} {'loss': 1.0863, 'learning_rate': 1.9994578050449716e-05, 'epoch': 0.03} {'loss': 0.947, 'learning_rate': 1.9994567266845092e-05, 'epoch': 0.03} {'loss': 0.9506, 'learning_rate': 1.9994556472530387e-05, 'epoch': 0.03} {'loss': 1.0264, 'learning_rate': 1.9994545667505615e-05, 'epoch': 0.03} {'loss': 0.9597, 'learning_rate': 1.9994534851770785e-05, 'epoch': 0.03} {'loss': 1.1957, 'learning_rate': 1.9994524025325908e-05, 'epoch': 0.03} {'loss': 0.9653, 'learning_rate': 1.9994513188170994e-05, 'epoch': 0.03} {'loss': 1.0972, 'learning_rate': 1.9994502340306063e-05, 'epoch': 0.03} {'loss': 0.8983, 'learning_rate': 1.9994491481731112e-05, 'epoch': 0.03} {'loss': 1.1102, 'learning_rate': 1.9994480612446168e-05, 'epoch': 0.03} {'loss': 0.9408, 'learning_rate': 1.9994469732451234e-05, 'epoch': 0.03} {'loss': 0.8755, 'learning_rate': 1.9994458841746325e-05, 'epoch': 0.03} {'loss': 0.8611, 'learning_rate': 1.9994447940331446e-05, 'epoch': 0.03} {'loss': 0.9971, 'learning_rate': 1.999443702820662e-05, 'epoch': 0.03} {'loss': 1.0964, 'learning_rate': 1.999442610537185e-05, 'epoch': 0.03} {'loss': 0.7304, 'learning_rate': 1.9994415171827153e-05, 'epoch': 0.03} {'loss': 1.0311, 'learning_rate': 1.9994404227572536e-05, 'epoch': 0.03} {'loss': 0.8261, 'learning_rate': 1.9994393272608013e-05, 'epoch': 0.03} {'loss': 1.0378, 'learning_rate': 1.9994382306933597e-05, 'epoch': 0.03} {'loss': 0.98, 'learning_rate': 1.9994371330549295e-05, 'epoch': 0.03} {'loss': 1.0637, 'learning_rate': 1.9994360343455123e-05, 'epoch': 0.03} {'loss': 0.9703, 'learning_rate': 1.9994349345651093e-05, 'epoch': 0.03} {'loss': 0.8811, 'learning_rate': 1.9994338337137216e-05, 'epoch': 0.03} {'loss': 0.9211, 'learning_rate': 1.9994327317913505e-05, 'epoch': 0.03} {'loss': 0.9662, 'learning_rate': 1.9994316287979963e-05, 'epoch': 0.03} {'loss': 0.971, 'learning_rate': 1.999430524733662e-05, 'epoch': 0.03} {'loss': 1.0067, 'learning_rate': 1.9994294195983467e-05, 'epoch': 0.03} {'loss': 1.1374, 'learning_rate': 1.999428313392053e-05, 'epoch': 0.03} {'loss': 0.8471, 'learning_rate': 1.9994272061147816e-05, 'epoch': 0.03} {'loss': 0.9732, 'learning_rate': 1.999426097766534e-05, 'epoch': 0.03} {'loss': 0.9338, 'learning_rate': 1.9994249883473107e-05, 'epoch': 0.03} {'loss': 0.998, 'learning_rate': 1.9994238778571136e-05, 'epoch': 0.03} {'loss': 0.9633, 'learning_rate': 1.9994227662959436e-05, 'epoch': 0.03} {'loss': 1.0586, 'learning_rate': 1.9994216536638018e-05, 'epoch': 0.03} {'loss': 0.8934, 'learning_rate': 1.9994205399606895e-05, 'epoch': 0.03} {'loss': 0.932, 'learning_rate': 1.999419425186608e-05, 'epoch': 0.03} {'loss': 0.9928, 'learning_rate': 1.9994183093415583e-05, 'epoch': 0.03} {'loss': 0.9031, 'learning_rate': 1.9994171924255416e-05, 'epoch': 0.03} {'loss': 0.8434, 'learning_rate': 1.9994160744385595e-05, 'epoch': 0.03} {'loss': 1.13, 'learning_rate': 1.9994149553806122e-05, 'epoch': 0.03} {'loss': 0.8684, 'learning_rate': 1.9994138352517023e-05, 'epoch': 0.03} {'loss': 0.9945, 'learning_rate': 1.9994127140518296e-05, 'epoch': 0.03} {'loss': 0.8003, 'learning_rate': 1.9994115917809967e-05, 'epoch': 0.03} {'loss': 0.7535, 'learning_rate': 1.9994104684392037e-05, 'epoch': 0.03} {'loss': 0.9453, 'learning_rate': 1.9994093440264524e-05, 'epoch': 0.03} {'loss': 0.8838, 'learning_rate': 1.9994082185427435e-05, 'epoch': 0.03} {'loss': 0.9897, 'learning_rate': 1.9994070919880783e-05, 'epoch': 0.03} {'loss': 1.0165, 'learning_rate': 1.999405964362459e-05, 'epoch': 0.03} {'loss': 0.8514, 'learning_rate': 1.9994048356658852e-05, 'epoch': 0.03} {'loss': 1.1631, 'learning_rate': 1.999403705898359e-05, 'epoch': 0.03} {'loss': 0.9553, 'learning_rate': 1.999402575059882e-05, 'epoch': 0.03} {'loss': 0.9064, 'learning_rate': 1.9994014431504543e-05, 'epoch': 0.03} {'loss': 1.1082, 'learning_rate': 1.9994003101700786e-05, 'epoch': 0.03} {'loss': 0.9526, 'learning_rate': 1.9993991761187548e-05, 'epoch': 0.03} {'loss': 0.8872, 'learning_rate': 1.9993980409964845e-05, 'epoch': 0.03} {'loss': 1.0194, 'learning_rate': 1.9993969048032688e-05, 'epoch': 0.03} {'loss': 1.1408, 'learning_rate': 1.9993957675391097e-05, 'epoch': 0.03} {'loss': 1.1365, 'learning_rate': 1.9993946292040075e-05, 'epoch': 0.03} {'loss': 0.743, 'learning_rate': 1.9993934897979636e-05, 'epoch': 0.03} {'loss': 1.0026, 'learning_rate': 1.9993923493209797e-05, 'epoch': 0.03} {'loss': 0.9563, 'learning_rate': 1.9993912077730565e-05, 'epoch': 0.03} {'loss': 1.069, 'learning_rate': 1.9993900651541956e-05, 'epoch': 0.03} {'loss': 0.9764, 'learning_rate': 1.9993889214643978e-05, 'epoch': 0.03} {'loss': 1.0028, 'learning_rate': 1.9993877767036647e-05, 'epoch': 0.03} {'loss': 0.8017, 'learning_rate': 1.9993866308719974e-05, 'epoch': 0.03} {'loss': 1.0315, 'learning_rate': 1.9993854839693972e-05, 'epoch': 0.03} {'loss': 1.1727, 'learning_rate': 1.999384335995865e-05, 'epoch': 0.03} {'loss': 1.1055, 'learning_rate': 1.9993831869514025e-05, 'epoch': 0.03} {'loss': 1.0509, 'learning_rate': 1.9993820368360107e-05, 'epoch': 0.03} {'loss': 1.0294, 'learning_rate': 1.9993808856496907e-05, 'epoch': 0.03} {'loss': 0.9861, 'learning_rate': 1.999379733392444e-05, 'epoch': 0.03} {'loss': 0.8943, 'learning_rate': 1.999378580064272e-05, 'epoch': 0.03} {'loss': 0.9414, 'learning_rate': 1.9993774256651753e-05, 'epoch': 0.03} {'loss': 0.8316, 'learning_rate': 1.9993762701951553e-05, 'epoch': 0.03} {'loss': 0.8884, 'learning_rate': 1.999375113654214e-05, 'epoch': 0.03} {'loss': 0.7478, 'learning_rate': 1.9993739560423515e-05, 'epoch': 0.03} {'loss': 0.8487, 'learning_rate': 1.9993727973595697e-05, 'epoch': 0.03} {'loss': 1.0332, 'learning_rate': 1.99937163760587e-05, 'epoch': 0.03} {'loss': 0.9218, 'learning_rate': 1.9993704767812533e-05, 'epoch': 0.03} {'loss': 0.9701, 'learning_rate': 1.999369314885721e-05, 'epoch': 0.03} {'loss': 0.8816, 'learning_rate': 1.9993681519192744e-05, 'epoch': 0.03} {'loss': 0.7876, 'learning_rate': 1.9993669878819143e-05, 'epoch': 0.03} {'loss': 1.0628, 'learning_rate': 1.9993658227736422e-05, 'epoch': 0.03} {'loss': 0.9326, 'learning_rate': 1.9993646565944596e-05, 'epoch': 0.03} {'loss': 1.1809, 'learning_rate': 1.9993634893443676e-05, 'epoch': 0.03} {'loss': 0.9621, 'learning_rate': 1.9993623210233676e-05, 'epoch': 0.03} {'loss': 0.9988, 'learning_rate': 1.9993611516314603e-05, 'epoch': 0.03} {'loss': 0.9358, 'learning_rate': 1.9993599811686474e-05, 'epoch': 0.03} {'loss': 1.0954, 'learning_rate': 1.9993588096349305e-05, 'epoch': 0.03} {'loss': 1.0347, 'learning_rate': 1.99935763703031e-05, 'epoch': 0.03} {'loss': 1.0515, 'learning_rate': 1.9993564633547877e-05, 'epoch': 0.03} {'loss': 0.9082, 'learning_rate': 1.999355288608365e-05, 'epoch': 0.03} {'loss': 0.888, 'learning_rate': 1.9993541127910428e-05, 'epoch': 0.03} {'loss': 0.8811, 'learning_rate': 1.999352935902822e-05, 'epoch': 0.03} {'loss': 0.8784, 'learning_rate': 1.999351757943705e-05, 'epoch': 0.03} {'loss': 0.9579, 'learning_rate': 1.999350578913692e-05, 'epoch': 0.03} {'loss': 1.092, 'learning_rate': 1.999349398812785e-05, 'epoch': 0.03} {'loss': 0.9534, 'learning_rate': 1.9993482176409843e-05, 'epoch': 0.03} {'loss': 1.2362, 'learning_rate': 1.999347035398292e-05, 'epoch': 0.03} {'loss': 0.9198, 'learning_rate': 1.9993458520847094e-05, 'epoch': 0.03} {'loss': 0.7759, 'learning_rate': 1.9993446677002376e-05, 'epoch': 0.03} {'loss': 0.9789, 'learning_rate': 1.9993434822448775e-05, 'epoch': 0.03} {'loss': 0.9278, 'learning_rate': 1.999342295718631e-05, 'epoch': 0.03} {'loss': 0.8808, 'learning_rate': 1.9993411081214987e-05, 'epoch': 0.03} {'loss': 0.8127, 'learning_rate': 1.9993399194534823e-05, 'epoch': 0.03} {'loss': 1.0367, 'learning_rate': 1.999338729714583e-05, 'epoch': 0.03} {'loss': 1.08, 'learning_rate': 1.9993375389048025e-05, 'epoch': 0.03} {'loss': 0.8895, 'learning_rate': 1.9993363470241413e-05, 'epoch': 0.03} {'loss': 0.9371, 'learning_rate': 1.9993351540726006e-05, 'epoch': 0.03} {'loss': 0.9489, 'learning_rate': 1.9993339600501823e-05, 'epoch': 0.03} {'loss': 0.9536, 'learning_rate': 1.9993327649568877e-05, 'epoch': 0.03} {'loss': 0.7963, 'learning_rate': 1.9993315687927178e-05, 'epoch': 0.03} {'loss': 1.1996, 'learning_rate': 1.9993303715576736e-05, 'epoch': 0.03} {'loss': 1.0161, 'learning_rate': 1.999329173251757e-05, 'epoch': 0.03} {'loss': 1.0565, 'learning_rate': 1.9993279738749688e-05, 'epoch': 0.03} {'loss': 0.8521, 'learning_rate': 1.9993267734273106e-05, 'epoch': 0.03} {'loss': 0.9102, 'learning_rate': 1.999325571908784e-05, 'epoch': 0.03} {'loss': 0.9995, 'learning_rate': 1.9993243693193893e-05, 'epoch': 0.03} {'loss': 0.9809, 'learning_rate': 1.9993231656591286e-05, 'epoch': 0.03} {'loss': 0.9261, 'learning_rate': 1.9993219609280027e-05, 'epoch': 0.03} {'loss': 0.9546, 'learning_rate': 1.9993207551260134e-05, 'epoch': 0.03} {'loss': 1.017, 'learning_rate': 1.9993195482531617e-05, 'epoch': 0.03} {'loss': 1.0275, 'learning_rate': 1.9993183403094486e-05, 'epoch': 0.03} {'loss': 1.1467, 'learning_rate': 1.999317131294876e-05, 'epoch': 0.03} {'loss': 1.0385, 'learning_rate': 1.9993159212094446e-05, 'epoch': 0.03} {'loss': 0.8986, 'learning_rate': 1.999314710053156e-05, 'epoch': 0.03} {'loss': 0.9498, 'learning_rate': 1.999313497826012e-05, 'epoch': 0.03} {'loss': 0.8863, 'learning_rate': 1.999312284528013e-05, 'epoch': 0.03} {'loss': 0.8987, 'learning_rate': 1.999311070159161e-05, 'epoch': 0.03} {'loss': 0.9711, 'learning_rate': 1.9993098547194564e-05, 'epoch': 0.03} {'loss': 1.0222, 'learning_rate': 1.9993086382089016e-05, 'epoch': 0.03} {'loss': 1.02, 'learning_rate': 1.9993074206274975e-05, 'epoch': 0.03} {'loss': 0.9349, 'learning_rate': 1.999306201975245e-05, 'epoch': 0.03} {'loss': 0.9198, 'learning_rate': 1.9993049822521454e-05, 'epoch': 0.03} {'loss': 0.9108, 'learning_rate': 1.999303761458201e-05, 'epoch': 0.03} {'loss': 0.9298, 'learning_rate': 1.999302539593412e-05, 'epoch': 0.03} {'loss': 1.0188, 'learning_rate': 1.9993013166577803e-05, 'epoch': 0.03} {'loss': 0.9292, 'learning_rate': 1.999300092651307e-05, 'epoch': 0.03} {'loss': 0.9079, 'learning_rate': 1.999298867573993e-05, 'epoch': 0.03} {'loss': 1.044, 'learning_rate': 1.9992976414258408e-05, 'epoch': 0.03} {'loss': 1.0527, 'learning_rate': 1.999296414206851e-05, 'epoch': 0.03} {'loss': 0.9353, 'learning_rate': 1.9992951859170247e-05, 'epoch': 0.03} {'loss': 0.9741, 'learning_rate': 1.999293956556363e-05, 'epoch': 0.03} {'loss': 1.1045, 'learning_rate': 1.999292726124868e-05, 'epoch': 0.03} {'loss': 0.9129, 'learning_rate': 1.999291494622541e-05, 'epoch': 0.03} {'loss': 0.9302, 'learning_rate': 1.999290262049382e-05, 'epoch': 0.03} {'loss': 1.0549, 'learning_rate': 1.9992890284053945e-05, 'epoch': 0.03} {'loss': 1.1306, 'learning_rate': 1.9992877936905776e-05, 'epoch': 0.03} {'loss': 0.9118, 'learning_rate': 1.999286557904934e-05, 'epoch': 0.03} {'loss': 1.0048, 'learning_rate': 1.999285321048465e-05, 'epoch': 0.03} {'loss': 0.8409, 'learning_rate': 1.999284083121171e-05, 'epoch': 0.03} {'loss': 0.7754, 'learning_rate': 1.9992828441230544e-05, 'epoch': 0.03} {'loss': 0.9849, 'learning_rate': 1.9992816040541155e-05, 'epoch': 0.03} {'loss': 0.7903, 'learning_rate': 1.999280362914357e-05, 'epoch': 0.03} {'loss': 1.0564, 'learning_rate': 1.9992791207037788e-05, 'epoch': 0.03} {'loss': 0.9983, 'learning_rate': 1.9992778774223827e-05, 'epoch': 0.03} {'loss': 0.8337, 'learning_rate': 1.9992766330701707e-05, 'epoch': 0.03} {'loss': 0.9026, 'learning_rate': 1.9992753876471433e-05, 'epoch': 0.03} {'loss': 0.9777, 'learning_rate': 1.999274141153302e-05, 'epoch': 0.03} {'loss': 0.8932, 'learning_rate': 1.9992728935886486e-05, 'epoch': 0.03} {'loss': 1.0885, 'learning_rate': 1.9992716449531837e-05, 'epoch': 0.03} {'loss': 0.9626, 'learning_rate': 1.9992703952469092e-05, 'epoch': 0.03} {'loss': 0.9747, 'learning_rate': 1.9992691444698265e-05, 'epoch': 0.03} {'loss': 1.0187, 'learning_rate': 1.9992678926219363e-05, 'epoch': 0.03} {'loss': 1.1077, 'learning_rate': 1.999266639703241e-05, 'epoch': 0.03} {'loss': 1.0401, 'learning_rate': 1.9992653857137407e-05, 'epoch': 0.03} {'loss': 0.9017, 'learning_rate': 1.9992641306534377e-05, 'epoch': 0.03} {'loss': 0.9229, 'learning_rate': 1.999262874522333e-05, 'epoch': 0.03} {'loss': 1.0312, 'learning_rate': 1.9992616173204275e-05, 'epoch': 0.03} {'loss': 0.9428, 'learning_rate': 1.9992603590477232e-05, 'epoch': 0.03} {'loss': 0.9249, 'learning_rate': 1.9992590997042213e-05, 'epoch': 0.03} {'loss': 1.0303, 'learning_rate': 1.9992578392899233e-05, 'epoch': 0.03} {'loss': 1.1776, 'learning_rate': 1.9992565778048304e-05, 'epoch': 0.03} {'loss': 0.8158, 'learning_rate': 1.9992553152489434e-05, 'epoch': 0.03} {'loss': 0.9276, 'learning_rate': 1.9992540516222646e-05, 'epoch': 0.03} {'loss': 0.9522, 'learning_rate': 1.9992527869247948e-05, 'epoch': 0.03} {'loss': 1.0345, 'learning_rate': 1.999251521156535e-05, 'epoch': 0.03} {'loss': 0.9411, 'learning_rate': 1.999250254317487e-05, 'epoch': 0.03} {'loss': 1.1498, 'learning_rate': 1.9992489864076526e-05, 'epoch': 0.03} {'loss': 0.8355, 'learning_rate': 1.999247717427033e-05, 'epoch': 0.03} {'loss': 1.101, 'learning_rate': 1.999246447375629e-05, 'epoch': 0.03} {'loss': 0.8223, 'learning_rate': 1.999245176253442e-05, 'epoch': 0.03} {'loss': 0.9446, 'learning_rate': 1.9992439040604735e-05, 'epoch': 0.03} {'loss': 1.1463, 'learning_rate': 1.9992426307967254e-05, 'epoch': 0.03} {'loss': 0.9403, 'learning_rate': 1.9992413564621985e-05, 'epoch': 0.03} {'loss': 0.9529, 'learning_rate': 1.9992400810568943e-05, 'epoch': 0.03} {'loss': 0.9958, 'learning_rate': 1.999238804580814e-05, 'epoch': 0.03} {'loss': 0.98, 'learning_rate': 1.999237527033959e-05, 'epoch': 0.03} {'loss': 0.8325, 'learning_rate': 1.9992362484163316e-05, 'epoch': 0.03} {'loss': 1.0904, 'learning_rate': 1.9992349687279317e-05, 'epoch': 0.03} {'loss': 0.9353, 'learning_rate': 1.9992336879687616e-05, 'epoch': 0.03} {'loss': 1.0037, 'learning_rate': 1.9992324061388222e-05, 'epoch': 0.03} {'loss': 0.8632, 'learning_rate': 1.9992311232381153e-05, 'epoch': 0.03} {'loss': 0.9805, 'learning_rate': 1.999229839266642e-05, 'epoch': 0.03} {'loss': 0.9446, 'learning_rate': 1.9992285542244036e-05, 'epoch': 0.03} {'loss': 1.0054, 'learning_rate': 1.9992272681114014e-05, 'epoch': 0.03} {'loss': 1.0621, 'learning_rate': 1.9992259809276375e-05, 'epoch': 0.03} {'loss': 1.0668, 'learning_rate': 1.999224692673113e-05, 'epoch': 0.03} {'loss': 1.008, 'learning_rate': 1.9992234033478284e-05, 'epoch': 0.03} {'loss': 0.9549, 'learning_rate': 1.999222112951786e-05, 'epoch': 0.03} {'loss': 1.1788, 'learning_rate': 1.999220821484987e-05, 'epoch': 0.03} {'loss': 0.899, 'learning_rate': 1.9992195289474324e-05, 'epoch': 0.03} {'loss': 0.9159, 'learning_rate': 1.999218235339124e-05, 'epoch': 0.03} {'loss': 0.8907, 'learning_rate': 1.9992169406600636e-05, 'epoch': 0.03} {'loss': 0.9058, 'learning_rate': 1.9992156449102514e-05, 'epoch': 0.03} {'loss': 0.9643, 'learning_rate': 1.9992143480896897e-05, 'epoch': 0.03} {'loss': 0.8607, 'learning_rate': 1.9992130501983797e-05, 'epoch': 0.03} {'loss': 0.938, 'learning_rate': 1.9992117512363224e-05, 'epoch': 0.03} {'loss': 1.0851, 'learning_rate': 1.9992104512035197e-05, 'epoch': 0.03} {'loss': 0.9071, 'learning_rate': 1.999209150099973e-05, 'epoch': 0.03} {'loss': 0.9862, 'learning_rate': 1.9992078479256836e-05, 'epoch': 0.03} {'loss': 0.8378, 'learning_rate': 1.9992065446806524e-05, 'epoch': 0.03} {'loss': 0.9967, 'learning_rate': 1.9992052403648818e-05, 'epoch': 0.03} {'loss': 0.9447, 'learning_rate': 1.9992039349783717e-05, 'epoch': 0.03} {'loss': 0.9196, 'learning_rate': 1.9992026285211252e-05, 'epoch': 0.03} {'loss': 0.8966, 'learning_rate': 1.9992013209931427e-05, 'epoch': 0.03} {'loss': 1.0023, 'learning_rate': 1.999200012394426e-05, 'epoch': 0.03} {'loss': 1.0498, 'learning_rate': 1.9991987027249757e-05, 'epoch': 0.03} {'loss': 0.9885, 'learning_rate': 1.9991973919847942e-05, 'epoch': 0.03} {'loss': 0.9741, 'learning_rate': 1.9991960801738824e-05, 'epoch': 0.03} {'loss': 0.8877, 'learning_rate': 1.9991947672922417e-05, 'epoch': 0.03} {'loss': 1.0319, 'learning_rate': 1.9991934533398738e-05, 'epoch': 0.03} {'loss': 1.0649, 'learning_rate': 1.99919213831678e-05, 'epoch': 0.03} {'loss': 0.9893, 'learning_rate': 1.9991908222229617e-05, 'epoch': 0.03} {'loss': 0.9973, 'learning_rate': 1.99918950505842e-05, 'epoch': 0.03} {'loss': 0.9925, 'learning_rate': 1.999188186823157e-05, 'epoch': 0.03} {'loss': 1.0701, 'learning_rate': 1.999186867517173e-05, 'epoch': 0.03} {'loss': 1.0773, 'learning_rate': 1.9991855471404705e-05, 'epoch': 0.03} {'loss': 1.0956, 'learning_rate': 1.9991842256930506e-05, 'epoch': 0.03} {'loss': 0.9949, 'learning_rate': 1.9991829031749143e-05, 'epoch': 0.03} {'loss': 0.9292, 'learning_rate': 1.9991815795860632e-05, 'epoch': 0.03} {'loss': 1.1226, 'learning_rate': 1.9991802549264996e-05, 'epoch': 0.03} {'loss': 1.0104, 'learning_rate': 1.999178929196224e-05, 'epoch': 0.03} {'loss': 0.9692, 'learning_rate': 1.9991776023952376e-05, 'epoch': 0.03} {'loss': 1.0089, 'learning_rate': 1.999176274523542e-05, 'epoch': 0.03} {'loss': 0.9591, 'learning_rate': 1.9991749455811395e-05, 'epoch': 0.03} {'loss': 0.9702, 'learning_rate': 1.9991736155680304e-05, 'epoch': 0.03} {'loss': 1.0162, 'learning_rate': 1.9991722844842168e-05, 'epoch': 0.03} {'loss': 1.0203, 'learning_rate': 1.9991709523296997e-05, 'epoch': 0.03} {'loss': 0.886, 'learning_rate': 1.9991696191044808e-05, 'epoch': 0.03} {'loss': 0.9441, 'learning_rate': 1.9991682848085617e-05, 'epoch': 0.03} {'loss': 0.8603, 'learning_rate': 1.9991669494419436e-05, 'epoch': 0.03} {'loss': 0.9827, 'learning_rate': 1.9991656130046276e-05, 'epoch': 0.03} {'loss': 0.9988, 'learning_rate': 1.999164275496616e-05, 'epoch': 0.03} {'loss': 1.0123, 'learning_rate': 1.9991629369179093e-05, 'epoch': 0.03} {'loss': 1.0033, 'learning_rate': 1.9991615972685096e-05, 'epoch': 0.03} {'loss': 0.8326, 'learning_rate': 1.9991602565484175e-05, 'epoch': 0.03} {'loss': 0.8786, 'learning_rate': 1.9991589147576355e-05, 'epoch': 0.03} {'loss': 1.222, 'learning_rate': 1.9991575718961645e-05, 'epoch': 0.03} {'loss': 0.9484, 'learning_rate': 1.9991562279640056e-05, 'epoch': 0.03} {'loss': 1.0516, 'learning_rate': 1.9991548829611612e-05, 'epoch': 0.03} {'loss': 0.9364, 'learning_rate': 1.999153536887632e-05, 'epoch': 0.03} {'loss': 1.088, 'learning_rate': 1.9991521897434193e-05, 'epoch': 0.03} {'loss': 0.9802, 'learning_rate': 1.999150841528525e-05, 'epoch': 0.03} {'loss': 0.8975, 'learning_rate': 1.9991494922429505e-05, 'epoch': 0.03} {'loss': 0.9029, 'learning_rate': 1.9991481418866972e-05, 'epoch': 0.03} {'loss': 0.9417, 'learning_rate': 1.9991467904597662e-05, 'epoch': 0.03} {'loss': 0.7906, 'learning_rate': 1.9991454379621594e-05, 'epoch': 0.03} {'loss': 1.111, 'learning_rate': 1.9991440843938782e-05, 'epoch': 0.03} {'loss': 0.9508, 'learning_rate': 1.9991427297549237e-05, 'epoch': 0.03} {'loss': 0.881, 'learning_rate': 1.999141374045298e-05, 'epoch': 0.03} {'loss': 0.9409, 'learning_rate': 1.9991400172650017e-05, 'epoch': 0.03} {'loss': 0.778, 'learning_rate': 1.9991386594140366e-05, 'epoch': 0.03} {'loss': 0.9486, 'learning_rate': 1.9991373004924046e-05, 'epoch': 0.03} {'loss': 0.976, 'learning_rate': 1.9991359405001066e-05, 'epoch': 0.03} {'loss': 0.8072, 'learning_rate': 1.9991345794371445e-05, 'epoch': 0.03} {'loss': 1.0584, 'learning_rate': 1.9991332173035194e-05, 'epoch': 0.03} {'loss': 1.0088, 'learning_rate': 1.999131854099233e-05, 'epoch': 0.03} {'loss': 1.0553, 'learning_rate': 1.9991304898242866e-05, 'epoch': 0.03} {'loss': 0.98, 'learning_rate': 1.9991291244786814e-05, 'epoch': 0.03} {'loss': 0.9967, 'learning_rate': 1.9991277580624192e-05, 'epoch': 0.03} {'loss': 1.06, 'learning_rate': 1.999126390575502e-05, 'epoch': 0.03} {'loss': 0.9218, 'learning_rate': 1.9991250220179302e-05, 'epoch': 0.03} {'loss': 0.9511, 'learning_rate': 1.999123652389706e-05, 'epoch': 0.03} {'loss': 1.0342, 'learning_rate': 1.99912228169083e-05, 'epoch': 0.03} {'loss': 1.11, 'learning_rate': 1.999120909921305e-05, 'epoch': 0.03} {'loss': 0.9589, 'learning_rate': 1.9991195370811314e-05, 'epoch': 0.03} {'loss': 0.9648, 'learning_rate': 1.9991181631703115e-05, 'epoch': 0.03} {'loss': 1.0595, 'learning_rate': 1.9991167881888457e-05, 'epoch': 0.03} {'loss': 1.0092, 'learning_rate': 1.9991154121367367e-05, 'epoch': 0.03} {'loss': 0.9506, 'learning_rate': 1.9991140350139848e-05, 'epoch': 0.03} {'loss': 0.8953, 'learning_rate': 1.9991126568205924e-05, 'epoch': 0.03} {'loss': 1.0639, 'learning_rate': 1.9991112775565608e-05, 'epoch': 0.03} {'loss': 0.9562, 'learning_rate': 1.9991098972218908e-05, 'epoch': 0.03} {'loss': 1.024, 'learning_rate': 1.9991085158165844e-05, 'epoch': 0.03} {'loss': 1.0042, 'learning_rate': 1.9991071333406432e-05, 'epoch': 0.03} {'loss': 1.143, 'learning_rate': 1.9991057497940686e-05, 'epoch': 0.03} {'loss': 0.9631, 'learning_rate': 1.999104365176862e-05, 'epoch': 0.03} {'loss': 0.9989, 'learning_rate': 1.9991029794890248e-05, 'epoch': 0.03} {'loss': 1.1878, 'learning_rate': 1.999101592730559e-05, 'epoch': 0.03} {'loss': 0.9858, 'learning_rate': 1.999100204901465e-05, 'epoch': 0.03} {'loss': 1.2751, 'learning_rate': 1.9990988160017456e-05, 'epoch': 0.03} {'loss': 0.9868, 'learning_rate': 1.9990974260314012e-05, 'epoch': 0.03} {'loss': 1.1108, 'learning_rate': 1.9990960349904336e-05, 'epoch': 0.03} {'loss': 0.8289, 'learning_rate': 1.999094642878845e-05, 'epoch': 0.03} {'loss': 1.1187, 'learning_rate': 1.999093249696636e-05, 'epoch': 0.03} {'loss': 1.1183, 'learning_rate': 1.9990918554438082e-05, 'epoch': 0.03} {'loss': 1.0236, 'learning_rate': 1.9990904601203636e-05, 'epoch': 0.03} {'loss': 1.0395, 'learning_rate': 1.999089063726303e-05, 'epoch': 0.03} {'loss': 0.9693, 'learning_rate': 1.9990876662616286e-05, 'epoch': 0.03} {'loss': 1.0561, 'learning_rate': 1.999086267726342e-05, 'epoch': 0.03} {'loss': 0.9337, 'learning_rate': 1.9990848681204435e-05, 'epoch': 0.03} {'loss': 1.0071, 'learning_rate': 1.999083467443936e-05, 'epoch': 0.03} {'loss': 0.7558, 'learning_rate': 1.9990820656968203e-05, 'epoch': 0.03} {'loss': 0.9906, 'learning_rate': 1.9990806628790976e-05, 'epoch': 0.03} {'loss': 1.2146, 'learning_rate': 1.99907925899077e-05, 'epoch': 0.03} {'loss': 0.9472, 'learning_rate': 1.999077854031839e-05, 'epoch': 0.03} {'loss': 0.9628, 'learning_rate': 1.9990764480023058e-05, 'epoch': 0.03} {'loss': 1.0213, 'learning_rate': 1.999075040902172e-05, 'epoch': 0.03} {'loss': 1.0146, 'learning_rate': 1.999073632731439e-05, 'epoch': 0.03} {'loss': 1.1069, 'learning_rate': 1.9990722234901083e-05, 'epoch': 0.03} {'loss': 0.8999, 'learning_rate': 1.999070813178182e-05, 'epoch': 0.03} {'loss': 0.9299, 'learning_rate': 1.999069401795661e-05, 'epoch': 0.03} {'loss': 0.9955, 'learning_rate': 1.9990679893425468e-05, 'epoch': 0.03} {'loss': 1.0405, 'learning_rate': 1.999066575818841e-05, 'epoch': 0.03} {'loss': 1.2051, 'learning_rate': 1.9990651612245454e-05, 'epoch': 0.03} {'loss': 1.1538, 'learning_rate': 1.9990637455596612e-05, 'epoch': 0.03} {'loss': 0.9038, 'learning_rate': 1.99906232882419e-05, 'epoch': 0.03} {'loss': 1.1451, 'learning_rate': 1.9990609110181337e-05, 'epoch': 0.03} {'loss': 0.9324, 'learning_rate': 1.999059492141493e-05, 'epoch': 0.03} {'loss': 0.9265, 'learning_rate': 1.99905807219427e-05, 'epoch': 0.03} {'loss': 0.8368, 'learning_rate': 1.999056651176466e-05, 'epoch': 0.03} {'loss': 0.9913, 'learning_rate': 1.999055229088083e-05, 'epoch': 0.03} {'loss': 0.8128, 'learning_rate': 1.9990538059291224e-05, 'epoch': 0.03} {'loss': 0.8616, 'learning_rate': 1.999052381699585e-05, 'epoch': 0.03} {'loss': 0.7885, 'learning_rate': 1.9990509563994725e-05, 'epoch': 0.03} {'loss': 1.0257, 'learning_rate': 1.999049530028787e-05, 'epoch': 0.03} {'loss': 0.9799, 'learning_rate': 1.99904810258753e-05, 'epoch': 0.03} {'loss': 0.9416, 'learning_rate': 1.9990466740757026e-05, 'epoch': 0.03} {'loss': 1.0192, 'learning_rate': 1.9990452444933065e-05, 'epoch': 0.03} {'loss': 0.9544, 'learning_rate': 1.9990438138403433e-05, 'epoch': 0.03} {'loss': 1.1066, 'learning_rate': 1.9990423821168146e-05, 'epoch': 0.03} {'loss': 0.8166, 'learning_rate': 1.9990409493227213e-05, 'epoch': 0.03} {'loss': 0.9732, 'learning_rate': 1.999039515458066e-05, 'epoch': 0.03} {'loss': 0.8219, 'learning_rate': 1.9990380805228496e-05, 'epoch': 0.03} {'loss': 1.0347, 'learning_rate': 1.9990366445170737e-05, 'epoch': 0.03} {'loss': 1.047, 'learning_rate': 1.99903520744074e-05, 'epoch': 0.03} {'loss': 0.8932, 'learning_rate': 1.9990337692938496e-05, 'epoch': 0.03} {'loss': 0.9252, 'learning_rate': 1.9990323300764046e-05, 'epoch': 0.03} {'loss': 0.9644, 'learning_rate': 1.999030889788406e-05, 'epoch': 0.03} {'loss': 0.7871, 'learning_rate': 1.999029448429856e-05, 'epoch': 0.03} {'loss': 0.9095, 'learning_rate': 1.9990280060007554e-05, 'epoch': 0.03} {'loss': 0.8596, 'learning_rate': 1.9990265625011065e-05, 'epoch': 0.03} {'loss': 0.8573, 'learning_rate': 1.9990251179309103e-05, 'epoch': 0.03} {'loss': 0.8354, 'learning_rate': 1.9990236722901684e-05, 'epoch': 0.03} {'loss': 1.0954, 'learning_rate': 1.9990222255788826e-05, 'epoch': 0.03} {'loss': 1.0794, 'learning_rate': 1.9990207777970542e-05, 'epoch': 0.03} {'loss': 0.9642, 'learning_rate': 1.999019328944685e-05, 'epoch': 0.03} {'loss': 1.0379, 'learning_rate': 1.9990178790217762e-05, 'epoch': 0.03} {'loss': 0.9891, 'learning_rate': 1.99901642802833e-05, 'epoch': 0.03} {'loss': 0.8194, 'learning_rate': 1.999014975964347e-05, 'epoch': 0.03} {'loss': 0.8839, 'learning_rate': 1.9990135228298296e-05, 'epoch': 0.03} {'loss': 0.9461, 'learning_rate': 1.9990120686247793e-05, 'epoch': 0.03} {'loss': 1.0129, 'learning_rate': 1.999010613349197e-05, 'epoch': 0.03} {'loss': 1.0485, 'learning_rate': 1.9990091570030848e-05, 'epoch': 0.03} {'loss': 1.082, 'learning_rate': 1.999007699586444e-05, 'epoch': 0.03} {'loss': 0.9043, 'learning_rate': 1.9990062410992762e-05, 'epoch': 0.03} {'loss': 0.8393, 'learning_rate': 1.9990047815415835e-05, 'epoch': 0.03} {'loss': 0.861, 'learning_rate': 1.9990033209133665e-05, 'epoch': 0.03} {'loss': 1.0742, 'learning_rate': 1.9990018592146276e-05, 'epoch': 0.03} {'loss': 0.8314, 'learning_rate': 1.999000396445368e-05, 'epoch': 0.03} {'loss': 0.9615, 'learning_rate': 1.998998932605589e-05, 'epoch': 0.03} {'loss': 0.9065, 'learning_rate': 1.998997467695293e-05, 'epoch': 0.03} {'loss': 0.8795, 'learning_rate': 1.9989960017144808e-05, 'epoch': 0.03} {'loss': 0.8153, 'learning_rate': 1.998994534663154e-05, 'epoch': 0.03} {'loss': 0.9296, 'learning_rate': 1.9989930665413148e-05, 'epoch': 0.03} {'loss': 0.9988, 'learning_rate': 1.998991597348964e-05, 'epoch': 0.03} {'loss': 1.0045, 'learning_rate': 1.9989901270861037e-05, 'epoch': 0.03} {'loss': 0.9666, 'learning_rate': 1.9989886557527357e-05, 'epoch': 0.03} {'loss': 1.0059, 'learning_rate': 1.9989871833488606e-05, 'epoch': 0.03} {'loss': 1.0975, 'learning_rate': 1.998985709874481e-05, 'epoch': 0.03} {'loss': 1.0572, 'learning_rate': 1.9989842353295976e-05, 'epoch': 0.03} {'loss': 0.9252, 'learning_rate': 1.9989827597142128e-05, 'epoch': 0.03} {'loss': 0.9882, 'learning_rate': 1.9989812830283276e-05, 'epoch': 0.03} {'loss': 0.8465, 'learning_rate': 1.9989798052719436e-05, 'epoch': 0.03} {'loss': 1.1895, 'learning_rate': 1.998978326445063e-05, 'epoch': 0.03} {'loss': 0.9758, 'learning_rate': 1.998976846547687e-05, 'epoch': 0.03} {'loss': 0.9951, 'learning_rate': 1.9989753655798167e-05, 'epoch': 0.03} {'loss': 1.0036, 'learning_rate': 1.9989738835414542e-05, 'epoch': 0.03} {'loss': 0.9748, 'learning_rate': 1.9989724004326016e-05, 'epoch': 0.04} {'loss': 0.975, 'learning_rate': 1.9989709162532593e-05, 'epoch': 0.04} {'loss': 0.8931, 'learning_rate': 1.99896943100343e-05, 'epoch': 0.04} {'loss': 1.0648, 'learning_rate': 1.9989679446831142e-05, 'epoch': 0.04} {'loss': 0.9996, 'learning_rate': 1.9989664572923146e-05, 'epoch': 0.04} {'loss': 0.9617, 'learning_rate': 1.998964968831032e-05, 'epoch': 0.04} {'loss': 1.0282, 'learning_rate': 1.998963479299268e-05, 'epoch': 0.04} {'loss': 0.9974, 'learning_rate': 1.9989619886970247e-05, 'epoch': 0.04} {'loss': 0.9993, 'learning_rate': 1.998960497024304e-05, 'epoch': 0.04} {'loss': 0.9961, 'learning_rate': 1.9989590042811063e-05, 'epoch': 0.04} {'loss': 1.0168, 'learning_rate': 1.998957510467434e-05, 'epoch': 0.04} {'loss': 0.8373, 'learning_rate': 1.9989560155832886e-05, 'epoch': 0.04} {'loss': 1.1251, 'learning_rate': 1.998954519628672e-05, 'epoch': 0.04} {'loss': 0.8751, 'learning_rate': 1.9989530226035852e-05, 'epoch': 0.04} {'loss': 0.9333, 'learning_rate': 1.99895152450803e-05, 'epoch': 0.04} {'loss': 0.9999, 'learning_rate': 1.9989500253420083e-05, 'epoch': 0.04} {'loss': 0.987, 'learning_rate': 1.9989485251055214e-05, 'epoch': 0.04} {'loss': 0.9026, 'learning_rate': 1.9989470237985708e-05, 'epoch': 0.04} {'loss': 1.1247, 'learning_rate': 1.9989455214211582e-05, 'epoch': 0.04} {'loss': 0.9774, 'learning_rate': 1.998944017973286e-05, 'epoch': 0.04} {'loss': 1.0382, 'learning_rate': 1.9989425134549544e-05, 'epoch': 0.04} {'loss': 0.8589, 'learning_rate': 1.9989410078661662e-05, 'epoch': 0.04} {'loss': 1.1245, 'learning_rate': 1.9989395012069225e-05, 'epoch': 0.04} {'loss': 0.9349, 'learning_rate': 1.9989379934772247e-05, 'epoch': 0.04} {'loss': 1.042, 'learning_rate': 1.9989364846770747e-05, 'epoch': 0.04} {'loss': 0.9466, 'learning_rate': 1.9989349748064743e-05, 'epoch': 0.04} {'loss': 0.8616, 'learning_rate': 1.9989334638654248e-05, 'epoch': 0.04} {'loss': 0.8364, 'learning_rate': 1.998931951853928e-05, 'epoch': 0.04} {'loss': 0.9285, 'learning_rate': 1.998930438771985e-05, 'epoch': 0.04} {'loss': 0.9762, 'learning_rate': 1.9989289246195986e-05, 'epoch': 0.04} {'loss': 1.0983, 'learning_rate': 1.9989274093967695e-05, 'epoch': 0.04} {'loss': 0.9753, 'learning_rate': 1.9989258931034994e-05, 'epoch': 0.04} {'loss': 1.0111, 'learning_rate': 1.99892437573979e-05, 'epoch': 0.04} {'loss': 1.0233, 'learning_rate': 1.998922857305643e-05, 'epoch': 0.04} {'loss': 1.1338, 'learning_rate': 1.99892133780106e-05, 'epoch': 0.04} {'loss': 1.0647, 'learning_rate': 1.998919817226043e-05, 'epoch': 0.04} {'loss': 0.9634, 'learning_rate': 1.998918295580593e-05, 'epoch': 0.04} {'loss': 1.073, 'learning_rate': 1.9989167728647114e-05, 'epoch': 0.04} {'loss': 0.8804, 'learning_rate': 1.998915249078401e-05, 'epoch': 0.04} {'loss': 0.9747, 'learning_rate': 1.9989137242216623e-05, 'epoch': 0.04} {'loss': 0.9861, 'learning_rate': 1.9989121982944976e-05, 'epoch': 0.04} {'loss': 1.0338, 'learning_rate': 1.9989106712969083e-05, 'epoch': 0.04} {'loss': 0.9042, 'learning_rate': 1.9989091432288957e-05, 'epoch': 0.04} {'loss': 0.9263, 'learning_rate': 1.9989076140904624e-05, 'epoch': 0.04} {'loss': 1.07, 'learning_rate': 1.9989060838816093e-05, 'epoch': 0.04} {'loss': 1.079, 'learning_rate': 1.998904552602338e-05, 'epoch': 0.04} {'loss': 0.8939, 'learning_rate': 1.9989030202526503e-05, 'epoch': 0.04} {'loss': 0.8343, 'learning_rate': 1.9989014868325478e-05, 'epoch': 0.04} {'loss': 1.0865, 'learning_rate': 1.9988999523420322e-05, 'epoch': 0.04} {'loss': 0.8844, 'learning_rate': 1.9988984167811055e-05, 'epoch': 0.04} {'loss': 1.0405, 'learning_rate': 1.9988968801497686e-05, 'epoch': 0.04} {'loss': 1.075, 'learning_rate': 1.998895342448024e-05, 'epoch': 0.04} {'loss': 0.9712, 'learning_rate': 1.9988938036758724e-05, 'epoch': 0.04} {'loss': 1.1616, 'learning_rate': 1.998892263833316e-05, 'epoch': 0.04} {'loss': 0.8437, 'learning_rate': 1.9988907229203568e-05, 'epoch': 0.04} {'loss': 0.9982, 'learning_rate': 1.9988891809369956e-05, 'epoch': 0.04} {'loss': 1.0645, 'learning_rate': 1.9988876378832347e-05, 'epoch': 0.04} {'loss': 0.9566, 'learning_rate': 1.9988860937590756e-05, 'epoch': 0.04} {'loss': 0.8312, 'learning_rate': 1.9988845485645196e-05, 'epoch': 0.04} {'loss': 0.9355, 'learning_rate': 1.9988830022995687e-05, 'epoch': 0.04} {'loss': 1.0507, 'learning_rate': 1.9988814549642247e-05, 'epoch': 0.04} {'loss': 0.9575, 'learning_rate': 1.998879906558489e-05, 'epoch': 0.04} {'loss': 1.1241, 'learning_rate': 1.9988783570823632e-05, 'epoch': 0.04} {'loss': 1.0229, 'learning_rate': 1.9988768065358492e-05, 'epoch': 0.04} {'loss': 0.903, 'learning_rate': 1.9988752549189484e-05, 'epoch': 0.04} {'loss': 1.1019, 'learning_rate': 1.998873702231663e-05, 'epoch': 0.04} {'loss': 0.8523, 'learning_rate': 1.998872148473994e-05, 'epoch': 0.04} {'loss': 1.0919, 'learning_rate': 1.9988705936459434e-05, 'epoch': 0.04} {'loss': 0.8724, 'learning_rate': 1.9988690377475127e-05, 'epoch': 0.04} {'loss': 0.9276, 'learning_rate': 1.9988674807787037e-05, 'epoch': 0.04} {'loss': 1.1859, 'learning_rate': 1.998865922739518e-05, 'epoch': 0.04} {'loss': 0.8968, 'learning_rate': 1.9988643636299578e-05, 'epoch': 0.04} {'loss': 0.7624, 'learning_rate': 1.9988628034500235e-05, 'epoch': 0.04} {'loss': 0.9607, 'learning_rate': 1.998861242199718e-05, 'epoch': 0.04} {'loss': 1.049, 'learning_rate': 1.9988596798790426e-05, 'epoch': 0.04} {'loss': 0.8915, 'learning_rate': 1.9988581164879986e-05, 'epoch': 0.04} {'loss': 1.1218, 'learning_rate': 1.9988565520265883e-05, 'epoch': 0.04} {'loss': 0.9717, 'learning_rate': 1.998854986494813e-05, 'epoch': 0.04} {'loss': 1.1163, 'learning_rate': 1.998853419892674e-05, 'epoch': 0.04} {'loss': 0.912, 'learning_rate': 1.9988518522201737e-05, 'epoch': 0.04} {'loss': 1.0364, 'learning_rate': 1.9988502834773134e-05, 'epoch': 0.04} {'loss': 1.0104, 'learning_rate': 1.998848713664095e-05, 'epoch': 0.04} {'loss': 1.0035, 'learning_rate': 1.9988471427805202e-05, 'epoch': 0.04} {'loss': 0.8818, 'learning_rate': 1.9988455708265905e-05, 'epoch': 0.04} {'loss': 0.9655, 'learning_rate': 1.9988439978023072e-05, 'epoch': 0.04} {'loss': 1.0055, 'learning_rate': 1.9988424237076728e-05, 'epoch': 0.04} {'loss': 0.9798, 'learning_rate': 1.9988408485426886e-05, 'epoch': 0.04} {'loss': 0.877, 'learning_rate': 1.998839272307356e-05, 'epoch': 0.04} {'loss': 0.8365, 'learning_rate': 1.9988376950016772e-05, 'epoch': 0.04} {'loss': 1.1727, 'learning_rate': 1.9988361166256535e-05, 'epoch': 0.04} {'loss': 0.8771, 'learning_rate': 1.998834537179287e-05, 'epoch': 0.04} {'loss': 1.1764, 'learning_rate': 1.998832956662579e-05, 'epoch': 0.04} {'loss': 1.0066, 'learning_rate': 1.9988313750755312e-05, 'epoch': 0.04} {'loss': 1.1099, 'learning_rate': 1.998829792418146e-05, 'epoch': 0.04} {'loss': 0.7906, 'learning_rate': 1.9988282086904236e-05, 'epoch': 0.04} {'loss': 1.0326, 'learning_rate': 1.998826623892367e-05, 'epoch': 0.04} {'loss': 0.9773, 'learning_rate': 1.9988250380239778e-05, 'epoch': 0.04} {'loss': 0.7805, 'learning_rate': 1.998823451085257e-05, 'epoch': 0.04} {'loss': 0.8954, 'learning_rate': 1.998821863076207e-05, 'epoch': 0.04} {'loss': 0.9324, 'learning_rate': 1.9988202739968293e-05, 'epoch': 0.04} {'loss': 1.0379, 'learning_rate': 1.9988186838471255e-05, 'epoch': 0.04} {'loss': 1.1155, 'learning_rate': 1.9988170926270973e-05, 'epoch': 0.04} {'loss': 0.9835, 'learning_rate': 1.9988155003367464e-05, 'epoch': 0.04} {'loss': 0.85, 'learning_rate': 1.9988139069760745e-05, 'epoch': 0.04} {'loss': 0.8579, 'learning_rate': 1.9988123125450833e-05, 'epoch': 0.04} {'loss': 0.8666, 'learning_rate': 1.9988107170437745e-05, 'epoch': 0.04} {'loss': 0.9418, 'learning_rate': 1.9988091204721502e-05, 'epoch': 0.04} {'loss': 0.8163, 'learning_rate': 1.9988075228302116e-05, 'epoch': 0.04} {'loss': 0.8828, 'learning_rate': 1.9988059241179605e-05, 'epoch': 0.04} {'loss': 0.7822, 'learning_rate': 1.998804324335399e-05, 'epoch': 0.04} {'loss': 0.9057, 'learning_rate': 1.998802723482528e-05, 'epoch': 0.04} {'loss': 0.9999, 'learning_rate': 1.9988011215593503e-05, 'epoch': 0.04} {'loss': 1.01, 'learning_rate': 1.9987995185658667e-05, 'epoch': 0.04} {'loss': 0.8332, 'learning_rate': 1.9987979145020794e-05, 'epoch': 0.04} {'loss': 1.0517, 'learning_rate': 1.9987963093679897e-05, 'epoch': 0.04} {'loss': 0.8554, 'learning_rate': 1.9987947031636e-05, 'epoch': 0.04} {'loss': 0.7338, 'learning_rate': 1.9987930958889114e-05, 'epoch': 0.04} {'loss': 0.9368, 'learning_rate': 1.998791487543926e-05, 'epoch': 0.04} {'loss': 0.9622, 'learning_rate': 1.9987898781286453e-05, 'epoch': 0.04} {'loss': 1.0334, 'learning_rate': 1.9987882676430713e-05, 'epoch': 0.04} {'loss': 0.9082, 'learning_rate': 1.998786656087205e-05, 'epoch': 0.04} {'loss': 0.912, 'learning_rate': 1.998785043461049e-05, 'epoch': 0.04} {'loss': 0.9554, 'learning_rate': 1.9987834297646048e-05, 'epoch': 0.04} {'loss': 0.8772, 'learning_rate': 1.9987818149978738e-05, 'epoch': 0.04} {'loss': 1.0543, 'learning_rate': 1.998780199160858e-05, 'epoch': 0.04} {'loss': 0.8619, 'learning_rate': 1.998778582253559e-05, 'epoch': 0.04} {'loss': 0.9095, 'learning_rate': 1.9987769642759785e-05, 'epoch': 0.04} {'loss': 0.9202, 'learning_rate': 1.9987753452281187e-05, 'epoch': 0.04} {'loss': 0.9396, 'learning_rate': 1.998773725109981e-05, 'epoch': 0.04} {'loss': 1.1278, 'learning_rate': 1.998772103921567e-05, 'epoch': 0.04} {'loss': 1.0288, 'learning_rate': 1.9987704816628784e-05, 'epoch': 0.04} {'loss': 0.9058, 'learning_rate': 1.9987688583339172e-05, 'epoch': 0.04} {'loss': 0.7436, 'learning_rate': 1.9987672339346845e-05, 'epoch': 0.04} {'loss': 0.8019, 'learning_rate': 1.9987656084651834e-05, 'epoch': 0.04} {'loss': 1.0317, 'learning_rate': 1.9987639819254144e-05, 'epoch': 0.04} {'loss': 0.8515, 'learning_rate': 1.9987623543153797e-05, 'epoch': 0.04} {'loss': 1.0011, 'learning_rate': 1.998760725635081e-05, 'epoch': 0.04} {'loss': 1.0594, 'learning_rate': 1.9987590958845197e-05, 'epoch': 0.04} {'loss': 0.834, 'learning_rate': 1.998757465063698e-05, 'epoch': 0.04} {'loss': 0.8853, 'learning_rate': 1.9987558331726183e-05, 'epoch': 0.04} {'loss': 0.7018, 'learning_rate': 1.9987542002112808e-05, 'epoch': 0.04} {'loss': 1.1203, 'learning_rate': 1.9987525661796884e-05, 'epoch': 0.04} {'loss': 0.9165, 'learning_rate': 1.9987509310778424e-05, 'epoch': 0.04} {'loss': 0.8229, 'learning_rate': 1.9987492949057442e-05, 'epoch': 0.04} {'loss': 0.7937, 'learning_rate': 1.9987476576633965e-05, 'epoch': 0.04} {'loss': 0.8326, 'learning_rate': 1.9987460193508002e-05, 'epoch': 0.04} {'loss': 1.0122, 'learning_rate': 1.998744379967958e-05, 'epoch': 0.04} {'loss': 1.0213, 'learning_rate': 1.9987427395148705e-05, 'epoch': 0.04} {'loss': 0.9344, 'learning_rate': 1.99874109799154e-05, 'epoch': 0.04} {'loss': 0.9126, 'learning_rate': 1.9987394553979685e-05, 'epoch': 0.04} {'loss': 0.9312, 'learning_rate': 1.9987378117341576e-05, 'epoch': 0.04} {'loss': 1.0053, 'learning_rate': 1.9987361670001087e-05, 'epoch': 0.04} {'loss': 0.9242, 'learning_rate': 1.998734521195824e-05, 'epoch': 0.04} {'loss': 0.7009, 'learning_rate': 1.998732874321305e-05, 'epoch': 0.04} {'loss': 0.8347, 'learning_rate': 1.998731226376554e-05, 'epoch': 0.04} {'loss': 0.994, 'learning_rate': 1.998729577361572e-05, 'epoch': 0.04} {'loss': 0.8351, 'learning_rate': 1.998727927276361e-05, 'epoch': 0.04} {'loss': 0.8944, 'learning_rate': 1.998726276120923e-05, 'epoch': 0.04} {'loss': 1.0849, 'learning_rate': 1.99872462389526e-05, 'epoch': 0.04} {'loss': 0.8262, 'learning_rate': 1.998722970599373e-05, 'epoch': 0.04} {'loss': 0.9512, 'learning_rate': 1.9987213162332644e-05, 'epoch': 0.04} {'loss': 0.9492, 'learning_rate': 1.9987196607969356e-05, 'epoch': 0.04} {'loss': 1.0507, 'learning_rate': 1.9987180042903885e-05, 'epoch': 0.04} {'loss': 1.0322, 'learning_rate': 1.9987163467136254e-05, 'epoch': 0.04} {'loss': 0.9198, 'learning_rate': 1.998714688066647e-05, 'epoch': 0.04} {'loss': 0.9977, 'learning_rate': 1.998713028349456e-05, 'epoch': 0.04} {'loss': 0.9739, 'learning_rate': 1.998711367562054e-05, 'epoch': 0.04} {'loss': 1.0195, 'learning_rate': 1.9987097057044422e-05, 'epoch': 0.04} {'loss': 0.9113, 'learning_rate': 1.998708042776623e-05, 'epoch': 0.04} {'loss': 0.8128, 'learning_rate': 1.998706378778598e-05, 'epoch': 0.04} {'loss': 1.0143, 'learning_rate': 1.9987047137103693e-05, 'epoch': 0.04} {'loss': 0.9605, 'learning_rate': 1.998703047571938e-05, 'epoch': 0.04} {'loss': 0.9458, 'learning_rate': 1.9987013803633062e-05, 'epoch': 0.04} {'loss': 0.9951, 'learning_rate': 1.9986997120844756e-05, 'epoch': 0.04} {'loss': 0.8665, 'learning_rate': 1.9986980427354484e-05, 'epoch': 0.04} {'loss': 0.7471, 'learning_rate': 1.9986963723162262e-05, 'epoch': 0.04} {'loss': 0.9025, 'learning_rate': 1.9986947008268104e-05, 'epoch': 0.04} {'loss': 0.8705, 'learning_rate': 1.9986930282672034e-05, 'epoch': 0.04} {'loss': 1.0073, 'learning_rate': 1.9986913546374068e-05, 'epoch': 0.04} {'loss': 0.9933, 'learning_rate': 1.9986896799374217e-05, 'epoch': 0.04} {'loss': 1.0331, 'learning_rate': 1.998688004167251e-05, 'epoch': 0.04} {'loss': 1.1833, 'learning_rate': 1.998686327326896e-05, 'epoch': 0.04} {'loss': 0.9923, 'learning_rate': 1.9986846494163577e-05, 'epoch': 0.04} {'loss': 1.0246, 'learning_rate': 1.9986829704356392e-05, 'epoch': 0.04} {'loss': 1.07, 'learning_rate': 1.9986812903847417e-05, 'epoch': 0.04} {'loss': 0.758, 'learning_rate': 1.9986796092636672e-05, 'epoch': 0.04} {'loss': 1.1088, 'learning_rate': 1.9986779270724174e-05, 'epoch': 0.04} {'loss': 1.021, 'learning_rate': 1.998676243810994e-05, 'epoch': 0.04} {'loss': 0.8325, 'learning_rate': 1.9986745594793985e-05, 'epoch': 0.04} {'loss': 1.0639, 'learning_rate': 1.9986728740776336e-05, 'epoch': 0.04} {'loss': 0.9787, 'learning_rate': 1.9986711876057002e-05, 'epoch': 0.04} {'loss': 1.1194, 'learning_rate': 1.9986695000636006e-05, 'epoch': 0.04} {'loss': 0.9465, 'learning_rate': 1.998667811451337e-05, 'epoch': 0.04} {'loss': 1.0334, 'learning_rate': 1.99866612176891e-05, 'epoch': 0.04} {'loss': 0.9283, 'learning_rate': 1.998664431016322e-05, 'epoch': 0.04} {'loss': 0.853, 'learning_rate': 1.9986627391935755e-05, 'epoch': 0.04} {'loss': 1.0307, 'learning_rate': 1.998661046300671e-05, 'epoch': 0.04} {'loss': 0.9516, 'learning_rate': 1.9986593523376122e-05, 'epoch': 0.04} {'loss': 0.941, 'learning_rate': 1.9986576573043986e-05, 'epoch': 0.04} {'loss': 0.9803, 'learning_rate': 1.9986559612010338e-05, 'epoch': 0.04} {'loss': 0.9323, 'learning_rate': 1.9986542640275194e-05, 'epoch': 0.04} {'loss': 0.9334, 'learning_rate': 1.998652565783856e-05, 'epoch': 0.04} {'loss': 0.9769, 'learning_rate': 1.9986508664700467e-05, 'epoch': 0.04} {'loss': 0.9334, 'learning_rate': 1.9986491660860927e-05, 'epoch': 0.04} {'loss': 1.0915, 'learning_rate': 1.998647464631996e-05, 'epoch': 0.04} {'loss': 0.9162, 'learning_rate': 1.9986457621077586e-05, 'epoch': 0.04} {'loss': 1.0413, 'learning_rate': 1.998644058513382e-05, 'epoch': 0.04} {'loss': 1.0558, 'learning_rate': 1.998642353848868e-05, 'epoch': 0.04} {'loss': 0.8722, 'learning_rate': 1.9986406481142187e-05, 'epoch': 0.04} {'loss': 1.1298, 'learning_rate': 1.998638941309436e-05, 'epoch': 0.04} {'loss': 0.9984, 'learning_rate': 1.998637233434521e-05, 'epoch': 0.04} {'loss': 0.8887, 'learning_rate': 1.9986355244894765e-05, 'epoch': 0.04} {'loss': 0.8615, 'learning_rate': 1.998633814474304e-05, 'epoch': 0.04} {'loss': 1.0547, 'learning_rate': 1.9986321033890052e-05, 'epoch': 0.04} {'loss': 0.943, 'learning_rate': 1.9986303912335817e-05, 'epoch': 0.04} {'loss': 1.0085, 'learning_rate': 1.9986286780080357e-05, 'epoch': 0.04} {'loss': 1.1595, 'learning_rate': 1.9986269637123692e-05, 'epoch': 0.04} {'loss': 0.8798, 'learning_rate': 1.9986252483465834e-05, 'epoch': 0.04} {'loss': 0.9967, 'learning_rate': 1.998623531910681e-05, 'epoch': 0.04} {'loss': 0.9471, 'learning_rate': 1.998621814404663e-05, 'epoch': 0.04} {'loss': 0.9522, 'learning_rate': 1.9986200958285313e-05, 'epoch': 0.04} {'loss': 0.8815, 'learning_rate': 1.9986183761822885e-05, 'epoch': 0.04} {'loss': 0.8508, 'learning_rate': 1.998616655465936e-05, 'epoch': 0.04} {'loss': 1.1499, 'learning_rate': 1.9986149336794756e-05, 'epoch': 0.04} {'loss': 0.8529, 'learning_rate': 1.998613210822909e-05, 'epoch': 0.04} {'loss': 0.8179, 'learning_rate': 1.998611486896238e-05, 'epoch': 0.04} {'loss': 1.0466, 'learning_rate': 1.9986097618994653e-05, 'epoch': 0.04} {'loss': 1.0043, 'learning_rate': 1.9986080358325915e-05, 'epoch': 0.04} {'loss': 0.8787, 'learning_rate': 1.9986063086956193e-05, 'epoch': 0.04} {'loss': 1.2412, 'learning_rate': 1.99860458048855e-05, 'epoch': 0.04} {'loss': 0.8522, 'learning_rate': 1.9986028512113865e-05, 'epoch': 0.04} {'loss': 0.9266, 'learning_rate': 1.9986011208641293e-05, 'epoch': 0.04} {'loss': 0.9209, 'learning_rate': 1.998599389446781e-05, 'epoch': 0.04} {'loss': 0.8462, 'learning_rate': 1.9985976569593434e-05, 'epoch': 0.04} {'loss': 0.8823, 'learning_rate': 1.998595923401818e-05, 'epoch': 0.04} {'loss': 0.8776, 'learning_rate': 1.9985941887742072e-05, 'epoch': 0.04} {'loss': 1.0838, 'learning_rate': 1.998592453076513e-05, 'epoch': 0.04} {'loss': 1.1252, 'learning_rate': 1.998590716308736e-05, 'epoch': 0.04} {'loss': 0.9556, 'learning_rate': 1.9985889784708796e-05, 'epoch': 0.04} {'loss': 0.8323, 'learning_rate': 1.998587239562945e-05, 'epoch': 0.04} {'loss': 1.0754, 'learning_rate': 1.9985854995849337e-05, 'epoch': 0.04} {'loss': 0.9778, 'learning_rate': 1.998583758536848e-05, 'epoch': 0.04} {'loss': 0.9308, 'learning_rate': 1.9985820164186897e-05, 'epoch': 0.04} {'loss': 1.0435, 'learning_rate': 1.9985802732304604e-05, 'epoch': 0.04} {'loss': 1.0944, 'learning_rate': 1.9985785289721623e-05, 'epoch': 0.04} {'loss': 0.9788, 'learning_rate': 1.9985767836437975e-05, 'epoch': 0.04} {'loss': 0.9718, 'learning_rate': 1.9985750372453673e-05, 'epoch': 0.04} {'loss': 1.0385, 'learning_rate': 1.998573289776874e-05, 'epoch': 0.04} {'loss': 0.899, 'learning_rate': 1.998571541238319e-05, 'epoch': 0.04} {'loss': 1.0623, 'learning_rate': 1.998569791629705e-05, 'epoch': 0.04} {'loss': 0.9362, 'learning_rate': 1.9985680409510326e-05, 'epoch': 0.04} {'loss': 0.9455, 'learning_rate': 1.998566289202305e-05, 'epoch': 0.04} {'loss': 1.0164, 'learning_rate': 1.998564536383523e-05, 'epoch': 0.04} {'loss': 0.8125, 'learning_rate': 1.9985627824946893e-05, 'epoch': 0.04} {'loss': 0.9425, 'learning_rate': 1.9985610275358056e-05, 'epoch': 0.04} {'loss': 0.9174, 'learning_rate': 1.9985592715068733e-05, 'epoch': 0.04} {'loss': 0.9198, 'learning_rate': 1.998557514407895e-05, 'epoch': 0.04} {'loss': 1.1699, 'learning_rate': 1.9985557562388718e-05, 'epoch': 0.04} {'loss': 1.0337, 'learning_rate': 1.9985539969998062e-05, 'epoch': 0.04} {'loss': 0.8762, 'learning_rate': 1.9985522366907e-05, 'epoch': 0.04} {'loss': 1.1477, 'learning_rate': 1.9985504753115545e-05, 'epoch': 0.04} {'loss': 1.1153, 'learning_rate': 1.9985487128623723e-05, 'epoch': 0.04} {'loss': 0.9665, 'learning_rate': 1.998546949343155e-05, 'epoch': 0.04} {'loss': 1.0864, 'learning_rate': 1.998545184753905e-05, 'epoch': 0.04} {'loss': 1.0068, 'learning_rate': 1.998543419094623e-05, 'epoch': 0.04} {'loss': 1.0846, 'learning_rate': 1.998541652365312e-05, 'epoch': 0.04} {'loss': 0.7797, 'learning_rate': 1.9985398845659732e-05, 'epoch': 0.04} {'loss': 0.9781, 'learning_rate': 1.998538115696609e-05, 'epoch': 0.04} {'loss': 0.9457, 'learning_rate': 1.9985363457572208e-05, 'epoch': 0.04} {'loss': 1.0522, 'learning_rate': 1.9985345747478112e-05, 'epoch': 0.04} {'loss': 0.9272, 'learning_rate': 1.9985328026683818e-05, 'epoch': 0.04} {'loss': 1.0058, 'learning_rate': 1.998531029518934e-05, 'epoch': 0.04} {'loss': 0.839, 'learning_rate': 1.99852925529947e-05, 'epoch': 0.04} {'loss': 0.9737, 'learning_rate': 1.998527480009992e-05, 'epoch': 0.04} {'loss': 0.8485, 'learning_rate': 1.9985257036505015e-05, 'epoch': 0.04} {'loss': 0.9324, 'learning_rate': 1.998523926221001e-05, 'epoch': 0.04} {'loss': 1.0279, 'learning_rate': 1.9985221477214917e-05, 'epoch': 0.04} {'loss': 1.0563, 'learning_rate': 1.9985203681519756e-05, 'epoch': 0.04} {'loss': 0.8587, 'learning_rate': 1.998518587512455e-05, 'epoch': 0.04} {'loss': 1.0139, 'learning_rate': 1.9985168058029315e-05, 'epoch': 0.04} {'loss': 1.1447, 'learning_rate': 1.998515023023407e-05, 'epoch': 0.04} {'loss': 0.8629, 'learning_rate': 1.998513239173884e-05, 'epoch': 0.04} {'loss': 1.0853, 'learning_rate': 1.998511454254364e-05, 'epoch': 0.04} {'loss': 1.1071, 'learning_rate': 1.9985096682648482e-05, 'epoch': 0.04} {'loss': 1.0811, 'learning_rate': 1.9985078812053396e-05, 'epoch': 0.04} {'loss': 0.9997, 'learning_rate': 1.9985060930758397e-05, 'epoch': 0.04} {'loss': 0.9247, 'learning_rate': 1.9985043038763504e-05, 'epoch': 0.04} {'loss': 0.9901, 'learning_rate': 1.9985025136068736e-05, 'epoch': 0.04} {'loss': 1.0828, 'learning_rate': 1.9985007222674108e-05, 'epoch': 0.04} {'loss': 0.887, 'learning_rate': 1.998498929857965e-05, 'epoch': 0.04} {'loss': 1.0926, 'learning_rate': 1.998497136378537e-05, 'epoch': 0.04} {'loss': 0.9705, 'learning_rate': 1.9984953418291294e-05, 'epoch': 0.04} {'loss': 0.8111, 'learning_rate': 1.998493546209744e-05, 'epoch': 0.04} {'loss': 1.0315, 'learning_rate': 1.9984917495203825e-05, 'epoch': 0.04} {'loss': 0.7939, 'learning_rate': 1.9984899517610473e-05, 'epoch': 0.04} {'loss': 0.9528, 'learning_rate': 1.9984881529317394e-05, 'epoch': 0.04} {'loss': 0.9822, 'learning_rate': 1.998486353032462e-05, 'epoch': 0.04} {'loss': 1.0194, 'learning_rate': 1.998484552063216e-05, 'epoch': 0.04} {'loss': 1.0259, 'learning_rate': 1.9984827500240036e-05, 'epoch': 0.04} {'loss': 0.8145, 'learning_rate': 1.998480946914827e-05, 'epoch': 0.04} {'loss': 0.9692, 'learning_rate': 1.9984791427356878e-05, 'epoch': 0.04} {'loss': 0.9114, 'learning_rate': 1.998477337486588e-05, 'epoch': 0.04} {'loss': 0.9464, 'learning_rate': 1.9984755311675296e-05, 'epoch': 0.04} {'loss': 1.0689, 'learning_rate': 1.9984737237785147e-05, 'epoch': 0.04} {'loss': 0.9891, 'learning_rate': 1.9984719153195453e-05, 'epoch': 0.04} {'loss': 1.0045, 'learning_rate': 1.998470105790623e-05, 'epoch': 0.04} {'loss': 0.7775, 'learning_rate': 1.99846829519175e-05, 'epoch': 0.04} {'loss': 1.0523, 'learning_rate': 1.9984664835229276e-05, 'epoch': 0.04} {'loss': 0.8644, 'learning_rate': 1.9984646707841582e-05, 'epoch': 0.04} {'loss': 0.9375, 'learning_rate': 1.9984628569754444e-05, 'epoch': 0.04} {'loss': 0.792, 'learning_rate': 1.9984610420967873e-05, 'epoch': 0.04} {'loss': 1.091, 'learning_rate': 1.998459226148189e-05, 'epoch': 0.04} {'loss': 1.0287, 'learning_rate': 1.9984574091296515e-05, 'epoch': 0.04} {'loss': 0.9535, 'learning_rate': 1.998455591041177e-05, 'epoch': 0.04} {'loss': 0.9547, 'learning_rate': 1.998453771882767e-05, 'epoch': 0.04} {'loss': 0.9503, 'learning_rate': 1.9984519516544236e-05, 'epoch': 0.04} {'loss': 0.9722, 'learning_rate': 1.998450130356149e-05, 'epoch': 0.04} {'loss': 0.9348, 'learning_rate': 1.9984483079879447e-05, 'epoch': 0.04} {'loss': 0.893, 'learning_rate': 1.9984464845498133e-05, 'epoch': 0.04} {'loss': 1.0192, 'learning_rate': 1.998444660041756e-05, 'epoch': 0.04} {'loss': 0.8557, 'learning_rate': 1.9984428344637755e-05, 'epoch': 0.04} {'loss': 0.8157, 'learning_rate': 1.998441007815873e-05, 'epoch': 0.04} {'loss': 0.9284, 'learning_rate': 1.998439180098051e-05, 'epoch': 0.04} {'loss': 1.1709, 'learning_rate': 1.9984373513103117e-05, 'epoch': 0.04} {'loss': 0.9583, 'learning_rate': 1.9984355214526562e-05, 'epoch': 0.04} {'loss': 0.9858, 'learning_rate': 1.998433690525087e-05, 'epoch': 0.04} {'loss': 0.785, 'learning_rate': 1.998431858527606e-05, 'epoch': 0.04} {'loss': 0.9264, 'learning_rate': 1.9984300254602154e-05, 'epoch': 0.04} {'loss': 1.0792, 'learning_rate': 1.9984281913229167e-05, 'epoch': 0.04} {'loss': 0.9795, 'learning_rate': 1.9984263561157122e-05, 'epoch': 0.04} {'loss': 1.0659, 'learning_rate': 1.9984245198386033e-05, 'epoch': 0.04} {'loss': 0.9527, 'learning_rate': 1.998422682491593e-05, 'epoch': 0.04} {'loss': 0.9788, 'learning_rate': 1.998420844074682e-05, 'epoch': 0.04} {'loss': 1.0748, 'learning_rate': 1.9984190045878737e-05, 'epoch': 0.04} {'loss': 0.9532, 'learning_rate': 1.9984171640311688e-05, 'epoch': 0.04} {'loss': 1.1119, 'learning_rate': 1.9984153224045702e-05, 'epoch': 0.04} {'loss': 0.8079, 'learning_rate': 1.9984134797080792e-05, 'epoch': 0.04} {'loss': 0.9093, 'learning_rate': 1.9984116359416982e-05, 'epoch': 0.04} {'loss': 0.9075, 'learning_rate': 1.998409791105429e-05, 'epoch': 0.04} {'loss': 0.9761, 'learning_rate': 1.9984079451992735e-05, 'epoch': 0.04} {'loss': 0.8677, 'learning_rate': 1.9984060982232336e-05, 'epoch': 0.04} {'loss': 0.937, 'learning_rate': 1.9984042501773118e-05, 'epoch': 0.04} {'loss': 1.0108, 'learning_rate': 1.9984024010615094e-05, 'epoch': 0.04} {'loss': 0.9718, 'learning_rate': 1.998400550875829e-05, 'epoch': 0.04} {'loss': 1.0195, 'learning_rate': 1.9983986996202722e-05, 'epoch': 0.04} {'loss': 1.0781, 'learning_rate': 1.998396847294841e-05, 'epoch': 0.04} {'loss': 0.9696, 'learning_rate': 1.9983949938995376e-05, 'epoch': 0.04} {'loss': 0.9016, 'learning_rate': 1.9983931394343637e-05, 'epoch': 0.04} {'loss': 1.0404, 'learning_rate': 1.998391283899322e-05, 'epoch': 0.04} {'loss': 0.8578, 'learning_rate': 1.998389427294413e-05, 'epoch': 0.04} {'loss': 1.0507, 'learning_rate': 1.99838756961964e-05, 'epoch': 0.04} {'loss': 1.1551, 'learning_rate': 1.9983857108750048e-05, 'epoch': 0.04} {'loss': 0.8743, 'learning_rate': 1.9983838510605095e-05, 'epoch': 0.04} {'loss': 0.9334, 'learning_rate': 1.998381990176155e-05, 'epoch': 0.04} {'loss': 1.0335, 'learning_rate': 1.9983801282219444e-05, 'epoch': 0.04} {'loss': 1.0601, 'learning_rate': 1.9983782651978797e-05, 'epoch': 0.04} {'loss': 1.1243, 'learning_rate': 1.9983764011039623e-05, 'epoch': 0.04} {'loss': 0.8655, 'learning_rate': 1.9983745359401944e-05, 'epoch': 0.04} {'loss': 0.9544, 'learning_rate': 1.9983726697065782e-05, 'epoch': 0.04} {'loss': 0.8956, 'learning_rate': 1.9983708024031156e-05, 'epoch': 0.04} {'loss': 0.8892, 'learning_rate': 1.9983689340298085e-05, 'epoch': 0.04} {'loss': 1.0063, 'learning_rate': 1.9983670645866594e-05, 'epoch': 0.04} {'loss': 0.9416, 'learning_rate': 1.998365194073669e-05, 'epoch': 0.04} {'loss': 1.0902, 'learning_rate': 1.998363322490841e-05, 'epoch': 0.04} {'loss': 1.0468, 'learning_rate': 1.9983614498381763e-05, 'epoch': 0.04} {'loss': 0.9973, 'learning_rate': 1.9983595761156772e-05, 'epoch': 0.04} {'loss': 0.7613, 'learning_rate': 1.9983577013233457e-05, 'epoch': 0.04} {'loss': 0.9789, 'learning_rate': 1.9983558254611837e-05, 'epoch': 0.04} {'loss': 0.9292, 'learning_rate': 1.9983539485291934e-05, 'epoch': 0.04} {'loss': 0.993, 'learning_rate': 1.9983520705273768e-05, 'epoch': 0.04} {'loss': 1.0292, 'learning_rate': 1.998350191455736e-05, 'epoch': 0.04} {'loss': 1.0367, 'learning_rate': 1.9983483113142727e-05, 'epoch': 0.04} {'loss': 0.8305, 'learning_rate': 1.998346430102989e-05, 'epoch': 0.04} {'loss': 0.9122, 'learning_rate': 1.998344547821887e-05, 'epoch': 0.04} {'loss': 0.8915, 'learning_rate': 1.9983426644709685e-05, 'epoch': 0.04} {'loss': 1.0878, 'learning_rate': 1.9983407800502363e-05, 'epoch': 0.04} {'loss': 0.8444, 'learning_rate': 1.9983388945596913e-05, 'epoch': 0.04} {'loss': 0.7514, 'learning_rate': 1.9983370079993365e-05, 'epoch': 0.04} {'loss': 1.0378, 'learning_rate': 1.9983351203691734e-05, 'epoch': 0.04} {'loss': 0.9027, 'learning_rate': 1.998333231669204e-05, 'epoch': 0.04} {'loss': 1.0042, 'learning_rate': 1.9983313418994305e-05, 'epoch': 0.04} {'loss': 0.9877, 'learning_rate': 1.9983294510598544e-05, 'epoch': 0.04} {'loss': 1.1522, 'learning_rate': 1.9983275591504788e-05, 'epoch': 0.04} {'loss': 1.0238, 'learning_rate': 1.998325666171305e-05, 'epoch': 0.04} {'loss': 1.0551, 'learning_rate': 1.9983237721223354e-05, 'epoch': 0.04} {'loss': 1.2033, 'learning_rate': 1.998321877003571e-05, 'epoch': 0.04} {'loss': 0.9503, 'learning_rate': 1.998319980815015e-05, 'epoch': 0.04} {'loss': 0.9506, 'learning_rate': 1.998318083556669e-05, 'epoch': 0.04} {'loss': 0.7339, 'learning_rate': 1.9983161852285353e-05, 'epoch': 0.04} {'loss': 1.0374, 'learning_rate': 1.9983142858306156e-05, 'epoch': 0.04} {'loss': 1.1265, 'learning_rate': 1.998312385362912e-05, 'epoch': 0.04} {'loss': 1.1158, 'learning_rate': 1.9983104838254267e-05, 'epoch': 0.04} {'loss': 0.9817, 'learning_rate': 1.9983085812181615e-05, 'epoch': 0.04} {'loss': 0.9397, 'learning_rate': 1.9983066775411184e-05, 'epoch': 0.04} {'loss': 0.9812, 'learning_rate': 1.9983047727943e-05, 'epoch': 0.04} {'loss': 0.9753, 'learning_rate': 1.9983028669777074e-05, 'epoch': 0.04} {'loss': 0.9721, 'learning_rate': 1.9983009600913436e-05, 'epoch': 0.04} {'loss': 1.0295, 'learning_rate': 1.99829905213521e-05, 'epoch': 0.04} {'loss': 1.1249, 'learning_rate': 1.9982971431093087e-05, 'epoch': 0.04} {'loss': 0.9091, 'learning_rate': 1.998295233013642e-05, 'epoch': 0.04} {'loss': 0.9487, 'learning_rate': 1.998293321848212e-05, 'epoch': 0.04} {'loss': 0.7159, 'learning_rate': 1.998291409613021e-05, 'epoch': 0.04} {'loss': 0.788, 'learning_rate': 1.99828949630807e-05, 'epoch': 0.04} {'loss': 0.9336, 'learning_rate': 1.998287581933362e-05, 'epoch': 0.04} {'loss': 0.9444, 'learning_rate': 1.9982856664888986e-05, 'epoch': 0.04} {'loss': 1.0413, 'learning_rate': 1.9982837499746822e-05, 'epoch': 0.04} {'loss': 1.1378, 'learning_rate': 1.9982818323907148e-05, 'epoch': 0.04} {'loss': 0.9975, 'learning_rate': 1.998279913736998e-05, 'epoch': 0.04} {'loss': 0.7839, 'learning_rate': 1.9982779940135343e-05, 'epoch': 0.04} {'loss': 0.9644, 'learning_rate': 1.9982760732203254e-05, 'epoch': 0.04} {'loss': 0.9937, 'learning_rate': 1.9982741513573738e-05, 'epoch': 0.04} {'loss': 0.9267, 'learning_rate': 1.9982722284246813e-05, 'epoch': 0.04} {'loss': 0.9004, 'learning_rate': 1.9982703044222502e-05, 'epoch': 0.04} {'loss': 0.7477, 'learning_rate': 1.9982683793500822e-05, 'epoch': 0.04} {'loss': 0.896, 'learning_rate': 1.9982664532081794e-05, 'epoch': 0.04} {'loss': 1.0124, 'learning_rate': 1.998264525996544e-05, 'epoch': 0.04} {'loss': 0.908, 'learning_rate': 1.9982625977151783e-05, 'epoch': 0.04} {'loss': 0.9515, 'learning_rate': 1.998260668364084e-05, 'epoch': 0.04} {'loss': 1.1122, 'learning_rate': 1.9982587379432636e-05, 'epoch': 0.04} {'loss': 0.7885, 'learning_rate': 1.998256806452718e-05, 'epoch': 0.04} {'loss': 1.0722, 'learning_rate': 1.998254873892451e-05, 'epoch': 0.04} {'loss': 1.0811, 'learning_rate': 1.9982529402624636e-05, 'epoch': 0.04} {'loss': 0.7507, 'learning_rate': 1.998251005562758e-05, 'epoch': 0.04} {'loss': 0.9172, 'learning_rate': 1.9982490697933363e-05, 'epoch': 0.04} {'loss': 1.0941, 'learning_rate': 1.9982471329542005e-05, 'epoch': 0.04} {'loss': 0.8743, 'learning_rate': 1.9982451950453532e-05, 'epoch': 0.04} {'loss': 0.8892, 'learning_rate': 1.9982432560667958e-05, 'epoch': 0.04} {'loss': 0.9684, 'learning_rate': 1.9982413160185307e-05, 'epoch': 0.04} {'loss': 0.8836, 'learning_rate': 1.99823937490056e-05, 'epoch': 0.04} {'loss': 0.935, 'learning_rate': 1.9982374327128853e-05, 'epoch': 0.04} {'loss': 0.9348, 'learning_rate': 1.9982354894555095e-05, 'epoch': 0.04} {'loss': 0.8452, 'learning_rate': 1.9982335451284344e-05, 'epoch': 0.04} {'loss': 1.0014, 'learning_rate': 1.9982315997316614e-05, 'epoch': 0.04} {'loss': 1.0074, 'learning_rate': 1.9982296532651938e-05, 'epoch': 0.04} {'loss': 0.9408, 'learning_rate': 1.9982277057290328e-05, 'epoch': 0.04} {'loss': 0.9741, 'learning_rate': 1.9982257571231805e-05, 'epoch': 0.04} {'loss': 0.973, 'learning_rate': 1.9982238074476396e-05, 'epoch': 0.04} {'loss': 1.1118, 'learning_rate': 1.9982218567024115e-05, 'epoch': 0.04} {'loss': 1.158, 'learning_rate': 1.9982199048874987e-05, 'epoch': 0.04} {'loss': 1.0917, 'learning_rate': 1.998217952002903e-05, 'epoch': 0.04} {'loss': 1.0872, 'learning_rate': 1.9982159980486265e-05, 'epoch': 0.04} {'loss': 0.8797, 'learning_rate': 1.998214043024672e-05, 'epoch': 0.04} {'loss': 1.0644, 'learning_rate': 1.998212086931041e-05, 'epoch': 0.04} {'loss': 1.1234, 'learning_rate': 1.998210129767735e-05, 'epoch': 0.04} {'loss': 0.8523, 'learning_rate': 1.9982081715347575e-05, 'epoch': 0.04} {'loss': 1.0503, 'learning_rate': 1.9982062122321094e-05, 'epoch': 0.04} {'loss': 0.8801, 'learning_rate': 1.9982042518597936e-05, 'epoch': 0.04} {'loss': 0.9291, 'learning_rate': 1.9982022904178116e-05, 'epoch': 0.04} {'loss': 0.8842, 'learning_rate': 1.998200327906166e-05, 'epoch': 0.04} {'loss': 0.9556, 'learning_rate': 1.9981983643248583e-05, 'epoch': 0.04} {'loss': 0.9932, 'learning_rate': 1.998196399673891e-05, 'epoch': 0.04} {'loss': 0.9325, 'learning_rate': 1.9981944339532665e-05, 'epoch': 0.04} {'loss': 0.8989, 'learning_rate': 1.9981924671629864e-05, 'epoch': 0.04} {'loss': 1.0121, 'learning_rate': 1.998190499303053e-05, 'epoch': 0.04} {'loss': 1.0438, 'learning_rate': 1.9981885303734683e-05, 'epoch': 0.04} {'loss': 0.8849, 'learning_rate': 1.9981865603742347e-05, 'epoch': 0.04} {'loss': 0.9086, 'learning_rate': 1.9981845893053537e-05, 'epoch': 0.04} {'loss': 1.072, 'learning_rate': 1.9981826171668283e-05, 'epoch': 0.04} {'loss': 1.032, 'learning_rate': 1.9981806439586598e-05, 'epoch': 0.04} {'loss': 0.9869, 'learning_rate': 1.9981786696808507e-05, 'epoch': 0.04} {'loss': 1.1272, 'learning_rate': 1.9981766943334033e-05, 'epoch': 0.04} {'loss': 0.9749, 'learning_rate': 1.998174717916319e-05, 'epoch': 0.04} {'loss': 1.0933, 'learning_rate': 1.9981727404296008e-05, 'epoch': 0.04} {'loss': 0.8529, 'learning_rate': 1.9981707618732504e-05, 'epoch': 0.04} {'loss': 0.916, 'learning_rate': 1.9981687822472698e-05, 'epoch': 0.04} {'loss': 0.8558, 'learning_rate': 1.9981668015516615e-05, 'epoch': 0.04} {'loss': 1.0786, 'learning_rate': 1.998164819786427e-05, 'epoch': 0.04} {'loss': 0.8268, 'learning_rate': 1.9981628369515692e-05, 'epoch': 0.04} {'loss': 1.0362, 'learning_rate': 1.9981608530470894e-05, 'epoch': 0.04} {'loss': 0.8858, 'learning_rate': 1.9981588680729906e-05, 'epoch': 0.04} {'loss': 1.008, 'learning_rate': 1.998156882029274e-05, 'epoch': 0.04} {'loss': 0.9359, 'learning_rate': 1.9981548949159428e-05, 'epoch': 0.04} {'loss': 0.9345, 'learning_rate': 1.9981529067329983e-05, 'epoch': 0.04} {'loss': 1.051, 'learning_rate': 1.9981509174804425e-05, 'epoch': 0.04} {'loss': 1.0888, 'learning_rate': 1.9981489271582783e-05, 'epoch': 0.04} {'loss': 1.0446, 'learning_rate': 1.9981469357665073e-05, 'epoch': 0.04} {'loss': 0.9479, 'learning_rate': 1.998144943305132e-05, 'epoch': 0.04} {'loss': 1.0636, 'learning_rate': 1.9981429497741538e-05, 'epoch': 0.04} {'loss': 0.8538, 'learning_rate': 1.9981409551735757e-05, 'epoch': 0.04} {'loss': 0.9661, 'learning_rate': 1.9981389595033996e-05, 'epoch': 0.04} {'loss': 1.1278, 'learning_rate': 1.9981369627636272e-05, 'epoch': 0.04} {'loss': 0.866, 'learning_rate': 1.9981349649542613e-05, 'epoch': 0.04} {'loss': 0.9693, 'learning_rate': 1.9981329660753035e-05, 'epoch': 0.05} {'loss': 1.0009, 'learning_rate': 1.998130966126756e-05, 'epoch': 0.05} {'loss': 0.9782, 'learning_rate': 1.9981289651086215e-05, 'epoch': 0.05} {'loss': 0.9366, 'learning_rate': 1.9981269630209013e-05, 'epoch': 0.05} {'loss': 0.9403, 'learning_rate': 1.998124959863598e-05, 'epoch': 0.05} {'loss': 0.9068, 'learning_rate': 1.9981229556367137e-05, 'epoch': 0.05} {'loss': 1.0583, 'learning_rate': 1.9981209503402508e-05, 'epoch': 0.05} {'loss': 0.8297, 'learning_rate': 1.9981189439742112e-05, 'epoch': 0.05} {'loss': 1.0764, 'learning_rate': 1.998116936538597e-05, 'epoch': 0.05} {'loss': 0.9005, 'learning_rate': 1.9981149280334104e-05, 'epoch': 0.05} {'loss': 1.0742, 'learning_rate': 1.9981129184586535e-05, 'epoch': 0.05} {'loss': 1.0032, 'learning_rate': 1.9981109078143288e-05, 'epoch': 0.05} {'loss': 0.8106, 'learning_rate': 1.998108896100438e-05, 'epoch': 0.05} {'loss': 0.9469, 'learning_rate': 1.9981068833169833e-05, 'epoch': 0.05} {'loss': 0.982, 'learning_rate': 1.998104869463967e-05, 'epoch': 0.05} {'loss': 0.9265, 'learning_rate': 1.9981028545413914e-05, 'epoch': 0.05} {'loss': 0.8055, 'learning_rate': 1.9981008385492588e-05, 'epoch': 0.05} {'loss': 1.0431, 'learning_rate': 1.9980988214875702e-05, 'epoch': 0.05} {'loss': 1.0481, 'learning_rate': 1.9980968033563294e-05, 'epoch': 0.05} {'loss': 1.0171, 'learning_rate': 1.9980947841555377e-05, 'epoch': 0.05} {'loss': 0.9585, 'learning_rate': 1.998092763885197e-05, 'epoch': 0.05} {'loss': 0.9598, 'learning_rate': 1.99809074254531e-05, 'epoch': 0.05} {'loss': 0.7616, 'learning_rate': 1.9980887201358788e-05, 'epoch': 0.05} {'loss': 1.0138, 'learning_rate': 1.9980866966569053e-05, 'epoch': 0.05} {'loss': 1.075, 'learning_rate': 1.9980846721083918e-05, 'epoch': 0.05} {'loss': 0.8036, 'learning_rate': 1.9980826464903406e-05, 'epoch': 0.05} {'loss': 0.9399, 'learning_rate': 1.9980806198027538e-05, 'epoch': 0.05} {'loss': 0.9256, 'learning_rate': 1.9980785920456337e-05, 'epoch': 0.05} {'loss': 1.068, 'learning_rate': 1.9980765632189818e-05, 'epoch': 0.05} {'loss': 0.8225, 'learning_rate': 1.998074533322801e-05, 'epoch': 0.05} {'loss': 1.1169, 'learning_rate': 1.9980725023570936e-05, 'epoch': 0.05} {'loss': 0.9853, 'learning_rate': 1.998070470321861e-05, 'epoch': 0.05} {'loss': 1.0454, 'learning_rate': 1.9980684372171057e-05, 'epoch': 0.05} {'loss': 0.8811, 'learning_rate': 1.9980664030428305e-05, 'epoch': 0.05} {'loss': 1.0358, 'learning_rate': 1.9980643677990366e-05, 'epoch': 0.05} {'loss': 0.9692, 'learning_rate': 1.998062331485727e-05, 'epoch': 0.05} {'loss': 0.8844, 'learning_rate': 1.9980602941029032e-05, 'epoch': 0.05} {'loss': 0.9867, 'learning_rate': 1.998058255650568e-05, 'epoch': 0.05} {'loss': 1.0356, 'learning_rate': 1.9980562161287232e-05, 'epoch': 0.05} {'loss': 0.87, 'learning_rate': 1.998054175537371e-05, 'epoch': 0.05} {'loss': 1.0129, 'learning_rate': 1.998052133876514e-05, 'epoch': 0.05} {'loss': 0.9296, 'learning_rate': 1.998050091146154e-05, 'epoch': 0.05} {'loss': 1.0916, 'learning_rate': 1.9980480473462925e-05, 'epoch': 0.05} {'loss': 1.1174, 'learning_rate': 1.9980460024769334e-05, 'epoch': 0.05} {'loss': 0.9008, 'learning_rate': 1.9980439565380773e-05, 'epoch': 0.05} {'loss': 0.9384, 'learning_rate': 1.9980419095297273e-05, 'epoch': 0.05} {'loss': 0.9955, 'learning_rate': 1.9980398614518853e-05, 'epoch': 0.05} {'loss': 1.1012, 'learning_rate': 1.9980378123045538e-05, 'epoch': 0.05} {'loss': 1.0437, 'learning_rate': 1.998035762087734e-05, 'epoch': 0.05} {'loss': 0.8595, 'learning_rate': 1.9980337108014292e-05, 'epoch': 0.05} {'loss': 0.7763, 'learning_rate': 1.9980316584456413e-05, 'epoch': 0.05} {'loss': 0.9069, 'learning_rate': 1.9980296050203722e-05, 'epoch': 0.05} {'loss': 0.9864, 'learning_rate': 1.9980275505256245e-05, 'epoch': 0.05} {'loss': 0.9587, 'learning_rate': 1.9980254949614e-05, 'epoch': 0.05} {'loss': 0.9874, 'learning_rate': 1.9980234383277013e-05, 'epoch': 0.05} {'loss': 0.9762, 'learning_rate': 1.9980213806245303e-05, 'epoch': 0.05} {'loss': 0.9566, 'learning_rate': 1.998019321851889e-05, 'epoch': 0.05} {'loss': 1.0815, 'learning_rate': 1.9980172620097803e-05, 'epoch': 0.05} {'loss': 1.0272, 'learning_rate': 1.998015201098206e-05, 'epoch': 0.05} {'loss': 0.9917, 'learning_rate': 1.9980131391171684e-05, 'epoch': 0.05} {'loss': 0.9479, 'learning_rate': 1.9980110760666696e-05, 'epoch': 0.05} {'loss': 1.085, 'learning_rate': 1.9980090119467117e-05, 'epoch': 0.05} {'loss': 0.992, 'learning_rate': 1.9980069467572972e-05, 'epoch': 0.05} {'loss': 0.925, 'learning_rate': 1.998004880498428e-05, 'epoch': 0.05} {'loss': 0.9496, 'learning_rate': 1.998002813170107e-05, 'epoch': 0.05} {'loss': 0.8399, 'learning_rate': 1.998000744772335e-05, 'epoch': 0.05} {'loss': 0.8754, 'learning_rate': 1.997998675305116e-05, 'epoch': 0.05} {'loss': 1.1429, 'learning_rate': 1.997996604768451e-05, 'epoch': 0.05} {'loss': 1.1243, 'learning_rate': 1.9979945331623426e-05, 'epoch': 0.05} {'loss': 1.0386, 'learning_rate': 1.997992460486793e-05, 'epoch': 0.05} {'loss': 0.9417, 'learning_rate': 1.9979903867418042e-05, 'epoch': 0.05} {'loss': 0.9789, 'learning_rate': 1.997988311927379e-05, 'epoch': 0.05} {'loss': 1.0875, 'learning_rate': 1.997986236043519e-05, 'epoch': 0.05} {'loss': 1.0148, 'learning_rate': 1.9979841590902266e-05, 'epoch': 0.05} {'loss': 0.9267, 'learning_rate': 1.9979820810675043e-05, 'epoch': 0.05} {'loss': 0.9721, 'learning_rate': 1.997980001975354e-05, 'epoch': 0.05} {'loss': 1.0326, 'learning_rate': 1.997977921813778e-05, 'epoch': 0.05} {'loss': 0.8717, 'learning_rate': 1.997975840582779e-05, 'epoch': 0.05} {'loss': 0.9949, 'learning_rate': 1.9979737582823583e-05, 'epoch': 0.05} {'loss': 0.9365, 'learning_rate': 1.997971674912519e-05, 'epoch': 0.05} {'loss': 1.1065, 'learning_rate': 1.997969590473263e-05, 'epoch': 0.05} {'loss': 0.9769, 'learning_rate': 1.9979675049645922e-05, 'epoch': 0.05} {'loss': 1.0941, 'learning_rate': 1.997965418386509e-05, 'epoch': 0.05} {'loss': 1.0547, 'learning_rate': 1.9979633307390162e-05, 'epoch': 0.05} {'loss': 0.91, 'learning_rate': 1.9979612420221153e-05, 'epoch': 0.05} {'loss': 0.878, 'learning_rate': 1.9979591522358093e-05, 'epoch': 0.05} {'loss': 0.8747, 'learning_rate': 1.9979570613800998e-05, 'epoch': 0.05} {'loss': 0.8741, 'learning_rate': 1.997954969454989e-05, 'epoch': 0.05} {'loss': 1.0354, 'learning_rate': 1.9979528764604797e-05, 'epoch': 0.05} {'loss': 1.0024, 'learning_rate': 1.9979507823965736e-05, 'epoch': 0.05} {'loss': 1.0151, 'learning_rate': 1.997948687263273e-05, 'epoch': 0.05} {'loss': 1.0929, 'learning_rate': 1.9979465910605807e-05, 'epoch': 0.05} {'loss': 0.7956, 'learning_rate': 1.9979444937884987e-05, 'epoch': 0.05} {'loss': 1.1687, 'learning_rate': 1.9979423954470288e-05, 'epoch': 0.05} {'loss': 0.8561, 'learning_rate': 1.9979402960361733e-05, 'epoch': 0.05} {'loss': 0.6937, 'learning_rate': 1.997938195555935e-05, 'epoch': 0.05} {'loss': 0.9158, 'learning_rate': 1.997936094006316e-05, 'epoch': 0.05} {'loss': 1.0904, 'learning_rate': 1.997933991387318e-05, 'epoch': 0.05} {'loss': 0.8523, 'learning_rate': 1.9979318876989443e-05, 'epoch': 0.05} {'loss': 0.8242, 'learning_rate': 1.997929782941196e-05, 'epoch': 0.05} {'loss': 0.8369, 'learning_rate': 1.9979276771140758e-05, 'epoch': 0.05} {'loss': 0.8862, 'learning_rate': 1.997925570217586e-05, 'epoch': 0.05} {'loss': 0.9302, 'learning_rate': 1.9979234622517293e-05, 'epoch': 0.05} {'loss': 0.9263, 'learning_rate': 1.9979213532165074e-05, 'epoch': 0.05} {'loss': 0.9718, 'learning_rate': 1.9979192431119226e-05, 'epoch': 0.05} {'loss': 0.9973, 'learning_rate': 1.9979171319379774e-05, 'epoch': 0.05} {'loss': 0.8525, 'learning_rate': 1.9979150196946737e-05, 'epoch': 0.05} {'loss': 0.9494, 'learning_rate': 1.997912906382014e-05, 'epoch': 0.05} {'loss': 0.7979, 'learning_rate': 1.9979107920000007e-05, 'epoch': 0.05} {'loss': 1.0853, 'learning_rate': 1.997908676548636e-05, 'epoch': 0.05} {'loss': 1.0188, 'learning_rate': 1.997906560027922e-05, 'epoch': 0.05} {'loss': 0.8114, 'learning_rate': 1.9979044424378607e-05, 'epoch': 0.05} {'loss': 1.0129, 'learning_rate': 1.9979023237784553e-05, 'epoch': 0.05} {'loss': 0.9316, 'learning_rate': 1.997900204049707e-05, 'epoch': 0.05} {'loss': 0.9193, 'learning_rate': 1.997898083251619e-05, 'epoch': 0.05} {'loss': 0.9746, 'learning_rate': 1.997895961384193e-05, 'epoch': 0.05} {'loss': 1.2245, 'learning_rate': 1.9978938384474313e-05, 'epoch': 0.05} {'loss': 1.02, 'learning_rate': 1.9978917144413364e-05, 'epoch': 0.05} {'loss': 0.8992, 'learning_rate': 1.99788958936591e-05, 'epoch': 0.05} {'loss': 0.9863, 'learning_rate': 1.9978874632211556e-05, 'epoch': 0.05} {'loss': 0.897, 'learning_rate': 1.9978853360070746e-05, 'epoch': 0.05} {'loss': 0.8722, 'learning_rate': 1.997883207723669e-05, 'epoch': 0.05} {'loss': 1.0979, 'learning_rate': 1.9978810783709415e-05, 'epoch': 0.05} {'loss': 0.9377, 'learning_rate': 1.9978789479488945e-05, 'epoch': 0.05} {'loss': 1.0414, 'learning_rate': 1.9978768164575298e-05, 'epoch': 0.05} {'loss': 0.9149, 'learning_rate': 1.9978746838968507e-05, 'epoch': 0.05} {'loss': 1.0296, 'learning_rate': 1.9978725502668586e-05, 'epoch': 0.05} {'loss': 0.9447, 'learning_rate': 1.997870415567556e-05, 'epoch': 0.05} {'loss': 0.8827, 'learning_rate': 1.9978682797989448e-05, 'epoch': 0.05} {'loss': 0.9763, 'learning_rate': 1.997866142961028e-05, 'epoch': 0.05} {'loss': 1.0952, 'learning_rate': 1.9978640050538073e-05, 'epoch': 0.05} {'loss': 0.9404, 'learning_rate': 1.9978618660772857e-05, 'epoch': 0.05} {'loss': 0.895, 'learning_rate': 1.997859726031465e-05, 'epoch': 0.05} {'loss': 0.8146, 'learning_rate': 1.997857584916347e-05, 'epoch': 0.05} {'loss': 0.8911, 'learning_rate': 1.9978554427319346e-05, 'epoch': 0.05} {'loss': 0.7323, 'learning_rate': 1.9978532994782306e-05, 'epoch': 0.05} {'loss': 0.9133, 'learning_rate': 1.9978511551552367e-05, 'epoch': 0.05} {'loss': 0.9974, 'learning_rate': 1.9978490097629547e-05, 'epoch': 0.05} {'loss': 1.0468, 'learning_rate': 1.997846863301388e-05, 'epoch': 0.05} {'loss': 0.9731, 'learning_rate': 1.997844715770538e-05, 'epoch': 0.05} {'loss': 0.9281, 'learning_rate': 1.9978425671704073e-05, 'epoch': 0.05} {'loss': 0.975, 'learning_rate': 1.997840417500998e-05, 'epoch': 0.05} {'loss': 0.9575, 'learning_rate': 1.997838266762313e-05, 'epoch': 0.05} {'loss': 0.9691, 'learning_rate': 1.997836114954354e-05, 'epoch': 0.05} {'loss': 0.9529, 'learning_rate': 1.9978339620771238e-05, 'epoch': 0.05} {'loss': 0.912, 'learning_rate': 1.9978318081306243e-05, 'epoch': 0.05} {'loss': 0.9104, 'learning_rate': 1.997829653114858e-05, 'epoch': 0.05} {'loss': 0.9702, 'learning_rate': 1.997827497029827e-05, 'epoch': 0.05} {'loss': 1.0375, 'learning_rate': 1.9978253398755342e-05, 'epoch': 0.05} {'loss': 1.0011, 'learning_rate': 1.997823181651981e-05, 'epoch': 0.05} {'loss': 1.1125, 'learning_rate': 1.9978210223591706e-05, 'epoch': 0.05} {'loss': 1.0706, 'learning_rate': 1.9978188619971046e-05, 'epoch': 0.05} {'loss': 0.7663, 'learning_rate': 1.997816700565786e-05, 'epoch': 0.05} {'loss': 1.0735, 'learning_rate': 1.9978145380652165e-05, 'epoch': 0.05} {'loss': 0.8273, 'learning_rate': 1.9978123744953985e-05, 'epoch': 0.05} {'loss': 1.1001, 'learning_rate': 1.9978102098563345e-05, 'epoch': 0.05} {'loss': 1.167, 'learning_rate': 1.9978080441480273e-05, 'epoch': 0.05} {'loss': 1.1582, 'learning_rate': 1.9978058773704783e-05, 'epoch': 0.05} {'loss': 0.8832, 'learning_rate': 1.9978037095236904e-05, 'epoch': 0.05} {'loss': 0.8816, 'learning_rate': 1.9978015406076657e-05, 'epoch': 0.05} {'loss': 0.9341, 'learning_rate': 1.9977993706224062e-05, 'epoch': 0.05} {'loss': 1.0354, 'learning_rate': 1.9977971995679154e-05, 'epoch': 0.05} {'loss': 0.895, 'learning_rate': 1.9977950274441945e-05, 'epoch': 0.05} {'loss': 0.9942, 'learning_rate': 1.997792854251246e-05, 'epoch': 0.05} {'loss': 0.9255, 'learning_rate': 1.9977906799890726e-05, 'epoch': 0.05} {'loss': 0.9667, 'learning_rate': 1.9977885046576762e-05, 'epoch': 0.05} {'loss': 1.1595, 'learning_rate': 1.9977863282570594e-05, 'epoch': 0.05} {'loss': 0.9217, 'learning_rate': 1.997784150787225e-05, 'epoch': 0.05} {'loss': 0.9748, 'learning_rate': 1.9977819722481745e-05, 'epoch': 0.05} {'loss': 0.8663, 'learning_rate': 1.9977797926399103e-05, 'epoch': 0.05} {'loss': 0.9256, 'learning_rate': 1.9977776119624354e-05, 'epoch': 0.05} {'loss': 1.0623, 'learning_rate': 1.9977754302157514e-05, 'epoch': 0.05} {'loss': 0.9609, 'learning_rate': 1.997773247399861e-05, 'epoch': 0.05} {'loss': 0.7068, 'learning_rate': 1.9977710635147667e-05, 'epoch': 0.05} {'loss': 1.089, 'learning_rate': 1.9977688785604706e-05, 'epoch': 0.05} {'loss': 0.9894, 'learning_rate': 1.997766692536975e-05, 'epoch': 0.05} {'loss': 0.894, 'learning_rate': 1.9977645054442822e-05, 'epoch': 0.05} {'loss': 1.0341, 'learning_rate': 1.997762317282395e-05, 'epoch': 0.05} {'loss': 0.9338, 'learning_rate': 1.9977601280513154e-05, 'epoch': 0.05} {'loss': 1.0636, 'learning_rate': 1.9977579377510454e-05, 'epoch': 0.05} {'loss': 1.2343, 'learning_rate': 1.997755746381588e-05, 'epoch': 0.05} {'loss': 0.8867, 'learning_rate': 1.9977535539429455e-05, 'epoch': 0.05} {'loss': 0.9796, 'learning_rate': 1.9977513604351196e-05, 'epoch': 0.05} {'loss': 0.9593, 'learning_rate': 1.9977491658581132e-05, 'epoch': 0.05} {'loss': 1.1005, 'learning_rate': 1.9977469702119286e-05, 'epoch': 0.05} {'loss': 1.1141, 'learning_rate': 1.997744773496568e-05, 'epoch': 0.05} {'loss': 0.9663, 'learning_rate': 1.997742575712034e-05, 'epoch': 0.05} {'loss': 0.9989, 'learning_rate': 1.9977403768583284e-05, 'epoch': 0.05} {'loss': 1.0369, 'learning_rate': 1.997738176935454e-05, 'epoch': 0.05} {'loss': 1.0304, 'learning_rate': 1.9977359759434135e-05, 'epoch': 0.05} {'loss': 1.0154, 'learning_rate': 1.9977337738822083e-05, 'epoch': 0.05} {'loss': 0.8371, 'learning_rate': 1.997731570751842e-05, 'epoch': 0.05} {'loss': 1.0048, 'learning_rate': 1.9977293665523155e-05, 'epoch': 0.05} {'loss': 0.9375, 'learning_rate': 1.9977271612836323e-05, 'epoch': 0.05} {'loss': 1.0003, 'learning_rate': 1.9977249549457943e-05, 'epoch': 0.05} {'loss': 0.7507, 'learning_rate': 1.9977227475388042e-05, 'epoch': 0.05} {'loss': 0.9254, 'learning_rate': 1.997720539062664e-05, 'epoch': 0.05} {'loss': 1.0915, 'learning_rate': 1.997718329517376e-05, 'epoch': 0.05} {'loss': 0.918, 'learning_rate': 1.997716118902943e-05, 'epoch': 0.05} {'loss': 0.8695, 'learning_rate': 1.997713907219367e-05, 'epoch': 0.05} {'loss': 0.8112, 'learning_rate': 1.9977116944666508e-05, 'epoch': 0.05} {'loss': 1.0851, 'learning_rate': 1.9977094806447962e-05, 'epoch': 0.05} {'loss': 1.0576, 'learning_rate': 1.997707265753806e-05, 'epoch': 0.05} {'loss': 1.0572, 'learning_rate': 1.997705049793682e-05, 'epoch': 0.05} {'loss': 1.0565, 'learning_rate': 1.9977028327644276e-05, 'epoch': 0.05} {'loss': 0.7513, 'learning_rate': 1.997700614666044e-05, 'epoch': 0.05} {'loss': 1.0855, 'learning_rate': 1.9976983954985344e-05, 'epoch': 0.05} {'loss': 0.9557, 'learning_rate': 1.997696175261901e-05, 'epoch': 0.05} {'loss': 0.9113, 'learning_rate': 1.9976939539561463e-05, 'epoch': 0.05} {'loss': 1.0011, 'learning_rate': 1.997691731581272e-05, 'epoch': 0.05} {'loss': 0.8344, 'learning_rate': 1.997689508137281e-05, 'epoch': 0.05} {'loss': 1.0766, 'learning_rate': 1.997687283624176e-05, 'epoch': 0.05} {'loss': 0.8341, 'learning_rate': 1.9976850580419588e-05, 'epoch': 0.05} {'loss': 0.9045, 'learning_rate': 1.997682831390632e-05, 'epoch': 0.05} {'loss': 0.8263, 'learning_rate': 1.997680603670198e-05, 'epoch': 0.05} {'loss': 1.0009, 'learning_rate': 1.997678374880659e-05, 'epoch': 0.05} {'loss': 0.9867, 'learning_rate': 1.9976761450220178e-05, 'epoch': 0.05} {'loss': 1.038, 'learning_rate': 1.9976739140942767e-05, 'epoch': 0.05} {'loss': 0.9571, 'learning_rate': 1.997671682097438e-05, 'epoch': 0.05} {'loss': 1.024, 'learning_rate': 1.997669449031504e-05, 'epoch': 0.05} {'loss': 0.9915, 'learning_rate': 1.997667214896477e-05, 'epoch': 0.05} {'loss': 1.0105, 'learning_rate': 1.997664979692359e-05, 'epoch': 0.05} {'loss': 0.9353, 'learning_rate': 1.997662743419154e-05, 'epoch': 0.05} {'loss': 1.0647, 'learning_rate': 1.9976605060768625e-05, 'epoch': 0.05} {'loss': 0.9435, 'learning_rate': 1.997658267665488e-05, 'epoch': 0.05} {'loss': 0.959, 'learning_rate': 1.9976560281850327e-05, 'epoch': 0.05} {'loss': 1.0995, 'learning_rate': 1.997653787635499e-05, 'epoch': 0.05} {'loss': 1.0306, 'learning_rate': 1.997651546016889e-05, 'epoch': 0.05} {'loss': 0.9196, 'learning_rate': 1.9976493033292056e-05, 'epoch': 0.05} {'loss': 1.0573, 'learning_rate': 1.9976470595724505e-05, 'epoch': 0.05} {'loss': 0.8858, 'learning_rate': 1.997644814746627e-05, 'epoch': 0.05} {'loss': 0.7952, 'learning_rate': 1.9976425688517368e-05, 'epoch': 0.05} {'loss': 1.0599, 'learning_rate': 1.9976403218877825e-05, 'epoch': 0.05} {'loss': 0.7886, 'learning_rate': 1.9976380738547667e-05, 'epoch': 0.05} {'loss': 0.7099, 'learning_rate': 1.9976358247526916e-05, 'epoch': 0.05} {'loss': 0.8826, 'learning_rate': 1.9976335745815596e-05, 'epoch': 0.05} {'loss': 0.9059, 'learning_rate': 1.997631323341373e-05, 'epoch': 0.05} {'loss': 1.0373, 'learning_rate': 1.9976290710321348e-05, 'epoch': 0.05} {'loss': 0.8507, 'learning_rate': 1.9976268176538468e-05, 'epoch': 0.05} {'loss': 0.7824, 'learning_rate': 1.997624563206512e-05, 'epoch': 0.05} {'loss': 0.9201, 'learning_rate': 1.9976223076901318e-05, 'epoch': 0.05} {'loss': 1.056, 'learning_rate': 1.9976200511047093e-05, 'epoch': 0.05} {'loss': 1.1255, 'learning_rate': 1.9976177934502473e-05, 'epoch': 0.05} {'loss': 1.0442, 'learning_rate': 1.9976155347267476e-05, 'epoch': 0.05} {'loss': 0.9618, 'learning_rate': 1.997613274934213e-05, 'epoch': 0.05} {'loss': 1.0412, 'learning_rate': 1.9976110140726454e-05, 'epoch': 0.05} {'loss': 0.7778, 'learning_rate': 1.997608752142048e-05, 'epoch': 0.05} {'loss': 1.0483, 'learning_rate': 1.9976064891424224e-05, 'epoch': 0.05} {'loss': 1.0098, 'learning_rate': 1.9976042250737715e-05, 'epoch': 0.05} {'loss': 0.8636, 'learning_rate': 1.9976019599360976e-05, 'epoch': 0.05} {'loss': 1.0598, 'learning_rate': 1.997599693729403e-05, 'epoch': 0.05} {'loss': 1.0034, 'learning_rate': 1.9975974264536906e-05, 'epoch': 0.05} {'loss': 1.0267, 'learning_rate': 1.9975951581089626e-05, 'epoch': 0.05} {'loss': 1.0836, 'learning_rate': 1.997592888695221e-05, 'epoch': 0.05} {'loss': 1.1275, 'learning_rate': 1.997590618212469e-05, 'epoch': 0.05} {'loss': 0.9377, 'learning_rate': 1.9975883466607082e-05, 'epoch': 0.05} {'loss': 0.8819, 'learning_rate': 1.9975860740399414e-05, 'epoch': 0.05} {'loss': 1.0088, 'learning_rate': 1.997583800350172e-05, 'epoch': 0.05} {'loss': 0.948, 'learning_rate': 1.9975815255914004e-05, 'epoch': 0.05} {'loss': 0.9008, 'learning_rate': 1.9975792497636306e-05, 'epoch': 0.05} {'loss': 1.1945, 'learning_rate': 1.9975769728668646e-05, 'epoch': 0.05} {'loss': 0.906, 'learning_rate': 1.9975746949011047e-05, 'epoch': 0.05} {'loss': 1.0041, 'learning_rate': 1.9975724158663537e-05, 'epoch': 0.05} {'loss': 0.9743, 'learning_rate': 1.997570135762614e-05, 'epoch': 0.05} {'loss': 1.0203, 'learning_rate': 1.9975678545898873e-05, 'epoch': 0.05} {'loss': 0.8873, 'learning_rate': 1.997565572348177e-05, 'epoch': 0.05} {'loss': 0.9291, 'learning_rate': 1.9975632890374847e-05, 'epoch': 0.05} {'loss': 0.7936, 'learning_rate': 1.9975610046578138e-05, 'epoch': 0.05} {'loss': 0.9223, 'learning_rate': 1.997558719209166e-05, 'epoch': 0.05} {'loss': 0.8208, 'learning_rate': 1.997556432691544e-05, 'epoch': 0.05} {'loss': 1.164, 'learning_rate': 1.9975541451049504e-05, 'epoch': 0.05} {'loss': 0.8592, 'learning_rate': 1.9975518564493877e-05, 'epoch': 0.05} {'loss': 0.9608, 'learning_rate': 1.9975495667248576e-05, 'epoch': 0.05} {'loss': 0.7889, 'learning_rate': 1.9975472759313635e-05, 'epoch': 0.05} {'loss': 1.088, 'learning_rate': 1.9975449840689073e-05, 'epoch': 0.05} {'loss': 0.8558, 'learning_rate': 1.9975426911374915e-05, 'epoch': 0.05} {'loss': 0.9643, 'learning_rate': 1.997540397137119e-05, 'epoch': 0.05} {'loss': 1.0253, 'learning_rate': 1.9975381020677917e-05, 'epoch': 0.05} {'loss': 1.0056, 'learning_rate': 1.9975358059295122e-05, 'epoch': 0.05} {'loss': 0.9407, 'learning_rate': 1.9975335087222832e-05, 'epoch': 0.05} {'loss': 0.8596, 'learning_rate': 1.9975312104461075e-05, 'epoch': 0.05} {'loss': 1.2066, 'learning_rate': 1.9975289111009863e-05, 'epoch': 0.05} {'loss': 1.0544, 'learning_rate': 1.997526610686923e-05, 'epoch': 0.05} {'loss': 1.1604, 'learning_rate': 1.9975243092039202e-05, 'epoch': 0.05} {'loss': 1.0345, 'learning_rate': 1.9975220066519797e-05, 'epoch': 0.05} {'loss': 1.0903, 'learning_rate': 1.9975197030311047e-05, 'epoch': 0.05} {'loss': 0.8519, 'learning_rate': 1.997517398341297e-05, 'epoch': 0.05} {'loss': 1.0108, 'learning_rate': 1.9975150925825593e-05, 'epoch': 0.05} {'loss': 0.9177, 'learning_rate': 1.9975127857548944e-05, 'epoch': 0.05} {'loss': 0.9009, 'learning_rate': 1.9975104778583048e-05, 'epoch': 0.05} {'loss': 0.9105, 'learning_rate': 1.9975081688927925e-05, 'epoch': 0.05} {'loss': 1.0071, 'learning_rate': 1.99750585885836e-05, 'epoch': 0.05} {'loss': 1.1032, 'learning_rate': 1.99750354775501e-05, 'epoch': 0.05} {'loss': 0.7302, 'learning_rate': 1.997501235582745e-05, 'epoch': 0.05} {'loss': 1.0052, 'learning_rate': 1.997498922341567e-05, 'epoch': 0.05} {'loss': 0.7586, 'learning_rate': 1.997496608031479e-05, 'epoch': 0.05} {'loss': 0.9237, 'learning_rate': 1.9974942926524837e-05, 'epoch': 0.05} {'loss': 0.8596, 'learning_rate': 1.997491976204583e-05, 'epoch': 0.05} {'loss': 0.8475, 'learning_rate': 1.99748965868778e-05, 'epoch': 0.05} {'loss': 0.9641, 'learning_rate': 1.9974873401020766e-05, 'epoch': 0.05} {'loss': 0.8356, 'learning_rate': 1.997485020447475e-05, 'epoch': 0.05} {'loss': 0.8, 'learning_rate': 1.997482699723979e-05, 'epoch': 0.05} {'loss': 0.8941, 'learning_rate': 1.9974803779315894e-05, 'epoch': 0.05} {'loss': 1.0287, 'learning_rate': 1.9974780550703098e-05, 'epoch': 0.05} {'loss': 1.1467, 'learning_rate': 1.997475731140143e-05, 'epoch': 0.05} {'loss': 1.0106, 'learning_rate': 1.9974734061410902e-05, 'epoch': 0.05} {'loss': 0.9704, 'learning_rate': 1.997471080073155e-05, 'epoch': 0.05} {'loss': 1.0415, 'learning_rate': 1.9974687529363396e-05, 'epoch': 0.05} {'loss': 0.9013, 'learning_rate': 1.997466424730646e-05, 'epoch': 0.05} {'loss': 0.9249, 'learning_rate': 1.9974640954560774e-05, 'epoch': 0.05} {'loss': 0.8898, 'learning_rate': 1.997461765112636e-05, 'epoch': 0.05} {'loss': 1.0273, 'learning_rate': 1.9974594337003243e-05, 'epoch': 0.05} {'loss': 1.0764, 'learning_rate': 1.9974571012191448e-05, 'epoch': 0.05} {'loss': 1.0619, 'learning_rate': 1.9974547676690998e-05, 'epoch': 0.05} {'loss': 0.9494, 'learning_rate': 1.997452433050192e-05, 'epoch': 0.05} {'loss': 0.9712, 'learning_rate': 1.9974500973624244e-05, 'epoch': 0.05} {'loss': 0.986, 'learning_rate': 1.9974477606057983e-05, 'epoch': 0.05} {'loss': 0.9849, 'learning_rate': 1.997445422780317e-05, 'epoch': 0.05} {'loss': 1.0574, 'learning_rate': 1.9974430838859833e-05, 'epoch': 0.05} {'loss': 0.8129, 'learning_rate': 1.9974407439227992e-05, 'epoch': 0.05} {'loss': 0.9242, 'learning_rate': 1.9974384028907672e-05, 'epoch': 0.05} {'loss': 1.0137, 'learning_rate': 1.9974360607898897e-05, 'epoch': 0.05} {'loss': 0.9729, 'learning_rate': 1.99743371762017e-05, 'epoch': 0.05} {'loss': 1.0094, 'learning_rate': 1.9974313733816096e-05, 'epoch': 0.05} {'loss': 0.9229, 'learning_rate': 1.9974290280742113e-05, 'epoch': 0.05} {'loss': 0.9, 'learning_rate': 1.9974266816979784e-05, 'epoch': 0.05} {'loss': 0.9772, 'learning_rate': 1.9974243342529123e-05, 'epoch': 0.05} {'loss': 0.9136, 'learning_rate': 1.9974219857390162e-05, 'epoch': 0.05} {'loss': 0.8985, 'learning_rate': 1.9974196361562924e-05, 'epoch': 0.05} {'loss': 0.9592, 'learning_rate': 1.9974172855047437e-05, 'epoch': 0.05} {'loss': 1.1176, 'learning_rate': 1.997414933784372e-05, 'epoch': 0.05} {'loss': 1.1419, 'learning_rate': 1.99741258099518e-05, 'epoch': 0.05} {'loss': 0.9009, 'learning_rate': 1.9974102271371705e-05, 'epoch': 0.05} {'loss': 0.9797, 'learning_rate': 1.9974078722103464e-05, 'epoch': 0.05} {'loss': 1.1192, 'learning_rate': 1.9974055162147096e-05, 'epoch': 0.05} {'loss': 0.8761, 'learning_rate': 1.9974031591502623e-05, 'epoch': 0.05} {'loss': 1.0728, 'learning_rate': 1.9974008010170078e-05, 'epoch': 0.05} {'loss': 1.0843, 'learning_rate': 1.9973984418149485e-05, 'epoch': 0.05} {'loss': 1.108, 'learning_rate': 1.9973960815440864e-05, 'epoch': 0.05} {'loss': 0.9799, 'learning_rate': 1.9973937202044246e-05, 'epoch': 0.05} {'loss': 0.9137, 'learning_rate': 1.997391357795965e-05, 'epoch': 0.05} {'loss': 1.0429, 'learning_rate': 1.997388994318711e-05, 'epoch': 0.05} {'loss': 1.0483, 'learning_rate': 1.9973866297726645e-05, 'epoch': 0.05} {'loss': 0.8992, 'learning_rate': 1.9973842641578282e-05, 'epoch': 0.05} {'loss': 1.0382, 'learning_rate': 1.9973818974742047e-05, 'epoch': 0.05} {'loss': 0.9153, 'learning_rate': 1.9973795297217964e-05, 'epoch': 0.05} {'loss': 0.886, 'learning_rate': 1.997377160900606e-05, 'epoch': 0.05} {'loss': 1.0265, 'learning_rate': 1.997374791010636e-05, 'epoch': 0.05} {'loss': 1.1669, 'learning_rate': 1.997372420051889e-05, 'epoch': 0.05} {'loss': 0.9101, 'learning_rate': 1.997370048024367e-05, 'epoch': 0.05} {'loss': 1.0188, 'learning_rate': 1.9973676749280733e-05, 'epoch': 0.05} {'loss': 0.897, 'learning_rate': 1.99736530076301e-05, 'epoch': 0.05} {'loss': 0.9561, 'learning_rate': 1.99736292552918e-05, 'epoch': 0.05} {'loss': 0.806, 'learning_rate': 1.9973605492265854e-05, 'epoch': 0.05} {'loss': 0.8677, 'learning_rate': 1.997358171855229e-05, 'epoch': 0.05} {'loss': 0.947, 'learning_rate': 1.997355793415113e-05, 'epoch': 0.05} {'loss': 1.0536, 'learning_rate': 1.9973534139062407e-05, 'epoch': 0.05} {'loss': 0.8817, 'learning_rate': 1.9973510333286138e-05, 'epoch': 0.05} {'loss': 0.9105, 'learning_rate': 1.9973486516822356e-05, 'epoch': 0.05} {'loss': 1.0592, 'learning_rate': 1.9973462689671082e-05, 'epoch': 0.05} {'loss': 0.9952, 'learning_rate': 1.9973438851832342e-05, 'epoch': 0.05} {'loss': 0.964, 'learning_rate': 1.997341500330616e-05, 'epoch': 0.05} {'loss': 0.8683, 'learning_rate': 1.9973391144092572e-05, 'epoch': 0.05} {'loss': 0.8699, 'learning_rate': 1.9973367274191586e-05, 'epoch': 0.05} {'loss': 0.9969, 'learning_rate': 1.9973343393603242e-05, 'epoch': 0.05} {'loss': 0.7825, 'learning_rate': 1.9973319502327556e-05, 'epoch': 0.05} {'loss': 0.9993, 'learning_rate': 1.9973295600364563e-05, 'epoch': 0.05} {'loss': 1.0071, 'learning_rate': 1.997327168771428e-05, 'epoch': 0.05} {'loss': 0.985, 'learning_rate': 1.9973247764376737e-05, 'epoch': 0.05} {'loss': 1.0195, 'learning_rate': 1.997322383035196e-05, 'epoch': 0.05} {'loss': 0.9888, 'learning_rate': 1.9973199885639975e-05, 'epoch': 0.05} {'loss': 1.0302, 'learning_rate': 1.9973175930240804e-05, 'epoch': 0.05} {'loss': 1.0745, 'learning_rate': 1.9973151964154473e-05, 'epoch': 0.05} {'loss': 0.9601, 'learning_rate': 1.9973127987381012e-05, 'epoch': 0.05} {'loss': 0.9396, 'learning_rate': 1.997310399992044e-05, 'epoch': 0.05} {'loss': 0.8915, 'learning_rate': 1.9973080001772795e-05, 'epoch': 0.05} {'loss': 0.9279, 'learning_rate': 1.997305599293809e-05, 'epoch': 0.05} {'loss': 0.8631, 'learning_rate': 1.9973031973416356e-05, 'epoch': 0.05} {'loss': 0.8819, 'learning_rate': 1.997300794320762e-05, 'epoch': 0.05} {'loss': 0.957, 'learning_rate': 1.99729839023119e-05, 'epoch': 0.05} {'loss': 1.0281, 'learning_rate': 1.997295985072923e-05, 'epoch': 0.05} {'loss': 0.9549, 'learning_rate': 1.997293578845964e-05, 'epoch': 0.05} {'loss': 1.0457, 'learning_rate': 1.997291171550314e-05, 'epoch': 0.05} {'loss': 1.0006, 'learning_rate': 1.997288763185977e-05, 'epoch': 0.05} {'loss': 0.8338, 'learning_rate': 1.997286353752955e-05, 'epoch': 0.05} {'loss': 0.8531, 'learning_rate': 1.9972839432512505e-05, 'epoch': 0.05} {'loss': 0.9631, 'learning_rate': 1.9972815316808663e-05, 'epoch': 0.05} {'loss': 0.9575, 'learning_rate': 1.997279119041805e-05, 'epoch': 0.05} {'loss': 0.9375, 'learning_rate': 1.9972767053340693e-05, 'epoch': 0.05} {'loss': 1.0941, 'learning_rate': 1.9972742905576613e-05, 'epoch': 0.05} {'loss': 0.7659, 'learning_rate': 1.997271874712584e-05, 'epoch': 0.05} {'loss': 0.8351, 'learning_rate': 1.9972694577988398e-05, 'epoch': 0.05} {'loss': 0.9921, 'learning_rate': 1.9972670398164314e-05, 'epoch': 0.05} {'loss': 0.9613, 'learning_rate': 1.9972646207653615e-05, 'epoch': 0.05} {'loss': 1.0532, 'learning_rate': 1.9972622006456325e-05, 'epoch': 0.05} {'loss': 0.9554, 'learning_rate': 1.997259779457247e-05, 'epoch': 0.05} {'loss': 0.8648, 'learning_rate': 1.9972573572002076e-05, 'epoch': 0.05} {'loss': 0.9016, 'learning_rate': 1.997254933874517e-05, 'epoch': 0.05} {'loss': 0.9091, 'learning_rate': 1.9972525094801778e-05, 'epoch': 0.05} {'loss': 0.8221, 'learning_rate': 1.9972500840171922e-05, 'epoch': 0.05} {'loss': 1.1579, 'learning_rate': 1.9972476574855633e-05, 'epoch': 0.05} {'loss': 1.0531, 'learning_rate': 1.9972452298852937e-05, 'epoch': 0.05} {'loss': 1.089, 'learning_rate': 1.997242801216386e-05, 'epoch': 0.05} {'loss': 0.9372, 'learning_rate': 1.997240371478842e-05, 'epoch': 0.05} {'loss': 0.9367, 'learning_rate': 1.9972379406726656e-05, 'epoch': 0.05} {'loss': 1.0153, 'learning_rate': 1.997235508797858e-05, 'epoch': 0.05} {'loss': 0.9645, 'learning_rate': 1.9972330758544232e-05, 'epoch': 0.05} {'loss': 1.0175, 'learning_rate': 1.9972306418423632e-05, 'epoch': 0.05} {'loss': 1.0275, 'learning_rate': 1.99722820676168e-05, 'epoch': 0.05} {'loss': 0.841, 'learning_rate': 1.997225770612377e-05, 'epoch': 0.05} {'loss': 0.898, 'learning_rate': 1.9972233333944568e-05, 'epoch': 0.05} {'loss': 0.9341, 'learning_rate': 1.9972208951079215e-05, 'epoch': 0.05} {'loss': 0.9597, 'learning_rate': 1.997218455752774e-05, 'epoch': 0.05} {'loss': 0.8481, 'learning_rate': 1.9972160153290174e-05, 'epoch': 0.05} {'loss': 0.9849, 'learning_rate': 1.9972135738366535e-05, 'epoch': 0.05} {'loss': 0.9122, 'learning_rate': 1.997211131275685e-05, 'epoch': 0.05} {'loss': 0.8759, 'learning_rate': 1.997208687646115e-05, 'epoch': 0.05} {'loss': 0.9745, 'learning_rate': 1.997206242947946e-05, 'epoch': 0.05} {'loss': 0.9782, 'learning_rate': 1.9972037971811802e-05, 'epoch': 0.05} {'loss': 1.003, 'learning_rate': 1.997201350345821e-05, 'epoch': 0.05} {'loss': 0.9199, 'learning_rate': 1.99719890244187e-05, 'epoch': 0.05} {'loss': 1.0912, 'learning_rate': 1.9971964534693308e-05, 'epoch': 0.05} {'loss': 1.0285, 'learning_rate': 1.9971940034282053e-05, 'epoch': 0.05} {'loss': 1.0457, 'learning_rate': 1.997191552318497e-05, 'epoch': 0.05} {'loss': 0.9416, 'learning_rate': 1.9971891001402073e-05, 'epoch': 0.05} {'loss': 0.954, 'learning_rate': 1.9971866468933396e-05, 'epoch': 0.05} {'loss': 0.9725, 'learning_rate': 1.9971841925778964e-05, 'epoch': 0.05} {'loss': 0.9554, 'learning_rate': 1.9971817371938805e-05, 'epoch': 0.05} {'loss': 0.9984, 'learning_rate': 1.9971792807412943e-05, 'epoch': 0.05} {'loss': 0.9758, 'learning_rate': 1.9971768232201407e-05, 'epoch': 0.05} {'loss': 0.8433, 'learning_rate': 1.997174364630422e-05, 'epoch': 0.05} {'loss': 1.0353, 'learning_rate': 1.997171904972141e-05, 'epoch': 0.05} {'loss': 1.1183, 'learning_rate': 1.9971694442453e-05, 'epoch': 0.05} {'loss': 1.0437, 'learning_rate': 1.997166982449902e-05, 'epoch': 0.05} {'loss': 0.9337, 'learning_rate': 1.99716451958595e-05, 'epoch': 0.05} {'loss': 0.8743, 'learning_rate': 1.9971620556534458e-05, 'epoch': 0.05} {'loss': 0.8659, 'learning_rate': 1.9971595906523927e-05, 'epoch': 0.05} {'loss': 1.0212, 'learning_rate': 1.997157124582793e-05, 'epoch': 0.05} {'loss': 1.1227, 'learning_rate': 1.9971546574446496e-05, 'epoch': 0.05} {'loss': 1.0516, 'learning_rate': 1.9971521892379646e-05, 'epoch': 0.05} {'loss': 0.803, 'learning_rate': 1.9971497199627416e-05, 'epoch': 0.05} {'loss': 1.0258, 'learning_rate': 1.997147249618982e-05, 'epoch': 0.05} {'loss': 0.9682, 'learning_rate': 1.9971447782066894e-05, 'epoch': 0.05} {'loss': 0.8691, 'learning_rate': 1.9971423057258664e-05, 'epoch': 0.05} {'loss': 0.8298, 'learning_rate': 1.997139832176515e-05, 'epoch': 0.05} {'loss': 0.9072, 'learning_rate': 1.997137357558639e-05, 'epoch': 0.05} {'loss': 0.8256, 'learning_rate': 1.9971348818722397e-05, 'epoch': 0.05} {'loss': 1.2026, 'learning_rate': 1.9971324051173203e-05, 'epoch': 0.05} {'loss': 1.0279, 'learning_rate': 1.9971299272938837e-05, 'epoch': 0.05} {'loss': 0.8917, 'learning_rate': 1.9971274484019324e-05, 'epoch': 0.05} {'loss': 1.0083, 'learning_rate': 1.9971249684414693e-05, 'epoch': 0.05} {'loss': 0.8316, 'learning_rate': 1.997122487412497e-05, 'epoch': 0.05} {'loss': 0.8793, 'learning_rate': 1.9971200053150172e-05, 'epoch': 0.05} {'loss': 0.9376, 'learning_rate': 1.9971175221490338e-05, 'epoch': 0.05} {'loss': 0.9678, 'learning_rate': 1.997115037914549e-05, 'epoch': 0.05} {'loss': 0.8641, 'learning_rate': 1.997112552611565e-05, 'epoch': 0.05} {'loss': 0.8865, 'learning_rate': 1.9971100662400852e-05, 'epoch': 0.05} {'loss': 0.7797, 'learning_rate': 1.9971075788001118e-05, 'epoch': 0.05} {'loss': 0.9736, 'learning_rate': 1.997105090291648e-05, 'epoch': 0.05} {'loss': 0.803, 'learning_rate': 1.997102600714696e-05, 'epoch': 0.05} {'loss': 0.9876, 'learning_rate': 1.9971001100692585e-05, 'epoch': 0.05} {'loss': 0.8893, 'learning_rate': 1.997097618355338e-05, 'epoch': 0.05} {'loss': 1.1694, 'learning_rate': 1.997095125572938e-05, 'epoch': 0.05} {'loss': 0.8866, 'learning_rate': 1.99709263172206e-05, 'epoch': 0.05} {'loss': 0.973, 'learning_rate': 1.9970901368027072e-05, 'epoch': 0.05} {'loss': 0.9985, 'learning_rate': 1.9970876408148826e-05, 'epoch': 0.05} {'loss': 1.0004, 'learning_rate': 1.997085143758589e-05, 'epoch': 0.05} {'loss': 0.8191, 'learning_rate': 1.9970826456338282e-05, 'epoch': 0.05} {'loss': 0.9405, 'learning_rate': 1.997080146440603e-05, 'epoch': 0.05} {'loss': 0.9268, 'learning_rate': 1.9970776461789172e-05, 'epoch': 0.05} {'loss': 0.7546, 'learning_rate': 1.997075144848772e-05, 'epoch': 0.05} {'loss': 0.9791, 'learning_rate': 1.997072642450171e-05, 'epoch': 0.05} {'loss': 1.0499, 'learning_rate': 1.997070138983117e-05, 'epoch': 0.05} {'loss': 0.8662, 'learning_rate': 1.9970676344476122e-05, 'epoch': 0.05} {'loss': 0.9116, 'learning_rate': 1.9970651288436597e-05, 'epoch': 0.05} {'loss': 0.89, 'learning_rate': 1.9970626221712615e-05, 'epoch': 0.05} {'loss': 0.8706, 'learning_rate': 1.9970601144304207e-05, 'epoch': 0.05} {'loss': 0.9049, 'learning_rate': 1.9970576056211403e-05, 'epoch': 0.05} {'loss': 0.9538, 'learning_rate': 1.9970550957434224e-05, 'epoch': 0.05} {'loss': 0.8779, 'learning_rate': 1.9970525847972703e-05, 'epoch': 0.05} {'loss': 0.9679, 'learning_rate': 1.997050072782686e-05, 'epoch': 0.05} {'loss': 1.1708, 'learning_rate': 1.997047559699673e-05, 'epoch': 0.06} {'loss': 0.9784, 'learning_rate': 1.997045045548233e-05, 'epoch': 0.06} {'loss': 0.9762, 'learning_rate': 1.9970425303283694e-05, 'epoch': 0.06} {'loss': 1.0105, 'learning_rate': 1.997040014040085e-05, 'epoch': 0.06} {'loss': 1.0646, 'learning_rate': 1.9970374966833818e-05, 'epoch': 0.06} {'loss': 1.0375, 'learning_rate': 1.9970349782582635e-05, 'epoch': 0.06} {'loss': 0.9665, 'learning_rate': 1.997032458764732e-05, 'epoch': 0.06} {'loss': 0.9992, 'learning_rate': 1.9970299382027904e-05, 'epoch': 0.06} {'loss': 0.7758, 'learning_rate': 1.9970274165724408e-05, 'epoch': 0.06} {'loss': 0.8982, 'learning_rate': 1.9970248938736866e-05, 'epoch': 0.06} {'loss': 1.056, 'learning_rate': 1.99702237010653e-05, 'epoch': 0.06} {'loss': 0.9028, 'learning_rate': 1.997019845270974e-05, 'epoch': 0.06} {'loss': 0.8305, 'learning_rate': 1.9970173193670214e-05, 'epoch': 0.06} {'loss': 0.8007, 'learning_rate': 1.997014792394675e-05, 'epoch': 0.06} {'loss': 1.023, 'learning_rate': 1.997012264353937e-05, 'epoch': 0.06} {'loss': 0.9932, 'learning_rate': 1.9970097352448104e-05, 'epoch': 0.06} {'loss': 1.0377, 'learning_rate': 1.997007205067298e-05, 'epoch': 0.06} {'loss': 0.9293, 'learning_rate': 1.997004673821402e-05, 'epoch': 0.06} {'loss': 0.9454, 'learning_rate': 1.9970021415071258e-05, 'epoch': 0.06} {'loss': 0.8617, 'learning_rate': 1.996999608124472e-05, 'epoch': 0.06} {'loss': 1.0328, 'learning_rate': 1.996997073673443e-05, 'epoch': 0.06} {'loss': 0.894, 'learning_rate': 1.9969945381540414e-05, 'epoch': 0.06} {'loss': 0.9241, 'learning_rate': 1.99699200156627e-05, 'epoch': 0.06} {'loss': 0.9832, 'learning_rate': 1.9969894639101324e-05, 'epoch': 0.06} {'loss': 1.0181, 'learning_rate': 1.99698692518563e-05, 'epoch': 0.06} {'loss': 0.9855, 'learning_rate': 1.9969843853927667e-05, 'epoch': 0.06} {'loss': 1.0539, 'learning_rate': 1.996981844531544e-05, 'epoch': 0.06} {'loss': 0.8904, 'learning_rate': 1.9969793026019657e-05, 'epoch': 0.06} {'loss': 1.0879, 'learning_rate': 1.996976759604034e-05, 'epoch': 0.06} {'loss': 1.0392, 'learning_rate': 1.9969742155377516e-05, 'epoch': 0.06} {'loss': 0.9901, 'learning_rate': 1.9969716704031214e-05, 'epoch': 0.06} {'loss': 0.8107, 'learning_rate': 1.9969691242001462e-05, 'epoch': 0.06} {'loss': 1.0437, 'learning_rate': 1.9969665769288283e-05, 'epoch': 0.06} {'loss': 0.767, 'learning_rate': 1.996964028589171e-05, 'epoch': 0.06} {'loss': 1.0877, 'learning_rate': 1.996961479181177e-05, 'epoch': 0.06} {'loss': 1.0847, 'learning_rate': 1.9969589287048484e-05, 'epoch': 0.06} {'loss': 1.2628, 'learning_rate': 1.9969563771601887e-05, 'epoch': 0.06} {'loss': 0.9184, 'learning_rate': 1.9969538245471994e-05, 'epoch': 0.06} {'loss': 0.8815, 'learning_rate': 1.9969512708658852e-05, 'epoch': 0.06} {'loss': 1.0628, 'learning_rate': 1.9969487161162472e-05, 'epoch': 0.06} {'loss': 0.9809, 'learning_rate': 1.9969461602982886e-05, 'epoch': 0.06} {'loss': 0.826, 'learning_rate': 1.996943603412012e-05, 'epoch': 0.06} {'loss': 1.0197, 'learning_rate': 1.9969410454574207e-05, 'epoch': 0.06} {'loss': 0.9564, 'learning_rate': 1.996938486434517e-05, 'epoch': 0.06} {'loss': 0.8799, 'learning_rate': 1.996935926343304e-05, 'epoch': 0.06} {'loss': 0.8847, 'learning_rate': 1.996933365183784e-05, 'epoch': 0.06} {'loss': 0.9286, 'learning_rate': 1.9969308029559597e-05, 'epoch': 0.06} {'loss': 1.187, 'learning_rate': 1.9969282396598345e-05, 'epoch': 0.06} {'loss': 0.8979, 'learning_rate': 1.9969256752954104e-05, 'epoch': 0.06} {'loss': 0.8613, 'learning_rate': 1.9969231098626904e-05, 'epoch': 0.06} {'loss': 0.8695, 'learning_rate': 1.9969205433616775e-05, 'epoch': 0.06} {'loss': 1.0318, 'learning_rate': 1.996917975792374e-05, 'epoch': 0.06} {'loss': 0.9312, 'learning_rate': 1.996915407154783e-05, 'epoch': 0.06} {'loss': 0.8508, 'learning_rate': 1.9969128374489073e-05, 'epoch': 0.06} {'loss': 0.9515, 'learning_rate': 1.9969102666747494e-05, 'epoch': 0.06} {'loss': 0.9419, 'learning_rate': 1.9969076948323125e-05, 'epoch': 0.06} {'loss': 0.8341, 'learning_rate': 1.9969051219215987e-05, 'epoch': 0.06} {'loss': 1.0804, 'learning_rate': 1.996902547942611e-05, 'epoch': 0.06} {'loss': 0.8703, 'learning_rate': 1.9968999728953524e-05, 'epoch': 0.06} {'loss': 0.8649, 'learning_rate': 1.9968973967798254e-05, 'epoch': 0.06} {'loss': 0.9731, 'learning_rate': 1.9968948195960333e-05, 'epoch': 0.06} {'loss': 1.158, 'learning_rate': 1.9968922413439778e-05, 'epoch': 0.06} {'loss': 0.8752, 'learning_rate': 1.9968896620236627e-05, 'epoch': 0.06} {'loss': 1.0816, 'learning_rate': 1.9968870816350902e-05, 'epoch': 0.06} {'loss': 0.8878, 'learning_rate': 1.9968845001782632e-05, 'epoch': 0.06} {'loss': 1.0362, 'learning_rate': 1.9968819176531847e-05, 'epoch': 0.06} {'loss': 0.8847, 'learning_rate': 1.996879334059857e-05, 'epoch': 0.06} {'loss': 1.0351, 'learning_rate': 1.9968767493982833e-05, 'epoch': 0.06} {'loss': 0.8845, 'learning_rate': 1.996874163668466e-05, 'epoch': 0.06} {'loss': 0.8032, 'learning_rate': 1.9968715768704082e-05, 'epoch': 0.06} {'loss': 0.9223, 'learning_rate': 1.9968689890041124e-05, 'epoch': 0.06} {'loss': 0.9791, 'learning_rate': 1.9968664000695816e-05, 'epoch': 0.06} {'loss': 0.9848, 'learning_rate': 1.9968638100668186e-05, 'epoch': 0.06} {'loss': 1.0991, 'learning_rate': 1.9968612189958258e-05, 'epoch': 0.06} {'loss': 0.9429, 'learning_rate': 1.9968586268566062e-05, 'epoch': 0.06} {'loss': 0.8955, 'learning_rate': 1.996856033649163e-05, 'epoch': 0.06} {'loss': 1.0381, 'learning_rate': 1.9968534393734985e-05, 'epoch': 0.06} {'loss': 0.8695, 'learning_rate': 1.996850844029615e-05, 'epoch': 0.06} {'loss': 1.016, 'learning_rate': 1.9968482476175165e-05, 'epoch': 0.06} {'loss': 1.1465, 'learning_rate': 1.996845650137205e-05, 'epoch': 0.06} {'loss': 0.865, 'learning_rate': 1.996843051588683e-05, 'epoch': 0.06} {'loss': 1.0214, 'learning_rate': 1.9968404519719543e-05, 'epoch': 0.06} {'loss': 1.0159, 'learning_rate': 1.996837851287021e-05, 'epoch': 0.06} {'loss': 0.9697, 'learning_rate': 1.9968352495338856e-05, 'epoch': 0.06} {'loss': 0.924, 'learning_rate': 1.9968326467125512e-05, 'epoch': 0.06} {'loss': 0.965, 'learning_rate': 1.996830042823021e-05, 'epoch': 0.06} {'loss': 0.9043, 'learning_rate': 1.9968274378652973e-05, 'epoch': 0.06} {'loss': 0.9106, 'learning_rate': 1.996824831839383e-05, 'epoch': 0.06} {'loss': 0.8306, 'learning_rate': 1.996822224745281e-05, 'epoch': 0.06} {'loss': 0.9675, 'learning_rate': 1.996819616582994e-05, 'epoch': 0.06} {'loss': 0.9666, 'learning_rate': 1.996817007352525e-05, 'epoch': 0.06} {'loss': 0.8207, 'learning_rate': 1.9968143970538764e-05, 'epoch': 0.06} {'loss': 0.9839, 'learning_rate': 1.996811785687051e-05, 'epoch': 0.06} {'loss': 0.7667, 'learning_rate': 1.996809173252052e-05, 'epoch': 0.06} {'loss': 1.0329, 'learning_rate': 1.9968065597488822e-05, 'epoch': 0.06} {'loss': 1.0557, 'learning_rate': 1.9968039451775437e-05, 'epoch': 0.06} {'loss': 0.9838, 'learning_rate': 1.9968013295380404e-05, 'epoch': 0.06} {'loss': 1.0571, 'learning_rate': 1.9967987128303743e-05, 'epoch': 0.06} {'loss': 0.9635, 'learning_rate': 1.9967960950545483e-05, 'epoch': 0.06} {'loss': 1.3224, 'learning_rate': 1.9967934762105655e-05, 'epoch': 0.06} {'loss': 0.9821, 'learning_rate': 1.996790856298428e-05, 'epoch': 0.06} {'loss': 0.8799, 'learning_rate': 1.99678823531814e-05, 'epoch': 0.06} {'loss': 0.7755, 'learning_rate': 1.9967856132697027e-05, 'epoch': 0.06} {'loss': 0.8038, 'learning_rate': 1.99678299015312e-05, 'epoch': 0.06} {'loss': 0.8878, 'learning_rate': 1.996780365968394e-05, 'epoch': 0.06} {'loss': 0.9976, 'learning_rate': 1.9967777407155283e-05, 'epoch': 0.06} {'loss': 1.0002, 'learning_rate': 1.996775114394525e-05, 'epoch': 0.06} {'loss': 0.8584, 'learning_rate': 1.9967724870053877e-05, 'epoch': 0.06} {'loss': 0.866, 'learning_rate': 1.9967698585481184e-05, 'epoch': 0.06} {'loss': 1.1116, 'learning_rate': 1.99676722902272e-05, 'epoch': 0.06} {'loss': 0.8903, 'learning_rate': 1.9967645984291958e-05, 'epoch': 0.06} {'loss': 0.8826, 'learning_rate': 1.9967619667675483e-05, 'epoch': 0.06} {'loss': 0.8995, 'learning_rate': 1.9967593340377804e-05, 'epoch': 0.06} {'loss': 0.8722, 'learning_rate': 1.9967567002398948e-05, 'epoch': 0.06} {'loss': 1.0906, 'learning_rate': 1.9967540653738945e-05, 'epoch': 0.06} {'loss': 0.9818, 'learning_rate': 1.9967514294397824e-05, 'epoch': 0.06} {'loss': 0.8681, 'learning_rate': 1.9967487924375613e-05, 'epoch': 0.06} {'loss': 1.0234, 'learning_rate': 1.9967461543672334e-05, 'epoch': 0.06} {'loss': 0.7972, 'learning_rate': 1.9967435152288023e-05, 'epoch': 0.06} {'loss': 0.9179, 'learning_rate': 1.996740875022271e-05, 'epoch': 0.06} {'loss': 0.8959, 'learning_rate': 1.996738233747641e-05, 'epoch': 0.06} {'loss': 0.978, 'learning_rate': 1.9967355914049166e-05, 'epoch': 0.06} {'loss': 1.2191, 'learning_rate': 1.9967329479941e-05, 'epoch': 0.06} {'loss': 1.0102, 'learning_rate': 1.9967303035151938e-05, 'epoch': 0.06} {'loss': 1.1282, 'learning_rate': 1.996727657968202e-05, 'epoch': 0.06} {'loss': 1.1088, 'learning_rate': 1.9967250113531256e-05, 'epoch': 0.06} {'loss': 0.9904, 'learning_rate': 1.9967223636699688e-05, 'epoch': 0.06} {'loss': 1.0551, 'learning_rate': 1.996719714918734e-05, 'epoch': 0.06} {'loss': 0.8446, 'learning_rate': 1.9967170650994238e-05, 'epoch': 0.06} {'loss': 0.9126, 'learning_rate': 1.9967144142120413e-05, 'epoch': 0.06} {'loss': 0.819, 'learning_rate': 1.9967117622565896e-05, 'epoch': 0.06} {'loss': 1.0453, 'learning_rate': 1.9967091092330714e-05, 'epoch': 0.06} {'loss': 1.1558, 'learning_rate': 1.9967064551414893e-05, 'epoch': 0.06} {'loss': 0.886, 'learning_rate': 1.9967037999818458e-05, 'epoch': 0.06} {'loss': 1.0579, 'learning_rate': 1.996701143754145e-05, 'epoch': 0.06} {'loss': 0.9435, 'learning_rate': 1.9966984864583887e-05, 'epoch': 0.06} {'loss': 0.9736, 'learning_rate': 1.9966958280945798e-05, 'epoch': 0.06} {'loss': 0.8979, 'learning_rate': 1.9966931686627213e-05, 'epoch': 0.06} {'loss': 0.9339, 'learning_rate': 1.9966905081628166e-05, 'epoch': 0.06} {'loss': 1.0455, 'learning_rate': 1.9966878465948677e-05, 'epoch': 0.06} {'loss': 0.9023, 'learning_rate': 1.9966851839588777e-05, 'epoch': 0.06} {'loss': 1.092, 'learning_rate': 1.99668252025485e-05, 'epoch': 0.06} {'loss': 0.9814, 'learning_rate': 1.996679855482787e-05, 'epoch': 0.06} {'loss': 0.8007, 'learning_rate': 1.9966771896426912e-05, 'epoch': 0.06} {'loss': 0.8669, 'learning_rate': 1.996674522734566e-05, 'epoch': 0.06} {'loss': 0.9124, 'learning_rate': 1.996671854758414e-05, 'epoch': 0.06} {'loss': 0.9155, 'learning_rate': 1.9966691857142382e-05, 'epoch': 0.06} {'loss': 1.0187, 'learning_rate': 1.9966665156020413e-05, 'epoch': 0.06} {'loss': 1.0128, 'learning_rate': 1.9966638444218267e-05, 'epoch': 0.06} {'loss': 0.7863, 'learning_rate': 1.9966611721735964e-05, 'epoch': 0.06} {'loss': 0.9299, 'learning_rate': 1.9966584988573538e-05, 'epoch': 0.06} {'loss': 0.9534, 'learning_rate': 1.996655824473102e-05, 'epoch': 0.06} {'loss': 1.0403, 'learning_rate': 1.996653149020843e-05, 'epoch': 0.06} {'loss': 1.032, 'learning_rate': 1.9966504725005803e-05, 'epoch': 0.06} {'loss': 1.0156, 'learning_rate': 1.9966477949123172e-05, 'epoch': 0.06} {'loss': 0.9742, 'learning_rate': 1.9966451162560556e-05, 'epoch': 0.06} {'loss': 1.1396, 'learning_rate': 1.996642436531799e-05, 'epoch': 0.06} {'loss': 0.9632, 'learning_rate': 1.9966397557395497e-05, 'epoch': 0.06} {'loss': 1.0131, 'learning_rate': 1.996637073879311e-05, 'epoch': 0.06} {'loss': 1.0094, 'learning_rate': 1.996634390951086e-05, 'epoch': 0.06} {'loss': 0.9651, 'learning_rate': 1.9966317069548773e-05, 'epoch': 0.06} {'loss': 0.9134, 'learning_rate': 1.9966290218906878e-05, 'epoch': 0.06} {'loss': 1.0836, 'learning_rate': 1.9966263357585202e-05, 'epoch': 0.06} {'loss': 0.9091, 'learning_rate': 1.9966236485583776e-05, 'epoch': 0.06} {'loss': 0.9601, 'learning_rate': 1.9966209602902626e-05, 'epoch': 0.06} {'loss': 0.9406, 'learning_rate': 1.9966182709541786e-05, 'epoch': 0.06} {'loss': 0.8581, 'learning_rate': 1.996615580550128e-05, 'epoch': 0.06} {'loss': 0.8122, 'learning_rate': 1.9966128890781137e-05, 'epoch': 0.06} {'loss': 1.011, 'learning_rate': 1.996610196538139e-05, 'epoch': 0.06} {'loss': 0.9842, 'learning_rate': 1.9966075029302065e-05, 'epoch': 0.06} {'loss': 0.896, 'learning_rate': 1.996604808254319e-05, 'epoch': 0.06} {'loss': 0.8497, 'learning_rate': 1.9966021125104797e-05, 'epoch': 0.06} {'loss': 0.8639, 'learning_rate': 1.9965994156986913e-05, 'epoch': 0.06} {'loss': 0.8616, 'learning_rate': 1.9965967178189564e-05, 'epoch': 0.06} {'loss': 0.9835, 'learning_rate': 1.9965940188712785e-05, 'epoch': 0.06} {'loss': 1.0281, 'learning_rate': 1.99659131885566e-05, 'epoch': 0.06} {'loss': 1.0345, 'learning_rate': 1.9965886177721038e-05, 'epoch': 0.06} {'loss': 1.037, 'learning_rate': 1.996585915620613e-05, 'epoch': 0.06} {'loss': 1.0395, 'learning_rate': 1.9965832124011904e-05, 'epoch': 0.06} {'loss': 0.9365, 'learning_rate': 1.9965805081138392e-05, 'epoch': 0.06} {'loss': 0.9572, 'learning_rate': 1.9965778027585618e-05, 'epoch': 0.06} {'loss': 1.0084, 'learning_rate': 1.9965750963353615e-05, 'epoch': 0.06} {'loss': 0.9619, 'learning_rate': 1.996572388844241e-05, 'epoch': 0.06} {'loss': 1.0821, 'learning_rate': 1.996569680285203e-05, 'epoch': 0.06} {'loss': 0.8527, 'learning_rate': 1.9965669706582507e-05, 'epoch': 0.06} {'loss': 0.9571, 'learning_rate': 1.9965642599633874e-05, 'epoch': 0.06} {'loss': 0.9719, 'learning_rate': 1.996561548200615e-05, 'epoch': 0.06} {'loss': 0.8111, 'learning_rate': 1.996558835369937e-05, 'epoch': 0.06} {'loss': 0.9969, 'learning_rate': 1.9965561214713566e-05, 'epoch': 0.06} {'loss': 0.9799, 'learning_rate': 1.9965534065048766e-05, 'epoch': 0.06} {'loss': 0.9986, 'learning_rate': 1.996550690470499e-05, 'epoch': 0.06} {'loss': 0.9554, 'learning_rate': 1.996547973368228e-05, 'epoch': 0.06} {'loss': 0.8066, 'learning_rate': 1.9965452551980654e-05, 'epoch': 0.06} {'loss': 0.973, 'learning_rate': 1.996542535960015e-05, 'epoch': 0.06} {'loss': 0.992, 'learning_rate': 1.996539815654079e-05, 'epoch': 0.06} {'loss': 1.0996, 'learning_rate': 1.996537094280261e-05, 'epoch': 0.06} {'loss': 0.7611, 'learning_rate': 1.9965343718385632e-05, 'epoch': 0.06} {'loss': 0.8239, 'learning_rate': 1.996531648328989e-05, 'epoch': 0.06} {'loss': 0.9114, 'learning_rate': 1.9965289237515414e-05, 'epoch': 0.06} {'loss': 0.782, 'learning_rate': 1.9965261981062227e-05, 'epoch': 0.06} {'loss': 1.0344, 'learning_rate': 1.9965234713930366e-05, 'epoch': 0.06} {'loss': 0.9174, 'learning_rate': 1.9965207436119852e-05, 'epoch': 0.06} {'loss': 0.8985, 'learning_rate': 1.9965180147630726e-05, 'epoch': 0.06} {'loss': 1.0511, 'learning_rate': 1.9965152848463005e-05, 'epoch': 0.06} {'loss': 0.8325, 'learning_rate': 1.9965125538616726e-05, 'epoch': 0.06} {'loss': 0.927, 'learning_rate': 1.9965098218091913e-05, 'epoch': 0.06} {'loss': 0.8677, 'learning_rate': 1.99650708868886e-05, 'epoch': 0.06} {'loss': 0.9435, 'learning_rate': 1.9965043545006813e-05, 'epoch': 0.06} {'loss': 0.8719, 'learning_rate': 1.9965016192446583e-05, 'epoch': 0.06} {'loss': 0.8916, 'learning_rate': 1.996498882920794e-05, 'epoch': 0.06} {'loss': 0.807, 'learning_rate': 1.9964961455290908e-05, 'epoch': 0.06} {'loss': 1.0057, 'learning_rate': 1.996493407069552e-05, 'epoch': 0.06} {'loss': 0.7999, 'learning_rate': 1.9964906675421808e-05, 'epoch': 0.06} {'loss': 0.7894, 'learning_rate': 1.9964879269469802e-05, 'epoch': 0.06} {'loss': 0.9633, 'learning_rate': 1.9964851852839526e-05, 'epoch': 0.06} {'loss': 0.9708, 'learning_rate': 1.9964824425531014e-05, 'epoch': 0.06} {'loss': 0.8311, 'learning_rate': 1.996479698754429e-05, 'epoch': 0.06} {'loss': 0.8892, 'learning_rate': 1.9964769538879387e-05, 'epoch': 0.06} {'loss': 0.9613, 'learning_rate': 1.9964742079536337e-05, 'epoch': 0.06} {'loss': 0.9755, 'learning_rate': 1.9964714609515165e-05, 'epoch': 0.06} {'loss': 0.9798, 'learning_rate': 1.99646871288159e-05, 'epoch': 0.06} {'loss': 1.092, 'learning_rate': 1.9964659637438575e-05, 'epoch': 0.06} {'loss': 0.8309, 'learning_rate': 1.9964632135383217e-05, 'epoch': 0.06} {'loss': 1.0771, 'learning_rate': 1.9964604622649857e-05, 'epoch': 0.06} {'loss': 0.8915, 'learning_rate': 1.996457709923852e-05, 'epoch': 0.06} {'loss': 1.1446, 'learning_rate': 1.9964549565149248e-05, 'epoch': 0.06} {'loss': 0.8908, 'learning_rate': 1.9964522020382054e-05, 'epoch': 0.06} {'loss': 0.9066, 'learning_rate': 1.996449446493698e-05, 'epoch': 0.06} {'loss': 0.9309, 'learning_rate': 1.996446689881405e-05, 'epoch': 0.06} {'loss': 0.9255, 'learning_rate': 1.9964439322013288e-05, 'epoch': 0.06} {'loss': 0.8902, 'learning_rate': 1.996441173453474e-05, 'epoch': 0.06} {'loss': 0.9314, 'learning_rate': 1.9964384136378418e-05, 'epoch': 0.06} {'loss': 0.9972, 'learning_rate': 1.9964356527544362e-05, 'epoch': 0.06} {'loss': 0.8349, 'learning_rate': 1.99643289080326e-05, 'epoch': 0.06} {'loss': 0.9794, 'learning_rate': 1.9964301277843155e-05, 'epoch': 0.06} {'loss': 0.8484, 'learning_rate': 1.9964273636976065e-05, 'epoch': 0.06} {'loss': 0.9835, 'learning_rate': 1.996424598543136e-05, 'epoch': 0.06} {'loss': 1.1624, 'learning_rate': 1.9964218323209064e-05, 'epoch': 0.06} {'loss': 1.017, 'learning_rate': 1.9964190650309207e-05, 'epoch': 0.06} {'loss': 0.9147, 'learning_rate': 1.9964162966731822e-05, 'epoch': 0.06} {'loss': 0.7604, 'learning_rate': 1.9964135272476933e-05, 'epoch': 0.06} {'loss': 0.9831, 'learning_rate': 1.996410756754458e-05, 'epoch': 0.06} {'loss': 1.0293, 'learning_rate': 1.996407985193478e-05, 'epoch': 0.06} {'loss': 0.8572, 'learning_rate': 1.9964052125647573e-05, 'epoch': 0.06} {'loss': 1.0293, 'learning_rate': 1.9964024388682985e-05, 'epoch': 0.06} {'loss': 1.0049, 'learning_rate': 1.9963996641041046e-05, 'epoch': 0.06} {'loss': 0.8779, 'learning_rate': 1.9963968882721786e-05, 'epoch': 0.06} {'loss': 0.9652, 'learning_rate': 1.9963941113725228e-05, 'epoch': 0.06} {'loss': 0.9136, 'learning_rate': 1.9963913334051413e-05, 'epoch': 0.06} {'loss': 0.8378, 'learning_rate': 1.9963885543700365e-05, 'epoch': 0.06} {'loss': 1.0027, 'learning_rate': 1.9963857742672115e-05, 'epoch': 0.06} {'loss': 1.065, 'learning_rate': 1.996382993096669e-05, 'epoch': 0.06} {'loss': 0.9333, 'learning_rate': 1.9963802108584124e-05, 'epoch': 0.06} {'loss': 0.9691, 'learning_rate': 1.996377427552444e-05, 'epoch': 0.06} {'loss': 1.0189, 'learning_rate': 1.996374643178768e-05, 'epoch': 0.06} {'loss': 1.0873, 'learning_rate': 1.996371857737386e-05, 'epoch': 0.06} {'loss': 0.8209, 'learning_rate': 1.9963690712283022e-05, 'epoch': 0.06} {'loss': 0.7995, 'learning_rate': 1.9963662836515186e-05, 'epoch': 0.06} {'loss': 1.0898, 'learning_rate': 1.9963634950070388e-05, 'epoch': 0.06} {'loss': 0.9024, 'learning_rate': 1.9963607052948655e-05, 'epoch': 0.06} {'loss': 0.8128, 'learning_rate': 1.9963579145150014e-05, 'epoch': 0.06} {'loss': 0.8537, 'learning_rate': 1.9963551226674503e-05, 'epoch': 0.06} {'loss': 1.0274, 'learning_rate': 1.9963523297522148e-05, 'epoch': 0.06} {'loss': 1.1303, 'learning_rate': 1.996349535769298e-05, 'epoch': 0.06} {'loss': 0.8152, 'learning_rate': 1.9963467407187023e-05, 'epoch': 0.06} {'loss': 0.9466, 'learning_rate': 1.9963439446004313e-05, 'epoch': 0.06} {'loss': 0.9945, 'learning_rate': 1.996341147414488e-05, 'epoch': 0.06} {'loss': 0.9111, 'learning_rate': 1.996338349160875e-05, 'epoch': 0.06} {'loss': 0.9197, 'learning_rate': 1.9963355498395954e-05, 'epoch': 0.06} {'loss': 0.925, 'learning_rate': 1.9963327494506528e-05, 'epoch': 0.06} {'loss': 0.9239, 'learning_rate': 1.9963299479940496e-05, 'epoch': 0.06} {'loss': 1.0018, 'learning_rate': 1.9963271454697887e-05, 'epoch': 0.06} {'loss': 0.8765, 'learning_rate': 1.9963243418778737e-05, 'epoch': 0.06} {'loss': 0.9282, 'learning_rate': 1.996321537218307e-05, 'epoch': 0.06} {'loss': 0.9118, 'learning_rate': 1.996318731491092e-05, 'epoch': 0.06} {'loss': 0.9733, 'learning_rate': 1.9963159246962315e-05, 'epoch': 0.06} {'loss': 0.9379, 'learning_rate': 1.9963131168337285e-05, 'epoch': 0.06} {'loss': 0.915, 'learning_rate': 1.996310307903586e-05, 'epoch': 0.06} {'loss': 0.9396, 'learning_rate': 1.996307497905807e-05, 'epoch': 0.06} {'loss': 1.1741, 'learning_rate': 1.996304686840395e-05, 'epoch': 0.06} {'loss': 0.9066, 'learning_rate': 1.9963018747073523e-05, 'epoch': 0.06} {'loss': 0.9049, 'learning_rate': 1.9962990615066823e-05, 'epoch': 0.06} {'loss': 0.9983, 'learning_rate': 1.996296247238388e-05, 'epoch': 0.06} {'loss': 1.0645, 'learning_rate': 1.996293431902472e-05, 'epoch': 0.06} {'loss': 1.015, 'learning_rate': 1.996290615498938e-05, 'epoch': 0.06} {'loss': 0.95, 'learning_rate': 1.9962877980277886e-05, 'epoch': 0.06} {'loss': 1.0069, 'learning_rate': 1.9962849794890265e-05, 'epoch': 0.06} {'loss': 1.288, 'learning_rate': 1.996282159882656e-05, 'epoch': 0.06} {'loss': 0.8343, 'learning_rate': 1.9962793392086786e-05, 'epoch': 0.06} {'loss': 0.9858, 'learning_rate': 1.9962765174670983e-05, 'epoch': 0.06} {'loss': 0.985, 'learning_rate': 1.9962736946579176e-05, 'epoch': 0.06} {'loss': 0.9031, 'learning_rate': 1.9962708707811396e-05, 'epoch': 0.06} {'loss': 0.9503, 'learning_rate': 1.9962680458367674e-05, 'epoch': 0.06} {'loss': 1.0218, 'learning_rate': 1.9962652198248044e-05, 'epoch': 0.06} {'loss': 0.9845, 'learning_rate': 1.9962623927452533e-05, 'epoch': 0.06} {'loss': 0.8178, 'learning_rate': 1.996259564598117e-05, 'epoch': 0.06} {'loss': 0.9661, 'learning_rate': 1.9962567353833988e-05, 'epoch': 0.06} {'loss': 1.0957, 'learning_rate': 1.996253905101101e-05, 'epoch': 0.06} {'loss': 0.9904, 'learning_rate': 1.996251073751228e-05, 'epoch': 0.06} {'loss': 0.6855, 'learning_rate': 1.9962482413337816e-05, 'epoch': 0.06} {'loss': 0.6795, 'learning_rate': 1.9962454078487657e-05, 'epoch': 0.06} {'loss': 1.0673, 'learning_rate': 1.9962425732961826e-05, 'epoch': 0.06} {'loss': 0.8803, 'learning_rate': 1.9962397376760356e-05, 'epoch': 0.06} {'loss': 1.0507, 'learning_rate': 1.9962369009883278e-05, 'epoch': 0.06} {'loss': 0.8948, 'learning_rate': 1.9962340632330627e-05, 'epoch': 0.06} {'loss': 0.9662, 'learning_rate': 1.9962312244102423e-05, 'epoch': 0.06} {'loss': 0.9498, 'learning_rate': 1.9962283845198708e-05, 'epoch': 0.06} {'loss': 0.7788, 'learning_rate': 1.99622554356195e-05, 'epoch': 0.06} {'loss': 0.9352, 'learning_rate': 1.9962227015364843e-05, 'epoch': 0.06} {'loss': 0.8002, 'learning_rate': 1.9962198584434754e-05, 'epoch': 0.06} {'loss': 0.8426, 'learning_rate': 1.9962170142829275e-05, 'epoch': 0.06} {'loss': 0.8619, 'learning_rate': 1.996214169054843e-05, 'epoch': 0.06} {'loss': 0.8905, 'learning_rate': 1.996211322759225e-05, 'epoch': 0.06} {'loss': 1.057, 'learning_rate': 1.9962084753960767e-05, 'epoch': 0.06} {'loss': 0.9888, 'learning_rate': 1.9962056269654012e-05, 'epoch': 0.06} {'loss': 1.0092, 'learning_rate': 1.9962027774672014e-05, 'epoch': 0.06} {'loss': 0.9794, 'learning_rate': 1.9961999269014805e-05, 'epoch': 0.06} {'loss': 0.9567, 'learning_rate': 1.9961970752682412e-05, 'epoch': 0.06} {'loss': 0.8429, 'learning_rate': 1.9961942225674874e-05, 'epoch': 0.06} {'loss': 0.9085, 'learning_rate': 1.996191368799221e-05, 'epoch': 0.06} {'loss': 0.9403, 'learning_rate': 1.9961885139634457e-05, 'epoch': 0.06} {'loss': 0.9123, 'learning_rate': 1.9961856580601647e-05, 'epoch': 0.06} {'loss': 0.9759, 'learning_rate': 1.996182801089381e-05, 'epoch': 0.06} {'loss': 0.9442, 'learning_rate': 1.996179943051097e-05, 'epoch': 0.06} {'loss': 0.858, 'learning_rate': 1.9961770839453165e-05, 'epoch': 0.06} {'loss': 0.7996, 'learning_rate': 1.9961742237720424e-05, 'epoch': 0.06} {'loss': 0.9678, 'learning_rate': 1.996171362531278e-05, 'epoch': 0.06} {'loss': 0.9758, 'learning_rate': 1.996168500223026e-05, 'epoch': 0.06} {'loss': 1.0348, 'learning_rate': 1.996165636847289e-05, 'epoch': 0.06} {'loss': 0.953, 'learning_rate': 1.996162772404071e-05, 'epoch': 0.06} {'loss': 0.9419, 'learning_rate': 1.9961599068933746e-05, 'epoch': 0.06} {'loss': 1.0036, 'learning_rate': 1.996157040315203e-05, 'epoch': 0.06} {'loss': 0.9668, 'learning_rate': 1.996154172669559e-05, 'epoch': 0.06} {'loss': 1.028, 'learning_rate': 1.9961513039564463e-05, 'epoch': 0.06} {'loss': 1.1556, 'learning_rate': 1.9961484341758673e-05, 'epoch': 0.06} {'loss': 0.9074, 'learning_rate': 1.9961455633278256e-05, 'epoch': 0.06} {'loss': 0.8282, 'learning_rate': 1.9961426914123235e-05, 'epoch': 0.06} {'loss': 1.0132, 'learning_rate': 1.9961398184293654e-05, 'epoch': 0.06} {'loss': 1.0471, 'learning_rate': 1.996136944378953e-05, 'epoch': 0.06} {'loss': 0.6729, 'learning_rate': 1.99613406926109e-05, 'epoch': 0.06} {'loss': 0.965, 'learning_rate': 1.9961311930757795e-05, 'epoch': 0.06} {'loss': 1.2296, 'learning_rate': 1.9961283158230245e-05, 'epoch': 0.06} {'loss': 0.9905, 'learning_rate': 1.996125437502828e-05, 'epoch': 0.06} {'loss': 0.8484, 'learning_rate': 1.9961225581151934e-05, 'epoch': 0.06} {'loss': 1.0254, 'learning_rate': 1.9961196776601236e-05, 'epoch': 0.06} {'loss': 0.9773, 'learning_rate': 1.9961167961376216e-05, 'epoch': 0.06} {'loss': 1.0331, 'learning_rate': 1.9961139135476904e-05, 'epoch': 0.06} {'loss': 1.0034, 'learning_rate': 1.9961110298903336e-05, 'epoch': 0.06} {'loss': 1.1024, 'learning_rate': 1.9961081451655534e-05, 'epoch': 0.06} {'loss': 0.9802, 'learning_rate': 1.9961052593733538e-05, 'epoch': 0.06} {'loss': 0.9265, 'learning_rate': 1.9961023725137375e-05, 'epoch': 0.06} {'loss': 0.978, 'learning_rate': 1.9960994845867072e-05, 'epoch': 0.06} {'loss': 0.9675, 'learning_rate': 1.996096595592267e-05, 'epoch': 0.06} {'loss': 0.8232, 'learning_rate': 1.996093705530419e-05, 'epoch': 0.06} {'loss': 0.9825, 'learning_rate': 1.9960908144011667e-05, 'epoch': 0.06} {'loss': 0.8642, 'learning_rate': 1.996087922204513e-05, 'epoch': 0.06} {'loss': 1.007, 'learning_rate': 1.9960850289404616e-05, 'epoch': 0.06} {'loss': 0.9671, 'learning_rate': 1.9960821346090152e-05, 'epoch': 0.06} {'loss': 1.1006, 'learning_rate': 1.9960792392101765e-05, 'epoch': 0.06} {'loss': 0.8169, 'learning_rate': 1.9960763427439492e-05, 'epoch': 0.06} {'loss': 1.0064, 'learning_rate': 1.9960734452103364e-05, 'epoch': 0.06} {'loss': 0.9383, 'learning_rate': 1.996070546609341e-05, 'epoch': 0.06} {'loss': 1.0402, 'learning_rate': 1.996067646940966e-05, 'epoch': 0.06} {'loss': 0.9527, 'learning_rate': 1.996064746205214e-05, 'epoch': 0.06} {'loss': 0.9607, 'learning_rate': 1.9960618444020898e-05, 'epoch': 0.06} {'loss': 0.987, 'learning_rate': 1.9960589415315948e-05, 'epoch': 0.06} {'loss': 0.9833, 'learning_rate': 1.996056037593733e-05, 'epoch': 0.06} {'loss': 1.0603, 'learning_rate': 1.996053132588507e-05, 'epoch': 0.06} {'loss': 0.9273, 'learning_rate': 1.9960502265159204e-05, 'epoch': 0.06} {'loss': 1.0599, 'learning_rate': 1.9960473193759758e-05, 'epoch': 0.06} {'loss': 1.0302, 'learning_rate': 1.996044411168677e-05, 'epoch': 0.06} {'loss': 0.9909, 'learning_rate': 1.9960415018940264e-05, 'epoch': 0.06} {'loss': 1.0204, 'learning_rate': 1.9960385915520272e-05, 'epoch': 0.06} {'loss': 1.0306, 'learning_rate': 1.9960356801426832e-05, 'epoch': 0.06} {'loss': 1.0185, 'learning_rate': 1.996032767665997e-05, 'epoch': 0.06} {'loss': 1.0464, 'learning_rate': 1.9960298541219715e-05, 'epoch': 0.06} {'loss': 0.9794, 'learning_rate': 1.9960269395106105e-05, 'epoch': 0.06} {'loss': 0.7478, 'learning_rate': 1.9960240238319162e-05, 'epoch': 0.06} {'loss': 1.0285, 'learning_rate': 1.996021107085893e-05, 'epoch': 0.06} {'loss': 0.9516, 'learning_rate': 1.996018189272543e-05, 'epoch': 0.06} {'loss': 0.8657, 'learning_rate': 1.9960152703918695e-05, 'epoch': 0.06} {'loss': 0.8994, 'learning_rate': 1.9960123504438757e-05, 'epoch': 0.06} {'loss': 0.9341, 'learning_rate': 1.996009429428565e-05, 'epoch': 0.06} {'loss': 1.0723, 'learning_rate': 1.99600650734594e-05, 'epoch': 0.06} {'loss': 0.8783, 'learning_rate': 1.9960035841960044e-05, 'epoch': 0.06} {'loss': 0.8082, 'learning_rate': 1.996000659978761e-05, 'epoch': 0.06} {'loss': 0.9239, 'learning_rate': 1.9959977346942126e-05, 'epoch': 0.06} {'loss': 0.9542, 'learning_rate': 1.9959948083423634e-05, 'epoch': 0.06} {'loss': 0.8161, 'learning_rate': 1.9959918809232155e-05, 'epoch': 0.06} {'loss': 0.9226, 'learning_rate': 1.9959889524367725e-05, 'epoch': 0.06} {'loss': 0.9516, 'learning_rate': 1.995986022883037e-05, 'epoch': 0.06} {'loss': 0.9582, 'learning_rate': 1.9959830922620135e-05, 'epoch': 0.06} {'loss': 0.9209, 'learning_rate': 1.9959801605737036e-05, 'epoch': 0.06} {'loss': 1.1137, 'learning_rate': 1.9959772278181112e-05, 'epoch': 0.06} {'loss': 0.8571, 'learning_rate': 1.9959742939952393e-05, 'epoch': 0.06} {'loss': 0.9991, 'learning_rate': 1.995971359105091e-05, 'epoch': 0.06} {'loss': 0.9782, 'learning_rate': 1.9959684231476694e-05, 'epoch': 0.06} {'loss': 0.9298, 'learning_rate': 1.995965486122978e-05, 'epoch': 0.06} {'loss': 0.7477, 'learning_rate': 1.9959625480310195e-05, 'epoch': 0.06} {'loss': 1.1083, 'learning_rate': 1.995959608871797e-05, 'epoch': 0.06} {'loss': 1.0082, 'learning_rate': 1.9959566686453144e-05, 'epoch': 0.06} {'loss': 0.8993, 'learning_rate': 1.9959537273515743e-05, 'epoch': 0.06} {'loss': 0.8881, 'learning_rate': 1.9959507849905795e-05, 'epoch': 0.06} {'loss': 1.0114, 'learning_rate': 1.995947841562334e-05, 'epoch': 0.06} {'loss': 1.0321, 'learning_rate': 1.9959448970668402e-05, 'epoch': 0.06} {'loss': 0.8806, 'learning_rate': 1.9959419515041015e-05, 'epoch': 0.06} {'loss': 0.8578, 'learning_rate': 1.9959390048741213e-05, 'epoch': 0.06} {'loss': 0.9224, 'learning_rate': 1.9959360571769023e-05, 'epoch': 0.06} {'loss': 0.8309, 'learning_rate': 1.9959331084124482e-05, 'epoch': 0.06} {'loss': 1.0321, 'learning_rate': 1.995930158580762e-05, 'epoch': 0.06} {'loss': 0.9167, 'learning_rate': 1.9959272076818465e-05, 'epoch': 0.06} {'loss': 1.0266, 'learning_rate': 1.995924255715705e-05, 'epoch': 0.06} {'loss': 0.8439, 'learning_rate': 1.995921302682341e-05, 'epoch': 0.06} {'loss': 0.9756, 'learning_rate': 1.9959183485817574e-05, 'epoch': 0.06} {'loss': 1.0658, 'learning_rate': 1.995915393413957e-05, 'epoch': 0.06} {'loss': 0.9709, 'learning_rate': 1.995912437178944e-05, 'epoch': 0.06} {'loss': 0.8755, 'learning_rate': 1.9959094798767208e-05, 'epoch': 0.06} {'loss': 0.9835, 'learning_rate': 1.9959065215072905e-05, 'epoch': 0.06} {'loss': 0.931, 'learning_rate': 1.9959035620706566e-05, 'epoch': 0.06} {'loss': 1.0058, 'learning_rate': 1.9959006015668222e-05, 'epoch': 0.06} {'loss': 0.9088, 'learning_rate': 1.99589763999579e-05, 'epoch': 0.06} {'loss': 0.8557, 'learning_rate': 1.9958946773575643e-05, 'epoch': 0.06} {'loss': 1.113, 'learning_rate': 1.9958917136521473e-05, 'epoch': 0.06} {'loss': 1.1511, 'learning_rate': 1.995888748879542e-05, 'epoch': 0.06} {'loss': 0.9507, 'learning_rate': 1.9958857830397524e-05, 'epoch': 0.06} {'loss': 0.9884, 'learning_rate': 1.9958828161327816e-05, 'epoch': 0.06} {'loss': 0.9199, 'learning_rate': 1.995879848158632e-05, 'epoch': 0.06} {'loss': 0.8613, 'learning_rate': 1.995876879117307e-05, 'epoch': 0.06} {'loss': 0.7557, 'learning_rate': 1.9958739090088106e-05, 'epoch': 0.06} {'loss': 1.0827, 'learning_rate': 1.9958709378331454e-05, 'epoch': 0.06} {'loss': 0.8473, 'learning_rate': 1.9958679655903143e-05, 'epoch': 0.06} {'loss': 0.9024, 'learning_rate': 1.9958649922803212e-05, 'epoch': 0.06} {'loss': 0.9254, 'learning_rate': 1.9958620179031686e-05, 'epoch': 0.06} {'loss': 0.857, 'learning_rate': 1.99585904245886e-05, 'epoch': 0.06} {'loss': 1.0879, 'learning_rate': 1.9958560659473984e-05, 'epoch': 0.06} {'loss': 1.0348, 'learning_rate': 1.9958530883687872e-05, 'epoch': 0.06} {'loss': 1.0422, 'learning_rate': 1.9958501097230297e-05, 'epoch': 0.06} {'loss': 0.9411, 'learning_rate': 1.995847130010129e-05, 'epoch': 0.06} {'loss': 1.0096, 'learning_rate': 1.995844149230088e-05, 'epoch': 0.06} {'loss': 1.0384, 'learning_rate': 1.99584116738291e-05, 'epoch': 0.06} {'loss': 1.0728, 'learning_rate': 1.9958381844685985e-05, 'epoch': 0.06} {'loss': 0.9698, 'learning_rate': 1.9958352004871565e-05, 'epoch': 0.06} {'loss': 0.9256, 'learning_rate': 1.995832215438587e-05, 'epoch': 0.06} {'loss': 1.0942, 'learning_rate': 1.995829229322894e-05, 'epoch': 0.06} {'loss': 0.9062, 'learning_rate': 1.9958262421400796e-05, 'epoch': 0.06} {'loss': 0.9624, 'learning_rate': 1.9958232538901476e-05, 'epoch': 0.06} {'loss': 0.9767, 'learning_rate': 1.995820264573101e-05, 'epoch': 0.06} {'loss': 0.9061, 'learning_rate': 1.9958172741889434e-05, 'epoch': 0.06} {'loss': 1.0458, 'learning_rate': 1.9958142827376775e-05, 'epoch': 0.06} {'loss': 0.9804, 'learning_rate': 1.995811290219307e-05, 'epoch': 0.06} {'loss': 0.9567, 'learning_rate': 1.9958082966338343e-05, 'epoch': 0.06} {'loss': 1.0457, 'learning_rate': 1.9958053019812635e-05, 'epoch': 0.06} {'loss': 1.0709, 'learning_rate': 1.9958023062615973e-05, 'epoch': 0.06} {'loss': 1.0732, 'learning_rate': 1.9957993094748392e-05, 'epoch': 0.06} {'loss': 1.0225, 'learning_rate': 1.995796311620992e-05, 'epoch': 0.06} {'loss': 0.9172, 'learning_rate': 1.9957933127000594e-05, 'epoch': 0.06} {'loss': 1.0171, 'learning_rate': 1.9957903127120444e-05, 'epoch': 0.06} {'loss': 0.8563, 'learning_rate': 1.99578731165695e-05, 'epoch': 0.06} {'loss': 0.9769, 'learning_rate': 1.9957843095347797e-05, 'epoch': 0.06} {'loss': 1.0933, 'learning_rate': 1.9957813063455368e-05, 'epoch': 0.06} {'loss': 0.9177, 'learning_rate': 1.9957783020892245e-05, 'epoch': 0.06} {'loss': 0.9297, 'learning_rate': 1.9957752967658455e-05, 'epoch': 0.06} {'loss': 0.9674, 'learning_rate': 1.9957722903754035e-05, 'epoch': 0.06} {'loss': 0.8954, 'learning_rate': 1.9957692829179016e-05, 'epoch': 0.06} {'loss': 0.7533, 'learning_rate': 1.995766274393343e-05, 'epoch': 0.06} {'loss': 0.8751, 'learning_rate': 1.9957632648017312e-05, 'epoch': 0.06} {'loss': 1.0923, 'learning_rate': 1.995760254143069e-05, 'epoch': 0.06} {'loss': 0.9918, 'learning_rate': 1.99575724241736e-05, 'epoch': 0.06} {'loss': 1.0946, 'learning_rate': 1.9957542296246068e-05, 'epoch': 0.06} {'loss': 0.8185, 'learning_rate': 1.9957512157648135e-05, 'epoch': 0.06} {'loss': 0.8196, 'learning_rate': 1.9957482008379826e-05, 'epoch': 0.06} {'loss': 0.8692, 'learning_rate': 1.995745184844118e-05, 'epoch': 0.06} {'loss': 0.8259, 'learning_rate': 1.995742167783222e-05, 'epoch': 0.06} {'loss': 0.9539, 'learning_rate': 1.995739149655299e-05, 'epoch': 0.06} {'loss': 0.9494, 'learning_rate': 1.9957361304603513e-05, 'epoch': 0.06} {'loss': 0.9153, 'learning_rate': 1.9957331101983825e-05, 'epoch': 0.06} {'loss': 1.0283, 'learning_rate': 1.995730088869396e-05, 'epoch': 0.06} {'loss': 0.8174, 'learning_rate': 1.9957270664733945e-05, 'epoch': 0.06} {'loss': 0.8516, 'learning_rate': 1.995724043010382e-05, 'epoch': 0.06} {'loss': 0.9639, 'learning_rate': 1.995721018480361e-05, 'epoch': 0.06} {'loss': 0.8129, 'learning_rate': 1.9957179928833354e-05, 'epoch': 0.06} {'loss': 0.9642, 'learning_rate': 1.9957149662193075e-05, 'epoch': 0.07} {'loss': 0.721, 'learning_rate': 1.9957119384882814e-05, 'epoch': 0.07} {'loss': 0.7716, 'learning_rate': 1.99570890969026e-05, 'epoch': 0.07} {'loss': 0.8031, 'learning_rate': 1.995705879825247e-05, 'epoch': 0.07} {'loss': 0.7998, 'learning_rate': 1.9957028488932454e-05, 'epoch': 0.07} {'loss': 1.0314, 'learning_rate': 1.9956998168942578e-05, 'epoch': 0.07} {'loss': 0.8706, 'learning_rate': 1.9956967838282882e-05, 'epoch': 0.07} {'loss': 1.0, 'learning_rate': 1.9956937496953397e-05, 'epoch': 0.07} {'loss': 0.9697, 'learning_rate': 1.9956907144954155e-05, 'epoch': 0.07} {'loss': 1.0427, 'learning_rate': 1.9956876782285186e-05, 'epoch': 0.07} {'loss': 0.9364, 'learning_rate': 1.9956846408946525e-05, 'epoch': 0.07} {'loss': 0.9957, 'learning_rate': 1.9956816024938207e-05, 'epoch': 0.07} {'loss': 0.9264, 'learning_rate': 1.9956785630260263e-05, 'epoch': 0.07} {'loss': 1.0552, 'learning_rate': 1.995675522491272e-05, 'epoch': 0.07} {'loss': 1.0615, 'learning_rate': 1.9956724808895618e-05, 'epoch': 0.07} {'loss': 0.9469, 'learning_rate': 1.9956694382208986e-05, 'epoch': 0.07} {'loss': 0.7527, 'learning_rate': 1.9956663944852856e-05, 'epoch': 0.07} {'loss': 0.9391, 'learning_rate': 1.9956633496827265e-05, 'epoch': 0.07} {'loss': 0.9071, 'learning_rate': 1.995660303813224e-05, 'epoch': 0.07} {'loss': 0.9073, 'learning_rate': 1.995657256876782e-05, 'epoch': 0.07} {'loss': 0.9245, 'learning_rate': 1.995654208873403e-05, 'epoch': 0.07} {'loss': 1.0502, 'learning_rate': 1.9956511598030907e-05, 'epoch': 0.07} {'loss': 0.9749, 'learning_rate': 1.9956481096658483e-05, 'epoch': 0.07} {'loss': 0.9975, 'learning_rate': 1.995645058461679e-05, 'epoch': 0.07} {'loss': 0.866, 'learning_rate': 1.9956420061905863e-05, 'epoch': 0.07} {'loss': 1.0152, 'learning_rate': 1.9956389528525734e-05, 'epoch': 0.07} {'loss': 0.8606, 'learning_rate': 1.9956358984476436e-05, 'epoch': 0.07} {'loss': 0.9946, 'learning_rate': 1.9956328429757996e-05, 'epoch': 0.07} {'loss': 1.1433, 'learning_rate': 1.9956297864370454e-05, 'epoch': 0.07} {'loss': 0.7978, 'learning_rate': 1.9956267288313844e-05, 'epoch': 0.07} {'loss': 0.9488, 'learning_rate': 1.995623670158819e-05, 'epoch': 0.07} {'loss': 1.0031, 'learning_rate': 1.9956206104193533e-05, 'epoch': 0.07} {'loss': 0.8404, 'learning_rate': 1.99561754961299e-05, 'epoch': 0.07} {'loss': 0.8878, 'learning_rate': 1.995614487739733e-05, 'epoch': 0.07} {'loss': 0.9589, 'learning_rate': 1.9956114247995846e-05, 'epoch': 0.07} {'loss': 0.9937, 'learning_rate': 1.995608360792549e-05, 'epoch': 0.07} {'loss': 0.9124, 'learning_rate': 1.9956052957186294e-05, 'epoch': 0.07} {'loss': 0.9527, 'learning_rate': 1.9956022295778288e-05, 'epoch': 0.07} {'loss': 0.9977, 'learning_rate': 1.9955991623701505e-05, 'epoch': 0.07} {'loss': 0.8074, 'learning_rate': 1.9955960940955976e-05, 'epoch': 0.07} {'loss': 1.0423, 'learning_rate': 1.995593024754174e-05, 'epoch': 0.07} {'loss': 1.0371, 'learning_rate': 1.9955899543458823e-05, 'epoch': 0.07} {'loss': 1.0813, 'learning_rate': 1.9955868828707263e-05, 'epoch': 0.07} {'loss': 0.8951, 'learning_rate': 1.995583810328709e-05, 'epoch': 0.07} {'loss': 1.0241, 'learning_rate': 1.9955807367198343e-05, 'epoch': 0.07} {'loss': 0.9321, 'learning_rate': 1.995577662044104e-05, 'epoch': 0.07} {'loss': 0.8536, 'learning_rate': 1.995574586301523e-05, 'epoch': 0.07} {'loss': 1.0195, 'learning_rate': 1.995571509492094e-05, 'epoch': 0.07} {'loss': 1.0072, 'learning_rate': 1.99556843161582e-05, 'epoch': 0.07} {'loss': 0.9226, 'learning_rate': 1.995565352672705e-05, 'epoch': 0.07} {'loss': 1.0655, 'learning_rate': 1.9955622726627515e-05, 'epoch': 0.07} {'loss': 0.8177, 'learning_rate': 1.9955591915859634e-05, 'epoch': 0.07} {'loss': 0.8547, 'learning_rate': 1.9955561094423434e-05, 'epoch': 0.07} {'loss': 0.8546, 'learning_rate': 1.9955530262318956e-05, 'epoch': 0.07} {'loss': 1.0512, 'learning_rate': 1.9955499419546226e-05, 'epoch': 0.07} {'loss': 0.7782, 'learning_rate': 1.995546856610528e-05, 'epoch': 0.07} {'loss': 0.8874, 'learning_rate': 1.9955437701996153e-05, 'epoch': 0.07} {'loss': 0.9453, 'learning_rate': 1.9955406827218873e-05, 'epoch': 0.07} {'loss': 0.7965, 'learning_rate': 1.9955375941773478e-05, 'epoch': 0.07} {'loss': 0.9628, 'learning_rate': 1.995534504566e-05, 'epoch': 0.07} {'loss': 0.9647, 'learning_rate': 1.995531413887847e-05, 'epoch': 0.07} {'loss': 0.9869, 'learning_rate': 1.9955283221428922e-05, 'epoch': 0.07} {'loss': 0.8778, 'learning_rate': 1.995525229331139e-05, 'epoch': 0.07} {'loss': 1.047, 'learning_rate': 1.9955221354525903e-05, 'epoch': 0.07} {'loss': 1.1043, 'learning_rate': 1.9955190405072505e-05, 'epoch': 0.07} {'loss': 0.9284, 'learning_rate': 1.9955159444951218e-05, 'epoch': 0.07} {'loss': 0.8819, 'learning_rate': 1.995512847416208e-05, 'epoch': 0.07} {'loss': 0.9524, 'learning_rate': 1.9955097492705123e-05, 'epoch': 0.07} {'loss': 1.0666, 'learning_rate': 1.995506650058038e-05, 'epoch': 0.07} {'loss': 0.8566, 'learning_rate': 1.9955035497787884e-05, 'epoch': 0.07} {'loss': 0.921, 'learning_rate': 1.9955004484327668e-05, 'epoch': 0.07} {'loss': 0.9315, 'learning_rate': 1.995497346019977e-05, 'epoch': 0.07} {'loss': 0.7859, 'learning_rate': 1.9954942425404218e-05, 'epoch': 0.07} {'loss': 1.0262, 'learning_rate': 1.9954911379941048e-05, 'epoch': 0.07} {'loss': 1.0554, 'learning_rate': 1.9954880323810287e-05, 'epoch': 0.07} {'loss': 0.9684, 'learning_rate': 1.995484925701198e-05, 'epoch': 0.07} {'loss': 1.1238, 'learning_rate': 1.9954818179546146e-05, 'epoch': 0.07} {'loss': 0.9156, 'learning_rate': 1.995478709141283e-05, 'epoch': 0.07} {'loss': 1.1442, 'learning_rate': 1.9954755992612064e-05, 'epoch': 0.07} {'loss': 1.0145, 'learning_rate': 1.9954724883143876e-05, 'epoch': 0.07} {'loss': 0.9633, 'learning_rate': 1.99546937630083e-05, 'epoch': 0.07} {'loss': 1.0993, 'learning_rate': 1.995466263220537e-05, 'epoch': 0.07} {'loss': 0.9473, 'learning_rate': 1.9954631490735126e-05, 'epoch': 0.07} {'loss': 0.8876, 'learning_rate': 1.9954600338597592e-05, 'epoch': 0.07} {'loss': 0.9871, 'learning_rate': 1.9954569175792807e-05, 'epoch': 0.07} {'loss': 1.045, 'learning_rate': 1.9954538002320803e-05, 'epoch': 0.07} {'loss': 0.8869, 'learning_rate': 1.9954506818181612e-05, 'epoch': 0.07} {'loss': 0.951, 'learning_rate': 1.9954475623375268e-05, 'epoch': 0.07} {'loss': 0.8468, 'learning_rate': 1.9954444417901808e-05, 'epoch': 0.07} {'loss': 0.9658, 'learning_rate': 1.9954413201761258e-05, 'epoch': 0.07} {'loss': 1.001, 'learning_rate': 1.9954381974953657e-05, 'epoch': 0.07} {'loss': 0.8183, 'learning_rate': 1.9954350737479037e-05, 'epoch': 0.07} {'loss': 0.9119, 'learning_rate': 1.9954319489337434e-05, 'epoch': 0.07} {'loss': 1.0481, 'learning_rate': 1.9954288230528877e-05, 'epoch': 0.07} {'loss': 0.9448, 'learning_rate': 1.9954256961053403e-05, 'epoch': 0.07} {'loss': 0.8599, 'learning_rate': 1.9954225680911044e-05, 'epoch': 0.07} {'loss': 0.9619, 'learning_rate': 1.9954194390101833e-05, 'epoch': 0.07} {'loss': 0.8615, 'learning_rate': 1.9954163088625808e-05, 'epoch': 0.07} {'loss': 0.9714, 'learning_rate': 1.9954131776482994e-05, 'epoch': 0.07} {'loss': 1.0126, 'learning_rate': 1.995410045367343e-05, 'epoch': 0.07} {'loss': 0.9566, 'learning_rate': 1.995406912019715e-05, 'epoch': 0.07} {'loss': 1.071, 'learning_rate': 1.995403777605419e-05, 'epoch': 0.07} {'loss': 0.9241, 'learning_rate': 1.9954006421244574e-05, 'epoch': 0.07} {'loss': 0.9651, 'learning_rate': 1.9953975055768345e-05, 'epoch': 0.07} {'loss': 0.7838, 'learning_rate': 1.995394367962553e-05, 'epoch': 0.07} {'loss': 0.9717, 'learning_rate': 1.995391229281617e-05, 'epoch': 0.07} {'loss': 0.8521, 'learning_rate': 1.9953880895340294e-05, 'epoch': 0.07} {'loss': 1.2478, 'learning_rate': 1.9953849487197935e-05, 'epoch': 0.07} {'loss': 0.8878, 'learning_rate': 1.995381806838913e-05, 'epoch': 0.07} {'loss': 0.8255, 'learning_rate': 1.9953786638913907e-05, 'epoch': 0.07} {'loss': 1.1208, 'learning_rate': 1.9953755198772306e-05, 'epoch': 0.07} {'loss': 1.0649, 'learning_rate': 1.9953723747964355e-05, 'epoch': 0.07} {'loss': 0.8496, 'learning_rate': 1.9953692286490094e-05, 'epoch': 0.07} {'loss': 0.8275, 'learning_rate': 1.995366081434955e-05, 'epoch': 0.07} {'loss': 0.9344, 'learning_rate': 1.9953629331542764e-05, 'epoch': 0.07} {'loss': 0.9191, 'learning_rate': 1.9953597838069763e-05, 'epoch': 0.07} {'loss': 1.0469, 'learning_rate': 1.9953566333930588e-05, 'epoch': 0.07} {'loss': 0.9564, 'learning_rate': 1.9953534819125262e-05, 'epoch': 0.07} {'loss': 1.0119, 'learning_rate': 1.995350329365383e-05, 'epoch': 0.07} {'loss': 0.7878, 'learning_rate': 1.995347175751632e-05, 'epoch': 0.07} {'loss': 0.9609, 'learning_rate': 1.995344021071276e-05, 'epoch': 0.07} {'loss': 0.7396, 'learning_rate': 1.99534086532432e-05, 'epoch': 0.07} {'loss': 0.9471, 'learning_rate': 1.995337708510766e-05, 'epoch': 0.07} {'loss': 1.0106, 'learning_rate': 1.995334550630618e-05, 'epoch': 0.07} {'loss': 0.8931, 'learning_rate': 1.995331391683879e-05, 'epoch': 0.07} {'loss': 1.081, 'learning_rate': 1.9953282316705526e-05, 'epoch': 0.07} {'loss': 1.1107, 'learning_rate': 1.995325070590642e-05, 'epoch': 0.07} {'loss': 0.8905, 'learning_rate': 1.995321908444151e-05, 'epoch': 0.07} {'loss': 0.739, 'learning_rate': 1.9953187452310825e-05, 'epoch': 0.07} {'loss': 0.9322, 'learning_rate': 1.9953155809514403e-05, 'epoch': 0.07} {'loss': 0.9945, 'learning_rate': 1.9953124156052274e-05, 'epoch': 0.07} {'loss': 0.8304, 'learning_rate': 1.995309249192448e-05, 'epoch': 0.07} {'loss': 0.8406, 'learning_rate': 1.9953060817131042e-05, 'epoch': 0.07} {'loss': 0.9754, 'learning_rate': 1.9953029131672006e-05, 'epoch': 0.07} {'loss': 0.8129, 'learning_rate': 1.99529974355474e-05, 'epoch': 0.07} {'loss': 0.9544, 'learning_rate': 1.995296572875726e-05, 'epoch': 0.07} {'loss': 0.9977, 'learning_rate': 1.9952934011301615e-05, 'epoch': 0.07} {'loss': 0.8074, 'learning_rate': 1.9952902283180504e-05, 'epoch': 0.07} {'loss': 1.0184, 'learning_rate': 1.995287054439396e-05, 'epoch': 0.07} {'loss': 0.8723, 'learning_rate': 1.9952838794942017e-05, 'epoch': 0.07} {'loss': 0.9787, 'learning_rate': 1.995280703482471e-05, 'epoch': 0.07} {'loss': 0.8129, 'learning_rate': 1.9952775264042072e-05, 'epoch': 0.07} {'loss': 1.2479, 'learning_rate': 1.995274348259414e-05, 'epoch': 0.07} {'loss': 0.9022, 'learning_rate': 1.9952711690480943e-05, 'epoch': 0.07} {'loss': 0.9287, 'learning_rate': 1.995267988770251e-05, 'epoch': 0.07} {'loss': 0.9398, 'learning_rate': 1.995264807425889e-05, 'epoch': 0.07} {'loss': 0.9768, 'learning_rate': 1.9952616250150107e-05, 'epoch': 0.07} {'loss': 0.9505, 'learning_rate': 1.99525844153762e-05, 'epoch': 0.07} {'loss': 0.9005, 'learning_rate': 1.99525525699372e-05, 'epoch': 0.07} {'loss': 1.111, 'learning_rate': 1.9952520713833137e-05, 'epoch': 0.07} {'loss': 1.1107, 'learning_rate': 1.9952488847064053e-05, 'epoch': 0.07} {'loss': 0.7903, 'learning_rate': 1.9952456969629977e-05, 'epoch': 0.07} {'loss': 0.9763, 'learning_rate': 1.995242508153095e-05, 'epoch': 0.07} {'loss': 0.9345, 'learning_rate': 1.9952393182767e-05, 'epoch': 0.07} {'loss': 1.019, 'learning_rate': 1.9952361273338158e-05, 'epoch': 0.07} {'loss': 0.9911, 'learning_rate': 1.9952329353244467e-05, 'epoch': 0.07} {'loss': 1.0654, 'learning_rate': 1.9952297422485954e-05, 'epoch': 0.07} {'loss': 0.9482, 'learning_rate': 1.9952265481062655e-05, 'epoch': 0.07} {'loss': 1.1061, 'learning_rate': 1.995223352897461e-05, 'epoch': 0.07} {'loss': 1.0223, 'learning_rate': 1.9952201566221845e-05, 'epoch': 0.07} {'loss': 0.8844, 'learning_rate': 1.9952169592804398e-05, 'epoch': 0.07} {'loss': 0.8713, 'learning_rate': 1.9952137608722304e-05, 'epoch': 0.07} {'loss': 0.9964, 'learning_rate': 1.9952105613975598e-05, 'epoch': 0.07} {'loss': 0.8557, 'learning_rate': 1.995207360856431e-05, 'epoch': 0.07} {'loss': 0.8871, 'learning_rate': 1.9952041592488478e-05, 'epoch': 0.07} {'loss': 0.8498, 'learning_rate': 1.9952009565748135e-05, 'epoch': 0.07} {'loss': 0.9445, 'learning_rate': 1.9951977528343315e-05, 'epoch': 0.07} {'loss': 0.9394, 'learning_rate': 1.9951945480274052e-05, 'epoch': 0.07} {'loss': 1.0402, 'learning_rate': 1.9951913421540383e-05, 'epoch': 0.07} {'loss': 1.1295, 'learning_rate': 1.995188135214234e-05, 'epoch': 0.07} {'loss': 0.954, 'learning_rate': 1.995184927207996e-05, 'epoch': 0.07} {'loss': 0.8967, 'learning_rate': 1.9951817181353272e-05, 'epoch': 0.07} {'loss': 1.0062, 'learning_rate': 1.9951785079962312e-05, 'epoch': 0.07} {'loss': 1.0492, 'learning_rate': 1.995175296790712e-05, 'epoch': 0.07} {'loss': 1.0406, 'learning_rate': 1.995172084518773e-05, 'epoch': 0.07} {'loss': 1.0359, 'learning_rate': 1.9951688711804166e-05, 'epoch': 0.07} {'loss': 0.9988, 'learning_rate': 1.995165656775647e-05, 'epoch': 0.07} {'loss': 1.0861, 'learning_rate': 1.995162441304468e-05, 'epoch': 0.07} {'loss': 0.9008, 'learning_rate': 1.9951592247668824e-05, 'epoch': 0.07} {'loss': 0.8246, 'learning_rate': 1.9951560071628936e-05, 'epoch': 0.07} {'loss': 0.9405, 'learning_rate': 1.995152788492506e-05, 'epoch': 0.07} {'loss': 0.8837, 'learning_rate': 1.9951495687557213e-05, 'epoch': 0.07} {'loss': 0.847, 'learning_rate': 1.995146347952545e-05, 'epoch': 0.07} {'loss': 0.8305, 'learning_rate': 1.995143126082979e-05, 'epoch': 0.07} {'loss': 0.9959, 'learning_rate': 1.9951399031470277e-05, 'epoch': 0.07} {'loss': 1.0237, 'learning_rate': 1.995136679144694e-05, 'epoch': 0.07} {'loss': 0.8966, 'learning_rate': 1.9951334540759816e-05, 'epoch': 0.07} {'loss': 0.9816, 'learning_rate': 1.9951302279408938e-05, 'epoch': 0.07} {'loss': 1.0856, 'learning_rate': 1.995127000739434e-05, 'epoch': 0.07} {'loss': 0.9514, 'learning_rate': 1.995123772471606e-05, 'epoch': 0.07} {'loss': 0.9911, 'learning_rate': 1.995120543137413e-05, 'epoch': 0.07} {'loss': 1.0138, 'learning_rate': 1.9951173127368587e-05, 'epoch': 0.07} {'loss': 0.8914, 'learning_rate': 1.9951140812699462e-05, 'epoch': 0.07} {'loss': 0.9985, 'learning_rate': 1.995110848736679e-05, 'epoch': 0.07} {'loss': 1.0689, 'learning_rate': 1.9951076151370612e-05, 'epoch': 0.07} {'loss': 0.8038, 'learning_rate': 1.9951043804710953e-05, 'epoch': 0.07} {'loss': 0.7722, 'learning_rate': 1.9951011447387857e-05, 'epoch': 0.07} {'loss': 0.8358, 'learning_rate': 1.995097907940135e-05, 'epoch': 0.07} {'loss': 0.9649, 'learning_rate': 1.9950946700751474e-05, 'epoch': 0.07} {'loss': 0.9548, 'learning_rate': 1.9950914311438257e-05, 'epoch': 0.07} {'loss': 1.0617, 'learning_rate': 1.995088191146174e-05, 'epoch': 0.07} {'loss': 1.0114, 'learning_rate': 1.9950849500821955e-05, 'epoch': 0.07} {'loss': 1.0673, 'learning_rate': 1.9950817079518933e-05, 'epoch': 0.07} {'loss': 1.1343, 'learning_rate': 1.9950784647552716e-05, 'epoch': 0.07} {'loss': 0.9854, 'learning_rate': 1.9950752204923332e-05, 'epoch': 0.07} {'loss': 0.832, 'learning_rate': 1.9950719751630824e-05, 'epoch': 0.07} {'loss': 1.0497, 'learning_rate': 1.9950687287675218e-05, 'epoch': 0.07} {'loss': 0.8592, 'learning_rate': 1.9950654813056554e-05, 'epoch': 0.07} {'loss': 1.0101, 'learning_rate': 1.995062232777486e-05, 'epoch': 0.07} {'loss': 0.9084, 'learning_rate': 1.995058983183018e-05, 'epoch': 0.07} {'loss': 0.8661, 'learning_rate': 1.995055732522255e-05, 'epoch': 0.07} {'loss': 1.0058, 'learning_rate': 1.9950524807951993e-05, 'epoch': 0.07} {'loss': 0.8442, 'learning_rate': 1.995049228001855e-05, 'epoch': 0.07} {'loss': 0.9188, 'learning_rate': 1.9950459741422263e-05, 'epoch': 0.07} {'loss': 1.0276, 'learning_rate': 1.9950427192163155e-05, 'epoch': 0.07} {'loss': 0.6717, 'learning_rate': 1.9950394632241267e-05, 'epoch': 0.07} {'loss': 1.0562, 'learning_rate': 1.9950362061656633e-05, 'epoch': 0.07} {'loss': 0.9493, 'learning_rate': 1.995032948040929e-05, 'epoch': 0.07} {'loss': 1.0607, 'learning_rate': 1.995029688849927e-05, 'epoch': 0.07} {'loss': 0.7458, 'learning_rate': 1.995026428592661e-05, 'epoch': 0.07} {'loss': 0.9798, 'learning_rate': 1.995023167269134e-05, 'epoch': 0.07} {'loss': 1.1528, 'learning_rate': 1.99501990487935e-05, 'epoch': 0.07} {'loss': 1.0161, 'learning_rate': 1.9950166414233126e-05, 'epoch': 0.07} {'loss': 0.9705, 'learning_rate': 1.9950133769010246e-05, 'epoch': 0.07} {'loss': 0.9007, 'learning_rate': 1.9950101113124906e-05, 'epoch': 0.07} {'loss': 1.008, 'learning_rate': 1.995006844657713e-05, 'epoch': 0.07} {'loss': 0.9743, 'learning_rate': 1.9950035769366958e-05, 'epoch': 0.07} {'loss': 0.8959, 'learning_rate': 1.9950003081494428e-05, 'epoch': 0.07} {'loss': 0.9495, 'learning_rate': 1.9949970382959565e-05, 'epoch': 0.07} {'loss': 0.9291, 'learning_rate': 1.9949937673762415e-05, 'epoch': 0.07} {'loss': 1.0357, 'learning_rate': 1.994990495390301e-05, 'epoch': 0.07} {'loss': 1.1214, 'learning_rate': 1.9949872223381382e-05, 'epoch': 0.07} {'loss': 1.03, 'learning_rate': 1.9949839482197568e-05, 'epoch': 0.07} {'loss': 0.9715, 'learning_rate': 1.9949806730351604e-05, 'epoch': 0.07} {'loss': 0.89, 'learning_rate': 1.994977396784352e-05, 'epoch': 0.07} {'loss': 0.9716, 'learning_rate': 1.994974119467336e-05, 'epoch': 0.07} {'loss': 0.9533, 'learning_rate': 1.9949708410841152e-05, 'epoch': 0.07} {'loss': 1.0434, 'learning_rate': 1.9949675616346934e-05, 'epoch': 0.07} {'loss': 0.9471, 'learning_rate': 1.9949642811190742e-05, 'epoch': 0.07} {'loss': 1.1718, 'learning_rate': 1.994960999537261e-05, 'epoch': 0.07} {'loss': 0.9207, 'learning_rate': 1.9949577168892573e-05, 'epoch': 0.07} {'loss': 0.7647, 'learning_rate': 1.9949544331750662e-05, 'epoch': 0.07} {'loss': 0.9844, 'learning_rate': 1.9949511483946917e-05, 'epoch': 0.07} {'loss': 0.9426, 'learning_rate': 1.9949478625481376e-05, 'epoch': 0.07} {'loss': 1.0835, 'learning_rate': 1.9949445756354068e-05, 'epoch': 0.07} {'loss': 0.982, 'learning_rate': 1.994941287656503e-05, 'epoch': 0.07} {'loss': 0.8806, 'learning_rate': 1.9949379986114302e-05, 'epoch': 0.07} {'loss': 1.1027, 'learning_rate': 1.9949347085001912e-05, 'epoch': 0.07} {'loss': 1.0312, 'learning_rate': 1.99493141732279e-05, 'epoch': 0.07} {'loss': 0.9347, 'learning_rate': 1.99492812507923e-05, 'epoch': 0.07} {'loss': 0.9282, 'learning_rate': 1.9949248317695147e-05, 'epoch': 0.07} {'loss': 0.9812, 'learning_rate': 1.9949215373936477e-05, 'epoch': 0.07} {'loss': 0.9358, 'learning_rate': 1.9949182419516323e-05, 'epoch': 0.07} {'loss': 0.8946, 'learning_rate': 1.994914945443472e-05, 'epoch': 0.07} {'loss': 0.9727, 'learning_rate': 1.994911647869171e-05, 'epoch': 0.07} {'loss': 1.0531, 'learning_rate': 1.9949083492287325e-05, 'epoch': 0.07} {'loss': 1.0476, 'learning_rate': 1.9949050495221595e-05, 'epoch': 0.07} {'loss': 0.8618, 'learning_rate': 1.994901748749456e-05, 'epoch': 0.07} {'loss': 0.9421, 'learning_rate': 1.9948984469106255e-05, 'epoch': 0.07} {'loss': 0.8408, 'learning_rate': 1.9948951440056717e-05, 'epoch': 0.07} {'loss': 1.038, 'learning_rate': 1.9948918400345976e-05, 'epoch': 0.07} {'loss': 0.9544, 'learning_rate': 1.9948885349974075e-05, 'epoch': 0.07} {'loss': 1.0713, 'learning_rate': 1.9948852288941045e-05, 'epoch': 0.07} {'loss': 0.8727, 'learning_rate': 1.994881921724692e-05, 'epoch': 0.07} {'loss': 1.0024, 'learning_rate': 1.9948786134891734e-05, 'epoch': 0.07} {'loss': 0.9933, 'learning_rate': 1.994875304187553e-05, 'epoch': 0.07} {'loss': 0.8907, 'learning_rate': 1.994871993819834e-05, 'epoch': 0.07} {'loss': 0.9378, 'learning_rate': 1.99486868238602e-05, 'epoch': 0.07} {'loss': 0.9446, 'learning_rate': 1.9948653698861137e-05, 'epoch': 0.07} {'loss': 1.0623, 'learning_rate': 1.99486205632012e-05, 'epoch': 0.07} {'loss': 0.9886, 'learning_rate': 1.9948587416880416e-05, 'epoch': 0.07} {'loss': 0.8266, 'learning_rate': 1.9948554259898824e-05, 'epoch': 0.07} {'loss': 0.7428, 'learning_rate': 1.9948521092256455e-05, 'epoch': 0.07} {'loss': 0.9165, 'learning_rate': 1.994848791395335e-05, 'epoch': 0.07} {'loss': 0.7953, 'learning_rate': 1.9948454724989545e-05, 'epoch': 0.07} {'loss': 0.9914, 'learning_rate': 1.9948421525365068e-05, 'epoch': 0.07} {'loss': 0.9274, 'learning_rate': 1.994838831507996e-05, 'epoch': 0.07} {'loss': 0.9376, 'learning_rate': 1.994835509413426e-05, 'epoch': 0.07} {'loss': 0.9924, 'learning_rate': 1.9948321862527996e-05, 'epoch': 0.07} {'loss': 0.9263, 'learning_rate': 1.9948288620261208e-05, 'epoch': 0.07} {'loss': 0.8856, 'learning_rate': 1.994825536733393e-05, 'epoch': 0.07} {'loss': 0.9695, 'learning_rate': 1.99482221037462e-05, 'epoch': 0.07} {'loss': 0.9717, 'learning_rate': 1.994818882949805e-05, 'epoch': 0.07} {'loss': 0.8739, 'learning_rate': 1.9948155544589523e-05, 'epoch': 0.07} {'loss': 0.9508, 'learning_rate': 1.9948122249020646e-05, 'epoch': 0.07} {'loss': 0.7178, 'learning_rate': 1.994808894279146e-05, 'epoch': 0.07} {'loss': 0.7987, 'learning_rate': 1.9948055625901993e-05, 'epoch': 0.07} {'loss': 0.8162, 'learning_rate': 1.994802229835229e-05, 'epoch': 0.07} {'loss': 0.9933, 'learning_rate': 1.9947988960142383e-05, 'epoch': 0.07} {'loss': 0.8835, 'learning_rate': 1.994795561127231e-05, 'epoch': 0.07} {'loss': 1.069, 'learning_rate': 1.9947922251742105e-05, 'epoch': 0.07} {'loss': 0.9513, 'learning_rate': 1.99478888815518e-05, 'epoch': 0.07} {'loss': 0.7826, 'learning_rate': 1.9947855500701436e-05, 'epoch': 0.07} {'loss': 1.0926, 'learning_rate': 1.9947822109191047e-05, 'epoch': 0.07} {'loss': 0.9517, 'learning_rate': 1.994778870702067e-05, 'epoch': 0.07} {'loss': 0.7815, 'learning_rate': 1.9947755294190337e-05, 'epoch': 0.07} {'loss': 0.8664, 'learning_rate': 1.9947721870700088e-05, 'epoch': 0.07} {'loss': 0.9838, 'learning_rate': 1.994768843654996e-05, 'epoch': 0.07} {'loss': 1.0258, 'learning_rate': 1.994765499173998e-05, 'epoch': 0.07} {'loss': 0.9375, 'learning_rate': 1.9947621536270195e-05, 'epoch': 0.07} {'loss': 1.0179, 'learning_rate': 1.9947588070140632e-05, 'epoch': 0.07} {'loss': 0.9665, 'learning_rate': 1.9947554593351332e-05, 'epoch': 0.07} {'loss': 1.0072, 'learning_rate': 1.9947521105902326e-05, 'epoch': 0.07} {'loss': 0.892, 'learning_rate': 1.9947487607793658e-05, 'epoch': 0.07} {'loss': 1.0134, 'learning_rate': 1.994745409902536e-05, 'epoch': 0.07} {'loss': 0.9039, 'learning_rate': 1.9947420579597466e-05, 'epoch': 0.07} {'loss': 1.0063, 'learning_rate': 1.9947387049510014e-05, 'epoch': 0.07} {'loss': 0.9423, 'learning_rate': 1.9947353508763035e-05, 'epoch': 0.07} {'loss': 0.9405, 'learning_rate': 1.994731995735657e-05, 'epoch': 0.07} {'loss': 0.9427, 'learning_rate': 1.9947286395290655e-05, 'epoch': 0.07} {'loss': 1.0557, 'learning_rate': 1.9947252822565323e-05, 'epoch': 0.07} {'loss': 0.8908, 'learning_rate': 1.9947219239180616e-05, 'epoch': 0.07} {'loss': 0.9045, 'learning_rate': 1.9947185645136563e-05, 'epoch': 0.07} {'loss': 1.0106, 'learning_rate': 1.9947152040433206e-05, 'epoch': 0.07} {'loss': 1.0105, 'learning_rate': 1.9947118425070572e-05, 'epoch': 0.07} {'loss': 0.8561, 'learning_rate': 1.9947084799048704e-05, 'epoch': 0.07} {'loss': 0.9467, 'learning_rate': 1.994705116236764e-05, 'epoch': 0.07} {'loss': 0.8679, 'learning_rate': 1.994701751502741e-05, 'epoch': 0.07} {'loss': 0.7092, 'learning_rate': 1.9946983857028055e-05, 'epoch': 0.07} {'loss': 0.9152, 'learning_rate': 1.9946950188369608e-05, 'epoch': 0.07} {'loss': 0.692, 'learning_rate': 1.9946916509052108e-05, 'epoch': 0.07} {'loss': 0.8537, 'learning_rate': 1.994688281907559e-05, 'epoch': 0.07} {'loss': 0.8817, 'learning_rate': 1.9946849118440083e-05, 'epoch': 0.07} {'loss': 1.1922, 'learning_rate': 1.9946815407145635e-05, 'epoch': 0.07} {'loss': 0.9392, 'learning_rate': 1.9946781685192274e-05, 'epoch': 0.07} {'loss': 0.9245, 'learning_rate': 1.994674795258004e-05, 'epoch': 0.07} {'loss': 0.7595, 'learning_rate': 1.9946714209308968e-05, 'epoch': 0.07} {'loss': 0.7871, 'learning_rate': 1.9946680455379094e-05, 'epoch': 0.07} {'loss': 0.9592, 'learning_rate': 1.9946646690790455e-05, 'epoch': 0.07} {'loss': 0.7888, 'learning_rate': 1.9946612915543082e-05, 'epoch': 0.07} {'loss': 0.8731, 'learning_rate': 1.994657912963702e-05, 'epoch': 0.07} {'loss': 0.8292, 'learning_rate': 1.9946545333072297e-05, 'epoch': 0.07} {'loss': 0.833, 'learning_rate': 1.9946511525848956e-05, 'epoch': 0.07} {'loss': 0.86, 'learning_rate': 1.994647770796703e-05, 'epoch': 0.07} {'loss': 0.9834, 'learning_rate': 1.9946443879426557e-05, 'epoch': 0.07} {'loss': 1.1694, 'learning_rate': 1.9946410040227567e-05, 'epoch': 0.07} {'loss': 1.1059, 'learning_rate': 1.9946376190370103e-05, 'epoch': 0.07} {'loss': 0.8928, 'learning_rate': 1.99463423298542e-05, 'epoch': 0.07} {'loss': 1.0868, 'learning_rate': 1.9946308458679892e-05, 'epoch': 0.07} {'loss': 1.1279, 'learning_rate': 1.994627457684722e-05, 'epoch': 0.07} {'loss': 0.9767, 'learning_rate': 1.9946240684356212e-05, 'epoch': 0.07} {'loss': 0.8812, 'learning_rate': 1.9946206781206915e-05, 'epoch': 0.07} {'loss': 0.8414, 'learning_rate': 1.9946172867399355e-05, 'epoch': 0.07} {'loss': 0.9536, 'learning_rate': 1.9946138942933576e-05, 'epoch': 0.07} {'loss': 0.9115, 'learning_rate': 1.9946105007809612e-05, 'epoch': 0.07} {'loss': 1.1204, 'learning_rate': 1.9946071062027497e-05, 'epoch': 0.07} {'loss': 0.897, 'learning_rate': 1.9946037105587268e-05, 'epoch': 0.07} {'loss': 0.9321, 'learning_rate': 1.9946003138488965e-05, 'epoch': 0.07} {'loss': 0.8605, 'learning_rate': 1.994596916073262e-05, 'epoch': 0.07} {'loss': 0.8929, 'learning_rate': 1.9945935172318273e-05, 'epoch': 0.07} {'loss': 0.9633, 'learning_rate': 1.9945901173245957e-05, 'epoch': 0.07} {'loss': 1.1072, 'learning_rate': 1.994586716351571e-05, 'epoch': 0.07} {'loss': 0.9702, 'learning_rate': 1.9945833143127573e-05, 'epoch': 0.07} {'loss': 0.9393, 'learning_rate': 1.9945799112081573e-05, 'epoch': 0.07} {'loss': 0.9463, 'learning_rate': 1.9945765070377754e-05, 'epoch': 0.07} {'loss': 0.9457, 'learning_rate': 1.994573101801615e-05, 'epoch': 0.07} {'loss': 0.978, 'learning_rate': 1.9945696954996797e-05, 'epoch': 0.07} {'loss': 1.0748, 'learning_rate': 1.9945662881319734e-05, 'epoch': 0.07} {'loss': 0.8326, 'learning_rate': 1.9945628796984993e-05, 'epoch': 0.07} {'loss': 0.9497, 'learning_rate': 1.9945594701992614e-05, 'epoch': 0.07} {'loss': 0.9549, 'learning_rate': 1.994556059634263e-05, 'epoch': 0.07} {'loss': 1.0688, 'learning_rate': 1.9945526480035084e-05, 'epoch': 0.07} {'loss': 1.0279, 'learning_rate': 1.994549235307001e-05, 'epoch': 0.07} {'loss': 0.9944, 'learning_rate': 1.994545821544744e-05, 'epoch': 0.07} {'loss': 0.8884, 'learning_rate': 1.9945424067167415e-05, 'epoch': 0.07} {'loss': 0.8355, 'learning_rate': 1.994538990822997e-05, 'epoch': 0.07} {'loss': 0.9421, 'learning_rate': 1.994535573863514e-05, 'epoch': 0.07} {'loss': 0.7562, 'learning_rate': 1.9945321558382968e-05, 'epoch': 0.07} {'loss': 0.9623, 'learning_rate': 1.9945287367473485e-05, 'epoch': 0.07} {'loss': 1.0971, 'learning_rate': 1.994525316590673e-05, 'epoch': 0.07} {'loss': 0.8804, 'learning_rate': 1.9945218953682736e-05, 'epoch': 0.07} {'loss': 1.0238, 'learning_rate': 1.994518473080154e-05, 'epoch': 0.07} {'loss': 0.8925, 'learning_rate': 1.9945150497263187e-05, 'epoch': 0.07} {'loss': 0.8533, 'learning_rate': 1.9945116253067705e-05, 'epoch': 0.07} {'loss': 0.8535, 'learning_rate': 1.9945081998215133e-05, 'epoch': 0.07} {'loss': 1.0262, 'learning_rate': 1.994504773270551e-05, 'epoch': 0.07} {'loss': 1.0124, 'learning_rate': 1.9945013456538868e-05, 'epoch': 0.07} {'loss': 1.0674, 'learning_rate': 1.9944979169715247e-05, 'epoch': 0.07} {'loss': 0.753, 'learning_rate': 1.9944944872234684e-05, 'epoch': 0.07} {'loss': 0.7808, 'learning_rate': 1.9944910564097214e-05, 'epoch': 0.07} {'loss': 0.9047, 'learning_rate': 1.9944876245302876e-05, 'epoch': 0.07} {'loss': 0.8911, 'learning_rate': 1.9944841915851706e-05, 'epoch': 0.07} {'loss': 0.9764, 'learning_rate': 1.9944807575743736e-05, 'epoch': 0.07} {'loss': 1.0153, 'learning_rate': 1.9944773224979014e-05, 'epoch': 0.07} {'loss': 0.8699, 'learning_rate': 1.9944738863557564e-05, 'epoch': 0.07} {'loss': 0.9194, 'learning_rate': 1.9944704491479433e-05, 'epoch': 0.07} {'loss': 0.8743, 'learning_rate': 1.9944670108744648e-05, 'epoch': 0.07} {'loss': 0.8469, 'learning_rate': 1.9944635715353254e-05, 'epoch': 0.07} {'loss': 1.052, 'learning_rate': 1.994460131130529e-05, 'epoch': 0.07} {'loss': 1.0089, 'learning_rate': 1.9944566896600782e-05, 'epoch': 0.07} {'loss': 0.6939, 'learning_rate': 1.9944532471239776e-05, 'epoch': 0.07} {'loss': 0.9606, 'learning_rate': 1.9944498035222306e-05, 'epoch': 0.07} {'loss': 1.024, 'learning_rate': 1.9944463588548406e-05, 'epoch': 0.07} {'loss': 0.889, 'learning_rate': 1.994442913121812e-05, 'epoch': 0.07} {'loss': 0.9422, 'learning_rate': 1.9944394663231475e-05, 'epoch': 0.07} {'loss': 0.8814, 'learning_rate': 1.994436018458852e-05, 'epoch': 0.07} {'loss': 1.0537, 'learning_rate': 1.9944325695289285e-05, 'epoch': 0.07} {'loss': 1.0462, 'learning_rate': 1.9944291195333804e-05, 'epoch': 0.07} {'loss': 0.9271, 'learning_rate': 1.9944256684722117e-05, 'epoch': 0.07} {'loss': 0.8735, 'learning_rate': 1.9944222163454263e-05, 'epoch': 0.07} {'loss': 1.156, 'learning_rate': 1.9944187631530275e-05, 'epoch': 0.07} {'loss': 1.0702, 'learning_rate': 1.99441530889502e-05, 'epoch': 0.07} {'loss': 1.0506, 'learning_rate': 1.994411853571406e-05, 'epoch': 0.07} {'loss': 0.9764, 'learning_rate': 1.99440839718219e-05, 'epoch': 0.07} {'loss': 0.7822, 'learning_rate': 1.9944049397273758e-05, 'epoch': 0.07} {'loss': 0.9812, 'learning_rate': 1.9944014812069673e-05, 'epoch': 0.07} {'loss': 1.0287, 'learning_rate': 1.9943980216209672e-05, 'epoch': 0.07} {'loss': 0.9095, 'learning_rate': 1.9943945609693804e-05, 'epoch': 0.07} {'loss': 0.8034, 'learning_rate': 1.99439109925221e-05, 'epoch': 0.07} {'loss': 0.9508, 'learning_rate': 1.9943876364694597e-05, 'epoch': 0.07} {'loss': 1.1292, 'learning_rate': 1.9943841726211333e-05, 'epoch': 0.07} {'loss': 1.0333, 'learning_rate': 1.9943807077072344e-05, 'epoch': 0.07} {'loss': 0.874, 'learning_rate': 1.994377241727767e-05, 'epoch': 0.07} {'loss': 0.8383, 'learning_rate': 1.9943737746827345e-05, 'epoch': 0.07} {'loss': 0.8859, 'learning_rate': 1.9943703065721407e-05, 'epoch': 0.07} {'loss': 0.8998, 'learning_rate': 1.9943668373959896e-05, 'epoch': 0.07} {'loss': 0.9293, 'learning_rate': 1.9943633671542845e-05, 'epoch': 0.07} {'loss': 0.9081, 'learning_rate': 1.9943598958470294e-05, 'epoch': 0.07} {'loss': 1.0162, 'learning_rate': 1.9943564234742277e-05, 'epoch': 0.07} {'loss': 1.0651, 'learning_rate': 1.9943529500358837e-05, 'epoch': 0.07} {'loss': 1.131, 'learning_rate': 1.9943494755320008e-05, 'epoch': 0.07} {'loss': 1.0337, 'learning_rate': 1.9943459999625822e-05, 'epoch': 0.07} {'loss': 0.9408, 'learning_rate': 1.9943425233276324e-05, 'epoch': 0.07} {'loss': 1.0363, 'learning_rate': 1.9943390456271548e-05, 'epoch': 0.07} {'loss': 0.7584, 'learning_rate': 1.9943355668611535e-05, 'epoch': 0.07} {'loss': 1.0331, 'learning_rate': 1.9943320870296318e-05, 'epoch': 0.07} {'loss': 1.0277, 'learning_rate': 1.9943286061325932e-05, 'epoch': 0.07} {'loss': 0.7073, 'learning_rate': 1.994325124170042e-05, 'epoch': 0.07} {'loss': 0.8904, 'learning_rate': 1.9943216411419813e-05, 'epoch': 0.07} {'loss': 0.7923, 'learning_rate': 1.9943181570484154e-05, 'epoch': 0.07} {'loss': 0.7941, 'learning_rate': 1.994314671889348e-05, 'epoch': 0.07} {'loss': 0.9809, 'learning_rate': 1.9943111856647827e-05, 'epoch': 0.07} {'loss': 0.9035, 'learning_rate': 1.9943076983747233e-05, 'epoch': 0.07} {'loss': 0.8228, 'learning_rate': 1.9943042100191733e-05, 'epoch': 0.07} {'loss': 0.8777, 'learning_rate': 1.9943007205981365e-05, 'epoch': 0.07} {'loss': 1.0066, 'learning_rate': 1.994297230111617e-05, 'epoch': 0.07} {'loss': 1.0207, 'learning_rate': 1.994293738559618e-05, 'epoch': 0.07} {'loss': 0.9643, 'learning_rate': 1.9942902459421435e-05, 'epoch': 0.07} {'loss': 1.0713, 'learning_rate': 1.9942867522591974e-05, 'epoch': 0.07} {'loss': 1.0066, 'learning_rate': 1.9942832575107835e-05, 'epoch': 0.07} {'loss': 1.0432, 'learning_rate': 1.994279761696905e-05, 'epoch': 0.07} {'loss': 1.1641, 'learning_rate': 1.9942762648175664e-05, 'epoch': 0.07} {'loss': 0.876, 'learning_rate': 1.994272766872771e-05, 'epoch': 0.07} {'loss': 0.8771, 'learning_rate': 1.9942692678625223e-05, 'epoch': 0.07} {'loss': 0.9142, 'learning_rate': 1.9942657677868244e-05, 'epoch': 0.07} {'loss': 0.8233, 'learning_rate': 1.994262266645681e-05, 'epoch': 0.07} {'loss': 1.0254, 'learning_rate': 1.994258764439096e-05, 'epoch': 0.07} {'loss': 0.9858, 'learning_rate': 1.9942552611670728e-05, 'epoch': 0.07} {'loss': 0.9617, 'learning_rate': 1.9942517568296153e-05, 'epoch': 0.07} {'loss': 0.8639, 'learning_rate': 1.9942482514267274e-05, 'epoch': 0.07} {'loss': 1.0346, 'learning_rate': 1.994244744958413e-05, 'epoch': 0.07} {'loss': 0.9453, 'learning_rate': 1.9942412374246753e-05, 'epoch': 0.07} {'loss': 0.9014, 'learning_rate': 1.9942377288255183e-05, 'epoch': 0.07} {'loss': 0.8318, 'learning_rate': 1.994234219160946e-05, 'epoch': 0.07} {'loss': 1.0358, 'learning_rate': 1.9942307084309624e-05, 'epoch': 0.07} {'loss': 0.9571, 'learning_rate': 1.9942271966355703e-05, 'epoch': 0.07} {'loss': 0.9688, 'learning_rate': 1.994223683774774e-05, 'epoch': 0.07} {'loss': 0.8575, 'learning_rate': 1.9942201698485777e-05, 'epoch': 0.07} {'loss': 1.0262, 'learning_rate': 1.9942166548569847e-05, 'epoch': 0.07} {'loss': 0.8546, 'learning_rate': 1.9942131387999987e-05, 'epoch': 0.07} {'loss': 0.9381, 'learning_rate': 1.9942096216776235e-05, 'epoch': 0.07} {'loss': 0.9307, 'learning_rate': 1.9942061034898628e-05, 'epoch': 0.07} {'loss': 0.7387, 'learning_rate': 1.994202584236721e-05, 'epoch': 0.07} {'loss': 0.8944, 'learning_rate': 1.994199063918201e-05, 'epoch': 0.07} {'loss': 0.9834, 'learning_rate': 1.994195542534307e-05, 'epoch': 0.07} {'loss': 0.9759, 'learning_rate': 1.9941920200850432e-05, 'epoch': 0.07} {'loss': 0.9507, 'learning_rate': 1.9941884965704122e-05, 'epoch': 0.07} {'loss': 1.023, 'learning_rate': 1.994184971990419e-05, 'epoch': 0.07} {'loss': 1.0638, 'learning_rate': 1.994181446345067e-05, 'epoch': 0.07} {'loss': 1.0931, 'learning_rate': 1.9941779196343594e-05, 'epoch': 0.07} {'loss': 1.0698, 'learning_rate': 1.9941743918583006e-05, 'epoch': 0.07} {'loss': 1.033, 'learning_rate': 1.9941708630168943e-05, 'epoch': 0.07} {'loss': 0.8834, 'learning_rate': 1.994167333110144e-05, 'epoch': 0.07} {'loss': 0.8611, 'learning_rate': 1.9941638021380538e-05, 'epoch': 0.07} {'loss': 0.8555, 'learning_rate': 1.9941602701006274e-05, 'epoch': 0.07} {'loss': 0.8298, 'learning_rate': 1.9941567369978684e-05, 'epoch': 0.07} {'loss': 0.8649, 'learning_rate': 1.994153202829781e-05, 'epoch': 0.07} {'loss': 1.0776, 'learning_rate': 1.9941496675963684e-05, 'epoch': 0.07} {'loss': 0.8951, 'learning_rate': 1.994146131297635e-05, 'epoch': 0.07} {'loss': 1.1367, 'learning_rate': 1.9941425939335842e-05, 'epoch': 0.07} {'loss': 1.1245, 'learning_rate': 1.9941390555042196e-05, 'epoch': 0.07} {'loss': 0.8349, 'learning_rate': 1.9941355160095453e-05, 'epoch': 0.07} {'loss': 1.0412, 'learning_rate': 1.9941319754495655e-05, 'epoch': 0.08} {'loss': 0.9632, 'learning_rate': 1.9941284338242836e-05, 'epoch': 0.08} {'loss': 1.0373, 'learning_rate': 1.994124891133703e-05, 'epoch': 0.08} {'loss': 1.0792, 'learning_rate': 1.9941213473778277e-05, 'epoch': 0.08} {'loss': 0.9258, 'learning_rate': 1.994117802556662e-05, 'epoch': 0.08} {'loss': 0.8819, 'learning_rate': 1.9941142566702094e-05, 'epoch': 0.08} {'loss': 0.951, 'learning_rate': 1.9941107097184732e-05, 'epoch': 0.08} {'loss': 0.9418, 'learning_rate': 1.9941071617014583e-05, 'epoch': 0.08} {'loss': 0.9033, 'learning_rate': 1.9941036126191673e-05, 'epoch': 0.08} {'loss': 0.8914, 'learning_rate': 1.9941000624716046e-05, 'epoch': 0.08} {'loss': 0.9572, 'learning_rate': 1.9940965112587743e-05, 'epoch': 0.08} {'loss': 0.8625, 'learning_rate': 1.9940929589806795e-05, 'epoch': 0.08} {'loss': 1.0819, 'learning_rate': 1.9940894056373245e-05, 'epoch': 0.08} {'loss': 1.0986, 'learning_rate': 1.994085851228713e-05, 'epoch': 0.08} {'loss': 1.0874, 'learning_rate': 1.9940822957548488e-05, 'epoch': 0.08} {'loss': 0.97, 'learning_rate': 1.994078739215736e-05, 'epoch': 0.08} {'loss': 0.9652, 'learning_rate': 1.9940751816113778e-05, 'epoch': 0.08} {'loss': 0.9021, 'learning_rate': 1.9940716229417784e-05, 'epoch': 0.08} {'loss': 0.8353, 'learning_rate': 1.9940680632069415e-05, 'epoch': 0.08} {'loss': 0.8402, 'learning_rate': 1.994064502406871e-05, 'epoch': 0.08} {'loss': 0.6479, 'learning_rate': 1.9940609405415703e-05, 'epoch': 0.08} {'loss': 0.9709, 'learning_rate': 1.994057377611044e-05, 'epoch': 0.08} {'loss': 1.0159, 'learning_rate': 1.9940538136152954e-05, 'epoch': 0.08} {'loss': 0.8844, 'learning_rate': 1.9940502485543286e-05, 'epoch': 0.08} {'loss': 0.9417, 'learning_rate': 1.994046682428147e-05, 'epoch': 0.08} {'loss': 0.8195, 'learning_rate': 1.9940431152367544e-05, 'epoch': 0.08} {'loss': 1.077, 'learning_rate': 1.9940395469801555e-05, 'epoch': 0.08} {'loss': 0.9997, 'learning_rate': 1.9940359776583527e-05, 'epoch': 0.08} {'loss': 0.887, 'learning_rate': 1.994032407271351e-05, 'epoch': 0.08} {'loss': 0.9724, 'learning_rate': 1.9940288358191544e-05, 'epoch': 0.08} {'loss': 0.9578, 'learning_rate': 1.9940252633017657e-05, 'epoch': 0.08} {'loss': 0.9478, 'learning_rate': 1.9940216897191894e-05, 'epoch': 0.08} {'loss': 0.9947, 'learning_rate': 1.994018115071429e-05, 'epoch': 0.08} {'loss': 0.9877, 'learning_rate': 1.9940145393584883e-05, 'epoch': 0.08} {'loss': 0.9889, 'learning_rate': 1.9940109625803717e-05, 'epoch': 0.08} {'loss': 0.8873, 'learning_rate': 1.9940073847370824e-05, 'epoch': 0.08} {'loss': 0.9313, 'learning_rate': 1.9940038058286247e-05, 'epoch': 0.08} {'loss': 0.9713, 'learning_rate': 1.994000225855002e-05, 'epoch': 0.08} {'loss': 0.9375, 'learning_rate': 1.9939966448162184e-05, 'epoch': 0.08} {'loss': 1.1101, 'learning_rate': 1.9939930627122775e-05, 'epoch': 0.08} {'loss': 0.9028, 'learning_rate': 1.9939894795431834e-05, 'epoch': 0.08} {'loss': 1.2095, 'learning_rate': 1.99398589530894e-05, 'epoch': 0.08} {'loss': 1.0024, 'learning_rate': 1.993982310009551e-05, 'epoch': 0.08} {'loss': 1.0154, 'learning_rate': 1.9939787236450202e-05, 'epoch': 0.08} {'loss': 0.9527, 'learning_rate': 1.9939751362153515e-05, 'epoch': 0.08} {'loss': 1.108, 'learning_rate': 1.9939715477205487e-05, 'epoch': 0.08} {'loss': 1.045, 'learning_rate': 1.9939679581606155e-05, 'epoch': 0.08} {'loss': 0.8377, 'learning_rate': 1.993964367535556e-05, 'epoch': 0.08} {'loss': 0.9545, 'learning_rate': 1.9939607758453742e-05, 'epoch': 0.08} {'loss': 1.0034, 'learning_rate': 1.9939571830900736e-05, 'epoch': 0.08} {'loss': 0.9424, 'learning_rate': 1.993953589269658e-05, 'epoch': 0.08} {'loss': 0.8284, 'learning_rate': 1.9939499943841317e-05, 'epoch': 0.08} {'loss': 0.7027, 'learning_rate': 1.9939463984334982e-05, 'epoch': 0.08} {'loss': 1.0443, 'learning_rate': 1.9939428014177615e-05, 'epoch': 0.08} {'loss': 1.0492, 'learning_rate': 1.9939392033369248e-05, 'epoch': 0.08} {'loss': 1.0703, 'learning_rate': 1.993935604190993e-05, 'epoch': 0.08} {'loss': 0.922, 'learning_rate': 1.9939320039799695e-05, 'epoch': 0.08} {'loss': 1.145, 'learning_rate': 1.9939284027038583e-05, 'epoch': 0.08} {'loss': 0.8936, 'learning_rate': 1.9939248003626628e-05, 'epoch': 0.08} {'loss': 1.0293, 'learning_rate': 1.9939211969563873e-05, 'epoch': 0.08} {'loss': 1.0115, 'learning_rate': 1.9939175924850357e-05, 'epoch': 0.08} {'loss': 1.0618, 'learning_rate': 1.9939139869486114e-05, 'epoch': 0.08} {'loss': 0.6715, 'learning_rate': 1.9939103803471186e-05, 'epoch': 0.08} {'loss': 0.883, 'learning_rate': 1.9939067726805612e-05, 'epoch': 0.08} {'loss': 0.9946, 'learning_rate': 1.993903163948943e-05, 'epoch': 0.08} {'loss': 0.9481, 'learning_rate': 1.9938995541522678e-05, 'epoch': 0.08} {'loss': 0.9867, 'learning_rate': 1.9938959432905395e-05, 'epoch': 0.08} {'loss': 0.9419, 'learning_rate': 1.993892331363762e-05, 'epoch': 0.08} {'loss': 1.0807, 'learning_rate': 1.9938887183719394e-05, 'epoch': 0.08} {'loss': 1.1834, 'learning_rate': 1.993885104315075e-05, 'epoch': 0.08} {'loss': 0.9882, 'learning_rate': 1.9938814891931732e-05, 'epoch': 0.08} {'loss': 1.0152, 'learning_rate': 1.9938778730062376e-05, 'epoch': 0.08} {'loss': 1.1043, 'learning_rate': 1.993874255754272e-05, 'epoch': 0.08} {'loss': 0.7568, 'learning_rate': 1.993870637437281e-05, 'epoch': 0.08} {'loss': 0.948, 'learning_rate': 1.9938670180552676e-05, 'epoch': 0.08} {'loss': 1.1245, 'learning_rate': 1.9938633976082357e-05, 'epoch': 0.08} {'loss': 0.8308, 'learning_rate': 1.99385977609619e-05, 'epoch': 0.08} {'loss': 0.8401, 'learning_rate': 1.9938561535191333e-05, 'epoch': 0.08} {'loss': 0.8527, 'learning_rate': 1.9938525298770703e-05, 'epoch': 0.08} {'loss': 0.9763, 'learning_rate': 1.9938489051700044e-05, 'epoch': 0.08} {'loss': 0.9928, 'learning_rate': 1.99384527939794e-05, 'epoch': 0.08} {'loss': 0.9247, 'learning_rate': 1.9938416525608805e-05, 'epoch': 0.08} {'loss': 0.9944, 'learning_rate': 1.99383802465883e-05, 'epoch': 0.08} {'loss': 0.8834, 'learning_rate': 1.9938343956917924e-05, 'epoch': 0.08} {'loss': 0.9308, 'learning_rate': 1.993830765659772e-05, 'epoch': 0.08} {'loss': 0.6334, 'learning_rate': 1.9938271345627714e-05, 'epoch': 0.08} {'loss': 1.0578, 'learning_rate': 1.9938235024007957e-05, 'epoch': 0.08} {'loss': 0.9848, 'learning_rate': 1.9938198691738485e-05, 'epoch': 0.08} {'loss': 0.966, 'learning_rate': 1.9938162348819336e-05, 'epoch': 0.08} {'loss': 1.0758, 'learning_rate': 1.9938125995250547e-05, 'epoch': 0.08} {'loss': 0.7963, 'learning_rate': 1.993808963103216e-05, 'epoch': 0.08} {'loss': 0.9267, 'learning_rate': 1.9938053256164213e-05, 'epoch': 0.08} {'loss': 0.9935, 'learning_rate': 1.9938016870646747e-05, 'epoch': 0.08} {'loss': 0.9822, 'learning_rate': 1.9937980474479793e-05, 'epoch': 0.08} {'loss': 0.937, 'learning_rate': 1.9937944067663402e-05, 'epoch': 0.08} {'loss': 0.9301, 'learning_rate': 1.9937907650197608e-05, 'epoch': 0.08} {'loss': 1.0586, 'learning_rate': 1.9937871222082442e-05, 'epoch': 0.08} {'loss': 0.9213, 'learning_rate': 1.9937834783317957e-05, 'epoch': 0.08} {'loss': 0.8838, 'learning_rate': 1.993779833390418e-05, 'epoch': 0.08} {'loss': 0.9574, 'learning_rate': 1.9937761873841158e-05, 'epoch': 0.08} {'loss': 0.9769, 'learning_rate': 1.9937725403128928e-05, 'epoch': 0.08} {'loss': 0.8196, 'learning_rate': 1.993768892176753e-05, 'epoch': 0.08} {'loss': 0.8877, 'learning_rate': 1.9937652429756995e-05, 'epoch': 0.08} {'loss': 0.8343, 'learning_rate': 1.9937615927097373e-05, 'epoch': 0.08} {'loss': 0.8966, 'learning_rate': 1.9937579413788696e-05, 'epoch': 0.08} {'loss': 0.9323, 'learning_rate': 1.9937542889831006e-05, 'epoch': 0.08} {'loss': 1.0135, 'learning_rate': 1.9937506355224344e-05, 'epoch': 0.08} {'loss': 0.9604, 'learning_rate': 1.993746980996875e-05, 'epoch': 0.08} {'loss': 0.9364, 'learning_rate': 1.9937433254064253e-05, 'epoch': 0.08} {'loss': 0.9607, 'learning_rate': 1.9937396687510903e-05, 'epoch': 0.08} {'loss': 0.999, 'learning_rate': 1.9937360110308735e-05, 'epoch': 0.08} {'loss': 0.7716, 'learning_rate': 1.993732352245779e-05, 'epoch': 0.08} {'loss': 1.0043, 'learning_rate': 1.9937286923958106e-05, 'epoch': 0.08} {'loss': 0.9195, 'learning_rate': 1.9937250314809718e-05, 'epoch': 0.08} {'loss': 1.0532, 'learning_rate': 1.9937213695012673e-05, 'epoch': 0.08} {'loss': 0.8402, 'learning_rate': 1.9937177064567007e-05, 'epoch': 0.08} {'loss': 0.9063, 'learning_rate': 1.993714042347276e-05, 'epoch': 0.08} {'loss': 0.967, 'learning_rate': 1.9937103771729967e-05, 'epoch': 0.08} {'loss': 0.877, 'learning_rate': 1.993706710933867e-05, 'epoch': 0.08} {'loss': 0.9332, 'learning_rate': 1.993703043629891e-05, 'epoch': 0.08} {'loss': 0.8915, 'learning_rate': 1.9936993752610725e-05, 'epoch': 0.08} {'loss': 0.9689, 'learning_rate': 1.9936957058274157e-05, 'epoch': 0.08} {'loss': 0.9345, 'learning_rate': 1.993692035328924e-05, 'epoch': 0.08} {'loss': 0.6857, 'learning_rate': 1.9936883637656014e-05, 'epoch': 0.08} {'loss': 0.9225, 'learning_rate': 1.9936846911374523e-05, 'epoch': 0.08} {'loss': 0.9714, 'learning_rate': 1.99368101744448e-05, 'epoch': 0.08} {'loss': 0.9759, 'learning_rate': 1.9936773426866897e-05, 'epoch': 0.08} {'loss': 0.8809, 'learning_rate': 1.9936736668640836e-05, 'epoch': 0.08} {'loss': 0.8785, 'learning_rate': 1.9936699899766666e-05, 'epoch': 0.08} {'loss': 0.8264, 'learning_rate': 1.9936663120244432e-05, 'epoch': 0.08} {'loss': 0.8812, 'learning_rate': 1.993662633007416e-05, 'epoch': 0.08} {'loss': 0.9296, 'learning_rate': 1.9936589529255897e-05, 'epoch': 0.08} {'loss': 1.0071, 'learning_rate': 1.9936552717789682e-05, 'epoch': 0.08} {'loss': 1.1351, 'learning_rate': 1.993651589567555e-05, 'epoch': 0.08} {'loss': 0.9082, 'learning_rate': 1.9936479062913552e-05, 'epoch': 0.08} {'loss': 0.9954, 'learning_rate': 1.9936442219503715e-05, 'epoch': 0.08} {'loss': 1.0247, 'learning_rate': 1.9936405365446085e-05, 'epoch': 0.08} {'loss': 1.1878, 'learning_rate': 1.9936368500740698e-05, 'epoch': 0.08} {'loss': 0.8964, 'learning_rate': 1.99363316253876e-05, 'epoch': 0.08} {'loss': 0.916, 'learning_rate': 1.993629473938682e-05, 'epoch': 0.08} {'loss': 0.8242, 'learning_rate': 1.9936257842738405e-05, 'epoch': 0.08} {'loss': 0.7961, 'learning_rate': 1.9936220935442393e-05, 'epoch': 0.08} {'loss': 0.9623, 'learning_rate': 1.9936184017498827e-05, 'epoch': 0.08} {'loss': 1.0189, 'learning_rate': 1.9936147088907738e-05, 'epoch': 0.08} {'loss': 0.9438, 'learning_rate': 1.9936110149669175e-05, 'epoch': 0.08} {'loss': 1.0746, 'learning_rate': 1.993607319978317e-05, 'epoch': 0.08} {'loss': 1.0097, 'learning_rate': 1.9936036239249767e-05, 'epoch': 0.08} {'loss': 0.8205, 'learning_rate': 1.9935999268069005e-05, 'epoch': 0.08} {'loss': 0.9389, 'learning_rate': 1.9935962286240923e-05, 'epoch': 0.08} {'loss': 0.8955, 'learning_rate': 1.993592529376556e-05, 'epoch': 0.08} {'loss': 0.9915, 'learning_rate': 1.9935888290642954e-05, 'epoch': 0.08} {'loss': 0.9647, 'learning_rate': 1.9935851276873152e-05, 'epoch': 0.08} {'loss': 0.9688, 'learning_rate': 1.9935814252456183e-05, 'epoch': 0.08} {'loss': 0.8599, 'learning_rate': 1.9935777217392097e-05, 'epoch': 0.08} {'loss': 0.9486, 'learning_rate': 1.9935740171680926e-05, 'epoch': 0.08} {'loss': 0.9749, 'learning_rate': 1.9935703115322714e-05, 'epoch': 0.08} {'loss': 0.9071, 'learning_rate': 1.9935666048317497e-05, 'epoch': 0.08} {'loss': 0.9778, 'learning_rate': 1.993562897066532e-05, 'epoch': 0.08} {'loss': 0.8767, 'learning_rate': 1.993559188236622e-05, 'epoch': 0.08} {'loss': 1.0376, 'learning_rate': 1.993555478342023e-05, 'epoch': 0.08} {'loss': 0.9344, 'learning_rate': 1.9935517673827404e-05, 'epoch': 0.08} {'loss': 1.0514, 'learning_rate': 1.9935480553587772e-05, 'epoch': 0.08} {'loss': 1.0184, 'learning_rate': 1.9935443422701377e-05, 'epoch': 0.08} {'loss': 0.8132, 'learning_rate': 1.9935406281168255e-05, 'epoch': 0.08} {'loss': 0.8411, 'learning_rate': 1.9935369128988448e-05, 'epoch': 0.08} {'loss': 0.9394, 'learning_rate': 1.9935331966162002e-05, 'epoch': 0.08} {'loss': 0.9784, 'learning_rate': 1.9935294792688945e-05, 'epoch': 0.08} {'loss': 0.7668, 'learning_rate': 1.9935257608569325e-05, 'epoch': 0.08} {'loss': 0.896, 'learning_rate': 1.993522041380318e-05, 'epoch': 0.08} {'loss': 0.9123, 'learning_rate': 1.993518320839055e-05, 'epoch': 0.08} {'loss': 0.8575, 'learning_rate': 1.9935145992331473e-05, 'epoch': 0.08} {'loss': 0.9435, 'learning_rate': 1.9935108765625993e-05, 'epoch': 0.08} {'loss': 0.8825, 'learning_rate': 1.9935071528274143e-05, 'epoch': 0.08} {'loss': 0.9507, 'learning_rate': 1.993503428027597e-05, 'epoch': 0.08} {'loss': 0.864, 'learning_rate': 1.993499702163151e-05, 'epoch': 0.08} {'loss': 1.0824, 'learning_rate': 1.9934959752340806e-05, 'epoch': 0.08} {'loss': 1.0225, 'learning_rate': 1.9934922472403896e-05, 'epoch': 0.08} {'loss': 0.944, 'learning_rate': 1.9934885181820816e-05, 'epoch': 0.08} {'loss': 0.8351, 'learning_rate': 1.9934847880591613e-05, 'epoch': 0.08} {'loss': 1.0992, 'learning_rate': 1.9934810568716323e-05, 'epoch': 0.08} {'loss': 0.8759, 'learning_rate': 1.9934773246194985e-05, 'epoch': 0.08} {'loss': 0.8664, 'learning_rate': 1.9934735913027646e-05, 'epoch': 0.08} {'loss': 0.9991, 'learning_rate': 1.993469856921434e-05, 'epoch': 0.08} {'loss': 0.7456, 'learning_rate': 1.99346612147551e-05, 'epoch': 0.08} {'loss': 0.994, 'learning_rate': 1.9934623849649978e-05, 'epoch': 0.08} {'loss': 1.0086, 'learning_rate': 1.9934586473899012e-05, 'epoch': 0.08} {'loss': 0.9375, 'learning_rate': 1.9934549087502238e-05, 'epoch': 0.08} {'loss': 0.7414, 'learning_rate': 1.99345116904597e-05, 'epoch': 0.08} {'loss': 0.9236, 'learning_rate': 1.9934474282771435e-05, 'epoch': 0.08} {'loss': 0.8772, 'learning_rate': 1.9934436864437484e-05, 'epoch': 0.08} {'loss': 1.0336, 'learning_rate': 1.993439943545789e-05, 'epoch': 0.08} {'loss': 0.8617, 'learning_rate': 1.993436199583269e-05, 'epoch': 0.08} {'loss': 0.8311, 'learning_rate': 1.993432454556192e-05, 'epoch': 0.08} {'loss': 0.9609, 'learning_rate': 1.9934287084645626e-05, 'epoch': 0.08} {'loss': 0.8266, 'learning_rate': 1.9934249613083847e-05, 'epoch': 0.08} {'loss': 0.9489, 'learning_rate': 1.9934212130876625e-05, 'epoch': 0.08} {'loss': 0.9631, 'learning_rate': 1.9934174638024e-05, 'epoch': 0.08} {'loss': 1.0254, 'learning_rate': 1.9934137134526004e-05, 'epoch': 0.08} {'loss': 0.8373, 'learning_rate': 1.9934099620382685e-05, 'epoch': 0.08} {'loss': 0.9657, 'learning_rate': 1.9934062095594084e-05, 'epoch': 0.08} {'loss': 0.887, 'learning_rate': 1.993402456016024e-05, 'epoch': 0.08} {'loss': 0.8991, 'learning_rate': 1.9933987014081188e-05, 'epoch': 0.08} {'loss': 1.0806, 'learning_rate': 1.9933949457356974e-05, 'epoch': 0.08} {'loss': 1.058, 'learning_rate': 1.9933911889987637e-05, 'epoch': 0.08} {'loss': 0.8257, 'learning_rate': 1.9933874311973217e-05, 'epoch': 0.08} {'loss': 0.9452, 'learning_rate': 1.9933836723313754e-05, 'epoch': 0.08} {'loss': 0.8982, 'learning_rate': 1.993379912400929e-05, 'epoch': 0.08} {'loss': 1.0772, 'learning_rate': 1.9933761514059863e-05, 'epoch': 0.08} {'loss': 1.0076, 'learning_rate': 1.993372389346551e-05, 'epoch': 0.08} {'loss': 0.7891, 'learning_rate': 1.993368626222628e-05, 'epoch': 0.08} {'loss': 0.9171, 'learning_rate': 1.9933648620342204e-05, 'epoch': 0.08} {'loss': 0.9991, 'learning_rate': 1.993361096781333e-05, 'epoch': 0.08} {'loss': 1.0144, 'learning_rate': 1.9933573304639697e-05, 'epoch': 0.08} {'loss': 1.0015, 'learning_rate': 1.993353563082134e-05, 'epoch': 0.08} {'loss': 0.8995, 'learning_rate': 1.9933497946358304e-05, 'epoch': 0.08} {'loss': 1.0788, 'learning_rate': 1.993346025125063e-05, 'epoch': 0.08} {'loss': 0.9985, 'learning_rate': 1.9933422545498354e-05, 'epoch': 0.08} {'loss': 0.9565, 'learning_rate': 1.993338482910152e-05, 'epoch': 0.08} {'loss': 0.938, 'learning_rate': 1.9933347102060172e-05, 'epoch': 0.08} {'loss': 1.0376, 'learning_rate': 1.9933309364374342e-05, 'epoch': 0.08} {'loss': 0.8162, 'learning_rate': 1.9933271616044076e-05, 'epoch': 0.08} {'loss': 0.6982, 'learning_rate': 1.993323385706941e-05, 'epoch': 0.08} {'loss': 0.9286, 'learning_rate': 1.9933196087450392e-05, 'epoch': 0.08} {'loss': 1.0208, 'learning_rate': 1.9933158307187055e-05, 'epoch': 0.08} {'loss': 1.0342, 'learning_rate': 1.993312051627944e-05, 'epoch': 0.08} {'loss': 0.8736, 'learning_rate': 1.9933082714727595e-05, 'epoch': 0.08} {'loss': 0.9026, 'learning_rate': 1.9933044902531553e-05, 'epoch': 0.08} {'loss': 0.914, 'learning_rate': 1.9933007079691356e-05, 'epoch': 0.08} {'loss': 0.8644, 'learning_rate': 1.9932969246207045e-05, 'epoch': 0.08} {'loss': 1.0961, 'learning_rate': 1.9932931402078664e-05, 'epoch': 0.08} {'loss': 0.7546, 'learning_rate': 1.993289354730625e-05, 'epoch': 0.08} {'loss': 0.9184, 'learning_rate': 1.993285568188984e-05, 'epoch': 0.08} {'loss': 0.9617, 'learning_rate': 1.9932817805829483e-05, 'epoch': 0.08} {'loss': 0.9658, 'learning_rate': 1.993277991912521e-05, 'epoch': 0.08} {'loss': 0.9406, 'learning_rate': 1.9932742021777073e-05, 'epoch': 0.08} {'loss': 0.9642, 'learning_rate': 1.9932704113785104e-05, 'epoch': 0.08} {'loss': 1.0671, 'learning_rate': 1.9932666195149344e-05, 'epoch': 0.08} {'loss': 0.9094, 'learning_rate': 1.993262826586984e-05, 'epoch': 0.08} {'loss': 0.95, 'learning_rate': 1.9932590325946622e-05, 'epoch': 0.08} {'loss': 0.9583, 'learning_rate': 1.9932552375379742e-05, 'epoch': 0.08} {'loss': 0.9506, 'learning_rate': 1.9932514414169236e-05, 'epoch': 0.08} {'loss': 1.0669, 'learning_rate': 1.9932476442315144e-05, 'epoch': 0.08} {'loss': 0.9836, 'learning_rate': 1.9932438459817503e-05, 'epoch': 0.08} {'loss': 0.8536, 'learning_rate': 1.9932400466676362e-05, 'epoch': 0.08} {'loss': 1.0713, 'learning_rate': 1.9932362462891754e-05, 'epoch': 0.08} {'loss': 0.981, 'learning_rate': 1.9932324448463726e-05, 'epoch': 0.08} {'loss': 0.8709, 'learning_rate': 1.9932286423392316e-05, 'epoch': 0.08} {'loss': 0.9566, 'learning_rate': 1.9932248387677564e-05, 'epoch': 0.08} {'loss': 0.8159, 'learning_rate': 1.993221034131951e-05, 'epoch': 0.08} {'loss': 1.0308, 'learning_rate': 1.9932172284318198e-05, 'epoch': 0.08} {'loss': 0.769, 'learning_rate': 1.993213421667367e-05, 'epoch': 0.08} {'loss': 0.9464, 'learning_rate': 1.993209613838596e-05, 'epoch': 0.08} {'loss': 0.8432, 'learning_rate': 1.993205804945511e-05, 'epoch': 0.08} {'loss': 1.1591, 'learning_rate': 1.9932019949881165e-05, 'epoch': 0.08} {'loss': 0.9045, 'learning_rate': 1.9931981839664167e-05, 'epoch': 0.08} {'loss': 0.9876, 'learning_rate': 1.9931943718804152e-05, 'epoch': 0.08} {'loss': 1.0165, 'learning_rate': 1.9931905587301165e-05, 'epoch': 0.08} {'loss': 0.856, 'learning_rate': 1.9931867445155243e-05, 'epoch': 0.08} {'loss': 0.9921, 'learning_rate': 1.9931829292366426e-05, 'epoch': 0.08} {'loss': 0.8976, 'learning_rate': 1.9931791128934762e-05, 'epoch': 0.08} {'loss': 0.943, 'learning_rate': 1.9931752954860285e-05, 'epoch': 0.08} {'loss': 1.0063, 'learning_rate': 1.993171477014304e-05, 'epoch': 0.08} {'loss': 1.0232, 'learning_rate': 1.993167657478306e-05, 'epoch': 0.08} {'loss': 0.9116, 'learning_rate': 1.99316383687804e-05, 'epoch': 0.08} {'loss': 0.8138, 'learning_rate': 1.993160015213509e-05, 'epoch': 0.08} {'loss': 0.923, 'learning_rate': 1.9931561924847175e-05, 'epoch': 0.08} {'loss': 0.9902, 'learning_rate': 1.9931523686916693e-05, 'epoch': 0.08} {'loss': 0.8353, 'learning_rate': 1.993148543834369e-05, 'epoch': 0.08} {'loss': 0.8021, 'learning_rate': 1.99314471791282e-05, 'epoch': 0.08} {'loss': 1.0096, 'learning_rate': 1.9931408909270274e-05, 'epoch': 0.08} {'loss': 0.8798, 'learning_rate': 1.9931370628769943e-05, 'epoch': 0.08} {'loss': 1.0189, 'learning_rate': 1.9931332337627252e-05, 'epoch': 0.08} {'loss': 0.906, 'learning_rate': 1.993129403584224e-05, 'epoch': 0.08} {'loss': 0.9916, 'learning_rate': 1.9931255723414953e-05, 'epoch': 0.08} {'loss': 0.9535, 'learning_rate': 1.993121740034543e-05, 'epoch': 0.08} {'loss': 0.9865, 'learning_rate': 1.993117906663371e-05, 'epoch': 0.08} {'loss': 1.0419, 'learning_rate': 1.9931140722279833e-05, 'epoch': 0.08} {'loss': 0.9713, 'learning_rate': 1.9931102367283845e-05, 'epoch': 0.08} {'loss': 0.8499, 'learning_rate': 1.9931064001645786e-05, 'epoch': 0.08} {'loss': 0.9323, 'learning_rate': 1.9931025625365693e-05, 'epoch': 0.08} {'loss': 1.028, 'learning_rate': 1.9930987238443607e-05, 'epoch': 0.08} {'loss': 0.9891, 'learning_rate': 1.993094884087958e-05, 'epoch': 0.08} {'loss': 0.986, 'learning_rate': 1.9930910432673638e-05, 'epoch': 0.08} {'loss': 1.1303, 'learning_rate': 1.993087201382583e-05, 'epoch': 0.08} {'loss': 0.9436, 'learning_rate': 1.9930833584336198e-05, 'epoch': 0.08} {'loss': 0.8198, 'learning_rate': 1.9930795144204783e-05, 'epoch': 0.08} {'loss': 0.9407, 'learning_rate': 1.9930756693431622e-05, 'epoch': 0.08} {'loss': 0.8346, 'learning_rate': 1.993071823201676e-05, 'epoch': 0.08} {'loss': 0.992, 'learning_rate': 1.9930679759960235e-05, 'epoch': 0.08} {'loss': 0.9588, 'learning_rate': 1.9930641277262094e-05, 'epoch': 0.08} {'loss': 0.8991, 'learning_rate': 1.993060278392237e-05, 'epoch': 0.08} {'loss': 0.9296, 'learning_rate': 1.9930564279941113e-05, 'epoch': 0.08} {'loss': 1.0235, 'learning_rate': 1.9930525765318358e-05, 'epoch': 0.08} {'loss': 0.9298, 'learning_rate': 1.9930487240054148e-05, 'epoch': 0.08} {'loss': 0.7774, 'learning_rate': 1.9930448704148528e-05, 'epoch': 0.08} {'loss': 0.9662, 'learning_rate': 1.993041015760153e-05, 'epoch': 0.08} {'loss': 1.0307, 'learning_rate': 1.9930371600413205e-05, 'epoch': 0.08} {'loss': 0.8781, 'learning_rate': 1.993033303258359e-05, 'epoch': 0.08} {'loss': 0.8946, 'learning_rate': 1.9930294454112728e-05, 'epoch': 0.08} {'loss': 0.994, 'learning_rate': 1.993025586500066e-05, 'epoch': 0.08} {'loss': 0.8815, 'learning_rate': 1.9930217265247423e-05, 'epoch': 0.08} {'loss': 0.7795, 'learning_rate': 1.9930178654853065e-05, 'epoch': 0.08} {'loss': 0.98, 'learning_rate': 1.993014003381762e-05, 'epoch': 0.08} {'loss': 0.9845, 'learning_rate': 1.993010140214114e-05, 'epoch': 0.08} {'loss': 1.0012, 'learning_rate': 1.993006275982366e-05, 'epoch': 0.08} {'loss': 1.0632, 'learning_rate': 1.9930024106865217e-05, 'epoch': 0.08} {'loss': 0.8584, 'learning_rate': 1.992998544326586e-05, 'epoch': 0.08} {'loss': 0.9206, 'learning_rate': 1.9929946769025624e-05, 'epoch': 0.08} {'loss': 0.8922, 'learning_rate': 1.9929908084144553e-05, 'epoch': 0.08} {'loss': 0.8968, 'learning_rate': 1.9929869388622693e-05, 'epoch': 0.08} {'loss': 0.8171, 'learning_rate': 1.9929830682460082e-05, 'epoch': 0.08} {'loss': 1.019, 'learning_rate': 1.992979196565676e-05, 'epoch': 0.08} {'loss': 0.9844, 'learning_rate': 1.992975323821277e-05, 'epoch': 0.08} {'loss': 0.9452, 'learning_rate': 1.992971450012815e-05, 'epoch': 0.08} {'loss': 1.0137, 'learning_rate': 1.992967575140295e-05, 'epoch': 0.08} {'loss': 1.0275, 'learning_rate': 1.9929636992037203e-05, 'epoch': 0.08} {'loss': 0.924, 'learning_rate': 1.9929598222030955e-05, 'epoch': 0.08} {'loss': 0.7863, 'learning_rate': 1.992955944138424e-05, 'epoch': 0.08} {'loss': 0.9147, 'learning_rate': 1.9929520650097117e-05, 'epoch': 0.08} {'loss': 0.8678, 'learning_rate': 1.992948184816961e-05, 'epoch': 0.08} {'loss': 0.9211, 'learning_rate': 1.9929443035601767e-05, 'epoch': 0.08} {'loss': 0.8064, 'learning_rate': 1.992940421239363e-05, 'epoch': 0.08} {'loss': 1.0346, 'learning_rate': 1.992936537854524e-05, 'epoch': 0.08} {'loss': 0.924, 'learning_rate': 1.9929326534056642e-05, 'epoch': 0.08} {'loss': 0.8936, 'learning_rate': 1.9929287678927875e-05, 'epoch': 0.08} {'loss': 1.0711, 'learning_rate': 1.9929248813158975e-05, 'epoch': 0.08} {'loss': 0.8695, 'learning_rate': 1.9929209936749993e-05, 'epoch': 0.08} {'loss': 1.0671, 'learning_rate': 1.9929171049700962e-05, 'epoch': 0.08} {'loss': 0.889, 'learning_rate': 1.992913215201193e-05, 'epoch': 0.08} {'loss': 0.9536, 'learning_rate': 1.992909324368294e-05, 'epoch': 0.08} {'loss': 0.8876, 'learning_rate': 1.9929054324714024e-05, 'epoch': 0.08} {'loss': 1.0599, 'learning_rate': 1.9929015395105233e-05, 'epoch': 0.08} {'loss': 1.0869, 'learning_rate': 1.9928976454856607e-05, 'epoch': 0.08} {'loss': 1.154, 'learning_rate': 1.9928937503968188e-05, 'epoch': 0.08} {'loss': 0.9041, 'learning_rate': 1.9928898542440014e-05, 'epoch': 0.08} {'loss': 0.8132, 'learning_rate': 1.9928859570272128e-05, 'epoch': 0.08} {'loss': 0.8678, 'learning_rate': 1.9928820587464575e-05, 'epoch': 0.08} {'loss': 1.007, 'learning_rate': 1.9928781594017392e-05, 'epoch': 0.08} {'loss': 0.8893, 'learning_rate': 1.9928742589930627e-05, 'epoch': 0.08} {'loss': 0.8061, 'learning_rate': 1.9928703575204316e-05, 'epoch': 0.08} {'loss': 1.1067, 'learning_rate': 1.9928664549838505e-05, 'epoch': 0.08} {'loss': 1.0533, 'learning_rate': 1.992862551383323e-05, 'epoch': 0.08} {'loss': 0.9591, 'learning_rate': 1.992858646718854e-05, 'epoch': 0.08} {'loss': 0.9819, 'learning_rate': 1.9928547409904474e-05, 'epoch': 0.08} {'loss': 1.011, 'learning_rate': 1.992850834198107e-05, 'epoch': 0.08} {'loss': 0.9753, 'learning_rate': 1.9928469263418376e-05, 'epoch': 0.08} {'loss': 1.0242, 'learning_rate': 1.9928430174216428e-05, 'epoch': 0.08} {'loss': 1.0076, 'learning_rate': 1.9928391074375275e-05, 'epoch': 0.08} {'loss': 0.9016, 'learning_rate': 1.9928351963894952e-05, 'epoch': 0.08} {'loss': 0.9329, 'learning_rate': 1.9928312842775502e-05, 'epoch': 0.08} {'loss': 0.9105, 'learning_rate': 1.9928273711016972e-05, 'epoch': 0.08} {'loss': 1.0044, 'learning_rate': 1.9928234568619404e-05, 'epoch': 0.08} {'loss': 1.0006, 'learning_rate': 1.992819541558283e-05, 'epoch': 0.08} {'loss': 0.9676, 'learning_rate': 1.9928156251907303e-05, 'epoch': 0.08} {'loss': 0.9951, 'learning_rate': 1.9928117077592856e-05, 'epoch': 0.08} {'loss': 0.9283, 'learning_rate': 1.992807789263954e-05, 'epoch': 0.08} {'loss': 1.0654, 'learning_rate': 1.992803869704739e-05, 'epoch': 0.08} {'loss': 1.1424, 'learning_rate': 1.9927999490816453e-05, 'epoch': 0.08} {'loss': 0.8575, 'learning_rate': 1.9927960273946766e-05, 'epoch': 0.08} {'loss': 1.1252, 'learning_rate': 1.992792104643837e-05, 'epoch': 0.08} {'loss': 1.0139, 'learning_rate': 1.9927881808291318e-05, 'epoch': 0.08} {'loss': 1.0578, 'learning_rate': 1.992784255950564e-05, 'epoch': 0.08} {'loss': 1.0767, 'learning_rate': 1.9927803300081385e-05, 'epoch': 0.08} {'loss': 0.9794, 'learning_rate': 1.992776403001859e-05, 'epoch': 0.08} {'loss': 0.9766, 'learning_rate': 1.99277247493173e-05, 'epoch': 0.08} {'loss': 0.969, 'learning_rate': 1.992768545797756e-05, 'epoch': 0.08} {'loss': 0.9663, 'learning_rate': 1.9927646155999408e-05, 'epoch': 0.08} {'loss': 0.9746, 'learning_rate': 1.9927606843382884e-05, 'epoch': 0.08} {'loss': 0.9462, 'learning_rate': 1.9927567520128037e-05, 'epoch': 0.08} {'loss': 0.9394, 'learning_rate': 1.9927528186234903e-05, 'epoch': 0.08} {'loss': 0.9127, 'learning_rate': 1.9927488841703527e-05, 'epoch': 0.08} {'loss': 1.0939, 'learning_rate': 1.9927449486533955e-05, 'epoch': 0.08} {'loss': 1.0461, 'learning_rate': 1.992741012072622e-05, 'epoch': 0.08} {'loss': 1.0289, 'learning_rate': 1.992737074428037e-05, 'epoch': 0.08} {'loss': 0.9715, 'learning_rate': 1.9927331357196446e-05, 'epoch': 0.08} {'loss': 1.0604, 'learning_rate': 1.9927291959474494e-05, 'epoch': 0.08} {'loss': 0.8716, 'learning_rate': 1.992725255111455e-05, 'epoch': 0.08} {'loss': 0.6969, 'learning_rate': 1.9927213132116655e-05, 'epoch': 0.08} {'loss': 0.7595, 'learning_rate': 1.992717370248086e-05, 'epoch': 0.08} {'loss': 1.0474, 'learning_rate': 1.9927134262207198e-05, 'epoch': 0.08} {'loss': 0.79, 'learning_rate': 1.992709481129572e-05, 'epoch': 0.08} {'loss': 1.0695, 'learning_rate': 1.9927055349746465e-05, 'epoch': 0.08} {'loss': 0.9795, 'learning_rate': 1.992701587755947e-05, 'epoch': 0.08} {'loss': 1.0103, 'learning_rate': 1.9926976394734784e-05, 'epoch': 0.08} {'loss': 1.0406, 'learning_rate': 1.9926936901272444e-05, 'epoch': 0.08} {'loss': 1.0265, 'learning_rate': 1.9926897397172498e-05, 'epoch': 0.08} {'loss': 1.0132, 'learning_rate': 1.9926857882434984e-05, 'epoch': 0.08} {'loss': 1.04, 'learning_rate': 1.992681835705995e-05, 'epoch': 0.08} {'loss': 0.8634, 'learning_rate': 1.9926778821047427e-05, 'epoch': 0.08} {'loss': 0.868, 'learning_rate': 1.9926739274397472e-05, 'epoch': 0.08} {'loss': 1.1077, 'learning_rate': 1.9926699717110115e-05, 'epoch': 0.08} {'loss': 0.875, 'learning_rate': 1.9926660149185407e-05, 'epoch': 0.08} {'loss': 1.0478, 'learning_rate': 1.9926620570623384e-05, 'epoch': 0.08} {'loss': 0.9103, 'learning_rate': 1.992658098142409e-05, 'epoch': 0.08} {'loss': 1.0416, 'learning_rate': 1.992654138158757e-05, 'epoch': 0.08} {'loss': 0.9985, 'learning_rate': 1.9926501771113864e-05, 'epoch': 0.08} {'loss': 0.9639, 'learning_rate': 1.9926462150003015e-05, 'epoch': 0.08} {'loss': 0.9344, 'learning_rate': 1.992642251825507e-05, 'epoch': 0.08} {'loss': 1.0179, 'learning_rate': 1.9926382875870062e-05, 'epoch': 0.08} {'loss': 1.033, 'learning_rate': 1.9926343222848043e-05, 'epoch': 0.08} {'loss': 1.0171, 'learning_rate': 1.992630355918905e-05, 'epoch': 0.08} {'loss': 0.9387, 'learning_rate': 1.9926263884893126e-05, 'epoch': 0.08} {'loss': 0.8926, 'learning_rate': 1.9926224199960316e-05, 'epoch': 0.08} {'loss': 1.0071, 'learning_rate': 1.992618450439066e-05, 'epoch': 0.08} {'loss': 1.0464, 'learning_rate': 1.99261447981842e-05, 'epoch': 0.08} {'loss': 1.1159, 'learning_rate': 1.992610508134098e-05, 'epoch': 0.08} {'loss': 0.8154, 'learning_rate': 1.9926065353861044e-05, 'epoch': 0.08} {'loss': 0.9323, 'learning_rate': 1.992602561574443e-05, 'epoch': 0.08} {'loss': 0.9713, 'learning_rate': 1.9925985866991193e-05, 'epoch': 0.08} {'loss': 0.942, 'learning_rate': 1.9925946107601358e-05, 'epoch': 0.08} {'loss': 1.0142, 'learning_rate': 1.9925906337574978e-05, 'epoch': 0.08} {'loss': 1.0417, 'learning_rate': 1.9925866556912093e-05, 'epoch': 0.08} {'loss': 0.9398, 'learning_rate': 1.9925826765612745e-05, 'epoch': 0.08} {'loss': 0.7577, 'learning_rate': 1.992578696367698e-05, 'epoch': 0.08} {'loss': 1.0387, 'learning_rate': 1.9925747151104837e-05, 'epoch': 0.08} {'loss': 0.8938, 'learning_rate': 1.992570732789636e-05, 'epoch': 0.08} {'loss': 0.9954, 'learning_rate': 1.992566749405159e-05, 'epoch': 0.08} {'loss': 1.016, 'learning_rate': 1.9925627649570575e-05, 'epoch': 0.08} {'loss': 0.9338, 'learning_rate': 1.9925587794453352e-05, 'epoch': 0.08} {'loss': 0.9313, 'learning_rate': 1.9925547928699967e-05, 'epoch': 0.08} {'loss': 0.8371, 'learning_rate': 1.9925508052310464e-05, 'epoch': 0.08} {'loss': 1.0203, 'learning_rate': 1.992546816528488e-05, 'epoch': 0.08} {'loss': 0.8461, 'learning_rate': 1.9925428267623262e-05, 'epoch': 0.08} {'loss': 0.9557, 'learning_rate': 1.992538835932565e-05, 'epoch': 0.08} {'loss': 0.9427, 'learning_rate': 1.992534844039209e-05, 'epoch': 0.08} {'loss': 1.0104, 'learning_rate': 1.992530851082262e-05, 'epoch': 0.08} {'loss': 0.9769, 'learning_rate': 1.992526857061729e-05, 'epoch': 0.08} {'loss': 0.8917, 'learning_rate': 1.992522861977614e-05, 'epoch': 0.08} {'loss': 1.0378, 'learning_rate': 1.992518865829921e-05, 'epoch': 0.08} {'loss': 1.0522, 'learning_rate': 1.9925148686186545e-05, 'epoch': 0.08} {'loss': 0.7304, 'learning_rate': 1.9925108703438188e-05, 'epoch': 0.08} {'loss': 0.9767, 'learning_rate': 1.992506871005418e-05, 'epoch': 0.08} {'loss': 0.9667, 'learning_rate': 1.9925028706034565e-05, 'epoch': 0.08} {'loss': 0.9182, 'learning_rate': 1.9924988691379385e-05, 'epoch': 0.08} {'loss': 0.8775, 'learning_rate': 1.9924948666088686e-05, 'epoch': 0.08} {'loss': 1.0146, 'learning_rate': 1.9924908630162506e-05, 'epoch': 0.08} {'loss': 0.9834, 'learning_rate': 1.9924868583600895e-05, 'epoch': 0.08} {'loss': 0.7556, 'learning_rate': 1.9924828526403888e-05, 'epoch': 0.08} {'loss': 1.08, 'learning_rate': 1.9924788458571532e-05, 'epoch': 0.08} {'loss': 0.9349, 'learning_rate': 1.9924748380103867e-05, 'epoch': 0.08} {'loss': 0.893, 'learning_rate': 1.9924708291000945e-05, 'epoch': 0.08} {'loss': 0.9528, 'learning_rate': 1.9924668191262796e-05, 'epoch': 0.08} {'loss': 0.9238, 'learning_rate': 1.9924628080889474e-05, 'epoch': 0.08} {'loss': 1.1022, 'learning_rate': 1.9924587959881016e-05, 'epoch': 0.08} {'loss': 0.8914, 'learning_rate': 1.9924547828237463e-05, 'epoch': 0.08} {'loss': 0.7891, 'learning_rate': 1.9924507685958863e-05, 'epoch': 0.08} {'loss': 1.0906, 'learning_rate': 1.992446753304526e-05, 'epoch': 0.08} {'loss': 0.8002, 'learning_rate': 1.992442736949669e-05, 'epoch': 0.08} {'loss': 0.8552, 'learning_rate': 1.99243871953132e-05, 'epoch': 0.08} {'loss': 0.9054, 'learning_rate': 1.9924347010494837e-05, 'epoch': 0.08} {'loss': 0.8936, 'learning_rate': 1.992430681504164e-05, 'epoch': 0.08} {'loss': 0.9005, 'learning_rate': 1.992426660895365e-05, 'epoch': 0.08} {'loss': 1.0234, 'learning_rate': 1.9924226392230915e-05, 'epoch': 0.08} {'loss': 1.0901, 'learning_rate': 1.9924186164873476e-05, 'epoch': 0.08} {'loss': 0.9859, 'learning_rate': 1.9924145926881375e-05, 'epoch': 0.08} {'loss': 1.03, 'learning_rate': 1.9924105678254655e-05, 'epoch': 0.08} {'loss': 0.9827, 'learning_rate': 1.992406541899336e-05, 'epoch': 0.08} {'loss': 0.76, 'learning_rate': 1.9924025149097534e-05, 'epoch': 0.08} {'loss': 1.115, 'learning_rate': 1.992398486856722e-05, 'epoch': 0.08} {'loss': 0.9031, 'learning_rate': 1.992394457740246e-05, 'epoch': 0.08} {'loss': 0.8778, 'learning_rate': 1.99239042756033e-05, 'epoch': 0.08} {'loss': 0.9555, 'learning_rate': 1.9923863963169777e-05, 'epoch': 0.08} {'loss': 0.9995, 'learning_rate': 1.9923823640101938e-05, 'epoch': 0.08} {'loss': 0.9672, 'learning_rate': 1.9923783306399827e-05, 'epoch': 0.08} {'loss': 0.7747, 'learning_rate': 1.992374296206349e-05, 'epoch': 0.08} {'loss': 0.8307, 'learning_rate': 1.9923702607092965e-05, 'epoch': 0.08} {'loss': 0.8627, 'learning_rate': 1.9923662241488297e-05, 'epoch': 0.08} {'loss': 1.0482, 'learning_rate': 1.9923621865249523e-05, 'epoch': 0.08} {'loss': 0.9127, 'learning_rate': 1.9923581478376702e-05, 'epoch': 0.08} {'loss': 1.0008, 'learning_rate': 1.9923541080869863e-05, 'epoch': 0.08} {'loss': 1.0929, 'learning_rate': 1.9923500672729054e-05, 'epoch': 0.08} {'loss': 0.928, 'learning_rate': 1.9923460253954315e-05, 'epoch': 0.08} {'loss': 0.8818, 'learning_rate': 1.99234198245457e-05, 'epoch': 0.08} {'loss': 0.9945, 'learning_rate': 1.9923379384503243e-05, 'epoch': 0.08} {'loss': 1.14, 'learning_rate': 1.9923338933826987e-05, 'epoch': 0.08} {'loss': 1.0739, 'learning_rate': 1.9923298472516978e-05, 'epoch': 0.08} {'loss': 0.9917, 'learning_rate': 1.992325800057326e-05, 'epoch': 0.08} {'loss': 0.8765, 'learning_rate': 1.9923217517995876e-05, 'epoch': 0.08} {'loss': 0.9904, 'learning_rate': 1.9923177024784868e-05, 'epoch': 0.08} {'loss': 0.8803, 'learning_rate': 1.992313652094028e-05, 'epoch': 0.08} {'loss': 1.0097, 'learning_rate': 1.9923096006462158e-05, 'epoch': 0.08} {'loss': 1.039, 'learning_rate': 1.992305548135054e-05, 'epoch': 0.09} {'loss': 1.0612, 'learning_rate': 1.9923014945605472e-05, 'epoch': 0.09} {'loss': 1.0498, 'learning_rate': 1.9922974399227e-05, 'epoch': 0.09} {'loss': 0.8175, 'learning_rate': 1.992293384221516e-05, 'epoch': 0.09} {'loss': 0.9477, 'learning_rate': 1.992289327457001e-05, 'epoch': 0.09} {'loss': 0.9678, 'learning_rate': 1.9922852696291576e-05, 'epoch': 0.09} {'loss': 0.9874, 'learning_rate': 1.9922812107379913e-05, 'epoch': 0.09} {'loss': 0.8105, 'learning_rate': 1.9922771507835062e-05, 'epoch': 0.09} {'loss': 0.8583, 'learning_rate': 1.9922730897657068e-05, 'epoch': 0.09} {'loss': 0.8959, 'learning_rate': 1.9922690276845967e-05, 'epoch': 0.09} {'loss': 0.9687, 'learning_rate': 1.992264964540181e-05, 'epoch': 0.09} {'loss': 0.8842, 'learning_rate': 1.992260900332464e-05, 'epoch': 0.09} {'loss': 0.9721, 'learning_rate': 1.9922568350614496e-05, 'epoch': 0.09} {'loss': 0.9803, 'learning_rate': 1.992252768727143e-05, 'epoch': 0.09} {'loss': 0.7579, 'learning_rate': 1.9922487013295475e-05, 'epoch': 0.09} {'loss': 0.8593, 'learning_rate': 1.992244632868668e-05, 'epoch': 0.09} {'loss': 1.0133, 'learning_rate': 1.9922405633445087e-05, 'epoch': 0.09} {'loss': 0.8868, 'learning_rate': 1.9922364927570746e-05, 'epoch': 0.09} {'loss': 0.9191, 'learning_rate': 1.992232421106369e-05, 'epoch': 0.09} {'loss': 1.0501, 'learning_rate': 1.992228348392397e-05, 'epoch': 0.09} {'loss': 1.0097, 'learning_rate': 1.992224274615163e-05, 'epoch': 0.09} {'loss': 0.8941, 'learning_rate': 1.992220199774671e-05, 'epoch': 0.09} {'loss': 1.048, 'learning_rate': 1.9922161238709254e-05, 'epoch': 0.09} {'loss': 1.0213, 'learning_rate': 1.9922120469039306e-05, 'epoch': 0.09} {'loss': 1.0093, 'learning_rate': 1.9922079688736912e-05, 'epoch': 0.09} {'loss': 0.979, 'learning_rate': 1.992203889780211e-05, 'epoch': 0.09} {'loss': 0.9451, 'learning_rate': 1.9921998096234955e-05, 'epoch': 0.09} {'loss': 0.8462, 'learning_rate': 1.992195728403548e-05, 'epoch': 0.09} {'loss': 0.8188, 'learning_rate': 1.992191646120373e-05, 'epoch': 0.09} {'loss': 0.9335, 'learning_rate': 1.9921875627739754e-05, 'epoch': 0.09} {'loss': 0.9543, 'learning_rate': 1.992183478364359e-05, 'epoch': 0.09} {'loss': 0.828, 'learning_rate': 1.9921793928915284e-05, 'epoch': 0.09} {'loss': 0.9311, 'learning_rate': 1.9921753063554885e-05, 'epoch': 0.09} {'loss': 0.9945, 'learning_rate': 1.992171218756243e-05, 'epoch': 0.09} {'loss': 0.9958, 'learning_rate': 1.9921671300937965e-05, 'epoch': 0.09} {'loss': 0.7178, 'learning_rate': 1.992163040368153e-05, 'epoch': 0.09} {'loss': 0.7395, 'learning_rate': 1.9921589495793177e-05, 'epoch': 0.09} {'loss': 1.0401, 'learning_rate': 1.9921548577272944e-05, 'epoch': 0.09} {'loss': 0.8333, 'learning_rate': 1.9921507648120878e-05, 'epoch': 0.09} {'loss': 0.9649, 'learning_rate': 1.992146670833702e-05, 'epoch': 0.09} {'loss': 0.9865, 'learning_rate': 1.9921425757921416e-05, 'epoch': 0.09} {'loss': 0.7476, 'learning_rate': 1.9921384796874107e-05, 'epoch': 0.09} {'loss': 1.0729, 'learning_rate': 1.9921343825195136e-05, 'epoch': 0.09} {'loss': 1.0047, 'learning_rate': 1.9921302842884557e-05, 'epoch': 0.09} {'loss': 0.9115, 'learning_rate': 1.99212618499424e-05, 'epoch': 0.09} {'loss': 1.1103, 'learning_rate': 1.9921220846368717e-05, 'epoch': 0.09} {'loss': 0.9467, 'learning_rate': 1.9921179832163552e-05, 'epoch': 0.09} {'loss': 0.9107, 'learning_rate': 1.992113880732695e-05, 'epoch': 0.09} {'loss': 0.8612, 'learning_rate': 1.9921097771858946e-05, 'epoch': 0.09} {'loss': 1.1208, 'learning_rate': 1.9921056725759592e-05, 'epoch': 0.09} {'loss': 0.8843, 'learning_rate': 1.992101566902893e-05, 'epoch': 0.09} {'loss': 0.8234, 'learning_rate': 1.9920974601667008e-05, 'epoch': 0.09} {'loss': 0.9422, 'learning_rate': 1.9920933523673862e-05, 'epoch': 0.09} {'loss': 0.9332, 'learning_rate': 1.9920892435049545e-05, 'epoch': 0.09} {'loss': 0.9272, 'learning_rate': 1.9920851335794093e-05, 'epoch': 0.09} {'loss': 1.0991, 'learning_rate': 1.9920810225907554e-05, 'epoch': 0.09} {'loss': 0.8709, 'learning_rate': 1.992076910538997e-05, 'epoch': 0.09} {'loss': 0.9596, 'learning_rate': 1.9920727974241386e-05, 'epoch': 0.09} {'loss': 0.8893, 'learning_rate': 1.9920686832461852e-05, 'epoch': 0.09} {'loss': 1.0434, 'learning_rate': 1.99206456800514e-05, 'epoch': 0.09} {'loss': 1.0723, 'learning_rate': 1.9920604517010088e-05, 'epoch': 0.09} {'loss': 0.8403, 'learning_rate': 1.9920563343337947e-05, 'epoch': 0.09} {'loss': 0.7784, 'learning_rate': 1.992052215903503e-05, 'epoch': 0.09} {'loss': 0.9028, 'learning_rate': 1.9920480964101373e-05, 'epoch': 0.09} {'loss': 0.9121, 'learning_rate': 1.9920439758537032e-05, 'epoch': 0.09} {'loss': 0.9051, 'learning_rate': 1.992039854234204e-05, 'epoch': 0.09} {'loss': 0.7814, 'learning_rate': 1.9920357315516448e-05, 'epoch': 0.09} {'loss': 0.8242, 'learning_rate': 1.9920316078060297e-05, 'epoch': 0.09} {'loss': 0.9158, 'learning_rate': 1.9920274829973634e-05, 'epoch': 0.09} {'loss': 0.9781, 'learning_rate': 1.99202335712565e-05, 'epoch': 0.09} {'loss': 0.9703, 'learning_rate': 1.9920192301908937e-05, 'epoch': 0.09} {'loss': 0.897, 'learning_rate': 1.9920151021930993e-05, 'epoch': 0.09} {'loss': 0.9867, 'learning_rate': 1.9920109731322714e-05, 'epoch': 0.09} {'loss': 0.93, 'learning_rate': 1.9920068430084142e-05, 'epoch': 0.09} {'loss': 0.972, 'learning_rate': 1.9920027118215323e-05, 'epoch': 0.09} {'loss': 0.9969, 'learning_rate': 1.9919985795716298e-05, 'epoch': 0.09} {'loss': 0.8379, 'learning_rate': 1.9919944462587114e-05, 'epoch': 0.09} {'loss': 0.9, 'learning_rate': 1.991990311882781e-05, 'epoch': 0.09} {'loss': 0.985, 'learning_rate': 1.9919861764438438e-05, 'epoch': 0.09} {'loss': 0.984, 'learning_rate': 1.991982039941904e-05, 'epoch': 0.09} {'loss': 0.9276, 'learning_rate': 1.9919779023769657e-05, 'epoch': 0.09} {'loss': 0.8698, 'learning_rate': 1.9919737637490335e-05, 'epoch': 0.09} {'loss': 0.9922, 'learning_rate': 1.9919696240581122e-05, 'epoch': 0.09} {'loss': 1.05, 'learning_rate': 1.9919654833042056e-05, 'epoch': 0.09} {'loss': 0.8801, 'learning_rate': 1.9919613414873184e-05, 'epoch': 0.09} {'loss': 1.0461, 'learning_rate': 1.9919571986074553e-05, 'epoch': 0.09} {'loss': 1.0677, 'learning_rate': 1.9919530546646204e-05, 'epoch': 0.09} {'loss': 0.9864, 'learning_rate': 1.9919489096588185e-05, 'epoch': 0.09} {'loss': 0.8972, 'learning_rate': 1.9919447635900535e-05, 'epoch': 0.09} {'loss': 0.8563, 'learning_rate': 1.9919406164583303e-05, 'epoch': 0.09} {'loss': 0.9614, 'learning_rate': 1.9919364682636533e-05, 'epoch': 0.09} {'loss': 0.867, 'learning_rate': 1.9919323190060265e-05, 'epoch': 0.09} {'loss': 0.9825, 'learning_rate': 1.9919281686854554e-05, 'epoch': 0.09} {'loss': 0.783, 'learning_rate': 1.991924017301943e-05, 'epoch': 0.09} {'loss': 0.924, 'learning_rate': 1.9919198648554945e-05, 'epoch': 0.09} {'loss': 0.9431, 'learning_rate': 1.9919157113461147e-05, 'epoch': 0.09} {'loss': 1.0603, 'learning_rate': 1.9919115567738078e-05, 'epoch': 0.09} {'loss': 1.0462, 'learning_rate': 1.991907401138578e-05, 'epoch': 0.09} {'loss': 1.1715, 'learning_rate': 1.9919032444404297e-05, 'epoch': 0.09} {'loss': 1.0907, 'learning_rate': 1.9918990866793677e-05, 'epoch': 0.09} {'loss': 0.9682, 'learning_rate': 1.991894927855396e-05, 'epoch': 0.09} {'loss': 1.0046, 'learning_rate': 1.99189076796852e-05, 'epoch': 0.09} {'loss': 0.8126, 'learning_rate': 1.991886607018743e-05, 'epoch': 0.09} {'loss': 1.0545, 'learning_rate': 1.9918824450060703e-05, 'epoch': 0.09} {'loss': 0.9426, 'learning_rate': 1.991878281930506e-05, 'epoch': 0.09} {'loss': 1.0758, 'learning_rate': 1.9918741177920543e-05, 'epoch': 0.09} {'loss': 0.9699, 'learning_rate': 1.9918699525907202e-05, 'epoch': 0.09} {'loss': 0.8873, 'learning_rate': 1.991865786326508e-05, 'epoch': 0.09} {'loss': 0.9482, 'learning_rate': 1.9918616189994216e-05, 'epoch': 0.09} {'loss': 1.0212, 'learning_rate': 1.9918574506094666e-05, 'epoch': 0.09} {'loss': 0.9564, 'learning_rate': 1.9918532811566465e-05, 'epoch': 0.09} {'loss': 0.9041, 'learning_rate': 1.991849110640966e-05, 'epoch': 0.09} {'loss': 0.8662, 'learning_rate': 1.9918449390624297e-05, 'epoch': 0.09} {'loss': 0.8967, 'learning_rate': 1.991840766421042e-05, 'epoch': 0.09} {'loss': 0.9783, 'learning_rate': 1.9918365927168078e-05, 'epoch': 0.09} {'loss': 1.0337, 'learning_rate': 1.9918324179497308e-05, 'epoch': 0.09} {'loss': 0.9478, 'learning_rate': 1.9918282421198157e-05, 'epoch': 0.09} {'loss': 1.0544, 'learning_rate': 1.991824065227068e-05, 'epoch': 0.09} {'loss': 0.8484, 'learning_rate': 1.99181988727149e-05, 'epoch': 0.09} {'loss': 0.8885, 'learning_rate': 1.9918157082530883e-05, 'epoch': 0.09} {'loss': 0.8631, 'learning_rate': 1.9918115281718665e-05, 'epoch': 0.09} {'loss': 0.9749, 'learning_rate': 1.991807347027829e-05, 'epoch': 0.09} {'loss': 0.9423, 'learning_rate': 1.9918031648209804e-05, 'epoch': 0.09} {'loss': 0.9316, 'learning_rate': 1.991798981551325e-05, 'epoch': 0.09} {'loss': 0.8174, 'learning_rate': 1.991794797218868e-05, 'epoch': 0.09} {'loss': 0.9431, 'learning_rate': 1.9917906118236127e-05, 'epoch': 0.09} {'loss': 0.8624, 'learning_rate': 1.9917864253655647e-05, 'epoch': 0.09} {'loss': 0.9264, 'learning_rate': 1.9917822378447278e-05, 'epoch': 0.09} {'loss': 1.024, 'learning_rate': 1.9917780492611068e-05, 'epoch': 0.09} {'loss': 0.9059, 'learning_rate': 1.991773859614706e-05, 'epoch': 0.09} {'loss': 0.8917, 'learning_rate': 1.9917696689055302e-05, 'epoch': 0.09} {'loss': 0.9003, 'learning_rate': 1.991765477133584e-05, 'epoch': 0.09} {'loss': 0.9862, 'learning_rate': 1.991761284298871e-05, 'epoch': 0.09} {'loss': 0.9866, 'learning_rate': 1.9917570904013967e-05, 'epoch': 0.09} {'loss': 0.7646, 'learning_rate': 1.991752895441165e-05, 'epoch': 0.09} {'loss': 0.6649, 'learning_rate': 1.9917486994181803e-05, 'epoch': 0.09} {'loss': 0.9396, 'learning_rate': 1.9917445023324475e-05, 'epoch': 0.09} {'loss': 0.9376, 'learning_rate': 1.9917403041839712e-05, 'epoch': 0.09} {'loss': 0.943, 'learning_rate': 1.9917361049727553e-05, 'epoch': 0.09} {'loss': 0.8775, 'learning_rate': 1.991731904698805e-05, 'epoch': 0.09} {'loss': 0.9539, 'learning_rate': 1.9917277033621242e-05, 'epoch': 0.09} {'loss': 1.0508, 'learning_rate': 1.9917235009627175e-05, 'epoch': 0.09} {'loss': 0.766, 'learning_rate': 1.9917192975005898e-05, 'epoch': 0.09} {'loss': 1.0108, 'learning_rate': 1.9917150929757457e-05, 'epoch': 0.09} {'loss': 0.8674, 'learning_rate': 1.9917108873881887e-05, 'epoch': 0.09} {'loss': 0.8169, 'learning_rate': 1.9917066807379245e-05, 'epoch': 0.09} {'loss': 0.9366, 'learning_rate': 1.991702473024957e-05, 'epoch': 0.09} {'loss': 1.0821, 'learning_rate': 1.9916982642492905e-05, 'epoch': 0.09} {'loss': 0.9022, 'learning_rate': 1.99169405441093e-05, 'epoch': 0.09} {'loss': 0.8667, 'learning_rate': 1.9916898435098796e-05, 'epoch': 0.09} {'loss': 0.9665, 'learning_rate': 1.9916856315461445e-05, 'epoch': 0.09} {'loss': 0.9347, 'learning_rate': 1.9916814185197283e-05, 'epoch': 0.09} {'loss': 0.8394, 'learning_rate': 1.9916772044306364e-05, 'epoch': 0.09} {'loss': 0.9038, 'learning_rate': 1.9916729892788723e-05, 'epoch': 0.09} {'loss': 0.884, 'learning_rate': 1.9916687730644413e-05, 'epoch': 0.09} {'loss': 0.9883, 'learning_rate': 1.9916645557873478e-05, 'epoch': 0.09} {'loss': 1.0349, 'learning_rate': 1.9916603374475963e-05, 'epoch': 0.09} {'loss': 1.0191, 'learning_rate': 1.991656118045191e-05, 'epoch': 0.09} {'loss': 0.8153, 'learning_rate': 1.991651897580137e-05, 'epoch': 0.09} {'loss': 1.1836, 'learning_rate': 1.9916476760524384e-05, 'epoch': 0.09} {'loss': 1.014, 'learning_rate': 1.9916434534620997e-05, 'epoch': 0.09} {'loss': 0.7924, 'learning_rate': 1.9916392298091253e-05, 'epoch': 0.09} {'loss': 0.9446, 'learning_rate': 1.9916350050935206e-05, 'epoch': 0.09} {'loss': 0.9147, 'learning_rate': 1.991630779315289e-05, 'epoch': 0.09} {'loss': 1.0333, 'learning_rate': 1.9916265524744357e-05, 'epoch': 0.09} {'loss': 0.912, 'learning_rate': 1.991622324570965e-05, 'epoch': 0.09} {'loss': 0.8652, 'learning_rate': 1.9916180956048814e-05, 'epoch': 0.09} {'loss': 0.7855, 'learning_rate': 1.9916138655761898e-05, 'epoch': 0.09} {'loss': 0.8161, 'learning_rate': 1.9916096344848942e-05, 'epoch': 0.09} {'loss': 1.0406, 'learning_rate': 1.9916054023309992e-05, 'epoch': 0.09} {'loss': 0.8717, 'learning_rate': 1.99160116911451e-05, 'epoch': 0.09} {'loss': 0.9791, 'learning_rate': 1.99159693483543e-05, 'epoch': 0.09} {'loss': 0.9752, 'learning_rate': 1.9915926994937647e-05, 'epoch': 0.09} {'loss': 0.8834, 'learning_rate': 1.9915884630895187e-05, 'epoch': 0.09} {'loss': 1.0382, 'learning_rate': 1.9915842256226956e-05, 'epoch': 0.09} {'loss': 0.9427, 'learning_rate': 1.991579987093301e-05, 'epoch': 0.09} {'loss': 0.9567, 'learning_rate': 1.9915757475013386e-05, 'epoch': 0.09} {'loss': 0.895, 'learning_rate': 1.991571506846813e-05, 'epoch': 0.09} {'loss': 0.8643, 'learning_rate': 1.9915672651297297e-05, 'epoch': 0.09} {'loss': 0.8152, 'learning_rate': 1.9915630223500924e-05, 'epoch': 0.09} {'loss': 0.9464, 'learning_rate': 1.9915587785079057e-05, 'epoch': 0.09} {'loss': 0.8838, 'learning_rate': 1.9915545336031742e-05, 'epoch': 0.09} {'loss': 1.125, 'learning_rate': 1.9915502876359025e-05, 'epoch': 0.09} {'loss': 0.8523, 'learning_rate': 1.9915460406060954e-05, 'epoch': 0.09} {'loss': 0.9126, 'learning_rate': 1.9915417925137573e-05, 'epoch': 0.09} {'loss': 1.093, 'learning_rate': 1.9915375433588923e-05, 'epoch': 0.09} {'loss': 1.0261, 'learning_rate': 1.9915332931415057e-05, 'epoch': 0.09} {'loss': 0.7247, 'learning_rate': 1.9915290418616014e-05, 'epoch': 0.09} {'loss': 0.9824, 'learning_rate': 1.9915247895191846e-05, 'epoch': 0.09} {'loss': 1.0541, 'learning_rate': 1.9915205361142593e-05, 'epoch': 0.09} {'loss': 0.9584, 'learning_rate': 1.99151628164683e-05, 'epoch': 0.09} {'loss': 1.0, 'learning_rate': 1.991512026116902e-05, 'epoch': 0.09} {'loss': 0.8567, 'learning_rate': 1.9915077695244788e-05, 'epoch': 0.09} {'loss': 1.002, 'learning_rate': 1.991503511869566e-05, 'epoch': 0.09} {'loss': 0.9855, 'learning_rate': 1.9914992531521675e-05, 'epoch': 0.09} {'loss': 0.9965, 'learning_rate': 1.991494993372288e-05, 'epoch': 0.09} {'loss': 0.9803, 'learning_rate': 1.991490732529932e-05, 'epoch': 0.09} {'loss': 1.0136, 'learning_rate': 1.9914864706251046e-05, 'epoch': 0.09} {'loss': 1.0098, 'learning_rate': 1.99148220765781e-05, 'epoch': 0.09} {'loss': 0.89, 'learning_rate': 1.9914779436280525e-05, 'epoch': 0.09} {'loss': 1.0363, 'learning_rate': 1.9914736785358367e-05, 'epoch': 0.09} {'loss': 0.8497, 'learning_rate': 1.9914694123811674e-05, 'epoch': 0.09} {'loss': 0.8768, 'learning_rate': 1.9914651451640495e-05, 'epoch': 0.09} {'loss': 0.9954, 'learning_rate': 1.991460876884487e-05, 'epoch': 0.09} {'loss': 0.9937, 'learning_rate': 1.991456607542485e-05, 'epoch': 0.09} {'loss': 1.007, 'learning_rate': 1.991452337138047e-05, 'epoch': 0.09} {'loss': 0.9189, 'learning_rate': 1.991448065671179e-05, 'epoch': 0.09} {'loss': 1.0152, 'learning_rate': 1.991443793141885e-05, 'epoch': 0.09} {'loss': 0.9025, 'learning_rate': 1.991439519550169e-05, 'epoch': 0.09} {'loss': 0.9667, 'learning_rate': 1.9914352448960363e-05, 'epoch': 0.09} {'loss': 0.9134, 'learning_rate': 1.9914309691794913e-05, 'epoch': 0.09} {'loss': 0.9089, 'learning_rate': 1.9914266924005386e-05, 'epoch': 0.09} {'loss': 0.9529, 'learning_rate': 1.9914224145591823e-05, 'epoch': 0.09} {'loss': 0.9785, 'learning_rate': 1.991418135655428e-05, 'epoch': 0.09} {'loss': 0.8667, 'learning_rate': 1.9914138556892792e-05, 'epoch': 0.09} {'loss': 1.0632, 'learning_rate': 1.9914095746607412e-05, 'epoch': 0.09} {'loss': 0.87, 'learning_rate': 1.9914052925698183e-05, 'epoch': 0.09} {'loss': 1.0168, 'learning_rate': 1.991401009416515e-05, 'epoch': 0.09} {'loss': 0.9606, 'learning_rate': 1.9913967252008364e-05, 'epoch': 0.09} {'loss': 0.8282, 'learning_rate': 1.9913924399227863e-05, 'epoch': 0.09} {'loss': 1.0024, 'learning_rate': 1.9913881535823702e-05, 'epoch': 0.09} {'loss': 0.9306, 'learning_rate': 1.9913838661795918e-05, 'epoch': 0.09} {'loss': 0.9739, 'learning_rate': 1.9913795777144562e-05, 'epoch': 0.09} {'loss': 1.0365, 'learning_rate': 1.9913752881869682e-05, 'epoch': 0.09} {'loss': 0.8354, 'learning_rate': 1.9913709975971318e-05, 'epoch': 0.09} {'loss': 1.0087, 'learning_rate': 1.991366705944952e-05, 'epoch': 0.09} {'loss': 0.7996, 'learning_rate': 1.991362413230433e-05, 'epoch': 0.09} {'loss': 1.1025, 'learning_rate': 1.99135811945358e-05, 'epoch': 0.09} {'loss': 0.8531, 'learning_rate': 1.9913538246143975e-05, 'epoch': 0.09} {'loss': 0.9724, 'learning_rate': 1.9913495287128897e-05, 'epoch': 0.09} {'loss': 0.9313, 'learning_rate': 1.9913452317490612e-05, 'epoch': 0.09} {'loss': 0.8923, 'learning_rate': 1.991340933722917e-05, 'epoch': 0.09} {'loss': 0.8717, 'learning_rate': 1.9913366346344615e-05, 'epoch': 0.09} {'loss': 1.0766, 'learning_rate': 1.9913323344836993e-05, 'epoch': 0.09} {'loss': 0.8957, 'learning_rate': 1.991328033270635e-05, 'epoch': 0.09} {'loss': 0.9628, 'learning_rate': 1.9913237309952736e-05, 'epoch': 0.09} {'loss': 0.8785, 'learning_rate': 1.991319427657619e-05, 'epoch': 0.09} {'loss': 1.0802, 'learning_rate': 1.9913151232576762e-05, 'epoch': 0.09} {'loss': 0.9043, 'learning_rate': 1.9913108177954496e-05, 'epoch': 0.09} {'loss': 1.1633, 'learning_rate': 1.991306511270944e-05, 'epoch': 0.09} {'loss': 0.8374, 'learning_rate': 1.9913022036841645e-05, 'epoch': 0.09} {'loss': 0.8184, 'learning_rate': 1.991297895035115e-05, 'epoch': 0.09} {'loss': 1.0409, 'learning_rate': 1.9912935853238002e-05, 'epoch': 0.09} {'loss': 1.0176, 'learning_rate': 1.9912892745502247e-05, 'epoch': 0.09} {'loss': 0.8642, 'learning_rate': 1.9912849627143934e-05, 'epoch': 0.09} {'loss': 0.8498, 'learning_rate': 1.991280649816311e-05, 'epoch': 0.09} {'loss': 0.9211, 'learning_rate': 1.991276335855982e-05, 'epoch': 0.09} {'loss': 0.8925, 'learning_rate': 1.9912720208334104e-05, 'epoch': 0.09} {'loss': 0.8778, 'learning_rate': 1.991267704748602e-05, 'epoch': 0.09} {'loss': 0.9742, 'learning_rate': 1.9912633876015603e-05, 'epoch': 0.09} {'loss': 0.9737, 'learning_rate': 1.9912590693922905e-05, 'epoch': 0.09} {'loss': 0.883, 'learning_rate': 1.9912547501207973e-05, 'epoch': 0.09} {'loss': 0.8165, 'learning_rate': 1.991250429787085e-05, 'epoch': 0.09} {'loss': 0.9121, 'learning_rate': 1.9912461083911583e-05, 'epoch': 0.09} {'loss': 0.9081, 'learning_rate': 1.991241785933022e-05, 'epoch': 0.09} {'loss': 0.9419, 'learning_rate': 1.991237462412681e-05, 'epoch': 0.09} {'loss': 0.8686, 'learning_rate': 1.991233137830139e-05, 'epoch': 0.09} {'loss': 0.8803, 'learning_rate': 1.9912288121854017e-05, 'epoch': 0.09} {'loss': 0.9431, 'learning_rate': 1.9912244854784735e-05, 'epoch': 0.09} {'loss': 0.9465, 'learning_rate': 1.9912201577093584e-05, 'epoch': 0.09} {'loss': 0.9888, 'learning_rate': 1.9912158288780614e-05, 'epoch': 0.09} {'loss': 0.906, 'learning_rate': 1.9912114989845874e-05, 'epoch': 0.09} {'loss': 0.9862, 'learning_rate': 1.9912071680289405e-05, 'epoch': 0.09} {'loss': 0.8005, 'learning_rate': 1.9912028360111258e-05, 'epoch': 0.09} {'loss': 0.9154, 'learning_rate': 1.9911985029311478e-05, 'epoch': 0.09} {'loss': 0.9449, 'learning_rate': 1.9911941687890114e-05, 'epoch': 0.09} {'loss': 1.0056, 'learning_rate': 1.9911898335847208e-05, 'epoch': 0.09} {'loss': 0.8528, 'learning_rate': 1.9911854973182807e-05, 'epoch': 0.09} {'loss': 0.6398, 'learning_rate': 1.991181159989696e-05, 'epoch': 0.09} {'loss': 0.8615, 'learning_rate': 1.9911768215989712e-05, 'epoch': 0.09} {'loss': 1.1494, 'learning_rate': 1.991172482146111e-05, 'epoch': 0.09} {'loss': 0.8525, 'learning_rate': 1.99116814163112e-05, 'epoch': 0.09} {'loss': 0.8511, 'learning_rate': 1.991163800054003e-05, 'epoch': 0.09} {'loss': 0.9437, 'learning_rate': 1.991159457414764e-05, 'epoch': 0.09} {'loss': 0.9787, 'learning_rate': 1.9911551137134085e-05, 'epoch': 0.09} {'loss': 0.9777, 'learning_rate': 1.991150768949941e-05, 'epoch': 0.09} {'loss': 0.9193, 'learning_rate': 1.991146423124366e-05, 'epoch': 0.09} {'loss': 1.0607, 'learning_rate': 1.9911420762366883e-05, 'epoch': 0.09} {'loss': 0.8495, 'learning_rate': 1.991137728286912e-05, 'epoch': 0.09} {'loss': 1.0099, 'learning_rate': 1.9911333792750425e-05, 'epoch': 0.09} {'loss': 0.9804, 'learning_rate': 1.9911290292010837e-05, 'epoch': 0.09} {'loss': 0.7664, 'learning_rate': 1.9911246780650412e-05, 'epoch': 0.09} {'loss': 0.8309, 'learning_rate': 1.991120325866919e-05, 'epoch': 0.09} {'loss': 0.9476, 'learning_rate': 1.9911159726067218e-05, 'epoch': 0.09} {'loss': 0.9043, 'learning_rate': 1.9911116182844544e-05, 'epoch': 0.09} {'loss': 1.0981, 'learning_rate': 1.9911072629001215e-05, 'epoch': 0.09} {'loss': 0.7407, 'learning_rate': 1.991102906453728e-05, 'epoch': 0.09} {'loss': 0.8345, 'learning_rate': 1.991098548945278e-05, 'epoch': 0.09} {'loss': 0.8679, 'learning_rate': 1.991094190374776e-05, 'epoch': 0.09} {'loss': 0.8681, 'learning_rate': 1.9910898307422277e-05, 'epoch': 0.09} {'loss': 0.9431, 'learning_rate': 1.991085470047637e-05, 'epoch': 0.09} {'loss': 0.9892, 'learning_rate': 1.9910811082910088e-05, 'epoch': 0.09} {'loss': 0.9538, 'learning_rate': 1.9910767454723477e-05, 'epoch': 0.09} {'loss': 0.9376, 'learning_rate': 1.9910723815916587e-05, 'epoch': 0.09} {'loss': 0.8465, 'learning_rate': 1.9910680166489456e-05, 'epoch': 0.09} {'loss': 0.9409, 'learning_rate': 1.991063650644214e-05, 'epoch': 0.09} {'loss': 0.9226, 'learning_rate': 1.9910592835774687e-05, 'epoch': 0.09} {'loss': 0.9239, 'learning_rate': 1.9910549154487137e-05, 'epoch': 0.09} {'loss': 0.8942, 'learning_rate': 1.9910505462579535e-05, 'epoch': 0.09} {'loss': 1.0393, 'learning_rate': 1.9910461760051932e-05, 'epoch': 0.09} {'loss': 0.9002, 'learning_rate': 1.991041804690438e-05, 'epoch': 0.09} {'loss': 0.9194, 'learning_rate': 1.9910374323136917e-05, 'epoch': 0.09} {'loss': 0.9958, 'learning_rate': 1.9910330588749593e-05, 'epoch': 0.09} {'loss': 0.9624, 'learning_rate': 1.9910286843742458e-05, 'epoch': 0.09} {'loss': 0.9681, 'learning_rate': 1.9910243088115552e-05, 'epoch': 0.09} {'loss': 1.0508, 'learning_rate': 1.9910199321868927e-05, 'epoch': 0.09} {'loss': 0.8479, 'learning_rate': 1.9910155545002633e-05, 'epoch': 0.09} {'loss': 1.0291, 'learning_rate': 1.991011175751671e-05, 'epoch': 0.09} {'loss': 1.0599, 'learning_rate': 1.9910067959411208e-05, 'epoch': 0.09} {'loss': 0.9674, 'learning_rate': 1.9910024150686175e-05, 'epoch': 0.09} {'loss': 1.0047, 'learning_rate': 1.9909980331341657e-05, 'epoch': 0.09} {'loss': 1.1059, 'learning_rate': 1.9909936501377696e-05, 'epoch': 0.09} {'loss': 0.8692, 'learning_rate': 1.990989266079435e-05, 'epoch': 0.09} {'loss': 0.8175, 'learning_rate': 1.9909848809591653e-05, 'epoch': 0.09} {'loss': 1.0335, 'learning_rate': 1.9909804947769666e-05, 'epoch': 0.09} {'loss': 0.8606, 'learning_rate': 1.9909761075328423e-05, 'epoch': 0.09} {'loss': 1.0102, 'learning_rate': 1.9909717192267978e-05, 'epoch': 0.09} {'loss': 0.8923, 'learning_rate': 1.9909673298588377e-05, 'epoch': 0.09} {'loss': 0.8443, 'learning_rate': 1.9909629394289665e-05, 'epoch': 0.09} {'loss': 0.8796, 'learning_rate': 1.9909585479371892e-05, 'epoch': 0.09} {'loss': 0.975, 'learning_rate': 1.9909541553835107e-05, 'epoch': 0.09} {'loss': 0.9978, 'learning_rate': 1.990949761767935e-05, 'epoch': 0.09} {'loss': 0.8078, 'learning_rate': 1.990945367090467e-05, 'epoch': 0.09} {'loss': 1.0263, 'learning_rate': 1.990940971351112e-05, 'epoch': 0.09} {'loss': 0.8039, 'learning_rate': 1.9909365745498742e-05, 'epoch': 0.09} {'loss': 0.8918, 'learning_rate': 1.9909321766867584e-05, 'epoch': 0.09} {'loss': 0.9772, 'learning_rate': 1.9909277777617696e-05, 'epoch': 0.09} {'loss': 1.014, 'learning_rate': 1.990923377774912e-05, 'epoch': 0.09} {'loss': 0.859, 'learning_rate': 1.9909189767261904e-05, 'epoch': 0.09} {'loss': 0.8577, 'learning_rate': 1.99091457461561e-05, 'epoch': 0.09} {'loss': 0.8895, 'learning_rate': 1.990910171443175e-05, 'epoch': 0.09} {'loss': 0.8698, 'learning_rate': 1.99090576720889e-05, 'epoch': 0.09} {'loss': 1.0335, 'learning_rate': 1.9909013619127607e-05, 'epoch': 0.09} {'loss': 0.7727, 'learning_rate': 1.9908969555547908e-05, 'epoch': 0.09} {'loss': 1.0887, 'learning_rate': 1.9908925481349854e-05, 'epoch': 0.09} {'loss': 0.8959, 'learning_rate': 1.990888139653349e-05, 'epoch': 0.09} {'loss': 0.9954, 'learning_rate': 1.990883730109887e-05, 'epoch': 0.09} {'loss': 0.9722, 'learning_rate': 1.9908793195046035e-05, 'epoch': 0.09} {'loss': 0.9333, 'learning_rate': 1.9908749078375032e-05, 'epoch': 0.09} {'loss': 1.0871, 'learning_rate': 1.990870495108591e-05, 'epoch': 0.09} {'loss': 0.8104, 'learning_rate': 1.9908660813178716e-05, 'epoch': 0.09} {'loss': 1.0139, 'learning_rate': 1.99086166646535e-05, 'epoch': 0.09} {'loss': 0.9491, 'learning_rate': 1.9908572505510304e-05, 'epoch': 0.09} {'loss': 1.1543, 'learning_rate': 1.990852833574918e-05, 'epoch': 0.09} {'loss': 0.8686, 'learning_rate': 1.9908484155370177e-05, 'epoch': 0.09} {'loss': 0.8581, 'learning_rate': 1.990843996437333e-05, 'epoch': 0.09} {'loss': 0.9916, 'learning_rate': 1.9908395762758706e-05, 'epoch': 0.09} {'loss': 0.9429, 'learning_rate': 1.9908351550526333e-05, 'epoch': 0.09} {'loss': 0.8896, 'learning_rate': 1.990830732767627e-05, 'epoch': 0.09} {'loss': 0.934, 'learning_rate': 1.9908263094208566e-05, 'epoch': 0.09} {'loss': 0.8981, 'learning_rate': 1.990821885012326e-05, 'epoch': 0.09} {'loss': 0.9227, 'learning_rate': 1.99081745954204e-05, 'epoch': 0.09} {'loss': 0.931, 'learning_rate': 1.990813033010004e-05, 'epoch': 0.09} {'loss': 0.9902, 'learning_rate': 1.9908086054162223e-05, 'epoch': 0.09} {'loss': 0.8518, 'learning_rate': 1.9908041767607e-05, 'epoch': 0.09} {'loss': 0.8921, 'learning_rate': 1.9907997470434413e-05, 'epoch': 0.09} {'loss': 0.9228, 'learning_rate': 1.9907953162644513e-05, 'epoch': 0.09} {'loss': 0.9814, 'learning_rate': 1.990790884423735e-05, 'epoch': 0.09} {'loss': 1.1281, 'learning_rate': 1.9907864515212965e-05, 'epoch': 0.09} {'loss': 0.9522, 'learning_rate': 1.9907820175571408e-05, 'epoch': 0.09} {'loss': 0.8821, 'learning_rate': 1.9907775825312733e-05, 'epoch': 0.09} {'loss': 0.8361, 'learning_rate': 1.9907731464436978e-05, 'epoch': 0.09} {'loss': 0.721, 'learning_rate': 1.9907687092944194e-05, 'epoch': 0.09} {'loss': 0.8738, 'learning_rate': 1.990764271083443e-05, 'epoch': 0.09} {'loss': 0.8849, 'learning_rate': 1.990759831810773e-05, 'epoch': 0.09} {'loss': 0.9129, 'learning_rate': 1.9907553914764145e-05, 'epoch': 0.09} {'loss': 1.0579, 'learning_rate': 1.9907509500803727e-05, 'epoch': 0.09} {'loss': 0.916, 'learning_rate': 1.9907465076226514e-05, 'epoch': 0.09} {'loss': 0.8832, 'learning_rate': 1.990742064103256e-05, 'epoch': 0.09} {'loss': 0.8022, 'learning_rate': 1.9907376195221907e-05, 'epoch': 0.09} {'loss': 1.0422, 'learning_rate': 1.9907331738794608e-05, 'epoch': 0.09} {'loss': 0.7953, 'learning_rate': 1.9907287271750714e-05, 'epoch': 0.09} {'loss': 0.8928, 'learning_rate': 1.990724279409026e-05, 'epoch': 0.09} {'loss': 0.8828, 'learning_rate': 1.9907198305813303e-05, 'epoch': 0.09} {'loss': 0.9295, 'learning_rate': 1.990715380691989e-05, 'epoch': 0.09} {'loss': 0.9903, 'learning_rate': 1.990710929741007e-05, 'epoch': 0.09} {'loss': 1.1141, 'learning_rate': 1.9907064777283883e-05, 'epoch': 0.09} {'loss': 0.8418, 'learning_rate': 1.9907020246541386e-05, 'epoch': 0.09} {'loss': 0.8185, 'learning_rate': 1.990697570518262e-05, 'epoch': 0.09} {'loss': 0.8466, 'learning_rate': 1.990693115320764e-05, 'epoch': 0.09} {'loss': 0.9592, 'learning_rate': 1.9906886590616483e-05, 'epoch': 0.09} {'loss': 0.9235, 'learning_rate': 1.9906842017409206e-05, 'epoch': 0.09} {'loss': 0.9474, 'learning_rate': 1.990679743358585e-05, 'epoch': 0.09} {'loss': 0.8501, 'learning_rate': 1.9906752839146473e-05, 'epoch': 0.09} {'loss': 0.9055, 'learning_rate': 1.9906708234091113e-05, 'epoch': 0.09} {'loss': 0.9902, 'learning_rate': 1.9906663618419818e-05, 'epoch': 0.09} {'loss': 0.9842, 'learning_rate': 1.990661899213264e-05, 'epoch': 0.09} {'loss': 1.0498, 'learning_rate': 1.9906574355229632e-05, 'epoch': 0.09} {'loss': 1.0839, 'learning_rate': 1.990652970771083e-05, 'epoch': 0.09} {'loss': 0.867, 'learning_rate': 1.990648504957629e-05, 'epoch': 0.09} {'loss': 1.0442, 'learning_rate': 1.9906440380826053e-05, 'epoch': 0.09} {'loss': 1.0172, 'learning_rate': 1.9906395701460174e-05, 'epoch': 0.09} {'loss': 0.9539, 'learning_rate': 1.9906351011478695e-05, 'epoch': 0.09} {'loss': 0.8504, 'learning_rate': 1.990630631088167e-05, 'epoch': 0.09} {'loss': 0.8212, 'learning_rate': 1.9906261599669145e-05, 'epoch': 0.09} {'loss': 0.9306, 'learning_rate': 1.990621687784116e-05, 'epoch': 0.09} {'loss': 0.9552, 'learning_rate': 1.9906172145397775e-05, 'epoch': 0.09} {'loss': 1.165, 'learning_rate': 1.9906127402339033e-05, 'epoch': 0.09} {'loss': 1.0598, 'learning_rate': 1.9906082648664976e-05, 'epoch': 0.09} {'loss': 0.7513, 'learning_rate': 1.9906037884375662e-05, 'epoch': 0.09} {'loss': 0.9227, 'learning_rate': 1.9905993109471134e-05, 'epoch': 0.09} {'loss': 1.0132, 'learning_rate': 1.9905948323951437e-05, 'epoch': 0.09} {'loss': 0.8899, 'learning_rate': 1.9905903527816628e-05, 'epoch': 0.09} {'loss': 1.0284, 'learning_rate': 1.9905858721066744e-05, 'epoch': 0.09} {'loss': 1.1566, 'learning_rate': 1.9905813903701844e-05, 'epoch': 0.09} {'loss': 0.8421, 'learning_rate': 1.9905769075721964e-05, 'epoch': 0.09} {'loss': 0.6817, 'learning_rate': 1.9905724237127162e-05, 'epoch': 0.09} {'loss': 0.9009, 'learning_rate': 1.990567938791748e-05, 'epoch': 0.09} {'loss': 0.9207, 'learning_rate': 1.990563452809297e-05, 'epoch': 0.09} {'loss': 0.9649, 'learning_rate': 1.990558965765368e-05, 'epoch': 0.09} {'loss': 0.7483, 'learning_rate': 1.9905544776599655e-05, 'epoch': 0.09} {'loss': 0.8135, 'learning_rate': 1.9905499884930945e-05, 'epoch': 0.09} {'loss': 1.0725, 'learning_rate': 1.99054549826476e-05, 'epoch': 0.09} {'loss': 0.8579, 'learning_rate': 1.9905410069749665e-05, 'epoch': 0.09} {'loss': 0.9531, 'learning_rate': 1.9905365146237184e-05, 'epoch': 0.09} {'loss': 0.9695, 'learning_rate': 1.9905320212110215e-05, 'epoch': 0.09} {'loss': 0.9377, 'learning_rate': 1.99052752673688e-05, 'epoch': 0.09} {'loss': 0.9792, 'learning_rate': 1.990523031201299e-05, 'epoch': 0.09} {'loss': 0.9548, 'learning_rate': 1.990518534604283e-05, 'epoch': 0.09} {'loss': 0.9767, 'learning_rate': 1.9905140369458373e-05, 'epoch': 0.09} {'loss': 0.8024, 'learning_rate': 1.990509538225966e-05, 'epoch': 0.09} {'loss': 0.9854, 'learning_rate': 1.9905050384446744e-05, 'epoch': 0.09} {'loss': 0.7782, 'learning_rate': 1.9905005376019674e-05, 'epoch': 0.09} {'loss': 0.8716, 'learning_rate': 1.99049603569785e-05, 'epoch': 0.09} {'loss': 0.946, 'learning_rate': 1.9904915327323263e-05, 'epoch': 0.09} {'loss': 0.8305, 'learning_rate': 1.9904870287054015e-05, 'epoch': 0.09} {'loss': 0.8944, 'learning_rate': 1.9904825236170805e-05, 'epoch': 0.09} {'loss': 1.0362, 'learning_rate': 1.9904780174673682e-05, 'epoch': 0.09} {'loss': 0.9811, 'learning_rate': 1.990473510256269e-05, 'epoch': 0.09} {'loss': 1.077, 'learning_rate': 1.9904690019837883e-05, 'epoch': 0.09} {'loss': 1.0611, 'learning_rate': 1.9904644926499304e-05, 'epoch': 0.09} {'loss': 0.9361, 'learning_rate': 1.9904599822547007e-05, 'epoch': 0.09} {'loss': 0.8868, 'learning_rate': 1.9904554707981037e-05, 'epoch': 0.09} {'loss': 1.1185, 'learning_rate': 1.9904509582801443e-05, 'epoch': 0.09} {'loss': 0.8503, 'learning_rate': 1.9904464447008272e-05, 'epoch': 0.09} {'loss': 1.0934, 'learning_rate': 1.9904419300601575e-05, 'epoch': 0.09} {'loss': 0.9205, 'learning_rate': 1.9904374143581396e-05, 'epoch': 0.09} {'loss': 0.9823, 'learning_rate': 1.990432897594779e-05, 'epoch': 0.09} {'loss': 1.0081, 'learning_rate': 1.9904283797700795e-05, 'epoch': 0.09} {'loss': 1.0202, 'learning_rate': 1.990423860884047e-05, 'epoch': 0.09} {'loss': 0.8908, 'learning_rate': 1.9904193409366862e-05, 'epoch': 0.09} {'loss': 0.98, 'learning_rate': 1.9904148199280014e-05, 'epoch': 0.09} {'loss': 0.8206, 'learning_rate': 1.9904102978579976e-05, 'epoch': 0.09} {'loss': 0.8733, 'learning_rate': 1.9904057747266802e-05, 'epoch': 0.09} {'loss': 1.1264, 'learning_rate': 1.9904012505340535e-05, 'epoch': 0.09} {'loss': 0.8422, 'learning_rate': 1.9903967252801223e-05, 'epoch': 0.09} {'loss': 0.8667, 'learning_rate': 1.9903921989648916e-05, 'epoch': 0.09} {'loss': 0.9748, 'learning_rate': 1.9903876715883663e-05, 'epoch': 0.09} {'loss': 0.7572, 'learning_rate': 1.990383143150551e-05, 'epoch': 0.09} {'loss': 1.0333, 'learning_rate': 1.9903786136514514e-05, 'epoch': 0.09} {'loss': 1.1253, 'learning_rate': 1.9903740830910712e-05, 'epoch': 0.09} {'loss': 0.9759, 'learning_rate': 1.990369551469416e-05, 'epoch': 0.09} {'loss': 0.8948, 'learning_rate': 1.9903650187864905e-05, 'epoch': 0.09} {'loss': 1.1165, 'learning_rate': 1.990360485042299e-05, 'epoch': 0.09} {'loss': 1.0014, 'learning_rate': 1.9903559502368476e-05, 'epoch': 0.09} {'loss': 0.9056, 'learning_rate': 1.99035141437014e-05, 'epoch': 0.09} {'loss': 0.9544, 'learning_rate': 1.9903468774421816e-05, 'epoch': 0.09} {'loss': 0.9969, 'learning_rate': 1.990342339452977e-05, 'epoch': 0.09} {'loss': 0.9499, 'learning_rate': 1.9903378004025314e-05, 'epoch': 0.09} {'loss': 0.9209, 'learning_rate': 1.990333260290849e-05, 'epoch': 0.09} {'loss': 1.0395, 'learning_rate': 1.9903287191179355e-05, 'epoch': 0.09} {'loss': 0.8993, 'learning_rate': 1.9903241768837954e-05, 'epoch': 0.09} {'loss': 0.9269, 'learning_rate': 1.9903196335884334e-05, 'epoch': 0.09} {'loss': 0.864, 'learning_rate': 1.9903150892318547e-05, 'epoch': 0.09} {'loss': 1.0603, 'learning_rate': 1.990310543814064e-05, 'epoch': 0.09} {'loss': 0.8877, 'learning_rate': 1.990305997335066e-05, 'epoch': 0.09} {'loss': 0.9073, 'learning_rate': 1.990301449794866e-05, 'epoch': 0.09} {'loss': 0.9608, 'learning_rate': 1.990296901193468e-05, 'epoch': 0.09} {'loss': 0.9831, 'learning_rate': 1.9902923515308785e-05, 'epoch': 0.09} {'loss': 1.029, 'learning_rate': 1.9902878008071006e-05, 'epoch': 0.09} {'loss': 0.9672, 'learning_rate': 1.9902832490221402e-05, 'epoch': 0.09} {'loss': 0.9551, 'learning_rate': 1.990278696176002e-05, 'epoch': 0.09} {'loss': 0.9478, 'learning_rate': 1.9902741422686907e-05, 'epoch': 0.09} {'loss': 0.9613, 'learning_rate': 1.9902695873002115e-05, 'epoch': 0.09} {'loss': 0.9831, 'learning_rate': 1.9902650312705684e-05, 'epoch': 0.09} {'loss': 0.944, 'learning_rate': 1.9902604741797675e-05, 'epoch': 0.09} {'loss': 0.894, 'learning_rate': 1.9902559160278128e-05, 'epoch': 0.09} {'loss': 0.9176, 'learning_rate': 1.99025135681471e-05, 'epoch': 0.09} {'loss': 0.9362, 'learning_rate': 1.990246796540463e-05, 'epoch': 0.09} {'loss': 0.9017, 'learning_rate': 1.9902422352050777e-05, 'epoch': 0.09} {'loss': 0.8088, 'learning_rate': 1.990237672808558e-05, 'epoch': 0.09} {'loss': 1.044, 'learning_rate': 1.9902331093509092e-05, 'epoch': 0.1} {'loss': 0.91, 'learning_rate': 1.9902285448321366e-05, 'epoch': 0.1} {'loss': 0.8974, 'learning_rate': 1.9902239792522448e-05, 'epoch': 0.1} {'loss': 0.9089, 'learning_rate': 1.9902194126112385e-05, 'epoch': 0.1} {'loss': 0.9529, 'learning_rate': 1.9902148449091222e-05, 'epoch': 0.1} {'loss': 0.8763, 'learning_rate': 1.990210276145902e-05, 'epoch': 0.1} {'loss': 0.9112, 'learning_rate': 1.990205706321582e-05, 'epoch': 0.1} {'loss': 0.9474, 'learning_rate': 1.990201135436167e-05, 'epoch': 0.1} {'loss': 0.9267, 'learning_rate': 1.9901965634896623e-05, 'epoch': 0.1} {'loss': 0.9432, 'learning_rate': 1.9901919904820725e-05, 'epoch': 0.1} {'loss': 0.9145, 'learning_rate': 1.990187416413403e-05, 'epoch': 0.1} {'loss': 0.8873, 'learning_rate': 1.9901828412836574e-05, 'epoch': 0.1} {'loss': 0.9188, 'learning_rate': 1.9901782650928422e-05, 'epoch': 0.1} {'loss': 0.7925, 'learning_rate': 1.9901736878409617e-05, 'epoch': 0.1} {'loss': 0.9746, 'learning_rate': 1.9901691095280204e-05, 'epoch': 0.1} {'loss': 0.7883, 'learning_rate': 1.9901645301540235e-05, 'epoch': 0.1} {'loss': 0.9369, 'learning_rate': 1.9901599497189763e-05, 'epoch': 0.1} {'loss': 0.957, 'learning_rate': 1.990155368222883e-05, 'epoch': 0.1} {'loss': 0.8169, 'learning_rate': 1.990150785665749e-05, 'epoch': 0.1} {'loss': 0.7827, 'learning_rate': 1.990146202047579e-05, 'epoch': 0.1} {'loss': 0.8632, 'learning_rate': 1.9901416173683783e-05, 'epoch': 0.1} {'loss': 0.8463, 'learning_rate': 1.9901370316281513e-05, 'epoch': 0.1} {'loss': 0.9826, 'learning_rate': 1.9901324448269027e-05, 'epoch': 0.1} {'loss': 1.0436, 'learning_rate': 1.9901278569646383e-05, 'epoch': 0.1} {'loss': 0.9002, 'learning_rate': 1.9901232680413624e-05, 'epoch': 0.1} {'loss': 0.8801, 'learning_rate': 1.9901186780570802e-05, 'epoch': 0.1} {'loss': 0.887, 'learning_rate': 1.990114087011796e-05, 'epoch': 0.1} {'loss': 0.8339, 'learning_rate': 1.9901094949055157e-05, 'epoch': 0.1} {'loss': 0.9637, 'learning_rate': 1.9901049017382433e-05, 'epoch': 0.1} {'loss': 1.1047, 'learning_rate': 1.9901003075099845e-05, 'epoch': 0.1} {'loss': 0.8918, 'learning_rate': 1.9900957122207437e-05, 'epoch': 0.1} {'loss': 0.8024, 'learning_rate': 1.990091115870526e-05, 'epoch': 0.1} {'loss': 1.0387, 'learning_rate': 1.9900865184593364e-05, 'epoch': 0.1} {'loss': 1.0018, 'learning_rate': 1.9900819199871796e-05, 'epoch': 0.1} {'loss': 1.0126, 'learning_rate': 1.9900773204540605e-05, 'epoch': 0.1} {'loss': 0.9984, 'learning_rate': 1.990072719859985e-05, 'epoch': 0.1} {'loss': 0.9117, 'learning_rate': 1.990068118204956e-05, 'epoch': 0.1} {'loss': 0.947, 'learning_rate': 1.9900635154889806e-05, 'epoch': 0.1} {'loss': 0.8995, 'learning_rate': 1.9900589117120625e-05, 'epoch': 0.1} {'loss': 1.0021, 'learning_rate': 1.9900543068742068e-05, 'epoch': 0.1} {'loss': 1.0723, 'learning_rate': 1.9900497009754186e-05, 'epoch': 0.1} {'loss': 0.9473, 'learning_rate': 1.9900450940157027e-05, 'epoch': 0.1} {'loss': 0.9913, 'learning_rate': 1.9900404859950645e-05, 'epoch': 0.1} {'loss': 0.9141, 'learning_rate': 1.990035876913508e-05, 'epoch': 0.1} {'loss': 0.8925, 'learning_rate': 1.990031266771039e-05, 'epoch': 0.1} {'loss': 1.0439, 'learning_rate': 1.9900266555676622e-05, 'epoch': 0.1} {'loss': 1.0112, 'learning_rate': 1.9900220433033825e-05, 'epoch': 0.1} {'loss': 1.0458, 'learning_rate': 1.9900174299782048e-05, 'epoch': 0.1} {'loss': 0.8458, 'learning_rate': 1.990012815592134e-05, 'epoch': 0.1} {'loss': 0.7664, 'learning_rate': 1.990008200145175e-05, 'epoch': 0.1} {'loss': 0.825, 'learning_rate': 1.990003583637333e-05, 'epoch': 0.1} {'loss': 0.8725, 'learning_rate': 1.9899989660686128e-05, 'epoch': 0.1} {'loss': 0.8684, 'learning_rate': 1.9899943474390194e-05, 'epoch': 0.1} {'loss': 1.0213, 'learning_rate': 1.9899897277485575e-05, 'epoch': 0.1} {'loss': 0.9052, 'learning_rate': 1.9899851069972326e-05, 'epoch': 0.1} {'loss': 1.0755, 'learning_rate': 1.989980485185049e-05, 'epoch': 0.1} {'loss': 1.0271, 'learning_rate': 1.989975862312012e-05, 'epoch': 0.1} {'loss': 1.0033, 'learning_rate': 1.9899712383781265e-05, 'epoch': 0.1} {'loss': 1.0991, 'learning_rate': 1.989966613383398e-05, 'epoch': 0.1} {'loss': 0.8663, 'learning_rate': 1.9899619873278304e-05, 'epoch': 0.1} {'loss': 0.9094, 'learning_rate': 1.9899573602114293e-05, 'epoch': 0.1} {'loss': 0.8266, 'learning_rate': 1.9899527320341994e-05, 'epoch': 0.1} {'loss': 0.8521, 'learning_rate': 1.989948102796146e-05, 'epoch': 0.1} {'loss': 0.661, 'learning_rate': 1.9899434724972736e-05, 'epoch': 0.1} {'loss': 1.1698, 'learning_rate': 1.9899388411375878e-05, 'epoch': 0.1} {'loss': 0.9607, 'learning_rate': 1.9899342087170928e-05, 'epoch': 0.1} {'loss': 0.8421, 'learning_rate': 1.989929575235794e-05, 'epoch': 0.1} {'loss': 0.8883, 'learning_rate': 1.9899249406936964e-05, 'epoch': 0.1} {'loss': 1.0071, 'learning_rate': 1.9899203050908048e-05, 'epoch': 0.1} {'loss': 0.9239, 'learning_rate': 1.9899156684271247e-05, 'epoch': 0.1} {'loss': 1.0984, 'learning_rate': 1.9899110307026602e-05, 'epoch': 0.1} {'loss': 1.029, 'learning_rate': 1.9899063919174167e-05, 'epoch': 0.1} {'loss': 0.9968, 'learning_rate': 1.9899017520713992e-05, 'epoch': 0.1} {'loss': 0.8628, 'learning_rate': 1.9898971111646126e-05, 'epoch': 0.1} {'loss': 0.9338, 'learning_rate': 1.989892469197062e-05, 'epoch': 0.1} {'loss': 0.9805, 'learning_rate': 1.9898878261687522e-05, 'epoch': 0.1} {'loss': 1.0344, 'learning_rate': 1.9898831820796882e-05, 'epoch': 0.1} {'loss': 0.8031, 'learning_rate': 1.989878536929875e-05, 'epoch': 0.1} {'loss': 0.8817, 'learning_rate': 1.9898738907193178e-05, 'epoch': 0.1} {'loss': 1.0231, 'learning_rate': 1.9898692434480212e-05, 'epoch': 0.1} {'loss': 1.0704, 'learning_rate': 1.9898645951159906e-05, 'epoch': 0.1} {'loss': 0.7941, 'learning_rate': 1.9898599457232305e-05, 'epoch': 0.1} {'loss': 0.8993, 'learning_rate': 1.9898552952697463e-05, 'epoch': 0.1} {'loss': 0.9892, 'learning_rate': 1.9898506437555427e-05, 'epoch': 0.1} {'loss': 1.0613, 'learning_rate': 1.989845991180625e-05, 'epoch': 0.1} {'loss': 0.929, 'learning_rate': 1.9898413375449978e-05, 'epoch': 0.1} {'loss': 1.0279, 'learning_rate': 1.9898366828486662e-05, 'epoch': 0.1} {'loss': 1.0112, 'learning_rate': 1.9898320270916353e-05, 'epoch': 0.1} {'loss': 0.9095, 'learning_rate': 1.98982737027391e-05, 'epoch': 0.1} {'loss': 1.0094, 'learning_rate': 1.9898227123954953e-05, 'epoch': 0.1} {'loss': 1.0956, 'learning_rate': 1.9898180534563964e-05, 'epoch': 0.1} {'loss': 0.6997, 'learning_rate': 1.9898133934566185e-05, 'epoch': 0.1} {'loss': 0.9303, 'learning_rate': 1.9898087323961655e-05, 'epoch': 0.1} {'loss': 0.9307, 'learning_rate': 1.9898040702750433e-05, 'epoch': 0.1} {'loss': 0.7851, 'learning_rate': 1.989799407093257e-05, 'epoch': 0.1} {'loss': 0.9536, 'learning_rate': 1.989794742850811e-05, 'epoch': 0.1} {'loss': 0.7774, 'learning_rate': 1.989790077547711e-05, 'epoch': 0.1} {'loss': 1.0207, 'learning_rate': 1.989785411183961e-05, 'epoch': 0.1} {'loss': 1.1471, 'learning_rate': 1.989780743759567e-05, 'epoch': 0.1} {'loss': 0.9212, 'learning_rate': 1.9897760752745334e-05, 'epoch': 0.1} {'loss': 0.9446, 'learning_rate': 1.9897714057288656e-05, 'epoch': 0.1} {'loss': 1.012, 'learning_rate': 1.989766735122568e-05, 'epoch': 0.1} {'loss': 0.7321, 'learning_rate': 1.9897620634556466e-05, 'epoch': 0.1} {'loss': 0.7902, 'learning_rate': 1.9897573907281053e-05, 'epoch': 0.1} {'loss': 0.8689, 'learning_rate': 1.98975271693995e-05, 'epoch': 0.1} {'loss': 0.9161, 'learning_rate': 1.989748042091185e-05, 'epoch': 0.1} {'loss': 0.9942, 'learning_rate': 1.989743366181816e-05, 'epoch': 0.1} {'loss': 1.0908, 'learning_rate': 1.9897386892118473e-05, 'epoch': 0.1} {'loss': 0.9347, 'learning_rate': 1.9897340111812845e-05, 'epoch': 0.1} {'loss': 0.9844, 'learning_rate': 1.9897293320901323e-05, 'epoch': 0.1} {'loss': 1.0761, 'learning_rate': 1.9897246519383956e-05, 'epoch': 0.1} {'loss': 1.1209, 'learning_rate': 1.9897199707260802e-05, 'epoch': 0.1} {'loss': 0.9935, 'learning_rate': 1.9897152884531897e-05, 'epoch': 0.1} {'loss': 0.8903, 'learning_rate': 1.9897106051197307e-05, 'epoch': 0.1} {'loss': 1.095, 'learning_rate': 1.989705920725707e-05, 'epoch': 0.1} {'loss': 0.9674, 'learning_rate': 1.9897012352711244e-05, 'epoch': 0.1} {'loss': 0.9575, 'learning_rate': 1.9896965487559873e-05, 'epoch': 0.1} {'loss': 1.0436, 'learning_rate': 1.9896918611803013e-05, 'epoch': 0.1} {'loss': 0.841, 'learning_rate': 1.9896871725440707e-05, 'epoch': 0.1} {'loss': 1.0468, 'learning_rate': 1.9896824828473013e-05, 'epoch': 0.1} {'loss': 0.9036, 'learning_rate': 1.989677792089998e-05, 'epoch': 0.1} {'loss': 1.0388, 'learning_rate': 1.9896731002721653e-05, 'epoch': 0.1} {'loss': 0.8719, 'learning_rate': 1.9896684073938087e-05, 'epoch': 0.1} {'loss': 1.0438, 'learning_rate': 1.9896637134549327e-05, 'epoch': 0.1} {'loss': 0.9266, 'learning_rate': 1.989659018455543e-05, 'epoch': 0.1} {'loss': 0.9306, 'learning_rate': 1.9896543223956442e-05, 'epoch': 0.1} {'loss': 0.9957, 'learning_rate': 1.989649625275242e-05, 'epoch': 0.1} {'loss': 0.8976, 'learning_rate': 1.9896449270943402e-05, 'epoch': 0.1} {'loss': 0.8533, 'learning_rate': 1.989640227852945e-05, 'epoch': 0.1} {'loss': 1.0603, 'learning_rate': 1.989635527551061e-05, 'epoch': 0.1} {'loss': 0.9326, 'learning_rate': 1.989630826188693e-05, 'epoch': 0.1} {'loss': 0.8537, 'learning_rate': 1.9896261237658463e-05, 'epoch': 0.1} {'loss': 1.0469, 'learning_rate': 1.989621420282526e-05, 'epoch': 0.1} {'loss': 1.1018, 'learning_rate': 1.9896167157387365e-05, 'epoch': 0.1} {'loss': 1.0671, 'learning_rate': 1.989612010134484e-05, 'epoch': 0.1} {'loss': 1.0007, 'learning_rate': 1.989607303469773e-05, 'epoch': 0.1} {'loss': 0.7795, 'learning_rate': 1.9896025957446083e-05, 'epoch': 0.1} {'loss': 1.0576, 'learning_rate': 1.9895978869589947e-05, 'epoch': 0.1} {'loss': 0.9426, 'learning_rate': 1.989593177112938e-05, 'epoch': 0.1} {'loss': 0.9112, 'learning_rate': 1.9895884662064428e-05, 'epoch': 0.1} {'loss': 0.8771, 'learning_rate': 1.9895837542395144e-05, 'epoch': 0.1} {'loss': 1.0074, 'learning_rate': 1.9895790412121573e-05, 'epoch': 0.1} {'loss': 0.9071, 'learning_rate': 1.9895743271243773e-05, 'epoch': 0.1} {'loss': 0.9727, 'learning_rate': 1.9895696119761787e-05, 'epoch': 0.1} {'loss': 0.8843, 'learning_rate': 1.9895648957675675e-05, 'epoch': 0.1} {'loss': 1.0167, 'learning_rate': 1.9895601784985476e-05, 'epoch': 0.1} {'loss': 0.8503, 'learning_rate': 1.989555460169125e-05, 'epoch': 0.1} {'loss': 0.9047, 'learning_rate': 1.9895507407793047e-05, 'epoch': 0.1} {'loss': 0.8401, 'learning_rate': 1.989546020329091e-05, 'epoch': 0.1} {'loss': 1.0624, 'learning_rate': 1.9895412988184898e-05, 'epoch': 0.1} {'loss': 0.8173, 'learning_rate': 1.9895365762475054e-05, 'epoch': 0.1} {'loss': 0.7794, 'learning_rate': 1.9895318526161432e-05, 'epoch': 0.1} {'loss': 0.9524, 'learning_rate': 1.989527127924409e-05, 'epoch': 0.1} {'loss': 0.8983, 'learning_rate': 1.9895224021723062e-05, 'epoch': 0.1} {'loss': 0.9465, 'learning_rate': 1.9895176753598416e-05, 'epoch': 0.1} {'loss': 0.9662, 'learning_rate': 1.9895129474870192e-05, 'epoch': 0.1} {'loss': 1.038, 'learning_rate': 1.9895082185538443e-05, 'epoch': 0.1} {'loss': 0.6789, 'learning_rate': 1.989503488560322e-05, 'epoch': 0.1} {'loss': 1.0726, 'learning_rate': 1.989498757506458e-05, 'epoch': 0.1} {'loss': 0.8768, 'learning_rate': 1.9894940253922562e-05, 'epoch': 0.1} {'loss': 0.9465, 'learning_rate': 1.9894892922177224e-05, 'epoch': 0.1} {'loss': 0.9584, 'learning_rate': 1.9894845579828616e-05, 'epoch': 0.1} {'loss': 0.8461, 'learning_rate': 1.9894798226876785e-05, 'epoch': 0.1} {'loss': 0.8815, 'learning_rate': 1.9894750863321785e-05, 'epoch': 0.1} {'loss': 0.8138, 'learning_rate': 1.9894703489163668e-05, 'epoch': 0.1} {'loss': 0.9307, 'learning_rate': 1.9894656104402483e-05, 'epoch': 0.1} {'loss': 0.8605, 'learning_rate': 1.9894608709038283e-05, 'epoch': 0.1} {'loss': 0.8189, 'learning_rate': 1.989456130307111e-05, 'epoch': 0.1} {'loss': 1.0008, 'learning_rate': 1.9894513886501026e-05, 'epoch': 0.1} {'loss': 0.968, 'learning_rate': 1.989446645932808e-05, 'epoch': 0.1} {'loss': 0.9157, 'learning_rate': 1.989441902155232e-05, 'epoch': 0.1} {'loss': 1.0406, 'learning_rate': 1.9894371573173793e-05, 'epoch': 0.1} {'loss': 1.0576, 'learning_rate': 1.9894324114192556e-05, 'epoch': 0.1} {'loss': 0.9609, 'learning_rate': 1.9894276644608656e-05, 'epoch': 0.1} {'loss': 0.8669, 'learning_rate': 1.9894229164422146e-05, 'epoch': 0.1} {'loss': 0.9492, 'learning_rate': 1.9894181673633077e-05, 'epoch': 0.1} {'loss': 0.757, 'learning_rate': 1.98941341722415e-05, 'epoch': 0.1} {'loss': 0.9908, 'learning_rate': 1.9894086660247466e-05, 'epoch': 0.1} {'loss': 1.025, 'learning_rate': 1.9894039137651022e-05, 'epoch': 0.1} {'loss': 0.975, 'learning_rate': 1.9893991604452223e-05, 'epoch': 0.1} {'loss': 1.132, 'learning_rate': 1.9893944060651123e-05, 'epoch': 0.1} {'loss': 0.8456, 'learning_rate': 1.9893896506247766e-05, 'epoch': 0.1} {'loss': 1.0241, 'learning_rate': 1.9893848941242205e-05, 'epoch': 0.1} {'loss': 0.9355, 'learning_rate': 1.989380136563449e-05, 'epoch': 0.1} {'loss': 1.22, 'learning_rate': 1.989375377942468e-05, 'epoch': 0.1} {'loss': 1.0737, 'learning_rate': 1.9893706182612814e-05, 'epoch': 0.1} {'loss': 0.9906, 'learning_rate': 1.989365857519895e-05, 'epoch': 0.1} {'loss': 0.8723, 'learning_rate': 1.989361095718314e-05, 'epoch': 0.1} {'loss': 1.1014, 'learning_rate': 1.9893563328565433e-05, 'epoch': 0.1} {'loss': 0.9312, 'learning_rate': 1.9893515689345878e-05, 'epoch': 0.1} {'loss': 0.816, 'learning_rate': 1.989346803952453e-05, 'epoch': 0.1} {'loss': 0.9425, 'learning_rate': 1.9893420379101437e-05, 'epoch': 0.1} {'loss': 0.8174, 'learning_rate': 1.9893372708076652e-05, 'epoch': 0.1} {'loss': 0.8918, 'learning_rate': 1.9893325026450223e-05, 'epoch': 0.1} {'loss': 0.9318, 'learning_rate': 1.9893277334222205e-05, 'epoch': 0.1} {'loss': 1.0365, 'learning_rate': 1.9893229631392644e-05, 'epoch': 0.1} {'loss': 0.9269, 'learning_rate': 1.9893181917961598e-05, 'epoch': 0.1} {'loss': 0.8685, 'learning_rate': 1.989313419392912e-05, 'epoch': 0.1} {'loss': 0.8595, 'learning_rate': 1.9893086459295246e-05, 'epoch': 0.1} {'loss': 0.9351, 'learning_rate': 1.989303871406004e-05, 'epoch': 0.1} {'loss': 0.9116, 'learning_rate': 1.9892990958223552e-05, 'epoch': 0.1} {'loss': 0.679, 'learning_rate': 1.9892943191785828e-05, 'epoch': 0.1} {'loss': 0.9188, 'learning_rate': 1.9892895414746928e-05, 'epoch': 0.1} {'loss': 0.9934, 'learning_rate': 1.9892847627106896e-05, 'epoch': 0.1} {'loss': 0.765, 'learning_rate': 1.9892799828865782e-05, 'epoch': 0.1} {'loss': 1.1445, 'learning_rate': 1.989275202002364e-05, 'epoch': 0.1} {'loss': 1.1513, 'learning_rate': 1.9892704200580523e-05, 'epoch': 0.1} {'loss': 0.9071, 'learning_rate': 1.9892656370536484e-05, 'epoch': 0.1} {'loss': 0.86, 'learning_rate': 1.9892608529891566e-05, 'epoch': 0.1} {'loss': 0.9936, 'learning_rate': 1.9892560678645823e-05, 'epoch': 0.1} {'loss': 0.8532, 'learning_rate': 1.9892512816799315e-05, 'epoch': 0.1} {'loss': 0.9281, 'learning_rate': 1.989246494435208e-05, 'epoch': 0.1} {'loss': 0.9673, 'learning_rate': 1.989241706130418e-05, 'epoch': 0.1} {'loss': 0.878, 'learning_rate': 1.9892369167655662e-05, 'epoch': 0.1} {'loss': 0.9371, 'learning_rate': 1.989232126340658e-05, 'epoch': 0.1} {'loss': 0.9439, 'learning_rate': 1.9892273348556977e-05, 'epoch': 0.1} {'loss': 1.1122, 'learning_rate': 1.9892225423106914e-05, 'epoch': 0.1} {'loss': 0.9239, 'learning_rate': 1.989217748705644e-05, 'epoch': 0.1} {'loss': 0.9404, 'learning_rate': 1.9892129540405602e-05, 'epoch': 0.1} {'loss': 1.1047, 'learning_rate': 1.9892081583154456e-05, 'epoch': 0.1} {'loss': 1.0003, 'learning_rate': 1.989203361530305e-05, 'epoch': 0.1} {'loss': 1.0139, 'learning_rate': 1.989198563685144e-05, 'epoch': 0.1} {'loss': 0.942, 'learning_rate': 1.9891937647799674e-05, 'epoch': 0.1} {'loss': 0.9767, 'learning_rate': 1.98918896481478e-05, 'epoch': 0.1} {'loss': 1.0747, 'learning_rate': 1.9891841637895878e-05, 'epoch': 0.1} {'loss': 1.0373, 'learning_rate': 1.989179361704395e-05, 'epoch': 0.1} {'loss': 1.0668, 'learning_rate': 1.989174558559208e-05, 'epoch': 0.1} {'loss': 0.8449, 'learning_rate': 1.9891697543540303e-05, 'epoch': 0.1} {'loss': 0.9058, 'learning_rate': 1.9891649490888687e-05, 'epoch': 0.1} {'loss': 0.8802, 'learning_rate': 1.9891601427637272e-05, 'epoch': 0.1} {'loss': 1.1063, 'learning_rate': 1.9891553353786115e-05, 'epoch': 0.1} {'loss': 1.0775, 'learning_rate': 1.9891505269335262e-05, 'epoch': 0.1} {'loss': 0.8028, 'learning_rate': 1.9891457174284774e-05, 'epoch': 0.1} {'loss': 0.9333, 'learning_rate': 1.9891409068634692e-05, 'epoch': 0.1} {'loss': 1.0545, 'learning_rate': 1.9891360952385077e-05, 'epoch': 0.1} {'loss': 0.9812, 'learning_rate': 1.9891312825535973e-05, 'epoch': 0.1} {'loss': 0.9291, 'learning_rate': 1.9891264688087434e-05, 'epoch': 0.1} {'loss': 0.9895, 'learning_rate': 1.9891216540039514e-05, 'epoch': 0.1} {'loss': 1.0141, 'learning_rate': 1.989116838139226e-05, 'epoch': 0.1} {'loss': 0.9968, 'learning_rate': 1.989112021214573e-05, 'epoch': 0.1} {'loss': 0.871, 'learning_rate': 1.989107203229997e-05, 'epoch': 0.1} {'loss': 0.7161, 'learning_rate': 1.9891023841855034e-05, 'epoch': 0.1} {'loss': 0.8096, 'learning_rate': 1.9890975640810973e-05, 'epoch': 0.1} {'loss': 0.6353, 'learning_rate': 1.9890927429167837e-05, 'epoch': 0.1} {'loss': 1.1337, 'learning_rate': 1.9890879206925682e-05, 'epoch': 0.1} {'loss': 0.9638, 'learning_rate': 1.9890830974084557e-05, 'epoch': 0.1} {'loss': 0.8612, 'learning_rate': 1.9890782730644515e-05, 'epoch': 0.1} {'loss': 1.0345, 'learning_rate': 1.98907344766056e-05, 'epoch': 0.1} {'loss': 0.8821, 'learning_rate': 1.989068621196788e-05, 'epoch': 0.1} {'loss': 0.8879, 'learning_rate': 1.9890637936731392e-05, 'epoch': 0.1} {'loss': 0.9318, 'learning_rate': 1.989058965089619e-05, 'epoch': 0.1} {'loss': 0.9738, 'learning_rate': 1.9890541354462334e-05, 'epoch': 0.1} {'loss': 0.9576, 'learning_rate': 1.9890493047429867e-05, 'epoch': 0.1} {'loss': 0.9516, 'learning_rate': 1.9890444729798846e-05, 'epoch': 0.1} {'loss': 0.7757, 'learning_rate': 1.989039640156932e-05, 'epoch': 0.1} {'loss': 0.8105, 'learning_rate': 1.989034806274134e-05, 'epoch': 0.1} {'loss': 0.9826, 'learning_rate': 1.989029971331496e-05, 'epoch': 0.1} {'loss': 1.0259, 'learning_rate': 1.9890251353290233e-05, 'epoch': 0.1} {'loss': 0.9278, 'learning_rate': 1.989020298266721e-05, 'epoch': 0.1} {'loss': 1.0797, 'learning_rate': 1.9890154601445938e-05, 'epoch': 0.1} {'loss': 0.8277, 'learning_rate': 1.9890106209626473e-05, 'epoch': 0.1} {'loss': 0.8456, 'learning_rate': 1.989005780720887e-05, 'epoch': 0.1} {'loss': 1.0933, 'learning_rate': 1.9890009394193174e-05, 'epoch': 0.1} {'loss': 0.9496, 'learning_rate': 1.9889960970579443e-05, 'epoch': 0.1} {'loss': 0.9465, 'learning_rate': 1.9889912536367727e-05, 'epoch': 0.1} {'loss': 0.9703, 'learning_rate': 1.9889864091558074e-05, 'epoch': 0.1} {'loss': 0.7847, 'learning_rate': 1.9889815636150537e-05, 'epoch': 0.1} {'loss': 1.0105, 'learning_rate': 1.9889767170145175e-05, 'epoch': 0.1} {'loss': 1.0152, 'learning_rate': 1.9889718693542032e-05, 'epoch': 0.1} {'loss': 0.9537, 'learning_rate': 1.9889670206341165e-05, 'epoch': 0.1} {'loss': 1.0291, 'learning_rate': 1.9889621708542624e-05, 'epoch': 0.1} {'loss': 0.6706, 'learning_rate': 1.9889573200146458e-05, 'epoch': 0.1} {'loss': 0.886, 'learning_rate': 1.9889524681152724e-05, 'epoch': 0.1} {'loss': 0.8485, 'learning_rate': 1.988947615156147e-05, 'epoch': 0.1} {'loss': 0.8728, 'learning_rate': 1.988942761137275e-05, 'epoch': 0.1} {'loss': 1.0479, 'learning_rate': 1.9889379060586616e-05, 'epoch': 0.1} {'loss': 1.016, 'learning_rate': 1.9889330499203118e-05, 'epoch': 0.1} {'loss': 0.9325, 'learning_rate': 1.9889281927222313e-05, 'epoch': 0.1} {'loss': 1.1089, 'learning_rate': 1.988923334464425e-05, 'epoch': 0.1} {'loss': 0.9312, 'learning_rate': 1.9889184751468978e-05, 'epoch': 0.1} {'loss': 0.9943, 'learning_rate': 1.9889136147696557e-05, 'epoch': 0.1} {'loss': 1.0178, 'learning_rate': 1.9889087533327028e-05, 'epoch': 0.1} {'loss': 1.0164, 'learning_rate': 1.9889038908360453e-05, 'epoch': 0.1} {'loss': 0.9384, 'learning_rate': 1.988899027279688e-05, 'epoch': 0.1} {'loss': 1.037, 'learning_rate': 1.9888941626636358e-05, 'epoch': 0.1} {'loss': 0.9253, 'learning_rate': 1.9888892969878945e-05, 'epoch': 0.1} {'loss': 0.8145, 'learning_rate': 1.988884430252469e-05, 'epoch': 0.1} {'loss': 0.92, 'learning_rate': 1.9888795624573647e-05, 'epoch': 0.1} {'loss': 1.0113, 'learning_rate': 1.9888746936025868e-05, 'epoch': 0.1} {'loss': 1.1057, 'learning_rate': 1.9888698236881403e-05, 'epoch': 0.1} {'loss': 1.0959, 'learning_rate': 1.9888649527140304e-05, 'epoch': 0.1} {'loss': 0.9934, 'learning_rate': 1.9888600806802624e-05, 'epoch': 0.1} {'loss': 0.9984, 'learning_rate': 1.9888552075868416e-05, 'epoch': 0.1} {'loss': 0.9981, 'learning_rate': 1.9888503334337734e-05, 'epoch': 0.1} {'loss': 0.8954, 'learning_rate': 1.988845458221063e-05, 'epoch': 0.1} {'loss': 0.9398, 'learning_rate': 1.988840581948715e-05, 'epoch': 0.1} {'loss': 1.184, 'learning_rate': 1.988835704616735e-05, 'epoch': 0.1} {'loss': 1.0214, 'learning_rate': 1.9888308262251286e-05, 'epoch': 0.1} {'loss': 0.9679, 'learning_rate': 1.9888259467739005e-05, 'epoch': 0.1} {'loss': 1.0749, 'learning_rate': 1.9888210662630566e-05, 'epoch': 0.1} {'loss': 0.9472, 'learning_rate': 1.988816184692601e-05, 'epoch': 0.1} {'loss': 0.9235, 'learning_rate': 1.9888113020625404e-05, 'epoch': 0.1} {'loss': 0.8781, 'learning_rate': 1.9888064183728787e-05, 'epoch': 0.1} {'loss': 0.8044, 'learning_rate': 1.9888015336236218e-05, 'epoch': 0.1} {'loss': 0.8829, 'learning_rate': 1.9887966478147748e-05, 'epoch': 0.1} {'loss': 1.0639, 'learning_rate': 1.988791760946343e-05, 'epoch': 0.1} {'loss': 1.0214, 'learning_rate': 1.9887868730183318e-05, 'epoch': 0.1} {'loss': 0.8905, 'learning_rate': 1.988781984030746e-05, 'epoch': 0.1} {'loss': 0.9379, 'learning_rate': 1.9887770939835907e-05, 'epoch': 0.1} {'loss': 1.0146, 'learning_rate': 1.9887722028768718e-05, 'epoch': 0.1} {'loss': 0.8137, 'learning_rate': 1.9887673107105946e-05, 'epoch': 0.1} {'loss': 0.8819, 'learning_rate': 1.9887624174847636e-05, 'epoch': 0.1} {'loss': 0.9925, 'learning_rate': 1.9887575231993845e-05, 'epoch': 0.1} {'loss': 0.7973, 'learning_rate': 1.9887526278544623e-05, 'epoch': 0.1} {'loss': 0.9983, 'learning_rate': 1.9887477314500026e-05, 'epoch': 0.1} {'loss': 0.9538, 'learning_rate': 1.9887428339860103e-05, 'epoch': 0.1} {'loss': 0.8978, 'learning_rate': 1.988737935462491e-05, 'epoch': 0.1} {'loss': 1.1282, 'learning_rate': 1.98873303587945e-05, 'epoch': 0.1} {'loss': 0.9234, 'learning_rate': 1.988728135236892e-05, 'epoch': 0.1} {'loss': 1.065, 'learning_rate': 1.9887232335348227e-05, 'epoch': 0.1} {'loss': 0.9745, 'learning_rate': 1.9887183307732472e-05, 'epoch': 0.1} {'loss': 0.9866, 'learning_rate': 1.9887134269521704e-05, 'epoch': 0.1} {'loss': 0.9196, 'learning_rate': 1.9887085220715983e-05, 'epoch': 0.1} {'loss': 0.9268, 'learning_rate': 1.9887036161315358e-05, 'epoch': 0.1} {'loss': 0.7914, 'learning_rate': 1.988698709131988e-05, 'epoch': 0.1} {'loss': 0.8522, 'learning_rate': 1.9886938010729605e-05, 'epoch': 0.1} {'loss': 0.9677, 'learning_rate': 1.988688891954458e-05, 'epoch': 0.1} {'loss': 0.9052, 'learning_rate': 1.9886839817764866e-05, 'epoch': 0.1} {'loss': 0.9949, 'learning_rate': 1.9886790705390505e-05, 'epoch': 0.1} {'loss': 1.0323, 'learning_rate': 1.988674158242156e-05, 'epoch': 0.1} {'loss': 1.0408, 'learning_rate': 1.9886692448858075e-05, 'epoch': 0.1} {'loss': 0.9343, 'learning_rate': 1.988664330470011e-05, 'epoch': 0.1} {'loss': 0.9381, 'learning_rate': 1.9886594149947712e-05, 'epoch': 0.1} {'loss': 0.9945, 'learning_rate': 1.988654498460094e-05, 'epoch': 0.1} {'loss': 0.8112, 'learning_rate': 1.988649580865984e-05, 'epoch': 0.1} {'loss': 0.8694, 'learning_rate': 1.9886446622124465e-05, 'epoch': 0.1} {'loss': 0.8992, 'learning_rate': 1.9886397424994873e-05, 'epoch': 0.1} {'loss': 0.7417, 'learning_rate': 1.9886348217271118e-05, 'epoch': 0.1} {'loss': 1.1541, 'learning_rate': 1.988629899895324e-05, 'epoch': 0.1} {'loss': 0.96, 'learning_rate': 1.9886249770041308e-05, 'epoch': 0.1} {'loss': 0.9035, 'learning_rate': 1.9886200530535366e-05, 'epoch': 0.1} {'loss': 1.081, 'learning_rate': 1.9886151280435464e-05, 'epoch': 0.1} {'loss': 1.0339, 'learning_rate': 1.988610201974166e-05, 'epoch': 0.1} {'loss': 0.8706, 'learning_rate': 1.9886052748454004e-05, 'epoch': 0.1} {'loss': 1.0148, 'learning_rate': 1.9886003466572555e-05, 'epoch': 0.1} {'loss': 0.7212, 'learning_rate': 1.9885954174097356e-05, 'epoch': 0.1} {'loss': 0.924, 'learning_rate': 1.9885904871028465e-05, 'epoch': 0.1} {'loss': 1.0277, 'learning_rate': 1.9885855557365937e-05, 'epoch': 0.1} {'loss': 1.01, 'learning_rate': 1.9885806233109825e-05, 'epoch': 0.1} {'loss': 0.8128, 'learning_rate': 1.9885756898260173e-05, 'epoch': 0.1} {'loss': 0.9533, 'learning_rate': 1.9885707552817043e-05, 'epoch': 0.1} {'loss': 1.1273, 'learning_rate': 1.9885658196780485e-05, 'epoch': 0.1} {'loss': 0.8893, 'learning_rate': 1.9885608830150554e-05, 'epoch': 0.1} {'loss': 1.049, 'learning_rate': 1.98855594529273e-05, 'epoch': 0.1} {'loss': 1.046, 'learning_rate': 1.9885510065110778e-05, 'epoch': 0.1} {'loss': 0.841, 'learning_rate': 1.9885460666701037e-05, 'epoch': 0.1} {'loss': 0.9511, 'learning_rate': 1.9885411257698134e-05, 'epoch': 0.1} {'loss': 0.841, 'learning_rate': 1.988536183810212e-05, 'epoch': 0.1} {'loss': 0.9374, 'learning_rate': 1.988531240791305e-05, 'epoch': 0.1} {'loss': 1.0837, 'learning_rate': 1.988526296713097e-05, 'epoch': 0.1} {'loss': 0.957, 'learning_rate': 1.9885213515755945e-05, 'epoch': 0.1} {'loss': 0.9088, 'learning_rate': 1.988516405378802e-05, 'epoch': 0.1} {'loss': 0.7965, 'learning_rate': 1.988511458122725e-05, 'epoch': 0.1} {'loss': 0.9293, 'learning_rate': 1.9885065098073687e-05, 'epoch': 0.1} {'loss': 0.939, 'learning_rate': 1.9885015604327384e-05, 'epoch': 0.1} {'loss': 0.9291, 'learning_rate': 1.9884966099988394e-05, 'epoch': 0.1} {'loss': 0.8667, 'learning_rate': 1.988491658505677e-05, 'epoch': 0.1} {'loss': 0.9168, 'learning_rate': 1.988486705953257e-05, 'epoch': 0.1} {'loss': 0.9525, 'learning_rate': 1.988481752341584e-05, 'epoch': 0.1} {'loss': 1.0036, 'learning_rate': 1.9884767976706633e-05, 'epoch': 0.1} {'loss': 1.0792, 'learning_rate': 1.988471841940501e-05, 'epoch': 0.1} {'loss': 0.908, 'learning_rate': 1.9884668851511016e-05, 'epoch': 0.1} {'loss': 0.9916, 'learning_rate': 1.9884619273024707e-05, 'epoch': 0.1} {'loss': 0.9945, 'learning_rate': 1.9884569683946136e-05, 'epoch': 0.1} {'loss': 0.9739, 'learning_rate': 1.988452008427536e-05, 'epoch': 0.1} {'loss': 0.8272, 'learning_rate': 1.9884470474012424e-05, 'epoch': 0.1} {'loss': 0.8399, 'learning_rate': 1.9884420853157392e-05, 'epoch': 0.1} {'loss': 0.9147, 'learning_rate': 1.9884371221710304e-05, 'epoch': 0.1} {'loss': 0.8537, 'learning_rate': 1.9884321579671225e-05, 'epoch': 0.1} {'loss': 1.137, 'learning_rate': 1.9884271927040203e-05, 'epoch': 0.1} {'loss': 0.9188, 'learning_rate': 1.988422226381729e-05, 'epoch': 0.1} {'loss': 0.9455, 'learning_rate': 1.988417259000254e-05, 'epoch': 0.1} {'loss': 0.9191, 'learning_rate': 1.9884122905596007e-05, 'epoch': 0.1} {'loss': 0.9017, 'learning_rate': 1.9884073210597745e-05, 'epoch': 0.1} {'loss': 1.0159, 'learning_rate': 1.9884023505007807e-05, 'epoch': 0.1} {'loss': 0.913, 'learning_rate': 1.9883973788826247e-05, 'epoch': 0.1} {'loss': 1.0234, 'learning_rate': 1.9883924062053112e-05, 'epoch': 0.1} {'loss': 0.8259, 'learning_rate': 1.9883874324688464e-05, 'epoch': 0.1} {'loss': 0.8992, 'learning_rate': 1.988382457673235e-05, 'epoch': 0.1} {'loss': 0.9841, 'learning_rate': 1.9883774818184828e-05, 'epoch': 0.1} {'loss': 0.9327, 'learning_rate': 1.988372504904595e-05, 'epoch': 0.1} {'loss': 0.9982, 'learning_rate': 1.9883675269315768e-05, 'epoch': 0.1} {'loss': 0.9676, 'learning_rate': 1.9883625478994335e-05, 'epoch': 0.1} {'loss': 1.0393, 'learning_rate': 1.9883575678081705e-05, 'epoch': 0.1} {'loss': 0.9623, 'learning_rate': 1.9883525866577936e-05, 'epoch': 0.1} {'loss': 0.9041, 'learning_rate': 1.988347604448307e-05, 'epoch': 0.1} {'loss': 0.9644, 'learning_rate': 1.988342621179717e-05, 'epoch': 0.1} {'loss': 1.0318, 'learning_rate': 1.9883376368520292e-05, 'epoch': 0.1} {'loss': 0.9285, 'learning_rate': 1.9883326514652476e-05, 'epoch': 0.1} {'loss': 0.8927, 'learning_rate': 1.9883276650193787e-05, 'epoch': 0.1} {'loss': 0.8366, 'learning_rate': 1.9883226775144276e-05, 'epoch': 0.1} {'loss': 0.7786, 'learning_rate': 1.9883176889503993e-05, 'epoch': 0.1} {'loss': 0.955, 'learning_rate': 1.9883126993273e-05, 'epoch': 0.1} {'loss': 0.9684, 'learning_rate': 1.988307708645134e-05, 'epoch': 0.1} {'loss': 0.9, 'learning_rate': 1.9883027169039072e-05, 'epoch': 0.1} {'loss': 0.8342, 'learning_rate': 1.9882977241036245e-05, 'epoch': 0.1} {'loss': 0.9625, 'learning_rate': 1.988292730244292e-05, 'epoch': 0.1} {'loss': 1.0273, 'learning_rate': 1.9882877353259142e-05, 'epoch': 0.1} {'loss': 0.9046, 'learning_rate': 1.9882827393484974e-05, 'epoch': 0.1} {'loss': 1.0141, 'learning_rate': 1.988277742312046e-05, 'epoch': 0.1} {'loss': 0.8844, 'learning_rate': 1.988272744216566e-05, 'epoch': 0.1} {'loss': 0.9006, 'learning_rate': 1.988267745062063e-05, 'epoch': 0.1} {'loss': 0.9994, 'learning_rate': 1.9882627448485415e-05, 'epoch': 0.1} {'loss': 0.9058, 'learning_rate': 1.988257743576007e-05, 'epoch': 0.1} {'loss': 0.8452, 'learning_rate': 1.9882527412444654e-05, 'epoch': 0.1} {'loss': 0.7565, 'learning_rate': 1.988247737853922e-05, 'epoch': 0.1} {'loss': 1.1598, 'learning_rate': 1.9882427334043816e-05, 'epoch': 0.1} {'loss': 1.0054, 'learning_rate': 1.98823772789585e-05, 'epoch': 0.1} {'loss': 1.0535, 'learning_rate': 1.9882327213283325e-05, 'epoch': 0.1} {'loss': 0.8106, 'learning_rate': 1.9882277137018345e-05, 'epoch': 0.1} {'loss': 1.0415, 'learning_rate': 1.9882227050163613e-05, 'epoch': 0.1} {'loss': 0.9857, 'learning_rate': 1.9882176952719185e-05, 'epoch': 0.1} {'loss': 0.9563, 'learning_rate': 1.988212684468511e-05, 'epoch': 0.1} {'loss': 0.8434, 'learning_rate': 1.9882076726061445e-05, 'epoch': 0.1} {'loss': 0.8046, 'learning_rate': 1.988202659684824e-05, 'epoch': 0.1} {'loss': 0.9984, 'learning_rate': 1.9881976457045553e-05, 'epoch': 0.1} {'loss': 1.1133, 'learning_rate': 1.988192630665344e-05, 'epoch': 0.1} {'loss': 1.0625, 'learning_rate': 1.9881876145671945e-05, 'epoch': 0.1} {'loss': 1.03, 'learning_rate': 1.9881825974101132e-05, 'epoch': 0.1} {'loss': 0.9558, 'learning_rate': 1.9881775791941052e-05, 'epoch': 0.1} {'loss': 0.9461, 'learning_rate': 1.9881725599191752e-05, 'epoch': 0.1} {'loss': 0.9254, 'learning_rate': 1.9881675395853297e-05, 'epoch': 0.1} {'loss': 1.0217, 'learning_rate': 1.988162518192573e-05, 'epoch': 0.1} {'loss': 1.0211, 'learning_rate': 1.9881574957409114e-05, 'epoch': 0.1} {'loss': 0.9874, 'learning_rate': 1.9881524722303495e-05, 'epoch': 0.1} {'loss': 1.0176, 'learning_rate': 1.988147447660893e-05, 'epoch': 0.1} {'loss': 1.0456, 'learning_rate': 1.9881424220325475e-05, 'epoch': 0.1} {'loss': 0.8051, 'learning_rate': 1.9881373953453186e-05, 'epoch': 0.1} {'loss': 0.8665, 'learning_rate': 1.9881323675992108e-05, 'epoch': 0.1} {'loss': 0.9725, 'learning_rate': 1.98812733879423e-05, 'epoch': 0.1} {'loss': 0.8831, 'learning_rate': 1.9881223089303817e-05, 'epoch': 0.1} {'loss': 1.0187, 'learning_rate': 1.9881172780076713e-05, 'epoch': 0.1} {'loss': 1.0032, 'learning_rate': 1.9881122460261036e-05, 'epoch': 0.1} {'loss': 0.7768, 'learning_rate': 1.9881072129856848e-05, 'epoch': 0.1} {'loss': 0.9718, 'learning_rate': 1.9881021788864202e-05, 'epoch': 0.1} {'loss': 0.9098, 'learning_rate': 1.9880971437283143e-05, 'epoch': 0.1} {'loss': 1.0084, 'learning_rate': 1.9880921075113735e-05, 'epoch': 0.1} {'loss': 1.0769, 'learning_rate': 1.9880870702356026e-05, 'epoch': 0.1} {'loss': 0.7094, 'learning_rate': 1.9880820319010073e-05, 'epoch': 0.1} {'loss': 1.0343, 'learning_rate': 1.988076992507593e-05, 'epoch': 0.1} {'loss': 0.9396, 'learning_rate': 1.9880719520553652e-05, 'epoch': 0.1} {'loss': 1.1307, 'learning_rate': 1.988066910544329e-05, 'epoch': 0.1} {'loss': 0.8968, 'learning_rate': 1.98806186797449e-05, 'epoch': 0.1} {'loss': 0.967, 'learning_rate': 1.9880568243458533e-05, 'epoch': 0.1} {'loss': 0.9943, 'learning_rate': 1.9880517796584248e-05, 'epoch': 0.1} {'loss': 0.8206, 'learning_rate': 1.9880467339122092e-05, 'epoch': 0.1} {'loss': 1.1174, 'learning_rate': 1.988041687107213e-05, 'epoch': 0.1} {'loss': 0.9404, 'learning_rate': 1.9880366392434404e-05, 'epoch': 0.1} {'loss': 1.0915, 'learning_rate': 1.9880315903208976e-05, 'epoch': 0.1} {'loss': 0.903, 'learning_rate': 1.9880265403395898e-05, 'epoch': 0.1} {'loss': 0.9693, 'learning_rate': 1.9880214892995223e-05, 'epoch': 0.1} {'loss': 1.0583, 'learning_rate': 1.9880164372007006e-05, 'epoch': 0.1} {'loss': 1.0896, 'learning_rate': 1.98801138404313e-05, 'epoch': 0.1} {'loss': 0.9133, 'learning_rate': 1.9880063298268163e-05, 'epoch': 0.1} {'loss': 0.9832, 'learning_rate': 1.9880012745517643e-05, 'epoch': 0.1} {'loss': 1.0194, 'learning_rate': 1.98799621821798e-05, 'epoch': 0.1} {'loss': 0.8959, 'learning_rate': 1.9879911608254684e-05, 'epoch': 0.1} {'loss': 0.9357, 'learning_rate': 1.9879861023742353e-05, 'epoch': 0.1} {'loss': 0.9217, 'learning_rate': 1.987981042864286e-05, 'epoch': 0.1} {'loss': 0.7751, 'learning_rate': 1.9879759822956256e-05, 'epoch': 0.1} {'loss': 0.7382, 'learning_rate': 1.98797092066826e-05, 'epoch': 0.1} {'loss': 0.7944, 'learning_rate': 1.9879658579821944e-05, 'epoch': 0.1} {'loss': 0.8101, 'learning_rate': 1.987960794237434e-05, 'epoch': 0.1} {'loss': 0.9647, 'learning_rate': 1.9879557294339844e-05, 'epoch': 0.1} {'loss': 0.9318, 'learning_rate': 1.987950663571851e-05, 'epoch': 0.1} {'loss': 0.9739, 'learning_rate': 1.9879455966510396e-05, 'epoch': 0.1} {'loss': 0.8526, 'learning_rate': 1.9879405286715552e-05, 'epoch': 0.1} {'loss': 0.9075, 'learning_rate': 1.9879354596334033e-05, 'epoch': 0.1} {'loss': 0.8517, 'learning_rate': 1.9879303895365897e-05, 'epoch': 0.1} {'loss': 1.0569, 'learning_rate': 1.987925318381119e-05, 'epoch': 0.1} {'loss': 0.8177, 'learning_rate': 1.9879202461669975e-05, 'epoch': 0.1} {'loss': 0.9239, 'learning_rate': 1.9879151728942304e-05, 'epoch': 0.1} {'loss': 0.8561, 'learning_rate': 1.987910098562823e-05, 'epoch': 0.11} {'loss': 0.8941, 'learning_rate': 1.9879050231727805e-05, 'epoch': 0.11} {'loss': 0.9396, 'learning_rate': 1.9878999467241085e-05, 'epoch': 0.11} {'loss': 0.8936, 'learning_rate': 1.9878948692168126e-05, 'epoch': 0.11} {'loss': 0.9984, 'learning_rate': 1.9878897906508984e-05, 'epoch': 0.11} {'loss': 0.707, 'learning_rate': 1.9878847110263712e-05, 'epoch': 0.11} {'loss': 1.068, 'learning_rate': 1.987879630343236e-05, 'epoch': 0.11} {'loss': 0.8655, 'learning_rate': 1.9878745486014992e-05, 'epoch': 0.11} {'loss': 0.8301, 'learning_rate': 1.9878694658011653e-05, 'epoch': 0.11} {'loss': 0.9651, 'learning_rate': 1.9878643819422398e-05, 'epoch': 0.11} {'loss': 1.0909, 'learning_rate': 1.9878592970247287e-05, 'epoch': 0.11} {'loss': 0.9097, 'learning_rate': 1.9878542110486376e-05, 'epoch': 0.11} {'loss': 0.9584, 'learning_rate': 1.987849124013971e-05, 'epoch': 0.11} {'loss': 0.9062, 'learning_rate': 1.9878440359207352e-05, 'epoch': 0.11} {'loss': 0.9726, 'learning_rate': 1.9878389467689353e-05, 'epoch': 0.11} {'loss': 1.0263, 'learning_rate': 1.987833856558577e-05, 'epoch': 0.11} {'loss': 0.8204, 'learning_rate': 1.9878287652896652e-05, 'epoch': 0.11} {'loss': 0.9455, 'learning_rate': 1.987823672962206e-05, 'epoch': 0.11} {'loss': 0.9671, 'learning_rate': 1.9878185795762044e-05, 'epoch': 0.11} {'loss': 1.0732, 'learning_rate': 1.9878134851316662e-05, 'epoch': 0.11} {'loss': 1.0063, 'learning_rate': 1.9878083896285964e-05, 'epoch': 0.11} {'loss': 0.9528, 'learning_rate': 1.987803293067001e-05, 'epoch': 0.11} {'loss': 1.1011, 'learning_rate': 1.987798195446885e-05, 'epoch': 0.11} {'loss': 0.9901, 'learning_rate': 1.9877930967682545e-05, 'epoch': 0.11} {'loss': 0.8456, 'learning_rate': 1.9877879970311143e-05, 'epoch': 0.11} {'loss': 0.9684, 'learning_rate': 1.9877828962354702e-05, 'epoch': 0.11} {'loss': 1.028, 'learning_rate': 1.9877777943813273e-05, 'epoch': 0.11} {'loss': 0.8549, 'learning_rate': 1.9877726914686914e-05, 'epoch': 0.11} {'loss': 0.9969, 'learning_rate': 1.9877675874975683e-05, 'epoch': 0.11} {'loss': 1.0416, 'learning_rate': 1.9877624824679626e-05, 'epoch': 0.11} {'loss': 0.8965, 'learning_rate': 1.9877573763798804e-05, 'epoch': 0.11} {'loss': 0.9621, 'learning_rate': 1.987752269233327e-05, 'epoch': 0.11} {'loss': 0.8737, 'learning_rate': 1.9877471610283083e-05, 'epoch': 0.11} {'loss': 0.9699, 'learning_rate': 1.987742051764829e-05, 'epoch': 0.11} {'loss': 0.9173, 'learning_rate': 1.9877369414428947e-05, 'epoch': 0.11} {'loss': 0.8709, 'learning_rate': 1.9877318300625115e-05, 'epoch': 0.11} {'loss': 0.8438, 'learning_rate': 1.9877267176236843e-05, 'epoch': 0.11} {'loss': 1.1129, 'learning_rate': 1.987721604126419e-05, 'epoch': 0.11} {'loss': 1.096, 'learning_rate': 1.9877164895707206e-05, 'epoch': 0.11} {'loss': 0.8213, 'learning_rate': 1.987711373956595e-05, 'epoch': 0.11} {'loss': 0.857, 'learning_rate': 1.9877062572840474e-05, 'epoch': 0.11} {'loss': 0.8842, 'learning_rate': 1.9877011395530833e-05, 'epoch': 0.11} {'loss': 1.1011, 'learning_rate': 1.9876960207637086e-05, 'epoch': 0.11} {'loss': 0.9524, 'learning_rate': 1.9876909009159283e-05, 'epoch': 0.11} {'loss': 0.935, 'learning_rate': 1.987685780009748e-05, 'epoch': 0.11} {'loss': 1.1083, 'learning_rate': 1.9876806580451732e-05, 'epoch': 0.11} {'loss': 0.9237, 'learning_rate': 1.9876755350222095e-05, 'epoch': 0.11} {'loss': 0.8428, 'learning_rate': 1.9876704109408627e-05, 'epoch': 0.11} {'loss': 1.0056, 'learning_rate': 1.9876652858011373e-05, 'epoch': 0.11} {'loss': 0.9819, 'learning_rate': 1.9876601596030398e-05, 'epoch': 0.11} {'loss': 0.7882, 'learning_rate': 1.9876550323465754e-05, 'epoch': 0.11} {'loss': 1.0018, 'learning_rate': 1.9876499040317493e-05, 'epoch': 0.11} {'loss': 0.88, 'learning_rate': 1.987644774658567e-05, 'epoch': 0.11} {'loss': 1.0227, 'learning_rate': 1.9876396442270343e-05, 'epoch': 0.11} {'loss': 0.9115, 'learning_rate': 1.9876345127371568e-05, 'epoch': 0.11} {'loss': 0.8774, 'learning_rate': 1.9876293801889394e-05, 'epoch': 0.11} {'loss': 1.0175, 'learning_rate': 1.987624246582388e-05, 'epoch': 0.11} {'loss': 0.9697, 'learning_rate': 1.9876191119175086e-05, 'epoch': 0.11} {'loss': 0.914, 'learning_rate': 1.9876139761943058e-05, 'epoch': 0.11} {'loss': 0.9575, 'learning_rate': 1.9876088394127854e-05, 'epoch': 0.11} {'loss': 0.8701, 'learning_rate': 1.9876037015729533e-05, 'epoch': 0.11} {'loss': 0.9925, 'learning_rate': 1.9875985626748144e-05, 'epoch': 0.11} {'loss': 1.0379, 'learning_rate': 1.9875934227183747e-05, 'epoch': 0.11} {'loss': 1.1227, 'learning_rate': 1.9875882817036395e-05, 'epoch': 0.11} {'loss': 0.9995, 'learning_rate': 1.9875831396306142e-05, 'epoch': 0.11} {'loss': 0.7958, 'learning_rate': 1.9875779964993045e-05, 'epoch': 0.11} {'loss': 0.8705, 'learning_rate': 1.9875728523097157e-05, 'epoch': 0.11} {'loss': 1.077, 'learning_rate': 1.9875677070618537e-05, 'epoch': 0.11} {'loss': 0.908, 'learning_rate': 1.9875625607557236e-05, 'epoch': 0.11} {'loss': 1.0503, 'learning_rate': 1.9875574133913312e-05, 'epoch': 0.11} {'loss': 0.9847, 'learning_rate': 1.9875522649686817e-05, 'epoch': 0.11} {'loss': 0.8747, 'learning_rate': 1.987547115487781e-05, 'epoch': 0.11} {'loss': 0.9145, 'learning_rate': 1.9875419649486343e-05, 'epoch': 0.11} {'loss': 0.7818, 'learning_rate': 1.9875368133512473e-05, 'epoch': 0.11} {'loss': 0.9529, 'learning_rate': 1.9875316606956257e-05, 'epoch': 0.11} {'loss': 1.0777, 'learning_rate': 1.9875265069817745e-05, 'epoch': 0.11} {'loss': 0.7771, 'learning_rate': 1.9875213522096995e-05, 'epoch': 0.11} {'loss': 1.0079, 'learning_rate': 1.9875161963794066e-05, 'epoch': 0.11} {'loss': 1.0783, 'learning_rate': 1.9875110394909006e-05, 'epoch': 0.11} {'loss': 0.801, 'learning_rate': 1.987505881544188e-05, 'epoch': 0.11} {'loss': 0.912, 'learning_rate': 1.9875007225392727e-05, 'epoch': 0.11} {'loss': 0.9687, 'learning_rate': 1.9874955624761618e-05, 'epoch': 0.11} {'loss': 1.0787, 'learning_rate': 1.9874904013548603e-05, 'epoch': 0.11} {'loss': 0.812, 'learning_rate': 1.9874852391753738e-05, 'epoch': 0.11} {'loss': 0.9761, 'learning_rate': 1.9874800759377077e-05, 'epoch': 0.11} {'loss': 1.1262, 'learning_rate': 1.9874749116418673e-05, 'epoch': 0.11} {'loss': 0.8522, 'learning_rate': 1.9874697462878586e-05, 'epoch': 0.11} {'loss': 0.9309, 'learning_rate': 1.987464579875687e-05, 'epoch': 0.11} {'loss': 0.861, 'learning_rate': 1.987459412405358e-05, 'epoch': 0.11} {'loss': 0.9679, 'learning_rate': 1.987454243876877e-05, 'epoch': 0.11} {'loss': 1.0838, 'learning_rate': 1.9874490742902498e-05, 'epoch': 0.11} {'loss': 0.8803, 'learning_rate': 1.9874439036454815e-05, 'epoch': 0.11} {'loss': 0.8539, 'learning_rate': 1.9874387319425782e-05, 'epoch': 0.11} {'loss': 0.9978, 'learning_rate': 1.9874335591815452e-05, 'epoch': 0.11} {'loss': 1.0382, 'learning_rate': 1.987428385362388e-05, 'epoch': 0.11} {'loss': 0.9421, 'learning_rate': 1.987423210485112e-05, 'epoch': 0.11} {'loss': 0.9136, 'learning_rate': 1.987418034549723e-05, 'epoch': 0.11} {'loss': 0.9326, 'learning_rate': 1.9874128575562262e-05, 'epoch': 0.11} {'loss': 0.9357, 'learning_rate': 1.987407679504628e-05, 'epoch': 0.11} {'loss': 0.8623, 'learning_rate': 1.987402500394933e-05, 'epoch': 0.11} {'loss': 0.878, 'learning_rate': 1.9873973202271467e-05, 'epoch': 0.11} {'loss': 0.9272, 'learning_rate': 1.9873921390012757e-05, 'epoch': 0.11} {'loss': 0.9859, 'learning_rate': 1.9873869567173246e-05, 'epoch': 0.11} {'loss': 0.8801, 'learning_rate': 1.9873817733752993e-05, 'epoch': 0.11} {'loss': 0.8918, 'learning_rate': 1.9873765889752055e-05, 'epoch': 0.11} {'loss': 0.8898, 'learning_rate': 1.9873714035170482e-05, 'epoch': 0.11} {'loss': 0.9081, 'learning_rate': 1.9873662170008337e-05, 'epoch': 0.11} {'loss': 1.0539, 'learning_rate': 1.987361029426567e-05, 'epoch': 0.11} {'loss': 1.0277, 'learning_rate': 1.987355840794254e-05, 'epoch': 0.11} {'loss': 0.9342, 'learning_rate': 1.9873506511038997e-05, 'epoch': 0.11} {'loss': 0.8743, 'learning_rate': 1.98734546035551e-05, 'epoch': 0.11} {'loss': 1.0137, 'learning_rate': 1.9873402685490914e-05, 'epoch': 0.11} {'loss': 0.8839, 'learning_rate': 1.9873350756846478e-05, 'epoch': 0.11} {'loss': 1.0961, 'learning_rate': 1.987329881762186e-05, 'epoch': 0.11} {'loss': 0.8732, 'learning_rate': 1.987324686781711e-05, 'epoch': 0.11} {'loss': 0.8784, 'learning_rate': 1.9873194907432283e-05, 'epoch': 0.11} {'loss': 0.9521, 'learning_rate': 1.9873142936467435e-05, 'epoch': 0.11} {'loss': 0.7816, 'learning_rate': 1.9873090954922628e-05, 'epoch': 0.11} {'loss': 0.8203, 'learning_rate': 1.9873038962797907e-05, 'epoch': 0.11} {'loss': 0.8386, 'learning_rate': 1.987298696009334e-05, 'epoch': 0.11} {'loss': 1.0185, 'learning_rate': 1.9872934946808973e-05, 'epoch': 0.11} {'loss': 0.9843, 'learning_rate': 1.9872882922944865e-05, 'epoch': 0.11} {'loss': 0.9535, 'learning_rate': 1.9872830888501074e-05, 'epoch': 0.11} {'loss': 1.0369, 'learning_rate': 1.9872778843477652e-05, 'epoch': 0.11} {'loss': 0.8456, 'learning_rate': 1.987272678787466e-05, 'epoch': 0.11} {'loss': 0.6287, 'learning_rate': 1.9872674721692145e-05, 'epoch': 0.11} {'loss': 0.8744, 'learning_rate': 1.9872622644930168e-05, 'epoch': 0.11} {'loss': 0.9315, 'learning_rate': 1.9872570557588787e-05, 'epoch': 0.11} {'loss': 0.8617, 'learning_rate': 1.987251845966806e-05, 'epoch': 0.11} {'loss': 1.1348, 'learning_rate': 1.987246635116803e-05, 'epoch': 0.11} {'loss': 0.9748, 'learning_rate': 1.9872414232088767e-05, 'epoch': 0.11} {'loss': 0.9602, 'learning_rate': 1.9872362102430318e-05, 'epoch': 0.11} {'loss': 0.8309, 'learning_rate': 1.9872309962192742e-05, 'epoch': 0.11} {'loss': 0.921, 'learning_rate': 1.9872257811376094e-05, 'epoch': 0.11} {'loss': 0.8721, 'learning_rate': 1.9872205649980435e-05, 'epoch': 0.11} {'loss': 1.0809, 'learning_rate': 1.9872153478005812e-05, 'epoch': 0.11} {'loss': 0.8856, 'learning_rate': 1.987210129545229e-05, 'epoch': 0.11} {'loss': 0.8522, 'learning_rate': 1.9872049102319916e-05, 'epoch': 0.11} {'loss': 0.9938, 'learning_rate': 1.9871996898608754e-05, 'epoch': 0.11} {'loss': 0.989, 'learning_rate': 1.9871944684318856e-05, 'epoch': 0.11} {'loss': 0.9782, 'learning_rate': 1.9871892459450274e-05, 'epoch': 0.11} {'loss': 0.8164, 'learning_rate': 1.987184022400307e-05, 'epoch': 0.11} {'loss': 0.9249, 'learning_rate': 1.9871787977977305e-05, 'epoch': 0.11} {'loss': 0.8846, 'learning_rate': 1.987173572137302e-05, 'epoch': 0.11} {'loss': 0.8323, 'learning_rate': 1.9871683454190283e-05, 'epoch': 0.11} {'loss': 1.0726, 'learning_rate': 1.9871631176429146e-05, 'epoch': 0.11} {'loss': 0.9149, 'learning_rate': 1.9871578888089665e-05, 'epoch': 0.11} {'loss': 0.9215, 'learning_rate': 1.9871526589171895e-05, 'epoch': 0.11} {'loss': 0.8596, 'learning_rate': 1.9871474279675893e-05, 'epoch': 0.11} {'loss': 0.858, 'learning_rate': 1.9871421959601717e-05, 'epoch': 0.11} {'loss': 0.9215, 'learning_rate': 1.987136962894942e-05, 'epoch': 0.11} {'loss': 0.9659, 'learning_rate': 1.9871317287719058e-05, 'epoch': 0.11} {'loss': 0.8214, 'learning_rate': 1.9871264935910694e-05, 'epoch': 0.11} {'loss': 1.0567, 'learning_rate': 1.9871212573524375e-05, 'epoch': 0.11} {'loss': 0.8988, 'learning_rate': 1.987116020056016e-05, 'epoch': 0.11} {'loss': 1.0889, 'learning_rate': 1.987110781701811e-05, 'epoch': 0.11} {'loss': 1.0262, 'learning_rate': 1.9871055422898272e-05, 'epoch': 0.11} {'loss': 1.0314, 'learning_rate': 1.987100301820071e-05, 'epoch': 0.11} {'loss': 0.8981, 'learning_rate': 1.9870950602925475e-05, 'epoch': 0.11} {'loss': 0.9942, 'learning_rate': 1.9870898177072628e-05, 'epoch': 0.11} {'loss': 1.0898, 'learning_rate': 1.9870845740642224e-05, 'epoch': 0.11} {'loss': 1.2186, 'learning_rate': 1.9870793293634316e-05, 'epoch': 0.11} {'loss': 0.9772, 'learning_rate': 1.987074083604896e-05, 'epoch': 0.11} {'loss': 0.797, 'learning_rate': 1.9870688367886216e-05, 'epoch': 0.11} {'loss': 1.1462, 'learning_rate': 1.9870635889146143e-05, 'epoch': 0.11} {'loss': 0.8954, 'learning_rate': 1.9870583399828787e-05, 'epoch': 0.11} {'loss': 0.8862, 'learning_rate': 1.987053089993421e-05, 'epoch': 0.11} {'loss': 0.9557, 'learning_rate': 1.9870478389462468e-05, 'epoch': 0.11} {'loss': 1.124, 'learning_rate': 1.987042586841362e-05, 'epoch': 0.11} {'loss': 0.8459, 'learning_rate': 1.987037333678772e-05, 'epoch': 0.11} {'loss': 0.8849, 'learning_rate': 1.9870320794584823e-05, 'epoch': 0.11} {'loss': 0.9726, 'learning_rate': 1.987026824180499e-05, 'epoch': 0.11} {'loss': 0.8272, 'learning_rate': 1.9870215678448267e-05, 'epoch': 0.11} {'loss': 0.9074, 'learning_rate': 1.9870163104514725e-05, 'epoch': 0.11} {'loss': 0.9983, 'learning_rate': 1.9870110520004404e-05, 'epoch': 0.11} {'loss': 1.0546, 'learning_rate': 1.9870057924917373e-05, 'epoch': 0.11} {'loss': 1.024, 'learning_rate': 1.9870005319253685e-05, 'epoch': 0.11} {'loss': 0.8178, 'learning_rate': 1.9869952703013395e-05, 'epoch': 0.11} {'loss': 0.8834, 'learning_rate': 1.9869900076196557e-05, 'epoch': 0.11} {'loss': 0.9164, 'learning_rate': 1.9869847438803232e-05, 'epoch': 0.11} {'loss': 0.9558, 'learning_rate': 1.9869794790833478e-05, 'epoch': 0.11} {'loss': 0.8555, 'learning_rate': 1.9869742132287345e-05, 'epoch': 0.11} {'loss': 0.8196, 'learning_rate': 1.986968946316489e-05, 'epoch': 0.11} {'loss': 0.9, 'learning_rate': 1.9869636783466176e-05, 'epoch': 0.11} {'loss': 0.9519, 'learning_rate': 1.9869584093191256e-05, 'epoch': 0.11} {'loss': 1.063, 'learning_rate': 1.986953139234018e-05, 'epoch': 0.11} {'loss': 1.0181, 'learning_rate': 1.9869478680913015e-05, 'epoch': 0.11} {'loss': 1.0691, 'learning_rate': 1.9869425958909813e-05, 'epoch': 0.11} {'loss': 0.7886, 'learning_rate': 1.9869373226330628e-05, 'epoch': 0.11} {'loss': 1.1228, 'learning_rate': 1.9869320483175523e-05, 'epoch': 0.11} {'loss': 0.6778, 'learning_rate': 1.9869267729444546e-05, 'epoch': 0.11} {'loss': 1.0487, 'learning_rate': 1.986921496513776e-05, 'epoch': 0.11} {'loss': 0.7961, 'learning_rate': 1.9869162190255217e-05, 'epoch': 0.11} {'loss': 0.8518, 'learning_rate': 1.9869109404796978e-05, 'epoch': 0.11} {'loss': 0.8491, 'learning_rate': 1.9869056608763096e-05, 'epoch': 0.11} {'loss': 0.8652, 'learning_rate': 1.9869003802153632e-05, 'epoch': 0.11} {'loss': 1.0235, 'learning_rate': 1.9868950984968636e-05, 'epoch': 0.11} {'loss': 1.0631, 'learning_rate': 1.9868898157208173e-05, 'epoch': 0.11} {'loss': 0.8765, 'learning_rate': 1.986884531887229e-05, 'epoch': 0.11} {'loss': 0.9078, 'learning_rate': 1.9868792469961052e-05, 'epoch': 0.11} {'loss': 0.9545, 'learning_rate': 1.9868739610474512e-05, 'epoch': 0.11} {'loss': 0.9833, 'learning_rate': 1.9868686740412726e-05, 'epoch': 0.11} {'loss': 1.0803, 'learning_rate': 1.986863385977575e-05, 'epoch': 0.11} {'loss': 0.8809, 'learning_rate': 1.9868580968563646e-05, 'epoch': 0.11} {'loss': 1.0019, 'learning_rate': 1.9868528066776464e-05, 'epoch': 0.11} {'loss': 0.8745, 'learning_rate': 1.986847515441426e-05, 'epoch': 0.11} {'loss': 1.0641, 'learning_rate': 1.98684222314771e-05, 'epoch': 0.11} {'loss': 0.9016, 'learning_rate': 1.9868369297965035e-05, 'epoch': 0.11} {'loss': 1.0, 'learning_rate': 1.9868316353878115e-05, 'epoch': 0.11} {'loss': 1.0651, 'learning_rate': 1.986826339921641e-05, 'epoch': 0.11} {'loss': 0.7136, 'learning_rate': 1.9868210433979968e-05, 'epoch': 0.11} {'loss': 0.8618, 'learning_rate': 1.9868157458168845e-05, 'epoch': 0.11} {'loss': 0.8685, 'learning_rate': 1.9868104471783106e-05, 'epoch': 0.11} {'loss': 0.997, 'learning_rate': 1.9868051474822797e-05, 'epoch': 0.11} {'loss': 0.8588, 'learning_rate': 1.9867998467287983e-05, 'epoch': 0.11} {'loss': 0.8979, 'learning_rate': 1.986794544917872e-05, 'epoch': 0.11} {'loss': 0.9596, 'learning_rate': 1.9867892420495058e-05, 'epoch': 0.11} {'loss': 1.0176, 'learning_rate': 1.9867839381237064e-05, 'epoch': 0.11} {'loss': 0.9962, 'learning_rate': 1.9867786331404786e-05, 'epoch': 0.11} {'loss': 0.83, 'learning_rate': 1.9867733270998288e-05, 'epoch': 0.11} {'loss': 1.0016, 'learning_rate': 1.986768020001762e-05, 'epoch': 0.11} {'loss': 0.8575, 'learning_rate': 1.986762711846284e-05, 'epoch': 0.11} {'loss': 0.8541, 'learning_rate': 1.986757402633401e-05, 'epoch': 0.11} {'loss': 0.965, 'learning_rate': 1.9867520923631184e-05, 'epoch': 0.11} {'loss': 0.996, 'learning_rate': 1.9867467810354414e-05, 'epoch': 0.11} {'loss': 0.9267, 'learning_rate': 1.986741468650377e-05, 'epoch': 0.11} {'loss': 1.0637, 'learning_rate': 1.9867361552079292e-05, 'epoch': 0.11} {'loss': 0.8651, 'learning_rate': 1.9867308407081053e-05, 'epoch': 0.11} {'loss': 0.9051, 'learning_rate': 1.9867255251509096e-05, 'epoch': 0.11} {'loss': 0.9059, 'learning_rate': 1.986720208536349e-05, 'epoch': 0.11} {'loss': 0.93, 'learning_rate': 1.9867148908644284e-05, 'epoch': 0.11} {'loss': 0.8433, 'learning_rate': 1.9867095721351535e-05, 'epoch': 0.11} {'loss': 0.8906, 'learning_rate': 1.9867042523485304e-05, 'epoch': 0.11} {'loss': 0.9869, 'learning_rate': 1.986698931504565e-05, 'epoch': 0.11} {'loss': 0.8526, 'learning_rate': 1.986693609603262e-05, 'epoch': 0.11} {'loss': 0.8857, 'learning_rate': 1.9866882866446284e-05, 'epoch': 0.11} {'loss': 0.8777, 'learning_rate': 1.9866829626286688e-05, 'epoch': 0.11} {'loss': 0.897, 'learning_rate': 1.9866776375553892e-05, 'epoch': 0.11} {'loss': 0.8821, 'learning_rate': 1.986672311424796e-05, 'epoch': 0.11} {'loss': 0.8343, 'learning_rate': 1.986666984236894e-05, 'epoch': 0.11} {'loss': 0.9365, 'learning_rate': 1.9866616559916894e-05, 'epoch': 0.11} {'loss': 0.9892, 'learning_rate': 1.9866563266891878e-05, 'epoch': 0.11} {'loss': 0.9647, 'learning_rate': 1.9866509963293947e-05, 'epoch': 0.11} {'loss': 0.8742, 'learning_rate': 1.9866456649123164e-05, 'epoch': 0.11} {'loss': 1.0767, 'learning_rate': 1.986640332437958e-05, 'epoch': 0.11} {'loss': 0.8182, 'learning_rate': 1.9866349989063253e-05, 'epoch': 0.11} {'loss': 0.8609, 'learning_rate': 1.9866296643174244e-05, 'epoch': 0.11} {'loss': 0.8992, 'learning_rate': 1.9866243286712606e-05, 'epoch': 0.11} {'loss': 0.6937, 'learning_rate': 1.9866189919678395e-05, 'epoch': 0.11} {'loss': 0.7784, 'learning_rate': 1.9866136542071675e-05, 'epoch': 0.11} {'loss': 0.8963, 'learning_rate': 1.98660831538925e-05, 'epoch': 0.11} {'loss': 1.0153, 'learning_rate': 1.9866029755140923e-05, 'epoch': 0.11} {'loss': 1.0163, 'learning_rate': 1.986597634581701e-05, 'epoch': 0.11} {'loss': 0.9449, 'learning_rate': 1.9865922925920808e-05, 'epoch': 0.11} {'loss': 0.9059, 'learning_rate': 1.986586949545238e-05, 'epoch': 0.11} {'loss': 1.0364, 'learning_rate': 1.9865816054411783e-05, 'epoch': 0.11} {'loss': 0.873, 'learning_rate': 1.9865762602799076e-05, 'epoch': 0.11} {'loss': 0.9584, 'learning_rate': 1.986570914061431e-05, 'epoch': 0.11} {'loss': 1.0917, 'learning_rate': 1.9865655667857546e-05, 'epoch': 0.11} {'loss': 1.0393, 'learning_rate': 1.9865602184528842e-05, 'epoch': 0.11} {'loss': 0.9018, 'learning_rate': 1.986554869062826e-05, 'epoch': 0.11} {'loss': 0.9414, 'learning_rate': 1.9865495186155844e-05, 'epoch': 0.11} {'loss': 0.9383, 'learning_rate': 1.9865441671111668e-05, 'epoch': 0.11} {'loss': 0.8354, 'learning_rate': 1.9865388145495773e-05, 'epoch': 0.11} {'loss': 0.9375, 'learning_rate': 1.986533460930823e-05, 'epoch': 0.11} {'loss': 1.0459, 'learning_rate': 1.9865281062549086e-05, 'epoch': 0.11} {'loss': 0.7544, 'learning_rate': 1.9865227505218407e-05, 'epoch': 0.11} {'loss': 0.8022, 'learning_rate': 1.9865173937316245e-05, 'epoch': 0.11} {'loss': 0.8972, 'learning_rate': 1.9865120358842657e-05, 'epoch': 0.11} {'loss': 0.9368, 'learning_rate': 1.9865066769797706e-05, 'epoch': 0.11} {'loss': 0.7167, 'learning_rate': 1.986501317018144e-05, 'epoch': 0.11} {'loss': 1.0786, 'learning_rate': 1.9864959559993927e-05, 'epoch': 0.11} {'loss': 1.1022, 'learning_rate': 1.9864905939235215e-05, 'epoch': 0.11} {'loss': 0.8476, 'learning_rate': 1.9864852307905372e-05, 'epoch': 0.11} {'loss': 1.0746, 'learning_rate': 1.9864798666004444e-05, 'epoch': 0.11} {'loss': 1.1029, 'learning_rate': 1.9864745013532496e-05, 'epoch': 0.11} {'loss': 0.9148, 'learning_rate': 1.986469135048958e-05, 'epoch': 0.11} {'loss': 0.9097, 'learning_rate': 1.9864637676875762e-05, 'epoch': 0.11} {'loss': 0.9336, 'learning_rate': 1.9864583992691094e-05, 'epoch': 0.11} {'loss': 1.0413, 'learning_rate': 1.9864530297935628e-05, 'epoch': 0.11} {'loss': 0.9981, 'learning_rate': 1.9864476592609434e-05, 'epoch': 0.11} {'loss': 1.0906, 'learning_rate': 1.986442287671256e-05, 'epoch': 0.11} {'loss': 0.8306, 'learning_rate': 1.986436915024507e-05, 'epoch': 0.11} {'loss': 1.0161, 'learning_rate': 1.9864315413207015e-05, 'epoch': 0.11} {'loss': 0.8985, 'learning_rate': 1.9864261665598455e-05, 'epoch': 0.11} {'loss': 0.9783, 'learning_rate': 1.986420790741945e-05, 'epoch': 0.11} {'loss': 0.8632, 'learning_rate': 1.9864154138670054e-05, 'epoch': 0.11} {'loss': 1.078, 'learning_rate': 1.9864100359350328e-05, 'epoch': 0.11} {'loss': 0.8883, 'learning_rate': 1.986404656946033e-05, 'epoch': 0.11} {'loss': 0.9738, 'learning_rate': 1.9863992769000115e-05, 'epoch': 0.11} {'loss': 0.9305, 'learning_rate': 1.986393895796974e-05, 'epoch': 0.11} {'loss': 1.0062, 'learning_rate': 1.9863885136369262e-05, 'epoch': 0.11} {'loss': 1.1248, 'learning_rate': 1.9863831304198743e-05, 'epoch': 0.11} {'loss': 1.0242, 'learning_rate': 1.986377746145824e-05, 'epoch': 0.11} {'loss': 0.8746, 'learning_rate': 1.9863723608147807e-05, 'epoch': 0.11} {'loss': 0.9564, 'learning_rate': 1.9863669744267504e-05, 'epoch': 0.11} {'loss': 0.6537, 'learning_rate': 1.986361586981739e-05, 'epoch': 0.11} {'loss': 0.8131, 'learning_rate': 1.986356198479752e-05, 'epoch': 0.11} {'loss': 0.8573, 'learning_rate': 1.9863508089207957e-05, 'epoch': 0.11} {'loss': 0.7949, 'learning_rate': 1.986345418304875e-05, 'epoch': 0.11} {'loss': 1.1202, 'learning_rate': 1.9863400266319966e-05, 'epoch': 0.11} {'loss': 1.0673, 'learning_rate': 1.9863346339021653e-05, 'epoch': 0.11} {'loss': 0.7704, 'learning_rate': 1.9863292401153877e-05, 'epoch': 0.11} {'loss': 0.8227, 'learning_rate': 1.9863238452716695e-05, 'epoch': 0.11} {'loss': 0.9695, 'learning_rate': 1.9863184493710158e-05, 'epoch': 0.11} {'loss': 0.9382, 'learning_rate': 1.9863130524134333e-05, 'epoch': 0.11} {'loss': 0.9724, 'learning_rate': 1.9863076543989272e-05, 'epoch': 0.11} {'loss': 0.8525, 'learning_rate': 1.9863022553275036e-05, 'epoch': 0.11} {'loss': 0.8226, 'learning_rate': 1.986296855199168e-05, 'epoch': 0.11} {'loss': 1.0831, 'learning_rate': 1.986291454013926e-05, 'epoch': 0.11} {'loss': 0.8908, 'learning_rate': 1.986286051771784e-05, 'epoch': 0.11} {'loss': 0.9051, 'learning_rate': 1.9862806484727474e-05, 'epoch': 0.11} {'loss': 0.8784, 'learning_rate': 1.986275244116822e-05, 'epoch': 0.11} {'loss': 1.0236, 'learning_rate': 1.9862698387040135e-05, 'epoch': 0.11} {'loss': 1.0048, 'learning_rate': 1.9862644322343283e-05, 'epoch': 0.11} {'loss': 1.0395, 'learning_rate': 1.9862590247077716e-05, 'epoch': 0.11} {'loss': 0.915, 'learning_rate': 1.9862536161243493e-05, 'epoch': 0.11} {'loss': 0.9979, 'learning_rate': 1.986248206484067e-05, 'epoch': 0.11} {'loss': 0.8927, 'learning_rate': 1.986242795786931e-05, 'epoch': 0.11} {'loss': 0.7556, 'learning_rate': 1.9862373840329465e-05, 'epoch': 0.11} {'loss': 0.9227, 'learning_rate': 1.98623197122212e-05, 'epoch': 0.11} {'loss': 0.8727, 'learning_rate': 1.9862265573544568e-05, 'epoch': 0.11} {'loss': 1.0131, 'learning_rate': 1.9862211424299628e-05, 'epoch': 0.11} {'loss': 0.9487, 'learning_rate': 1.9862157264486438e-05, 'epoch': 0.11} {'loss': 0.9671, 'learning_rate': 1.9862103094105058e-05, 'epoch': 0.11} {'loss': 0.9159, 'learning_rate': 1.9862048913155543e-05, 'epoch': 0.11} {'loss': 0.8542, 'learning_rate': 1.9861994721637953e-05, 'epoch': 0.11} {'loss': 0.8139, 'learning_rate': 1.9861940519552347e-05, 'epoch': 0.11} {'loss': 0.8471, 'learning_rate': 1.9861886306898782e-05, 'epoch': 0.11} {'loss': 1.045, 'learning_rate': 1.9861832083677312e-05, 'epoch': 0.11} {'loss': 0.9809, 'learning_rate': 1.9861777849888e-05, 'epoch': 0.11} {'loss': 1.0627, 'learning_rate': 1.9861723605530904e-05, 'epoch': 0.11} {'loss': 0.9002, 'learning_rate': 1.986166935060608e-05, 'epoch': 0.11} {'loss': 0.9451, 'learning_rate': 1.986161508511359e-05, 'epoch': 0.11} {'loss': 0.9617, 'learning_rate': 1.9861560809053488e-05, 'epoch': 0.11} {'loss': 0.9776, 'learning_rate': 1.986150652242583e-05, 'epoch': 0.11} {'loss': 0.8721, 'learning_rate': 1.986145222523068e-05, 'epoch': 0.11} {'loss': 0.8809, 'learning_rate': 1.98613979174681e-05, 'epoch': 0.11} {'loss': 0.8843, 'learning_rate': 1.9861343599138133e-05, 'epoch': 0.11} {'loss': 0.9898, 'learning_rate': 1.986128927024085e-05, 'epoch': 0.11} {'loss': 0.9295, 'learning_rate': 1.9861234930776305e-05, 'epoch': 0.11} {'loss': 0.8109, 'learning_rate': 1.986118058074456e-05, 'epoch': 0.11} {'loss': 1.0332, 'learning_rate': 1.9861126220145665e-05, 'epoch': 0.11} {'loss': 0.8262, 'learning_rate': 1.9861071848979686e-05, 'epoch': 0.11} {'loss': 0.8868, 'learning_rate': 1.9861017467246676e-05, 'epoch': 0.11} {'loss': 0.9783, 'learning_rate': 1.98609630749467e-05, 'epoch': 0.11} {'loss': 0.897, 'learning_rate': 1.986090867207981e-05, 'epoch': 0.11} {'loss': 1.0755, 'learning_rate': 1.9860854258646067e-05, 'epoch': 0.11} {'loss': 1.1523, 'learning_rate': 1.9860799834645526e-05, 'epoch': 0.11} {'loss': 1.0712, 'learning_rate': 1.986074540007825e-05, 'epoch': 0.11} {'loss': 0.9263, 'learning_rate': 1.9860690954944295e-05, 'epoch': 0.11} {'loss': 1.1623, 'learning_rate': 1.986063649924372e-05, 'epoch': 0.11} {'loss': 1.0629, 'learning_rate': 1.9860582032976583e-05, 'epoch': 0.11} {'loss': 0.8371, 'learning_rate': 1.9860527556142942e-05, 'epoch': 0.11} {'loss': 0.8049, 'learning_rate': 1.9860473068742853e-05, 'epoch': 0.11} {'loss': 0.8066, 'learning_rate': 1.986041857077638e-05, 'epoch': 0.11} {'loss': 1.0174, 'learning_rate': 1.986036406224358e-05, 'epoch': 0.11} {'loss': 0.9708, 'learning_rate': 1.986030954314451e-05, 'epoch': 0.11} {'loss': 0.8788, 'learning_rate': 1.9860255013479225e-05, 'epoch': 0.11} {'loss': 0.8225, 'learning_rate': 1.9860200473247787e-05, 'epoch': 0.11} {'loss': 0.9356, 'learning_rate': 1.9860145922450257e-05, 'epoch': 0.11} {'loss': 1.1405, 'learning_rate': 1.986009136108669e-05, 'epoch': 0.11} {'loss': 1.0289, 'learning_rate': 1.9860036789157146e-05, 'epoch': 0.11} {'loss': 0.9446, 'learning_rate': 1.985998220666168e-05, 'epoch': 0.11} {'loss': 0.941, 'learning_rate': 1.9859927613600357e-05, 'epoch': 0.11} {'loss': 1.0737, 'learning_rate': 1.985987300997323e-05, 'epoch': 0.11} {'loss': 0.882, 'learning_rate': 1.9859818395780354e-05, 'epoch': 0.11} {'loss': 0.8826, 'learning_rate': 1.9859763771021798e-05, 'epoch': 0.11} {'loss': 1.1409, 'learning_rate': 1.9859709135697616e-05, 'epoch': 0.11} {'loss': 0.9558, 'learning_rate': 1.9859654489807864e-05, 'epoch': 0.11} {'loss': 1.075, 'learning_rate': 1.9859599833352602e-05, 'epoch': 0.11} {'loss': 0.7776, 'learning_rate': 1.985954516633189e-05, 'epoch': 0.11} {'loss': 0.9711, 'learning_rate': 1.9859490488745784e-05, 'epoch': 0.11} {'loss': 0.9829, 'learning_rate': 1.9859435800594346e-05, 'epoch': 0.11} {'loss': 0.8527, 'learning_rate': 1.985938110187763e-05, 'epoch': 0.11} {'loss': 0.9296, 'learning_rate': 1.9859326392595698e-05, 'epoch': 0.11} {'loss': 0.7427, 'learning_rate': 1.985927167274861e-05, 'epoch': 0.11} {'loss': 0.8658, 'learning_rate': 1.985921694233642e-05, 'epoch': 0.11} {'loss': 0.8873, 'learning_rate': 1.9859162201359194e-05, 'epoch': 0.11} {'loss': 0.956, 'learning_rate': 1.985910744981698e-05, 'epoch': 0.11} {'loss': 0.9056, 'learning_rate': 1.9859052687709844e-05, 'epoch': 0.11} {'loss': 1.014, 'learning_rate': 1.9858997915037844e-05, 'epoch': 0.11} {'loss': 0.8384, 'learning_rate': 1.985894313180104e-05, 'epoch': 0.11} {'loss': 0.9406, 'learning_rate': 1.9858888337999486e-05, 'epoch': 0.11} {'loss': 0.9842, 'learning_rate': 1.9858833533633244e-05, 'epoch': 0.11} {'loss': 0.9809, 'learning_rate': 1.985877871870237e-05, 'epoch': 0.11} {'loss': 0.8878, 'learning_rate': 1.985872389320693e-05, 'epoch': 0.11} {'loss': 1.0829, 'learning_rate': 1.9858669057146974e-05, 'epoch': 0.11} {'loss': 0.8447, 'learning_rate': 1.9858614210522563e-05, 'epoch': 0.11} {'loss': 0.8737, 'learning_rate': 1.985855935333376e-05, 'epoch': 0.11} {'loss': 1.1349, 'learning_rate': 1.9858504485580618e-05, 'epoch': 0.11} {'loss': 0.8163, 'learning_rate': 1.9858449607263202e-05, 'epoch': 0.11} {'loss': 1.0621, 'learning_rate': 1.9858394718381565e-05, 'epoch': 0.11} {'loss': 0.9698, 'learning_rate': 1.985833981893577e-05, 'epoch': 0.11} {'loss': 0.9069, 'learning_rate': 1.985828490892587e-05, 'epoch': 0.11} {'loss': 1.0415, 'learning_rate': 1.9858229988351933e-05, 'epoch': 0.11} {'loss': 1.0986, 'learning_rate': 1.985817505721401e-05, 'epoch': 0.11} {'loss': 1.0701, 'learning_rate': 1.9858120115512163e-05, 'epoch': 0.11} {'loss': 0.9494, 'learning_rate': 1.985806516324645e-05, 'epoch': 0.11} {'loss': 0.9321, 'learning_rate': 1.9858010200416933e-05, 'epoch': 0.11} {'loss': 0.8798, 'learning_rate': 1.985795522702367e-05, 'epoch': 0.11} {'loss': 0.9289, 'learning_rate': 1.985790024306671e-05, 'epoch': 0.11} {'loss': 0.8975, 'learning_rate': 1.9857845248546126e-05, 'epoch': 0.11} {'loss': 0.9392, 'learning_rate': 1.9857790243461973e-05, 'epoch': 0.11} {'loss': 1.0582, 'learning_rate': 1.9857735227814302e-05, 'epoch': 0.11} {'loss': 1.0527, 'learning_rate': 1.9857680201603182e-05, 'epoch': 0.11} {'loss': 0.9659, 'learning_rate': 1.9857625164828667e-05, 'epoch': 0.11} {'loss': 1.1163, 'learning_rate': 1.9857570117490818e-05, 'epoch': 0.11} {'loss': 0.867, 'learning_rate': 1.985751505958969e-05, 'epoch': 0.11} {'loss': 0.9854, 'learning_rate': 1.985745999112535e-05, 'epoch': 0.11} {'loss': 0.9555, 'learning_rate': 1.985740491209785e-05, 'epoch': 0.11} {'loss': 0.8902, 'learning_rate': 1.985734982250725e-05, 'epoch': 0.11} {'loss': 0.7817, 'learning_rate': 1.9857294722353608e-05, 'epoch': 0.11} {'loss': 0.9539, 'learning_rate': 1.9857239611636986e-05, 'epoch': 0.11} {'loss': 0.839, 'learning_rate': 1.9857184490357446e-05, 'epoch': 0.11} {'loss': 0.9596, 'learning_rate': 1.985712935851504e-05, 'epoch': 0.11} {'loss': 0.8552, 'learning_rate': 1.9857074216109827e-05, 'epoch': 0.11} {'loss': 0.9058, 'learning_rate': 1.9857019063141876e-05, 'epoch': 0.11} {'loss': 1.0544, 'learning_rate': 1.9856963899611235e-05, 'epoch': 0.11} {'loss': 0.9796, 'learning_rate': 1.9856908725517968e-05, 'epoch': 0.11} {'loss': 1.0426, 'learning_rate': 1.9856853540862136e-05, 'epoch': 0.11} {'loss': 1.0045, 'learning_rate': 1.9856798345643792e-05, 'epoch': 0.11} {'loss': 1.0129, 'learning_rate': 1.9856743139863002e-05, 'epoch': 0.11} {'loss': 0.889, 'learning_rate': 1.9856687923519823e-05, 'epoch': 0.11} {'loss': 0.9516, 'learning_rate': 1.985663269661431e-05, 'epoch': 0.11} {'loss': 0.8559, 'learning_rate': 1.9856577459146528e-05, 'epoch': 0.11} {'loss': 0.9242, 'learning_rate': 1.985652221111653e-05, 'epoch': 0.11} {'loss': 0.8098, 'learning_rate': 1.985646695252438e-05, 'epoch': 0.11} {'loss': 0.7657, 'learning_rate': 1.985641168337014e-05, 'epoch': 0.11} {'loss': 0.8878, 'learning_rate': 1.9856356403653864e-05, 'epoch': 0.11} {'loss': 1.0005, 'learning_rate': 1.9856301113375612e-05, 'epoch': 0.11} {'loss': 1.0073, 'learning_rate': 1.985624581253544e-05, 'epoch': 0.11} {'loss': 0.8853, 'learning_rate': 1.9856190501133414e-05, 'epoch': 0.11} {'loss': 0.9942, 'learning_rate': 1.985613517916959e-05, 'epoch': 0.11} {'loss': 1.0508, 'learning_rate': 1.985607984664403e-05, 'epoch': 0.11} {'loss': 1.1422, 'learning_rate': 1.9856024503556788e-05, 'epoch': 0.11} {'loss': 0.8771, 'learning_rate': 1.9855969149907928e-05, 'epoch': 0.11} {'loss': 0.8938, 'learning_rate': 1.9855913785697506e-05, 'epoch': 0.11} {'loss': 0.8153, 'learning_rate': 1.9855858410925582e-05, 'epoch': 0.11} {'loss': 0.8809, 'learning_rate': 1.985580302559222e-05, 'epoch': 0.11} {'loss': 1.0709, 'learning_rate': 1.985574762969747e-05, 'epoch': 0.11} {'loss': 1.0405, 'learning_rate': 1.98556922232414e-05, 'epoch': 0.11} {'loss': 0.9548, 'learning_rate': 1.9855636806224067e-05, 'epoch': 0.11} {'loss': 0.9374, 'learning_rate': 1.9855581378645528e-05, 'epoch': 0.11} {'loss': 0.8933, 'learning_rate': 1.9855525940505847e-05, 'epoch': 0.11} {'loss': 0.893, 'learning_rate': 1.9855470491805077e-05, 'epoch': 0.11} {'loss': 0.9716, 'learning_rate': 1.985541503254328e-05, 'epoch': 0.11} {'loss': 0.8483, 'learning_rate': 1.985535956272052e-05, 'epoch': 0.11} {'loss': 0.8152, 'learning_rate': 1.985530408233685e-05, 'epoch': 0.11} {'loss': 0.8821, 'learning_rate': 1.9855248591392336e-05, 'epoch': 0.11} {'loss': 0.9572, 'learning_rate': 1.985519308988703e-05, 'epoch': 0.11} {'loss': 0.9014, 'learning_rate': 1.9855137577820994e-05, 'epoch': 0.11} {'loss': 0.8827, 'learning_rate': 1.9855082055194293e-05, 'epoch': 0.11} {'loss': 0.9989, 'learning_rate': 1.9855026522006978e-05, 'epoch': 0.11} {'loss': 0.8068, 'learning_rate': 1.9854970978259117e-05, 'epoch': 0.11} {'loss': 0.8412, 'learning_rate': 1.9854915423950764e-05, 'epoch': 0.11} {'loss': 0.957, 'learning_rate': 1.9854859859081977e-05, 'epoch': 0.11} {'loss': 0.85, 'learning_rate': 1.9854804283652817e-05, 'epoch': 0.11} {'loss': 1.11, 'learning_rate': 1.9854748697663345e-05, 'epoch': 0.11} {'loss': 0.9588, 'learning_rate': 1.9854693101113625e-05, 'epoch': 0.11} {'loss': 0.6888, 'learning_rate': 1.985463749400371e-05, 'epoch': 0.11} {'loss': 0.7931, 'learning_rate': 1.985458187633366e-05, 'epoch': 0.11} {'loss': 0.8111, 'learning_rate': 1.985452624810354e-05, 'epoch': 0.11} {'loss': 1.004, 'learning_rate': 1.98544706093134e-05, 'epoch': 0.11} {'loss': 1.0324, 'learning_rate': 1.9854414959963306e-05, 'epoch': 0.11} {'loss': 0.8758, 'learning_rate': 1.985435930005332e-05, 'epoch': 0.11} {'loss': 1.0956, 'learning_rate': 1.9854303629583498e-05, 'epoch': 0.11} {'loss': 0.8313, 'learning_rate': 1.98542479485539e-05, 'epoch': 0.11} {'loss': 1.0914, 'learning_rate': 1.9854192256964584e-05, 'epoch': 0.11} {'loss': 1.0662, 'learning_rate': 1.9854136554815615e-05, 'epoch': 0.11} {'loss': 1.1234, 'learning_rate': 1.985408084210705e-05, 'epoch': 0.11} {'loss': 0.9125, 'learning_rate': 1.985402511883894e-05, 'epoch': 0.11} {'loss': 0.8622, 'learning_rate': 1.9853969385011364e-05, 'epoch': 0.11} {'loss': 1.0516, 'learning_rate': 1.9853913640624363e-05, 'epoch': 0.11} {'loss': 0.7254, 'learning_rate': 1.9853857885678004e-05, 'epoch': 0.11} {'loss': 0.9684, 'learning_rate': 1.985380212017235e-05, 'epoch': 0.11} {'loss': 0.9592, 'learning_rate': 1.9853746344107455e-05, 'epoch': 0.11} {'loss': 0.8146, 'learning_rate': 1.9853690557483386e-05, 'epoch': 0.11} {'loss': 1.1173, 'learning_rate': 1.985363476030019e-05, 'epoch': 0.11} {'loss': 0.99, 'learning_rate': 1.985357895255794e-05, 'epoch': 0.11} {'loss': 0.978, 'learning_rate': 1.9853523134256692e-05, 'epoch': 0.11} {'loss': 0.8454, 'learning_rate': 1.9853467305396505e-05, 'epoch': 0.12} {'loss': 0.9221, 'learning_rate': 1.9853411465977438e-05, 'epoch': 0.12} {'loss': 0.92, 'learning_rate': 1.985335561599955e-05, 'epoch': 0.12} {'loss': 0.9746, 'learning_rate': 1.98532997554629e-05, 'epoch': 0.12} {'loss': 0.8104, 'learning_rate': 1.9853243884367553e-05, 'epoch': 0.12} {'loss': 0.7412, 'learning_rate': 1.9853188002713567e-05, 'epoch': 0.12} {'loss': 0.9353, 'learning_rate': 1.9853132110501e-05, 'epoch': 0.12} {'loss': 0.9058, 'learning_rate': 1.985307620772991e-05, 'epoch': 0.12} {'loss': 0.9126, 'learning_rate': 1.9853020294400364e-05, 'epoch': 0.12} {'loss': 1.0057, 'learning_rate': 1.985296437051241e-05, 'epoch': 0.12} {'loss': 0.9763, 'learning_rate': 1.9852908436066123e-05, 'epoch': 0.12} {'loss': 0.8703, 'learning_rate': 1.985285249106155e-05, 'epoch': 0.12} {'loss': 0.944, 'learning_rate': 1.985279653549876e-05, 'epoch': 0.12} {'loss': 0.9649, 'learning_rate': 1.9852740569377807e-05, 'epoch': 0.12} {'loss': 0.9814, 'learning_rate': 1.9852684592698755e-05, 'epoch': 0.12} {'loss': 1.0074, 'learning_rate': 1.985262860546166e-05, 'epoch': 0.12} {'loss': 1.016, 'learning_rate': 1.9852572607666587e-05, 'epoch': 0.12} {'loss': 0.7852, 'learning_rate': 1.9852516599313592e-05, 'epoch': 0.12} {'loss': 1.0616, 'learning_rate': 1.9852460580402738e-05, 'epoch': 0.12} {'loss': 0.8273, 'learning_rate': 1.985240455093408e-05, 'epoch': 0.12} {'loss': 0.8165, 'learning_rate': 1.9852348510907683e-05, 'epoch': 0.12} {'loss': 0.9762, 'learning_rate': 1.9852292460323604e-05, 'epoch': 0.12} {'loss': 0.9052, 'learning_rate': 1.9852236399181906e-05, 'epoch': 0.12} {'loss': 0.9123, 'learning_rate': 1.9852180327482644e-05, 'epoch': 0.12} {'loss': 0.85, 'learning_rate': 1.9852124245225886e-05, 'epoch': 0.12} {'loss': 0.9185, 'learning_rate': 1.9852068152411685e-05, 'epoch': 0.12} {'loss': 0.9196, 'learning_rate': 1.9852012049040103e-05, 'epoch': 0.12} {'loss': 0.9348, 'learning_rate': 1.9851955935111203e-05, 'epoch': 0.12} {'loss': 0.8, 'learning_rate': 1.9851899810625045e-05, 'epoch': 0.12} {'loss': 0.8921, 'learning_rate': 1.9851843675581684e-05, 'epoch': 0.12} {'loss': 0.8426, 'learning_rate': 1.9851787529981183e-05, 'epoch': 0.12} {'loss': 0.963, 'learning_rate': 1.9851731373823605e-05, 'epoch': 0.12} {'loss': 0.9332, 'learning_rate': 1.9851675207109005e-05, 'epoch': 0.12} {'loss': 0.9379, 'learning_rate': 1.9851619029837447e-05, 'epoch': 0.12} {'loss': 1.0188, 'learning_rate': 1.9851562842008992e-05, 'epoch': 0.12} {'loss': 0.8816, 'learning_rate': 1.98515066436237e-05, 'epoch': 0.12} {'loss': 0.9066, 'learning_rate': 1.9851450434681623e-05, 'epoch': 0.12} {'loss': 0.8817, 'learning_rate': 1.985139421518283e-05, 'epoch': 0.12} {'loss': 1.0922, 'learning_rate': 1.9851337985127377e-05, 'epoch': 0.12} {'loss': 0.7049, 'learning_rate': 1.985128174451533e-05, 'epoch': 0.12} {'loss': 0.9984, 'learning_rate': 1.9851225493346743e-05, 'epoch': 0.12} {'loss': 0.9554, 'learning_rate': 1.985116923162168e-05, 'epoch': 0.12} {'loss': 0.8309, 'learning_rate': 1.98511129593402e-05, 'epoch': 0.12} {'loss': 0.9289, 'learning_rate': 1.9851056676502365e-05, 'epoch': 0.12} {'loss': 0.8932, 'learning_rate': 1.9851000383108232e-05, 'epoch': 0.12} {'loss': 1.0292, 'learning_rate': 1.9850944079157862e-05, 'epoch': 0.12} {'loss': 0.8845, 'learning_rate': 1.9850887764651317e-05, 'epoch': 0.12} {'loss': 0.8672, 'learning_rate': 1.9850831439588657e-05, 'epoch': 0.12} {'loss': 0.8778, 'learning_rate': 1.985077510396994e-05, 'epoch': 0.12} {'loss': 1.0973, 'learning_rate': 1.9850718757795233e-05, 'epoch': 0.12} {'loss': 0.9014, 'learning_rate': 1.985066240106459e-05, 'epoch': 0.12} {'loss': 1.0771, 'learning_rate': 1.9850606033778074e-05, 'epoch': 0.12} {'loss': 0.9965, 'learning_rate': 1.985054965593574e-05, 'epoch': 0.12} {'loss': 0.9545, 'learning_rate': 1.9850493267537657e-05, 'epoch': 0.12} {'loss': 0.7575, 'learning_rate': 1.985043686858388e-05, 'epoch': 0.12} {'loss': 1.0079, 'learning_rate': 1.985038045907447e-05, 'epoch': 0.12} {'loss': 0.8593, 'learning_rate': 1.985032403900949e-05, 'epoch': 0.12} {'loss': 0.7623, 'learning_rate': 1.9850267608389e-05, 'epoch': 0.12} {'loss': 0.912, 'learning_rate': 1.9850211167213057e-05, 'epoch': 0.12} {'loss': 0.8936, 'learning_rate': 1.9850154715481723e-05, 'epoch': 0.12} {'loss': 0.9626, 'learning_rate': 1.985009825319506e-05, 'epoch': 0.12} {'loss': 0.7989, 'learning_rate': 1.9850041780353128e-05, 'epoch': 0.12} {'loss': 1.0811, 'learning_rate': 1.9849985296955986e-05, 'epoch': 0.12} {'loss': 0.9433, 'learning_rate': 1.9849928803003698e-05, 'epoch': 0.12} {'loss': 0.9277, 'learning_rate': 1.9849872298496323e-05, 'epoch': 0.12} {'loss': 0.8234, 'learning_rate': 1.9849815783433917e-05, 'epoch': 0.12} {'loss': 1.0262, 'learning_rate': 1.9849759257816547e-05, 'epoch': 0.12} {'loss': 0.995, 'learning_rate': 1.9849702721644268e-05, 'epoch': 0.12} {'loss': 0.7809, 'learning_rate': 1.9849646174917148e-05, 'epoch': 0.12} {'loss': 0.8875, 'learning_rate': 1.984958961763524e-05, 'epoch': 0.12} {'loss': 0.8956, 'learning_rate': 1.984953304979861e-05, 'epoch': 0.12} {'loss': 0.9076, 'learning_rate': 1.9849476471407315e-05, 'epoch': 0.12} {'loss': 0.8758, 'learning_rate': 1.9849419882461417e-05, 'epoch': 0.12} {'loss': 1.0613, 'learning_rate': 1.9849363282960977e-05, 'epoch': 0.12} {'loss': 0.9787, 'learning_rate': 1.9849306672906056e-05, 'epoch': 0.12} {'loss': 0.8459, 'learning_rate': 1.9849250052296712e-05, 'epoch': 0.12} {'loss': 1.0758, 'learning_rate': 1.9849193421133005e-05, 'epoch': 0.12} {'loss': 1.1043, 'learning_rate': 1.9849136779415006e-05, 'epoch': 0.12} {'loss': 0.954, 'learning_rate': 1.9849080127142764e-05, 'epoch': 0.12} {'loss': 0.9818, 'learning_rate': 1.9849023464316342e-05, 'epoch': 0.12} {'loss': 0.8319, 'learning_rate': 1.9848966790935805e-05, 'epoch': 0.12} {'loss': 1.1059, 'learning_rate': 1.984891010700121e-05, 'epoch': 0.12} {'loss': 1.0648, 'learning_rate': 1.9848853412512618e-05, 'epoch': 0.12} {'loss': 0.8894, 'learning_rate': 1.984879670747009e-05, 'epoch': 0.12} {'loss': 0.7983, 'learning_rate': 1.9848739991873693e-05, 'epoch': 0.12} {'loss': 1.0764, 'learning_rate': 1.9848683265723477e-05, 'epoch': 0.12} {'loss': 0.851, 'learning_rate': 1.984862652901951e-05, 'epoch': 0.12} {'loss': 0.9877, 'learning_rate': 1.984856978176185e-05, 'epoch': 0.12} {'loss': 0.8998, 'learning_rate': 1.9848513023950558e-05, 'epoch': 0.12} {'loss': 1.0504, 'learning_rate': 1.9848456255585695e-05, 'epoch': 0.12} {'loss': 0.9492, 'learning_rate': 1.9848399476667325e-05, 'epoch': 0.12} {'loss': 0.8528, 'learning_rate': 1.9848342687195502e-05, 'epoch': 0.12} {'loss': 0.9327, 'learning_rate': 1.9848285887170295e-05, 'epoch': 0.12} {'loss': 0.9624, 'learning_rate': 1.984822907659176e-05, 'epoch': 0.12} {'loss': 1.0014, 'learning_rate': 1.9848172255459957e-05, 'epoch': 0.12} {'loss': 0.955, 'learning_rate': 1.984811542377495e-05, 'epoch': 0.12} {'loss': 1.0134, 'learning_rate': 1.9848058581536795e-05, 'epoch': 0.12} {'loss': 0.8662, 'learning_rate': 1.984800172874556e-05, 'epoch': 0.12} {'loss': 1.1008, 'learning_rate': 1.9847944865401304e-05, 'epoch': 0.12} {'loss': 0.9724, 'learning_rate': 1.984788799150408e-05, 'epoch': 0.12} {'loss': 0.8373, 'learning_rate': 1.9847831107053965e-05, 'epoch': 0.12} {'loss': 0.8511, 'learning_rate': 1.9847774212051e-05, 'epoch': 0.12} {'loss': 1.1232, 'learning_rate': 1.9847717306495263e-05, 'epoch': 0.12} {'loss': 0.8896, 'learning_rate': 1.9847660390386806e-05, 'epoch': 0.12} {'loss': 1.0049, 'learning_rate': 1.984760346372569e-05, 'epoch': 0.12} {'loss': 0.7785, 'learning_rate': 1.984754652651198e-05, 'epoch': 0.12} {'loss': 1.1565, 'learning_rate': 1.9847489578745733e-05, 'epoch': 0.12} {'loss': 0.8373, 'learning_rate': 1.9847432620427016e-05, 'epoch': 0.12} {'loss': 0.9367, 'learning_rate': 1.9847375651555884e-05, 'epoch': 0.12} {'loss': 0.8764, 'learning_rate': 1.98473186721324e-05, 'epoch': 0.12} {'loss': 0.9766, 'learning_rate': 1.9847261682156624e-05, 'epoch': 0.12} {'loss': 0.9675, 'learning_rate': 1.984720468162862e-05, 'epoch': 0.12} {'loss': 1.1096, 'learning_rate': 1.9847147670548446e-05, 'epoch': 0.12} {'loss': 0.9896, 'learning_rate': 1.9847090648916167e-05, 'epoch': 0.12} {'loss': 1.1089, 'learning_rate': 1.984703361673184e-05, 'epoch': 0.12} {'loss': 0.9441, 'learning_rate': 1.984697657399553e-05, 'epoch': 0.12} {'loss': 0.9902, 'learning_rate': 1.9846919520707294e-05, 'epoch': 0.12} {'loss': 0.8877, 'learning_rate': 1.9846862456867194e-05, 'epoch': 0.12} {'loss': 0.943, 'learning_rate': 1.9846805382475293e-05, 'epoch': 0.12} {'loss': 0.9366, 'learning_rate': 1.984674829753165e-05, 'epoch': 0.12} {'loss': 0.9332, 'learning_rate': 1.9846691202036328e-05, 'epoch': 0.12} {'loss': 1.0712, 'learning_rate': 1.984663409598939e-05, 'epoch': 0.12} {'loss': 0.886, 'learning_rate': 1.9846576979390893e-05, 'epoch': 0.12} {'loss': 1.0582, 'learning_rate': 1.98465198522409e-05, 'epoch': 0.12} {'loss': 0.9914, 'learning_rate': 1.984646271453947e-05, 'epoch': 0.12} {'loss': 0.8461, 'learning_rate': 1.984640556628667e-05, 'epoch': 0.12} {'loss': 0.9222, 'learning_rate': 1.9846348407482558e-05, 'epoch': 0.12} {'loss': 0.7555, 'learning_rate': 1.9846291238127195e-05, 'epoch': 0.12} {'loss': 0.9994, 'learning_rate': 1.9846234058220643e-05, 'epoch': 0.12} {'loss': 0.8136, 'learning_rate': 1.9846176867762958e-05, 'epoch': 0.12} {'loss': 0.9336, 'learning_rate': 1.984611966675421e-05, 'epoch': 0.12} {'loss': 0.769, 'learning_rate': 1.984606245519445e-05, 'epoch': 0.12} {'loss': 0.955, 'learning_rate': 1.9846005233083755e-05, 'epoch': 0.12} {'loss': 0.9191, 'learning_rate': 1.9845948000422172e-05, 'epoch': 0.12} {'loss': 0.7626, 'learning_rate': 1.9845890757209764e-05, 'epoch': 0.12} {'loss': 0.9032, 'learning_rate': 1.9845833503446598e-05, 'epoch': 0.12} {'loss': 0.9133, 'learning_rate': 1.9845776239132736e-05, 'epoch': 0.12} {'loss': 0.9475, 'learning_rate': 1.984571896426823e-05, 'epoch': 0.12} {'loss': 1.0072, 'learning_rate': 1.984566167885315e-05, 'epoch': 0.12} {'loss': 0.9462, 'learning_rate': 1.984560438288756e-05, 'epoch': 0.12} {'loss': 0.9976, 'learning_rate': 1.984554707637151e-05, 'epoch': 0.12} {'loss': 1.0047, 'learning_rate': 1.984548975930507e-05, 'epoch': 0.12} {'loss': 0.9166, 'learning_rate': 1.9845432431688297e-05, 'epoch': 0.12} {'loss': 1.0197, 'learning_rate': 1.9845375093521256e-05, 'epoch': 0.12} {'loss': 0.9753, 'learning_rate': 1.984531774480401e-05, 'epoch': 0.12} {'loss': 0.9022, 'learning_rate': 1.9845260385536612e-05, 'epoch': 0.12} {'loss': 0.8883, 'learning_rate': 1.984520301571913e-05, 'epoch': 0.12} {'loss': 0.9596, 'learning_rate': 1.984514563535163e-05, 'epoch': 0.12} {'loss': 1.0041, 'learning_rate': 1.9845088244434164e-05, 'epoch': 0.12} {'loss': 0.8477, 'learning_rate': 1.9845030842966795e-05, 'epoch': 0.12} {'loss': 1.0943, 'learning_rate': 1.984497343094959e-05, 'epoch': 0.12} {'loss': 0.9023, 'learning_rate': 1.9844916008382605e-05, 'epoch': 0.12} {'loss': 0.9696, 'learning_rate': 1.9844858575265905e-05, 'epoch': 0.12} {'loss': 0.8325, 'learning_rate': 1.984480113159955e-05, 'epoch': 0.12} {'loss': 0.9552, 'learning_rate': 1.9844743677383606e-05, 'epoch': 0.12} {'loss': 0.8882, 'learning_rate': 1.9844686212618126e-05, 'epoch': 0.12} {'loss': 0.93, 'learning_rate': 1.9844628737303176e-05, 'epoch': 0.12} {'loss': 1.0566, 'learning_rate': 1.984457125143882e-05, 'epoch': 0.12} {'loss': 0.6799, 'learning_rate': 1.984451375502512e-05, 'epoch': 0.12} {'loss': 0.9923, 'learning_rate': 1.984445624806213e-05, 'epoch': 0.12} {'loss': 1.0128, 'learning_rate': 1.9844398730549915e-05, 'epoch': 0.12} {'loss': 1.0073, 'learning_rate': 1.9844341202488543e-05, 'epoch': 0.12} {'loss': 0.8122, 'learning_rate': 1.9844283663878074e-05, 'epoch': 0.12} {'loss': 0.9244, 'learning_rate': 1.9844226114718558e-05, 'epoch': 0.12} {'loss': 0.9317, 'learning_rate': 1.984416855501007e-05, 'epoch': 0.12} {'loss': 1.0067, 'learning_rate': 1.9844110984752667e-05, 'epoch': 0.12} {'loss': 0.9834, 'learning_rate': 1.9844053403946408e-05, 'epoch': 0.12} {'loss': 0.834, 'learning_rate': 1.984399581259136e-05, 'epoch': 0.12} {'loss': 1.0942, 'learning_rate': 1.9843938210687583e-05, 'epoch': 0.12} {'loss': 1.0636, 'learning_rate': 1.9843880598235135e-05, 'epoch': 0.12} {'loss': 0.821, 'learning_rate': 1.984382297523408e-05, 'epoch': 0.12} {'loss': 0.9996, 'learning_rate': 1.984376534168448e-05, 'epoch': 0.12} {'loss': 0.8547, 'learning_rate': 1.98437076975864e-05, 'epoch': 0.12} {'loss': 1.0347, 'learning_rate': 1.9843650042939896e-05, 'epoch': 0.12} {'loss': 0.799, 'learning_rate': 1.9843592377745035e-05, 'epoch': 0.12} {'loss': 0.8562, 'learning_rate': 1.9843534702001876e-05, 'epoch': 0.12} {'loss': 0.9702, 'learning_rate': 1.984347701571048e-05, 'epoch': 0.12} {'loss': 0.9037, 'learning_rate': 1.984341931887091e-05, 'epoch': 0.12} {'loss': 0.7969, 'learning_rate': 1.9843361611483226e-05, 'epoch': 0.12} {'loss': 0.9876, 'learning_rate': 1.9843303893547496e-05, 'epoch': 0.12} {'loss': 0.9277, 'learning_rate': 1.9843246165063776e-05, 'epoch': 0.12} {'loss': 0.9162, 'learning_rate': 1.9843188426032128e-05, 'epoch': 0.12} {'loss': 0.8715, 'learning_rate': 1.9843130676452616e-05, 'epoch': 0.12} {'loss': 0.9011, 'learning_rate': 1.98430729163253e-05, 'epoch': 0.12} {'loss': 0.9893, 'learning_rate': 1.9843015145650243e-05, 'epoch': 0.12} {'loss': 1.0841, 'learning_rate': 1.9842957364427508e-05, 'epoch': 0.12} {'loss': 0.8248, 'learning_rate': 1.9842899572657156e-05, 'epoch': 0.12} {'loss': 0.9271, 'learning_rate': 1.9842841770339248e-05, 'epoch': 0.12} {'loss': 0.7662, 'learning_rate': 1.9842783957473846e-05, 'epoch': 0.12} {'loss': 0.7509, 'learning_rate': 1.9842726134061016e-05, 'epoch': 0.12} {'loss': 0.9203, 'learning_rate': 1.984266830010081e-05, 'epoch': 0.12} {'loss': 0.9895, 'learning_rate': 1.9842610455593302e-05, 'epoch': 0.12} {'loss': 0.8253, 'learning_rate': 1.9842552600538547e-05, 'epoch': 0.12} {'loss': 0.8562, 'learning_rate': 1.984249473493661e-05, 'epoch': 0.12} {'loss': 0.6707, 'learning_rate': 1.984243685878755e-05, 'epoch': 0.12} {'loss': 0.9921, 'learning_rate': 1.984237897209143e-05, 'epoch': 0.12} {'loss': 0.9752, 'learning_rate': 1.9842321074848313e-05, 'epoch': 0.12} {'loss': 1.067, 'learning_rate': 1.9842263167058262e-05, 'epoch': 0.12} {'loss': 0.9553, 'learning_rate': 1.9842205248721337e-05, 'epoch': 0.12} {'loss': 0.8669, 'learning_rate': 1.98421473198376e-05, 'epoch': 0.12} {'loss': 0.7364, 'learning_rate': 1.9842089380407112e-05, 'epoch': 0.12} {'loss': 0.8702, 'learning_rate': 1.984203143042994e-05, 'epoch': 0.12} {'loss': 1.046, 'learning_rate': 1.984197346990614e-05, 'epoch': 0.12} {'loss': 0.978, 'learning_rate': 1.9841915498835783e-05, 'epoch': 0.12} {'loss': 0.9974, 'learning_rate': 1.984185751721892e-05, 'epoch': 0.12} {'loss': 0.8568, 'learning_rate': 1.984179952505562e-05, 'epoch': 0.12} {'loss': 1.0802, 'learning_rate': 1.9841741522345942e-05, 'epoch': 0.12} {'loss': 0.923, 'learning_rate': 1.9841683509089953e-05, 'epoch': 0.12} {'loss': 0.8929, 'learning_rate': 1.984162548528771e-05, 'epoch': 0.12} {'loss': 0.8624, 'learning_rate': 1.9841567450939277e-05, 'epoch': 0.12} {'loss': 0.8614, 'learning_rate': 1.9841509406044716e-05, 'epoch': 0.12} {'loss': 1.1239, 'learning_rate': 1.984145135060409e-05, 'epoch': 0.12} {'loss': 0.8481, 'learning_rate': 1.9841393284617463e-05, 'epoch': 0.12} {'loss': 1.0293, 'learning_rate': 1.984133520808489e-05, 'epoch': 0.12} {'loss': 0.8284, 'learning_rate': 1.984127712100644e-05, 'epoch': 0.12} {'loss': 0.9839, 'learning_rate': 1.9841219023382173e-05, 'epoch': 0.12} {'loss': 0.8157, 'learning_rate': 1.9841160915212153e-05, 'epoch': 0.12} {'loss': 0.9467, 'learning_rate': 1.9841102796496442e-05, 'epoch': 0.12} {'loss': 0.8114, 'learning_rate': 1.9841044667235095e-05, 'epoch': 0.12} {'loss': 0.827, 'learning_rate': 1.984098652742819e-05, 'epoch': 0.12} {'loss': 0.9179, 'learning_rate': 1.9840928377075773e-05, 'epoch': 0.12} {'loss': 0.9166, 'learning_rate': 1.9840870216177915e-05, 'epoch': 0.12} {'loss': 1.1113, 'learning_rate': 1.9840812044734674e-05, 'epoch': 0.12} {'loss': 0.7838, 'learning_rate': 1.984075386274612e-05, 'epoch': 0.12} {'loss': 0.9752, 'learning_rate': 1.9840695670212303e-05, 'epoch': 0.12} {'loss': 1.006, 'learning_rate': 1.9840637467133296e-05, 'epoch': 0.12} {'loss': 0.8705, 'learning_rate': 1.984057925350916e-05, 'epoch': 0.12} {'loss': 0.8965, 'learning_rate': 1.984052102933995e-05, 'epoch': 0.12} {'loss': 1.0073, 'learning_rate': 1.984046279462574e-05, 'epoch': 0.12} {'loss': 1.0457, 'learning_rate': 1.984040454936658e-05, 'epoch': 0.12} {'loss': 0.913, 'learning_rate': 1.9840346293562544e-05, 'epoch': 0.12} {'loss': 0.8321, 'learning_rate': 1.9840288027213682e-05, 'epoch': 0.12} {'loss': 0.9049, 'learning_rate': 1.9840229750320067e-05, 'epoch': 0.12} {'loss': 1.046, 'learning_rate': 1.9840171462881758e-05, 'epoch': 0.12} {'loss': 0.9486, 'learning_rate': 1.9840113164898818e-05, 'epoch': 0.12} {'loss': 0.783, 'learning_rate': 1.9840054856371303e-05, 'epoch': 0.12} {'loss': 1.1313, 'learning_rate': 1.983999653729929e-05, 'epoch': 0.12} {'loss': 0.9603, 'learning_rate': 1.9839938207682826e-05, 'epoch': 0.12} {'loss': 0.9472, 'learning_rate': 1.9839879867521982e-05, 'epoch': 0.12} {'loss': 0.8916, 'learning_rate': 1.983982151681682e-05, 'epoch': 0.12} {'loss': 1.0086, 'learning_rate': 1.9839763155567397e-05, 'epoch': 0.12} {'loss': 1.0667, 'learning_rate': 1.9839704783773786e-05, 'epoch': 0.12} {'loss': 0.8591, 'learning_rate': 1.983964640143604e-05, 'epoch': 0.12} {'loss': 0.9501, 'learning_rate': 1.9839588008554222e-05, 'epoch': 0.12} {'loss': 0.8276, 'learning_rate': 1.98395296051284e-05, 'epoch': 0.12} {'loss': 0.8344, 'learning_rate': 1.9839471191158635e-05, 'epoch': 0.12} {'loss': 0.9535, 'learning_rate': 1.983941276664499e-05, 'epoch': 0.12} {'loss': 0.8424, 'learning_rate': 1.983935433158752e-05, 'epoch': 0.12} {'loss': 0.8184, 'learning_rate': 1.98392958859863e-05, 'epoch': 0.12} {'loss': 0.8934, 'learning_rate': 1.9839237429841383e-05, 'epoch': 0.12} {'loss': 0.885, 'learning_rate': 1.9839178963152834e-05, 'epoch': 0.12} {'loss': 0.8271, 'learning_rate': 1.983912048592072e-05, 'epoch': 0.12} {'loss': 0.9048, 'learning_rate': 1.9839061998145097e-05, 'epoch': 0.12} {'loss': 0.9028, 'learning_rate': 1.9839003499826034e-05, 'epoch': 0.12} {'loss': 1.0656, 'learning_rate': 1.983894499096359e-05, 'epoch': 0.12} {'loss': 0.891, 'learning_rate': 1.9838886471557827e-05, 'epoch': 0.12} {'loss': 0.9439, 'learning_rate': 1.9838827941608812e-05, 'epoch': 0.12} {'loss': 1.0491, 'learning_rate': 1.98387694011166e-05, 'epoch': 0.12} {'loss': 0.9288, 'learning_rate': 1.9838710850081264e-05, 'epoch': 0.12} {'loss': 0.9572, 'learning_rate': 1.9838652288502856e-05, 'epoch': 0.12} {'loss': 0.8822, 'learning_rate': 1.983859371638145e-05, 'epoch': 0.12} {'loss': 0.9567, 'learning_rate': 1.98385351337171e-05, 'epoch': 0.12} {'loss': 0.828, 'learning_rate': 1.983847654050987e-05, 'epoch': 0.12} {'loss': 0.7998, 'learning_rate': 1.9838417936759828e-05, 'epoch': 0.12} {'loss': 0.8389, 'learning_rate': 1.9838359322467033e-05, 'epoch': 0.12} {'loss': 0.9098, 'learning_rate': 1.9838300697631544e-05, 'epoch': 0.12} {'loss': 0.8754, 'learning_rate': 1.983824206225343e-05, 'epoch': 0.12} {'loss': 0.9879, 'learning_rate': 1.983818341633275e-05, 'epoch': 0.12} {'loss': 0.9535, 'learning_rate': 1.983812475986957e-05, 'epoch': 0.12} {'loss': 0.8142, 'learning_rate': 1.983806609286395e-05, 'epoch': 0.12} {'loss': 0.8742, 'learning_rate': 1.983800741531596e-05, 'epoch': 0.12} {'loss': 0.9263, 'learning_rate': 1.9837948727225653e-05, 'epoch': 0.12} {'loss': 0.8245, 'learning_rate': 1.9837890028593096e-05, 'epoch': 0.12} {'loss': 0.8269, 'learning_rate': 1.9837831319418354e-05, 'epoch': 0.12} {'loss': 0.9124, 'learning_rate': 1.983777259970148e-05, 'epoch': 0.12} {'loss': 1.0681, 'learning_rate': 1.9837713869442553e-05, 'epoch': 0.12} {'loss': 0.9896, 'learning_rate': 1.9837655128641623e-05, 'epoch': 0.12} {'loss': 1.007, 'learning_rate': 1.983759637729876e-05, 'epoch': 0.12} {'loss': 0.9011, 'learning_rate': 1.9837537615414026e-05, 'epoch': 0.12} {'loss': 1.0259, 'learning_rate': 1.983747884298748e-05, 'epoch': 0.12} {'loss': 1.0546, 'learning_rate': 1.983742006001919e-05, 'epoch': 0.12} {'loss': 0.99, 'learning_rate': 1.9837361266509214e-05, 'epoch': 0.12} {'loss': 0.9411, 'learning_rate': 1.9837302462457617e-05, 'epoch': 0.12} {'loss': 1.0002, 'learning_rate': 1.9837243647864467e-05, 'epoch': 0.12} {'loss': 0.8933, 'learning_rate': 1.9837184822729817e-05, 'epoch': 0.12} {'loss': 0.8686, 'learning_rate': 1.983712598705374e-05, 'epoch': 0.12} {'loss': 0.728, 'learning_rate': 1.9837067140836293e-05, 'epoch': 0.12} {'loss': 0.9074, 'learning_rate': 1.983700828407754e-05, 'epoch': 0.12} {'loss': 0.9173, 'learning_rate': 1.9836949416777544e-05, 'epoch': 0.12} {'loss': 0.9549, 'learning_rate': 1.983689053893637e-05, 'epoch': 0.12} {'loss': 0.8386, 'learning_rate': 1.983683165055408e-05, 'epoch': 0.12} {'loss': 0.7894, 'learning_rate': 1.983677275163074e-05, 'epoch': 0.12} {'loss': 0.9682, 'learning_rate': 1.9836713842166406e-05, 'epoch': 0.12} {'loss': 0.8551, 'learning_rate': 1.9836654922161145e-05, 'epoch': 0.12} {'loss': 0.9769, 'learning_rate': 1.9836595991615022e-05, 'epoch': 0.12} {'loss': 0.913, 'learning_rate': 1.98365370505281e-05, 'epoch': 0.12} {'loss': 0.6914, 'learning_rate': 1.983647809890044e-05, 'epoch': 0.12} {'loss': 1.1408, 'learning_rate': 1.9836419136732104e-05, 'epoch': 0.12} {'loss': 0.8306, 'learning_rate': 1.983636016402316e-05, 'epoch': 0.12} {'loss': 0.8814, 'learning_rate': 1.9836301180773664e-05, 'epoch': 0.12} {'loss': 1.0162, 'learning_rate': 1.983624218698369e-05, 'epoch': 0.12} {'loss': 1.091, 'learning_rate': 1.983618318265329e-05, 'epoch': 0.12} {'loss': 0.872, 'learning_rate': 1.9836124167782533e-05, 'epoch': 0.12} {'loss': 1.0878, 'learning_rate': 1.9836065142371482e-05, 'epoch': 0.12} {'loss': 0.902, 'learning_rate': 1.9836006106420197e-05, 'epoch': 0.12} {'loss': 1.0186, 'learning_rate': 1.9835947059928746e-05, 'epoch': 0.12} {'loss': 0.9826, 'learning_rate': 1.9835888002897186e-05, 'epoch': 0.12} {'loss': 0.8897, 'learning_rate': 1.983582893532559e-05, 'epoch': 0.12} {'loss': 0.9148, 'learning_rate': 1.9835769857214015e-05, 'epoch': 0.12} {'loss': 0.9279, 'learning_rate': 1.9835710768562522e-05, 'epoch': 0.12} {'loss': 0.9998, 'learning_rate': 1.9835651669371178e-05, 'epoch': 0.12} {'loss': 1.0568, 'learning_rate': 1.9835592559640044e-05, 'epoch': 0.12} {'loss': 0.782, 'learning_rate': 1.9835533439369187e-05, 'epoch': 0.12} {'loss': 1.0049, 'learning_rate': 1.983547430855867e-05, 'epoch': 0.12} {'loss': 0.8635, 'learning_rate': 1.983541516720855e-05, 'epoch': 0.12} {'loss': 0.9215, 'learning_rate': 1.9835356015318895e-05, 'epoch': 0.12} {'loss': 1.1512, 'learning_rate': 1.9835296852889772e-05, 'epoch': 0.12} {'loss': 1.0112, 'learning_rate': 1.983523767992124e-05, 'epoch': 0.12} {'loss': 1.0697, 'learning_rate': 1.983517849641336e-05, 'epoch': 0.12} {'loss': 0.9664, 'learning_rate': 1.9835119302366203e-05, 'epoch': 0.12} {'loss': 1.0047, 'learning_rate': 1.9835060097779826e-05, 'epoch': 0.12} {'loss': 1.0083, 'learning_rate': 1.9835000882654293e-05, 'epoch': 0.12} {'loss': 0.9899, 'learning_rate': 1.983494165698967e-05, 'epoch': 0.12} {'loss': 0.9706, 'learning_rate': 1.9834882420786022e-05, 'epoch': 0.12} {'loss': 0.8361, 'learning_rate': 1.983482317404341e-05, 'epoch': 0.12} {'loss': 0.9375, 'learning_rate': 1.983476391676189e-05, 'epoch': 0.12} {'loss': 1.0159, 'learning_rate': 1.983470464894154e-05, 'epoch': 0.12} {'loss': 0.8888, 'learning_rate': 1.983464537058241e-05, 'epoch': 0.12} {'loss': 0.8947, 'learning_rate': 1.9834586081684578e-05, 'epoch': 0.12} {'loss': 0.9623, 'learning_rate': 1.9834526782248092e-05, 'epoch': 0.12} {'loss': 0.9445, 'learning_rate': 1.9834467472273026e-05, 'epoch': 0.12} {'loss': 0.9832, 'learning_rate': 1.983440815175944e-05, 'epoch': 0.12} {'loss': 0.8675, 'learning_rate': 1.98343488207074e-05, 'epoch': 0.12} {'loss': 0.8519, 'learning_rate': 1.9834289479116967e-05, 'epoch': 0.12} {'loss': 1.1166, 'learning_rate': 1.9834230126988205e-05, 'epoch': 0.12} {'loss': 0.9068, 'learning_rate': 1.9834170764321178e-05, 'epoch': 0.12} {'loss': 0.9498, 'learning_rate': 1.9834111391115946e-05, 'epoch': 0.12} {'loss': 1.14, 'learning_rate': 1.983405200737258e-05, 'epoch': 0.12} {'loss': 0.8865, 'learning_rate': 1.983399261309114e-05, 'epoch': 0.12} {'loss': 0.9407, 'learning_rate': 1.9833933208271687e-05, 'epoch': 0.12} {'loss': 1.103, 'learning_rate': 1.9833873792914287e-05, 'epoch': 0.12} {'loss': 0.9567, 'learning_rate': 1.9833814367019005e-05, 'epoch': 0.12} {'loss': 1.0051, 'learning_rate': 1.98337549305859e-05, 'epoch': 0.12} {'loss': 0.987, 'learning_rate': 1.9833695483615046e-05, 'epoch': 0.12} {'loss': 0.8846, 'learning_rate': 1.9833636026106492e-05, 'epoch': 0.12} {'loss': 0.953, 'learning_rate': 1.9833576558060316e-05, 'epoch': 0.12} {'loss': 0.911, 'learning_rate': 1.9833517079476572e-05, 'epoch': 0.12} {'loss': 0.9181, 'learning_rate': 1.9833457590355328e-05, 'epoch': 0.12} {'loss': 0.8625, 'learning_rate': 1.9833398090696646e-05, 'epoch': 0.12} {'loss': 1.1188, 'learning_rate': 1.983333858050059e-05, 'epoch': 0.12} {'loss': 1.1945, 'learning_rate': 1.9833279059767222e-05, 'epoch': 0.12} {'loss': 0.9666, 'learning_rate': 1.9833219528496613e-05, 'epoch': 0.12} {'loss': 0.9452, 'learning_rate': 1.983315998668882e-05, 'epoch': 0.12} {'loss': 0.8876, 'learning_rate': 1.9833100434343908e-05, 'epoch': 0.12} {'loss': 1.0051, 'learning_rate': 1.983304087146194e-05, 'epoch': 0.12} {'loss': 1.0428, 'learning_rate': 1.9832981298042982e-05, 'epoch': 0.12} {'loss': 0.9643, 'learning_rate': 1.9832921714087096e-05, 'epoch': 0.12} {'loss': 0.943, 'learning_rate': 1.983286211959435e-05, 'epoch': 0.12} {'loss': 0.9496, 'learning_rate': 1.9832802514564804e-05, 'epoch': 0.12} {'loss': 0.9244, 'learning_rate': 1.983274289899852e-05, 'epoch': 0.12} {'loss': 0.9022, 'learning_rate': 1.9832683272895568e-05, 'epoch': 0.12} {'loss': 0.9459, 'learning_rate': 1.983262363625601e-05, 'epoch': 0.12} {'loss': 0.7942, 'learning_rate': 1.9832563989079904e-05, 'epoch': 0.12} {'loss': 0.944, 'learning_rate': 1.9832504331367313e-05, 'epoch': 0.12} {'loss': 0.903, 'learning_rate': 1.9832444663118317e-05, 'epoch': 0.12} {'loss': 0.9938, 'learning_rate': 1.9832384984332963e-05, 'epoch': 0.12} {'loss': 1.0799, 'learning_rate': 1.9832325295011325e-05, 'epoch': 0.12} {'loss': 0.9587, 'learning_rate': 1.983226559515346e-05, 'epoch': 0.12} {'loss': 1.087, 'learning_rate': 1.9832205884759436e-05, 'epoch': 0.12} {'loss': 1.0066, 'learning_rate': 1.9832146163829313e-05, 'epoch': 0.12} {'loss': 1.0791, 'learning_rate': 1.983208643236316e-05, 'epoch': 0.12} {'loss': 0.9751, 'learning_rate': 1.983202669036104e-05, 'epoch': 0.12} {'loss': 0.8407, 'learning_rate': 1.9831966937823017e-05, 'epoch': 0.12} {'loss': 1.1016, 'learning_rate': 1.9831907174749153e-05, 'epoch': 0.12} {'loss': 0.9985, 'learning_rate': 1.9831847401139514e-05, 'epoch': 0.12} {'loss': 1.0315, 'learning_rate': 1.983178761699416e-05, 'epoch': 0.12} {'loss': 0.8356, 'learning_rate': 1.983172782231316e-05, 'epoch': 0.12} {'loss': 0.9464, 'learning_rate': 1.983166801709658e-05, 'epoch': 0.12} {'loss': 0.82, 'learning_rate': 1.9831608201344475e-05, 'epoch': 0.12} {'loss': 0.8672, 'learning_rate': 1.9831548375056915e-05, 'epoch': 0.12} {'loss': 1.0485, 'learning_rate': 1.9831488538233966e-05, 'epoch': 0.12} {'loss': 1.0493, 'learning_rate': 1.9831428690875686e-05, 'epoch': 0.12} {'loss': 0.883, 'learning_rate': 1.9831368832982148e-05, 'epoch': 0.12} {'loss': 0.9698, 'learning_rate': 1.9831308964553405e-05, 'epoch': 0.12} {'loss': 0.8274, 'learning_rate': 1.9831249085589533e-05, 'epoch': 0.12} {'loss': 1.0251, 'learning_rate': 1.9831189196090584e-05, 'epoch': 0.12} {'loss': 0.8756, 'learning_rate': 1.9831129296056636e-05, 'epoch': 0.12} {'loss': 0.7861, 'learning_rate': 1.983106938548774e-05, 'epoch': 0.12} {'loss': 0.8077, 'learning_rate': 1.983100946438397e-05, 'epoch': 0.12} {'loss': 0.9189, 'learning_rate': 1.983094953274538e-05, 'epoch': 0.12} {'loss': 1.0728, 'learning_rate': 1.9830889590572045e-05, 'epoch': 0.12} {'loss': 0.8476, 'learning_rate': 1.9830829637864025e-05, 'epoch': 0.12} {'loss': 0.9268, 'learning_rate': 1.983076967462138e-05, 'epoch': 0.12} {'loss': 0.8993, 'learning_rate': 1.983070970084418e-05, 'epoch': 0.12} {'loss': 0.8353, 'learning_rate': 1.983064971653249e-05, 'epoch': 0.12} {'loss': 1.0106, 'learning_rate': 1.9830589721686365e-05, 'epoch': 0.12} {'loss': 1.0796, 'learning_rate': 1.9830529716305882e-05, 'epoch': 0.12} {'loss': 1.0652, 'learning_rate': 1.9830469700391094e-05, 'epoch': 0.12} {'loss': 1.0228, 'learning_rate': 1.9830409673942073e-05, 'epoch': 0.12} {'loss': 0.8871, 'learning_rate': 1.9830349636958886e-05, 'epoch': 0.12} {'loss': 1.0027, 'learning_rate': 1.9830289589441584e-05, 'epoch': 0.12} {'loss': 0.8988, 'learning_rate': 1.9830229531390244e-05, 'epoch': 0.12} {'loss': 0.8289, 'learning_rate': 1.9830169462804925e-05, 'epoch': 0.12} {'loss': 0.9044, 'learning_rate': 1.983010938368569e-05, 'epoch': 0.12} {'loss': 0.7523, 'learning_rate': 1.983004929403261e-05, 'epoch': 0.12} {'loss': 0.9096, 'learning_rate': 1.982998919384574e-05, 'epoch': 0.12} {'loss': 0.9159, 'learning_rate': 1.9829929083125154e-05, 'epoch': 0.12} {'loss': 0.9013, 'learning_rate': 1.982986896187091e-05, 'epoch': 0.12} {'loss': 0.9115, 'learning_rate': 1.9829808830083072e-05, 'epoch': 0.12} {'loss': 0.959, 'learning_rate': 1.982974868776171e-05, 'epoch': 0.12} {'loss': 0.8621, 'learning_rate': 1.982968853490688e-05, 'epoch': 0.12} {'loss': 0.8699, 'learning_rate': 1.9829628371518656e-05, 'epoch': 0.12} {'loss': 0.8118, 'learning_rate': 1.98295681975971e-05, 'epoch': 0.12} {'loss': 0.9275, 'learning_rate': 1.9829508013142267e-05, 'epoch': 0.12} {'loss': 0.8024, 'learning_rate': 1.9829447818154235e-05, 'epoch': 0.12} {'loss': 0.987, 'learning_rate': 1.982938761263306e-05, 'epoch': 0.12} {'loss': 0.9082, 'learning_rate': 1.9829327396578814e-05, 'epoch': 0.12} {'loss': 0.8844, 'learning_rate': 1.982926716999155e-05, 'epoch': 0.12} {'loss': 0.9382, 'learning_rate': 1.982920693287134e-05, 'epoch': 0.12} {'loss': 0.8861, 'learning_rate': 1.9829146685218252e-05, 'epoch': 0.12} {'loss': 0.9059, 'learning_rate': 1.9829086427032346e-05, 'epoch': 0.12} {'loss': 0.8164, 'learning_rate': 1.982902615831368e-05, 'epoch': 0.12} {'loss': 0.8315, 'learning_rate': 1.982896587906233e-05, 'epoch': 0.12} {'loss': 0.944, 'learning_rate': 1.9828905589278354e-05, 'epoch': 0.12} {'loss': 0.9683, 'learning_rate': 1.9828845288961823e-05, 'epoch': 0.12} {'loss': 0.9262, 'learning_rate': 1.9828784978112795e-05, 'epoch': 0.12} {'loss': 0.9112, 'learning_rate': 1.9828724656731337e-05, 'epoch': 0.12} {'loss': 0.7546, 'learning_rate': 1.982866432481751e-05, 'epoch': 0.12} {'loss': 0.8592, 'learning_rate': 1.9828603982371387e-05, 'epoch': 0.12} {'loss': 0.8372, 'learning_rate': 1.9828543629393025e-05, 'epoch': 0.12} {'loss': 0.8483, 'learning_rate': 1.982848326588249e-05, 'epoch': 0.12} {'loss': 0.8046, 'learning_rate': 1.982842289183985e-05, 'epoch': 0.12} {'loss': 0.8981, 'learning_rate': 1.982836250726517e-05, 'epoch': 0.12} {'loss': 0.8621, 'learning_rate': 1.9828302112158506e-05, 'epoch': 0.12} {'loss': 0.8347, 'learning_rate': 1.9828241706519936e-05, 'epoch': 0.12} {'loss': 1.0171, 'learning_rate': 1.9828181290349514e-05, 'epoch': 0.12} {'loss': 0.8787, 'learning_rate': 1.982812086364731e-05, 'epoch': 0.12} {'loss': 0.9663, 'learning_rate': 1.9828060426413385e-05, 'epoch': 0.12} {'loss': 0.8729, 'learning_rate': 1.982799997864781e-05, 'epoch': 0.12} {'loss': 0.9656, 'learning_rate': 1.9827939520350646e-05, 'epoch': 0.12} {'loss': 0.9893, 'learning_rate': 1.9827879051521958e-05, 'epoch': 0.12} {'loss': 0.9188, 'learning_rate': 1.9827818572161807e-05, 'epoch': 0.12} {'loss': 0.9758, 'learning_rate': 1.9827758082270262e-05, 'epoch': 0.12} {'loss': 0.7861, 'learning_rate': 1.982769758184739e-05, 'epoch': 0.12} {'loss': 0.9534, 'learning_rate': 1.9827637070893254e-05, 'epoch': 0.12} {'loss': 1.0349, 'learning_rate': 1.9827576549407915e-05, 'epoch': 0.12} {'loss': 0.9479, 'learning_rate': 1.982751601739144e-05, 'epoch': 0.12} {'loss': 0.8674, 'learning_rate': 1.9827455474843895e-05, 'epoch': 0.12} {'loss': 0.8835, 'learning_rate': 1.9827394921765346e-05, 'epoch': 0.12} {'loss': 0.9014, 'learning_rate': 1.9827334358155856e-05, 'epoch': 0.12} {'loss': 0.9943, 'learning_rate': 1.982727378401549e-05, 'epoch': 0.12} {'loss': 1.001, 'learning_rate': 1.9827213199344313e-05, 'epoch': 0.12} {'loss': 0.9025, 'learning_rate': 1.982715260414239e-05, 'epoch': 0.12} {'loss': 1.0055, 'learning_rate': 1.9827091998409787e-05, 'epoch': 0.12} {'loss': 1.0045, 'learning_rate': 1.9827031382146568e-05, 'epoch': 0.12} {'loss': 0.8373, 'learning_rate': 1.9826970755352794e-05, 'epoch': 0.12} {'loss': 1.0394, 'learning_rate': 1.982691011802854e-05, 'epoch': 0.12} {'loss': 0.8535, 'learning_rate': 1.982684947017386e-05, 'epoch': 0.12} {'loss': 1.0288, 'learning_rate': 1.9826788811788826e-05, 'epoch': 0.12} {'loss': 0.91, 'learning_rate': 1.98267281428735e-05, 'epoch': 0.12} {'loss': 0.8321, 'learning_rate': 1.982666746342795e-05, 'epoch': 0.12} {'loss': 0.939, 'learning_rate': 1.9826606773452236e-05, 'epoch': 0.12} {'loss': 0.7882, 'learning_rate': 1.982654607294643e-05, 'epoch': 0.12} {'loss': 0.9532, 'learning_rate': 1.982648536191059e-05, 'epoch': 0.12} {'loss': 0.8345, 'learning_rate': 1.9826424640344785e-05, 'epoch': 0.12} {'loss': 1.0072, 'learning_rate': 1.9826363908249075e-05, 'epoch': 0.12} {'loss': 1.0733, 'learning_rate': 1.9826303165623532e-05, 'epoch': 0.12} {'loss': 0.9747, 'learning_rate': 1.982624241246822e-05, 'epoch': 0.12} {'loss': 0.7968, 'learning_rate': 1.9826181648783203e-05, 'epoch': 0.12} {'loss': 1.0924, 'learning_rate': 1.9826120874568543e-05, 'epoch': 0.12} {'loss': 0.9879, 'learning_rate': 1.9826060089824307e-05, 'epoch': 0.12} {'loss': 0.8817, 'learning_rate': 1.9825999294550564e-05, 'epoch': 0.12} {'loss': 0.9836, 'learning_rate': 1.9825938488747375e-05, 'epoch': 0.12} {'loss': 0.8027, 'learning_rate': 1.9825877672414804e-05, 'epoch': 0.12} {'loss': 0.9105, 'learning_rate': 1.982581684555292e-05, 'epoch': 0.12} {'loss': 0.907, 'learning_rate': 1.9825756008161785e-05, 'epoch': 0.12} {'loss': 0.9396, 'learning_rate': 1.9825695160241468e-05, 'epoch': 0.12} {'loss': 0.9434, 'learning_rate': 1.982563430179203e-05, 'epoch': 0.12} {'loss': 0.9598, 'learning_rate': 1.9825573432813536e-05, 'epoch': 0.12} {'loss': 1.02, 'learning_rate': 1.9825512553306056e-05, 'epoch': 0.12} {'loss': 0.843, 'learning_rate': 1.9825451663269652e-05, 'epoch': 0.12} {'loss': 1.0105, 'learning_rate': 1.982539076270439e-05, 'epoch': 0.13} {'loss': 1.0151, 'learning_rate': 1.9825329851610334e-05, 'epoch': 0.13} {'loss': 0.8514, 'learning_rate': 1.982526892998755e-05, 'epoch': 0.13} {'loss': 0.996, 'learning_rate': 1.982520799783611e-05, 'epoch': 0.13} {'loss': 0.6984, 'learning_rate': 1.9825147055156064e-05, 'epoch': 0.13} {'loss': 0.9243, 'learning_rate': 1.982508610194749e-05, 'epoch': 0.13} {'loss': 0.8748, 'learning_rate': 1.982502513821045e-05, 'epoch': 0.13} {'loss': 0.8887, 'learning_rate': 1.9824964163945008e-05, 'epoch': 0.13} {'loss': 1.1339, 'learning_rate': 1.9824903179151228e-05, 'epoch': 0.13} {'loss': 0.8754, 'learning_rate': 1.982484218382918e-05, 'epoch': 0.13} {'loss': 1.0395, 'learning_rate': 1.9824781177978927e-05, 'epoch': 0.13} {'loss': 0.8715, 'learning_rate': 1.9824720161600535e-05, 'epoch': 0.13} {'loss': 0.8284, 'learning_rate': 1.9824659134694066e-05, 'epoch': 0.13} {'loss': 1.0509, 'learning_rate': 1.982459809725959e-05, 'epoch': 0.13} {'loss': 0.8653, 'learning_rate': 1.982453704929717e-05, 'epoch': 0.13} {'loss': 0.8831, 'learning_rate': 1.982447599080687e-05, 'epoch': 0.13} {'loss': 0.8761, 'learning_rate': 1.982441492178876e-05, 'epoch': 0.13} {'loss': 0.8358, 'learning_rate': 1.98243538422429e-05, 'epoch': 0.13} {'loss': 0.9796, 'learning_rate': 1.9824292752169358e-05, 'epoch': 0.13} {'loss': 0.8295, 'learning_rate': 1.9824231651568203e-05, 'epoch': 0.13} {'loss': 1.0149, 'learning_rate': 1.9824170540439496e-05, 'epoch': 0.13} {'loss': 0.8939, 'learning_rate': 1.9824109418783304e-05, 'epoch': 0.13} {'loss': 0.9524, 'learning_rate': 1.982404828659969e-05, 'epoch': 0.13} {'loss': 0.9704, 'learning_rate': 1.9823987143888722e-05, 'epoch': 0.13} {'loss': 1.0966, 'learning_rate': 1.9823925990650467e-05, 'epoch': 0.13} {'loss': 0.9057, 'learning_rate': 1.9823864826884988e-05, 'epoch': 0.13} {'loss': 0.7735, 'learning_rate': 1.982380365259235e-05, 'epoch': 0.13} {'loss': 0.6944, 'learning_rate': 1.982374246777262e-05, 'epoch': 0.13} {'loss': 1.02, 'learning_rate': 1.982368127242586e-05, 'epoch': 0.13} {'loss': 0.9477, 'learning_rate': 1.9823620066552143e-05, 'epoch': 0.13} {'loss': 1.0266, 'learning_rate': 1.982355885015153e-05, 'epoch': 0.13} {'loss': 1.0236, 'learning_rate': 1.9823497623224087e-05, 'epoch': 0.13} {'loss': 1.0202, 'learning_rate': 1.982343638576988e-05, 'epoch': 0.13} {'loss': 0.8012, 'learning_rate': 1.9823375137788973e-05, 'epoch': 0.13} {'loss': 1.1378, 'learning_rate': 1.9823313879281432e-05, 'epoch': 0.13} {'loss': 0.845, 'learning_rate': 1.982325261024733e-05, 'epoch': 0.13} {'loss': 0.8181, 'learning_rate': 1.982319133068672e-05, 'epoch': 0.13} {'loss': 1.0438, 'learning_rate': 1.9823130040599677e-05, 'epoch': 0.13} {'loss': 1.0002, 'learning_rate': 1.982306873998626e-05, 'epoch': 0.13} {'loss': 0.9285, 'learning_rate': 1.9823007428846543e-05, 'epoch': 0.13} {'loss': 0.9635, 'learning_rate': 1.982294610718058e-05, 'epoch': 0.13} {'loss': 0.9, 'learning_rate': 1.982288477498845e-05, 'epoch': 0.13} {'loss': 1.0666, 'learning_rate': 1.982282343227021e-05, 'epoch': 0.13} {'loss': 0.9692, 'learning_rate': 1.9822762079025926e-05, 'epoch': 0.13} {'loss': 1.0077, 'learning_rate': 1.982270071525567e-05, 'epoch': 0.13} {'loss': 0.9643, 'learning_rate': 1.9822639340959502e-05, 'epoch': 0.13} {'loss': 0.9281, 'learning_rate': 1.982257795613749e-05, 'epoch': 0.13} {'loss': 0.904, 'learning_rate': 1.98225165607897e-05, 'epoch': 0.13} {'loss': 0.7766, 'learning_rate': 1.9822455154916192e-05, 'epoch': 0.13} {'loss': 0.964, 'learning_rate': 1.9822393738517042e-05, 'epoch': 0.13} {'loss': 1.0411, 'learning_rate': 1.982233231159231e-05, 'epoch': 0.13} {'loss': 0.9629, 'learning_rate': 1.982227087414206e-05, 'epoch': 0.13} {'loss': 1.0707, 'learning_rate': 1.9822209426166365e-05, 'epoch': 0.13} {'loss': 0.8593, 'learning_rate': 1.982214796766528e-05, 'epoch': 0.13} {'loss': 1.0222, 'learning_rate': 1.982208649863888e-05, 'epoch': 0.13} {'loss': 0.856, 'learning_rate': 1.9822025019087226e-05, 'epoch': 0.13} {'loss': 0.8123, 'learning_rate': 1.9821963529010388e-05, 'epoch': 0.13} {'loss': 0.9174, 'learning_rate': 1.9821902028408427e-05, 'epoch': 0.13} {'loss': 0.9037, 'learning_rate': 1.9821840517281415e-05, 'epoch': 0.13} {'loss': 1.1478, 'learning_rate': 1.982177899562941e-05, 'epoch': 0.13} {'loss': 0.928, 'learning_rate': 1.9821717463452485e-05, 'epoch': 0.13} {'loss': 0.8497, 'learning_rate': 1.9821655920750703e-05, 'epoch': 0.13} {'loss': 1.0848, 'learning_rate': 1.9821594367524133e-05, 'epoch': 0.13} {'loss': 0.9441, 'learning_rate': 1.9821532803772837e-05, 'epoch': 0.13} {'loss': 0.8879, 'learning_rate': 1.982147122949688e-05, 'epoch': 0.13} {'loss': 1.0065, 'learning_rate': 1.982140964469633e-05, 'epoch': 0.13} {'loss': 0.8051, 'learning_rate': 1.9821348049371254e-05, 'epoch': 0.13} {'loss': 0.8745, 'learning_rate': 1.9821286443521716e-05, 'epoch': 0.13} {'loss': 0.8512, 'learning_rate': 1.9821224827147783e-05, 'epoch': 0.13} {'loss': 1.1358, 'learning_rate': 1.9821163200249524e-05, 'epoch': 0.13} {'loss': 0.9659, 'learning_rate': 1.9821101562827e-05, 'epoch': 0.13} {'loss': 1.0889, 'learning_rate': 1.9821039914880282e-05, 'epoch': 0.13} {'loss': 0.9124, 'learning_rate': 1.9820978256409428e-05, 'epoch': 0.13} {'loss': 0.9123, 'learning_rate': 1.9820916587414512e-05, 'epoch': 0.13} {'loss': 1.1557, 'learning_rate': 1.9820854907895598e-05, 'epoch': 0.13} {'loss': 0.866, 'learning_rate': 1.9820793217852753e-05, 'epoch': 0.13} {'loss': 0.9363, 'learning_rate': 1.9820731517286043e-05, 'epoch': 0.13} {'loss': 0.8447, 'learning_rate': 1.982066980619553e-05, 'epoch': 0.13} {'loss': 0.8781, 'learning_rate': 1.9820608084581285e-05, 'epoch': 0.13} {'loss': 0.8669, 'learning_rate': 1.9820546352443366e-05, 'epoch': 0.13} {'loss': 1.011, 'learning_rate': 1.982048460978185e-05, 'epoch': 0.13} {'loss': 0.9751, 'learning_rate': 1.98204228565968e-05, 'epoch': 0.13} {'loss': 1.0481, 'learning_rate': 1.9820361092888277e-05, 'epoch': 0.13} {'loss': 1.0375, 'learning_rate': 1.9820299318656354e-05, 'epoch': 0.13} {'loss': 1.0218, 'learning_rate': 1.982023753390109e-05, 'epoch': 0.13} {'loss': 1.0001, 'learning_rate': 1.9820175738622554e-05, 'epoch': 0.13} {'loss': 1.1203, 'learning_rate': 1.982011393282082e-05, 'epoch': 0.13} {'loss': 0.7146, 'learning_rate': 1.9820052116495943e-05, 'epoch': 0.13} {'loss': 0.9796, 'learning_rate': 1.9819990289647998e-05, 'epoch': 0.13} {'loss': 1.0493, 'learning_rate': 1.9819928452277043e-05, 'epoch': 0.13} {'loss': 0.781, 'learning_rate': 1.9819866604383148e-05, 'epoch': 0.13} {'loss': 0.851, 'learning_rate': 1.9819804745966383e-05, 'epoch': 0.13} {'loss': 0.9475, 'learning_rate': 1.9819742877026805e-05, 'epoch': 0.13} {'loss': 1.1484, 'learning_rate': 1.9819680997564493e-05, 'epoch': 0.13} {'loss': 0.8747, 'learning_rate': 1.98196191075795e-05, 'epoch': 0.13} {'loss': 0.7846, 'learning_rate': 1.9819557207071907e-05, 'epoch': 0.13} {'loss': 0.8648, 'learning_rate': 1.9819495296041768e-05, 'epoch': 0.13} {'loss': 0.8912, 'learning_rate': 1.9819433374489152e-05, 'epoch': 0.13} {'loss': 0.9315, 'learning_rate': 1.9819371442414127e-05, 'epoch': 0.13} {'loss': 1.081, 'learning_rate': 1.981930949981676e-05, 'epoch': 0.13} {'loss': 0.9818, 'learning_rate': 1.981924754669712e-05, 'epoch': 0.13} {'loss': 1.0406, 'learning_rate': 1.981918558305527e-05, 'epoch': 0.13} {'loss': 0.8485, 'learning_rate': 1.981912360889127e-05, 'epoch': 0.13} {'loss': 0.8396, 'learning_rate': 1.9819061624205197e-05, 'epoch': 0.13} {'loss': 0.8396, 'learning_rate': 1.981899962899711e-05, 'epoch': 0.13} {'loss': 0.8613, 'learning_rate': 1.9818937623267082e-05, 'epoch': 0.13} {'loss': 1.1183, 'learning_rate': 1.9818875607015177e-05, 'epoch': 0.13} {'loss': 1.0192, 'learning_rate': 1.9818813580241455e-05, 'epoch': 0.13} {'loss': 0.7781, 'learning_rate': 1.9818751542945995e-05, 'epoch': 0.13} {'loss': 0.8747, 'learning_rate': 1.9818689495128854e-05, 'epoch': 0.13} {'loss': 0.8448, 'learning_rate': 1.98186274367901e-05, 'epoch': 0.13} {'loss': 0.9532, 'learning_rate': 1.9818565367929802e-05, 'epoch': 0.13} {'loss': 0.8262, 'learning_rate': 1.9818503288548023e-05, 'epoch': 0.13} {'loss': 0.9421, 'learning_rate': 1.981844119864483e-05, 'epoch': 0.13} {'loss': 0.9378, 'learning_rate': 1.9818379098220296e-05, 'epoch': 0.13} {'loss': 1.1091, 'learning_rate': 1.981831698727448e-05, 'epoch': 0.13} {'loss': 0.9961, 'learning_rate': 1.9818254865807453e-05, 'epoch': 0.13} {'loss': 0.9764, 'learning_rate': 1.9818192733819277e-05, 'epoch': 0.13} {'loss': 0.8815, 'learning_rate': 1.9818130591310022e-05, 'epoch': 0.13} {'loss': 1.0509, 'learning_rate': 1.9818068438279755e-05, 'epoch': 0.13} {'loss': 1.0319, 'learning_rate': 1.9818006274728542e-05, 'epoch': 0.13} {'loss': 1.0822, 'learning_rate': 1.9817944100656448e-05, 'epoch': 0.13} {'loss': 0.9643, 'learning_rate': 1.981788191606354e-05, 'epoch': 0.13} {'loss': 1.0146, 'learning_rate': 1.9817819720949888e-05, 'epoch': 0.13} {'loss': 0.9662, 'learning_rate': 1.9817757515315554e-05, 'epoch': 0.13} {'loss': 0.9456, 'learning_rate': 1.981769529916061e-05, 'epoch': 0.13} {'loss': 0.9066, 'learning_rate': 1.9817633072485114e-05, 'epoch': 0.13} {'loss': 1.0068, 'learning_rate': 1.9817570835289143e-05, 'epoch': 0.13} {'loss': 0.9336, 'learning_rate': 1.9817508587572752e-05, 'epoch': 0.13} {'loss': 0.9078, 'learning_rate': 1.9817446329336022e-05, 'epoch': 0.13} {'loss': 0.8956, 'learning_rate': 1.9817384060579008e-05, 'epoch': 0.13} {'loss': 1.007, 'learning_rate': 1.9817321781301783e-05, 'epoch': 0.13} {'loss': 0.9333, 'learning_rate': 1.981725949150441e-05, 'epoch': 0.13} {'loss': 0.8983, 'learning_rate': 1.981719719118696e-05, 'epoch': 0.13} {'loss': 0.9189, 'learning_rate': 1.981713488034949e-05, 'epoch': 0.13} {'loss': 0.9231, 'learning_rate': 1.9817072558992082e-05, 'epoch': 0.13} {'loss': 0.9627, 'learning_rate': 1.9817010227114793e-05, 'epoch': 0.13} {'loss': 0.96, 'learning_rate': 1.981694788471769e-05, 'epoch': 0.13} {'loss': 0.9774, 'learning_rate': 1.981688553180084e-05, 'epoch': 0.13} {'loss': 0.9277, 'learning_rate': 1.981682316836431e-05, 'epoch': 0.13} {'loss': 0.9903, 'learning_rate': 1.9816760794408173e-05, 'epoch': 0.13} {'loss': 0.9883, 'learning_rate': 1.981669840993249e-05, 'epoch': 0.13} {'loss': 1.0363, 'learning_rate': 1.9816636014937326e-05, 'epoch': 0.13} {'loss': 1.1166, 'learning_rate': 1.9816573609422752e-05, 'epoch': 0.13} {'loss': 0.9914, 'learning_rate': 1.9816511193388832e-05, 'epoch': 0.13} {'loss': 0.9816, 'learning_rate': 1.9816448766835634e-05, 'epoch': 0.13} {'loss': 0.7416, 'learning_rate': 1.981638632976323e-05, 'epoch': 0.13} {'loss': 0.8386, 'learning_rate': 1.9816323882171677e-05, 'epoch': 0.13} {'loss': 1.027, 'learning_rate': 1.9816261424061047e-05, 'epoch': 0.13} {'loss': 1.0209, 'learning_rate': 1.981619895543141e-05, 'epoch': 0.13} {'loss': 0.9121, 'learning_rate': 1.9816136476282828e-05, 'epoch': 0.13} {'loss': 1.0115, 'learning_rate': 1.981607398661537e-05, 'epoch': 0.13} {'loss': 0.8548, 'learning_rate': 1.9816011486429102e-05, 'epoch': 0.13} {'loss': 0.9349, 'learning_rate': 1.9815948975724092e-05, 'epoch': 0.13} {'loss': 0.9707, 'learning_rate': 1.981588645450041e-05, 'epoch': 0.13} {'loss': 1.1103, 'learning_rate': 1.9815823922758113e-05, 'epoch': 0.13} {'loss': 0.8064, 'learning_rate': 1.981576138049728e-05, 'epoch': 0.13} {'loss': 1.112, 'learning_rate': 1.9815698827717972e-05, 'epoch': 0.13} {'loss': 0.984, 'learning_rate': 1.9815636264420256e-05, 'epoch': 0.13} {'loss': 0.9744, 'learning_rate': 1.98155736906042e-05, 'epoch': 0.13} {'loss': 1.0197, 'learning_rate': 1.9815511106269872e-05, 'epoch': 0.13} {'loss': 0.9421, 'learning_rate': 1.9815448511417336e-05, 'epoch': 0.13} {'loss': 1.0925, 'learning_rate': 1.9815385906046663e-05, 'epoch': 0.13} {'loss': 0.9757, 'learning_rate': 1.981532329015792e-05, 'epoch': 0.13} {'loss': 0.9845, 'learning_rate': 1.9815260663751166e-05, 'epoch': 0.13} {'loss': 0.9634, 'learning_rate': 1.9815198026826476e-05, 'epoch': 0.13} {'loss': 0.9646, 'learning_rate': 1.9815135379383918e-05, 'epoch': 0.13} {'loss': 0.9596, 'learning_rate': 1.9815072721423554e-05, 'epoch': 0.13} {'loss': 1.0752, 'learning_rate': 1.9815010052945454e-05, 'epoch': 0.13} {'loss': 0.9267, 'learning_rate': 1.981494737394969e-05, 'epoch': 0.13} {'loss': 0.8385, 'learning_rate': 1.9814884684436318e-05, 'epoch': 0.13} {'loss': 0.7996, 'learning_rate': 1.9814821984405414e-05, 'epoch': 0.13} {'loss': 0.9689, 'learning_rate': 1.981475927385704e-05, 'epoch': 0.13} {'loss': 0.8099, 'learning_rate': 1.981469655279127e-05, 'epoch': 0.13} {'loss': 0.7875, 'learning_rate': 1.981463382120816e-05, 'epoch': 0.13} {'loss': 1.0407, 'learning_rate': 1.981457107910779e-05, 'epoch': 0.13} {'loss': 0.9435, 'learning_rate': 1.9814508326490222e-05, 'epoch': 0.13} {'loss': 1.0265, 'learning_rate': 1.981444556335552e-05, 'epoch': 0.13} {'loss': 0.9547, 'learning_rate': 1.9814382789703754e-05, 'epoch': 0.13} {'loss': 0.8545, 'learning_rate': 1.981432000553499e-05, 'epoch': 0.13} {'loss': 1.145, 'learning_rate': 1.9814257210849296e-05, 'epoch': 0.13} {'loss': 0.7926, 'learning_rate': 1.981419440564674e-05, 'epoch': 0.13} {'loss': 0.9018, 'learning_rate': 1.981413158992739e-05, 'epoch': 0.13} {'loss': 1.0005, 'learning_rate': 1.9814068763691315e-05, 'epoch': 0.13} {'loss': 0.9998, 'learning_rate': 1.9814005926938577e-05, 'epoch': 0.13} {'loss': 0.7741, 'learning_rate': 1.9813943079669244e-05, 'epoch': 0.13} {'loss': 1.0481, 'learning_rate': 1.9813880221883386e-05, 'epoch': 0.13} {'loss': 1.0801, 'learning_rate': 1.981381735358107e-05, 'epoch': 0.13} {'loss': 0.8766, 'learning_rate': 1.981375447476236e-05, 'epoch': 0.13} {'loss': 1.0147, 'learning_rate': 1.981369158542733e-05, 'epoch': 0.13} {'loss': 0.9774, 'learning_rate': 1.9813628685576046e-05, 'epoch': 0.13} {'loss': 1.0853, 'learning_rate': 1.981356577520857e-05, 'epoch': 0.13} {'loss': 0.8392, 'learning_rate': 1.9813502854324974e-05, 'epoch': 0.13} {'loss': 0.98, 'learning_rate': 1.9813439922925323e-05, 'epoch': 0.13} {'loss': 1.0195, 'learning_rate': 1.9813376981009683e-05, 'epoch': 0.13} {'loss': 0.9215, 'learning_rate': 1.9813314028578126e-05, 'epoch': 0.13} {'loss': 0.9956, 'learning_rate': 1.981325106563072e-05, 'epoch': 0.13} {'loss': 0.8419, 'learning_rate': 1.9813188092167524e-05, 'epoch': 0.13} {'loss': 0.8766, 'learning_rate': 1.9813125108188615e-05, 'epoch': 0.13} {'loss': 1.1465, 'learning_rate': 1.9813062113694056e-05, 'epoch': 0.13} {'loss': 0.8567, 'learning_rate': 1.9812999108683914e-05, 'epoch': 0.13} {'loss': 0.8934, 'learning_rate': 1.981293609315826e-05, 'epoch': 0.13} {'loss': 1.0413, 'learning_rate': 1.9812873067117157e-05, 'epoch': 0.13} {'loss': 0.9243, 'learning_rate': 1.981281003056068e-05, 'epoch': 0.13} {'loss': 1.0258, 'learning_rate': 1.9812746983488888e-05, 'epoch': 0.13} {'loss': 0.6713, 'learning_rate': 1.981268392590185e-05, 'epoch': 0.13} {'loss': 0.9199, 'learning_rate': 1.981262085779964e-05, 'epoch': 0.13} {'loss': 0.8651, 'learning_rate': 1.9812557779182315e-05, 'epoch': 0.13} {'loss': 0.7638, 'learning_rate': 1.981249469004995e-05, 'epoch': 0.13} {'loss': 0.9506, 'learning_rate': 1.9812431590402617e-05, 'epoch': 0.13} {'loss': 0.9033, 'learning_rate': 1.9812368480240372e-05, 'epoch': 0.13} {'loss': 0.9031, 'learning_rate': 1.981230535956329e-05, 'epoch': 0.13} {'loss': 1.1047, 'learning_rate': 1.9812242228371438e-05, 'epoch': 0.13} {'loss': 0.7457, 'learning_rate': 1.9812179086664883e-05, 'epoch': 0.13} {'loss': 0.8196, 'learning_rate': 1.9812115934443695e-05, 'epoch': 0.13} {'loss': 0.7983, 'learning_rate': 1.9812052771707935e-05, 'epoch': 0.13} {'loss': 0.9123, 'learning_rate': 1.9811989598457674e-05, 'epoch': 0.13} {'loss': 1.0453, 'learning_rate': 1.9811926414692983e-05, 'epoch': 0.13} {'loss': 0.8548, 'learning_rate': 1.981186322041393e-05, 'epoch': 0.13} {'loss': 0.9348, 'learning_rate': 1.9811800015620577e-05, 'epoch': 0.13} {'loss': 0.9415, 'learning_rate': 1.9811736800312996e-05, 'epoch': 0.13} {'loss': 0.8979, 'learning_rate': 1.981167357449125e-05, 'epoch': 0.13} {'loss': 0.8583, 'learning_rate': 1.9811610338155413e-05, 'epoch': 0.13} {'loss': 0.8939, 'learning_rate': 1.981154709130555e-05, 'epoch': 0.13} {'loss': 0.8194, 'learning_rate': 1.9811483833941726e-05, 'epoch': 0.13} {'loss': 0.9489, 'learning_rate': 1.9811420566064017e-05, 'epoch': 0.13} {'loss': 0.9378, 'learning_rate': 1.981135728767248e-05, 'epoch': 0.13} {'loss': 0.7985, 'learning_rate': 1.9811293998767192e-05, 'epoch': 0.13} {'loss': 0.8536, 'learning_rate': 1.9811230699348213e-05, 'epoch': 0.13} {'loss': 1.0515, 'learning_rate': 1.981116738941562e-05, 'epoch': 0.13} {'loss': 0.9563, 'learning_rate': 1.981110406896947e-05, 'epoch': 0.13} {'loss': 0.9458, 'learning_rate': 1.981104073800984e-05, 'epoch': 0.13} {'loss': 0.9814, 'learning_rate': 1.9810977396536795e-05, 'epoch': 0.13} {'loss': 0.9601, 'learning_rate': 1.98109140445504e-05, 'epoch': 0.13} {'loss': 1.0296, 'learning_rate': 1.9810850682050726e-05, 'epoch': 0.13} {'loss': 0.9887, 'learning_rate': 1.981078730903784e-05, 'epoch': 0.13} {'loss': 0.9646, 'learning_rate': 1.9810723925511806e-05, 'epoch': 0.13} {'loss': 0.8827, 'learning_rate': 1.98106605314727e-05, 'epoch': 0.13} {'loss': 1.0081, 'learning_rate': 1.9810597126920584e-05, 'epoch': 0.13} {'loss': 0.8661, 'learning_rate': 1.981053371185553e-05, 'epoch': 0.13} {'loss': 0.8043, 'learning_rate': 1.9810470286277604e-05, 'epoch': 0.13} {'loss': 0.8022, 'learning_rate': 1.9810406850186873e-05, 'epoch': 0.13} {'loss': 1.0058, 'learning_rate': 1.9810343403583407e-05, 'epoch': 0.13} {'loss': 0.996, 'learning_rate': 1.981027994646727e-05, 'epoch': 0.13} {'loss': 0.9463, 'learning_rate': 1.9810216478838532e-05, 'epoch': 0.13} {'loss': 1.0079, 'learning_rate': 1.9810153000697264e-05, 'epoch': 0.13} {'loss': 0.9543, 'learning_rate': 1.9810089512043528e-05, 'epoch': 0.13} {'loss': 0.8408, 'learning_rate': 1.98100260128774e-05, 'epoch': 0.13} {'loss': 0.9835, 'learning_rate': 1.980996250319894e-05, 'epoch': 0.13} {'loss': 0.9299, 'learning_rate': 1.9809898983008223e-05, 'epoch': 0.13} {'loss': 1.0633, 'learning_rate': 1.980983545230531e-05, 'epoch': 0.13} {'loss': 0.9202, 'learning_rate': 1.9809771911090277e-05, 'epoch': 0.13} {'loss': 0.9732, 'learning_rate': 1.9809708359363187e-05, 'epoch': 0.13} {'loss': 0.9921, 'learning_rate': 1.9809644797124107e-05, 'epoch': 0.13} {'loss': 0.7769, 'learning_rate': 1.9809581224373108e-05, 'epoch': 0.13} {'loss': 0.9335, 'learning_rate': 1.980951764111026e-05, 'epoch': 0.13} {'loss': 1.0618, 'learning_rate': 1.9809454047335625e-05, 'epoch': 0.13} {'loss': 0.919, 'learning_rate': 1.9809390443049277e-05, 'epoch': 0.13} {'loss': 0.8329, 'learning_rate': 1.9809326828251284e-05, 'epoch': 0.13} {'loss': 1.0662, 'learning_rate': 1.9809263202941707e-05, 'epoch': 0.13} {'loss': 0.9502, 'learning_rate': 1.980919956712062e-05, 'epoch': 0.13} {'loss': 0.8394, 'learning_rate': 1.9809135920788093e-05, 'epoch': 0.13} {'loss': 0.9382, 'learning_rate': 1.980907226394419e-05, 'epoch': 0.13} {'loss': 0.7444, 'learning_rate': 1.9809008596588982e-05, 'epoch': 0.13} {'loss': 0.8923, 'learning_rate': 1.9808944918722533e-05, 'epoch': 0.13} {'loss': 0.7421, 'learning_rate': 1.9808881230344915e-05, 'epoch': 0.13} {'loss': 0.9937, 'learning_rate': 1.9808817531456195e-05, 'epoch': 0.13} {'loss': 0.8858, 'learning_rate': 1.9808753822056443e-05, 'epoch': 0.13} {'loss': 0.9568, 'learning_rate': 1.9808690102145727e-05, 'epoch': 0.13} {'loss': 0.915, 'learning_rate': 1.9808626371724112e-05, 'epoch': 0.13} {'loss': 0.8515, 'learning_rate': 1.980856263079167e-05, 'epoch': 0.13} {'loss': 0.952, 'learning_rate': 1.9808498879348467e-05, 'epoch': 0.13} {'loss': 0.8707, 'learning_rate': 1.9808435117394573e-05, 'epoch': 0.13} {'loss': 1.0336, 'learning_rate': 1.9808371344930057e-05, 'epoch': 0.13} {'loss': 0.8681, 'learning_rate': 1.9808307561954983e-05, 'epoch': 0.13} {'loss': 0.8249, 'learning_rate': 1.9808243768469424e-05, 'epoch': 0.13} {'loss': 0.8985, 'learning_rate': 1.9808179964473446e-05, 'epoch': 0.13} {'loss': 0.8224, 'learning_rate': 1.9808116149967117e-05, 'epoch': 0.13} {'loss': 0.8018, 'learning_rate': 1.980805232495051e-05, 'epoch': 0.13} {'loss': 0.922, 'learning_rate': 1.9807988489423685e-05, 'epoch': 0.13} {'loss': 0.7893, 'learning_rate': 1.9807924643386717e-05, 'epoch': 0.13} {'loss': 0.9042, 'learning_rate': 1.9807860786839673e-05, 'epoch': 0.13} {'loss': 0.9473, 'learning_rate': 1.980779691978262e-05, 'epoch': 0.13} {'loss': 0.8131, 'learning_rate': 1.9807733042215628e-05, 'epoch': 0.13} {'loss': 0.8342, 'learning_rate': 1.9807669154138765e-05, 'epoch': 0.13} {'loss': 0.7861, 'learning_rate': 1.9807605255552097e-05, 'epoch': 0.13} {'loss': 0.9383, 'learning_rate': 1.9807541346455698e-05, 'epoch': 0.13} {'loss': 0.9175, 'learning_rate': 1.9807477426849633e-05, 'epoch': 0.13} {'loss': 0.7382, 'learning_rate': 1.980741349673397e-05, 'epoch': 0.13} {'loss': 0.8081, 'learning_rate': 1.980734955610878e-05, 'epoch': 0.13} {'loss': 0.864, 'learning_rate': 1.9807285604974128e-05, 'epoch': 0.13} {'loss': 0.9002, 'learning_rate': 1.980722164333008e-05, 'epoch': 0.13} {'loss': 0.9685, 'learning_rate': 1.9807157671176715e-05, 'epoch': 0.13} {'loss': 0.9076, 'learning_rate': 1.9807093688514092e-05, 'epoch': 0.13} {'loss': 1.0214, 'learning_rate': 1.9807029695342287e-05, 'epoch': 0.13} {'loss': 0.9508, 'learning_rate': 1.980696569166136e-05, 'epoch': 0.13} {'loss': 0.9396, 'learning_rate': 1.9806901677471386e-05, 'epoch': 0.13} {'loss': 0.8833, 'learning_rate': 1.9806837652772432e-05, 'epoch': 0.13} {'loss': 0.8902, 'learning_rate': 1.9806773617564564e-05, 'epoch': 0.13} {'loss': 0.8365, 'learning_rate': 1.9806709571847856e-05, 'epoch': 0.13} {'loss': 1.0195, 'learning_rate': 1.9806645515622373e-05, 'epoch': 0.13} {'loss': 0.9312, 'learning_rate': 1.9806581448888186e-05, 'epoch': 0.13} {'loss': 0.8601, 'learning_rate': 1.9806517371645356e-05, 'epoch': 0.13} {'loss': 0.9249, 'learning_rate': 1.9806453283893964e-05, 'epoch': 0.13} {'loss': 1.0116, 'learning_rate': 1.980638918563407e-05, 'epoch': 0.13} {'loss': 0.8428, 'learning_rate': 1.9806325076865742e-05, 'epoch': 0.13} {'loss': 0.8653, 'learning_rate': 1.9806260957589057e-05, 'epoch': 0.13} {'loss': 0.9301, 'learning_rate': 1.9806196827804075e-05, 'epoch': 0.13} {'loss': 0.8093, 'learning_rate': 1.9806132687510867e-05, 'epoch': 0.13} {'loss': 0.9796, 'learning_rate': 1.9806068536709504e-05, 'epoch': 0.13} {'loss': 0.9446, 'learning_rate': 1.9806004375400053e-05, 'epoch': 0.13} {'loss': 0.8772, 'learning_rate': 1.9805940203582586e-05, 'epoch': 0.13} {'loss': 0.8874, 'learning_rate': 1.9805876021257167e-05, 'epoch': 0.13} {'loss': 0.7805, 'learning_rate': 1.9805811828423867e-05, 'epoch': 0.13} {'loss': 0.9575, 'learning_rate': 1.980574762508275e-05, 'epoch': 0.13} {'loss': 0.8295, 'learning_rate': 1.9805683411233895e-05, 'epoch': 0.13} {'loss': 0.9573, 'learning_rate': 1.9805619186877367e-05, 'epoch': 0.13} {'loss': 0.8645, 'learning_rate': 1.9805554952013228e-05, 'epoch': 0.13} {'loss': 0.9294, 'learning_rate': 1.9805490706641554e-05, 'epoch': 0.13} {'loss': 0.8944, 'learning_rate': 1.9805426450762413e-05, 'epoch': 0.13} {'loss': 0.9686, 'learning_rate': 1.9805362184375872e-05, 'epoch': 0.13} {'loss': 0.8373, 'learning_rate': 1.9805297907481996e-05, 'epoch': 0.13} {'loss': 0.9073, 'learning_rate': 1.9805233620080862e-05, 'epoch': 0.13} {'loss': 0.9283, 'learning_rate': 1.9805169322172536e-05, 'epoch': 0.13} {'loss': 1.0989, 'learning_rate': 1.9805105013757084e-05, 'epoch': 0.13} {'loss': 0.9333, 'learning_rate': 1.980504069483458e-05, 'epoch': 0.13} {'loss': 0.9093, 'learning_rate': 1.980497636540509e-05, 'epoch': 0.13} {'loss': 0.7442, 'learning_rate': 1.980491202546868e-05, 'epoch': 0.13} {'loss': 0.7745, 'learning_rate': 1.9804847675025424e-05, 'epoch': 0.13} {'loss': 0.9033, 'learning_rate': 1.9804783314075386e-05, 'epoch': 0.13} {'loss': 0.8562, 'learning_rate': 1.980471894261864e-05, 'epoch': 0.13} {'loss': 0.8656, 'learning_rate': 1.9804654560655253e-05, 'epoch': 0.13} {'loss': 0.8632, 'learning_rate': 1.9804590168185293e-05, 'epoch': 0.13} {'loss': 0.7706, 'learning_rate': 1.9804525765208828e-05, 'epoch': 0.13} {'loss': 0.8665, 'learning_rate': 1.980446135172593e-05, 'epoch': 0.13} {'loss': 0.8622, 'learning_rate': 1.9804396927736666e-05, 'epoch': 0.13} {'loss': 0.8415, 'learning_rate': 1.980433249324111e-05, 'epoch': 0.13} {'loss': 0.7782, 'learning_rate': 1.980426804823932e-05, 'epoch': 0.13} {'loss': 0.9378, 'learning_rate': 1.9804203592731377e-05, 'epoch': 0.13} {'loss': 1.0134, 'learning_rate': 1.9804139126717344e-05, 'epoch': 0.13} {'loss': 0.8356, 'learning_rate': 1.9804074650197288e-05, 'epoch': 0.13} {'loss': 0.8492, 'learning_rate': 1.9804010163171285e-05, 'epoch': 0.13} {'loss': 0.925, 'learning_rate': 1.98039456656394e-05, 'epoch': 0.13} {'loss': 1.0046, 'learning_rate': 1.98038811576017e-05, 'epoch': 0.13} {'loss': 0.9924, 'learning_rate': 1.9803816639058256e-05, 'epoch': 0.13} {'loss': 1.0465, 'learning_rate': 1.980375211000914e-05, 'epoch': 0.13} {'loss': 0.8111, 'learning_rate': 1.980368757045442e-05, 'epoch': 0.13} {'loss': 0.9311, 'learning_rate': 1.980362302039416e-05, 'epoch': 0.13} {'loss': 0.8128, 'learning_rate': 1.9803558459828437e-05, 'epoch': 0.13} {'loss': 0.944, 'learning_rate': 1.980349388875731e-05, 'epoch': 0.13} {'loss': 0.8658, 'learning_rate': 1.9803429307180862e-05, 'epoch': 0.13} {'loss': 0.9212, 'learning_rate': 1.9803364715099152e-05, 'epoch': 0.13} {'loss': 0.9289, 'learning_rate': 1.980330011251225e-05, 'epoch': 0.13} {'loss': 0.8311, 'learning_rate': 1.980323549942023e-05, 'epoch': 0.13} {'loss': 0.8947, 'learning_rate': 1.9803170875823155e-05, 'epoch': 0.13} {'loss': 0.9433, 'learning_rate': 1.9803106241721102e-05, 'epoch': 0.13} {'loss': 0.8972, 'learning_rate': 1.9803041597114133e-05, 'epoch': 0.13} {'loss': 0.8716, 'learning_rate': 1.980297694200232e-05, 'epoch': 0.13} {'loss': 0.8884, 'learning_rate': 1.9802912276385732e-05, 'epoch': 0.13} {'loss': 0.9173, 'learning_rate': 1.980284760026444e-05, 'epoch': 0.13} {'loss': 0.8221, 'learning_rate': 1.9802782913638513e-05, 'epoch': 0.13} {'loss': 0.9397, 'learning_rate': 1.980271821650802e-05, 'epoch': 0.13} {'loss': 1.0047, 'learning_rate': 1.9802653508873028e-05, 'epoch': 0.13} {'loss': 1.0014, 'learning_rate': 1.9802588790733604e-05, 'epoch': 0.13} {'loss': 0.9345, 'learning_rate': 1.9802524062089827e-05, 'epoch': 0.13} {'loss': 0.9889, 'learning_rate': 1.9802459322941757e-05, 'epoch': 0.13} {'loss': 0.9944, 'learning_rate': 1.980239457328947e-05, 'epoch': 0.13} {'loss': 0.7663, 'learning_rate': 1.9802329813133033e-05, 'epoch': 0.13} {'loss': 0.9848, 'learning_rate': 1.980226504247251e-05, 'epoch': 0.13} {'loss': 0.9623, 'learning_rate': 1.9802200261307982e-05, 'epoch': 0.13} {'loss': 0.8102, 'learning_rate': 1.980213546963951e-05, 'epoch': 0.13} {'loss': 1.0569, 'learning_rate': 1.9802070667467162e-05, 'epoch': 0.13} {'loss': 0.7768, 'learning_rate': 1.980200585479101e-05, 'epoch': 0.13} {'loss': 0.8683, 'learning_rate': 1.9801941031611127e-05, 'epoch': 0.13} {'loss': 0.8926, 'learning_rate': 1.980187619792758e-05, 'epoch': 0.13} {'loss': 1.1398, 'learning_rate': 1.9801811353740438e-05, 'epoch': 0.13} {'loss': 0.8037, 'learning_rate': 1.980174649904977e-05, 'epoch': 0.13} {'loss': 0.9162, 'learning_rate': 1.9801681633855644e-05, 'epoch': 0.13} {'loss': 1.1021, 'learning_rate': 1.980161675815813e-05, 'epoch': 0.13} {'loss': 0.6828, 'learning_rate': 1.9801551871957305e-05, 'epoch': 0.13} {'loss': 1.0586, 'learning_rate': 1.980148697525323e-05, 'epoch': 0.13} {'loss': 1.0857, 'learning_rate': 1.9801422068045975e-05, 'epoch': 0.13} {'loss': 0.9191, 'learning_rate': 1.980135715033561e-05, 'epoch': 0.13} {'loss': 0.8783, 'learning_rate': 1.980129222212221e-05, 'epoch': 0.13} {'loss': 0.9505, 'learning_rate': 1.980122728340584e-05, 'epoch': 0.13} {'loss': 0.711, 'learning_rate': 1.980116233418657e-05, 'epoch': 0.13} {'loss': 0.9273, 'learning_rate': 1.980109737446447e-05, 'epoch': 0.13} {'loss': 0.8755, 'learning_rate': 1.980103240423961e-05, 'epoch': 0.13} {'loss': 0.8907, 'learning_rate': 1.9800967423512058e-05, 'epoch': 0.13} {'loss': 0.9837, 'learning_rate': 1.9800902432281887e-05, 'epoch': 0.13} {'loss': 0.8736, 'learning_rate': 1.980083743054916e-05, 'epoch': 0.13} {'loss': 1.038, 'learning_rate': 1.9800772418313955e-05, 'epoch': 0.13} {'loss': 0.8873, 'learning_rate': 1.980070739557634e-05, 'epoch': 0.13} {'loss': 0.837, 'learning_rate': 1.9800642362336378e-05, 'epoch': 0.13} {'loss': 0.9128, 'learning_rate': 1.9800577318594145e-05, 'epoch': 0.13} {'loss': 0.8739, 'learning_rate': 1.980051226434971e-05, 'epoch': 0.13} {'loss': 1.0695, 'learning_rate': 1.9800447199603137e-05, 'epoch': 0.13} {'loss': 0.982, 'learning_rate': 1.9800382124354505e-05, 'epoch': 0.13} {'loss': 0.9121, 'learning_rate': 1.9800317038603876e-05, 'epoch': 0.13} {'loss': 1.1038, 'learning_rate': 1.9800251942351327e-05, 'epoch': 0.13} {'loss': 0.9108, 'learning_rate': 1.980018683559692e-05, 'epoch': 0.13} {'loss': 0.7457, 'learning_rate': 1.980012171834073e-05, 'epoch': 0.13} {'loss': 1.0351, 'learning_rate': 1.9800056590582823e-05, 'epoch': 0.13} {'loss': 0.8929, 'learning_rate': 1.979999145232327e-05, 'epoch': 0.13} {'loss': 0.8979, 'learning_rate': 1.9799926303562142e-05, 'epoch': 0.13} {'loss': 0.9698, 'learning_rate': 1.9799861144299513e-05, 'epoch': 0.13} {'loss': 0.9333, 'learning_rate': 1.9799795974535444e-05, 'epoch': 0.13} {'loss': 0.9009, 'learning_rate': 1.979973079427001e-05, 'epoch': 0.13} {'loss': 0.8147, 'learning_rate': 1.979966560350328e-05, 'epoch': 0.13} {'loss': 1.0774, 'learning_rate': 1.9799600402235322e-05, 'epoch': 0.13} {'loss': 0.9922, 'learning_rate': 1.9799535190466212e-05, 'epoch': 0.13} {'loss': 0.9433, 'learning_rate': 1.9799469968196014e-05, 'epoch': 0.13} {'loss': 0.8284, 'learning_rate': 1.9799404735424796e-05, 'epoch': 0.13} {'loss': 1.1017, 'learning_rate': 1.9799339492152636e-05, 'epoch': 0.13} {'loss': 0.8489, 'learning_rate': 1.97992742383796e-05, 'epoch': 0.13} {'loss': 0.8798, 'learning_rate': 1.9799208974105752e-05, 'epoch': 0.13} {'loss': 1.1096, 'learning_rate': 1.9799143699331173e-05, 'epoch': 0.13} {'loss': 0.9917, 'learning_rate': 1.979907841405592e-05, 'epoch': 0.13} {'loss': 0.9605, 'learning_rate': 1.9799013118280074e-05, 'epoch': 0.13} {'loss': 0.9268, 'learning_rate': 1.9798947812003703e-05, 'epoch': 0.13} {'loss': 1.0256, 'learning_rate': 1.979888249522687e-05, 'epoch': 0.13} {'loss': 0.9377, 'learning_rate': 1.9798817167949656e-05, 'epoch': 0.13} {'loss': 0.9035, 'learning_rate': 1.979875183017212e-05, 'epoch': 0.13} {'loss': 0.721, 'learning_rate': 1.979868648189434e-05, 'epoch': 0.13} {'loss': 0.9555, 'learning_rate': 1.9798621123116382e-05, 'epoch': 0.13} {'loss': 0.9124, 'learning_rate': 1.9798555753838317e-05, 'epoch': 0.13} {'loss': 0.8777, 'learning_rate': 1.979849037406022e-05, 'epoch': 0.13} {'loss': 0.9978, 'learning_rate': 1.9798424983782147e-05, 'epoch': 0.13} {'loss': 0.7888, 'learning_rate': 1.9798359583004183e-05, 'epoch': 0.13} {'loss': 1.0208, 'learning_rate': 1.9798294171726393e-05, 'epoch': 0.13} {'loss': 0.9429, 'learning_rate': 1.9798228749948843e-05, 'epoch': 0.13} {'loss': 0.7964, 'learning_rate': 1.9798163317671608e-05, 'epoch': 0.13} {'loss': 0.8838, 'learning_rate': 1.9798097874894756e-05, 'epoch': 0.13} {'loss': 1.1965, 'learning_rate': 1.979803242161836e-05, 'epoch': 0.13} {'loss': 0.7095, 'learning_rate': 1.9797966957842485e-05, 'epoch': 0.13} {'loss': 0.9963, 'learning_rate': 1.9797901483567208e-05, 'epoch': 0.13} {'loss': 0.8772, 'learning_rate': 1.9797835998792592e-05, 'epoch': 0.13} {'loss': 0.9746, 'learning_rate': 1.9797770503518712e-05, 'epoch': 0.13} {'loss': 0.9777, 'learning_rate': 1.9797704997745634e-05, 'epoch': 0.13} {'loss': 0.719, 'learning_rate': 1.979763948147343e-05, 'epoch': 0.13} {'loss': 1.0763, 'learning_rate': 1.979757395470218e-05, 'epoch': 0.13} {'loss': 0.9429, 'learning_rate': 1.9797508417431938e-05, 'epoch': 0.13} {'loss': 0.848, 'learning_rate': 1.979744286966278e-05, 'epoch': 0.13} {'loss': 0.864, 'learning_rate': 1.979737731139478e-05, 'epoch': 0.13} {'loss': 0.9387, 'learning_rate': 1.9797311742628006e-05, 'epoch': 0.13} {'loss': 1.0831, 'learning_rate': 1.9797246163362528e-05, 'epoch': 0.13} {'loss': 0.9409, 'learning_rate': 1.979718057359842e-05, 'epoch': 0.13} {'loss': 0.8225, 'learning_rate': 1.9797114973335743e-05, 'epoch': 0.13} {'loss': 0.8964, 'learning_rate': 1.9797049362574575e-05, 'epoch': 0.13} {'loss': 1.0178, 'learning_rate': 1.9796983741314986e-05, 'epoch': 0.13} {'loss': 0.8333, 'learning_rate': 1.9796918109557043e-05, 'epoch': 0.13} {'loss': 0.7718, 'learning_rate': 1.979685246730082e-05, 'epoch': 0.13} {'loss': 0.817, 'learning_rate': 1.9796786814546383e-05, 'epoch': 0.13} {'loss': 0.8979, 'learning_rate': 1.9796721151293807e-05, 'epoch': 0.13} {'loss': 0.9054, 'learning_rate': 1.9796655477543156e-05, 'epoch': 0.13} {'loss': 0.705, 'learning_rate': 1.9796589793294507e-05, 'epoch': 0.13} {'loss': 0.84, 'learning_rate': 1.9796524098547928e-05, 'epoch': 0.13} {'loss': 1.0331, 'learning_rate': 1.979645839330349e-05, 'epoch': 0.13} {'loss': 0.8028, 'learning_rate': 1.9796392677561262e-05, 'epoch': 0.13} {'loss': 0.9226, 'learning_rate': 1.9796326951321317e-05, 'epoch': 0.13} {'loss': 1.1787, 'learning_rate': 1.979626121458372e-05, 'epoch': 0.13} {'loss': 0.9446, 'learning_rate': 1.9796195467348546e-05, 'epoch': 0.13} {'loss': 0.9523, 'learning_rate': 1.9796129709615866e-05, 'epoch': 0.13} {'loss': 0.9405, 'learning_rate': 1.9796063941385747e-05, 'epoch': 0.13} {'loss': 0.9606, 'learning_rate': 1.979599816265826e-05, 'epoch': 0.13} {'loss': 0.9969, 'learning_rate': 1.979593237343348e-05, 'epoch': 0.13} {'loss': 0.9734, 'learning_rate': 1.9795866573711473e-05, 'epoch': 0.13} {'loss': 0.8268, 'learning_rate': 1.979580076349231e-05, 'epoch': 0.13} {'loss': 0.9895, 'learning_rate': 1.9795734942776067e-05, 'epoch': 0.13} {'loss': 0.9049, 'learning_rate': 1.9795669111562804e-05, 'epoch': 0.13} {'loss': 0.973, 'learning_rate': 1.97956032698526e-05, 'epoch': 0.13} {'loss': 1.0181, 'learning_rate': 1.9795537417645524e-05, 'epoch': 0.13} {'loss': 0.9987, 'learning_rate': 1.9795471554941643e-05, 'epoch': 0.13} {'loss': 1.0066, 'learning_rate': 1.979540568174103e-05, 'epoch': 0.13} {'loss': 0.9893, 'learning_rate': 1.979533979804376e-05, 'epoch': 0.13} {'loss': 1.0372, 'learning_rate': 1.9795273903849894e-05, 'epoch': 0.13} {'loss': 0.828, 'learning_rate': 1.979520799915951e-05, 'epoch': 0.13} {'loss': 1.0241, 'learning_rate': 1.979514208397268e-05, 'epoch': 0.13} {'loss': 0.9924, 'learning_rate': 1.9795076158289466e-05, 'epoch': 0.13} {'loss': 0.977, 'learning_rate': 1.9795010222109945e-05, 'epoch': 0.13} {'loss': 1.0707, 'learning_rate': 1.979494427543419e-05, 'epoch': 0.13} {'loss': 1.0353, 'learning_rate': 1.9794878318262265e-05, 'epoch': 0.13} {'loss': 0.7742, 'learning_rate': 1.9794812350594243e-05, 'epoch': 0.14} {'loss': 0.8744, 'learning_rate': 1.9794746372430197e-05, 'epoch': 0.14} {'loss': 0.9446, 'learning_rate': 1.97946803837702e-05, 'epoch': 0.14} {'loss': 0.9439, 'learning_rate': 1.9794614384614314e-05, 'epoch': 0.14} {'loss': 0.8174, 'learning_rate': 1.9794548374962613e-05, 'epoch': 0.14} {'loss': 0.8979, 'learning_rate': 1.9794482354815172e-05, 'epoch': 0.14} {'loss': 0.8902, 'learning_rate': 1.979441632417206e-05, 'epoch': 0.14} {'loss': 0.9394, 'learning_rate': 1.9794350283033347e-05, 'epoch': 0.14} {'loss': 0.8832, 'learning_rate': 1.9794284231399102e-05, 'epoch': 0.14} {'loss': 0.9065, 'learning_rate': 1.9794218169269397e-05, 'epoch': 0.14} {'loss': 0.9957, 'learning_rate': 1.9794152096644307e-05, 'epoch': 0.14} {'loss': 0.9047, 'learning_rate': 1.9794086013523897e-05, 'epoch': 0.14} {'loss': 0.7586, 'learning_rate': 1.979401991990824e-05, 'epoch': 0.14} {'loss': 0.8264, 'learning_rate': 1.9793953815797407e-05, 'epoch': 0.14} {'loss': 0.9041, 'learning_rate': 1.9793887701191466e-05, 'epoch': 0.14} {'loss': 0.8278, 'learning_rate': 1.9793821576090493e-05, 'epoch': 0.14} {'loss': 0.9211, 'learning_rate': 1.9793755440494555e-05, 'epoch': 0.14} {'loss': 0.9995, 'learning_rate': 1.9793689294403722e-05, 'epoch': 0.14} {'loss': 0.9416, 'learning_rate': 1.979362313781807e-05, 'epoch': 0.14} {'loss': 0.8926, 'learning_rate': 1.979355697073767e-05, 'epoch': 0.14} {'loss': 0.8801, 'learning_rate': 1.9793490793162586e-05, 'epoch': 0.14} {'loss': 0.9983, 'learning_rate': 1.9793424605092892e-05, 'epoch': 0.14} {'loss': 0.8617, 'learning_rate': 1.979335840652866e-05, 'epoch': 0.14} {'loss': 1.0313, 'learning_rate': 1.9793292197469964e-05, 'epoch': 0.14} {'loss': 0.8363, 'learning_rate': 1.9793225977916865e-05, 'epoch': 0.14} {'loss': 0.9893, 'learning_rate': 1.9793159747869445e-05, 'epoch': 0.14} {'loss': 0.8041, 'learning_rate': 1.979309350732777e-05, 'epoch': 0.14} {'loss': 0.8744, 'learning_rate': 1.9793027256291908e-05, 'epoch': 0.14} {'loss': 0.8884, 'learning_rate': 1.979296099476194e-05, 'epoch': 0.14} {'loss': 0.8345, 'learning_rate': 1.979289472273792e-05, 'epoch': 0.14} {'loss': 0.9854, 'learning_rate': 1.979282844021994e-05, 'epoch': 0.14} {'loss': 0.8761, 'learning_rate': 1.979276214720806e-05, 'epoch': 0.14} {'loss': 0.8901, 'learning_rate': 1.9792695843702347e-05, 'epoch': 0.14} {'loss': 0.8899, 'learning_rate': 1.9792629529702875e-05, 'epoch': 0.14} {'loss': 0.7973, 'learning_rate': 1.979256320520972e-05, 'epoch': 0.14} {'loss': 0.9223, 'learning_rate': 1.979249687022295e-05, 'epoch': 0.14} {'loss': 0.9357, 'learning_rate': 1.9792430524742633e-05, 'epoch': 0.14} {'loss': 0.9518, 'learning_rate': 1.9792364168768843e-05, 'epoch': 0.14} {'loss': 0.8733, 'learning_rate': 1.9792297802301658e-05, 'epoch': 0.14} {'loss': 0.9332, 'learning_rate': 1.9792231425341133e-05, 'epoch': 0.14} {'loss': 0.9927, 'learning_rate': 1.9792165037887354e-05, 'epoch': 0.14} {'loss': 0.9439, 'learning_rate': 1.9792098639940382e-05, 'epoch': 0.14} {'loss': 0.9325, 'learning_rate': 1.97920322315003e-05, 'epoch': 0.14} {'loss': 1.0024, 'learning_rate': 1.9791965812567164e-05, 'epoch': 0.14} {'loss': 0.8456, 'learning_rate': 1.9791899383141056e-05, 'epoch': 0.14} {'loss': 0.9335, 'learning_rate': 1.979183294322204e-05, 'epoch': 0.14} {'loss': 0.7412, 'learning_rate': 1.9791766492810195e-05, 'epoch': 0.14} {'loss': 0.842, 'learning_rate': 1.979170003190559e-05, 'epoch': 0.14} {'loss': 0.9263, 'learning_rate': 1.9791633560508294e-05, 'epoch': 0.14} {'loss': 0.9016, 'learning_rate': 1.9791567078618374e-05, 'epoch': 0.14} {'loss': 0.9271, 'learning_rate': 1.9791500586235913e-05, 'epoch': 0.14} {'loss': 0.8984, 'learning_rate': 1.9791434083360972e-05, 'epoch': 0.14} {'loss': 1.023, 'learning_rate': 1.9791367569993625e-05, 'epoch': 0.14} {'loss': 0.8578, 'learning_rate': 1.9791301046133945e-05, 'epoch': 0.14} {'loss': 0.8196, 'learning_rate': 1.9791234511782e-05, 'epoch': 0.14} {'loss': 0.8929, 'learning_rate': 1.9791167966937865e-05, 'epoch': 0.14} {'loss': 1.0437, 'learning_rate': 1.979110141160161e-05, 'epoch': 0.14} {'loss': 0.8475, 'learning_rate': 1.9791034845773308e-05, 'epoch': 0.14} {'loss': 0.9536, 'learning_rate': 1.979096826945303e-05, 'epoch': 0.14} {'loss': 0.85, 'learning_rate': 1.979090168264084e-05, 'epoch': 0.14} {'loss': 0.8282, 'learning_rate': 1.9790835085336817e-05, 'epoch': 0.14} {'loss': 0.9275, 'learning_rate': 1.979076847754103e-05, 'epoch': 0.14} {'loss': 0.915, 'learning_rate': 1.9790701859253555e-05, 'epoch': 0.14} {'loss': 0.952, 'learning_rate': 1.9790635230474455e-05, 'epoch': 0.14} {'loss': 0.7973, 'learning_rate': 1.9790568591203805e-05, 'epoch': 0.14} {'loss': 0.9853, 'learning_rate': 1.9790501941441683e-05, 'epoch': 0.14} {'loss': 1.0753, 'learning_rate': 1.979043528118815e-05, 'epoch': 0.14} {'loss': 0.9328, 'learning_rate': 1.979036861044328e-05, 'epoch': 0.14} {'loss': 0.8791, 'learning_rate': 1.9790301929207153e-05, 'epoch': 0.14} {'loss': 0.8694, 'learning_rate': 1.979023523747983e-05, 'epoch': 0.14} {'loss': 1.0427, 'learning_rate': 1.9790168535261385e-05, 'epoch': 0.14} {'loss': 0.8931, 'learning_rate': 1.9790101822551894e-05, 'epoch': 0.14} {'loss': 0.9589, 'learning_rate': 1.9790035099351423e-05, 'epoch': 0.14} {'loss': 0.8928, 'learning_rate': 1.9789968365660045e-05, 'epoch': 0.14} {'loss': 0.8106, 'learning_rate': 1.9789901621477832e-05, 'epoch': 0.14} {'loss': 1.018, 'learning_rate': 1.978983486680486e-05, 'epoch': 0.14} {'loss': 0.9344, 'learning_rate': 1.9789768101641193e-05, 'epoch': 0.14} {'loss': 1.0117, 'learning_rate': 1.978970132598691e-05, 'epoch': 0.14} {'loss': 0.7751, 'learning_rate': 1.978963453984207e-05, 'epoch': 0.14} {'loss': 0.8591, 'learning_rate': 1.978956774320676e-05, 'epoch': 0.14} {'loss': 0.9013, 'learning_rate': 1.9789500936081044e-05, 'epoch': 0.14} {'loss': 0.8614, 'learning_rate': 1.9789434118464988e-05, 'epoch': 0.14} {'loss': 0.9414, 'learning_rate': 1.978936729035868e-05, 'epoch': 0.14} {'loss': 1.0422, 'learning_rate': 1.9789300451762173e-05, 'epoch': 0.14} {'loss': 0.8256, 'learning_rate': 1.978923360267555e-05, 'epoch': 0.14} {'loss': 1.0745, 'learning_rate': 1.978916674309888e-05, 'epoch': 0.14} {'loss': 0.8903, 'learning_rate': 1.9789099873032235e-05, 'epoch': 0.14} {'loss': 1.0301, 'learning_rate': 1.9789032992475684e-05, 'epoch': 0.14} {'loss': 0.9991, 'learning_rate': 1.9788966101429302e-05, 'epoch': 0.14} {'loss': 1.071, 'learning_rate': 1.978889919989316e-05, 'epoch': 0.14} {'loss': 0.8821, 'learning_rate': 1.978883228786733e-05, 'epoch': 0.14} {'loss': 0.9259, 'learning_rate': 1.9788765365351877e-05, 'epoch': 0.14} {'loss': 1.1121, 'learning_rate': 1.9788698432346884e-05, 'epoch': 0.14} {'loss': 0.8867, 'learning_rate': 1.9788631488852415e-05, 'epoch': 0.14} {'loss': 0.8194, 'learning_rate': 1.9788564534868543e-05, 'epoch': 0.14} {'loss': 1.017, 'learning_rate': 1.978849757039534e-05, 'epoch': 0.14} {'loss': 1.0798, 'learning_rate': 1.978843059543288e-05, 'epoch': 0.14} {'loss': 1.1526, 'learning_rate': 1.9788363609981237e-05, 'epoch': 0.14} {'loss': 0.8434, 'learning_rate': 1.9788296614040473e-05, 'epoch': 0.14} {'loss': 0.9851, 'learning_rate': 1.978822960761067e-05, 'epoch': 0.14} {'loss': 1.0336, 'learning_rate': 1.9788162590691894e-05, 'epoch': 0.14} {'loss': 0.8971, 'learning_rate': 1.978809556328422e-05, 'epoch': 0.14} {'loss': 1.0229, 'learning_rate': 1.978802852538771e-05, 'epoch': 0.14} {'loss': 0.9587, 'learning_rate': 1.978796147700245e-05, 'epoch': 0.14} {'loss': 0.8966, 'learning_rate': 1.9787894418128508e-05, 'epoch': 0.14} {'loss': 1.0249, 'learning_rate': 1.9787827348765953e-05, 'epoch': 0.14} {'loss': 0.8829, 'learning_rate': 1.9787760268914856e-05, 'epoch': 0.14} {'loss': 1.0382, 'learning_rate': 1.9787693178575292e-05, 'epoch': 0.14} {'loss': 0.9157, 'learning_rate': 1.9787626077747326e-05, 'epoch': 0.14} {'loss': 1.018, 'learning_rate': 1.978755896643104e-05, 'epoch': 0.14} {'loss': 1.0517, 'learning_rate': 1.97874918446265e-05, 'epoch': 0.14} {'loss': 0.8587, 'learning_rate': 1.9787424712333782e-05, 'epoch': 0.14} {'loss': 0.8109, 'learning_rate': 1.9787357569552952e-05, 'epoch': 0.14} {'loss': 1.1284, 'learning_rate': 1.9787290416284085e-05, 'epoch': 0.14} {'loss': 0.8425, 'learning_rate': 1.9787223252527256e-05, 'epoch': 0.14} {'loss': 0.9851, 'learning_rate': 1.978715607828253e-05, 'epoch': 0.14} {'loss': 0.9794, 'learning_rate': 1.9787088893549984e-05, 'epoch': 0.14} {'loss': 0.9896, 'learning_rate': 1.978702169832969e-05, 'epoch': 0.14} {'loss': 0.7954, 'learning_rate': 1.9786954492621717e-05, 'epoch': 0.14} {'loss': 0.7821, 'learning_rate': 1.9786887276426143e-05, 'epoch': 0.14} {'loss': 0.9551, 'learning_rate': 1.978682004974303e-05, 'epoch': 0.14} {'loss': 0.8574, 'learning_rate': 1.978675281257246e-05, 'epoch': 0.14} {'loss': 0.9908, 'learning_rate': 1.97866855649145e-05, 'epoch': 0.14} {'loss': 0.648, 'learning_rate': 1.978661830676922e-05, 'epoch': 0.14} {'loss': 0.9326, 'learning_rate': 1.97865510381367e-05, 'epoch': 0.14} {'loss': 1.0244, 'learning_rate': 1.9786483759017006e-05, 'epoch': 0.14} {'loss': 0.783, 'learning_rate': 1.9786416469410214e-05, 'epoch': 0.14} {'loss': 0.903, 'learning_rate': 1.978634916931639e-05, 'epoch': 0.14} {'loss': 0.9534, 'learning_rate': 1.978628185873561e-05, 'epoch': 0.14} {'loss': 1.0029, 'learning_rate': 1.9786214537667945e-05, 'epoch': 0.14} {'loss': 0.8729, 'learning_rate': 1.978614720611347e-05, 'epoch': 0.14} {'loss': 0.947, 'learning_rate': 1.9786079864072254e-05, 'epoch': 0.14} {'loss': 0.7648, 'learning_rate': 1.978601251154437e-05, 'epoch': 0.14} {'loss': 0.8721, 'learning_rate': 1.978594514852989e-05, 'epoch': 0.14} {'loss': 0.8745, 'learning_rate': 1.978587777502889e-05, 'epoch': 0.14} {'loss': 0.8052, 'learning_rate': 1.9785810391041434e-05, 'epoch': 0.14} {'loss': 1.0788, 'learning_rate': 1.97857429965676e-05, 'epoch': 0.14} {'loss': 0.7896, 'learning_rate': 1.978567559160746e-05, 'epoch': 0.14} {'loss': 0.9306, 'learning_rate': 1.9785608176161085e-05, 'epoch': 0.14} {'loss': 0.7864, 'learning_rate': 1.978554075022855e-05, 'epoch': 0.14} {'loss': 0.9083, 'learning_rate': 1.978547331380992e-05, 'epoch': 0.14} {'loss': 1.0345, 'learning_rate': 1.9785405866905278e-05, 'epoch': 0.14} {'loss': 0.8757, 'learning_rate': 1.9785338409514683e-05, 'epoch': 0.14} {'loss': 0.8924, 'learning_rate': 1.978527094163822e-05, 'epoch': 0.14} {'loss': 0.8997, 'learning_rate': 1.9785203463275956e-05, 'epoch': 0.14} {'loss': 1.1124, 'learning_rate': 1.9785135974427963e-05, 'epoch': 0.14} {'loss': 0.9698, 'learning_rate': 1.9785068475094313e-05, 'epoch': 0.14} {'loss': 0.8663, 'learning_rate': 1.978500096527508e-05, 'epoch': 0.14} {'loss': 1.078, 'learning_rate': 1.9784933444970332e-05, 'epoch': 0.14} {'loss': 0.9517, 'learning_rate': 1.9784865914180144e-05, 'epoch': 0.14} {'loss': 0.952, 'learning_rate': 1.9784798372904593e-05, 'epoch': 0.14} {'loss': 0.8467, 'learning_rate': 1.9784730821143747e-05, 'epoch': 0.14} {'loss': 0.8918, 'learning_rate': 1.978466325889768e-05, 'epoch': 0.14} {'loss': 0.9416, 'learning_rate': 1.978459568616646e-05, 'epoch': 0.14} {'loss': 0.9966, 'learning_rate': 1.9784528102950163e-05, 'epoch': 0.14} {'loss': 0.9559, 'learning_rate': 1.9784460509248863e-05, 'epoch': 0.14} {'loss': 0.9423, 'learning_rate': 1.978439290506263e-05, 'epoch': 0.14} {'loss': 0.6801, 'learning_rate': 1.9784325290391536e-05, 'epoch': 0.14} {'loss': 1.0312, 'learning_rate': 1.9784257665235654e-05, 'epoch': 0.14} {'loss': 1.0362, 'learning_rate': 1.978419002959506e-05, 'epoch': 0.14} {'loss': 0.9387, 'learning_rate': 1.978412238346982e-05, 'epoch': 0.14} {'loss': 0.9312, 'learning_rate': 1.978405472686001e-05, 'epoch': 0.14} {'loss': 1.1485, 'learning_rate': 1.9783987059765703e-05, 'epoch': 0.14} {'loss': 0.8846, 'learning_rate': 1.978391938218697e-05, 'epoch': 0.14} {'loss': 0.8569, 'learning_rate': 1.9783851694123884e-05, 'epoch': 0.14} {'loss': 0.8012, 'learning_rate': 1.978378399557652e-05, 'epoch': 0.14} {'loss': 0.899, 'learning_rate': 1.9783716286544946e-05, 'epoch': 0.14} {'loss': 0.7818, 'learning_rate': 1.9783648567029238e-05, 'epoch': 0.14} {'loss': 0.8862, 'learning_rate': 1.978358083702947e-05, 'epoch': 0.14} {'loss': 0.8905, 'learning_rate': 1.978351309654571e-05, 'epoch': 0.14} {'loss': 0.9392, 'learning_rate': 1.9783445345578032e-05, 'epoch': 0.14} {'loss': 0.8658, 'learning_rate': 1.978337758412651e-05, 'epoch': 0.14} {'loss': 1.1274, 'learning_rate': 1.9783309812191215e-05, 'epoch': 0.14} {'loss': 0.8323, 'learning_rate': 1.978324202977222e-05, 'epoch': 0.14} {'loss': 1.148, 'learning_rate': 1.97831742368696e-05, 'epoch': 0.14} {'loss': 0.8196, 'learning_rate': 1.978310643348343e-05, 'epoch': 0.14} {'loss': 0.7644, 'learning_rate': 1.978303861961377e-05, 'epoch': 0.14} {'loss': 1.0118, 'learning_rate': 1.9782970795260706e-05, 'epoch': 0.14} {'loss': 0.7205, 'learning_rate': 1.9782902960424305e-05, 'epoch': 0.14} {'loss': 0.9557, 'learning_rate': 1.978283511510464e-05, 'epoch': 0.14} {'loss': 0.9603, 'learning_rate': 1.9782767259301786e-05, 'epoch': 0.14} {'loss': 0.9026, 'learning_rate': 1.9782699393015813e-05, 'epoch': 0.14} {'loss': 0.8529, 'learning_rate': 1.9782631516246792e-05, 'epoch': 0.14} {'loss': 0.9897, 'learning_rate': 1.97825636289948e-05, 'epoch': 0.14} {'loss': 1.0075, 'learning_rate': 1.9782495731259907e-05, 'epoch': 0.14} {'loss': 1.0994, 'learning_rate': 1.9782427823042192e-05, 'epoch': 0.14} {'loss': 0.9933, 'learning_rate': 1.978235990434172e-05, 'epoch': 0.14} {'loss': 1.0032, 'learning_rate': 1.9782291975158563e-05, 'epoch': 0.14} {'loss': 0.9169, 'learning_rate': 1.9782224035492802e-05, 'epoch': 0.14} {'loss': 0.8183, 'learning_rate': 1.97821560853445e-05, 'epoch': 0.14} {'loss': 0.9682, 'learning_rate': 1.978208812471374e-05, 'epoch': 0.14} {'loss': 0.9809, 'learning_rate': 1.9782020153600588e-05, 'epoch': 0.14} {'loss': 0.8929, 'learning_rate': 1.9781952172005117e-05, 'epoch': 0.14} {'loss': 0.8401, 'learning_rate': 1.9781884179927403e-05, 'epoch': 0.14} {'loss': 0.9381, 'learning_rate': 1.9781816177367515e-05, 'epoch': 0.14} {'loss': 0.8423, 'learning_rate': 1.978174816432553e-05, 'epoch': 0.14} {'loss': 1.025, 'learning_rate': 1.978168014080152e-05, 'epoch': 0.14} {'loss': 0.8561, 'learning_rate': 1.9781612106795554e-05, 'epoch': 0.14} {'loss': 0.9268, 'learning_rate': 1.978154406230771e-05, 'epoch': 0.14} {'loss': 0.9528, 'learning_rate': 1.9781476007338058e-05, 'epoch': 0.14} {'loss': 0.6705, 'learning_rate': 1.978140794188667e-05, 'epoch': 0.14} {'loss': 0.9155, 'learning_rate': 1.9781339865953623e-05, 'epoch': 0.14} {'loss': 0.8231, 'learning_rate': 1.9781271779538987e-05, 'epoch': 0.14} {'loss': 1.0762, 'learning_rate': 1.9781203682642837e-05, 'epoch': 0.14} {'loss': 0.8715, 'learning_rate': 1.9781135575265243e-05, 'epoch': 0.14} {'loss': 0.8303, 'learning_rate': 1.9781067457406278e-05, 'epoch': 0.14} {'loss': 0.8802, 'learning_rate': 1.9780999329066018e-05, 'epoch': 0.14} {'loss': 0.865, 'learning_rate': 1.9780931190244536e-05, 'epoch': 0.14} {'loss': 0.9839, 'learning_rate': 1.9780863040941898e-05, 'epoch': 0.14} {'loss': 0.8221, 'learning_rate': 1.9780794881158186e-05, 'epoch': 0.14} {'loss': 1.1171, 'learning_rate': 1.978072671089347e-05, 'epoch': 0.14} {'loss': 0.9312, 'learning_rate': 1.9780658530147822e-05, 'epoch': 0.14} {'loss': 0.8858, 'learning_rate': 1.9780590338921315e-05, 'epoch': 0.14} {'loss': 0.9049, 'learning_rate': 1.9780522137214023e-05, 'epoch': 0.14} {'loss': 0.9758, 'learning_rate': 1.978045392502602e-05, 'epoch': 0.14} {'loss': 0.9645, 'learning_rate': 1.9780385702357375e-05, 'epoch': 0.14} {'loss': 0.9429, 'learning_rate': 1.978031746920817e-05, 'epoch': 0.14} {'loss': 1.0318, 'learning_rate': 1.978024922557847e-05, 'epoch': 0.14} {'loss': 1.028, 'learning_rate': 1.9780180971468344e-05, 'epoch': 0.14} {'loss': 0.9209, 'learning_rate': 1.9780112706877875e-05, 'epoch': 0.14} {'loss': 0.8771, 'learning_rate': 1.9780044431807135e-05, 'epoch': 0.14} {'loss': 0.8457, 'learning_rate': 1.977997614625619e-05, 'epoch': 0.14} {'loss': 1.0619, 'learning_rate': 1.9779907850225122e-05, 'epoch': 0.14} {'loss': 0.8782, 'learning_rate': 1.9779839543714e-05, 'epoch': 0.14} {'loss': 0.8996, 'learning_rate': 1.9779771226722894e-05, 'epoch': 0.14} {'loss': 0.7941, 'learning_rate': 1.9779702899251883e-05, 'epoch': 0.14} {'loss': 1.1202, 'learning_rate': 1.977963456130104e-05, 'epoch': 0.14} {'loss': 0.9465, 'learning_rate': 1.977956621287043e-05, 'epoch': 0.14} {'loss': 0.8144, 'learning_rate': 1.9779497853960136e-05, 'epoch': 0.14} {'loss': 0.8532, 'learning_rate': 1.9779429484570227e-05, 'epoch': 0.14} {'loss': 1.0095, 'learning_rate': 1.9779361104700776e-05, 'epoch': 0.14} {'loss': 0.8184, 'learning_rate': 1.9779292714351857e-05, 'epoch': 0.14} {'loss': 0.9667, 'learning_rate': 1.9779224313523544e-05, 'epoch': 0.14} {'loss': 0.9923, 'learning_rate': 1.9779155902215906e-05, 'epoch': 0.14} {'loss': 1.0607, 'learning_rate': 1.9779087480429027e-05, 'epoch': 0.14} {'loss': 1.0088, 'learning_rate': 1.9779019048162968e-05, 'epoch': 0.14} {'loss': 0.8833, 'learning_rate': 1.9778950605417807e-05, 'epoch': 0.14} {'loss': 0.9764, 'learning_rate': 1.977888215219362e-05, 'epoch': 0.14} {'loss': 0.9692, 'learning_rate': 1.977881368849048e-05, 'epoch': 0.14} {'loss': 0.8151, 'learning_rate': 1.9778745214308454e-05, 'epoch': 0.14} {'loss': 1.0649, 'learning_rate': 1.977867672964762e-05, 'epoch': 0.14} {'loss': 0.8062, 'learning_rate': 1.9778608234508054e-05, 'epoch': 0.14} {'loss': 0.905, 'learning_rate': 1.9778539728889826e-05, 'epoch': 0.14} {'loss': 0.9306, 'learning_rate': 1.977847121279301e-05, 'epoch': 0.14} {'loss': 0.9645, 'learning_rate': 1.977840268621768e-05, 'epoch': 0.14} {'loss': 0.8682, 'learning_rate': 1.9778334149163908e-05, 'epoch': 0.14} {'loss': 0.9272, 'learning_rate': 1.977826560163177e-05, 'epoch': 0.14} {'loss': 0.9801, 'learning_rate': 1.9778197043621334e-05, 'epoch': 0.14} {'loss': 0.9753, 'learning_rate': 1.9778128475132682e-05, 'epoch': 0.14} {'loss': 1.0044, 'learning_rate': 1.977805989616588e-05, 'epoch': 0.14} {'loss': 1.0545, 'learning_rate': 1.9777991306721006e-05, 'epoch': 0.14} {'loss': 0.8847, 'learning_rate': 1.9777922706798128e-05, 'epoch': 0.14} {'loss': 0.9782, 'learning_rate': 1.977785409639733e-05, 'epoch': 0.14} {'loss': 1.1337, 'learning_rate': 1.9777785475518674e-05, 'epoch': 0.14} {'loss': 0.861, 'learning_rate': 1.977771684416224e-05, 'epoch': 0.14} {'loss': 0.9607, 'learning_rate': 1.97776482023281e-05, 'epoch': 0.14} {'loss': 0.9268, 'learning_rate': 1.9777579550016326e-05, 'epoch': 0.14} {'loss': 0.8715, 'learning_rate': 1.9777510887226994e-05, 'epoch': 0.14} {'loss': 0.9558, 'learning_rate': 1.9777442213960177e-05, 'epoch': 0.14} {'loss': 0.9466, 'learning_rate': 1.9777373530215948e-05, 'epoch': 0.14} {'loss': 0.7377, 'learning_rate': 1.977730483599438e-05, 'epoch': 0.14} {'loss': 0.8406, 'learning_rate': 1.9777236131295544e-05, 'epoch': 0.14} {'loss': 0.8104, 'learning_rate': 1.9777167416119525e-05, 'epoch': 0.14} {'loss': 1.0443, 'learning_rate': 1.9777098690466383e-05, 'epoch': 0.14} {'loss': 1.1567, 'learning_rate': 1.97770299543362e-05, 'epoch': 0.14} {'loss': 0.9668, 'learning_rate': 1.9776961207729047e-05, 'epoch': 0.14} {'loss': 0.8535, 'learning_rate': 1.9776892450644993e-05, 'epoch': 0.14} {'loss': 0.8956, 'learning_rate': 1.977682368308412e-05, 'epoch': 0.14} {'loss': 0.9081, 'learning_rate': 1.97767549050465e-05, 'epoch': 0.14} {'loss': 1.0133, 'learning_rate': 1.9776686116532203e-05, 'epoch': 0.14} {'loss': 0.7629, 'learning_rate': 1.97766173175413e-05, 'epoch': 0.14} {'loss': 0.869, 'learning_rate': 1.9776548508073876e-05, 'epoch': 0.14} {'loss': 0.8464, 'learning_rate': 1.9776479688129995e-05, 'epoch': 0.14} {'loss': 0.901, 'learning_rate': 1.9776410857709733e-05, 'epoch': 0.14} {'loss': 0.767, 'learning_rate': 1.9776342016813168e-05, 'epoch': 0.14} {'loss': 0.821, 'learning_rate': 1.9776273165440366e-05, 'epoch': 0.14} {'loss': 0.971, 'learning_rate': 1.9776204303591404e-05, 'epoch': 0.14} {'loss': 0.8176, 'learning_rate': 1.9776135431266362e-05, 'epoch': 0.14} {'loss': 1.013, 'learning_rate': 1.97760665484653e-05, 'epoch': 0.14} {'loss': 0.6198, 'learning_rate': 1.977599765518831e-05, 'epoch': 0.14} {'loss': 1.0093, 'learning_rate': 1.9775928751435448e-05, 'epoch': 0.14} {'loss': 0.9133, 'learning_rate': 1.9775859837206802e-05, 'epoch': 0.14} {'loss': 0.8745, 'learning_rate': 1.977579091250244e-05, 'epoch': 0.14} {'loss': 0.9406, 'learning_rate': 1.9775721977322432e-05, 'epoch': 0.14} {'loss': 0.8703, 'learning_rate': 1.9775653031666858e-05, 'epoch': 0.14} {'loss': 0.9833, 'learning_rate': 1.9775584075535786e-05, 'epoch': 0.14} {'loss': 0.947, 'learning_rate': 1.9775515108929296e-05, 'epoch': 0.14} {'loss': 0.8598, 'learning_rate': 1.977544613184746e-05, 'epoch': 0.14} {'loss': 1.0577, 'learning_rate': 1.9775377144290352e-05, 'epoch': 0.14} {'loss': 0.9781, 'learning_rate': 1.9775308146258042e-05, 'epoch': 0.14} {'loss': 1.031, 'learning_rate': 1.9775239137750607e-05, 'epoch': 0.14} {'loss': 1.0194, 'learning_rate': 1.9775170118768122e-05, 'epoch': 0.14} {'loss': 0.9968, 'learning_rate': 1.9775101089310662e-05, 'epoch': 0.14} {'loss': 0.9018, 'learning_rate': 1.97750320493783e-05, 'epoch': 0.14} {'loss': 0.952, 'learning_rate': 1.9774962998971104e-05, 'epoch': 0.14} {'loss': 0.997, 'learning_rate': 1.9774893938089155e-05, 'epoch': 0.14} {'loss': 1.0373, 'learning_rate': 1.9774824866732526e-05, 'epoch': 0.14} {'loss': 0.7631, 'learning_rate': 1.977475578490129e-05, 'epoch': 0.14} {'loss': 0.8479, 'learning_rate': 1.977468669259552e-05, 'epoch': 0.14} {'loss': 0.8296, 'learning_rate': 1.977461758981529e-05, 'epoch': 0.14} {'loss': 0.9246, 'learning_rate': 1.9774548476560675e-05, 'epoch': 0.14} {'loss': 0.8979, 'learning_rate': 1.977447935283175e-05, 'epoch': 0.14} {'loss': 0.7657, 'learning_rate': 1.977441021862859e-05, 'epoch': 0.14} {'loss': 0.8672, 'learning_rate': 1.9774341073951265e-05, 'epoch': 0.14} {'loss': 0.8081, 'learning_rate': 1.9774271918799852e-05, 'epoch': 0.14} {'loss': 0.8888, 'learning_rate': 1.9774202753174422e-05, 'epoch': 0.14} {'loss': 0.9003, 'learning_rate': 1.9774133577075058e-05, 'epoch': 0.14} {'loss': 0.8586, 'learning_rate': 1.9774064390501822e-05, 'epoch': 0.14} {'loss': 0.9397, 'learning_rate': 1.9773995193454794e-05, 'epoch': 0.14} {'loss': 1.037, 'learning_rate': 1.977392598593405e-05, 'epoch': 0.14} {'loss': 1.0675, 'learning_rate': 1.9773856767939664e-05, 'epoch': 0.14} {'loss': 0.8368, 'learning_rate': 1.9773787539471704e-05, 'epoch': 0.14} {'loss': 0.9478, 'learning_rate': 1.977371830053025e-05, 'epoch': 0.14} {'loss': 1.1523, 'learning_rate': 1.9773649051115376e-05, 'epoch': 0.14} {'loss': 0.8805, 'learning_rate': 1.9773579791227153e-05, 'epoch': 0.14} {'loss': 0.9678, 'learning_rate': 1.977351052086566e-05, 'epoch': 0.14} {'loss': 0.815, 'learning_rate': 1.9773441240030965e-05, 'epoch': 0.14} {'loss': 0.8824, 'learning_rate': 1.977337194872315e-05, 'epoch': 0.14} {'loss': 0.8949, 'learning_rate': 1.977330264694228e-05, 'epoch': 0.14} {'loss': 0.882, 'learning_rate': 1.9773233334688436e-05, 'epoch': 0.14} {'loss': 1.0021, 'learning_rate': 1.9773164011961688e-05, 'epoch': 0.14} {'loss': 0.9557, 'learning_rate': 1.9773094678762116e-05, 'epoch': 0.14} {'loss': 0.7862, 'learning_rate': 1.9773025335089792e-05, 'epoch': 0.14} {'loss': 1.1032, 'learning_rate': 1.977295598094479e-05, 'epoch': 0.14} {'loss': 0.8506, 'learning_rate': 1.977288661632718e-05, 'epoch': 0.14} {'loss': 1.0185, 'learning_rate': 1.9772817241237038e-05, 'epoch': 0.14} {'loss': 0.9354, 'learning_rate': 1.9772747855674445e-05, 'epoch': 0.14} {'loss': 0.85, 'learning_rate': 1.977267845963947e-05, 'epoch': 0.14} {'loss': 0.8379, 'learning_rate': 1.9772609053132187e-05, 'epoch': 0.14} {'loss': 0.9112, 'learning_rate': 1.977253963615267e-05, 'epoch': 0.14} {'loss': 0.9426, 'learning_rate': 1.9772470208700996e-05, 'epoch': 0.14} {'loss': 0.9662, 'learning_rate': 1.9772400770777238e-05, 'epoch': 0.14} {'loss': 0.7196, 'learning_rate': 1.977233132238147e-05, 'epoch': 0.14} {'loss': 0.8763, 'learning_rate': 1.977226186351377e-05, 'epoch': 0.14} {'loss': 0.8763, 'learning_rate': 1.9772192394174207e-05, 'epoch': 0.14} {'loss': 0.8684, 'learning_rate': 1.9772122914362858e-05, 'epoch': 0.14} {'loss': 0.7368, 'learning_rate': 1.9772053424079796e-05, 'epoch': 0.14} {'loss': 0.7653, 'learning_rate': 1.9771983923325096e-05, 'epoch': 0.14} {'loss': 0.99, 'learning_rate': 1.9771914412098837e-05, 'epoch': 0.14} {'loss': 0.9606, 'learning_rate': 1.9771844890401088e-05, 'epoch': 0.14} {'loss': 0.9112, 'learning_rate': 1.9771775358231925e-05, 'epoch': 0.14} {'loss': 0.9722, 'learning_rate': 1.9771705815591426e-05, 'epoch': 0.14} {'loss': 0.8189, 'learning_rate': 1.9771636262479658e-05, 'epoch': 0.14} {'loss': 0.9919, 'learning_rate': 1.97715666988967e-05, 'epoch': 0.14} {'loss': 0.7695, 'learning_rate': 1.9771497124842628e-05, 'epoch': 0.14} {'loss': 0.9735, 'learning_rate': 1.9771427540317515e-05, 'epoch': 0.14} {'loss': 0.8712, 'learning_rate': 1.9771357945321435e-05, 'epoch': 0.14} {'loss': 0.9558, 'learning_rate': 1.9771288339854462e-05, 'epoch': 0.14} {'loss': 1.0839, 'learning_rate': 1.9771218723916672e-05, 'epoch': 0.14} {'loss': 0.8632, 'learning_rate': 1.9771149097508138e-05, 'epoch': 0.14} {'loss': 1.0262, 'learning_rate': 1.9771079460628938e-05, 'epoch': 0.14} {'loss': 0.89, 'learning_rate': 1.9771009813279144e-05, 'epoch': 0.14} {'loss': 1.0355, 'learning_rate': 1.977094015545883e-05, 'epoch': 0.14} {'loss': 0.9104, 'learning_rate': 1.9770870487168074e-05, 'epoch': 0.14} {'loss': 1.0256, 'learning_rate': 1.9770800808406948e-05, 'epoch': 0.14} {'loss': 0.864, 'learning_rate': 1.9770731119175525e-05, 'epoch': 0.14} {'loss': 0.7882, 'learning_rate': 1.9770661419473884e-05, 'epoch': 0.14} {'loss': 0.8548, 'learning_rate': 1.97705917093021e-05, 'epoch': 0.14} {'loss': 1.0081, 'learning_rate': 1.9770521988660238e-05, 'epoch': 0.14} {'loss': 0.8532, 'learning_rate': 1.9770452257548386e-05, 'epoch': 0.14} {'loss': 0.956, 'learning_rate': 1.977038251596661e-05, 'epoch': 0.14} {'loss': 1.0356, 'learning_rate': 1.9770312763914985e-05, 'epoch': 0.14} {'loss': 0.9435, 'learning_rate': 1.977024300139359e-05, 'epoch': 0.14} {'loss': 1.0194, 'learning_rate': 1.9770173228402497e-05, 'epoch': 0.14} {'loss': 0.719, 'learning_rate': 1.9770103444941786e-05, 'epoch': 0.14} {'loss': 0.8859, 'learning_rate': 1.9770033651011525e-05, 'epoch': 0.14} {'loss': 0.9748, 'learning_rate': 1.976996384661179e-05, 'epoch': 0.14} {'loss': 1.1387, 'learning_rate': 1.9769894031742653e-05, 'epoch': 0.14} {'loss': 0.6946, 'learning_rate': 1.97698242064042e-05, 'epoch': 0.14} {'loss': 0.7835, 'learning_rate': 1.9769754370596494e-05, 'epoch': 0.14} {'loss': 0.8619, 'learning_rate': 1.9769684524319616e-05, 'epoch': 0.14} {'loss': 1.169, 'learning_rate': 1.976961466757364e-05, 'epoch': 0.14} {'loss': 0.731, 'learning_rate': 1.9769544800358638e-05, 'epoch': 0.14} {'loss': 1.0275, 'learning_rate': 1.976947492267469e-05, 'epoch': 0.14} {'loss': 0.8309, 'learning_rate': 1.9769405034521866e-05, 'epoch': 0.14} {'loss': 0.9528, 'learning_rate': 1.9769335135900243e-05, 'epoch': 0.14} {'loss': 0.7929, 'learning_rate': 1.9769265226809895e-05, 'epoch': 0.14} {'loss': 1.0903, 'learning_rate': 1.97691953072509e-05, 'epoch': 0.14} {'loss': 1.0536, 'learning_rate': 1.9769125377223326e-05, 'epoch': 0.14} {'loss': 0.9109, 'learning_rate': 1.9769055436727257e-05, 'epoch': 0.14} {'loss': 0.8427, 'learning_rate': 1.976898548576276e-05, 'epoch': 0.14} {'loss': 0.9114, 'learning_rate': 1.9768915524329916e-05, 'epoch': 0.14} {'loss': 0.8928, 'learning_rate': 1.9768845552428796e-05, 'epoch': 0.14} {'loss': 0.91, 'learning_rate': 1.9768775570059477e-05, 'epoch': 0.14} {'loss': 0.9196, 'learning_rate': 1.9768705577222033e-05, 'epoch': 0.14} {'loss': 1.0279, 'learning_rate': 1.9768635573916536e-05, 'epoch': 0.14} {'loss': 0.8535, 'learning_rate': 1.9768565560143068e-05, 'epoch': 0.14} {'loss': 0.8747, 'learning_rate': 1.97684955359017e-05, 'epoch': 0.14} {'loss': 0.8771, 'learning_rate': 1.976842550119251e-05, 'epoch': 0.14} {'loss': 0.9134, 'learning_rate': 1.9768355456015565e-05, 'epoch': 0.14} {'loss': 0.8244, 'learning_rate': 1.976828540037095e-05, 'epoch': 0.14} {'loss': 0.8376, 'learning_rate': 1.9768215334258733e-05, 'epoch': 0.14} {'loss': 0.9, 'learning_rate': 1.976814525767899e-05, 'epoch': 0.14} {'loss': 0.9577, 'learning_rate': 1.9768075170631802e-05, 'epoch': 0.14} {'loss': 0.9294, 'learning_rate': 1.9768005073117237e-05, 'epoch': 0.14} {'loss': 0.8356, 'learning_rate': 1.9767934965135375e-05, 'epoch': 0.14} {'loss': 0.95, 'learning_rate': 1.9767864846686286e-05, 'epoch': 0.14} {'loss': 0.9381, 'learning_rate': 1.976779471777005e-05, 'epoch': 0.14} {'loss': 0.9061, 'learning_rate': 1.9767724578386744e-05, 'epoch': 0.14} {'loss': 0.9577, 'learning_rate': 1.9767654428536433e-05, 'epoch': 0.14} {'loss': 0.8349, 'learning_rate': 1.97675842682192e-05, 'epoch': 0.14} {'loss': 1.0055, 'learning_rate': 1.9767514097435123e-05, 'epoch': 0.14} {'loss': 1.0498, 'learning_rate': 1.9767443916184267e-05, 'epoch': 0.14} {'loss': 0.895, 'learning_rate': 1.976737372446672e-05, 'epoch': 0.14} {'loss': 0.7609, 'learning_rate': 1.9767303522282546e-05, 'epoch': 0.14} {'loss': 0.7123, 'learning_rate': 1.9767233309631826e-05, 'epoch': 0.14} {'loss': 0.8908, 'learning_rate': 1.9767163086514632e-05, 'epoch': 0.14} {'loss': 1.0224, 'learning_rate': 1.9767092852931045e-05, 'epoch': 0.14} {'loss': 0.8429, 'learning_rate': 1.9767022608881136e-05, 'epoch': 0.14} {'loss': 0.849, 'learning_rate': 1.976695235436498e-05, 'epoch': 0.14} {'loss': 0.8547, 'learning_rate': 1.976688208938265e-05, 'epoch': 0.14} {'loss': 0.821, 'learning_rate': 1.976681181393423e-05, 'epoch': 0.14} {'loss': 1.0012, 'learning_rate': 1.9766741528019784e-05, 'epoch': 0.14} {'loss': 0.8955, 'learning_rate': 1.9766671231639397e-05, 'epoch': 0.14} {'loss': 0.7557, 'learning_rate': 1.9766600924793135e-05, 'epoch': 0.14} {'loss': 0.813, 'learning_rate': 1.9766530607481083e-05, 'epoch': 0.14} {'loss': 0.8257, 'learning_rate': 1.9766460279703312e-05, 'epoch': 0.14} {'loss': 0.8612, 'learning_rate': 1.9766389941459897e-05, 'epoch': 0.14} {'loss': 0.8372, 'learning_rate': 1.9766319592750915e-05, 'epoch': 0.14} {'loss': 0.8972, 'learning_rate': 1.9766249233576435e-05, 'epoch': 0.14} {'loss': 1.0269, 'learning_rate': 1.9766178863936544e-05, 'epoch': 0.14} {'loss': 0.8858, 'learning_rate': 1.9766108483831307e-05, 'epoch': 0.14} {'loss': 0.9362, 'learning_rate': 1.9766038093260805e-05, 'epoch': 0.14} {'loss': 0.9598, 'learning_rate': 1.976596769222511e-05, 'epoch': 0.14} {'loss': 0.9357, 'learning_rate': 1.9765897280724298e-05, 'epoch': 0.14} {'loss': 0.9746, 'learning_rate': 1.976582685875845e-05, 'epoch': 0.14} {'loss': 0.8068, 'learning_rate': 1.9765756426327633e-05, 'epoch': 0.14} {'loss': 0.9257, 'learning_rate': 1.976568598343193e-05, 'epoch': 0.14} {'loss': 0.9513, 'learning_rate': 1.976561553007141e-05, 'epoch': 0.14} {'loss': 0.8715, 'learning_rate': 1.976554506624615e-05, 'epoch': 0.14} {'loss': 0.8923, 'learning_rate': 1.976547459195623e-05, 'epoch': 0.14} {'loss': 0.9575, 'learning_rate': 1.9765404107201723e-05, 'epoch': 0.14} {'loss': 0.8387, 'learning_rate': 1.9765333611982706e-05, 'epoch': 0.14} {'loss': 1.0502, 'learning_rate': 1.9765263106299248e-05, 'epoch': 0.14} {'loss': 0.875, 'learning_rate': 1.9765192590151436e-05, 'epoch': 0.14} {'loss': 0.8455, 'learning_rate': 1.976512206353933e-05, 'epoch': 0.14} {'loss': 0.8981, 'learning_rate': 1.976505152646302e-05, 'epoch': 0.14} {'loss': 0.8791, 'learning_rate': 1.9764980978922574e-05, 'epoch': 0.14} {'loss': 0.904, 'learning_rate': 1.976491042091807e-05, 'epoch': 0.14} {'loss': 0.9287, 'learning_rate': 1.9764839852449585e-05, 'epoch': 0.14} {'loss': 0.9333, 'learning_rate': 1.976476927351719e-05, 'epoch': 0.14} {'loss': 0.9624, 'learning_rate': 1.9764698684120965e-05, 'epoch': 0.14} {'loss': 1.1072, 'learning_rate': 1.9764628084260985e-05, 'epoch': 0.14} {'loss': 0.9784, 'learning_rate': 1.976455747393732e-05, 'epoch': 0.14} {'loss': 1.0567, 'learning_rate': 1.9764486853150052e-05, 'epoch': 0.14} {'loss': 0.9579, 'learning_rate': 1.9764416221899258e-05, 'epoch': 0.14} {'loss': 1.0385, 'learning_rate': 1.9764345580185012e-05, 'epoch': 0.14} {'loss': 1.0034, 'learning_rate': 1.9764274928007385e-05, 'epoch': 0.14} {'loss': 0.8813, 'learning_rate': 1.9764204265366455e-05, 'epoch': 0.14} {'loss': 0.7974, 'learning_rate': 1.9764133592262302e-05, 'epoch': 0.14} {'loss': 1.0675, 'learning_rate': 1.9764062908694996e-05, 'epoch': 0.14} {'loss': 1.0731, 'learning_rate': 1.9763992214664614e-05, 'epoch': 0.14} {'loss': 0.8978, 'learning_rate': 1.976392151017124e-05, 'epoch': 0.14} {'loss': 1.0056, 'learning_rate': 1.9763850795214936e-05, 'epoch': 0.14} {'loss': 0.7432, 'learning_rate': 1.9763780069795787e-05, 'epoch': 0.14} {'loss': 0.8521, 'learning_rate': 1.976370933391387e-05, 'epoch': 0.14} {'loss': 0.8773, 'learning_rate': 1.9763638587569255e-05, 'epoch': 0.14} {'loss': 0.8495, 'learning_rate': 1.9763567830762015e-05, 'epoch': 0.14} {'loss': 0.9384, 'learning_rate': 1.9763497063492238e-05, 'epoch': 0.14} {'loss': 0.8643, 'learning_rate': 1.9763426285759988e-05, 'epoch': 0.14} {'loss': 1.1409, 'learning_rate': 1.9763355497565346e-05, 'epoch': 0.14} {'loss': 0.8665, 'learning_rate': 1.976328469890839e-05, 'epoch': 0.14} {'loss': 0.9313, 'learning_rate': 1.976321388978919e-05, 'epoch': 0.14} {'loss': 0.9405, 'learning_rate': 1.9763143070207825e-05, 'epoch': 0.14} {'loss': 1.0427, 'learning_rate': 1.9763072240164375e-05, 'epoch': 0.14} {'loss': 0.905, 'learning_rate': 1.9763001399658906e-05, 'epoch': 0.14} {'loss': 1.0134, 'learning_rate': 1.976293054869151e-05, 'epoch': 0.14} {'loss': 0.9057, 'learning_rate': 1.976285968726224e-05, 'epoch': 0.14} {'loss': 0.9629, 'learning_rate': 1.976278881537119e-05, 'epoch': 0.14} {'loss': 0.8576, 'learning_rate': 1.9762717933018436e-05, 'epoch': 0.14} {'loss': 1.0168, 'learning_rate': 1.9762647040204044e-05, 'epoch': 0.14} {'loss': 0.85, 'learning_rate': 1.9762576136928094e-05, 'epoch': 0.14} {'loss': 0.9049, 'learning_rate': 1.9762505223190664e-05, 'epoch': 0.14} {'loss': 0.8075, 'learning_rate': 1.9762434298991828e-05, 'epoch': 0.14} {'loss': 0.7893, 'learning_rate': 1.976236336433166e-05, 'epoch': 0.14} {'loss': 1.1202, 'learning_rate': 1.9762292419210243e-05, 'epoch': 0.14} {'loss': 1.0251, 'learning_rate': 1.9762221463627647e-05, 'epoch': 0.14} {'loss': 0.6779, 'learning_rate': 1.9762150497583947e-05, 'epoch': 0.14} {'loss': 0.8393, 'learning_rate': 1.9762079521079224e-05, 'epoch': 0.14} {'loss': 0.9384, 'learning_rate': 1.976200853411355e-05, 'epoch': 0.14} {'loss': 0.9133, 'learning_rate': 1.9761937536687007e-05, 'epoch': 0.14} {'loss': 0.9546, 'learning_rate': 1.9761866528799665e-05, 'epoch': 0.15} {'loss': 0.911, 'learning_rate': 1.97617955104516e-05, 'epoch': 0.15} {'loss': 1.0379, 'learning_rate': 1.976172448164289e-05, 'epoch': 0.15} {'loss': 0.8457, 'learning_rate': 1.9761653442373615e-05, 'epoch': 0.15} {'loss': 0.8056, 'learning_rate': 1.9761582392643842e-05, 'epoch': 0.15} {'loss': 1.1178, 'learning_rate': 1.9761511332453653e-05, 'epoch': 0.15} {'loss': 0.842, 'learning_rate': 1.976144026180313e-05, 'epoch': 0.15} {'loss': 0.9374, 'learning_rate': 1.9761369180692337e-05, 'epoch': 0.15} {'loss': 0.8442, 'learning_rate': 1.9761298089121355e-05, 'epoch': 0.15} {'loss': 0.8693, 'learning_rate': 1.9761226987090266e-05, 'epoch': 0.15} {'loss': 1.0343, 'learning_rate': 1.976115587459914e-05, 'epoch': 0.15} {'loss': 1.0396, 'learning_rate': 1.976108475164805e-05, 'epoch': 0.15} {'loss': 0.8583, 'learning_rate': 1.9761013618237078e-05, 'epoch': 0.15} {'loss': 0.847, 'learning_rate': 1.97609424743663e-05, 'epoch': 0.15} {'loss': 0.9486, 'learning_rate': 1.9760871320035793e-05, 'epoch': 0.15} {'loss': 0.9825, 'learning_rate': 1.976080015524563e-05, 'epoch': 0.15} {'loss': 0.9429, 'learning_rate': 1.976072897999589e-05, 'epoch': 0.15} {'loss': 0.9653, 'learning_rate': 1.9760657794286645e-05, 'epoch': 0.15} {'loss': 1.0364, 'learning_rate': 1.9760586598117977e-05, 'epoch': 0.15} {'loss': 0.8274, 'learning_rate': 1.9760515391489957e-05, 'epoch': 0.15} {'loss': 0.9744, 'learning_rate': 1.976044417440267e-05, 'epoch': 0.15} {'loss': 0.9368, 'learning_rate': 1.9760372946856178e-05, 'epoch': 0.15} {'loss': 0.951, 'learning_rate': 1.976030170885057e-05, 'epoch': 0.15} {'loss': 0.7601, 'learning_rate': 1.9760230460385917e-05, 'epoch': 0.15} {'loss': 1.2262, 'learning_rate': 1.9760159201462296e-05, 'epoch': 0.15} {'loss': 1.0271, 'learning_rate': 1.9760087932079783e-05, 'epoch': 0.15} {'loss': 0.9554, 'learning_rate': 1.9760016652238457e-05, 'epoch': 0.15} {'loss': 1.0768, 'learning_rate': 1.9759945361938388e-05, 'epoch': 0.15} {'loss': 1.0291, 'learning_rate': 1.975987406117966e-05, 'epoch': 0.15} {'loss': 1.0725, 'learning_rate': 1.9759802749962347e-05, 'epoch': 0.15} {'loss': 1.1062, 'learning_rate': 1.975973142828652e-05, 'epoch': 0.15} {'loss': 0.86, 'learning_rate': 1.9759660096152263e-05, 'epoch': 0.15} {'loss': 0.9357, 'learning_rate': 1.975958875355965e-05, 'epoch': 0.15} {'loss': 0.8341, 'learning_rate': 1.9759517400508758e-05, 'epoch': 0.15} {'loss': 1.0554, 'learning_rate': 1.9759446036999658e-05, 'epoch': 0.15} {'loss': 0.9894, 'learning_rate': 1.9759374663032432e-05, 'epoch': 0.15} {'loss': 0.9559, 'learning_rate': 1.9759303278607155e-05, 'epoch': 0.15} {'loss': 1.1061, 'learning_rate': 1.9759231883723908e-05, 'epoch': 0.15} {'loss': 0.9504, 'learning_rate': 1.9759160478382758e-05, 'epoch': 0.15} {'loss': 0.9136, 'learning_rate': 1.9759089062583787e-05, 'epoch': 0.15} {'loss': 0.997, 'learning_rate': 1.9759017636327073e-05, 'epoch': 0.15} {'loss': 0.7999, 'learning_rate': 1.9758946199612693e-05, 'epoch': 0.15} {'loss': 0.8766, 'learning_rate': 1.9758874752440716e-05, 'epoch': 0.15} {'loss': 0.711, 'learning_rate': 1.975880329481123e-05, 'epoch': 0.15} {'loss': 1.0479, 'learning_rate': 1.97587318267243e-05, 'epoch': 0.15} {'loss': 1.093, 'learning_rate': 1.975866034818001e-05, 'epoch': 0.15} {'loss': 0.8252, 'learning_rate': 1.975858885917844e-05, 'epoch': 0.15} {'loss': 0.9563, 'learning_rate': 1.9758517359719653e-05, 'epoch': 0.15} {'loss': 0.9968, 'learning_rate': 1.9758445849803735e-05, 'epoch': 0.15} {'loss': 0.8285, 'learning_rate': 1.9758374329430764e-05, 'epoch': 0.15} {'loss': 0.94, 'learning_rate': 1.9758302798600815e-05, 'epoch': 0.15} {'loss': 0.935, 'learning_rate': 1.9758231257313964e-05, 'epoch': 0.15} {'loss': 0.8563, 'learning_rate': 1.9758159705570284e-05, 'epoch': 0.15} {'loss': 0.9736, 'learning_rate': 1.9758088143369857e-05, 'epoch': 0.15} {'loss': 0.8899, 'learning_rate': 1.9758016570712758e-05, 'epoch': 0.15} {'loss': 0.9647, 'learning_rate': 1.9757944987599064e-05, 'epoch': 0.15} {'loss': 1.0156, 'learning_rate': 1.9757873394028853e-05, 'epoch': 0.15} {'loss': 0.8463, 'learning_rate': 1.9757801790002197e-05, 'epoch': 0.15} {'loss': 0.8264, 'learning_rate': 1.9757730175519177e-05, 'epoch': 0.15} {'loss': 0.932, 'learning_rate': 1.9757658550579866e-05, 'epoch': 0.15} {'loss': 0.9271, 'learning_rate': 1.9757586915184348e-05, 'epoch': 0.15} {'loss': 0.9537, 'learning_rate': 1.9757515269332692e-05, 'epoch': 0.15} {'loss': 0.9738, 'learning_rate': 1.9757443613024977e-05, 'epoch': 0.15} {'loss': 0.9874, 'learning_rate': 1.9757371946261284e-05, 'epoch': 0.15} {'loss': 0.9623, 'learning_rate': 1.9757300269041684e-05, 'epoch': 0.15} {'loss': 0.7739, 'learning_rate': 1.9757228581366255e-05, 'epoch': 0.15} {'loss': 0.9136, 'learning_rate': 1.9757156883235072e-05, 'epoch': 0.15} {'loss': 0.9178, 'learning_rate': 1.9757085174648222e-05, 'epoch': 0.15} {'loss': 1.0882, 'learning_rate': 1.975701345560577e-05, 'epoch': 0.15} {'loss': 1.0077, 'learning_rate': 1.97569417261078e-05, 'epoch': 0.15} {'loss': 1.0767, 'learning_rate': 1.9756869986154384e-05, 'epoch': 0.15} {'loss': 1.0305, 'learning_rate': 1.97567982357456e-05, 'epoch': 0.15} {'loss': 0.9577, 'learning_rate': 1.975672647488153e-05, 'epoch': 0.15} {'loss': 1.0875, 'learning_rate': 1.9756654703562247e-05, 'epoch': 0.15} {'loss': 1.0313, 'learning_rate': 1.9756582921787824e-05, 'epoch': 0.15} {'loss': 0.9833, 'learning_rate': 1.9756511129558344e-05, 'epoch': 0.15} {'loss': 0.8421, 'learning_rate': 1.9756439326873883e-05, 'epoch': 0.15} {'loss': 0.8322, 'learning_rate': 1.9756367513734514e-05, 'epoch': 0.15} {'loss': 0.9183, 'learning_rate': 1.9756295690140316e-05, 'epoch': 0.15} {'loss': 0.8085, 'learning_rate': 1.9756223856091374e-05, 'epoch': 0.15} {'loss': 1.071, 'learning_rate': 1.975615201158775e-05, 'epoch': 0.15} {'loss': 0.9736, 'learning_rate': 1.975608015662953e-05, 'epoch': 0.15} {'loss': 1.0874, 'learning_rate': 1.9756008291216792e-05, 'epoch': 0.15} {'loss': 0.9273, 'learning_rate': 1.975593641534961e-05, 'epoch': 0.15} {'loss': 0.9891, 'learning_rate': 1.9755864529028058e-05, 'epoch': 0.15} {'loss': 0.9063, 'learning_rate': 1.975579263225222e-05, 'epoch': 0.15} {'loss': 1.0442, 'learning_rate': 1.9755720725022167e-05, 'epoch': 0.15} {'loss': 0.8779, 'learning_rate': 1.975564880733798e-05, 'epoch': 0.15} {'loss': 0.9338, 'learning_rate': 1.9755576879199737e-05, 'epoch': 0.15} {'loss': 0.9754, 'learning_rate': 1.9755504940607508e-05, 'epoch': 0.15} {'loss': 0.8976, 'learning_rate': 1.9755432991561378e-05, 'epoch': 0.15} {'loss': 0.9923, 'learning_rate': 1.9755361032061424e-05, 'epoch': 0.15} {'loss': 0.8418, 'learning_rate': 1.9755289062107715e-05, 'epoch': 0.15} {'loss': 0.8684, 'learning_rate': 1.9755217081700336e-05, 'epoch': 0.15} {'loss': 0.8476, 'learning_rate': 1.9755145090839364e-05, 'epoch': 0.15} {'loss': 0.9135, 'learning_rate': 1.9755073089524867e-05, 'epoch': 0.15} {'loss': 0.7929, 'learning_rate': 1.9755001077756936e-05, 'epoch': 0.15} {'loss': 0.7619, 'learning_rate': 1.9754929055535633e-05, 'epoch': 0.15} {'loss': 0.7984, 'learning_rate': 1.975485702286105e-05, 'epoch': 0.15} {'loss': 0.9878, 'learning_rate': 1.9754784979733254e-05, 'epoch': 0.15} {'loss': 0.8038, 'learning_rate': 1.975471292615233e-05, 'epoch': 0.15} {'loss': 1.067, 'learning_rate': 1.9754640862118345e-05, 'epoch': 0.15} {'loss': 0.918, 'learning_rate': 1.9754568787631382e-05, 'epoch': 0.15} {'loss': 0.8679, 'learning_rate': 1.975449670269152e-05, 'epoch': 0.15} {'loss': 1.0466, 'learning_rate': 1.9754424607298836e-05, 'epoch': 0.15} {'loss': 1.0782, 'learning_rate': 1.9754352501453402e-05, 'epoch': 0.15} {'loss': 0.9643, 'learning_rate': 1.97542803851553e-05, 'epoch': 0.15} {'loss': 0.8459, 'learning_rate': 1.975420825840461e-05, 'epoch': 0.15} {'loss': 1.0118, 'learning_rate': 1.9754136121201402e-05, 'epoch': 0.15} {'loss': 0.9711, 'learning_rate': 1.9754063973545758e-05, 'epoch': 0.15} {'loss': 0.9398, 'learning_rate': 1.975399181543775e-05, 'epoch': 0.15} {'loss': 0.8788, 'learning_rate': 1.9753919646877465e-05, 'epoch': 0.15} {'loss': 0.8461, 'learning_rate': 1.9753847467864973e-05, 'epoch': 0.15} {'loss': 0.8997, 'learning_rate': 1.9753775278400352e-05, 'epoch': 0.15} {'loss': 0.9006, 'learning_rate': 1.9753703078483683e-05, 'epoch': 0.15} {'loss': 0.8927, 'learning_rate': 1.9753630868115037e-05, 'epoch': 0.15} {'loss': 0.9221, 'learning_rate': 1.9753558647294496e-05, 'epoch': 0.15} {'loss': 1.0619, 'learning_rate': 1.9753486416022138e-05, 'epoch': 0.15} {'loss': 0.8906, 'learning_rate': 1.975341417429804e-05, 'epoch': 0.15} {'loss': 1.0691, 'learning_rate': 1.9753341922122277e-05, 'epoch': 0.15} {'loss': 0.7603, 'learning_rate': 1.9753269659494928e-05, 'epoch': 0.15} {'loss': 0.8187, 'learning_rate': 1.975319738641607e-05, 'epoch': 0.15} {'loss': 0.7386, 'learning_rate': 1.975312510288578e-05, 'epoch': 0.15} {'loss': 0.8219, 'learning_rate': 1.975305280890414e-05, 'epoch': 0.15} {'loss': 1.154, 'learning_rate': 1.9752980504471218e-05, 'epoch': 0.15} {'loss': 0.9334, 'learning_rate': 1.9752908189587102e-05, 'epoch': 0.15} {'loss': 1.0117, 'learning_rate': 1.975283586425186e-05, 'epoch': 0.15} {'loss': 1.0214, 'learning_rate': 1.9752763528465577e-05, 'epoch': 0.15} {'loss': 0.8907, 'learning_rate': 1.9752691182228327e-05, 'epoch': 0.15} {'loss': 0.9728, 'learning_rate': 1.975261882554019e-05, 'epoch': 0.15} {'loss': 0.9952, 'learning_rate': 1.9752546458401238e-05, 'epoch': 0.15} {'loss': 0.9268, 'learning_rate': 1.9752474080811558e-05, 'epoch': 0.15} {'loss': 0.8756, 'learning_rate': 1.9752401692771216e-05, 'epoch': 0.15} {'loss': 0.9073, 'learning_rate': 1.97523292942803e-05, 'epoch': 0.15} {'loss': 0.8365, 'learning_rate': 1.9752256885338878e-05, 'epoch': 0.15} {'loss': 1.062, 'learning_rate': 1.9752184465947034e-05, 'epoch': 0.15} {'loss': 0.8724, 'learning_rate': 1.9752112036104847e-05, 'epoch': 0.15} {'loss': 0.9015, 'learning_rate': 1.975203959581239e-05, 'epoch': 0.15} {'loss': 0.8482, 'learning_rate': 1.975196714506974e-05, 'epoch': 0.15} {'loss': 1.132, 'learning_rate': 1.975189468387698e-05, 'epoch': 0.15} {'loss': 0.819, 'learning_rate': 1.9751822212234188e-05, 'epoch': 0.15} {'loss': 0.8887, 'learning_rate': 1.975174973014143e-05, 'epoch': 0.15} {'loss': 0.8619, 'learning_rate': 1.97516772375988e-05, 'epoch': 0.15} {'loss': 0.9309, 'learning_rate': 1.9751604734606362e-05, 'epoch': 0.15} {'loss': 0.8374, 'learning_rate': 1.9751532221164202e-05, 'epoch': 0.15} {'loss': 0.9195, 'learning_rate': 1.9751459697272396e-05, 'epoch': 0.15} {'loss': 0.8989, 'learning_rate': 1.9751387162931016e-05, 'epoch': 0.15} {'loss': 0.9891, 'learning_rate': 1.975131461814015e-05, 'epoch': 0.15} {'loss': 0.952, 'learning_rate': 1.975124206289987e-05, 'epoch': 0.15} {'loss': 0.8109, 'learning_rate': 1.975116949721025e-05, 'epoch': 0.15} {'loss': 0.88, 'learning_rate': 1.9751096921071376e-05, 'epoch': 0.15} {'loss': 0.9323, 'learning_rate': 1.9751024334483316e-05, 'epoch': 0.15} {'loss': 0.8823, 'learning_rate': 1.975095173744616e-05, 'epoch': 0.15} {'loss': 0.9576, 'learning_rate': 1.9750879129959974e-05, 'epoch': 0.15} {'loss': 1.0355, 'learning_rate': 1.9750806512024844e-05, 'epoch': 0.15} {'loss': 1.0163, 'learning_rate': 1.9750733883640845e-05, 'epoch': 0.15} {'loss': 0.8974, 'learning_rate': 1.9750661244808053e-05, 'epoch': 0.15} {'loss': 0.8979, 'learning_rate': 1.975058859552655e-05, 'epoch': 0.15} {'loss': 0.8834, 'learning_rate': 1.9750515935796407e-05, 'epoch': 0.15} {'loss': 1.0848, 'learning_rate': 1.975044326561771e-05, 'epoch': 0.15} {'loss': 0.9224, 'learning_rate': 1.975037058499053e-05, 'epoch': 0.15} {'loss': 0.9715, 'learning_rate': 1.975029789391495e-05, 'epoch': 0.15} {'loss': 0.9905, 'learning_rate': 1.9750225192391043e-05, 'epoch': 0.15} {'loss': 0.9031, 'learning_rate': 1.9750152480418895e-05, 'epoch': 0.15} {'loss': 0.8787, 'learning_rate': 1.975007975799857e-05, 'epoch': 0.15} {'loss': 1.0811, 'learning_rate': 1.975000702513016e-05, 'epoch': 0.15} {'loss': 0.8162, 'learning_rate': 1.9749934281813742e-05, 'epoch': 0.15} {'loss': 0.8605, 'learning_rate': 1.9749861528049384e-05, 'epoch': 0.15} {'loss': 0.8823, 'learning_rate': 1.974978876383717e-05, 'epoch': 0.15} {'loss': 0.9624, 'learning_rate': 1.9749715989177178e-05, 'epoch': 0.15} {'loss': 0.8539, 'learning_rate': 1.974964320406948e-05, 'epoch': 0.15} {'loss': 0.8534, 'learning_rate': 1.9749570408514168e-05, 'epoch': 0.15} {'loss': 0.8529, 'learning_rate': 1.9749497602511306e-05, 'epoch': 0.15} {'loss': 0.9616, 'learning_rate': 1.974942478606098e-05, 'epoch': 0.15} {'loss': 0.9516, 'learning_rate': 1.9749351959163264e-05, 'epoch': 0.15} {'loss': 1.0267, 'learning_rate': 1.9749279121818235e-05, 'epoch': 0.15} {'loss': 0.8606, 'learning_rate': 1.974920627402598e-05, 'epoch': 0.15} {'loss': 1.029, 'learning_rate': 1.9749133415786567e-05, 'epoch': 0.15} {'loss': 0.9765, 'learning_rate': 1.9749060547100076e-05, 'epoch': 0.15} {'loss': 0.9068, 'learning_rate': 1.974898766796659e-05, 'epoch': 0.15} {'loss': 1.016, 'learning_rate': 1.974891477838618e-05, 'epoch': 0.15} {'loss': 1.0669, 'learning_rate': 1.974884187835893e-05, 'epoch': 0.15} {'loss': 0.969, 'learning_rate': 1.9748768967884917e-05, 'epoch': 0.15} {'loss': 1.0112, 'learning_rate': 1.9748696046964215e-05, 'epoch': 0.15} {'loss': 0.9809, 'learning_rate': 1.974862311559691e-05, 'epoch': 0.15} {'loss': 1.0035, 'learning_rate': 1.9748550173783072e-05, 'epoch': 0.15} {'loss': 0.916, 'learning_rate': 1.974847722152278e-05, 'epoch': 0.15} {'loss': 0.9466, 'learning_rate': 1.974840425881612e-05, 'epoch': 0.15} {'loss': 0.7945, 'learning_rate': 1.9748331285663166e-05, 'epoch': 0.15} {'loss': 0.9848, 'learning_rate': 1.974825830206399e-05, 'epoch': 0.15} {'loss': 0.9793, 'learning_rate': 1.974818530801868e-05, 'epoch': 0.15} {'loss': 0.98, 'learning_rate': 1.974811230352731e-05, 'epoch': 0.15} {'loss': 0.9327, 'learning_rate': 1.9748039288589954e-05, 'epoch': 0.15} {'loss': 0.8589, 'learning_rate': 1.974796626320669e-05, 'epoch': 0.15} {'loss': 0.8277, 'learning_rate': 1.9747893227377608e-05, 'epoch': 0.15} {'loss': 0.8943, 'learning_rate': 1.974782018110278e-05, 'epoch': 0.15} {'loss': 1.0501, 'learning_rate': 1.9747747124382278e-05, 'epoch': 0.15} {'loss': 0.9152, 'learning_rate': 1.9747674057216184e-05, 'epoch': 0.15} {'loss': 0.9444, 'learning_rate': 1.9747600979604578e-05, 'epoch': 0.15} {'loss': 0.7507, 'learning_rate': 1.974752789154754e-05, 'epoch': 0.15} {'loss': 0.7637, 'learning_rate': 1.974745479304515e-05, 'epoch': 0.15} {'loss': 0.914, 'learning_rate': 1.9747381684097474e-05, 'epoch': 0.15} {'loss': 0.8739, 'learning_rate': 1.9747308564704606e-05, 'epoch': 0.15} {'loss': 0.9543, 'learning_rate': 1.9747235434866612e-05, 'epoch': 0.15} {'loss': 0.9673, 'learning_rate': 1.9747162294583577e-05, 'epoch': 0.15} {'loss': 0.8632, 'learning_rate': 1.974708914385558e-05, 'epoch': 0.15} {'loss': 0.9461, 'learning_rate': 1.9747015982682696e-05, 'epoch': 0.15} {'loss': 1.0724, 'learning_rate': 1.9746942811065005e-05, 'epoch': 0.15} {'loss': 0.9009, 'learning_rate': 1.974686962900258e-05, 'epoch': 0.15} {'loss': 0.8607, 'learning_rate': 1.9746796436495513e-05, 'epoch': 0.15} {'loss': 0.9769, 'learning_rate': 1.9746723233543868e-05, 'epoch': 0.15} {'loss': 0.9556, 'learning_rate': 1.9746650020147734e-05, 'epoch': 0.15} {'loss': 1.0618, 'learning_rate': 1.974657679630718e-05, 'epoch': 0.15} {'loss': 0.8657, 'learning_rate': 1.974650356202229e-05, 'epoch': 0.15} {'loss': 0.7933, 'learning_rate': 1.9746430317293145e-05, 'epoch': 0.15} {'loss': 0.9233, 'learning_rate': 1.9746357062119818e-05, 'epoch': 0.15} {'loss': 0.8943, 'learning_rate': 1.974628379650239e-05, 'epoch': 0.15} {'loss': 0.9744, 'learning_rate': 1.9746210520440937e-05, 'epoch': 0.15} {'loss': 0.8825, 'learning_rate': 1.9746137233935543e-05, 'epoch': 0.15} {'loss': 1.0214, 'learning_rate': 1.974606393698628e-05, 'epoch': 0.15} {'loss': 0.8315, 'learning_rate': 1.9745990629593233e-05, 'epoch': 0.15} {'loss': 0.9186, 'learning_rate': 1.974591731175648e-05, 'epoch': 0.15} {'loss': 1.0186, 'learning_rate': 1.9745843983476092e-05, 'epoch': 0.15} {'loss': 0.8517, 'learning_rate': 1.9745770644752153e-05, 'epoch': 0.15} {'loss': 0.9054, 'learning_rate': 1.9745697295584746e-05, 'epoch': 0.15} {'loss': 0.9762, 'learning_rate': 1.974562393597394e-05, 'epoch': 0.15} {'loss': 0.9087, 'learning_rate': 1.9745550565919818e-05, 'epoch': 0.15} {'loss': 0.8402, 'learning_rate': 1.974547718542246e-05, 'epoch': 0.15} {'loss': 0.9106, 'learning_rate': 1.9745403794481946e-05, 'epoch': 0.15} {'loss': 1.0553, 'learning_rate': 1.974533039309835e-05, 'epoch': 0.15} {'loss': 1.0321, 'learning_rate': 1.974525698127175e-05, 'epoch': 0.15} {'loss': 0.9457, 'learning_rate': 1.974518355900223e-05, 'epoch': 0.15} {'loss': 0.9325, 'learning_rate': 1.974511012628987e-05, 'epoch': 0.15} {'loss': 0.8451, 'learning_rate': 1.974503668313474e-05, 'epoch': 0.15} {'loss': 0.9738, 'learning_rate': 1.9744963229536927e-05, 'epoch': 0.15} {'loss': 0.9409, 'learning_rate': 1.9744889765496503e-05, 'epoch': 0.15} {'loss': 0.7912, 'learning_rate': 1.9744816291013553e-05, 'epoch': 0.15} {'loss': 0.8146, 'learning_rate': 1.9744742806088153e-05, 'epoch': 0.15} {'loss': 1.072, 'learning_rate': 1.974466931072038e-05, 'epoch': 0.15} {'loss': 1.1689, 'learning_rate': 1.9744595804910314e-05, 'epoch': 0.15} {'loss': 1.0108, 'learning_rate': 1.9744522288658034e-05, 'epoch': 0.15} {'loss': 0.9284, 'learning_rate': 1.974444876196362e-05, 'epoch': 0.15} {'loss': 0.8964, 'learning_rate': 1.974437522482715e-05, 'epoch': 0.15} {'loss': 0.9314, 'learning_rate': 1.97443016772487e-05, 'epoch': 0.15} {'loss': 1.0041, 'learning_rate': 1.9744228119228354e-05, 'epoch': 0.15} {'loss': 0.9284, 'learning_rate': 1.9744154550766186e-05, 'epoch': 0.15} {'loss': 0.9208, 'learning_rate': 1.974408097186228e-05, 'epoch': 0.15} {'loss': 0.9073, 'learning_rate': 1.974400738251671e-05, 'epoch': 0.15} {'loss': 1.031, 'learning_rate': 1.9743933782729556e-05, 'epoch': 0.15} {'loss': 0.9608, 'learning_rate': 1.97438601725009e-05, 'epoch': 0.15} {'loss': 0.9972, 'learning_rate': 1.9743786551830815e-05, 'epoch': 0.15} {'loss': 0.8249, 'learning_rate': 1.9743712920719384e-05, 'epoch': 0.15} {'loss': 0.7862, 'learning_rate': 1.9743639279166686e-05, 'epoch': 0.15} {'loss': 1.072, 'learning_rate': 1.97435656271728e-05, 'epoch': 0.15} {'loss': 0.7888, 'learning_rate': 1.97434919647378e-05, 'epoch': 0.15} {'loss': 1.0667, 'learning_rate': 1.9743418291861774e-05, 'epoch': 0.15} {'loss': 0.9405, 'learning_rate': 1.9743344608544795e-05, 'epoch': 0.15} {'loss': 1.0036, 'learning_rate': 1.974327091478694e-05, 'epoch': 0.15} {'loss': 0.8818, 'learning_rate': 1.974319721058829e-05, 'epoch': 0.15} {'loss': 0.9821, 'learning_rate': 1.974312349594893e-05, 'epoch': 0.15} {'loss': 0.7623, 'learning_rate': 1.9743049770868932e-05, 'epoch': 0.15} {'loss': 0.9719, 'learning_rate': 1.9742976035348377e-05, 'epoch': 0.15} {'loss': 0.8903, 'learning_rate': 1.9742902289387342e-05, 'epoch': 0.15} {'loss': 0.7796, 'learning_rate': 1.9742828532985907e-05, 'epoch': 0.15} {'loss': 0.8619, 'learning_rate': 1.9742754766144155e-05, 'epoch': 0.15} {'loss': 0.8829, 'learning_rate': 1.974268098886216e-05, 'epoch': 0.15} {'loss': 0.9495, 'learning_rate': 1.9742607201140003e-05, 'epoch': 0.15} {'loss': 0.962, 'learning_rate': 1.9742533402977764e-05, 'epoch': 0.15} {'loss': 0.9393, 'learning_rate': 1.9742459594375522e-05, 'epoch': 0.15} {'loss': 0.9179, 'learning_rate': 1.974238577533335e-05, 'epoch': 0.15} {'loss': 0.8905, 'learning_rate': 1.9742311945851337e-05, 'epoch': 0.15} {'loss': 0.9149, 'learning_rate': 1.974223810592956e-05, 'epoch': 0.15} {'loss': 1.1315, 'learning_rate': 1.974216425556809e-05, 'epoch': 0.15} {'loss': 0.9425, 'learning_rate': 1.9742090394767015e-05, 'epoch': 0.15} {'loss': 0.9432, 'learning_rate': 1.9742016523526408e-05, 'epoch': 0.15} {'loss': 0.9885, 'learning_rate': 1.9741942641846354e-05, 'epoch': 0.15} {'loss': 0.8876, 'learning_rate': 1.9741868749726928e-05, 'epoch': 0.15} {'loss': 1.0084, 'learning_rate': 1.974179484716821e-05, 'epoch': 0.15} {'loss': 0.8445, 'learning_rate': 1.974172093417028e-05, 'epoch': 0.15} {'loss': 0.9959, 'learning_rate': 1.9741647010733218e-05, 'epoch': 0.15} {'loss': 0.7532, 'learning_rate': 1.97415730768571e-05, 'epoch': 0.15} {'loss': 0.8495, 'learning_rate': 1.9741499132542006e-05, 'epoch': 0.15} {'loss': 0.7258, 'learning_rate': 1.974142517778802e-05, 'epoch': 0.15} {'loss': 0.9069, 'learning_rate': 1.9741351212595217e-05, 'epoch': 0.15} {'loss': 0.766, 'learning_rate': 1.9741277236963675e-05, 'epoch': 0.15} {'loss': 0.9612, 'learning_rate': 1.9741203250893478e-05, 'epoch': 0.15} {'loss': 1.0817, 'learning_rate': 1.9741129254384698e-05, 'epoch': 0.15} {'loss': 0.8861, 'learning_rate': 1.9741055247437423e-05, 'epoch': 0.15} {'loss': 0.9135, 'learning_rate': 1.9740981230051727e-05, 'epoch': 0.15} {'loss': 0.85, 'learning_rate': 1.974090720222769e-05, 'epoch': 0.15} {'loss': 0.8619, 'learning_rate': 1.974083316396539e-05, 'epoch': 0.15} {'loss': 1.0699, 'learning_rate': 1.974075911526491e-05, 'epoch': 0.15} {'loss': 0.8672, 'learning_rate': 1.974068505612633e-05, 'epoch': 0.15} {'loss': 0.7631, 'learning_rate': 1.9740610986549722e-05, 'epoch': 0.15} {'loss': 0.8895, 'learning_rate': 1.9740536906535172e-05, 'epoch': 0.15} {'loss': 0.9547, 'learning_rate': 1.974046281608276e-05, 'epoch': 0.15} {'loss': 1.0554, 'learning_rate': 1.9740388715192563e-05, 'epoch': 0.15} {'loss': 0.9691, 'learning_rate': 1.9740314603864655e-05, 'epoch': 0.15} {'loss': 0.7173, 'learning_rate': 1.9740240482099126e-05, 'epoch': 0.15} {'loss': 0.8645, 'learning_rate': 1.9740166349896047e-05, 'epoch': 0.15} {'loss': 1.014, 'learning_rate': 1.97400922072555e-05, 'epoch': 0.15} {'loss': 0.8391, 'learning_rate': 1.974001805417757e-05, 'epoch': 0.15} {'loss': 1.0218, 'learning_rate': 1.973994389066233e-05, 'epoch': 0.15} {'loss': 0.9965, 'learning_rate': 1.973986971670986e-05, 'epoch': 0.15} {'loss': 0.9692, 'learning_rate': 1.9739795532320238e-05, 'epoch': 0.15} {'loss': 0.7442, 'learning_rate': 1.973972133749355e-05, 'epoch': 0.15} {'loss': 0.6997, 'learning_rate': 1.9739647132229868e-05, 'epoch': 0.15} {'loss': 0.9451, 'learning_rate': 1.9739572916529276e-05, 'epoch': 0.15} {'loss': 0.8186, 'learning_rate': 1.9739498690391853e-05, 'epoch': 0.15} {'loss': 0.9383, 'learning_rate': 1.9739424453817683e-05, 'epoch': 0.15} {'loss': 0.9013, 'learning_rate': 1.9739350206806834e-05, 'epoch': 0.15} {'loss': 0.9721, 'learning_rate': 1.9739275949359393e-05, 'epoch': 0.15} {'loss': 0.8098, 'learning_rate': 1.9739201681475443e-05, 'epoch': 0.15} {'loss': 0.9988, 'learning_rate': 1.9739127403155054e-05, 'epoch': 0.15} {'loss': 0.9479, 'learning_rate': 1.9739053114398315e-05, 'epoch': 0.15} {'loss': 0.9477, 'learning_rate': 1.97389788152053e-05, 'epoch': 0.15} {'loss': 1.0476, 'learning_rate': 1.973890450557609e-05, 'epoch': 0.15} {'loss': 0.9635, 'learning_rate': 1.9738830185510763e-05, 'epoch': 0.15} {'loss': 1.0307, 'learning_rate': 1.9738755855009404e-05, 'epoch': 0.15} {'loss': 0.8575, 'learning_rate': 1.9738681514072088e-05, 'epoch': 0.15} {'loss': 0.966, 'learning_rate': 1.9738607162698895e-05, 'epoch': 0.15} {'loss': 1.0501, 'learning_rate': 1.9738532800889908e-05, 'epoch': 0.15} {'loss': 0.8559, 'learning_rate': 1.97384584286452e-05, 'epoch': 0.15} {'loss': 0.8374, 'learning_rate': 1.9738384045964856e-05, 'epoch': 0.15} {'loss': 0.7968, 'learning_rate': 1.973830965284896e-05, 'epoch': 0.15} {'loss': 1.0348, 'learning_rate': 1.973823524929758e-05, 'epoch': 0.15} {'loss': 0.8381, 'learning_rate': 1.97381608353108e-05, 'epoch': 0.15} {'loss': 0.9971, 'learning_rate': 1.9738086410888708e-05, 'epoch': 0.15} {'loss': 0.7416, 'learning_rate': 1.9738011976031376e-05, 'epoch': 0.15} {'loss': 0.9353, 'learning_rate': 1.9737937530738885e-05, 'epoch': 0.15} {'loss': 1.1224, 'learning_rate': 1.9737863075011315e-05, 'epoch': 0.15} {'loss': 0.8722, 'learning_rate': 1.9737788608848746e-05, 'epoch': 0.15} {'loss': 0.8401, 'learning_rate': 1.9737714132251256e-05, 'epoch': 0.15} {'loss': 1.0342, 'learning_rate': 1.9737639645218927e-05, 'epoch': 0.15} {'loss': 0.8235, 'learning_rate': 1.973756514775184e-05, 'epoch': 0.15} {'loss': 0.8735, 'learning_rate': 1.973749063985007e-05, 'epoch': 0.15} {'loss': 0.931, 'learning_rate': 1.97374161215137e-05, 'epoch': 0.15} {'loss': 1.0124, 'learning_rate': 1.973734159274281e-05, 'epoch': 0.15} {'loss': 0.9536, 'learning_rate': 1.973726705353748e-05, 'epoch': 0.15} {'loss': 0.8122, 'learning_rate': 1.9737192503897792e-05, 'epoch': 0.15} {'loss': 0.6733, 'learning_rate': 1.973711794382382e-05, 'epoch': 0.15} {'loss': 0.9327, 'learning_rate': 1.973704337331565e-05, 'epoch': 0.15} {'loss': 0.8232, 'learning_rate': 1.973696879237336e-05, 'epoch': 0.15} {'loss': 0.8422, 'learning_rate': 1.9736894200997026e-05, 'epoch': 0.15} {'loss': 0.9887, 'learning_rate': 1.9736819599186732e-05, 'epoch': 0.15} {'loss': 0.7966, 'learning_rate': 1.9736744986942557e-05, 'epoch': 0.15} {'loss': 0.7943, 'learning_rate': 1.9736670364264583e-05, 'epoch': 0.15} {'loss': 0.8987, 'learning_rate': 1.9736595731152887e-05, 'epoch': 0.15} {'loss': 0.9108, 'learning_rate': 1.9736521087607548e-05, 'epoch': 0.15} {'loss': 0.8695, 'learning_rate': 1.973644643362865e-05, 'epoch': 0.15} {'loss': 0.8067, 'learning_rate': 1.9736371769216268e-05, 'epoch': 0.15} {'loss': 0.8109, 'learning_rate': 1.9736297094370486e-05, 'epoch': 0.15} {'loss': 1.0691, 'learning_rate': 1.9736222409091387e-05, 'epoch': 0.15} {'loss': 1.076, 'learning_rate': 1.9736147713379043e-05, 'epoch': 0.15} {'loss': 1.015, 'learning_rate': 1.9736073007233538e-05, 'epoch': 0.15} {'loss': 1.1041, 'learning_rate': 1.973599829065495e-05, 'epoch': 0.15} {'loss': 0.8381, 'learning_rate': 1.9735923563643365e-05, 'epoch': 0.15} {'loss': 0.9866, 'learning_rate': 1.973584882619886e-05, 'epoch': 0.15} {'loss': 0.872, 'learning_rate': 1.973577407832151e-05, 'epoch': 0.15} {'loss': 0.9732, 'learning_rate': 1.9735699320011404e-05, 'epoch': 0.15} {'loss': 0.7964, 'learning_rate': 1.9735624551268616e-05, 'epoch': 0.15} {'loss': 0.8179, 'learning_rate': 1.9735549772093227e-05, 'epoch': 0.15} {'loss': 0.8927, 'learning_rate': 1.9735474982485313e-05, 'epoch': 0.15} {'loss': 0.9718, 'learning_rate': 1.9735400182444965e-05, 'epoch': 0.15} {'loss': 0.8639, 'learning_rate': 1.9735325371972254e-05, 'epoch': 0.15} {'loss': 0.6942, 'learning_rate': 1.9735250551067266e-05, 'epoch': 0.15} {'loss': 0.842, 'learning_rate': 1.9735175719730077e-05, 'epoch': 0.15} {'loss': 0.7676, 'learning_rate': 1.973510087796077e-05, 'epoch': 0.15} {'loss': 1.0131, 'learning_rate': 1.973502602575942e-05, 'epoch': 0.15} {'loss': 0.8424, 'learning_rate': 1.9734951163126114e-05, 'epoch': 0.15} {'loss': 0.9257, 'learning_rate': 1.9734876290060928e-05, 'epoch': 0.15} {'loss': 1.0294, 'learning_rate': 1.9734801406563945e-05, 'epoch': 0.15} {'loss': 0.9663, 'learning_rate': 1.9734726512635243e-05, 'epoch': 0.15} {'loss': 1.0196, 'learning_rate': 1.97346516082749e-05, 'epoch': 0.15} {'loss': 0.805, 'learning_rate': 1.9734576693483004e-05, 'epoch': 0.15} {'loss': 0.9368, 'learning_rate': 1.9734501768259627e-05, 'epoch': 0.15} {'loss': 0.9305, 'learning_rate': 1.9734426832604855e-05, 'epoch': 0.15} {'loss': 1.0277, 'learning_rate': 1.9734351886518765e-05, 'epoch': 0.15} {'loss': 0.9365, 'learning_rate': 1.9734276930001437e-05, 'epoch': 0.15} {'loss': 1.0828, 'learning_rate': 1.9734201963052952e-05, 'epoch': 0.15} {'loss': 0.8148, 'learning_rate': 1.9734126985673395e-05, 'epoch': 0.15} {'loss': 0.8077, 'learning_rate': 1.973405199786284e-05, 'epoch': 0.15} {'loss': 0.9562, 'learning_rate': 1.973397699962137e-05, 'epoch': 0.15} {'loss': 0.8135, 'learning_rate': 1.9733901990949066e-05, 'epoch': 0.15} {'loss': 0.8534, 'learning_rate': 1.9733826971846005e-05, 'epoch': 0.15} {'loss': 0.9078, 'learning_rate': 1.973375194231227e-05, 'epoch': 0.15} {'loss': 0.9167, 'learning_rate': 1.9733676902347944e-05, 'epoch': 0.15} {'loss': 0.911, 'learning_rate': 1.9733601851953104e-05, 'epoch': 0.15} {'loss': 0.7968, 'learning_rate': 1.9733526791127832e-05, 'epoch': 0.15} {'loss': 0.8915, 'learning_rate': 1.9733451719872207e-05, 'epoch': 0.15} {'loss': 0.8613, 'learning_rate': 1.973337663818631e-05, 'epoch': 0.15} {'loss': 1.0041, 'learning_rate': 1.9733301546070217e-05, 'epoch': 0.15} {'loss': 0.9293, 'learning_rate': 1.973322644352402e-05, 'epoch': 0.15} {'loss': 0.9247, 'learning_rate': 1.9733151330547786e-05, 'epoch': 0.15} {'loss': 1.0965, 'learning_rate': 1.9733076207141603e-05, 'epoch': 0.15} {'loss': 1.0228, 'learning_rate': 1.9733001073305553e-05, 'epoch': 0.15} {'loss': 0.8773, 'learning_rate': 1.9732925929039713e-05, 'epoch': 0.15} {'loss': 0.9405, 'learning_rate': 1.9732850774344166e-05, 'epoch': 0.15} {'loss': 0.8902, 'learning_rate': 1.9732775609218988e-05, 'epoch': 0.15} {'loss': 0.8491, 'learning_rate': 1.9732700433664265e-05, 'epoch': 0.15} {'loss': 0.8776, 'learning_rate': 1.9732625247680074e-05, 'epoch': 0.15} {'loss': 0.8933, 'learning_rate': 1.9732550051266494e-05, 'epoch': 0.15} {'loss': 1.0635, 'learning_rate': 1.973247484442361e-05, 'epoch': 0.15} {'loss': 0.9391, 'learning_rate': 1.9732399627151503e-05, 'epoch': 0.15} {'loss': 0.9596, 'learning_rate': 1.973232439945025e-05, 'epoch': 0.15} {'loss': 0.9204, 'learning_rate': 1.9732249161319933e-05, 'epoch': 0.15} {'loss': 0.9863, 'learning_rate': 1.9732173912760634e-05, 'epoch': 0.15} {'loss': 0.8543, 'learning_rate': 1.973209865377243e-05, 'epoch': 0.15} {'loss': 0.9311, 'learning_rate': 1.9732023384355406e-05, 'epoch': 0.15} {'loss': 0.8257, 'learning_rate': 1.9731948104509637e-05, 'epoch': 0.15} {'loss': 0.8845, 'learning_rate': 1.973187281423521e-05, 'epoch': 0.15} {'loss': 1.0317, 'learning_rate': 1.97317975135322e-05, 'epoch': 0.15} {'loss': 0.7848, 'learning_rate': 1.9731722202400698e-05, 'epoch': 0.15} {'loss': 0.8805, 'learning_rate': 1.973164688084077e-05, 'epoch': 0.15} {'loss': 0.9992, 'learning_rate': 1.9731571548852508e-05, 'epoch': 0.15} {'loss': 0.9541, 'learning_rate': 1.9731496206435988e-05, 'epoch': 0.15} {'loss': 0.936, 'learning_rate': 1.973142085359129e-05, 'epoch': 0.15} {'loss': 0.9304, 'learning_rate': 1.9731345490318498e-05, 'epoch': 0.15} {'loss': 1.0586, 'learning_rate': 1.973127011661769e-05, 'epoch': 0.15} {'loss': 0.7711, 'learning_rate': 1.9731194732488945e-05, 'epoch': 0.15} {'loss': 1.1265, 'learning_rate': 1.9731119337932353e-05, 'epoch': 0.15} {'loss': 1.079, 'learning_rate': 1.9731043932947983e-05, 'epoch': 0.15} {'loss': 0.9564, 'learning_rate': 1.973096851753592e-05, 'epoch': 0.15} {'loss': 0.8243, 'learning_rate': 1.973089309169625e-05, 'epoch': 0.15} {'loss': 1.025, 'learning_rate': 1.973081765542905e-05, 'epoch': 0.15} {'loss': 0.7887, 'learning_rate': 1.9730742208734396e-05, 'epoch': 0.15} {'loss': 0.817, 'learning_rate': 1.973066675161238e-05, 'epoch': 0.15} {'loss': 0.8792, 'learning_rate': 1.9730591284063072e-05, 'epoch': 0.15} {'loss': 0.9913, 'learning_rate': 1.973051580608656e-05, 'epoch': 0.15} {'loss': 0.8489, 'learning_rate': 1.9730440317682918e-05, 'epoch': 0.15} {'loss': 1.0125, 'learning_rate': 1.9730364818852234e-05, 'epoch': 0.15} {'loss': 0.9723, 'learning_rate': 1.9730289309594584e-05, 'epoch': 0.15} {'loss': 1.0367, 'learning_rate': 1.973021378991005e-05, 'epoch': 0.15} {'loss': 0.909, 'learning_rate': 1.9730138259798717e-05, 'epoch': 0.15} {'loss': 0.9055, 'learning_rate': 1.9730062719260662e-05, 'epoch': 0.15} {'loss': 0.8776, 'learning_rate': 1.9729987168295967e-05, 'epoch': 0.15} {'loss': 0.9583, 'learning_rate': 1.972991160690471e-05, 'epoch': 0.15} {'loss': 0.7776, 'learning_rate': 1.9729836035086975e-05, 'epoch': 0.15} {'loss': 0.9384, 'learning_rate': 1.9729760452842844e-05, 'epoch': 0.15} {'loss': 1.0563, 'learning_rate': 1.9729684860172398e-05, 'epoch': 0.15} {'loss': 0.946, 'learning_rate': 1.9729609257075712e-05, 'epoch': 0.15} {'loss': 0.8771, 'learning_rate': 1.9729533643552874e-05, 'epoch': 0.15} {'loss': 0.8118, 'learning_rate': 1.972945801960396e-05, 'epoch': 0.15} {'loss': 0.9673, 'learning_rate': 1.9729382385229062e-05, 'epoch': 0.15} {'loss': 0.928, 'learning_rate': 1.9729306740428244e-05, 'epoch': 0.15} {'loss': 0.9463, 'learning_rate': 1.97292310852016e-05, 'epoch': 0.15} {'loss': 0.8286, 'learning_rate': 1.9729155419549203e-05, 'epoch': 0.15} {'loss': 0.7597, 'learning_rate': 1.972907974347114e-05, 'epoch': 0.15} {'loss': 0.8468, 'learning_rate': 1.972900405696749e-05, 'epoch': 0.15} {'loss': 0.9832, 'learning_rate': 1.9728928360038334e-05, 'epoch': 0.15} {'loss': 0.8234, 'learning_rate': 1.9728852652683757e-05, 'epoch': 0.15} {'loss': 0.8835, 'learning_rate': 1.972877693490383e-05, 'epoch': 0.15} {'loss': 0.9066, 'learning_rate': 1.9728701206698644e-05, 'epoch': 0.15} {'loss': 0.7842, 'learning_rate': 1.9728625468068277e-05, 'epoch': 0.15} {'loss': 0.9044, 'learning_rate': 1.9728549719012808e-05, 'epoch': 0.15} {'loss': 0.8597, 'learning_rate': 1.9728473959532318e-05, 'epoch': 0.15} {'loss': 0.8707, 'learning_rate': 1.9728398189626892e-05, 'epoch': 0.15} {'loss': 0.9681, 'learning_rate': 1.9728322409296612e-05, 'epoch': 0.15} {'loss': 0.7723, 'learning_rate': 1.9728246618541552e-05, 'epoch': 0.15} {'loss': 0.9006, 'learning_rate': 1.97281708173618e-05, 'epoch': 0.15} {'loss': 0.8746, 'learning_rate': 1.9728095005757433e-05, 'epoch': 0.15} {'loss': 0.692, 'learning_rate': 1.972801918372854e-05, 'epoch': 0.15} {'loss': 1.0799, 'learning_rate': 1.972794335127519e-05, 'epoch': 0.15} {'loss': 0.9411, 'learning_rate': 1.9727867508397477e-05, 'epoch': 0.15} {'loss': 0.8133, 'learning_rate': 1.972779165509547e-05, 'epoch': 0.15} {'loss': 0.9501, 'learning_rate': 1.9727715791369257e-05, 'epoch': 0.15} {'loss': 0.7997, 'learning_rate': 1.9727639917218918e-05, 'epoch': 0.15} {'loss': 1.1274, 'learning_rate': 1.972756403264454e-05, 'epoch': 0.15} {'loss': 1.0559, 'learning_rate': 1.9727488137646196e-05, 'epoch': 0.15} {'loss': 0.8004, 'learning_rate': 1.972741223222397e-05, 'epoch': 0.15} {'loss': 0.9591, 'learning_rate': 1.9727336316377944e-05, 'epoch': 0.15} {'loss': 0.7831, 'learning_rate': 1.9727260390108197e-05, 'epoch': 0.15} {'loss': 0.9398, 'learning_rate': 1.972718445341482e-05, 'epoch': 0.15} {'loss': 1.06, 'learning_rate': 1.972710850629788e-05, 'epoch': 0.15} {'loss': 0.8426, 'learning_rate': 1.9727032548757468e-05, 'epoch': 0.15} {'loss': 1.0115, 'learning_rate': 1.9726956580793662e-05, 'epoch': 0.15} {'loss': 0.9647, 'learning_rate': 1.9726880602406543e-05, 'epoch': 0.15} {'loss': 1.0547, 'learning_rate': 1.9726804613596196e-05, 'epoch': 0.15} {'loss': 0.8249, 'learning_rate': 1.97267286143627e-05, 'epoch': 0.15} {'loss': 0.9606, 'learning_rate': 1.9726652604706132e-05, 'epoch': 0.15} {'loss': 0.9479, 'learning_rate': 1.972657658462658e-05, 'epoch': 0.15} {'loss': 0.8951, 'learning_rate': 1.9726500554124124e-05, 'epoch': 0.16} {'loss': 0.8675, 'learning_rate': 1.972642451319885e-05, 'epoch': 0.16} {'loss': 0.8789, 'learning_rate': 1.9726348461850826e-05, 'epoch': 0.16} {'loss': 0.8585, 'learning_rate': 1.9726272400080144e-05, 'epoch': 0.16} {'loss': 0.9395, 'learning_rate': 1.9726196327886888e-05, 'epoch': 0.16} {'loss': 0.8145, 'learning_rate': 1.9726120245271128e-05, 'epoch': 0.16} {'loss': 0.8537, 'learning_rate': 1.9726044152232953e-05, 'epoch': 0.16} {'loss': 0.8221, 'learning_rate': 1.9725968048772448e-05, 'epoch': 0.16} {'loss': 0.8894, 'learning_rate': 1.972589193488969e-05, 'epoch': 0.16} {'loss': 0.8429, 'learning_rate': 1.9725815810584758e-05, 'epoch': 0.16} {'loss': 0.8386, 'learning_rate': 1.972573967585774e-05, 'epoch': 0.16} {'loss': 0.9113, 'learning_rate': 1.972566353070871e-05, 'epoch': 0.16} {'loss': 1.0046, 'learning_rate': 1.9725587375137757e-05, 'epoch': 0.16} {'loss': 0.6694, 'learning_rate': 1.972551120914496e-05, 'epoch': 0.16} {'loss': 0.8686, 'learning_rate': 1.9725435032730398e-05, 'epoch': 0.16} {'loss': 0.9302, 'learning_rate': 1.9725358845894153e-05, 'epoch': 0.16} {'loss': 0.8892, 'learning_rate': 1.9725282648636313e-05, 'epoch': 0.16} {'loss': 0.8366, 'learning_rate': 1.9725206440956948e-05, 'epoch': 0.16} {'loss': 0.9386, 'learning_rate': 1.972513022285615e-05, 'epoch': 0.16} {'loss': 0.9402, 'learning_rate': 1.9725053994334e-05, 'epoch': 0.16} {'loss': 0.9169, 'learning_rate': 1.9724977755390574e-05, 'epoch': 0.16} {'loss': 0.9444, 'learning_rate': 1.972490150602596e-05, 'epoch': 0.16} {'loss': 0.8225, 'learning_rate': 1.9724825246240233e-05, 'epoch': 0.16} {'loss': 0.7841, 'learning_rate': 1.972474897603348e-05, 'epoch': 0.16} {'loss': 0.9262, 'learning_rate': 1.9724672695405777e-05, 'epoch': 0.16} {'loss': 0.9199, 'learning_rate': 1.972459640435721e-05, 'epoch': 0.16} {'loss': 0.8308, 'learning_rate': 1.9724520102887864e-05, 'epoch': 0.16} {'loss': 0.9066, 'learning_rate': 1.9724443790997813e-05, 'epoch': 0.16} {'loss': 1.0525, 'learning_rate': 1.9724367468687145e-05, 'epoch': 0.16} {'loss': 0.9947, 'learning_rate': 1.972429113595594e-05, 'epoch': 0.16} {'loss': 0.9163, 'learning_rate': 1.972421479280428e-05, 'epoch': 0.16} {'loss': 0.9559, 'learning_rate': 1.9724138439232245e-05, 'epoch': 0.16} {'loss': 0.9483, 'learning_rate': 1.9724062075239917e-05, 'epoch': 0.16} {'loss': 0.8168, 'learning_rate': 1.972398570082738e-05, 'epoch': 0.16} {'loss': 0.9246, 'learning_rate': 1.9723909315994715e-05, 'epoch': 0.16} {'loss': 0.8236, 'learning_rate': 1.9723832920742e-05, 'epoch': 0.16} {'loss': 0.9273, 'learning_rate': 1.9723756515069326e-05, 'epoch': 0.16} {'loss': 0.874, 'learning_rate': 1.972368009897677e-05, 'epoch': 0.16} {'loss': 0.908, 'learning_rate': 1.9723603672464407e-05, 'epoch': 0.16} {'loss': 1.0121, 'learning_rate': 1.972352723553233e-05, 'epoch': 0.16} {'loss': 0.8888, 'learning_rate': 1.9723450788180615e-05, 'epoch': 0.16} {'loss': 1.0811, 'learning_rate': 1.9723374330409342e-05, 'epoch': 0.16} {'loss': 0.9695, 'learning_rate': 1.9723297862218598e-05, 'epoch': 0.16} {'loss': 0.985, 'learning_rate': 1.972322138360846e-05, 'epoch': 0.16} {'loss': 0.8826, 'learning_rate': 1.972314489457902e-05, 'epoch': 0.16} {'loss': 0.8961, 'learning_rate': 1.9723068395130346e-05, 'epoch': 0.16} {'loss': 0.9737, 'learning_rate': 1.972299188526253e-05, 'epoch': 0.16} {'loss': 0.9776, 'learning_rate': 1.9722915364975646e-05, 'epoch': 0.16} {'loss': 1.1321, 'learning_rate': 1.9722838834269785e-05, 'epoch': 0.16} {'loss': 0.907, 'learning_rate': 1.972276229314502e-05, 'epoch': 0.16} {'loss': 0.7701, 'learning_rate': 1.9722685741601444e-05, 'epoch': 0.16} {'loss': 0.9891, 'learning_rate': 1.9722609179639128e-05, 'epoch': 0.16} {'loss': 0.8033, 'learning_rate': 1.972253260725816e-05, 'epoch': 0.16} {'loss': 0.7776, 'learning_rate': 1.972245602445862e-05, 'epoch': 0.16} {'loss': 1.1138, 'learning_rate': 1.9722379431240596e-05, 'epoch': 0.16} {'loss': 0.8497, 'learning_rate': 1.972230282760416e-05, 'epoch': 0.16} {'loss': 0.9494, 'learning_rate': 1.97222262135494e-05, 'epoch': 0.16} {'loss': 0.9178, 'learning_rate': 1.9722149589076398e-05, 'epoch': 0.16} {'loss': 0.9145, 'learning_rate': 1.9722072954185236e-05, 'epoch': 0.16} {'loss': 0.861, 'learning_rate': 1.9721996308875993e-05, 'epoch': 0.16} {'loss': 0.8644, 'learning_rate': 1.9721919653148753e-05, 'epoch': 0.16} {'loss': 0.9079, 'learning_rate': 1.97218429870036e-05, 'epoch': 0.16} {'loss': 0.9896, 'learning_rate': 1.9721766310440616e-05, 'epoch': 0.16} {'loss': 1.0226, 'learning_rate': 1.972168962345988e-05, 'epoch': 0.16} {'loss': 0.9995, 'learning_rate': 1.9721612926061478e-05, 'epoch': 0.16} {'loss': 0.8308, 'learning_rate': 1.972153621824549e-05, 'epoch': 0.16} {'loss': 0.8847, 'learning_rate': 1.9721459500011994e-05, 'epoch': 0.16} {'loss': 0.9929, 'learning_rate': 1.9721382771361082e-05, 'epoch': 0.16} {'loss': 1.0662, 'learning_rate': 1.972130603229283e-05, 'epoch': 0.16} {'loss': 0.8874, 'learning_rate': 1.9721229282807323e-05, 'epoch': 0.16} {'loss': 0.8465, 'learning_rate': 1.9721152522904635e-05, 'epoch': 0.16} {'loss': 0.8182, 'learning_rate': 1.9721075752584862e-05, 'epoch': 0.16} {'loss': 0.9387, 'learning_rate': 1.9720998971848074e-05, 'epoch': 0.16} {'loss': 1.0389, 'learning_rate': 1.972092218069436e-05, 'epoch': 0.16} {'loss': 0.8943, 'learning_rate': 1.9720845379123798e-05, 'epoch': 0.16} {'loss': 0.929, 'learning_rate': 1.972076856713648e-05, 'epoch': 0.16} {'loss': 1.1202, 'learning_rate': 1.9720691744732473e-05, 'epoch': 0.16} {'loss': 0.7789, 'learning_rate': 1.972061491191187e-05, 'epoch': 0.16} {'loss': 0.9405, 'learning_rate': 1.9720538068674754e-05, 'epoch': 0.16} {'loss': 0.9962, 'learning_rate': 1.97204612150212e-05, 'epoch': 0.16} {'loss': 0.8883, 'learning_rate': 1.9720384350951298e-05, 'epoch': 0.16} {'loss': 0.9343, 'learning_rate': 1.9720307476465124e-05, 'epoch': 0.16} {'loss': 0.8655, 'learning_rate': 1.9720230591562766e-05, 'epoch': 0.16} {'loss': 0.9248, 'learning_rate': 1.97201536962443e-05, 'epoch': 0.16} {'loss': 0.9689, 'learning_rate': 1.9720076790509814e-05, 'epoch': 0.16} {'loss': 0.9125, 'learning_rate': 1.9719999874359387e-05, 'epoch': 0.16} {'loss': 1.0805, 'learning_rate': 1.9719922947793108e-05, 'epoch': 0.16} {'loss': 0.9337, 'learning_rate': 1.9719846010811047e-05, 'epoch': 0.16} {'loss': 1.0244, 'learning_rate': 1.97197690634133e-05, 'epoch': 0.16} {'loss': 0.9462, 'learning_rate': 1.9719692105599938e-05, 'epoch': 0.16} {'loss': 0.9628, 'learning_rate': 1.9719615137371052e-05, 'epoch': 0.16} {'loss': 0.9078, 'learning_rate': 1.9719538158726717e-05, 'epoch': 0.16} {'loss': 1.0666, 'learning_rate': 1.9719461169667025e-05, 'epoch': 0.16} {'loss': 0.8106, 'learning_rate': 1.9719384170192052e-05, 'epoch': 0.16} {'loss': 1.0542, 'learning_rate': 1.9719307160301878e-05, 'epoch': 0.16} {'loss': 0.8566, 'learning_rate': 1.9719230139996594e-05, 'epoch': 0.16} {'loss': 0.9363, 'learning_rate': 1.9719153109276273e-05, 'epoch': 0.16} {'loss': 0.9985, 'learning_rate': 1.9719076068141005e-05, 'epoch': 0.16} {'loss': 0.8995, 'learning_rate': 1.971899901659087e-05, 'epoch': 0.16} {'loss': 1.1275, 'learning_rate': 1.971892195462595e-05, 'epoch': 0.16} {'loss': 0.8428, 'learning_rate': 1.9718844882246325e-05, 'epoch': 0.16} {'loss': 0.957, 'learning_rate': 1.9718767799452086e-05, 'epoch': 0.16} {'loss': 0.8259, 'learning_rate': 1.971869070624331e-05, 'epoch': 0.16} {'loss': 0.9495, 'learning_rate': 1.9718613602620073e-05, 'epoch': 0.16} {'loss': 1.0357, 'learning_rate': 1.9718536488582468e-05, 'epoch': 0.16} {'loss': 0.9209, 'learning_rate': 1.9718459364130576e-05, 'epoch': 0.16} {'loss': 1.0382, 'learning_rate': 1.9718382229264478e-05, 'epoch': 0.16} {'loss': 0.7324, 'learning_rate': 1.9718305083984253e-05, 'epoch': 0.16} {'loss': 0.9119, 'learning_rate': 1.9718227928289988e-05, 'epoch': 0.16} {'loss': 0.8374, 'learning_rate': 1.9718150762181764e-05, 'epoch': 0.16} {'loss': 1.0385, 'learning_rate': 1.9718073585659664e-05, 'epoch': 0.16} {'loss': 0.9372, 'learning_rate': 1.9717996398723774e-05, 'epoch': 0.16} {'loss': 0.9818, 'learning_rate': 1.971791920137417e-05, 'epoch': 0.16} {'loss': 0.899, 'learning_rate': 1.9717841993610943e-05, 'epoch': 0.16} {'loss': 0.9608, 'learning_rate': 1.9717764775434168e-05, 'epoch': 0.16} {'loss': 0.9109, 'learning_rate': 1.9717687546843932e-05, 'epoch': 0.16} {'loss': 0.7794, 'learning_rate': 1.9717610307840318e-05, 'epoch': 0.16} {'loss': 0.8361, 'learning_rate': 1.9717533058423405e-05, 'epoch': 0.16} {'loss': 0.94, 'learning_rate': 1.971745579859328e-05, 'epoch': 0.16} {'loss': 0.8464, 'learning_rate': 1.9717378528350023e-05, 'epoch': 0.16} {'loss': 0.8539, 'learning_rate': 1.971730124769372e-05, 'epoch': 0.16} {'loss': 0.9375, 'learning_rate': 1.971722395662445e-05, 'epoch': 0.16} {'loss': 1.0209, 'learning_rate': 1.9717146655142296e-05, 'epoch': 0.16} {'loss': 0.7918, 'learning_rate': 1.9717069343247342e-05, 'epoch': 0.16} {'loss': 0.9723, 'learning_rate': 1.9716992020939673e-05, 'epoch': 0.16} {'loss': 0.9616, 'learning_rate': 1.971691468821937e-05, 'epoch': 0.16} {'loss': 1.0249, 'learning_rate': 1.9716837345086517e-05, 'epoch': 0.16} {'loss': 0.9715, 'learning_rate': 1.9716759991541195e-05, 'epoch': 0.16} {'loss': 0.9326, 'learning_rate': 1.9716682627583487e-05, 'epoch': 0.16} {'loss': 1.0016, 'learning_rate': 1.9716605253213477e-05, 'epoch': 0.16} {'loss': 0.8529, 'learning_rate': 1.9716527868431246e-05, 'epoch': 0.16} {'loss': 0.8476, 'learning_rate': 1.9716450473236877e-05, 'epoch': 0.16} {'loss': 0.8154, 'learning_rate': 1.971637306763046e-05, 'epoch': 0.16} {'loss': 1.0094, 'learning_rate': 1.971629565161207e-05, 'epoch': 0.16} {'loss': 0.9364, 'learning_rate': 1.971621822518179e-05, 'epoch': 0.16} {'loss': 0.842, 'learning_rate': 1.971614078833971e-05, 'epoch': 0.16} {'loss': 1.1378, 'learning_rate': 1.9716063341085902e-05, 'epoch': 0.16} {'loss': 0.8377, 'learning_rate': 1.971598588342046e-05, 'epoch': 0.16} {'loss': 1.0015, 'learning_rate': 1.971590841534346e-05, 'epoch': 0.16} {'loss': 0.9527, 'learning_rate': 1.9715830936854988e-05, 'epoch': 0.16} {'loss': 1.0617, 'learning_rate': 1.9715753447955126e-05, 'epoch': 0.16} {'loss': 0.7789, 'learning_rate': 1.9715675948643958e-05, 'epoch': 0.16} {'loss': 1.0365, 'learning_rate': 1.9715598438921563e-05, 'epoch': 0.16} {'loss': 0.8883, 'learning_rate': 1.971552091878803e-05, 'epoch': 0.16} {'loss': 0.806, 'learning_rate': 1.9715443388243442e-05, 'epoch': 0.16} {'loss': 0.8148, 'learning_rate': 1.9715365847287876e-05, 'epoch': 0.16} {'loss': 0.8655, 'learning_rate': 1.971528829592142e-05, 'epoch': 0.16} {'loss': 1.0641, 'learning_rate': 1.9715210734144155e-05, 'epoch': 0.16} {'loss': 0.9852, 'learning_rate': 1.9715133161956163e-05, 'epoch': 0.16} {'loss': 0.7558, 'learning_rate': 1.9715055579357533e-05, 'epoch': 0.16} {'loss': 0.889, 'learning_rate': 1.9714977986348343e-05, 'epoch': 0.16} {'loss': 0.8024, 'learning_rate': 1.9714900382928674e-05, 'epoch': 0.16} {'loss': 1.0734, 'learning_rate': 1.9714822769098618e-05, 'epoch': 0.16} {'loss': 0.8396, 'learning_rate': 1.971474514485825e-05, 'epoch': 0.16} {'loss': 0.8783, 'learning_rate': 1.9714667510207652e-05, 'epoch': 0.16} {'loss': 0.8721, 'learning_rate': 1.9714589865146915e-05, 'epoch': 0.16} {'loss': 1.0284, 'learning_rate': 1.971451220967612e-05, 'epoch': 0.16} {'loss': 1.0432, 'learning_rate': 1.9714434543795344e-05, 'epoch': 0.16} {'loss': 0.8536, 'learning_rate': 1.9714356867504675e-05, 'epoch': 0.16} {'loss': 0.815, 'learning_rate': 1.9714279180804198e-05, 'epoch': 0.16} {'loss': 0.946, 'learning_rate': 1.9714201483693995e-05, 'epoch': 0.16} {'loss': 0.9344, 'learning_rate': 1.9714123776174146e-05, 'epoch': 0.16} {'loss': 0.7797, 'learning_rate': 1.9714046058244737e-05, 'epoch': 0.16} {'loss': 1.0256, 'learning_rate': 1.9713968329905852e-05, 'epoch': 0.16} {'loss': 0.9045, 'learning_rate': 1.9713890591157572e-05, 'epoch': 0.16} {'loss': 0.6665, 'learning_rate': 1.971381284199998e-05, 'epoch': 0.16} {'loss': 1.043, 'learning_rate': 1.971373508243316e-05, 'epoch': 0.16} {'loss': 0.8709, 'learning_rate': 1.9713657312457203e-05, 'epoch': 0.16} {'loss': 0.9583, 'learning_rate': 1.971357953207218e-05, 'epoch': 0.16} {'loss': 0.9006, 'learning_rate': 1.9713501741278183e-05, 'epoch': 0.16} {'loss': 0.8897, 'learning_rate': 1.9713423940075288e-05, 'epoch': 0.16} {'loss': 1.0234, 'learning_rate': 1.9713346128463587e-05, 'epoch': 0.16} {'loss': 0.9718, 'learning_rate': 1.9713268306443156e-05, 'epoch': 0.16} {'loss': 0.8471, 'learning_rate': 1.971319047401408e-05, 'epoch': 0.16} {'loss': 0.9945, 'learning_rate': 1.971311263117645e-05, 'epoch': 0.16} {'loss': 0.8809, 'learning_rate': 1.9713034777930335e-05, 'epoch': 0.16} {'loss': 0.888, 'learning_rate': 1.9712956914275832e-05, 'epoch': 0.16} {'loss': 0.9009, 'learning_rate': 1.9712879040213016e-05, 'epoch': 0.16} {'loss': 0.8769, 'learning_rate': 1.9712801155741978e-05, 'epoch': 0.16} {'loss': 0.9168, 'learning_rate': 1.9712723260862795e-05, 'epoch': 0.16} {'loss': 0.9504, 'learning_rate': 1.971264535557555e-05, 'epoch': 0.16} {'loss': 0.8804, 'learning_rate': 1.971256743988033e-05, 'epoch': 0.16} {'loss': 0.8644, 'learning_rate': 1.9712489513777217e-05, 'epoch': 0.16} {'loss': 0.9834, 'learning_rate': 1.9712411577266297e-05, 'epoch': 0.16} {'loss': 1.019, 'learning_rate': 1.971233363034765e-05, 'epoch': 0.16} {'loss': 0.807, 'learning_rate': 1.971225567302136e-05, 'epoch': 0.16} {'loss': 0.9808, 'learning_rate': 1.9712177705287514e-05, 'epoch': 0.16} {'loss': 1.0102, 'learning_rate': 1.971209972714619e-05, 'epoch': 0.16} {'loss': 0.9885, 'learning_rate': 1.9712021738597474e-05, 'epoch': 0.16} {'loss': 0.8261, 'learning_rate': 1.9711943739641453e-05, 'epoch': 0.16} {'loss': 1.0525, 'learning_rate': 1.9711865730278208e-05, 'epoch': 0.16} {'loss': 0.9054, 'learning_rate': 1.9711787710507822e-05, 'epoch': 0.16} {'loss': 0.8034, 'learning_rate': 1.9711709680330376e-05, 'epoch': 0.16} {'loss': 1.0156, 'learning_rate': 1.971163163974596e-05, 'epoch': 0.16} {'loss': 1.0976, 'learning_rate': 1.971155358875465e-05, 'epoch': 0.16} {'loss': 0.9646, 'learning_rate': 1.9711475527356537e-05, 'epoch': 0.16} {'loss': 0.8637, 'learning_rate': 1.97113974555517e-05, 'epoch': 0.16} {'loss': 0.8864, 'learning_rate': 1.9711319373340228e-05, 'epoch': 0.16} {'loss': 1.0067, 'learning_rate': 1.9711241280722196e-05, 'epoch': 0.16} {'loss': 0.8199, 'learning_rate': 1.9711163177697698e-05, 'epoch': 0.16} {'loss': 0.9676, 'learning_rate': 1.9711085064266806e-05, 'epoch': 0.16} {'loss': 1.0114, 'learning_rate': 1.9711006940429613e-05, 'epoch': 0.16} {'loss': 0.949, 'learning_rate': 1.97109288061862e-05, 'epoch': 0.16} {'loss': 0.8766, 'learning_rate': 1.971085066153665e-05, 'epoch': 0.16} {'loss': 0.839, 'learning_rate': 1.9710772506481045e-05, 'epoch': 0.16} {'loss': 0.8408, 'learning_rate': 1.971069434101947e-05, 'epoch': 0.16} {'loss': 1.2179, 'learning_rate': 1.9710616165152015e-05, 'epoch': 0.16} {'loss': 0.9574, 'learning_rate': 1.9710537978878753e-05, 'epoch': 0.16} {'loss': 1.0047, 'learning_rate': 1.9710459782199777e-05, 'epoch': 0.16} {'loss': 0.9815, 'learning_rate': 1.9710381575115166e-05, 'epoch': 0.16} {'loss': 0.9632, 'learning_rate': 1.9710303357625e-05, 'epoch': 0.16} {'loss': 1.047, 'learning_rate': 1.9710225129729372e-05, 'epoch': 0.16} {'loss': 0.8782, 'learning_rate': 1.9710146891428362e-05, 'epoch': 0.16} {'loss': 0.9408, 'learning_rate': 1.971006864272205e-05, 'epoch': 0.16} {'loss': 0.8456, 'learning_rate': 1.9709990383610527e-05, 'epoch': 0.16} {'loss': 0.9486, 'learning_rate': 1.9709912114093873e-05, 'epoch': 0.16} {'loss': 0.9061, 'learning_rate': 1.9709833834172167e-05, 'epoch': 0.16} {'loss': 0.9245, 'learning_rate': 1.9709755543845502e-05, 'epoch': 0.16} {'loss': 0.8667, 'learning_rate': 1.9709677243113956e-05, 'epoch': 0.16} {'loss': 0.9525, 'learning_rate': 1.9709598931977612e-05, 'epoch': 0.16} {'loss': 0.913, 'learning_rate': 1.970952061043656e-05, 'epoch': 0.16} {'loss': 0.8868, 'learning_rate': 1.970944227849088e-05, 'epoch': 0.16} {'loss': 0.8475, 'learning_rate': 1.9709363936140654e-05, 'epoch': 0.16} {'loss': 0.6634, 'learning_rate': 1.970928558338597e-05, 'epoch': 0.16} {'loss': 0.9474, 'learning_rate': 1.9709207220226913e-05, 'epoch': 0.16} {'loss': 0.8495, 'learning_rate': 1.970912884666356e-05, 'epoch': 0.16} {'loss': 1.0002, 'learning_rate': 1.9709050462696e-05, 'epoch': 0.16} {'loss': 1.0559, 'learning_rate': 1.9708972068324317e-05, 'epoch': 0.16} {'loss': 1.1227, 'learning_rate': 1.970889366354859e-05, 'epoch': 0.16} {'loss': 0.9266, 'learning_rate': 1.9708815248368913e-05, 'epoch': 0.16} {'loss': 0.8834, 'learning_rate': 1.970873682278536e-05, 'epoch': 0.16} {'loss': 0.7266, 'learning_rate': 1.9708658386798024e-05, 'epoch': 0.16} {'loss': 0.8284, 'learning_rate': 1.9708579940406978e-05, 'epoch': 0.16} {'loss': 0.7962, 'learning_rate': 1.9708501483612318e-05, 'epoch': 0.16} {'loss': 0.8413, 'learning_rate': 1.970842301641412e-05, 'epoch': 0.16} {'loss': 0.8595, 'learning_rate': 1.970834453881247e-05, 'epoch': 0.16} {'loss': 0.8522, 'learning_rate': 1.9708266050807455e-05, 'epoch': 0.16} {'loss': 0.9061, 'learning_rate': 1.9708187552399153e-05, 'epoch': 0.16} {'loss': 0.9067, 'learning_rate': 1.9708109043587655e-05, 'epoch': 0.16} {'loss': 0.8448, 'learning_rate': 1.970803052437304e-05, 'epoch': 0.16} {'loss': 0.9153, 'learning_rate': 1.9707951994755396e-05, 'epoch': 0.16} {'loss': 0.7323, 'learning_rate': 1.9707873454734802e-05, 'epoch': 0.16} {'loss': 1.1727, 'learning_rate': 1.970779490431135e-05, 'epoch': 0.16} {'loss': 0.8299, 'learning_rate': 1.9707716343485116e-05, 'epoch': 0.16} {'loss': 0.8338, 'learning_rate': 1.9707637772256186e-05, 'epoch': 0.16} {'loss': 0.7868, 'learning_rate': 1.970755919062465e-05, 'epoch': 0.16} {'loss': 0.8858, 'learning_rate': 1.9707480598590587e-05, 'epoch': 0.16} {'loss': 1.0899, 'learning_rate': 1.970740199615408e-05, 'epoch': 0.16} {'loss': 1.0053, 'learning_rate': 1.970732338331522e-05, 'epoch': 0.16} {'loss': 0.9361, 'learning_rate': 1.9707244760074085e-05, 'epoch': 0.16} {'loss': 0.81, 'learning_rate': 1.970716612643076e-05, 'epoch': 0.16} {'loss': 0.9557, 'learning_rate': 1.9707087482385332e-05, 'epoch': 0.16} {'loss': 1.0404, 'learning_rate': 1.9707008827937885e-05, 'epoch': 0.16} {'loss': 0.8593, 'learning_rate': 1.9706930163088498e-05, 'epoch': 0.16} {'loss': 1.1094, 'learning_rate': 1.970685148783726e-05, 'epoch': 0.16} {'loss': 0.9451, 'learning_rate': 1.9706772802184256e-05, 'epoch': 0.16} {'loss': 0.9966, 'learning_rate': 1.9706694106129568e-05, 'epoch': 0.16} {'loss': 0.8762, 'learning_rate': 1.9706615399673282e-05, 'epoch': 0.16} {'loss': 0.9141, 'learning_rate': 1.9706536682815482e-05, 'epoch': 0.16} {'loss': 0.9459, 'learning_rate': 1.970645795555625e-05, 'epoch': 0.16} {'loss': 0.8416, 'learning_rate': 1.9706379217895672e-05, 'epoch': 0.16} {'loss': 0.9462, 'learning_rate': 1.9706300469833836e-05, 'epoch': 0.16} {'loss': 0.9821, 'learning_rate': 1.9706221711370817e-05, 'epoch': 0.16} {'loss': 0.9581, 'learning_rate': 1.9706142942506712e-05, 'epoch': 0.16} {'loss': 0.8482, 'learning_rate': 1.9706064163241595e-05, 'epoch': 0.16} {'loss': 0.8395, 'learning_rate': 1.9705985373575556e-05, 'epoch': 0.16} {'loss': 0.8719, 'learning_rate': 1.970590657350868e-05, 'epoch': 0.16} {'loss': 0.9282, 'learning_rate': 1.9705827763041042e-05, 'epoch': 0.16} {'loss': 0.9737, 'learning_rate': 1.9705748942172736e-05, 'epoch': 0.16} {'loss': 0.8586, 'learning_rate': 1.9705670110903848e-05, 'epoch': 0.16} {'loss': 0.9418, 'learning_rate': 1.9705591269234456e-05, 'epoch': 0.16} {'loss': 0.7879, 'learning_rate': 1.9705512417164647e-05, 'epoch': 0.16} {'loss': 0.888, 'learning_rate': 1.9705433554694504e-05, 'epoch': 0.16} {'loss': 0.8609, 'learning_rate': 1.9705354681824114e-05, 'epoch': 0.16} {'loss': 0.8634, 'learning_rate': 1.970527579855356e-05, 'epoch': 0.16} {'loss': 1.143, 'learning_rate': 1.9705196904882927e-05, 'epoch': 0.16} {'loss': 0.9759, 'learning_rate': 1.9705118000812306e-05, 'epoch': 0.16} {'loss': 0.9751, 'learning_rate': 1.970503908634177e-05, 'epoch': 0.16} {'loss': 0.8492, 'learning_rate': 1.9704960161471404e-05, 'epoch': 0.16} {'loss': 0.9802, 'learning_rate': 1.9704881226201304e-05, 'epoch': 0.16} {'loss': 1.0637, 'learning_rate': 1.9704802280531546e-05, 'epoch': 0.16} {'loss': 0.859, 'learning_rate': 1.9704723324462212e-05, 'epoch': 0.16} {'loss': 0.7771, 'learning_rate': 1.9704644357993398e-05, 'epoch': 0.16} {'loss': 1.0801, 'learning_rate': 1.9704565381125177e-05, 'epoch': 0.16} {'loss': 0.7376, 'learning_rate': 1.970448639385764e-05, 'epoch': 0.16} {'loss': 1.04, 'learning_rate': 1.970440739619087e-05, 'epoch': 0.16} {'loss': 0.9739, 'learning_rate': 1.970432838812495e-05, 'epoch': 0.16} {'loss': 0.8092, 'learning_rate': 1.9704249369659968e-05, 'epoch': 0.16} {'loss': 0.8436, 'learning_rate': 1.970417034079601e-05, 'epoch': 0.16} {'loss': 0.7814, 'learning_rate': 1.9704091301533154e-05, 'epoch': 0.16} {'loss': 0.9202, 'learning_rate': 1.9704012251871487e-05, 'epoch': 0.16} {'loss': 0.8303, 'learning_rate': 1.97039331918111e-05, 'epoch': 0.16} {'loss': 0.8503, 'learning_rate': 1.9703854121352063e-05, 'epoch': 0.16} {'loss': 0.9959, 'learning_rate': 1.9703775040494478e-05, 'epoch': 0.16} {'loss': 0.8533, 'learning_rate': 1.970369594923842e-05, 'epoch': 0.16} {'loss': 0.9356, 'learning_rate': 1.970361684758398e-05, 'epoch': 0.16} {'loss': 0.981, 'learning_rate': 1.9703537735531234e-05, 'epoch': 0.16} {'loss': 0.8588, 'learning_rate': 1.9703458613080272e-05, 'epoch': 0.16} {'loss': 0.8857, 'learning_rate': 1.9703379480231182e-05, 'epoch': 0.16} {'loss': 0.7087, 'learning_rate': 1.9703300336984043e-05, 'epoch': 0.16} {'loss': 0.8496, 'learning_rate': 1.9703221183338942e-05, 'epoch': 0.16} {'loss': 1.0501, 'learning_rate': 1.9703142019295966e-05, 'epoch': 0.16} {'loss': 0.8005, 'learning_rate': 1.9703062844855192e-05, 'epoch': 0.16} {'loss': 0.9214, 'learning_rate': 1.9702983660016713e-05, 'epoch': 0.16} {'loss': 0.7655, 'learning_rate': 1.9702904464780614e-05, 'epoch': 0.16} {'loss': 1.0413, 'learning_rate': 1.9702825259146975e-05, 'epoch': 0.16} {'loss': 0.8629, 'learning_rate': 1.970274604311588e-05, 'epoch': 0.16} {'loss': 1.0337, 'learning_rate': 1.970266681668742e-05, 'epoch': 0.16} {'loss': 0.9925, 'learning_rate': 1.9702587579861677e-05, 'epoch': 0.16} {'loss': 0.9411, 'learning_rate': 1.9702508332638734e-05, 'epoch': 0.16} {'loss': 1.1534, 'learning_rate': 1.9702429075018678e-05, 'epoch': 0.16} {'loss': 0.9355, 'learning_rate': 1.9702349807001594e-05, 'epoch': 0.16} {'loss': 0.9161, 'learning_rate': 1.9702270528587567e-05, 'epoch': 0.16} {'loss': 1.1496, 'learning_rate': 1.970219123977668e-05, 'epoch': 0.16} {'loss': 0.9074, 'learning_rate': 1.9702111940569023e-05, 'epoch': 0.16} {'loss': 0.9571, 'learning_rate': 1.9702032630964674e-05, 'epoch': 0.16} {'loss': 1.0119, 'learning_rate': 1.9701953310963722e-05, 'epoch': 0.16} {'loss': 0.9308, 'learning_rate': 1.9701873980566253e-05, 'epoch': 0.16} {'loss': 1.0164, 'learning_rate': 1.970179463977235e-05, 'epoch': 0.16} {'loss': 0.9141, 'learning_rate': 1.9701715288582095e-05, 'epoch': 0.16} {'loss': 0.9788, 'learning_rate': 1.970163592699558e-05, 'epoch': 0.16} {'loss': 0.7819, 'learning_rate': 1.9701556555012885e-05, 'epoch': 0.16} {'loss': 0.825, 'learning_rate': 1.9701477172634095e-05, 'epoch': 0.16} {'loss': 0.9157, 'learning_rate': 1.97013977798593e-05, 'epoch': 0.16} {'loss': 0.898, 'learning_rate': 1.9701318376688582e-05, 'epoch': 0.16} {'loss': 1.0848, 'learning_rate': 1.9701238963122022e-05, 'epoch': 0.16} {'loss': 0.8697, 'learning_rate': 1.970115953915971e-05, 'epoch': 0.16} {'loss': 1.1407, 'learning_rate': 1.9701080104801732e-05, 'epoch': 0.16} {'loss': 0.9252, 'learning_rate': 1.9701000660048168e-05, 'epoch': 0.16} {'loss': 0.9805, 'learning_rate': 1.970092120489911e-05, 'epoch': 0.16} {'loss': 0.7767, 'learning_rate': 1.9700841739354638e-05, 'epoch': 0.16} {'loss': 0.8087, 'learning_rate': 1.9700762263414838e-05, 'epoch': 0.16} {'loss': 0.8983, 'learning_rate': 1.9700682777079793e-05, 'epoch': 0.16} {'loss': 0.8369, 'learning_rate': 1.9700603280349597e-05, 'epoch': 0.16} {'loss': 1.0601, 'learning_rate': 1.9700523773224324e-05, 'epoch': 0.16} {'loss': 0.8763, 'learning_rate': 1.9700444255704067e-05, 'epoch': 0.16} {'loss': 0.8506, 'learning_rate': 1.9700364727788906e-05, 'epoch': 0.16} {'loss': 1.0169, 'learning_rate': 1.970028518947893e-05, 'epoch': 0.16} {'loss': 0.8064, 'learning_rate': 1.9700205640774223e-05, 'epoch': 0.16} {'loss': 0.8794, 'learning_rate': 1.970012608167487e-05, 'epoch': 0.16} {'loss': 0.9859, 'learning_rate': 1.9700046512180955e-05, 'epoch': 0.16} {'loss': 0.9222, 'learning_rate': 1.9699966932292568e-05, 'epoch': 0.16} {'loss': 0.9981, 'learning_rate': 1.969988734200979e-05, 'epoch': 0.16} {'loss': 0.907, 'learning_rate': 1.9699807741332705e-05, 'epoch': 0.16} {'loss': 0.8773, 'learning_rate': 1.9699728130261403e-05, 'epoch': 0.16} {'loss': 0.9311, 'learning_rate': 1.9699648508795966e-05, 'epoch': 0.16} {'loss': 0.8724, 'learning_rate': 1.969956887693648e-05, 'epoch': 0.16} {'loss': 0.7778, 'learning_rate': 1.9699489234683028e-05, 'epoch': 0.16} {'loss': 0.9122, 'learning_rate': 1.9699409582035702e-05, 'epoch': 0.16} {'loss': 1.0804, 'learning_rate': 1.9699329918994582e-05, 'epoch': 0.16} {'loss': 0.8289, 'learning_rate': 1.9699250245559754e-05, 'epoch': 0.16} {'loss': 0.7916, 'learning_rate': 1.9699170561731306e-05, 'epoch': 0.16} {'loss': 0.8928, 'learning_rate': 1.9699090867509317e-05, 'epoch': 0.16} {'loss': 1.0207, 'learning_rate': 1.9699011162893877e-05, 'epoch': 0.16} {'loss': 0.9067, 'learning_rate': 1.9698931447885073e-05, 'epoch': 0.16} {'loss': 1.1109, 'learning_rate': 1.969885172248299e-05, 'epoch': 0.16} {'loss': 1.0249, 'learning_rate': 1.9698771986687714e-05, 'epoch': 0.16} {'loss': 0.8643, 'learning_rate': 1.969869224049932e-05, 'epoch': 0.16} {'loss': 0.9568, 'learning_rate': 1.969861248391791e-05, 'epoch': 0.16} {'loss': 0.8007, 'learning_rate': 1.9698532716943556e-05, 'epoch': 0.16} {'loss': 1.0364, 'learning_rate': 1.9698452939576355e-05, 'epoch': 0.16} {'loss': 0.8451, 'learning_rate': 1.9698373151816382e-05, 'epoch': 0.16} {'loss': 0.8675, 'learning_rate': 1.9698293353663728e-05, 'epoch': 0.16} {'loss': 0.9353, 'learning_rate': 1.9698213545118478e-05, 'epoch': 0.16} {'loss': 0.8909, 'learning_rate': 1.9698133726180716e-05, 'epoch': 0.16} {'loss': 0.9191, 'learning_rate': 1.9698053896850524e-05, 'epoch': 0.16} {'loss': 0.8969, 'learning_rate': 1.9697974057127997e-05, 'epoch': 0.16} {'loss': 0.9081, 'learning_rate': 1.9697894207013216e-05, 'epoch': 0.16} {'loss': 0.8108, 'learning_rate': 1.9697814346506266e-05, 'epoch': 0.16} {'loss': 1.008, 'learning_rate': 1.9697734475607227e-05, 'epoch': 0.16} {'loss': 1.0499, 'learning_rate': 1.96976545943162e-05, 'epoch': 0.16} {'loss': 0.7813, 'learning_rate': 1.9697574702633252e-05, 'epoch': 0.16} {'loss': 0.8732, 'learning_rate': 1.969749480055848e-05, 'epoch': 0.16} {'loss': 0.858, 'learning_rate': 1.969741488809197e-05, 'epoch': 0.16} {'loss': 0.8913, 'learning_rate': 1.96973349652338e-05, 'epoch': 0.16} {'loss': 0.8281, 'learning_rate': 1.9697255031984065e-05, 'epoch': 0.16} {'loss': 0.9554, 'learning_rate': 1.9697175088342843e-05, 'epoch': 0.16} {'loss': 0.8719, 'learning_rate': 1.9697095134310224e-05, 'epoch': 0.16} {'loss': 0.7818, 'learning_rate': 1.969701516988629e-05, 'epoch': 0.16} {'loss': 0.7614, 'learning_rate': 1.9696935195071136e-05, 'epoch': 0.16} {'loss': 0.8662, 'learning_rate': 1.969685520986483e-05, 'epoch': 0.16} {'loss': 0.8446, 'learning_rate': 1.9696775214267476e-05, 'epoch': 0.16} {'loss': 0.8986, 'learning_rate': 1.969669520827915e-05, 'epoch': 0.16} {'loss': 0.8796, 'learning_rate': 1.969661519189994e-05, 'epoch': 0.16} {'loss': 0.9571, 'learning_rate': 1.9696535165129933e-05, 'epoch': 0.16} {'loss': 0.7851, 'learning_rate': 1.9696455127969213e-05, 'epoch': 0.16} {'loss': 0.8969, 'learning_rate': 1.9696375080417865e-05, 'epoch': 0.16} {'loss': 0.9197, 'learning_rate': 1.9696295022475978e-05, 'epoch': 0.16} {'loss': 0.7838, 'learning_rate': 1.9696214954143632e-05, 'epoch': 0.16} {'loss': 0.8989, 'learning_rate': 1.969613487542092e-05, 'epoch': 0.16} {'loss': 0.9406, 'learning_rate': 1.9696054786307922e-05, 'epoch': 0.16} {'loss': 1.1245, 'learning_rate': 1.9695974686804727e-05, 'epoch': 0.16} {'loss': 0.8131, 'learning_rate': 1.9695894576911422e-05, 'epoch': 0.16} {'loss': 1.0667, 'learning_rate': 1.969581445662809e-05, 'epoch': 0.16} {'loss': 0.9553, 'learning_rate': 1.9695734325954814e-05, 'epoch': 0.16} {'loss': 1.1363, 'learning_rate': 1.9695654184891686e-05, 'epoch': 0.16} {'loss': 0.8934, 'learning_rate': 1.969557403343879e-05, 'epoch': 0.16} {'loss': 0.9818, 'learning_rate': 1.969549387159621e-05, 'epoch': 0.16} {'loss': 0.8407, 'learning_rate': 1.9695413699364035e-05, 'epoch': 0.16} {'loss': 0.9092, 'learning_rate': 1.969533351674235e-05, 'epoch': 0.16} {'loss': 0.8661, 'learning_rate': 1.9695253323731238e-05, 'epoch': 0.16} {'loss': 0.8796, 'learning_rate': 1.9695173120330788e-05, 'epoch': 0.16} {'loss': 0.9267, 'learning_rate': 1.9695092906541083e-05, 'epoch': 0.16} {'loss': 0.8629, 'learning_rate': 1.9695012682362217e-05, 'epoch': 0.16} {'loss': 0.8748, 'learning_rate': 1.9694932447794262e-05, 'epoch': 0.16} {'loss': 0.9001, 'learning_rate': 1.9694852202837315e-05, 'epoch': 0.16} {'loss': 0.9207, 'learning_rate': 1.969477194749146e-05, 'epoch': 0.16} {'loss': 0.9715, 'learning_rate': 1.969469168175678e-05, 'epoch': 0.16} {'loss': 0.9873, 'learning_rate': 1.9694611405633365e-05, 'epoch': 0.16} {'loss': 0.7876, 'learning_rate': 1.9694531119121297e-05, 'epoch': 0.16} {'loss': 0.8537, 'learning_rate': 1.9694450822220665e-05, 'epoch': 0.16} {'loss': 0.8128, 'learning_rate': 1.9694370514931553e-05, 'epoch': 0.16} {'loss': 0.9313, 'learning_rate': 1.969429019725405e-05, 'epoch': 0.16} {'loss': 0.8901, 'learning_rate': 1.969420986918824e-05, 'epoch': 0.16} {'loss': 0.854, 'learning_rate': 1.9694129530734207e-05, 'epoch': 0.16} {'loss': 0.9709, 'learning_rate': 1.969404918189204e-05, 'epoch': 0.16} {'loss': 0.9459, 'learning_rate': 1.9693968822661825e-05, 'epoch': 0.16} {'loss': 0.9473, 'learning_rate': 1.9693888453043644e-05, 'epoch': 0.16} {'loss': 0.9335, 'learning_rate': 1.9693808073037594e-05, 'epoch': 0.16} {'loss': 0.9987, 'learning_rate': 1.969372768264375e-05, 'epoch': 0.16} {'loss': 0.7969, 'learning_rate': 1.96936472818622e-05, 'epoch': 0.16} {'loss': 0.9067, 'learning_rate': 1.969356687069303e-05, 'epoch': 0.16} {'loss': 0.8979, 'learning_rate': 1.9693486449136336e-05, 'epoch': 0.16} {'loss': 0.87, 'learning_rate': 1.969340601719219e-05, 'epoch': 0.16} {'loss': 0.9527, 'learning_rate': 1.9693325574860684e-05, 'epoch': 0.16} {'loss': 0.9119, 'learning_rate': 1.9693245122141907e-05, 'epoch': 0.16} {'loss': 0.8087, 'learning_rate': 1.9693164659035944e-05, 'epoch': 0.16} {'loss': 0.9763, 'learning_rate': 1.9693084185542878e-05, 'epoch': 0.16} {'loss': 0.8419, 'learning_rate': 1.96930037016628e-05, 'epoch': 0.16} {'loss': 0.8295, 'learning_rate': 1.9692923207395792e-05, 'epoch': 0.16} {'loss': 0.9086, 'learning_rate': 1.9692842702741942e-05, 'epoch': 0.16} {'loss': 0.806, 'learning_rate': 1.9692762187701337e-05, 'epoch': 0.16} {'loss': 0.8663, 'learning_rate': 1.9692681662274062e-05, 'epoch': 0.16} {'loss': 0.7836, 'learning_rate': 1.9692601126460204e-05, 'epoch': 0.16} {'loss': 0.7254, 'learning_rate': 1.9692520580259852e-05, 'epoch': 0.16} {'loss': 0.9598, 'learning_rate': 1.9692440023673084e-05, 'epoch': 0.16} {'loss': 0.8503, 'learning_rate': 1.969235945669999e-05, 'epoch': 0.16} {'loss': 1.0187, 'learning_rate': 1.9692278879340665e-05, 'epoch': 0.16} {'loss': 0.9425, 'learning_rate': 1.9692198291595187e-05, 'epoch': 0.16} {'loss': 0.9262, 'learning_rate': 1.9692117693463642e-05, 'epoch': 0.16} {'loss': 0.8762, 'learning_rate': 1.9692037084946117e-05, 'epoch': 0.16} {'loss': 0.9099, 'learning_rate': 1.9691956466042705e-05, 'epoch': 0.16} {'loss': 0.9718, 'learning_rate': 1.969187583675348e-05, 'epoch': 0.16} {'loss': 0.9588, 'learning_rate': 1.969179519707854e-05, 'epoch': 0.16} {'loss': 1.0984, 'learning_rate': 1.969171454701796e-05, 'epoch': 0.16} {'loss': 0.8699, 'learning_rate': 1.969163388657184e-05, 'epoch': 0.16} {'loss': 0.7846, 'learning_rate': 1.969155321574026e-05, 'epoch': 0.16} {'loss': 0.8399, 'learning_rate': 1.9691472534523302e-05, 'epoch': 0.16} {'loss': 0.9785, 'learning_rate': 1.9691391842921058e-05, 'epoch': 0.16} {'loss': 1.0411, 'learning_rate': 1.969131114093361e-05, 'epoch': 0.16} {'loss': 1.0686, 'learning_rate': 1.9691230428561054e-05, 'epoch': 0.16} {'loss': 0.8944, 'learning_rate': 1.9691149705803464e-05, 'epoch': 0.16} {'loss': 0.905, 'learning_rate': 1.9691068972660935e-05, 'epoch': 0.16} {'loss': 0.7935, 'learning_rate': 1.969098822913355e-05, 'epoch': 0.16} {'loss': 0.7773, 'learning_rate': 1.9690907475221398e-05, 'epoch': 0.16} {'loss': 0.6829, 'learning_rate': 1.9690826710924564e-05, 'epoch': 0.16} {'loss': 0.8657, 'learning_rate': 1.9690745936243132e-05, 'epoch': 0.16} {'loss': 0.9375, 'learning_rate': 1.9690665151177192e-05, 'epoch': 0.16} {'loss': 0.9025, 'learning_rate': 1.969058435572683e-05, 'epoch': 0.16} {'loss': 0.8023, 'learning_rate': 1.9690503549892135e-05, 'epoch': 0.16} {'loss': 0.9072, 'learning_rate': 1.9690422733673187e-05, 'epoch': 0.16} {'loss': 0.9345, 'learning_rate': 1.969034190707008e-05, 'epoch': 0.16} {'loss': 0.9585, 'learning_rate': 1.9690261070082893e-05, 'epoch': 0.16} {'loss': 0.8919, 'learning_rate': 1.969018022271172e-05, 'epoch': 0.16} {'loss': 0.9494, 'learning_rate': 1.969009936495664e-05, 'epoch': 0.16} {'loss': 1.0492, 'learning_rate': 1.9690018496817748e-05, 'epoch': 0.16} {'loss': 0.8029, 'learning_rate': 1.9689937618295122e-05, 'epoch': 0.16} {'loss': 0.8414, 'learning_rate': 1.968985672938886e-05, 'epoch': 0.16} {'loss': 0.7961, 'learning_rate': 1.9689775830099038e-05, 'epoch': 0.16} {'loss': 1.0604, 'learning_rate': 1.968969492042575e-05, 'epoch': 0.16} {'loss': 0.9796, 'learning_rate': 1.9689614000369073e-05, 'epoch': 0.16} {'loss': 0.7355, 'learning_rate': 1.9689533069929104e-05, 'epoch': 0.16} {'loss': 0.9074, 'learning_rate': 1.9689452129105924e-05, 'epoch': 0.16} {'loss': 0.8908, 'learning_rate': 1.968937117789962e-05, 'epoch': 0.16} {'loss': 0.7413, 'learning_rate': 1.9689290216310287e-05, 'epoch': 0.16} {'loss': 0.8734, 'learning_rate': 1.9689209244338e-05, 'epoch': 0.16} {'loss': 0.9066, 'learning_rate': 1.9689128261982853e-05, 'epoch': 0.16} {'loss': 0.8136, 'learning_rate': 1.968904726924493e-05, 'epoch': 0.16} {'loss': 1.0105, 'learning_rate': 1.968896626612432e-05, 'epoch': 0.16} {'loss': 1.1455, 'learning_rate': 1.9688885252621105e-05, 'epoch': 0.16} {'loss': 0.8476, 'learning_rate': 1.9688804228735374e-05, 'epoch': 0.16} {'loss': 0.8873, 'learning_rate': 1.9688723194467218e-05, 'epoch': 0.16} {'loss': 1.0273, 'learning_rate': 1.9688642149816718e-05, 'epoch': 0.17} {'loss': 0.9526, 'learning_rate': 1.9688561094783966e-05, 'epoch': 0.17} {'loss': 0.9325, 'learning_rate': 1.9688480029369046e-05, 'epoch': 0.17} {'loss': 0.8809, 'learning_rate': 1.9688398953572044e-05, 'epoch': 0.17} {'loss': 0.8768, 'learning_rate': 1.9688317867393047e-05, 'epoch': 0.17} {'loss': 0.8451, 'learning_rate': 1.9688236770832146e-05, 'epoch': 0.17} {'loss': 0.7548, 'learning_rate': 1.9688155663889424e-05, 'epoch': 0.17} {'loss': 0.9335, 'learning_rate': 1.9688074546564964e-05, 'epoch': 0.17} {'loss': 0.9617, 'learning_rate': 1.9687993418858866e-05, 'epoch': 0.17} {'loss': 1.0899, 'learning_rate': 1.9687912280771203e-05, 'epoch': 0.17} {'loss': 0.8452, 'learning_rate': 1.968783113230207e-05, 'epoch': 0.17} {'loss': 0.8837, 'learning_rate': 1.968774997345155e-05, 'epoch': 0.17} {'loss': 0.9063, 'learning_rate': 1.968766880421973e-05, 'epoch': 0.17} {'loss': 0.8449, 'learning_rate': 1.9687587624606702e-05, 'epoch': 0.17} {'loss': 0.7756, 'learning_rate': 1.9687506434612548e-05, 'epoch': 0.17} {'loss': 0.8285, 'learning_rate': 1.968742523423736e-05, 'epoch': 0.17} {'loss': 1.1391, 'learning_rate': 1.9687344023481218e-05, 'epoch': 0.17} {'loss': 0.8688, 'learning_rate': 1.968726280234421e-05, 'epoch': 0.17} {'loss': 0.8304, 'learning_rate': 1.968718157082643e-05, 'epoch': 0.17} {'loss': 0.8709, 'learning_rate': 1.968710032892796e-05, 'epoch': 0.17} {'loss': 0.861, 'learning_rate': 1.9687019076648884e-05, 'epoch': 0.17} {'loss': 1.0013, 'learning_rate': 1.9686937813989298e-05, 'epoch': 0.17} {'loss': 0.866, 'learning_rate': 1.968685654094928e-05, 'epoch': 0.17} {'loss': 0.918, 'learning_rate': 1.9686775257528923e-05, 'epoch': 0.17} {'loss': 0.8852, 'learning_rate': 1.968669396372831e-05, 'epoch': 0.17} {'loss': 1.0061, 'learning_rate': 1.9686612659547532e-05, 'epoch': 0.17} {'loss': 0.8995, 'learning_rate': 1.9686531344986674e-05, 'epoch': 0.17} {'loss': 0.929, 'learning_rate': 1.9686450020045823e-05, 'epoch': 0.17} {'loss': 0.9912, 'learning_rate': 1.9686368684725064e-05, 'epoch': 0.17} {'loss': 1.0528, 'learning_rate': 1.968628733902449e-05, 'epoch': 0.17} {'loss': 0.9687, 'learning_rate': 1.9686205982944186e-05, 'epoch': 0.17} {'loss': 0.9624, 'learning_rate': 1.9686124616484233e-05, 'epoch': 0.17} {'loss': 1.0009, 'learning_rate': 1.968604323964473e-05, 'epoch': 0.17} {'loss': 0.9412, 'learning_rate': 1.9685961852425756e-05, 'epoch': 0.17} {'loss': 0.9398, 'learning_rate': 1.9685880454827395e-05, 'epoch': 0.17} {'loss': 0.8574, 'learning_rate': 1.9685799046849742e-05, 'epoch': 0.17} {'loss': 0.9397, 'learning_rate': 1.968571762849288e-05, 'epoch': 0.17} {'loss': 0.8403, 'learning_rate': 1.9685636199756897e-05, 'epoch': 0.17} {'loss': 0.9201, 'learning_rate': 1.9685554760641883e-05, 'epoch': 0.17} {'loss': 0.8904, 'learning_rate': 1.9685473311147923e-05, 'epoch': 0.17} {'loss': 0.9414, 'learning_rate': 1.9685391851275103e-05, 'epoch': 0.17} {'loss': 0.8896, 'learning_rate': 1.9685310381023507e-05, 'epoch': 0.17} {'loss': 0.8987, 'learning_rate': 1.9685228900393234e-05, 'epoch': 0.17} {'loss': 0.8743, 'learning_rate': 1.968514740938436e-05, 'epoch': 0.17} {'loss': 0.8248, 'learning_rate': 1.9685065907996978e-05, 'epoch': 0.17} {'loss': 0.9308, 'learning_rate': 1.9684984396231172e-05, 'epoch': 0.17} {'loss': 0.8393, 'learning_rate': 1.9684902874087035e-05, 'epoch': 0.17} {'loss': 1.0176, 'learning_rate': 1.9684821341564646e-05, 'epoch': 0.17} {'loss': 0.974, 'learning_rate': 1.9684739798664098e-05, 'epoch': 0.17} {'loss': 1.1196, 'learning_rate': 1.968465824538548e-05, 'epoch': 0.17} {'loss': 1.0187, 'learning_rate': 1.9684576681728873e-05, 'epoch': 0.17} {'loss': 1.0684, 'learning_rate': 1.9684495107694368e-05, 'epoch': 0.17} {'loss': 0.9704, 'learning_rate': 1.9684413523282053e-05, 'epoch': 0.17} {'loss': 0.9258, 'learning_rate': 1.9684331928492016e-05, 'epoch': 0.17} {'loss': 0.9264, 'learning_rate': 1.9684250323324345e-05, 'epoch': 0.17} {'loss': 0.7431, 'learning_rate': 1.968416870777912e-05, 'epoch': 0.17} {'loss': 0.8096, 'learning_rate': 1.968408708185644e-05, 'epoch': 0.17} {'loss': 0.7431, 'learning_rate': 1.9684005445556383e-05, 'epoch': 0.17} {'loss': 0.7429, 'learning_rate': 1.9683923798879042e-05, 'epoch': 0.17} {'loss': 0.8613, 'learning_rate': 1.9683842141824504e-05, 'epoch': 0.17} {'loss': 0.9133, 'learning_rate': 1.9683760474392854e-05, 'epoch': 0.17} {'loss': 0.9629, 'learning_rate': 1.968367879658418e-05, 'epoch': 0.17} {'loss': 0.859, 'learning_rate': 1.9683597108398568e-05, 'epoch': 0.17} {'loss': 0.9153, 'learning_rate': 1.9683515409836112e-05, 'epoch': 0.17} {'loss': 0.9692, 'learning_rate': 1.9683433700896893e-05, 'epoch': 0.17} {'loss': 1.0212, 'learning_rate': 1.9683351981581e-05, 'epoch': 0.17} {'loss': 0.8458, 'learning_rate': 1.968327025188852e-05, 'epoch': 0.17} {'loss': 1.057, 'learning_rate': 1.9683188511819545e-05, 'epoch': 0.17} {'loss': 0.9441, 'learning_rate': 1.9683106761374156e-05, 'epoch': 0.17} {'loss': 0.8957, 'learning_rate': 1.9683025000552448e-05, 'epoch': 0.17} {'loss': 0.8587, 'learning_rate': 1.9682943229354508e-05, 'epoch': 0.17} {'loss': 1.0681, 'learning_rate': 1.968286144778041e-05, 'epoch': 0.17} {'loss': 0.8566, 'learning_rate': 1.9682779655830262e-05, 'epoch': 0.17} {'loss': 1.0064, 'learning_rate': 1.968269785350414e-05, 'epoch': 0.17} {'loss': 0.8943, 'learning_rate': 1.9682616040802127e-05, 'epoch': 0.17} {'loss': 0.8703, 'learning_rate': 1.9682534217724323e-05, 'epoch': 0.17} {'loss': 0.9008, 'learning_rate': 1.9682452384270807e-05, 'epoch': 0.17} {'loss': 0.8382, 'learning_rate': 1.9682370540441672e-05, 'epoch': 0.17} {'loss': 0.9652, 'learning_rate': 1.9682288686237e-05, 'epoch': 0.17} {'loss': 0.8561, 'learning_rate': 1.9682206821656883e-05, 'epoch': 0.17} {'loss': 0.8134, 'learning_rate': 1.9682124946701408e-05, 'epoch': 0.17} {'loss': 0.8809, 'learning_rate': 1.968204306137066e-05, 'epoch': 0.17} {'loss': 1.066, 'learning_rate': 1.9681961165664732e-05, 'epoch': 0.17} {'loss': 1.0069, 'learning_rate': 1.9681879259583707e-05, 'epoch': 0.17} {'loss': 0.9753, 'learning_rate': 1.9681797343127677e-05, 'epoch': 0.17} {'loss': 0.9393, 'learning_rate': 1.9681715416296723e-05, 'epoch': 0.17} {'loss': 1.0568, 'learning_rate': 1.968163347909094e-05, 'epoch': 0.17} {'loss': 0.805, 'learning_rate': 1.9681551531510414e-05, 'epoch': 0.17} {'loss': 1.2114, 'learning_rate': 1.968146957355523e-05, 'epoch': 0.17} {'loss': 0.8775, 'learning_rate': 1.9681387605225473e-05, 'epoch': 0.17} {'loss': 1.0416, 'learning_rate': 1.9681305626521243e-05, 'epoch': 0.17} {'loss': 0.8883, 'learning_rate': 1.9681223637442617e-05, 'epoch': 0.17} {'loss': 0.8895, 'learning_rate': 1.9681141637989687e-05, 'epoch': 0.17} {'loss': 0.8117, 'learning_rate': 1.968105962816254e-05, 'epoch': 0.17} {'loss': 0.9214, 'learning_rate': 1.9680977607961263e-05, 'epoch': 0.17} {'loss': 0.8542, 'learning_rate': 1.9680895577385944e-05, 'epoch': 0.17} {'loss': 1.1067, 'learning_rate': 1.968081353643667e-05, 'epoch': 0.17} {'loss': 0.8016, 'learning_rate': 1.9680731485113537e-05, 'epoch': 0.17} {'loss': 0.8099, 'learning_rate': 1.9680649423416622e-05, 'epoch': 0.17} {'loss': 1.0611, 'learning_rate': 1.9680567351346016e-05, 'epoch': 0.17} {'loss': 0.93, 'learning_rate': 1.968048526890181e-05, 'epoch': 0.17} {'loss': 0.8622, 'learning_rate': 1.9680403176084093e-05, 'epoch': 0.17} {'loss': 0.9451, 'learning_rate': 1.9680321072892948e-05, 'epoch': 0.17} {'loss': 1.033, 'learning_rate': 1.9680238959328465e-05, 'epoch': 0.17} {'loss': 0.9621, 'learning_rate': 1.968015683539073e-05, 'epoch': 0.17} {'loss': 0.9162, 'learning_rate': 1.9680074701079837e-05, 'epoch': 0.17} {'loss': 0.8951, 'learning_rate': 1.9679992556395868e-05, 'epoch': 0.17} {'loss': 1.0458, 'learning_rate': 1.9679910401338917e-05, 'epoch': 0.17} {'loss': 0.8429, 'learning_rate': 1.9679828235909065e-05, 'epoch': 0.17} {'loss': 0.6973, 'learning_rate': 1.9679746060106403e-05, 'epoch': 0.17} {'loss': 0.8635, 'learning_rate': 1.967966387393102e-05, 'epoch': 0.17} {'loss': 0.746, 'learning_rate': 1.9679581677383004e-05, 'epoch': 0.17} {'loss': 0.9187, 'learning_rate': 1.9679499470462442e-05, 'epoch': 0.17} {'loss': 0.8456, 'learning_rate': 1.9679417253169423e-05, 'epoch': 0.17} {'loss': 0.9558, 'learning_rate': 1.9679335025504036e-05, 'epoch': 0.17} {'loss': 0.8777, 'learning_rate': 1.9679252787466367e-05, 'epoch': 0.17} {'loss': 0.8434, 'learning_rate': 1.9679170539056505e-05, 'epoch': 0.17} {'loss': 1.0151, 'learning_rate': 1.967908828027454e-05, 'epoch': 0.17} {'loss': 1.0724, 'learning_rate': 1.9679006011120556e-05, 'epoch': 0.17} {'loss': 0.99, 'learning_rate': 1.9678923731594644e-05, 'epoch': 0.17} {'loss': 0.7598, 'learning_rate': 1.9678841441696888e-05, 'epoch': 0.17} {'loss': 1.1683, 'learning_rate': 1.9678759141427383e-05, 'epoch': 0.17} {'loss': 0.8167, 'learning_rate': 1.9678676830786218e-05, 'epoch': 0.17} {'loss': 0.6929, 'learning_rate': 1.9678594509773473e-05, 'epoch': 0.17} {'loss': 0.7922, 'learning_rate': 1.967851217838924e-05, 'epoch': 0.17} {'loss': 0.9643, 'learning_rate': 1.967842983663361e-05, 'epoch': 0.17} {'loss': 0.7588, 'learning_rate': 1.9678347484506667e-05, 'epoch': 0.17} {'loss': 0.8553, 'learning_rate': 1.96782651220085e-05, 'epoch': 0.17} {'loss': 0.9366, 'learning_rate': 1.96781827491392e-05, 'epoch': 0.17} {'loss': 0.9278, 'learning_rate': 1.9678100365898857e-05, 'epoch': 0.17} {'loss': 0.9832, 'learning_rate': 1.967801797228755e-05, 'epoch': 0.17} {'loss': 0.9443, 'learning_rate': 1.9677935568305378e-05, 'epoch': 0.17} {'loss': 0.8731, 'learning_rate': 1.967785315395242e-05, 'epoch': 0.17} {'loss': 0.8335, 'learning_rate': 1.9677770729228775e-05, 'epoch': 0.17} {'loss': 0.7874, 'learning_rate': 1.967768829413452e-05, 'epoch': 0.17} {'loss': 0.8121, 'learning_rate': 1.967760584866975e-05, 'epoch': 0.17} {'loss': 1.0255, 'learning_rate': 1.9677523392834554e-05, 'epoch': 0.17} {'loss': 0.7284, 'learning_rate': 1.9677440926629015e-05, 'epoch': 0.17} {'loss': 0.9018, 'learning_rate': 1.9677358450053224e-05, 'epoch': 0.17} {'loss': 0.901, 'learning_rate': 1.9677275963107273e-05, 'epoch': 0.17} {'loss': 0.8863, 'learning_rate': 1.9677193465791244e-05, 'epoch': 0.17} {'loss': 0.8344, 'learning_rate': 1.9677110958105234e-05, 'epoch': 0.17} {'loss': 0.8323, 'learning_rate': 1.9677028440049325e-05, 'epoch': 0.17} {'loss': 0.8333, 'learning_rate': 1.96769459116236e-05, 'epoch': 0.17} {'loss': 0.7762, 'learning_rate': 1.9676863372828162e-05, 'epoch': 0.17} {'loss': 0.8837, 'learning_rate': 1.9676780823663088e-05, 'epoch': 0.17} {'loss': 1.0025, 'learning_rate': 1.967669826412847e-05, 'epoch': 0.17} {'loss': 0.7653, 'learning_rate': 1.9676615694224397e-05, 'epoch': 0.17} {'loss': 0.9616, 'learning_rate': 1.9676533113950957e-05, 'epoch': 0.17} {'loss': 0.7416, 'learning_rate': 1.9676450523308238e-05, 'epoch': 0.17} {'loss': 1.0764, 'learning_rate': 1.9676367922296327e-05, 'epoch': 0.17} {'loss': 0.8257, 'learning_rate': 1.9676285310915318e-05, 'epoch': 0.17} {'loss': 0.9282, 'learning_rate': 1.9676202689165293e-05, 'epoch': 0.17} {'loss': 0.9951, 'learning_rate': 1.9676120057046345e-05, 'epoch': 0.17} {'loss': 0.8655, 'learning_rate': 1.9676037414558562e-05, 'epoch': 0.17} {'loss': 0.9773, 'learning_rate': 1.9675954761702032e-05, 'epoch': 0.17} {'loss': 0.8235, 'learning_rate': 1.967587209847684e-05, 'epoch': 0.17} {'loss': 0.9754, 'learning_rate': 1.9675789424883082e-05, 'epoch': 0.17} {'loss': 0.7717, 'learning_rate': 1.967570674092084e-05, 'epoch': 0.17} {'loss': 1.0902, 'learning_rate': 1.96756240465902e-05, 'epoch': 0.17} {'loss': 0.8438, 'learning_rate': 1.9675541341891263e-05, 'epoch': 0.17} {'loss': 0.832, 'learning_rate': 1.9675458626824107e-05, 'epoch': 0.17} {'loss': 0.9799, 'learning_rate': 1.9675375901388823e-05, 'epoch': 0.17} {'loss': 1.1577, 'learning_rate': 1.9675293165585504e-05, 'epoch': 0.17} {'loss': 0.9119, 'learning_rate': 1.967521041941423e-05, 'epoch': 0.17} {'loss': 0.9721, 'learning_rate': 1.96751276628751e-05, 'epoch': 0.17} {'loss': 0.8807, 'learning_rate': 1.9675044895968196e-05, 'epoch': 0.17} {'loss': 0.8643, 'learning_rate': 1.9674962118693605e-05, 'epoch': 0.17} {'loss': 0.8019, 'learning_rate': 1.9674879331051422e-05, 'epoch': 0.17} {'loss': 0.8368, 'learning_rate': 1.9674796533041733e-05, 'epoch': 0.17} {'loss': 0.7969, 'learning_rate': 1.9674713724664624e-05, 'epoch': 0.17} {'loss': 0.8279, 'learning_rate': 1.9674630905920187e-05, 'epoch': 0.17} {'loss': 0.8902, 'learning_rate': 1.9674548076808508e-05, 'epoch': 0.17} {'loss': 0.9656, 'learning_rate': 1.967446523732968e-05, 'epoch': 0.17} {'loss': 0.8812, 'learning_rate': 1.967438238748379e-05, 'epoch': 0.17} {'loss': 0.9824, 'learning_rate': 1.9674299527270925e-05, 'epoch': 0.17} {'loss': 0.7173, 'learning_rate': 1.9674216656691175e-05, 'epoch': 0.17} {'loss': 0.8942, 'learning_rate': 1.9674133775744627e-05, 'epoch': 0.17} {'loss': 0.8719, 'learning_rate': 1.967405088443137e-05, 'epoch': 0.17} {'loss': 0.9171, 'learning_rate': 1.96739679827515e-05, 'epoch': 0.17} {'loss': 1.018, 'learning_rate': 1.96738850707051e-05, 'epoch': 0.17} {'loss': 0.9221, 'learning_rate': 1.9673802148292257e-05, 'epoch': 0.17} {'loss': 1.0702, 'learning_rate': 1.9673719215513062e-05, 'epoch': 0.17} {'loss': 1.1682, 'learning_rate': 1.96736362723676e-05, 'epoch': 0.17} {'loss': 0.9831, 'learning_rate': 1.967355331885597e-05, 'epoch': 0.17} {'loss': 0.9539, 'learning_rate': 1.967347035497825e-05, 'epoch': 0.17} {'loss': 1.0097, 'learning_rate': 1.9673387380734535e-05, 'epoch': 0.17} {'loss': 0.8123, 'learning_rate': 1.967330439612491e-05, 'epoch': 0.17} {'loss': 1.0145, 'learning_rate': 1.9673221401149468e-05, 'epoch': 0.17} {'loss': 0.929, 'learning_rate': 1.96731383958083e-05, 'epoch': 0.17} {'loss': 0.9152, 'learning_rate': 1.9673055380101488e-05, 'epoch': 0.17} {'loss': 0.8829, 'learning_rate': 1.9672972354029123e-05, 'epoch': 0.17} {'loss': 0.9747, 'learning_rate': 1.9672889317591296e-05, 'epoch': 0.17} {'loss': 0.8285, 'learning_rate': 1.967280627078809e-05, 'epoch': 0.17} {'loss': 0.7823, 'learning_rate': 1.9672723213619607e-05, 'epoch': 0.17} {'loss': 0.9501, 'learning_rate': 1.9672640146085924e-05, 'epoch': 0.17} {'loss': 1.1096, 'learning_rate': 1.9672557068187136e-05, 'epoch': 0.17} {'loss': 0.9931, 'learning_rate': 1.967247397992333e-05, 'epoch': 0.17} {'loss': 0.9763, 'learning_rate': 1.9672390881294594e-05, 'epoch': 0.17} {'loss': 0.9609, 'learning_rate': 1.967230777230102e-05, 'epoch': 0.17} {'loss': 0.8594, 'learning_rate': 1.9672224652942693e-05, 'epoch': 0.17} {'loss': 0.8412, 'learning_rate': 1.9672141523219705e-05, 'epoch': 0.17} {'loss': 0.9481, 'learning_rate': 1.9672058383132144e-05, 'epoch': 0.17} {'loss': 1.0094, 'learning_rate': 1.9671975232680102e-05, 'epoch': 0.17} {'loss': 0.9514, 'learning_rate': 1.9671892071863663e-05, 'epoch': 0.17} {'loss': 0.8716, 'learning_rate': 1.967180890068292e-05, 'epoch': 0.17} {'loss': 0.973, 'learning_rate': 1.9671725719137957e-05, 'epoch': 0.17} {'loss': 1.0254, 'learning_rate': 1.9671642527228873e-05, 'epoch': 0.17} {'loss': 0.8629, 'learning_rate': 1.9671559324955748e-05, 'epoch': 0.17} {'loss': 0.9168, 'learning_rate': 1.9671476112318673e-05, 'epoch': 0.17} {'loss': 1.0127, 'learning_rate': 1.967139288931774e-05, 'epoch': 0.17} {'loss': 0.7407, 'learning_rate': 1.9671309655953038e-05, 'epoch': 0.17} {'loss': 1.0219, 'learning_rate': 1.9671226412224654e-05, 'epoch': 0.17} {'loss': 1.1192, 'learning_rate': 1.9671143158132676e-05, 'epoch': 0.17} {'loss': 0.8314, 'learning_rate': 1.9671059893677195e-05, 'epoch': 0.17} {'loss': 0.8169, 'learning_rate': 1.9670976618858303e-05, 'epoch': 0.17} {'loss': 1.0065, 'learning_rate': 1.9670893333676086e-05, 'epoch': 0.17} {'loss': 0.9472, 'learning_rate': 1.9670810038130634e-05, 'epoch': 0.17} {'loss': 1.0119, 'learning_rate': 1.9670726732222035e-05, 'epoch': 0.17} {'loss': 0.8979, 'learning_rate': 1.967064341595038e-05, 'epoch': 0.17} {'loss': 0.9231, 'learning_rate': 1.967056008931576e-05, 'epoch': 0.17} {'loss': 1.0159, 'learning_rate': 1.967047675231826e-05, 'epoch': 0.17} {'loss': 0.7116, 'learning_rate': 1.967039340495797e-05, 'epoch': 0.17} {'loss': 0.8998, 'learning_rate': 1.9670310047234983e-05, 'epoch': 0.17} {'loss': 0.8754, 'learning_rate': 1.9670226679149385e-05, 'epoch': 0.17} {'loss': 0.8883, 'learning_rate': 1.9670143300701268e-05, 'epoch': 0.17} {'loss': 1.0627, 'learning_rate': 1.967005991189072e-05, 'epoch': 0.17} {'loss': 0.9369, 'learning_rate': 1.9669976512717826e-05, 'epoch': 0.17} {'loss': 1.0149, 'learning_rate': 1.966989310318268e-05, 'epoch': 0.17} {'loss': 0.9247, 'learning_rate': 1.9669809683285372e-05, 'epoch': 0.17} {'loss': 0.9589, 'learning_rate': 1.966972625302599e-05, 'epoch': 0.17} {'loss': 0.9112, 'learning_rate': 1.9669642812404625e-05, 'epoch': 0.17} {'loss': 0.6768, 'learning_rate': 1.9669559361421366e-05, 'epoch': 0.17} {'loss': 0.7954, 'learning_rate': 1.96694759000763e-05, 'epoch': 0.17} {'loss': 0.9507, 'learning_rate': 1.9669392428369515e-05, 'epoch': 0.17} {'loss': 1.0054, 'learning_rate': 1.9669308946301106e-05, 'epoch': 0.17} {'loss': 0.9838, 'learning_rate': 1.966922545387116e-05, 'epoch': 0.17} {'loss': 0.832, 'learning_rate': 1.9669141951079764e-05, 'epoch': 0.17} {'loss': 0.6869, 'learning_rate': 1.9669058437927014e-05, 'epoch': 0.17} {'loss': 1.1468, 'learning_rate': 1.966897491441299e-05, 'epoch': 0.17} {'loss': 0.9982, 'learning_rate': 1.9668891380537787e-05, 'epoch': 0.17} {'loss': 0.9852, 'learning_rate': 1.96688078363015e-05, 'epoch': 0.17} {'loss': 0.8362, 'learning_rate': 1.9668724281704208e-05, 'epoch': 0.17} {'loss': 0.838, 'learning_rate': 1.9668640716746008e-05, 'epoch': 0.17} {'loss': 0.9227, 'learning_rate': 1.9668557141426983e-05, 'epoch': 0.17} {'loss': 1.0837, 'learning_rate': 1.966847355574723e-05, 'epoch': 0.17} {'loss': 0.8688, 'learning_rate': 1.966838995970683e-05, 'epoch': 0.17} {'loss': 0.8129, 'learning_rate': 1.9668306353305885e-05, 'epoch': 0.17} {'loss': 0.859, 'learning_rate': 1.9668222736544475e-05, 'epoch': 0.17} {'loss': 0.9269, 'learning_rate': 1.9668139109422686e-05, 'epoch': 0.17} {'loss': 1.048, 'learning_rate': 1.9668055471940618e-05, 'epoch': 0.17} {'loss': 0.7968, 'learning_rate': 1.9667971824098354e-05, 'epoch': 0.17} {'loss': 0.8242, 'learning_rate': 1.966788816589599e-05, 'epoch': 0.17} {'loss': 0.8588, 'learning_rate': 1.9667804497333605e-05, 'epoch': 0.17} {'loss': 0.7506, 'learning_rate': 1.96677208184113e-05, 'epoch': 0.17} {'loss': 0.82, 'learning_rate': 1.966763712912916e-05, 'epoch': 0.17} {'loss': 1.13, 'learning_rate': 1.966755342948727e-05, 'epoch': 0.17} {'loss': 0.8315, 'learning_rate': 1.9667469719485726e-05, 'epoch': 0.17} {'loss': 0.9177, 'learning_rate': 1.9667385999124614e-05, 'epoch': 0.17} {'loss': 0.9449, 'learning_rate': 1.966730226840403e-05, 'epoch': 0.17} {'loss': 0.9315, 'learning_rate': 1.9667218527324054e-05, 'epoch': 0.17} {'loss': 0.9711, 'learning_rate': 1.966713477588478e-05, 'epoch': 0.17} {'loss': 0.8459, 'learning_rate': 1.9667051014086303e-05, 'epoch': 0.17} {'loss': 0.8871, 'learning_rate': 1.9666967241928706e-05, 'epoch': 0.17} {'loss': 0.9245, 'learning_rate': 1.9666883459412083e-05, 'epoch': 0.17} {'loss': 0.824, 'learning_rate': 1.966679966653652e-05, 'epoch': 0.17} {'loss': 0.7301, 'learning_rate': 1.966671586330211e-05, 'epoch': 0.17} {'loss': 0.7231, 'learning_rate': 1.966663204970894e-05, 'epoch': 0.17} {'loss': 1.006, 'learning_rate': 1.9666548225757106e-05, 'epoch': 0.17} {'loss': 1.0506, 'learning_rate': 1.966646439144669e-05, 'epoch': 0.17} {'loss': 0.8934, 'learning_rate': 1.9666380546777783e-05, 'epoch': 0.17} {'loss': 1.0346, 'learning_rate': 1.9666296691750477e-05, 'epoch': 0.17} {'loss': 0.9777, 'learning_rate': 1.966621282636486e-05, 'epoch': 0.17} {'loss': 0.9015, 'learning_rate': 1.966612895062103e-05, 'epoch': 0.17} {'loss': 0.8851, 'learning_rate': 1.9666045064519063e-05, 'epoch': 0.17} {'loss': 0.9159, 'learning_rate': 1.966596116805906e-05, 'epoch': 0.17} {'loss': 1.053, 'learning_rate': 1.966587726124111e-05, 'epoch': 0.17} {'loss': 0.9419, 'learning_rate': 1.9665793344065296e-05, 'epoch': 0.17} {'loss': 0.9715, 'learning_rate': 1.966570941653171e-05, 'epoch': 0.17} {'loss': 0.8785, 'learning_rate': 1.966562547864045e-05, 'epoch': 0.17} {'loss': 1.0668, 'learning_rate': 1.9665541530391597e-05, 'epoch': 0.17} {'loss': 0.804, 'learning_rate': 1.9665457571785243e-05, 'epoch': 0.17} {'loss': 1.036, 'learning_rate': 1.966537360282148e-05, 'epoch': 0.17} {'loss': 0.8291, 'learning_rate': 1.9665289623500396e-05, 'epoch': 0.17} {'loss': 1.0307, 'learning_rate': 1.9665205633822083e-05, 'epoch': 0.17} {'loss': 0.7879, 'learning_rate': 1.966512163378663e-05, 'epoch': 0.17} {'loss': 0.8407, 'learning_rate': 1.9665037623394125e-05, 'epoch': 0.17} {'loss': 0.8366, 'learning_rate': 1.966495360264466e-05, 'epoch': 0.17} {'loss': 0.9513, 'learning_rate': 1.9664869571538328e-05, 'epoch': 0.17} {'loss': 0.7965, 'learning_rate': 1.9664785530075215e-05, 'epoch': 0.17} {'loss': 0.8951, 'learning_rate': 1.966470147825541e-05, 'epoch': 0.17} {'loss': 0.8711, 'learning_rate': 1.9664617416079007e-05, 'epoch': 0.17} {'loss': 0.9117, 'learning_rate': 1.9664533343546092e-05, 'epoch': 0.17} {'loss': 0.9523, 'learning_rate': 1.966444926065676e-05, 'epoch': 0.17} {'loss': 0.7126, 'learning_rate': 1.9664365167411094e-05, 'epoch': 0.17} {'loss': 0.7982, 'learning_rate': 1.9664281063809193e-05, 'epoch': 0.17} {'loss': 1.0833, 'learning_rate': 1.966419694985114e-05, 'epoch': 0.17} {'loss': 0.8851, 'learning_rate': 1.9664112825537026e-05, 'epoch': 0.17} {'loss': 0.7765, 'learning_rate': 1.9664028690866946e-05, 'epoch': 0.17} {'loss': 0.9904, 'learning_rate': 1.9663944545840988e-05, 'epoch': 0.17} {'loss': 0.6902, 'learning_rate': 1.9663860390459238e-05, 'epoch': 0.17} {'loss': 0.8968, 'learning_rate': 1.9663776224721792e-05, 'epoch': 0.17} {'loss': 0.8269, 'learning_rate': 1.966369204862874e-05, 'epoch': 0.17} {'loss': 0.9773, 'learning_rate': 1.966360786218016e-05, 'epoch': 0.17} {'loss': 0.9117, 'learning_rate': 1.966352366537616e-05, 'epoch': 0.17} {'loss': 0.9244, 'learning_rate': 1.966343945821682e-05, 'epoch': 0.17} {'loss': 1.0876, 'learning_rate': 1.9663355240702233e-05, 'epoch': 0.17} {'loss': 0.9372, 'learning_rate': 1.966327101283249e-05, 'epoch': 0.17} {'loss': 0.8848, 'learning_rate': 1.966318677460768e-05, 'epoch': 0.17} {'loss': 0.8336, 'learning_rate': 1.966310252602789e-05, 'epoch': 0.17} {'loss': 0.813, 'learning_rate': 1.9663018267093216e-05, 'epoch': 0.17} {'loss': 0.7793, 'learning_rate': 1.9662933997803746e-05, 'epoch': 0.17} {'loss': 1.0342, 'learning_rate': 1.9662849718159566e-05, 'epoch': 0.17} {'loss': 0.8962, 'learning_rate': 1.9662765428160774e-05, 'epoch': 0.17} {'loss': 0.8222, 'learning_rate': 1.966268112780746e-05, 'epoch': 0.17} {'loss': 0.8619, 'learning_rate': 1.9662596817099704e-05, 'epoch': 0.17} {'loss': 0.8597, 'learning_rate': 1.9662512496037608e-05, 'epoch': 0.17} {'loss': 0.9519, 'learning_rate': 1.9662428164621253e-05, 'epoch': 0.17} {'loss': 0.7947, 'learning_rate': 1.966234382285074e-05, 'epoch': 0.17} {'loss': 1.0449, 'learning_rate': 1.9662259470726154e-05, 'epoch': 0.17} {'loss': 1.1429, 'learning_rate': 1.966217510824758e-05, 'epoch': 0.17} {'loss': 1.0547, 'learning_rate': 1.9662090735415115e-05, 'epoch': 0.17} {'loss': 0.9336, 'learning_rate': 1.9662006352228848e-05, 'epoch': 0.17} {'loss': 0.862, 'learning_rate': 1.966192195868887e-05, 'epoch': 0.17} {'loss': 1.0526, 'learning_rate': 1.9661837554795267e-05, 'epoch': 0.17} {'loss': 1.1119, 'learning_rate': 1.9661753140548136e-05, 'epoch': 0.17} {'loss': 0.7162, 'learning_rate': 1.9661668715947562e-05, 'epoch': 0.17} {'loss': 0.828, 'learning_rate': 1.966158428099364e-05, 'epoch': 0.17} {'loss': 0.9676, 'learning_rate': 1.9661499835686465e-05, 'epoch': 0.17} {'loss': 0.9246, 'learning_rate': 1.966141538002611e-05, 'epoch': 0.17} {'loss': 0.8669, 'learning_rate': 1.966133091401268e-05, 'epoch': 0.17} {'loss': 0.8392, 'learning_rate': 1.9661246437646264e-05, 'epoch': 0.17} {'loss': 0.9291, 'learning_rate': 1.966116195092695e-05, 'epoch': 0.17} {'loss': 0.9567, 'learning_rate': 1.966107745385483e-05, 'epoch': 0.17} {'loss': 1.0064, 'learning_rate': 1.9660992946429992e-05, 'epoch': 0.17} {'loss': 0.994, 'learning_rate': 1.9660908428652528e-05, 'epoch': 0.17} {'loss': 1.1002, 'learning_rate': 1.966082390052253e-05, 'epoch': 0.17} {'loss': 0.8707, 'learning_rate': 1.9660739362040086e-05, 'epoch': 0.17} {'loss': 1.0195, 'learning_rate': 1.9660654813205284e-05, 'epoch': 0.17} {'loss': 1.017, 'learning_rate': 1.9660570254018222e-05, 'epoch': 0.17} {'loss': 0.8886, 'learning_rate': 1.9660485684478988e-05, 'epoch': 0.17} {'loss': 0.8986, 'learning_rate': 1.9660401104587673e-05, 'epoch': 0.17} {'loss': 0.8938, 'learning_rate': 1.9660316514344365e-05, 'epoch': 0.17} {'loss': 0.9897, 'learning_rate': 1.9660231913749155e-05, 'epoch': 0.17} {'loss': 1.0068, 'learning_rate': 1.9660147302802132e-05, 'epoch': 0.17} {'loss': 0.9003, 'learning_rate': 1.9660062681503395e-05, 'epoch': 0.17} {'loss': 0.8367, 'learning_rate': 1.9659978049853023e-05, 'epoch': 0.17} {'loss': 0.9108, 'learning_rate': 1.965989340785112e-05, 'epoch': 0.17} {'loss': 0.9279, 'learning_rate': 1.9659808755497762e-05, 'epoch': 0.17} {'loss': 0.7952, 'learning_rate': 1.9659724092793052e-05, 'epoch': 0.17} {'loss': 0.8867, 'learning_rate': 1.965963941973707e-05, 'epoch': 0.17} {'loss': 1.0259, 'learning_rate': 1.9659554736329917e-05, 'epoch': 0.17} {'loss': 1.1263, 'learning_rate': 1.965947004257168e-05, 'epoch': 0.17} {'loss': 0.909, 'learning_rate': 1.9659385338462445e-05, 'epoch': 0.17} {'loss': 0.8754, 'learning_rate': 1.965930062400231e-05, 'epoch': 0.17} {'loss': 0.8051, 'learning_rate': 1.9659215899191367e-05, 'epoch': 0.17} {'loss': 0.9229, 'learning_rate': 1.9659131164029696e-05, 'epoch': 0.17} {'loss': 0.9013, 'learning_rate': 1.9659046418517395e-05, 'epoch': 0.17} {'loss': 1.1716, 'learning_rate': 1.9658961662654555e-05, 'epoch': 0.17} {'loss': 1.0002, 'learning_rate': 1.9658876896441263e-05, 'epoch': 0.17} {'loss': 1.011, 'learning_rate': 1.9658792119877616e-05, 'epoch': 0.17} {'loss': 0.886, 'learning_rate': 1.9658707332963703e-05, 'epoch': 0.17} {'loss': 0.953, 'learning_rate': 1.965862253569961e-05, 'epoch': 0.17} {'loss': 0.9836, 'learning_rate': 1.965853772808543e-05, 'epoch': 0.17} {'loss': 0.8576, 'learning_rate': 1.965845291012126e-05, 'epoch': 0.17} {'loss': 0.9251, 'learning_rate': 1.965836808180718e-05, 'epoch': 0.17} {'loss': 0.8284, 'learning_rate': 1.9658283243143292e-05, 'epoch': 0.17} {'loss': 0.8862, 'learning_rate': 1.965819839412968e-05, 'epoch': 0.17} {'loss': 0.8947, 'learning_rate': 1.9658113534766438e-05, 'epoch': 0.17} {'loss': 0.8449, 'learning_rate': 1.965802866505365e-05, 'epoch': 0.17} {'loss': 0.8964, 'learning_rate': 1.9657943784991417e-05, 'epoch': 0.17} {'loss': 1.0141, 'learning_rate': 1.965785889457983e-05, 'epoch': 0.17} {'loss': 0.8388, 'learning_rate': 1.9657773993818966e-05, 'epoch': 0.17} {'loss': 0.7893, 'learning_rate': 1.965768908270893e-05, 'epoch': 0.17} {'loss': 0.8537, 'learning_rate': 1.9657604161249812e-05, 'epoch': 0.17} {'loss': 0.8385, 'learning_rate': 1.9657519229441698e-05, 'epoch': 0.17} {'loss': 0.8717, 'learning_rate': 1.9657434287284677e-05, 'epoch': 0.17} {'loss': 0.9531, 'learning_rate': 1.9657349334778842e-05, 'epoch': 0.17} {'loss': 0.9495, 'learning_rate': 1.965726437192429e-05, 'epoch': 0.17} {'loss': 0.9264, 'learning_rate': 1.9657179398721107e-05, 'epoch': 0.17} {'loss': 0.9407, 'learning_rate': 1.9657094415169386e-05, 'epoch': 0.17} {'loss': 0.9078, 'learning_rate': 1.9657009421269217e-05, 'epoch': 0.17} {'loss': 0.9626, 'learning_rate': 1.9656924417020687e-05, 'epoch': 0.17} {'loss': 0.8694, 'learning_rate': 1.9656839402423894e-05, 'epoch': 0.17} {'loss': 0.862, 'learning_rate': 1.9656754377478924e-05, 'epoch': 0.17} {'loss': 0.7647, 'learning_rate': 1.9656669342185867e-05, 'epoch': 0.17} {'loss': 0.8495, 'learning_rate': 1.9656584296544822e-05, 'epoch': 0.17} {'loss': 0.9283, 'learning_rate': 1.9656499240555874e-05, 'epoch': 0.17} {'loss': 0.9948, 'learning_rate': 1.9656414174219118e-05, 'epoch': 0.17} {'loss': 0.7552, 'learning_rate': 1.965632909753464e-05, 'epoch': 0.17} {'loss': 1.0597, 'learning_rate': 1.9656244010502535e-05, 'epoch': 0.17} {'loss': 0.8321, 'learning_rate': 1.965615891312289e-05, 'epoch': 0.17} {'loss': 0.8417, 'learning_rate': 1.9656073805395802e-05, 'epoch': 0.17} {'loss': 0.6563, 'learning_rate': 1.965598868732136e-05, 'epoch': 0.17} {'loss': 0.9497, 'learning_rate': 1.9655903558899655e-05, 'epoch': 0.17} {'loss': 1.0662, 'learning_rate': 1.9655818420130773e-05, 'epoch': 0.17} {'loss': 1.0953, 'learning_rate': 1.9655733271014818e-05, 'epoch': 0.17} {'loss': 1.0148, 'learning_rate': 1.9655648111551867e-05, 'epoch': 0.17} {'loss': 0.762, 'learning_rate': 1.965556294174202e-05, 'epoch': 0.17} {'loss': 1.0167, 'learning_rate': 1.9655477761585364e-05, 'epoch': 0.17} {'loss': 0.7838, 'learning_rate': 1.9655392571081993e-05, 'epoch': 0.17} {'loss': 1.0033, 'learning_rate': 1.9655307370231996e-05, 'epoch': 0.17} {'loss': 0.974, 'learning_rate': 1.965522215903547e-05, 'epoch': 0.17} {'loss': 0.7963, 'learning_rate': 1.9655136937492498e-05, 'epoch': 0.17} {'loss': 0.9351, 'learning_rate': 1.965505170560318e-05, 'epoch': 0.17} {'loss': 0.7963, 'learning_rate': 1.9654966463367596e-05, 'epoch': 0.17} {'loss': 0.8858, 'learning_rate': 1.9654881210785848e-05, 'epoch': 0.17} {'loss': 1.0387, 'learning_rate': 1.9654795947858023e-05, 'epoch': 0.17} {'loss': 1.0072, 'learning_rate': 1.9654710674584213e-05, 'epoch': 0.17} {'loss': 0.691, 'learning_rate': 1.9654625390964508e-05, 'epoch': 0.17} {'loss': 0.8443, 'learning_rate': 1.9654540096999004e-05, 'epoch': 0.17} {'loss': 0.911, 'learning_rate': 1.9654454792687785e-05, 'epoch': 0.17} {'loss': 0.9559, 'learning_rate': 1.9654369478030946e-05, 'epoch': 0.17} {'loss': 1.0324, 'learning_rate': 1.965428415302858e-05, 'epoch': 0.17} {'loss': 0.922, 'learning_rate': 1.9654198817680776e-05, 'epoch': 0.17} {'loss': 1.0295, 'learning_rate': 1.9654113471987627e-05, 'epoch': 0.17} {'loss': 1.0171, 'learning_rate': 1.9654028115949227e-05, 'epoch': 0.17} {'loss': 0.999, 'learning_rate': 1.9653942749565665e-05, 'epoch': 0.17} {'loss': 1.0678, 'learning_rate': 1.9653857372837026e-05, 'epoch': 0.17} {'loss': 0.9967, 'learning_rate': 1.9653771985763414e-05, 'epoch': 0.17} {'loss': 0.9604, 'learning_rate': 1.965368658834491e-05, 'epoch': 0.17} {'loss': 1.0199, 'learning_rate': 1.965360118058161e-05, 'epoch': 0.17} {'loss': 0.9483, 'learning_rate': 1.9653515762473606e-05, 'epoch': 0.17} {'loss': 0.8777, 'learning_rate': 1.9653430334020988e-05, 'epoch': 0.17} {'loss': 0.9851, 'learning_rate': 1.965334489522385e-05, 'epoch': 0.17} {'loss': 1.0016, 'learning_rate': 1.9653259446082277e-05, 'epoch': 0.17} {'loss': 0.9712, 'learning_rate': 1.965317398659637e-05, 'epoch': 0.17} {'loss': 0.8741, 'learning_rate': 1.9653088516766216e-05, 'epoch': 0.17} {'loss': 0.9125, 'learning_rate': 1.9653003036591906e-05, 'epoch': 0.17} {'loss': 0.848, 'learning_rate': 1.9652917546073528e-05, 'epoch': 0.17} {'loss': 1.1288, 'learning_rate': 1.965283204521118e-05, 'epoch': 0.17} {'loss': 0.9609, 'learning_rate': 1.965274653400495e-05, 'epoch': 0.17} {'loss': 0.8238, 'learning_rate': 1.9652661012454934e-05, 'epoch': 0.17} {'loss': 0.7697, 'learning_rate': 1.965257548056122e-05, 'epoch': 0.17} {'loss': 0.8756, 'learning_rate': 1.9652489938323897e-05, 'epoch': 0.17} {'loss': 0.8322, 'learning_rate': 1.9652404385743062e-05, 'epoch': 0.17} {'loss': 1.0647, 'learning_rate': 1.9652318822818804e-05, 'epoch': 0.17} {'loss': 0.9359, 'learning_rate': 1.9652233249551215e-05, 'epoch': 0.17} {'loss': 0.8477, 'learning_rate': 1.965214766594039e-05, 'epoch': 0.17} {'loss': 0.9988, 'learning_rate': 1.9652062071986414e-05, 'epoch': 0.17} {'loss': 0.9306, 'learning_rate': 1.9651976467689383e-05, 'epoch': 0.17} {'loss': 0.9027, 'learning_rate': 1.965189085304939e-05, 'epoch': 0.17} {'loss': 0.8702, 'learning_rate': 1.9651805228066522e-05, 'epoch': 0.17} {'loss': 1.2353, 'learning_rate': 1.9651719592740875e-05, 'epoch': 0.17} {'loss': 0.9117, 'learning_rate': 1.965163394707254e-05, 'epoch': 0.17} {'loss': 0.8985, 'learning_rate': 1.9651548291061606e-05, 'epoch': 0.17} {'loss': 0.8378, 'learning_rate': 1.965146262470817e-05, 'epoch': 0.17} {'loss': 1.1022, 'learning_rate': 1.9651376948012316e-05, 'epoch': 0.17} {'loss': 0.9294, 'learning_rate': 1.9651291260974146e-05, 'epoch': 0.17} {'loss': 0.8374, 'learning_rate': 1.9651205563593744e-05, 'epoch': 0.17} {'loss': 0.961, 'learning_rate': 1.9651119855871205e-05, 'epoch': 0.17} {'loss': 0.8934, 'learning_rate': 1.9651034137806618e-05, 'epoch': 0.17} {'loss': 0.8947, 'learning_rate': 1.9650948409400076e-05, 'epoch': 0.17} {'loss': 0.9079, 'learning_rate': 1.9650862670651673e-05, 'epoch': 0.17} {'loss': 0.8835, 'learning_rate': 1.9650776921561502e-05, 'epoch': 0.17} {'loss': 0.8947, 'learning_rate': 1.9650691162129648e-05, 'epoch': 0.17} {'loss': 0.8798, 'learning_rate': 1.965060539235621e-05, 'epoch': 0.17} {'loss': 0.9184, 'learning_rate': 1.965051961224128e-05, 'epoch': 0.17} {'loss': 0.9057, 'learning_rate': 1.9650433821784946e-05, 'epoch': 0.17} {'loss': 0.9036, 'learning_rate': 1.9650348020987296e-05, 'epoch': 0.17} {'loss': 0.8783, 'learning_rate': 1.965026220984843e-05, 'epoch': 0.17} {'loss': 0.9767, 'learning_rate': 1.965017638836844e-05, 'epoch': 0.17} {'loss': 0.9901, 'learning_rate': 1.9650090556547412e-05, 'epoch': 0.17} {'loss': 1.1112, 'learning_rate': 1.9650004714385444e-05, 'epoch': 0.17} {'loss': 0.8308, 'learning_rate': 1.964991886188262e-05, 'epoch': 0.17} {'loss': 1.0088, 'learning_rate': 1.964983299903904e-05, 'epoch': 0.17} {'loss': 0.9559, 'learning_rate': 1.9649747125854796e-05, 'epoch': 0.17} {'loss': 0.8847, 'learning_rate': 1.9649661242329973e-05, 'epoch': 0.17} {'loss': 0.8305, 'learning_rate': 1.9649575348464666e-05, 'epoch': 0.17} {'loss': 0.9596, 'learning_rate': 1.9649489444258968e-05, 'epoch': 0.17} {'loss': 0.9099, 'learning_rate': 1.9649403529712975e-05, 'epoch': 0.17} {'loss': 0.8795, 'learning_rate': 1.9649317604826774e-05, 'epoch': 0.17} {'loss': 0.8648, 'learning_rate': 1.9649231669600456e-05, 'epoch': 0.17} {'loss': 0.9159, 'learning_rate': 1.964914572403412e-05, 'epoch': 0.17} {'loss': 0.8384, 'learning_rate': 1.964905976812785e-05, 'epoch': 0.17} {'loss': 0.7852, 'learning_rate': 1.964897380188174e-05, 'epoch': 0.17} {'loss': 0.9014, 'learning_rate': 1.9648887825295885e-05, 'epoch': 0.17} {'loss': 0.8521, 'learning_rate': 1.964880183837038e-05, 'epoch': 0.17} {'loss': 1.2128, 'learning_rate': 1.9648715841105307e-05, 'epoch': 0.17} {'loss': 0.9288, 'learning_rate': 1.964862983350077e-05, 'epoch': 0.17} {'loss': 1.1628, 'learning_rate': 1.9648543815556848e-05, 'epoch': 0.17} {'loss': 0.8353, 'learning_rate': 1.9648457787273644e-05, 'epoch': 0.18} {'loss': 0.7775, 'learning_rate': 1.964837174865125e-05, 'epoch': 0.18} {'loss': 0.894, 'learning_rate': 1.9648285699689752e-05, 'epoch': 0.18} {'loss': 0.8618, 'learning_rate': 1.9648199640389244e-05, 'epoch': 0.18} {'loss': 0.8389, 'learning_rate': 1.964811357074982e-05, 'epoch': 0.18} {'loss': 0.9727, 'learning_rate': 1.964802749077157e-05, 'epoch': 0.18} {'loss': 0.9893, 'learning_rate': 1.964794140045459e-05, 'epoch': 0.18} {'loss': 0.8817, 'learning_rate': 1.964785529979897e-05, 'epoch': 0.18} {'loss': 0.8958, 'learning_rate': 1.9647769188804803e-05, 'epoch': 0.18} {'loss': 1.012, 'learning_rate': 1.964768306747218e-05, 'epoch': 0.18} {'loss': 0.8734, 'learning_rate': 1.964759693580119e-05, 'epoch': 0.18} {'loss': 0.8198, 'learning_rate': 1.9647510793791934e-05, 'epoch': 0.18} {'loss': 1.0406, 'learning_rate': 1.96474246414445e-05, 'epoch': 0.18} {'loss': 0.886, 'learning_rate': 1.9647338478758974e-05, 'epoch': 0.18} {'loss': 0.9966, 'learning_rate': 1.9647252305735458e-05, 'epoch': 0.18} {'loss': 1.0255, 'learning_rate': 1.964716612237404e-05, 'epoch': 0.18} {'loss': 1.0553, 'learning_rate': 1.9647079928674814e-05, 'epoch': 0.18} {'loss': 1.0445, 'learning_rate': 1.964699372463787e-05, 'epoch': 0.18} {'loss': 0.8866, 'learning_rate': 1.96469075102633e-05, 'epoch': 0.18} {'loss': 0.8094, 'learning_rate': 1.96468212855512e-05, 'epoch': 0.18} {'loss': 0.7905, 'learning_rate': 1.9646735050501658e-05, 'epoch': 0.18} {'loss': 0.7906, 'learning_rate': 1.964664880511477e-05, 'epoch': 0.18} {'loss': 0.9911, 'learning_rate': 1.964656254939063e-05, 'epoch': 0.18} {'loss': 0.9362, 'learning_rate': 1.9646476283329322e-05, 'epoch': 0.18} {'loss': 0.8019, 'learning_rate': 1.964639000693095e-05, 'epoch': 0.18} {'loss': 0.938, 'learning_rate': 1.9646303720195598e-05, 'epoch': 0.18} {'loss': 0.8094, 'learning_rate': 1.964621742312336e-05, 'epoch': 0.18} {'loss': 0.9967, 'learning_rate': 1.964613111571433e-05, 'epoch': 0.18} {'loss': 0.8912, 'learning_rate': 1.96460447979686e-05, 'epoch': 0.18} {'loss': 0.8942, 'learning_rate': 1.9645958469886262e-05, 'epoch': 0.18} {'loss': 0.9129, 'learning_rate': 1.964587213146741e-05, 'epoch': 0.18} {'loss': 0.7766, 'learning_rate': 1.964578578271213e-05, 'epoch': 0.18} {'loss': 0.859, 'learning_rate': 1.9645699423620528e-05, 'epoch': 0.18} {'loss': 1.0872, 'learning_rate': 1.9645613054192686e-05, 'epoch': 0.18} {'loss': 1.0035, 'learning_rate': 1.9645526674428698e-05, 'epoch': 0.18} {'loss': 0.9024, 'learning_rate': 1.9645440284328655e-05, 'epoch': 0.18} {'loss': 1.0267, 'learning_rate': 1.9645353883892655e-05, 'epoch': 0.18} {'loss': 0.7347, 'learning_rate': 1.964526747312079e-05, 'epoch': 0.18} {'loss': 0.8252, 'learning_rate': 1.9645181052013147e-05, 'epoch': 0.18} {'loss': 1.0038, 'learning_rate': 1.964509462056982e-05, 'epoch': 0.18} {'loss': 0.7415, 'learning_rate': 1.964500817879091e-05, 'epoch': 0.18} {'loss': 1.0285, 'learning_rate': 1.96449217266765e-05, 'epoch': 0.18} {'loss': 0.8533, 'learning_rate': 1.9644835264226684e-05, 'epoch': 0.18} {'loss': 0.8924, 'learning_rate': 1.9644748791441558e-05, 'epoch': 0.18} {'loss': 0.9516, 'learning_rate': 1.9644662308321214e-05, 'epoch': 0.18} {'loss': 0.7691, 'learning_rate': 1.9644575814865743e-05, 'epoch': 0.18} {'loss': 0.8896, 'learning_rate': 1.964448931107524e-05, 'epoch': 0.18} {'loss': 0.9252, 'learning_rate': 1.9644402796949793e-05, 'epoch': 0.18} {'loss': 1.0795, 'learning_rate': 1.96443162724895e-05, 'epoch': 0.18} {'loss': 1.1004, 'learning_rate': 1.964422973769445e-05, 'epoch': 0.18} {'loss': 0.9483, 'learning_rate': 1.964414319256474e-05, 'epoch': 0.18} {'loss': 0.79, 'learning_rate': 1.964405663710046e-05, 'epoch': 0.18} {'loss': 1.0104, 'learning_rate': 1.96439700713017e-05, 'epoch': 0.18} {'loss': 1.1145, 'learning_rate': 1.964388349516856e-05, 'epoch': 0.18} {'loss': 0.934, 'learning_rate': 1.9643796908701126e-05, 'epoch': 0.18} {'loss': 0.9431, 'learning_rate': 1.9643710311899493e-05, 'epoch': 0.18} {'loss': 0.8814, 'learning_rate': 1.9643623704763754e-05, 'epoch': 0.18} {'loss': 0.8442, 'learning_rate': 1.9643537087294003e-05, 'epoch': 0.18} {'loss': 0.992, 'learning_rate': 1.964345045949033e-05, 'epoch': 0.18} {'loss': 1.0145, 'learning_rate': 1.964336382135283e-05, 'epoch': 0.18} {'loss': 0.9556, 'learning_rate': 1.9643277172881596e-05, 'epoch': 0.18} {'loss': 1.0139, 'learning_rate': 1.9643190514076718e-05, 'epoch': 0.18} {'loss': 0.9268, 'learning_rate': 1.9643103844938292e-05, 'epoch': 0.18} {'loss': 0.8289, 'learning_rate': 1.964301716546641e-05, 'epoch': 0.18} {'loss': 0.8402, 'learning_rate': 1.9642930475661167e-05, 'epoch': 0.18} {'loss': 0.8962, 'learning_rate': 1.964284377552265e-05, 'epoch': 0.18} {'loss': 0.7907, 'learning_rate': 1.9642757065050958e-05, 'epoch': 0.18} {'loss': 0.8396, 'learning_rate': 1.9642670344246182e-05, 'epoch': 0.18} {'loss': 0.7919, 'learning_rate': 1.964258361310841e-05, 'epoch': 0.18} {'loss': 1.0614, 'learning_rate': 1.9642496871637746e-05, 'epoch': 0.18} {'loss': 1.0222, 'learning_rate': 1.9642410119834272e-05, 'epoch': 0.18} {'loss': 0.9234, 'learning_rate': 1.9642323357698086e-05, 'epoch': 0.18} {'loss': 0.9385, 'learning_rate': 1.964223658522928e-05, 'epoch': 0.18} {'loss': 0.8545, 'learning_rate': 1.964214980242795e-05, 'epoch': 0.18} {'loss': 0.9882, 'learning_rate': 1.9642063009294183e-05, 'epoch': 0.18} {'loss': 0.8888, 'learning_rate': 1.9641976205828075e-05, 'epoch': 0.18} {'loss': 0.7729, 'learning_rate': 1.964188939202972e-05, 'epoch': 0.18} {'loss': 0.9523, 'learning_rate': 1.9641802567899214e-05, 'epoch': 0.18} {'loss': 0.7665, 'learning_rate': 1.964171573343664e-05, 'epoch': 0.18} {'loss': 1.0284, 'learning_rate': 1.9641628888642104e-05, 'epoch': 0.18} {'loss': 1.0121, 'learning_rate': 1.9641542033515687e-05, 'epoch': 0.18} {'loss': 0.9685, 'learning_rate': 1.9641455168057488e-05, 'epoch': 0.18} {'loss': 0.9719, 'learning_rate': 1.96413682922676e-05, 'epoch': 0.18} {'loss': 1.0168, 'learning_rate': 1.9641281406146117e-05, 'epoch': 0.18} {'loss': 1.0648, 'learning_rate': 1.9641194509693133e-05, 'epoch': 0.18} {'loss': 0.7898, 'learning_rate': 1.9641107602908734e-05, 'epoch': 0.18} {'loss': 0.8668, 'learning_rate': 1.9641020685793024e-05, 'epoch': 0.18} {'loss': 0.8594, 'learning_rate': 1.9640933758346084e-05, 'epoch': 0.18} {'loss': 1.0451, 'learning_rate': 1.9640846820568015e-05, 'epoch': 0.18} {'loss': 0.8858, 'learning_rate': 1.9640759872458912e-05, 'epoch': 0.18} {'loss': 0.8473, 'learning_rate': 1.964067291401886e-05, 'epoch': 0.18} {'loss': 0.9987, 'learning_rate': 1.964058594524796e-05, 'epoch': 0.18} {'loss': 1.0143, 'learning_rate': 1.9640498966146302e-05, 'epoch': 0.18} {'loss': 0.8309, 'learning_rate': 1.964041197671398e-05, 'epoch': 0.18} {'loss': 0.9718, 'learning_rate': 1.9640324976951086e-05, 'epoch': 0.18} {'loss': 1.1158, 'learning_rate': 1.9640237966857708e-05, 'epoch': 0.18} {'loss': 0.8673, 'learning_rate': 1.964015094643395e-05, 'epoch': 0.18} {'loss': 0.8373, 'learning_rate': 1.96400639156799e-05, 'epoch': 0.18} {'loss': 0.8681, 'learning_rate': 1.963997687459565e-05, 'epoch': 0.18} {'loss': 0.9577, 'learning_rate': 1.9639889823181297e-05, 'epoch': 0.18} {'loss': 0.8338, 'learning_rate': 1.963980276143693e-05, 'epoch': 0.18} {'loss': 0.7804, 'learning_rate': 1.9639715689362645e-05, 'epoch': 0.18} {'loss': 0.7705, 'learning_rate': 1.9639628606958535e-05, 'epoch': 0.18} {'loss': 1.136, 'learning_rate': 1.9639541514224693e-05, 'epoch': 0.18} {'loss': 0.914, 'learning_rate': 1.963945441116121e-05, 'epoch': 0.18} {'loss': 0.8006, 'learning_rate': 1.9639367297768185e-05, 'epoch': 0.18} {'loss': 0.7651, 'learning_rate': 1.9639280174045706e-05, 'epoch': 0.18} {'loss': 0.9368, 'learning_rate': 1.9639193039993868e-05, 'epoch': 0.18} {'loss': 0.8077, 'learning_rate': 1.9639105895612767e-05, 'epoch': 0.18} {'loss': 0.9336, 'learning_rate': 1.9639018740902493e-05, 'epoch': 0.18} {'loss': 1.0475, 'learning_rate': 1.9638931575863136e-05, 'epoch': 0.18} {'loss': 0.9494, 'learning_rate': 1.96388444004948e-05, 'epoch': 0.18} {'loss': 1.0624, 'learning_rate': 1.963875721479757e-05, 'epoch': 0.18} {'loss': 1.0843, 'learning_rate': 1.963867001877154e-05, 'epoch': 0.18} {'loss': 0.9353, 'learning_rate': 1.9638582812416807e-05, 'epoch': 0.18} {'loss': 0.954, 'learning_rate': 1.9638495595733462e-05, 'epoch': 0.18} {'loss': 0.8903, 'learning_rate': 1.96384083687216e-05, 'epoch': 0.18} {'loss': 0.8982, 'learning_rate': 1.963832113138131e-05, 'epoch': 0.18} {'loss': 0.9372, 'learning_rate': 1.9638233883712694e-05, 'epoch': 0.18} {'loss': 1.0457, 'learning_rate': 1.963814662571584e-05, 'epoch': 0.18} {'loss': 0.9123, 'learning_rate': 1.963805935739084e-05, 'epoch': 0.18} {'loss': 1.0029, 'learning_rate': 1.9637972078737788e-05, 'epoch': 0.18} {'loss': 0.9065, 'learning_rate': 1.963788478975678e-05, 'epoch': 0.18} {'loss': 0.82, 'learning_rate': 1.963779749044791e-05, 'epoch': 0.18} {'loss': 0.8925, 'learning_rate': 1.963771018081127e-05, 'epoch': 0.18} {'loss': 0.8419, 'learning_rate': 1.9637622860846953e-05, 'epoch': 0.18} {'loss': 0.9698, 'learning_rate': 1.9637535530555053e-05, 'epoch': 0.18} {'loss': 0.9371, 'learning_rate': 1.9637448189935664e-05, 'epoch': 0.18} {'loss': 0.8073, 'learning_rate': 1.963736083898888e-05, 'epoch': 0.18} {'loss': 0.8753, 'learning_rate': 1.9637273477714794e-05, 'epoch': 0.18} {'loss': 0.9339, 'learning_rate': 1.96371861061135e-05, 'epoch': 0.18} {'loss': 0.8887, 'learning_rate': 1.963709872418509e-05, 'epoch': 0.18} {'loss': 0.9166, 'learning_rate': 1.963701133192966e-05, 'epoch': 0.18} {'loss': 0.935, 'learning_rate': 1.9636923929347302e-05, 'epoch': 0.18} {'loss': 0.7945, 'learning_rate': 1.9636836516438112e-05, 'epoch': 0.18} {'loss': 0.9082, 'learning_rate': 1.9636749093202178e-05, 'epoch': 0.18} {'loss': 0.8095, 'learning_rate': 1.96366616596396e-05, 'epoch': 0.18} {'loss': 1.0533, 'learning_rate': 1.963657421575047e-05, 'epoch': 0.18} {'loss': 0.7927, 'learning_rate': 1.963648676153488e-05, 'epoch': 0.18} {'loss': 0.9626, 'learning_rate': 1.9636399296992924e-05, 'epoch': 0.18} {'loss': 1.0512, 'learning_rate': 1.9636311822124697e-05, 'epoch': 0.18} {'loss': 0.804, 'learning_rate': 1.963622433693029e-05, 'epoch': 0.18} {'loss': 0.9238, 'learning_rate': 1.9636136841409806e-05, 'epoch': 0.18} {'loss': 0.9792, 'learning_rate': 1.9636049335563324e-05, 'epoch': 0.18} {'loss': 0.8547, 'learning_rate': 1.9635961819390948e-05, 'epoch': 0.18} {'loss': 0.7294, 'learning_rate': 1.963587429289277e-05, 'epoch': 0.18} {'loss': 0.9112, 'learning_rate': 1.9635786756068884e-05, 'epoch': 0.18} {'loss': 0.7947, 'learning_rate': 1.9635699208919382e-05, 'epoch': 0.18} {'loss': 0.8564, 'learning_rate': 1.9635611651444355e-05, 'epoch': 0.18} {'loss': 0.8204, 'learning_rate': 1.9635524083643905e-05, 'epoch': 0.18} {'loss': 0.8506, 'learning_rate': 1.963543650551812e-05, 'epoch': 0.18} {'loss': 0.9015, 'learning_rate': 1.9635348917067094e-05, 'epoch': 0.18} {'loss': 1.0121, 'learning_rate': 1.9635261318290924e-05, 'epoch': 0.18} {'loss': 1.0064, 'learning_rate': 1.96351737091897e-05, 'epoch': 0.18} {'loss': 1.0371, 'learning_rate': 1.9635086089763516e-05, 'epoch': 0.18} {'loss': 0.9347, 'learning_rate': 1.9634998460012473e-05, 'epoch': 0.18} {'loss': 0.8579, 'learning_rate': 1.9634910819936656e-05, 'epoch': 0.18} {'loss': 0.9603, 'learning_rate': 1.9634823169536165e-05, 'epoch': 0.18} {'loss': 0.9686, 'learning_rate': 1.9634735508811088e-05, 'epoch': 0.18} {'loss': 1.1462, 'learning_rate': 1.9634647837761523e-05, 'epoch': 0.18} {'loss': 0.8952, 'learning_rate': 1.9634560156387565e-05, 'epoch': 0.18} {'loss': 0.8948, 'learning_rate': 1.9634472464689305e-05, 'epoch': 0.18} {'loss': 0.862, 'learning_rate': 1.963438476266684e-05, 'epoch': 0.18} {'loss': 0.9532, 'learning_rate': 1.963429705032026e-05, 'epoch': 0.18} {'loss': 0.7932, 'learning_rate': 1.963420932764966e-05, 'epoch': 0.18} {'loss': 0.7839, 'learning_rate': 1.9634121594655137e-05, 'epoch': 0.18} {'loss': 0.9143, 'learning_rate': 1.9634033851336785e-05, 'epoch': 0.18} {'loss': 0.8799, 'learning_rate': 1.9633946097694694e-05, 'epoch': 0.18} {'loss': 1.0266, 'learning_rate': 1.963385833372896e-05, 'epoch': 0.18} {'loss': 0.8641, 'learning_rate': 1.9633770559439677e-05, 'epoch': 0.18} {'loss': 0.9312, 'learning_rate': 1.9633682774826938e-05, 'epoch': 0.18} {'loss': 0.9029, 'learning_rate': 1.9633594979890842e-05, 'epoch': 0.18} {'loss': 0.9655, 'learning_rate': 1.963350717463148e-05, 'epoch': 0.18} {'loss': 0.9805, 'learning_rate': 1.963341935904894e-05, 'epoch': 0.18} {'loss': 0.8888, 'learning_rate': 1.963333153314333e-05, 'epoch': 0.18} {'loss': 0.9883, 'learning_rate': 1.963324369691473e-05, 'epoch': 0.18} {'loss': 0.8343, 'learning_rate': 1.9633155850363237e-05, 'epoch': 0.18} {'loss': 0.9499, 'learning_rate': 1.9633067993488955e-05, 'epoch': 0.18} {'loss': 0.9196, 'learning_rate': 1.963298012629197e-05, 'epoch': 0.18} {'loss': 1.0725, 'learning_rate': 1.9632892248772375e-05, 'epoch': 0.18} {'loss': 0.9246, 'learning_rate': 1.9632804360930267e-05, 'epoch': 0.18} {'loss': 1.0221, 'learning_rate': 1.963271646276574e-05, 'epoch': 0.18} {'loss': 1.0612, 'learning_rate': 1.9632628554278885e-05, 'epoch': 0.18} {'loss': 1.0966, 'learning_rate': 1.9632540635469804e-05, 'epoch': 0.18} {'loss': 0.8128, 'learning_rate': 1.9632452706338583e-05, 'epoch': 0.18} {'loss': 1.054, 'learning_rate': 1.963236476688532e-05, 'epoch': 0.18} {'loss': 0.8668, 'learning_rate': 1.9632276817110112e-05, 'epoch': 0.18} {'loss': 0.8902, 'learning_rate': 1.9632188857013047e-05, 'epoch': 0.18} {'loss': 0.9985, 'learning_rate': 1.9632100886594222e-05, 'epoch': 0.18} {'loss': 0.7423, 'learning_rate': 1.9632012905853735e-05, 'epoch': 0.18} {'loss': 0.8666, 'learning_rate': 1.9631924914791673e-05, 'epoch': 0.18} {'loss': 0.9726, 'learning_rate': 1.9631836913408135e-05, 'epoch': 0.18} {'loss': 0.8778, 'learning_rate': 1.9631748901703217e-05, 'epoch': 0.18} {'loss': 0.9304, 'learning_rate': 1.9631660879677005e-05, 'epoch': 0.18} {'loss': 0.9982, 'learning_rate': 1.9631572847329602e-05, 'epoch': 0.18} {'loss': 1.0353, 'learning_rate': 1.96314848046611e-05, 'epoch': 0.18} {'loss': 1.0223, 'learning_rate': 1.9631396751671595e-05, 'epoch': 0.18} {'loss': 1.1474, 'learning_rate': 1.9631308688361174e-05, 'epoch': 0.18} {'loss': 0.8742, 'learning_rate': 1.963122061472994e-05, 'epoch': 0.18} {'loss': 0.9297, 'learning_rate': 1.9631132530777984e-05, 'epoch': 0.18} {'loss': 0.7799, 'learning_rate': 1.96310444365054e-05, 'epoch': 0.18} {'loss': 0.6784, 'learning_rate': 1.963095633191228e-05, 'epoch': 0.18} {'loss': 0.8743, 'learning_rate': 1.9630868216998726e-05, 'epoch': 0.18} {'loss': 0.8019, 'learning_rate': 1.9630780091764823e-05, 'epoch': 0.18} {'loss': 0.9025, 'learning_rate': 1.9630691956210673e-05, 'epoch': 0.18} {'loss': 0.862, 'learning_rate': 1.9630603810336362e-05, 'epoch': 0.18} {'loss': 0.841, 'learning_rate': 1.9630515654142e-05, 'epoch': 0.18} {'loss': 0.8376, 'learning_rate': 1.963042748762766e-05, 'epoch': 0.18} {'loss': 0.8597, 'learning_rate': 1.9630339310793455e-05, 'epoch': 0.18} {'loss': 0.9964, 'learning_rate': 1.9630251123639468e-05, 'epoch': 0.18} {'loss': 0.8591, 'learning_rate': 1.96301629261658e-05, 'epoch': 0.18} {'loss': 0.9288, 'learning_rate': 1.963007471837254e-05, 'epoch': 0.18} {'loss': 0.9693, 'learning_rate': 1.962998650025979e-05, 'epoch': 0.18} {'loss': 1.1511, 'learning_rate': 1.962989827182764e-05, 'epoch': 0.18} {'loss': 0.8801, 'learning_rate': 1.9629810033076183e-05, 'epoch': 0.18} {'loss': 1.1409, 'learning_rate': 1.9629721784005514e-05, 'epoch': 0.18} {'loss': 0.8789, 'learning_rate': 1.9629633524615734e-05, 'epoch': 0.18} {'loss': 0.8756, 'learning_rate': 1.9629545254906927e-05, 'epoch': 0.18} {'loss': 0.8346, 'learning_rate': 1.96294569748792e-05, 'epoch': 0.18} {'loss': 0.7822, 'learning_rate': 1.9629368684532635e-05, 'epoch': 0.18} {'loss': 1.0156, 'learning_rate': 1.9629280383867333e-05, 'epoch': 0.18} {'loss': 0.9117, 'learning_rate': 1.962919207288339e-05, 'epoch': 0.18} {'loss': 1.0826, 'learning_rate': 1.9629103751580896e-05, 'epoch': 0.18} {'loss': 0.973, 'learning_rate': 1.962901541995995e-05, 'epoch': 0.18} {'loss': 0.9176, 'learning_rate': 1.9628927078020643e-05, 'epoch': 0.18} {'loss': 0.893, 'learning_rate': 1.9628838725763076e-05, 'epoch': 0.18} {'loss': 0.8938, 'learning_rate': 1.9628750363187335e-05, 'epoch': 0.18} {'loss': 1.0186, 'learning_rate': 1.962866199029352e-05, 'epoch': 0.18} {'loss': 0.9656, 'learning_rate': 1.9628573607081724e-05, 'epoch': 0.18} {'loss': 1.0634, 'learning_rate': 1.9628485213552045e-05, 'epoch': 0.18} {'loss': 0.9226, 'learning_rate': 1.9628396809704574e-05, 'epoch': 0.18} {'loss': 0.9215, 'learning_rate': 1.9628308395539407e-05, 'epoch': 0.18} {'loss': 0.8463, 'learning_rate': 1.9628219971056634e-05, 'epoch': 0.18} {'loss': 0.9169, 'learning_rate': 1.962813153625636e-05, 'epoch': 0.18} {'loss': 0.7242, 'learning_rate': 1.962804309113867e-05, 'epoch': 0.18} {'loss': 0.8931, 'learning_rate': 1.9627954635703668e-05, 'epoch': 0.18} {'loss': 0.9708, 'learning_rate': 1.962786616995144e-05, 'epoch': 0.18} {'loss': 1.0225, 'learning_rate': 1.9627777693882085e-05, 'epoch': 0.18} {'loss': 0.9525, 'learning_rate': 1.9627689207495698e-05, 'epoch': 0.18} {'loss': 0.9408, 'learning_rate': 1.962760071079237e-05, 'epoch': 0.18} {'loss': 0.8705, 'learning_rate': 1.96275122037722e-05, 'epoch': 0.18} {'loss': 1.0346, 'learning_rate': 1.9627423686435284e-05, 'epoch': 0.18} {'loss': 1.0123, 'learning_rate': 1.9627335158781716e-05, 'epoch': 0.18} {'loss': 0.8377, 'learning_rate': 1.9627246620811585e-05, 'epoch': 0.18} {'loss': 0.9419, 'learning_rate': 1.9627158072524993e-05, 'epoch': 0.18} {'loss': 0.834, 'learning_rate': 1.9627069513922034e-05, 'epoch': 0.18} {'loss': 0.7657, 'learning_rate': 1.9626980945002796e-05, 'epoch': 0.18} {'loss': 0.8422, 'learning_rate': 1.962689236576738e-05, 'epoch': 0.18} {'loss': 0.9454, 'learning_rate': 1.9626803776215885e-05, 'epoch': 0.18} {'loss': 0.9137, 'learning_rate': 1.9626715176348398e-05, 'epoch': 0.18} {'loss': 0.8982, 'learning_rate': 1.9626626566165015e-05, 'epoch': 0.18} {'loss': 0.9672, 'learning_rate': 1.9626537945665835e-05, 'epoch': 0.18} {'loss': 0.828, 'learning_rate': 1.962644931485095e-05, 'epoch': 0.18} {'loss': 0.9091, 'learning_rate': 1.962636067372045e-05, 'epoch': 0.18} {'loss': 0.8397, 'learning_rate': 1.9626272022274448e-05, 'epoch': 0.18} {'loss': 0.8797, 'learning_rate': 1.9626183360513017e-05, 'epoch': 0.18} {'loss': 0.946, 'learning_rate': 1.9626094688436262e-05, 'epoch': 0.18} {'loss': 0.9117, 'learning_rate': 1.9626006006044283e-05, 'epoch': 0.18} {'loss': 0.9624, 'learning_rate': 1.9625917313337167e-05, 'epoch': 0.18} {'loss': 0.7838, 'learning_rate': 1.9625828610315012e-05, 'epoch': 0.18} {'loss': 1.0578, 'learning_rate': 1.9625739896977914e-05, 'epoch': 0.18} {'loss': 0.9185, 'learning_rate': 1.9625651173325967e-05, 'epoch': 0.18} {'loss': 0.8504, 'learning_rate': 1.9625562439359263e-05, 'epoch': 0.18} {'loss': 0.9416, 'learning_rate': 1.9625473695077903e-05, 'epoch': 0.18} {'loss': 0.9159, 'learning_rate': 1.962538494048198e-05, 'epoch': 0.18} {'loss': 0.9682, 'learning_rate': 1.9625296175571586e-05, 'epoch': 0.18} {'loss': 1.0367, 'learning_rate': 1.9625207400346818e-05, 'epoch': 0.18} {'loss': 0.8961, 'learning_rate': 1.962511861480777e-05, 'epoch': 0.18} {'loss': 0.8066, 'learning_rate': 1.9625029818954542e-05, 'epoch': 0.18} {'loss': 1.003, 'learning_rate': 1.9624941012787224e-05, 'epoch': 0.18} {'loss': 0.8956, 'learning_rate': 1.962485219630591e-05, 'epoch': 0.18} {'loss': 0.9024, 'learning_rate': 1.9624763369510704e-05, 'epoch': 0.18} {'loss': 1.0423, 'learning_rate': 1.9624674532401696e-05, 'epoch': 0.18} {'loss': 0.9038, 'learning_rate': 1.9624585684978977e-05, 'epoch': 0.18} {'loss': 0.8237, 'learning_rate': 1.9624496827242646e-05, 'epoch': 0.18} {'loss': 0.7373, 'learning_rate': 1.96244079591928e-05, 'epoch': 0.18} {'loss': 1.0138, 'learning_rate': 1.962431908082953e-05, 'epoch': 0.18} {'loss': 0.9333, 'learning_rate': 1.9624230192152934e-05, 'epoch': 0.18} {'loss': 0.8708, 'learning_rate': 1.9624141293163107e-05, 'epoch': 0.18} {'loss': 0.8545, 'learning_rate': 1.9624052383860145e-05, 'epoch': 0.18} {'loss': 0.9028, 'learning_rate': 1.962396346424414e-05, 'epoch': 0.18} {'loss': 0.9048, 'learning_rate': 1.9623874534315192e-05, 'epoch': 0.18} {'loss': 0.8472, 'learning_rate': 1.9623785594073394e-05, 'epoch': 0.18} {'loss': 0.962, 'learning_rate': 1.9623696643518837e-05, 'epoch': 0.18} {'loss': 0.9308, 'learning_rate': 1.9623607682651623e-05, 'epoch': 0.18} {'loss': 0.8036, 'learning_rate': 1.9623518711471848e-05, 'epoch': 0.18} {'loss': 0.9833, 'learning_rate': 1.96234297299796e-05, 'epoch': 0.18} {'loss': 0.8668, 'learning_rate': 1.962334073817498e-05, 'epoch': 0.18} {'loss': 1.1508, 'learning_rate': 1.962325173605808e-05, 'epoch': 0.18} {'loss': 0.8649, 'learning_rate': 1.9623162723629e-05, 'epoch': 0.18} {'loss': 0.9391, 'learning_rate': 1.962307370088783e-05, 'epoch': 0.18} {'loss': 1.0619, 'learning_rate': 1.962298466783467e-05, 'epoch': 0.18} {'loss': 1.0202, 'learning_rate': 1.9622895624469614e-05, 'epoch': 0.18} {'loss': 0.9252, 'learning_rate': 1.9622806570792753e-05, 'epoch': 0.18} {'loss': 1.073, 'learning_rate': 1.9622717506804187e-05, 'epoch': 0.18} {'loss': 0.8993, 'learning_rate': 1.9622628432504012e-05, 'epoch': 0.18} {'loss': 0.9154, 'learning_rate': 1.9622539347892326e-05, 'epoch': 0.18} {'loss': 0.8572, 'learning_rate': 1.9622450252969216e-05, 'epoch': 0.18} {'loss': 1.1042, 'learning_rate': 1.9622361147734784e-05, 'epoch': 0.18} {'loss': 0.9583, 'learning_rate': 1.962227203218912e-05, 'epoch': 0.18} {'loss': 1.0274, 'learning_rate': 1.962218290633233e-05, 'epoch': 0.18} {'loss': 0.7609, 'learning_rate': 1.9622093770164498e-05, 'epoch': 0.18} {'loss': 0.9713, 'learning_rate': 1.962200462368572e-05, 'epoch': 0.18} {'loss': 0.9258, 'learning_rate': 1.96219154668961e-05, 'epoch': 0.18} {'loss': 0.9155, 'learning_rate': 1.962182629979573e-05, 'epoch': 0.18} {'loss': 1.0226, 'learning_rate': 1.9621737122384704e-05, 'epoch': 0.18} {'loss': 0.7589, 'learning_rate': 1.962164793466312e-05, 'epoch': 0.18} {'loss': 1.0374, 'learning_rate': 1.962155873663107e-05, 'epoch': 0.18} {'loss': 0.9194, 'learning_rate': 1.962146952828865e-05, 'epoch': 0.18} {'loss': 0.9165, 'learning_rate': 1.9621380309635957e-05, 'epoch': 0.18} {'loss': 0.9154, 'learning_rate': 1.962129108067309e-05, 'epoch': 0.18} {'loss': 0.8394, 'learning_rate': 1.9621201841400138e-05, 'epoch': 0.18} {'loss': 0.9079, 'learning_rate': 1.9621112591817204e-05, 'epoch': 0.18} {'loss': 0.9042, 'learning_rate': 1.9621023331924375e-05, 'epoch': 0.18} {'loss': 0.8705, 'learning_rate': 1.9620934061721756e-05, 'epoch': 0.18} {'loss': 0.9163, 'learning_rate': 1.962084478120943e-05, 'epoch': 0.18} {'loss': 1.1197, 'learning_rate': 1.9620755490387506e-05, 'epoch': 0.18} {'loss': 0.9684, 'learning_rate': 1.9620666189256075e-05, 'epoch': 0.18} {'loss': 0.8634, 'learning_rate': 1.962057687781523e-05, 'epoch': 0.18} {'loss': 0.8219, 'learning_rate': 1.9620487556065065e-05, 'epoch': 0.18} {'loss': 0.9362, 'learning_rate': 1.9620398224005687e-05, 'epoch': 0.18} {'loss': 0.9774, 'learning_rate': 1.962030888163718e-05, 'epoch': 0.18} {'loss': 0.9972, 'learning_rate': 1.9620219528959642e-05, 'epoch': 0.18} {'loss': 0.792, 'learning_rate': 1.9620130165973173e-05, 'epoch': 0.18} {'loss': 0.8896, 'learning_rate': 1.9620040792677865e-05, 'epoch': 0.18} {'loss': 0.8473, 'learning_rate': 1.9619951409073814e-05, 'epoch': 0.18} {'loss': 0.8121, 'learning_rate': 1.9619862015161118e-05, 'epoch': 0.18} {'loss': 0.966, 'learning_rate': 1.9619772610939872e-05, 'epoch': 0.18} {'loss': 0.8327, 'learning_rate': 1.961968319641017e-05, 'epoch': 0.18} {'loss': 0.8436, 'learning_rate': 1.9619593771572112e-05, 'epoch': 0.18} {'loss': 0.9434, 'learning_rate': 1.961950433642579e-05, 'epoch': 0.18} {'loss': 0.9557, 'learning_rate': 1.96194148909713e-05, 'epoch': 0.18} {'loss': 0.7472, 'learning_rate': 1.961932543520874e-05, 'epoch': 0.18} {'loss': 0.9214, 'learning_rate': 1.9619235969138204e-05, 'epoch': 0.18} {'loss': 0.9303, 'learning_rate': 1.961914649275979e-05, 'epoch': 0.18} {'loss': 0.9228, 'learning_rate': 1.9619057006073588e-05, 'epoch': 0.18} {'loss': 0.8593, 'learning_rate': 1.96189675090797e-05, 'epoch': 0.18} {'loss': 0.8008, 'learning_rate': 1.9618878001778223e-05, 'epoch': 0.18} {'loss': 0.8507, 'learning_rate': 1.961878848416925e-05, 'epoch': 0.18} {'loss': 0.8857, 'learning_rate': 1.9618698956252872e-05, 'epoch': 0.18} {'loss': 0.7996, 'learning_rate': 1.9618609418029194e-05, 'epoch': 0.18} {'loss': 0.8996, 'learning_rate': 1.9618519869498308e-05, 'epoch': 0.18} {'loss': 1.0389, 'learning_rate': 1.9618430310660308e-05, 'epoch': 0.18} {'loss': 0.9027, 'learning_rate': 1.9618340741515293e-05, 'epoch': 0.18} {'loss': 0.8152, 'learning_rate': 1.9618251162063357e-05, 'epoch': 0.18} {'loss': 1.0509, 'learning_rate': 1.96181615723046e-05, 'epoch': 0.18} {'loss': 0.9925, 'learning_rate': 1.9618071972239106e-05, 'epoch': 0.18} {'loss': 0.8201, 'learning_rate': 1.9617982361866988e-05, 'epoch': 0.18} {'loss': 0.8285, 'learning_rate': 1.9617892741188332e-05, 'epoch': 0.18} {'loss': 0.9895, 'learning_rate': 1.9617803110203234e-05, 'epoch': 0.18} {'loss': 0.9041, 'learning_rate': 1.961771346891179e-05, 'epoch': 0.18} {'loss': 0.9258, 'learning_rate': 1.9617623817314105e-05, 'epoch': 0.18} {'loss': 0.7947, 'learning_rate': 1.9617534155410264e-05, 'epoch': 0.18} {'loss': 1.0774, 'learning_rate': 1.9617444483200367e-05, 'epoch': 0.18} {'loss': 0.8092, 'learning_rate': 1.961735480068451e-05, 'epoch': 0.18} {'loss': 0.9702, 'learning_rate': 1.9617265107862792e-05, 'epoch': 0.18} {'loss': 0.7551, 'learning_rate': 1.96171754047353e-05, 'epoch': 0.18} {'loss': 0.8403, 'learning_rate': 1.9617085691302143e-05, 'epoch': 0.18} {'loss': 0.8042, 'learning_rate': 1.961699596756341e-05, 'epoch': 0.18} {'loss': 1.0068, 'learning_rate': 1.9616906233519196e-05, 'epoch': 0.18} {'loss': 0.8357, 'learning_rate': 1.96168164891696e-05, 'epoch': 0.18} {'loss': 0.82, 'learning_rate': 1.9616726734514716e-05, 'epoch': 0.18} {'loss': 0.9818, 'learning_rate': 1.961663696955464e-05, 'epoch': 0.18} {'loss': 0.9272, 'learning_rate': 1.9616547194289473e-05, 'epoch': 0.18} {'loss': 1.0061, 'learning_rate': 1.9616457408719306e-05, 'epoch': 0.18} {'loss': 0.7743, 'learning_rate': 1.9616367612844235e-05, 'epoch': 0.18} {'loss': 0.9744, 'learning_rate': 1.961627780666436e-05, 'epoch': 0.18} {'loss': 0.9333, 'learning_rate': 1.961618799017978e-05, 'epoch': 0.18} {'loss': 0.9353, 'learning_rate': 1.961609816339058e-05, 'epoch': 0.18} {'loss': 0.9822, 'learning_rate': 1.9616008326296866e-05, 'epoch': 0.18} {'loss': 0.9688, 'learning_rate': 1.961591847889873e-05, 'epoch': 0.18} {'loss': 0.7301, 'learning_rate': 1.961582862119627e-05, 'epoch': 0.18} {'loss': 0.8217, 'learning_rate': 1.961573875318958e-05, 'epoch': 0.18} {'loss': 0.7511, 'learning_rate': 1.961564887487876e-05, 'epoch': 0.18} {'loss': 0.7439, 'learning_rate': 1.9615558986263904e-05, 'epoch': 0.18} {'loss': 1.0156, 'learning_rate': 1.961546908734511e-05, 'epoch': 0.18} {'loss': 0.9179, 'learning_rate': 1.961537917812247e-05, 'epoch': 0.18} {'loss': 1.0316, 'learning_rate': 1.9615289258596087e-05, 'epoch': 0.18} {'loss': 0.7919, 'learning_rate': 1.961519932876605e-05, 'epoch': 0.18} {'loss': 0.8589, 'learning_rate': 1.961510938863246e-05, 'epoch': 0.18} {'loss': 0.7754, 'learning_rate': 1.9615019438195415e-05, 'epoch': 0.18} {'loss': 0.9052, 'learning_rate': 1.9614929477455007e-05, 'epoch': 0.18} {'loss': 1.0467, 'learning_rate': 1.9614839506411333e-05, 'epoch': 0.18} {'loss': 0.9954, 'learning_rate': 1.9614749525064493e-05, 'epoch': 0.18} {'loss': 1.0216, 'learning_rate': 1.961465953341458e-05, 'epoch': 0.18} {'loss': 0.907, 'learning_rate': 1.9614569531461694e-05, 'epoch': 0.18} {'loss': 1.0131, 'learning_rate': 1.9614479519205924e-05, 'epoch': 0.18} {'loss': 0.9269, 'learning_rate': 1.9614389496647374e-05, 'epoch': 0.18} {'loss': 0.7928, 'learning_rate': 1.9614299463786138e-05, 'epoch': 0.18} {'loss': 0.8071, 'learning_rate': 1.9614209420622315e-05, 'epoch': 0.18} {'loss': 0.8394, 'learning_rate': 1.9614119367155993e-05, 'epoch': 0.18} {'loss': 0.9578, 'learning_rate': 1.961402930338728e-05, 'epoch': 0.18} {'loss': 0.9299, 'learning_rate': 1.9613939229316266e-05, 'epoch': 0.18} {'loss': 1.0248, 'learning_rate': 1.9613849144943047e-05, 'epoch': 0.18} {'loss': 1.1572, 'learning_rate': 1.961375905026772e-05, 'epoch': 0.18} {'loss': 0.8675, 'learning_rate': 1.9613668945290383e-05, 'epoch': 0.18} {'loss': 1.0965, 'learning_rate': 1.9613578830011134e-05, 'epoch': 0.18} {'loss': 1.0581, 'learning_rate': 1.9613488704430063e-05, 'epoch': 0.18} {'loss': 0.8612, 'learning_rate': 1.9613398568547276e-05, 'epoch': 0.18} {'loss': 0.9061, 'learning_rate': 1.961330842236286e-05, 'epoch': 0.18} {'loss': 0.9797, 'learning_rate': 1.961321826587692e-05, 'epoch': 0.18} {'loss': 0.9336, 'learning_rate': 1.961312809908955e-05, 'epoch': 0.18} {'loss': 0.9847, 'learning_rate': 1.9613037922000843e-05, 'epoch': 0.18} {'loss': 0.9783, 'learning_rate': 1.96129477346109e-05, 'epoch': 0.18} {'loss': 0.9164, 'learning_rate': 1.9612857536919815e-05, 'epoch': 0.18} {'loss': 0.8234, 'learning_rate': 1.9612767328927687e-05, 'epoch': 0.18} {'loss': 1.0436, 'learning_rate': 1.9612677110634612e-05, 'epoch': 0.18} {'loss': 0.8529, 'learning_rate': 1.961258688204068e-05, 'epoch': 0.18} {'loss': 0.8848, 'learning_rate': 1.9612496643146e-05, 'epoch': 0.18} {'loss': 1.0283, 'learning_rate': 1.961240639395066e-05, 'epoch': 0.18} {'loss': 0.7045, 'learning_rate': 1.9612316134454756e-05, 'epoch': 0.18} {'loss': 0.7758, 'learning_rate': 1.961222586465839e-05, 'epoch': 0.18} {'loss': 0.9131, 'learning_rate': 1.961213558456166e-05, 'epoch': 0.18} {'loss': 1.0767, 'learning_rate': 1.9612045294164654e-05, 'epoch': 0.18} {'loss': 0.8184, 'learning_rate': 1.9611954993467473e-05, 'epoch': 0.18} {'loss': 1.1047, 'learning_rate': 1.961186468247022e-05, 'epoch': 0.18} {'loss': 1.1101, 'learning_rate': 1.961177436117298e-05, 'epoch': 0.18} {'loss': 0.9232, 'learning_rate': 1.9611684029575863e-05, 'epoch': 0.18} {'loss': 0.8695, 'learning_rate': 1.961159368767896e-05, 'epoch': 0.18} {'loss': 0.9983, 'learning_rate': 1.961150333548236e-05, 'epoch': 0.18} {'loss': 1.0485, 'learning_rate': 1.961141297298617e-05, 'epoch': 0.18} {'loss': 0.7674, 'learning_rate': 1.9611322600190484e-05, 'epoch': 0.18} {'loss': 0.8035, 'learning_rate': 1.9611232217095395e-05, 'epoch': 0.18} {'loss': 0.8518, 'learning_rate': 1.9611141823701006e-05, 'epoch': 0.18} {'loss': 1.059, 'learning_rate': 1.961105142000741e-05, 'epoch': 0.18} {'loss': 0.9367, 'learning_rate': 1.961096100601471e-05, 'epoch': 0.18} {'loss': 0.8349, 'learning_rate': 1.961087058172299e-05, 'epoch': 0.18} {'loss': 0.8071, 'learning_rate': 1.961078014713236e-05, 'epoch': 0.18} {'loss': 0.6995, 'learning_rate': 1.961068970224291e-05, 'epoch': 0.18} {'loss': 0.6703, 'learning_rate': 1.961059924705474e-05, 'epoch': 0.18} {'loss': 0.9674, 'learning_rate': 1.9610508781567942e-05, 'epoch': 0.18} {'loss': 1.0782, 'learning_rate': 1.9610418305782618e-05, 'epoch': 0.18} {'loss': 0.885, 'learning_rate': 1.9610327819698867e-05, 'epoch': 0.18} {'loss': 1.0279, 'learning_rate': 1.9610237323316777e-05, 'epoch': 0.18} {'loss': 1.0253, 'learning_rate': 1.961014681663645e-05, 'epoch': 0.18} {'loss': 0.8104, 'learning_rate': 1.961005629965799e-05, 'epoch': 0.18} {'loss': 0.8104, 'learning_rate': 1.9609965772381482e-05, 'epoch': 0.18} {'loss': 1.0275, 'learning_rate': 1.960987523480703e-05, 'epoch': 0.18} {'loss': 0.8293, 'learning_rate': 1.960978468693473e-05, 'epoch': 0.18} {'loss': 0.9226, 'learning_rate': 1.9609694128764678e-05, 'epoch': 0.18} {'loss': 0.938, 'learning_rate': 1.960960356029697e-05, 'epoch': 0.18} {'loss': 1.0053, 'learning_rate': 1.9609512981531705e-05, 'epoch': 0.18} {'loss': 0.9926, 'learning_rate': 1.9609422392468978e-05, 'epoch': 0.18} {'loss': 0.8393, 'learning_rate': 1.9609331793108892e-05, 'epoch': 0.18} {'loss': 0.9892, 'learning_rate': 1.9609241183451538e-05, 'epoch': 0.18} {'loss': 1.016, 'learning_rate': 1.960915056349701e-05, 'epoch': 0.18} {'loss': 0.8374, 'learning_rate': 1.9609059933245417e-05, 'epoch': 0.18} {'loss': 0.8308, 'learning_rate': 1.9608969292696843e-05, 'epoch': 0.18} {'loss': 0.9763, 'learning_rate': 1.9608878641851397e-05, 'epoch': 0.18} {'loss': 0.9787, 'learning_rate': 1.9608787980709165e-05, 'epoch': 0.18} {'loss': 1.2055, 'learning_rate': 1.960869730927025e-05, 'epoch': 0.18} {'loss': 0.7907, 'learning_rate': 1.960860662753475e-05, 'epoch': 0.18} {'loss': 0.8962, 'learning_rate': 1.9608515935502762e-05, 'epoch': 0.18} {'loss': 1.0898, 'learning_rate': 1.9608425233174383e-05, 'epoch': 0.18} {'loss': 1.1063, 'learning_rate': 1.9608334520549705e-05, 'epoch': 0.18} {'loss': 1.1071, 'learning_rate': 1.9608243797628833e-05, 'epoch': 0.18} {'loss': 0.9635, 'learning_rate': 1.9608153064411856e-05, 'epoch': 0.18} {'loss': 0.7896, 'learning_rate': 1.960806232089888e-05, 'epoch': 0.18} {'loss': 0.7779, 'learning_rate': 1.9607971567089995e-05, 'epoch': 0.18} {'loss': 0.9893, 'learning_rate': 1.9607880802985307e-05, 'epoch': 0.18} {'loss': 0.9704, 'learning_rate': 1.96077900285849e-05, 'epoch': 0.18} {'loss': 0.9132, 'learning_rate': 1.9607699243888886e-05, 'epoch': 0.18} {'loss': 0.9822, 'learning_rate': 1.9607608448897352e-05, 'epoch': 0.18} {'loss': 0.682, 'learning_rate': 1.9607517643610397e-05, 'epoch': 0.18} {'loss': 0.9685, 'learning_rate': 1.960742682802812e-05, 'epoch': 0.18} {'loss': 1.0007, 'learning_rate': 1.960733600215062e-05, 'epoch': 0.18} {'loss': 0.9612, 'learning_rate': 1.9607245165977987e-05, 'epoch': 0.18} {'loss': 0.8596, 'learning_rate': 1.960715431951033e-05, 'epoch': 0.18} {'loss': 0.9923, 'learning_rate': 1.960706346274774e-05, 'epoch': 0.18} {'loss': 0.9071, 'learning_rate': 1.960697259569031e-05, 'epoch': 0.18} {'loss': 0.9029, 'learning_rate': 1.9606881718338144e-05, 'epoch': 0.18} {'loss': 0.887, 'learning_rate': 1.9606790830691336e-05, 'epoch': 0.18} {'loss': 0.8438, 'learning_rate': 1.9606699932749985e-05, 'epoch': 0.18} {'loss': 0.955, 'learning_rate': 1.960660902451419e-05, 'epoch': 0.18} {'loss': 0.9245, 'learning_rate': 1.9606518105984047e-05, 'epoch': 0.18} {'loss': 0.9065, 'learning_rate': 1.960642717715965e-05, 'epoch': 0.18} {'loss': 0.9528, 'learning_rate': 1.96063362380411e-05, 'epoch': 0.18} {'loss': 0.8149, 'learning_rate': 1.9606245288628495e-05, 'epoch': 0.18} {'loss': 0.7559, 'learning_rate': 1.9606154328921928e-05, 'epoch': 0.18} {'loss': 0.8857, 'learning_rate': 1.9606063358921505e-05, 'epoch': 0.18} {'loss': 0.9522, 'learning_rate': 1.9605972378627314e-05, 'epoch': 0.18} {'loss': 0.8792, 'learning_rate': 1.9605881388039457e-05, 'epoch': 0.19} {'loss': 0.8936, 'learning_rate': 1.960579038715803e-05, 'epoch': 0.19} {'loss': 0.8374, 'learning_rate': 1.9605699375983134e-05, 'epoch': 0.19} {'loss': 0.858, 'learning_rate': 1.9605608354514865e-05, 'epoch': 0.19} {'loss': 0.776, 'learning_rate': 1.9605517322753316e-05, 'epoch': 0.19} {'loss': 0.9445, 'learning_rate': 1.960542628069859e-05, 'epoch': 0.19} {'loss': 0.8863, 'learning_rate': 1.9605335228350785e-05, 'epoch': 0.19} {'loss': 1.1287, 'learning_rate': 1.9605244165709992e-05, 'epoch': 0.19} {'loss': 1.0414, 'learning_rate': 1.9605153092776316e-05, 'epoch': 0.19} {'loss': 0.807, 'learning_rate': 1.960506200954985e-05, 'epoch': 0.19} {'loss': 0.9068, 'learning_rate': 1.9604970916030693e-05, 'epoch': 0.19} {'loss': 0.723, 'learning_rate': 1.9604879812218943e-05, 'epoch': 0.19} {'loss': 0.8735, 'learning_rate': 1.96047886981147e-05, 'epoch': 0.19} {'loss': 0.9524, 'learning_rate': 1.9604697573718055e-05, 'epoch': 0.19} {'loss': 0.7674, 'learning_rate': 1.9604606439029115e-05, 'epoch': 0.19} {'loss': 0.9076, 'learning_rate': 1.9604515294047968e-05, 'epoch': 0.19} {'loss': 0.9342, 'learning_rate': 1.9604424138774717e-05, 'epoch': 0.19} {'loss': 1.0389, 'learning_rate': 1.9604332973209457e-05, 'epoch': 0.19} {'loss': 0.9717, 'learning_rate': 1.9604241797352293e-05, 'epoch': 0.19} {'loss': 0.991, 'learning_rate': 1.960415061120331e-05, 'epoch': 0.19} {'loss': 0.861, 'learning_rate': 1.9604059414762617e-05, 'epoch': 0.19} {'loss': 0.816, 'learning_rate': 1.960396820803031e-05, 'epoch': 0.19} {'loss': 0.809, 'learning_rate': 1.9603876991006476e-05, 'epoch': 0.19} {'loss': 0.9536, 'learning_rate': 1.9603785763691227e-05, 'epoch': 0.19} {'loss': 0.9585, 'learning_rate': 1.9603694526084656e-05, 'epoch': 0.19} {'loss': 0.9704, 'learning_rate': 1.9603603278186855e-05, 'epoch': 0.19} {'loss': 0.825, 'learning_rate': 1.960351201999793e-05, 'epoch': 0.19} {'loss': 0.968, 'learning_rate': 1.9603420751517972e-05, 'epoch': 0.19} {'loss': 0.9645, 'learning_rate': 1.9603329472747084e-05, 'epoch': 0.19} {'loss': 0.8171, 'learning_rate': 1.960323818368536e-05, 'epoch': 0.19} {'loss': 0.9076, 'learning_rate': 1.9603146884332898e-05, 'epoch': 0.19} {'loss': 0.9474, 'learning_rate': 1.9603055574689804e-05, 'epoch': 0.19} {'loss': 0.8861, 'learning_rate': 1.9602964254756164e-05, 'epoch': 0.19} {'loss': 1.033, 'learning_rate': 1.9602872924532083e-05, 'epoch': 0.19} {'loss': 0.8952, 'learning_rate': 1.9602781584017656e-05, 'epoch': 0.19} {'loss': 0.8839, 'learning_rate': 1.9602690233212982e-05, 'epoch': 0.19} {'loss': 0.8563, 'learning_rate': 1.960259887211816e-05, 'epoch': 0.19} {'loss': 0.7252, 'learning_rate': 1.9602507500733285e-05, 'epoch': 0.19} {'loss': 0.7539, 'learning_rate': 1.9602416119058457e-05, 'epoch': 0.19} {'loss': 0.8157, 'learning_rate': 1.9602324727093772e-05, 'epoch': 0.19} {'loss': 0.7465, 'learning_rate': 1.960223332483933e-05, 'epoch': 0.19} {'loss': 0.8788, 'learning_rate': 1.9602141912295232e-05, 'epoch': 0.19} {'loss': 0.8887, 'learning_rate': 1.960205048946157e-05, 'epoch': 0.19} {'loss': 1.0572, 'learning_rate': 1.9601959056338442e-05, 'epoch': 0.19} {'loss': 1.0361, 'learning_rate': 1.9601867612925952e-05, 'epoch': 0.19} {'loss': 0.8665, 'learning_rate': 1.960177615922419e-05, 'epoch': 0.19} {'loss': 0.7141, 'learning_rate': 1.960168469523326e-05, 'epoch': 0.19} {'loss': 0.9602, 'learning_rate': 1.960159322095326e-05, 'epoch': 0.19} {'loss': 0.7563, 'learning_rate': 1.9601501736384286e-05, 'epoch': 0.19} {'loss': 1.0161, 'learning_rate': 1.9601410241526433e-05, 'epoch': 0.19} {'loss': 0.9674, 'learning_rate': 1.9601318736379803e-05, 'epoch': 0.19} {'loss': 1.0115, 'learning_rate': 1.9601227220944497e-05, 'epoch': 0.19} {'loss': 0.8634, 'learning_rate': 1.9601135695220608e-05, 'epoch': 0.19} {'loss': 1.0034, 'learning_rate': 1.9601044159208236e-05, 'epoch': 0.19} {'loss': 0.9614, 'learning_rate': 1.9600952612907477e-05, 'epoch': 0.19} {'loss': 0.9981, 'learning_rate': 1.960086105631843e-05, 'epoch': 0.19} {'loss': 0.9472, 'learning_rate': 1.9600769489441196e-05, 'epoch': 0.19} {'loss': 0.8995, 'learning_rate': 1.960067791227587e-05, 'epoch': 0.19} {'loss': 0.893, 'learning_rate': 1.960058632482255e-05, 'epoch': 0.19} {'loss': 0.9, 'learning_rate': 1.960049472708134e-05, 'epoch': 0.19} {'loss': 0.7707, 'learning_rate': 1.960040311905233e-05, 'epoch': 0.19} {'loss': 0.9963, 'learning_rate': 1.9600311500735622e-05, 'epoch': 0.19} {'loss': 0.9417, 'learning_rate': 1.960021987213131e-05, 'epoch': 0.19} {'loss': 0.7712, 'learning_rate': 1.96001282332395e-05, 'epoch': 0.19} {'loss': 0.8506, 'learning_rate': 1.9600036584060283e-05, 'epoch': 0.19} {'loss': 0.8883, 'learning_rate': 1.9599944924593764e-05, 'epoch': 0.19} {'loss': 0.8873, 'learning_rate': 1.9599853254840037e-05, 'epoch': 0.19} {'loss': 0.9758, 'learning_rate': 1.9599761574799202e-05, 'epoch': 0.19} {'loss': 0.9372, 'learning_rate': 1.9599669884471353e-05, 'epoch': 0.19} {'loss': 0.9628, 'learning_rate': 1.959957818385659e-05, 'epoch': 0.19} {'loss': 0.8799, 'learning_rate': 1.9599486472955015e-05, 'epoch': 0.19} {'loss': 0.8339, 'learning_rate': 1.9599394751766726e-05, 'epoch': 0.19} {'loss': 0.8543, 'learning_rate': 1.9599303020291818e-05, 'epoch': 0.19} {'loss': 0.7849, 'learning_rate': 1.9599211278530387e-05, 'epoch': 0.19} {'loss': 0.9058, 'learning_rate': 1.9599119526482536e-05, 'epoch': 0.19} {'loss': 0.9398, 'learning_rate': 1.9599027764148365e-05, 'epoch': 0.19} {'loss': 1.0262, 'learning_rate': 1.9598935991527968e-05, 'epoch': 0.19} {'loss': 1.0104, 'learning_rate': 1.9598844208621443e-05, 'epoch': 0.19} {'loss': 1.0198, 'learning_rate': 1.9598752415428893e-05, 'epoch': 0.19} {'loss': 0.7736, 'learning_rate': 1.959866061195041e-05, 'epoch': 0.19} {'loss': 0.8327, 'learning_rate': 1.95985687981861e-05, 'epoch': 0.19} {'loss': 0.7932, 'learning_rate': 1.9598476974136055e-05, 'epoch': 0.19} {'loss': 0.8843, 'learning_rate': 1.9598385139800373e-05, 'epoch': 0.19} {'loss': 0.9051, 'learning_rate': 1.9598293295179157e-05, 'epoch': 0.19} {'loss': 0.9545, 'learning_rate': 1.9598201440272504e-05, 'epoch': 0.19} {'loss': 0.7193, 'learning_rate': 1.9598109575080513e-05, 'epoch': 0.19} {'loss': 0.8118, 'learning_rate': 1.959801769960328e-05, 'epoch': 0.19} {'loss': 1.1, 'learning_rate': 1.9597925813840907e-05, 'epoch': 0.19} {'loss': 0.9882, 'learning_rate': 1.9597833917793484e-05, 'epoch': 0.19} {'loss': 1.0399, 'learning_rate': 1.959774201146112e-05, 'epoch': 0.19} {'loss': 0.9515, 'learning_rate': 1.959765009484391e-05, 'epoch': 0.19} {'loss': 0.9885, 'learning_rate': 1.959755816794195e-05, 'epoch': 0.19} {'loss': 0.8316, 'learning_rate': 1.959746623075534e-05, 'epoch': 0.19} {'loss': 1.0526, 'learning_rate': 1.959737428328418e-05, 'epoch': 0.19} {'loss': 0.9901, 'learning_rate': 1.959728232552857e-05, 'epoch': 0.19} {'loss': 1.0421, 'learning_rate': 1.9597190357488597e-05, 'epoch': 0.19} {'loss': 0.9257, 'learning_rate': 1.9597098379164375e-05, 'epoch': 0.19} {'loss': 0.9998, 'learning_rate': 1.9597006390555994e-05, 'epoch': 0.19} {'loss': 0.7764, 'learning_rate': 1.9596914391663556e-05, 'epoch': 0.19} {'loss': 0.8213, 'learning_rate': 1.959682238248716e-05, 'epoch': 0.19} {'loss': 1.1171, 'learning_rate': 1.95967303630269e-05, 'epoch': 0.19} {'loss': 0.9796, 'learning_rate': 1.9596638333282872e-05, 'epoch': 0.19} {'loss': 0.9657, 'learning_rate': 1.959654629325519e-05, 'epoch': 0.19} {'loss': 1.0063, 'learning_rate': 1.9596454242943935e-05, 'epoch': 0.19} {'loss': 0.9817, 'learning_rate': 1.9596362182349216e-05, 'epoch': 0.19} {'loss': 0.9362, 'learning_rate': 1.959627011147113e-05, 'epoch': 0.19} {'loss': 0.809, 'learning_rate': 1.959617803030977e-05, 'epoch': 0.19} {'loss': 0.8878, 'learning_rate': 1.9596085938865243e-05, 'epoch': 0.19} {'loss': 0.9716, 'learning_rate': 1.9595993837137645e-05, 'epoch': 0.19} {'loss': 1.0515, 'learning_rate': 1.959590172512707e-05, 'epoch': 0.19} {'loss': 1.0422, 'learning_rate': 1.959580960283362e-05, 'epoch': 0.19} {'loss': 1.0532, 'learning_rate': 1.9595717470257398e-05, 'epoch': 0.19} {'loss': 0.9678, 'learning_rate': 1.9595625327398496e-05, 'epoch': 0.19} {'loss': 0.8093, 'learning_rate': 1.9595533174257014e-05, 'epoch': 0.19} {'loss': 1.1245, 'learning_rate': 1.9595441010833054e-05, 'epoch': 0.19} {'loss': 1.1464, 'learning_rate': 1.9595348837126714e-05, 'epoch': 0.19} {'loss': 0.8778, 'learning_rate': 1.9595256653138088e-05, 'epoch': 0.19} {'loss': 0.8595, 'learning_rate': 1.9595164458867282e-05, 'epoch': 0.19} {'loss': 0.7778, 'learning_rate': 1.959507225431439e-05, 'epoch': 0.19} {'loss': 1.0932, 'learning_rate': 1.959498003947951e-05, 'epoch': 0.19} {'loss': 0.9455, 'learning_rate': 1.959488781436275e-05, 'epoch': 0.19} {'loss': 0.945, 'learning_rate': 1.9594795578964194e-05, 'epoch': 0.19} {'loss': 0.8434, 'learning_rate': 1.959470333328395e-05, 'epoch': 0.19} {'loss': 0.9314, 'learning_rate': 1.9594611077322118e-05, 'epoch': 0.19} {'loss': 1.0195, 'learning_rate': 1.9594518811078793e-05, 'epoch': 0.19} {'loss': 0.8308, 'learning_rate': 1.9594426534554075e-05, 'epoch': 0.19} {'loss': 0.9193, 'learning_rate': 1.9594334247748063e-05, 'epoch': 0.19} {'loss': 1.0567, 'learning_rate': 1.9594241950660854e-05, 'epoch': 0.19} {'loss': 0.9257, 'learning_rate': 1.959414964329255e-05, 'epoch': 0.19} {'loss': 0.8871, 'learning_rate': 1.959405732564325e-05, 'epoch': 0.19} {'loss': 1.0614, 'learning_rate': 1.9593964997713052e-05, 'epoch': 0.19} {'loss': 0.9774, 'learning_rate': 1.9593872659502054e-05, 'epoch': 0.19} {'loss': 0.8621, 'learning_rate': 1.9593780311010356e-05, 'epoch': 0.19} {'loss': 1.0524, 'learning_rate': 1.9593687952238057e-05, 'epoch': 0.19} {'loss': 0.89, 'learning_rate': 1.9593595583185255e-05, 'epoch': 0.19} {'loss': 0.756, 'learning_rate': 1.9593503203852048e-05, 'epoch': 0.19} {'loss': 0.7903, 'learning_rate': 1.9593410814238537e-05, 'epoch': 0.19} {'loss': 0.9658, 'learning_rate': 1.9593318414344818e-05, 'epoch': 0.19} {'loss': 0.8162, 'learning_rate': 1.9593226004171e-05, 'epoch': 0.19} {'loss': 0.8801, 'learning_rate': 1.9593133583717168e-05, 'epoch': 0.19} {'loss': 1.1005, 'learning_rate': 1.959304115298343e-05, 'epoch': 0.19} {'loss': 0.8138, 'learning_rate': 1.959294871196988e-05, 'epoch': 0.19} {'loss': 0.7824, 'learning_rate': 1.9592856260676622e-05, 'epoch': 0.19} {'loss': 0.8986, 'learning_rate': 1.9592763799103753e-05, 'epoch': 0.19} {'loss': 0.946, 'learning_rate': 1.959267132725137e-05, 'epoch': 0.19} {'loss': 1.0059, 'learning_rate': 1.9592578845119577e-05, 'epoch': 0.19} {'loss': 0.8669, 'learning_rate': 1.9592486352708464e-05, 'epoch': 0.19} {'loss': 0.9479, 'learning_rate': 1.9592393850018142e-05, 'epoch': 0.19} {'loss': 0.9664, 'learning_rate': 1.9592301337048702e-05, 'epoch': 0.19} {'loss': 0.8008, 'learning_rate': 1.9592208813800244e-05, 'epoch': 0.19} {'loss': 0.8568, 'learning_rate': 1.959211628027287e-05, 'epoch': 0.19} {'loss': 0.9145, 'learning_rate': 1.9592023736466678e-05, 'epoch': 0.19} {'loss': 1.1083, 'learning_rate': 1.9591931182381768e-05, 'epoch': 0.19} {'loss': 0.8864, 'learning_rate': 1.9591838618018235e-05, 'epoch': 0.19} {'loss': 0.8669, 'learning_rate': 1.9591746043376185e-05, 'epoch': 0.19} {'loss': 0.7832, 'learning_rate': 1.959165345845571e-05, 'epoch': 0.19} {'loss': 0.8323, 'learning_rate': 1.9591560863256912e-05, 'epoch': 0.19} {'loss': 0.9299, 'learning_rate': 1.9591468257779894e-05, 'epoch': 0.19} {'loss': 0.8678, 'learning_rate': 1.959137564202475e-05, 'epoch': 0.19} {'loss': 1.0008, 'learning_rate': 1.9591283015991582e-05, 'epoch': 0.19} {'loss': 0.8436, 'learning_rate': 1.9591190379680488e-05, 'epoch': 0.19} {'loss': 0.8618, 'learning_rate': 1.9591097733091567e-05, 'epoch': 0.19} {'loss': 0.9559, 'learning_rate': 1.959100507622492e-05, 'epoch': 0.19} {'loss': 1.0361, 'learning_rate': 1.9590912409080646e-05, 'epoch': 0.19} {'loss': 0.6996, 'learning_rate': 1.9590819731658844e-05, 'epoch': 0.19} {'loss': 0.8218, 'learning_rate': 1.9590727043959613e-05, 'epoch': 0.19} {'loss': 0.9288, 'learning_rate': 1.9590634345983053e-05, 'epoch': 0.19} {'loss': 1.128, 'learning_rate': 1.959054163772926e-05, 'epoch': 0.19} {'loss': 0.8275, 'learning_rate': 1.959044891919834e-05, 'epoch': 0.19} {'loss': 0.9271, 'learning_rate': 1.9590356190390385e-05, 'epoch': 0.19} {'loss': 0.9642, 'learning_rate': 1.95902634513055e-05, 'epoch': 0.19} {'loss': 0.9282, 'learning_rate': 1.959017070194378e-05, 'epoch': 0.19} {'loss': 0.8944, 'learning_rate': 1.9590077942305327e-05, 'epoch': 0.19} {'loss': 0.8432, 'learning_rate': 1.9589985172390242e-05, 'epoch': 0.19} {'loss': 0.7971, 'learning_rate': 1.958989239219862e-05, 'epoch': 0.19} {'loss': 0.9133, 'learning_rate': 1.9589799601730567e-05, 'epoch': 0.19} {'loss': 0.988, 'learning_rate': 1.9589706800986172e-05, 'epoch': 0.19} {'loss': 1.0731, 'learning_rate': 1.9589613989965544e-05, 'epoch': 0.19} {'loss': 0.816, 'learning_rate': 1.9589521168668776e-05, 'epoch': 0.19} {'loss': 0.8421, 'learning_rate': 1.9589428337095975e-05, 'epoch': 0.19} {'loss': 0.8581, 'learning_rate': 1.9589335495247233e-05, 'epoch': 0.19} {'loss': 0.8978, 'learning_rate': 1.9589242643122654e-05, 'epoch': 0.19} {'loss': 0.8155, 'learning_rate': 1.9589149780722335e-05, 'epoch': 0.19} {'loss': 1.0084, 'learning_rate': 1.958905690804638e-05, 'epoch': 0.19} {'loss': 0.8539, 'learning_rate': 1.9588964025094882e-05, 'epoch': 0.19} {'loss': 0.8304, 'learning_rate': 1.958887113186794e-05, 'epoch': 0.19} {'loss': 0.7765, 'learning_rate': 1.9588778228365664e-05, 'epoch': 0.19} {'loss': 0.9456, 'learning_rate': 1.958868531458814e-05, 'epoch': 0.19} {'loss': 1.0647, 'learning_rate': 1.9588592390535483e-05, 'epoch': 0.19} {'loss': 0.8766, 'learning_rate': 1.9588499456207776e-05, 'epoch': 0.19} {'loss': 0.8655, 'learning_rate': 1.9588406511605132e-05, 'epoch': 0.19} {'loss': 0.8522, 'learning_rate': 1.958831355672764e-05, 'epoch': 0.19} {'loss': 0.9089, 'learning_rate': 1.9588220591575408e-05, 'epoch': 0.19} {'loss': 0.8701, 'learning_rate': 1.958812761614853e-05, 'epoch': 0.19} {'loss': 0.8762, 'learning_rate': 1.958803463044711e-05, 'epoch': 0.19} {'loss': 0.8996, 'learning_rate': 1.9587941634471244e-05, 'epoch': 0.19} {'loss': 1.032, 'learning_rate': 1.9587848628221034e-05, 'epoch': 0.19} {'loss': 0.7317, 'learning_rate': 1.958775561169658e-05, 'epoch': 0.19} {'loss': 0.9565, 'learning_rate': 1.9587662584897976e-05, 'epoch': 0.19} {'loss': 0.9766, 'learning_rate': 1.958756954782533e-05, 'epoch': 0.19} {'loss': 0.8648, 'learning_rate': 1.9587476500478737e-05, 'epoch': 0.19} {'loss': 0.9334, 'learning_rate': 1.9587383442858297e-05, 'epoch': 0.19} {'loss': 0.7986, 'learning_rate': 1.9587290374964112e-05, 'epoch': 0.19} {'loss': 1.0298, 'learning_rate': 1.958719729679628e-05, 'epoch': 0.19} {'loss': 0.9924, 'learning_rate': 1.9587104208354898e-05, 'epoch': 0.19} {'loss': 1.0933, 'learning_rate': 1.958701110964007e-05, 'epoch': 0.19} {'loss': 0.9971, 'learning_rate': 1.9586918000651897e-05, 'epoch': 0.19} {'loss': 1.0337, 'learning_rate': 1.9586824881390473e-05, 'epoch': 0.19} {'loss': 0.9346, 'learning_rate': 1.9586731751855902e-05, 'epoch': 0.19} {'loss': 0.9553, 'learning_rate': 1.958663861204828e-05, 'epoch': 0.19} {'loss': 0.9665, 'learning_rate': 1.9586545461967713e-05, 'epoch': 0.19} {'loss': 0.9866, 'learning_rate': 1.9586452301614295e-05, 'epoch': 0.19} {'loss': 0.9211, 'learning_rate': 1.958635913098813e-05, 'epoch': 0.19} {'loss': 0.8295, 'learning_rate': 1.9586265950089315e-05, 'epoch': 0.19} {'loss': 0.7508, 'learning_rate': 1.9586172758917952e-05, 'epoch': 0.19} {'loss': 0.7701, 'learning_rate': 1.958607955747414e-05, 'epoch': 0.19} {'loss': 0.9419, 'learning_rate': 1.958598634575798e-05, 'epoch': 0.19} {'loss': 0.9597, 'learning_rate': 1.9585893123769565e-05, 'epoch': 0.19} {'loss': 0.7478, 'learning_rate': 1.9585799891509003e-05, 'epoch': 0.19} {'loss': 0.9805, 'learning_rate': 1.958570664897639e-05, 'epoch': 0.19} {'loss': 0.9328, 'learning_rate': 1.958561339617183e-05, 'epoch': 0.19} {'loss': 0.9802, 'learning_rate': 1.9585520133095417e-05, 'epoch': 0.19} {'loss': 0.9221, 'learning_rate': 1.9585426859747256e-05, 'epoch': 0.19} {'loss': 0.928, 'learning_rate': 1.9585333576127444e-05, 'epoch': 0.19} {'loss': 1.1004, 'learning_rate': 1.9585240282236084e-05, 'epoch': 0.19} {'loss': 0.9504, 'learning_rate': 1.9585146978073273e-05, 'epoch': 0.19} {'loss': 0.8498, 'learning_rate': 1.958505366363911e-05, 'epoch': 0.19} {'loss': 0.9295, 'learning_rate': 1.95849603389337e-05, 'epoch': 0.19} {'loss': 0.9436, 'learning_rate': 1.9584867003957137e-05, 'epoch': 0.19} {'loss': 1.0209, 'learning_rate': 1.9584773658709522e-05, 'epoch': 0.19} {'loss': 0.9424, 'learning_rate': 1.9584680303190962e-05, 'epoch': 0.19} {'loss': 0.8716, 'learning_rate': 1.958458693740155e-05, 'epoch': 0.19} {'loss': 1.061, 'learning_rate': 1.9584493561341388e-05, 'epoch': 0.19} {'loss': 0.8328, 'learning_rate': 1.9584400175010575e-05, 'epoch': 0.19} {'loss': 0.8056, 'learning_rate': 1.9584306778409216e-05, 'epoch': 0.19} {'loss': 1.0264, 'learning_rate': 1.9584213371537403e-05, 'epoch': 0.19} {'loss': 0.9851, 'learning_rate': 1.958411995439524e-05, 'epoch': 0.19} {'loss': 0.9372, 'learning_rate': 1.958402652698283e-05, 'epoch': 0.19} {'loss': 0.9942, 'learning_rate': 1.9583933089300272e-05, 'epoch': 0.19} {'loss': 0.8292, 'learning_rate': 1.9583839641347663e-05, 'epoch': 0.19} {'loss': 0.8596, 'learning_rate': 1.9583746183125104e-05, 'epoch': 0.19} {'loss': 0.8591, 'learning_rate': 1.9583652714632694e-05, 'epoch': 0.19} {'loss': 0.9023, 'learning_rate': 1.958355923587054e-05, 'epoch': 0.19} {'loss': 1.0597, 'learning_rate': 1.9583465746838732e-05, 'epoch': 0.19} {'loss': 0.8585, 'learning_rate': 1.958337224753738e-05, 'epoch': 0.19} {'loss': 0.7879, 'learning_rate': 1.958327873796658e-05, 'epoch': 0.19} {'loss': 1.0187, 'learning_rate': 1.958318521812643e-05, 'epoch': 0.19} {'loss': 0.9863, 'learning_rate': 1.9583091688017027e-05, 'epoch': 0.19} {'loss': 0.9953, 'learning_rate': 1.9582998147638483e-05, 'epoch': 0.19} {'loss': 0.8973, 'learning_rate': 1.958290459699089e-05, 'epoch': 0.19} {'loss': 0.7963, 'learning_rate': 1.9582811036074352e-05, 'epoch': 0.19} {'loss': 0.9081, 'learning_rate': 1.9582717464888962e-05, 'epoch': 0.19} {'loss': 0.9266, 'learning_rate': 1.958262388343483e-05, 'epoch': 0.19} {'loss': 0.817, 'learning_rate': 1.9582530291712048e-05, 'epoch': 0.19} {'loss': 0.9901, 'learning_rate': 1.9582436689720724e-05, 'epoch': 0.19} {'loss': 0.9175, 'learning_rate': 1.958234307746095e-05, 'epoch': 0.19} {'loss': 0.9605, 'learning_rate': 1.9582249454932832e-05, 'epoch': 0.19} {'loss': 0.6726, 'learning_rate': 1.958215582213647e-05, 'epoch': 0.19} {'loss': 0.9235, 'learning_rate': 1.958206217907196e-05, 'epoch': 0.19} {'loss': 0.9298, 'learning_rate': 1.958196852573941e-05, 'epoch': 0.19} {'loss': 0.9558, 'learning_rate': 1.9581874862138914e-05, 'epoch': 0.19} {'loss': 0.9295, 'learning_rate': 1.9581781188270573e-05, 'epoch': 0.19} {'loss': 1.0383, 'learning_rate': 1.958168750413449e-05, 'epoch': 0.19} {'loss': 0.9065, 'learning_rate': 1.9581593809730765e-05, 'epoch': 0.19} {'loss': 1.021, 'learning_rate': 1.9581500105059498e-05, 'epoch': 0.19} {'loss': 0.8582, 'learning_rate': 1.958140639012079e-05, 'epoch': 0.19} {'loss': 0.8852, 'learning_rate': 1.9581312664914732e-05, 'epoch': 0.19} {'loss': 0.9151, 'learning_rate': 1.9581218929441437e-05, 'epoch': 0.19} {'loss': 0.9246, 'learning_rate': 1.9581125183701005e-05, 'epoch': 0.19} {'loss': 1.0737, 'learning_rate': 1.9581031427693528e-05, 'epoch': 0.19} {'loss': 0.9885, 'learning_rate': 1.9580937661419116e-05, 'epoch': 0.19} {'loss': 0.9818, 'learning_rate': 1.958084388487786e-05, 'epoch': 0.19} {'loss': 1.0922, 'learning_rate': 1.9580750098069865e-05, 'epoch': 0.19} {'loss': 0.7639, 'learning_rate': 1.9580656300995235e-05, 'epoch': 0.19} {'loss': 0.9947, 'learning_rate': 1.9580562493654064e-05, 'epoch': 0.19} {'loss': 0.8381, 'learning_rate': 1.9580468676046457e-05, 'epoch': 0.19} {'loss': 0.9108, 'learning_rate': 1.9580374848172514e-05, 'epoch': 0.19} {'loss': 0.7926, 'learning_rate': 1.958028101003233e-05, 'epoch': 0.19} {'loss': 0.8227, 'learning_rate': 1.9580187161626016e-05, 'epoch': 0.19} {'loss': 0.9387, 'learning_rate': 1.9580093302953663e-05, 'epoch': 0.19} {'loss': 0.919, 'learning_rate': 1.957999943401538e-05, 'epoch': 0.19} {'loss': 0.8414, 'learning_rate': 1.957990555481126e-05, 'epoch': 0.19} {'loss': 0.9684, 'learning_rate': 1.9579811665341407e-05, 'epoch': 0.19} {'loss': 1.0916, 'learning_rate': 1.957971776560592e-05, 'epoch': 0.19} {'loss': 0.9848, 'learning_rate': 1.95796238556049e-05, 'epoch': 0.19} {'loss': 0.9887, 'learning_rate': 1.957952993533845e-05, 'epoch': 0.19} {'loss': 0.8147, 'learning_rate': 1.9579436004806667e-05, 'epoch': 0.19} {'loss': 0.9925, 'learning_rate': 1.957934206400966e-05, 'epoch': 0.19} {'loss': 0.8563, 'learning_rate': 1.957924811294752e-05, 'epoch': 0.19} {'loss': 0.8852, 'learning_rate': 1.957915415162035e-05, 'epoch': 0.19} {'loss': 0.7262, 'learning_rate': 1.957906018002825e-05, 'epoch': 0.19} {'loss': 0.9356, 'learning_rate': 1.9578966198171324e-05, 'epoch': 0.19} {'loss': 0.9646, 'learning_rate': 1.9578872206049672e-05, 'epoch': 0.19} {'loss': 0.7687, 'learning_rate': 1.9578778203663393e-05, 'epoch': 0.19} {'loss': 0.879, 'learning_rate': 1.957868419101259e-05, 'epoch': 0.19} {'loss': 0.7796, 'learning_rate': 1.957859016809736e-05, 'epoch': 0.19} {'loss': 0.9338, 'learning_rate': 1.9578496134917808e-05, 'epoch': 0.19} {'loss': 0.877, 'learning_rate': 1.957840209147403e-05, 'epoch': 0.19} {'loss': 0.9983, 'learning_rate': 1.9578308037766133e-05, 'epoch': 0.19} {'loss': 0.7584, 'learning_rate': 1.9578213973794217e-05, 'epoch': 0.19} {'loss': 0.8032, 'learning_rate': 1.9578119899558375e-05, 'epoch': 0.19} {'loss': 0.9903, 'learning_rate': 1.9578025815058714e-05, 'epoch': 0.19} {'loss': 0.8788, 'learning_rate': 1.9577931720295337e-05, 'epoch': 0.19} {'loss': 0.9113, 'learning_rate': 1.9577837615268336e-05, 'epoch': 0.19} {'loss': 0.9718, 'learning_rate': 1.957774349997782e-05, 'epoch': 0.19} {'loss': 1.0678, 'learning_rate': 1.957764937442389e-05, 'epoch': 0.19} {'loss': 0.9939, 'learning_rate': 1.9577555238606644e-05, 'epoch': 0.19} {'loss': 0.7064, 'learning_rate': 1.957746109252618e-05, 'epoch': 0.19} {'loss': 0.9345, 'learning_rate': 1.9577366936182606e-05, 'epoch': 0.19} {'loss': 0.9156, 'learning_rate': 1.9577272769576016e-05, 'epoch': 0.19} {'loss': 0.8386, 'learning_rate': 1.9577178592706513e-05, 'epoch': 0.19} {'loss': 0.929, 'learning_rate': 1.9577084405574197e-05, 'epoch': 0.19} {'loss': 0.9259, 'learning_rate': 1.9576990208179175e-05, 'epoch': 0.19} {'loss': 0.9436, 'learning_rate': 1.9576896000521543e-05, 'epoch': 0.19} {'loss': 0.8301, 'learning_rate': 1.9576801782601402e-05, 'epoch': 0.19} {'loss': 0.819, 'learning_rate': 1.9576707554418854e-05, 'epoch': 0.19} {'loss': 1.042, 'learning_rate': 1.9576613315973996e-05, 'epoch': 0.19} {'loss': 0.7783, 'learning_rate': 1.957651906726694e-05, 'epoch': 0.19} {'loss': 0.8585, 'learning_rate': 1.9576424808297775e-05, 'epoch': 0.19} {'loss': 0.8785, 'learning_rate': 1.9576330539066607e-05, 'epoch': 0.19} {'loss': 1.0939, 'learning_rate': 1.9576236259573537e-05, 'epoch': 0.19} {'loss': 0.9789, 'learning_rate': 1.957614196981866e-05, 'epoch': 0.19} {'loss': 0.9675, 'learning_rate': 1.9576047669802086e-05, 'epoch': 0.19} {'loss': 1.043, 'learning_rate': 1.957595335952392e-05, 'epoch': 0.19} {'loss': 0.9262, 'learning_rate': 1.9575859038984245e-05, 'epoch': 0.19} {'loss': 0.9728, 'learning_rate': 1.9575764708183178e-05, 'epoch': 0.19} {'loss': 0.9086, 'learning_rate': 1.9575670367120814e-05, 'epoch': 0.19} {'loss': 0.9592, 'learning_rate': 1.9575576015797256e-05, 'epoch': 0.19} {'loss': 0.8516, 'learning_rate': 1.9575481654212602e-05, 'epoch': 0.19} {'loss': 0.9871, 'learning_rate': 1.9575387282366954e-05, 'epoch': 0.19} {'loss': 0.8867, 'learning_rate': 1.957529290026042e-05, 'epoch': 0.19} {'loss': 0.889, 'learning_rate': 1.957519850789309e-05, 'epoch': 0.19} {'loss': 0.8015, 'learning_rate': 1.9575104105265073e-05, 'epoch': 0.19} {'loss': 0.7509, 'learning_rate': 1.9575009692376467e-05, 'epoch': 0.19} {'loss': 0.8977, 'learning_rate': 1.9574915269227375e-05, 'epoch': 0.19} {'loss': 0.9364, 'learning_rate': 1.9574820835817895e-05, 'epoch': 0.19} {'loss': 0.7553, 'learning_rate': 1.9574726392148135e-05, 'epoch': 0.19} {'loss': 0.9544, 'learning_rate': 1.9574631938218184e-05, 'epoch': 0.19} {'loss': 0.6794, 'learning_rate': 1.9574537474028157e-05, 'epoch': 0.19} {'loss': 0.7883, 'learning_rate': 1.9574442999578145e-05, 'epoch': 0.19} {'loss': 1.0017, 'learning_rate': 1.9574348514868257e-05, 'epoch': 0.19} {'loss': 0.7516, 'learning_rate': 1.9574254019898587e-05, 'epoch': 0.19} {'loss': 0.949, 'learning_rate': 1.957415951466924e-05, 'epoch': 0.19} {'loss': 0.9646, 'learning_rate': 1.957406499918032e-05, 'epoch': 0.19} {'loss': 0.7841, 'learning_rate': 1.9573970473431922e-05, 'epoch': 0.19} {'loss': 0.9472, 'learning_rate': 1.957387593742415e-05, 'epoch': 0.19} {'loss': 0.9793, 'learning_rate': 1.9573781391157108e-05, 'epoch': 0.19} {'loss': 0.9242, 'learning_rate': 1.9573686834630894e-05, 'epoch': 0.19} {'loss': 0.9804, 'learning_rate': 1.9573592267845614e-05, 'epoch': 0.19} {'loss': 0.9758, 'learning_rate': 1.9573497690801366e-05, 'epoch': 0.19} {'loss': 1.0216, 'learning_rate': 1.9573403103498244e-05, 'epoch': 0.19} {'loss': 0.9877, 'learning_rate': 1.957330850593636e-05, 'epoch': 0.19} {'loss': 0.7447, 'learning_rate': 1.9573213898115813e-05, 'epoch': 0.19} {'loss': 0.8937, 'learning_rate': 1.9573119280036705e-05, 'epoch': 0.19} {'loss': 0.8299, 'learning_rate': 1.9573024651699133e-05, 'epoch': 0.19} {'loss': 1.1129, 'learning_rate': 1.9572930013103202e-05, 'epoch': 0.19} {'loss': 0.9373, 'learning_rate': 1.957283536424901e-05, 'epoch': 0.19} {'loss': 0.9718, 'learning_rate': 1.9572740705136666e-05, 'epoch': 0.19} {'loss': 1.1149, 'learning_rate': 1.957264603576626e-05, 'epoch': 0.19} {'loss': 0.8282, 'learning_rate': 1.9572551356137905e-05, 'epoch': 0.19} {'loss': 0.8125, 'learning_rate': 1.9572456666251697e-05, 'epoch': 0.19} {'loss': 0.8473, 'learning_rate': 1.9572361966107737e-05, 'epoch': 0.19} {'loss': 0.8134, 'learning_rate': 1.9572267255706127e-05, 'epoch': 0.19} {'loss': 0.9351, 'learning_rate': 1.9572172535046964e-05, 'epoch': 0.19} {'loss': 0.8114, 'learning_rate': 1.957207780413036e-05, 'epoch': 0.19} {'loss': 0.9421, 'learning_rate': 1.9571983062956407e-05, 'epoch': 0.19} {'loss': 0.8559, 'learning_rate': 1.957188831152521e-05, 'epoch': 0.19} {'loss': 0.8852, 'learning_rate': 1.9571793549836874e-05, 'epoch': 0.19} {'loss': 0.9719, 'learning_rate': 1.95716987778915e-05, 'epoch': 0.19} {'loss': 0.8578, 'learning_rate': 1.957160399568918e-05, 'epoch': 0.19} {'loss': 0.8357, 'learning_rate': 1.9571509203230026e-05, 'epoch': 0.19} {'loss': 0.9846, 'learning_rate': 1.9571414400514137e-05, 'epoch': 0.19} {'loss': 0.8276, 'learning_rate': 1.957131958754161e-05, 'epoch': 0.19} {'loss': 1.0035, 'learning_rate': 1.9571224764312552e-05, 'epoch': 0.19} {'loss': 1.1098, 'learning_rate': 1.9571129930827063e-05, 'epoch': 0.19} {'loss': 1.0034, 'learning_rate': 1.9571035087085245e-05, 'epoch': 0.19} {'loss': 1.038, 'learning_rate': 1.95709402330872e-05, 'epoch': 0.19} {'loss': 1.0497, 'learning_rate': 1.9570845368833025e-05, 'epoch': 0.19} {'loss': 0.9477, 'learning_rate': 1.957075049432283e-05, 'epoch': 0.19} {'loss': 0.7517, 'learning_rate': 1.957065560955671e-05, 'epoch': 0.19} {'loss': 1.0721, 'learning_rate': 1.9570560714534767e-05, 'epoch': 0.19} {'loss': 0.9046, 'learning_rate': 1.9570465809257103e-05, 'epoch': 0.19} {'loss': 1.0149, 'learning_rate': 1.9570370893723825e-05, 'epoch': 0.19} {'loss': 0.9357, 'learning_rate': 1.957027596793503e-05, 'epoch': 0.19} {'loss': 0.8852, 'learning_rate': 1.957018103189082e-05, 'epoch': 0.19} {'loss': 0.8475, 'learning_rate': 1.95700860855913e-05, 'epoch': 0.19} {'loss': 1.0293, 'learning_rate': 1.9569991129036565e-05, 'epoch': 0.19} {'loss': 0.907, 'learning_rate': 1.956989616222672e-05, 'epoch': 0.19} {'loss': 0.8263, 'learning_rate': 1.9569801185161873e-05, 'epoch': 0.19} {'loss': 0.8977, 'learning_rate': 1.9569706197842115e-05, 'epoch': 0.19} {'loss': 1.0477, 'learning_rate': 1.9569611200267554e-05, 'epoch': 0.19} {'loss': 0.8239, 'learning_rate': 1.9569516192438293e-05, 'epoch': 0.19} {'loss': 0.927, 'learning_rate': 1.956942117435443e-05, 'epoch': 0.19} {'loss': 1.0012, 'learning_rate': 1.9569326146016073e-05, 'epoch': 0.19} {'loss': 0.761, 'learning_rate': 1.956923110742331e-05, 'epoch': 0.19} {'loss': 0.9948, 'learning_rate': 1.9569136058576262e-05, 'epoch': 0.19} {'loss': 1.0735, 'learning_rate': 1.9569040999475016e-05, 'epoch': 0.19} {'loss': 0.8323, 'learning_rate': 1.9568945930119678e-05, 'epoch': 0.19} {'loss': 0.9411, 'learning_rate': 1.9568850850510354e-05, 'epoch': 0.19} {'loss': 0.946, 'learning_rate': 1.956875576064714e-05, 'epoch': 0.19} {'loss': 0.9532, 'learning_rate': 1.9568660660530145e-05, 'epoch': 0.19} {'loss': 0.8326, 'learning_rate': 1.9568565550159458e-05, 'epoch': 0.19} {'loss': 0.8401, 'learning_rate': 1.9568470429535197e-05, 'epoch': 0.19} {'loss': 0.8667, 'learning_rate': 1.9568375298657453e-05, 'epoch': 0.19} {'loss': 1.0395, 'learning_rate': 1.9568280157526335e-05, 'epoch': 0.19} {'loss': 1.0082, 'learning_rate': 1.9568185006141937e-05, 'epoch': 0.19} {'loss': 1.0013, 'learning_rate': 1.9568089844504364e-05, 'epoch': 0.19} {'loss': 0.8391, 'learning_rate': 1.9567994672613725e-05, 'epoch': 0.19} {'loss': 0.9086, 'learning_rate': 1.956789949047011e-05, 'epoch': 0.19} {'loss': 0.9802, 'learning_rate': 1.9567804298073635e-05, 'epoch': 0.19} {'loss': 0.8718, 'learning_rate': 1.9567709095424388e-05, 'epoch': 0.19} {'loss': 0.8969, 'learning_rate': 1.9567613882522477e-05, 'epoch': 0.19} {'loss': 0.8635, 'learning_rate': 1.9567518659368005e-05, 'epoch': 0.19} {'loss': 0.8275, 'learning_rate': 1.9567423425961073e-05, 'epoch': 0.19} {'loss': 1.0919, 'learning_rate': 1.9567328182301787e-05, 'epoch': 0.19} {'loss': 0.9478, 'learning_rate': 1.956723292839024e-05, 'epoch': 0.19} {'loss': 0.6758, 'learning_rate': 1.9567137664226543e-05, 'epoch': 0.19} {'loss': 0.8831, 'learning_rate': 1.9567042389810792e-05, 'epoch': 0.19} {'loss': 0.7694, 'learning_rate': 1.9566947105143093e-05, 'epoch': 0.19} {'loss': 0.8251, 'learning_rate': 1.9566851810223548e-05, 'epoch': 0.19} {'loss': 0.9682, 'learning_rate': 1.9566756505052255e-05, 'epoch': 0.19} {'loss': 0.9655, 'learning_rate': 1.9566661189629325e-05, 'epoch': 0.19} {'loss': 0.8276, 'learning_rate': 1.9566565863954844e-05, 'epoch': 0.19} {'loss': 1.06, 'learning_rate': 1.9566470528028933e-05, 'epoch': 0.19} {'loss': 0.8195, 'learning_rate': 1.956637518185168e-05, 'epoch': 0.19} {'loss': 0.8264, 'learning_rate': 1.9566279825423194e-05, 'epoch': 0.19} {'loss': 0.9032, 'learning_rate': 1.9566184458743576e-05, 'epoch': 0.19} {'loss': 0.8441, 'learning_rate': 1.9566089081812933e-05, 'epoch': 0.19} {'loss': 1.0733, 'learning_rate': 1.9565993694631357e-05, 'epoch': 0.19} {'loss': 0.844, 'learning_rate': 1.9565898297198955e-05, 'epoch': 0.19} {'loss': 0.9716, 'learning_rate': 1.956580288951583e-05, 'epoch': 0.19} {'loss': 0.7548, 'learning_rate': 1.9565707471582084e-05, 'epoch': 0.19} {'loss': 0.9015, 'learning_rate': 1.956561204339782e-05, 'epoch': 0.19} {'loss': 0.8902, 'learning_rate': 1.956551660496314e-05, 'epoch': 0.19} {'loss': 0.8858, 'learning_rate': 1.9565421156278143e-05, 'epoch': 0.19} {'loss': 0.8726, 'learning_rate': 1.9565325697342932e-05, 'epoch': 0.19} {'loss': 0.6709, 'learning_rate': 1.9565230228157617e-05, 'epoch': 0.19} {'loss': 0.7653, 'learning_rate': 1.9565134748722295e-05, 'epoch': 0.19} {'loss': 0.9483, 'learning_rate': 1.9565039259037065e-05, 'epoch': 0.19} {'loss': 0.8942, 'learning_rate': 1.9564943759102027e-05, 'epoch': 0.19} {'loss': 1.0293, 'learning_rate': 1.9564848248917295e-05, 'epoch': 0.19} {'loss': 0.9181, 'learning_rate': 1.9564752728482963e-05, 'epoch': 0.19} {'loss': 0.71, 'learning_rate': 1.956465719779914e-05, 'epoch': 0.19} {'loss': 1.0085, 'learning_rate': 1.9564561656865915e-05, 'epoch': 0.19} {'loss': 0.8102, 'learning_rate': 1.9564466105683405e-05, 'epoch': 0.19} {'loss': 1.0022, 'learning_rate': 1.9564370544251703e-05, 'epoch': 0.19} {'loss': 1.0195, 'learning_rate': 1.9564274972570915e-05, 'epoch': 0.19} {'loss': 0.8289, 'learning_rate': 1.9564179390641147e-05, 'epoch': 0.19} {'loss': 0.9519, 'learning_rate': 1.9564083798462494e-05, 'epoch': 0.19} {'loss': 0.8124, 'learning_rate': 1.956398819603506e-05, 'epoch': 0.19} {'loss': 0.7135, 'learning_rate': 1.9563892583358956e-05, 'epoch': 0.19} {'loss': 1.0975, 'learning_rate': 1.956379696043427e-05, 'epoch': 0.19} {'loss': 0.6866, 'learning_rate': 1.9563701327261116e-05, 'epoch': 0.19} {'loss': 0.8375, 'learning_rate': 1.9563605683839596e-05, 'epoch': 0.19} {'loss': 0.8412, 'learning_rate': 1.9563510030169807e-05, 'epoch': 0.19} {'loss': 0.906, 'learning_rate': 1.956341436625185e-05, 'epoch': 0.19} {'loss': 0.7399, 'learning_rate': 1.956331869208584e-05, 'epoch': 0.19} {'loss': 1.0143, 'learning_rate': 1.9563223007671864e-05, 'epoch': 0.19} {'loss': 0.7654, 'learning_rate': 1.956312731301003e-05, 'epoch': 0.19} {'loss': 0.9199, 'learning_rate': 1.9563031608100447e-05, 'epoch': 0.19} {'loss': 0.8789, 'learning_rate': 1.956293589294321e-05, 'epoch': 0.19} {'loss': 0.8962, 'learning_rate': 1.9562840167538426e-05, 'epoch': 0.19} {'loss': 0.989, 'learning_rate': 1.9562744431886194e-05, 'epoch': 0.19} {'loss': 0.9737, 'learning_rate': 1.956264868598662e-05, 'epoch': 0.19} {'loss': 1.0596, 'learning_rate': 1.95625529298398e-05, 'epoch': 0.19} {'loss': 0.9458, 'learning_rate': 1.9562457163445846e-05, 'epoch': 0.19} {'loss': 0.9831, 'learning_rate': 1.9562361386804857e-05, 'epoch': 0.19} {'loss': 0.9243, 'learning_rate': 1.956226559991693e-05, 'epoch': 0.19} {'loss': 0.9558, 'learning_rate': 1.9562169802782177e-05, 'epoch': 0.19} {'loss': 0.9892, 'learning_rate': 1.956207399540069e-05, 'epoch': 0.19} {'loss': 0.7899, 'learning_rate': 1.9561978177772585e-05, 'epoch': 0.19} {'loss': 0.8755, 'learning_rate': 1.9561882349897954e-05, 'epoch': 0.19} {'loss': 1.0059, 'learning_rate': 1.95617865117769e-05, 'epoch': 0.19} {'loss': 0.9821, 'learning_rate': 1.9561690663409535e-05, 'epoch': 0.19} {'loss': 0.8783, 'learning_rate': 1.956159480479595e-05, 'epoch': 0.19} {'loss': 0.9558, 'learning_rate': 1.956149893593626e-05, 'epoch': 0.19} {'loss': 0.8545, 'learning_rate': 1.9561403056830554e-05, 'epoch': 0.19} {'loss': 0.9712, 'learning_rate': 1.9561307167478943e-05, 'epoch': 0.19} {'loss': 0.9314, 'learning_rate': 1.956121126788153e-05, 'epoch': 0.19} {'loss': 0.9418, 'learning_rate': 1.9561115358038417e-05, 'epoch': 0.19} {'loss': 0.9092, 'learning_rate': 1.9561019437949705e-05, 'epoch': 0.19} {'loss': 0.8971, 'learning_rate': 1.9560923507615496e-05, 'epoch': 0.19} {'loss': 0.9277, 'learning_rate': 1.9560827567035894e-05, 'epoch': 0.2} {'loss': 1.0222, 'learning_rate': 1.9560731616211006e-05, 'epoch': 0.2} {'loss': 1.0622, 'learning_rate': 1.956063565514093e-05, 'epoch': 0.2} {'loss': 0.7485, 'learning_rate': 1.956053968382577e-05, 'epoch': 0.2} {'loss': 0.8723, 'learning_rate': 1.956044370226563e-05, 'epoch': 0.2} {'loss': 0.952, 'learning_rate': 1.956034771046061e-05, 'epoch': 0.2} {'loss': 0.8577, 'learning_rate': 1.956025170841081e-05, 'epoch': 0.2} {'loss': 0.8513, 'learning_rate': 1.956015569611634e-05, 'epoch': 0.2} {'loss': 0.9521, 'learning_rate': 1.9560059673577304e-05, 'epoch': 0.2} {'loss': 0.9676, 'learning_rate': 1.95599636407938e-05, 'epoch': 0.2} {'loss': 0.8789, 'learning_rate': 1.9559867597765932e-05, 'epoch': 0.2} {'loss': 1.0568, 'learning_rate': 1.9559771544493805e-05, 'epoch': 0.2} {'loss': 0.9985, 'learning_rate': 1.9559675480977515e-05, 'epoch': 0.2} {'loss': 0.7684, 'learning_rate': 1.9559579407217172e-05, 'epoch': 0.2} {'loss': 0.8679, 'learning_rate': 1.9559483323212877e-05, 'epoch': 0.2} {'loss': 1.1168, 'learning_rate': 1.9559387228964734e-05, 'epoch': 0.2} {'loss': 0.7745, 'learning_rate': 1.9559291124472843e-05, 'epoch': 0.2} {'loss': 1.0741, 'learning_rate': 1.955919500973731e-05, 'epoch': 0.2} {'loss': 0.9016, 'learning_rate': 1.9559098884758238e-05, 'epoch': 0.2} {'loss': 0.928, 'learning_rate': 1.9559002749535727e-05, 'epoch': 0.2} {'loss': 0.8913, 'learning_rate': 1.955890660406988e-05, 'epoch': 0.2} {'loss': 1.0446, 'learning_rate': 1.9558810448360804e-05, 'epoch': 0.2} {'loss': 0.7668, 'learning_rate': 1.9558714282408602e-05, 'epoch': 0.2} {'loss': 0.9359, 'learning_rate': 1.9558618106213373e-05, 'epoch': 0.2} {'loss': 0.9959, 'learning_rate': 1.9558521919775222e-05, 'epoch': 0.2} {'loss': 0.8587, 'learning_rate': 1.955842572309425e-05, 'epoch': 0.2} {'loss': 0.9144, 'learning_rate': 1.9558329516170563e-05, 'epoch': 0.2} {'loss': 0.9653, 'learning_rate': 1.9558233299004266e-05, 'epoch': 0.2} {'loss': 0.9312, 'learning_rate': 1.955813707159546e-05, 'epoch': 0.2} {'loss': 0.9948, 'learning_rate': 1.955804083394424e-05, 'epoch': 0.2} {'loss': 1.1306, 'learning_rate': 1.9557944586050724e-05, 'epoch': 0.2} {'loss': 0.8937, 'learning_rate': 1.9557848327915005e-05, 'epoch': 0.2} {'loss': 0.9979, 'learning_rate': 1.9557752059537187e-05, 'epoch': 0.2} {'loss': 0.8889, 'learning_rate': 1.9557655780917378e-05, 'epoch': 0.2} {'loss': 0.9134, 'learning_rate': 1.9557559492055678e-05, 'epoch': 0.2} {'loss': 1.0313, 'learning_rate': 1.955746319295219e-05, 'epoch': 0.2} {'loss': 0.8267, 'learning_rate': 1.9557366883607017e-05, 'epoch': 0.2} {'loss': 0.8426, 'learning_rate': 1.9557270564020264e-05, 'epoch': 0.2} {'loss': 0.8186, 'learning_rate': 1.955717423419203e-05, 'epoch': 0.2} {'loss': 0.8422, 'learning_rate': 1.9557077894122422e-05, 'epoch': 0.2} {'loss': 1.0449, 'learning_rate': 1.9556981543811545e-05, 'epoch': 0.2} {'loss': 0.8366, 'learning_rate': 1.9556885183259496e-05, 'epoch': 0.2} {'loss': 1.0295, 'learning_rate': 1.9556788812466386e-05, 'epoch': 0.2} {'loss': 0.9825, 'learning_rate': 1.9556692431432315e-05, 'epoch': 0.2} {'loss': 0.8984, 'learning_rate': 1.9556596040157382e-05, 'epoch': 0.2} {'loss': 0.9379, 'learning_rate': 1.9556499638641692e-05, 'epoch': 0.2} {'loss': 0.9426, 'learning_rate': 1.9556403226885354e-05, 'epoch': 0.2} {'loss': 0.9791, 'learning_rate': 1.9556306804888468e-05, 'epoch': 0.2} {'loss': 1.0096, 'learning_rate': 1.9556210372651134e-05, 'epoch': 0.2} {'loss': 0.8554, 'learning_rate': 1.9556113930173462e-05, 'epoch': 0.2} {'loss': 1.0312, 'learning_rate': 1.9556017477455546e-05, 'epoch': 0.2} {'loss': 1.015, 'learning_rate': 1.95559210144975e-05, 'epoch': 0.2} {'loss': 0.963, 'learning_rate': 1.9555824541299416e-05, 'epoch': 0.2} {'loss': 0.8856, 'learning_rate': 1.955572805786141e-05, 'epoch': 0.2} {'loss': 0.8398, 'learning_rate': 1.9555631564183575e-05, 'epoch': 0.2} {'loss': 1.0989, 'learning_rate': 1.955553506026602e-05, 'epoch': 0.2} {'loss': 0.9573, 'learning_rate': 1.9555438546108846e-05, 'epoch': 0.2} {'loss': 0.8747, 'learning_rate': 1.9555342021712155e-05, 'epoch': 0.2} {'loss': 0.8652, 'learning_rate': 1.955524548707606e-05, 'epoch': 0.2} {'loss': 0.8042, 'learning_rate': 1.955514894220065e-05, 'epoch': 0.2} {'loss': 0.8797, 'learning_rate': 1.9555052387086038e-05, 'epoch': 0.2} {'loss': 0.9832, 'learning_rate': 1.9554955821732326e-05, 'epoch': 0.2} {'loss': 0.8852, 'learning_rate': 1.9554859246139612e-05, 'epoch': 0.2} {'loss': 1.0228, 'learning_rate': 1.9554762660308007e-05, 'epoch': 0.2} {'loss': 0.8721, 'learning_rate': 1.955466606423761e-05, 'epoch': 0.2} {'loss': 0.9146, 'learning_rate': 1.9554569457928528e-05, 'epoch': 0.2} {'loss': 0.841, 'learning_rate': 1.955447284138086e-05, 'epoch': 0.2} {'loss': 0.9727, 'learning_rate': 1.9554376214594714e-05, 'epoch': 0.2} {'loss': 0.8486, 'learning_rate': 1.955427957757019e-05, 'epoch': 0.2} {'loss': 0.9274, 'learning_rate': 1.9554182930307396e-05, 'epoch': 0.2} {'loss': 0.9407, 'learning_rate': 1.955408627280643e-05, 'epoch': 0.2} {'loss': 1.0144, 'learning_rate': 1.9553989605067404e-05, 'epoch': 0.2} {'loss': 1.0122, 'learning_rate': 1.955389292709041e-05, 'epoch': 0.2} {'loss': 0.7864, 'learning_rate': 1.9553796238875558e-05, 'epoch': 0.2} {'loss': 0.8417, 'learning_rate': 1.955369954042295e-05, 'epoch': 0.2} {'loss': 0.8734, 'learning_rate': 1.955360283173269e-05, 'epoch': 0.2} {'loss': 0.9147, 'learning_rate': 1.9553506112804888e-05, 'epoch': 0.2} {'loss': 0.9817, 'learning_rate': 1.9553409383639636e-05, 'epoch': 0.2} {'loss': 1.0258, 'learning_rate': 1.9553312644237048e-05, 'epoch': 0.2} {'loss': 0.8843, 'learning_rate': 1.955321589459722e-05, 'epoch': 0.2} {'loss': 0.8622, 'learning_rate': 1.955311913472026e-05, 'epoch': 0.2} {'loss': 0.9992, 'learning_rate': 1.9553022364606275e-05, 'epoch': 0.2} {'loss': 0.7721, 'learning_rate': 1.9552925584255357e-05, 'epoch': 0.2} {'loss': 1.0153, 'learning_rate': 1.9552828793667622e-05, 'epoch': 0.2} {'loss': 0.9024, 'learning_rate': 1.9552731992843165e-05, 'epoch': 0.2} {'loss': 0.79, 'learning_rate': 1.95526351817821e-05, 'epoch': 0.2} {'loss': 1.0479, 'learning_rate': 1.9552538360484517e-05, 'epoch': 0.2} {'loss': 0.9571, 'learning_rate': 1.955244152895053e-05, 'epoch': 0.2} {'loss': 0.9266, 'learning_rate': 1.955234468718024e-05, 'epoch': 0.2} {'loss': 0.8172, 'learning_rate': 1.9552247835173748e-05, 'epoch': 0.2} {'loss': 0.9093, 'learning_rate': 1.9552150972931163e-05, 'epoch': 0.2} {'loss': 0.8464, 'learning_rate': 1.9552054100452588e-05, 'epoch': 0.2} {'loss': 0.9644, 'learning_rate': 1.9551957217738118e-05, 'epoch': 0.2} {'loss': 0.9391, 'learning_rate': 1.9551860324787867e-05, 'epoch': 0.2} {'loss': 0.9554, 'learning_rate': 1.955176342160194e-05, 'epoch': 0.2} {'loss': 0.9473, 'learning_rate': 1.955166650818043e-05, 'epoch': 0.2} {'loss': 0.8424, 'learning_rate': 1.9551569584523454e-05, 'epoch': 0.2} {'loss': 0.7301, 'learning_rate': 1.9551472650631104e-05, 'epoch': 0.2} {'loss': 0.966, 'learning_rate': 1.9551375706503492e-05, 'epoch': 0.2} {'loss': 0.9759, 'learning_rate': 1.9551278752140714e-05, 'epoch': 0.2} {'loss': 0.6878, 'learning_rate': 1.955118178754288e-05, 'epoch': 0.2} {'loss': 0.9071, 'learning_rate': 1.9551084812710098e-05, 'epoch': 0.2} {'loss': 0.8827, 'learning_rate': 1.9550987827642463e-05, 'epoch': 0.2} {'loss': 0.8916, 'learning_rate': 1.9550890832340082e-05, 'epoch': 0.2} {'loss': 1.0637, 'learning_rate': 1.955079382680306e-05, 'epoch': 0.2} {'loss': 1.0061, 'learning_rate': 1.95506968110315e-05, 'epoch': 0.2} {'loss': 0.913, 'learning_rate': 1.9550599785025507e-05, 'epoch': 0.2} {'loss': 0.9823, 'learning_rate': 1.9550502748785186e-05, 'epoch': 0.2} {'loss': 0.9967, 'learning_rate': 1.9550405702310638e-05, 'epoch': 0.2} {'loss': 0.9954, 'learning_rate': 1.9550308645601967e-05, 'epoch': 0.2} {'loss': 0.8719, 'learning_rate': 1.955021157865928e-05, 'epoch': 0.2} {'loss': 0.9131, 'learning_rate': 1.9550114501482674e-05, 'epoch': 0.2} {'loss': 0.993, 'learning_rate': 1.9550017414072267e-05, 'epoch': 0.2} {'loss': 0.7439, 'learning_rate': 1.9549920316428147e-05, 'epoch': 0.2} {'loss': 0.9299, 'learning_rate': 1.9549823208550428e-05, 'epoch': 0.2} {'loss': 0.9065, 'learning_rate': 1.9549726090439213e-05, 'epoch': 0.2} {'loss': 0.9255, 'learning_rate': 1.9549628962094607e-05, 'epoch': 0.2} {'loss': 0.9652, 'learning_rate': 1.9549531823516705e-05, 'epoch': 0.2} {'loss': 0.8755, 'learning_rate': 1.954943467470562e-05, 'epoch': 0.2} {'loss': 0.9902, 'learning_rate': 1.9549337515661458e-05, 'epoch': 0.2} {'loss': 1.0086, 'learning_rate': 1.9549240346384314e-05, 'epoch': 0.2} {'loss': 0.988, 'learning_rate': 1.9549143166874303e-05, 'epoch': 0.2} {'loss': 0.8492, 'learning_rate': 1.9549045977131518e-05, 'epoch': 0.2} {'loss': 0.8881, 'learning_rate': 1.954894877715607e-05, 'epoch': 0.2} {'loss': 1.0039, 'learning_rate': 1.954885156694806e-05, 'epoch': 0.2} {'loss': 1.085, 'learning_rate': 1.9548754346507595e-05, 'epoch': 0.2} {'loss': 0.9354, 'learning_rate': 1.9548657115834778e-05, 'epoch': 0.2} {'loss': 0.9798, 'learning_rate': 1.9548559874929712e-05, 'epoch': 0.2} {'loss': 0.8172, 'learning_rate': 1.9548462623792505e-05, 'epoch': 0.2} {'loss': 0.796, 'learning_rate': 1.9548365362423255e-05, 'epoch': 0.2} {'loss': 0.8125, 'learning_rate': 1.9548268090822074e-05, 'epoch': 0.2} {'loss': 0.9863, 'learning_rate': 1.9548170808989057e-05, 'epoch': 0.2} {'loss': 0.7949, 'learning_rate': 1.9548073516924316e-05, 'epoch': 0.2} {'loss': 0.776, 'learning_rate': 1.954797621462795e-05, 'epoch': 0.2} {'loss': 0.9601, 'learning_rate': 1.954787890210007e-05, 'epoch': 0.2} {'loss': 0.9653, 'learning_rate': 1.9547781579340775e-05, 'epoch': 0.2} {'loss': 0.9432, 'learning_rate': 1.9547684246350167e-05, 'epoch': 0.2} {'loss': 0.9176, 'learning_rate': 1.954758690312836e-05, 'epoch': 0.2} {'loss': 0.8967, 'learning_rate': 1.9547489549675443e-05, 'epoch': 0.2} {'loss': 0.8903, 'learning_rate': 1.9547392185991535e-05, 'epoch': 0.2} {'loss': 0.9032, 'learning_rate': 1.9547294812076733e-05, 'epoch': 0.2} {'loss': 1.0745, 'learning_rate': 1.9547197427931145e-05, 'epoch': 0.2} {'loss': 0.8847, 'learning_rate': 1.9547100033554873e-05, 'epoch': 0.2} {'loss': 0.9107, 'learning_rate': 1.954700262894802e-05, 'epoch': 0.2} {'loss': 0.8393, 'learning_rate': 1.954690521411069e-05, 'epoch': 0.2} {'loss': 1.0115, 'learning_rate': 1.954680778904299e-05, 'epoch': 0.2} {'loss': 0.9155, 'learning_rate': 1.954671035374503e-05, 'epoch': 0.2} {'loss': 0.9653, 'learning_rate': 1.95466129082169e-05, 'epoch': 0.2} {'loss': 1.0242, 'learning_rate': 1.954651545245872e-05, 'epoch': 0.2} {'loss': 0.9151, 'learning_rate': 1.954641798647058e-05, 'epoch': 0.2} {'loss': 0.914, 'learning_rate': 1.9546320510252594e-05, 'epoch': 0.2} {'loss': 0.7738, 'learning_rate': 1.9546223023804867e-05, 'epoch': 0.2} {'loss': 1.0102, 'learning_rate': 1.9546125527127496e-05, 'epoch': 0.2} {'loss': 0.778, 'learning_rate': 1.9546028020220596e-05, 'epoch': 0.2} {'loss': 0.9705, 'learning_rate': 1.954593050308426e-05, 'epoch': 0.2} {'loss': 0.8823, 'learning_rate': 1.95458329757186e-05, 'epoch': 0.2} {'loss': 0.8982, 'learning_rate': 1.9545735438123717e-05, 'epoch': 0.2} {'loss': 0.7671, 'learning_rate': 1.9545637890299718e-05, 'epoch': 0.2} {'loss': 0.8155, 'learning_rate': 1.9545540332246706e-05, 'epoch': 0.2} {'loss': 0.8925, 'learning_rate': 1.9545442763964784e-05, 'epoch': 0.2} {'loss': 0.8882, 'learning_rate': 1.954534518545406e-05, 'epoch': 0.2} {'loss': 0.9955, 'learning_rate': 1.954524759671464e-05, 'epoch': 0.2} {'loss': 0.9318, 'learning_rate': 1.9545149997746625e-05, 'epoch': 0.2} {'loss': 0.8637, 'learning_rate': 1.9545052388550116e-05, 'epoch': 0.2} {'loss': 0.7994, 'learning_rate': 1.9544954769125226e-05, 'epoch': 0.2} {'loss': 0.9437, 'learning_rate': 1.9544857139472054e-05, 'epoch': 0.2} {'loss': 0.9216, 'learning_rate': 1.9544759499590706e-05, 'epoch': 0.2} {'loss': 0.955, 'learning_rate': 1.954466184948129e-05, 'epoch': 0.2} {'loss': 0.8015, 'learning_rate': 1.9544564189143905e-05, 'epoch': 0.2} {'loss': 0.9829, 'learning_rate': 1.9544466518578655e-05, 'epoch': 0.2} {'loss': 1.0149, 'learning_rate': 1.954436883778565e-05, 'epoch': 0.2} {'loss': 0.8242, 'learning_rate': 1.954427114676499e-05, 'epoch': 0.2} {'loss': 0.8626, 'learning_rate': 1.9544173445516787e-05, 'epoch': 0.2} {'loss': 1.0727, 'learning_rate': 1.954407573404114e-05, 'epoch': 0.2} {'loss': 0.8296, 'learning_rate': 1.954397801233815e-05, 'epoch': 0.2} {'loss': 0.8691, 'learning_rate': 1.954388028040793e-05, 'epoch': 0.2} {'loss': 0.8354, 'learning_rate': 1.954378253825058e-05, 'epoch': 0.2} {'loss': 0.9375, 'learning_rate': 1.9543684785866205e-05, 'epoch': 0.2} {'loss': 0.9886, 'learning_rate': 1.954358702325491e-05, 'epoch': 0.2} {'loss': 0.8764, 'learning_rate': 1.9543489250416804e-05, 'epoch': 0.2} {'loss': 0.7881, 'learning_rate': 1.9543391467351982e-05, 'epoch': 0.2} {'loss': 0.9753, 'learning_rate': 1.954329367406056e-05, 'epoch': 0.2} {'loss': 0.9171, 'learning_rate': 1.9543195870542634e-05, 'epoch': 0.2} {'loss': 0.82, 'learning_rate': 1.9543098056798313e-05, 'epoch': 0.2} {'loss': 1.0486, 'learning_rate': 1.95430002328277e-05, 'epoch': 0.2} {'loss': 0.9381, 'learning_rate': 1.9542902398630904e-05, 'epoch': 0.2} {'loss': 0.7975, 'learning_rate': 1.9542804554208023e-05, 'epoch': 0.2} {'loss': 0.8478, 'learning_rate': 1.954270669955917e-05, 'epoch': 0.2} {'loss': 0.9235, 'learning_rate': 1.9542608834684444e-05, 'epoch': 0.2} {'loss': 0.9771, 'learning_rate': 1.954251095958395e-05, 'epoch': 0.2} {'loss': 0.9263, 'learning_rate': 1.9542413074257793e-05, 'epoch': 0.2} {'loss': 0.9487, 'learning_rate': 1.954231517870608e-05, 'epoch': 0.2} {'loss': 0.9451, 'learning_rate': 1.9542217272928917e-05, 'epoch': 0.2} {'loss': 0.9744, 'learning_rate': 1.954211935692641e-05, 'epoch': 0.2} {'loss': 0.9592, 'learning_rate': 1.9542021430698653e-05, 'epoch': 0.2} {'loss': 1.027, 'learning_rate': 1.9541923494245764e-05, 'epoch': 0.2} {'loss': 0.9414, 'learning_rate': 1.9541825547567842e-05, 'epoch': 0.2} {'loss': 1.0758, 'learning_rate': 1.954172759066499e-05, 'epoch': 0.2} {'loss': 0.8669, 'learning_rate': 1.9541629623537316e-05, 'epoch': 0.2} {'loss': 1.0415, 'learning_rate': 1.954153164618493e-05, 'epoch': 0.2} {'loss': 0.9423, 'learning_rate': 1.9541433658607926e-05, 'epoch': 0.2} {'loss': 0.9825, 'learning_rate': 1.954133566080642e-05, 'epoch': 0.2} {'loss': 0.9822, 'learning_rate': 1.9541237652780506e-05, 'epoch': 0.2} {'loss': 0.7904, 'learning_rate': 1.95411396345303e-05, 'epoch': 0.2} {'loss': 0.9745, 'learning_rate': 1.9541041606055896e-05, 'epoch': 0.2} {'loss': 0.9725, 'learning_rate': 1.9540943567357405e-05, 'epoch': 0.2} {'loss': 0.8107, 'learning_rate': 1.9540845518434936e-05, 'epoch': 0.2} {'loss': 0.9882, 'learning_rate': 1.9540747459288592e-05, 'epoch': 0.2} {'loss': 0.9326, 'learning_rate': 1.954064938991847e-05, 'epoch': 0.2} {'loss': 0.7406, 'learning_rate': 1.9540551310324686e-05, 'epoch': 0.2} {'loss': 1.011, 'learning_rate': 1.9540453220507337e-05, 'epoch': 0.2} {'loss': 1.0265, 'learning_rate': 1.954035512046653e-05, 'epoch': 0.2} {'loss': 0.8686, 'learning_rate': 1.9540257010202375e-05, 'epoch': 0.2} {'loss': 1.0741, 'learning_rate': 1.954015888971497e-05, 'epoch': 0.2} {'loss': 0.7446, 'learning_rate': 1.9540060759004428e-05, 'epoch': 0.2} {'loss': 0.93, 'learning_rate': 1.9539962618070847e-05, 'epoch': 0.2} {'loss': 0.855, 'learning_rate': 1.9539864466914336e-05, 'epoch': 0.2} {'loss': 0.8213, 'learning_rate': 1.9539766305535e-05, 'epoch': 0.2} {'loss': 0.773, 'learning_rate': 1.9539668133932942e-05, 'epoch': 0.2} {'loss': 0.9338, 'learning_rate': 1.9539569952108266e-05, 'epoch': 0.2} {'loss': 1.0156, 'learning_rate': 1.9539471760061084e-05, 'epoch': 0.2} {'loss': 0.9427, 'learning_rate': 1.9539373557791498e-05, 'epoch': 0.2} {'loss': 0.899, 'learning_rate': 1.9539275345299608e-05, 'epoch': 0.2} {'loss': 0.8628, 'learning_rate': 1.9539177122585523e-05, 'epoch': 0.2} {'loss': 0.843, 'learning_rate': 1.953907888964935e-05, 'epoch': 0.2} {'loss': 1.0031, 'learning_rate': 1.9538980646491198e-05, 'epoch': 0.2} {'loss': 0.9688, 'learning_rate': 1.9538882393111163e-05, 'epoch': 0.2} {'loss': 0.8421, 'learning_rate': 1.9538784129509355e-05, 'epoch': 0.2} {'loss': 1.0229, 'learning_rate': 1.953868585568588e-05, 'epoch': 0.2} {'loss': 0.9009, 'learning_rate': 1.953858757164084e-05, 'epoch': 0.2} {'loss': 0.8614, 'learning_rate': 1.9538489277374345e-05, 'epoch': 0.2} {'loss': 0.7779, 'learning_rate': 1.9538390972886494e-05, 'epoch': 0.2} {'loss': 0.7266, 'learning_rate': 1.9538292658177398e-05, 'epoch': 0.2} {'loss': 0.886, 'learning_rate': 1.9538194333247162e-05, 'epoch': 0.2} {'loss': 1.0574, 'learning_rate': 1.953809599809589e-05, 'epoch': 0.2} {'loss': 0.9849, 'learning_rate': 1.9537997652723684e-05, 'epoch': 0.2} {'loss': 1.0311, 'learning_rate': 1.9537899297130656e-05, 'epoch': 0.2} {'loss': 0.8974, 'learning_rate': 1.9537800931316904e-05, 'epoch': 0.2} {'loss': 0.8829, 'learning_rate': 1.953770255528254e-05, 'epoch': 0.2} {'loss': 0.9747, 'learning_rate': 1.953760416902767e-05, 'epoch': 0.2} {'loss': 0.8275, 'learning_rate': 1.9537505772552396e-05, 'epoch': 0.2} {'loss': 0.8767, 'learning_rate': 1.953740736585682e-05, 'epoch': 0.2} {'loss': 0.7774, 'learning_rate': 1.9537308948941052e-05, 'epoch': 0.2} {'loss': 0.9655, 'learning_rate': 1.9537210521805198e-05, 'epoch': 0.2} {'loss': 0.8132, 'learning_rate': 1.953711208444936e-05, 'epoch': 0.2} {'loss': 0.7264, 'learning_rate': 1.9537013636873646e-05, 'epoch': 0.2} {'loss': 0.8926, 'learning_rate': 1.9536915179078164e-05, 'epoch': 0.2} {'loss': 0.9062, 'learning_rate': 1.9536816711063013e-05, 'epoch': 0.2} {'loss': 0.752, 'learning_rate': 1.9536718232828305e-05, 'epoch': 0.2} {'loss': 0.9557, 'learning_rate': 1.953661974437414e-05, 'epoch': 0.2} {'loss': 0.9264, 'learning_rate': 1.953652124570063e-05, 'epoch': 0.2} {'loss': 0.9386, 'learning_rate': 1.9536422736807874e-05, 'epoch': 0.2} {'loss': 0.6825, 'learning_rate': 1.9536324217695982e-05, 'epoch': 0.2} {'loss': 0.7556, 'learning_rate': 1.9536225688365055e-05, 'epoch': 0.2} {'loss': 0.8724, 'learning_rate': 1.9536127148815206e-05, 'epoch': 0.2} {'loss': 0.8653, 'learning_rate': 1.953602859904653e-05, 'epoch': 0.2} {'loss': 0.9084, 'learning_rate': 1.9535930039059145e-05, 'epoch': 0.2} {'loss': 0.9532, 'learning_rate': 1.9535831468853145e-05, 'epoch': 0.2} {'loss': 0.9084, 'learning_rate': 1.9535732888428644e-05, 'epoch': 0.2} {'loss': 0.9837, 'learning_rate': 1.9535634297785745e-05, 'epoch': 0.2} {'loss': 0.9686, 'learning_rate': 1.953553569692455e-05, 'epoch': 0.2} {'loss': 0.839, 'learning_rate': 1.953543708584517e-05, 'epoch': 0.2} {'loss': 0.8191, 'learning_rate': 1.9535338464547708e-05, 'epoch': 0.2} {'loss': 0.8846, 'learning_rate': 1.953523983303227e-05, 'epoch': 0.2} {'loss': 1.1553, 'learning_rate': 1.9535141191298963e-05, 'epoch': 0.2} {'loss': 0.7432, 'learning_rate': 1.953504253934789e-05, 'epoch': 0.2} {'loss': 1.0254, 'learning_rate': 1.953494387717916e-05, 'epoch': 0.2} {'loss': 0.7036, 'learning_rate': 1.953484520479288e-05, 'epoch': 0.2} {'loss': 0.9133, 'learning_rate': 1.9534746522189144e-05, 'epoch': 0.2} {'loss': 0.7467, 'learning_rate': 1.9534647829368075e-05, 'epoch': 0.2} {'loss': 0.9018, 'learning_rate': 1.9534549126329768e-05, 'epoch': 0.2} {'loss': 0.9106, 'learning_rate': 1.953445041307433e-05, 'epoch': 0.2} {'loss': 0.9266, 'learning_rate': 1.953435168960187e-05, 'epoch': 0.2} {'loss': 0.8011, 'learning_rate': 1.9534252955912486e-05, 'epoch': 0.2} {'loss': 0.783, 'learning_rate': 1.9534154212006293e-05, 'epoch': 0.2} {'loss': 0.904, 'learning_rate': 1.9534055457883396e-05, 'epoch': 0.2} {'loss': 0.9268, 'learning_rate': 1.9533956693543895e-05, 'epoch': 0.2} {'loss': 0.8951, 'learning_rate': 1.9533857918987897e-05, 'epoch': 0.2} {'loss': 0.949, 'learning_rate': 1.9533759134215512e-05, 'epoch': 0.2} {'loss': 0.8706, 'learning_rate': 1.9533660339226842e-05, 'epoch': 0.2} {'loss': 0.891, 'learning_rate': 1.9533561534022e-05, 'epoch': 0.2} {'loss': 0.8303, 'learning_rate': 1.9533462718601083e-05, 'epoch': 0.2} {'loss': 0.848, 'learning_rate': 1.95333638929642e-05, 'epoch': 0.2} {'loss': 0.9231, 'learning_rate': 1.9533265057111453e-05, 'epoch': 0.2} {'loss': 0.6587, 'learning_rate': 1.9533166211042956e-05, 'epoch': 0.2} {'loss': 0.9319, 'learning_rate': 1.9533067354758812e-05, 'epoch': 0.2} {'loss': 0.7341, 'learning_rate': 1.9532968488259125e-05, 'epoch': 0.2} {'loss': 0.8661, 'learning_rate': 1.9532869611544e-05, 'epoch': 0.2} {'loss': 0.8487, 'learning_rate': 1.9532770724613547e-05, 'epoch': 0.2} {'loss': 0.8397, 'learning_rate': 1.953267182746787e-05, 'epoch': 0.2} {'loss': 0.9103, 'learning_rate': 1.9532572920107076e-05, 'epoch': 0.2} {'loss': 1.0166, 'learning_rate': 1.9532474002531265e-05, 'epoch': 0.2} {'loss': 0.8192, 'learning_rate': 1.9532375074740552e-05, 'epoch': 0.2} {'loss': 1.13, 'learning_rate': 1.9532276136735038e-05, 'epoch': 0.2} {'loss': 0.9172, 'learning_rate': 1.953217718851483e-05, 'epoch': 0.2} {'loss': 0.8737, 'learning_rate': 1.9532078230080032e-05, 'epoch': 0.2} {'loss': 0.7982, 'learning_rate': 1.953197926143075e-05, 'epoch': 0.2} {'loss': 0.937, 'learning_rate': 1.9531880282567098e-05, 'epoch': 0.2} {'loss': 0.9608, 'learning_rate': 1.953178129348917e-05, 'epoch': 0.2} {'loss': 1.0651, 'learning_rate': 1.9531682294197083e-05, 'epoch': 0.2} {'loss': 0.9187, 'learning_rate': 1.9531583284690936e-05, 'epoch': 0.2} {'loss': 0.9582, 'learning_rate': 1.9531484264970836e-05, 'epoch': 0.2} {'loss': 0.9177, 'learning_rate': 1.953138523503689e-05, 'epoch': 0.2} {'loss': 0.9552, 'learning_rate': 1.953128619488921e-05, 'epoch': 0.2} {'loss': 0.7911, 'learning_rate': 1.953118714452789e-05, 'epoch': 0.2} {'loss': 0.9834, 'learning_rate': 1.9531088083953044e-05, 'epoch': 0.2} {'loss': 0.9429, 'learning_rate': 1.953098901316478e-05, 'epoch': 0.2} {'loss': 0.9594, 'learning_rate': 1.9530889932163197e-05, 'epoch': 0.2} {'loss': 1.0139, 'learning_rate': 1.9530790840948407e-05, 'epoch': 0.2} {'loss': 0.9943, 'learning_rate': 1.9530691739520517e-05, 'epoch': 0.2} {'loss': 1.0408, 'learning_rate': 1.953059262787963e-05, 'epoch': 0.2} {'loss': 1.0028, 'learning_rate': 1.953049350602585e-05, 'epoch': 0.2} {'loss': 0.7665, 'learning_rate': 1.9530394373959285e-05, 'epoch': 0.2} {'loss': 0.9055, 'learning_rate': 1.9530295231680047e-05, 'epoch': 0.2} {'loss': 0.9028, 'learning_rate': 1.9530196079188233e-05, 'epoch': 0.2} {'loss': 1.045, 'learning_rate': 1.9530096916483957e-05, 'epoch': 0.2} {'loss': 0.8408, 'learning_rate': 1.952999774356732e-05, 'epoch': 0.2} {'loss': 0.8216, 'learning_rate': 1.952989856043843e-05, 'epoch': 0.2} {'loss': 0.8658, 'learning_rate': 1.9529799367097396e-05, 'epoch': 0.2} {'loss': 1.0212, 'learning_rate': 1.9529700163544322e-05, 'epoch': 0.2} {'loss': 0.9637, 'learning_rate': 1.952960094977931e-05, 'epoch': 0.2} {'loss': 0.9306, 'learning_rate': 1.9529501725802474e-05, 'epoch': 0.2} {'loss': 0.9995, 'learning_rate': 1.9529402491613916e-05, 'epoch': 0.2} {'loss': 0.881, 'learning_rate': 1.9529303247213743e-05, 'epoch': 0.2} {'loss': 0.8965, 'learning_rate': 1.9529203992602062e-05, 'epoch': 0.2} {'loss': 0.9501, 'learning_rate': 1.952910472777898e-05, 'epoch': 0.2} {'loss': 0.8799, 'learning_rate': 1.9529005452744598e-05, 'epoch': 0.2} {'loss': 0.9538, 'learning_rate': 1.952890616749903e-05, 'epoch': 0.2} {'loss': 1.0555, 'learning_rate': 1.9528806872042376e-05, 'epoch': 0.2} {'loss': 0.8747, 'learning_rate': 1.952870756637475e-05, 'epoch': 0.2} {'loss': 0.8633, 'learning_rate': 1.9528608250496252e-05, 'epoch': 0.2} {'loss': 0.7771, 'learning_rate': 1.9528508924406988e-05, 'epoch': 0.2} {'loss': 0.8614, 'learning_rate': 1.952840958810707e-05, 'epoch': 0.2} {'loss': 0.8176, 'learning_rate': 1.95283102415966e-05, 'epoch': 0.2} {'loss': 0.9511, 'learning_rate': 1.9528210884875684e-05, 'epoch': 0.2} {'loss': 1.0029, 'learning_rate': 1.952811151794443e-05, 'epoch': 0.2} {'loss': 0.847, 'learning_rate': 1.9528012140802947e-05, 'epoch': 0.2} {'loss': 0.7576, 'learning_rate': 1.9527912753451337e-05, 'epoch': 0.2} {'loss': 0.8505, 'learning_rate': 1.9527813355889707e-05, 'epoch': 0.2} {'loss': 0.8395, 'learning_rate': 1.952771394811817e-05, 'epoch': 0.2} {'loss': 1.0599, 'learning_rate': 1.9527614530136825e-05, 'epoch': 0.2} {'loss': 0.948, 'learning_rate': 1.952751510194578e-05, 'epoch': 0.2} {'loss': 0.979, 'learning_rate': 1.9527415663545143e-05, 'epoch': 0.2} {'loss': 0.6536, 'learning_rate': 1.9527316214935023e-05, 'epoch': 0.2} {'loss': 1.028, 'learning_rate': 1.9527216756115523e-05, 'epoch': 0.2} {'loss': 0.9351, 'learning_rate': 1.952711728708675e-05, 'epoch': 0.2} {'loss': 0.9852, 'learning_rate': 1.9527017807848808e-05, 'epoch': 0.2} {'loss': 0.9111, 'learning_rate': 1.9526918318401806e-05, 'epoch': 0.2} {'loss': 1.0418, 'learning_rate': 1.9526818818745855e-05, 'epoch': 0.2} {'loss': 0.7239, 'learning_rate': 1.9526719308881056e-05, 'epoch': 0.2} {'loss': 0.8769, 'learning_rate': 1.952661978880752e-05, 'epoch': 0.2} {'loss': 0.9378, 'learning_rate': 1.9526520258525347e-05, 'epoch': 0.2} {'loss': 0.7598, 'learning_rate': 1.9526420718034652e-05, 'epoch': 0.2} {'loss': 0.8015, 'learning_rate': 1.9526321167335533e-05, 'epoch': 0.2} {'loss': 1.0143, 'learning_rate': 1.9526221606428102e-05, 'epoch': 0.2} {'loss': 0.856, 'learning_rate': 1.9526122035312468e-05, 'epoch': 0.2} {'loss': 1.0415, 'learning_rate': 1.952602245398873e-05, 'epoch': 0.2} {'loss': 1.1101, 'learning_rate': 1.9525922862457003e-05, 'epoch': 0.2} {'loss': 0.8586, 'learning_rate': 1.952582326071739e-05, 'epoch': 0.2} {'loss': 0.957, 'learning_rate': 1.9525723648769993e-05, 'epoch': 0.2} {'loss': 0.8094, 'learning_rate': 1.9525624026614928e-05, 'epoch': 0.2} {'loss': 0.7592, 'learning_rate': 1.9525524394252295e-05, 'epoch': 0.2} {'loss': 0.8889, 'learning_rate': 1.95254247516822e-05, 'epoch': 0.2} {'loss': 0.8001, 'learning_rate': 1.952532509890476e-05, 'epoch': 0.2} {'loss': 0.722, 'learning_rate': 1.952522543592007e-05, 'epoch': 0.2} {'loss': 0.9874, 'learning_rate': 1.9525125762728245e-05, 'epoch': 0.2} {'loss': 0.8776, 'learning_rate': 1.9525026079329384e-05, 'epoch': 0.2} {'loss': 0.7873, 'learning_rate': 1.9524926385723596e-05, 'epoch': 0.2} {'loss': 0.9227, 'learning_rate': 1.9524826681910994e-05, 'epoch': 0.2} {'loss': 1.0187, 'learning_rate': 1.9524726967891678e-05, 'epoch': 0.2} {'loss': 0.8765, 'learning_rate': 1.9524627243665758e-05, 'epoch': 0.2} {'loss': 0.8116, 'learning_rate': 1.952452750923334e-05, 'epoch': 0.2} {'loss': 1.0727, 'learning_rate': 1.9524427764594533e-05, 'epoch': 0.2} {'loss': 1.0126, 'learning_rate': 1.952432800974944e-05, 'epoch': 0.2} {'loss': 0.991, 'learning_rate': 1.952422824469817e-05, 'epoch': 0.2} {'loss': 0.7521, 'learning_rate': 1.9524128469440833e-05, 'epoch': 0.2} {'loss': 0.8664, 'learning_rate': 1.9524028683977527e-05, 'epoch': 0.2} {'loss': 0.7715, 'learning_rate': 1.952392888830837e-05, 'epoch': 0.2} {'loss': 1.0414, 'learning_rate': 1.952382908243346e-05, 'epoch': 0.2} {'loss': 0.8619, 'learning_rate': 1.952372926635291e-05, 'epoch': 0.2} {'loss': 0.8074, 'learning_rate': 1.9523629440066823e-05, 'epoch': 0.2} {'loss': 0.9817, 'learning_rate': 1.952352960357531e-05, 'epoch': 0.2} {'loss': 1.0597, 'learning_rate': 1.952342975687847e-05, 'epoch': 0.2} {'loss': 0.7308, 'learning_rate': 1.952332989997642e-05, 'epoch': 0.2} {'loss': 0.8192, 'learning_rate': 1.952323003286926e-05, 'epoch': 0.2} {'loss': 0.9687, 'learning_rate': 1.9523130155557104e-05, 'epoch': 0.2} {'loss': 0.8736, 'learning_rate': 1.952303026804005e-05, 'epoch': 0.2} {'loss': 0.8472, 'learning_rate': 1.952293037031821e-05, 'epoch': 0.2} {'loss': 0.8742, 'learning_rate': 1.9522830462391692e-05, 'epoch': 0.2} {'loss': 1.0443, 'learning_rate': 1.95227305442606e-05, 'epoch': 0.2} {'loss': 0.9708, 'learning_rate': 1.9522630615925046e-05, 'epoch': 0.2} {'loss': 0.8032, 'learning_rate': 1.9522530677385133e-05, 'epoch': 0.2} {'loss': 1.0525, 'learning_rate': 1.952243072864097e-05, 'epoch': 0.2} {'loss': 0.9154, 'learning_rate': 1.952233076969266e-05, 'epoch': 0.2} {'loss': 0.933, 'learning_rate': 1.952223080054031e-05, 'epoch': 0.2} {'loss': 0.8866, 'learning_rate': 1.9522130821184035e-05, 'epoch': 0.2} {'loss': 0.816, 'learning_rate': 1.952203083162394e-05, 'epoch': 0.2} {'loss': 0.9864, 'learning_rate': 1.9521930831860123e-05, 'epoch': 0.2} {'loss': 0.9936, 'learning_rate': 1.95218308218927e-05, 'epoch': 0.2} {'loss': 0.8898, 'learning_rate': 1.952173080172178e-05, 'epoch': 0.2} {'loss': 0.8661, 'learning_rate': 1.952163077134746e-05, 'epoch': 0.2} {'loss': 0.9357, 'learning_rate': 1.9521530730769857e-05, 'epoch': 0.2} {'loss': 0.8673, 'learning_rate': 1.9521430679989076e-05, 'epoch': 0.2} {'loss': 0.8748, 'learning_rate': 1.9521330619005218e-05, 'epoch': 0.2} {'loss': 0.9915, 'learning_rate': 1.9521230547818397e-05, 'epoch': 0.2} {'loss': 0.7923, 'learning_rate': 1.952113046642872e-05, 'epoch': 0.2} {'loss': 0.737, 'learning_rate': 1.952103037483629e-05, 'epoch': 0.2} {'loss': 0.8016, 'learning_rate': 1.9520930273041213e-05, 'epoch': 0.2} {'loss': 0.8161, 'learning_rate': 1.9520830161043606e-05, 'epoch': 0.2} {'loss': 0.9574, 'learning_rate': 1.952073003884357e-05, 'epoch': 0.2} {'loss': 0.8375, 'learning_rate': 1.952062990644121e-05, 'epoch': 0.2} {'loss': 0.7756, 'learning_rate': 1.9520529763836636e-05, 'epoch': 0.2} {'loss': 0.8303, 'learning_rate': 1.9520429611029957e-05, 'epoch': 0.2} {'loss': 0.9755, 'learning_rate': 1.9520329448021275e-05, 'epoch': 0.2} {'loss': 0.8409, 'learning_rate': 1.95202292748107e-05, 'epoch': 0.2} {'loss': 0.7346, 'learning_rate': 1.9520129091398344e-05, 'epoch': 0.2} {'loss': 0.9743, 'learning_rate': 1.952002889778431e-05, 'epoch': 0.2} {'loss': 0.767, 'learning_rate': 1.9519928693968706e-05, 'epoch': 0.2} {'loss': 1.0037, 'learning_rate': 1.951982847995164e-05, 'epoch': 0.2} {'loss': 0.9004, 'learning_rate': 1.9519728255733215e-05, 'epoch': 0.2} {'loss': 0.8348, 'learning_rate': 1.9519628021313543e-05, 'epoch': 0.2} {'loss': 0.9081, 'learning_rate': 1.951952777669273e-05, 'epoch': 0.2} {'loss': 0.778, 'learning_rate': 1.9519427521870885e-05, 'epoch': 0.2} {'loss': 0.8607, 'learning_rate': 1.9519327256848117e-05, 'epoch': 0.2} {'loss': 0.756, 'learning_rate': 1.9519226981624526e-05, 'epoch': 0.2} {'loss': 0.8158, 'learning_rate': 1.9519126696200227e-05, 'epoch': 0.2} {'loss': 0.8959, 'learning_rate': 1.9519026400575323e-05, 'epoch': 0.2} {'loss': 0.9987, 'learning_rate': 1.9518926094749924e-05, 'epoch': 0.2} {'loss': 0.968, 'learning_rate': 1.9518825778724136e-05, 'epoch': 0.2} {'loss': 0.7793, 'learning_rate': 1.9518725452498067e-05, 'epoch': 0.2} {'loss': 0.8725, 'learning_rate': 1.9518625116071823e-05, 'epoch': 0.2} {'loss': 0.8883, 'learning_rate': 1.9518524769445517e-05, 'epoch': 0.2} {'loss': 0.9123, 'learning_rate': 1.951842441261925e-05, 'epoch': 0.2} {'loss': 0.9351, 'learning_rate': 1.9518324045593132e-05, 'epoch': 0.2} {'loss': 0.9652, 'learning_rate': 1.951822366836727e-05, 'epoch': 0.2} {'loss': 0.7605, 'learning_rate': 1.9518123280941775e-05, 'epoch': 0.2} {'loss': 0.9908, 'learning_rate': 1.951802288331675e-05, 'epoch': 0.2} {'loss': 0.8287, 'learning_rate': 1.9517922475492304e-05, 'epoch': 0.2} {'loss': 0.935, 'learning_rate': 1.9517822057468544e-05, 'epoch': 0.2} {'loss': 0.9264, 'learning_rate': 1.9517721629245583e-05, 'epoch': 0.2} {'loss': 0.8549, 'learning_rate': 1.951762119082352e-05, 'epoch': 0.2} {'loss': 0.98, 'learning_rate': 1.9517520742202468e-05, 'epoch': 0.2} {'loss': 0.8696, 'learning_rate': 1.9517420283382535e-05, 'epoch': 0.2} {'loss': 1.0682, 'learning_rate': 1.9517319814363827e-05, 'epoch': 0.2} {'loss': 0.8111, 'learning_rate': 1.951721933514645e-05, 'epoch': 0.2} {'loss': 0.9637, 'learning_rate': 1.9517118845730515e-05, 'epoch': 0.2} {'loss': 0.9231, 'learning_rate': 1.9517018346116126e-05, 'epoch': 0.2} {'loss': 0.8594, 'learning_rate': 1.9516917836303397e-05, 'epoch': 0.2} {'loss': 1.0647, 'learning_rate': 1.951681731629243e-05, 'epoch': 0.2} {'loss': 1.0045, 'learning_rate': 1.9516716786083332e-05, 'epoch': 0.2} {'loss': 0.8097, 'learning_rate': 1.9516616245676214e-05, 'epoch': 0.2} {'loss': 0.9099, 'learning_rate': 1.9516515695071184e-05, 'epoch': 0.2} {'loss': 1.0089, 'learning_rate': 1.951641513426835e-05, 'epoch': 0.2} {'loss': 0.9795, 'learning_rate': 1.9516314563267816e-05, 'epoch': 0.2} {'loss': 0.8821, 'learning_rate': 1.951621398206969e-05, 'epoch': 0.2} {'loss': 0.9616, 'learning_rate': 1.9516113390674086e-05, 'epoch': 0.2} {'loss': 0.8594, 'learning_rate': 1.9516012789081105e-05, 'epoch': 0.2} {'loss': 0.9628, 'learning_rate': 1.9515912177290857e-05, 'epoch': 0.2} {'loss': 0.8572, 'learning_rate': 1.951581155530345e-05, 'epoch': 0.2} {'loss': 1.088, 'learning_rate': 1.9515710923118997e-05, 'epoch': 0.2} {'loss': 0.7702, 'learning_rate': 1.9515610280737595e-05, 'epoch': 0.2} {'loss': 1.014, 'learning_rate': 1.951550962815936e-05, 'epoch': 0.2} {'loss': 0.9707, 'learning_rate': 1.9515408965384397e-05, 'epoch': 0.2} {'loss': 0.7907, 'learning_rate': 1.9515308292412817e-05, 'epoch': 0.2} {'loss': 0.8534, 'learning_rate': 1.9515207609244722e-05, 'epoch': 0.2} {'loss': 0.872, 'learning_rate': 1.9515106915880224e-05, 'epoch': 0.2} {'loss': 1.0235, 'learning_rate': 1.9515006212319432e-05, 'epoch': 0.2} {'loss': 0.8067, 'learning_rate': 1.951490549856245e-05, 'epoch': 0.2} {'loss': 1.0137, 'learning_rate': 1.951480477460939e-05, 'epoch': 0.2} {'loss': 0.9219, 'learning_rate': 1.9514704040460354e-05, 'epoch': 0.2} {'loss': 0.8464, 'learning_rate': 1.9514603296115457e-05, 'epoch': 0.2} {'loss': 1.1493, 'learning_rate': 1.9514502541574804e-05, 'epoch': 0.2} {'loss': 0.8793, 'learning_rate': 1.9514401776838504e-05, 'epoch': 0.2} {'loss': 1.0023, 'learning_rate': 1.951430100190666e-05, 'epoch': 0.2} {'loss': 0.9582, 'learning_rate': 1.9514200216779387e-05, 'epoch': 0.2} {'loss': 0.7981, 'learning_rate': 1.951409942145679e-05, 'epoch': 0.2} {'loss': 0.8084, 'learning_rate': 1.9513998615938975e-05, 'epoch': 0.2} {'loss': 1.002, 'learning_rate': 1.951389780022605e-05, 'epoch': 0.2} {'loss': 0.9125, 'learning_rate': 1.9513796974318125e-05, 'epoch': 0.2} {'loss': 0.8339, 'learning_rate': 1.951369613821531e-05, 'epoch': 0.2} {'loss': 0.9083, 'learning_rate': 1.9513595291917713e-05, 'epoch': 0.2} {'loss': 1.1197, 'learning_rate': 1.9513494435425437e-05, 'epoch': 0.21} {'loss': 0.8069, 'learning_rate': 1.9513393568738595e-05, 'epoch': 0.21} {'loss': 0.8201, 'learning_rate': 1.9513292691857294e-05, 'epoch': 0.21} {'loss': 0.8024, 'learning_rate': 1.9513191804781636e-05, 'epoch': 0.21} {'loss': 1.0512, 'learning_rate': 1.9513090907511737e-05, 'epoch': 0.21} {'loss': 1.0823, 'learning_rate': 1.9512990000047702e-05, 'epoch': 0.21} {'loss': 0.8834, 'learning_rate': 1.9512889082389642e-05, 'epoch': 0.21} {'loss': 0.9203, 'learning_rate': 1.9512788154537662e-05, 'epoch': 0.21} {'loss': 1.1022, 'learning_rate': 1.9512687216491872e-05, 'epoch': 0.21} {'loss': 0.9085, 'learning_rate': 1.9512586268252375e-05, 'epoch': 0.21} {'loss': 0.809, 'learning_rate': 1.9512485309819284e-05, 'epoch': 0.21} {'loss': 0.9804, 'learning_rate': 1.951238434119271e-05, 'epoch': 0.21} {'loss': 0.7996, 'learning_rate': 1.9512283362372756e-05, 'epoch': 0.21} {'loss': 0.6216, 'learning_rate': 1.9512182373359533e-05, 'epoch': 0.21} {'loss': 0.7853, 'learning_rate': 1.9512081374153146e-05, 'epoch': 0.21} {'loss': 0.9072, 'learning_rate': 1.9511980364753703e-05, 'epoch': 0.21} {'loss': 0.8557, 'learning_rate': 1.9511879345161316e-05, 'epoch': 0.21} {'loss': 1.1129, 'learning_rate': 1.9511778315376094e-05, 'epoch': 0.21} {'loss': 0.9582, 'learning_rate': 1.9511677275398145e-05, 'epoch': 0.21} {'loss': 0.9737, 'learning_rate': 1.9511576225227574e-05, 'epoch': 0.21} {'loss': 1.0494, 'learning_rate': 1.9511475164864486e-05, 'epoch': 0.21} {'loss': 0.9336, 'learning_rate': 1.9511374094308997e-05, 'epoch': 0.21} {'loss': 0.8263, 'learning_rate': 1.951127301356121e-05, 'epoch': 0.21} {'loss': 0.8646, 'learning_rate': 1.951117192262124e-05, 'epoch': 0.21} {'loss': 0.8237, 'learning_rate': 1.951107082148919e-05, 'epoch': 0.21} {'loss': 0.9256, 'learning_rate': 1.9510969710165168e-05, 'epoch': 0.21} {'loss': 0.9786, 'learning_rate': 1.9510868588649283e-05, 'epoch': 0.21} {'loss': 0.7457, 'learning_rate': 1.9510767456941643e-05, 'epoch': 0.21} {'loss': 0.9285, 'learning_rate': 1.9510666315042358e-05, 'epoch': 0.21} {'loss': 1.011, 'learning_rate': 1.9510565162951538e-05, 'epoch': 0.21} {'loss': 0.8741, 'learning_rate': 1.9510464000669285e-05, 'epoch': 0.21} {'loss': 0.8518, 'learning_rate': 1.9510362828195715e-05, 'epoch': 0.21} {'loss': 1.1459, 'learning_rate': 1.9510261645530933e-05, 'epoch': 0.21} {'loss': 0.8637, 'learning_rate': 1.9510160452675043e-05, 'epoch': 0.21} {'loss': 1.0629, 'learning_rate': 1.951005924962816e-05, 'epoch': 0.21} {'loss': 0.869, 'learning_rate': 1.9509958036390392e-05, 'epoch': 0.21} {'loss': 1.0434, 'learning_rate': 1.9509856812961844e-05, 'epoch': 0.21} {'loss': 0.8154, 'learning_rate': 1.9509755579342626e-05, 'epoch': 0.21} {'loss': 1.0461, 'learning_rate': 1.950965433553285e-05, 'epoch': 0.21} {'loss': 0.9267, 'learning_rate': 1.950955308153262e-05, 'epoch': 0.21} {'loss': 0.9866, 'learning_rate': 1.950945181734204e-05, 'epoch': 0.21} {'loss': 0.8207, 'learning_rate': 1.9509350542961228e-05, 'epoch': 0.21} {'loss': 0.6572, 'learning_rate': 1.9509249258390287e-05, 'epoch': 0.21} {'loss': 0.968, 'learning_rate': 1.950914796362933e-05, 'epoch': 0.21} {'loss': 0.6723, 'learning_rate': 1.950904665867846e-05, 'epoch': 0.21} {'loss': 0.8673, 'learning_rate': 1.9508945343537792e-05, 'epoch': 0.21} {'loss': 0.9983, 'learning_rate': 1.9508844018207426e-05, 'epoch': 0.21} {'loss': 0.8791, 'learning_rate': 1.950874268268748e-05, 'epoch': 0.21} {'loss': 0.8807, 'learning_rate': 1.9508641336978055e-05, 'epoch': 0.21} {'loss': 0.7751, 'learning_rate': 1.9508539981079263e-05, 'epoch': 0.21} {'loss': 0.8148, 'learning_rate': 1.9508438614991214e-05, 'epoch': 0.21} {'loss': 0.9324, 'learning_rate': 1.950833723871401e-05, 'epoch': 0.21} {'loss': 0.8831, 'learning_rate': 1.950823585224777e-05, 'epoch': 0.21} {'loss': 0.7433, 'learning_rate': 1.9508134455592595e-05, 'epoch': 0.21} {'loss': 0.8973, 'learning_rate': 1.9508033048748597e-05, 'epoch': 0.21} {'loss': 0.963, 'learning_rate': 1.950793163171588e-05, 'epoch': 0.21} {'loss': 1.0547, 'learning_rate': 1.950783020449456e-05, 'epoch': 0.21} {'loss': 0.8751, 'learning_rate': 1.950772876708474e-05, 'epoch': 0.21} {'loss': 0.8512, 'learning_rate': 1.950762731948653e-05, 'epoch': 0.21} {'loss': 0.634, 'learning_rate': 1.950752586170004e-05, 'epoch': 0.21} {'loss': 0.9425, 'learning_rate': 1.9507424393725377e-05, 'epoch': 0.21} {'loss': 0.8378, 'learning_rate': 1.950732291556265e-05, 'epoch': 0.21} {'loss': 0.9223, 'learning_rate': 1.950722142721197e-05, 'epoch': 0.21} {'loss': 1.0673, 'learning_rate': 1.9507119928673446e-05, 'epoch': 0.21} {'loss': 0.7506, 'learning_rate': 1.9507018419947182e-05, 'epoch': 0.21} {'loss': 0.776, 'learning_rate': 1.950691690103329e-05, 'epoch': 0.21} {'loss': 0.9245, 'learning_rate': 1.950681537193188e-05, 'epoch': 0.21} {'loss': 0.8465, 'learning_rate': 1.950671383264306e-05, 'epoch': 0.21} {'loss': 0.9133, 'learning_rate': 1.9506612283166936e-05, 'epoch': 0.21} {'loss': 1.0323, 'learning_rate': 1.950651072350362e-05, 'epoch': 0.21} {'loss': 0.6299, 'learning_rate': 1.9506409153653218e-05, 'epoch': 0.21} {'loss': 1.0176, 'learning_rate': 1.950630757361584e-05, 'epoch': 0.21} {'loss': 0.8832, 'learning_rate': 1.95062059833916e-05, 'epoch': 0.21} {'loss': 0.8222, 'learning_rate': 1.9506104382980598e-05, 'epoch': 0.21} {'loss': 0.9157, 'learning_rate': 1.950600277238295e-05, 'epoch': 0.21} {'loss': 0.907, 'learning_rate': 1.950590115159876e-05, 'epoch': 0.21} {'loss': 0.995, 'learning_rate': 1.950579952062814e-05, 'epoch': 0.21} {'loss': 0.7457, 'learning_rate': 1.9505697879471196e-05, 'epoch': 0.21} {'loss': 1.085, 'learning_rate': 1.950559622812804e-05, 'epoch': 0.21} {'loss': 0.8087, 'learning_rate': 1.9505494566598782e-05, 'epoch': 0.21} {'loss': 1.0835, 'learning_rate': 1.9505392894883525e-05, 'epoch': 0.21} {'loss': 0.965, 'learning_rate': 1.9505291212982382e-05, 'epoch': 0.21} {'loss': 0.779, 'learning_rate': 1.9505189520895465e-05, 'epoch': 0.21} {'loss': 0.9755, 'learning_rate': 1.9505087818622878e-05, 'epoch': 0.21} {'loss': 1.0371, 'learning_rate': 1.950498610616473e-05, 'epoch': 0.21} {'loss': 0.8078, 'learning_rate': 1.9504884383521133e-05, 'epoch': 0.21} {'loss': 0.9844, 'learning_rate': 1.950478265069219e-05, 'epoch': 0.21} {'loss': 0.9588, 'learning_rate': 1.950468090767802e-05, 'epoch': 0.21} {'loss': 0.8664, 'learning_rate': 1.9504579154478724e-05, 'epoch': 0.21} {'loss': 0.8739, 'learning_rate': 1.9504477391094417e-05, 'epoch': 0.21} {'loss': 0.961, 'learning_rate': 1.9504375617525204e-05, 'epoch': 0.21} {'loss': 0.9676, 'learning_rate': 1.950427383377119e-05, 'epoch': 0.21} {'loss': 0.8914, 'learning_rate': 1.9504172039832492e-05, 'epoch': 0.21} {'loss': 0.743, 'learning_rate': 1.9504070235709215e-05, 'epoch': 0.21} {'loss': 0.967, 'learning_rate': 1.950396842140147e-05, 'epoch': 0.21} {'loss': 0.8931, 'learning_rate': 1.9503866596909365e-05, 'epoch': 0.21} {'loss': 0.975, 'learning_rate': 1.950376476223301e-05, 'epoch': 0.21} {'loss': 0.5782, 'learning_rate': 1.9503662917372512e-05, 'epoch': 0.21} {'loss': 0.9487, 'learning_rate': 1.950356106232798e-05, 'epoch': 0.21} {'loss': 0.8848, 'learning_rate': 1.9503459197099527e-05, 'epoch': 0.21} {'loss': 0.9845, 'learning_rate': 1.9503357321687256e-05, 'epoch': 0.21} {'loss': 0.8484, 'learning_rate': 1.9503255436091285e-05, 'epoch': 0.21} {'loss': 0.8575, 'learning_rate': 1.9503153540311714e-05, 'epoch': 0.21} {'loss': 0.9888, 'learning_rate': 1.950305163434866e-05, 'epoch': 0.21} {'loss': 0.8772, 'learning_rate': 1.9502949718202228e-05, 'epoch': 0.21} {'loss': 0.8489, 'learning_rate': 1.9502847791872523e-05, 'epoch': 0.21} {'loss': 0.8547, 'learning_rate': 1.9502745855359663e-05, 'epoch': 0.21} {'loss': 1.0121, 'learning_rate': 1.9502643908663752e-05, 'epoch': 0.21} {'loss': 0.929, 'learning_rate': 1.95025419517849e-05, 'epoch': 0.21} {'loss': 0.8655, 'learning_rate': 1.950243998472322e-05, 'epoch': 0.21} {'loss': 0.9076, 'learning_rate': 1.950233800747881e-05, 'epoch': 0.21} {'loss': 0.9183, 'learning_rate': 1.9502236020051794e-05, 'epoch': 0.21} {'loss': 0.9073, 'learning_rate': 1.950213402244227e-05, 'epoch': 0.21} {'loss': 0.924, 'learning_rate': 1.9502032014650355e-05, 'epoch': 0.21} {'loss': 0.9416, 'learning_rate': 1.9501929996676157e-05, 'epoch': 0.21} {'loss': 0.8989, 'learning_rate': 1.9501827968519783e-05, 'epoch': 0.21} {'loss': 0.9751, 'learning_rate': 1.950172593018134e-05, 'epoch': 0.21} {'loss': 0.7647, 'learning_rate': 1.9501623881660938e-05, 'epoch': 0.21} {'loss': 0.812, 'learning_rate': 1.9501521822958692e-05, 'epoch': 0.21} {'loss': 0.9717, 'learning_rate': 1.9501419754074708e-05, 'epoch': 0.21} {'loss': 0.9954, 'learning_rate': 1.9501317675009096e-05, 'epoch': 0.21} {'loss': 0.908, 'learning_rate': 1.9501215585761962e-05, 'epoch': 0.21} {'loss': 0.7916, 'learning_rate': 1.9501113486333417e-05, 'epoch': 0.21} {'loss': 0.9662, 'learning_rate': 1.9501011376723574e-05, 'epoch': 0.21} {'loss': 1.0347, 'learning_rate': 1.950090925693254e-05, 'epoch': 0.21} {'loss': 1.0845, 'learning_rate': 1.950080712696042e-05, 'epoch': 0.21} {'loss': 0.9944, 'learning_rate': 1.950070498680733e-05, 'epoch': 0.21} {'loss': 0.8778, 'learning_rate': 1.950060283647338e-05, 'epoch': 0.21} {'loss': 0.8736, 'learning_rate': 1.9500500675958673e-05, 'epoch': 0.21} {'loss': 0.9096, 'learning_rate': 1.9500398505263324e-05, 'epoch': 0.21} {'loss': 0.9737, 'learning_rate': 1.950029632438744e-05, 'epoch': 0.21} {'loss': 0.9805, 'learning_rate': 1.9500194133331135e-05, 'epoch': 0.21} {'loss': 0.9465, 'learning_rate': 1.950009193209451e-05, 'epoch': 0.21} {'loss': 0.8457, 'learning_rate': 1.9499989720677678e-05, 'epoch': 0.21} {'loss': 0.7967, 'learning_rate': 1.949988749908075e-05, 'epoch': 0.21} {'loss': 0.8273, 'learning_rate': 1.9499785267303837e-05, 'epoch': 0.21} {'loss': 0.5933, 'learning_rate': 1.9499683025347047e-05, 'epoch': 0.21} {'loss': 0.9026, 'learning_rate': 1.949958077321049e-05, 'epoch': 0.21} {'loss': 0.8973, 'learning_rate': 1.949947851089427e-05, 'epoch': 0.21} {'loss': 1.0539, 'learning_rate': 1.9499376238398507e-05, 'epoch': 0.21} {'loss': 0.9103, 'learning_rate': 1.94992739557233e-05, 'epoch': 0.21} {'loss': 0.7251, 'learning_rate': 1.949917166286877e-05, 'epoch': 0.21} {'loss': 0.969, 'learning_rate': 1.9499069359835015e-05, 'epoch': 0.21} {'loss': 0.8765, 'learning_rate': 1.949896704662215e-05, 'epoch': 0.21} {'loss': 0.8651, 'learning_rate': 1.9498864723230285e-05, 'epoch': 0.21} {'loss': 0.9815, 'learning_rate': 1.949876238965953e-05, 'epoch': 0.21} {'loss': 0.8508, 'learning_rate': 1.9498660045909993e-05, 'epoch': 0.21} {'loss': 0.8625, 'learning_rate': 1.9498557691981786e-05, 'epoch': 0.21} {'loss': 0.8123, 'learning_rate': 1.9498455327875016e-05, 'epoch': 0.21} {'loss': 0.9179, 'learning_rate': 1.9498352953589795e-05, 'epoch': 0.21} {'loss': 0.7874, 'learning_rate': 1.949825056912623e-05, 'epoch': 0.21} {'loss': 1.0856, 'learning_rate': 1.9498148174484434e-05, 'epoch': 0.21} {'loss': 0.8995, 'learning_rate': 1.9498045769664512e-05, 'epoch': 0.21} {'loss': 0.9876, 'learning_rate': 1.949794335466658e-05, 'epoch': 0.21} {'loss': 0.985, 'learning_rate': 1.9497840929490742e-05, 'epoch': 0.21} {'loss': 0.7766, 'learning_rate': 1.949773849413711e-05, 'epoch': 0.21} {'loss': 1.0353, 'learning_rate': 1.9497636048605796e-05, 'epoch': 0.21} {'loss': 0.9363, 'learning_rate': 1.9497533592896908e-05, 'epoch': 0.21} {'loss': 0.9558, 'learning_rate': 1.9497431127010553e-05, 'epoch': 0.21} {'loss': 0.8132, 'learning_rate': 1.9497328650946846e-05, 'epoch': 0.21} {'loss': 0.9873, 'learning_rate': 1.949722616470589e-05, 'epoch': 0.21} {'loss': 0.8195, 'learning_rate': 1.9497123668287802e-05, 'epoch': 0.21} {'loss': 1.1061, 'learning_rate': 1.9497021161692688e-05, 'epoch': 0.21} {'loss': 0.8515, 'learning_rate': 1.9496918644920663e-05, 'epoch': 0.21} {'loss': 0.9097, 'learning_rate': 1.9496816117971828e-05, 'epoch': 0.21} {'loss': 0.7863, 'learning_rate': 1.94967135808463e-05, 'epoch': 0.21} {'loss': 1.0344, 'learning_rate': 1.9496611033544184e-05, 'epoch': 0.21} {'loss': 1.0591, 'learning_rate': 1.949650847606559e-05, 'epoch': 0.21} {'loss': 1.0025, 'learning_rate': 1.9496405908410634e-05, 'epoch': 0.21} {'loss': 0.8201, 'learning_rate': 1.949630333057942e-05, 'epoch': 0.21} {'loss': 0.8391, 'learning_rate': 1.949620074257206e-05, 'epoch': 0.21} {'loss': 0.7923, 'learning_rate': 1.9496098144388664e-05, 'epoch': 0.21} {'loss': 0.8652, 'learning_rate': 1.9495995536029345e-05, 'epoch': 0.21} {'loss': 0.8492, 'learning_rate': 1.9495892917494205e-05, 'epoch': 0.21} {'loss': 0.8377, 'learning_rate': 1.949579028878336e-05, 'epoch': 0.21} {'loss': 0.7856, 'learning_rate': 1.949568764989692e-05, 'epoch': 0.21} {'loss': 1.05, 'learning_rate': 1.9495585000834994e-05, 'epoch': 0.21} {'loss': 0.9744, 'learning_rate': 1.9495482341597692e-05, 'epoch': 0.21} {'loss': 1.0558, 'learning_rate': 1.949537967218512e-05, 'epoch': 0.21} {'loss': 0.8742, 'learning_rate': 1.9495276992597393e-05, 'epoch': 0.21} {'loss': 0.8424, 'learning_rate': 1.949517430283462e-05, 'epoch': 0.21} {'loss': 0.7918, 'learning_rate': 1.949507160289691e-05, 'epoch': 0.21} {'loss': 0.852, 'learning_rate': 1.9494968892784376e-05, 'epoch': 0.21} {'loss': 0.9816, 'learning_rate': 1.9494866172497127e-05, 'epoch': 0.21} {'loss': 0.9725, 'learning_rate': 1.949476344203527e-05, 'epoch': 0.21} {'loss': 0.9054, 'learning_rate': 1.9494660701398916e-05, 'epoch': 0.21} {'loss': 0.839, 'learning_rate': 1.9494557950588177e-05, 'epoch': 0.21} {'loss': 0.9978, 'learning_rate': 1.9494455189603163e-05, 'epoch': 0.21} {'loss': 0.8357, 'learning_rate': 1.9494352418443983e-05, 'epoch': 0.21} {'loss': 0.8573, 'learning_rate': 1.9494249637110747e-05, 'epoch': 0.21} {'loss': 0.7855, 'learning_rate': 1.9494146845603565e-05, 'epoch': 0.21} {'loss': 0.9861, 'learning_rate': 1.9494044043922548e-05, 'epoch': 0.21} {'loss': 0.9752, 'learning_rate': 1.949394123206781e-05, 'epoch': 0.21} {'loss': 0.8861, 'learning_rate': 1.949383841003945e-05, 'epoch': 0.21} {'loss': 0.8712, 'learning_rate': 1.9493735577837588e-05, 'epoch': 0.21} {'loss': 0.8158, 'learning_rate': 1.9493632735462333e-05, 'epoch': 0.21} {'loss': 0.9228, 'learning_rate': 1.9493529882913793e-05, 'epoch': 0.21} {'loss': 0.881, 'learning_rate': 1.949342702019208e-05, 'epoch': 0.21} {'loss': 0.9202, 'learning_rate': 1.94933241472973e-05, 'epoch': 0.21} {'loss': 1.0791, 'learning_rate': 1.9493221264229565e-05, 'epoch': 0.21} {'loss': 1.0267, 'learning_rate': 1.9493118370988993e-05, 'epoch': 0.21} {'loss': 0.9241, 'learning_rate': 1.9493015467575684e-05, 'epoch': 0.21} {'loss': 0.8961, 'learning_rate': 1.9492912553989753e-05, 'epoch': 0.21} {'loss': 0.802, 'learning_rate': 1.9492809630231312e-05, 'epoch': 0.21} {'loss': 0.9028, 'learning_rate': 1.9492706696300463e-05, 'epoch': 0.21} {'loss': 0.9396, 'learning_rate': 1.9492603752197324e-05, 'epoch': 0.21} {'loss': 0.9865, 'learning_rate': 1.9492500797922004e-05, 'epoch': 0.21} {'loss': 1.1232, 'learning_rate': 1.9492397833474615e-05, 'epoch': 0.21} {'loss': 0.7199, 'learning_rate': 1.949229485885526e-05, 'epoch': 0.21} {'loss': 0.888, 'learning_rate': 1.949219187406406e-05, 'epoch': 0.21} {'loss': 0.941, 'learning_rate': 1.9492088879101113e-05, 'epoch': 0.21} {'loss': 0.7693, 'learning_rate': 1.949198587396654e-05, 'epoch': 0.21} {'loss': 0.9535, 'learning_rate': 1.9491882858660453e-05, 'epoch': 0.21} {'loss': 0.9059, 'learning_rate': 1.9491779833182947e-05, 'epoch': 0.21} {'loss': 0.8305, 'learning_rate': 1.9491676797534147e-05, 'epoch': 0.21} {'loss': 0.7944, 'learning_rate': 1.949157375171416e-05, 'epoch': 0.21} {'loss': 0.7437, 'learning_rate': 1.949147069572309e-05, 'epoch': 0.21} {'loss': 0.9171, 'learning_rate': 1.9491367629561057e-05, 'epoch': 0.21} {'loss': 0.7413, 'learning_rate': 1.9491264553228167e-05, 'epoch': 0.21} {'loss': 0.8364, 'learning_rate': 1.9491161466724526e-05, 'epoch': 0.21} {'loss': 1.0074, 'learning_rate': 1.9491058370050252e-05, 'epoch': 0.21} {'loss': 0.8455, 'learning_rate': 1.9490955263205453e-05, 'epoch': 0.21} {'loss': 0.8252, 'learning_rate': 1.949085214619024e-05, 'epoch': 0.21} {'loss': 1.048, 'learning_rate': 1.949074901900472e-05, 'epoch': 0.21} {'loss': 0.7541, 'learning_rate': 1.9490645881649004e-05, 'epoch': 0.21} {'loss': 0.8349, 'learning_rate': 1.9490542734123205e-05, 'epoch': 0.21} {'loss': 0.9334, 'learning_rate': 1.9490439576427434e-05, 'epoch': 0.21} {'loss': 0.8594, 'learning_rate': 1.9490336408561803e-05, 'epoch': 0.21} {'loss': 0.9788, 'learning_rate': 1.9490233230526416e-05, 'epoch': 0.21} {'loss': 0.8773, 'learning_rate': 1.9490130042321392e-05, 'epoch': 0.21} {'loss': 0.8667, 'learning_rate': 1.9490026843946833e-05, 'epoch': 0.21} {'loss': 0.9219, 'learning_rate': 1.9489923635402854e-05, 'epoch': 0.21} {'loss': 0.8164, 'learning_rate': 1.9489820416689567e-05, 'epoch': 0.21} {'loss': 0.8623, 'learning_rate': 1.948971718780708e-05, 'epoch': 0.21} {'loss': 0.7229, 'learning_rate': 1.9489613948755505e-05, 'epoch': 0.21} {'loss': 0.8012, 'learning_rate': 1.9489510699534954e-05, 'epoch': 0.21} {'loss': 0.9119, 'learning_rate': 1.9489407440145532e-05, 'epoch': 0.21} {'loss': 1.0638, 'learning_rate': 1.9489304170587354e-05, 'epoch': 0.21} {'loss': 0.8454, 'learning_rate': 1.9489200890860532e-05, 'epoch': 0.21} {'loss': 0.9905, 'learning_rate': 1.9489097600965175e-05, 'epoch': 0.21} {'loss': 0.7833, 'learning_rate': 1.9488994300901393e-05, 'epoch': 0.21} {'loss': 0.8226, 'learning_rate': 1.9488890990669296e-05, 'epoch': 0.21} {'loss': 0.8737, 'learning_rate': 1.9488787670268996e-05, 'epoch': 0.21} {'loss': 1.0004, 'learning_rate': 1.9488684339700607e-05, 'epoch': 0.21} {'loss': 0.8885, 'learning_rate': 1.948858099896423e-05, 'epoch': 0.21} {'loss': 0.7962, 'learning_rate': 1.9488477648059987e-05, 'epoch': 0.21} {'loss': 0.833, 'learning_rate': 1.948837428698798e-05, 'epoch': 0.21} {'loss': 1.0096, 'learning_rate': 1.9488270915748328e-05, 'epoch': 0.21} {'loss': 1.0132, 'learning_rate': 1.9488167534341133e-05, 'epoch': 0.21} {'loss': 1.0774, 'learning_rate': 1.9488064142766518e-05, 'epoch': 0.21} {'loss': 0.8591, 'learning_rate': 1.948796074102458e-05, 'epoch': 0.21} {'loss': 0.879, 'learning_rate': 1.9487857329115434e-05, 'epoch': 0.21} {'loss': 0.8123, 'learning_rate': 1.9487753907039195e-05, 'epoch': 0.21} {'loss': 0.9873, 'learning_rate': 1.948765047479597e-05, 'epoch': 0.21} {'loss': 0.9181, 'learning_rate': 1.9487547032385872e-05, 'epoch': 0.21} {'loss': 0.7537, 'learning_rate': 1.948744357980901e-05, 'epoch': 0.21} {'loss': 0.9017, 'learning_rate': 1.9487340117065498e-05, 'epoch': 0.21} {'loss': 1.0546, 'learning_rate': 1.948723664415544e-05, 'epoch': 0.21} {'loss': 0.7495, 'learning_rate': 1.948713316107896e-05, 'epoch': 0.21} {'loss': 0.7024, 'learning_rate': 1.9487029667836155e-05, 'epoch': 0.21} {'loss': 0.8703, 'learning_rate': 1.9486926164427143e-05, 'epoch': 0.21} {'loss': 0.9818, 'learning_rate': 1.9486822650852034e-05, 'epoch': 0.21} {'loss': 0.934, 'learning_rate': 1.9486719127110937e-05, 'epoch': 0.21} {'loss': 0.9357, 'learning_rate': 1.9486615593203965e-05, 'epoch': 0.21} {'loss': 0.9828, 'learning_rate': 1.9486512049131228e-05, 'epoch': 0.21} {'loss': 1.0761, 'learning_rate': 1.9486408494892835e-05, 'epoch': 0.21} {'loss': 0.8073, 'learning_rate': 1.9486304930488902e-05, 'epoch': 0.21} {'loss': 0.8765, 'learning_rate': 1.9486201355919537e-05, 'epoch': 0.21} {'loss': 0.9027, 'learning_rate': 1.948609777118485e-05, 'epoch': 0.21} {'loss': 0.8771, 'learning_rate': 1.9485994176284954e-05, 'epoch': 0.21} {'loss': 0.9016, 'learning_rate': 1.9485890571219957e-05, 'epoch': 0.21} {'loss': 0.9688, 'learning_rate': 1.948578695598997e-05, 'epoch': 0.21} {'loss': 1.0347, 'learning_rate': 1.9485683330595112e-05, 'epoch': 0.21} {'loss': 0.6844, 'learning_rate': 1.9485579695035485e-05, 'epoch': 0.21} {'loss': 0.8584, 'learning_rate': 1.9485476049311205e-05, 'epoch': 0.21} {'loss': 0.9965, 'learning_rate': 1.948537239342238e-05, 'epoch': 0.21} {'loss': 0.9082, 'learning_rate': 1.9485268727369124e-05, 'epoch': 0.21} {'loss': 0.8289, 'learning_rate': 1.9485165051151546e-05, 'epoch': 0.21} {'loss': 0.9043, 'learning_rate': 1.9485061364769752e-05, 'epoch': 0.21} {'loss': 0.9047, 'learning_rate': 1.9484957668223865e-05, 'epoch': 0.21} {'loss': 0.8028, 'learning_rate': 1.948485396151399e-05, 'epoch': 0.21} {'loss': 0.8266, 'learning_rate': 1.9484750244640232e-05, 'epoch': 0.21} {'loss': 0.8577, 'learning_rate': 1.9484646517602714e-05, 'epoch': 0.21} {'loss': 1.1197, 'learning_rate': 1.948454278040154e-05, 'epoch': 0.21} {'loss': 1.0317, 'learning_rate': 1.948443903303682e-05, 'epoch': 0.21} {'loss': 0.8324, 'learning_rate': 1.948433527550867e-05, 'epoch': 0.21} {'loss': 0.9127, 'learning_rate': 1.9484231507817198e-05, 'epoch': 0.21} {'loss': 0.9786, 'learning_rate': 1.9484127729962514e-05, 'epoch': 0.21} {'loss': 1.0353, 'learning_rate': 1.9484023941944735e-05, 'epoch': 0.21} {'loss': 0.8911, 'learning_rate': 1.9483920143763964e-05, 'epoch': 0.21} {'loss': 0.9962, 'learning_rate': 1.948381633542032e-05, 'epoch': 0.21} {'loss': 0.8158, 'learning_rate': 1.948371251691391e-05, 'epoch': 0.21} {'loss': 0.8785, 'learning_rate': 1.9483608688244847e-05, 'epoch': 0.21} {'loss': 0.9807, 'learning_rate': 1.9483504849413237e-05, 'epoch': 0.21} {'loss': 0.9339, 'learning_rate': 1.9483401000419203e-05, 'epoch': 0.21} {'loss': 1.0316, 'learning_rate': 1.948329714126284e-05, 'epoch': 0.21} {'loss': 0.9258, 'learning_rate': 1.9483193271944276e-05, 'epoch': 0.21} {'loss': 0.9578, 'learning_rate': 1.948308939246361e-05, 'epoch': 0.21} {'loss': 1.098, 'learning_rate': 1.948298550282096e-05, 'epoch': 0.21} {'loss': 0.9943, 'learning_rate': 1.9482881603016434e-05, 'epoch': 0.21} {'loss': 0.8647, 'learning_rate': 1.9482777693050146e-05, 'epoch': 0.21} {'loss': 0.8757, 'learning_rate': 1.94826737729222e-05, 'epoch': 0.21} {'loss': 0.921, 'learning_rate': 1.948256984263272e-05, 'epoch': 0.21} {'loss': 0.7888, 'learning_rate': 1.948246590218181e-05, 'epoch': 0.21} {'loss': 0.9302, 'learning_rate': 1.948236195156958e-05, 'epoch': 0.21} {'loss': 0.8764, 'learning_rate': 1.9482257990796143e-05, 'epoch': 0.21} {'loss': 0.9449, 'learning_rate': 1.9482154019861614e-05, 'epoch': 0.21} {'loss': 0.7972, 'learning_rate': 1.9482050038766097e-05, 'epoch': 0.21} {'loss': 0.8333, 'learning_rate': 1.948194604750971e-05, 'epoch': 0.21} {'loss': 0.923, 'learning_rate': 1.9481842046092557e-05, 'epoch': 0.21} {'loss': 0.8894, 'learning_rate': 1.948173803451476e-05, 'epoch': 0.21} {'loss': 0.703, 'learning_rate': 1.9481634012776424e-05, 'epoch': 0.21} {'loss': 1.0073, 'learning_rate': 1.948152998087766e-05, 'epoch': 0.21} {'loss': 0.8098, 'learning_rate': 1.9481425938818584e-05, 'epoch': 0.21} {'loss': 0.9419, 'learning_rate': 1.94813218865993e-05, 'epoch': 0.21} {'loss': 1.0695, 'learning_rate': 1.9481217824219926e-05, 'epoch': 0.21} {'loss': 1.0226, 'learning_rate': 1.9481113751680572e-05, 'epoch': 0.21} {'loss': 0.9868, 'learning_rate': 1.9481009668981346e-05, 'epoch': 0.21} {'loss': 0.7363, 'learning_rate': 1.9480905576122367e-05, 'epoch': 0.21} {'loss': 0.9574, 'learning_rate': 1.9480801473103738e-05, 'epoch': 0.21} {'loss': 0.7996, 'learning_rate': 1.9480697359925577e-05, 'epoch': 0.21} {'loss': 1.062, 'learning_rate': 1.9480593236587993e-05, 'epoch': 0.21} {'loss': 0.8835, 'learning_rate': 1.9480489103091097e-05, 'epoch': 0.21} {'loss': 0.8245, 'learning_rate': 1.9480384959435002e-05, 'epoch': 0.21} {'loss': 0.8443, 'learning_rate': 1.9480280805619815e-05, 'epoch': 0.21} {'loss': 0.7303, 'learning_rate': 1.9480176641645653e-05, 'epoch': 0.21} {'loss': 0.9186, 'learning_rate': 1.948007246751263e-05, 'epoch': 0.21} {'loss': 1.013, 'learning_rate': 1.947996828322085e-05, 'epoch': 0.21} {'loss': 0.9817, 'learning_rate': 1.947986408877043e-05, 'epoch': 0.21} {'loss': 1.0112, 'learning_rate': 1.9479759884161482e-05, 'epoch': 0.21} {'loss': 0.9646, 'learning_rate': 1.9479655669394112e-05, 'epoch': 0.21} {'loss': 0.959, 'learning_rate': 1.9479551444468435e-05, 'epoch': 0.21} {'loss': 0.8714, 'learning_rate': 1.9479447209384566e-05, 'epoch': 0.21} {'loss': 0.8235, 'learning_rate': 1.9479342964142615e-05, 'epoch': 0.21} {'loss': 0.9073, 'learning_rate': 1.9479238708742688e-05, 'epoch': 0.21} {'loss': 0.8061, 'learning_rate': 1.9479134443184905e-05, 'epoch': 0.21} {'loss': 0.7167, 'learning_rate': 1.947903016746937e-05, 'epoch': 0.21} {'loss': 0.8433, 'learning_rate': 1.94789258815962e-05, 'epoch': 0.21} {'loss': 0.8217, 'learning_rate': 1.9478821585565506e-05, 'epoch': 0.21} {'loss': 0.9713, 'learning_rate': 1.94787172793774e-05, 'epoch': 0.21} {'loss': 0.8209, 'learning_rate': 1.947861296303199e-05, 'epoch': 0.21} {'loss': 1.0267, 'learning_rate': 1.9478508636529395e-05, 'epoch': 0.21} {'loss': 0.9609, 'learning_rate': 1.947840429986972e-05, 'epoch': 0.21} {'loss': 0.8691, 'learning_rate': 1.947829995305308e-05, 'epoch': 0.21} {'loss': 0.9226, 'learning_rate': 1.9478195596079584e-05, 'epoch': 0.21} {'loss': 0.9295, 'learning_rate': 1.9478091228949348e-05, 'epoch': 0.21} {'loss': 1.0201, 'learning_rate': 1.947798685166248e-05, 'epoch': 0.21} {'loss': 0.8991, 'learning_rate': 1.9477882464219096e-05, 'epoch': 0.21} {'loss': 0.8426, 'learning_rate': 1.9477778066619306e-05, 'epoch': 0.21} {'loss': 0.9613, 'learning_rate': 1.947767365886322e-05, 'epoch': 0.21} {'loss': 0.954, 'learning_rate': 1.947756924095095e-05, 'epoch': 0.21} {'loss': 0.8681, 'learning_rate': 1.947746481288261e-05, 'epoch': 0.21} {'loss': 1.01, 'learning_rate': 1.9477360374658314e-05, 'epoch': 0.21} {'loss': 0.8781, 'learning_rate': 1.947725592627817e-05, 'epoch': 0.21} {'loss': 0.8841, 'learning_rate': 1.9477151467742286e-05, 'epoch': 0.21} {'loss': 0.8762, 'learning_rate': 1.9477046999050783e-05, 'epoch': 0.21} {'loss': 0.9154, 'learning_rate': 1.947694252020377e-05, 'epoch': 0.21} {'loss': 0.9839, 'learning_rate': 1.9476838031201353e-05, 'epoch': 0.21} {'loss': 0.8869, 'learning_rate': 1.9476733532043654e-05, 'epoch': 0.21} {'loss': 0.9015, 'learning_rate': 1.9476629022730775e-05, 'epoch': 0.21} {'loss': 0.8626, 'learning_rate': 1.9476524503262838e-05, 'epoch': 0.21} {'loss': 0.9791, 'learning_rate': 1.9476419973639945e-05, 'epoch': 0.21} {'loss': 0.8854, 'learning_rate': 1.9476315433862215e-05, 'epoch': 0.21} {'loss': 1.0428, 'learning_rate': 1.9476210883929756e-05, 'epoch': 0.21} {'loss': 0.8457, 'learning_rate': 1.9476106323842683e-05, 'epoch': 0.21} {'loss': 0.7745, 'learning_rate': 1.9476001753601107e-05, 'epoch': 0.21} {'loss': 0.9356, 'learning_rate': 1.9475897173205135e-05, 'epoch': 0.21} {'loss': 0.8446, 'learning_rate': 1.947579258265489e-05, 'epoch': 0.21} {'loss': 0.8941, 'learning_rate': 1.9475687981950478e-05, 'epoch': 0.21} {'loss': 0.9649, 'learning_rate': 1.947558337109201e-05, 'epoch': 0.21} {'loss': 0.8629, 'learning_rate': 1.9475478750079598e-05, 'epoch': 0.21} {'loss': 0.9342, 'learning_rate': 1.9475374118913355e-05, 'epoch': 0.21} {'loss': 0.9306, 'learning_rate': 1.9475269477593396e-05, 'epoch': 0.21} {'loss': 0.9546, 'learning_rate': 1.9475164826119827e-05, 'epoch': 0.21} {'loss': 0.8771, 'learning_rate': 1.9475060164492765e-05, 'epoch': 0.21} {'loss': 0.8845, 'learning_rate': 1.9474955492712322e-05, 'epoch': 0.21} {'loss': 0.9179, 'learning_rate': 1.947485081077861e-05, 'epoch': 0.21} {'loss': 0.8633, 'learning_rate': 1.947474611869174e-05, 'epoch': 0.21} {'loss': 0.8417, 'learning_rate': 1.947464141645182e-05, 'epoch': 0.21} {'loss': 0.8748, 'learning_rate': 1.947453670405897e-05, 'epoch': 0.21} {'loss': 0.9431, 'learning_rate': 1.94744319815133e-05, 'epoch': 0.21} {'loss': 0.8762, 'learning_rate': 1.947432724881492e-05, 'epoch': 0.21} {'loss': 0.8341, 'learning_rate': 1.947422250596394e-05, 'epoch': 0.21} {'loss': 0.9728, 'learning_rate': 1.947411775296048e-05, 'epoch': 0.21} {'loss': 0.8344, 'learning_rate': 1.9474012989804646e-05, 'epoch': 0.21} {'loss': 0.7619, 'learning_rate': 1.947390821649655e-05, 'epoch': 0.21} {'loss': 1.027, 'learning_rate': 1.947380343303631e-05, 'epoch': 0.21} {'loss': 0.8491, 'learning_rate': 1.947369863942403e-05, 'epoch': 0.21} {'loss': 0.8991, 'learning_rate': 1.9473593835659833e-05, 'epoch': 0.21} {'loss': 0.897, 'learning_rate': 1.947348902174382e-05, 'epoch': 0.21} {'loss': 0.9702, 'learning_rate': 1.947338419767611e-05, 'epoch': 0.21} {'loss': 1.104, 'learning_rate': 1.9473279363456814e-05, 'epoch': 0.21} {'loss': 0.8485, 'learning_rate': 1.9473174519086043e-05, 'epoch': 0.21} {'loss': 0.8976, 'learning_rate': 1.9473069664563914e-05, 'epoch': 0.21} {'loss': 0.9683, 'learning_rate': 1.9472964799890532e-05, 'epoch': 0.21} {'loss': 0.8374, 'learning_rate': 1.9472859925066016e-05, 'epoch': 0.21} {'loss': 0.7081, 'learning_rate': 1.9472755040090474e-05, 'epoch': 0.21} {'loss': 0.9263, 'learning_rate': 1.9472650144964018e-05, 'epoch': 0.21} {'loss': 0.8396, 'learning_rate': 1.9472545239686766e-05, 'epoch': 0.21} {'loss': 1.0318, 'learning_rate': 1.9472440324258825e-05, 'epoch': 0.21} {'loss': 0.9915, 'learning_rate': 1.947233539868031e-05, 'epoch': 0.21} {'loss': 0.98, 'learning_rate': 1.9472230462951334e-05, 'epoch': 0.21} {'loss': 0.8185, 'learning_rate': 1.9472125517072006e-05, 'epoch': 0.21} {'loss': 0.7888, 'learning_rate': 1.947202056104244e-05, 'epoch': 0.21} {'loss': 0.8552, 'learning_rate': 1.947191559486275e-05, 'epoch': 0.21} {'loss': 0.7809, 'learning_rate': 1.947181061853305e-05, 'epoch': 0.21} {'loss': 0.7214, 'learning_rate': 1.9471705632053446e-05, 'epoch': 0.21} {'loss': 1.0338, 'learning_rate': 1.9471600635424058e-05, 'epoch': 0.21} {'loss': 0.9744, 'learning_rate': 1.947149562864499e-05, 'epoch': 0.21} {'loss': 0.9857, 'learning_rate': 1.9471390611716367e-05, 'epoch': 0.21} {'loss': 0.8281, 'learning_rate': 1.9471285584638288e-05, 'epoch': 0.21} {'loss': 0.8457, 'learning_rate': 1.9471180547410874e-05, 'epoch': 0.21} {'loss': 0.89, 'learning_rate': 1.9471075500034237e-05, 'epoch': 0.21} {'loss': 0.9849, 'learning_rate': 1.9470970442508482e-05, 'epoch': 0.21} {'loss': 0.7708, 'learning_rate': 1.9470865374833734e-05, 'epoch': 0.21} {'loss': 0.917, 'learning_rate': 1.9470760297010098e-05, 'epoch': 0.21} {'loss': 0.9679, 'learning_rate': 1.9470655209037686e-05, 'epoch': 0.21} {'loss': 0.7637, 'learning_rate': 1.947055011091661e-05, 'epoch': 0.21} {'loss': 0.8878, 'learning_rate': 1.9470445002646987e-05, 'epoch': 0.21} {'loss': 0.9413, 'learning_rate': 1.9470339884228928e-05, 'epoch': 0.21} {'loss': 0.9577, 'learning_rate': 1.9470234755662543e-05, 'epoch': 0.21} {'loss': 0.9084, 'learning_rate': 1.9470129616947948e-05, 'epoch': 0.21} {'loss': 0.9349, 'learning_rate': 1.9470024468085254e-05, 'epoch': 0.21} {'loss': 0.6822, 'learning_rate': 1.9469919309074574e-05, 'epoch': 0.21} {'loss': 0.9436, 'learning_rate': 1.9469814139916022e-05, 'epoch': 0.21} {'loss': 0.9507, 'learning_rate': 1.9469708960609707e-05, 'epoch': 0.21} {'loss': 0.9402, 'learning_rate': 1.946960377115575e-05, 'epoch': 0.21} {'loss': 0.8394, 'learning_rate': 1.946949857155425e-05, 'epoch': 0.21} {'loss': 0.9029, 'learning_rate': 1.946939336180533e-05, 'epoch': 0.21} {'loss': 0.8736, 'learning_rate': 1.9469288141909102e-05, 'epoch': 0.21} {'loss': 0.9505, 'learning_rate': 1.9469182911865676e-05, 'epoch': 0.21} {'loss': 1.0504, 'learning_rate': 1.946907767167517e-05, 'epoch': 0.21} {'loss': 1.0056, 'learning_rate': 1.9468972421337688e-05, 'epoch': 0.21} {'loss': 0.8966, 'learning_rate': 1.9468867160853348e-05, 'epoch': 0.21} {'loss': 0.9633, 'learning_rate': 1.9468761890222262e-05, 'epoch': 0.21} {'loss': 0.7192, 'learning_rate': 1.9468656609444544e-05, 'epoch': 0.21} {'loss': 1.0782, 'learning_rate': 1.9468551318520307e-05, 'epoch': 0.21} {'loss': 0.881, 'learning_rate': 1.9468446017449662e-05, 'epoch': 0.21} {'loss': 0.8813, 'learning_rate': 1.9468340706232718e-05, 'epoch': 0.21} {'loss': 0.9884, 'learning_rate': 1.94682353848696e-05, 'epoch': 0.21} {'loss': 0.9115, 'learning_rate': 1.946813005336041e-05, 'epoch': 0.21} {'loss': 0.8549, 'learning_rate': 1.946802471170526e-05, 'epoch': 0.21} {'loss': 0.8518, 'learning_rate': 1.946791935990427e-05, 'epoch': 0.21} {'loss': 0.922, 'learning_rate': 1.946781399795755e-05, 'epoch': 0.21} {'loss': 0.8785, 'learning_rate': 1.9467708625865213e-05, 'epoch': 0.21} {'loss': 0.5593, 'learning_rate': 1.946760324362737e-05, 'epoch': 0.21} {'loss': 0.8623, 'learning_rate': 1.9467497851244142e-05, 'epoch': 0.21} {'loss': 0.8933, 'learning_rate': 1.946739244871563e-05, 'epoch': 0.21} {'loss': 1.0104, 'learning_rate': 1.9467287036041953e-05, 'epoch': 0.21} {'loss': 0.7646, 'learning_rate': 1.9467181613223224e-05, 'epoch': 0.21} {'loss': 0.8529, 'learning_rate': 1.9467076180259555e-05, 'epoch': 0.21} {'loss': 0.6994, 'learning_rate': 1.946697073715106e-05, 'epoch': 0.21} {'loss': 0.8218, 'learning_rate': 1.946686528389785e-05, 'epoch': 0.21} {'loss': 0.991, 'learning_rate': 1.946675982050004e-05, 'epoch': 0.21} {'loss': 1.041, 'learning_rate': 1.9466654346957745e-05, 'epoch': 0.21} {'loss': 0.999, 'learning_rate': 1.9466548863271072e-05, 'epoch': 0.21} {'loss': 0.8459, 'learning_rate': 1.946644336944014e-05, 'epoch': 0.21} {'loss': 0.8754, 'learning_rate': 1.9466337865465057e-05, 'epoch': 0.21} {'loss': 0.9105, 'learning_rate': 1.946623235134594e-05, 'epoch': 0.21} {'loss': 0.7725, 'learning_rate': 1.94661268270829e-05, 'epoch': 0.21} {'loss': 1.0615, 'learning_rate': 1.9466021292676054e-05, 'epoch': 0.21} {'loss': 0.8052, 'learning_rate': 1.9465915748125507e-05, 'epoch': 0.21} {'loss': 1.0474, 'learning_rate': 1.946581019343138e-05, 'epoch': 0.21} {'loss': 1.012, 'learning_rate': 1.9465704628593785e-05, 'epoch': 0.21} {'loss': 0.7261, 'learning_rate': 1.9465599053612828e-05, 'epoch': 0.21} {'loss': 0.9858, 'learning_rate': 1.9465493468488634e-05, 'epoch': 0.21} {'loss': 0.9002, 'learning_rate': 1.94653878732213e-05, 'epoch': 0.21} {'loss': 0.8572, 'learning_rate': 1.9465282267810956e-05, 'epoch': 0.21} {'loss': 0.9581, 'learning_rate': 1.9465176652257703e-05, 'epoch': 0.21} {'loss': 0.9855, 'learning_rate': 1.9465071026561664e-05, 'epoch': 0.21} {'loss': 0.8107, 'learning_rate': 1.9464965390722944e-05, 'epoch': 0.21} {'loss': 0.7893, 'learning_rate': 1.946485974474166e-05, 'epoch': 0.21} {'loss': 0.9215, 'learning_rate': 1.9464754088617926e-05, 'epoch': 0.21} {'loss': 0.874, 'learning_rate': 1.9464648422351852e-05, 'epoch': 0.21} {'loss': 0.8817, 'learning_rate': 1.946454274594355e-05, 'epoch': 0.21} {'loss': 0.8395, 'learning_rate': 1.946443705939314e-05, 'epoch': 0.21} {'loss': 0.7225, 'learning_rate': 1.946433136270073e-05, 'epoch': 0.21} {'loss': 0.8838, 'learning_rate': 1.9464225655866435e-05, 'epoch': 0.21} {'loss': 0.8434, 'learning_rate': 1.9464119938890368e-05, 'epoch': 0.21} {'loss': 0.9239, 'learning_rate': 1.9464014211772647e-05, 'epoch': 0.21} {'loss': 0.7519, 'learning_rate': 1.9463908474513373e-05, 'epoch': 0.21} {'loss': 0.9127, 'learning_rate': 1.946380272711267e-05, 'epoch': 0.21} {'loss': 0.9531, 'learning_rate': 1.946369696957065e-05, 'epoch': 0.22} {'loss': 0.9764, 'learning_rate': 1.9463591201887423e-05, 'epoch': 0.22} {'loss': 0.8689, 'learning_rate': 1.9463485424063105e-05, 'epoch': 0.22} {'loss': 0.7811, 'learning_rate': 1.9463379636097806e-05, 'epoch': 0.22} {'loss': 0.9646, 'learning_rate': 1.9463273837991643e-05, 'epoch': 0.22} {'loss': 0.7123, 'learning_rate': 1.9463168029744727e-05, 'epoch': 0.22} {'loss': 0.8693, 'learning_rate': 1.9463062211357173e-05, 'epoch': 0.22} {'loss': 0.9273, 'learning_rate': 1.9462956382829093e-05, 'epoch': 0.22} {'loss': 0.787, 'learning_rate': 1.9462850544160602e-05, 'epoch': 0.22} {'loss': 0.7981, 'learning_rate': 1.9462744695351813e-05, 'epoch': 0.22} {'loss': 0.8988, 'learning_rate': 1.946263883640284e-05, 'epoch': 0.22} {'loss': 0.7643, 'learning_rate': 1.9462532967313794e-05, 'epoch': 0.22} {'loss': 0.9365, 'learning_rate': 1.9462427088084788e-05, 'epoch': 0.22} {'loss': 0.8852, 'learning_rate': 1.9462321198715944e-05, 'epoch': 0.22} {'loss': 0.9102, 'learning_rate': 1.9462215299207364e-05, 'epoch': 0.22} {'loss': 0.8191, 'learning_rate': 1.9462109389559166e-05, 'epoch': 0.22} {'loss': 0.8892, 'learning_rate': 1.946200346977146e-05, 'epoch': 0.22} {'loss': 0.833, 'learning_rate': 1.946189753984437e-05, 'epoch': 0.22} {'loss': 0.8316, 'learning_rate': 1.9461791599778e-05, 'epoch': 0.22} {'loss': 0.9101, 'learning_rate': 1.9461685649572467e-05, 'epoch': 0.22} {'loss': 0.7529, 'learning_rate': 1.9461579689227883e-05, 'epoch': 0.22} {'loss': 0.9377, 'learning_rate': 1.9461473718744362e-05, 'epoch': 0.22} {'loss': 0.9612, 'learning_rate': 1.946136773812202e-05, 'epoch': 0.22} {'loss': 1.0457, 'learning_rate': 1.9461261747360967e-05, 'epoch': 0.22} {'loss': 1.1195, 'learning_rate': 1.9461155746461316e-05, 'epoch': 0.22} {'loss': 0.9286, 'learning_rate': 1.9461049735423186e-05, 'epoch': 0.22} {'loss': 0.934, 'learning_rate': 1.946094371424669e-05, 'epoch': 0.22} {'loss': 0.8822, 'learning_rate': 1.946083768293193e-05, 'epoch': 0.22} {'loss': 0.8654, 'learning_rate': 1.9460731641479037e-05, 'epoch': 0.22} {'loss': 0.891, 'learning_rate': 1.9460625589888113e-05, 'epoch': 0.22} {'loss': 0.919, 'learning_rate': 1.9460519528159273e-05, 'epoch': 0.22} {'loss': 0.7671, 'learning_rate': 1.9460413456292634e-05, 'epoch': 0.22} {'loss': 0.8815, 'learning_rate': 1.946030737428831e-05, 'epoch': 0.22} {'loss': 0.8557, 'learning_rate': 1.946020128214641e-05, 'epoch': 0.22} {'loss': 0.906, 'learning_rate': 1.9460095179867053e-05, 'epoch': 0.22} {'loss': 0.9744, 'learning_rate': 1.9459989067450348e-05, 'epoch': 0.22} {'loss': 0.934, 'learning_rate': 1.945988294489641e-05, 'epoch': 0.22} {'loss': 0.7828, 'learning_rate': 1.945977681220536e-05, 'epoch': 0.22} {'loss': 1.0439, 'learning_rate': 1.9459670669377298e-05, 'epoch': 0.22} {'loss': 0.9093, 'learning_rate': 1.9459564516412346e-05, 'epoch': 0.22} {'loss': 0.8891, 'learning_rate': 1.945945835331062e-05, 'epoch': 0.22} {'loss': 0.9533, 'learning_rate': 1.945935218007223e-05, 'epoch': 0.22} {'loss': 0.9235, 'learning_rate': 1.945924599669729e-05, 'epoch': 0.22} {'loss': 0.8508, 'learning_rate': 1.9459139803185912e-05, 'epoch': 0.22} {'loss': 0.9351, 'learning_rate': 1.9459033599538216e-05, 'epoch': 0.22} {'loss': 0.9166, 'learning_rate': 1.945892738575431e-05, 'epoch': 0.22} {'loss': 0.8108, 'learning_rate': 1.9458821161834306e-05, 'epoch': 0.22} {'loss': 0.8587, 'learning_rate': 1.9458714927778324e-05, 'epoch': 0.22} {'loss': 0.907, 'learning_rate': 1.9458608683586477e-05, 'epoch': 0.22} {'loss': 0.8938, 'learning_rate': 1.9458502429258875e-05, 'epoch': 0.22} {'loss': 0.8284, 'learning_rate': 1.9458396164795636e-05, 'epoch': 0.22} {'loss': 0.9835, 'learning_rate': 1.9458289890196872e-05, 'epoch': 0.22} {'loss': 0.9661, 'learning_rate': 1.9458183605462694e-05, 'epoch': 0.22} {'loss': 0.8465, 'learning_rate': 1.945807731059322e-05, 'epoch': 0.22} {'loss': 1.0645, 'learning_rate': 1.9457971005588564e-05, 'epoch': 0.22} {'loss': 0.7862, 'learning_rate': 1.9457864690448834e-05, 'epoch': 0.22} {'loss': 1.0571, 'learning_rate': 1.9457758365174152e-05, 'epoch': 0.22} {'loss': 0.894, 'learning_rate': 1.9457652029764626e-05, 'epoch': 0.22} {'loss': 0.8651, 'learning_rate': 1.9457545684220375e-05, 'epoch': 0.22} {'loss': 1.0531, 'learning_rate': 1.945743932854151e-05, 'epoch': 0.22} {'loss': 0.9287, 'learning_rate': 1.9457332962728143e-05, 'epoch': 0.22} {'loss': 0.9296, 'learning_rate': 1.9457226586780392e-05, 'epoch': 0.22} {'loss': 0.9478, 'learning_rate': 1.945712020069837e-05, 'epoch': 0.22} {'loss': 0.8708, 'learning_rate': 1.945701380448219e-05, 'epoch': 0.22} {'loss': 0.9647, 'learning_rate': 1.9456907398131963e-05, 'epoch': 0.22} {'loss': 0.8315, 'learning_rate': 1.9456800981647807e-05, 'epoch': 0.22} {'loss': 0.8755, 'learning_rate': 1.9456694555029834e-05, 'epoch': 0.22} {'loss': 0.9272, 'learning_rate': 1.9456588118278163e-05, 'epoch': 0.22} {'loss': 1.0206, 'learning_rate': 1.9456481671392904e-05, 'epoch': 0.22} {'loss': 0.9588, 'learning_rate': 1.945637521437417e-05, 'epoch': 0.22} {'loss': 0.936, 'learning_rate': 1.9456268747222076e-05, 'epoch': 0.22} {'loss': 0.8485, 'learning_rate': 1.9456162269936737e-05, 'epoch': 0.22} {'loss': 1.0451, 'learning_rate': 1.9456055782518265e-05, 'epoch': 0.22} {'loss': 0.7098, 'learning_rate': 1.945594928496678e-05, 'epoch': 0.22} {'loss': 0.9943, 'learning_rate': 1.945584277728239e-05, 'epoch': 0.22} {'loss': 0.9286, 'learning_rate': 1.945573625946521e-05, 'epoch': 0.22} {'loss': 0.8511, 'learning_rate': 1.9455629731515356e-05, 'epoch': 0.22} {'loss': 0.8692, 'learning_rate': 1.945552319343294e-05, 'epoch': 0.22} {'loss': 0.845, 'learning_rate': 1.9455416645218078e-05, 'epoch': 0.22} {'loss': 1.1152, 'learning_rate': 1.9455310086870883e-05, 'epoch': 0.22} {'loss': 0.8154, 'learning_rate': 1.9455203518391473e-05, 'epoch': 0.22} {'loss': 0.8966, 'learning_rate': 1.9455096939779957e-05, 'epoch': 0.22} {'loss': 1.1001, 'learning_rate': 1.9454990351036452e-05, 'epoch': 0.22} {'loss': 0.9333, 'learning_rate': 1.9454883752161072e-05, 'epoch': 0.22} {'loss': 0.9483, 'learning_rate': 1.9454777143153927e-05, 'epoch': 0.22} {'loss': 0.9862, 'learning_rate': 1.9454670524015137e-05, 'epoch': 0.22} {'loss': 0.9563, 'learning_rate': 1.945456389474482e-05, 'epoch': 0.22} {'loss': 0.8083, 'learning_rate': 1.9454457255343077e-05, 'epoch': 0.22} {'loss': 0.8775, 'learning_rate': 1.945435060581003e-05, 'epoch': 0.22} {'loss': 0.8612, 'learning_rate': 1.9454243946145796e-05, 'epoch': 0.22} {'loss': 0.8586, 'learning_rate': 1.9454137276350484e-05, 'epoch': 0.22} {'loss': 0.9414, 'learning_rate': 1.9454030596424212e-05, 'epoch': 0.22} {'loss': 0.8933, 'learning_rate': 1.9453923906367093e-05, 'epoch': 0.22} {'loss': 0.9373, 'learning_rate': 1.945381720617924e-05, 'epoch': 0.22} {'loss': 0.7672, 'learning_rate': 1.945371049586077e-05, 'epoch': 0.22} {'loss': 0.9553, 'learning_rate': 1.9453603775411796e-05, 'epoch': 0.22} {'loss': 0.8975, 'learning_rate': 1.9453497044832432e-05, 'epoch': 0.22} {'loss': 0.8632, 'learning_rate': 1.9453390304122794e-05, 'epoch': 0.22} {'loss': 0.9893, 'learning_rate': 1.9453283553282994e-05, 'epoch': 0.22} {'loss': 0.7995, 'learning_rate': 1.9453176792313148e-05, 'epoch': 0.22} {'loss': 0.8741, 'learning_rate': 1.9453070021213367e-05, 'epoch': 0.22} {'loss': 0.8516, 'learning_rate': 1.9452963239983767e-05, 'epoch': 0.22} {'loss': 0.9574, 'learning_rate': 1.945285644862447e-05, 'epoch': 0.22} {'loss': 1.0206, 'learning_rate': 1.945274964713558e-05, 'epoch': 0.22} {'loss': 0.9153, 'learning_rate': 1.9452642835517218e-05, 'epoch': 0.22} {'loss': 0.8793, 'learning_rate': 1.9452536013769495e-05, 'epoch': 0.22} {'loss': 0.905, 'learning_rate': 1.9452429181892526e-05, 'epoch': 0.22} {'loss': 0.9638, 'learning_rate': 1.9452322339886424e-05, 'epoch': 0.22} {'loss': 0.8016, 'learning_rate': 1.945221548775131e-05, 'epoch': 0.22} {'loss': 0.8965, 'learning_rate': 1.945210862548729e-05, 'epoch': 0.22} {'loss': 0.7018, 'learning_rate': 1.9452001753094485e-05, 'epoch': 0.22} {'loss': 0.9407, 'learning_rate': 1.9451894870573005e-05, 'epoch': 0.22} {'loss': 0.8384, 'learning_rate': 1.9451787977922967e-05, 'epoch': 0.22} {'loss': 1.0053, 'learning_rate': 1.9451681075144487e-05, 'epoch': 0.22} {'loss': 0.9005, 'learning_rate': 1.9451574162237676e-05, 'epoch': 0.22} {'loss': 0.8424, 'learning_rate': 1.945146723920265e-05, 'epoch': 0.22} {'loss': 1.0191, 'learning_rate': 1.9451360306039525e-05, 'epoch': 0.22} {'loss': 0.8668, 'learning_rate': 1.9451253362748415e-05, 'epoch': 0.22} {'loss': 0.978, 'learning_rate': 1.9451146409329434e-05, 'epoch': 0.22} {'loss': 0.9442, 'learning_rate': 1.9451039445782697e-05, 'epoch': 0.22} {'loss': 1.0102, 'learning_rate': 1.9450932472108316e-05, 'epoch': 0.22} {'loss': 1.0217, 'learning_rate': 1.945082548830641e-05, 'epoch': 0.22} {'loss': 0.8664, 'learning_rate': 1.9450718494377088e-05, 'epoch': 0.22} {'loss': 0.902, 'learning_rate': 1.9450611490320468e-05, 'epoch': 0.22} {'loss': 0.7691, 'learning_rate': 1.9450504476136668e-05, 'epoch': 0.22} {'loss': 0.8934, 'learning_rate': 1.9450397451825796e-05, 'epoch': 0.22} {'loss': 0.812, 'learning_rate': 1.9450290417387975e-05, 'epoch': 0.22} {'loss': 0.9595, 'learning_rate': 1.9450183372823313e-05, 'epoch': 0.22} {'loss': 0.9113, 'learning_rate': 1.9450076318131924e-05, 'epoch': 0.22} {'loss': 0.8733, 'learning_rate': 1.944996925331393e-05, 'epoch': 0.22} {'loss': 0.8357, 'learning_rate': 1.944986217836944e-05, 'epoch': 0.22} {'loss': 0.786, 'learning_rate': 1.9449755093298567e-05, 'epoch': 0.22} {'loss': 1.1006, 'learning_rate': 1.944964799810143e-05, 'epoch': 0.22} {'loss': 1.0264, 'learning_rate': 1.9449540892778144e-05, 'epoch': 0.22} {'loss': 0.8018, 'learning_rate': 1.9449433777328818e-05, 'epoch': 0.22} {'loss': 0.875, 'learning_rate': 1.9449326651753572e-05, 'epoch': 0.22} {'loss': 0.7985, 'learning_rate': 1.944921951605252e-05, 'epoch': 0.22} {'loss': 0.9449, 'learning_rate': 1.944911237022578e-05, 'epoch': 0.22} {'loss': 0.9544, 'learning_rate': 1.944900521427346e-05, 'epoch': 0.22} {'loss': 1.0281, 'learning_rate': 1.944889804819568e-05, 'epoch': 0.22} {'loss': 0.8946, 'learning_rate': 1.944879087199255e-05, 'epoch': 0.22} {'loss': 0.8211, 'learning_rate': 1.9448683685664188e-05, 'epoch': 0.22} {'loss': 0.8761, 'learning_rate': 1.9448576489210712e-05, 'epoch': 0.22} {'loss': 0.9886, 'learning_rate': 1.944846928263223e-05, 'epoch': 0.22} {'loss': 1.017, 'learning_rate': 1.944836206592886e-05, 'epoch': 0.22} {'loss': 0.8423, 'learning_rate': 1.944825483910072e-05, 'epoch': 0.22} {'loss': 0.9433, 'learning_rate': 1.9448147602147922e-05, 'epoch': 0.22} {'loss': 0.929, 'learning_rate': 1.9448040355070577e-05, 'epoch': 0.22} {'loss': 0.9897, 'learning_rate': 1.944793309786881e-05, 'epoch': 0.22} {'loss': 0.8612, 'learning_rate': 1.9447825830542726e-05, 'epoch': 0.22} {'loss': 0.8067, 'learning_rate': 1.9447718553092446e-05, 'epoch': 0.22} {'loss': 1.003, 'learning_rate': 1.9447611265518083e-05, 'epoch': 0.22} {'loss': 0.9663, 'learning_rate': 1.944750396781975e-05, 'epoch': 0.22} {'loss': 0.8397, 'learning_rate': 1.9447396659997564e-05, 'epoch': 0.22} {'loss': 0.8032, 'learning_rate': 1.944728934205164e-05, 'epoch': 0.22} {'loss': 0.8625, 'learning_rate': 1.9447182013982095e-05, 'epoch': 0.22} {'loss': 0.9972, 'learning_rate': 1.944707467578904e-05, 'epoch': 0.22} {'loss': 0.8035, 'learning_rate': 1.9446967327472592e-05, 'epoch': 0.22} {'loss': 0.7541, 'learning_rate': 1.9446859969032864e-05, 'epoch': 0.22} {'loss': 0.7701, 'learning_rate': 1.9446752600469974e-05, 'epoch': 0.22} {'loss': 1.0279, 'learning_rate': 1.9446645221784038e-05, 'epoch': 0.22} {'loss': 0.8538, 'learning_rate': 1.944653783297517e-05, 'epoch': 0.22} {'loss': 0.9256, 'learning_rate': 1.944643043404348e-05, 'epoch': 0.22} {'loss': 0.8617, 'learning_rate': 1.9446323024989088e-05, 'epoch': 0.22} {'loss': 0.6914, 'learning_rate': 1.944621560581211e-05, 'epoch': 0.22} {'loss': 0.9203, 'learning_rate': 1.944610817651266e-05, 'epoch': 0.22} {'loss': 0.7205, 'learning_rate': 1.9446000737090852e-05, 'epoch': 0.22} {'loss': 0.8454, 'learning_rate': 1.9445893287546798e-05, 'epoch': 0.22} {'loss': 0.8198, 'learning_rate': 1.9445785827880623e-05, 'epoch': 0.22} {'loss': 0.9489, 'learning_rate': 1.944567835809243e-05, 'epoch': 0.22} {'loss': 0.9897, 'learning_rate': 1.9445570878182344e-05, 'epoch': 0.22} {'loss': 0.798, 'learning_rate': 1.9445463388150474e-05, 'epoch': 0.22} {'loss': 0.8039, 'learning_rate': 1.9445355887996937e-05, 'epoch': 0.22} {'loss': 0.6935, 'learning_rate': 1.944524837772185e-05, 'epoch': 0.22} {'loss': 0.9043, 'learning_rate': 1.944514085732533e-05, 'epoch': 0.22} {'loss': 0.8277, 'learning_rate': 1.9445033326807484e-05, 'epoch': 0.22} {'loss': 0.9283, 'learning_rate': 1.9444925786168435e-05, 'epoch': 0.22} {'loss': 0.8075, 'learning_rate': 1.9444818235408294e-05, 'epoch': 0.22} {'loss': 1.0448, 'learning_rate': 1.944471067452718e-05, 'epoch': 0.22} {'loss': 0.807, 'learning_rate': 1.9444603103525205e-05, 'epoch': 0.22} {'loss': 0.7336, 'learning_rate': 1.9444495522402484e-05, 'epoch': 0.22} {'loss': 0.9527, 'learning_rate': 1.9444387931159136e-05, 'epoch': 0.22} {'loss': 1.0008, 'learning_rate': 1.9444280329795275e-05, 'epoch': 0.22} {'loss': 0.917, 'learning_rate': 1.944417271831101e-05, 'epoch': 0.22} {'loss': 0.9024, 'learning_rate': 1.9444065096706466e-05, 'epoch': 0.22} {'loss': 1.0623, 'learning_rate': 1.944395746498175e-05, 'epoch': 0.22} {'loss': 0.898, 'learning_rate': 1.9443849823136985e-05, 'epoch': 0.22} {'loss': 0.7936, 'learning_rate': 1.944374217117228e-05, 'epoch': 0.22} {'loss': 0.879, 'learning_rate': 1.9443634509087758e-05, 'epoch': 0.22} {'loss': 0.808, 'learning_rate': 1.9443526836883523e-05, 'epoch': 0.22} {'loss': 0.6135, 'learning_rate': 1.94434191545597e-05, 'epoch': 0.22} {'loss': 0.9033, 'learning_rate': 1.94433114621164e-05, 'epoch': 0.22} {'loss': 1.0687, 'learning_rate': 1.9443203759553738e-05, 'epoch': 0.22} {'loss': 0.8881, 'learning_rate': 1.944309604687183e-05, 'epoch': 0.22} {'loss': 0.9303, 'learning_rate': 1.9442988324070798e-05, 'epoch': 0.22} {'loss': 0.852, 'learning_rate': 1.944288059115075e-05, 'epoch': 0.22} {'loss': 0.9557, 'learning_rate': 1.9442772848111803e-05, 'epoch': 0.22} {'loss': 0.8604, 'learning_rate': 1.9442665094954067e-05, 'epoch': 0.22} {'loss': 0.9139, 'learning_rate': 1.944255733167767e-05, 'epoch': 0.22} {'loss': 0.8833, 'learning_rate': 1.9442449558282715e-05, 'epoch': 0.22} {'loss': 0.8676, 'learning_rate': 1.9442341774769328e-05, 'epoch': 0.22} {'loss': 0.8855, 'learning_rate': 1.9442233981137618e-05, 'epoch': 0.22} {'loss': 0.7762, 'learning_rate': 1.9442126177387702e-05, 'epoch': 0.22} {'loss': 0.7811, 'learning_rate': 1.9442018363519694e-05, 'epoch': 0.22} {'loss': 1.0226, 'learning_rate': 1.9441910539533714e-05, 'epoch': 0.22} {'loss': 1.1888, 'learning_rate': 1.944180270542987e-05, 'epoch': 0.22} {'loss': 0.8891, 'learning_rate': 1.944169486120829e-05, 'epoch': 0.22} {'loss': 0.8433, 'learning_rate': 1.9441587006869073e-05, 'epoch': 0.22} {'loss': 0.7034, 'learning_rate': 1.944147914241235e-05, 'epoch': 0.22} {'loss': 0.7921, 'learning_rate': 1.9441371267838225e-05, 'epoch': 0.22} {'loss': 0.8155, 'learning_rate': 1.944126338314682e-05, 'epoch': 0.22} {'loss': 0.8596, 'learning_rate': 1.944115548833825e-05, 'epoch': 0.22} {'loss': 0.9259, 'learning_rate': 1.9441047583412632e-05, 'epoch': 0.22} {'loss': 0.8035, 'learning_rate': 1.9440939668370075e-05, 'epoch': 0.22} {'loss': 0.7004, 'learning_rate': 1.9440831743210703e-05, 'epoch': 0.22} {'loss': 0.9467, 'learning_rate': 1.9440723807934626e-05, 'epoch': 0.22} {'loss': 0.7878, 'learning_rate': 1.944061586254196e-05, 'epoch': 0.22} {'loss': 1.0151, 'learning_rate': 1.9440507907032825e-05, 'epoch': 0.22} {'loss': 0.8615, 'learning_rate': 1.944039994140733e-05, 'epoch': 0.22} {'loss': 1.0524, 'learning_rate': 1.94402919656656e-05, 'epoch': 0.22} {'loss': 0.8785, 'learning_rate': 1.944018397980774e-05, 'epoch': 0.22} {'loss': 0.7049, 'learning_rate': 1.9440075983833873e-05, 'epoch': 0.22} {'loss': 0.8842, 'learning_rate': 1.943996797774411e-05, 'epoch': 0.22} {'loss': 0.9021, 'learning_rate': 1.9439859961538576e-05, 'epoch': 0.22} {'loss': 0.9703, 'learning_rate': 1.9439751935217374e-05, 'epoch': 0.22} {'loss': 0.7735, 'learning_rate': 1.9439643898780626e-05, 'epoch': 0.22} {'loss': 0.8937, 'learning_rate': 1.943953585222845e-05, 'epoch': 0.22} {'loss': 0.9278, 'learning_rate': 1.9439427795560957e-05, 'epoch': 0.22} {'loss': 0.8981, 'learning_rate': 1.9439319728778265e-05, 'epoch': 0.22} {'loss': 0.8755, 'learning_rate': 1.9439211651880492e-05, 'epoch': 0.22} {'loss': 0.8039, 'learning_rate': 1.9439103564867753e-05, 'epoch': 0.22} {'loss': 0.9077, 'learning_rate': 1.943899546774016e-05, 'epoch': 0.22} {'loss': 0.8664, 'learning_rate': 1.943888736049783e-05, 'epoch': 0.22} {'loss': 0.9712, 'learning_rate': 1.9438779243140882e-05, 'epoch': 0.22} {'loss': 0.8665, 'learning_rate': 1.943867111566943e-05, 'epoch': 0.22} {'loss': 0.9035, 'learning_rate': 1.9438562978083594e-05, 'epoch': 0.22} {'loss': 0.9272, 'learning_rate': 1.9438454830383482e-05, 'epoch': 0.22} {'loss': 0.9235, 'learning_rate': 1.9438346672569214e-05, 'epoch': 0.22} {'loss': 1.0349, 'learning_rate': 1.9438238504640905e-05, 'epoch': 0.22} {'loss': 0.8688, 'learning_rate': 1.943813032659867e-05, 'epoch': 0.22} {'loss': 0.8132, 'learning_rate': 1.9438022138442632e-05, 'epoch': 0.22} {'loss': 0.9198, 'learning_rate': 1.9437913940172898e-05, 'epoch': 0.22} {'loss': 0.8568, 'learning_rate': 1.9437805731789587e-05, 'epoch': 0.22} {'loss': 0.7349, 'learning_rate': 1.943769751329282e-05, 'epoch': 0.22} {'loss': 1.0001, 'learning_rate': 1.94375892846827e-05, 'epoch': 0.22} {'loss': 0.9232, 'learning_rate': 1.9437481045959357e-05, 'epoch': 0.22} {'loss': 0.7391, 'learning_rate': 1.94373727971229e-05, 'epoch': 0.22} {'loss': 0.8915, 'learning_rate': 1.9437264538173445e-05, 'epoch': 0.22} {'loss': 0.8773, 'learning_rate': 1.943715626911111e-05, 'epoch': 0.22} {'loss': 0.7911, 'learning_rate': 1.943704798993601e-05, 'epoch': 0.22} {'loss': 0.7371, 'learning_rate': 1.9436939700648266e-05, 'epoch': 0.22} {'loss': 1.0731, 'learning_rate': 1.9436831401247982e-05, 'epoch': 0.22} {'loss': 0.965, 'learning_rate': 1.9436723091735287e-05, 'epoch': 0.22} {'loss': 0.8853, 'learning_rate': 1.943661477211029e-05, 'epoch': 0.22} {'loss': 0.8423, 'learning_rate': 1.9436506442373107e-05, 'epoch': 0.22} {'loss': 1.019, 'learning_rate': 1.9436398102523855e-05, 'epoch': 0.22} {'loss': 1.0097, 'learning_rate': 1.9436289752562657e-05, 'epoch': 0.22} {'loss': 0.7846, 'learning_rate': 1.9436181392489616e-05, 'epoch': 0.22} {'loss': 0.9285, 'learning_rate': 1.943607302230486e-05, 'epoch': 0.22} {'loss': 0.8673, 'learning_rate': 1.9435964642008493e-05, 'epoch': 0.22} {'loss': 0.8715, 'learning_rate': 1.9435856251600645e-05, 'epoch': 0.22} {'loss': 0.9665, 'learning_rate': 1.9435747851081422e-05, 'epoch': 0.22} {'loss': 0.7705, 'learning_rate': 1.9435639440450943e-05, 'epoch': 0.22} {'loss': 0.7676, 'learning_rate': 1.9435531019709327e-05, 'epoch': 0.22} {'loss': 0.9732, 'learning_rate': 1.943542258885669e-05, 'epoch': 0.22} {'loss': 0.8334, 'learning_rate': 1.943531414789314e-05, 'epoch': 0.22} {'loss': 0.877, 'learning_rate': 1.9435205696818803e-05, 'epoch': 0.22} {'loss': 0.8967, 'learning_rate': 1.943509723563379e-05, 'epoch': 0.22} {'loss': 0.8905, 'learning_rate': 1.9434988764338222e-05, 'epoch': 0.22} {'loss': 0.8594, 'learning_rate': 1.9434880282932208e-05, 'epoch': 0.22} {'loss': 0.8602, 'learning_rate': 1.9434771791415873e-05, 'epoch': 0.22} {'loss': 0.9831, 'learning_rate': 1.9434663289789325e-05, 'epoch': 0.22} {'loss': 0.8804, 'learning_rate': 1.943455477805268e-05, 'epoch': 0.22} {'loss': 0.8614, 'learning_rate': 1.9434446256206064e-05, 'epoch': 0.22} {'loss': 0.9511, 'learning_rate': 1.9434337724249585e-05, 'epoch': 0.22} {'loss': 0.8781, 'learning_rate': 1.9434229182183364e-05, 'epoch': 0.22} {'loss': 0.8353, 'learning_rate': 1.9434120630007513e-05, 'epoch': 0.22} {'loss': 0.8799, 'learning_rate': 1.943401206772215e-05, 'epoch': 0.22} {'loss': 0.8833, 'learning_rate': 1.9433903495327394e-05, 'epoch': 0.22} {'loss': 0.7381, 'learning_rate': 1.9433794912823355e-05, 'epoch': 0.22} {'loss': 0.8787, 'learning_rate': 1.9433686320210155e-05, 'epoch': 0.22} {'loss': 1.0374, 'learning_rate': 1.943357771748791e-05, 'epoch': 0.22} {'loss': 0.9798, 'learning_rate': 1.9433469104656733e-05, 'epoch': 0.22} {'loss': 0.9819, 'learning_rate': 1.9433360481716744e-05, 'epoch': 0.22} {'loss': 0.8356, 'learning_rate': 1.9433251848668058e-05, 'epoch': 0.22} {'loss': 0.9504, 'learning_rate': 1.943314320551079e-05, 'epoch': 0.22} {'loss': 0.9287, 'learning_rate': 1.943303455224506e-05, 'epoch': 0.22} {'loss': 0.9131, 'learning_rate': 1.943292588887098e-05, 'epoch': 0.22} {'loss': 1.098, 'learning_rate': 1.9432817215388665e-05, 'epoch': 0.22} {'loss': 0.8389, 'learning_rate': 1.9432708531798238e-05, 'epoch': 0.22} {'loss': 0.6711, 'learning_rate': 1.9432599838099814e-05, 'epoch': 0.22} {'loss': 1.0255, 'learning_rate': 1.943249113429351e-05, 'epoch': 0.22} {'loss': 1.0005, 'learning_rate': 1.9432382420379438e-05, 'epoch': 0.22} {'loss': 0.963, 'learning_rate': 1.9432273696357712e-05, 'epoch': 0.22} {'loss': 0.9119, 'learning_rate': 1.943216496222846e-05, 'epoch': 0.22} {'loss': 0.8711, 'learning_rate': 1.943205621799179e-05, 'epoch': 0.22} {'loss': 0.8863, 'learning_rate': 1.943194746364782e-05, 'epoch': 0.22} {'loss': 0.961, 'learning_rate': 1.9431838699196668e-05, 'epoch': 0.22} {'loss': 0.7605, 'learning_rate': 1.9431729924638446e-05, 'epoch': 0.22} {'loss': 0.9292, 'learning_rate': 1.943162113997328e-05, 'epoch': 0.22} {'loss': 0.9831, 'learning_rate': 1.943151234520128e-05, 'epoch': 0.22} {'loss': 0.721, 'learning_rate': 1.9431403540322557e-05, 'epoch': 0.22} {'loss': 0.9324, 'learning_rate': 1.943129472533724e-05, 'epoch': 0.22} {'loss': 1.0172, 'learning_rate': 1.9431185900245438e-05, 'epoch': 0.22} {'loss': 0.8066, 'learning_rate': 1.9431077065047266e-05, 'epoch': 0.22} {'loss': 0.91, 'learning_rate': 1.9430968219742844e-05, 'epoch': 0.22} {'loss': 0.8336, 'learning_rate': 1.9430859364332295e-05, 'epoch': 0.22} {'loss': 0.8436, 'learning_rate': 1.943075049881572e-05, 'epoch': 0.22} {'loss': 0.8266, 'learning_rate': 1.943064162319325e-05, 'epoch': 0.22} {'loss': 0.8557, 'learning_rate': 1.9430532737464998e-05, 'epoch': 0.22} {'loss': 0.9051, 'learning_rate': 1.9430423841631075e-05, 'epoch': 0.22} {'loss': 1.0952, 'learning_rate': 1.9430314935691602e-05, 'epoch': 0.22} {'loss': 0.8959, 'learning_rate': 1.9430206019646698e-05, 'epoch': 0.22} {'loss': 0.8418, 'learning_rate': 1.9430097093496477e-05, 'epoch': 0.22} {'loss': 0.9085, 'learning_rate': 1.9429988157241054e-05, 'epoch': 0.22} {'loss': 0.8196, 'learning_rate': 1.942987921088055e-05, 'epoch': 0.22} {'loss': 1.0062, 'learning_rate': 1.9429770254415073e-05, 'epoch': 0.22} {'loss': 1.0306, 'learning_rate': 1.942966128784475e-05, 'epoch': 0.22} {'loss': 0.8784, 'learning_rate': 1.9429552311169696e-05, 'epoch': 0.22} {'loss': 0.687, 'learning_rate': 1.9429443324390026e-05, 'epoch': 0.22} {'loss': 0.8613, 'learning_rate': 1.942933432750585e-05, 'epoch': 0.22} {'loss': 0.8971, 'learning_rate': 1.9429225320517296e-05, 'epoch': 0.22} {'loss': 1.0022, 'learning_rate': 1.9429116303424478e-05, 'epoch': 0.22} {'loss': 0.9871, 'learning_rate': 1.942900727622751e-05, 'epoch': 0.22} {'loss': 0.9518, 'learning_rate': 1.9428898238926508e-05, 'epoch': 0.22} {'loss': 1.0427, 'learning_rate': 1.942878919152159e-05, 'epoch': 0.22} {'loss': 1.1509, 'learning_rate': 1.9428680134012875e-05, 'epoch': 0.22} {'loss': 0.9729, 'learning_rate': 1.9428571066400478e-05, 'epoch': 0.22} {'loss': 0.951, 'learning_rate': 1.9428461988684515e-05, 'epoch': 0.22} {'loss': 1.1604, 'learning_rate': 1.94283529008651e-05, 'epoch': 0.22} {'loss': 0.9759, 'learning_rate': 1.942824380294236e-05, 'epoch': 0.22} {'loss': 0.9941, 'learning_rate': 1.9428134694916405e-05, 'epoch': 0.22} {'loss': 0.7544, 'learning_rate': 1.9428025576787352e-05, 'epoch': 0.22} {'loss': 0.7411, 'learning_rate': 1.942791644855532e-05, 'epoch': 0.22} {'loss': 0.7205, 'learning_rate': 1.9427807310220423e-05, 'epoch': 0.22} {'loss': 0.9026, 'learning_rate': 1.942769816178278e-05, 'epoch': 0.22} {'loss': 0.8062, 'learning_rate': 1.9427589003242507e-05, 'epoch': 0.22} {'loss': 0.906, 'learning_rate': 1.942747983459972e-05, 'epoch': 0.22} {'loss': 0.9475, 'learning_rate': 1.942737065585454e-05, 'epoch': 0.22} {'loss': 0.9207, 'learning_rate': 1.942726146700708e-05, 'epoch': 0.22} {'loss': 1.0305, 'learning_rate': 1.9427152268057462e-05, 'epoch': 0.22} {'loss': 0.8121, 'learning_rate': 1.9427043059005796e-05, 'epoch': 0.22} {'loss': 0.864, 'learning_rate': 1.94269338398522e-05, 'epoch': 0.22} {'loss': 1.1297, 'learning_rate': 1.94268246105968e-05, 'epoch': 0.22} {'loss': 1.0074, 'learning_rate': 1.94267153712397e-05, 'epoch': 0.22} {'loss': 0.7975, 'learning_rate': 1.9426606121781028e-05, 'epoch': 0.22} {'loss': 0.8933, 'learning_rate': 1.94264968622209e-05, 'epoch': 0.22} {'loss': 1.0713, 'learning_rate': 1.9426387592559424e-05, 'epoch': 0.22} {'loss': 0.7477, 'learning_rate': 1.942627831279672e-05, 'epoch': 0.22} {'loss': 0.7411, 'learning_rate': 1.9426169022932915e-05, 'epoch': 0.22} {'loss': 0.907, 'learning_rate': 1.9426059722968114e-05, 'epoch': 0.22} {'loss': 0.8606, 'learning_rate': 1.9425950412902446e-05, 'epoch': 0.22} {'loss': 1.0362, 'learning_rate': 1.9425841092736015e-05, 'epoch': 0.22} {'loss': 0.9365, 'learning_rate': 1.942573176246895e-05, 'epoch': 0.22} {'loss': 0.7745, 'learning_rate': 1.942562242210136e-05, 'epoch': 0.22} {'loss': 0.9231, 'learning_rate': 1.942551307163336e-05, 'epoch': 0.22} {'loss': 1.0245, 'learning_rate': 1.9425403711065078e-05, 'epoch': 0.22} {'loss': 0.8574, 'learning_rate': 1.9425294340396624e-05, 'epoch': 0.22} {'loss': 0.8429, 'learning_rate': 1.9425184959628117e-05, 'epoch': 0.22} {'loss': 0.8295, 'learning_rate': 1.9425075568759673e-05, 'epoch': 0.22} {'loss': 0.9705, 'learning_rate': 1.9424966167791408e-05, 'epoch': 0.22} {'loss': 0.9861, 'learning_rate': 1.9424856756723444e-05, 'epoch': 0.22} {'loss': 0.7671, 'learning_rate': 1.9424747335555892e-05, 'epoch': 0.22} {'loss': 0.7159, 'learning_rate': 1.9424637904288873e-05, 'epoch': 0.22} {'loss': 0.9165, 'learning_rate': 1.9424528462922506e-05, 'epoch': 0.22} {'loss': 0.8283, 'learning_rate': 1.942441901145691e-05, 'epoch': 0.22} {'loss': 0.8244, 'learning_rate': 1.942430954989219e-05, 'epoch': 0.22} {'loss': 0.9459, 'learning_rate': 1.9424200078228476e-05, 'epoch': 0.22} {'loss': 1.0426, 'learning_rate': 1.9424090596465882e-05, 'epoch': 0.22} {'loss': 0.9473, 'learning_rate': 1.9423981104604524e-05, 'epoch': 0.22} {'loss': 0.9301, 'learning_rate': 1.9423871602644517e-05, 'epoch': 0.22} {'loss': 0.9749, 'learning_rate': 1.9423762090585984e-05, 'epoch': 0.22} {'loss': 0.9046, 'learning_rate': 1.9423652568429036e-05, 'epoch': 0.22} {'loss': 1.0731, 'learning_rate': 1.9423543036173798e-05, 'epoch': 0.22} {'loss': 0.8723, 'learning_rate': 1.942343349382038e-05, 'epoch': 0.22} {'loss': 0.9044, 'learning_rate': 1.9423323941368904e-05, 'epoch': 0.22} {'loss': 1.0935, 'learning_rate': 1.9423214378819482e-05, 'epoch': 0.22} {'loss': 0.889, 'learning_rate': 1.9423104806172242e-05, 'epoch': 0.22} {'loss': 0.7513, 'learning_rate': 1.942299522342729e-05, 'epoch': 0.22} {'loss': 0.8811, 'learning_rate': 1.9422885630584752e-05, 'epoch': 0.22} {'loss': 1.1096, 'learning_rate': 1.9422776027644737e-05, 'epoch': 0.22} {'loss': 0.9002, 'learning_rate': 1.942266641460737e-05, 'epoch': 0.22} {'loss': 0.7891, 'learning_rate': 1.9422556791472765e-05, 'epoch': 0.22} {'loss': 0.9436, 'learning_rate': 1.942244715824104e-05, 'epoch': 0.22} {'loss': 0.8948, 'learning_rate': 1.942233751491231e-05, 'epoch': 0.22} {'loss': 0.8387, 'learning_rate': 1.9422227861486696e-05, 'epoch': 0.22} {'loss': 0.767, 'learning_rate': 1.9422118197964316e-05, 'epoch': 0.22} {'loss': 1.0839, 'learning_rate': 1.9422008524345287e-05, 'epoch': 0.22} {'loss': 0.8913, 'learning_rate': 1.9421898840629723e-05, 'epoch': 0.22} {'loss': 0.8298, 'learning_rate': 1.9421789146817746e-05, 'epoch': 0.22} {'loss': 0.8328, 'learning_rate': 1.942167944290947e-05, 'epoch': 0.22} {'loss': 0.9401, 'learning_rate': 1.9421569728905013e-05, 'epoch': 0.22} {'loss': 0.8033, 'learning_rate': 1.9421460004804497e-05, 'epoch': 0.22} {'loss': 0.9375, 'learning_rate': 1.9421350270608036e-05, 'epoch': 0.22} {'loss': 0.7638, 'learning_rate': 1.9421240526315745e-05, 'epoch': 0.22} {'loss': 1.0065, 'learning_rate': 1.9421130771927747e-05, 'epoch': 0.22} {'loss': 1.0897, 'learning_rate': 1.9421021007444152e-05, 'epoch': 0.22} {'loss': 0.949, 'learning_rate': 1.9420911232865087e-05, 'epoch': 0.22} {'loss': 0.7895, 'learning_rate': 1.9420801448190664e-05, 'epoch': 0.22} {'loss': 0.8606, 'learning_rate': 1.9420691653421006e-05, 'epoch': 0.22} {'loss': 0.8822, 'learning_rate': 1.9420581848556224e-05, 'epoch': 0.22} {'loss': 0.8699, 'learning_rate': 1.9420472033596435e-05, 'epoch': 0.22} {'loss': 0.8605, 'learning_rate': 1.9420362208541762e-05, 'epoch': 0.22} {'loss': 0.8682, 'learning_rate': 1.9420252373392323e-05, 'epoch': 0.22} {'loss': 0.9762, 'learning_rate': 1.942014252814823e-05, 'epoch': 0.22} {'loss': 1.0411, 'learning_rate': 1.9420032672809608e-05, 'epoch': 0.22} {'loss': 0.8368, 'learning_rate': 1.941992280737657e-05, 'epoch': 0.22} {'loss': 0.9138, 'learning_rate': 1.9419812931849232e-05, 'epoch': 0.22} {'loss': 0.8917, 'learning_rate': 1.9419703046227715e-05, 'epoch': 0.22} {'loss': 0.8193, 'learning_rate': 1.9419593150512134e-05, 'epoch': 0.22} {'loss': 0.8067, 'learning_rate': 1.9419483244702614e-05, 'epoch': 0.22} {'loss': 0.9682, 'learning_rate': 1.9419373328799263e-05, 'epoch': 0.22} {'loss': 0.9415, 'learning_rate': 1.9419263402802206e-05, 'epoch': 0.22} {'loss': 0.9603, 'learning_rate': 1.941915346671156e-05, 'epoch': 0.22} {'loss': 0.8945, 'learning_rate': 1.9419043520527434e-05, 'epoch': 0.22} {'loss': 0.8002, 'learning_rate': 1.941893356424996e-05, 'epoch': 0.22} {'loss': 1.1346, 'learning_rate': 1.9418823597879243e-05, 'epoch': 0.22} {'loss': 0.9573, 'learning_rate': 1.9418713621415408e-05, 'epoch': 0.22} {'loss': 0.8749, 'learning_rate': 1.9418603634858572e-05, 'epoch': 0.22} {'loss': 0.8087, 'learning_rate': 1.9418493638208854e-05, 'epoch': 0.22} {'loss': 0.864, 'learning_rate': 1.9418383631466366e-05, 'epoch': 0.22} {'loss': 0.7708, 'learning_rate': 1.941827361463123e-05, 'epoch': 0.22} {'loss': 0.8465, 'learning_rate': 1.941816358770357e-05, 'epoch': 0.22} {'loss': 0.8447, 'learning_rate': 1.941805355068349e-05, 'epoch': 0.22} {'loss': 0.8395, 'learning_rate': 1.9417943503571123e-05, 'epoch': 0.22} {'loss': 0.7728, 'learning_rate': 1.9417833446366576e-05, 'epoch': 0.22} {'loss': 0.8567, 'learning_rate': 1.9417723379069966e-05, 'epoch': 0.22} {'loss': 0.8365, 'learning_rate': 1.941761330168142e-05, 'epoch': 0.22} {'loss': 0.988, 'learning_rate': 1.9417503214201053e-05, 'epoch': 0.22} {'loss': 0.7565, 'learning_rate': 1.941739311662898e-05, 'epoch': 0.22} {'loss': 1.062, 'learning_rate': 1.9417283008965317e-05, 'epoch': 0.22} {'loss': 0.8488, 'learning_rate': 1.941717289121019e-05, 'epoch': 0.22} {'loss': 0.9844, 'learning_rate': 1.9417062763363707e-05, 'epoch': 0.22} {'loss': 0.8767, 'learning_rate': 1.9416952625425997e-05, 'epoch': 0.22} {'loss': 0.9661, 'learning_rate': 1.941684247739717e-05, 'epoch': 0.22} {'loss': 0.9042, 'learning_rate': 1.9416732319277344e-05, 'epoch': 0.22} {'loss': 0.8503, 'learning_rate': 1.9416622151066642e-05, 'epoch': 0.22} {'loss': 0.8991, 'learning_rate': 1.9416511972765176e-05, 'epoch': 0.22} {'loss': 0.8138, 'learning_rate': 1.9416401784373074e-05, 'epoch': 0.22} {'loss': 0.7679, 'learning_rate': 1.941629158589044e-05, 'epoch': 0.22} {'loss': 0.773, 'learning_rate': 1.9416181377317403e-05, 'epoch': 0.22} {'loss': 0.8837, 'learning_rate': 1.9416071158654078e-05, 'epoch': 0.22} {'loss': 0.983, 'learning_rate': 1.9415960929900585e-05, 'epoch': 0.22} {'loss': 0.8426, 'learning_rate': 1.941585069105704e-05, 'epoch': 0.22} {'loss': 0.8724, 'learning_rate': 1.941574044212356e-05, 'epoch': 0.22} {'loss': 0.837, 'learning_rate': 1.9415630183100266e-05, 'epoch': 0.22} {'loss': 0.9084, 'learning_rate': 1.941551991398727e-05, 'epoch': 0.22} {'loss': 1.0709, 'learning_rate': 1.9415409634784697e-05, 'epoch': 0.22} {'loss': 0.866, 'learning_rate': 1.941529934549266e-05, 'epoch': 0.22} {'loss': 0.8077, 'learning_rate': 1.9415189046111284e-05, 'epoch': 0.22} {'loss': 0.8085, 'learning_rate': 1.941507873664068e-05, 'epoch': 0.22} {'loss': 1.0323, 'learning_rate': 1.9414968417080974e-05, 'epoch': 0.22} {'loss': 1.0123, 'learning_rate': 1.9414858087432277e-05, 'epoch': 0.22} {'loss': 0.8292, 'learning_rate': 1.941474774769471e-05, 'epoch': 0.22} {'loss': 0.7798, 'learning_rate': 1.9414637397868387e-05, 'epoch': 0.22} {'loss': 0.9859, 'learning_rate': 1.9414527037953435e-05, 'epoch': 0.22} {'loss': 1.0694, 'learning_rate': 1.9414416667949967e-05, 'epoch': 0.22} {'loss': 0.9417, 'learning_rate': 1.9414306287858104e-05, 'epoch': 0.22} {'loss': 0.953, 'learning_rate': 1.941419589767796e-05, 'epoch': 0.22} {'loss': 0.7721, 'learning_rate': 1.9414085497409653e-05, 'epoch': 0.22} {'loss': 0.9105, 'learning_rate': 1.9413975087053305e-05, 'epoch': 0.22} {'loss': 0.9063, 'learning_rate': 1.9413864666609036e-05, 'epoch': 0.22} {'loss': 1.0118, 'learning_rate': 1.9413754236076957e-05, 'epoch': 0.22} {'loss': 0.975, 'learning_rate': 1.941364379545719e-05, 'epoch': 0.22} {'loss': 0.8941, 'learning_rate': 1.941353334474986e-05, 'epoch': 0.22} {'loss': 0.8091, 'learning_rate': 1.9413422883955076e-05, 'epoch': 0.22} {'loss': 0.7531, 'learning_rate': 1.941331241307296e-05, 'epoch': 0.22} {'loss': 0.7872, 'learning_rate': 1.9413201932103626e-05, 'epoch': 0.22} {'loss': 0.8871, 'learning_rate': 1.9413091441047204e-05, 'epoch': 0.22} {'loss': 1.0918, 'learning_rate': 1.9412980939903802e-05, 'epoch': 0.22} {'loss': 0.8459, 'learning_rate': 1.941287042867354e-05, 'epoch': 0.22} {'loss': 0.9303, 'learning_rate': 1.941275990735654e-05, 'epoch': 0.22} {'loss': 0.899, 'learning_rate': 1.9412649375952916e-05, 'epoch': 0.22} {'loss': 1.0672, 'learning_rate': 1.941253883446279e-05, 'epoch': 0.22} {'loss': 1.0645, 'learning_rate': 1.9412428282886274e-05, 'epoch': 0.22} {'loss': 0.9909, 'learning_rate': 1.94123177212235e-05, 'epoch': 0.22} {'loss': 0.9617, 'learning_rate': 1.9412207149474572e-05, 'epoch': 0.22} {'loss': 0.9819, 'learning_rate': 1.9412096567639617e-05, 'epoch': 0.22} {'loss': 0.8394, 'learning_rate': 1.9411985975718752e-05, 'epoch': 0.22} {'loss': 0.7745, 'learning_rate': 1.9411875373712093e-05, 'epoch': 0.22} {'loss': 0.8133, 'learning_rate': 1.941176476161976e-05, 'epoch': 0.22} {'loss': 0.9542, 'learning_rate': 1.9411654139441874e-05, 'epoch': 0.23} {'loss': 0.8999, 'learning_rate': 1.9411543507178544e-05, 'epoch': 0.23} {'loss': 0.9653, 'learning_rate': 1.94114328648299e-05, 'epoch': 0.23} {'loss': 0.881, 'learning_rate': 1.941132221239606e-05, 'epoch': 0.23} {'loss': 0.9361, 'learning_rate': 1.9411211549877135e-05, 'epoch': 0.23} {'loss': 0.8999, 'learning_rate': 1.9411100877273248e-05, 'epoch': 0.23} {'loss': 0.9343, 'learning_rate': 1.941099019458452e-05, 'epoch': 0.23} {'loss': 1.0065, 'learning_rate': 1.9410879501811063e-05, 'epoch': 0.23} {'loss': 0.9041, 'learning_rate': 1.9410768798953e-05, 'epoch': 0.23} {'loss': 1.0034, 'learning_rate': 1.9410658086010448e-05, 'epoch': 0.23} {'loss': 0.9333, 'learning_rate': 1.941054736298353e-05, 'epoch': 0.23} {'loss': 0.8758, 'learning_rate': 1.9410436629872356e-05, 'epoch': 0.23} {'loss': 0.9103, 'learning_rate': 1.941032588667705e-05, 'epoch': 0.23} {'loss': 1.0025, 'learning_rate': 1.9410215133397735e-05, 'epoch': 0.23} {'loss': 0.8237, 'learning_rate': 1.9410104370034525e-05, 'epoch': 0.23} {'loss': 0.9322, 'learning_rate': 1.9409993596587534e-05, 'epoch': 0.23} {'loss': 1.1175, 'learning_rate': 1.940988281305689e-05, 'epoch': 0.23} {'loss': 0.9294, 'learning_rate': 1.9409772019442705e-05, 'epoch': 0.23} {'loss': 0.7651, 'learning_rate': 1.94096612157451e-05, 'epoch': 0.23} {'loss': 0.9079, 'learning_rate': 1.9409550401964196e-05, 'epoch': 0.23} {'loss': 1.0162, 'learning_rate': 1.940943957810011e-05, 'epoch': 0.23} {'loss': 1.0004, 'learning_rate': 1.9409328744152956e-05, 'epoch': 0.23} {'loss': 0.8369, 'learning_rate': 1.940921790012286e-05, 'epoch': 0.23} {'loss': 0.9515, 'learning_rate': 1.9409107046009935e-05, 'epoch': 0.23} {'loss': 0.8629, 'learning_rate': 1.9408996181814307e-05, 'epoch': 0.23} {'loss': 0.9129, 'learning_rate': 1.9408885307536086e-05, 'epoch': 0.23} {'loss': 0.7389, 'learning_rate': 1.9408774423175396e-05, 'epoch': 0.23} {'loss': 0.8033, 'learning_rate': 1.940866352873236e-05, 'epoch': 0.23} {'loss': 1.1113, 'learning_rate': 1.9408552624207084e-05, 'epoch': 0.23} {'loss': 1.0774, 'learning_rate': 1.94084417095997e-05, 'epoch': 0.23} {'loss': 0.9411, 'learning_rate': 1.940833078491032e-05, 'epoch': 0.23} {'loss': 1.0334, 'learning_rate': 1.9408219850139065e-05, 'epoch': 0.23} {'loss': 0.7747, 'learning_rate': 1.9408108905286053e-05, 'epoch': 0.23} {'loss': 0.7854, 'learning_rate': 1.9407997950351403e-05, 'epoch': 0.23} {'loss': 0.7914, 'learning_rate': 1.9407886985335233e-05, 'epoch': 0.23} {'loss': 0.9605, 'learning_rate': 1.9407776010237666e-05, 'epoch': 0.23} {'loss': 0.9479, 'learning_rate': 1.9407665025058814e-05, 'epoch': 0.23} {'loss': 0.8059, 'learning_rate': 1.9407554029798803e-05, 'epoch': 0.23} {'loss': 0.8729, 'learning_rate': 1.940744302445775e-05, 'epoch': 0.23} {'loss': 0.8703, 'learning_rate': 1.940733200903577e-05, 'epoch': 0.23} {'loss': 0.9013, 'learning_rate': 1.9407220983532982e-05, 'epoch': 0.23} {'loss': 0.7625, 'learning_rate': 1.940710994794951e-05, 'epoch': 0.23} {'loss': 0.7843, 'learning_rate': 1.9406998902285472e-05, 'epoch': 0.23} {'loss': 0.8839, 'learning_rate': 1.9406887846540984e-05, 'epoch': 0.23} {'loss': 0.9879, 'learning_rate': 1.940677678071617e-05, 'epoch': 0.23} {'loss': 1.0486, 'learning_rate': 1.9406665704811144e-05, 'epoch': 0.23} {'loss': 0.9281, 'learning_rate': 1.9406554618826024e-05, 'epoch': 0.23} {'loss': 0.9519, 'learning_rate': 1.9406443522760934e-05, 'epoch': 0.23} {'loss': 0.8779, 'learning_rate': 1.940633241661599e-05, 'epoch': 0.23} {'loss': 0.7673, 'learning_rate': 1.9406221300391312e-05, 'epoch': 0.23} {'loss': 0.9047, 'learning_rate': 1.9406110174087017e-05, 'epoch': 0.23} {'loss': 0.8303, 'learning_rate': 1.9405999037703233e-05, 'epoch': 0.23} {'loss': 0.9137, 'learning_rate': 1.9405887891240065e-05, 'epoch': 0.23} {'loss': 0.9197, 'learning_rate': 1.9405776734697643e-05, 'epoch': 0.23} {'loss': 0.9525, 'learning_rate': 1.940566556807608e-05, 'epoch': 0.23} {'loss': 0.9819, 'learning_rate': 1.9405554391375497e-05, 'epoch': 0.23} {'loss': 0.8499, 'learning_rate': 1.9405443204596014e-05, 'epoch': 0.23} {'loss': 0.8622, 'learning_rate': 1.9405332007737754e-05, 'epoch': 0.23} {'loss': 0.8741, 'learning_rate': 1.940522080080083e-05, 'epoch': 0.23} {'loss': 0.9559, 'learning_rate': 1.940510958378536e-05, 'epoch': 0.23} {'loss': 0.7907, 'learning_rate': 1.9404998356691465e-05, 'epoch': 0.23} {'loss': 0.7952, 'learning_rate': 1.940488711951927e-05, 'epoch': 0.23} {'loss': 1.0004, 'learning_rate': 1.9404775872268887e-05, 'epoch': 0.23} {'loss': 0.9191, 'learning_rate': 1.9404664614940437e-05, 'epoch': 0.23} {'loss': 0.9098, 'learning_rate': 1.9404553347534042e-05, 'epoch': 0.23} {'loss': 0.9452, 'learning_rate': 1.940444207004982e-05, 'epoch': 0.23} {'loss': 0.8807, 'learning_rate': 1.9404330782487887e-05, 'epoch': 0.23} {'loss': 0.8304, 'learning_rate': 1.940421948484837e-05, 'epoch': 0.23} {'loss': 0.9773, 'learning_rate': 1.9404108177131375e-05, 'epoch': 0.23} {'loss': 1.0347, 'learning_rate': 1.9403996859337034e-05, 'epoch': 0.23} {'loss': 0.7531, 'learning_rate': 1.940388553146546e-05, 'epoch': 0.23} {'loss': 0.9452, 'learning_rate': 1.9403774193516777e-05, 'epoch': 0.23} {'loss': 0.7354, 'learning_rate': 1.9403662845491098e-05, 'epoch': 0.23} {'loss': 0.8151, 'learning_rate': 1.9403551487388546e-05, 'epoch': 0.23} {'loss': 0.9075, 'learning_rate': 1.940344011920924e-05, 'epoch': 0.23} {'loss': 1.0204, 'learning_rate': 1.9403328740953303e-05, 'epoch': 0.23} {'loss': 0.9244, 'learning_rate': 1.9403217352620847e-05, 'epoch': 0.23} {'loss': 0.9871, 'learning_rate': 1.9403105954211995e-05, 'epoch': 0.23} {'loss': 0.7116, 'learning_rate': 1.9402994545726862e-05, 'epoch': 0.23} {'loss': 1.0404, 'learning_rate': 1.940288312716558e-05, 'epoch': 0.23} {'loss': 0.8917, 'learning_rate': 1.9402771698528255e-05, 'epoch': 0.23} {'loss': 0.922, 'learning_rate': 1.9402660259815014e-05, 'epoch': 0.23} {'loss': 0.9124, 'learning_rate': 1.940254881102597e-05, 'epoch': 0.23} {'loss': 0.9783, 'learning_rate': 1.940243735216125e-05, 'epoch': 0.23} {'loss': 0.9453, 'learning_rate': 1.940232588322097e-05, 'epoch': 0.23} {'loss': 0.873, 'learning_rate': 1.9402214404205248e-05, 'epoch': 0.23} {'loss': 0.9229, 'learning_rate': 1.9402102915114204e-05, 'epoch': 0.23} {'loss': 0.9455, 'learning_rate': 1.9401991415947957e-05, 'epoch': 0.23} {'loss': 0.9786, 'learning_rate': 1.940187990670663e-05, 'epoch': 0.23} {'loss': 0.8092, 'learning_rate': 1.940176838739034e-05, 'epoch': 0.23} {'loss': 0.8481, 'learning_rate': 1.9401656857999206e-05, 'epoch': 0.23} {'loss': 0.953, 'learning_rate': 1.9401545318533347e-05, 'epoch': 0.23} {'loss': 0.9892, 'learning_rate': 1.9401433768992885e-05, 'epoch': 0.23} {'loss': 0.9077, 'learning_rate': 1.940132220937794e-05, 'epoch': 0.23} {'loss': 0.9742, 'learning_rate': 1.9401210639688627e-05, 'epoch': 0.23} {'loss': 0.8941, 'learning_rate': 1.9401099059925067e-05, 'epoch': 0.23} {'loss': 0.9789, 'learning_rate': 1.9400987470087386e-05, 'epoch': 0.23} {'loss': 0.7861, 'learning_rate': 1.9400875870175694e-05, 'epoch': 0.23} {'loss': 0.8154, 'learning_rate': 1.9400764260190114e-05, 'epoch': 0.23} {'loss': 1.0628, 'learning_rate': 1.940065264013077e-05, 'epoch': 0.23} {'loss': 0.8495, 'learning_rate': 1.9400541009997778e-05, 'epoch': 0.23} {'loss': 0.8807, 'learning_rate': 1.9400429369791255e-05, 'epoch': 0.23} {'loss': 0.9945, 'learning_rate': 1.940031771951133e-05, 'epoch': 0.23} {'loss': 0.869, 'learning_rate': 1.9400206059158107e-05, 'epoch': 0.23} {'loss': 0.8984, 'learning_rate': 1.940009438873172e-05, 'epoch': 0.23} {'loss': 1.0191, 'learning_rate': 1.9399982708232282e-05, 'epoch': 0.23} {'loss': 0.9553, 'learning_rate': 1.9399871017659916e-05, 'epoch': 0.23} {'loss': 0.9479, 'learning_rate': 1.939975931701474e-05, 'epoch': 0.23} {'loss': 0.8042, 'learning_rate': 1.939964760629687e-05, 'epoch': 0.23} {'loss': 1.0263, 'learning_rate': 1.9399535885506433e-05, 'epoch': 0.23} {'loss': 0.9753, 'learning_rate': 1.9399424154643545e-05, 'epoch': 0.23} {'loss': 0.7882, 'learning_rate': 1.9399312413708322e-05, 'epoch': 0.23} {'loss': 0.9786, 'learning_rate': 1.939920066270089e-05, 'epoch': 0.23} {'loss': 1.0352, 'learning_rate': 1.9399088901621367e-05, 'epoch': 0.23} {'loss': 0.794, 'learning_rate': 1.939897713046987e-05, 'epoch': 0.23} {'loss': 0.8268, 'learning_rate': 1.939886534924652e-05, 'epoch': 0.23} {'loss': 0.8557, 'learning_rate': 1.939875355795144e-05, 'epoch': 0.23} {'loss': 0.7442, 'learning_rate': 1.9398641756584746e-05, 'epoch': 0.23} {'loss': 0.9614, 'learning_rate': 1.939852994514656e-05, 'epoch': 0.23} {'loss': 0.9004, 'learning_rate': 1.9398418123636998e-05, 'epoch': 0.23} {'loss': 1.036, 'learning_rate': 1.9398306292056184e-05, 'epoch': 0.23} {'loss': 1.1057, 'learning_rate': 1.9398194450404237e-05, 'epoch': 0.23} {'loss': 0.8046, 'learning_rate': 1.939808259868128e-05, 'epoch': 0.23} {'loss': 0.9845, 'learning_rate': 1.9397970736887423e-05, 'epoch': 0.23} {'loss': 0.7539, 'learning_rate': 1.9397858865022797e-05, 'epoch': 0.23} {'loss': 0.9637, 'learning_rate': 1.9397746983087514e-05, 'epoch': 0.23} {'loss': 1.1228, 'learning_rate': 1.9397635091081698e-05, 'epoch': 0.23} {'loss': 1.0615, 'learning_rate': 1.939752318900547e-05, 'epoch': 0.23} {'loss': 0.8417, 'learning_rate': 1.9397411276858945e-05, 'epoch': 0.23} {'loss': 0.8812, 'learning_rate': 1.9397299354642245e-05, 'epoch': 0.23} {'loss': 0.8306, 'learning_rate': 1.9397187422355492e-05, 'epoch': 0.23} {'loss': 0.933, 'learning_rate': 1.9397075479998805e-05, 'epoch': 0.23} {'loss': 0.7895, 'learning_rate': 1.9396963527572302e-05, 'epoch': 0.23} {'loss': 1.2082, 'learning_rate': 1.9396851565076106e-05, 'epoch': 0.23} {'loss': 0.9201, 'learning_rate': 1.9396739592510335e-05, 'epoch': 0.23} {'loss': 0.762, 'learning_rate': 1.9396627609875107e-05, 'epoch': 0.23} {'loss': 0.7941, 'learning_rate': 1.9396515617170547e-05, 'epoch': 0.23} {'loss': 0.7393, 'learning_rate': 1.9396403614396772e-05, 'epoch': 0.23} {'loss': 0.9746, 'learning_rate': 1.9396291601553903e-05, 'epoch': 0.23} {'loss': 0.8501, 'learning_rate': 1.939617957864206e-05, 'epoch': 0.23} {'loss': 0.753, 'learning_rate': 1.9396067545661357e-05, 'epoch': 0.23} {'loss': 0.7645, 'learning_rate': 1.9395955502611928e-05, 'epoch': 0.23} {'loss': 0.9754, 'learning_rate': 1.939584344949388e-05, 'epoch': 0.23} {'loss': 0.9721, 'learning_rate': 1.939573138630734e-05, 'epoch': 0.23} {'loss': 0.859, 'learning_rate': 1.9395619313052423e-05, 'epoch': 0.23} {'loss': 1.0569, 'learning_rate': 1.9395507229729254e-05, 'epoch': 0.23} {'loss': 0.9741, 'learning_rate': 1.939539513633795e-05, 'epoch': 0.23} {'loss': 0.8502, 'learning_rate': 1.939528303287863e-05, 'epoch': 0.23} {'loss': 0.9419, 'learning_rate': 1.939517091935142e-05, 'epoch': 0.23} {'loss': 0.8958, 'learning_rate': 1.9395058795756434e-05, 'epoch': 0.23} {'loss': 0.8802, 'learning_rate': 1.9394946662093795e-05, 'epoch': 0.23} {'loss': 0.9337, 'learning_rate': 1.9394834518363624e-05, 'epoch': 0.23} {'loss': 0.8968, 'learning_rate': 1.9394722364566036e-05, 'epoch': 0.23} {'loss': 1.0061, 'learning_rate': 1.939461020070116e-05, 'epoch': 0.23} {'loss': 0.7917, 'learning_rate': 1.939449802676911e-05, 'epoch': 0.23} {'loss': 0.9182, 'learning_rate': 1.9394385842770007e-05, 'epoch': 0.23} {'loss': 0.8791, 'learning_rate': 1.939427364870397e-05, 'epoch': 0.23} {'loss': 0.8023, 'learning_rate': 1.9394161444571122e-05, 'epoch': 0.23} {'loss': 0.8736, 'learning_rate': 1.9394049230371584e-05, 'epoch': 0.23} {'loss': 0.7668, 'learning_rate': 1.9393937006105473e-05, 'epoch': 0.23} {'loss': 0.7811, 'learning_rate': 1.9393824771772907e-05, 'epoch': 0.23} {'loss': 0.9161, 'learning_rate': 1.9393712527374016e-05, 'epoch': 0.23} {'loss': 0.7022, 'learning_rate': 1.9393600272908913e-05, 'epoch': 0.23} {'loss': 0.9915, 'learning_rate': 1.9393488008377715e-05, 'epoch': 0.23} {'loss': 0.8467, 'learning_rate': 1.939337573378055e-05, 'epoch': 0.23} {'loss': 0.8216, 'learning_rate': 1.9393263449117538e-05, 'epoch': 0.23} {'loss': 0.8951, 'learning_rate': 1.9393151154388792e-05, 'epoch': 0.23} {'loss': 1.0505, 'learning_rate': 1.939303884959444e-05, 'epoch': 0.23} {'loss': 0.927, 'learning_rate': 1.9392926534734596e-05, 'epoch': 0.23} {'loss': 0.8674, 'learning_rate': 1.9392814209809383e-05, 'epoch': 0.23} {'loss': 0.8726, 'learning_rate': 1.9392701874818926e-05, 'epoch': 0.23} {'loss': 1.0689, 'learning_rate': 1.9392589529763338e-05, 'epoch': 0.23} {'loss': 0.9915, 'learning_rate': 1.9392477174642742e-05, 'epoch': 0.23} {'loss': 0.8399, 'learning_rate': 1.939236480945726e-05, 'epoch': 0.23} {'loss': 0.7275, 'learning_rate': 1.939225243420701e-05, 'epoch': 0.23} {'loss': 1.0258, 'learning_rate': 1.9392140048892117e-05, 'epoch': 0.23} {'loss': 0.8778, 'learning_rate': 1.9392027653512696e-05, 'epoch': 0.23} {'loss': 0.9997, 'learning_rate': 1.939191524806887e-05, 'epoch': 0.23} {'loss': 0.9817, 'learning_rate': 1.939180283256076e-05, 'epoch': 0.23} {'loss': 0.8146, 'learning_rate': 1.9391690406988484e-05, 'epoch': 0.23} {'loss': 0.9432, 'learning_rate': 1.9391577971352166e-05, 'epoch': 0.23} {'loss': 0.8817, 'learning_rate': 1.9391465525651923e-05, 'epoch': 0.23} {'loss': 0.8626, 'learning_rate': 1.939135306988788e-05, 'epoch': 0.23} {'loss': 0.7396, 'learning_rate': 1.939124060406015e-05, 'epoch': 0.23} {'loss': 0.8281, 'learning_rate': 1.9391128128168863e-05, 'epoch': 0.23} {'loss': 0.769, 'learning_rate': 1.9391015642214132e-05, 'epoch': 0.23} {'loss': 1.0315, 'learning_rate': 1.939090314619608e-05, 'epoch': 0.23} {'loss': 0.9214, 'learning_rate': 1.9390790640114826e-05, 'epoch': 0.23} {'loss': 0.9213, 'learning_rate': 1.9390678123970496e-05, 'epoch': 0.23} {'loss': 0.8697, 'learning_rate': 1.9390565597763204e-05, 'epoch': 0.23} {'loss': 1.0333, 'learning_rate': 1.9390453061493076e-05, 'epoch': 0.23} {'loss': 0.9397, 'learning_rate': 1.9390340515160227e-05, 'epoch': 0.23} {'loss': 0.792, 'learning_rate': 1.9390227958764782e-05, 'epoch': 0.23} {'loss': 1.0583, 'learning_rate': 1.939011539230686e-05, 'epoch': 0.23} {'loss': 0.8983, 'learning_rate': 1.9390002815786584e-05, 'epoch': 0.23} {'loss': 0.9098, 'learning_rate': 1.9389890229204068e-05, 'epoch': 0.23} {'loss': 0.956, 'learning_rate': 1.938977763255944e-05, 'epoch': 0.23} {'loss': 0.9321, 'learning_rate': 1.9389665025852817e-05, 'epoch': 0.23} {'loss': 0.9706, 'learning_rate': 1.9389552409084323e-05, 'epoch': 0.23} {'loss': 0.7614, 'learning_rate': 1.9389439782254074e-05, 'epoch': 0.23} {'loss': 0.8765, 'learning_rate': 1.9389327145362192e-05, 'epoch': 0.23} {'loss': 1.0048, 'learning_rate': 1.9389214498408798e-05, 'epoch': 0.23} {'loss': 0.9869, 'learning_rate': 1.9389101841394015e-05, 'epoch': 0.23} {'loss': 0.89, 'learning_rate': 1.938898917431796e-05, 'epoch': 0.23} {'loss': 0.9553, 'learning_rate': 1.9388876497180758e-05, 'epoch': 0.23} {'loss': 0.9671, 'learning_rate': 1.938876380998253e-05, 'epoch': 0.23} {'loss': 0.7649, 'learning_rate': 1.9388651112723387e-05, 'epoch': 0.23} {'loss': 0.8576, 'learning_rate': 1.9388538405403463e-05, 'epoch': 0.23} {'loss': 0.923, 'learning_rate': 1.938842568802287e-05, 'epoch': 0.23} {'loss': 0.9541, 'learning_rate': 1.9388312960581734e-05, 'epoch': 0.23} {'loss': 0.9634, 'learning_rate': 1.9388200223080172e-05, 'epoch': 0.23} {'loss': 0.8137, 'learning_rate': 1.9388087475518306e-05, 'epoch': 0.23} {'loss': 0.8411, 'learning_rate': 1.9387974717896253e-05, 'epoch': 0.23} {'loss': 0.8327, 'learning_rate': 1.938786195021414e-05, 'epoch': 0.23} {'loss': 1.0905, 'learning_rate': 1.938774917247209e-05, 'epoch': 0.23} {'loss': 0.8679, 'learning_rate': 1.9387636384670217e-05, 'epoch': 0.23} {'loss': 0.753, 'learning_rate': 1.9387523586808644e-05, 'epoch': 0.23} {'loss': 0.9011, 'learning_rate': 1.938741077888749e-05, 'epoch': 0.23} {'loss': 0.8476, 'learning_rate': 1.9387297960906883e-05, 'epoch': 0.23} {'loss': 0.899, 'learning_rate': 1.9387185132866935e-05, 'epoch': 0.23} {'loss': 0.9209, 'learning_rate': 1.938707229476777e-05, 'epoch': 0.23} {'loss': 0.9941, 'learning_rate': 1.9386959446609513e-05, 'epoch': 0.23} {'loss': 1.0429, 'learning_rate': 1.9386846588392282e-05, 'epoch': 0.23} {'loss': 0.7327, 'learning_rate': 1.9386733720116196e-05, 'epoch': 0.23} {'loss': 0.9246, 'learning_rate': 1.9386620841781373e-05, 'epoch': 0.23} {'loss': 0.8383, 'learning_rate': 1.9386507953387946e-05, 'epoch': 0.23} {'loss': 0.9331, 'learning_rate': 1.9386395054936024e-05, 'epoch': 0.23} {'loss': 0.9401, 'learning_rate': 1.9386282146425737e-05, 'epoch': 0.23} {'loss': 1.0029, 'learning_rate': 1.9386169227857195e-05, 'epoch': 0.23} {'loss': 0.7225, 'learning_rate': 1.938605629923053e-05, 'epoch': 0.23} {'loss': 1.0322, 'learning_rate': 1.9385943360545857e-05, 'epoch': 0.23} {'loss': 0.932, 'learning_rate': 1.93858304118033e-05, 'epoch': 0.23} {'loss': 0.8246, 'learning_rate': 1.938571745300298e-05, 'epoch': 0.23} {'loss': 0.9378, 'learning_rate': 1.9385604484145016e-05, 'epoch': 0.23} {'loss': 0.9708, 'learning_rate': 1.9385491505229527e-05, 'epoch': 0.23} {'loss': 0.831, 'learning_rate': 1.9385378516256636e-05, 'epoch': 0.23} {'loss': 0.8003, 'learning_rate': 1.938526551722647e-05, 'epoch': 0.23} {'loss': 0.9236, 'learning_rate': 1.938515250813914e-05, 'epoch': 0.23} {'loss': 0.7385, 'learning_rate': 1.9385039488994775e-05, 'epoch': 0.23} {'loss': 0.7488, 'learning_rate': 1.938492645979349e-05, 'epoch': 0.23} {'loss': 0.8715, 'learning_rate': 1.9384813420535412e-05, 'epoch': 0.23} {'loss': 0.9023, 'learning_rate': 1.938470037122066e-05, 'epoch': 0.23} {'loss': 1.012, 'learning_rate': 1.938458731184935e-05, 'epoch': 0.23} {'loss': 0.815, 'learning_rate': 1.9384474242421615e-05, 'epoch': 0.23} {'loss': 0.8984, 'learning_rate': 1.9384361162937565e-05, 'epoch': 0.23} {'loss': 0.9378, 'learning_rate': 1.9384248073397324e-05, 'epoch': 0.23} {'loss': 1.0755, 'learning_rate': 1.9384134973801016e-05, 'epoch': 0.23} {'loss': 0.9167, 'learning_rate': 1.9384021864148756e-05, 'epoch': 0.23} {'loss': 1.114, 'learning_rate': 1.9383908744440674e-05, 'epoch': 0.23} {'loss': 0.9294, 'learning_rate': 1.9383795614676887e-05, 'epoch': 0.23} {'loss': 1.0506, 'learning_rate': 1.9383682474857512e-05, 'epoch': 0.23} {'loss': 0.917, 'learning_rate': 1.938356932498268e-05, 'epoch': 0.23} {'loss': 0.7982, 'learning_rate': 1.9383456165052503e-05, 'epoch': 0.23} {'loss': 0.9682, 'learning_rate': 1.9383342995067106e-05, 'epoch': 0.23} {'loss': 0.856, 'learning_rate': 1.9383229815026608e-05, 'epoch': 0.23} {'loss': 0.843, 'learning_rate': 1.938311662493114e-05, 'epoch': 0.23} {'loss': 0.7295, 'learning_rate': 1.9383003424780808e-05, 'epoch': 0.23} {'loss': 0.9287, 'learning_rate': 1.9382890214575743e-05, 'epoch': 0.23} {'loss': 1.1185, 'learning_rate': 1.9382776994316064e-05, 'epoch': 0.23} {'loss': 0.8174, 'learning_rate': 1.9382663764001894e-05, 'epoch': 0.23} {'loss': 0.9443, 'learning_rate': 1.9382550523633355e-05, 'epoch': 0.23} {'loss': 0.9299, 'learning_rate': 1.9382437273210562e-05, 'epoch': 0.23} {'loss': 1.0393, 'learning_rate': 1.938232401273364e-05, 'epoch': 0.23} {'loss': 1.0131, 'learning_rate': 1.9382210742202713e-05, 'epoch': 0.23} {'loss': 0.947, 'learning_rate': 1.9382097461617903e-05, 'epoch': 0.23} {'loss': 0.9315, 'learning_rate': 1.9381984170979328e-05, 'epoch': 0.23} {'loss': 1.0066, 'learning_rate': 1.9381870870287108e-05, 'epoch': 0.23} {'loss': 0.9547, 'learning_rate': 1.9381757559541366e-05, 'epoch': 0.23} {'loss': 0.9186, 'learning_rate': 1.9381644238742224e-05, 'epoch': 0.23} {'loss': 0.8727, 'learning_rate': 1.9381530907889808e-05, 'epoch': 0.23} {'loss': 1.0379, 'learning_rate': 1.938141756698423e-05, 'epoch': 0.23} {'loss': 0.9405, 'learning_rate': 1.9381304216025617e-05, 'epoch': 0.23} {'loss': 1.0617, 'learning_rate': 1.938119085501409e-05, 'epoch': 0.23} {'loss': 0.8802, 'learning_rate': 1.9381077483949774e-05, 'epoch': 0.23} {'loss': 0.7522, 'learning_rate': 1.9380964102832786e-05, 'epoch': 0.23} {'loss': 0.8486, 'learning_rate': 1.938085071166324e-05, 'epoch': 0.23} {'loss': 0.8601, 'learning_rate': 1.9380737310441272e-05, 'epoch': 0.23} {'loss': 1.0695, 'learning_rate': 1.9380623899167e-05, 'epoch': 0.23} {'loss': 0.9475, 'learning_rate': 1.9380510477840538e-05, 'epoch': 0.23} {'loss': 0.7575, 'learning_rate': 1.9380397046462017e-05, 'epoch': 0.23} {'loss': 0.8825, 'learning_rate': 1.938028360503155e-05, 'epoch': 0.23} {'loss': 0.9364, 'learning_rate': 1.9380170153549264e-05, 'epoch': 0.23} {'loss': 0.9206, 'learning_rate': 1.938005669201528e-05, 'epoch': 0.23} {'loss': 0.9896, 'learning_rate': 1.9379943220429718e-05, 'epoch': 0.23} {'loss': 0.7706, 'learning_rate': 1.93798297387927e-05, 'epoch': 0.23} {'loss': 1.1647, 'learning_rate': 1.9379716247104346e-05, 'epoch': 0.23} {'loss': 0.8568, 'learning_rate': 1.9379602745364784e-05, 'epoch': 0.23} {'loss': 1.0016, 'learning_rate': 1.9379489233574126e-05, 'epoch': 0.23} {'loss': 0.8866, 'learning_rate': 1.9379375711732503e-05, 'epoch': 0.23} {'loss': 0.8448, 'learning_rate': 1.937926217984003e-05, 'epoch': 0.23} {'loss': 0.9887, 'learning_rate': 1.9379148637896833e-05, 'epoch': 0.23} {'loss': 0.9392, 'learning_rate': 1.937903508590303e-05, 'epoch': 0.23} {'loss': 0.9497, 'learning_rate': 1.9378921523858744e-05, 'epoch': 0.23} {'loss': 0.8932, 'learning_rate': 1.9378807951764096e-05, 'epoch': 0.23} {'loss': 0.8193, 'learning_rate': 1.937869436961921e-05, 'epoch': 0.23} {'loss': 0.9294, 'learning_rate': 1.9378580777424206e-05, 'epoch': 0.23} {'loss': 0.9177, 'learning_rate': 1.9378467175179208e-05, 'epoch': 0.23} {'loss': 1.0719, 'learning_rate': 1.9378353562884336e-05, 'epoch': 0.23} {'loss': 0.8837, 'learning_rate': 1.9378239940539713e-05, 'epoch': 0.23} {'loss': 0.8584, 'learning_rate': 1.9378126308145454e-05, 'epoch': 0.23} {'loss': 0.7607, 'learning_rate': 1.9378012665701692e-05, 'epoch': 0.23} {'loss': 0.9397, 'learning_rate': 1.9377899013208537e-05, 'epoch': 0.23} {'loss': 0.9769, 'learning_rate': 1.9377785350666123e-05, 'epoch': 0.23} {'loss': 0.9656, 'learning_rate': 1.937767167807456e-05, 'epoch': 0.23} {'loss': 0.8096, 'learning_rate': 1.937755799543398e-05, 'epoch': 0.23} {'loss': 0.7638, 'learning_rate': 1.93774443027445e-05, 'epoch': 0.23} {'loss': 0.9231, 'learning_rate': 1.9377330600006238e-05, 'epoch': 0.23} {'loss': 1.1322, 'learning_rate': 1.9377216887219323e-05, 'epoch': 0.23} {'loss': 1.0795, 'learning_rate': 1.9377103164383873e-05, 'epoch': 0.23} {'loss': 0.9085, 'learning_rate': 1.937698943150001e-05, 'epoch': 0.23} {'loss': 0.788, 'learning_rate': 1.937687568856786e-05, 'epoch': 0.23} {'loss': 0.793, 'learning_rate': 1.937676193558754e-05, 'epoch': 0.23} {'loss': 0.8655, 'learning_rate': 1.9376648172559173e-05, 'epoch': 0.23} {'loss': 0.804, 'learning_rate': 1.937653439948288e-05, 'epoch': 0.23} {'loss': 0.8261, 'learning_rate': 1.9376420616358782e-05, 'epoch': 0.23} {'loss': 0.9099, 'learning_rate': 1.9376306823187004e-05, 'epoch': 0.23} {'loss': 0.8745, 'learning_rate': 1.937619301996767e-05, 'epoch': 0.23} {'loss': 0.9822, 'learning_rate': 1.9376079206700896e-05, 'epoch': 0.23} {'loss': 0.8431, 'learning_rate': 1.937596538338681e-05, 'epoch': 0.23} {'loss': 0.8496, 'learning_rate': 1.9375851550025528e-05, 'epoch': 0.23} {'loss': 0.7822, 'learning_rate': 1.9375737706617178e-05, 'epoch': 0.23} {'loss': 0.9765, 'learning_rate': 1.9375623853161875e-05, 'epoch': 0.23} {'loss': 0.8709, 'learning_rate': 1.937550998965975e-05, 'epoch': 0.23} {'loss': 1.1303, 'learning_rate': 1.9375396116110914e-05, 'epoch': 0.23} {'loss': 0.8853, 'learning_rate': 1.93752822325155e-05, 'epoch': 0.23} {'loss': 1.0203, 'learning_rate': 1.937516833887362e-05, 'epoch': 0.23} {'loss': 0.9006, 'learning_rate': 1.93750544351854e-05, 'epoch': 0.23} {'loss': 0.8929, 'learning_rate': 1.9374940521450968e-05, 'epoch': 0.23} {'loss': 1.0422, 'learning_rate': 1.937482659767044e-05, 'epoch': 0.23} {'loss': 1.0464, 'learning_rate': 1.9374712663843938e-05, 'epoch': 0.23} {'loss': 0.8903, 'learning_rate': 1.937459871997159e-05, 'epoch': 0.23} {'loss': 0.8219, 'learning_rate': 1.9374484766053506e-05, 'epoch': 0.23} {'loss': 0.9751, 'learning_rate': 1.937437080208982e-05, 'epoch': 0.23} {'loss': 1.134, 'learning_rate': 1.9374256828080648e-05, 'epoch': 0.23} {'loss': 0.8461, 'learning_rate': 1.9374142844026112e-05, 'epoch': 0.23} {'loss': 0.952, 'learning_rate': 1.9374028849926335e-05, 'epoch': 0.23} {'loss': 0.8752, 'learning_rate': 1.9373914845781445e-05, 'epoch': 0.23} {'loss': 0.8712, 'learning_rate': 1.9373800831591558e-05, 'epoch': 0.23} {'loss': 0.9, 'learning_rate': 1.9373686807356795e-05, 'epoch': 0.23} {'loss': 0.9785, 'learning_rate': 1.937357277307728e-05, 'epoch': 0.23} {'loss': 1.0502, 'learning_rate': 1.937345872875314e-05, 'epoch': 0.23} {'loss': 0.8536, 'learning_rate': 1.937334467438449e-05, 'epoch': 0.23} {'loss': 0.8708, 'learning_rate': 1.9373230609971456e-05, 'epoch': 0.23} {'loss': 0.9871, 'learning_rate': 1.937311653551416e-05, 'epoch': 0.23} {'loss': 0.702, 'learning_rate': 1.9373002451012723e-05, 'epoch': 0.23} {'loss': 0.7628, 'learning_rate': 1.937288835646727e-05, 'epoch': 0.23} {'loss': 0.7734, 'learning_rate': 1.9372774251877916e-05, 'epoch': 0.23} {'loss': 0.9227, 'learning_rate': 1.937266013724479e-05, 'epoch': 0.23} {'loss': 0.8563, 'learning_rate': 1.9372546012568018e-05, 'epoch': 0.23} {'loss': 0.9932, 'learning_rate': 1.937243187784771e-05, 'epoch': 0.23} {'loss': 0.9473, 'learning_rate': 1.9372317733083998e-05, 'epoch': 0.23} {'loss': 0.7054, 'learning_rate': 1.9372203578277005e-05, 'epoch': 0.23} {'loss': 0.8735, 'learning_rate': 1.9372089413426844e-05, 'epoch': 0.23} {'loss': 0.8833, 'learning_rate': 1.9371975238533648e-05, 'epoch': 0.23} {'loss': 1.1028, 'learning_rate': 1.9371861053597534e-05, 'epoch': 0.23} {'loss': 0.9831, 'learning_rate': 1.9371746858618622e-05, 'epoch': 0.23} {'loss': 1.1101, 'learning_rate': 1.937163265359704e-05, 'epoch': 0.23} {'loss': 0.9648, 'learning_rate': 1.937151843853291e-05, 'epoch': 0.23} {'loss': 0.9613, 'learning_rate': 1.937140421342635e-05, 'epoch': 0.23} {'loss': 0.8506, 'learning_rate': 1.9371289978277482e-05, 'epoch': 0.23} {'loss': 0.833, 'learning_rate': 1.9371175733086433e-05, 'epoch': 0.23} {'loss': 0.9163, 'learning_rate': 1.9371061477853324e-05, 'epoch': 0.23} {'loss': 0.9795, 'learning_rate': 1.9370947212578276e-05, 'epoch': 0.23} {'loss': 0.9059, 'learning_rate': 1.9370832937261413e-05, 'epoch': 0.23} {'loss': 0.8095, 'learning_rate': 1.9370718651902855e-05, 'epoch': 0.23} {'loss': 0.8047, 'learning_rate': 1.9370604356502728e-05, 'epoch': 0.23} {'loss': 0.9375, 'learning_rate': 1.937049005106115e-05, 'epoch': 0.23} {'loss': 0.9688, 'learning_rate': 1.937037573557825e-05, 'epoch': 0.23} {'loss': 1.016, 'learning_rate': 1.9370261410054145e-05, 'epoch': 0.23} {'loss': 0.8786, 'learning_rate': 1.937014707448896e-05, 'epoch': 0.23} {'loss': 0.8403, 'learning_rate': 1.9370032728882815e-05, 'epoch': 0.23} {'loss': 1.0756, 'learning_rate': 1.9369918373235834e-05, 'epoch': 0.23} {'loss': 0.9303, 'learning_rate': 1.936980400754814e-05, 'epoch': 0.23} {'loss': 0.9821, 'learning_rate': 1.9369689631819858e-05, 'epoch': 0.23} {'loss': 0.7272, 'learning_rate': 1.9369575246051108e-05, 'epoch': 0.23} {'loss': 0.8506, 'learning_rate': 1.936946085024201e-05, 'epoch': 0.23} {'loss': 0.8174, 'learning_rate': 1.936934644439269e-05, 'epoch': 0.23} {'loss': 1.1295, 'learning_rate': 1.9369232028503267e-05, 'epoch': 0.23} {'loss': 0.8703, 'learning_rate': 1.936911760257387e-05, 'epoch': 0.23} {'loss': 0.8726, 'learning_rate': 1.9369003166604617e-05, 'epoch': 0.23} {'loss': 0.798, 'learning_rate': 1.936888872059563e-05, 'epoch': 0.23} {'loss': 0.8485, 'learning_rate': 1.9368774264547033e-05, 'epoch': 0.23} {'loss': 0.9798, 'learning_rate': 1.936865979845895e-05, 'epoch': 0.23} {'loss': 0.8191, 'learning_rate': 1.9368545322331502e-05, 'epoch': 0.23} {'loss': 0.8578, 'learning_rate': 1.936843083616481e-05, 'epoch': 0.23} {'loss': 0.9839, 'learning_rate': 1.9368316339959004e-05, 'epoch': 0.23} {'loss': 0.9672, 'learning_rate': 1.93682018337142e-05, 'epoch': 0.23} {'loss': 0.8648, 'learning_rate': 1.9368087317430516e-05, 'epoch': 0.23} {'loss': 0.8929, 'learning_rate': 1.9367972791108086e-05, 'epoch': 0.23} {'loss': 1.0548, 'learning_rate': 1.936785825474703e-05, 'epoch': 0.23} {'loss': 1.0017, 'learning_rate': 1.9367743708347465e-05, 'epoch': 0.23} {'loss': 1.0339, 'learning_rate': 1.9367629151909518e-05, 'epoch': 0.23} {'loss': 0.9228, 'learning_rate': 1.9367514585433312e-05, 'epoch': 0.23} {'loss': 0.9034, 'learning_rate': 1.936740000891897e-05, 'epoch': 0.23} {'loss': 1.0458, 'learning_rate': 1.936728542236661e-05, 'epoch': 0.23} {'loss': 0.7433, 'learning_rate': 1.936717082577636e-05, 'epoch': 0.23} {'loss': 0.8962, 'learning_rate': 1.9367056219148338e-05, 'epoch': 0.23} {'loss': 0.9708, 'learning_rate': 1.936694160248267e-05, 'epoch': 0.23} {'loss': 0.8931, 'learning_rate': 1.9366826975779482e-05, 'epoch': 0.23} {'loss': 1.0461, 'learning_rate': 1.9366712339038894e-05, 'epoch': 0.23} {'loss': 0.8479, 'learning_rate': 1.9366597692261024e-05, 'epoch': 0.23} {'loss': 0.9259, 'learning_rate': 1.9366483035446003e-05, 'epoch': 0.23} {'loss': 0.7259, 'learning_rate': 1.936636836859395e-05, 'epoch': 0.23} {'loss': 1.0936, 'learning_rate': 1.9366253691704987e-05, 'epoch': 0.23} {'loss': 0.8264, 'learning_rate': 1.9366139004779235e-05, 'epoch': 0.23} {'loss': 0.8918, 'learning_rate': 1.936602430781682e-05, 'epoch': 0.23} {'loss': 0.7523, 'learning_rate': 1.936590960081787e-05, 'epoch': 0.23} {'loss': 0.8901, 'learning_rate': 1.93657948837825e-05, 'epoch': 0.23} {'loss': 0.9872, 'learning_rate': 1.9365680156710835e-05, 'epoch': 0.23} {'loss': 0.953, 'learning_rate': 1.9365565419602996e-05, 'epoch': 0.23} {'loss': 0.9815, 'learning_rate': 1.936545067245911e-05, 'epoch': 0.23} {'loss': 1.0001, 'learning_rate': 1.9365335915279298e-05, 'epoch': 0.23} {'loss': 0.8798, 'learning_rate': 1.9365221148063686e-05, 'epoch': 0.23} {'loss': 0.9109, 'learning_rate': 1.936510637081239e-05, 'epoch': 0.23} {'loss': 0.8446, 'learning_rate': 1.936499158352554e-05, 'epoch': 0.23} {'loss': 0.8404, 'learning_rate': 1.936487678620326e-05, 'epoch': 0.23} {'loss': 0.8451, 'learning_rate': 1.936476197884566e-05, 'epoch': 0.23} {'loss': 0.9915, 'learning_rate': 1.9364647161452882e-05, 'epoch': 0.23} {'loss': 0.799, 'learning_rate': 1.9364532334025035e-05, 'epoch': 0.23} {'loss': 0.8617, 'learning_rate': 1.9364417496562244e-05, 'epoch': 0.23} {'loss': 0.8368, 'learning_rate': 1.9364302649064636e-05, 'epoch': 0.23} {'loss': 0.831, 'learning_rate': 1.9364187791532334e-05, 'epoch': 0.23} {'loss': 0.8115, 'learning_rate': 1.9364072923965457e-05, 'epoch': 0.23} {'loss': 0.8632, 'learning_rate': 1.9363958046364135e-05, 'epoch': 0.23} {'loss': 0.6057, 'learning_rate': 1.9363843158728482e-05, 'epoch': 0.23} {'loss': 0.7982, 'learning_rate': 1.936372826105863e-05, 'epoch': 0.23} {'loss': 0.8404, 'learning_rate': 1.9363613353354696e-05, 'epoch': 0.23} {'loss': 0.8389, 'learning_rate': 1.9363498435616807e-05, 'epoch': 0.23} {'loss': 0.8748, 'learning_rate': 1.9363383507845083e-05, 'epoch': 0.23} {'loss': 0.8139, 'learning_rate': 1.936326857003965e-05, 'epoch': 0.23} {'loss': 0.9867, 'learning_rate': 1.9363153622200624e-05, 'epoch': 0.23} {'loss': 1.0988, 'learning_rate': 1.936303866432814e-05, 'epoch': 0.23} {'loss': 0.8416, 'learning_rate': 1.936292369642231e-05, 'epoch': 0.23} {'loss': 0.9465, 'learning_rate': 1.9362808718483265e-05, 'epoch': 0.23} {'loss': 0.7883, 'learning_rate': 1.9362693730511125e-05, 'epoch': 0.23} {'loss': 1.0624, 'learning_rate': 1.9362578732506015e-05, 'epoch': 0.23} {'loss': 0.9022, 'learning_rate': 1.9362463724468058e-05, 'epoch': 0.23} {'loss': 1.078, 'learning_rate': 1.9362348706397374e-05, 'epoch': 0.23} {'loss': 0.9127, 'learning_rate': 1.936223367829409e-05, 'epoch': 0.23} {'loss': 0.8691, 'learning_rate': 1.9362118640158324e-05, 'epoch': 0.23} {'loss': 0.9747, 'learning_rate': 1.9362003591990206e-05, 'epoch': 0.23} {'loss': 1.0475, 'learning_rate': 1.9361888533789856e-05, 'epoch': 0.23} {'loss': 0.7844, 'learning_rate': 1.9361773465557393e-05, 'epoch': 0.23} {'loss': 0.9127, 'learning_rate': 1.936165838729295e-05, 'epoch': 0.23} {'loss': 0.7572, 'learning_rate': 1.9361543298996642e-05, 'epoch': 0.23} {'loss': 1.1029, 'learning_rate': 1.9361428200668597e-05, 'epoch': 0.23} {'loss': 0.9, 'learning_rate': 1.936131309230894e-05, 'epoch': 0.23} {'loss': 0.955, 'learning_rate': 1.9361197973917787e-05, 'epoch': 0.23} {'loss': 0.9242, 'learning_rate': 1.9361082845495265e-05, 'epoch': 0.23} {'loss': 1.0976, 'learning_rate': 1.9360967707041497e-05, 'epoch': 0.23} {'loss': 1.0701, 'learning_rate': 1.936085255855661e-05, 'epoch': 0.23} {'loss': 0.826, 'learning_rate': 1.9360737400040722e-05, 'epoch': 0.23} {'loss': 0.9299, 'learning_rate': 1.9360622231493965e-05, 'epoch': 0.23} {'loss': 0.9504, 'learning_rate': 1.936050705291645e-05, 'epoch': 0.23} {'loss': 0.8842, 'learning_rate': 1.936039186430831e-05, 'epoch': 0.23} {'loss': 1.075, 'learning_rate': 1.9360276665669664e-05, 'epoch': 0.23} {'loss': 0.8502, 'learning_rate': 1.9360161457000636e-05, 'epoch': 0.23} {'loss': 0.9637, 'learning_rate': 1.9360046238301353e-05, 'epoch': 0.23} {'loss': 1.0793, 'learning_rate': 1.9359931009571932e-05, 'epoch': 0.23} {'loss': 0.8811, 'learning_rate': 1.9359815770812506e-05, 'epoch': 0.23} {'loss': 0.9885, 'learning_rate': 1.9359700522023187e-05, 'epoch': 0.23} {'loss': 0.8746, 'learning_rate': 1.9359585263204107e-05, 'epoch': 0.23} {'loss': 0.9103, 'learning_rate': 1.9359469994355384e-05, 'epoch': 0.23} {'loss': 0.8535, 'learning_rate': 1.9359354715477147e-05, 'epoch': 0.23} {'loss': 0.939, 'learning_rate': 1.9359239426569515e-05, 'epoch': 0.23} {'loss': 0.7709, 'learning_rate': 1.9359124127632613e-05, 'epoch': 0.23} {'loss': 0.6858, 'learning_rate': 1.9359008818666563e-05, 'epoch': 0.23} {'loss': 0.8571, 'learning_rate': 1.9358893499671498e-05, 'epoch': 0.23} {'loss': 0.9287, 'learning_rate': 1.9358778170647525e-05, 'epoch': 0.23} {'loss': 0.7536, 'learning_rate': 1.935866283159478e-05, 'epoch': 0.23} {'loss': 0.864, 'learning_rate': 1.9358547482513382e-05, 'epoch': 0.23} {'loss': 0.84, 'learning_rate': 1.9358432123403463e-05, 'epoch': 0.23} {'loss': 0.9159, 'learning_rate': 1.935831675426513e-05, 'epoch': 0.23} {'loss': 0.8902, 'learning_rate': 1.935820137509852e-05, 'epoch': 0.23} {'loss': 1.0226, 'learning_rate': 1.935808598590375e-05, 'epoch': 0.23} {'loss': 1.0865, 'learning_rate': 1.935797058668095e-05, 'epoch': 0.23} {'loss': 0.8377, 'learning_rate': 1.9357855177430238e-05, 'epoch': 0.23} {'loss': 1.113, 'learning_rate': 1.935773975815174e-05, 'epoch': 0.23} {'loss': 0.7983, 'learning_rate': 1.9357624328845578e-05, 'epoch': 0.23} {'loss': 0.8452, 'learning_rate': 1.9357508889511877e-05, 'epoch': 0.23} {'loss': 1.0138, 'learning_rate': 1.9357393440150764e-05, 'epoch': 0.23} {'loss': 0.8963, 'learning_rate': 1.9357277980762355e-05, 'epoch': 0.24} {'loss': 0.8203, 'learning_rate': 1.9357162511346778e-05, 'epoch': 0.24} {'loss': 0.9291, 'learning_rate': 1.935704703190416e-05, 'epoch': 0.24} {'loss': 0.8206, 'learning_rate': 1.9356931542434623e-05, 'epoch': 0.24} {'loss': 0.7111, 'learning_rate': 1.9356816042938283e-05, 'epoch': 0.24} {'loss': 0.8655, 'learning_rate': 1.9356700533415276e-05, 'epoch': 0.24} {'loss': 0.9564, 'learning_rate': 1.9356585013865715e-05, 'epoch': 0.24} {'loss': 0.8249, 'learning_rate': 1.9356469484289734e-05, 'epoch': 0.24} {'loss': 0.7066, 'learning_rate': 1.9356353944687448e-05, 'epoch': 0.24} {'loss': 0.9529, 'learning_rate': 1.9356238395058986e-05, 'epoch': 0.24} {'loss': 0.8578, 'learning_rate': 1.935612283540447e-05, 'epoch': 0.24} {'loss': 0.7845, 'learning_rate': 1.9356007265724022e-05, 'epoch': 0.24} {'loss': 0.8447, 'learning_rate': 1.935589168601777e-05, 'epoch': 0.24} {'loss': 0.7479, 'learning_rate': 1.9355776096285833e-05, 'epoch': 0.24} {'loss': 0.9207, 'learning_rate': 1.935566049652834e-05, 'epoch': 0.24} {'loss': 0.8394, 'learning_rate': 1.935554488674541e-05, 'epoch': 0.24} {'loss': 1.0419, 'learning_rate': 1.9355429266937172e-05, 'epoch': 0.24} {'loss': 1.0298, 'learning_rate': 1.9355313637103746e-05, 'epoch': 0.24} {'loss': 0.843, 'learning_rate': 1.9355197997245258e-05, 'epoch': 0.24} {'loss': 0.9803, 'learning_rate': 1.935508234736183e-05, 'epoch': 0.24} {'loss': 0.8577, 'learning_rate': 1.9354966687453584e-05, 'epoch': 0.24} {'loss': 0.8558, 'learning_rate': 1.9354851017520652e-05, 'epoch': 0.24} {'loss': 0.8398, 'learning_rate': 1.935473533756315e-05, 'epoch': 0.24} {'loss': 0.9659, 'learning_rate': 1.9354619647581206e-05, 'epoch': 0.24} {'loss': 1.0272, 'learning_rate': 1.9354503947574942e-05, 'epoch': 0.24} {'loss': 0.8626, 'learning_rate': 1.9354388237544484e-05, 'epoch': 0.24} {'loss': 0.8636, 'learning_rate': 1.9354272517489953e-05, 'epoch': 0.24} {'loss': 0.8287, 'learning_rate': 1.9354156787411472e-05, 'epoch': 0.24} {'loss': 0.9339, 'learning_rate': 1.9354041047309172e-05, 'epoch': 0.24} {'loss': 0.7222, 'learning_rate': 1.9353925297183173e-05, 'epoch': 0.24} {'loss': 0.9002, 'learning_rate': 1.9353809537033595e-05, 'epoch': 0.24} {'loss': 0.9856, 'learning_rate': 1.9353693766860572e-05, 'epoch': 0.24} {'loss': 1.0386, 'learning_rate': 1.9353577986664215e-05, 'epoch': 0.24} {'loss': 0.8058, 'learning_rate': 1.935346219644466e-05, 'epoch': 0.24} {'loss': 1.0281, 'learning_rate': 1.9353346396202025e-05, 'epoch': 0.24} {'loss': 0.8085, 'learning_rate': 1.9353230585936432e-05, 'epoch': 0.24} {'loss': 0.8221, 'learning_rate': 1.935311476564801e-05, 'epoch': 0.24} {'loss': 0.8797, 'learning_rate': 1.9352998935336885e-05, 'epoch': 0.24} {'loss': 1.0287, 'learning_rate': 1.9352883095003174e-05, 'epoch': 0.24} {'loss': 1.0524, 'learning_rate': 1.9352767244647003e-05, 'epoch': 0.24} {'loss': 0.7299, 'learning_rate': 1.9352651384268502e-05, 'epoch': 0.24} {'loss': 1.0254, 'learning_rate': 1.9352535513867788e-05, 'epoch': 0.24} {'loss': 0.9344, 'learning_rate': 1.935241963344499e-05, 'epoch': 0.24} {'loss': 0.8405, 'learning_rate': 1.9352303743000228e-05, 'epoch': 0.24} {'loss': 0.8427, 'learning_rate': 1.935218784253363e-05, 'epoch': 0.24} {'loss': 0.9584, 'learning_rate': 1.935207193204532e-05, 'epoch': 0.24} {'loss': 0.9182, 'learning_rate': 1.9351956011535416e-05, 'epoch': 0.24} {'loss': 0.8405, 'learning_rate': 1.935184008100405e-05, 'epoch': 0.24} {'loss': 0.8572, 'learning_rate': 1.9351724140451343e-05, 'epoch': 0.24} {'loss': 0.9648, 'learning_rate': 1.9351608189877422e-05, 'epoch': 0.24} {'loss': 1.0082, 'learning_rate': 1.9351492229282407e-05, 'epoch': 0.24} {'loss': 0.8921, 'learning_rate': 1.9351376258666423e-05, 'epoch': 0.24} {'loss': 0.9411, 'learning_rate': 1.9351260278029596e-05, 'epoch': 0.24} {'loss': 0.9294, 'learning_rate': 1.935114428737205e-05, 'epoch': 0.24} {'loss': 0.8703, 'learning_rate': 1.9351028286693908e-05, 'epoch': 0.24} {'loss': 0.8742, 'learning_rate': 1.93509122759953e-05, 'epoch': 0.24} {'loss': 0.9339, 'learning_rate': 1.9350796255276337e-05, 'epoch': 0.24} {'loss': 1.0179, 'learning_rate': 1.9350680224537158e-05, 'epoch': 0.24} {'loss': 1.0339, 'learning_rate': 1.935056418377788e-05, 'epoch': 0.24} {'loss': 0.8558, 'learning_rate': 1.9350448132998628e-05, 'epoch': 0.24} {'loss': 0.9114, 'learning_rate': 1.9350332072199527e-05, 'epoch': 0.24} {'loss': 0.9955, 'learning_rate': 1.9350216001380698e-05, 'epoch': 0.24} {'loss': 0.9916, 'learning_rate': 1.9350099920542275e-05, 'epoch': 0.24} {'loss': 0.8128, 'learning_rate': 1.934998382968437e-05, 'epoch': 0.24} {'loss': 0.8753, 'learning_rate': 1.934986772880712e-05, 'epoch': 0.24} {'loss': 1.0032, 'learning_rate': 1.9349751617910635e-05, 'epoch': 0.24} {'loss': 0.7659, 'learning_rate': 1.9349635496995055e-05, 'epoch': 0.24} {'loss': 0.9447, 'learning_rate': 1.934951936606049e-05, 'epoch': 0.24} {'loss': 0.9475, 'learning_rate': 1.9349403225107076e-05, 'epoch': 0.24} {'loss': 0.9344, 'learning_rate': 1.934928707413493e-05, 'epoch': 0.24} {'loss': 0.7844, 'learning_rate': 1.934917091314418e-05, 'epoch': 0.24} {'loss': 0.9756, 'learning_rate': 1.934905474213495e-05, 'epoch': 0.24} {'loss': 0.9052, 'learning_rate': 1.9348938561107365e-05, 'epoch': 0.24} {'loss': 0.7705, 'learning_rate': 1.9348822370061543e-05, 'epoch': 0.24} {'loss': 0.8144, 'learning_rate': 1.934870616899762e-05, 'epoch': 0.24} {'loss': 0.9772, 'learning_rate': 1.9348589957915713e-05, 'epoch': 0.24} {'loss': 0.9848, 'learning_rate': 1.934847373681595e-05, 'epoch': 0.24} {'loss': 0.7912, 'learning_rate': 1.9348357505698448e-05, 'epoch': 0.24} {'loss': 0.9739, 'learning_rate': 1.9348241264563342e-05, 'epoch': 0.24} {'loss': 1.008, 'learning_rate': 1.934812501341075e-05, 'epoch': 0.24} {'loss': 0.8922, 'learning_rate': 1.9348008752240796e-05, 'epoch': 0.24} {'loss': 0.8372, 'learning_rate': 1.9347892481053612e-05, 'epoch': 0.24} {'loss': 0.9888, 'learning_rate': 1.9347776199849315e-05, 'epoch': 0.24} {'loss': 0.8971, 'learning_rate': 1.934765990862803e-05, 'epoch': 0.24} {'loss': 1.0827, 'learning_rate': 1.934754360738989e-05, 'epoch': 0.24} {'loss': 0.8129, 'learning_rate': 1.9347427296135008e-05, 'epoch': 0.24} {'loss': 0.935, 'learning_rate': 1.9347310974863515e-05, 'epoch': 0.24} {'loss': 0.9471, 'learning_rate': 1.9347194643575532e-05, 'epoch': 0.24} {'loss': 0.8728, 'learning_rate': 1.934707830227119e-05, 'epoch': 0.24} {'loss': 0.7455, 'learning_rate': 1.9346961950950608e-05, 'epoch': 0.24} {'loss': 0.8438, 'learning_rate': 1.9346845589613918e-05, 'epoch': 0.24} {'loss': 1.0506, 'learning_rate': 1.9346729218261232e-05, 'epoch': 0.24} {'loss': 0.8235, 'learning_rate': 1.9346612836892687e-05, 'epoch': 0.24} {'loss': 0.949, 'learning_rate': 1.93464964455084e-05, 'epoch': 0.24} {'loss': 1.1015, 'learning_rate': 1.9346380044108502e-05, 'epoch': 0.24} {'loss': 0.9838, 'learning_rate': 1.934626363269311e-05, 'epoch': 0.24} {'loss': 0.964, 'learning_rate': 1.9346147211262356e-05, 'epoch': 0.24} {'loss': 0.9059, 'learning_rate': 1.934603077981636e-05, 'epoch': 0.24} {'loss': 0.8226, 'learning_rate': 1.9345914338355248e-05, 'epoch': 0.24} {'loss': 0.7325, 'learning_rate': 1.9345797886879144e-05, 'epoch': 0.24} {'loss': 0.9096, 'learning_rate': 1.9345681425388177e-05, 'epoch': 0.24} {'loss': 0.9698, 'learning_rate': 1.934556495388247e-05, 'epoch': 0.24} {'loss': 1.035, 'learning_rate': 1.9345448472362144e-05, 'epoch': 0.24} {'loss': 0.9827, 'learning_rate': 1.9345331980827328e-05, 'epoch': 0.24} {'loss': 0.7873, 'learning_rate': 1.9345215479278143e-05, 'epoch': 0.24} {'loss': 0.9284, 'learning_rate': 1.934509896771472e-05, 'epoch': 0.24} {'loss': 0.9023, 'learning_rate': 1.9344982446137176e-05, 'epoch': 0.24} {'loss': 1.0543, 'learning_rate': 1.9344865914545643e-05, 'epoch': 0.24} {'loss': 0.8347, 'learning_rate': 1.934474937294024e-05, 'epoch': 0.24} {'loss': 0.663, 'learning_rate': 1.9344632821321095e-05, 'epoch': 0.24} {'loss': 0.9014, 'learning_rate': 1.9344516259688336e-05, 'epoch': 0.24} {'loss': 0.9626, 'learning_rate': 1.934439968804208e-05, 'epoch': 0.24} {'loss': 0.821, 'learning_rate': 1.9344283106382456e-05, 'epoch': 0.24} {'loss': 0.8772, 'learning_rate': 1.9344166514709593e-05, 'epoch': 0.24} {'loss': 1.013, 'learning_rate': 1.934404991302361e-05, 'epoch': 0.24} {'loss': 0.8063, 'learning_rate': 1.934393330132464e-05, 'epoch': 0.24} {'loss': 0.7839, 'learning_rate': 1.9343816679612796e-05, 'epoch': 0.24} {'loss': 1.0435, 'learning_rate': 1.9343700047888206e-05, 'epoch': 0.24} {'loss': 0.9767, 'learning_rate': 1.9343583406151003e-05, 'epoch': 0.24} {'loss': 0.9659, 'learning_rate': 1.9343466754401308e-05, 'epoch': 0.24} {'loss': 0.9756, 'learning_rate': 1.9343350092639243e-05, 'epoch': 0.24} {'loss': 0.9679, 'learning_rate': 1.9343233420864937e-05, 'epoch': 0.24} {'loss': 0.9606, 'learning_rate': 1.9343116739078508e-05, 'epoch': 0.24} {'loss': 0.9263, 'learning_rate': 1.9343000047280093e-05, 'epoch': 0.24} {'loss': 0.9292, 'learning_rate': 1.9342883345469805e-05, 'epoch': 0.24} {'loss': 0.8896, 'learning_rate': 1.9342766633647774e-05, 'epoch': 0.24} {'loss': 0.9716, 'learning_rate': 1.934264991181413e-05, 'epoch': 0.24} {'loss': 0.8284, 'learning_rate': 1.934253317996899e-05, 'epoch': 0.24} {'loss': 1.0616, 'learning_rate': 1.9342416438112484e-05, 'epoch': 0.24} {'loss': 0.9928, 'learning_rate': 1.9342299686244735e-05, 'epoch': 0.24} {'loss': 0.9008, 'learning_rate': 1.9342182924365866e-05, 'epoch': 0.24} {'loss': 1.0265, 'learning_rate': 1.934206615247601e-05, 'epoch': 0.24} {'loss': 0.9, 'learning_rate': 1.9341949370575284e-05, 'epoch': 0.24} {'loss': 0.7918, 'learning_rate': 1.9341832578663818e-05, 'epoch': 0.24} {'loss': 0.8552, 'learning_rate': 1.934171577674173e-05, 'epoch': 0.24} {'loss': 0.8326, 'learning_rate': 1.9341598964809158e-05, 'epoch': 0.24} {'loss': 0.794, 'learning_rate': 1.9341482142866213e-05, 'epoch': 0.24} {'loss': 0.8707, 'learning_rate': 1.934136531091303e-05, 'epoch': 0.24} {'loss': 0.705, 'learning_rate': 1.934124846894973e-05, 'epoch': 0.24} {'loss': 0.9549, 'learning_rate': 1.934113161697644e-05, 'epoch': 0.24} {'loss': 0.8764, 'learning_rate': 1.934101475499328e-05, 'epoch': 0.24} {'loss': 0.9112, 'learning_rate': 1.9340897883000387e-05, 'epoch': 0.24} {'loss': 0.7874, 'learning_rate': 1.9340781000997874e-05, 'epoch': 0.24} {'loss': 0.8565, 'learning_rate': 1.9340664108985874e-05, 'epoch': 0.24} {'loss': 0.9374, 'learning_rate': 1.934054720696451e-05, 'epoch': 0.24} {'loss': 0.8996, 'learning_rate': 1.93404302949339e-05, 'epoch': 0.24} {'loss': 0.8463, 'learning_rate': 1.934031337289418e-05, 'epoch': 0.24} {'loss': 0.8703, 'learning_rate': 1.9340196440845474e-05, 'epoch': 0.24} {'loss': 0.9693, 'learning_rate': 1.93400794987879e-05, 'epoch': 0.24} {'loss': 0.9089, 'learning_rate': 1.933996254672159e-05, 'epoch': 0.24} {'loss': 0.9938, 'learning_rate': 1.9339845584646667e-05, 'epoch': 0.24} {'loss': 1.0381, 'learning_rate': 1.9339728612563257e-05, 'epoch': 0.24} {'loss': 0.8053, 'learning_rate': 1.9339611630471485e-05, 'epoch': 0.24} {'loss': 0.8061, 'learning_rate': 1.9339494638371477e-05, 'epoch': 0.24} {'loss': 0.8046, 'learning_rate': 1.9339377636263354e-05, 'epoch': 0.24} {'loss': 0.8628, 'learning_rate': 1.9339260624147246e-05, 'epoch': 0.24} {'loss': 0.7607, 'learning_rate': 1.933914360202328e-05, 'epoch': 0.24} {'loss': 0.7795, 'learning_rate': 1.9339026569891577e-05, 'epoch': 0.24} {'loss': 0.6857, 'learning_rate': 1.9338909527752263e-05, 'epoch': 0.24} {'loss': 0.8637, 'learning_rate': 1.9338792475605466e-05, 'epoch': 0.24} {'loss': 0.8506, 'learning_rate': 1.933867541345131e-05, 'epoch': 0.24} {'loss': 1.0057, 'learning_rate': 1.933855834128992e-05, 'epoch': 0.24} {'loss': 0.9635, 'learning_rate': 1.9338441259121422e-05, 'epoch': 0.24} {'loss': 0.8772, 'learning_rate': 1.933832416694594e-05, 'epoch': 0.24} {'loss': 0.8816, 'learning_rate': 1.9338207064763607e-05, 'epoch': 0.24} {'loss': 1.0219, 'learning_rate': 1.9338089952574534e-05, 'epoch': 0.24} {'loss': 1.0367, 'learning_rate': 1.933797283037886e-05, 'epoch': 0.24} {'loss': 1.0104, 'learning_rate': 1.9337855698176705e-05, 'epoch': 0.24} {'loss': 0.8378, 'learning_rate': 1.933773855596819e-05, 'epoch': 0.24} {'loss': 0.9527, 'learning_rate': 1.933762140375345e-05, 'epoch': 0.24} {'loss': 0.9209, 'learning_rate': 1.9337504241532604e-05, 'epoch': 0.24} {'loss': 0.9013, 'learning_rate': 1.933738706930578e-05, 'epoch': 0.24} {'loss': 0.861, 'learning_rate': 1.9337269887073103e-05, 'epoch': 0.24} {'loss': 0.9186, 'learning_rate': 1.93371526948347e-05, 'epoch': 0.24} {'loss': 0.8979, 'learning_rate': 1.9337035492590693e-05, 'epoch': 0.24} {'loss': 0.9678, 'learning_rate': 1.933691828034121e-05, 'epoch': 0.24} {'loss': 1.0439, 'learning_rate': 1.933680105808638e-05, 'epoch': 0.24} {'loss': 0.9522, 'learning_rate': 1.933668382582632e-05, 'epoch': 0.24} {'loss': 0.8091, 'learning_rate': 1.933656658356116e-05, 'epoch': 0.24} {'loss': 0.8229, 'learning_rate': 1.9336449331291032e-05, 'epoch': 0.24} {'loss': 0.8069, 'learning_rate': 1.9336332069016052e-05, 'epoch': 0.24} {'loss': 1.0026, 'learning_rate': 1.933621479673635e-05, 'epoch': 0.24} {'loss': 0.8935, 'learning_rate': 1.933609751445205e-05, 'epoch': 0.24} {'loss': 0.8458, 'learning_rate': 1.9335980222163282e-05, 'epoch': 0.24} {'loss': 0.8924, 'learning_rate': 1.9335862919870166e-05, 'epoch': 0.24} {'loss': 0.9447, 'learning_rate': 1.933574560757283e-05, 'epoch': 0.24} {'loss': 0.7143, 'learning_rate': 1.93356282852714e-05, 'epoch': 0.24} {'loss': 0.9429, 'learning_rate': 1.9335510952966007e-05, 'epoch': 0.24} {'loss': 0.7719, 'learning_rate': 1.9335393610656767e-05, 'epoch': 0.24} {'loss': 0.8866, 'learning_rate': 1.9335276258343808e-05, 'epoch': 0.24} {'loss': 0.9612, 'learning_rate': 1.9335158896027263e-05, 'epoch': 0.24} {'loss': 0.7266, 'learning_rate': 1.9335041523707247e-05, 'epoch': 0.24} {'loss': 0.8472, 'learning_rate': 1.9334924141383896e-05, 'epoch': 0.24} {'loss': 1.041, 'learning_rate': 1.933480674905733e-05, 'epoch': 0.24} {'loss': 0.843, 'learning_rate': 1.9334689346727675e-05, 'epoch': 0.24} {'loss': 0.8304, 'learning_rate': 1.9334571934395058e-05, 'epoch': 0.24} {'loss': 0.8847, 'learning_rate': 1.9334454512059606e-05, 'epoch': 0.24} {'loss': 0.7225, 'learning_rate': 1.9334337079721443e-05, 'epoch': 0.24} {'loss': 1.0191, 'learning_rate': 1.9334219637380696e-05, 'epoch': 0.24} {'loss': 0.7274, 'learning_rate': 1.933410218503749e-05, 'epoch': 0.24} {'loss': 0.8825, 'learning_rate': 1.933398472269195e-05, 'epoch': 0.24} {'loss': 0.8956, 'learning_rate': 1.9333867250344204e-05, 'epoch': 0.24} {'loss': 0.7685, 'learning_rate': 1.9333749767994373e-05, 'epoch': 0.24} {'loss': 0.8799, 'learning_rate': 1.933363227564259e-05, 'epoch': 0.24} {'loss': 0.907, 'learning_rate': 1.933351477328898e-05, 'epoch': 0.24} {'loss': 1.0298, 'learning_rate': 1.933339726093366e-05, 'epoch': 0.24} {'loss': 0.953, 'learning_rate': 1.9333279738576768e-05, 'epoch': 0.24} {'loss': 0.8402, 'learning_rate': 1.9333162206218424e-05, 'epoch': 0.24} {'loss': 0.8913, 'learning_rate': 1.9333044663858752e-05, 'epoch': 0.24} {'loss': 0.9067, 'learning_rate': 1.9332927111497884e-05, 'epoch': 0.24} {'loss': 0.9859, 'learning_rate': 1.933280954913594e-05, 'epoch': 0.24} {'loss': 0.999, 'learning_rate': 1.9332691976773046e-05, 'epoch': 0.24} {'loss': 0.9581, 'learning_rate': 1.9332574394409332e-05, 'epoch': 0.24} {'loss': 0.8625, 'learning_rate': 1.9332456802044925e-05, 'epoch': 0.24} {'loss': 0.7999, 'learning_rate': 1.9332339199679945e-05, 'epoch': 0.24} {'loss': 0.7623, 'learning_rate': 1.9332221587314518e-05, 'epoch': 0.24} {'loss': 1.0088, 'learning_rate': 1.933210396494878e-05, 'epoch': 0.24} {'loss': 0.9692, 'learning_rate': 1.9331986332582847e-05, 'epoch': 0.24} {'loss': 0.7435, 'learning_rate': 1.9331868690216845e-05, 'epoch': 0.24} {'loss': 0.9344, 'learning_rate': 1.933175103785091e-05, 'epoch': 0.24} {'loss': 0.8851, 'learning_rate': 1.933163337548516e-05, 'epoch': 0.24} {'loss': 1.0314, 'learning_rate': 1.9331515703119722e-05, 'epoch': 0.24} {'loss': 0.9741, 'learning_rate': 1.933139802075472e-05, 'epoch': 0.24} {'loss': 0.8578, 'learning_rate': 1.9331280328390284e-05, 'epoch': 0.24} {'loss': 0.8533, 'learning_rate': 1.9331162626026542e-05, 'epoch': 0.24} {'loss': 0.9199, 'learning_rate': 1.9331044913663614e-05, 'epoch': 0.24} {'loss': 0.9075, 'learning_rate': 1.933092719130163e-05, 'epoch': 0.24} {'loss': 0.9095, 'learning_rate': 1.9330809458940715e-05, 'epoch': 0.24} {'loss': 1.0306, 'learning_rate': 1.9330691716580996e-05, 'epoch': 0.24} {'loss': 0.9618, 'learning_rate': 1.93305739642226e-05, 'epoch': 0.24} {'loss': 0.9142, 'learning_rate': 1.9330456201865648e-05, 'epoch': 0.24} {'loss': 0.9205, 'learning_rate': 1.9330338429510273e-05, 'epoch': 0.24} {'loss': 0.8956, 'learning_rate': 1.93302206471566e-05, 'epoch': 0.24} {'loss': 0.8567, 'learning_rate': 1.9330102854804748e-05, 'epoch': 0.24} {'loss': 0.9442, 'learning_rate': 1.932998505245485e-05, 'epoch': 0.24} {'loss': 1.1263, 'learning_rate': 1.9329867240107036e-05, 'epoch': 0.24} {'loss': 0.9056, 'learning_rate': 1.9329749417761423e-05, 'epoch': 0.24} {'loss': 0.8126, 'learning_rate': 1.932963158541814e-05, 'epoch': 0.24} {'loss': 0.97, 'learning_rate': 1.932951374307732e-05, 'epoch': 0.24} {'loss': 0.8363, 'learning_rate': 1.9329395890739083e-05, 'epoch': 0.24} {'loss': 0.856, 'learning_rate': 1.932927802840355e-05, 'epoch': 0.24} {'loss': 1.0669, 'learning_rate': 1.932916015607086e-05, 'epoch': 0.24} {'loss': 0.93, 'learning_rate': 1.9329042273741132e-05, 'epoch': 0.24} {'loss': 0.735, 'learning_rate': 1.932892438141449e-05, 'epoch': 0.24} {'loss': 0.9582, 'learning_rate': 1.9328806479091068e-05, 'epoch': 0.24} {'loss': 0.9573, 'learning_rate': 1.9328688566770982e-05, 'epoch': 0.24} {'loss': 0.8796, 'learning_rate': 1.932857064445437e-05, 'epoch': 0.24} {'loss': 1.0753, 'learning_rate': 1.932845271214135e-05, 'epoch': 0.24} {'loss': 0.8843, 'learning_rate': 1.9328334769832053e-05, 'epoch': 0.24} {'loss': 0.9549, 'learning_rate': 1.9328216817526598e-05, 'epoch': 0.24} {'loss': 0.9812, 'learning_rate': 1.932809885522512e-05, 'epoch': 0.24} {'loss': 0.8448, 'learning_rate': 1.9327980882927744e-05, 'epoch': 0.24} {'loss': 0.7505, 'learning_rate': 1.9327862900634593e-05, 'epoch': 0.24} {'loss': 1.064, 'learning_rate': 1.9327744908345795e-05, 'epoch': 0.24} {'loss': 0.96, 'learning_rate': 1.932762690606148e-05, 'epoch': 0.24} {'loss': 0.7857, 'learning_rate': 1.9327508893781766e-05, 'epoch': 0.24} {'loss': 0.8846, 'learning_rate': 1.9327390871506785e-05, 'epoch': 0.24} {'loss': 0.9096, 'learning_rate': 1.9327272839236663e-05, 'epoch': 0.24} {'loss': 1.0647, 'learning_rate': 1.932715479697153e-05, 'epoch': 0.24} {'loss': 0.8578, 'learning_rate': 1.93270367447115e-05, 'epoch': 0.24} {'loss': 0.9469, 'learning_rate': 1.9326918682456718e-05, 'epoch': 0.24} {'loss': 0.8894, 'learning_rate': 1.9326800610207298e-05, 'epoch': 0.24} {'loss': 0.7989, 'learning_rate': 1.9326682527963368e-05, 'epoch': 0.24} {'loss': 0.713, 'learning_rate': 1.9326564435725058e-05, 'epoch': 0.24} {'loss': 0.7731, 'learning_rate': 1.932644633349249e-05, 'epoch': 0.24} {'loss': 0.885, 'learning_rate': 1.9326328221265794e-05, 'epoch': 0.24} {'loss': 0.7383, 'learning_rate': 1.9326210099045093e-05, 'epoch': 0.24} {'loss': 1.0109, 'learning_rate': 1.932609196683052e-05, 'epoch': 0.24} {'loss': 0.9309, 'learning_rate': 1.9325973824622194e-05, 'epoch': 0.24} {'loss': 1.1195, 'learning_rate': 1.9325855672420247e-05, 'epoch': 0.24} {'loss': 0.6852, 'learning_rate': 1.9325737510224805e-05, 'epoch': 0.24} {'loss': 0.7106, 'learning_rate': 1.932561933803599e-05, 'epoch': 0.24} {'loss': 1.0401, 'learning_rate': 1.932550115585394e-05, 'epoch': 0.24} {'loss': 1.0395, 'learning_rate': 1.9325382963678766e-05, 'epoch': 0.24} {'loss': 0.8682, 'learning_rate': 1.9325264761510607e-05, 'epoch': 0.24} {'loss': 0.7987, 'learning_rate': 1.9325146549349582e-05, 'epoch': 0.24} {'loss': 0.9461, 'learning_rate': 1.9325028327195823e-05, 'epoch': 0.24} {'loss': 0.8512, 'learning_rate': 1.9324910095049452e-05, 'epoch': 0.24} {'loss': 0.8895, 'learning_rate': 1.9324791852910604e-05, 'epoch': 0.24} {'loss': 0.7678, 'learning_rate': 1.9324673600779396e-05, 'epoch': 0.24} {'loss': 0.714, 'learning_rate': 1.9324555338655958e-05, 'epoch': 0.24} {'loss': 0.6502, 'learning_rate': 1.9324437066540417e-05, 'epoch': 0.24} {'loss': 0.8909, 'learning_rate': 1.93243187844329e-05, 'epoch': 0.24} {'loss': 0.8274, 'learning_rate': 1.9324200492333537e-05, 'epoch': 0.24} {'loss': 0.9361, 'learning_rate': 1.932408219024245e-05, 'epoch': 0.24} {'loss': 0.9527, 'learning_rate': 1.9323963878159767e-05, 'epoch': 0.24} {'loss': 0.8443, 'learning_rate': 1.9323845556085613e-05, 'epoch': 0.24} {'loss': 0.82, 'learning_rate': 1.932372722402012e-05, 'epoch': 0.24} {'loss': 0.8945, 'learning_rate': 1.932360888196341e-05, 'epoch': 0.24} {'loss': 0.918, 'learning_rate': 1.9323490529915614e-05, 'epoch': 0.24} {'loss': 0.8541, 'learning_rate': 1.9323372167876853e-05, 'epoch': 0.24} {'loss': 1.0688, 'learning_rate': 1.9323253795847258e-05, 'epoch': 0.24} {'loss': 0.8956, 'learning_rate': 1.9323135413826956e-05, 'epoch': 0.24} {'loss': 1.1074, 'learning_rate': 1.9323017021816077e-05, 'epoch': 0.24} {'loss': 0.9322, 'learning_rate': 1.932289861981474e-05, 'epoch': 0.24} {'loss': 0.8046, 'learning_rate': 1.9322780207823074e-05, 'epoch': 0.24} {'loss': 1.0126, 'learning_rate': 1.9322661785841207e-05, 'epoch': 0.24} {'loss': 0.9332, 'learning_rate': 1.932254335386927e-05, 'epoch': 0.24} {'loss': 0.9547, 'learning_rate': 1.9322424911907386e-05, 'epoch': 0.24} {'loss': 0.9338, 'learning_rate': 1.932230645995568e-05, 'epoch': 0.24} {'loss': 0.839, 'learning_rate': 1.932218799801428e-05, 'epoch': 0.24} {'loss': 0.9804, 'learning_rate': 1.9322069526083318e-05, 'epoch': 0.24} {'loss': 0.8158, 'learning_rate': 1.9321951044162917e-05, 'epoch': 0.24} {'loss': 0.9354, 'learning_rate': 1.9321832552253202e-05, 'epoch': 0.24} {'loss': 0.954, 'learning_rate': 1.9321714050354303e-05, 'epoch': 0.24} {'loss': 0.9822, 'learning_rate': 1.9321595538466347e-05, 'epoch': 0.24} {'loss': 0.8864, 'learning_rate': 1.9321477016589457e-05, 'epoch': 0.24} {'loss': 0.8619, 'learning_rate': 1.932135848472377e-05, 'epoch': 0.24} {'loss': 0.8673, 'learning_rate': 1.93212399428694e-05, 'epoch': 0.24} {'loss': 1.056, 'learning_rate': 1.932112139102648e-05, 'epoch': 0.24} {'loss': 0.9993, 'learning_rate': 1.932100282919514e-05, 'epoch': 0.24} {'loss': 0.7051, 'learning_rate': 1.93208842573755e-05, 'epoch': 0.24} {'loss': 0.823, 'learning_rate': 1.9320765675567696e-05, 'epoch': 0.24} {'loss': 0.9896, 'learning_rate': 1.9320647083771848e-05, 'epoch': 0.24} {'loss': 0.8188, 'learning_rate': 1.9320528481988082e-05, 'epoch': 0.24} {'loss': 0.8381, 'learning_rate': 1.9320409870216534e-05, 'epoch': 0.24} {'loss': 1.0455, 'learning_rate': 1.9320291248457322e-05, 'epoch': 0.24} {'loss': 0.8442, 'learning_rate': 1.932017261671058e-05, 'epoch': 0.24} {'loss': 0.9051, 'learning_rate': 1.932005397497643e-05, 'epoch': 0.24} {'loss': 0.8876, 'learning_rate': 1.9319935323255e-05, 'epoch': 0.24} {'loss': 0.7985, 'learning_rate': 1.931981666154642e-05, 'epoch': 0.24} {'loss': 1.0202, 'learning_rate': 1.9319697989850816e-05, 'epoch': 0.24} {'loss': 0.923, 'learning_rate': 1.9319579308168316e-05, 'epoch': 0.24} {'loss': 0.8559, 'learning_rate': 1.931946061649904e-05, 'epoch': 0.24} {'loss': 0.8643, 'learning_rate': 1.9319341914843124e-05, 'epoch': 0.24} {'loss': 0.7871, 'learning_rate': 1.9319223203200693e-05, 'epoch': 0.24} {'loss': 0.814, 'learning_rate': 1.931910448157187e-05, 'epoch': 0.24} {'loss': 0.9866, 'learning_rate': 1.9318985749956786e-05, 'epoch': 0.24} {'loss': 0.8002, 'learning_rate': 1.9318867008355572e-05, 'epoch': 0.24} {'loss': 0.8204, 'learning_rate': 1.9318748256768348e-05, 'epoch': 0.24} {'loss': 0.8019, 'learning_rate': 1.9318629495195242e-05, 'epoch': 0.24} {'loss': 1.0569, 'learning_rate': 1.9318510723636387e-05, 'epoch': 0.24} {'loss': 1.0561, 'learning_rate': 1.9318391942091904e-05, 'epoch': 0.24} {'loss': 0.994, 'learning_rate': 1.9318273150561926e-05, 'epoch': 0.24} {'loss': 0.8581, 'learning_rate': 1.9318154349046575e-05, 'epoch': 0.24} {'loss': 1.0235, 'learning_rate': 1.931803553754598e-05, 'epoch': 0.24} {'loss': 0.8899, 'learning_rate': 1.931791671606027e-05, 'epoch': 0.24} {'loss': 0.9898, 'learning_rate': 1.931779788458957e-05, 'epoch': 0.24} {'loss': 1.064, 'learning_rate': 1.931767904313401e-05, 'epoch': 0.24} {'loss': 0.9628, 'learning_rate': 1.9317560191693717e-05, 'epoch': 0.24} {'loss': 0.6772, 'learning_rate': 1.9317441330268817e-05, 'epoch': 0.24} {'loss': 0.893, 'learning_rate': 1.9317322458859434e-05, 'epoch': 0.24} {'loss': 0.8918, 'learning_rate': 1.9317203577465705e-05, 'epoch': 0.24} {'loss': 0.8277, 'learning_rate': 1.9317084686087747e-05, 'epoch': 0.24} {'loss': 0.9224, 'learning_rate': 1.931696578472569e-05, 'epoch': 0.24} {'loss': 0.9982, 'learning_rate': 1.931684687337967e-05, 'epoch': 0.24} {'loss': 0.9319, 'learning_rate': 1.9316727952049805e-05, 'epoch': 0.24} {'loss': 0.8557, 'learning_rate': 1.9316609020736222e-05, 'epoch': 0.24} {'loss': 0.9406, 'learning_rate': 1.9316490079439052e-05, 'epoch': 0.24} {'loss': 0.9331, 'learning_rate': 1.9316371128158424e-05, 'epoch': 0.24} {'loss': 0.7944, 'learning_rate': 1.9316252166894465e-05, 'epoch': 0.24} {'loss': 0.9454, 'learning_rate': 1.93161331956473e-05, 'epoch': 0.24} {'loss': 0.963, 'learning_rate': 1.9316014214417057e-05, 'epoch': 0.24} {'loss': 0.9354, 'learning_rate': 1.9315895223203863e-05, 'epoch': 0.24} {'loss': 0.98, 'learning_rate': 1.9315776222007847e-05, 'epoch': 0.24} {'loss': 0.8232, 'learning_rate': 1.9315657210829134e-05, 'epoch': 0.24} {'loss': 1.0836, 'learning_rate': 1.9315538189667857e-05, 'epoch': 0.24} {'loss': 0.9074, 'learning_rate': 1.9315419158524137e-05, 'epoch': 0.24} {'loss': 0.7759, 'learning_rate': 1.9315300117398107e-05, 'epoch': 0.24} {'loss': 0.802, 'learning_rate': 1.9315181066289892e-05, 'epoch': 0.24} {'loss': 0.9181, 'learning_rate': 1.9315062005199617e-05, 'epoch': 0.24} {'loss': 0.6706, 'learning_rate': 1.9314942934127418e-05, 'epoch': 0.24} {'loss': 0.7116, 'learning_rate': 1.9314823853073413e-05, 'epoch': 0.24} {'loss': 0.8775, 'learning_rate': 1.9314704762037732e-05, 'epoch': 0.24} {'loss': 1.0602, 'learning_rate': 1.9314585661020506e-05, 'epoch': 0.24} {'loss': 0.6989, 'learning_rate': 1.931446655002186e-05, 'epoch': 0.24} {'loss': 0.8507, 'learning_rate': 1.9314347429041925e-05, 'epoch': 0.24} {'loss': 0.743, 'learning_rate': 1.9314228298080823e-05, 'epoch': 0.24} {'loss': 0.8444, 'learning_rate': 1.9314109157138686e-05, 'epoch': 0.24} {'loss': 0.8354, 'learning_rate': 1.931399000621564e-05, 'epoch': 0.24} {'loss': 0.8402, 'learning_rate': 1.9313870845311813e-05, 'epoch': 0.24} {'loss': 0.815, 'learning_rate': 1.9313751674427332e-05, 'epoch': 0.24} {'loss': 0.9399, 'learning_rate': 1.931363249356233e-05, 'epoch': 0.24} {'loss': 0.8035, 'learning_rate': 1.9313513302716927e-05, 'epoch': 0.24} {'loss': 0.8247, 'learning_rate': 1.931339410189125e-05, 'epoch': 0.24} {'loss': 0.8337, 'learning_rate': 1.9313274891085436e-05, 'epoch': 0.24} {'loss': 0.9664, 'learning_rate': 1.9313155670299604e-05, 'epoch': 0.24} {'loss': 0.9726, 'learning_rate': 1.931303643953389e-05, 'epoch': 0.24} {'loss': 0.923, 'learning_rate': 1.9312917198788413e-05, 'epoch': 0.24} {'loss': 0.8243, 'learning_rate': 1.9312797948063304e-05, 'epoch': 0.24} {'loss': 0.694, 'learning_rate': 1.9312678687358694e-05, 'epoch': 0.24} {'loss': 0.9696, 'learning_rate': 1.9312559416674704e-05, 'epoch': 0.24} {'loss': 0.7456, 'learning_rate': 1.931244013601147e-05, 'epoch': 0.24} {'loss': 0.9524, 'learning_rate': 1.9312320845369116e-05, 'epoch': 0.24} {'loss': 0.9794, 'learning_rate': 1.931220154474777e-05, 'epoch': 0.24} {'loss': 0.7348, 'learning_rate': 1.931208223414756e-05, 'epoch': 0.24} {'loss': 1.0191, 'learning_rate': 1.931196291356861e-05, 'epoch': 0.24} {'loss': 0.987, 'learning_rate': 1.9311843583011054e-05, 'epoch': 0.24} {'loss': 0.9386, 'learning_rate': 1.9311724242475015e-05, 'epoch': 0.24} {'loss': 0.8326, 'learning_rate': 1.9311604891960623e-05, 'epoch': 0.24} {'loss': 1.0329, 'learning_rate': 1.931148553146801e-05, 'epoch': 0.24} {'loss': 0.9123, 'learning_rate': 1.9311366160997297e-05, 'epoch': 0.24} {'loss': 0.7823, 'learning_rate': 1.9311246780548614e-05, 'epoch': 0.24} {'loss': 1.0354, 'learning_rate': 1.931112739012209e-05, 'epoch': 0.24} {'loss': 0.8401, 'learning_rate': 1.931100798971785e-05, 'epoch': 0.24} {'loss': 0.8453, 'learning_rate': 1.931088857933603e-05, 'epoch': 0.24} {'loss': 0.9511, 'learning_rate': 1.931076915897675e-05, 'epoch': 0.24} {'loss': 0.7786, 'learning_rate': 1.9310649728640142e-05, 'epoch': 0.24} {'loss': 0.8547, 'learning_rate': 1.931053028832633e-05, 'epoch': 0.24} {'loss': 0.874, 'learning_rate': 1.9310410838035446e-05, 'epoch': 0.24} {'loss': 1.0854, 'learning_rate': 1.9310291377767617e-05, 'epoch': 0.24} {'loss': 0.9155, 'learning_rate': 1.931017190752297e-05, 'epoch': 0.24} {'loss': 0.7362, 'learning_rate': 1.9310052427301632e-05, 'epoch': 0.24} {'loss': 0.7932, 'learning_rate': 1.9309932937103734e-05, 'epoch': 0.24} {'loss': 0.9071, 'learning_rate': 1.93098134369294e-05, 'epoch': 0.24} {'loss': 0.9162, 'learning_rate': 1.930969392677876e-05, 'epoch': 0.24} {'loss': 0.973, 'learning_rate': 1.930957440665195e-05, 'epoch': 0.24} {'loss': 0.9554, 'learning_rate': 1.9309454876549084e-05, 'epoch': 0.24} {'loss': 1.02, 'learning_rate': 1.93093353364703e-05, 'epoch': 0.24} {'loss': 0.9203, 'learning_rate': 1.930921578641572e-05, 'epoch': 0.24} {'loss': 0.8994, 'learning_rate': 1.9309096226385483e-05, 'epoch': 0.24} {'loss': 0.8966, 'learning_rate': 1.93089766563797e-05, 'epoch': 0.24} {'loss': 1.0377, 'learning_rate': 1.9308857076398513e-05, 'epoch': 0.24} {'loss': 0.8821, 'learning_rate': 1.9308737486442045e-05, 'epoch': 0.24} {'loss': 1.0051, 'learning_rate': 1.9308617886510422e-05, 'epoch': 0.24} {'loss': 0.8051, 'learning_rate': 1.9308498276603777e-05, 'epoch': 0.24} {'loss': 0.8813, 'learning_rate': 1.9308378656722238e-05, 'epoch': 0.24} {'loss': 0.9774, 'learning_rate': 1.9308259026865927e-05, 'epoch': 0.24} {'loss': 0.8229, 'learning_rate': 1.9308139387034977e-05, 'epoch': 0.24} {'loss': 1.0611, 'learning_rate': 1.9308019737229516e-05, 'epoch': 0.24} {'loss': 0.9396, 'learning_rate': 1.9307900077449676e-05, 'epoch': 0.24} {'loss': 1.0809, 'learning_rate': 1.9307780407695576e-05, 'epoch': 0.24} {'loss': 0.9699, 'learning_rate': 1.930766072796735e-05, 'epoch': 0.24} {'loss': 0.7577, 'learning_rate': 1.9307541038265127e-05, 'epoch': 0.24} {'loss': 0.917, 'learning_rate': 1.9307421338589032e-05, 'epoch': 0.24} {'loss': 0.9726, 'learning_rate': 1.9307301628939195e-05, 'epoch': 0.24} {'loss': 0.9128, 'learning_rate': 1.9307181909315746e-05, 'epoch': 0.24} {'loss': 1.1494, 'learning_rate': 1.930706217971881e-05, 'epoch': 0.24} {'loss': 1.025, 'learning_rate': 1.9306942440148516e-05, 'epoch': 0.24} {'loss': 1.0057, 'learning_rate': 1.9306822690604996e-05, 'epoch': 0.24} {'loss': 0.9342, 'learning_rate': 1.9306702931088375e-05, 'epoch': 0.24} {'loss': 1.0955, 'learning_rate': 1.930658316159878e-05, 'epoch': 0.24} {'loss': 0.9941, 'learning_rate': 1.930646338213634e-05, 'epoch': 0.24} {'loss': 0.8446, 'learning_rate': 1.9306343592701187e-05, 'epoch': 0.24} {'loss': 0.9147, 'learning_rate': 1.9306223793293445e-05, 'epoch': 0.24} {'loss': 0.9049, 'learning_rate': 1.9306103983913247e-05, 'epoch': 0.24} {'loss': 0.8825, 'learning_rate': 1.9305984164560718e-05, 'epoch': 0.24} {'loss': 0.8368, 'learning_rate': 1.930586433523599e-05, 'epoch': 0.24} {'loss': 0.8205, 'learning_rate': 1.9305744495939184e-05, 'epoch': 0.24} {'loss': 0.8067, 'learning_rate': 1.9305624646670433e-05, 'epoch': 0.24} {'loss': 1.0276, 'learning_rate': 1.9305504787429866e-05, 'epoch': 0.24} {'loss': 0.9017, 'learning_rate': 1.9305384918217612e-05, 'epoch': 0.24} {'loss': 0.9596, 'learning_rate': 1.9305265039033796e-05, 'epoch': 0.24} {'loss': 0.8596, 'learning_rate': 1.930514514987855e-05, 'epoch': 0.24} {'loss': 0.9511, 'learning_rate': 1.9305025250752002e-05, 'epoch': 0.24} {'loss': 1.0136, 'learning_rate': 1.9304905341654276e-05, 'epoch': 0.24} {'loss': 0.859, 'learning_rate': 1.9304785422585507e-05, 'epoch': 0.24} {'loss': 0.7552, 'learning_rate': 1.930466549354582e-05, 'epoch': 0.24} {'loss': 0.8832, 'learning_rate': 1.9304545554535345e-05, 'epoch': 0.24} {'loss': 0.8494, 'learning_rate': 1.9304425605554208e-05, 'epoch': 0.24} {'loss': 0.8945, 'learning_rate': 1.930430564660254e-05, 'epoch': 0.24} {'loss': 1.104, 'learning_rate': 1.930418567768047e-05, 'epoch': 0.24} {'loss': 0.8577, 'learning_rate': 1.9304065698788122e-05, 'epoch': 0.24} {'loss': 0.725, 'learning_rate': 1.9303945709925628e-05, 'epoch': 0.24} {'loss': 1.0367, 'learning_rate': 1.9303825711093122e-05, 'epoch': 0.24} {'loss': 0.6553, 'learning_rate': 1.9303705702290724e-05, 'epoch': 0.24} {'loss': 0.892, 'learning_rate': 1.9303585683518565e-05, 'epoch': 0.24} {'loss': 0.7211, 'learning_rate': 1.9303465654776773e-05, 'epoch': 0.24} {'loss': 0.8896, 'learning_rate': 1.930334561606548e-05, 'epoch': 0.24} {'loss': 0.7653, 'learning_rate': 1.930322556738481e-05, 'epoch': 0.24} {'loss': 0.9683, 'learning_rate': 1.9303105508734895e-05, 'epoch': 0.24} {'loss': 1.0728, 'learning_rate': 1.9302985440115867e-05, 'epoch': 0.24} {'loss': 0.823, 'learning_rate': 1.9302865361527843e-05, 'epoch': 0.24} {'loss': 0.9366, 'learning_rate': 1.9302745272970967e-05, 'epoch': 0.24} {'loss': 0.9197, 'learning_rate': 1.9302625174445354e-05, 'epoch': 0.24} {'loss': 0.6885, 'learning_rate': 1.930250506595114e-05, 'epoch': 0.24} {'loss': 0.9092, 'learning_rate': 1.9302384947488452e-05, 'epoch': 0.24} {'loss': 0.8648, 'learning_rate': 1.9302264819057422e-05, 'epoch': 0.24} {'loss': 1.0144, 'learning_rate': 1.9302144680658173e-05, 'epoch': 0.24} {'loss': 0.9016, 'learning_rate': 1.9302024532290837e-05, 'epoch': 0.24} {'loss': 0.8425, 'learning_rate': 1.9301904373955542e-05, 'epoch': 0.24} {'loss': 0.6624, 'learning_rate': 1.9301784205652415e-05, 'epoch': 0.24} {'loss': 0.7529, 'learning_rate': 1.9301664027381587e-05, 'epoch': 0.24} {'loss': 0.9897, 'learning_rate': 1.930154383914319e-05, 'epoch': 0.24} {'loss': 0.9593, 'learning_rate': 1.930142364093735e-05, 'epoch': 0.24} {'loss': 0.9504, 'learning_rate': 1.9301303432764192e-05, 'epoch': 0.24} {'loss': 0.9131, 'learning_rate': 1.9301183214623845e-05, 'epoch': 0.24} {'loss': 0.8266, 'learning_rate': 1.9301062986516444e-05, 'epoch': 0.24} {'loss': 0.908, 'learning_rate': 1.9300942748442115e-05, 'epoch': 0.24} {'loss': 0.7873, 'learning_rate': 1.9300822500400987e-05, 'epoch': 0.24} {'loss': 1.0448, 'learning_rate': 1.9300702242393184e-05, 'epoch': 0.24} {'loss': 0.9417, 'learning_rate': 1.9300581974418843e-05, 'epoch': 0.24} {'loss': 0.9708, 'learning_rate': 1.930046169647809e-05, 'epoch': 0.25} {'loss': 0.787, 'learning_rate': 1.930034140857105e-05, 'epoch': 0.25} {'loss': 0.9068, 'learning_rate': 1.9300221110697858e-05, 'epoch': 0.25} {'loss': 0.8744, 'learning_rate': 1.9300100802858636e-05, 'epoch': 0.25} {'loss': 1.0089, 'learning_rate': 1.929998048505352e-05, 'epoch': 0.25} {'loss': 0.9849, 'learning_rate': 1.9299860157282633e-05, 'epoch': 0.25} {'loss': 0.8809, 'learning_rate': 1.9299739819546106e-05, 'epoch': 0.25} {'loss': 1.0308, 'learning_rate': 1.929961947184407e-05, 'epoch': 0.25} {'loss': 0.7934, 'learning_rate': 1.929949911417665e-05, 'epoch': 0.25} {'loss': 0.9745, 'learning_rate': 1.929937874654398e-05, 'epoch': 0.25} {'loss': 0.9278, 'learning_rate': 1.9299258368946185e-05, 'epoch': 0.25} {'loss': 0.6822, 'learning_rate': 1.9299137981383395e-05, 'epoch': 0.25} {'loss': 0.9529, 'learning_rate': 1.929901758385574e-05, 'epoch': 0.25} {'loss': 1.0117, 'learning_rate': 1.929889717636335e-05, 'epoch': 0.25} {'loss': 0.8259, 'learning_rate': 1.929877675890635e-05, 'epoch': 0.25} {'loss': 0.9621, 'learning_rate': 1.9298656331484875e-05, 'epoch': 0.25} {'loss': 0.8314, 'learning_rate': 1.9298535894099045e-05, 'epoch': 0.25} {'loss': 0.9692, 'learning_rate': 1.9298415446749e-05, 'epoch': 0.25} {'loss': 0.8159, 'learning_rate': 1.929829498943486e-05, 'epoch': 0.25} {'loss': 1.085, 'learning_rate': 1.929817452215676e-05, 'epoch': 0.25} {'loss': 0.9529, 'learning_rate': 1.9298054044914828e-05, 'epoch': 0.25} {'loss': 1.0462, 'learning_rate': 1.9297933557709187e-05, 'epoch': 0.25} {'loss': 0.9862, 'learning_rate': 1.929781306053997e-05, 'epoch': 0.25} {'loss': 0.9946, 'learning_rate': 1.9297692553407314e-05, 'epoch': 0.25} {'loss': 0.8503, 'learning_rate': 1.929757203631134e-05, 'epoch': 0.25} {'loss': 0.8847, 'learning_rate': 1.9297451509252175e-05, 'epoch': 0.25} {'loss': 0.7744, 'learning_rate': 1.9297330972229954e-05, 'epoch': 0.25} {'loss': 0.8684, 'learning_rate': 1.92972104252448e-05, 'epoch': 0.25} {'loss': 0.9456, 'learning_rate': 1.929708986829685e-05, 'epoch': 0.25} {'loss': 0.9398, 'learning_rate': 1.9296969301386225e-05, 'epoch': 0.25} {'loss': 0.9723, 'learning_rate': 1.9296848724513063e-05, 'epoch': 0.25} {'loss': 0.8266, 'learning_rate': 1.9296728137677485e-05, 'epoch': 0.25} {'loss': 1.0069, 'learning_rate': 1.9296607540879627e-05, 'epoch': 0.25} {'loss': 0.6262, 'learning_rate': 1.9296486934119612e-05, 'epoch': 0.25} {'loss': 0.8715, 'learning_rate': 1.9296366317397575e-05, 'epoch': 0.25} {'loss': 0.8849, 'learning_rate': 1.929624569071364e-05, 'epoch': 0.25} {'loss': 0.8763, 'learning_rate': 1.9296125054067937e-05, 'epoch': 0.25} {'loss': 0.7123, 'learning_rate': 1.92960044074606e-05, 'epoch': 0.25} {'loss': 1.0117, 'learning_rate': 1.9295883750891756e-05, 'epoch': 0.25} {'loss': 0.9701, 'learning_rate': 1.9295763084361532e-05, 'epoch': 0.25} {'loss': 0.9329, 'learning_rate': 1.9295642407870058e-05, 'epoch': 0.25} {'loss': 1.0028, 'learning_rate': 1.9295521721417466e-05, 'epoch': 0.25} {'loss': 0.9322, 'learning_rate': 1.9295401025003882e-05, 'epoch': 0.25} {'loss': 0.983, 'learning_rate': 1.9295280318629437e-05, 'epoch': 0.25} {'loss': 0.8759, 'learning_rate': 1.9295159602294262e-05, 'epoch': 0.25} {'loss': 0.8872, 'learning_rate': 1.9295038875998484e-05, 'epoch': 0.25} {'loss': 0.9387, 'learning_rate': 1.929491813974223e-05, 'epoch': 0.25} {'loss': 0.7978, 'learning_rate': 1.9294797393525634e-05, 'epoch': 0.25} {'loss': 0.7814, 'learning_rate': 1.9294676637348824e-05, 'epoch': 0.25} {'loss': 0.7791, 'learning_rate': 1.929455587121193e-05, 'epoch': 0.25} {'loss': 0.7593, 'learning_rate': 1.929443509511508e-05, 'epoch': 0.25} {'loss': 1.0546, 'learning_rate': 1.9294314309058407e-05, 'epoch': 0.25} {'loss': 0.7998, 'learning_rate': 1.9294193513042032e-05, 'epoch': 0.25} {'loss': 1.1927, 'learning_rate': 1.929407270706609e-05, 'epoch': 0.25} {'loss': 1.0839, 'learning_rate': 1.9293951891130714e-05, 'epoch': 0.25} {'loss': 0.957, 'learning_rate': 1.9293831065236028e-05, 'epoch': 0.25} {'loss': 1.0179, 'learning_rate': 1.9293710229382162e-05, 'epoch': 0.25} {'loss': 0.9126, 'learning_rate': 1.929358938356925e-05, 'epoch': 0.25} {'loss': 0.837, 'learning_rate': 1.9293468527797414e-05, 'epoch': 0.25} {'loss': 0.9324, 'learning_rate': 1.9293347662066792e-05, 'epoch': 0.25} {'loss': 0.8934, 'learning_rate': 1.9293226786377505e-05, 'epoch': 0.25} {'loss': 0.8051, 'learning_rate': 1.9293105900729686e-05, 'epoch': 0.25} {'loss': 1.0309, 'learning_rate': 1.929298500512347e-05, 'epoch': 0.25} {'loss': 0.7672, 'learning_rate': 1.929286409955898e-05, 'epoch': 0.25} {'loss': 0.8531, 'learning_rate': 1.9292743184036346e-05, 'epoch': 0.25} {'loss': 0.8406, 'learning_rate': 1.9292622258555698e-05, 'epoch': 0.25} {'loss': 0.8365, 'learning_rate': 1.929250132311717e-05, 'epoch': 0.25} {'loss': 0.7611, 'learning_rate': 1.929238037772089e-05, 'epoch': 0.25} {'loss': 0.7938, 'learning_rate': 1.9292259422366978e-05, 'epoch': 0.25} {'loss': 1.0129, 'learning_rate': 1.9292138457055575e-05, 'epoch': 0.25} {'loss': 0.9295, 'learning_rate': 1.929201748178681e-05, 'epoch': 0.25} {'loss': 0.7711, 'learning_rate': 1.9291896496560807e-05, 'epoch': 0.25} {'loss': 0.8829, 'learning_rate': 1.92917755013777e-05, 'epoch': 0.25} {'loss': 0.7841, 'learning_rate': 1.9291654496237614e-05, 'epoch': 0.25} {'loss': 0.8254, 'learning_rate': 1.9291533481140684e-05, 'epoch': 0.25} {'loss': 0.8561, 'learning_rate': 1.9291412456087034e-05, 'epoch': 0.25} {'loss': 0.859, 'learning_rate': 1.92912914210768e-05, 'epoch': 0.25} {'loss': 0.9252, 'learning_rate': 1.929117037611011e-05, 'epoch': 0.25} {'loss': 0.9949, 'learning_rate': 1.9291049321187087e-05, 'epoch': 0.25} {'loss': 1.0119, 'learning_rate': 1.9290928256307872e-05, 'epoch': 0.25} {'loss': 0.8326, 'learning_rate': 1.9290807181472585e-05, 'epoch': 0.25} {'loss': 0.9027, 'learning_rate': 1.929068609668136e-05, 'epoch': 0.25} {'loss': 0.8643, 'learning_rate': 1.9290565001934327e-05, 'epoch': 0.25} {'loss': 0.9618, 'learning_rate': 1.9290443897231618e-05, 'epoch': 0.25} {'loss': 0.9125, 'learning_rate': 1.9290322782573355e-05, 'epoch': 0.25} {'loss': 1.0109, 'learning_rate': 1.9290201657959676e-05, 'epoch': 0.25} {'loss': 0.7223, 'learning_rate': 1.9290080523390703e-05, 'epoch': 0.25} {'loss': 0.9557, 'learning_rate': 1.9289959378866573e-05, 'epoch': 0.25} {'loss': 0.8849, 'learning_rate': 1.9289838224387414e-05, 'epoch': 0.25} {'loss': 1.0022, 'learning_rate': 1.9289717059953354e-05, 'epoch': 0.25} {'loss': 0.8697, 'learning_rate': 1.9289595885564526e-05, 'epoch': 0.25} {'loss': 1.0515, 'learning_rate': 1.9289474701221055e-05, 'epoch': 0.25} {'loss': 0.7092, 'learning_rate': 1.9289353506923073e-05, 'epoch': 0.25} {'loss': 0.9232, 'learning_rate': 1.928923230267071e-05, 'epoch': 0.25} {'loss': 1.0025, 'learning_rate': 1.92891110884641e-05, 'epoch': 0.25} {'loss': 0.983, 'learning_rate': 1.9288989864303364e-05, 'epoch': 0.25} {'loss': 0.6941, 'learning_rate': 1.928886863018864e-05, 'epoch': 0.25} {'loss': 0.9704, 'learning_rate': 1.9288747386120056e-05, 'epoch': 0.25} {'loss': 1.0737, 'learning_rate': 1.9288626132097737e-05, 'epoch': 0.25} {'loss': 0.9161, 'learning_rate': 1.928850486812182e-05, 'epoch': 0.25} {'loss': 0.8251, 'learning_rate': 1.9288383594192433e-05, 'epoch': 0.25} {'loss': 0.8477, 'learning_rate': 1.92882623103097e-05, 'epoch': 0.25} {'loss': 0.8286, 'learning_rate': 1.928814101647376e-05, 'epoch': 0.25} {'loss': 0.9583, 'learning_rate': 1.9288019712684734e-05, 'epoch': 0.25} {'loss': 1.0353, 'learning_rate': 1.928789839894276e-05, 'epoch': 0.25} {'loss': 0.9676, 'learning_rate': 1.9287777075247963e-05, 'epoch': 0.25} {'loss': 0.8127, 'learning_rate': 1.9287655741600475e-05, 'epoch': 0.25} {'loss': 0.8197, 'learning_rate': 1.9287534398000427e-05, 'epoch': 0.25} {'loss': 0.923, 'learning_rate': 1.9287413044447945e-05, 'epoch': 0.25} {'loss': 1.0684, 'learning_rate': 1.9287291680943166e-05, 'epoch': 0.25} {'loss': 1.0421, 'learning_rate': 1.928717030748621e-05, 'epoch': 0.25} {'loss': 0.9574, 'learning_rate': 1.9287048924077216e-05, 'epoch': 0.25} {'loss': 0.9188, 'learning_rate': 1.928692753071631e-05, 'epoch': 0.25} {'loss': 0.8998, 'learning_rate': 1.9286806127403624e-05, 'epoch': 0.25} {'loss': 0.7792, 'learning_rate': 1.9286684714139284e-05, 'epoch': 0.25} {'loss': 0.8176, 'learning_rate': 1.928656329092343e-05, 'epoch': 0.25} {'loss': 0.8303, 'learning_rate': 1.928644185775618e-05, 'epoch': 0.25} {'loss': 0.8729, 'learning_rate': 1.928632041463767e-05, 'epoch': 0.25} {'loss': 0.9118, 'learning_rate': 1.928619896156803e-05, 'epoch': 0.25} {'loss': 0.8952, 'learning_rate': 1.928607749854739e-05, 'epoch': 0.25} {'loss': 0.9434, 'learning_rate': 1.928595602557588e-05, 'epoch': 0.25} {'loss': 0.899, 'learning_rate': 1.9285834542653627e-05, 'epoch': 0.25} {'loss': 0.7719, 'learning_rate': 1.9285713049780766e-05, 'epoch': 0.25} {'loss': 0.9047, 'learning_rate': 1.9285591546957427e-05, 'epoch': 0.25} {'loss': 0.9313, 'learning_rate': 1.9285470034183737e-05, 'epoch': 0.25} {'loss': 0.9811, 'learning_rate': 1.928534851145983e-05, 'epoch': 0.25} {'loss': 0.8983, 'learning_rate': 1.9285226978785833e-05, 'epoch': 0.25} {'loss': 0.9746, 'learning_rate': 1.9285105436161876e-05, 'epoch': 0.25} {'loss': 0.7592, 'learning_rate': 1.928498388358809e-05, 'epoch': 0.25} {'loss': 0.9943, 'learning_rate': 1.9284862321064608e-05, 'epoch': 0.25} {'loss': 0.7874, 'learning_rate': 1.9284740748591555e-05, 'epoch': 0.25} {'loss': 0.9294, 'learning_rate': 1.9284619166169067e-05, 'epoch': 0.25} {'loss': 0.8894, 'learning_rate': 1.9284497573797272e-05, 'epoch': 0.25} {'loss': 0.8694, 'learning_rate': 1.92843759714763e-05, 'epoch': 0.25} {'loss': 0.8161, 'learning_rate': 1.9284254359206278e-05, 'epoch': 0.25} {'loss': 0.9009, 'learning_rate': 1.928413273698734e-05, 'epoch': 0.25} {'loss': 0.7838, 'learning_rate': 1.9284011104819616e-05, 'epoch': 0.25} {'loss': 0.985, 'learning_rate': 1.928388946270324e-05, 'epoch': 0.25} {'loss': 0.8945, 'learning_rate': 1.9283767810638333e-05, 'epoch': 0.25} {'loss': 0.8215, 'learning_rate': 1.9283646148625035e-05, 'epoch': 0.25} {'loss': 0.997, 'learning_rate': 1.928352447666347e-05, 'epoch': 0.25} {'loss': 0.8508, 'learning_rate': 1.928340279475377e-05, 'epoch': 0.25} {'loss': 0.8269, 'learning_rate': 1.928328110289607e-05, 'epoch': 0.25} {'loss': 0.7513, 'learning_rate': 1.9283159401090493e-05, 'epoch': 0.25} {'loss': 0.8823, 'learning_rate': 1.9283037689337177e-05, 'epoch': 0.25} {'loss': 0.8016, 'learning_rate': 1.9282915967636245e-05, 'epoch': 0.25} {'loss': 0.9557, 'learning_rate': 1.928279423598783e-05, 'epoch': 0.25} {'loss': 0.8808, 'learning_rate': 1.928267249439206e-05, 'epoch': 0.25} {'loss': 0.6717, 'learning_rate': 1.9282550742849078e-05, 'epoch': 0.25} {'loss': 0.7564, 'learning_rate': 1.9282428981359e-05, 'epoch': 0.25} {'loss': 0.9323, 'learning_rate': 1.928230720992196e-05, 'epoch': 0.25} {'loss': 0.6718, 'learning_rate': 1.928218542853809e-05, 'epoch': 0.25} {'loss': 0.7629, 'learning_rate': 1.9282063637207523e-05, 'epoch': 0.25} {'loss': 0.9086, 'learning_rate': 1.9281941835930386e-05, 'epoch': 0.25} {'loss': 0.8138, 'learning_rate': 1.928182002470681e-05, 'epoch': 0.25} {'loss': 0.9832, 'learning_rate': 1.9281698203536928e-05, 'epoch': 0.25} {'loss': 0.9293, 'learning_rate': 1.9281576372420864e-05, 'epoch': 0.25} {'loss': 0.8604, 'learning_rate': 1.928145453135876e-05, 'epoch': 0.25} {'loss': 0.9809, 'learning_rate': 1.9281332680350733e-05, 'epoch': 0.25} {'loss': 0.8576, 'learning_rate': 1.9281210819396924e-05, 'epoch': 0.25} {'loss': 0.9226, 'learning_rate': 1.928108894849746e-05, 'epoch': 0.25} {'loss': 0.8651, 'learning_rate': 1.928096706765247e-05, 'epoch': 0.25} {'loss': 0.92, 'learning_rate': 1.928084517686209e-05, 'epoch': 0.25} {'loss': 0.8511, 'learning_rate': 1.9280723276126442e-05, 'epoch': 0.25} {'loss': 0.7754, 'learning_rate': 1.9280601365445662e-05, 'epoch': 0.25} {'loss': 0.9128, 'learning_rate': 1.9280479444819883e-05, 'epoch': 0.25} {'loss': 0.7338, 'learning_rate': 1.9280357514249232e-05, 'epoch': 0.25} {'loss': 0.9055, 'learning_rate': 1.9280235573733838e-05, 'epoch': 0.25} {'loss': 0.9528, 'learning_rate': 1.9280113623273837e-05, 'epoch': 0.25} {'loss': 0.8665, 'learning_rate': 1.9279991662869354e-05, 'epoch': 0.25} {'loss': 0.8653, 'learning_rate': 1.9279869692520524e-05, 'epoch': 0.25} {'loss': 0.8192, 'learning_rate': 1.9279747712227474e-05, 'epoch': 0.25} {'loss': 0.9979, 'learning_rate': 1.9279625721990334e-05, 'epoch': 0.25} {'loss': 0.7834, 'learning_rate': 1.9279503721809245e-05, 'epoch': 0.25} {'loss': 1.0316, 'learning_rate': 1.9279381711684328e-05, 'epoch': 0.25} {'loss': 1.1732, 'learning_rate': 1.927925969161571e-05, 'epoch': 0.25} {'loss': 0.9398, 'learning_rate': 1.9279137661603535e-05, 'epoch': 0.25} {'loss': 0.903, 'learning_rate': 1.9279015621647926e-05, 'epoch': 0.25} {'loss': 0.8199, 'learning_rate': 1.927889357174901e-05, 'epoch': 0.25} {'loss': 0.9656, 'learning_rate': 1.9278771511906926e-05, 'epoch': 0.25} {'loss': 0.8404, 'learning_rate': 1.9278649442121796e-05, 'epoch': 0.25} {'loss': 1.015, 'learning_rate': 1.927852736239376e-05, 'epoch': 0.25} {'loss': 0.902, 'learning_rate': 1.9278405272722944e-05, 'epoch': 0.25} {'loss': 0.8961, 'learning_rate': 1.927828317310948e-05, 'epoch': 0.25} {'loss': 0.7466, 'learning_rate': 1.9278161063553496e-05, 'epoch': 0.25} {'loss': 0.9462, 'learning_rate': 1.9278038944055128e-05, 'epoch': 0.25} {'loss': 0.7482, 'learning_rate': 1.92779168146145e-05, 'epoch': 0.25} {'loss': 0.8852, 'learning_rate': 1.9277794675231745e-05, 'epoch': 0.25} {'loss': 1.0234, 'learning_rate': 1.9277672525907002e-05, 'epoch': 0.25} {'loss': 1.0344, 'learning_rate': 1.9277550366640393e-05, 'epoch': 0.25} {'loss': 1.0669, 'learning_rate': 1.927742819743205e-05, 'epoch': 0.25} {'loss': 1.0095, 'learning_rate': 1.927730601828211e-05, 'epoch': 0.25} {'loss': 1.0222, 'learning_rate': 1.9277183829190692e-05, 'epoch': 0.25} {'loss': 0.858, 'learning_rate': 1.927706163015794e-05, 'epoch': 0.25} {'loss': 1.0594, 'learning_rate': 1.9276939421183977e-05, 'epoch': 0.25} {'loss': 0.8772, 'learning_rate': 1.9276817202268935e-05, 'epoch': 0.25} {'loss': 0.8577, 'learning_rate': 1.9276694973412948e-05, 'epoch': 0.25} {'loss': 0.8212, 'learning_rate': 1.9276572734616145e-05, 'epoch': 0.25} {'loss': 0.9203, 'learning_rate': 1.9276450485878655e-05, 'epoch': 0.25} {'loss': 1.0009, 'learning_rate': 1.9276328227200613e-05, 'epoch': 0.25} {'loss': 0.8929, 'learning_rate': 1.9276205958582145e-05, 'epoch': 0.25} {'loss': 0.8318, 'learning_rate': 1.927608368002339e-05, 'epoch': 0.25} {'loss': 0.9592, 'learning_rate': 1.9275961391524473e-05, 'epoch': 0.25} {'loss': 0.9451, 'learning_rate': 1.9275839093085525e-05, 'epoch': 0.25} {'loss': 0.9002, 'learning_rate': 1.9275716784706677e-05, 'epoch': 0.25} {'loss': 0.7495, 'learning_rate': 1.9275594466388063e-05, 'epoch': 0.25} {'loss': 0.9685, 'learning_rate': 1.9275472138129812e-05, 'epoch': 0.25} {'loss': 0.8519, 'learning_rate': 1.9275349799932056e-05, 'epoch': 0.25} {'loss': 1.0345, 'learning_rate': 1.927522745179492e-05, 'epoch': 0.25} {'loss': 1.0398, 'learning_rate': 1.927510509371855e-05, 'epoch': 0.25} {'loss': 0.7939, 'learning_rate': 1.927498272570306e-05, 'epoch': 0.25} {'loss': 0.9254, 'learning_rate': 1.9274860347748592e-05, 'epoch': 0.25} {'loss': 0.8929, 'learning_rate': 1.9274737959855274e-05, 'epoch': 0.25} {'loss': 0.7625, 'learning_rate': 1.927461556202324e-05, 'epoch': 0.25} {'loss': 1.0329, 'learning_rate': 1.9274493154252615e-05, 'epoch': 0.25} {'loss': 0.8522, 'learning_rate': 1.9274370736543534e-05, 'epoch': 0.25} {'loss': 0.8779, 'learning_rate': 1.9274248308896125e-05, 'epoch': 0.25} {'loss': 0.9208, 'learning_rate': 1.927412587131053e-05, 'epoch': 0.25} {'loss': 0.709, 'learning_rate': 1.9274003423786864e-05, 'epoch': 0.25} {'loss': 0.8497, 'learning_rate': 1.9273880966325267e-05, 'epoch': 0.25} {'loss': 1.0568, 'learning_rate': 1.9273758498925872e-05, 'epoch': 0.25} {'loss': 0.9757, 'learning_rate': 1.927363602158881e-05, 'epoch': 0.25} {'loss': 0.8624, 'learning_rate': 1.9273513534314204e-05, 'epoch': 0.25} {'loss': 0.946, 'learning_rate': 1.9273391037102197e-05, 'epoch': 0.25} {'loss': 0.9099, 'learning_rate': 1.9273268529952912e-05, 'epoch': 0.25} {'loss': 0.8139, 'learning_rate': 1.927314601286648e-05, 'epoch': 0.25} {'loss': 0.8401, 'learning_rate': 1.9273023485843038e-05, 'epoch': 0.25} {'loss': 1.0172, 'learning_rate': 1.927290094888272e-05, 'epoch': 0.25} {'loss': 0.9522, 'learning_rate': 1.9272778401985644e-05, 'epoch': 0.25} {'loss': 0.8874, 'learning_rate': 1.9272655845151948e-05, 'epoch': 0.25} {'loss': 1.0137, 'learning_rate': 1.9272533278381768e-05, 'epoch': 0.25} {'loss': 0.9431, 'learning_rate': 1.9272410701675232e-05, 'epoch': 0.25} {'loss': 0.9484, 'learning_rate': 1.927228811503247e-05, 'epoch': 0.25} {'loss': 0.8012, 'learning_rate': 1.9272165518453616e-05, 'epoch': 0.25} {'loss': 0.9551, 'learning_rate': 1.9272042911938798e-05, 'epoch': 0.25} {'loss': 0.9595, 'learning_rate': 1.927192029548815e-05, 'epoch': 0.25} {'loss': 0.8285, 'learning_rate': 1.92717976691018e-05, 'epoch': 0.25} {'loss': 1.0332, 'learning_rate': 1.9271675032779886e-05, 'epoch': 0.25} {'loss': 0.9658, 'learning_rate': 1.9271552386522532e-05, 'epoch': 0.25} {'loss': 0.8298, 'learning_rate': 1.9271429730329875e-05, 'epoch': 0.25} {'loss': 0.8791, 'learning_rate': 1.9271307064202043e-05, 'epoch': 0.25} {'loss': 0.8008, 'learning_rate': 1.927118438813917e-05, 'epoch': 0.25} {'loss': 0.9093, 'learning_rate': 1.9271061702141384e-05, 'epoch': 0.25} {'loss': 0.9551, 'learning_rate': 1.927093900620882e-05, 'epoch': 0.25} {'loss': 0.8332, 'learning_rate': 1.927081630034161e-05, 'epoch': 0.25} {'loss': 0.9565, 'learning_rate': 1.9270693584539882e-05, 'epoch': 0.25} {'loss': 0.9741, 'learning_rate': 1.9270570858803767e-05, 'epoch': 0.25} {'loss': 0.9103, 'learning_rate': 1.9270448123133402e-05, 'epoch': 0.25} {'loss': 0.8652, 'learning_rate': 1.9270325377528913e-05, 'epoch': 0.25} {'loss': 0.7034, 'learning_rate': 1.927020262199043e-05, 'epoch': 0.25} {'loss': 0.9836, 'learning_rate': 1.9270079856518096e-05, 'epoch': 0.25} {'loss': 0.8433, 'learning_rate': 1.9269957081112033e-05, 'epoch': 0.25} {'loss': 0.8514, 'learning_rate': 1.9269834295772368e-05, 'epoch': 0.25} {'loss': 1.0448, 'learning_rate': 1.9269711500499246e-05, 'epoch': 0.25} {'loss': 0.9, 'learning_rate': 1.9269588695292788e-05, 'epoch': 0.25} {'loss': 1.0748, 'learning_rate': 1.926946588015313e-05, 'epoch': 0.25} {'loss': 0.6668, 'learning_rate': 1.9269343055080404e-05, 'epoch': 0.25} {'loss': 0.7728, 'learning_rate': 1.9269220220074738e-05, 'epoch': 0.25} {'loss': 1.0374, 'learning_rate': 1.926909737513627e-05, 'epoch': 0.25} {'loss': 0.8507, 'learning_rate': 1.9268974520265123e-05, 'epoch': 0.25} {'loss': 0.7157, 'learning_rate': 1.9268851655461434e-05, 'epoch': 0.25} {'loss': 0.7203, 'learning_rate': 1.9268728780725335e-05, 'epoch': 0.25} {'loss': 0.7173, 'learning_rate': 1.9268605896056955e-05, 'epoch': 0.25} {'loss': 0.7957, 'learning_rate': 1.926848300145643e-05, 'epoch': 0.25} {'loss': 0.8514, 'learning_rate': 1.9268360096923887e-05, 'epoch': 0.25} {'loss': 0.8979, 'learning_rate': 1.9268237182459456e-05, 'epoch': 0.25} {'loss': 0.9545, 'learning_rate': 1.926811425806328e-05, 'epoch': 0.25} {'loss': 0.8579, 'learning_rate': 1.926799132373548e-05, 'epoch': 0.25} {'loss': 0.8901, 'learning_rate': 1.926786837947619e-05, 'epoch': 0.25} {'loss': 0.864, 'learning_rate': 1.926774542528554e-05, 'epoch': 0.25} {'loss': 0.6831, 'learning_rate': 1.9267622461163668e-05, 'epoch': 0.25} {'loss': 0.7371, 'learning_rate': 1.92674994871107e-05, 'epoch': 0.25} {'loss': 1.0212, 'learning_rate': 1.926737650312677e-05, 'epoch': 0.25} {'loss': 0.8657, 'learning_rate': 1.9267253509212012e-05, 'epoch': 0.25} {'loss': 0.9591, 'learning_rate': 1.9267130505366554e-05, 'epoch': 0.25} {'loss': 0.8702, 'learning_rate': 1.926700749159053e-05, 'epoch': 0.25} {'loss': 1.0693, 'learning_rate': 1.926688446788407e-05, 'epoch': 0.25} {'loss': 0.8611, 'learning_rate': 1.9266761434247307e-05, 'epoch': 0.25} {'loss': 0.9416, 'learning_rate': 1.9266638390680374e-05, 'epoch': 0.25} {'loss': 0.7871, 'learning_rate': 1.92665153371834e-05, 'epoch': 0.25} {'loss': 0.9177, 'learning_rate': 1.926639227375652e-05, 'epoch': 0.25} {'loss': 0.911, 'learning_rate': 1.9266269200399865e-05, 'epoch': 0.25} {'loss': 0.8182, 'learning_rate': 1.926614611711356e-05, 'epoch': 0.25} {'loss': 0.9219, 'learning_rate': 1.926602302389775e-05, 'epoch': 0.25} {'loss': 0.8759, 'learning_rate': 1.9265899920752558e-05, 'epoch': 0.25} {'loss': 0.7961, 'learning_rate': 1.9265776807678115e-05, 'epoch': 0.25} {'loss': 0.8511, 'learning_rate': 1.926565368467456e-05, 'epoch': 0.25} {'loss': 0.9005, 'learning_rate': 1.926553055174202e-05, 'epoch': 0.25} {'loss': 1.0038, 'learning_rate': 1.9265407408880628e-05, 'epoch': 0.25} {'loss': 0.8755, 'learning_rate': 1.9265284256090514e-05, 'epoch': 0.25} {'loss': 0.8432, 'learning_rate': 1.9265161093371813e-05, 'epoch': 0.25} {'loss': 0.8637, 'learning_rate': 1.9265037920724655e-05, 'epoch': 0.25} {'loss': 0.8131, 'learning_rate': 1.9264914738149173e-05, 'epoch': 0.25} {'loss': 0.7849, 'learning_rate': 1.9264791545645497e-05, 'epoch': 0.25} {'loss': 0.8793, 'learning_rate': 1.926466834321376e-05, 'epoch': 0.25} {'loss': 0.9761, 'learning_rate': 1.92645451308541e-05, 'epoch': 0.25} {'loss': 0.9528, 'learning_rate': 1.926442190856664e-05, 'epoch': 0.25} {'loss': 0.7455, 'learning_rate': 1.9264298676351515e-05, 'epoch': 0.25} {'loss': 0.9951, 'learning_rate': 1.926417543420886e-05, 'epoch': 0.25} {'loss': 1.0303, 'learning_rate': 1.9264052182138805e-05, 'epoch': 0.25} {'loss': 0.9787, 'learning_rate': 1.926392892014148e-05, 'epoch': 0.25} {'loss': 0.872, 'learning_rate': 1.926380564821702e-05, 'epoch': 0.25} {'loss': 0.9395, 'learning_rate': 1.9263682366365555e-05, 'epoch': 0.25} {'loss': 0.8458, 'learning_rate': 1.926355907458722e-05, 'epoch': 0.25} {'loss': 0.8093, 'learning_rate': 1.9263435772882143e-05, 'epoch': 0.25} {'loss': 0.937, 'learning_rate': 1.9263312461250462e-05, 'epoch': 0.25} {'loss': 1.0907, 'learning_rate': 1.9263189139692303e-05, 'epoch': 0.25} {'loss': 1.1114, 'learning_rate': 1.9263065808207803e-05, 'epoch': 0.25} {'loss': 0.947, 'learning_rate': 1.926294246679709e-05, 'epoch': 0.25} {'loss': 0.9141, 'learning_rate': 1.9262819115460298e-05, 'epoch': 0.25} {'loss': 0.8688, 'learning_rate': 1.926269575419756e-05, 'epoch': 0.25} {'loss': 1.004, 'learning_rate': 1.9262572383009008e-05, 'epoch': 0.25} {'loss': 0.7964, 'learning_rate': 1.9262449001894773e-05, 'epoch': 0.25} {'loss': 1.0302, 'learning_rate': 1.926232561085499e-05, 'epoch': 0.25} {'loss': 0.9422, 'learning_rate': 1.9262202209889786e-05, 'epoch': 0.25} {'loss': 0.799, 'learning_rate': 1.9262078798999297e-05, 'epoch': 0.25} {'loss': 0.9128, 'learning_rate': 1.9261955378183653e-05, 'epoch': 0.25} {'loss': 0.7585, 'learning_rate': 1.926183194744299e-05, 'epoch': 0.25} {'loss': 0.9186, 'learning_rate': 1.9261708506777438e-05, 'epoch': 0.25} {'loss': 0.962, 'learning_rate': 1.9261585056187132e-05, 'epoch': 0.25} {'loss': 0.8058, 'learning_rate': 1.92614615956722e-05, 'epoch': 0.25} {'loss': 1.0631, 'learning_rate': 1.9261338125232773e-05, 'epoch': 0.25} {'loss': 0.9294, 'learning_rate': 1.9261214644868988e-05, 'epoch': 0.25} {'loss': 0.7923, 'learning_rate': 1.9261091154580978e-05, 'epoch': 0.25} {'loss': 0.9085, 'learning_rate': 1.9260967654368873e-05, 'epoch': 0.25} {'loss': 0.9193, 'learning_rate': 1.92608441442328e-05, 'epoch': 0.25} {'loss': 0.8686, 'learning_rate': 1.9260720624172902e-05, 'epoch': 0.25} {'loss': 0.9729, 'learning_rate': 1.9260597094189303e-05, 'epoch': 0.25} {'loss': 0.6688, 'learning_rate': 1.9260473554282137e-05, 'epoch': 0.25} {'loss': 0.8196, 'learning_rate': 1.9260350004451544e-05, 'epoch': 0.25} {'loss': 0.8984, 'learning_rate': 1.9260226444697644e-05, 'epoch': 0.25} {'loss': 0.9125, 'learning_rate': 1.926010287502058e-05, 'epoch': 0.25} {'loss': 1.15, 'learning_rate': 1.925997929542048e-05, 'epoch': 0.25} {'loss': 0.8381, 'learning_rate': 1.925985570589747e-05, 'epoch': 0.25} {'loss': 0.8874, 'learning_rate': 1.9259732106451695e-05, 'epoch': 0.25} {'loss': 0.9305, 'learning_rate': 1.925960849708328e-05, 'epoch': 0.25} {'loss': 0.8812, 'learning_rate': 1.925948487779236e-05, 'epoch': 0.25} {'loss': 0.9137, 'learning_rate': 1.925936124857906e-05, 'epoch': 0.25} {'loss': 0.9583, 'learning_rate': 1.9259237609443527e-05, 'epoch': 0.25} {'loss': 0.747, 'learning_rate': 1.925911396038588e-05, 'epoch': 0.25} {'loss': 0.9722, 'learning_rate': 1.9258990301406258e-05, 'epoch': 0.25} {'loss': 1.037, 'learning_rate': 1.9258866632504794e-05, 'epoch': 0.25} {'loss': 0.9017, 'learning_rate': 1.9258742953681616e-05, 'epoch': 0.25} {'loss': 0.7503, 'learning_rate': 1.9258619264936863e-05, 'epoch': 0.25} {'loss': 1.0462, 'learning_rate': 1.9258495566270658e-05, 'epoch': 0.25} {'loss': 0.857, 'learning_rate': 1.9258371857683142e-05, 'epoch': 0.25} {'loss': 0.853, 'learning_rate': 1.9258248139174448e-05, 'epoch': 0.25} {'loss': 0.861, 'learning_rate': 1.92581244107447e-05, 'epoch': 0.25} {'loss': 0.8357, 'learning_rate': 1.9258000672394043e-05, 'epoch': 0.25} {'loss': 0.7192, 'learning_rate': 1.9257876924122597e-05, 'epoch': 0.25} {'loss': 0.9846, 'learning_rate': 1.9257753165930504e-05, 'epoch': 0.25} {'loss': 0.8854, 'learning_rate': 1.925762939781789e-05, 'epoch': 0.25} {'loss': 0.7616, 'learning_rate': 1.925750561978489e-05, 'epoch': 0.25} {'loss': 0.8276, 'learning_rate': 1.9257381831831638e-05, 'epoch': 0.25} {'loss': 0.9727, 'learning_rate': 1.9257258033958267e-05, 'epoch': 0.25} {'loss': 0.9229, 'learning_rate': 1.9257134226164907e-05, 'epoch': 0.25} {'loss': 0.8179, 'learning_rate': 1.9257010408451697e-05, 'epoch': 0.25} {'loss': 0.8023, 'learning_rate': 1.925688658081876e-05, 'epoch': 0.25} {'loss': 0.7271, 'learning_rate': 1.9256762743266235e-05, 'epoch': 0.25} {'loss': 1.0722, 'learning_rate': 1.9256638895794254e-05, 'epoch': 0.25} {'loss': 0.9317, 'learning_rate': 1.9256515038402948e-05, 'epoch': 0.25} {'loss': 0.8773, 'learning_rate': 1.925639117109245e-05, 'epoch': 0.25} {'loss': 0.8154, 'learning_rate': 1.9256267293862892e-05, 'epoch': 0.25} {'loss': 1.059, 'learning_rate': 1.925614340671441e-05, 'epoch': 0.25} {'loss': 0.8785, 'learning_rate': 1.9256019509647136e-05, 'epoch': 0.25} {'loss': 1.0447, 'learning_rate': 1.9255895602661204e-05, 'epoch': 0.25} {'loss': 0.8942, 'learning_rate': 1.925577168575674e-05, 'epoch': 0.25} {'loss': 0.857, 'learning_rate': 1.925564775893388e-05, 'epoch': 0.25} {'loss': 0.8518, 'learning_rate': 1.9255523822192763e-05, 'epoch': 0.25} {'loss': 0.9308, 'learning_rate': 1.9255399875533515e-05, 'epoch': 0.25} {'loss': 0.9391, 'learning_rate': 1.925527591895627e-05, 'epoch': 0.25} {'loss': 0.8676, 'learning_rate': 1.925515195246116e-05, 'epoch': 0.25} {'loss': 0.9138, 'learning_rate': 1.925502797604832e-05, 'epoch': 0.25} {'loss': 0.9156, 'learning_rate': 1.9254903989717886e-05, 'epoch': 0.25} {'loss': 0.7375, 'learning_rate': 1.9254779993469982e-05, 'epoch': 0.25} {'loss': 0.9654, 'learning_rate': 1.9254655987304748e-05, 'epoch': 0.25} {'loss': 0.8294, 'learning_rate': 1.9254531971222317e-05, 'epoch': 0.25} {'loss': 0.7435, 'learning_rate': 1.9254407945222818e-05, 'epoch': 0.25} {'loss': 0.7831, 'learning_rate': 1.9254283909306382e-05, 'epoch': 0.25} {'loss': 0.8742, 'learning_rate': 1.9254159863473153e-05, 'epoch': 0.25} {'loss': 0.9974, 'learning_rate': 1.925403580772325e-05, 'epoch': 0.25} {'loss': 0.8069, 'learning_rate': 1.9253911742056816e-05, 'epoch': 0.25} {'loss': 1.0027, 'learning_rate': 1.925378766647398e-05, 'epoch': 0.25} {'loss': 0.835, 'learning_rate': 1.9253663580974874e-05, 'epoch': 0.25} {'loss': 0.8946, 'learning_rate': 1.9253539485559633e-05, 'epoch': 0.25} {'loss': 0.8713, 'learning_rate': 1.925341538022839e-05, 'epoch': 0.25} {'loss': 0.869, 'learning_rate': 1.9253291264981274e-05, 'epoch': 0.25} {'loss': 0.7675, 'learning_rate': 1.925316713981842e-05, 'epoch': 0.25} {'loss': 0.7617, 'learning_rate': 1.9253043004739967e-05, 'epoch': 0.25} {'loss': 0.7842, 'learning_rate': 1.9252918859746044e-05, 'epoch': 0.25} {'loss': 0.9887, 'learning_rate': 1.9252794704836783e-05, 'epoch': 0.25} {'loss': 0.8426, 'learning_rate': 1.9252670540012314e-05, 'epoch': 0.25} {'loss': 0.8668, 'learning_rate': 1.9252546365272775e-05, 'epoch': 0.25} {'loss': 0.8019, 'learning_rate': 1.9252422180618296e-05, 'epoch': 0.25} {'loss': 0.6771, 'learning_rate': 1.9252297986049015e-05, 'epoch': 0.25} {'loss': 0.9341, 'learning_rate': 1.9252173781565057e-05, 'epoch': 0.25} {'loss': 0.7255, 'learning_rate': 1.9252049567166565e-05, 'epoch': 0.25} {'loss': 1.0738, 'learning_rate': 1.9251925342853664e-05, 'epoch': 0.25} {'loss': 1.0964, 'learning_rate': 1.925180110862649e-05, 'epoch': 0.25} {'loss': 0.9549, 'learning_rate': 1.925167686448518e-05, 'epoch': 0.25} {'loss': 0.8907, 'learning_rate': 1.9251552610429858e-05, 'epoch': 0.25} {'loss': 0.8034, 'learning_rate': 1.9251428346460663e-05, 'epoch': 0.25} {'loss': 0.837, 'learning_rate': 1.9251304072577727e-05, 'epoch': 0.25} {'loss': 0.9826, 'learning_rate': 1.9251179788781186e-05, 'epoch': 0.25} {'loss': 0.8528, 'learning_rate': 1.925105549507117e-05, 'epoch': 0.25} {'loss': 0.8574, 'learning_rate': 1.9250931191447814e-05, 'epoch': 0.25} {'loss': 0.8467, 'learning_rate': 1.925080687791125e-05, 'epoch': 0.25} {'loss': 0.936, 'learning_rate': 1.9250682554461607e-05, 'epoch': 0.25} {'loss': 0.9581, 'learning_rate': 1.9250558221099028e-05, 'epoch': 0.25} {'loss': 1.0431, 'learning_rate': 1.9250433877823643e-05, 'epoch': 0.25} {'loss': 1.0058, 'learning_rate': 1.9250309524635578e-05, 'epoch': 0.25} {'loss': 0.8656, 'learning_rate': 1.9250185161534973e-05, 'epoch': 0.25} {'loss': 0.848, 'learning_rate': 1.925006078852196e-05, 'epoch': 0.25} {'loss': 0.9175, 'learning_rate': 1.9249936405596674e-05, 'epoch': 0.25} {'loss': 0.922, 'learning_rate': 1.9249812012759243e-05, 'epoch': 0.25} {'loss': 0.9844, 'learning_rate': 1.9249687610009806e-05, 'epoch': 0.25} {'loss': 0.8739, 'learning_rate': 1.924956319734849e-05, 'epoch': 0.25} {'loss': 0.8622, 'learning_rate': 1.9249438774775436e-05, 'epoch': 0.25} {'loss': 1.0162, 'learning_rate': 1.924931434229077e-05, 'epoch': 0.25} {'loss': 0.891, 'learning_rate': 1.9249189899894632e-05, 'epoch': 0.25} {'loss': 0.877, 'learning_rate': 1.924906544758715e-05, 'epoch': 0.25} {'loss': 0.9563, 'learning_rate': 1.9248940985368465e-05, 'epoch': 0.25} {'loss': 1.0825, 'learning_rate': 1.92488165132387e-05, 'epoch': 0.25} {'loss': 0.8582, 'learning_rate': 1.9248692031197994e-05, 'epoch': 0.25} {'loss': 1.0379, 'learning_rate': 1.924856753924648e-05, 'epoch': 0.25} {'loss': 0.9183, 'learning_rate': 1.924844303738429e-05, 'epoch': 0.25} {'loss': 0.9383, 'learning_rate': 1.9248318525611563e-05, 'epoch': 0.25} {'loss': 0.8466, 'learning_rate': 1.9248194003928424e-05, 'epoch': 0.25} {'loss': 0.7789, 'learning_rate': 1.9248069472335012e-05, 'epoch': 0.25} {'loss': 0.8396, 'learning_rate': 1.9247944930831458e-05, 'epoch': 0.25} {'loss': 0.8219, 'learning_rate': 1.9247820379417896e-05, 'epoch': 0.25} {'loss': 0.8451, 'learning_rate': 1.924769581809446e-05, 'epoch': 0.25} {'loss': 0.9232, 'learning_rate': 1.9247571246861284e-05, 'epoch': 0.25} {'loss': 0.7874, 'learning_rate': 1.92474466657185e-05, 'epoch': 0.25} {'loss': 0.735, 'learning_rate': 1.9247322074666244e-05, 'epoch': 0.25} {'loss': 0.7412, 'learning_rate': 1.9247197473704646e-05, 'epoch': 0.25} {'loss': 0.9323, 'learning_rate': 1.9247072862833843e-05, 'epoch': 0.25} {'loss': 0.8662, 'learning_rate': 1.9246948242053964e-05, 'epoch': 0.25} {'loss': 0.9654, 'learning_rate': 1.924682361136515e-05, 'epoch': 0.25} {'loss': 0.8781, 'learning_rate': 1.9246698970767525e-05, 'epoch': 0.25} {'loss': 0.8477, 'learning_rate': 1.9246574320261228e-05, 'epoch': 0.25} {'loss': 0.9943, 'learning_rate': 1.9246449659846394e-05, 'epoch': 0.25} {'loss': 0.896, 'learning_rate': 1.9246324989523155e-05, 'epoch': 0.25} {'loss': 0.8463, 'learning_rate': 1.9246200309291643e-05, 'epoch': 0.25} {'loss': 1.0747, 'learning_rate': 1.9246075619151994e-05, 'epoch': 0.25} {'loss': 0.9419, 'learning_rate': 1.9245950919104336e-05, 'epoch': 0.25} {'loss': 0.9004, 'learning_rate': 1.9245826209148812e-05, 'epoch': 0.25} {'loss': 0.9963, 'learning_rate': 1.924570148928555e-05, 'epoch': 0.25} {'loss': 0.9265, 'learning_rate': 1.9245576759514683e-05, 'epoch': 0.25} {'loss': 0.9487, 'learning_rate': 1.9245452019836345e-05, 'epoch': 0.25} {'loss': 0.8099, 'learning_rate': 1.9245327270250677e-05, 'epoch': 0.25} {'loss': 1.0472, 'learning_rate': 1.92452025107578e-05, 'epoch': 0.25} {'loss': 0.9874, 'learning_rate': 1.9245077741357856e-05, 'epoch': 0.25} {'loss': 0.855, 'learning_rate': 1.9244952962050977e-05, 'epoch': 0.25} {'loss': 0.7972, 'learning_rate': 1.9244828172837296e-05, 'epoch': 0.25} {'loss': 0.828, 'learning_rate': 1.9244703373716947e-05, 'epoch': 0.25} {'loss': 0.97, 'learning_rate': 1.9244578564690064e-05, 'epoch': 0.25} {'loss': 0.8297, 'learning_rate': 1.9244453745756782e-05, 'epoch': 0.25} {'loss': 0.8899, 'learning_rate': 1.9244328916917232e-05, 'epoch': 0.25} {'loss': 0.9252, 'learning_rate': 1.9244204078171548e-05, 'epoch': 0.25} {'loss': 0.7243, 'learning_rate': 1.924407922951987e-05, 'epoch': 0.25} {'loss': 0.8804, 'learning_rate': 1.9243954370962323e-05, 'epoch': 0.25} {'loss': 1.1621, 'learning_rate': 1.9243829502499046e-05, 'epoch': 0.25} {'loss': 0.8514, 'learning_rate': 1.924370462413017e-05, 'epoch': 0.25} {'loss': 0.7579, 'learning_rate': 1.924357973585583e-05, 'epoch': 0.25} {'loss': 0.8999, 'learning_rate': 1.924345483767616e-05, 'epoch': 0.25} {'loss': 0.7602, 'learning_rate': 1.9243329929591296e-05, 'epoch': 0.25} {'loss': 0.9144, 'learning_rate': 1.924320501160137e-05, 'epoch': 0.25} {'loss': 0.8972, 'learning_rate': 1.924308008370651e-05, 'epoch': 0.25} {'loss': 0.7985, 'learning_rate': 1.9242955145906862e-05, 'epoch': 0.25} {'loss': 1.1493, 'learning_rate': 1.924283019820255e-05, 'epoch': 0.25} {'loss': 0.9049, 'learning_rate': 1.924270524059371e-05, 'epoch': 0.25} {'loss': 0.8203, 'learning_rate': 1.924258027308048e-05, 'epoch': 0.25} {'loss': 0.8747, 'learning_rate': 1.924245529566299e-05, 'epoch': 0.25} {'loss': 0.9057, 'learning_rate': 1.9242330308341378e-05, 'epoch': 0.25} {'loss': 1.0191, 'learning_rate': 1.9242205311115768e-05, 'epoch': 0.25} {'loss': 0.9464, 'learning_rate': 1.9242080303986307e-05, 'epoch': 0.25} {'loss': 1.0344, 'learning_rate': 1.924195528695312e-05, 'epoch': 0.25} {'loss': 0.9464, 'learning_rate': 1.9241830260016345e-05, 'epoch': 0.25} {'loss': 0.8641, 'learning_rate': 1.924170522317611e-05, 'epoch': 0.25} {'loss': 0.8593, 'learning_rate': 1.9241580176432563e-05, 'epoch': 0.25} {'loss': 0.8109, 'learning_rate': 1.9241455119785823e-05, 'epoch': 0.26} {'loss': 0.955, 'learning_rate': 1.9241330053236028e-05, 'epoch': 0.26} {'loss': 0.8924, 'learning_rate': 1.924120497678332e-05, 'epoch': 0.26} {'loss': 0.8972, 'learning_rate': 1.924107989042782e-05, 'epoch': 0.26} {'loss': 0.901, 'learning_rate': 1.924095479416967e-05, 'epoch': 0.26} {'loss': 0.7776, 'learning_rate': 1.924082968800901e-05, 'epoch': 0.26} {'loss': 0.7574, 'learning_rate': 1.9240704571945958e-05, 'epoch': 0.26} {'loss': 0.8301, 'learning_rate': 1.924057944598066e-05, 'epoch': 0.26} {'loss': 0.7858, 'learning_rate': 1.924045431011325e-05, 'epoch': 0.26} {'loss': 1.1044, 'learning_rate': 1.9240329164343855e-05, 'epoch': 0.26} {'loss': 0.798, 'learning_rate': 1.9240204008672615e-05, 'epoch': 0.26} {'loss': 0.8875, 'learning_rate': 1.9240078843099664e-05, 'epoch': 0.26} {'loss': 0.9423, 'learning_rate': 1.923995366762513e-05, 'epoch': 0.26} {'loss': 1.1759, 'learning_rate': 1.923982848224916e-05, 'epoch': 0.26} {'loss': 0.8788, 'learning_rate': 1.9239703286971872e-05, 'epoch': 0.26} {'loss': 0.8662, 'learning_rate': 1.9239578081793412e-05, 'epoch': 0.26} {'loss': 0.7863, 'learning_rate': 1.9239452866713907e-05, 'epoch': 0.26} {'loss': 0.7991, 'learning_rate': 1.9239327641733497e-05, 'epoch': 0.26} {'loss': 0.8605, 'learning_rate': 1.9239202406852313e-05, 'epoch': 0.26} {'loss': 0.9029, 'learning_rate': 1.923907716207049e-05, 'epoch': 0.26} {'loss': 0.945, 'learning_rate': 1.923895190738816e-05, 'epoch': 0.26} {'loss': 0.8748, 'learning_rate': 1.923882664280546e-05, 'epoch': 0.26} {'loss': 0.8926, 'learning_rate': 1.9238701368322525e-05, 'epoch': 0.26} {'loss': 0.8242, 'learning_rate': 1.9238576083939488e-05, 'epoch': 0.26} {'loss': 0.8725, 'learning_rate': 1.923845078965648e-05, 'epoch': 0.26} {'loss': 0.8136, 'learning_rate': 1.923832548547364e-05, 'epoch': 0.26} {'loss': 0.8891, 'learning_rate': 1.9238200171391098e-05, 'epoch': 0.26} {'loss': 0.8101, 'learning_rate': 1.9238074847408996e-05, 'epoch': 0.26} {'loss': 0.8568, 'learning_rate': 1.9237949513527458e-05, 'epoch': 0.26} {'loss': 0.8329, 'learning_rate': 1.9237824169746625e-05, 'epoch': 0.26} {'loss': 0.9314, 'learning_rate': 1.923769881606663e-05, 'epoch': 0.26} {'loss': 0.8659, 'learning_rate': 1.923757345248761e-05, 'epoch': 0.26} {'loss': 0.8398, 'learning_rate': 1.923744807900969e-05, 'epoch': 0.26} {'loss': 0.8565, 'learning_rate': 1.9237322695633014e-05, 'epoch': 0.26} {'loss': 0.8899, 'learning_rate': 1.9237197302357712e-05, 'epoch': 0.26} {'loss': 0.9665, 'learning_rate': 1.9237071899183922e-05, 'epoch': 0.26} {'loss': 0.7083, 'learning_rate': 1.9236946486111773e-05, 'epoch': 0.26} {'loss': 0.9084, 'learning_rate': 1.9236821063141403e-05, 'epoch': 0.26} {'loss': 0.8664, 'learning_rate': 1.9236695630272945e-05, 'epoch': 0.26} {'loss': 0.8221, 'learning_rate': 1.9236570187506534e-05, 'epoch': 0.26} {'loss': 0.7815, 'learning_rate': 1.9236444734842307e-05, 'epoch': 0.26} {'loss': 0.9144, 'learning_rate': 1.9236319272280394e-05, 'epoch': 0.26} {'loss': 0.797, 'learning_rate': 1.923619379982093e-05, 'epoch': 0.26} {'loss': 0.9881, 'learning_rate': 1.9236068317464052e-05, 'epoch': 0.26} {'loss': 0.8316, 'learning_rate': 1.9235942825209894e-05, 'epoch': 0.26} {'loss': 0.8587, 'learning_rate': 1.923581732305859e-05, 'epoch': 0.26} {'loss': 0.8384, 'learning_rate': 1.9235691811010267e-05, 'epoch': 0.26} {'loss': 0.7683, 'learning_rate': 1.9235566289065077e-05, 'epoch': 0.26} {'loss': 0.885, 'learning_rate': 1.923544075722314e-05, 'epoch': 0.26} {'loss': 0.8203, 'learning_rate': 1.9235315215484592e-05, 'epoch': 0.26} {'loss': 0.9341, 'learning_rate': 1.9235189663849572e-05, 'epoch': 0.26} {'loss': 0.8306, 'learning_rate': 1.9235064102318212e-05, 'epoch': 0.26} {'loss': 0.931, 'learning_rate': 1.923493853089065e-05, 'epoch': 0.26} {'loss': 0.7566, 'learning_rate': 1.9234812949567018e-05, 'epoch': 0.26} {'loss': 0.8596, 'learning_rate': 1.9234687358347448e-05, 'epoch': 0.26} {'loss': 0.8105, 'learning_rate': 1.9234561757232077e-05, 'epoch': 0.26} {'loss': 0.9013, 'learning_rate': 1.9234436146221043e-05, 'epoch': 0.26} {'loss': 0.9259, 'learning_rate': 1.9234310525314473e-05, 'epoch': 0.26} {'loss': 0.8397, 'learning_rate': 1.9234184894512508e-05, 'epoch': 0.26} {'loss': 0.8425, 'learning_rate': 1.9234059253815277e-05, 'epoch': 0.26} {'loss': 0.84, 'learning_rate': 1.9233933603222922e-05, 'epoch': 0.26} {'loss': 1.1231, 'learning_rate': 1.9233807942735573e-05, 'epoch': 0.26} {'loss': 0.8528, 'learning_rate': 1.9233682272353364e-05, 'epoch': 0.26} {'loss': 0.7694, 'learning_rate': 1.9233556592076435e-05, 'epoch': 0.26} {'loss': 1.0235, 'learning_rate': 1.9233430901904914e-05, 'epoch': 0.26} {'loss': 0.9418, 'learning_rate': 1.9233305201838937e-05, 'epoch': 0.26} {'loss': 0.8459, 'learning_rate': 1.9233179491878643e-05, 'epoch': 0.26} {'loss': 0.8083, 'learning_rate': 1.923305377202416e-05, 'epoch': 0.26} {'loss': 0.8353, 'learning_rate': 1.9232928042275628e-05, 'epoch': 0.26} {'loss': 0.8842, 'learning_rate': 1.923280230263318e-05, 'epoch': 0.26} {'loss': 0.8769, 'learning_rate': 1.9232676553096957e-05, 'epoch': 0.26} {'loss': 0.8758, 'learning_rate': 1.9232550793667082e-05, 'epoch': 0.26} {'loss': 0.7602, 'learning_rate': 1.9232425024343694e-05, 'epoch': 0.26} {'loss': 0.8847, 'learning_rate': 1.9232299245126933e-05, 'epoch': 0.26} {'loss': 0.9634, 'learning_rate': 1.923217345601693e-05, 'epoch': 0.26} {'loss': 0.8935, 'learning_rate': 1.9232047657013818e-05, 'epoch': 0.26} {'loss': 0.9586, 'learning_rate': 1.9231921848117734e-05, 'epoch': 0.26} {'loss': 0.8371, 'learning_rate': 1.9231796029328814e-05, 'epoch': 0.26} {'loss': 0.7092, 'learning_rate': 1.923167020064719e-05, 'epoch': 0.26} {'loss': 1.08, 'learning_rate': 1.9231544362072996e-05, 'epoch': 0.26} {'loss': 0.8195, 'learning_rate': 1.9231418513606372e-05, 'epoch': 0.26} {'loss': 0.8874, 'learning_rate': 1.9231292655247447e-05, 'epoch': 0.26} {'loss': 0.7409, 'learning_rate': 1.9231166786996363e-05, 'epoch': 0.26} {'loss': 0.9948, 'learning_rate': 1.9231040908853253e-05, 'epoch': 0.26} {'loss': 0.8334, 'learning_rate': 1.923091502081824e-05, 'epoch': 0.26} {'loss': 0.7966, 'learning_rate': 1.9230789122891476e-05, 'epoch': 0.26} {'loss': 0.9504, 'learning_rate': 1.9230663215073084e-05, 'epoch': 0.26} {'loss': 0.799, 'learning_rate': 1.9230537297363208e-05, 'epoch': 0.26} {'loss': 0.9422, 'learning_rate': 1.9230411369761975e-05, 'epoch': 0.26} {'loss': 0.9492, 'learning_rate': 1.9230285432269523e-05, 'epoch': 0.26} {'loss': 0.8866, 'learning_rate': 1.9230159484885985e-05, 'epoch': 0.26} {'loss': 0.9824, 'learning_rate': 1.92300335276115e-05, 'epoch': 0.26} {'loss': 1.0377, 'learning_rate': 1.9229907560446203e-05, 'epoch': 0.26} {'loss': 1.0484, 'learning_rate': 1.9229781583390227e-05, 'epoch': 0.26} {'loss': 0.9016, 'learning_rate': 1.9229655596443705e-05, 'epoch': 0.26} {'loss': 0.9609, 'learning_rate': 1.9229529599606775e-05, 'epoch': 0.26} {'loss': 0.9463, 'learning_rate': 1.922940359287957e-05, 'epoch': 0.26} {'loss': 1.0522, 'learning_rate': 1.922927757626223e-05, 'epoch': 0.26} {'loss': 0.8001, 'learning_rate': 1.9229151549754877e-05, 'epoch': 0.26} {'loss': 0.8082, 'learning_rate': 1.9229025513357664e-05, 'epoch': 0.26} {'loss': 0.8399, 'learning_rate': 1.9228899467070713e-05, 'epoch': 0.26} {'loss': 0.9544, 'learning_rate': 1.9228773410894166e-05, 'epoch': 0.26} {'loss': 0.7776, 'learning_rate': 1.9228647344828152e-05, 'epoch': 0.26} {'loss': 0.9691, 'learning_rate': 1.922852126887281e-05, 'epoch': 0.26} {'loss': 0.9799, 'learning_rate': 1.9228395183028275e-05, 'epoch': 0.26} {'loss': 1.0634, 'learning_rate': 1.9228269087294686e-05, 'epoch': 0.26} {'loss': 0.9673, 'learning_rate': 1.922814298167217e-05, 'epoch': 0.26} {'loss': 1.0282, 'learning_rate': 1.9228016866160865e-05, 'epoch': 0.26} {'loss': 0.9858, 'learning_rate': 1.9227890740760906e-05, 'epoch': 0.26} {'loss': 0.9836, 'learning_rate': 1.9227764605472433e-05, 'epoch': 0.26} {'loss': 0.9459, 'learning_rate': 1.9227638460295575e-05, 'epoch': 0.26} {'loss': 1.0433, 'learning_rate': 1.922751230523047e-05, 'epoch': 0.26} {'loss': 0.8837, 'learning_rate': 1.9227386140277252e-05, 'epoch': 0.26} {'loss': 1.1371, 'learning_rate': 1.9227259965436057e-05, 'epoch': 0.26} {'loss': 0.9794, 'learning_rate': 1.9227133780707023e-05, 'epoch': 0.26} {'loss': 0.8102, 'learning_rate': 1.9227007586090282e-05, 'epoch': 0.26} {'loss': 1.1522, 'learning_rate': 1.9226881381585966e-05, 'epoch': 0.26} {'loss': 0.8408, 'learning_rate': 1.9226755167194214e-05, 'epoch': 0.26} {'loss': 0.9487, 'learning_rate': 1.9226628942915166e-05, 'epoch': 0.26} {'loss': 0.8582, 'learning_rate': 1.9226502708748945e-05, 'epoch': 0.26} {'loss': 0.9191, 'learning_rate': 1.92263764646957e-05, 'epoch': 0.26} {'loss': 0.8525, 'learning_rate': 1.9226250210755556e-05, 'epoch': 0.26} {'loss': 0.9852, 'learning_rate': 1.9226123946928657e-05, 'epoch': 0.26} {'loss': 0.8335, 'learning_rate': 1.922599767321513e-05, 'epoch': 0.26} {'loss': 0.9676, 'learning_rate': 1.9225871389615114e-05, 'epoch': 0.26} {'loss': 0.6732, 'learning_rate': 1.9225745096128744e-05, 'epoch': 0.26} {'loss': 0.9656, 'learning_rate': 1.9225618792756157e-05, 'epoch': 0.26} {'loss': 1.1426, 'learning_rate': 1.9225492479497483e-05, 'epoch': 0.26} {'loss': 0.8193, 'learning_rate': 1.9225366156352864e-05, 'epoch': 0.26} {'loss': 0.8462, 'learning_rate': 1.9225239823322432e-05, 'epoch': 0.26} {'loss': 0.9797, 'learning_rate': 1.9225113480406322e-05, 'epoch': 0.26} {'loss': 1.0269, 'learning_rate': 1.9224987127604674e-05, 'epoch': 0.26} {'loss': 0.9223, 'learning_rate': 1.9224860764917616e-05, 'epoch': 0.26} {'loss': 0.8728, 'learning_rate': 1.9224734392345287e-05, 'epoch': 0.26} {'loss': 0.8902, 'learning_rate': 1.9224608009887823e-05, 'epoch': 0.26} {'loss': 0.7495, 'learning_rate': 1.922448161754536e-05, 'epoch': 0.26} {'loss': 1.0779, 'learning_rate': 1.922435521531803e-05, 'epoch': 0.26} {'loss': 0.8631, 'learning_rate': 1.9224228803205973e-05, 'epoch': 0.26} {'loss': 0.7934, 'learning_rate': 1.9224102381209323e-05, 'epoch': 0.26} {'loss': 0.9028, 'learning_rate': 1.9223975949328214e-05, 'epoch': 0.26} {'loss': 0.7832, 'learning_rate': 1.922384950756278e-05, 'epoch': 0.26} {'loss': 0.9728, 'learning_rate': 1.9223723055913163e-05, 'epoch': 0.26} {'loss': 0.7089, 'learning_rate': 1.922359659437949e-05, 'epoch': 0.26} {'loss': 0.9362, 'learning_rate': 1.9223470122961904e-05, 'epoch': 0.26} {'loss': 0.8926, 'learning_rate': 1.9223343641660536e-05, 'epoch': 0.26} {'loss': 0.8757, 'learning_rate': 1.922321715047552e-05, 'epoch': 0.26} {'loss': 0.8735, 'learning_rate': 1.9223090649407e-05, 'epoch': 0.26} {'loss': 0.7746, 'learning_rate': 1.92229641384551e-05, 'epoch': 0.26} {'loss': 0.9016, 'learning_rate': 1.922283761761997e-05, 'epoch': 0.26} {'loss': 0.8517, 'learning_rate': 1.922271108690173e-05, 'epoch': 0.26} {'loss': 0.8778, 'learning_rate': 1.9222584546300524e-05, 'epoch': 0.26} {'loss': 1.0296, 'learning_rate': 1.9222457995816487e-05, 'epoch': 0.26} {'loss': 0.9615, 'learning_rate': 1.9222331435449754e-05, 'epoch': 0.26} {'loss': 0.8375, 'learning_rate': 1.922220486520046e-05, 'epoch': 0.26} {'loss': 0.907, 'learning_rate': 1.9222078285068742e-05, 'epoch': 0.26} {'loss': 0.8387, 'learning_rate': 1.9221951695054734e-05, 'epoch': 0.26} {'loss': 0.8043, 'learning_rate': 1.922182509515857e-05, 'epoch': 0.26} {'loss': 0.8007, 'learning_rate': 1.9221698485380393e-05, 'epoch': 0.26} {'loss': 0.945, 'learning_rate': 1.922157186572033e-05, 'epoch': 0.26} {'loss': 0.915, 'learning_rate': 1.922144523617852e-05, 'epoch': 0.26} {'loss': 0.8762, 'learning_rate': 1.9221318596755102e-05, 'epoch': 0.26} {'loss': 0.7717, 'learning_rate': 1.922119194745021e-05, 'epoch': 0.26} {'loss': 0.9321, 'learning_rate': 1.9221065288263976e-05, 'epoch': 0.26} {'loss': 0.756, 'learning_rate': 1.922093861919654e-05, 'epoch': 0.26} {'loss': 0.8503, 'learning_rate': 1.9220811940248033e-05, 'epoch': 0.26} {'loss': 0.8388, 'learning_rate': 1.9220685251418592e-05, 'epoch': 0.26} {'loss': 1.0044, 'learning_rate': 1.922055855270836e-05, 'epoch': 0.26} {'loss': 0.8947, 'learning_rate': 1.9220431844117468e-05, 'epoch': 0.26} {'loss': 0.8443, 'learning_rate': 1.9220305125646045e-05, 'epoch': 0.26} {'loss': 0.683, 'learning_rate': 1.9220178397294237e-05, 'epoch': 0.26} {'loss': 0.9227, 'learning_rate': 1.9220051659062176e-05, 'epoch': 0.26} {'loss': 1.1861, 'learning_rate': 1.9219924910949997e-05, 'epoch': 0.26} {'loss': 1.0299, 'learning_rate': 1.9219798152957833e-05, 'epoch': 0.26} {'loss': 0.8565, 'learning_rate': 1.921967138508583e-05, 'epoch': 0.26} {'loss': 0.9258, 'learning_rate': 1.921954460733411e-05, 'epoch': 0.26} {'loss': 0.7851, 'learning_rate': 1.921941781970282e-05, 'epoch': 0.26} {'loss': 0.8644, 'learning_rate': 1.9219291022192087e-05, 'epoch': 0.26} {'loss': 1.043, 'learning_rate': 1.921916421480206e-05, 'epoch': 0.26} {'loss': 0.8815, 'learning_rate': 1.921903739753286e-05, 'epoch': 0.26} {'loss': 0.9441, 'learning_rate': 1.921891057038463e-05, 'epoch': 0.26} {'loss': 0.7396, 'learning_rate': 1.9218783733357504e-05, 'epoch': 0.26} {'loss': 0.963, 'learning_rate': 1.9218656886451624e-05, 'epoch': 0.26} {'loss': 0.8594, 'learning_rate': 1.9218530029667117e-05, 'epoch': 0.26} {'loss': 0.9002, 'learning_rate': 1.9218403163004125e-05, 'epoch': 0.26} {'loss': 1.0572, 'learning_rate': 1.921827628646278e-05, 'epoch': 0.26} {'loss': 0.9691, 'learning_rate': 1.921814940004322e-05, 'epoch': 0.26} {'loss': 0.8196, 'learning_rate': 1.9218022503745583e-05, 'epoch': 0.26} {'loss': 0.8655, 'learning_rate': 1.9217895597570005e-05, 'epoch': 0.26} {'loss': 1.023, 'learning_rate': 1.9217768681516614e-05, 'epoch': 0.26} {'loss': 0.763, 'learning_rate': 1.9217641755585555e-05, 'epoch': 0.26} {'loss': 0.8419, 'learning_rate': 1.921751481977696e-05, 'epoch': 0.26} {'loss': 0.8485, 'learning_rate': 1.921738787409097e-05, 'epoch': 0.26} {'loss': 0.823, 'learning_rate': 1.9217260918527712e-05, 'epoch': 0.26} {'loss': 0.7992, 'learning_rate': 1.921713395308733e-05, 'epoch': 0.26} {'loss': 1.0842, 'learning_rate': 1.9217006977769954e-05, 'epoch': 0.26} {'loss': 0.7923, 'learning_rate': 1.9216879992575727e-05, 'epoch': 0.26} {'loss': 0.8658, 'learning_rate': 1.921675299750478e-05, 'epoch': 0.26} {'loss': 0.9006, 'learning_rate': 1.9216625992557246e-05, 'epoch': 0.26} {'loss': 1.0129, 'learning_rate': 1.921649897773327e-05, 'epoch': 0.26} {'loss': 0.9111, 'learning_rate': 1.9216371953032983e-05, 'epoch': 0.26} {'loss': 1.0247, 'learning_rate': 1.921624491845652e-05, 'epoch': 0.26} {'loss': 0.9057, 'learning_rate': 1.921611787400402e-05, 'epoch': 0.26} {'loss': 0.864, 'learning_rate': 1.921599081967562e-05, 'epoch': 0.26} {'loss': 0.7682, 'learning_rate': 1.9215863755471453e-05, 'epoch': 0.26} {'loss': 0.9127, 'learning_rate': 1.921573668139165e-05, 'epoch': 0.26} {'loss': 0.7546, 'learning_rate': 1.9215609597436364e-05, 'epoch': 0.26} {'loss': 0.8751, 'learning_rate': 1.9215482503605712e-05, 'epoch': 0.26} {'loss': 0.9077, 'learning_rate': 1.921535539989984e-05, 'epoch': 0.26} {'loss': 0.8351, 'learning_rate': 1.9215228286318886e-05, 'epoch': 0.26} {'loss': 0.8925, 'learning_rate': 1.921510116286298e-05, 'epoch': 0.26} {'loss': 0.6734, 'learning_rate': 1.9214974029532265e-05, 'epoch': 0.26} {'loss': 1.0003, 'learning_rate': 1.921484688632687e-05, 'epoch': 0.26} {'loss': 0.8749, 'learning_rate': 1.921471973324694e-05, 'epoch': 0.26} {'loss': 0.9397, 'learning_rate': 1.92145925702926e-05, 'epoch': 0.26} {'loss': 0.9806, 'learning_rate': 1.9214465397463995e-05, 'epoch': 0.26} {'loss': 0.958, 'learning_rate': 1.921433821476126e-05, 'epoch': 0.26} {'loss': 1.005, 'learning_rate': 1.9214211022184528e-05, 'epoch': 0.26} {'loss': 0.9631, 'learning_rate': 1.921408381973394e-05, 'epoch': 0.26} {'loss': 0.9872, 'learning_rate': 1.9213956607409626e-05, 'epoch': 0.26} {'loss': 0.9569, 'learning_rate': 1.9213829385211728e-05, 'epoch': 0.26} {'loss': 0.9272, 'learning_rate': 1.921370215314038e-05, 'epoch': 0.26} {'loss': 0.9835, 'learning_rate': 1.9213574911195717e-05, 'epoch': 0.26} {'loss': 0.8898, 'learning_rate': 1.9213447659377877e-05, 'epoch': 0.26} {'loss': 0.7922, 'learning_rate': 1.9213320397687e-05, 'epoch': 0.26} {'loss': 0.8481, 'learning_rate': 1.9213193126123214e-05, 'epoch': 0.26} {'loss': 0.8243, 'learning_rate': 1.921306584468666e-05, 'epoch': 0.26} {'loss': 0.845, 'learning_rate': 1.9212938553377478e-05, 'epoch': 0.26} {'loss': 0.8692, 'learning_rate': 1.92128112521958e-05, 'epoch': 0.26} {'loss': 0.7786, 'learning_rate': 1.9212683941141764e-05, 'epoch': 0.26} {'loss': 0.8204, 'learning_rate': 1.9212556620215504e-05, 'epoch': 0.26} {'loss': 0.958, 'learning_rate': 1.9212429289417157e-05, 'epoch': 0.26} {'loss': 0.9474, 'learning_rate': 1.9212301948746864e-05, 'epoch': 0.26} {'loss': 0.839, 'learning_rate': 1.9212174598204755e-05, 'epoch': 0.26} {'loss': 0.9597, 'learning_rate': 1.9212047237790968e-05, 'epoch': 0.26} {'loss': 0.8834, 'learning_rate': 1.9211919867505646e-05, 'epoch': 0.26} {'loss': 0.9047, 'learning_rate': 1.9211792487348913e-05, 'epoch': 0.26} {'loss': 1.0143, 'learning_rate': 1.9211665097320923e-05, 'epoch': 0.26} {'loss': 1.0158, 'learning_rate': 1.9211537697421794e-05, 'epoch': 0.26} {'loss': 0.9053, 'learning_rate': 1.9211410287651672e-05, 'epoch': 0.26} {'loss': 0.7822, 'learning_rate': 1.92112828680107e-05, 'epoch': 0.26} {'loss': 0.8978, 'learning_rate': 1.9211155438499e-05, 'epoch': 0.26} {'loss': 0.8105, 'learning_rate': 1.9211027999116717e-05, 'epoch': 0.26} {'loss': 0.8859, 'learning_rate': 1.9210900549863987e-05, 'epoch': 0.26} {'loss': 0.8822, 'learning_rate': 1.9210773090740944e-05, 'epoch': 0.26} {'loss': 0.9783, 'learning_rate': 1.9210645621747725e-05, 'epoch': 0.26} {'loss': 0.9286, 'learning_rate': 1.921051814288447e-05, 'epoch': 0.26} {'loss': 1.1306, 'learning_rate': 1.9210390654151315e-05, 'epoch': 0.26} {'loss': 0.9801, 'learning_rate': 1.9210263155548395e-05, 'epoch': 0.26} {'loss': 0.8678, 'learning_rate': 1.9210135647075845e-05, 'epoch': 0.26} {'loss': 0.8423, 'learning_rate': 1.9210008128733805e-05, 'epoch': 0.26} {'loss': 0.9422, 'learning_rate': 1.9209880600522408e-05, 'epoch': 0.26} {'loss': 1.0523, 'learning_rate': 1.9209753062441793e-05, 'epoch': 0.26} {'loss': 0.9742, 'learning_rate': 1.92096255144921e-05, 'epoch': 0.26} {'loss': 0.8452, 'learning_rate': 1.9209497956673456e-05, 'epoch': 0.26} {'loss': 0.8059, 'learning_rate': 1.9209370388986007e-05, 'epoch': 0.26} {'loss': 0.8851, 'learning_rate': 1.9209242811429886e-05, 'epoch': 0.26} {'loss': 0.9628, 'learning_rate': 1.9209115224005232e-05, 'epoch': 0.26} {'loss': 0.9562, 'learning_rate': 1.9208987626712176e-05, 'epoch': 0.26} {'loss': 0.9455, 'learning_rate': 1.9208860019550864e-05, 'epoch': 0.26} {'loss': 1.0667, 'learning_rate': 1.9208732402521422e-05, 'epoch': 0.26} {'loss': 0.828, 'learning_rate': 1.9208604775623992e-05, 'epoch': 0.26} {'loss': 0.8303, 'learning_rate': 1.9208477138858717e-05, 'epoch': 0.26} {'loss': 0.7292, 'learning_rate': 1.9208349492225724e-05, 'epoch': 0.26} {'loss': 0.9916, 'learning_rate': 1.920822183572515e-05, 'epoch': 0.26} {'loss': 1.0214, 'learning_rate': 1.920809416935714e-05, 'epoch': 0.26} {'loss': 0.8542, 'learning_rate': 1.9207966493121826e-05, 'epoch': 0.26} {'loss': 0.9061, 'learning_rate': 1.9207838807019345e-05, 'epoch': 0.26} {'loss': 0.8744, 'learning_rate': 1.920771111104983e-05, 'epoch': 0.26} {'loss': 1.1402, 'learning_rate': 1.9207583405213422e-05, 'epoch': 0.26} {'loss': 0.9301, 'learning_rate': 1.920745568951026e-05, 'epoch': 0.26} {'loss': 1.0873, 'learning_rate': 1.9207327963940477e-05, 'epoch': 0.26} {'loss': 0.9151, 'learning_rate': 1.920720022850421e-05, 'epoch': 0.26} {'loss': 0.7494, 'learning_rate': 1.9207072483201598e-05, 'epoch': 0.26} {'loss': 0.8865, 'learning_rate': 1.9206944728032778e-05, 'epoch': 0.26} {'loss': 0.8446, 'learning_rate': 1.9206816962997884e-05, 'epoch': 0.26} {'loss': 0.9925, 'learning_rate': 1.9206689188097053e-05, 'epoch': 0.26} {'loss': 0.9187, 'learning_rate': 1.920656140333043e-05, 'epoch': 0.26} {'loss': 0.9925, 'learning_rate': 1.9206433608698137e-05, 'epoch': 0.26} {'loss': 0.7996, 'learning_rate': 1.9206305804200327e-05, 'epoch': 0.26} {'loss': 0.8595, 'learning_rate': 1.9206177989837128e-05, 'epoch': 0.26} {'loss': 0.9219, 'learning_rate': 1.9206050165608676e-05, 'epoch': 0.26} {'loss': 0.9096, 'learning_rate': 1.9205922331515108e-05, 'epoch': 0.26} {'loss': 0.7862, 'learning_rate': 1.9205794487556568e-05, 'epoch': 0.26} {'loss': 0.8802, 'learning_rate': 1.9205666633733187e-05, 'epoch': 0.26} {'loss': 0.9885, 'learning_rate': 1.92055387700451e-05, 'epoch': 0.26} {'loss': 0.9997, 'learning_rate': 1.9205410896492453e-05, 'epoch': 0.26} {'loss': 0.9668, 'learning_rate': 1.9205283013075374e-05, 'epoch': 0.26} {'loss': 0.9132, 'learning_rate': 1.9205155119794003e-05, 'epoch': 0.26} {'loss': 0.9185, 'learning_rate': 1.920502721664848e-05, 'epoch': 0.26} {'loss': 0.9627, 'learning_rate': 1.9204899303638937e-05, 'epoch': 0.26} {'loss': 0.8469, 'learning_rate': 1.9204771380765515e-05, 'epoch': 0.26} {'loss': 0.9193, 'learning_rate': 1.9204643448028347e-05, 'epoch': 0.26} {'loss': 0.857, 'learning_rate': 1.920451550542758e-05, 'epoch': 0.26} {'loss': 1.0155, 'learning_rate': 1.9204387552963338e-05, 'epoch': 0.26} {'loss': 0.7792, 'learning_rate': 1.9204259590635762e-05, 'epoch': 0.26} {'loss': 0.8935, 'learning_rate': 1.9204131618444995e-05, 'epoch': 0.26} {'loss': 0.9761, 'learning_rate': 1.920400363639117e-05, 'epoch': 0.26} {'loss': 0.8809, 'learning_rate': 1.9203875644474423e-05, 'epoch': 0.26} {'loss': 0.9648, 'learning_rate': 1.9203747642694894e-05, 'epoch': 0.26} {'loss': 0.9214, 'learning_rate': 1.9203619631052718e-05, 'epoch': 0.26} {'loss': 0.9143, 'learning_rate': 1.920349160954803e-05, 'epoch': 0.26} {'loss': 1.0169, 'learning_rate': 1.9203363578180975e-05, 'epoch': 0.26} {'loss': 0.8403, 'learning_rate': 1.9203235536951683e-05, 'epoch': 0.26} {'loss': 0.7639, 'learning_rate': 1.9203107485860296e-05, 'epoch': 0.26} {'loss': 0.7907, 'learning_rate': 1.9202979424906948e-05, 'epoch': 0.26} {'loss': 0.8302, 'learning_rate': 1.9202851354091774e-05, 'epoch': 0.26} {'loss': 0.9832, 'learning_rate': 1.9202723273414915e-05, 'epoch': 0.26} {'loss': 0.9125, 'learning_rate': 1.9202595182876508e-05, 'epoch': 0.26} {'loss': 1.1148, 'learning_rate': 1.9202467082476687e-05, 'epoch': 0.26} {'loss': 0.9192, 'learning_rate': 1.92023389722156e-05, 'epoch': 0.26} {'loss': 0.841, 'learning_rate': 1.9202210852093367e-05, 'epoch': 0.26} {'loss': 0.9276, 'learning_rate': 1.920208272211014e-05, 'epoch': 0.26} {'loss': 0.8687, 'learning_rate': 1.9201954582266048e-05, 'epoch': 0.26} {'loss': 0.9611, 'learning_rate': 1.920182643256123e-05, 'epoch': 0.26} {'loss': 1.0802, 'learning_rate': 1.920169827299583e-05, 'epoch': 0.26} {'loss': 1.0967, 'learning_rate': 1.9201570103569975e-05, 'epoch': 0.26} {'loss': 0.8928, 'learning_rate': 1.920144192428381e-05, 'epoch': 0.26} {'loss': 0.9664, 'learning_rate': 1.9201313735137466e-05, 'epoch': 0.26} {'loss': 0.8066, 'learning_rate': 1.9201185536131087e-05, 'epoch': 0.26} {'loss': 0.6682, 'learning_rate': 1.9201057327264807e-05, 'epoch': 0.26} {'loss': 0.9289, 'learning_rate': 1.9200929108538765e-05, 'epoch': 0.26} {'loss': 1.0385, 'learning_rate': 1.9200800879953094e-05, 'epoch': 0.26} {'loss': 0.783, 'learning_rate': 1.9200672641507935e-05, 'epoch': 0.26} {'loss': 0.9643, 'learning_rate': 1.9200544393203425e-05, 'epoch': 0.26} {'loss': 0.878, 'learning_rate': 1.9200416135039702e-05, 'epoch': 0.26} {'loss': 0.951, 'learning_rate': 1.92002878670169e-05, 'epoch': 0.26} {'loss': 0.968, 'learning_rate': 1.920015958913516e-05, 'epoch': 0.26} {'loss': 0.9095, 'learning_rate': 1.9200031301394625e-05, 'epoch': 0.26} {'loss': 0.9132, 'learning_rate': 1.9199903003795416e-05, 'epoch': 0.26} {'loss': 0.9425, 'learning_rate': 1.9199774696337686e-05, 'epoch': 0.26} {'loss': 0.8577, 'learning_rate': 1.919964637902157e-05, 'epoch': 0.26} {'loss': 0.924, 'learning_rate': 1.91995180518472e-05, 'epoch': 0.26} {'loss': 0.8435, 'learning_rate': 1.9199389714814714e-05, 'epoch': 0.26} {'loss': 0.7842, 'learning_rate': 1.9199261367924252e-05, 'epoch': 0.26} {'loss': 0.939, 'learning_rate': 1.9199133011175953e-05, 'epoch': 0.26} {'loss': 0.8982, 'learning_rate': 1.9199004644569953e-05, 'epoch': 0.26} {'loss': 1.069, 'learning_rate': 1.9198876268106386e-05, 'epoch': 0.26} {'loss': 0.9763, 'learning_rate': 1.9198747881785396e-05, 'epoch': 0.26} {'loss': 0.932, 'learning_rate': 1.9198619485607117e-05, 'epoch': 0.26} {'loss': 0.9124, 'learning_rate': 1.919849107957169e-05, 'epoch': 0.26} {'loss': 0.9594, 'learning_rate': 1.9198362663679244e-05, 'epoch': 0.26} {'loss': 0.9043, 'learning_rate': 1.9198234237929923e-05, 'epoch': 0.26} {'loss': 0.8978, 'learning_rate': 1.9198105802323867e-05, 'epoch': 0.26} {'loss': 0.788, 'learning_rate': 1.9197977356861207e-05, 'epoch': 0.26} {'loss': 0.8062, 'learning_rate': 1.9197848901542088e-05, 'epoch': 0.26} {'loss': 0.7933, 'learning_rate': 1.9197720436366637e-05, 'epoch': 0.26} {'loss': 0.9204, 'learning_rate': 1.9197591961335005e-05, 'epoch': 0.26} {'loss': 0.7815, 'learning_rate': 1.919746347644732e-05, 'epoch': 0.26} {'loss': 0.7909, 'learning_rate': 1.9197334981703725e-05, 'epoch': 0.26} {'loss': 1.0329, 'learning_rate': 1.9197206477104355e-05, 'epoch': 0.26} {'loss': 0.8752, 'learning_rate': 1.9197077962649343e-05, 'epoch': 0.26} {'loss': 0.7253, 'learning_rate': 1.919694943833884e-05, 'epoch': 0.26} {'loss': 0.8936, 'learning_rate': 1.919682090417297e-05, 'epoch': 0.26} {'loss': 0.8139, 'learning_rate': 1.9196692360151877e-05, 'epoch': 0.26} {'loss': 0.7799, 'learning_rate': 1.9196563806275698e-05, 'epoch': 0.26} {'loss': 0.9768, 'learning_rate': 1.9196435242544575e-05, 'epoch': 0.26} {'loss': 0.9209, 'learning_rate': 1.9196306668958637e-05, 'epoch': 0.26} {'loss': 0.8232, 'learning_rate': 1.919617808551803e-05, 'epoch': 0.26} {'loss': 0.7369, 'learning_rate': 1.9196049492222885e-05, 'epoch': 0.26} {'loss': 0.7294, 'learning_rate': 1.9195920889073342e-05, 'epoch': 0.26} {'loss': 0.9559, 'learning_rate': 1.9195792276069544e-05, 'epoch': 0.26} {'loss': 1.0296, 'learning_rate': 1.919566365321162e-05, 'epoch': 0.26} {'loss': 0.8639, 'learning_rate': 1.9195535020499717e-05, 'epoch': 0.26} {'loss': 0.8928, 'learning_rate': 1.9195406377933964e-05, 'epoch': 0.26} {'loss': 1.0055, 'learning_rate': 1.919527772551451e-05, 'epoch': 0.26} {'loss': 0.7544, 'learning_rate': 1.9195149063241478e-05, 'epoch': 0.26} {'loss': 0.7091, 'learning_rate': 1.9195020391115017e-05, 'epoch': 0.26} {'loss': 0.8945, 'learning_rate': 1.9194891709135265e-05, 'epoch': 0.26} {'loss': 0.8079, 'learning_rate': 1.9194763017302352e-05, 'epoch': 0.26} {'loss': 0.8207, 'learning_rate': 1.9194634315616423e-05, 'epoch': 0.26} {'loss': 0.8466, 'learning_rate': 1.919450560407761e-05, 'epoch': 0.26} {'loss': 0.7985, 'learning_rate': 1.919437688268606e-05, 'epoch': 0.26} {'loss': 0.9125, 'learning_rate': 1.91942481514419e-05, 'epoch': 0.26} {'loss': 1.0156, 'learning_rate': 1.9194119410345276e-05, 'epoch': 0.26} {'loss': 0.822, 'learning_rate': 1.9193990659396324e-05, 'epoch': 0.26} {'loss': 1.0751, 'learning_rate': 1.919386189859518e-05, 'epoch': 0.26} {'loss': 0.9539, 'learning_rate': 1.919373312794198e-05, 'epoch': 0.26} {'loss': 0.8906, 'learning_rate': 1.9193604347436872e-05, 'epoch': 0.26} {'loss': 0.9069, 'learning_rate': 1.919347555707998e-05, 'epoch': 0.26} {'loss': 0.9566, 'learning_rate': 1.9193346756871457e-05, 'epoch': 0.26} {'loss': 0.9014, 'learning_rate': 1.919321794681143e-05, 'epoch': 0.26} {'loss': 1.1415, 'learning_rate': 1.9193089126900038e-05, 'epoch': 0.26} {'loss': 0.8808, 'learning_rate': 1.919296029713742e-05, 'epoch': 0.26} {'loss': 0.951, 'learning_rate': 1.9192831457523717e-05, 'epoch': 0.26} {'loss': 0.8696, 'learning_rate': 1.919270260805907e-05, 'epoch': 0.26} {'loss': 0.9286, 'learning_rate': 1.9192573748743606e-05, 'epoch': 0.26} {'loss': 0.9472, 'learning_rate': 1.919244487957747e-05, 'epoch': 0.26} {'loss': 0.723, 'learning_rate': 1.9192316000560803e-05, 'epoch': 0.26} {'loss': 0.8019, 'learning_rate': 1.9192187111693742e-05, 'epoch': 0.26} {'loss': 0.7347, 'learning_rate': 1.919205821297642e-05, 'epoch': 0.26} {'loss': 1.0211, 'learning_rate': 1.9191929304408975e-05, 'epoch': 0.26} {'loss': 0.7934, 'learning_rate': 1.919180038599155e-05, 'epoch': 0.26} {'loss': 0.7513, 'learning_rate': 1.919167145772428e-05, 'epoch': 0.26} {'loss': 1.0135, 'learning_rate': 1.919154251960731e-05, 'epoch': 0.26} {'loss': 0.9468, 'learning_rate': 1.9191413571640767e-05, 'epoch': 0.26} {'loss': 0.8389, 'learning_rate': 1.9191284613824797e-05, 'epoch': 0.26} {'loss': 0.9655, 'learning_rate': 1.9191155646159535e-05, 'epoch': 0.26} {'loss': 0.8668, 'learning_rate': 1.919102666864512e-05, 'epoch': 0.26} {'loss': 0.7896, 'learning_rate': 1.9190897681281693e-05, 'epoch': 0.26} {'loss': 0.7847, 'learning_rate': 1.9190768684069387e-05, 'epoch': 0.26} {'loss': 0.9058, 'learning_rate': 1.919063967700834e-05, 'epoch': 0.26} {'loss': 0.8828, 'learning_rate': 1.91905106600987e-05, 'epoch': 0.26} {'loss': 1.1812, 'learning_rate': 1.9190381633340595e-05, 'epoch': 0.26} {'loss': 0.9982, 'learning_rate': 1.9190252596734166e-05, 'epoch': 0.26} {'loss': 0.9416, 'learning_rate': 1.9190123550279553e-05, 'epoch': 0.26} {'loss': 0.9512, 'learning_rate': 1.9189994493976894e-05, 'epoch': 0.26} {'loss': 0.7379, 'learning_rate': 1.9189865427826325e-05, 'epoch': 0.26} {'loss': 0.8496, 'learning_rate': 1.9189736351827985e-05, 'epoch': 0.26} {'loss': 0.9399, 'learning_rate': 1.9189607265982012e-05, 'epoch': 0.26} {'loss': 0.8386, 'learning_rate': 1.918947817028855e-05, 'epoch': 0.26} {'loss': 0.9268, 'learning_rate': 1.9189349064747727e-05, 'epoch': 0.26} {'loss': 0.7977, 'learning_rate': 1.9189219949359692e-05, 'epoch': 0.26} {'loss': 0.8214, 'learning_rate': 1.9189090824124577e-05, 'epoch': 0.26} {'loss': 0.8462, 'learning_rate': 1.918896168904252e-05, 'epoch': 0.26} {'loss': 0.8432, 'learning_rate': 1.9188832544113666e-05, 'epoch': 0.26} {'loss': 0.9152, 'learning_rate': 1.918870338933814e-05, 'epoch': 0.26} {'loss': 0.8869, 'learning_rate': 1.9188574224716096e-05, 'epoch': 0.26} {'loss': 0.896, 'learning_rate': 1.9188445050247665e-05, 'epoch': 0.26} {'loss': 0.9345, 'learning_rate': 1.9188315865932985e-05, 'epoch': 0.26} {'loss': 0.9418, 'learning_rate': 1.9188186671772193e-05, 'epoch': 0.26} {'loss': 0.9189, 'learning_rate': 1.9188057467765433e-05, 'epoch': 0.26} {'loss': 0.949, 'learning_rate': 1.9187928253912837e-05, 'epoch': 0.26} {'loss': 0.9072, 'learning_rate': 1.918779903021455e-05, 'epoch': 0.26} {'loss': 0.9299, 'learning_rate': 1.9187669796670704e-05, 'epoch': 0.26} {'loss': 0.9294, 'learning_rate': 1.918754055328144e-05, 'epoch': 0.26} {'loss': 0.8824, 'learning_rate': 1.9187411300046902e-05, 'epoch': 0.26} {'loss': 0.9334, 'learning_rate': 1.9187282036967217e-05, 'epoch': 0.26} {'loss': 1.0429, 'learning_rate': 1.9187152764042536e-05, 'epoch': 0.26} {'loss': 1.0846, 'learning_rate': 1.9187023481272988e-05, 'epoch': 0.26} {'loss': 1.0229, 'learning_rate': 1.9186894188658714e-05, 'epoch': 0.26} {'loss': 0.8544, 'learning_rate': 1.9186764886199858e-05, 'epoch': 0.26} {'loss': 0.9348, 'learning_rate': 1.9186635573896554e-05, 'epoch': 0.26} {'loss': 0.8925, 'learning_rate': 1.918650625174894e-05, 'epoch': 0.26} {'loss': 0.9011, 'learning_rate': 1.918637691975715e-05, 'epoch': 0.26} {'loss': 0.8446, 'learning_rate': 1.9186247577921335e-05, 'epoch': 0.26} {'loss': 0.7662, 'learning_rate': 1.9186118226241624e-05, 'epoch': 0.26} {'loss': 0.7079, 'learning_rate': 1.9185988864718158e-05, 'epoch': 0.26} {'loss': 0.903, 'learning_rate': 1.9185859493351077e-05, 'epoch': 0.26} {'loss': 1.0393, 'learning_rate': 1.918573011214052e-05, 'epoch': 0.26} {'loss': 0.8447, 'learning_rate': 1.9185600721086617e-05, 'epoch': 0.26} {'loss': 1.0157, 'learning_rate': 1.918547132018952e-05, 'epoch': 0.26} {'loss': 0.9026, 'learning_rate': 1.918534190944936e-05, 'epoch': 0.26} {'loss': 0.8687, 'learning_rate': 1.9185212488866275e-05, 'epoch': 0.26} {'loss': 0.9021, 'learning_rate': 1.918508305844041e-05, 'epoch': 0.26} {'loss': 0.8545, 'learning_rate': 1.9184953618171897e-05, 'epoch': 0.26} {'loss': 1.0172, 'learning_rate': 1.918482416806088e-05, 'epoch': 0.26} {'loss': 0.8594, 'learning_rate': 1.9184694708107492e-05, 'epoch': 0.26} {'loss': 1.0215, 'learning_rate': 1.9184565238311873e-05, 'epoch': 0.26} {'loss': 0.9039, 'learning_rate': 1.9184435758674165e-05, 'epoch': 0.26} {'loss': 0.9614, 'learning_rate': 1.9184306269194506e-05, 'epoch': 0.26} {'loss': 0.9335, 'learning_rate': 1.9184176769873036e-05, 'epoch': 0.26} {'loss': 0.8906, 'learning_rate': 1.9184047260709887e-05, 'epoch': 0.26} {'loss': 1.0171, 'learning_rate': 1.9183917741705204e-05, 'epoch': 0.26} {'loss': 0.8833, 'learning_rate': 1.9183788212859127e-05, 'epoch': 0.26} {'loss': 0.8429, 'learning_rate': 1.918365867417179e-05, 'epoch': 0.26} {'loss': 0.8807, 'learning_rate': 1.918352912564333e-05, 'epoch': 0.26} {'loss': 0.8647, 'learning_rate': 1.9183399567273896e-05, 'epoch': 0.26} {'loss': 0.8108, 'learning_rate': 1.918326999906362e-05, 'epoch': 0.26} {'loss': 0.8574, 'learning_rate': 1.918314042101264e-05, 'epoch': 0.26} {'loss': 0.9072, 'learning_rate': 1.9183010833121095e-05, 'epoch': 0.26} {'loss': 0.9209, 'learning_rate': 1.9182881235389125e-05, 'epoch': 0.26} {'loss': 1.004, 'learning_rate': 1.9182751627816868e-05, 'epoch': 0.26} {'loss': 0.8345, 'learning_rate': 1.9182622010404467e-05, 'epoch': 0.26} {'loss': 0.8447, 'learning_rate': 1.9182492383152057e-05, 'epoch': 0.26} {'loss': 0.9527, 'learning_rate': 1.9182362746059776e-05, 'epoch': 0.26} {'loss': 1.0753, 'learning_rate': 1.9182233099127765e-05, 'epoch': 0.26} {'loss': 0.8258, 'learning_rate': 1.9182103442356162e-05, 'epoch': 0.26} {'loss': 0.9113, 'learning_rate': 1.918197377574511e-05, 'epoch': 0.26} {'loss': 1.0277, 'learning_rate': 1.9181844099294742e-05, 'epoch': 0.26} {'loss': 0.958, 'learning_rate': 1.9181714413005196e-05, 'epoch': 0.26} {'loss': 1.0114, 'learning_rate': 1.9181584716876617e-05, 'epoch': 0.26} {'loss': 0.8288, 'learning_rate': 1.9181455010909143e-05, 'epoch': 0.26} {'loss': 0.8518, 'learning_rate': 1.9181325295102908e-05, 'epoch': 0.26} {'loss': 0.8402, 'learning_rate': 1.9181195569458057e-05, 'epoch': 0.26} {'loss': 0.8676, 'learning_rate': 1.9181065833974724e-05, 'epoch': 0.26} {'loss': 0.9501, 'learning_rate': 1.9180936088653057e-05, 'epoch': 0.26} {'loss': 0.8459, 'learning_rate': 1.918080633349318e-05, 'epoch': 0.26} {'loss': 0.9454, 'learning_rate': 1.9180676568495245e-05, 'epoch': 0.26} {'loss': 0.814, 'learning_rate': 1.9180546793659385e-05, 'epoch': 0.26} {'loss': 0.8724, 'learning_rate': 1.918041700898574e-05, 'epoch': 0.26} {'loss': 0.8912, 'learning_rate': 1.918028721447445e-05, 'epoch': 0.26} {'loss': 0.8605, 'learning_rate': 1.9180157410125654e-05, 'epoch': 0.27} {'loss': 0.9562, 'learning_rate': 1.918002759593949e-05, 'epoch': 0.27} {'loss': 0.7122, 'learning_rate': 1.9179897771916098e-05, 'epoch': 0.27} {'loss': 0.8122, 'learning_rate': 1.9179767938055618e-05, 'epoch': 0.27} {'loss': 0.7156, 'learning_rate': 1.917963809435819e-05, 'epoch': 0.27} {'loss': 0.8206, 'learning_rate': 1.917950824082395e-05, 'epoch': 0.27} {'loss': 0.9122, 'learning_rate': 1.9179378377453034e-05, 'epoch': 0.27} {'loss': 0.8214, 'learning_rate': 1.9179248504245587e-05, 'epoch': 0.27} {'loss': 0.8297, 'learning_rate': 1.9179118621201753e-05, 'epoch': 0.27} {'loss': 0.8688, 'learning_rate': 1.9178988728321657e-05, 'epoch': 0.27} {'loss': 1.0693, 'learning_rate': 1.917885882560545e-05, 'epoch': 0.27} {'loss': 0.8975, 'learning_rate': 1.9178728913053267e-05, 'epoch': 0.27} {'loss': 0.806, 'learning_rate': 1.9178598990665247e-05, 'epoch': 0.27} {'loss': 0.7523, 'learning_rate': 1.917846905844153e-05, 'epoch': 0.27} {'loss': 0.9956, 'learning_rate': 1.9178339116382255e-05, 'epoch': 0.27} {'loss': 1.0074, 'learning_rate': 1.917820916448756e-05, 'epoch': 0.27} {'loss': 0.855, 'learning_rate': 1.9178079202757588e-05, 'epoch': 0.27} {'loss': 1.1005, 'learning_rate': 1.9177949231192475e-05, 'epoch': 0.27} {'loss': 0.9554, 'learning_rate': 1.917781924979236e-05, 'epoch': 0.27} {'loss': 1.0041, 'learning_rate': 1.9177689258557387e-05, 'epoch': 0.27} {'loss': 0.9866, 'learning_rate': 1.9177559257487684e-05, 'epoch': 0.27} {'loss': 0.9083, 'learning_rate': 1.9177429246583407e-05, 'epoch': 0.27} {'loss': 0.8309, 'learning_rate': 1.917729922584468e-05, 'epoch': 0.27} {'loss': 0.8283, 'learning_rate': 1.9177169195271654e-05, 'epoch': 0.27} {'loss': 0.984, 'learning_rate': 1.9177039154864456e-05, 'epoch': 0.27} {'loss': 0.8105, 'learning_rate': 1.9176909104623237e-05, 'epoch': 0.27} {'loss': 0.8639, 'learning_rate': 1.9176779044548127e-05, 'epoch': 0.27} {'loss': 0.8593, 'learning_rate': 1.9176648974639277e-05, 'epoch': 0.27} {'loss': 1.0156, 'learning_rate': 1.9176518894896815e-05, 'epoch': 0.27} {'loss': 0.8954, 'learning_rate': 1.9176388805320883e-05, 'epoch': 0.27} {'loss': 0.9036, 'learning_rate': 1.9176258705911627e-05, 'epoch': 0.27} {'loss': 0.8328, 'learning_rate': 1.917612859666918e-05, 'epoch': 0.27} {'loss': 0.9341, 'learning_rate': 1.917599847759368e-05, 'epoch': 0.27} {'loss': 0.9125, 'learning_rate': 1.9175868348685273e-05, 'epoch': 0.27} {'loss': 1.0173, 'learning_rate': 1.9175738209944096e-05, 'epoch': 0.27} {'loss': 0.9462, 'learning_rate': 1.9175608061370283e-05, 'epoch': 0.27} {'loss': 0.8741, 'learning_rate': 1.9175477902963976e-05, 'epoch': 0.27} {'loss': 0.8464, 'learning_rate': 1.917534773472532e-05, 'epoch': 0.27} {'loss': 1.0831, 'learning_rate': 1.9175217556654453e-05, 'epoch': 0.27} {'loss': 0.8041, 'learning_rate': 1.917508736875151e-05, 'epoch': 0.27} {'loss': 1.0422, 'learning_rate': 1.9174957171016634e-05, 'epoch': 0.27} {'loss': 0.6634, 'learning_rate': 1.917482696344996e-05, 'epoch': 0.27} {'loss': 0.8277, 'learning_rate': 1.9174696746051635e-05, 'epoch': 0.27} {'loss': 0.9744, 'learning_rate': 1.917456651882179e-05, 'epoch': 0.27} {'loss': 0.8757, 'learning_rate': 1.9174436281760572e-05, 'epoch': 0.27} {'loss': 0.8445, 'learning_rate': 1.9174306034868118e-05, 'epoch': 0.27} {'loss': 0.8812, 'learning_rate': 1.9174175778144562e-05, 'epoch': 0.27} {'loss': 0.9041, 'learning_rate': 1.9174045511590054e-05, 'epoch': 0.27} {'loss': 0.9131, 'learning_rate': 1.9173915235204726e-05, 'epoch': 0.27} {'loss': 0.9278, 'learning_rate': 1.9173784948988723e-05, 'epoch': 0.27} {'loss': 0.9687, 'learning_rate': 1.9173654652942178e-05, 'epoch': 0.27} {'loss': 0.8314, 'learning_rate': 1.9173524347065236e-05, 'epoch': 0.27} {'loss': 0.6877, 'learning_rate': 1.9173394031358033e-05, 'epoch': 0.27} {'loss': 0.8243, 'learning_rate': 1.917326370582071e-05, 'epoch': 0.27} {'loss': 0.783, 'learning_rate': 1.9173133370453408e-05, 'epoch': 0.27} {'loss': 0.9641, 'learning_rate': 1.917300302525627e-05, 'epoch': 0.27} {'loss': 0.8695, 'learning_rate': 1.9172872670229427e-05, 'epoch': 0.27} {'loss': 0.8856, 'learning_rate': 1.917274230537302e-05, 'epoch': 0.27} {'loss': 1.0551, 'learning_rate': 1.9172611930687195e-05, 'epoch': 0.27} {'loss': 0.9159, 'learning_rate': 1.9172481546172087e-05, 'epoch': 0.27} {'loss': 0.9658, 'learning_rate': 1.917235115182784e-05, 'epoch': 0.27} {'loss': 0.846, 'learning_rate': 1.9172220747654587e-05, 'epoch': 0.27} {'loss': 0.9811, 'learning_rate': 1.9172090333652473e-05, 'epoch': 0.27} {'loss': 0.8607, 'learning_rate': 1.917195990982164e-05, 'epoch': 0.27} {'loss': 1.0114, 'learning_rate': 1.9171829476162222e-05, 'epoch': 0.27} {'loss': 0.8737, 'learning_rate': 1.917169903267436e-05, 'epoch': 0.27} {'loss': 0.8056, 'learning_rate': 1.9171568579358193e-05, 'epoch': 0.27} {'loss': 0.9484, 'learning_rate': 1.9171438116213864e-05, 'epoch': 0.27} {'loss': 0.9265, 'learning_rate': 1.9171307643241516e-05, 'epoch': 0.27} {'loss': 0.9279, 'learning_rate': 1.9171177160441275e-05, 'epoch': 0.27} {'loss': 0.948, 'learning_rate': 1.9171046667813297e-05, 'epoch': 0.27} {'loss': 0.7491, 'learning_rate': 1.917091616535771e-05, 'epoch': 0.27} {'loss': 0.8673, 'learning_rate': 1.9170785653074662e-05, 'epoch': 0.27} {'loss': 0.9696, 'learning_rate': 1.917065513096429e-05, 'epoch': 0.27} {'loss': 0.8969, 'learning_rate': 1.9170524599026733e-05, 'epoch': 0.27} {'loss': 1.0033, 'learning_rate': 1.917039405726213e-05, 'epoch': 0.27} {'loss': 0.8424, 'learning_rate': 1.917026350567062e-05, 'epoch': 0.27} {'loss': 0.9756, 'learning_rate': 1.917013294425235e-05, 'epoch': 0.27} {'loss': 0.814, 'learning_rate': 1.917000237300745e-05, 'epoch': 0.27} {'loss': 0.813, 'learning_rate': 1.9169871791936068e-05, 'epoch': 0.27} {'loss': 0.7924, 'learning_rate': 1.916974120103834e-05, 'epoch': 0.27} {'loss': 0.8267, 'learning_rate': 1.9169610600314406e-05, 'epoch': 0.27} {'loss': 0.998, 'learning_rate': 1.916947998976441e-05, 'epoch': 0.27} {'loss': 0.9597, 'learning_rate': 1.916934936938848e-05, 'epoch': 0.27} {'loss': 0.8442, 'learning_rate': 1.916921873918677e-05, 'epoch': 0.27} {'loss': 0.6798, 'learning_rate': 1.9169088099159416e-05, 'epoch': 0.27} {'loss': 0.9786, 'learning_rate': 1.9168957449306555e-05, 'epoch': 0.27} {'loss': 0.9093, 'learning_rate': 1.916882678962833e-05, 'epoch': 0.27} {'loss': 0.6559, 'learning_rate': 1.916869612012488e-05, 'epoch': 0.27} {'loss': 0.7693, 'learning_rate': 1.916856544079634e-05, 'epoch': 0.27} {'loss': 1.004, 'learning_rate': 1.916843475164286e-05, 'epoch': 0.27} {'loss': 0.9495, 'learning_rate': 1.916830405266457e-05, 'epoch': 0.27} {'loss': 0.799, 'learning_rate': 1.9168173343861617e-05, 'epoch': 0.27} {'loss': 0.7517, 'learning_rate': 1.916804262523414e-05, 'epoch': 0.27} {'loss': 0.8821, 'learning_rate': 1.9167911896782275e-05, 'epoch': 0.27} {'loss': 0.9392, 'learning_rate': 1.9167781158506168e-05, 'epoch': 0.27} {'loss': 0.8925, 'learning_rate': 1.9167650410405955e-05, 'epoch': 0.27} {'loss': 0.9524, 'learning_rate': 1.9167519652481776e-05, 'epoch': 0.27} {'loss': 0.9057, 'learning_rate': 1.9167388884733773e-05, 'epoch': 0.27} {'loss': 0.7971, 'learning_rate': 1.9167258107162086e-05, 'epoch': 0.27} {'loss': 0.9065, 'learning_rate': 1.9167127319766852e-05, 'epoch': 0.27} {'loss': 1.0597, 'learning_rate': 1.9166996522548215e-05, 'epoch': 0.27} {'loss': 0.8828, 'learning_rate': 1.9166865715506317e-05, 'epoch': 0.27} {'loss': 0.8291, 'learning_rate': 1.916673489864129e-05, 'epoch': 0.27} {'loss': 0.912, 'learning_rate': 1.9166604071953282e-05, 'epoch': 0.27} {'loss': 0.9812, 'learning_rate': 1.916647323544243e-05, 'epoch': 0.27} {'loss': 0.8912, 'learning_rate': 1.9166342389108875e-05, 'epoch': 0.27} {'loss': 0.8119, 'learning_rate': 1.9166211532952757e-05, 'epoch': 0.27} {'loss': 0.8519, 'learning_rate': 1.9166080666974215e-05, 'epoch': 0.27} {'loss': 0.9435, 'learning_rate': 1.916594979117339e-05, 'epoch': 0.27} {'loss': 0.8996, 'learning_rate': 1.9165818905550423e-05, 'epoch': 0.27} {'loss': 1.0166, 'learning_rate': 1.9165688010105454e-05, 'epoch': 0.27} {'loss': 1.0222, 'learning_rate': 1.9165557104838624e-05, 'epoch': 0.27} {'loss': 0.8003, 'learning_rate': 1.916542618975007e-05, 'epoch': 0.27} {'loss': 0.8906, 'learning_rate': 1.9165295264839936e-05, 'epoch': 0.27} {'loss': 0.8511, 'learning_rate': 1.9165164330108363e-05, 'epoch': 0.27} {'loss': 0.8452, 'learning_rate': 1.9165033385555487e-05, 'epoch': 0.27} {'loss': 0.8683, 'learning_rate': 1.916490243118145e-05, 'epoch': 0.27} {'loss': 0.8412, 'learning_rate': 1.9164771466986395e-05, 'epoch': 0.27} {'loss': 0.8112, 'learning_rate': 1.9164640492970457e-05, 'epoch': 0.27} {'loss': 0.8532, 'learning_rate': 1.9164509509133782e-05, 'epoch': 0.27} {'loss': 0.868, 'learning_rate': 1.916437851547651e-05, 'epoch': 0.27} {'loss': 0.94, 'learning_rate': 1.9164247511998772e-05, 'epoch': 0.27} {'loss': 0.7539, 'learning_rate': 1.9164116498700723e-05, 'epoch': 0.27} {'loss': 0.915, 'learning_rate': 1.916398547558249e-05, 'epoch': 0.27} {'loss': 0.6733, 'learning_rate': 1.9163854442644225e-05, 'epoch': 0.27} {'loss': 0.8022, 'learning_rate': 1.916372339988606e-05, 'epoch': 0.27} {'loss': 0.8506, 'learning_rate': 1.916359234730814e-05, 'epoch': 0.27} {'loss': 0.9016, 'learning_rate': 1.91634612849106e-05, 'epoch': 0.27} {'loss': 0.9794, 'learning_rate': 1.9163330212693587e-05, 'epoch': 0.27} {'loss': 0.9624, 'learning_rate': 1.9163199130657238e-05, 'epoch': 0.27} {'loss': 0.6927, 'learning_rate': 1.9163068038801697e-05, 'epoch': 0.27} {'loss': 0.9778, 'learning_rate': 1.91629369371271e-05, 'epoch': 0.27} {'loss': 0.8113, 'learning_rate': 1.9162805825633587e-05, 'epoch': 0.27} {'loss': 0.6944, 'learning_rate': 1.9162674704321303e-05, 'epoch': 0.27} {'loss': 0.911, 'learning_rate': 1.9162543573190383e-05, 'epoch': 0.27} {'loss': 0.7391, 'learning_rate': 1.9162412432240975e-05, 'epoch': 0.27} {'loss': 0.972, 'learning_rate': 1.916228128147321e-05, 'epoch': 0.27} {'loss': 0.956, 'learning_rate': 1.916215012088724e-05, 'epoch': 0.27} {'loss': 0.836, 'learning_rate': 1.916201895048319e-05, 'epoch': 0.27} {'loss': 1.037, 'learning_rate': 1.916188777026122e-05, 'epoch': 0.27} {'loss': 0.8271, 'learning_rate': 1.9161756580221455e-05, 'epoch': 0.27} {'loss': 0.8865, 'learning_rate': 1.916162538036404e-05, 'epoch': 0.27} {'loss': 0.9389, 'learning_rate': 1.9161494170689116e-05, 'epoch': 0.27} {'loss': 0.8856, 'learning_rate': 1.9161362951196826e-05, 'epoch': 0.27} {'loss': 0.6362, 'learning_rate': 1.916123172188731e-05, 'epoch': 0.27} {'loss': 0.8079, 'learning_rate': 1.9161100482760708e-05, 'epoch': 0.27} {'loss': 0.8256, 'learning_rate': 1.9160969233817157e-05, 'epoch': 0.27} {'loss': 0.9468, 'learning_rate': 1.91608379750568e-05, 'epoch': 0.27} {'loss': 0.8604, 'learning_rate': 1.916070670647978e-05, 'epoch': 0.27} {'loss': 0.9578, 'learning_rate': 1.9160575428086236e-05, 'epoch': 0.27} {'loss': 0.8839, 'learning_rate': 1.9160444139876308e-05, 'epoch': 0.27} {'loss': 0.838, 'learning_rate': 1.916031284185014e-05, 'epoch': 0.27} {'loss': 0.7922, 'learning_rate': 1.9160181534007867e-05, 'epoch': 0.27} {'loss': 0.9702, 'learning_rate': 1.9160050216349636e-05, 'epoch': 0.27} {'loss': 0.7612, 'learning_rate': 1.915991888887558e-05, 'epoch': 0.27} {'loss': 1.0133, 'learning_rate': 1.9159787551585846e-05, 'epoch': 0.27} {'loss': 0.926, 'learning_rate': 1.9159656204480576e-05, 'epoch': 0.27} {'loss': 0.9356, 'learning_rate': 1.9159524847559904e-05, 'epoch': 0.27} {'loss': 0.937, 'learning_rate': 1.9159393480823974e-05, 'epoch': 0.27} {'loss': 0.8651, 'learning_rate': 1.9159262104272928e-05, 'epoch': 0.27} {'loss': 0.795, 'learning_rate': 1.9159130717906908e-05, 'epoch': 0.27} {'loss': 0.8765, 'learning_rate': 1.915899932172605e-05, 'epoch': 0.27} {'loss': 0.8832, 'learning_rate': 1.9158867915730498e-05, 'epoch': 0.27} {'loss': 1.0457, 'learning_rate': 1.9158736499920392e-05, 'epoch': 0.27} {'loss': 1.0491, 'learning_rate': 1.915860507429588e-05, 'epoch': 0.27} {'loss': 0.8539, 'learning_rate': 1.9158473638857086e-05, 'epoch': 0.27} {'loss': 0.9426, 'learning_rate': 1.9158342193604167e-05, 'epoch': 0.27} {'loss': 1.1138, 'learning_rate': 1.9158210738537256e-05, 'epoch': 0.27} {'loss': 0.9203, 'learning_rate': 1.91580792736565e-05, 'epoch': 0.27} {'loss': 0.9148, 'learning_rate': 1.915794779896203e-05, 'epoch': 0.27} {'loss': 0.8976, 'learning_rate': 1.915781631445399e-05, 'epoch': 0.27} {'loss': 0.8475, 'learning_rate': 1.915768482013253e-05, 'epoch': 0.27} {'loss': 0.8101, 'learning_rate': 1.915755331599778e-05, 'epoch': 0.27} {'loss': 0.8846, 'learning_rate': 1.915742180204989e-05, 'epoch': 0.27} {'loss': 0.7806, 'learning_rate': 1.9157290278288988e-05, 'epoch': 0.27} {'loss': 0.9097, 'learning_rate': 1.9157158744715228e-05, 'epoch': 0.27} {'loss': 0.8937, 'learning_rate': 1.9157027201328744e-05, 'epoch': 0.27} {'loss': 0.8456, 'learning_rate': 1.915689564812968e-05, 'epoch': 0.27} {'loss': 0.9055, 'learning_rate': 1.9156764085118176e-05, 'epoch': 0.27} {'loss': 0.91, 'learning_rate': 1.9156632512294373e-05, 'epoch': 0.27} {'loss': 0.8927, 'learning_rate': 1.915650092965841e-05, 'epoch': 0.27} {'loss': 0.8577, 'learning_rate': 1.9156369337210434e-05, 'epoch': 0.27} {'loss': 0.8953, 'learning_rate': 1.915623773495058e-05, 'epoch': 0.27} {'loss': 0.9048, 'learning_rate': 1.915610612287899e-05, 'epoch': 0.27} {'loss': 0.9052, 'learning_rate': 1.9155974500995804e-05, 'epoch': 0.27} {'loss': 0.8427, 'learning_rate': 1.9155842869301168e-05, 'epoch': 0.27} {'loss': 0.873, 'learning_rate': 1.9155711227795217e-05, 'epoch': 0.27} {'loss': 1.0333, 'learning_rate': 1.9155579576478097e-05, 'epoch': 0.27} {'loss': 0.9359, 'learning_rate': 1.9155447915349947e-05, 'epoch': 0.27} {'loss': 0.8709, 'learning_rate': 1.915531624441091e-05, 'epoch': 0.27} {'loss': 0.9095, 'learning_rate': 1.9155184563661123e-05, 'epoch': 0.27} {'loss': 0.8753, 'learning_rate': 1.915505287310073e-05, 'epoch': 0.27} {'loss': 0.8541, 'learning_rate': 1.915492117272987e-05, 'epoch': 0.27} {'loss': 0.8678, 'learning_rate': 1.915478946254869e-05, 'epoch': 0.27} {'loss': 0.9532, 'learning_rate': 1.9154657742557322e-05, 'epoch': 0.27} {'loss': 0.7799, 'learning_rate': 1.9154526012755915e-05, 'epoch': 0.27} {'loss': 0.8473, 'learning_rate': 1.9154394273144606e-05, 'epoch': 0.27} {'loss': 0.7898, 'learning_rate': 1.9154262523723537e-05, 'epoch': 0.27} {'loss': 0.8177, 'learning_rate': 1.915413076449285e-05, 'epoch': 0.27} {'loss': 1.0501, 'learning_rate': 1.9153998995452684e-05, 'epoch': 0.27} {'loss': 0.7957, 'learning_rate': 1.9153867216603187e-05, 'epoch': 0.27} {'loss': 0.9523, 'learning_rate': 1.9153735427944493e-05, 'epoch': 0.27} {'loss': 0.9682, 'learning_rate': 1.9153603629476743e-05, 'epoch': 0.27} {'loss': 1.0683, 'learning_rate': 1.9153471821200082e-05, 'epoch': 0.27} {'loss': 0.8969, 'learning_rate': 1.915334000311465e-05, 'epoch': 0.27} {'loss': 0.9886, 'learning_rate': 1.9153208175220586e-05, 'epoch': 0.27} {'loss': 1.0435, 'learning_rate': 1.9153076337518034e-05, 'epoch': 0.27} {'loss': 1.0123, 'learning_rate': 1.9152944490007135e-05, 'epoch': 0.27} {'loss': 0.8857, 'learning_rate': 1.915281263268803e-05, 'epoch': 0.27} {'loss': 0.9184, 'learning_rate': 1.9152680765560862e-05, 'epoch': 0.27} {'loss': 0.8524, 'learning_rate': 1.9152548888625766e-05, 'epoch': 0.27} {'loss': 0.8533, 'learning_rate': 1.9152417001882893e-05, 'epoch': 0.27} {'loss': 0.9646, 'learning_rate': 1.9152285105332374e-05, 'epoch': 0.27} {'loss': 0.9191, 'learning_rate': 1.9152153198974362e-05, 'epoch': 0.27} {'loss': 0.8274, 'learning_rate': 1.9152021282808986e-05, 'epoch': 0.27} {'loss': 1.0558, 'learning_rate': 1.9151889356836395e-05, 'epoch': 0.27} {'loss': 0.8265, 'learning_rate': 1.9151757421056728e-05, 'epoch': 0.27} {'loss': 0.9235, 'learning_rate': 1.9151625475470127e-05, 'epoch': 0.27} {'loss': 0.9242, 'learning_rate': 1.9151493520076734e-05, 'epoch': 0.27} {'loss': 0.9773, 'learning_rate': 1.9151361554876692e-05, 'epoch': 0.27} {'loss': 0.9541, 'learning_rate': 1.9151229579870136e-05, 'epoch': 0.27} {'loss': 0.8506, 'learning_rate': 1.9151097595057212e-05, 'epoch': 0.27} {'loss': 0.852, 'learning_rate': 1.9150965600438066e-05, 'epoch': 0.27} {'loss': 0.9177, 'learning_rate': 1.915083359601283e-05, 'epoch': 0.27} {'loss': 0.9634, 'learning_rate': 1.915070158178165e-05, 'epoch': 0.27} {'loss': 0.8257, 'learning_rate': 1.9150569557744668e-05, 'epoch': 0.27} {'loss': 0.973, 'learning_rate': 1.9150437523902024e-05, 'epoch': 0.27} {'loss': 0.9668, 'learning_rate': 1.9150305480253863e-05, 'epoch': 0.27} {'loss': 0.8615, 'learning_rate': 1.9150173426800323e-05, 'epoch': 0.27} {'loss': 0.895, 'learning_rate': 1.9150041363541544e-05, 'epoch': 0.27} {'loss': 1.0981, 'learning_rate': 1.914990929047767e-05, 'epoch': 0.27} {'loss': 0.965, 'learning_rate': 1.9149777207608844e-05, 'epoch': 0.27} {'loss': 0.8772, 'learning_rate': 1.9149645114935205e-05, 'epoch': 0.27} {'loss': 0.9735, 'learning_rate': 1.9149513012456896e-05, 'epoch': 0.27} {'loss': 0.8079, 'learning_rate': 1.9149380900174058e-05, 'epoch': 0.27} {'loss': 0.86, 'learning_rate': 1.9149248778086835e-05, 'epoch': 0.27} {'loss': 0.9174, 'learning_rate': 1.914911664619536e-05, 'epoch': 0.27} {'loss': 0.869, 'learning_rate': 1.9148984504499785e-05, 'epoch': 0.27} {'loss': 0.8117, 'learning_rate': 1.914885235300025e-05, 'epoch': 0.27} {'loss': 0.9888, 'learning_rate': 1.9148720191696888e-05, 'epoch': 0.27} {'loss': 0.8195, 'learning_rate': 1.914858802058985e-05, 'epoch': 0.27} {'loss': 0.8459, 'learning_rate': 1.9148455839679273e-05, 'epoch': 0.27} {'loss': 0.9622, 'learning_rate': 1.91483236489653e-05, 'epoch': 0.27} {'loss': 0.8763, 'learning_rate': 1.9148191448448075e-05, 'epoch': 0.27} {'loss': 0.8746, 'learning_rate': 1.9148059238127733e-05, 'epoch': 0.27} {'loss': 0.9422, 'learning_rate': 1.914792701800442e-05, 'epoch': 0.27} {'loss': 0.9148, 'learning_rate': 1.9147794788078282e-05, 'epoch': 0.27} {'loss': 0.946, 'learning_rate': 1.9147662548349454e-05, 'epoch': 0.27} {'loss': 0.8765, 'learning_rate': 1.914753029881808e-05, 'epoch': 0.27} {'loss': 0.826, 'learning_rate': 1.9147398039484302e-05, 'epoch': 0.27} {'loss': 0.6635, 'learning_rate': 1.914726577034826e-05, 'epoch': 0.27} {'loss': 0.9686, 'learning_rate': 1.91471334914101e-05, 'epoch': 0.27} {'loss': 0.85, 'learning_rate': 1.9147001202669957e-05, 'epoch': 0.27} {'loss': 0.8923, 'learning_rate': 1.9146868904127976e-05, 'epoch': 0.27} {'loss': 0.8913, 'learning_rate': 1.9146736595784302e-05, 'epoch': 0.27} {'loss': 1.0639, 'learning_rate': 1.9146604277639075e-05, 'epoch': 0.27} {'loss': 0.9365, 'learning_rate': 1.9146471949692437e-05, 'epoch': 0.27} {'loss': 0.8138, 'learning_rate': 1.9146339611944523e-05, 'epoch': 0.27} {'loss': 0.8896, 'learning_rate': 1.9146207264395485e-05, 'epoch': 0.27} {'loss': 1.0927, 'learning_rate': 1.9146074907045464e-05, 'epoch': 0.27} {'loss': 0.9871, 'learning_rate': 1.914594253989459e-05, 'epoch': 0.27} {'loss': 0.7413, 'learning_rate': 1.914581016294302e-05, 'epoch': 0.27} {'loss': 0.8664, 'learning_rate': 1.9145677776190885e-05, 'epoch': 0.27} {'loss': 0.9592, 'learning_rate': 1.9145545379638332e-05, 'epoch': 0.27} {'loss': 0.8835, 'learning_rate': 1.9145412973285503e-05, 'epoch': 0.27} {'loss': 0.9712, 'learning_rate': 1.9145280557132536e-05, 'epoch': 0.27} {'loss': 0.9615, 'learning_rate': 1.9145148131179578e-05, 'epoch': 0.27} {'loss': 0.8974, 'learning_rate': 1.9145015695426767e-05, 'epoch': 0.27} {'loss': 0.926, 'learning_rate': 1.9144883249874246e-05, 'epoch': 0.27} {'loss': 0.8642, 'learning_rate': 1.9144750794522156e-05, 'epoch': 0.27} {'loss': 0.8776, 'learning_rate': 1.914461832937064e-05, 'epoch': 0.27} {'loss': 0.9343, 'learning_rate': 1.9144485854419845e-05, 'epoch': 0.27} {'loss': 0.9421, 'learning_rate': 1.9144353369669905e-05, 'epoch': 0.27} {'loss': 0.8844, 'learning_rate': 1.9144220875120963e-05, 'epoch': 0.27} {'loss': 0.8959, 'learning_rate': 1.9144088370773168e-05, 'epoch': 0.27} {'loss': 0.8864, 'learning_rate': 1.914395585662665e-05, 'epoch': 0.27} {'loss': 1.0762, 'learning_rate': 1.9143823332681562e-05, 'epoch': 0.27} {'loss': 0.903, 'learning_rate': 1.9143690798938044e-05, 'epoch': 0.27} {'loss': 0.8327, 'learning_rate': 1.9143558255396235e-05, 'epoch': 0.27} {'loss': 0.9351, 'learning_rate': 1.9143425702056278e-05, 'epoch': 0.27} {'loss': 0.7975, 'learning_rate': 1.9143293138918314e-05, 'epoch': 0.27} {'loss': 0.9069, 'learning_rate': 1.9143160565982483e-05, 'epoch': 0.27} {'loss': 0.8757, 'learning_rate': 1.9143027983248937e-05, 'epoch': 0.27} {'loss': 0.8297, 'learning_rate': 1.9142895390717805e-05, 'epoch': 0.27} {'loss': 1.057, 'learning_rate': 1.914276278838924e-05, 'epoch': 0.27} {'loss': 0.8886, 'learning_rate': 1.9142630176263376e-05, 'epoch': 0.27} {'loss': 0.914, 'learning_rate': 1.9142497554340364e-05, 'epoch': 0.27} {'loss': 0.7916, 'learning_rate': 1.9142364922620334e-05, 'epoch': 0.27} {'loss': 0.8088, 'learning_rate': 1.914223228110344e-05, 'epoch': 0.27} {'loss': 1.067, 'learning_rate': 1.9142099629789818e-05, 'epoch': 0.27} {'loss': 0.8315, 'learning_rate': 1.914196696867961e-05, 'epoch': 0.27} {'loss': 0.8976, 'learning_rate': 1.9141834297772955e-05, 'epoch': 0.27} {'loss': 0.8539, 'learning_rate': 1.9141701617070007e-05, 'epoch': 0.27} {'loss': 0.7324, 'learning_rate': 1.9141568926570895e-05, 'epoch': 0.27} {'loss': 1.0404, 'learning_rate': 1.914143622627577e-05, 'epoch': 0.27} {'loss': 0.9841, 'learning_rate': 1.914130351618477e-05, 'epoch': 0.27} {'loss': 0.8251, 'learning_rate': 1.914117079629804e-05, 'epoch': 0.27} {'loss': 0.9126, 'learning_rate': 1.914103806661572e-05, 'epoch': 0.27} {'loss': 0.813, 'learning_rate': 1.914090532713795e-05, 'epoch': 0.27} {'loss': 0.9288, 'learning_rate': 1.9140772577864875e-05, 'epoch': 0.27} {'loss': 0.9009, 'learning_rate': 1.914063981879664e-05, 'epoch': 0.27} {'loss': 0.7647, 'learning_rate': 1.914050704993338e-05, 'epoch': 0.27} {'loss': 0.9538, 'learning_rate': 1.9140374271275247e-05, 'epoch': 0.27} {'loss': 0.8346, 'learning_rate': 1.9140241482822375e-05, 'epoch': 0.27} {'loss': 0.8811, 'learning_rate': 1.9140108684574913e-05, 'epoch': 0.27} {'loss': 0.9086, 'learning_rate': 1.9139975876532995e-05, 'epoch': 0.27} {'loss': 0.9646, 'learning_rate': 1.913984305869677e-05, 'epoch': 0.27} {'loss': 0.9, 'learning_rate': 1.9139710231066376e-05, 'epoch': 0.27} {'loss': 0.8149, 'learning_rate': 1.9139577393641963e-05, 'epoch': 0.27} {'loss': 1.0337, 'learning_rate': 1.9139444546423664e-05, 'epoch': 0.27} {'loss': 0.8396, 'learning_rate': 1.9139311689411624e-05, 'epoch': 0.27} {'loss': 0.8069, 'learning_rate': 1.913917882260599e-05, 'epoch': 0.27} {'loss': 0.8356, 'learning_rate': 1.9139045946006898e-05, 'epoch': 0.27} {'loss': 0.9094, 'learning_rate': 1.9138913059614493e-05, 'epoch': 0.27} {'loss': 0.9734, 'learning_rate': 1.913878016342892e-05, 'epoch': 0.27} {'loss': 1.0564, 'learning_rate': 1.913864725745032e-05, 'epoch': 0.27} {'loss': 0.9287, 'learning_rate': 1.9138514341678832e-05, 'epoch': 0.27} {'loss': 0.8991, 'learning_rate': 1.9138381416114603e-05, 'epoch': 0.27} {'loss': 0.8917, 'learning_rate': 1.913824848075777e-05, 'epoch': 0.27} {'loss': 0.871, 'learning_rate': 1.9138115535608487e-05, 'epoch': 0.27} {'loss': 0.9232, 'learning_rate': 1.9137982580666882e-05, 'epoch': 0.27} {'loss': 0.9195, 'learning_rate': 1.9137849615933105e-05, 'epoch': 0.27} {'loss': 0.9566, 'learning_rate': 1.91377166414073e-05, 'epoch': 0.27} {'loss': 0.9595, 'learning_rate': 1.91375836570896e-05, 'epoch': 0.27} {'loss': 0.8946, 'learning_rate': 1.9137450662980163e-05, 'epoch': 0.27} {'loss': 0.7307, 'learning_rate': 1.913731765907912e-05, 'epoch': 0.27} {'loss': 0.8457, 'learning_rate': 1.9137184645386613e-05, 'epoch': 0.27} {'loss': 0.839, 'learning_rate': 1.913705162190279e-05, 'epoch': 0.27} {'loss': 0.8413, 'learning_rate': 1.9136918588627792e-05, 'epoch': 0.27} {'loss': 0.9228, 'learning_rate': 1.9136785545561763e-05, 'epoch': 0.27} {'loss': 0.8516, 'learning_rate': 1.913665249270484e-05, 'epoch': 0.27} {'loss': 0.7973, 'learning_rate': 1.913651943005717e-05, 'epoch': 0.27} {'loss': 0.895, 'learning_rate': 1.9136386357618896e-05, 'epoch': 0.27} {'loss': 0.8877, 'learning_rate': 1.913625327539016e-05, 'epoch': 0.27} {'loss': 0.8581, 'learning_rate': 1.9136120183371103e-05, 'epoch': 0.27} {'loss': 1.1395, 'learning_rate': 1.913598708156187e-05, 'epoch': 0.27} {'loss': 0.9211, 'learning_rate': 1.9135853969962597e-05, 'epoch': 0.27} {'loss': 0.8881, 'learning_rate': 1.9135720848573438e-05, 'epoch': 0.27} {'loss': 0.9887, 'learning_rate': 1.913558771739453e-05, 'epoch': 0.27} {'loss': 0.8643, 'learning_rate': 1.913545457642601e-05, 'epoch': 0.27} {'loss': 0.7173, 'learning_rate': 1.913532142566803e-05, 'epoch': 0.27} {'loss': 1.0375, 'learning_rate': 1.9135188265120726e-05, 'epoch': 0.27} {'loss': 0.8046, 'learning_rate': 1.9135055094784247e-05, 'epoch': 0.27} {'loss': 0.7877, 'learning_rate': 1.913492191465873e-05, 'epoch': 0.27} {'loss': 0.9296, 'learning_rate': 1.9134788724744316e-05, 'epoch': 0.27} {'loss': 0.7993, 'learning_rate': 1.9134655525041153e-05, 'epoch': 0.27} {'loss': 1.0219, 'learning_rate': 1.9134522315549383e-05, 'epoch': 0.27} {'loss': 0.8584, 'learning_rate': 1.913438909626915e-05, 'epoch': 0.27} {'loss': 0.846, 'learning_rate': 1.9134255867200596e-05, 'epoch': 0.27} {'loss': 0.8346, 'learning_rate': 1.9134122628343857e-05, 'epoch': 0.27} {'loss': 0.9663, 'learning_rate': 1.9133989379699087e-05, 'epoch': 0.27} {'loss': 0.924, 'learning_rate': 1.913385612126642e-05, 'epoch': 0.27} {'loss': 0.8635, 'learning_rate': 1.9133722853046e-05, 'epoch': 0.27} {'loss': 0.8108, 'learning_rate': 1.913358957503797e-05, 'epoch': 0.27} {'loss': 0.7956, 'learning_rate': 1.913345628724248e-05, 'epoch': 0.27} {'loss': 0.6724, 'learning_rate': 1.9133322989659664e-05, 'epoch': 0.27} {'loss': 0.9595, 'learning_rate': 1.913318968228967e-05, 'epoch': 0.27} {'loss': 0.8361, 'learning_rate': 1.913305636513264e-05, 'epoch': 0.27} {'loss': 0.8394, 'learning_rate': 1.913292303818871e-05, 'epoch': 0.27} {'loss': 0.7419, 'learning_rate': 1.9132789701458034e-05, 'epoch': 0.27} {'loss': 0.8506, 'learning_rate': 1.9132656354940747e-05, 'epoch': 0.27} {'loss': 0.9951, 'learning_rate': 1.9132522998636995e-05, 'epoch': 0.27} {'loss': 1.016, 'learning_rate': 1.913238963254692e-05, 'epoch': 0.27} {'loss': 0.7958, 'learning_rate': 1.9132256256670667e-05, 'epoch': 0.27} {'loss': 0.8846, 'learning_rate': 1.9132122871008377e-05, 'epoch': 0.27} {'loss': 0.8769, 'learning_rate': 1.913198947556019e-05, 'epoch': 0.27} {'loss': 0.8069, 'learning_rate': 1.9131856070326254e-05, 'epoch': 0.27} {'loss': 0.9847, 'learning_rate': 1.9131722655306713e-05, 'epoch': 0.27} {'loss': 0.8484, 'learning_rate': 1.9131589230501705e-05, 'epoch': 0.27} {'loss': 0.9889, 'learning_rate': 1.913145579591137e-05, 'epoch': 0.27} {'loss': 0.7142, 'learning_rate': 1.9131322351535862e-05, 'epoch': 0.27} {'loss': 1.0522, 'learning_rate': 1.913118889737532e-05, 'epoch': 0.27} {'loss': 0.9829, 'learning_rate': 1.9131055433429877e-05, 'epoch': 0.27} {'loss': 1.0527, 'learning_rate': 1.9130921959699687e-05, 'epoch': 0.27} {'loss': 0.9714, 'learning_rate': 1.9130788476184895e-05, 'epoch': 0.27} {'loss': 1.0813, 'learning_rate': 1.913065498288563e-05, 'epoch': 0.27} {'loss': 1.0128, 'learning_rate': 1.913052147980205e-05, 'epoch': 0.27} {'loss': 0.8213, 'learning_rate': 1.9130387966934293e-05, 'epoch': 0.27} {'loss': 0.8492, 'learning_rate': 1.91302544442825e-05, 'epoch': 0.27} {'loss': 0.7117, 'learning_rate': 1.9130120911846814e-05, 'epoch': 0.27} {'loss': 0.8597, 'learning_rate': 1.912998736962738e-05, 'epoch': 0.27} {'loss': 0.9057, 'learning_rate': 1.9129853817624342e-05, 'epoch': 0.27} {'loss': 0.8854, 'learning_rate': 1.912972025583784e-05, 'epoch': 0.27} {'loss': 0.7154, 'learning_rate': 1.9129586684268017e-05, 'epoch': 0.27} {'loss': 0.8443, 'learning_rate': 1.912945310291502e-05, 'epoch': 0.27} {'loss': 0.8817, 'learning_rate': 1.9129319511778993e-05, 'epoch': 0.27} {'loss': 0.8992, 'learning_rate': 1.9129185910860074e-05, 'epoch': 0.27} {'loss': 1.0088, 'learning_rate': 1.9129052300158405e-05, 'epoch': 0.27} {'loss': 1.0346, 'learning_rate': 1.9128918679674136e-05, 'epoch': 0.27} {'loss': 1.0381, 'learning_rate': 1.9128785049407406e-05, 'epoch': 0.27} {'loss': 0.9647, 'learning_rate': 1.9128651409358356e-05, 'epoch': 0.27} {'loss': 0.9558, 'learning_rate': 1.9128517759527137e-05, 'epoch': 0.27} {'loss': 0.9552, 'learning_rate': 1.9128384099913883e-05, 'epoch': 0.27} {'loss': 0.9681, 'learning_rate': 1.9128250430518744e-05, 'epoch': 0.27} {'loss': 0.9817, 'learning_rate': 1.912811675134186e-05, 'epoch': 0.27} {'loss': 0.9759, 'learning_rate': 1.9127983062383378e-05, 'epoch': 0.27} {'loss': 0.7936, 'learning_rate': 1.9127849363643432e-05, 'epoch': 0.27} {'loss': 0.8838, 'learning_rate': 1.9127715655122177e-05, 'epoch': 0.27} {'loss': 0.8684, 'learning_rate': 1.912758193681975e-05, 'epoch': 0.27} {'loss': 0.9079, 'learning_rate': 1.9127448208736295e-05, 'epoch': 0.27} {'loss': 0.9094, 'learning_rate': 1.9127314470871955e-05, 'epoch': 0.27} {'loss': 0.7473, 'learning_rate': 1.9127180723226875e-05, 'epoch': 0.27} {'loss': 0.9326, 'learning_rate': 1.9127046965801194e-05, 'epoch': 0.27} {'loss': 1.025, 'learning_rate': 1.9126913198595057e-05, 'epoch': 0.27} {'loss': 0.838, 'learning_rate': 1.9126779421608614e-05, 'epoch': 0.27} {'loss': 0.9321, 'learning_rate': 1.9126645634842003e-05, 'epoch': 0.27} {'loss': 0.7635, 'learning_rate': 1.9126511838295363e-05, 'epoch': 0.27} {'loss': 0.9155, 'learning_rate': 1.9126378031968843e-05, 'epoch': 0.27} {'loss': 0.7704, 'learning_rate': 1.912624421586259e-05, 'epoch': 0.27} {'loss': 0.8891, 'learning_rate': 1.9126110389976737e-05, 'epoch': 0.27} {'loss': 0.8714, 'learning_rate': 1.9125976554311436e-05, 'epoch': 0.27} {'loss': 0.8414, 'learning_rate': 1.9125842708866824e-05, 'epoch': 0.27} {'loss': 0.9906, 'learning_rate': 1.912570885364305e-05, 'epoch': 0.27} {'loss': 0.994, 'learning_rate': 1.912557498864026e-05, 'epoch': 0.27} {'loss': 1.0506, 'learning_rate': 1.9125441113858586e-05, 'epoch': 0.27} {'loss': 1.0045, 'learning_rate': 1.912530722929818e-05, 'epoch': 0.27} {'loss': 1.0536, 'learning_rate': 1.9125173334959183e-05, 'epoch': 0.27} {'loss': 0.9378, 'learning_rate': 1.9125039430841744e-05, 'epoch': 0.27} {'loss': 0.7781, 'learning_rate': 1.9124905516945994e-05, 'epoch': 0.27} {'loss': 0.9299, 'learning_rate': 1.9124771593272092e-05, 'epoch': 0.27} {'loss': 0.8999, 'learning_rate': 1.9124637659820168e-05, 'epoch': 0.27} {'loss': 1.0501, 'learning_rate': 1.9124503716590376e-05, 'epoch': 0.27} {'loss': 1.022, 'learning_rate': 1.912436976358285e-05, 'epoch': 0.27} {'loss': 0.9058, 'learning_rate': 1.912423580079774e-05, 'epoch': 0.27} {'loss': 0.8114, 'learning_rate': 1.9124101828235187e-05, 'epoch': 0.27} {'loss': 0.8745, 'learning_rate': 1.9123967845895336e-05, 'epoch': 0.27} {'loss': 0.9896, 'learning_rate': 1.9123833853778333e-05, 'epoch': 0.27} {'loss': 0.8058, 'learning_rate': 1.9123699851884313e-05, 'epoch': 0.27} {'loss': 0.8761, 'learning_rate': 1.912356584021343e-05, 'epoch': 0.27} {'loss': 1.0343, 'learning_rate': 1.9123431818765823e-05, 'epoch': 0.27} {'loss': 0.9929, 'learning_rate': 1.912329778754163e-05, 'epoch': 0.27} {'loss': 0.7515, 'learning_rate': 1.9123163746541005e-05, 'epoch': 0.27} {'loss': 0.7906, 'learning_rate': 1.9123029695764087e-05, 'epoch': 0.27} {'loss': 0.8379, 'learning_rate': 1.9122895635211013e-05, 'epoch': 0.27} {'loss': 0.8892, 'learning_rate': 1.912276156488194e-05, 'epoch': 0.27} {'loss': 0.8884, 'learning_rate': 1.9122627484777003e-05, 'epoch': 0.27} {'loss': 0.8883, 'learning_rate': 1.9122493394896345e-05, 'epoch': 0.27} {'loss': 0.8255, 'learning_rate': 1.9122359295240113e-05, 'epoch': 0.27} {'loss': 0.9164, 'learning_rate': 1.9122225185808447e-05, 'epoch': 0.27} {'loss': 0.9722, 'learning_rate': 1.9122091066601496e-05, 'epoch': 0.27} {'loss': 1.0162, 'learning_rate': 1.91219569376194e-05, 'epoch': 0.27} {'loss': 0.9201, 'learning_rate': 1.912182279886231e-05, 'epoch': 0.27} {'loss': 0.7975, 'learning_rate': 1.9121688650330356e-05, 'epoch': 0.27} {'loss': 0.9374, 'learning_rate': 1.912155449202369e-05, 'epoch': 0.27} {'loss': 0.845, 'learning_rate': 1.912142032394246e-05, 'epoch': 0.27} {'loss': 1.0129, 'learning_rate': 1.91212861460868e-05, 'epoch': 0.27} {'loss': 0.9228, 'learning_rate': 1.912115195845686e-05, 'epoch': 0.27} {'loss': 0.9218, 'learning_rate': 1.9121017761052783e-05, 'epoch': 0.27} {'loss': 0.805, 'learning_rate': 1.9120883553874714e-05, 'epoch': 0.27} {'loss': 0.753, 'learning_rate': 1.9120749336922793e-05, 'epoch': 0.27} {'loss': 0.8194, 'learning_rate': 1.9120615110197166e-05, 'epoch': 0.27} {'loss': 0.9916, 'learning_rate': 1.9120480873697974e-05, 'epoch': 0.27} {'loss': 0.9494, 'learning_rate': 1.9120346627425368e-05, 'epoch': 0.27} {'loss': 0.7452, 'learning_rate': 1.9120212371379485e-05, 'epoch': 0.27} {'loss': 0.9795, 'learning_rate': 1.9120078105560475e-05, 'epoch': 0.27} {'loss': 1.082, 'learning_rate': 1.9119943829968473e-05, 'epoch': 0.27} {'loss': 0.9378, 'learning_rate': 1.911980954460363e-05, 'epoch': 0.27} {'loss': 0.8501, 'learning_rate': 1.9119675249466088e-05, 'epoch': 0.27} {'loss': 0.9601, 'learning_rate': 1.9119540944555992e-05, 'epoch': 0.27} {'loss': 0.8384, 'learning_rate': 1.911940662987348e-05, 'epoch': 0.27} {'loss': 0.9223, 'learning_rate': 1.9119272305418707e-05, 'epoch': 0.27} {'loss': 0.8806, 'learning_rate': 1.911913797119181e-05, 'epoch': 0.27} {'loss': 0.9684, 'learning_rate': 1.911900362719293e-05, 'epoch': 0.27} {'loss': 0.9711, 'learning_rate': 1.9118869273422218e-05, 'epoch': 0.27} {'loss': 0.9126, 'learning_rate': 1.9118734909879814e-05, 'epoch': 0.27} {'loss': 0.8416, 'learning_rate': 1.9118600536565858e-05, 'epoch': 0.27} {'loss': 0.9722, 'learning_rate': 1.9118466153480504e-05, 'epoch': 0.27} {'loss': 0.9446, 'learning_rate': 1.911833176062389e-05, 'epoch': 0.27} {'loss': 0.8899, 'learning_rate': 1.911819735799616e-05, 'epoch': 0.27} {'loss': 0.873, 'learning_rate': 1.9118062945597457e-05, 'epoch': 0.27} {'loss': 0.9145, 'learning_rate': 1.9117928523427925e-05, 'epoch': 0.27} {'loss': 0.8702, 'learning_rate': 1.9117794091487712e-05, 'epoch': 0.27} {'loss': 0.917, 'learning_rate': 1.911765964977696e-05, 'epoch': 0.27} {'loss': 0.7932, 'learning_rate': 1.9117525198295813e-05, 'epoch': 0.27} {'loss': 0.8598, 'learning_rate': 1.911739073704441e-05, 'epoch': 0.27} {'loss': 0.983, 'learning_rate': 1.9117256266022908e-05, 'epoch': 0.27} {'loss': 0.8012, 'learning_rate': 1.911712178523144e-05, 'epoch': 0.27} {'loss': 0.9535, 'learning_rate': 1.9116987294670153e-05, 'epoch': 0.27} {'loss': 0.7659, 'learning_rate': 1.911685279433919e-05, 'epoch': 0.27} {'loss': 0.8915, 'learning_rate': 1.9116718284238696e-05, 'epoch': 0.27} {'loss': 0.8098, 'learning_rate': 1.9116583764368816e-05, 'epoch': 0.27} {'loss': 0.8236, 'learning_rate': 1.9116449234729695e-05, 'epoch': 0.28} {'loss': 0.792, 'learning_rate': 1.9116314695321473e-05, 'epoch': 0.28} {'loss': 0.9737, 'learning_rate': 1.91161801461443e-05, 'epoch': 0.28} {'loss': 0.9622, 'learning_rate': 1.9116045587198314e-05, 'epoch': 0.28} {'loss': 0.8875, 'learning_rate': 1.911591101848367e-05, 'epoch': 0.28} {'loss': 0.728, 'learning_rate': 1.91157764400005e-05, 'epoch': 0.28} {'loss': 1.0027, 'learning_rate': 1.9115641851748948e-05, 'epoch': 0.28} {'loss': 0.7275, 'learning_rate': 1.9115507253729166e-05, 'epoch': 0.28} {'loss': 0.9144, 'learning_rate': 1.9115372645941298e-05, 'epoch': 0.28} {'loss': 0.8587, 'learning_rate': 1.9115238028385484e-05, 'epoch': 0.28} {'loss': 1.0244, 'learning_rate': 1.9115103401061868e-05, 'epoch': 0.28} {'loss': 0.6857, 'learning_rate': 1.9114968763970598e-05, 'epoch': 0.28} {'loss': 0.8382, 'learning_rate': 1.9114834117111817e-05, 'epoch': 0.28} {'loss': 0.9557, 'learning_rate': 1.9114699460485666e-05, 'epoch': 0.28} {'loss': 0.849, 'learning_rate': 1.9114564794092293e-05, 'epoch': 0.28} {'loss': 0.9009, 'learning_rate': 1.911443011793184e-05, 'epoch': 0.28} {'loss': 0.9635, 'learning_rate': 1.9114295432004456e-05, 'epoch': 0.28} {'loss': 1.0312, 'learning_rate': 1.9114160736310282e-05, 'epoch': 0.28} {'loss': 0.9428, 'learning_rate': 1.9114026030849456e-05, 'epoch': 0.28} {'loss': 1.0874, 'learning_rate': 1.9113891315622134e-05, 'epoch': 0.28} {'loss': 0.7989, 'learning_rate': 1.9113756590628454e-05, 'epoch': 0.28} {'loss': 0.8483, 'learning_rate': 1.9113621855868558e-05, 'epoch': 0.28} {'loss': 0.7922, 'learning_rate': 1.91134871113426e-05, 'epoch': 0.28} {'loss': 0.7964, 'learning_rate': 1.911335235705071e-05, 'epoch': 0.28} {'loss': 0.9503, 'learning_rate': 1.9113217592993047e-05, 'epoch': 0.28} {'loss': 0.9152, 'learning_rate': 1.9113082819169747e-05, 'epoch': 0.28} {'loss': 0.8281, 'learning_rate': 1.9112948035580956e-05, 'epoch': 0.28} {'loss': 0.9834, 'learning_rate': 1.9112813242226818e-05, 'epoch': 0.28} {'loss': 0.9427, 'learning_rate': 1.9112678439107478e-05, 'epoch': 0.28} {'loss': 0.8336, 'learning_rate': 1.911254362622308e-05, 'epoch': 0.28} {'loss': 0.9277, 'learning_rate': 1.9112408803573773e-05, 'epoch': 0.28} {'loss': 0.9674, 'learning_rate': 1.9112273971159692e-05, 'epoch': 0.28} {'loss': 0.7638, 'learning_rate': 1.911213912898099e-05, 'epoch': 0.28} {'loss': 0.9164, 'learning_rate': 1.911200427703781e-05, 'epoch': 0.28} {'loss': 0.8985, 'learning_rate': 1.911186941533029e-05, 'epoch': 0.28} {'loss': 0.8934, 'learning_rate': 1.9111734543858583e-05, 'epoch': 0.28} {'loss': 0.8783, 'learning_rate': 1.9111599662622832e-05, 'epoch': 0.28} {'loss': 0.6531, 'learning_rate': 1.9111464771623176e-05, 'epoch': 0.28} {'loss': 1.0995, 'learning_rate': 1.9111329870859764e-05, 'epoch': 0.28} {'loss': 0.9726, 'learning_rate': 1.911119496033274e-05, 'epoch': 0.28} {'loss': 0.8436, 'learning_rate': 1.9111060040042247e-05, 'epoch': 0.28} {'loss': 0.8771, 'learning_rate': 1.9110925109988433e-05, 'epoch': 0.28} {'loss': 1.1312, 'learning_rate': 1.911079017017144e-05, 'epoch': 0.28} {'loss': 0.8673, 'learning_rate': 1.9110655220591415e-05, 'epoch': 0.28} {'loss': 0.8944, 'learning_rate': 1.91105202612485e-05, 'epoch': 0.28} {'loss': 1.0688, 'learning_rate': 1.9110385292142837e-05, 'epoch': 0.28} {'loss': 0.8021, 'learning_rate': 1.9110250313274575e-05, 'epoch': 0.28} {'loss': 0.895, 'learning_rate': 1.911011532464386e-05, 'epoch': 0.28} {'loss': 0.8973, 'learning_rate': 1.910998032625083e-05, 'epoch': 0.28} {'loss': 0.9326, 'learning_rate': 1.910984531809564e-05, 'epoch': 0.28} {'loss': 1.0476, 'learning_rate': 1.9109710300178422e-05, 'epoch': 0.28} {'loss': 0.855, 'learning_rate': 1.9109575272499328e-05, 'epoch': 0.28} {'loss': 0.6082, 'learning_rate': 1.9109440235058504e-05, 'epoch': 0.28} {'loss': 0.8634, 'learning_rate': 1.9109305187856092e-05, 'epoch': 0.28} {'loss': 1.0657, 'learning_rate': 1.910917013089224e-05, 'epoch': 0.28} {'loss': 0.8552, 'learning_rate': 1.9109035064167085e-05, 'epoch': 0.28} {'loss': 0.9311, 'learning_rate': 1.910889998768078e-05, 'epoch': 0.28} {'loss': 0.877, 'learning_rate': 1.9108764901433466e-05, 'epoch': 0.28} {'loss': 1.0447, 'learning_rate': 1.910862980542529e-05, 'epoch': 0.28} {'loss': 0.8821, 'learning_rate': 1.9108494699656393e-05, 'epoch': 0.28} {'loss': 0.842, 'learning_rate': 1.910835958412692e-05, 'epoch': 0.28} {'loss': 0.9147, 'learning_rate': 1.9108224458837023e-05, 'epoch': 0.28} {'loss': 0.7539, 'learning_rate': 1.9108089323786836e-05, 'epoch': 0.28} {'loss': 1.1513, 'learning_rate': 1.910795417897651e-05, 'epoch': 0.28} {'loss': 1.0541, 'learning_rate': 1.9107819024406193e-05, 'epoch': 0.28} {'loss': 0.8377, 'learning_rate': 1.910768386007602e-05, 'epoch': 0.28} {'loss': 1.0666, 'learning_rate': 1.9107548685986147e-05, 'epoch': 0.28} {'loss': 0.7845, 'learning_rate': 1.9107413502136715e-05, 'epoch': 0.28} {'loss': 0.9405, 'learning_rate': 1.9107278308527864e-05, 'epoch': 0.28} {'loss': 0.906, 'learning_rate': 1.910714310515974e-05, 'epoch': 0.28} {'loss': 0.8887, 'learning_rate': 1.9107007892032495e-05, 'epoch': 0.28} {'loss': 1.0251, 'learning_rate': 1.9106872669146265e-05, 'epoch': 0.28} {'loss': 0.9212, 'learning_rate': 1.91067374365012e-05, 'epoch': 0.28} {'loss': 0.9947, 'learning_rate': 1.9106602194097447e-05, 'epoch': 0.28} {'loss': 0.8691, 'learning_rate': 1.9106466941935143e-05, 'epoch': 0.28} {'loss': 1.0427, 'learning_rate': 1.9106331680014444e-05, 'epoch': 0.28} {'loss': 0.9641, 'learning_rate': 1.910619640833548e-05, 'epoch': 0.28} {'loss': 0.9194, 'learning_rate': 1.910606112689841e-05, 'epoch': 0.28} {'loss': 0.8732, 'learning_rate': 1.9105925835703375e-05, 'epoch': 0.28} {'loss': 0.7946, 'learning_rate': 1.9105790534750516e-05, 'epoch': 0.28} {'loss': 0.9943, 'learning_rate': 1.9105655224039983e-05, 'epoch': 0.28} {'loss': 1.0131, 'learning_rate': 1.910551990357192e-05, 'epoch': 0.28} {'loss': 0.8386, 'learning_rate': 1.9105384573346463e-05, 'epoch': 0.28} {'loss': 1.0904, 'learning_rate': 1.910524923336377e-05, 'epoch': 0.28} {'loss': 0.6717, 'learning_rate': 1.910511388362398e-05, 'epoch': 0.28} {'loss': 0.7513, 'learning_rate': 1.910497852412724e-05, 'epoch': 0.28} {'loss': 0.9231, 'learning_rate': 1.910484315487369e-05, 'epoch': 0.28} {'loss': 0.913, 'learning_rate': 1.9104707775863483e-05, 'epoch': 0.28} {'loss': 1.0863, 'learning_rate': 1.9104572387096757e-05, 'epoch': 0.28} {'loss': 1.0388, 'learning_rate': 1.9104436988573662e-05, 'epoch': 0.28} {'loss': 0.8715, 'learning_rate': 1.910430158029434e-05, 'epoch': 0.28} {'loss': 0.97, 'learning_rate': 1.9104166162258935e-05, 'epoch': 0.28} {'loss': 0.8541, 'learning_rate': 1.91040307344676e-05, 'epoch': 0.28} {'loss': 0.7897, 'learning_rate': 1.910389529692047e-05, 'epoch': 0.28} {'loss': 0.7534, 'learning_rate': 1.9103759849617695e-05, 'epoch': 0.28} {'loss': 0.9608, 'learning_rate': 1.910362439255942e-05, 'epoch': 0.28} {'loss': 0.8687, 'learning_rate': 1.910348892574579e-05, 'epoch': 0.28} {'loss': 0.8513, 'learning_rate': 1.910335344917695e-05, 'epoch': 0.28} {'loss': 0.9572, 'learning_rate': 1.910321796285304e-05, 'epoch': 0.28} {'loss': 0.85, 'learning_rate': 1.910308246677422e-05, 'epoch': 0.28} {'loss': 0.7445, 'learning_rate': 1.910294696094062e-05, 'epoch': 0.28} {'loss': 0.9089, 'learning_rate': 1.910281144535239e-05, 'epoch': 0.28} {'loss': 0.8702, 'learning_rate': 1.9102675920009678e-05, 'epoch': 0.28} {'loss': 0.9685, 'learning_rate': 1.9102540384912627e-05, 'epoch': 0.28} {'loss': 0.9095, 'learning_rate': 1.9102404840061385e-05, 'epoch': 0.28} {'loss': 0.7152, 'learning_rate': 1.9102269285456087e-05, 'epoch': 0.28} {'loss': 0.997, 'learning_rate': 1.9102133721096893e-05, 'epoch': 0.28} {'loss': 1.0367, 'learning_rate': 1.910199814698394e-05, 'epoch': 0.28} {'loss': 0.8434, 'learning_rate': 1.9101862563117373e-05, 'epoch': 0.28} {'loss': 0.7627, 'learning_rate': 1.9101726969497338e-05, 'epoch': 0.28} {'loss': 0.9664, 'learning_rate': 1.9101591366123983e-05, 'epoch': 0.28} {'loss': 0.7348, 'learning_rate': 1.910145575299745e-05, 'epoch': 0.28} {'loss': 0.938, 'learning_rate': 1.9101320130117885e-05, 'epoch': 0.28} {'loss': 0.7999, 'learning_rate': 1.9101184497485437e-05, 'epoch': 0.28} {'loss': 0.8524, 'learning_rate': 1.9101048855100245e-05, 'epoch': 0.28} {'loss': 0.9611, 'learning_rate': 1.910091320296246e-05, 'epoch': 0.28} {'loss': 0.8456, 'learning_rate': 1.9100777541072225e-05, 'epoch': 0.28} {'loss': 1.0219, 'learning_rate': 1.9100641869429684e-05, 'epoch': 0.28} {'loss': 1.0562, 'learning_rate': 1.9100506188034983e-05, 'epoch': 0.28} {'loss': 0.8789, 'learning_rate': 1.9100370496888272e-05, 'epoch': 0.28} {'loss': 0.9781, 'learning_rate': 1.910023479598969e-05, 'epoch': 0.28} {'loss': 1.0359, 'learning_rate': 1.9100099085339387e-05, 'epoch': 0.28} {'loss': 1.0808, 'learning_rate': 1.9099963364937503e-05, 'epoch': 0.28} {'loss': 0.9281, 'learning_rate': 1.909982763478419e-05, 'epoch': 0.28} {'loss': 0.9937, 'learning_rate': 1.909969189487959e-05, 'epoch': 0.28} {'loss': 0.7385, 'learning_rate': 1.909955614522385e-05, 'epoch': 0.28} {'loss': 0.9172, 'learning_rate': 1.9099420385817114e-05, 'epoch': 0.28} {'loss': 0.8696, 'learning_rate': 1.9099284616659526e-05, 'epoch': 0.28} {'loss': 0.9486, 'learning_rate': 1.909914883775123e-05, 'epoch': 0.28} {'loss': 0.8386, 'learning_rate': 1.909901304909238e-05, 'epoch': 0.28} {'loss': 0.8919, 'learning_rate': 1.9098877250683116e-05, 'epoch': 0.28} {'loss': 0.7742, 'learning_rate': 1.9098741442523584e-05, 'epoch': 0.28} {'loss': 0.8454, 'learning_rate': 1.9098605624613927e-05, 'epoch': 0.28} {'loss': 0.8646, 'learning_rate': 1.9098469796954295e-05, 'epoch': 0.28} {'loss': 0.984, 'learning_rate': 1.9098333959544832e-05, 'epoch': 0.28} {'loss': 0.9016, 'learning_rate': 1.9098198112385677e-05, 'epoch': 0.28} {'loss': 0.7836, 'learning_rate': 1.9098062255476987e-05, 'epoch': 0.28} {'loss': 0.9442, 'learning_rate': 1.90979263888189e-05, 'epoch': 0.28} {'loss': 0.9233, 'learning_rate': 1.9097790512411566e-05, 'epoch': 0.28} {'loss': 0.7171, 'learning_rate': 1.9097654626255127e-05, 'epoch': 0.28} {'loss': 0.91, 'learning_rate': 1.9097518730349728e-05, 'epoch': 0.28} {'loss': 0.9316, 'learning_rate': 1.9097382824695518e-05, 'epoch': 0.28} {'loss': 1.007, 'learning_rate': 1.9097246909292644e-05, 'epoch': 0.28} {'loss': 0.9719, 'learning_rate': 1.9097110984141247e-05, 'epoch': 0.28} {'loss': 0.9361, 'learning_rate': 1.9096975049241476e-05, 'epoch': 0.28} {'loss': 0.8517, 'learning_rate': 1.909683910459347e-05, 'epoch': 0.28} {'loss': 0.9025, 'learning_rate': 1.9096703150197384e-05, 'epoch': 0.28} {'loss': 0.8844, 'learning_rate': 1.9096567186053358e-05, 'epoch': 0.28} {'loss': 0.8691, 'learning_rate': 1.909643121216154e-05, 'epoch': 0.28} {'loss': 1.0416, 'learning_rate': 1.9096295228522078e-05, 'epoch': 0.28} {'loss': 0.7829, 'learning_rate': 1.909615923513511e-05, 'epoch': 0.28} {'loss': 0.9434, 'learning_rate': 1.9096023232000787e-05, 'epoch': 0.28} {'loss': 0.8577, 'learning_rate': 1.9095887219119257e-05, 'epoch': 0.28} {'loss': 0.9164, 'learning_rate': 1.9095751196490658e-05, 'epoch': 0.28} {'loss': 0.8503, 'learning_rate': 1.9095615164115146e-05, 'epoch': 0.28} {'loss': 0.8866, 'learning_rate': 1.909547912199286e-05, 'epoch': 0.28} {'loss': 0.8774, 'learning_rate': 1.9095343070123948e-05, 'epoch': 0.28} {'loss': 0.7069, 'learning_rate': 1.909520700850855e-05, 'epoch': 0.28} {'loss': 0.8996, 'learning_rate': 1.909507093714682e-05, 'epoch': 0.28} {'loss': 0.8521, 'learning_rate': 1.9094934856038902e-05, 'epoch': 0.28} {'loss': 0.8237, 'learning_rate': 1.9094798765184936e-05, 'epoch': 0.28} {'loss': 1.1761, 'learning_rate': 1.9094662664585077e-05, 'epoch': 0.28} {'loss': 0.8423, 'learning_rate': 1.9094526554239464e-05, 'epoch': 0.28} {'loss': 0.7103, 'learning_rate': 1.9094390434148245e-05, 'epoch': 0.28} {'loss': 0.7952, 'learning_rate': 1.9094254304311567e-05, 'epoch': 0.28} {'loss': 0.6619, 'learning_rate': 1.9094118164729575e-05, 'epoch': 0.28} {'loss': 0.8816, 'learning_rate': 1.9093982015402414e-05, 'epoch': 0.28} {'loss': 0.91, 'learning_rate': 1.9093845856330228e-05, 'epoch': 0.28} {'loss': 0.9411, 'learning_rate': 1.9093709687513168e-05, 'epoch': 0.28} {'loss': 0.9302, 'learning_rate': 1.9093573508951377e-05, 'epoch': 0.28} {'loss': 0.9343, 'learning_rate': 1.9093437320645e-05, 'epoch': 0.28} {'loss': 0.9131, 'learning_rate': 1.9093301122594187e-05, 'epoch': 0.28} {'loss': 0.8075, 'learning_rate': 1.909316491479908e-05, 'epoch': 0.28} {'loss': 0.9179, 'learning_rate': 1.9093028697259824e-05, 'epoch': 0.28} {'loss': 0.7877, 'learning_rate': 1.909289246997657e-05, 'epoch': 0.28} {'loss': 0.8561, 'learning_rate': 1.9092756232949457e-05, 'epoch': 0.28} {'loss': 0.8978, 'learning_rate': 1.909261998617864e-05, 'epoch': 0.28} {'loss': 0.9423, 'learning_rate': 1.9092483729664258e-05, 'epoch': 0.28} {'loss': 0.7447, 'learning_rate': 1.909234746340646e-05, 'epoch': 0.28} {'loss': 0.9102, 'learning_rate': 1.9092211187405386e-05, 'epoch': 0.28} {'loss': 0.9876, 'learning_rate': 1.9092074901661194e-05, 'epoch': 0.28} {'loss': 0.7903, 'learning_rate': 1.9091938606174016e-05, 'epoch': 0.28} {'loss': 0.8082, 'learning_rate': 1.909180230094401e-05, 'epoch': 0.28} {'loss': 0.9276, 'learning_rate': 1.9091665985971318e-05, 'epoch': 0.28} {'loss': 0.7726, 'learning_rate': 1.9091529661256082e-05, 'epoch': 0.28} {'loss': 0.7378, 'learning_rate': 1.9091393326798453e-05, 'epoch': 0.28} {'loss': 0.9223, 'learning_rate': 1.9091256982598576e-05, 'epoch': 0.28} {'loss': 0.9588, 'learning_rate': 1.9091120628656597e-05, 'epoch': 0.28} {'loss': 0.7829, 'learning_rate': 1.9090984264972662e-05, 'epoch': 0.28} {'loss': 0.869, 'learning_rate': 1.9090847891546916e-05, 'epoch': 0.28} {'loss': 0.8626, 'learning_rate': 1.9090711508379502e-05, 'epoch': 0.28} {'loss': 0.9551, 'learning_rate': 1.9090575115470575e-05, 'epoch': 0.28} {'loss': 0.8523, 'learning_rate': 1.9090438712820275e-05, 'epoch': 0.28} {'loss': 0.8874, 'learning_rate': 1.909030230042875e-05, 'epoch': 0.28} {'loss': 0.8453, 'learning_rate': 1.9090165878296147e-05, 'epoch': 0.28} {'loss': 0.7959, 'learning_rate': 1.9090029446422607e-05, 'epoch': 0.28} {'loss': 0.8644, 'learning_rate': 1.9089893004808283e-05, 'epoch': 0.28} {'loss': 0.9541, 'learning_rate': 1.9089756553453318e-05, 'epoch': 0.28} {'loss': 0.8682, 'learning_rate': 1.9089620092357856e-05, 'epoch': 0.28} {'loss': 0.891, 'learning_rate': 1.908948362152205e-05, 'epoch': 0.28} {'loss': 0.7972, 'learning_rate': 1.9089347140946037e-05, 'epoch': 0.28} {'loss': 0.8304, 'learning_rate': 1.9089210650629972e-05, 'epoch': 0.28} {'loss': 0.7961, 'learning_rate': 1.9089074150573993e-05, 'epoch': 0.28} {'loss': 0.7069, 'learning_rate': 1.9088937640778257e-05, 'epoch': 0.28} {'loss': 1.0219, 'learning_rate': 1.90888011212429e-05, 'epoch': 0.28} {'loss': 0.8697, 'learning_rate': 1.908866459196807e-05, 'epoch': 0.28} {'loss': 0.8086, 'learning_rate': 1.908852805295392e-05, 'epoch': 0.28} {'loss': 0.9629, 'learning_rate': 1.908839150420059e-05, 'epoch': 0.28} {'loss': 0.9696, 'learning_rate': 1.908825494570823e-05, 'epoch': 0.28} {'loss': 0.8468, 'learning_rate': 1.9088118377476984e-05, 'epoch': 0.28} {'loss': 0.97, 'learning_rate': 1.9087981799506998e-05, 'epoch': 0.28} {'loss': 0.7109, 'learning_rate': 1.908784521179842e-05, 'epoch': 0.28} {'loss': 1.0278, 'learning_rate': 1.9087708614351396e-05, 'epoch': 0.28} {'loss': 0.8074, 'learning_rate': 1.9087572007166068e-05, 'epoch': 0.28} {'loss': 1.035, 'learning_rate': 1.908743539024259e-05, 'epoch': 0.28} {'loss': 0.8102, 'learning_rate': 1.9087298763581104e-05, 'epoch': 0.28} {'loss': 0.8205, 'learning_rate': 1.908716212718176e-05, 'epoch': 0.28} {'loss': 0.8631, 'learning_rate': 1.9087025481044695e-05, 'epoch': 0.28} {'loss': 0.8926, 'learning_rate': 1.908688882517007e-05, 'epoch': 0.28} {'loss': 0.9397, 'learning_rate': 1.908675215955802e-05, 'epoch': 0.28} {'loss': 0.9791, 'learning_rate': 1.9086615484208694e-05, 'epoch': 0.28} {'loss': 0.8849, 'learning_rate': 1.908647879912224e-05, 'epoch': 0.28} {'loss': 0.969, 'learning_rate': 1.90863421042988e-05, 'epoch': 0.28} {'loss': 0.9676, 'learning_rate': 1.9086205399738528e-05, 'epoch': 0.28} {'loss': 0.8703, 'learning_rate': 1.9086068685441567e-05, 'epoch': 0.28} {'loss': 0.8296, 'learning_rate': 1.9085931961408065e-05, 'epoch': 0.28} {'loss': 0.9215, 'learning_rate': 1.9085795227638166e-05, 'epoch': 0.28} {'loss': 0.8473, 'learning_rate': 1.9085658484132016e-05, 'epoch': 0.28} {'loss': 0.8298, 'learning_rate': 1.908552173088976e-05, 'epoch': 0.28} {'loss': 1.008, 'learning_rate': 1.9085384967911554e-05, 'epoch': 0.28} {'loss': 0.7297, 'learning_rate': 1.9085248195197536e-05, 'epoch': 0.28} {'loss': 0.8251, 'learning_rate': 1.908511141274785e-05, 'epoch': 0.28} {'loss': 0.9507, 'learning_rate': 1.908497462056265e-05, 'epoch': 0.28} {'loss': 0.8895, 'learning_rate': 1.9084837818642082e-05, 'epoch': 0.28} {'loss': 0.993, 'learning_rate': 1.9084701006986287e-05, 'epoch': 0.28} {'loss': 0.9803, 'learning_rate': 1.9084564185595417e-05, 'epoch': 0.28} {'loss': 1.1412, 'learning_rate': 1.9084427354469618e-05, 'epoch': 0.28} {'loss': 1.2149, 'learning_rate': 1.908429051360903e-05, 'epoch': 0.28} {'loss': 0.8635, 'learning_rate': 1.908415366301381e-05, 'epoch': 0.28} {'loss': 0.9237, 'learning_rate': 1.9084016802684097e-05, 'epoch': 0.28} {'loss': 0.8965, 'learning_rate': 1.908387993262004e-05, 'epoch': 0.28} {'loss': 0.8811, 'learning_rate': 1.9083743052821787e-05, 'epoch': 0.28} {'loss': 1.0543, 'learning_rate': 1.9083606163289485e-05, 'epoch': 0.28} {'loss': 0.8632, 'learning_rate': 1.9083469264023273e-05, 'epoch': 0.28} {'loss': 0.8343, 'learning_rate': 1.908333235502331e-05, 'epoch': 0.28} {'loss': 0.9248, 'learning_rate': 1.9083195436289734e-05, 'epoch': 0.28} {'loss': 0.7683, 'learning_rate': 1.9083058507822695e-05, 'epoch': 0.28} {'loss': 0.8138, 'learning_rate': 1.908292156962234e-05, 'epoch': 0.28} {'loss': 1.0702, 'learning_rate': 1.9082784621688813e-05, 'epoch': 0.28} {'loss': 0.6446, 'learning_rate': 1.908264766402226e-05, 'epoch': 0.28} {'loss': 1.0196, 'learning_rate': 1.9082510696622837e-05, 'epoch': 0.28} {'loss': 0.8971, 'learning_rate': 1.9082373719490678e-05, 'epoch': 0.28} {'loss': 1.0038, 'learning_rate': 1.908223673262594e-05, 'epoch': 0.28} {'loss': 0.8168, 'learning_rate': 1.908209973602876e-05, 'epoch': 0.28} {'loss': 0.6099, 'learning_rate': 1.9081962729699298e-05, 'epoch': 0.28} {'loss': 0.8259, 'learning_rate': 1.908182571363769e-05, 'epoch': 0.28} {'loss': 0.8112, 'learning_rate': 1.9081688687844084e-05, 'epoch': 0.28} {'loss': 0.7338, 'learning_rate': 1.908155165231863e-05, 'epoch': 0.28} {'loss': 0.8416, 'learning_rate': 1.908141460706147e-05, 'epoch': 0.28} {'loss': 0.8139, 'learning_rate': 1.908127755207276e-05, 'epoch': 0.28} {'loss': 0.9556, 'learning_rate': 1.9081140487352643e-05, 'epoch': 0.28} {'loss': 0.8759, 'learning_rate': 1.908100341290126e-05, 'epoch': 0.28} {'loss': 0.948, 'learning_rate': 1.9080866328718765e-05, 'epoch': 0.28} {'loss': 1.0092, 'learning_rate': 1.90807292348053e-05, 'epoch': 0.28} {'loss': 0.7601, 'learning_rate': 1.9080592131161015e-05, 'epoch': 0.28} {'loss': 0.8067, 'learning_rate': 1.9080455017786054e-05, 'epoch': 0.28} {'loss': 0.8862, 'learning_rate': 1.908031789468057e-05, 'epoch': 0.28} {'loss': 0.8961, 'learning_rate': 1.9080180761844702e-05, 'epoch': 0.28} {'loss': 0.7318, 'learning_rate': 1.9080043619278603e-05, 'epoch': 0.28} {'loss': 0.9074, 'learning_rate': 1.9079906466982416e-05, 'epoch': 0.28} {'loss': 0.8782, 'learning_rate': 1.907976930495629e-05, 'epoch': 0.28} {'loss': 0.8669, 'learning_rate': 1.9079632133200373e-05, 'epoch': 0.28} {'loss': 0.9596, 'learning_rate': 1.907949495171481e-05, 'epoch': 0.28} {'loss': 0.8733, 'learning_rate': 1.9079357760499748e-05, 'epoch': 0.28} {'loss': 0.9043, 'learning_rate': 1.9079220559555335e-05, 'epoch': 0.28} {'loss': 0.8295, 'learning_rate': 1.907908334888172e-05, 'epoch': 0.28} {'loss': 0.9644, 'learning_rate': 1.9078946128479045e-05, 'epoch': 0.28} {'loss': 0.941, 'learning_rate': 1.907880889834746e-05, 'epoch': 0.28} {'loss': 0.7067, 'learning_rate': 1.9078671658487115e-05, 'epoch': 0.28} {'loss': 0.8649, 'learning_rate': 1.9078534408898152e-05, 'epoch': 0.28} {'loss': 1.1273, 'learning_rate': 1.9078397149580718e-05, 'epoch': 0.28} {'loss': 0.8883, 'learning_rate': 1.9078259880534965e-05, 'epoch': 0.28} {'loss': 0.8686, 'learning_rate': 1.907812260176103e-05, 'epoch': 0.28} {'loss': 0.8259, 'learning_rate': 1.9077985313259077e-05, 'epoch': 0.28} {'loss': 0.8945, 'learning_rate': 1.907784801502924e-05, 'epoch': 0.28} {'loss': 0.9826, 'learning_rate': 1.907771070707167e-05, 'epoch': 0.28} {'loss': 0.9188, 'learning_rate': 1.9077573389386512e-05, 'epoch': 0.28} {'loss': 1.0104, 'learning_rate': 1.9077436061973914e-05, 'epoch': 0.28} {'loss': 0.7823, 'learning_rate': 1.9077298724834027e-05, 'epoch': 0.28} {'loss': 1.0546, 'learning_rate': 1.9077161377966993e-05, 'epoch': 0.28} {'loss': 1.0584, 'learning_rate': 1.907702402137296e-05, 'epoch': 0.28} {'loss': 0.8527, 'learning_rate': 1.907688665505208e-05, 'epoch': 0.28} {'loss': 0.8974, 'learning_rate': 1.9076749279004495e-05, 'epoch': 0.28} {'loss': 0.8245, 'learning_rate': 1.907661189323035e-05, 'epoch': 0.28} {'loss': 0.8648, 'learning_rate': 1.9076474497729806e-05, 'epoch': 0.28} {'loss': 0.9449, 'learning_rate': 1.907633709250299e-05, 'epoch': 0.28} {'loss': 0.9601, 'learning_rate': 1.9076199677550067e-05, 'epoch': 0.28} {'loss': 0.8584, 'learning_rate': 1.9076062252871174e-05, 'epoch': 0.28} {'loss': 0.809, 'learning_rate': 1.907592481846646e-05, 'epoch': 0.28} {'loss': 0.6939, 'learning_rate': 1.9075787374336076e-05, 'epoch': 0.28} {'loss': 0.923, 'learning_rate': 1.9075649920480165e-05, 'epoch': 0.28} {'loss': 1.0378, 'learning_rate': 1.9075512456898876e-05, 'epoch': 0.28} {'loss': 0.8595, 'learning_rate': 1.9075374983592357e-05, 'epoch': 0.28} {'loss': 1.0484, 'learning_rate': 1.9075237500560755e-05, 'epoch': 0.28} {'loss': 0.8795, 'learning_rate': 1.9075100007804216e-05, 'epoch': 0.28} {'loss': 0.9191, 'learning_rate': 1.9074962505322884e-05, 'epoch': 0.28} {'loss': 1.0093, 'learning_rate': 1.9074824993116916e-05, 'epoch': 0.28} {'loss': 0.8319, 'learning_rate': 1.9074687471186454e-05, 'epoch': 0.28} {'loss': 0.7971, 'learning_rate': 1.9074549939531645e-05, 'epoch': 0.28} {'loss': 0.9752, 'learning_rate': 1.9074412398152635e-05, 'epoch': 0.28} {'loss': 0.8448, 'learning_rate': 1.9074274847049573e-05, 'epoch': 0.28} {'loss': 0.8958, 'learning_rate': 1.907413728622261e-05, 'epoch': 0.28} {'loss': 0.8623, 'learning_rate': 1.9073999715671884e-05, 'epoch': 0.28} {'loss': 0.9353, 'learning_rate': 1.9073862135397552e-05, 'epoch': 0.28} {'loss': 0.7603, 'learning_rate': 1.907372454539976e-05, 'epoch': 0.28} {'loss': 0.7227, 'learning_rate': 1.907358694567865e-05, 'epoch': 0.28} {'loss': 0.7656, 'learning_rate': 1.9073449336234374e-05, 'epoch': 0.28} {'loss': 0.8471, 'learning_rate': 1.9073311717067077e-05, 'epoch': 0.28} {'loss': 0.9204, 'learning_rate': 1.907317408817691e-05, 'epoch': 0.28} {'loss': 1.0126, 'learning_rate': 1.9073036449564014e-05, 'epoch': 0.28} {'loss': 0.7986, 'learning_rate': 1.9072898801228542e-05, 'epoch': 0.28} {'loss': 0.825, 'learning_rate': 1.907276114317064e-05, 'epoch': 0.28} {'loss': 0.711, 'learning_rate': 1.9072623475390456e-05, 'epoch': 0.28} {'loss': 1.0374, 'learning_rate': 1.907248579788814e-05, 'epoch': 0.28} {'loss': 0.8556, 'learning_rate': 1.9072348110663833e-05, 'epoch': 0.28} {'loss': 0.9056, 'learning_rate': 1.9072210413717686e-05, 'epoch': 0.28} {'loss': 0.8151, 'learning_rate': 1.907207270704985e-05, 'epoch': 0.28} {'loss': 1.0342, 'learning_rate': 1.9071934990660464e-05, 'epoch': 0.28} {'loss': 0.6908, 'learning_rate': 1.9071797264549685e-05, 'epoch': 0.28} {'loss': 0.9418, 'learning_rate': 1.9071659528717658e-05, 'epoch': 0.28} {'loss': 0.9111, 'learning_rate': 1.9071521783164524e-05, 'epoch': 0.28} {'loss': 0.9986, 'learning_rate': 1.9071384027890438e-05, 'epoch': 0.28} {'loss': 0.8025, 'learning_rate': 1.9071246262895548e-05, 'epoch': 0.28} {'loss': 0.7924, 'learning_rate': 1.9071108488179995e-05, 'epoch': 0.28} {'loss': 0.754, 'learning_rate': 1.907097070374393e-05, 'epoch': 0.28} {'loss': 0.888, 'learning_rate': 1.9070832909587504e-05, 'epoch': 0.28} {'loss': 0.8655, 'learning_rate': 1.907069510571086e-05, 'epoch': 0.28} {'loss': 1.0003, 'learning_rate': 1.9070557292114148e-05, 'epoch': 0.28} {'loss': 0.8268, 'learning_rate': 1.9070419468797515e-05, 'epoch': 0.28} {'loss': 0.848, 'learning_rate': 1.907028163576111e-05, 'epoch': 0.28} {'loss': 0.937, 'learning_rate': 1.907014379300508e-05, 'epoch': 0.28} {'loss': 0.9561, 'learning_rate': 1.907000594052957e-05, 'epoch': 0.28} {'loss': 1.1039, 'learning_rate': 1.9069868078334736e-05, 'epoch': 0.28} {'loss': 0.8741, 'learning_rate': 1.906973020642071e-05, 'epoch': 0.28} {'loss': 0.8456, 'learning_rate': 1.9069592324787658e-05, 'epoch': 0.28} {'loss': 0.9044, 'learning_rate': 1.9069454433435716e-05, 'epoch': 0.28} {'loss': 0.9613, 'learning_rate': 1.9069316532365033e-05, 'epoch': 0.28} {'loss': 0.9297, 'learning_rate': 1.9069178621575762e-05, 'epoch': 0.28} {'loss': 0.9, 'learning_rate': 1.9069040701068045e-05, 'epoch': 0.28} {'loss': 1.018, 'learning_rate': 1.9068902770842034e-05, 'epoch': 0.28} {'loss': 1.0051, 'learning_rate': 1.9068764830897875e-05, 'epoch': 0.28} {'loss': 1.0534, 'learning_rate': 1.9068626881235714e-05, 'epoch': 0.28} {'loss': 0.8248, 'learning_rate': 1.9068488921855704e-05, 'epoch': 0.28} {'loss': 0.9617, 'learning_rate': 1.906835095275799e-05, 'epoch': 0.28} {'loss': 0.8021, 'learning_rate': 1.9068212973942716e-05, 'epoch': 0.28} {'loss': 0.9269, 'learning_rate': 1.9068074985410033e-05, 'epoch': 0.28} {'loss': 0.7797, 'learning_rate': 1.906793698716009e-05, 'epoch': 0.28} {'loss': 0.9955, 'learning_rate': 1.9067798979193037e-05, 'epoch': 0.28} {'loss': 0.8099, 'learning_rate': 1.9067660961509017e-05, 'epoch': 0.28} {'loss': 0.8457, 'learning_rate': 1.9067522934108182e-05, 'epoch': 0.28} {'loss': 0.9519, 'learning_rate': 1.9067384896990675e-05, 'epoch': 0.28} {'loss': 1.0326, 'learning_rate': 1.9067246850156647e-05, 'epoch': 0.28} {'loss': 0.9818, 'learning_rate': 1.9067108793606247e-05, 'epoch': 0.28} {'loss': 0.8423, 'learning_rate': 1.906697072733962e-05, 'epoch': 0.28} {'loss': 0.8814, 'learning_rate': 1.9066832651356918e-05, 'epoch': 0.28} {'loss': 0.9392, 'learning_rate': 1.9066694565658284e-05, 'epoch': 0.28} {'loss': 0.7117, 'learning_rate': 1.9066556470243867e-05, 'epoch': 0.28} {'loss': 0.9336, 'learning_rate': 1.906641836511382e-05, 'epoch': 0.28} {'loss': 0.9051, 'learning_rate': 1.9066280250268288e-05, 'epoch': 0.28} {'loss': 0.9367, 'learning_rate': 1.9066142125707413e-05, 'epoch': 0.28} {'loss': 0.9099, 'learning_rate': 1.9066003991431355e-05, 'epoch': 0.28} {'loss': 0.9808, 'learning_rate': 1.9065865847440252e-05, 'epoch': 0.28} {'loss': 0.9827, 'learning_rate': 1.9065727693734255e-05, 'epoch': 0.28} {'loss': 0.8578, 'learning_rate': 1.9065589530313514e-05, 'epoch': 0.28} {'loss': 0.7695, 'learning_rate': 1.9065451357178176e-05, 'epoch': 0.28} {'loss': 0.9635, 'learning_rate': 1.9065313174328387e-05, 'epoch': 0.28} {'loss': 0.8015, 'learning_rate': 1.9065174981764295e-05, 'epoch': 0.28} {'loss': 0.9155, 'learning_rate': 1.9065036779486054e-05, 'epoch': 0.28} {'loss': 0.901, 'learning_rate': 1.9064898567493805e-05, 'epoch': 0.28} {'loss': 0.6848, 'learning_rate': 1.9064760345787704e-05, 'epoch': 0.28} {'loss': 0.8554, 'learning_rate': 1.906462211436789e-05, 'epoch': 0.28} {'loss': 0.9344, 'learning_rate': 1.9064483873234513e-05, 'epoch': 0.28} {'loss': 0.8501, 'learning_rate': 1.9064345622387727e-05, 'epoch': 0.28} {'loss': 0.9496, 'learning_rate': 1.9064207361827676e-05, 'epoch': 0.28} {'loss': 1.1614, 'learning_rate': 1.906406909155451e-05, 'epoch': 0.28} {'loss': 0.7447, 'learning_rate': 1.9063930811568373e-05, 'epoch': 0.28} {'loss': 0.8633, 'learning_rate': 1.9063792521869416e-05, 'epoch': 0.28} {'loss': 0.9155, 'learning_rate': 1.906365422245779e-05, 'epoch': 0.28} {'loss': 0.9597, 'learning_rate': 1.906351591333364e-05, 'epoch': 0.28} {'loss': 0.8874, 'learning_rate': 1.9063377594497113e-05, 'epoch': 0.28} {'loss': 0.775, 'learning_rate': 1.9063239265948356e-05, 'epoch': 0.28} {'loss': 0.934, 'learning_rate': 1.9063100927687527e-05, 'epoch': 0.28} {'loss': 0.9763, 'learning_rate': 1.9062962579714763e-05, 'epoch': 0.28} {'loss': 0.8814, 'learning_rate': 1.9062824222030218e-05, 'epoch': 0.28} {'loss': 0.9105, 'learning_rate': 1.9062685854634037e-05, 'epoch': 0.28} {'loss': 0.9872, 'learning_rate': 1.9062547477526375e-05, 'epoch': 0.28} {'loss': 0.8196, 'learning_rate': 1.906240909070737e-05, 'epoch': 0.28} {'loss': 0.7638, 'learning_rate': 1.906227069417718e-05, 'epoch': 0.28} {'loss': 0.7827, 'learning_rate': 1.9062132287935948e-05, 'epoch': 0.28} {'loss': 0.7807, 'learning_rate': 1.906199387198382e-05, 'epoch': 0.28} {'loss': 0.9339, 'learning_rate': 1.906185544632095e-05, 'epoch': 0.28} {'loss': 0.88, 'learning_rate': 1.906171701094748e-05, 'epoch': 0.28} {'loss': 0.8254, 'learning_rate': 1.906157856586357e-05, 'epoch': 0.28} {'loss': 0.8591, 'learning_rate': 1.9061440111069356e-05, 'epoch': 0.28} {'loss': 0.8263, 'learning_rate': 1.9061301646564995e-05, 'epoch': 0.28} {'loss': 0.9852, 'learning_rate': 1.9061163172350624e-05, 'epoch': 0.28} {'loss': 0.9134, 'learning_rate': 1.9061024688426406e-05, 'epoch': 0.28} {'loss': 0.989, 'learning_rate': 1.906088619479248e-05, 'epoch': 0.28} {'loss': 0.8618, 'learning_rate': 1.9060747691448994e-05, 'epoch': 0.28} {'loss': 0.8685, 'learning_rate': 1.9060609178396102e-05, 'epoch': 0.28} {'loss': 0.9743, 'learning_rate': 1.906047065563395e-05, 'epoch': 0.28} {'loss': 0.9407, 'learning_rate': 1.9060332123162682e-05, 'epoch': 0.28} {'loss': 0.9895, 'learning_rate': 1.9060193580982455e-05, 'epoch': 0.28} {'loss': 0.8788, 'learning_rate': 1.906005502909341e-05, 'epoch': 0.28} {'loss': 1.0285, 'learning_rate': 1.90599164674957e-05, 'epoch': 0.28} {'loss': 0.9484, 'learning_rate': 1.9059777896189468e-05, 'epoch': 0.28} {'loss': 0.9287, 'learning_rate': 1.905963931517487e-05, 'epoch': 0.28} {'loss': 0.8153, 'learning_rate': 1.9059500724452053e-05, 'epoch': 0.28} {'loss': 0.958, 'learning_rate': 1.905936212402116e-05, 'epoch': 0.28} {'loss': 0.9549, 'learning_rate': 1.905922351388234e-05, 'epoch': 0.28} {'loss': 1.0508, 'learning_rate': 1.905908489403575e-05, 'epoch': 0.28} {'loss': 0.8363, 'learning_rate': 1.905894626448153e-05, 'epoch': 0.28} {'loss': 0.9714, 'learning_rate': 1.9058807625219833e-05, 'epoch': 0.28} {'loss': 0.9433, 'learning_rate': 1.9058668976250805e-05, 'epoch': 0.28} {'loss': 1.0427, 'learning_rate': 1.9058530317574596e-05, 'epoch': 0.28} {'loss': 0.8589, 'learning_rate': 1.9058391649191352e-05, 'epoch': 0.28} {'loss': 0.7528, 'learning_rate': 1.9058252971101226e-05, 'epoch': 0.28} {'loss': 0.9222, 'learning_rate': 1.9058114283304367e-05, 'epoch': 0.28} {'loss': 1.0024, 'learning_rate': 1.9057975585800913e-05, 'epoch': 0.28} {'loss': 1.1306, 'learning_rate': 1.9057836878591027e-05, 'epoch': 0.28} {'loss': 0.7955, 'learning_rate': 1.9057698161674852e-05, 'epoch': 0.28} {'loss': 0.8233, 'learning_rate': 1.9057559435052534e-05, 'epoch': 0.28} {'loss': 0.9648, 'learning_rate': 1.9057420698724224e-05, 'epoch': 0.28} {'loss': 0.8945, 'learning_rate': 1.9057281952690068e-05, 'epoch': 0.28} {'loss': 0.9603, 'learning_rate': 1.905714319695022e-05, 'epoch': 0.28} {'loss': 0.9105, 'learning_rate': 1.9057004431504823e-05, 'epoch': 0.28} {'loss': 0.9642, 'learning_rate': 1.9056865656354028e-05, 'epoch': 0.28} {'loss': 1.0019, 'learning_rate': 1.9056726871497987e-05, 'epoch': 0.28} {'loss': 0.9175, 'learning_rate': 1.9056588076936843e-05, 'epoch': 0.28} {'loss': 0.9246, 'learning_rate': 1.905644927267075e-05, 'epoch': 0.28} {'loss': 0.9019, 'learning_rate': 1.905631045869985e-05, 'epoch': 0.28} {'loss': 0.7951, 'learning_rate': 1.90561716350243e-05, 'epoch': 0.28} {'loss': 1.1257, 'learning_rate': 1.9056032801644246e-05, 'epoch': 0.28} {'loss': 0.7376, 'learning_rate': 1.905589395855983e-05, 'epoch': 0.28} {'loss': 1.0546, 'learning_rate': 1.905575510577121e-05, 'epoch': 0.28} {'loss': 0.8556, 'learning_rate': 1.905561624327853e-05, 'epoch': 0.28} {'loss': 0.9597, 'learning_rate': 1.905547737108194e-05, 'epoch': 0.28} {'loss': 0.7419, 'learning_rate': 1.9055338489181586e-05, 'epoch': 0.28} {'loss': 0.853, 'learning_rate': 1.9055199597577625e-05, 'epoch': 0.28} {'loss': 1.0714, 'learning_rate': 1.9055060696270197e-05, 'epoch': 0.28} {'loss': 0.9689, 'learning_rate': 1.9054921785259455e-05, 'epoch': 0.28} {'loss': 0.9825, 'learning_rate': 1.905478286454555e-05, 'epoch': 0.28} {'loss': 0.9133, 'learning_rate': 1.9054643934128622e-05, 'epoch': 0.28} {'loss': 0.8154, 'learning_rate': 1.905450499400883e-05, 'epoch': 0.28} {'loss': 0.7612, 'learning_rate': 1.9054366044186316e-05, 'epoch': 0.28} {'loss': 0.8932, 'learning_rate': 1.9054227084661233e-05, 'epoch': 0.28} {'loss': 0.9111, 'learning_rate': 1.905408811543373e-05, 'epoch': 0.28} {'loss': 0.9858, 'learning_rate': 1.9053949136503952e-05, 'epoch': 0.28} {'loss': 0.9349, 'learning_rate': 1.9053810147872052e-05, 'epoch': 0.28} {'loss': 0.8929, 'learning_rate': 1.9053671149538176e-05, 'epoch': 0.28} {'loss': 0.9382, 'learning_rate': 1.9053532141502472e-05, 'epoch': 0.28} {'loss': 0.8383, 'learning_rate': 1.9053393123765097e-05, 'epoch': 0.28} {'loss': 0.863, 'learning_rate': 1.905325409632619e-05, 'epoch': 0.28} {'loss': 0.7888, 'learning_rate': 1.9053115059185905e-05, 'epoch': 0.28} {'loss': 0.9089, 'learning_rate': 1.905297601234439e-05, 'epoch': 0.28} {'loss': 0.8502, 'learning_rate': 1.9052836955801793e-05, 'epoch': 0.28} {'loss': 0.8637, 'learning_rate': 1.9052697889558267e-05, 'epoch': 0.28} {'loss': 0.7881, 'learning_rate': 1.9052558813613956e-05, 'epoch': 0.28} {'loss': 1.0668, 'learning_rate': 1.905241972796901e-05, 'epoch': 0.28} {'loss': 0.8816, 'learning_rate': 1.9052280632623585e-05, 'epoch': 0.28} {'loss': 1.0643, 'learning_rate': 1.9052141527577818e-05, 'epoch': 0.28} {'loss': 0.7731, 'learning_rate': 1.9052002412831867e-05, 'epoch': 0.28} {'loss': 0.8604, 'learning_rate': 1.9051863288385877e-05, 'epoch': 0.28} {'loss': 0.8567, 'learning_rate': 1.9051724154240002e-05, 'epoch': 0.28} {'loss': 0.9259, 'learning_rate': 1.9051585010394383e-05, 'epoch': 0.28} {'loss': 0.7544, 'learning_rate': 1.9051445856849177e-05, 'epoch': 0.28} {'loss': 0.9577, 'learning_rate': 1.9051306693604528e-05, 'epoch': 0.28} {'loss': 0.9488, 'learning_rate': 1.905116752066059e-05, 'epoch': 0.28} {'loss': 0.6626, 'learning_rate': 1.9051028338017504e-05, 'epoch': 0.28} {'loss': 0.8783, 'learning_rate': 1.9050889145675427e-05, 'epoch': 0.28} {'loss': 0.9397, 'learning_rate': 1.9050749943634508e-05, 'epoch': 0.28} {'loss': 0.9846, 'learning_rate': 1.905061073189489e-05, 'epoch': 0.29} {'loss': 0.9501, 'learning_rate': 1.905047151045673e-05, 'epoch': 0.29} {'loss': 0.6433, 'learning_rate': 1.9050332279320163e-05, 'epoch': 0.29} {'loss': 0.9099, 'learning_rate': 1.9050193038485355e-05, 'epoch': 0.29} {'loss': 0.7726, 'learning_rate': 1.905005378795245e-05, 'epoch': 0.29} {'loss': 0.9103, 'learning_rate': 1.9049914527721594e-05, 'epoch': 0.29} {'loss': 0.912, 'learning_rate': 1.9049775257792936e-05, 'epoch': 0.29} {'loss': 0.9861, 'learning_rate': 1.904963597816663e-05, 'epoch': 0.29} {'loss': 1.048, 'learning_rate': 1.9049496688842823e-05, 'epoch': 0.29} {'loss': 1.0221, 'learning_rate': 1.904935738982166e-05, 'epoch': 0.29} {'loss': 0.7502, 'learning_rate': 1.9049218081103293e-05, 'epoch': 0.29} {'loss': 0.8556, 'learning_rate': 1.9049078762687876e-05, 'epoch': 0.29} {'loss': 0.8969, 'learning_rate': 1.904893943457555e-05, 'epoch': 0.29} {'loss': 0.7662, 'learning_rate': 1.904880009676647e-05, 'epoch': 0.29} {'loss': 0.8895, 'learning_rate': 1.9048660749260788e-05, 'epoch': 0.29} {'loss': 0.7848, 'learning_rate': 1.9048521392058646e-05, 'epoch': 0.29} {'loss': 0.8374, 'learning_rate': 1.90483820251602e-05, 'epoch': 0.29} {'loss': 0.8879, 'learning_rate': 1.9048242648565592e-05, 'epoch': 0.29} {'loss': 0.9059, 'learning_rate': 1.9048103262274977e-05, 'epoch': 0.29} {'loss': 0.9174, 'learning_rate': 1.90479638662885e-05, 'epoch': 0.29} {'loss': 0.8145, 'learning_rate': 1.9047824460606315e-05, 'epoch': 0.29} {'loss': 0.8615, 'learning_rate': 1.904768504522857e-05, 'epoch': 0.29} {'loss': 0.7681, 'learning_rate': 1.9047545620155413e-05, 'epoch': 0.29} {'loss': 0.9034, 'learning_rate': 1.9047406185386994e-05, 'epoch': 0.29} {'loss': 1.0155, 'learning_rate': 1.9047266740923463e-05, 'epoch': 0.29} {'loss': 0.777, 'learning_rate': 1.904712728676497e-05, 'epoch': 0.29} {'loss': 0.9135, 'learning_rate': 1.9046987822911665e-05, 'epoch': 0.29} {'loss': 0.8088, 'learning_rate': 1.9046848349363693e-05, 'epoch': 0.29} {'loss': 0.8278, 'learning_rate': 1.9046708866121208e-05, 'epoch': 0.29} {'loss': 0.848, 'learning_rate': 1.9046569373184356e-05, 'epoch': 0.29} {'loss': 0.9128, 'learning_rate': 1.904642987055329e-05, 'epoch': 0.29} {'loss': 1.0076, 'learning_rate': 1.904629035822816e-05, 'epoch': 0.29} {'loss': 0.7973, 'learning_rate': 1.904615083620911e-05, 'epoch': 0.29} {'loss': 0.8934, 'learning_rate': 1.9046011304496293e-05, 'epoch': 0.29} {'loss': 0.8893, 'learning_rate': 1.9045871763089862e-05, 'epoch': 0.29} {'loss': 0.8204, 'learning_rate': 1.9045732211989962e-05, 'epoch': 0.29} {'loss': 0.6947, 'learning_rate': 1.9045592651196742e-05, 'epoch': 0.29} {'loss': 0.96, 'learning_rate': 1.904545308071035e-05, 'epoch': 0.29} {'loss': 0.9487, 'learning_rate': 1.9045313500530943e-05, 'epoch': 0.29} {'loss': 0.9584, 'learning_rate': 1.904517391065867e-05, 'epoch': 0.29} {'loss': 0.9071, 'learning_rate': 1.9045034311093668e-05, 'epoch': 0.29} {'loss': 0.7512, 'learning_rate': 1.90448947018361e-05, 'epoch': 0.29} {'loss': 0.8673, 'learning_rate': 1.904475508288611e-05, 'epoch': 0.29} {'loss': 0.774, 'learning_rate': 1.904461545424385e-05, 'epoch': 0.29} {'loss': 0.628, 'learning_rate': 1.9044475815909466e-05, 'epoch': 0.29} {'loss': 0.9394, 'learning_rate': 1.9044336167883108e-05, 'epoch': 0.29} {'loss': 1.0105, 'learning_rate': 1.904419651016493e-05, 'epoch': 0.29} {'loss': 0.8637, 'learning_rate': 1.904405684275508e-05, 'epoch': 0.29} {'loss': 1.1698, 'learning_rate': 1.9043917165653707e-05, 'epoch': 0.29} {'loss': 0.9474, 'learning_rate': 1.9043777478860962e-05, 'epoch': 0.29} {'loss': 0.8645, 'learning_rate': 1.904363778237699e-05, 'epoch': 0.29} {'loss': 0.8405, 'learning_rate': 1.9043498076201943e-05, 'epoch': 0.29} {'loss': 0.7685, 'learning_rate': 1.9043358360335974e-05, 'epoch': 0.29} {'loss': 0.7891, 'learning_rate': 1.904321863477923e-05, 'epoch': 0.29} {'loss': 0.724, 'learning_rate': 1.904307889953186e-05, 'epoch': 0.29} {'loss': 0.8028, 'learning_rate': 1.9042939154594016e-05, 'epoch': 0.29} {'loss': 0.8727, 'learning_rate': 1.9042799399965845e-05, 'epoch': 0.29} {'loss': 0.8981, 'learning_rate': 1.90426596356475e-05, 'epoch': 0.29} {'loss': 1.0914, 'learning_rate': 1.9042519861639127e-05, 'epoch': 0.29} {'loss': 0.9707, 'learning_rate': 1.904238007794088e-05, 'epoch': 0.29} {'loss': 0.8271, 'learning_rate': 1.9042240284552907e-05, 'epoch': 0.29} {'loss': 1.0484, 'learning_rate': 1.9042100481475355e-05, 'epoch': 0.29} {'loss': 0.9072, 'learning_rate': 1.9041960668708377e-05, 'epoch': 0.29} {'loss': 0.8716, 'learning_rate': 1.9041820846252124e-05, 'epoch': 0.29} {'loss': 0.8524, 'learning_rate': 1.904168101410674e-05, 'epoch': 0.29} {'loss': 1.0484, 'learning_rate': 1.9041541172272386e-05, 'epoch': 0.29} {'loss': 0.9751, 'learning_rate': 1.9041401320749198e-05, 'epoch': 0.29} {'loss': 0.8555, 'learning_rate': 1.9041261459537336e-05, 'epoch': 0.29} {'loss': 0.9716, 'learning_rate': 1.904112158863694e-05, 'epoch': 0.29} {'loss': 0.7904, 'learning_rate': 1.904098170804817e-05, 'epoch': 0.29} {'loss': 1.0684, 'learning_rate': 1.9040841817771175e-05, 'epoch': 0.29} {'loss': 0.9362, 'learning_rate': 1.9040701917806102e-05, 'epoch': 0.29} {'loss': 1.0874, 'learning_rate': 1.9040562008153097e-05, 'epoch': 0.29} {'loss': 0.9601, 'learning_rate': 1.9040422088812314e-05, 'epoch': 0.29} {'loss': 0.9253, 'learning_rate': 1.9040282159783908e-05, 'epoch': 0.29} {'loss': 0.9157, 'learning_rate': 1.9040142221068016e-05, 'epoch': 0.29} {'loss': 0.8658, 'learning_rate': 1.90400022726648e-05, 'epoch': 0.29} {'loss': 0.9388, 'learning_rate': 1.9039862314574406e-05, 'epoch': 0.29} {'loss': 1.0764, 'learning_rate': 1.9039722346796986e-05, 'epoch': 0.29} {'loss': 0.8314, 'learning_rate': 1.903958236933268e-05, 'epoch': 0.29} {'loss': 0.9573, 'learning_rate': 1.9039442382181653e-05, 'epoch': 0.29} {'loss': 0.7529, 'learning_rate': 1.9039302385344044e-05, 'epoch': 0.29} {'loss': 1.0182, 'learning_rate': 1.9039162378820007e-05, 'epoch': 0.29} {'loss': 0.6866, 'learning_rate': 1.9039022362609694e-05, 'epoch': 0.29} {'loss': 0.8835, 'learning_rate': 1.9038882336713248e-05, 'epoch': 0.29} {'loss': 0.9043, 'learning_rate': 1.903874230113083e-05, 'epoch': 0.29} {'loss': 1.0099, 'learning_rate': 1.9038602255862578e-05, 'epoch': 0.29} {'loss': 0.867, 'learning_rate': 1.9038462200908653e-05, 'epoch': 0.29} {'loss': 0.8548, 'learning_rate': 1.9038322136269197e-05, 'epoch': 0.29} {'loss': 0.6493, 'learning_rate': 1.903818206194436e-05, 'epoch': 0.29} {'loss': 0.9584, 'learning_rate': 1.90380419779343e-05, 'epoch': 0.29} {'loss': 0.8017, 'learning_rate': 1.9037901884239163e-05, 'epoch': 0.29} {'loss': 0.8955, 'learning_rate': 1.9037761780859097e-05, 'epoch': 0.29} {'loss': 0.8167, 'learning_rate': 1.903762166779425e-05, 'epoch': 0.29} {'loss': 0.8347, 'learning_rate': 1.903748154504478e-05, 'epoch': 0.29} {'loss': 0.9128, 'learning_rate': 1.9037341412610833e-05, 'epoch': 0.29} {'loss': 0.7624, 'learning_rate': 1.9037201270492556e-05, 'epoch': 0.29} {'loss': 0.8517, 'learning_rate': 1.9037061118690103e-05, 'epoch': 0.29} {'loss': 0.8614, 'learning_rate': 1.9036920957203625e-05, 'epoch': 0.29} {'loss': 0.9461, 'learning_rate': 1.903678078603327e-05, 'epoch': 0.29} {'loss': 1.0146, 'learning_rate': 1.903664060517919e-05, 'epoch': 0.29} {'loss': 0.7191, 'learning_rate': 1.903650041464153e-05, 'epoch': 0.29} {'loss': 1.0279, 'learning_rate': 1.9036360214420448e-05, 'epoch': 0.29} {'loss': 0.9463, 'learning_rate': 1.903622000451609e-05, 'epoch': 0.29} {'loss': 1.0125, 'learning_rate': 1.90360797849286e-05, 'epoch': 0.29} {'loss': 0.8165, 'learning_rate': 1.9035939555658145e-05, 'epoch': 0.29} {'loss': 0.9424, 'learning_rate': 1.903579931670486e-05, 'epoch': 0.29} {'loss': 0.8228, 'learning_rate': 1.9035659068068902e-05, 'epoch': 0.29} {'loss': 0.8419, 'learning_rate': 1.9035518809750416e-05, 'epoch': 0.29} {'loss': 0.8395, 'learning_rate': 1.903537854174956e-05, 'epoch': 0.29} {'loss': 0.8595, 'learning_rate': 1.903523826406648e-05, 'epoch': 0.29} {'loss': 0.7863, 'learning_rate': 1.903509797670133e-05, 'epoch': 0.29} {'loss': 0.8399, 'learning_rate': 1.9034957679654252e-05, 'epoch': 0.29} {'loss': 0.9245, 'learning_rate': 1.9034817372925404e-05, 'epoch': 0.29} {'loss': 0.9733, 'learning_rate': 1.903467705651493e-05, 'epoch': 0.29} {'loss': 0.7956, 'learning_rate': 1.903453673042299e-05, 'epoch': 0.29} {'loss': 0.8194, 'learning_rate': 1.9034396394649724e-05, 'epoch': 0.29} {'loss': 0.81, 'learning_rate': 1.9034256049195285e-05, 'epoch': 0.29} {'loss': 0.8495, 'learning_rate': 1.903411569405983e-05, 'epoch': 0.29} {'loss': 0.9208, 'learning_rate': 1.90339753292435e-05, 'epoch': 0.29} {'loss': 0.7261, 'learning_rate': 1.9033834954746455e-05, 'epoch': 0.29} {'loss': 0.8529, 'learning_rate': 1.9033694570568838e-05, 'epoch': 0.29} {'loss': 0.8807, 'learning_rate': 1.9033554176710803e-05, 'epoch': 0.29} {'loss': 0.6875, 'learning_rate': 1.9033413773172496e-05, 'epoch': 0.29} {'loss': 0.9518, 'learning_rate': 1.9033273359954077e-05, 'epoch': 0.29} {'loss': 0.8978, 'learning_rate': 1.9033132937055687e-05, 'epoch': 0.29} {'loss': 1.0405, 'learning_rate': 1.9032992504477475e-05, 'epoch': 0.29} {'loss': 0.872, 'learning_rate': 1.9032852062219605e-05, 'epoch': 0.29} {'loss': 0.9453, 'learning_rate': 1.9032711610282212e-05, 'epoch': 0.29} {'loss': 0.7674, 'learning_rate': 1.903257114866546e-05, 'epoch': 0.29} {'loss': 0.9305, 'learning_rate': 1.9032430677369483e-05, 'epoch': 0.29} {'loss': 0.8446, 'learning_rate': 1.9032290196394448e-05, 'epoch': 0.29} {'loss': 0.9353, 'learning_rate': 1.90321497057405e-05, 'epoch': 0.29} {'loss': 1.0578, 'learning_rate': 1.9032009205407785e-05, 'epoch': 0.29} {'loss': 0.7498, 'learning_rate': 1.903186869539646e-05, 'epoch': 0.29} {'loss': 0.9007, 'learning_rate': 1.903172817570667e-05, 'epoch': 0.29} {'loss': 0.8661, 'learning_rate': 1.9031587646338567e-05, 'epoch': 0.29} {'loss': 0.9192, 'learning_rate': 1.9031447107292305e-05, 'epoch': 0.29} {'loss': 0.9008, 'learning_rate': 1.9031306558568032e-05, 'epoch': 0.29} {'loss': 1.0142, 'learning_rate': 1.90311660001659e-05, 'epoch': 0.29} {'loss': 0.927, 'learning_rate': 1.9031025432086058e-05, 'epoch': 0.29} {'loss': 0.976, 'learning_rate': 1.9030884854328656e-05, 'epoch': 0.29} {'loss': 0.8681, 'learning_rate': 1.9030744266893845e-05, 'epoch': 0.29} {'loss': 0.9464, 'learning_rate': 1.9030603669781778e-05, 'epoch': 0.29} {'loss': 0.8543, 'learning_rate': 1.9030463062992603e-05, 'epoch': 0.29} {'loss': 0.7694, 'learning_rate': 1.9030322446526473e-05, 'epoch': 0.29} {'loss': 0.9841, 'learning_rate': 1.9030181820383537e-05, 'epoch': 0.29} {'loss': 0.9302, 'learning_rate': 1.9030041184563944e-05, 'epoch': 0.29} {'loss': 0.7553, 'learning_rate': 1.902990053906785e-05, 'epoch': 0.29} {'loss': 0.8, 'learning_rate': 1.90297598838954e-05, 'epoch': 0.29} {'loss': 0.7414, 'learning_rate': 1.902961921904675e-05, 'epoch': 0.29} {'loss': 0.9769, 'learning_rate': 1.9029478544522046e-05, 'epoch': 0.29} {'loss': 0.906, 'learning_rate': 1.9029337860321443e-05, 'epoch': 0.29} {'loss': 0.809, 'learning_rate': 1.9029197166445087e-05, 'epoch': 0.29} {'loss': 0.6062, 'learning_rate': 1.9029056462893135e-05, 'epoch': 0.29} {'loss': 0.8443, 'learning_rate': 1.902891574966573e-05, 'epoch': 0.29} {'loss': 0.7388, 'learning_rate': 1.9028775026763027e-05, 'epoch': 0.29} {'loss': 0.8995, 'learning_rate': 1.9028634294185177e-05, 'epoch': 0.29} {'loss': 0.9052, 'learning_rate': 1.9028493551932333e-05, 'epoch': 0.29} {'loss': 0.9316, 'learning_rate': 1.9028352800004642e-05, 'epoch': 0.29} {'loss': 0.9059, 'learning_rate': 1.9028212038402256e-05, 'epoch': 0.29} {'loss': 0.9252, 'learning_rate': 1.9028071267125324e-05, 'epoch': 0.29} {'loss': 0.9113, 'learning_rate': 1.9027930486174e-05, 'epoch': 0.29} {'loss': 0.8637, 'learning_rate': 1.9027789695548434e-05, 'epoch': 0.29} {'loss': 0.7837, 'learning_rate': 1.902764889524878e-05, 'epoch': 0.29} {'loss': 1.0372, 'learning_rate': 1.902750808527518e-05, 'epoch': 0.29} {'loss': 0.9674, 'learning_rate': 1.9027367265627794e-05, 'epoch': 0.29} {'loss': 1.0102, 'learning_rate': 1.9027226436306767e-05, 'epoch': 0.29} {'loss': 0.8515, 'learning_rate': 1.902708559731225e-05, 'epoch': 0.29} {'loss': 0.9637, 'learning_rate': 1.90269447486444e-05, 'epoch': 0.29} {'loss': 0.9215, 'learning_rate': 1.9026803890303365e-05, 'epoch': 0.29} {'loss': 0.78, 'learning_rate': 1.902666302228929e-05, 'epoch': 0.29} {'loss': 0.9286, 'learning_rate': 1.9026522144602336e-05, 'epoch': 0.29} {'loss': 0.8527, 'learning_rate': 1.9026381257242645e-05, 'epoch': 0.29} {'loss': 0.8701, 'learning_rate': 1.9026240360210373e-05, 'epoch': 0.29} {'loss': 0.9623, 'learning_rate': 1.9026099453505673e-05, 'epoch': 0.29} {'loss': 0.86, 'learning_rate': 1.9025958537128687e-05, 'epoch': 0.29} {'loss': 0.8853, 'learning_rate': 1.9025817611079577e-05, 'epoch': 0.29} {'loss': 0.7127, 'learning_rate': 1.9025676675358486e-05, 'epoch': 0.29} {'loss': 0.7917, 'learning_rate': 1.902553572996557e-05, 'epoch': 0.29} {'loss': 0.7917, 'learning_rate': 1.9025394774900973e-05, 'epoch': 0.29} {'loss': 0.8141, 'learning_rate': 1.9025253810164853e-05, 'epoch': 0.29} {'loss': 0.8816, 'learning_rate': 1.902511283575736e-05, 'epoch': 0.29} {'loss': 1.1511, 'learning_rate': 1.9024971851678647e-05, 'epoch': 0.29} {'loss': 0.8976, 'learning_rate': 1.9024830857928857e-05, 'epoch': 0.29} {'loss': 1.0643, 'learning_rate': 1.9024689854508146e-05, 'epoch': 0.29} {'loss': 0.9885, 'learning_rate': 1.902454884141667e-05, 'epoch': 0.29} {'loss': 0.8244, 'learning_rate': 1.9024407818654575e-05, 'epoch': 0.29} {'loss': 0.8737, 'learning_rate': 1.902426678622201e-05, 'epoch': 0.29} {'loss': 0.9485, 'learning_rate': 1.902412574411913e-05, 'epoch': 0.29} {'loss': 1.0072, 'learning_rate': 1.9023984692346082e-05, 'epoch': 0.29} {'loss': 0.8302, 'learning_rate': 1.902384363090302e-05, 'epoch': 0.29} {'loss': 0.8886, 'learning_rate': 1.90237025597901e-05, 'epoch': 0.29} {'loss': 1.0094, 'learning_rate': 1.9023561479007464e-05, 'epoch': 0.29} {'loss': 0.9182, 'learning_rate': 1.902342038855527e-05, 'epoch': 0.29} {'loss': 0.8941, 'learning_rate': 1.9023279288433665e-05, 'epoch': 0.29} {'loss': 0.8693, 'learning_rate': 1.90231381786428e-05, 'epoch': 0.29} {'loss': 0.9987, 'learning_rate': 1.902299705918283e-05, 'epoch': 0.29} {'loss': 0.9535, 'learning_rate': 1.9022855930053906e-05, 'epoch': 0.29} {'loss': 0.8855, 'learning_rate': 1.9022714791256175e-05, 'epoch': 0.29} {'loss': 0.8741, 'learning_rate': 1.9022573642789793e-05, 'epoch': 0.29} {'loss': 0.8289, 'learning_rate': 1.9022432484654905e-05, 'epoch': 0.29} {'loss': 0.8588, 'learning_rate': 1.9022291316851672e-05, 'epoch': 0.29} {'loss': 0.9155, 'learning_rate': 1.9022150139380236e-05, 'epoch': 0.29} {'loss': 1.0052, 'learning_rate': 1.9022008952240752e-05, 'epoch': 0.29} {'loss': 0.6863, 'learning_rate': 1.9021867755433373e-05, 'epoch': 0.29} {'loss': 1.0122, 'learning_rate': 1.9021726548958247e-05, 'epoch': 0.29} {'loss': 1.0633, 'learning_rate': 1.9021585332815525e-05, 'epoch': 0.29} {'loss': 0.7435, 'learning_rate': 1.902144410700536e-05, 'epoch': 0.29} {'loss': 0.9143, 'learning_rate': 1.9021302871527906e-05, 'epoch': 0.29} {'loss': 0.9244, 'learning_rate': 1.9021161626383314e-05, 'epoch': 0.29} {'loss': 0.8014, 'learning_rate': 1.902102037157173e-05, 'epoch': 0.29} {'loss': 0.7565, 'learning_rate': 1.9020879107093305e-05, 'epoch': 0.29} {'loss': 0.904, 'learning_rate': 1.90207378329482e-05, 'epoch': 0.29} {'loss': 0.8406, 'learning_rate': 1.9020596549136553e-05, 'epoch': 0.29} {'loss': 0.9118, 'learning_rate': 1.902045525565853e-05, 'epoch': 0.29} {'loss': 0.8954, 'learning_rate': 1.9020313952514272e-05, 'epoch': 0.29} {'loss': 0.8998, 'learning_rate': 1.9020172639703935e-05, 'epoch': 0.29} {'loss': 0.8239, 'learning_rate': 1.9020031317227668e-05, 'epoch': 0.29} {'loss': 0.8238, 'learning_rate': 1.901988998508562e-05, 'epoch': 0.29} {'loss': 0.8542, 'learning_rate': 1.901974864327795e-05, 'epoch': 0.29} {'loss': 0.9119, 'learning_rate': 1.9019607291804804e-05, 'epoch': 0.29} {'loss': 0.8983, 'learning_rate': 1.9019465930666335e-05, 'epoch': 0.29} {'loss': 0.8996, 'learning_rate': 1.9019324559862695e-05, 'epoch': 0.29} {'loss': 0.7253, 'learning_rate': 1.9019183179394032e-05, 'epoch': 0.29} {'loss': 0.9987, 'learning_rate': 1.90190417892605e-05, 'epoch': 0.29} {'loss': 1.0364, 'learning_rate': 1.9018900389462254e-05, 'epoch': 0.29} {'loss': 1.0246, 'learning_rate': 1.901875897999944e-05, 'epoch': 0.29} {'loss': 0.8607, 'learning_rate': 1.901861756087221e-05, 'epoch': 0.29} {'loss': 0.9721, 'learning_rate': 1.9018476132080723e-05, 'epoch': 0.29} {'loss': 0.98, 'learning_rate': 1.9018334693625123e-05, 'epoch': 0.29} {'loss': 0.7394, 'learning_rate': 1.9018193245505562e-05, 'epoch': 0.29} {'loss': 0.6927, 'learning_rate': 1.9018051787722192e-05, 'epoch': 0.29} {'loss': 0.8377, 'learning_rate': 1.9017910320275165e-05, 'epoch': 0.29} {'loss': 0.7988, 'learning_rate': 1.9017768843164638e-05, 'epoch': 0.29} {'loss': 0.9133, 'learning_rate': 1.9017627356390752e-05, 'epoch': 0.29} {'loss': 0.7835, 'learning_rate': 1.9017485859953667e-05, 'epoch': 0.29} {'loss': 0.673, 'learning_rate': 1.901734435385353e-05, 'epoch': 0.29} {'loss': 0.8522, 'learning_rate': 1.90172028380905e-05, 'epoch': 0.29} {'loss': 1.0201, 'learning_rate': 1.901706131266472e-05, 'epoch': 0.29} {'loss': 0.9075, 'learning_rate': 1.9016919777576343e-05, 'epoch': 0.29} {'loss': 0.9776, 'learning_rate': 1.9016778232825526e-05, 'epoch': 0.29} {'loss': 0.9088, 'learning_rate': 1.9016636678412417e-05, 'epoch': 0.29} {'loss': 0.8216, 'learning_rate': 1.9016495114337166e-05, 'epoch': 0.29} {'loss': 0.786, 'learning_rate': 1.9016353540599928e-05, 'epoch': 0.29} {'loss': 0.9272, 'learning_rate': 1.901621195720085e-05, 'epoch': 0.29} {'loss': 0.976, 'learning_rate': 1.901607036414009e-05, 'epoch': 0.29} {'loss': 0.7684, 'learning_rate': 1.90159287614178e-05, 'epoch': 0.29} {'loss': 0.8534, 'learning_rate': 1.9015787149034125e-05, 'epoch': 0.29} {'loss': 0.866, 'learning_rate': 1.901564552698922e-05, 'epoch': 0.29} {'loss': 0.8562, 'learning_rate': 1.901550389528324e-05, 'epoch': 0.29} {'loss': 0.938, 'learning_rate': 1.901536225391633e-05, 'epoch': 0.29} {'loss': 0.7456, 'learning_rate': 1.9015220602888648e-05, 'epoch': 0.29} {'loss': 1.0022, 'learning_rate': 1.901507894220034e-05, 'epoch': 0.29} {'loss': 0.9489, 'learning_rate': 1.9014937271851566e-05, 'epoch': 0.29} {'loss': 0.8023, 'learning_rate': 1.9014795591842472e-05, 'epoch': 0.29} {'loss': 0.7442, 'learning_rate': 1.901465390217321e-05, 'epoch': 0.29} {'loss': 0.9996, 'learning_rate': 1.9014512202843932e-05, 'epoch': 0.29} {'loss': 0.7735, 'learning_rate': 1.901437049385479e-05, 'epoch': 0.29} {'loss': 0.8404, 'learning_rate': 1.901422877520594e-05, 'epoch': 0.29} {'loss': 0.7949, 'learning_rate': 1.901408704689753e-05, 'epoch': 0.29} {'loss': 0.9266, 'learning_rate': 1.9013945308929708e-05, 'epoch': 0.29} {'loss': 0.9059, 'learning_rate': 1.9013803561302634e-05, 'epoch': 0.29} {'loss': 0.7035, 'learning_rate': 1.901366180401645e-05, 'epoch': 0.29} {'loss': 0.8622, 'learning_rate': 1.9013520037071323e-05, 'epoch': 0.29} {'loss': 0.791, 'learning_rate': 1.901337826046739e-05, 'epoch': 0.29} {'loss': 0.8935, 'learning_rate': 1.901323647420481e-05, 'epoch': 0.29} {'loss': 0.9492, 'learning_rate': 1.9013094678283733e-05, 'epoch': 0.29} {'loss': 0.8961, 'learning_rate': 1.901295287270431e-05, 'epoch': 0.29} {'loss': 0.9651, 'learning_rate': 1.9012811057466698e-05, 'epoch': 0.29} {'loss': 1.0341, 'learning_rate': 1.9012669232571043e-05, 'epoch': 0.29} {'loss': 0.9343, 'learning_rate': 1.90125273980175e-05, 'epoch': 0.29} {'loss': 0.9028, 'learning_rate': 1.901238555380622e-05, 'epoch': 0.29} {'loss': 0.9191, 'learning_rate': 1.901224369993736e-05, 'epoch': 0.29} {'loss': 0.9275, 'learning_rate': 1.9012101836411062e-05, 'epoch': 0.29} {'loss': 0.8218, 'learning_rate': 1.9011959963227485e-05, 'epoch': 0.29} {'loss': 0.9219, 'learning_rate': 1.901181808038678e-05, 'epoch': 0.29} {'loss': 0.9169, 'learning_rate': 1.9011676187889096e-05, 'epoch': 0.29} {'loss': 0.9742, 'learning_rate': 1.901153428573459e-05, 'epoch': 0.29} {'loss': 0.8737, 'learning_rate': 1.9011392373923413e-05, 'epoch': 0.29} {'loss': 0.7742, 'learning_rate': 1.9011250452455715e-05, 'epoch': 0.29} {'loss': 0.9061, 'learning_rate': 1.9011108521331645e-05, 'epoch': 0.29} {'loss': 0.9439, 'learning_rate': 1.9010966580551363e-05, 'epoch': 0.29} {'loss': 0.8418, 'learning_rate': 1.9010824630115016e-05, 'epoch': 0.29} {'loss': 0.8234, 'learning_rate': 1.9010682670022758e-05, 'epoch': 0.29} {'loss': 0.7801, 'learning_rate': 1.901054070027474e-05, 'epoch': 0.29} {'loss': 0.9008, 'learning_rate': 1.901039872087111e-05, 'epoch': 0.29} {'loss': 0.8721, 'learning_rate': 1.901025673181203e-05, 'epoch': 0.29} {'loss': 0.9035, 'learning_rate': 1.9010114733097645e-05, 'epoch': 0.29} {'loss': 0.8995, 'learning_rate': 1.900997272472811e-05, 'epoch': 0.29} {'loss': 0.7815, 'learning_rate': 1.9009830706703573e-05, 'epoch': 0.29} {'loss': 0.9801, 'learning_rate': 1.900968867902419e-05, 'epoch': 0.29} {'loss': 0.7837, 'learning_rate': 1.9009546641690115e-05, 'epoch': 0.29} {'loss': 0.8504, 'learning_rate': 1.9009404594701496e-05, 'epoch': 0.29} {'loss': 0.8275, 'learning_rate': 1.900926253805849e-05, 'epoch': 0.29} {'loss': 0.6684, 'learning_rate': 1.900912047176124e-05, 'epoch': 0.29} {'loss': 1.0995, 'learning_rate': 1.9008978395809908e-05, 'epoch': 0.29} {'loss': 0.7782, 'learning_rate': 1.9008836310204643e-05, 'epoch': 0.29} {'loss': 0.953, 'learning_rate': 1.9008694214945595e-05, 'epoch': 0.29} {'loss': 0.9937, 'learning_rate': 1.900855211003292e-05, 'epoch': 0.29} {'loss': 1.0193, 'learning_rate': 1.9008409995466764e-05, 'epoch': 0.29} {'loss': 0.8263, 'learning_rate': 1.9008267871247287e-05, 'epoch': 0.29} {'loss': 0.8761, 'learning_rate': 1.900812573737464e-05, 'epoch': 0.29} {'loss': 1.0271, 'learning_rate': 1.900798359384897e-05, 'epoch': 0.29} {'loss': 0.6704, 'learning_rate': 1.9007841440670432e-05, 'epoch': 0.29} {'loss': 0.9837, 'learning_rate': 1.9007699277839182e-05, 'epoch': 0.29} {'loss': 0.8619, 'learning_rate': 1.9007557105355364e-05, 'epoch': 0.29} {'loss': 0.8681, 'learning_rate': 1.900741492321914e-05, 'epoch': 0.29} {'loss': 0.9678, 'learning_rate': 1.900727273143066e-05, 'epoch': 0.29} {'loss': 0.9115, 'learning_rate': 1.900713052999007e-05, 'epoch': 0.29} {'loss': 0.9252, 'learning_rate': 1.9006988318897527e-05, 'epoch': 0.29} {'loss': 0.9238, 'learning_rate': 1.9006846098153183e-05, 'epoch': 0.29} {'loss': 0.779, 'learning_rate': 1.9006703867757194e-05, 'epoch': 0.29} {'loss': 1.0476, 'learning_rate': 1.900656162770971e-05, 'epoch': 0.29} {'loss': 0.7848, 'learning_rate': 1.9006419378010876e-05, 'epoch': 0.29} {'loss': 0.8757, 'learning_rate': 1.9006277118660854e-05, 'epoch': 0.29} {'loss': 0.9102, 'learning_rate': 1.9006134849659793e-05, 'epoch': 0.29} {'loss': 0.7697, 'learning_rate': 1.9005992571007846e-05, 'epoch': 0.29} {'loss': 0.91, 'learning_rate': 1.900585028270516e-05, 'epoch': 0.29} {'loss': 0.9105, 'learning_rate': 1.90057079847519e-05, 'epoch': 0.29} {'loss': 1.0257, 'learning_rate': 1.900556567714821e-05, 'epoch': 0.29} {'loss': 0.9107, 'learning_rate': 1.900542335989424e-05, 'epoch': 0.29} {'loss': 0.8891, 'learning_rate': 1.9005281032990148e-05, 'epoch': 0.29} {'loss': 0.9085, 'learning_rate': 1.9005138696436086e-05, 'epoch': 0.29} {'loss': 0.9537, 'learning_rate': 1.90049963502322e-05, 'epoch': 0.29} {'loss': 0.7328, 'learning_rate': 1.9004853994378655e-05, 'epoch': 0.29} {'loss': 0.8032, 'learning_rate': 1.9004711628875588e-05, 'epoch': 0.29} {'loss': 0.9395, 'learning_rate': 1.9004569253723166e-05, 'epoch': 0.29} {'loss': 0.9136, 'learning_rate': 1.9004426868921534e-05, 'epoch': 0.29} {'loss': 0.8245, 'learning_rate': 1.9004284474470845e-05, 'epoch': 0.29} {'loss': 0.8348, 'learning_rate': 1.9004142070371255e-05, 'epoch': 0.29} {'loss': 0.8584, 'learning_rate': 1.900399965662291e-05, 'epoch': 0.29} {'loss': 0.8722, 'learning_rate': 1.900385723322597e-05, 'epoch': 0.29} {'loss': 0.8297, 'learning_rate': 1.900371480018058e-05, 'epoch': 0.29} {'loss': 0.8744, 'learning_rate': 1.90035723574869e-05, 'epoch': 0.29} {'loss': 0.9037, 'learning_rate': 1.900342990514508e-05, 'epoch': 0.29} {'loss': 0.9205, 'learning_rate': 1.9003287443155274e-05, 'epoch': 0.29} {'loss': 0.9054, 'learning_rate': 1.900314497151763e-05, 'epoch': 0.29} {'loss': 0.8609, 'learning_rate': 1.9003002490232305e-05, 'epoch': 0.29} {'loss': 0.896, 'learning_rate': 1.900285999929945e-05, 'epoch': 0.29} {'loss': 0.9436, 'learning_rate': 1.9002717498719216e-05, 'epoch': 0.29} {'loss': 0.8382, 'learning_rate': 1.900257498849176e-05, 'epoch': 0.29} {'loss': 0.9685, 'learning_rate': 1.900243246861723e-05, 'epoch': 0.29} {'loss': 0.8797, 'learning_rate': 1.9002289939095785e-05, 'epoch': 0.29} {'loss': 0.8941, 'learning_rate': 1.900214739992757e-05, 'epoch': 0.29} {'loss': 0.8386, 'learning_rate': 1.9002004851112742e-05, 'epoch': 0.29} {'loss': 0.8635, 'learning_rate': 1.9001862292651457e-05, 'epoch': 0.29} {'loss': 0.9036, 'learning_rate': 1.9001719724543862e-05, 'epoch': 0.29} {'loss': 0.9245, 'learning_rate': 1.900157714679011e-05, 'epoch': 0.29} {'loss': 0.8097, 'learning_rate': 1.9001434559390357e-05, 'epoch': 0.29} {'loss': 0.8981, 'learning_rate': 1.9001291962344756e-05, 'epoch': 0.29} {'loss': 0.9308, 'learning_rate': 1.9001149355653455e-05, 'epoch': 0.29} {'loss': 1.0539, 'learning_rate': 1.900100673931661e-05, 'epoch': 0.29} {'loss': 0.8731, 'learning_rate': 1.9000864113334375e-05, 'epoch': 0.29} {'loss': 0.6876, 'learning_rate': 1.9000721477706904e-05, 'epoch': 0.29} {'loss': 0.8977, 'learning_rate': 1.9000578832434347e-05, 'epoch': 0.29} {'loss': 0.8443, 'learning_rate': 1.9000436177516856e-05, 'epoch': 0.29} {'loss': 0.9967, 'learning_rate': 1.9000293512954587e-05, 'epoch': 0.29} {'loss': 1.0097, 'learning_rate': 1.900015083874769e-05, 'epoch': 0.29} {'loss': 0.7241, 'learning_rate': 1.900000815489632e-05, 'epoch': 0.29} {'loss': 0.8771, 'learning_rate': 1.8999865461400624e-05, 'epoch': 0.29} {'loss': 0.8877, 'learning_rate': 1.8999722758260764e-05, 'epoch': 0.29} {'loss': 0.7249, 'learning_rate': 1.899958004547689e-05, 'epoch': 0.29} {'loss': 0.6885, 'learning_rate': 1.899943732304915e-05, 'epoch': 0.29} {'loss': 0.825, 'learning_rate': 1.8999294590977703e-05, 'epoch': 0.29} {'loss': 0.8371, 'learning_rate': 1.89991518492627e-05, 'epoch': 0.29} {'loss': 0.8242, 'learning_rate': 1.8999009097904297e-05, 'epoch': 0.29} {'loss': 0.9018, 'learning_rate': 1.8998866336902634e-05, 'epoch': 0.29} {'loss': 1.0838, 'learning_rate': 1.899872356625788e-05, 'epoch': 0.29} {'loss': 0.8192, 'learning_rate': 1.8998580785970183e-05, 'epoch': 0.29} {'loss': 0.8058, 'learning_rate': 1.8998437996039692e-05, 'epoch': 0.29} {'loss': 0.9917, 'learning_rate': 1.899829519646656e-05, 'epoch': 0.29} {'loss': 0.8192, 'learning_rate': 1.8998152387250947e-05, 'epoch': 0.29} {'loss': 0.9132, 'learning_rate': 1.8998009568393e-05, 'epoch': 0.29} {'loss': 0.7796, 'learning_rate': 1.8997866739892875e-05, 'epoch': 0.29} {'loss': 0.8879, 'learning_rate': 1.899772390175072e-05, 'epoch': 0.29} {'loss': 0.8937, 'learning_rate': 1.8997581053966696e-05, 'epoch': 0.29} {'loss': 0.687, 'learning_rate': 1.899743819654095e-05, 'epoch': 0.29} {'loss': 0.903, 'learning_rate': 1.8997295329473636e-05, 'epoch': 0.29} {'loss': 0.8403, 'learning_rate': 1.8997152452764908e-05, 'epoch': 0.29} {'loss': 0.8159, 'learning_rate': 1.899700956641492e-05, 'epoch': 0.29} {'loss': 0.9655, 'learning_rate': 1.8996866670423825e-05, 'epoch': 0.29} {'loss': 0.843, 'learning_rate': 1.899672376479177e-05, 'epoch': 0.29} {'loss': 0.963, 'learning_rate': 1.899658084951892e-05, 'epoch': 0.29} {'loss': 0.9297, 'learning_rate': 1.899643792460542e-05, 'epoch': 0.29} {'loss': 0.8933, 'learning_rate': 1.899629499005142e-05, 'epoch': 0.29} {'loss': 0.783, 'learning_rate': 1.8996152045857085e-05, 'epoch': 0.29} {'loss': 0.6692, 'learning_rate': 1.8996009092022558e-05, 'epoch': 0.29} {'loss': 0.9682, 'learning_rate': 1.8995866128547996e-05, 'epoch': 0.29} {'loss': 0.9174, 'learning_rate': 1.8995723155433552e-05, 'epoch': 0.29} {'loss': 0.9672, 'learning_rate': 1.899558017267938e-05, 'epoch': 0.29} {'loss': 0.9439, 'learning_rate': 1.8995437180285625e-05, 'epoch': 0.29} {'loss': 0.9408, 'learning_rate': 1.8995294178252454e-05, 'epoch': 0.29} {'loss': 0.9696, 'learning_rate': 1.899515116658001e-05, 'epoch': 0.29} {'loss': 0.9596, 'learning_rate': 1.899500814526845e-05, 'epoch': 0.29} {'loss': 0.8506, 'learning_rate': 1.8994865114317932e-05, 'epoch': 0.29} {'loss': 0.8036, 'learning_rate': 1.8994722073728597e-05, 'epoch': 0.29} {'loss': 0.7942, 'learning_rate': 1.899457902350061e-05, 'epoch': 0.29} {'loss': 0.9731, 'learning_rate': 1.899443596363412e-05, 'epoch': 0.29} {'loss': 0.8001, 'learning_rate': 1.8994292894129277e-05, 'epoch': 0.29} {'loss': 0.9564, 'learning_rate': 1.8994149814986237e-05, 'epoch': 0.29} {'loss': 0.8532, 'learning_rate': 1.8994006726205155e-05, 'epoch': 0.29} {'loss': 0.8173, 'learning_rate': 1.8993863627786184e-05, 'epoch': 0.29} {'loss': 0.9001, 'learning_rate': 1.8993720519729474e-05, 'epoch': 0.29} {'loss': 0.9146, 'learning_rate': 1.8993577402035184e-05, 'epoch': 0.29} {'loss': 1.1067, 'learning_rate': 1.8993434274703464e-05, 'epoch': 0.29} {'loss': 0.9589, 'learning_rate': 1.8993291137734468e-05, 'epoch': 0.29} {'loss': 0.8708, 'learning_rate': 1.8993147991128344e-05, 'epoch': 0.29} {'loss': 0.7695, 'learning_rate': 1.8993004834885255e-05, 'epoch': 0.29} {'loss': 0.8536, 'learning_rate': 1.8992861669005347e-05, 'epoch': 0.29} {'loss': 0.8415, 'learning_rate': 1.899271849348878e-05, 'epoch': 0.29} {'loss': 0.9186, 'learning_rate': 1.8992575308335697e-05, 'epoch': 0.29} {'loss': 0.7676, 'learning_rate': 1.8992432113546263e-05, 'epoch': 0.29} {'loss': 0.9458, 'learning_rate': 1.8992288909120623e-05, 'epoch': 0.29} {'loss': 0.8158, 'learning_rate': 1.8992145695058937e-05, 'epoch': 0.29} {'loss': 0.9426, 'learning_rate': 1.8992002471361352e-05, 'epoch': 0.29} {'loss': 0.7829, 'learning_rate': 1.8991859238028027e-05, 'epoch': 0.29} {'loss': 0.8378, 'learning_rate': 1.899171599505911e-05, 'epoch': 0.29} {'loss': 0.854, 'learning_rate': 1.8991572742454766e-05, 'epoch': 0.29} {'loss': 0.8817, 'learning_rate': 1.8991429480215133e-05, 'epoch': 0.29} {'loss': 0.9653, 'learning_rate': 1.8991286208340375e-05, 'epoch': 0.29} {'loss': 0.9167, 'learning_rate': 1.899114292683064e-05, 'epoch': 0.29} {'loss': 1.0863, 'learning_rate': 1.8990999635686086e-05, 'epoch': 0.29} {'loss': 0.7448, 'learning_rate': 1.899085633490686e-05, 'epoch': 0.29} {'loss': 0.9512, 'learning_rate': 1.8990713024493126e-05, 'epoch': 0.29} {'loss': 0.9221, 'learning_rate': 1.899056970444503e-05, 'epoch': 0.29} {'loss': 0.7641, 'learning_rate': 1.8990426374762726e-05, 'epoch': 0.29} {'loss': 0.906, 'learning_rate': 1.8990283035446367e-05, 'epoch': 0.29} {'loss': 0.8436, 'learning_rate': 1.899013968649611e-05, 'epoch': 0.29} {'loss': 0.8143, 'learning_rate': 1.8989996327912107e-05, 'epoch': 0.29} {'loss': 0.7257, 'learning_rate': 1.898985295969451e-05, 'epoch': 0.29} {'loss': 0.9402, 'learning_rate': 1.8989709581843476e-05, 'epoch': 0.29} {'loss': 0.9667, 'learning_rate': 1.8989566194359156e-05, 'epoch': 0.29} {'loss': 0.872, 'learning_rate': 1.8989422797241706e-05, 'epoch': 0.29} {'loss': 1.0222, 'learning_rate': 1.8989279390491276e-05, 'epoch': 0.29} {'loss': 1.0028, 'learning_rate': 1.8989135974108025e-05, 'epoch': 0.29} {'loss': 0.8493, 'learning_rate': 1.89889925480921e-05, 'epoch': 0.29} {'loss': 0.8415, 'learning_rate': 1.898884911244366e-05, 'epoch': 0.29} {'loss': 0.8928, 'learning_rate': 1.8988705667162855e-05, 'epoch': 0.29} {'loss': 0.8187, 'learning_rate': 1.898856221224984e-05, 'epoch': 0.29} {'loss': 0.7463, 'learning_rate': 1.8988418747704773e-05, 'epoch': 0.29} {'loss': 0.9247, 'learning_rate': 1.89882752735278e-05, 'epoch': 0.29} {'loss': 0.906, 'learning_rate': 1.8988131789719083e-05, 'epoch': 0.29} {'loss': 0.7279, 'learning_rate': 1.898798829627877e-05, 'epoch': 0.29} {'loss': 0.992, 'learning_rate': 1.8987844793207014e-05, 'epoch': 0.29} {'loss': 1.0611, 'learning_rate': 1.8987701280503973e-05, 'epoch': 0.29} {'loss': 0.8076, 'learning_rate': 1.8987557758169803e-05, 'epoch': 0.29} {'loss': 0.9008, 'learning_rate': 1.8987414226204647e-05, 'epoch': 0.29} {'loss': 0.7499, 'learning_rate': 1.898727068460867e-05, 'epoch': 0.29} {'loss': 0.9323, 'learning_rate': 1.8987127133382018e-05, 'epoch': 0.29} {'loss': 0.8509, 'learning_rate': 1.898698357252485e-05, 'epoch': 0.29} {'loss': 1.1511, 'learning_rate': 1.8986840002037316e-05, 'epoch': 0.29} {'loss': 0.8386, 'learning_rate': 1.8986696421919574e-05, 'epoch': 0.29} {'loss': 0.751, 'learning_rate': 1.8986552832171775e-05, 'epoch': 0.29} {'loss': 0.7709, 'learning_rate': 1.8986409232794076e-05, 'epoch': 0.29} {'loss': 0.8808, 'learning_rate': 1.8986265623786625e-05, 'epoch': 0.29} {'loss': 0.8782, 'learning_rate': 1.8986122005149582e-05, 'epoch': 0.29} {'loss': 0.8533, 'learning_rate': 1.8985978376883096e-05, 'epoch': 0.29} {'loss': 0.8024, 'learning_rate': 1.8985834738987322e-05, 'epoch': 0.29} {'loss': 0.925, 'learning_rate': 1.8985691091462417e-05, 'epoch': 0.29} {'loss': 0.8418, 'learning_rate': 1.8985547434308532e-05, 'epoch': 0.29} {'loss': 0.8428, 'learning_rate': 1.898540376752582e-05, 'epoch': 0.29} {'loss': 0.906, 'learning_rate': 1.8985260091114443e-05, 'epoch': 0.29} {'loss': 0.8429, 'learning_rate': 1.8985116405074543e-05, 'epoch': 0.29} {'loss': 1.0163, 'learning_rate': 1.8984972709406284e-05, 'epoch': 0.29} {'loss': 0.9454, 'learning_rate': 1.8984829004109815e-05, 'epoch': 0.29} {'loss': 1.0551, 'learning_rate': 1.898468528918529e-05, 'epoch': 0.29} {'loss': 0.9495, 'learning_rate': 1.8984541564632864e-05, 'epoch': 0.29} {'loss': 0.9488, 'learning_rate': 1.898439783045269e-05, 'epoch': 0.29} {'loss': 0.9203, 'learning_rate': 1.8984254086644923e-05, 'epoch': 0.29} {'loss': 0.8575, 'learning_rate': 1.8984110333209718e-05, 'epoch': 0.29} {'loss': 0.9405, 'learning_rate': 1.8983966570147228e-05, 'epoch': 0.29} {'loss': 0.8717, 'learning_rate': 1.8983822797457603e-05, 'epoch': 0.29} {'loss': 0.8197, 'learning_rate': 1.8983679015141004e-05, 'epoch': 0.29} {'loss': 0.9726, 'learning_rate': 1.8983535223197584e-05, 'epoch': 0.29} {'loss': 0.7462, 'learning_rate': 1.8983391421627493e-05, 'epoch': 0.29} {'loss': 0.8532, 'learning_rate': 1.898324761043089e-05, 'epoch': 0.29} {'loss': 1.0063, 'learning_rate': 1.898310378960792e-05, 'epoch': 0.29} {'loss': 1.0867, 'learning_rate': 1.898295995915875e-05, 'epoch': 0.29} {'loss': 0.9339, 'learning_rate': 1.8982816119083526e-05, 'epoch': 0.29} {'loss': 0.6274, 'learning_rate': 1.89826722693824e-05, 'epoch': 0.29} {'loss': 0.8219, 'learning_rate': 1.898252841005553e-05, 'epoch': 0.3} {'loss': 1.0236, 'learning_rate': 1.8982384541103077e-05, 'epoch': 0.3} {'loss': 1.0215, 'learning_rate': 1.8982240662525182e-05, 'epoch': 0.3} {'loss': 0.8283, 'learning_rate': 1.8982096774322007e-05, 'epoch': 0.3} {'loss': 0.7781, 'learning_rate': 1.8981952876493706e-05, 'epoch': 0.3} {'loss': 0.8841, 'learning_rate': 1.898180896904043e-05, 'epoch': 0.3} {'loss': 0.8214, 'learning_rate': 1.898166505196234e-05, 'epoch': 0.3} {'loss': 0.8286, 'learning_rate': 1.898152112525958e-05, 'epoch': 0.3} {'loss': 0.9197, 'learning_rate': 1.898137718893231e-05, 'epoch': 0.3} {'loss': 0.8005, 'learning_rate': 1.8981233242980685e-05, 'epoch': 0.3} {'loss': 0.8872, 'learning_rate': 1.8981089287404856e-05, 'epoch': 0.3} {'loss': 1.0088, 'learning_rate': 1.8980945322204983e-05, 'epoch': 0.3} {'loss': 0.8609, 'learning_rate': 1.8980801347381214e-05, 'epoch': 0.3} {'loss': 0.8794, 'learning_rate': 1.8980657362933708e-05, 'epoch': 0.3} {'loss': 0.8678, 'learning_rate': 1.8980513368862616e-05, 'epoch': 0.3} {'loss': 0.9329, 'learning_rate': 1.898036936516809e-05, 'epoch': 0.3} {'loss': 0.933, 'learning_rate': 1.898022535185029e-05, 'epoch': 0.3} {'loss': 0.8662, 'learning_rate': 1.898008132890937e-05, 'epoch': 0.3} {'loss': 0.9858, 'learning_rate': 1.897993729634548e-05, 'epoch': 0.3} {'loss': 0.871, 'learning_rate': 1.8979793254158777e-05, 'epoch': 0.3} {'loss': 0.8697, 'learning_rate': 1.8979649202349416e-05, 'epoch': 0.3} {'loss': 0.8104, 'learning_rate': 1.8979505140917548e-05, 'epoch': 0.3} {'loss': 0.908, 'learning_rate': 1.897936106986333e-05, 'epoch': 0.3} {'loss': 0.7829, 'learning_rate': 1.897921698918692e-05, 'epoch': 0.3} {'loss': 0.9704, 'learning_rate': 1.8979072898888466e-05, 'epoch': 0.3} {'loss': 0.8788, 'learning_rate': 1.8978928798968126e-05, 'epoch': 0.3} {'loss': 0.7633, 'learning_rate': 1.8978784689426053e-05, 'epoch': 0.3} {'loss': 0.9954, 'learning_rate': 1.8978640570262402e-05, 'epoch': 0.3} {'loss': 0.9006, 'learning_rate': 1.8978496441477327e-05, 'epoch': 0.3} {'loss': 0.8709, 'learning_rate': 1.897835230307098e-05, 'epoch': 0.3} {'loss': 0.8457, 'learning_rate': 1.8978208155043522e-05, 'epoch': 0.3} {'loss': 0.8227, 'learning_rate': 1.89780639973951e-05, 'epoch': 0.3} {'loss': 0.9355, 'learning_rate': 1.8977919830125877e-05, 'epoch': 0.3} {'loss': 0.9689, 'learning_rate': 1.8977775653235998e-05, 'epoch': 0.3} {'loss': 0.7652, 'learning_rate': 1.8977631466725624e-05, 'epoch': 0.3} {'loss': 1.1112, 'learning_rate': 1.897748727059491e-05, 'epoch': 0.3} {'loss': 0.8889, 'learning_rate': 1.8977343064844004e-05, 'epoch': 0.3} {'loss': 0.9216, 'learning_rate': 1.8977198849473066e-05, 'epoch': 0.3} {'loss': 0.8544, 'learning_rate': 1.897705462448225e-05, 'epoch': 0.3} {'loss': 0.764, 'learning_rate': 1.897691038987171e-05, 'epoch': 0.3} {'loss': 0.9303, 'learning_rate': 1.8976766145641597e-05, 'epoch': 0.3} {'loss': 0.9116, 'learning_rate': 1.8976621891792074e-05, 'epoch': 0.3} {'loss': 0.9599, 'learning_rate': 1.8976477628323288e-05, 'epoch': 0.3} {'loss': 1.1515, 'learning_rate': 1.8976333355235396e-05, 'epoch': 0.3} {'loss': 0.7438, 'learning_rate': 1.897618907252855e-05, 'epoch': 0.3} {'loss': 0.7635, 'learning_rate': 1.8976044780202915e-05, 'epoch': 0.3} {'loss': 0.9002, 'learning_rate': 1.897590047825863e-05, 'epoch': 0.3} {'loss': 1.0513, 'learning_rate': 1.897575616669586e-05, 'epoch': 0.3} {'loss': 0.8599, 'learning_rate': 1.8975611845514758e-05, 'epoch': 0.3} {'loss': 0.9551, 'learning_rate': 1.897546751471548e-05, 'epoch': 0.3} {'loss': 0.8851, 'learning_rate': 1.897532317429817e-05, 'epoch': 0.3} {'loss': 0.9495, 'learning_rate': 1.8975178824262998e-05, 'epoch': 0.3} {'loss': 0.9955, 'learning_rate': 1.8975034464610115e-05, 'epoch': 0.3} {'loss': 0.8954, 'learning_rate': 1.8974890095339663e-05, 'epoch': 0.3} {'loss': 0.8665, 'learning_rate': 1.8974745716451813e-05, 'epoch': 0.3} {'loss': 0.8717, 'learning_rate': 1.897460132794671e-05, 'epoch': 0.3} {'loss': 0.8027, 'learning_rate': 1.8974456929824515e-05, 'epoch': 0.3} {'loss': 1.0894, 'learning_rate': 1.8974312522085378e-05, 'epoch': 0.3} {'loss': 0.9245, 'learning_rate': 1.8974168104729455e-05, 'epoch': 0.3} {'loss': 0.8898, 'learning_rate': 1.89740236777569e-05, 'epoch': 0.3} {'loss': 0.9781, 'learning_rate': 1.897387924116787e-05, 'epoch': 0.3} {'loss': 0.8496, 'learning_rate': 1.8973734794962516e-05, 'epoch': 0.3} {'loss': 0.9531, 'learning_rate': 1.8973590339140998e-05, 'epoch': 0.3} {'loss': 0.7863, 'learning_rate': 1.8973445873703467e-05, 'epoch': 0.3} {'loss': 0.9796, 'learning_rate': 1.897330139865008e-05, 'epoch': 0.3} {'loss': 0.9255, 'learning_rate': 1.8973156913980988e-05, 'epoch': 0.3} {'loss': 0.8133, 'learning_rate': 1.897301241969635e-05, 'epoch': 0.3} {'loss': 0.898, 'learning_rate': 1.897286791579632e-05, 'epoch': 0.3} {'loss': 0.8576, 'learning_rate': 1.897272340228105e-05, 'epoch': 0.3} {'loss': 0.9055, 'learning_rate': 1.8972578879150697e-05, 'epoch': 0.3} {'loss': 0.8978, 'learning_rate': 1.897243434640542e-05, 'epoch': 0.3} {'loss': 0.8302, 'learning_rate': 1.8972289804045366e-05, 'epoch': 0.3} {'loss': 0.9437, 'learning_rate': 1.8972145252070694e-05, 'epoch': 0.3} {'loss': 0.6774, 'learning_rate': 1.897200069048156e-05, 'epoch': 0.3} {'loss': 0.9146, 'learning_rate': 1.897185611927812e-05, 'epoch': 0.3} {'loss': 0.9433, 'learning_rate': 1.8971711538460522e-05, 'epoch': 0.3} {'loss': 0.8258, 'learning_rate': 1.8971566948028924e-05, 'epoch': 0.3} {'loss': 0.723, 'learning_rate': 1.8971422347983486e-05, 'epoch': 0.3} {'loss': 1.0382, 'learning_rate': 1.897127773832436e-05, 'epoch': 0.3} {'loss': 0.8628, 'learning_rate': 1.89711331190517e-05, 'epoch': 0.3} {'loss': 1.0842, 'learning_rate': 1.897098849016566e-05, 'epoch': 0.3} {'loss': 0.9365, 'learning_rate': 1.8970843851666393e-05, 'epoch': 0.3} {'loss': 1.0899, 'learning_rate': 1.897069920355406e-05, 'epoch': 0.3} {'loss': 0.9143, 'learning_rate': 1.8970554545828812e-05, 'epoch': 0.3} {'loss': 0.8492, 'learning_rate': 1.8970409878490804e-05, 'epoch': 0.3} {'loss': 0.7378, 'learning_rate': 1.8970265201540195e-05, 'epoch': 0.3} {'loss': 0.9834, 'learning_rate': 1.897012051497714e-05, 'epoch': 0.3} {'loss': 0.7767, 'learning_rate': 1.8969975818801788e-05, 'epoch': 0.3} {'loss': 1.0338, 'learning_rate': 1.8969831113014298e-05, 'epoch': 0.3} {'loss': 1.0474, 'learning_rate': 1.896968639761482e-05, 'epoch': 0.3} {'loss': 1.029, 'learning_rate': 1.8969541672603518e-05, 'epoch': 0.3} {'loss': 0.9787, 'learning_rate': 1.8969396937980543e-05, 'epoch': 0.3} {'loss': 0.7601, 'learning_rate': 1.8969252193746047e-05, 'epoch': 0.3} {'loss': 0.9203, 'learning_rate': 1.8969107439900188e-05, 'epoch': 0.3} {'loss': 1.0536, 'learning_rate': 1.896896267644312e-05, 'epoch': 0.3} {'loss': 0.8263, 'learning_rate': 1.8968817903375004e-05, 'epoch': 0.3} {'loss': 0.8495, 'learning_rate': 1.8968673120695988e-05, 'epoch': 0.3} {'loss': 0.8391, 'learning_rate': 1.8968528328406227e-05, 'epoch': 0.3} {'loss': 0.9369, 'learning_rate': 1.8968383526505878e-05, 'epoch': 0.3} {'loss': 0.9377, 'learning_rate': 1.89682387149951e-05, 'epoch': 0.3} {'loss': 0.9392, 'learning_rate': 1.8968093893874042e-05, 'epoch': 0.3} {'loss': 0.7095, 'learning_rate': 1.8967949063142863e-05, 'epoch': 0.3} {'loss': 0.6851, 'learning_rate': 1.8967804222801716e-05, 'epoch': 0.3} {'loss': 0.8216, 'learning_rate': 1.896765937285076e-05, 'epoch': 0.3} {'loss': 0.9985, 'learning_rate': 1.8967514513290144e-05, 'epoch': 0.3} {'loss': 0.907, 'learning_rate': 1.896736964412003e-05, 'epoch': 0.3} {'loss': 0.9721, 'learning_rate': 1.896722476534057e-05, 'epoch': 0.3} {'loss': 1.1273, 'learning_rate': 1.8967079876951915e-05, 'epoch': 0.3} {'loss': 0.8335, 'learning_rate': 1.8966934978954232e-05, 'epoch': 0.3} {'loss': 1.083, 'learning_rate': 1.8966790071347664e-05, 'epoch': 0.3} {'loss': 0.8788, 'learning_rate': 1.896664515413237e-05, 'epoch': 0.3} {'loss': 0.8939, 'learning_rate': 1.896650022730851e-05, 'epoch': 0.3} {'loss': 0.8907, 'learning_rate': 1.8966355290876236e-05, 'epoch': 0.3} {'loss': 1.0081, 'learning_rate': 1.89662103448357e-05, 'epoch': 0.3} {'loss': 0.9314, 'learning_rate': 1.896606538918706e-05, 'epoch': 0.3} {'loss': 0.9184, 'learning_rate': 1.8965920423930475e-05, 'epoch': 0.3} {'loss': 0.6326, 'learning_rate': 1.8965775449066096e-05, 'epoch': 0.3} {'loss': 0.7498, 'learning_rate': 1.8965630464594077e-05, 'epoch': 0.3} {'loss': 1.0762, 'learning_rate': 1.8965485470514577e-05, 'epoch': 0.3} {'loss': 0.8343, 'learning_rate': 1.896534046682775e-05, 'epoch': 0.3} {'loss': 1.0798, 'learning_rate': 1.896519545353375e-05, 'epoch': 0.3} {'loss': 0.8875, 'learning_rate': 1.896505043063274e-05, 'epoch': 0.3} {'loss': 0.861, 'learning_rate': 1.8964905398124864e-05, 'epoch': 0.3} {'loss': 0.8273, 'learning_rate': 1.8964760356010285e-05, 'epoch': 0.3} {'loss': 0.9228, 'learning_rate': 1.8964615304289155e-05, 'epoch': 0.3} {'loss': 0.9622, 'learning_rate': 1.896447024296163e-05, 'epoch': 0.3} {'loss': 0.92, 'learning_rate': 1.8964325172027867e-05, 'epoch': 0.3} {'loss': 0.8938, 'learning_rate': 1.896418009148802e-05, 'epoch': 0.3} {'loss': 0.963, 'learning_rate': 1.8964035001342245e-05, 'epoch': 0.3} {'loss': 0.9018, 'learning_rate': 1.8963889901590698e-05, 'epoch': 0.3} {'loss': 0.8501, 'learning_rate': 1.8963744792233534e-05, 'epoch': 0.3} {'loss': 0.8116, 'learning_rate': 1.8963599673270907e-05, 'epoch': 0.3} {'loss': 0.9684, 'learning_rate': 1.8963454544702975e-05, 'epoch': 0.3} {'loss': 0.94, 'learning_rate': 1.8963309406529892e-05, 'epoch': 0.3} {'loss': 0.7276, 'learning_rate': 1.8963164258751818e-05, 'epoch': 0.3} {'loss': 0.8915, 'learning_rate': 1.8963019101368898e-05, 'epoch': 0.3} {'loss': 0.9541, 'learning_rate': 1.89628739343813e-05, 'epoch': 0.3} {'loss': 0.9441, 'learning_rate': 1.8962728757789167e-05, 'epoch': 0.3} {'loss': 0.9604, 'learning_rate': 1.8962583571592667e-05, 'epoch': 0.3} {'loss': 0.8105, 'learning_rate': 1.8962438375791948e-05, 'epoch': 0.3} {'loss': 0.955, 'learning_rate': 1.8962293170387166e-05, 'epoch': 0.3} {'loss': 0.9882, 'learning_rate': 1.8962147955378478e-05, 'epoch': 0.3} {'loss': 0.8665, 'learning_rate': 1.896200273076604e-05, 'epoch': 0.3} {'loss': 1.0166, 'learning_rate': 1.896185749655001e-05, 'epoch': 0.3} {'loss': 0.9815, 'learning_rate': 1.8961712252730536e-05, 'epoch': 0.3} {'loss': 0.9361, 'learning_rate': 1.8961566999307782e-05, 'epoch': 0.3} {'loss': 1.0277, 'learning_rate': 1.89614217362819e-05, 'epoch': 0.3} {'loss': 0.8537, 'learning_rate': 1.8961276463653044e-05, 'epoch': 0.3} {'loss': 0.8145, 'learning_rate': 1.8961131181421374e-05, 'epoch': 0.3} {'loss': 0.7816, 'learning_rate': 1.896098588958704e-05, 'epoch': 0.3} {'loss': 0.7064, 'learning_rate': 1.89608405881502e-05, 'epoch': 0.3} {'loss': 1.0338, 'learning_rate': 1.8960695277111016e-05, 'epoch': 0.3} {'loss': 1.0253, 'learning_rate': 1.8960549956469634e-05, 'epoch': 0.3} {'loss': 0.8448, 'learning_rate': 1.8960404626226216e-05, 'epoch': 0.3} {'loss': 0.9193, 'learning_rate': 1.8960259286380914e-05, 'epoch': 0.3} {'loss': 0.8658, 'learning_rate': 1.8960113936933887e-05, 'epoch': 0.3} {'loss': 1.0035, 'learning_rate': 1.895996857788529e-05, 'epoch': 0.3} {'loss': 0.9223, 'learning_rate': 1.8959823209235275e-05, 'epoch': 0.3} {'loss': 0.8504, 'learning_rate': 1.8959677830984002e-05, 'epoch': 0.3} {'loss': 0.839, 'learning_rate': 1.8959532443131627e-05, 'epoch': 0.3} {'loss': 0.8922, 'learning_rate': 1.8959387045678303e-05, 'epoch': 0.3} {'loss': 0.9591, 'learning_rate': 1.895924163862419e-05, 'epoch': 0.3} {'loss': 0.9333, 'learning_rate': 1.8959096221969434e-05, 'epoch': 0.3} {'loss': 0.8533, 'learning_rate': 1.8958950795714205e-05, 'epoch': 0.3} {'loss': 0.94, 'learning_rate': 1.8958805359858647e-05, 'epoch': 0.3} {'loss': 0.7265, 'learning_rate': 1.8958659914402925e-05, 'epoch': 0.3} {'loss': 0.9259, 'learning_rate': 1.8958514459347187e-05, 'epoch': 0.3} {'loss': 0.9685, 'learning_rate': 1.895836899469159e-05, 'epoch': 0.3} {'loss': 0.8158, 'learning_rate': 1.8958223520436298e-05, 'epoch': 0.3} {'loss': 0.9468, 'learning_rate': 1.8958078036581456e-05, 'epoch': 0.3} {'loss': 0.7465, 'learning_rate': 1.8957932543127227e-05, 'epoch': 0.3} {'loss': 0.9555, 'learning_rate': 1.8957787040073767e-05, 'epoch': 0.3} {'loss': 0.7561, 'learning_rate': 1.8957641527421224e-05, 'epoch': 0.3} {'loss': 0.9855, 'learning_rate': 1.8957496005169762e-05, 'epoch': 0.3} {'loss': 0.7993, 'learning_rate': 1.8957350473319537e-05, 'epoch': 0.3} {'loss': 0.9503, 'learning_rate': 1.89572049318707e-05, 'epoch': 0.3} {'loss': 0.8318, 'learning_rate': 1.8957059380823407e-05, 'epoch': 0.3} {'loss': 0.7957, 'learning_rate': 1.8956913820177822e-05, 'epoch': 0.3} {'loss': 0.8891, 'learning_rate': 1.8956768249934093e-05, 'epoch': 0.3} {'loss': 0.7624, 'learning_rate': 1.895662267009238e-05, 'epoch': 0.3} {'loss': 0.9463, 'learning_rate': 1.8956477080652835e-05, 'epoch': 0.3} {'loss': 0.9658, 'learning_rate': 1.895633148161562e-05, 'epoch': 0.3} {'loss': 0.8226, 'learning_rate': 1.8956185872980882e-05, 'epoch': 0.3} {'loss': 0.897, 'learning_rate': 1.8956040254748786e-05, 'epoch': 0.3} {'loss': 0.8816, 'learning_rate': 1.8955894626919485e-05, 'epoch': 0.3} {'loss': 0.9267, 'learning_rate': 1.8955748989493132e-05, 'epoch': 0.3} {'loss': 0.9311, 'learning_rate': 1.8955603342469888e-05, 'epoch': 0.3} {'loss': 0.6718, 'learning_rate': 1.8955457685849907e-05, 'epoch': 0.3} {'loss': 0.8589, 'learning_rate': 1.8955312019633344e-05, 'epoch': 0.3} {'loss': 0.8897, 'learning_rate': 1.8955166343820355e-05, 'epoch': 0.3} {'loss': 0.8108, 'learning_rate': 1.8955020658411096e-05, 'epoch': 0.3} {'loss': 0.7804, 'learning_rate': 1.8954874963405726e-05, 'epoch': 0.3} {'loss': 0.8513, 'learning_rate': 1.8954729258804398e-05, 'epoch': 0.3} {'loss': 0.9446, 'learning_rate': 1.8954583544607274e-05, 'epoch': 0.3} {'loss': 0.8633, 'learning_rate': 1.89544378208145e-05, 'epoch': 0.3} {'loss': 0.8355, 'learning_rate': 1.895429208742624e-05, 'epoch': 0.3} {'loss': 0.804, 'learning_rate': 1.895414634444265e-05, 'epoch': 0.3} {'loss': 0.7958, 'learning_rate': 1.895400059186388e-05, 'epoch': 0.3} {'loss': 0.8031, 'learning_rate': 1.895385482969009e-05, 'epoch': 0.3} {'loss': 1.0139, 'learning_rate': 1.895370905792144e-05, 'epoch': 0.3} {'loss': 0.9028, 'learning_rate': 1.895356327655808e-05, 'epoch': 0.3} {'loss': 0.79, 'learning_rate': 1.895341748560017e-05, 'epoch': 0.3} {'loss': 1.0138, 'learning_rate': 1.895327168504786e-05, 'epoch': 0.3} {'loss': 0.8913, 'learning_rate': 1.895312587490132e-05, 'epoch': 0.3} {'loss': 0.727, 'learning_rate': 1.8952980055160695e-05, 'epoch': 0.3} {'loss': 1.0154, 'learning_rate': 1.895283422582614e-05, 'epoch': 0.3} {'loss': 0.9053, 'learning_rate': 1.895268838689782e-05, 'epoch': 0.3} {'loss': 0.9674, 'learning_rate': 1.8952542538375883e-05, 'epoch': 0.3} {'loss': 0.6786, 'learning_rate': 1.895239668026049e-05, 'epoch': 0.3} {'loss': 1.0201, 'learning_rate': 1.8952250812551793e-05, 'epoch': 0.3} {'loss': 1.0029, 'learning_rate': 1.8952104935249953e-05, 'epoch': 0.3} {'loss': 0.9901, 'learning_rate': 1.8951959048355128e-05, 'epoch': 0.3} {'loss': 0.8666, 'learning_rate': 1.8951813151867467e-05, 'epoch': 0.3} {'loss': 0.955, 'learning_rate': 1.895166724578713e-05, 'epoch': 0.3} {'loss': 0.8333, 'learning_rate': 1.8951521330114276e-05, 'epoch': 0.3} {'loss': 0.8159, 'learning_rate': 1.8951375404849058e-05, 'epoch': 0.3} {'loss': 0.893, 'learning_rate': 1.8951229469991635e-05, 'epoch': 0.3} {'loss': 0.8036, 'learning_rate': 1.8951083525542157e-05, 'epoch': 0.3} {'loss': 1.012, 'learning_rate': 1.895093757150079e-05, 'epoch': 0.3} {'loss': 0.9073, 'learning_rate': 1.8950791607867686e-05, 'epoch': 0.3} {'loss': 0.9066, 'learning_rate': 1.8950645634642994e-05, 'epoch': 0.3} {'loss': 0.8914, 'learning_rate': 1.8950499651826884e-05, 'epoch': 0.3} {'loss': 0.7932, 'learning_rate': 1.8950353659419502e-05, 'epoch': 0.3} {'loss': 0.8756, 'learning_rate': 1.8950207657421013e-05, 'epoch': 0.3} {'loss': 0.9604, 'learning_rate': 1.8950061645831567e-05, 'epoch': 0.3} {'loss': 1.0335, 'learning_rate': 1.894991562465132e-05, 'epoch': 0.3} {'loss': 0.8498, 'learning_rate': 1.894976959388043e-05, 'epoch': 0.3} {'loss': 0.893, 'learning_rate': 1.8949623553519055e-05, 'epoch': 0.3} {'loss': 0.6067, 'learning_rate': 1.8949477503567354e-05, 'epoch': 0.3} {'loss': 0.8781, 'learning_rate': 1.8949331444025475e-05, 'epoch': 0.3} {'loss': 0.7754, 'learning_rate': 1.894918537489358e-05, 'epoch': 0.3} {'loss': 0.9447, 'learning_rate': 1.894903929617183e-05, 'epoch': 0.3} {'loss': 0.9892, 'learning_rate': 1.8948893207860372e-05, 'epoch': 0.3} {'loss': 0.9605, 'learning_rate': 1.894874710995937e-05, 'epoch': 0.3} {'loss': 0.9198, 'learning_rate': 1.8948601002468975e-05, 'epoch': 0.3} {'loss': 0.853, 'learning_rate': 1.8948454885389348e-05, 'epoch': 0.3} {'loss': 0.7798, 'learning_rate': 1.8948308758720646e-05, 'epoch': 0.3} {'loss': 1.0272, 'learning_rate': 1.894816262246302e-05, 'epoch': 0.3} {'loss': 0.8151, 'learning_rate': 1.8948016476616633e-05, 'epoch': 0.3} {'loss': 0.8117, 'learning_rate': 1.894787032118164e-05, 'epoch': 0.3} {'loss': 0.9256, 'learning_rate': 1.8947724156158195e-05, 'epoch': 0.3} {'loss': 0.8737, 'learning_rate': 1.8947577981546453e-05, 'epoch': 0.3} {'loss': 0.743, 'learning_rate': 1.8947431797346573e-05, 'epoch': 0.3} {'loss': 0.8458, 'learning_rate': 1.8947285603558717e-05, 'epoch': 0.3} {'loss': 1.0338, 'learning_rate': 1.8947139400183034e-05, 'epoch': 0.3} {'loss': 0.7444, 'learning_rate': 1.8946993187219683e-05, 'epoch': 0.3} {'loss': 1.04, 'learning_rate': 1.8946846964668824e-05, 'epoch': 0.3} {'loss': 0.9202, 'learning_rate': 1.894670073253061e-05, 'epoch': 0.3} {'loss': 0.9262, 'learning_rate': 1.8946554490805198e-05, 'epoch': 0.3} {'loss': 0.9302, 'learning_rate': 1.8946408239492746e-05, 'epoch': 0.3} {'loss': 0.8081, 'learning_rate': 1.894626197859341e-05, 'epoch': 0.3} {'loss': 0.7884, 'learning_rate': 1.8946115708107346e-05, 'epoch': 0.3} {'loss': 1.018, 'learning_rate': 1.8945969428034713e-05, 'epoch': 0.3} {'loss': 0.9041, 'learning_rate': 1.8945823138375667e-05, 'epoch': 0.3} {'loss': 0.8104, 'learning_rate': 1.8945676839130362e-05, 'epoch': 0.3} {'loss': 0.8372, 'learning_rate': 1.8945530530298955e-05, 'epoch': 0.3} {'loss': 0.927, 'learning_rate': 1.894538421188161e-05, 'epoch': 0.3} {'loss': 0.8886, 'learning_rate': 1.8945237883878475e-05, 'epoch': 0.3} {'loss': 0.9471, 'learning_rate': 1.894509154628971e-05, 'epoch': 0.3} {'loss': 0.8032, 'learning_rate': 1.8944945199115472e-05, 'epoch': 0.3} {'loss': 0.8869, 'learning_rate': 1.894479884235592e-05, 'epoch': 0.3} {'loss': 0.9102, 'learning_rate': 1.8944652476011205e-05, 'epoch': 0.3} {'loss': 1.0365, 'learning_rate': 1.894450610008149e-05, 'epoch': 0.3} {'loss': 0.9258, 'learning_rate': 1.894435971456693e-05, 'epoch': 0.3} {'loss': 0.9872, 'learning_rate': 1.894421331946768e-05, 'epoch': 0.3} {'loss': 0.8708, 'learning_rate': 1.8944066914783898e-05, 'epoch': 0.3} {'loss': 0.7852, 'learning_rate': 1.8943920500515744e-05, 'epoch': 0.3} {'loss': 0.8127, 'learning_rate': 1.8943774076663372e-05, 'epoch': 0.3} {'loss': 1.0741, 'learning_rate': 1.8943627643226933e-05, 'epoch': 0.3} {'loss': 0.8002, 'learning_rate': 1.8943481200206595e-05, 'epoch': 0.3} {'loss': 0.8845, 'learning_rate': 1.894333474760251e-05, 'epoch': 0.3} {'loss': 0.8417, 'learning_rate': 1.8943188285414832e-05, 'epoch': 0.3} {'loss': 0.9363, 'learning_rate': 1.8943041813643722e-05, 'epoch': 0.3} {'loss': 1.0063, 'learning_rate': 1.8942895332289332e-05, 'epoch': 0.3} {'loss': 0.8428, 'learning_rate': 1.8942748841351828e-05, 'epoch': 0.3} {'loss': 0.9483, 'learning_rate': 1.8942602340831356e-05, 'epoch': 0.3} {'loss': 0.9821, 'learning_rate': 1.8942455830728085e-05, 'epoch': 0.3} {'loss': 0.9069, 'learning_rate': 1.8942309311042158e-05, 'epoch': 0.3} {'loss': 0.8337, 'learning_rate': 1.8942162781773747e-05, 'epoch': 0.3} {'loss': 0.7738, 'learning_rate': 1.8942016242922994e-05, 'epoch': 0.3} {'loss': 0.8916, 'learning_rate': 1.894186969449007e-05, 'epoch': 0.3} {'loss': 0.9096, 'learning_rate': 1.8941723136475122e-05, 'epoch': 0.3} {'loss': 0.8126, 'learning_rate': 1.894157656887831e-05, 'epoch': 0.3} {'loss': 0.919, 'learning_rate': 1.8941429991699795e-05, 'epoch': 0.3} {'loss': 0.729, 'learning_rate': 1.894128340493973e-05, 'epoch': 0.3} {'loss': 0.9117, 'learning_rate': 1.8941136808598274e-05, 'epoch': 0.3} {'loss': 0.7922, 'learning_rate': 1.8940990202675577e-05, 'epoch': 0.3} {'loss': 0.8704, 'learning_rate': 1.894084358717181e-05, 'epoch': 0.3} {'loss': 0.8487, 'learning_rate': 1.8940696962087115e-05, 'epoch': 0.3} {'loss': 0.793, 'learning_rate': 1.894055032742166e-05, 'epoch': 0.3} {'loss': 0.8964, 'learning_rate': 1.8940403683175597e-05, 'epoch': 0.3} {'loss': 0.7805, 'learning_rate': 1.8940257029349086e-05, 'epoch': 0.3} {'loss': 1.0301, 'learning_rate': 1.894011036594228e-05, 'epoch': 0.3} {'loss': 0.7155, 'learning_rate': 1.8939963692955344e-05, 'epoch': 0.3} {'loss': 0.9082, 'learning_rate': 1.8939817010388423e-05, 'epoch': 0.3} {'loss': 0.7502, 'learning_rate': 1.893967031824169e-05, 'epoch': 0.3} {'loss': 1.0173, 'learning_rate': 1.8939523616515286e-05, 'epoch': 0.3} {'loss': 0.9024, 'learning_rate': 1.8939376905209377e-05, 'epoch': 0.3} {'loss': 0.8704, 'learning_rate': 1.893923018432412e-05, 'epoch': 0.3} {'loss': 1.0466, 'learning_rate': 1.893908345385967e-05, 'epoch': 0.3} {'loss': 0.8348, 'learning_rate': 1.8938936713816187e-05, 'epoch': 0.3} {'loss': 0.921, 'learning_rate': 1.8938789964193825e-05, 'epoch': 0.3} {'loss': 0.9847, 'learning_rate': 1.893864320499274e-05, 'epoch': 0.3} {'loss': 0.9095, 'learning_rate': 1.89384964362131e-05, 'epoch': 0.3} {'loss': 0.9032, 'learning_rate': 1.8938349657855045e-05, 'epoch': 0.3} {'loss': 0.9204, 'learning_rate': 1.893820286991875e-05, 'epoch': 0.3} {'loss': 0.9047, 'learning_rate': 1.893805607240436e-05, 'epoch': 0.3} {'loss': 0.9458, 'learning_rate': 1.8937909265312036e-05, 'epoch': 0.3} {'loss': 0.917, 'learning_rate': 1.8937762448641934e-05, 'epoch': 0.3} {'loss': 0.7774, 'learning_rate': 1.8937615622394217e-05, 'epoch': 0.3} {'loss': 0.7892, 'learning_rate': 1.8937468786569034e-05, 'epoch': 0.3} {'loss': 0.9032, 'learning_rate': 1.8937321941166548e-05, 'epoch': 0.3} {'loss': 0.939, 'learning_rate': 1.8937175086186917e-05, 'epoch': 0.3} {'loss': 0.7645, 'learning_rate': 1.8937028221630296e-05, 'epoch': 0.3} {'loss': 1.0581, 'learning_rate': 1.893688134749684e-05, 'epoch': 0.3} {'loss': 0.7713, 'learning_rate': 1.893673446378671e-05, 'epoch': 0.3} {'loss': 0.9576, 'learning_rate': 1.8936587570500063e-05, 'epoch': 0.3} {'loss': 0.8617, 'learning_rate': 1.8936440667637054e-05, 'epoch': 0.3} {'loss': 0.9656, 'learning_rate': 1.8936293755197846e-05, 'epoch': 0.3} {'loss': 0.8764, 'learning_rate': 1.893614683318259e-05, 'epoch': 0.3} {'loss': 0.8727, 'learning_rate': 1.8935999901591448e-05, 'epoch': 0.3} {'loss': 1.0555, 'learning_rate': 1.8935852960424572e-05, 'epoch': 0.3} {'loss': 1.0215, 'learning_rate': 1.8935706009682127e-05, 'epoch': 0.3} {'loss': 0.9315, 'learning_rate': 1.8935559049364264e-05, 'epoch': 0.3} {'loss': 0.805, 'learning_rate': 1.8935412079471143e-05, 'epoch': 0.3} {'loss': 0.8643, 'learning_rate': 1.8935265100002925e-05, 'epoch': 0.3} {'loss': 0.8674, 'learning_rate': 1.893511811095976e-05, 'epoch': 0.3} {'loss': 0.6837, 'learning_rate': 1.8934971112341812e-05, 'epoch': 0.3} {'loss': 1.0201, 'learning_rate': 1.8934824104149233e-05, 'epoch': 0.3} {'loss': 0.9592, 'learning_rate': 1.8934677086382186e-05, 'epoch': 0.3} {'loss': 0.6841, 'learning_rate': 1.8934530059040824e-05, 'epoch': 0.3} {'loss': 0.7905, 'learning_rate': 1.893438302212531e-05, 'epoch': 0.3} {'loss': 0.9369, 'learning_rate': 1.8934235975635796e-05, 'epoch': 0.3} {'loss': 1.2533, 'learning_rate': 1.893408891957244e-05, 'epoch': 0.3} {'loss': 0.8228, 'learning_rate': 1.8933941853935406e-05, 'epoch': 0.3} {'loss': 0.9551, 'learning_rate': 1.8933794778724844e-05, 'epoch': 0.3} {'loss': 0.8911, 'learning_rate': 1.8933647693940917e-05, 'epoch': 0.3} {'loss': 0.8091, 'learning_rate': 1.8933500599583775e-05, 'epoch': 0.3} {'loss': 0.8749, 'learning_rate': 1.8933353495653586e-05, 'epoch': 0.3} {'loss': 0.9541, 'learning_rate': 1.8933206382150498e-05, 'epoch': 0.3} {'loss': 0.8769, 'learning_rate': 1.8933059259074678e-05, 'epoch': 0.3} {'loss': 0.8539, 'learning_rate': 1.8932912126426277e-05, 'epoch': 0.3} {'loss': 1.1031, 'learning_rate': 1.893276498420545e-05, 'epoch': 0.3} {'loss': 0.747, 'learning_rate': 1.8932617832412365e-05, 'epoch': 0.3} {'loss': 0.7901, 'learning_rate': 1.8932470671047172e-05, 'epoch': 0.3} {'loss': 0.875, 'learning_rate': 1.893232350011003e-05, 'epoch': 0.3} {'loss': 0.7556, 'learning_rate': 1.8932176319601095e-05, 'epoch': 0.3} {'loss': 0.9813, 'learning_rate': 1.893202912952053e-05, 'epoch': 0.3} {'loss': 0.8239, 'learning_rate': 1.893188192986849e-05, 'epoch': 0.3} {'loss': 0.8226, 'learning_rate': 1.893173472064513e-05, 'epoch': 0.3} {'loss': 1.0045, 'learning_rate': 1.8931587501850614e-05, 'epoch': 0.3} {'loss': 0.9118, 'learning_rate': 1.893144027348509e-05, 'epoch': 0.3} {'loss': 0.909, 'learning_rate': 1.8931293035548726e-05, 'epoch': 0.3} {'loss': 0.9268, 'learning_rate': 1.8931145788041675e-05, 'epoch': 0.3} {'loss': 0.7945, 'learning_rate': 1.8930998530964094e-05, 'epoch': 0.3} {'loss': 0.9232, 'learning_rate': 1.893085126431614e-05, 'epoch': 0.3} {'loss': 0.9741, 'learning_rate': 1.8930703988097977e-05, 'epoch': 0.3} {'loss': 0.8354, 'learning_rate': 1.8930556702309756e-05, 'epoch': 0.3} {'loss': 0.8514, 'learning_rate': 1.893040940695164e-05, 'epoch': 0.3} {'loss': 0.8912, 'learning_rate': 1.8930262102023784e-05, 'epoch': 0.3} {'loss': 0.8047, 'learning_rate': 1.893011478752634e-05, 'epoch': 0.3} {'loss': 0.6492, 'learning_rate': 1.892996746345948e-05, 'epoch': 0.3} {'loss': 0.9994, 'learning_rate': 1.8929820129823348e-05, 'epoch': 0.3} {'loss': 1.0196, 'learning_rate': 1.892967278661811e-05, 'epoch': 0.3} {'loss': 0.9597, 'learning_rate': 1.8929525433843924e-05, 'epoch': 0.3} {'loss': 0.8506, 'learning_rate': 1.8929378071500943e-05, 'epoch': 0.3} {'loss': 0.9353, 'learning_rate': 1.8929230699589326e-05, 'epoch': 0.3} {'loss': 0.9451, 'learning_rate': 1.8929083318109235e-05, 'epoch': 0.3} {'loss': 0.8713, 'learning_rate': 1.8928935927060827e-05, 'epoch': 0.3} {'loss': 1.0333, 'learning_rate': 1.8928788526444256e-05, 'epoch': 0.3} {'loss': 0.8459, 'learning_rate': 1.892864111625968e-05, 'epoch': 0.3} {'loss': 0.8927, 'learning_rate': 1.8928493696507262e-05, 'epoch': 0.3} {'loss': 0.9236, 'learning_rate': 1.892834626718716e-05, 'epoch': 0.3} {'loss': 0.9438, 'learning_rate': 1.8928198828299523e-05, 'epoch': 0.3} {'loss': 0.9331, 'learning_rate': 1.8928051379844517e-05, 'epoch': 0.3} {'loss': 0.7874, 'learning_rate': 1.8927903921822298e-05, 'epoch': 0.3} {'loss': 0.9338, 'learning_rate': 1.8927756454233027e-05, 'epoch': 0.3} {'loss': 0.9025, 'learning_rate': 1.8927608977076855e-05, 'epoch': 0.3} {'loss': 0.9817, 'learning_rate': 1.8927461490353947e-05, 'epoch': 0.3} {'loss': 0.7695, 'learning_rate': 1.892731399406446e-05, 'epoch': 0.3} {'loss': 0.9238, 'learning_rate': 1.8927166488208548e-05, 'epoch': 0.3} {'loss': 0.8239, 'learning_rate': 1.8927018972786372e-05, 'epoch': 0.3} {'loss': 0.6882, 'learning_rate': 1.8926871447798087e-05, 'epoch': 0.3} {'loss': 0.9113, 'learning_rate': 1.8926723913243855e-05, 'epoch': 0.3} {'loss': 0.7164, 'learning_rate': 1.8926576369123833e-05, 'epoch': 0.3} {'loss': 0.8025, 'learning_rate': 1.892642881543818e-05, 'epoch': 0.3} {'loss': 0.9773, 'learning_rate': 1.892628125218705e-05, 'epoch': 0.3} {'loss': 0.879, 'learning_rate': 1.8926133679370607e-05, 'epoch': 0.3} {'loss': 0.9465, 'learning_rate': 1.8925986096989006e-05, 'epoch': 0.3} {'loss': 0.9631, 'learning_rate': 1.8925838505042404e-05, 'epoch': 0.3} {'loss': 0.8224, 'learning_rate': 1.8925690903530963e-05, 'epoch': 0.3} {'loss': 1.0792, 'learning_rate': 1.8925543292454837e-05, 'epoch': 0.3} {'loss': 0.8575, 'learning_rate': 1.8925395671814183e-05, 'epoch': 0.3} {'loss': 0.8597, 'learning_rate': 1.892524804160916e-05, 'epoch': 0.3} {'loss': 0.7547, 'learning_rate': 1.8925100401839934e-05, 'epoch': 0.3} {'loss': 0.8688, 'learning_rate': 1.8924952752506657e-05, 'epoch': 0.3} {'loss': 0.9252, 'learning_rate': 1.8924805093609486e-05, 'epoch': 0.3} {'loss': 0.9708, 'learning_rate': 1.8924657425148582e-05, 'epoch': 0.3} {'loss': 0.9977, 'learning_rate': 1.89245097471241e-05, 'epoch': 0.3} {'loss': 0.7592, 'learning_rate': 1.89243620595362e-05, 'epoch': 0.3} {'loss': 0.827, 'learning_rate': 1.892421436238504e-05, 'epoch': 0.3} {'loss': 0.8017, 'learning_rate': 1.8924066655670784e-05, 'epoch': 0.3} {'loss': 0.9331, 'learning_rate': 1.8923918939393582e-05, 'epoch': 0.3} {'loss': 0.7004, 'learning_rate': 1.8923771213553595e-05, 'epoch': 0.3} {'loss': 0.9636, 'learning_rate': 1.8923623478150982e-05, 'epoch': 0.3} {'loss': 0.8473, 'learning_rate': 1.89234757331859e-05, 'epoch': 0.3} {'loss': 1.0071, 'learning_rate': 1.892332797865851e-05, 'epoch': 0.3} {'loss': 0.9351, 'learning_rate': 1.8923180214568967e-05, 'epoch': 0.3} {'loss': 0.8515, 'learning_rate': 1.8923032440917433e-05, 'epoch': 0.3} {'loss': 0.8529, 'learning_rate': 1.8922884657704063e-05, 'epoch': 0.3} {'loss': 0.8745, 'learning_rate': 1.8922736864929018e-05, 'epoch': 0.3} {'loss': 0.9614, 'learning_rate': 1.8922589062592456e-05, 'epoch': 0.3} {'loss': 1.1294, 'learning_rate': 1.892244125069453e-05, 'epoch': 0.3} {'loss': 0.7617, 'learning_rate': 1.8922293429235407e-05, 'epoch': 0.3} {'loss': 0.8485, 'learning_rate': 1.892214559821524e-05, 'epoch': 0.3} {'loss': 1.0941, 'learning_rate': 1.8921997757634188e-05, 'epoch': 0.3} {'loss': 0.692, 'learning_rate': 1.892184990749241e-05, 'epoch': 0.3} {'loss': 0.9343, 'learning_rate': 1.8921702047790067e-05, 'epoch': 0.3} {'loss': 0.9515, 'learning_rate': 1.8921554178527314e-05, 'epoch': 0.3} {'loss': 0.9099, 'learning_rate': 1.892140629970431e-05, 'epoch': 0.3} {'loss': 0.8767, 'learning_rate': 1.8921258411321215e-05, 'epoch': 0.3} {'loss': 0.8784, 'learning_rate': 1.8921110513378184e-05, 'epoch': 0.3} {'loss': 0.9376, 'learning_rate': 1.892096260587538e-05, 'epoch': 0.3} {'loss': 0.9128, 'learning_rate': 1.8920814688812958e-05, 'epoch': 0.3} {'loss': 0.7837, 'learning_rate': 1.8920666762191078e-05, 'epoch': 0.3} {'loss': 1.0534, 'learning_rate': 1.89205188260099e-05, 'epoch': 0.3} {'loss': 0.819, 'learning_rate': 1.8920370880269582e-05, 'epoch': 0.3} {'loss': 0.8527, 'learning_rate': 1.8920222924970277e-05, 'epoch': 0.3} {'loss': 0.8844, 'learning_rate': 1.8920074960112148e-05, 'epoch': 0.3} {'loss': 0.8285, 'learning_rate': 1.8919926985695357e-05, 'epoch': 0.3} {'loss': 0.848, 'learning_rate': 1.891977900172006e-05, 'epoch': 0.3} {'loss': 0.8351, 'learning_rate': 1.8919631008186413e-05, 'epoch': 0.3} {'loss': 0.9065, 'learning_rate': 1.8919483005094575e-05, 'epoch': 0.3} {'loss': 0.8997, 'learning_rate': 1.8919334992444706e-05, 'epoch': 0.3} {'loss': 0.7899, 'learning_rate': 1.8919186970236968e-05, 'epoch': 0.3} {'loss': 0.9596, 'learning_rate': 1.8919038938471516e-05, 'epoch': 0.3} {'loss': 0.7043, 'learning_rate': 1.8918890897148504e-05, 'epoch': 0.3} {'loss': 0.8068, 'learning_rate': 1.8918742846268097e-05, 'epoch': 0.3} {'loss': 0.9536, 'learning_rate': 1.8918594785830455e-05, 'epoch': 0.3} {'loss': 1.0587, 'learning_rate': 1.8918446715835734e-05, 'epoch': 0.3} {'loss': 0.8577, 'learning_rate': 1.891829863628409e-05, 'epoch': 0.3} {'loss': 0.8408, 'learning_rate': 1.8918150547175682e-05, 'epoch': 0.3} {'loss': 0.8507, 'learning_rate': 1.8918002448510674e-05, 'epoch': 0.3} {'loss': 0.8649, 'learning_rate': 1.891785434028922e-05, 'epoch': 0.3} {'loss': 0.9095, 'learning_rate': 1.8917706222511483e-05, 'epoch': 0.3} {'loss': 0.8533, 'learning_rate': 1.8917558095177618e-05, 'epoch': 0.3} {'loss': 0.7616, 'learning_rate': 1.891740995828778e-05, 'epoch': 0.3} {'loss': 0.9206, 'learning_rate': 1.891726181184214e-05, 'epoch': 0.3} {'loss': 0.9193, 'learning_rate': 1.891711365584084e-05, 'epoch': 0.3} {'loss': 0.8813, 'learning_rate': 1.8916965490284055e-05, 'epoch': 0.3} {'loss': 0.8847, 'learning_rate': 1.8916817315171935e-05, 'epoch': 0.3} {'loss': 0.9113, 'learning_rate': 1.891666913050464e-05, 'epoch': 0.3} {'loss': 0.768, 'learning_rate': 1.8916520936282328e-05, 'epoch': 0.3} {'loss': 0.8145, 'learning_rate': 1.891637273250516e-05, 'epoch': 0.3} {'loss': 0.9126, 'learning_rate': 1.8916224519173293e-05, 'epoch': 0.3} {'loss': 1.0052, 'learning_rate': 1.8916076296286888e-05, 'epoch': 0.3} {'loss': 1.0, 'learning_rate': 1.8915928063846104e-05, 'epoch': 0.3} {'loss': 0.7855, 'learning_rate': 1.8915779821851097e-05, 'epoch': 0.3} {'loss': 0.8616, 'learning_rate': 1.8915631570302025e-05, 'epoch': 0.3} {'loss': 0.6123, 'learning_rate': 1.8915483309199053e-05, 'epoch': 0.3} {'loss': 0.9907, 'learning_rate': 1.8915335038542334e-05, 'epoch': 0.3} {'loss': 0.9462, 'learning_rate': 1.891518675833203e-05, 'epoch': 0.3} {'loss': 0.8507, 'learning_rate': 1.8915038468568294e-05, 'epoch': 0.3} {'loss': 0.8774, 'learning_rate': 1.8914890169251295e-05, 'epoch': 0.3} {'loss': 0.9216, 'learning_rate': 1.8914741860381186e-05, 'epoch': 0.3} {'loss': 0.9359, 'learning_rate': 1.8914593541958125e-05, 'epoch': 0.3} {'loss': 0.8948, 'learning_rate': 1.8914445213982274e-05, 'epoch': 0.3} {'loss': 0.9407, 'learning_rate': 1.8914296876453785e-05, 'epoch': 0.3} {'loss': 0.8251, 'learning_rate': 1.8914148529372828e-05, 'epoch': 0.3} {'loss': 1.001, 'learning_rate': 1.8914000172739554e-05, 'epoch': 0.3} {'loss': 0.7613, 'learning_rate': 1.8913851806554125e-05, 'epoch': 0.3} {'loss': 0.6685, 'learning_rate': 1.89137034308167e-05, 'epoch': 0.3} {'loss': 0.8705, 'learning_rate': 1.8913555045527436e-05, 'epoch': 0.3} {'loss': 1.0738, 'learning_rate': 1.8913406650686496e-05, 'epoch': 0.3} {'loss': 1.0449, 'learning_rate': 1.8913258246294032e-05, 'epoch': 0.3} {'loss': 0.8789, 'learning_rate': 1.891310983235021e-05, 'epoch': 0.3} {'loss': 0.7021, 'learning_rate': 1.8912961408855187e-05, 'epoch': 0.3} {'loss': 0.9712, 'learning_rate': 1.8912812975809117e-05, 'epoch': 0.3} {'loss': 0.8109, 'learning_rate': 1.8912664533212168e-05, 'epoch': 0.3} {'loss': 0.9546, 'learning_rate': 1.8912516081064495e-05, 'epoch': 0.3} {'loss': 0.9668, 'learning_rate': 1.891236761936625e-05, 'epoch': 0.3} {'loss': 0.8817, 'learning_rate': 1.8912219148117606e-05, 'epoch': 0.3} {'loss': 0.9256, 'learning_rate': 1.8912070667318715e-05, 'epoch': 0.31} {'loss': 0.9895, 'learning_rate': 1.891192217696973e-05, 'epoch': 0.31} {'loss': 0.8989, 'learning_rate': 1.8911773677070823e-05, 'epoch': 0.31} {'loss': 0.9287, 'learning_rate': 1.891162516762214e-05, 'epoch': 0.31} {'loss': 1.0411, 'learning_rate': 1.891147664862385e-05, 'epoch': 0.31} {'loss': 0.7873, 'learning_rate': 1.8911328120076105e-05, 'epoch': 0.31} {'loss': 0.8723, 'learning_rate': 1.891117958197907e-05, 'epoch': 0.31} {'loss': 1.0343, 'learning_rate': 1.8911031034332902e-05, 'epoch': 0.31} {'loss': 0.733, 'learning_rate': 1.891088247713776e-05, 'epoch': 0.31} {'loss': 0.7435, 'learning_rate': 1.8910733910393802e-05, 'epoch': 0.31} {'loss': 0.8358, 'learning_rate': 1.891058533410119e-05, 'epoch': 0.31} {'loss': 0.8594, 'learning_rate': 1.891043674826008e-05, 'epoch': 0.31} {'loss': 0.9467, 'learning_rate': 1.8910288152870634e-05, 'epoch': 0.31} {'loss': 0.8143, 'learning_rate': 1.891013954793301e-05, 'epoch': 0.31} {'loss': 0.773, 'learning_rate': 1.8909990933447367e-05, 'epoch': 0.31} {'loss': 0.8192, 'learning_rate': 1.8909842309413863e-05, 'epoch': 0.31} {'loss': 1.0311, 'learning_rate': 1.890969367583266e-05, 'epoch': 0.31} {'loss': 0.8173, 'learning_rate': 1.8909545032703914e-05, 'epoch': 0.31} {'loss': 0.8473, 'learning_rate': 1.890939638002779e-05, 'epoch': 0.31} {'loss': 0.9146, 'learning_rate': 1.8909247717804444e-05, 'epoch': 0.31} {'loss': 0.891, 'learning_rate': 1.890909904603403e-05, 'epoch': 0.31} {'loss': 0.8886, 'learning_rate': 1.8908950364716718e-05, 'epoch': 0.31} {'loss': 0.8951, 'learning_rate': 1.890880167385266e-05, 'epoch': 0.31} {'loss': 0.7279, 'learning_rate': 1.8908652973442016e-05, 'epoch': 0.31} {'loss': 1.0682, 'learning_rate': 1.8908504263484944e-05, 'epoch': 0.31} {'loss': 0.9227, 'learning_rate': 1.8908355543981608e-05, 'epoch': 0.31} {'loss': 0.8333, 'learning_rate': 1.890820681493217e-05, 'epoch': 0.31} {'loss': 0.9066, 'learning_rate': 1.8908058076336775e-05, 'epoch': 0.31} {'loss': 0.9371, 'learning_rate': 1.8907909328195597e-05, 'epoch': 0.31} {'loss': 0.9067, 'learning_rate': 1.8907760570508792e-05, 'epoch': 0.31} {'loss': 0.9667, 'learning_rate': 1.890761180327651e-05, 'epoch': 0.31} {'loss': 0.9814, 'learning_rate': 1.8907463026498925e-05, 'epoch': 0.31} {'loss': 0.8883, 'learning_rate': 1.8907314240176188e-05, 'epoch': 0.31} {'loss': 0.9909, 'learning_rate': 1.8907165444308458e-05, 'epoch': 0.31} {'loss': 0.7153, 'learning_rate': 1.8907016638895896e-05, 'epoch': 0.31} {'loss': 0.9075, 'learning_rate': 1.8906867823938665e-05, 'epoch': 0.31} {'loss': 0.9582, 'learning_rate': 1.8906718999436918e-05, 'epoch': 0.31} {'loss': 0.8727, 'learning_rate': 1.890657016539082e-05, 'epoch': 0.31} {'loss': 0.9243, 'learning_rate': 1.890642132180053e-05, 'epoch': 0.31} {'loss': 0.9366, 'learning_rate': 1.8906272468666202e-05, 'epoch': 0.31} {'loss': 1.0178, 'learning_rate': 1.8906123605988e-05, 'epoch': 0.31} {'loss': 0.9387, 'learning_rate': 1.8905974733766082e-05, 'epoch': 0.31} {'loss': 0.9043, 'learning_rate': 1.890582585200061e-05, 'epoch': 0.31} {'loss': 0.9017, 'learning_rate': 1.890567696069174e-05, 'epoch': 0.31} {'loss': 0.9899, 'learning_rate': 1.8905528059839636e-05, 'epoch': 0.31} {'loss': 0.8186, 'learning_rate': 1.8905379149444455e-05, 'epoch': 0.31} {'loss': 0.7355, 'learning_rate': 1.8905230229506354e-05, 'epoch': 0.31} {'loss': 0.861, 'learning_rate': 1.8905081300025495e-05, 'epoch': 0.31} {'loss': 0.8199, 'learning_rate': 1.8904932361002037e-05, 'epoch': 0.31} {'loss': 1.006, 'learning_rate': 1.8904783412436143e-05, 'epoch': 0.31} {'loss': 0.8982, 'learning_rate': 1.8904634454327966e-05, 'epoch': 0.31} {'loss': 0.754, 'learning_rate': 1.8904485486677675e-05, 'epoch': 0.31} {'loss': 0.8894, 'learning_rate': 1.890433650948542e-05, 'epoch': 0.31} {'loss': 0.8811, 'learning_rate': 1.8904187522751366e-05, 'epoch': 0.31} {'loss': 1.0561, 'learning_rate': 1.890403852647567e-05, 'epoch': 0.31} {'loss': 0.9834, 'learning_rate': 1.8903889520658495e-05, 'epoch': 0.31} {'loss': 0.8957, 'learning_rate': 1.8903740505299998e-05, 'epoch': 0.31} {'loss': 0.8479, 'learning_rate': 1.8903591480400342e-05, 'epoch': 0.31} {'loss': 0.7443, 'learning_rate': 1.890344244595968e-05, 'epoch': 0.31} {'loss': 0.9148, 'learning_rate': 1.8903293401978177e-05, 'epoch': 0.31} {'loss': 0.7338, 'learning_rate': 1.8903144348455994e-05, 'epoch': 0.31} {'loss': 0.8857, 'learning_rate': 1.8902995285393286e-05, 'epoch': 0.31} {'loss': 0.8271, 'learning_rate': 1.8902846212790215e-05, 'epoch': 0.31} {'loss': 0.8039, 'learning_rate': 1.890269713064694e-05, 'epoch': 0.31} {'loss': 0.8953, 'learning_rate': 1.8902548038963623e-05, 'epoch': 0.31} {'loss': 0.8083, 'learning_rate': 1.8902398937740423e-05, 'epoch': 0.31} {'loss': 1.0139, 'learning_rate': 1.8902249826977498e-05, 'epoch': 0.31} {'loss': 0.933, 'learning_rate': 1.8902100706675007e-05, 'epoch': 0.31} {'loss': 0.9328, 'learning_rate': 1.8901951576833115e-05, 'epoch': 0.31} {'loss': 1.0479, 'learning_rate': 1.8901802437451976e-05, 'epoch': 0.31} {'loss': 0.9006, 'learning_rate': 1.8901653288531755e-05, 'epoch': 0.31} {'loss': 1.1394, 'learning_rate': 1.8901504130072608e-05, 'epoch': 0.31} {'loss': 0.7852, 'learning_rate': 1.8901354962074695e-05, 'epoch': 0.31} {'loss': 0.8848, 'learning_rate': 1.8901205784538174e-05, 'epoch': 0.31} {'loss': 0.8905, 'learning_rate': 1.890105659746321e-05, 'epoch': 0.31} {'loss': 0.9363, 'learning_rate': 1.8900907400849963e-05, 'epoch': 0.31} {'loss': 0.8645, 'learning_rate': 1.890075819469859e-05, 'epoch': 0.31} {'loss': 0.8698, 'learning_rate': 1.890060897900925e-05, 'epoch': 0.31} {'loss': 0.7586, 'learning_rate': 1.89004597537821e-05, 'epoch': 0.31} {'loss': 0.6663, 'learning_rate': 1.890031051901731e-05, 'epoch': 0.31} {'loss': 0.9901, 'learning_rate': 1.8900161274715034e-05, 'epoch': 0.31} {'loss': 0.9283, 'learning_rate': 1.8900012020875427e-05, 'epoch': 0.31} {'loss': 0.8243, 'learning_rate': 1.8899862757498655e-05, 'epoch': 0.31} {'loss': 0.8806, 'learning_rate': 1.889971348458488e-05, 'epoch': 0.31} {'loss': 0.9166, 'learning_rate': 1.8899564202134258e-05, 'epoch': 0.31} {'loss': 0.803, 'learning_rate': 1.8899414910146947e-05, 'epoch': 0.31} {'loss': 0.7879, 'learning_rate': 1.8899265608623115e-05, 'epoch': 0.31} {'loss': 0.9258, 'learning_rate': 1.889911629756291e-05, 'epoch': 0.31} {'loss': 0.976, 'learning_rate': 1.88989669769665e-05, 'epoch': 0.31} {'loss': 0.8593, 'learning_rate': 1.889881764683405e-05, 'epoch': 0.31} {'loss': 0.8365, 'learning_rate': 1.889866830716571e-05, 'epoch': 0.31} {'loss': 0.9942, 'learning_rate': 1.889851895796164e-05, 'epoch': 0.31} {'loss': 0.7298, 'learning_rate': 1.8898369599222007e-05, 'epoch': 0.31} {'loss': 0.938, 'learning_rate': 1.8898220230946968e-05, 'epoch': 0.31} {'loss': 0.7827, 'learning_rate': 1.8898070853136683e-05, 'epoch': 0.31} {'loss': 0.7086, 'learning_rate': 1.889792146579131e-05, 'epoch': 0.31} {'loss': 0.8032, 'learning_rate': 1.8897772068911013e-05, 'epoch': 0.31} {'loss': 0.8884, 'learning_rate': 1.889762266249595e-05, 'epoch': 0.31} {'loss': 0.9501, 'learning_rate': 1.8897473246546283e-05, 'epoch': 0.31} {'loss': 0.7184, 'learning_rate': 1.8897323821062167e-05, 'epoch': 0.31} {'loss': 0.7096, 'learning_rate': 1.8897174386043765e-05, 'epoch': 0.31} {'loss': 0.7982, 'learning_rate': 1.8897024941491244e-05, 'epoch': 0.31} {'loss': 1.001, 'learning_rate': 1.8896875487404754e-05, 'epoch': 0.31} {'loss': 0.7674, 'learning_rate': 1.8896726023784454e-05, 'epoch': 0.31} {'loss': 0.8659, 'learning_rate': 1.8896576550630517e-05, 'epoch': 0.31} {'loss': 0.888, 'learning_rate': 1.889642706794309e-05, 'epoch': 0.31} {'loss': 0.6041, 'learning_rate': 1.889627757572234e-05, 'epoch': 0.31} {'loss': 0.9654, 'learning_rate': 1.8896128073968426e-05, 'epoch': 0.31} {'loss': 0.8068, 'learning_rate': 1.8895978562681507e-05, 'epoch': 0.31} {'loss': 0.9176, 'learning_rate': 1.8895829041861743e-05, 'epoch': 0.31} {'loss': 0.8143, 'learning_rate': 1.88956795115093e-05, 'epoch': 0.31} {'loss': 0.8428, 'learning_rate': 1.889552997162433e-05, 'epoch': 0.31} {'loss': 0.9409, 'learning_rate': 1.8895380422206995e-05, 'epoch': 0.31} {'loss': 0.8524, 'learning_rate': 1.8895230863257457e-05, 'epoch': 0.31} {'loss': 1.0242, 'learning_rate': 1.889508129477588e-05, 'epoch': 0.31} {'loss': 0.9183, 'learning_rate': 1.889493171676242e-05, 'epoch': 0.31} {'loss': 0.7717, 'learning_rate': 1.889478212921724e-05, 'epoch': 0.31} {'loss': 0.8553, 'learning_rate': 1.8894632532140495e-05, 'epoch': 0.31} {'loss': 1.0056, 'learning_rate': 1.8894482925532347e-05, 'epoch': 0.31} {'loss': 0.8649, 'learning_rate': 1.8894333309392956e-05, 'epoch': 0.31} {'loss': 0.9518, 'learning_rate': 1.8894183683722487e-05, 'epoch': 0.31} {'loss': 0.8281, 'learning_rate': 1.88940340485211e-05, 'epoch': 0.31} {'loss': 1.0213, 'learning_rate': 1.8893884403788953e-05, 'epoch': 0.31} {'loss': 0.9484, 'learning_rate': 1.8893734749526202e-05, 'epoch': 0.31} {'loss': 0.9663, 'learning_rate': 1.8893585085733016e-05, 'epoch': 0.31} {'loss': 0.8837, 'learning_rate': 1.8893435412409548e-05, 'epoch': 0.31} {'loss': 0.9361, 'learning_rate': 1.889328572955596e-05, 'epoch': 0.31} {'loss': 0.7488, 'learning_rate': 1.8893136037172412e-05, 'epoch': 0.31} {'loss': 0.781, 'learning_rate': 1.889298633525907e-05, 'epoch': 0.31} {'loss': 0.8834, 'learning_rate': 1.889283662381609e-05, 'epoch': 0.31} {'loss': 0.7551, 'learning_rate': 1.8892686902843634e-05, 'epoch': 0.31} {'loss': 0.7853, 'learning_rate': 1.889253717234186e-05, 'epoch': 0.31} {'loss': 0.8702, 'learning_rate': 1.889238743231093e-05, 'epoch': 0.31} {'loss': 0.761, 'learning_rate': 1.8892237682751005e-05, 'epoch': 0.31} {'loss': 0.8734, 'learning_rate': 1.8892087923662242e-05, 'epoch': 0.31} {'loss': 0.8521, 'learning_rate': 1.8891938155044805e-05, 'epoch': 0.31} {'loss': 0.9547, 'learning_rate': 1.8891788376898855e-05, 'epoch': 0.31} {'loss': 0.9528, 'learning_rate': 1.889163858922455e-05, 'epoch': 0.31} {'loss': 0.968, 'learning_rate': 1.8891488792022055e-05, 'epoch': 0.31} {'loss': 1.024, 'learning_rate': 1.8891338985291523e-05, 'epoch': 0.31} {'loss': 0.6443, 'learning_rate': 1.8891189169033122e-05, 'epoch': 0.31} {'loss': 0.7751, 'learning_rate': 1.889103934324701e-05, 'epoch': 0.31} {'loss': 0.9501, 'learning_rate': 1.889088950793334e-05, 'epoch': 0.31} {'loss': 0.9949, 'learning_rate': 1.8890739663092284e-05, 'epoch': 0.31} {'loss': 0.7436, 'learning_rate': 1.8890589808724003e-05, 'epoch': 0.31} {'loss': 0.9273, 'learning_rate': 1.8890439944828645e-05, 'epoch': 0.31} {'loss': 0.9046, 'learning_rate': 1.8890290071406382e-05, 'epoch': 0.31} {'loss': 0.9292, 'learning_rate': 1.889014018845737e-05, 'epoch': 0.31} {'loss': 0.7252, 'learning_rate': 1.8889990295981772e-05, 'epoch': 0.31} {'loss': 0.8667, 'learning_rate': 1.8889840393979743e-05, 'epoch': 0.31} {'loss': 1.0097, 'learning_rate': 1.888969048245145e-05, 'epoch': 0.31} {'loss': 0.8408, 'learning_rate': 1.888954056139705e-05, 'epoch': 0.31} {'loss': 1.0103, 'learning_rate': 1.888939063081671e-05, 'epoch': 0.31} {'loss': 0.8408, 'learning_rate': 1.8889240690710582e-05, 'epoch': 0.31} {'loss': 0.9688, 'learning_rate': 1.8889090741078827e-05, 'epoch': 0.31} {'loss': 1.0642, 'learning_rate': 1.8888940781921613e-05, 'epoch': 0.31} {'loss': 1.0113, 'learning_rate': 1.8888790813239098e-05, 'epoch': 0.31} {'loss': 0.8269, 'learning_rate': 1.888864083503144e-05, 'epoch': 0.31} {'loss': 0.8818, 'learning_rate': 1.8888490847298797e-05, 'epoch': 0.31} {'loss': 0.7824, 'learning_rate': 1.8888340850041337e-05, 'epoch': 0.31} {'loss': 0.8701, 'learning_rate': 1.8888190843259218e-05, 'epoch': 0.31} {'loss': 0.8223, 'learning_rate': 1.88880408269526e-05, 'epoch': 0.31} {'loss': 0.7733, 'learning_rate': 1.8887890801121646e-05, 'epoch': 0.31} {'loss': 0.9056, 'learning_rate': 1.888774076576651e-05, 'epoch': 0.31} {'loss': 0.8726, 'learning_rate': 1.8887590720887364e-05, 'epoch': 0.31} {'loss': 0.8389, 'learning_rate': 1.888744066648436e-05, 'epoch': 0.31} {'loss': 0.9552, 'learning_rate': 1.8887290602557657e-05, 'epoch': 0.31} {'loss': 0.8527, 'learning_rate': 1.8887140529107425e-05, 'epoch': 0.31} {'loss': 0.8449, 'learning_rate': 1.8886990446133815e-05, 'epoch': 0.31} {'loss': 0.9266, 'learning_rate': 1.8886840353636997e-05, 'epoch': 0.31} {'loss': 0.9247, 'learning_rate': 1.8886690251617126e-05, 'epoch': 0.31} {'loss': 0.963, 'learning_rate': 1.8886540140074366e-05, 'epoch': 0.31} {'loss': 0.9697, 'learning_rate': 1.888639001900887e-05, 'epoch': 0.31} {'loss': 0.9394, 'learning_rate': 1.8886239888420812e-05, 'epoch': 0.31} {'loss': 0.9641, 'learning_rate': 1.8886089748310344e-05, 'epoch': 0.31} {'loss': 0.847, 'learning_rate': 1.888593959867763e-05, 'epoch': 0.31} {'loss': 0.9939, 'learning_rate': 1.8885789439522826e-05, 'epoch': 0.31} {'loss': 0.8249, 'learning_rate': 1.8885639270846097e-05, 'epoch': 0.31} {'loss': 0.7711, 'learning_rate': 1.8885489092647607e-05, 'epoch': 0.31} {'loss': 0.799, 'learning_rate': 1.888533890492751e-05, 'epoch': 0.31} {'loss': 0.8202, 'learning_rate': 1.8885188707685972e-05, 'epoch': 0.31} {'loss': 0.9069, 'learning_rate': 1.8885038500923156e-05, 'epoch': 0.31} {'loss': 0.9129, 'learning_rate': 1.8884888284639215e-05, 'epoch': 0.31} {'loss': 1.0515, 'learning_rate': 1.8884738058834312e-05, 'epoch': 0.31} {'loss': 0.9045, 'learning_rate': 1.8884587823508616e-05, 'epoch': 0.31} {'loss': 0.8934, 'learning_rate': 1.8884437578662277e-05, 'epoch': 0.31} {'loss': 1.1598, 'learning_rate': 1.8884287324295464e-05, 'epoch': 0.31} {'loss': 0.6774, 'learning_rate': 1.8884137060408335e-05, 'epoch': 0.31} {'loss': 1.0372, 'learning_rate': 1.888398678700105e-05, 'epoch': 0.31} {'loss': 0.7388, 'learning_rate': 1.8883836504073775e-05, 'epoch': 0.31} {'loss': 0.8878, 'learning_rate': 1.8883686211626667e-05, 'epoch': 0.31} {'loss': 0.9562, 'learning_rate': 1.8883535909659882e-05, 'epoch': 0.31} {'loss': 0.8913, 'learning_rate': 1.8883385598173592e-05, 'epoch': 0.31} {'loss': 0.6385, 'learning_rate': 1.8883235277167952e-05, 'epoch': 0.31} {'loss': 0.9121, 'learning_rate': 1.8883084946643122e-05, 'epoch': 0.31} {'loss': 0.8605, 'learning_rate': 1.8882934606599265e-05, 'epoch': 0.31} {'loss': 1.0306, 'learning_rate': 1.888278425703654e-05, 'epoch': 0.31} {'loss': 0.952, 'learning_rate': 1.8882633897955113e-05, 'epoch': 0.31} {'loss': 1.0615, 'learning_rate': 1.888248352935514e-05, 'epoch': 0.31} {'loss': 0.9324, 'learning_rate': 1.8882333151236785e-05, 'epoch': 0.31} {'loss': 0.8749, 'learning_rate': 1.8882182763600206e-05, 'epoch': 0.31} {'loss': 0.807, 'learning_rate': 1.888203236644557e-05, 'epoch': 0.31} {'loss': 0.8229, 'learning_rate': 1.8881881959773034e-05, 'epoch': 0.31} {'loss': 0.7956, 'learning_rate': 1.888173154358276e-05, 'epoch': 0.31} {'loss': 0.9981, 'learning_rate': 1.8881581117874908e-05, 'epoch': 0.31} {'loss': 0.6806, 'learning_rate': 1.888143068264964e-05, 'epoch': 0.31} {'loss': 0.9147, 'learning_rate': 1.8881280237907117e-05, 'epoch': 0.31} {'loss': 0.9079, 'learning_rate': 1.8881129783647504e-05, 'epoch': 0.31} {'loss': 0.8217, 'learning_rate': 1.8880979319870954e-05, 'epoch': 0.31} {'loss': 0.9051, 'learning_rate': 1.8880828846577637e-05, 'epoch': 0.31} {'loss': 1.1133, 'learning_rate': 1.888067836376771e-05, 'epoch': 0.31} {'loss': 0.9, 'learning_rate': 1.8880527871441334e-05, 'epoch': 0.31} {'loss': 0.8338, 'learning_rate': 1.888037736959867e-05, 'epoch': 0.31} {'loss': 0.768, 'learning_rate': 1.8880226858239878e-05, 'epoch': 0.31} {'loss': 0.8228, 'learning_rate': 1.8880076337365125e-05, 'epoch': 0.31} {'loss': 0.8777, 'learning_rate': 1.8879925806974567e-05, 'epoch': 0.31} {'loss': 0.9978, 'learning_rate': 1.8879775267068367e-05, 'epoch': 0.31} {'loss': 0.8563, 'learning_rate': 1.887962471764669e-05, 'epoch': 0.31} {'loss': 0.8978, 'learning_rate': 1.8879474158709688e-05, 'epoch': 0.31} {'loss': 0.8917, 'learning_rate': 1.8879323590257532e-05, 'epoch': 0.31} {'loss': 0.9216, 'learning_rate': 1.8879173012290377e-05, 'epoch': 0.31} {'loss': 0.9912, 'learning_rate': 1.8879022424808392e-05, 'epoch': 0.31} {'loss': 0.7475, 'learning_rate': 1.8878871827811727e-05, 'epoch': 0.31} {'loss': 0.7918, 'learning_rate': 1.887872122130055e-05, 'epoch': 0.31} {'loss': 0.7713, 'learning_rate': 1.8878570605275026e-05, 'epoch': 0.31} {'loss': 0.8723, 'learning_rate': 1.887841997973531e-05, 'epoch': 0.31} {'loss': 0.8562, 'learning_rate': 1.8878269344681562e-05, 'epoch': 0.31} {'loss': 0.9866, 'learning_rate': 1.887811870011395e-05, 'epoch': 0.31} {'loss': 1.0507, 'learning_rate': 1.8877968046032636e-05, 'epoch': 0.31} {'loss': 0.9296, 'learning_rate': 1.887781738243777e-05, 'epoch': 0.31} {'loss': 0.8909, 'learning_rate': 1.8877666709329528e-05, 'epoch': 0.31} {'loss': 0.9353, 'learning_rate': 1.8877516026708064e-05, 'epoch': 0.31} {'loss': 0.9194, 'learning_rate': 1.887736533457354e-05, 'epoch': 0.31} {'loss': 0.7105, 'learning_rate': 1.8877214632926116e-05, 'epoch': 0.31} {'loss': 0.8864, 'learning_rate': 1.8877063921765957e-05, 'epoch': 0.31} {'loss': 0.8891, 'learning_rate': 1.8876913201093222e-05, 'epoch': 0.31} {'loss': 0.8828, 'learning_rate': 1.8876762470908073e-05, 'epoch': 0.31} {'loss': 0.7417, 'learning_rate': 1.8876611731210673e-05, 'epoch': 0.31} {'loss': 0.7483, 'learning_rate': 1.887646098200118e-05, 'epoch': 0.31} {'loss': 0.8838, 'learning_rate': 1.8876310223279763e-05, 'epoch': 0.31} {'loss': 0.9487, 'learning_rate': 1.8876159455046576e-05, 'epoch': 0.31} {'loss': 0.7931, 'learning_rate': 1.887600867730178e-05, 'epoch': 0.31} {'loss': 0.8853, 'learning_rate': 1.8875857890045544e-05, 'epoch': 0.31} {'loss': 0.8816, 'learning_rate': 1.887570709327802e-05, 'epoch': 0.31} {'loss': 0.8261, 'learning_rate': 1.887555628699938e-05, 'epoch': 0.31} {'loss': 0.9449, 'learning_rate': 1.8875405471209774e-05, 'epoch': 0.31} {'loss': 0.9789, 'learning_rate': 1.8875254645909378e-05, 'epoch': 0.31} {'loss': 0.9681, 'learning_rate': 1.887510381109834e-05, 'epoch': 0.31} {'loss': 0.849, 'learning_rate': 1.887495296677683e-05, 'epoch': 0.31} {'loss': 0.9782, 'learning_rate': 1.8874802112945006e-05, 'epoch': 0.31} {'loss': 0.8379, 'learning_rate': 1.887465124960303e-05, 'epoch': 0.31} {'loss': 0.7753, 'learning_rate': 1.8874500376751067e-05, 'epoch': 0.31} {'loss': 1.0276, 'learning_rate': 1.887434949438927e-05, 'epoch': 0.31} {'loss': 1.0199, 'learning_rate': 1.887419860251781e-05, 'epoch': 0.31} {'loss': 0.8704, 'learning_rate': 1.8874047701136846e-05, 'epoch': 0.31} {'loss': 0.9005, 'learning_rate': 1.887389679024654e-05, 'epoch': 0.31} {'loss': 0.9032, 'learning_rate': 1.887374586984705e-05, 'epoch': 0.31} {'loss': 0.7548, 'learning_rate': 1.887359493993854e-05, 'epoch': 0.31} {'loss': 0.9811, 'learning_rate': 1.8873444000521174e-05, 'epoch': 0.31} {'loss': 0.8111, 'learning_rate': 1.887329305159511e-05, 'epoch': 0.31} {'loss': 1.0196, 'learning_rate': 1.887314209316051e-05, 'epoch': 0.31} {'loss': 0.8271, 'learning_rate': 1.8872991125217544e-05, 'epoch': 0.31} {'loss': 0.8828, 'learning_rate': 1.8872840147766364e-05, 'epoch': 0.31} {'loss': 0.8745, 'learning_rate': 1.8872689160807135e-05, 'epoch': 0.31} {'loss': 0.7866, 'learning_rate': 1.8872538164340018e-05, 'epoch': 0.31} {'loss': 0.8541, 'learning_rate': 1.8872387158365176e-05, 'epoch': 0.31} {'loss': 0.7501, 'learning_rate': 1.887223614288277e-05, 'epoch': 0.31} {'loss': 0.8839, 'learning_rate': 1.8872085117892964e-05, 'epoch': 0.31} {'loss': 0.9081, 'learning_rate': 1.8871934083395914e-05, 'epoch': 0.31} {'loss': 0.733, 'learning_rate': 1.887178303939179e-05, 'epoch': 0.31} {'loss': 0.8653, 'learning_rate': 1.8871631985880745e-05, 'epoch': 0.31} {'loss': 0.8232, 'learning_rate': 1.887148092286295e-05, 'epoch': 0.31} {'loss': 0.795, 'learning_rate': 1.887132985033856e-05, 'epoch': 0.31} {'loss': 0.6778, 'learning_rate': 1.887117876830774e-05, 'epoch': 0.31} {'loss': 0.8894, 'learning_rate': 1.887102767677065e-05, 'epoch': 0.31} {'loss': 0.6397, 'learning_rate': 1.8870876575727458e-05, 'epoch': 0.31} {'loss': 0.9019, 'learning_rate': 1.8870725465178318e-05, 'epoch': 0.31} {'loss': 0.9793, 'learning_rate': 1.8870574345123396e-05, 'epoch': 0.31} {'loss': 0.813, 'learning_rate': 1.887042321556285e-05, 'epoch': 0.31} {'loss': 1.0412, 'learning_rate': 1.8870272076496848e-05, 'epoch': 0.31} {'loss': 0.6705, 'learning_rate': 1.8870120927925545e-05, 'epoch': 0.31} {'loss': 0.9067, 'learning_rate': 1.8869969769849112e-05, 'epoch': 0.31} {'loss': 0.9998, 'learning_rate': 1.8869818602267703e-05, 'epoch': 0.31} {'loss': 1.0715, 'learning_rate': 1.8869667425181483e-05, 'epoch': 0.31} {'loss': 0.8669, 'learning_rate': 1.8869516238590614e-05, 'epoch': 0.31} {'loss': 0.7772, 'learning_rate': 1.8869365042495257e-05, 'epoch': 0.31} {'loss': 1.0908, 'learning_rate': 1.8869213836895577e-05, 'epoch': 0.31} {'loss': 0.894, 'learning_rate': 1.8869062621791733e-05, 'epoch': 0.31} {'loss': 0.8699, 'learning_rate': 1.8868911397183888e-05, 'epoch': 0.31} {'loss': 0.8178, 'learning_rate': 1.88687601630722e-05, 'epoch': 0.31} {'loss': 0.9668, 'learning_rate': 1.8868608919456842e-05, 'epoch': 0.31} {'loss': 0.815, 'learning_rate': 1.8868457666337966e-05, 'epoch': 0.31} {'loss': 0.9742, 'learning_rate': 1.8868306403715733e-05, 'epoch': 0.31} {'loss': 0.8588, 'learning_rate': 1.886815513159032e-05, 'epoch': 0.31} {'loss': 0.8234, 'learning_rate': 1.8868003849961866e-05, 'epoch': 0.31} {'loss': 0.8328, 'learning_rate': 1.8867852558830554e-05, 'epoch': 0.31} {'loss': 0.988, 'learning_rate': 1.8867701258196532e-05, 'epoch': 0.31} {'loss': 0.7336, 'learning_rate': 1.8867549948059972e-05, 'epoch': 0.31} {'loss': 0.8281, 'learning_rate': 1.886739862842103e-05, 'epoch': 0.31} {'loss': 0.8565, 'learning_rate': 1.886724729927987e-05, 'epoch': 0.31} {'loss': 0.9311, 'learning_rate': 1.8867095960636654e-05, 'epoch': 0.31} {'loss': 0.9239, 'learning_rate': 1.8866944612491544e-05, 'epoch': 0.31} {'loss': 0.9984, 'learning_rate': 1.8866793254844707e-05, 'epoch': 0.31} {'loss': 1.0885, 'learning_rate': 1.8866641887696294e-05, 'epoch': 0.31} {'loss': 0.8374, 'learning_rate': 1.886649051104648e-05, 'epoch': 0.31} {'loss': 0.7722, 'learning_rate': 1.8866339124895417e-05, 'epoch': 0.31} {'loss': 0.8387, 'learning_rate': 1.8866187729243272e-05, 'epoch': 0.31} {'loss': 0.8317, 'learning_rate': 1.886603632409021e-05, 'epoch': 0.31} {'loss': 0.8491, 'learning_rate': 1.8865884909436387e-05, 'epoch': 0.31} {'loss': 0.893, 'learning_rate': 1.8865733485281965e-05, 'epoch': 0.31} {'loss': 0.7107, 'learning_rate': 1.8865582051627114e-05, 'epoch': 0.31} {'loss': 0.7954, 'learning_rate': 1.8865430608471992e-05, 'epoch': 0.31} {'loss': 0.9312, 'learning_rate': 1.886527915581676e-05, 'epoch': 0.31} {'loss': 0.9416, 'learning_rate': 1.8865127693661576e-05, 'epoch': 0.31} {'loss': 0.787, 'learning_rate': 1.8864976222006615e-05, 'epoch': 0.31} {'loss': 0.9136, 'learning_rate': 1.886482474085203e-05, 'epoch': 0.31} {'loss': 0.8024, 'learning_rate': 1.8864673250197983e-05, 'epoch': 0.31} {'loss': 0.8649, 'learning_rate': 1.886452175004464e-05, 'epoch': 0.31} {'loss': 0.8386, 'learning_rate': 1.886437024039216e-05, 'epoch': 0.31} {'loss': 0.9524, 'learning_rate': 1.886421872124071e-05, 'epoch': 0.31} {'loss': 0.8644, 'learning_rate': 1.8864067192590448e-05, 'epoch': 0.31} {'loss': 0.7883, 'learning_rate': 1.8863915654441536e-05, 'epoch': 0.31} {'loss': 0.9119, 'learning_rate': 1.8863764106794143e-05, 'epoch': 0.31} {'loss': 0.84, 'learning_rate': 1.8863612549648424e-05, 'epoch': 0.31} {'loss': 0.7598, 'learning_rate': 1.8863460983004545e-05, 'epoch': 0.31} {'loss': 0.7961, 'learning_rate': 1.8863309406862665e-05, 'epoch': 0.31} {'loss': 0.992, 'learning_rate': 1.8863157821222954e-05, 'epoch': 0.31} {'loss': 0.9056, 'learning_rate': 1.8863006226085567e-05, 'epoch': 0.31} {'loss': 0.6971, 'learning_rate': 1.8862854621450668e-05, 'epoch': 0.31} {'loss': 0.8483, 'learning_rate': 1.886270300731842e-05, 'epoch': 0.31} {'loss': 0.74, 'learning_rate': 1.8862551383688985e-05, 'epoch': 0.31} {'loss': 0.8411, 'learning_rate': 1.886239975056253e-05, 'epoch': 0.31} {'loss': 0.9388, 'learning_rate': 1.8862248107939213e-05, 'epoch': 0.31} {'loss': 0.8737, 'learning_rate': 1.8862096455819196e-05, 'epoch': 0.31} {'loss': 0.8152, 'learning_rate': 1.8861944794202642e-05, 'epoch': 0.31} {'loss': 0.7521, 'learning_rate': 1.8861793123089717e-05, 'epoch': 0.31} {'loss': 0.7589, 'learning_rate': 1.8861641442480577e-05, 'epoch': 0.31} {'loss': 1.0433, 'learning_rate': 1.886148975237539e-05, 'epoch': 0.31} {'loss': 1.0023, 'learning_rate': 1.8861338052774316e-05, 'epoch': 0.31} {'loss': 0.9839, 'learning_rate': 1.886118634367752e-05, 'epoch': 0.31} {'loss': 1.034, 'learning_rate': 1.8861034625085162e-05, 'epoch': 0.31} {'loss': 0.8564, 'learning_rate': 1.8860882896997407e-05, 'epoch': 0.31} {'loss': 0.8221, 'learning_rate': 1.8860731159414415e-05, 'epoch': 0.31} {'loss': 0.9424, 'learning_rate': 1.8860579412336353e-05, 'epoch': 0.31} {'loss': 0.9715, 'learning_rate': 1.8860427655763377e-05, 'epoch': 0.31} {'loss': 0.8257, 'learning_rate': 1.8860275889695657e-05, 'epoch': 0.31} {'loss': 0.7483, 'learning_rate': 1.8860124114133348e-05, 'epoch': 0.31} {'loss': 0.9128, 'learning_rate': 1.8859972329076616e-05, 'epoch': 0.31} {'loss': 0.8985, 'learning_rate': 1.8859820534525623e-05, 'epoch': 0.31} {'loss': 0.7936, 'learning_rate': 1.8859668730480537e-05, 'epoch': 0.31} {'loss': 1.1063, 'learning_rate': 1.8859516916941512e-05, 'epoch': 0.31} {'loss': 0.8637, 'learning_rate': 1.885936509390872e-05, 'epoch': 0.31} {'loss': 0.8666, 'learning_rate': 1.8859213261382315e-05, 'epoch': 0.31} {'loss': 0.9543, 'learning_rate': 1.8859061419362462e-05, 'epoch': 0.31} {'loss': 0.7065, 'learning_rate': 1.885890956784933e-05, 'epoch': 0.31} {'loss': 0.894, 'learning_rate': 1.8858757706843074e-05, 'epoch': 0.31} {'loss': 0.7861, 'learning_rate': 1.885860583634386e-05, 'epoch': 0.31} {'loss': 0.8136, 'learning_rate': 1.885845395635185e-05, 'epoch': 0.31} {'loss': 0.9374, 'learning_rate': 1.8858302066867208e-05, 'epoch': 0.31} {'loss': 0.8522, 'learning_rate': 1.8858150167890094e-05, 'epoch': 0.31} {'loss': 0.9535, 'learning_rate': 1.8857998259420675e-05, 'epoch': 0.31} {'loss': 0.8806, 'learning_rate': 1.8857846341459107e-05, 'epoch': 0.31} {'loss': 0.8911, 'learning_rate': 1.8857694414005562e-05, 'epoch': 0.31} {'loss': 1.0214, 'learning_rate': 1.8857542477060193e-05, 'epoch': 0.31} {'loss': 0.8876, 'learning_rate': 1.8857390530623173e-05, 'epoch': 0.31} {'loss': 0.9289, 'learning_rate': 1.8857238574694657e-05, 'epoch': 0.31} {'loss': 0.9499, 'learning_rate': 1.885708660927481e-05, 'epoch': 0.31} {'loss': 0.8495, 'learning_rate': 1.8856934634363796e-05, 'epoch': 0.31} {'loss': 0.9313, 'learning_rate': 1.8856782649961777e-05, 'epoch': 0.31} {'loss': 0.8233, 'learning_rate': 1.8856630656068916e-05, 'epoch': 0.31} {'loss': 0.8563, 'learning_rate': 1.8856478652685376e-05, 'epoch': 0.31} {'loss': 1.0645, 'learning_rate': 1.8856326639811323e-05, 'epoch': 0.31} {'loss': 0.9611, 'learning_rate': 1.8856174617446913e-05, 'epoch': 0.31} {'loss': 0.9679, 'learning_rate': 1.8856022585592312e-05, 'epoch': 0.31} {'loss': 0.7713, 'learning_rate': 1.8855870544247686e-05, 'epoch': 0.31} {'loss': 0.7564, 'learning_rate': 1.8855718493413194e-05, 'epoch': 0.31} {'loss': 0.9981, 'learning_rate': 1.8855566433089e-05, 'epoch': 0.31} {'loss': 0.7716, 'learning_rate': 1.8855414363275268e-05, 'epoch': 0.31} {'loss': 0.7721, 'learning_rate': 1.885526228397216e-05, 'epoch': 0.31} {'loss': 0.8103, 'learning_rate': 1.885511019517984e-05, 'epoch': 0.31} {'loss': 0.8578, 'learning_rate': 1.885495809689847e-05, 'epoch': 0.31} {'loss': 0.9629, 'learning_rate': 1.885480598912821e-05, 'epoch': 0.31} {'loss': 0.7538, 'learning_rate': 1.885465387186923e-05, 'epoch': 0.31} {'loss': 0.8259, 'learning_rate': 1.885450174512169e-05, 'epoch': 0.31} {'loss': 0.7228, 'learning_rate': 1.885434960888575e-05, 'epoch': 0.31} {'loss': 0.8792, 'learning_rate': 1.8854197463161575e-05, 'epoch': 0.31} {'loss': 0.7081, 'learning_rate': 1.885404530794933e-05, 'epoch': 0.31} {'loss': 1.0905, 'learning_rate': 1.8853893143249172e-05, 'epoch': 0.31} {'loss': 0.9504, 'learning_rate': 1.8853740969061275e-05, 'epoch': 0.31} {'loss': 1.1054, 'learning_rate': 1.885358878538579e-05, 'epoch': 0.31} {'loss': 0.8639, 'learning_rate': 1.8853436592222885e-05, 'epoch': 0.31} {'loss': 0.9011, 'learning_rate': 1.8853284389572727e-05, 'epoch': 0.31} {'loss': 0.8121, 'learning_rate': 1.8853132177435478e-05, 'epoch': 0.31} {'loss': 0.8574, 'learning_rate': 1.8852979955811293e-05, 'epoch': 0.31} {'loss': 1.0165, 'learning_rate': 1.8852827724700343e-05, 'epoch': 0.31} {'loss': 0.6822, 'learning_rate': 1.885267548410279e-05, 'epoch': 0.31} {'loss': 1.0881, 'learning_rate': 1.8852523234018797e-05, 'epoch': 0.31} {'loss': 0.8904, 'learning_rate': 1.8852370974448523e-05, 'epoch': 0.31} {'loss': 0.969, 'learning_rate': 1.8852218705392137e-05, 'epoch': 0.31} {'loss': 0.9457, 'learning_rate': 1.88520664268498e-05, 'epoch': 0.31} {'loss': 0.8316, 'learning_rate': 1.8851914138821676e-05, 'epoch': 0.31} {'loss': 0.7522, 'learning_rate': 1.8851761841307924e-05, 'epoch': 0.31} {'loss': 0.8772, 'learning_rate': 1.8851609534308714e-05, 'epoch': 0.31} {'loss': 0.8177, 'learning_rate': 1.8851457217824202e-05, 'epoch': 0.31} {'loss': 0.9786, 'learning_rate': 1.8851304891854557e-05, 'epoch': 0.31} {'loss': 0.6444, 'learning_rate': 1.8851152556399936e-05, 'epoch': 0.31} {'loss': 0.855, 'learning_rate': 1.885100021146051e-05, 'epoch': 0.31} {'loss': 0.9352, 'learning_rate': 1.8850847857036438e-05, 'epoch': 0.31} {'loss': 0.7632, 'learning_rate': 1.8850695493127883e-05, 'epoch': 0.31} {'loss': 1.0451, 'learning_rate': 1.8850543119735008e-05, 'epoch': 0.31} {'loss': 0.8893, 'learning_rate': 1.885039073685798e-05, 'epoch': 0.31} {'loss': 0.8369, 'learning_rate': 1.8850238344496955e-05, 'epoch': 0.31} {'loss': 0.7922, 'learning_rate': 1.8850085942652105e-05, 'epoch': 0.31} {'loss': 0.8336, 'learning_rate': 1.884993353132359e-05, 'epoch': 0.31} {'loss': 0.8217, 'learning_rate': 1.884978111051157e-05, 'epoch': 0.31} {'loss': 0.8935, 'learning_rate': 1.884962868021621e-05, 'epoch': 0.31} {'loss': 0.7636, 'learning_rate': 1.8849476240437675e-05, 'epoch': 0.31} {'loss': 1.0349, 'learning_rate': 1.8849323791176127e-05, 'epoch': 0.31} {'loss': 0.7203, 'learning_rate': 1.884917133243173e-05, 'epoch': 0.31} {'loss': 0.8845, 'learning_rate': 1.8849018864204648e-05, 'epoch': 0.31} {'loss': 1.0569, 'learning_rate': 1.8848866386495044e-05, 'epoch': 0.31} {'loss': 0.7867, 'learning_rate': 1.8848713899303083e-05, 'epoch': 0.31} {'loss': 0.9393, 'learning_rate': 1.8848561402628923e-05, 'epoch': 0.31} {'loss': 0.9783, 'learning_rate': 1.8848408896472728e-05, 'epoch': 0.31} {'loss': 0.9366, 'learning_rate': 1.884825638083467e-05, 'epoch': 0.31} {'loss': 0.8954, 'learning_rate': 1.8848103855714904e-05, 'epoch': 0.31} {'loss': 0.8649, 'learning_rate': 1.8847951321113598e-05, 'epoch': 0.31} {'loss': 0.8418, 'learning_rate': 1.8847798777030913e-05, 'epoch': 0.31} {'loss': 0.8464, 'learning_rate': 1.8847646223467012e-05, 'epoch': 0.31} {'loss': 0.7658, 'learning_rate': 1.8847493660422058e-05, 'epoch': 0.31} {'loss': 0.8656, 'learning_rate': 1.884734108789622e-05, 'epoch': 0.31} {'loss': 0.9723, 'learning_rate': 1.8847188505889654e-05, 'epoch': 0.31} {'loss': 0.7704, 'learning_rate': 1.8847035914402526e-05, 'epoch': 0.31} {'loss': 0.9217, 'learning_rate': 1.8846883313435005e-05, 'epoch': 0.31} {'loss': 1.0429, 'learning_rate': 1.884673070298725e-05, 'epoch': 0.31} {'loss': 0.8563, 'learning_rate': 1.884657808305942e-05, 'epoch': 0.31} {'loss': 0.8303, 'learning_rate': 1.8846425453651688e-05, 'epoch': 0.31} {'loss': 0.9242, 'learning_rate': 1.8846272814764207e-05, 'epoch': 0.31} {'loss': 0.7895, 'learning_rate': 1.884612016639715e-05, 'epoch': 0.31} {'loss': 0.8232, 'learning_rate': 1.884596750855068e-05, 'epoch': 0.31} {'loss': 0.8866, 'learning_rate': 1.884581484122495e-05, 'epoch': 0.31} {'loss': 0.7292, 'learning_rate': 1.8845662164420134e-05, 'epoch': 0.31} {'loss': 0.9471, 'learning_rate': 1.8845509478136396e-05, 'epoch': 0.31} {'loss': 0.9106, 'learning_rate': 1.884535678237389e-05, 'epoch': 0.31} {'loss': 0.9959, 'learning_rate': 1.8845204077132793e-05, 'epoch': 0.31} {'loss': 1.03, 'learning_rate': 1.8845051362413258e-05, 'epoch': 0.31} {'loss': 0.8787, 'learning_rate': 1.884489863821545e-05, 'epoch': 0.31} {'loss': 0.7959, 'learning_rate': 1.8844745904539538e-05, 'epoch': 0.31} {'loss': 0.8097, 'learning_rate': 1.884459316138568e-05, 'epoch': 0.31} {'loss': 0.8605, 'learning_rate': 1.8844440408754046e-05, 'epoch': 0.31} {'loss': 0.6639, 'learning_rate': 1.8844287646644792e-05, 'epoch': 0.31} {'loss': 0.9117, 'learning_rate': 1.8844134875058087e-05, 'epoch': 0.31} {'loss': 0.8359, 'learning_rate': 1.8843982093994096e-05, 'epoch': 0.31} {'loss': 0.8272, 'learning_rate': 1.8843829303452975e-05, 'epoch': 0.31} {'loss': 0.8584, 'learning_rate': 1.8843676503434894e-05, 'epoch': 0.31} {'loss': 0.8697, 'learning_rate': 1.8843523693940016e-05, 'epoch': 0.31} {'loss': 0.813, 'learning_rate': 1.884337087496851e-05, 'epoch': 0.31} {'loss': 0.8374, 'learning_rate': 1.8843218046520525e-05, 'epoch': 0.31} {'loss': 0.9197, 'learning_rate': 1.8843065208596236e-05, 'epoch': 0.31} {'loss': 0.9402, 'learning_rate': 1.8842912361195806e-05, 'epoch': 0.31} {'loss': 0.9942, 'learning_rate': 1.8842759504319398e-05, 'epoch': 0.31} {'loss': 0.7694, 'learning_rate': 1.8842606637967172e-05, 'epoch': 0.31} {'loss': 0.8065, 'learning_rate': 1.88424537621393e-05, 'epoch': 0.31} {'loss': 0.8031, 'learning_rate': 1.8842300876835934e-05, 'epoch': 0.31} {'loss': 0.9221, 'learning_rate': 1.8842147982057252e-05, 'epoch': 0.31} {'loss': 0.8011, 'learning_rate': 1.8841995077803405e-05, 'epoch': 0.31} {'loss': 0.9527, 'learning_rate': 1.8841842164074566e-05, 'epoch': 0.31} {'loss': 0.9525, 'learning_rate': 1.884168924087089e-05, 'epoch': 0.31} {'loss': 0.9014, 'learning_rate': 1.884153630819255e-05, 'epoch': 0.31} {'loss': 0.798, 'learning_rate': 1.8841383366039704e-05, 'epoch': 0.31} {'loss': 0.7822, 'learning_rate': 1.884123041441252e-05, 'epoch': 0.31} {'loss': 0.8205, 'learning_rate': 1.8841077453311158e-05, 'epoch': 0.31} {'loss': 0.9687, 'learning_rate': 1.8840924482735783e-05, 'epoch': 0.31} {'loss': 0.8874, 'learning_rate': 1.8840771502686558e-05, 'epoch': 0.31} {'loss': 0.7546, 'learning_rate': 1.8840618513163652e-05, 'epoch': 0.31} {'loss': 1.0233, 'learning_rate': 1.884046551416722e-05, 'epoch': 0.31} {'loss': 1.0246, 'learning_rate': 1.884031250569744e-05, 'epoch': 0.31} {'loss': 0.6672, 'learning_rate': 1.884015948775446e-05, 'epoch': 0.31} {'loss': 0.9148, 'learning_rate': 1.8840006460338455e-05, 'epoch': 0.31} {'loss': 0.9749, 'learning_rate': 1.8839853423449582e-05, 'epoch': 0.31} {'loss': 0.8609, 'learning_rate': 1.883970037708801e-05, 'epoch': 0.31} {'loss': 0.7303, 'learning_rate': 1.8839547321253905e-05, 'epoch': 0.32} {'loss': 0.642, 'learning_rate': 1.8839394255947422e-05, 'epoch': 0.32} {'loss': 1.0373, 'learning_rate': 1.8839241181168733e-05, 'epoch': 0.32} {'loss': 0.7578, 'learning_rate': 1.8839088096917995e-05, 'epoch': 0.32} {'loss': 0.8903, 'learning_rate': 1.8838935003195384e-05, 'epoch': 0.32} {'loss': 0.8291, 'learning_rate': 1.883878190000105e-05, 'epoch': 0.32} {'loss': 1.0249, 'learning_rate': 1.8838628787335166e-05, 'epoch': 0.32} {'loss': 0.8962, 'learning_rate': 1.8838475665197892e-05, 'epoch': 0.32} {'loss': 0.7317, 'learning_rate': 1.8838322533589393e-05, 'epoch': 0.32} {'loss': 0.9824, 'learning_rate': 1.8838169392509834e-05, 'epoch': 0.32} {'loss': 0.8988, 'learning_rate': 1.883801624195938e-05, 'epoch': 0.32} {'loss': 0.9347, 'learning_rate': 1.8837863081938196e-05, 'epoch': 0.32} {'loss': 0.9093, 'learning_rate': 1.883770991244644e-05, 'epoch': 0.32} {'loss': 0.7245, 'learning_rate': 1.8837556733484285e-05, 'epoch': 0.32} {'loss': 0.8361, 'learning_rate': 1.8837403545051883e-05, 'epoch': 0.32} {'loss': 0.8849, 'learning_rate': 1.8837250347149413e-05, 'epoch': 0.32} {'loss': 0.9318, 'learning_rate': 1.8837097139777026e-05, 'epoch': 0.32} {'loss': 1.0117, 'learning_rate': 1.8836943922934896e-05, 'epoch': 0.32} {'loss': 1.063, 'learning_rate': 1.883679069662318e-05, 'epoch': 0.32} {'loss': 0.8405, 'learning_rate': 1.8836637460842047e-05, 'epoch': 0.32} {'loss': 0.9661, 'learning_rate': 1.883648421559166e-05, 'epoch': 0.32} {'loss': 0.9438, 'learning_rate': 1.883633096087218e-05, 'epoch': 0.32} {'loss': 1.1095, 'learning_rate': 1.8836177696683777e-05, 'epoch': 0.32} {'loss': 0.7289, 'learning_rate': 1.883602442302661e-05, 'epoch': 0.32} {'loss': 0.8682, 'learning_rate': 1.8835871139900845e-05, 'epoch': 0.32} {'loss': 0.8826, 'learning_rate': 1.8835717847306647e-05, 'epoch': 0.32} {'loss': 0.8922, 'learning_rate': 1.883556454524418e-05, 'epoch': 0.32} {'loss': 0.9713, 'learning_rate': 1.883541123371361e-05, 'epoch': 0.32} {'loss': 1.1241, 'learning_rate': 1.8835257912715095e-05, 'epoch': 0.32} {'loss': 0.8579, 'learning_rate': 1.8835104582248808e-05, 'epoch': 0.32} {'loss': 0.7547, 'learning_rate': 1.883495124231491e-05, 'epoch': 0.32} {'loss': 0.7831, 'learning_rate': 1.8834797892913557e-05, 'epoch': 0.32} {'loss': 0.8586, 'learning_rate': 1.8834644534044927e-05, 'epoch': 0.32} {'loss': 0.8964, 'learning_rate': 1.8834491165709178e-05, 'epoch': 0.32} {'loss': 0.8953, 'learning_rate': 1.8834337787906475e-05, 'epoch': 0.32} {'loss': 0.6956, 'learning_rate': 1.8834184400636978e-05, 'epoch': 0.32} {'loss': 0.8511, 'learning_rate': 1.8834031003900855e-05, 'epoch': 0.32} {'loss': 0.9333, 'learning_rate': 1.8833877597698272e-05, 'epoch': 0.32} {'loss': 0.9228, 'learning_rate': 1.883372418202939e-05, 'epoch': 0.32} {'loss': 0.7447, 'learning_rate': 1.8833570756894378e-05, 'epoch': 0.32} {'loss': 0.959, 'learning_rate': 1.88334173222934e-05, 'epoch': 0.32} {'loss': 0.8931, 'learning_rate': 1.8833263878226616e-05, 'epoch': 0.32} {'loss': 0.9788, 'learning_rate': 1.8833110424694187e-05, 'epoch': 0.32} {'loss': 0.8611, 'learning_rate': 1.883295696169629e-05, 'epoch': 0.32} {'loss': 0.8386, 'learning_rate': 1.883280348923308e-05, 'epoch': 0.32} {'loss': 0.8064, 'learning_rate': 1.8832650007304724e-05, 'epoch': 0.32} {'loss': 0.8705, 'learning_rate': 1.8832496515911385e-05, 'epoch': 0.32} {'loss': 0.8045, 'learning_rate': 1.883234301505323e-05, 'epoch': 0.32} {'loss': 0.8959, 'learning_rate': 1.8832189504730422e-05, 'epoch': 0.32} {'loss': 0.844, 'learning_rate': 1.8832035984943126e-05, 'epoch': 0.32} {'loss': 0.9914, 'learning_rate': 1.8831882455691507e-05, 'epoch': 0.32} {'loss': 0.8095, 'learning_rate': 1.8831728916975725e-05, 'epoch': 0.32} {'loss': 0.9656, 'learning_rate': 1.8831575368795952e-05, 'epoch': 0.32} {'loss': 0.7327, 'learning_rate': 1.883142181115235e-05, 'epoch': 0.32} {'loss': 0.9472, 'learning_rate': 1.883126824404508e-05, 'epoch': 0.32} {'loss': 0.9374, 'learning_rate': 1.8831114667474307e-05, 'epoch': 0.32} {'loss': 0.9139, 'learning_rate': 1.8830961081440202e-05, 'epoch': 0.32} {'loss': 0.8143, 'learning_rate': 1.8830807485942922e-05, 'epoch': 0.32} {'loss': 0.9141, 'learning_rate': 1.8830653880982638e-05, 'epoch': 0.32} {'loss': 0.9382, 'learning_rate': 1.883050026655951e-05, 'epoch': 0.32} {'loss': 0.9079, 'learning_rate': 1.8830346642673703e-05, 'epoch': 0.32} {'loss': 0.9995, 'learning_rate': 1.883019300932538e-05, 'epoch': 0.32} {'loss': 1.0057, 'learning_rate': 1.883003936651471e-05, 'epoch': 0.32} {'loss': 0.853, 'learning_rate': 1.882988571424186e-05, 'epoch': 0.32} {'loss': 1.0304, 'learning_rate': 1.8829732052506987e-05, 'epoch': 0.32} {'loss': 0.9147, 'learning_rate': 1.8829578381310262e-05, 'epoch': 0.32} {'loss': 0.9452, 'learning_rate': 1.8829424700651843e-05, 'epoch': 0.32} {'loss': 0.8716, 'learning_rate': 1.88292710105319e-05, 'epoch': 0.32} {'loss': 1.0033, 'learning_rate': 1.8829117310950598e-05, 'epoch': 0.32} {'loss': 0.8562, 'learning_rate': 1.8828963601908098e-05, 'epoch': 0.32} {'loss': 0.7278, 'learning_rate': 1.8828809883404565e-05, 'epoch': 0.32} {'loss': 0.5927, 'learning_rate': 1.882865615544017e-05, 'epoch': 0.32} {'loss': 1.0284, 'learning_rate': 1.882850241801507e-05, 'epoch': 0.32} {'loss': 0.9562, 'learning_rate': 1.8828348671129434e-05, 'epoch': 0.32} {'loss': 0.9274, 'learning_rate': 1.882819491478342e-05, 'epoch': 0.32} {'loss': 0.7738, 'learning_rate': 1.8828041148977204e-05, 'epoch': 0.32} {'loss': 0.7675, 'learning_rate': 1.8827887373710947e-05, 'epoch': 0.32} {'loss': 0.6914, 'learning_rate': 1.8827733588984807e-05, 'epoch': 0.32} {'loss': 0.9199, 'learning_rate': 1.8827579794798958e-05, 'epoch': 0.32} {'loss': 0.8877, 'learning_rate': 1.8827425991153557e-05, 'epoch': 0.32} {'loss': 1.0699, 'learning_rate': 1.8827272178048774e-05, 'epoch': 0.32} {'loss': 1.0375, 'learning_rate': 1.8827118355484773e-05, 'epoch': 0.32} {'loss': 0.871, 'learning_rate': 1.8826964523461716e-05, 'epoch': 0.32} {'loss': 0.8502, 'learning_rate': 1.882681068197977e-05, 'epoch': 0.32} {'loss': 0.8118, 'learning_rate': 1.8826656831039102e-05, 'epoch': 0.32} {'loss': 0.8052, 'learning_rate': 1.882650297063987e-05, 'epoch': 0.32} {'loss': 0.9491, 'learning_rate': 1.8826349100782247e-05, 'epoch': 0.32} {'loss': 0.9538, 'learning_rate': 1.8826195221466396e-05, 'epoch': 0.32} {'loss': 1.0025, 'learning_rate': 1.8826041332692476e-05, 'epoch': 0.32} {'loss': 0.7289, 'learning_rate': 1.8825887434460658e-05, 'epoch': 0.32} {'loss': 0.7673, 'learning_rate': 1.8825733526771106e-05, 'epoch': 0.32} {'loss': 0.8764, 'learning_rate': 1.8825579609623982e-05, 'epoch': 0.32} {'loss': 0.7493, 'learning_rate': 1.8825425683019457e-05, 'epoch': 0.32} {'loss': 0.8133, 'learning_rate': 1.8825271746957687e-05, 'epoch': 0.32} {'loss': 0.9182, 'learning_rate': 1.8825117801438844e-05, 'epoch': 0.32} {'loss': 0.947, 'learning_rate': 1.882496384646309e-05, 'epoch': 0.32} {'loss': 0.8745, 'learning_rate': 1.882480988203059e-05, 'epoch': 0.32} {'loss': 0.8723, 'learning_rate': 1.882465590814151e-05, 'epoch': 0.32} {'loss': 0.9149, 'learning_rate': 1.882450192479602e-05, 'epoch': 0.32} {'loss': 0.9461, 'learning_rate': 1.8824347931994273e-05, 'epoch': 0.32} {'loss': 0.8805, 'learning_rate': 1.882419392973644e-05, 'epoch': 0.32} {'loss': 1.0047, 'learning_rate': 1.882403991802269e-05, 'epoch': 0.32} {'loss': 0.6896, 'learning_rate': 1.8823885896853186e-05, 'epoch': 0.32} {'loss': 0.7752, 'learning_rate': 1.8823731866228088e-05, 'epoch': 0.32} {'loss': 0.8975, 'learning_rate': 1.882357782614757e-05, 'epoch': 0.32} {'loss': 0.9618, 'learning_rate': 1.882342377661179e-05, 'epoch': 0.32} {'loss': 0.9064, 'learning_rate': 1.8823269717620914e-05, 'epoch': 0.32} {'loss': 0.7856, 'learning_rate': 1.8823115649175108e-05, 'epoch': 0.32} {'loss': 0.7972, 'learning_rate': 1.8822961571274537e-05, 'epoch': 0.32} {'loss': 0.8724, 'learning_rate': 1.8822807483919367e-05, 'epoch': 0.32} {'loss': 0.9048, 'learning_rate': 1.882265338710976e-05, 'epoch': 0.32} {'loss': 0.8934, 'learning_rate': 1.882249928084589e-05, 'epoch': 0.32} {'loss': 0.7606, 'learning_rate': 1.882234516512791e-05, 'epoch': 0.32} {'loss': 0.9667, 'learning_rate': 1.8822191039955994e-05, 'epoch': 0.32} {'loss': 0.6431, 'learning_rate': 1.88220369053303e-05, 'epoch': 0.32} {'loss': 1.0184, 'learning_rate': 1.8821882761251e-05, 'epoch': 0.32} {'loss': 0.7905, 'learning_rate': 1.882172860771826e-05, 'epoch': 0.32} {'loss': 0.87, 'learning_rate': 1.8821574444732235e-05, 'epoch': 0.32} {'loss': 0.8358, 'learning_rate': 1.88214202722931e-05, 'epoch': 0.32} {'loss': 1.054, 'learning_rate': 1.8821266090401017e-05, 'epoch': 0.32} {'loss': 0.8414, 'learning_rate': 1.882111189905615e-05, 'epoch': 0.32} {'loss': 0.7027, 'learning_rate': 1.8820957698258668e-05, 'epoch': 0.32} {'loss': 0.863, 'learning_rate': 1.882080348800873e-05, 'epoch': 0.32} {'loss': 0.8987, 'learning_rate': 1.8820649268306507e-05, 'epoch': 0.32} {'loss': 0.8867, 'learning_rate': 1.8820495039152163e-05, 'epoch': 0.32} {'loss': 0.7749, 'learning_rate': 1.882034080054586e-05, 'epoch': 0.32} {'loss': 0.8485, 'learning_rate': 1.8820186552487772e-05, 'epoch': 0.32} {'loss': 1.0037, 'learning_rate': 1.8820032294978052e-05, 'epoch': 0.32} {'loss': 0.8419, 'learning_rate': 1.881987802801687e-05, 'epoch': 0.32} {'loss': 0.825, 'learning_rate': 1.88197237516044e-05, 'epoch': 0.32} {'loss': 0.8719, 'learning_rate': 1.8819569465740795e-05, 'epoch': 0.32} {'loss': 0.7991, 'learning_rate': 1.8819415170426226e-05, 'epoch': 0.32} {'loss': 0.8847, 'learning_rate': 1.8819260865660857e-05, 'epoch': 0.32} {'loss': 0.8466, 'learning_rate': 1.8819106551444853e-05, 'epoch': 0.32} {'loss': 0.802, 'learning_rate': 1.8818952227778384e-05, 'epoch': 0.32} {'loss': 0.988, 'learning_rate': 1.881879789466161e-05, 'epoch': 0.32} {'loss': 0.888, 'learning_rate': 1.8818643552094697e-05, 'epoch': 0.32} {'loss': 0.6207, 'learning_rate': 1.881848920007781e-05, 'epoch': 0.32} {'loss': 0.8895, 'learning_rate': 1.8818334838611118e-05, 'epoch': 0.32} {'loss': 0.7056, 'learning_rate': 1.8818180467694786e-05, 'epoch': 0.32} {'loss': 0.7862, 'learning_rate': 1.8818026087328974e-05, 'epoch': 0.32} {'loss': 0.9079, 'learning_rate': 1.8817871697513853e-05, 'epoch': 0.32} {'loss': 0.9634, 'learning_rate': 1.881771729824959e-05, 'epoch': 0.32} {'loss': 0.9748, 'learning_rate': 1.8817562889536343e-05, 'epoch': 0.32} {'loss': 0.9892, 'learning_rate': 1.881740847137428e-05, 'epoch': 0.32} {'loss': 0.9524, 'learning_rate': 1.881725404376357e-05, 'epoch': 0.32} {'loss': 0.7883, 'learning_rate': 1.8817099606704378e-05, 'epoch': 0.32} {'loss': 0.8038, 'learning_rate': 1.8816945160196867e-05, 'epoch': 0.32} {'loss': 0.9607, 'learning_rate': 1.8816790704241202e-05, 'epoch': 0.32} {'loss': 0.549, 'learning_rate': 1.8816636238837552e-05, 'epoch': 0.32} {'loss': 1.0112, 'learning_rate': 1.881648176398608e-05, 'epoch': 0.32} {'loss': 0.781, 'learning_rate': 1.881632727968695e-05, 'epoch': 0.32} {'loss': 0.9432, 'learning_rate': 1.8816172785940335e-05, 'epoch': 0.32} {'loss': 0.8047, 'learning_rate': 1.881601828274639e-05, 'epoch': 0.32} {'loss': 0.9028, 'learning_rate': 1.8815863770105286e-05, 'epoch': 0.32} {'loss': 0.8381, 'learning_rate': 1.8815709248017195e-05, 'epoch': 0.32} {'loss': 0.9775, 'learning_rate': 1.8815554716482267e-05, 'epoch': 0.32} {'loss': 0.9999, 'learning_rate': 1.881540017550068e-05, 'epoch': 0.32} {'loss': 0.9978, 'learning_rate': 1.8815245625072597e-05, 'epoch': 0.32} {'loss': 0.8739, 'learning_rate': 1.881509106519818e-05, 'epoch': 0.32} {'loss': 0.8356, 'learning_rate': 1.88149364958776e-05, 'epoch': 0.32} {'loss': 0.9417, 'learning_rate': 1.881478191711102e-05, 'epoch': 0.32} {'loss': 0.8352, 'learning_rate': 1.8814627328898606e-05, 'epoch': 0.32} {'loss': 0.9902, 'learning_rate': 1.8814472731240522e-05, 'epoch': 0.32} {'loss': 1.024, 'learning_rate': 1.8814318124136934e-05, 'epoch': 0.32} {'loss': 1.0269, 'learning_rate': 1.881416350758801e-05, 'epoch': 0.32} {'loss': 0.872, 'learning_rate': 1.8814008881593913e-05, 'epoch': 0.32} {'loss': 0.9772, 'learning_rate': 1.881385424615481e-05, 'epoch': 0.32} {'loss': 0.9293, 'learning_rate': 1.8813699601270867e-05, 'epoch': 0.32} {'loss': 0.9678, 'learning_rate': 1.8813544946942248e-05, 'epoch': 0.32} {'loss': 0.9253, 'learning_rate': 1.8813390283169123e-05, 'epoch': 0.32} {'loss': 0.8538, 'learning_rate': 1.8813235609951655e-05, 'epoch': 0.32} {'loss': 0.8982, 'learning_rate': 1.881308092729001e-05, 'epoch': 0.32} {'loss': 0.7606, 'learning_rate': 1.881292623518435e-05, 'epoch': 0.32} {'loss': 0.7456, 'learning_rate': 1.8812771533634847e-05, 'epoch': 0.32} {'loss': 0.9271, 'learning_rate': 1.881261682264166e-05, 'epoch': 0.32} {'loss': 0.8046, 'learning_rate': 1.8812462102204963e-05, 'epoch': 0.32} {'loss': 0.6601, 'learning_rate': 1.8812307372324915e-05, 'epoch': 0.32} {'loss': 0.8516, 'learning_rate': 1.8812152633001685e-05, 'epoch': 0.32} {'loss': 0.9084, 'learning_rate': 1.8811997884235438e-05, 'epoch': 0.32} {'loss': 0.9879, 'learning_rate': 1.881184312602634e-05, 'epoch': 0.32} {'loss': 0.875, 'learning_rate': 1.8811688358374556e-05, 'epoch': 0.32} {'loss': 0.9042, 'learning_rate': 1.8811533581280254e-05, 'epoch': 0.32} {'loss': 0.7666, 'learning_rate': 1.88113787947436e-05, 'epoch': 0.32} {'loss': 0.953, 'learning_rate': 1.8811223998764758e-05, 'epoch': 0.32} {'loss': 0.7956, 'learning_rate': 1.881106919334389e-05, 'epoch': 0.32} {'loss': 0.9199, 'learning_rate': 1.881091437848117e-05, 'epoch': 0.32} {'loss': 0.8305, 'learning_rate': 1.8810759554176758e-05, 'epoch': 0.32} {'loss': 1.0119, 'learning_rate': 1.8810604720430822e-05, 'epoch': 0.32} {'loss': 0.9345, 'learning_rate': 1.881044987724353e-05, 'epoch': 0.32} {'loss': 0.9165, 'learning_rate': 1.8810295024615043e-05, 'epoch': 0.32} {'loss': 0.891, 'learning_rate': 1.881014016254553e-05, 'epoch': 0.32} {'loss': 0.9319, 'learning_rate': 1.8809985291035157e-05, 'epoch': 0.32} {'loss': 1.0703, 'learning_rate': 1.8809830410084092e-05, 'epoch': 0.32} {'loss': 0.9276, 'learning_rate': 1.8809675519692496e-05, 'epoch': 0.32} {'loss': 0.8202, 'learning_rate': 1.880952061986054e-05, 'epoch': 0.32} {'loss': 0.7312, 'learning_rate': 1.880936571058838e-05, 'epoch': 0.32} {'loss': 0.9426, 'learning_rate': 1.88092107918762e-05, 'epoch': 0.32} {'loss': 0.8752, 'learning_rate': 1.880905586372415e-05, 'epoch': 0.32} {'loss': 0.9415, 'learning_rate': 1.8808900926132403e-05, 'epoch': 0.32} {'loss': 0.8492, 'learning_rate': 1.8808745979101123e-05, 'epoch': 0.32} {'loss': 0.9166, 'learning_rate': 1.8808591022630478e-05, 'epoch': 0.32} {'loss': 1.0248, 'learning_rate': 1.8808436056720632e-05, 'epoch': 0.32} {'loss': 0.6686, 'learning_rate': 1.880828108137175e-05, 'epoch': 0.32} {'loss': 0.9598, 'learning_rate': 1.8808126096584e-05, 'epoch': 0.32} {'loss': 0.8019, 'learning_rate': 1.8807971102357553e-05, 'epoch': 0.32} {'loss': 0.88, 'learning_rate': 1.8807816098692562e-05, 'epoch': 0.32} {'loss': 0.8833, 'learning_rate': 1.8807661085589206e-05, 'epoch': 0.32} {'loss': 0.8917, 'learning_rate': 1.8807506063047646e-05, 'epoch': 0.32} {'loss': 1.0019, 'learning_rate': 1.8807351031068045e-05, 'epoch': 0.32} {'loss': 0.9985, 'learning_rate': 1.8807195989650576e-05, 'epoch': 0.32} {'loss': 0.9461, 'learning_rate': 1.8807040938795402e-05, 'epoch': 0.32} {'loss': 0.9468, 'learning_rate': 1.8806885878502688e-05, 'epoch': 0.32} {'loss': 0.8991, 'learning_rate': 1.88067308087726e-05, 'epoch': 0.32} {'loss': 1.0376, 'learning_rate': 1.8806575729605306e-05, 'epoch': 0.32} {'loss': 0.8652, 'learning_rate': 1.880642064100097e-05, 'epoch': 0.32} {'loss': 0.8988, 'learning_rate': 1.8806265542959758e-05, 'epoch': 0.32} {'loss': 0.9168, 'learning_rate': 1.8806110435481844e-05, 'epoch': 0.32} {'loss': 0.7635, 'learning_rate': 1.880595531856738e-05, 'epoch': 0.32} {'loss': 1.0416, 'learning_rate': 1.8805800192216545e-05, 'epoch': 0.32} {'loss': 0.7924, 'learning_rate': 1.88056450564295e-05, 'epoch': 0.32} {'loss': 0.9715, 'learning_rate': 1.8805489911206408e-05, 'epoch': 0.32} {'loss': 0.9875, 'learning_rate': 1.8805334756547444e-05, 'epoch': 0.32} {'loss': 0.8942, 'learning_rate': 1.8805179592452763e-05, 'epoch': 0.32} {'loss': 0.9325, 'learning_rate': 1.8805024418922542e-05, 'epoch': 0.32} {'loss': 0.931, 'learning_rate': 1.880486923595694e-05, 'epoch': 0.32} {'loss': 1.0593, 'learning_rate': 1.8804714043556133e-05, 'epoch': 0.32} {'loss': 0.7825, 'learning_rate': 1.8804558841720273e-05, 'epoch': 0.32} {'loss': 0.9159, 'learning_rate': 1.8804403630449534e-05, 'epoch': 0.32} {'loss': 0.8079, 'learning_rate': 1.8804248409744084e-05, 'epoch': 0.32} {'loss': 0.8884, 'learning_rate': 1.8804093179604086e-05, 'epoch': 0.32} {'loss': 0.8405, 'learning_rate': 1.8803937940029707e-05, 'epoch': 0.32} {'loss': 0.7396, 'learning_rate': 1.8803782691021115e-05, 'epoch': 0.32} {'loss': 0.7964, 'learning_rate': 1.8803627432578474e-05, 'epoch': 0.32} {'loss': 0.9342, 'learning_rate': 1.8803472164701952e-05, 'epoch': 0.32} {'loss': 0.8918, 'learning_rate': 1.8803316887391716e-05, 'epoch': 0.32} {'loss': 1.0422, 'learning_rate': 1.8803161600647932e-05, 'epoch': 0.32} {'loss': 0.8034, 'learning_rate': 1.8803006304470766e-05, 'epoch': 0.32} {'loss': 0.8476, 'learning_rate': 1.8802850998860383e-05, 'epoch': 0.32} {'loss': 0.9903, 'learning_rate': 1.880269568381695e-05, 'epoch': 0.32} {'loss': 0.9753, 'learning_rate': 1.8802540359340634e-05, 'epoch': 0.32} {'loss': 1.0974, 'learning_rate': 1.8802385025431606e-05, 'epoch': 0.32} {'loss': 1.1219, 'learning_rate': 1.8802229682090022e-05, 'epoch': 0.32} {'loss': 0.8365, 'learning_rate': 1.880207432931606e-05, 'epoch': 0.32} {'loss': 0.826, 'learning_rate': 1.8801918967109872e-05, 'epoch': 0.32} {'loss': 1.0209, 'learning_rate': 1.8801763595471642e-05, 'epoch': 0.32} {'loss': 0.8753, 'learning_rate': 1.8801608214401523e-05, 'epoch': 0.32} {'loss': 0.9061, 'learning_rate': 1.880145282389969e-05, 'epoch': 0.32} {'loss': 0.9412, 'learning_rate': 1.8801297423966303e-05, 'epoch': 0.32} {'loss': 0.758, 'learning_rate': 1.8801142014601534e-05, 'epoch': 0.32} {'loss': 0.944, 'learning_rate': 1.8800986595805547e-05, 'epoch': 0.32} {'loss': 0.8736, 'learning_rate': 1.8800831167578505e-05, 'epoch': 0.32} {'loss': 0.6828, 'learning_rate': 1.880067572992058e-05, 'epoch': 0.32} {'loss': 0.9612, 'learning_rate': 1.8800520282831937e-05, 'epoch': 0.32} {'loss': 0.8514, 'learning_rate': 1.880036482631274e-05, 'epoch': 0.32} {'loss': 0.9035, 'learning_rate': 1.8800209360363162e-05, 'epoch': 0.32} {'loss': 0.8052, 'learning_rate': 1.8800053884983365e-05, 'epoch': 0.32} {'loss': 0.9774, 'learning_rate': 1.8799898400173513e-05, 'epoch': 0.32} {'loss': 0.8295, 'learning_rate': 1.879974290593378e-05, 'epoch': 0.32} {'loss': 1.0263, 'learning_rate': 1.8799587402264322e-05, 'epoch': 0.32} {'loss': 1.0103, 'learning_rate': 1.8799431889165314e-05, 'epoch': 0.32} {'loss': 0.7411, 'learning_rate': 1.8799276366636923e-05, 'epoch': 0.32} {'loss': 0.9746, 'learning_rate': 1.8799120834679313e-05, 'epoch': 0.32} {'loss': 0.911, 'learning_rate': 1.8798965293292647e-05, 'epoch': 0.32} {'loss': 0.9686, 'learning_rate': 1.87988097424771e-05, 'epoch': 0.32} {'loss': 1.0041, 'learning_rate': 1.879865418223283e-05, 'epoch': 0.32} {'loss': 0.8433, 'learning_rate': 1.8798498612560012e-05, 'epoch': 0.32} {'loss': 0.8499, 'learning_rate': 1.8798343033458808e-05, 'epoch': 0.32} {'loss': 0.8311, 'learning_rate': 1.8798187444929382e-05, 'epoch': 0.32} {'loss': 1.1529, 'learning_rate': 1.879803184697191e-05, 'epoch': 0.32} {'loss': 0.9808, 'learning_rate': 1.8797876239586548e-05, 'epoch': 0.32} {'loss': 0.9847, 'learning_rate': 1.879772062277347e-05, 'epoch': 0.32} {'loss': 0.94, 'learning_rate': 1.879756499653284e-05, 'epoch': 0.32} {'loss': 0.7149, 'learning_rate': 1.8797409360864823e-05, 'epoch': 0.32} {'loss': 0.8463, 'learning_rate': 1.8797253715769588e-05, 'epoch': 0.32} {'loss': 0.8493, 'learning_rate': 1.8797098061247304e-05, 'epoch': 0.32} {'loss': 0.7899, 'learning_rate': 1.8796942397298132e-05, 'epoch': 0.32} {'loss': 0.9091, 'learning_rate': 1.8796786723922246e-05, 'epoch': 0.32} {'loss': 1.0388, 'learning_rate': 1.8796631041119808e-05, 'epoch': 0.32} {'loss': 1.0421, 'learning_rate': 1.8796475348890984e-05, 'epoch': 0.32} {'loss': 1.0675, 'learning_rate': 1.8796319647235944e-05, 'epoch': 0.32} {'loss': 0.7694, 'learning_rate': 1.879616393615485e-05, 'epoch': 0.32} {'loss': 0.8418, 'learning_rate': 1.879600821564788e-05, 'epoch': 0.32} {'loss': 0.7994, 'learning_rate': 1.8795852485715187e-05, 'epoch': 0.32} {'loss': 0.9581, 'learning_rate': 1.8795696746356945e-05, 'epoch': 0.32} {'loss': 0.9197, 'learning_rate': 1.8795540997573324e-05, 'epoch': 0.32} {'loss': 0.8412, 'learning_rate': 1.8795385239364486e-05, 'epoch': 0.32} {'loss': 1.0508, 'learning_rate': 1.8795229471730597e-05, 'epoch': 0.32} {'loss': 1.01, 'learning_rate': 1.8795073694671827e-05, 'epoch': 0.32} {'loss': 0.6965, 'learning_rate': 1.8794917908188338e-05, 'epoch': 0.32} {'loss': 0.8258, 'learning_rate': 1.8794762112280307e-05, 'epoch': 0.32} {'loss': 1.0267, 'learning_rate': 1.879460630694789e-05, 'epoch': 0.32} {'loss': 0.8532, 'learning_rate': 1.879445049219126e-05, 'epoch': 0.32} {'loss': 0.9548, 'learning_rate': 1.8794294668010583e-05, 'epoch': 0.32} {'loss': 0.7276, 'learning_rate': 1.8794138834406025e-05, 'epoch': 0.32} {'loss': 0.9348, 'learning_rate': 1.8793982991377754e-05, 'epoch': 0.32} {'loss': 0.8445, 'learning_rate': 1.8793827138925933e-05, 'epoch': 0.32} {'loss': 0.8269, 'learning_rate': 1.8793671277050735e-05, 'epoch': 0.32} {'loss': 0.8249, 'learning_rate': 1.8793515405752326e-05, 'epoch': 0.32} {'loss': 0.8293, 'learning_rate': 1.8793359525030872e-05, 'epoch': 0.32} {'loss': 0.8157, 'learning_rate': 1.879320363488654e-05, 'epoch': 0.32} {'loss': 0.871, 'learning_rate': 1.8793047735319493e-05, 'epoch': 0.32} {'loss': 0.8948, 'learning_rate': 1.8792891826329903e-05, 'epoch': 0.32} {'loss': 0.8666, 'learning_rate': 1.879273590791794e-05, 'epoch': 0.32} {'loss': 1.0168, 'learning_rate': 1.879257998008376e-05, 'epoch': 0.32} {'loss': 0.8299, 'learning_rate': 1.8792424042827543e-05, 'epoch': 0.32} {'loss': 0.7132, 'learning_rate': 1.8792268096149446e-05, 'epoch': 0.32} {'loss': 0.9935, 'learning_rate': 1.8792112140049643e-05, 'epoch': 0.32} {'loss': 1.0779, 'learning_rate': 1.8791956174528295e-05, 'epoch': 0.32} {'loss': 1.0836, 'learning_rate': 1.8791800199585576e-05, 'epoch': 0.32} {'loss': 0.8529, 'learning_rate': 1.8791644215221645e-05, 'epoch': 0.32} {'loss': 0.9523, 'learning_rate': 1.8791488221436678e-05, 'epoch': 0.32} {'loss': 0.7847, 'learning_rate': 1.8791332218230834e-05, 'epoch': 0.32} {'loss': 0.8137, 'learning_rate': 1.879117620560429e-05, 'epoch': 0.32} {'loss': 0.8765, 'learning_rate': 1.87910201835572e-05, 'epoch': 0.32} {'loss': 0.8515, 'learning_rate': 1.8790864152089744e-05, 'epoch': 0.32} {'loss': 1.0181, 'learning_rate': 1.879070811120208e-05, 'epoch': 0.32} {'loss': 0.9826, 'learning_rate': 1.8790552060894382e-05, 'epoch': 0.32} {'loss': 0.9139, 'learning_rate': 1.8790396001166816e-05, 'epoch': 0.32} {'loss': 0.7684, 'learning_rate': 1.8790239932019542e-05, 'epoch': 0.32} {'loss': 1.229, 'learning_rate': 1.8790083853452734e-05, 'epoch': 0.32} {'loss': 0.9024, 'learning_rate': 1.878992776546656e-05, 'epoch': 0.32} {'loss': 0.7243, 'learning_rate': 1.8789771668061182e-05, 'epoch': 0.32} {'loss': 0.8124, 'learning_rate': 1.8789615561236775e-05, 'epoch': 0.32} {'loss': 0.8903, 'learning_rate': 1.8789459444993494e-05, 'epoch': 0.32} {'loss': 1.0504, 'learning_rate': 1.878930331933152e-05, 'epoch': 0.32} {'loss': 0.9454, 'learning_rate': 1.8789147184251013e-05, 'epoch': 0.32} {'loss': 0.8638, 'learning_rate': 1.8788991039752142e-05, 'epoch': 0.32} {'loss': 0.7435, 'learning_rate': 1.878883488583507e-05, 'epoch': 0.32} {'loss': 0.9398, 'learning_rate': 1.8788678722499973e-05, 'epoch': 0.32} {'loss': 0.8867, 'learning_rate': 1.8788522549747014e-05, 'epoch': 0.32} {'loss': 0.8793, 'learning_rate': 1.8788366367576353e-05, 'epoch': 0.32} {'loss': 1.0316, 'learning_rate': 1.878821017598817e-05, 'epoch': 0.32} {'loss': 0.9004, 'learning_rate': 1.8788053974982626e-05, 'epoch': 0.32} {'loss': 0.6686, 'learning_rate': 1.878789776455989e-05, 'epoch': 0.32} {'loss': 0.9891, 'learning_rate': 1.8787741544720128e-05, 'epoch': 0.32} {'loss': 0.9899, 'learning_rate': 1.8787585315463505e-05, 'epoch': 0.32} {'loss': 0.9877, 'learning_rate': 1.8787429076790193e-05, 'epoch': 0.32} {'loss': 0.9218, 'learning_rate': 1.8787272828700355e-05, 'epoch': 0.32} {'loss': 0.7457, 'learning_rate': 1.8787116571194163e-05, 'epoch': 0.32} {'loss': 0.9234, 'learning_rate': 1.8786960304271784e-05, 'epoch': 0.32} {'loss': 0.8373, 'learning_rate': 1.8786804027933383e-05, 'epoch': 0.32} {'loss': 0.7283, 'learning_rate': 1.8786647742179128e-05, 'epoch': 0.32} {'loss': 0.8169, 'learning_rate': 1.878649144700919e-05, 'epoch': 0.32} {'loss': 0.8417, 'learning_rate': 1.8786335142423727e-05, 'epoch': 0.32} {'loss': 0.8514, 'learning_rate': 1.8786178828422915e-05, 'epoch': 0.32} {'loss': 0.9369, 'learning_rate': 1.878602250500692e-05, 'epoch': 0.32} {'loss': 0.7884, 'learning_rate': 1.8785866172175912e-05, 'epoch': 0.32} {'loss': 0.9649, 'learning_rate': 1.8785709829930054e-05, 'epoch': 0.32} {'loss': 0.884, 'learning_rate': 1.8785553478269513e-05, 'epoch': 0.32} {'loss': 0.9068, 'learning_rate': 1.8785397117194462e-05, 'epoch': 0.32} {'loss': 0.8776, 'learning_rate': 1.878524074670506e-05, 'epoch': 0.32} {'loss': 0.8839, 'learning_rate': 1.8785084366801482e-05, 'epoch': 0.32} {'loss': 0.8713, 'learning_rate': 1.8784927977483896e-05, 'epoch': 0.32} {'loss': 0.9493, 'learning_rate': 1.8784771578752467e-05, 'epoch': 0.32} {'loss': 0.9339, 'learning_rate': 1.8784615170607358e-05, 'epoch': 0.32} {'loss': 0.8472, 'learning_rate': 1.878445875304874e-05, 'epoch': 0.32} {'loss': 0.9168, 'learning_rate': 1.8784302326076783e-05, 'epoch': 0.32} {'loss': 0.8761, 'learning_rate': 1.878414588969166e-05, 'epoch': 0.32} {'loss': 0.9272, 'learning_rate': 1.8783989443893523e-05, 'epoch': 0.32} {'loss': 1.0151, 'learning_rate': 1.878383298868255e-05, 'epoch': 0.32} {'loss': 0.9253, 'learning_rate': 1.878367652405891e-05, 'epoch': 0.32} {'loss': 0.9376, 'learning_rate': 1.878352005002277e-05, 'epoch': 0.32} {'loss': 0.872, 'learning_rate': 1.878336356657429e-05, 'epoch': 0.32} {'loss': 0.8467, 'learning_rate': 1.8783207073713648e-05, 'epoch': 0.32} {'loss': 0.9564, 'learning_rate': 1.8783050571441003e-05, 'epoch': 0.32} {'loss': 0.9559, 'learning_rate': 1.8782894059756527e-05, 'epoch': 0.32} {'loss': 0.861, 'learning_rate': 1.8782737538660388e-05, 'epoch': 0.32} {'loss': 0.9421, 'learning_rate': 1.8782581008152757e-05, 'epoch': 0.32} {'loss': 0.805, 'learning_rate': 1.878242446823379e-05, 'epoch': 0.32} {'loss': 0.8311, 'learning_rate': 1.878226791890367e-05, 'epoch': 0.32} {'loss': 0.885, 'learning_rate': 1.878211136016255e-05, 'epoch': 0.32} {'loss': 0.723, 'learning_rate': 1.878195479201061e-05, 'epoch': 0.32} {'loss': 0.865, 'learning_rate': 1.8781798214448012e-05, 'epoch': 0.32} {'loss': 0.9195, 'learning_rate': 1.8781641627474925e-05, 'epoch': 0.32} {'loss': 0.9793, 'learning_rate': 1.878148503109152e-05, 'epoch': 0.32} {'loss': 0.9675, 'learning_rate': 1.8781328425297952e-05, 'epoch': 0.32} {'loss': 0.9957, 'learning_rate': 1.8781171810094406e-05, 'epoch': 0.32} {'loss': 0.9431, 'learning_rate': 1.8781015185481038e-05, 'epoch': 0.32} {'loss': 0.9855, 'learning_rate': 1.878085855145802e-05, 'epoch': 0.32} {'loss': 0.7499, 'learning_rate': 1.8780701908025517e-05, 'epoch': 0.32} {'loss': 0.8416, 'learning_rate': 1.8780545255183706e-05, 'epoch': 0.32} {'loss': 0.8456, 'learning_rate': 1.8780388592932744e-05, 'epoch': 0.32} {'loss': 0.9169, 'learning_rate': 1.8780231921272805e-05, 'epoch': 0.32} {'loss': 1.0224, 'learning_rate': 1.878007524020405e-05, 'epoch': 0.32} {'loss': 0.9416, 'learning_rate': 1.877991854972666e-05, 'epoch': 0.32} {'loss': 0.924, 'learning_rate': 1.877976184984079e-05, 'epoch': 0.32} {'loss': 0.9304, 'learning_rate': 1.8779605140546614e-05, 'epoch': 0.32} {'loss': 0.8962, 'learning_rate': 1.8779448421844298e-05, 'epoch': 0.32} {'loss': 0.9124, 'learning_rate': 1.877929169373401e-05, 'epoch': 0.32} {'loss': 0.9236, 'learning_rate': 1.877913495621592e-05, 'epoch': 0.32} {'loss': 0.9609, 'learning_rate': 1.8778978209290194e-05, 'epoch': 0.32} {'loss': 0.82, 'learning_rate': 1.8778821452957002e-05, 'epoch': 0.32} {'loss': 0.8893, 'learning_rate': 1.8778664687216507e-05, 'epoch': 0.32} {'loss': 0.9161, 'learning_rate': 1.877850791206888e-05, 'epoch': 0.32} {'loss': 0.8673, 'learning_rate': 1.8778351127514294e-05, 'epoch': 0.32} {'loss': 0.9418, 'learning_rate': 1.877819433355291e-05, 'epoch': 0.32} {'loss': 1.0415, 'learning_rate': 1.87780375301849e-05, 'epoch': 0.32} {'loss': 0.7992, 'learning_rate': 1.877788071741043e-05, 'epoch': 0.32} {'loss': 0.8273, 'learning_rate': 1.877772389522967e-05, 'epoch': 0.32} {'loss': 0.8478, 'learning_rate': 1.877756706364278e-05, 'epoch': 0.32} {'loss': 0.8358, 'learning_rate': 1.877741022264994e-05, 'epoch': 0.32} {'loss': 0.822, 'learning_rate': 1.877725337225131e-05, 'epoch': 0.32} {'loss': 0.7735, 'learning_rate': 1.8777096512447065e-05, 'epoch': 0.32} {'loss': 0.9572, 'learning_rate': 1.8776939643237365e-05, 'epoch': 0.32} {'loss': 0.7905, 'learning_rate': 1.8776782764622385e-05, 'epoch': 0.32} {'loss': 0.9397, 'learning_rate': 1.877662587660229e-05, 'epoch': 0.32} {'loss': 1.026, 'learning_rate': 1.8776468979177244e-05, 'epoch': 0.32} {'loss': 0.9516, 'learning_rate': 1.8776312072347423e-05, 'epoch': 0.32} {'loss': 0.8491, 'learning_rate': 1.8776155156112992e-05, 'epoch': 0.32} {'loss': 0.9934, 'learning_rate': 1.8775998230474117e-05, 'epoch': 0.32} {'loss': 0.8699, 'learning_rate': 1.8775841295430966e-05, 'epoch': 0.32} {'loss': 0.7378, 'learning_rate': 1.8775684350983714e-05, 'epoch': 0.32} {'loss': 1.0955, 'learning_rate': 1.877552739713252e-05, 'epoch': 0.32} {'loss': 0.9671, 'learning_rate': 1.8775370433877558e-05, 'epoch': 0.32} {'loss': 0.9474, 'learning_rate': 1.8775213461218996e-05, 'epoch': 0.32} {'loss': 0.9657, 'learning_rate': 1.8775056479156996e-05, 'epoch': 0.32} {'loss': 0.8825, 'learning_rate': 1.8774899487691734e-05, 'epoch': 0.32} {'loss': 0.9352, 'learning_rate': 1.8774742486823377e-05, 'epoch': 0.32} {'loss': 0.8401, 'learning_rate': 1.877458547655209e-05, 'epoch': 0.32} {'loss': 1.0874, 'learning_rate': 1.8774428456878043e-05, 'epoch': 0.32} {'loss': 0.7755, 'learning_rate': 1.87742714278014e-05, 'epoch': 0.32} {'loss': 0.7982, 'learning_rate': 1.877411438932234e-05, 'epoch': 0.32} {'loss': 0.901, 'learning_rate': 1.877395734144102e-05, 'epoch': 0.32} {'loss': 0.9316, 'learning_rate': 1.8773800284157615e-05, 'epoch': 0.32} {'loss': 1.094, 'learning_rate': 1.877364321747229e-05, 'epoch': 0.32} {'loss': 0.8813, 'learning_rate': 1.8773486141385216e-05, 'epoch': 0.32} {'loss': 0.9747, 'learning_rate': 1.8773329055896556e-05, 'epoch': 0.32} {'loss': 0.8826, 'learning_rate': 1.8773171961006484e-05, 'epoch': 0.32} {'loss': 0.8269, 'learning_rate': 1.8773014856715167e-05, 'epoch': 0.32} {'loss': 0.7287, 'learning_rate': 1.8772857743022773e-05, 'epoch': 0.32} {'loss': 0.8044, 'learning_rate': 1.877270061992947e-05, 'epoch': 0.32} {'loss': 0.8828, 'learning_rate': 1.8772543487435424e-05, 'epoch': 0.32} {'loss': 0.8745, 'learning_rate': 1.877238634554081e-05, 'epoch': 0.32} {'loss': 0.8275, 'learning_rate': 1.877222919424579e-05, 'epoch': 0.32} {'loss': 0.6949, 'learning_rate': 1.8772072033550534e-05, 'epoch': 0.32} {'loss': 0.8569, 'learning_rate': 1.8771914863455212e-05, 'epoch': 0.32} {'loss': 0.7698, 'learning_rate': 1.8771757683959994e-05, 'epoch': 0.32} {'loss': 0.8506, 'learning_rate': 1.8771600495065043e-05, 'epoch': 0.32} {'loss': 0.8037, 'learning_rate': 1.8771443296770528e-05, 'epoch': 0.32} {'loss': 1.0286, 'learning_rate': 1.8771286089076627e-05, 'epoch': 0.32} {'loss': 0.7758, 'learning_rate': 1.8771128871983496e-05, 'epoch': 0.32} {'loss': 0.8453, 'learning_rate': 1.8770971645491308e-05, 'epoch': 0.32} {'loss': 0.7452, 'learning_rate': 1.8770814409600232e-05, 'epoch': 0.32} {'loss': 0.8861, 'learning_rate': 1.8770657164310438e-05, 'epoch': 0.32} {'loss': 0.8815, 'learning_rate': 1.87704999096221e-05, 'epoch': 0.32} {'loss': 0.8655, 'learning_rate': 1.877034264553537e-05, 'epoch': 0.32} {'loss': 0.9055, 'learning_rate': 1.877018537205043e-05, 'epoch': 0.32} {'loss': 0.9142, 'learning_rate': 1.8770028089167444e-05, 'epoch': 0.32} {'loss': 0.7587, 'learning_rate': 1.8769870796886583e-05, 'epoch': 0.32} {'loss': 0.9294, 'learning_rate': 1.8769713495208014e-05, 'epoch': 0.32} {'loss': 0.8443, 'learning_rate': 1.8769556184131905e-05, 'epoch': 0.32} {'loss': 0.8133, 'learning_rate': 1.8769398863658423e-05, 'epoch': 0.32} {'loss': 0.7756, 'learning_rate': 1.876924153378774e-05, 'epoch': 0.32} {'loss': 0.9012, 'learning_rate': 1.8769084194520024e-05, 'epoch': 0.32} {'loss': 0.9759, 'learning_rate': 1.8768926845855443e-05, 'epoch': 0.32} {'loss': 0.7741, 'learning_rate': 1.8768769487794166e-05, 'epoch': 0.32} {'loss': 0.8497, 'learning_rate': 1.876861212033636e-05, 'epoch': 0.32} {'loss': 0.8872, 'learning_rate': 1.8768454743482193e-05, 'epoch': 0.32} {'loss': 0.9553, 'learning_rate': 1.876829735723184e-05, 'epoch': 0.32} {'loss': 0.8991, 'learning_rate': 1.876813996158546e-05, 'epoch': 0.32} {'loss': 0.9293, 'learning_rate': 1.8767982556543226e-05, 'epoch': 0.32} {'loss': 0.8617, 'learning_rate': 1.876782514210531e-05, 'epoch': 0.32} {'loss': 0.9712, 'learning_rate': 1.876766771827188e-05, 'epoch': 0.32} {'loss': 1.0694, 'learning_rate': 1.87675102850431e-05, 'epoch': 0.32} {'loss': 0.948, 'learning_rate': 1.8767352842419143e-05, 'epoch': 0.32} {'loss': 0.8562, 'learning_rate': 1.8767195390400177e-05, 'epoch': 0.32} {'loss': 1.026, 'learning_rate': 1.8767037928986366e-05, 'epoch': 0.32} {'loss': 0.867, 'learning_rate': 1.8766880458177885e-05, 'epoch': 0.32} {'loss': 0.9146, 'learning_rate': 1.87667229779749e-05, 'epoch': 0.32} {'loss': 0.9311, 'learning_rate': 1.876656548837758e-05, 'epoch': 0.32} {'loss': 0.8009, 'learning_rate': 1.8766407989386093e-05, 'epoch': 0.32} {'loss': 0.7809, 'learning_rate': 1.876625048100061e-05, 'epoch': 0.32} {'loss': 0.9877, 'learning_rate': 1.8766092963221298e-05, 'epoch': 0.32} {'loss': 0.8982, 'learning_rate': 1.8765935436048324e-05, 'epoch': 0.32} {'loss': 0.7526, 'learning_rate': 1.8765777899481864e-05, 'epoch': 0.32} {'loss': 0.7766, 'learning_rate': 1.876562035352208e-05, 'epoch': 0.32} {'loss': 0.7773, 'learning_rate': 1.876546279816914e-05, 'epoch': 0.32} {'loss': 0.83, 'learning_rate': 1.8765305233423217e-05, 'epoch': 0.32} {'loss': 0.948, 'learning_rate': 1.876514765928448e-05, 'epoch': 0.32} {'loss': 0.7873, 'learning_rate': 1.8764990075753094e-05, 'epoch': 0.32} {'loss': 1.0131, 'learning_rate': 1.876483248282923e-05, 'epoch': 0.33} {'loss': 0.8723, 'learning_rate': 1.8764674880513055e-05, 'epoch': 0.33} {'loss': 1.0243, 'learning_rate': 1.8764517268804747e-05, 'epoch': 0.33} {'loss': 0.7837, 'learning_rate': 1.876435964770446e-05, 'epoch': 0.33} {'loss': 0.9587, 'learning_rate': 1.876420201721237e-05, 'epoch': 0.33} {'loss': 1.0961, 'learning_rate': 1.8764044377328654e-05, 'epoch': 0.33} {'loss': 0.685, 'learning_rate': 1.8763886728053468e-05, 'epoch': 0.33} {'loss': 0.8829, 'learning_rate': 1.8763729069386988e-05, 'epoch': 0.33} {'loss': 1.0152, 'learning_rate': 1.8763571401329382e-05, 'epoch': 0.33} {'loss': 0.9041, 'learning_rate': 1.8763413723880817e-05, 'epoch': 0.33} {'loss': 0.8069, 'learning_rate': 1.8763256037041466e-05, 'epoch': 0.33} {'loss': 1.054, 'learning_rate': 1.8763098340811493e-05, 'epoch': 0.33} {'loss': 0.7177, 'learning_rate': 1.8762940635191067e-05, 'epoch': 0.33} {'loss': 0.9174, 'learning_rate': 1.876278292018036e-05, 'epoch': 0.33} {'loss': 0.8665, 'learning_rate': 1.8762625195779544e-05, 'epoch': 0.33} {'loss': 0.9085, 'learning_rate': 1.876246746198878e-05, 'epoch': 0.33} {'loss': 0.9909, 'learning_rate': 1.8762309718808245e-05, 'epoch': 0.33} {'loss': 0.7515, 'learning_rate': 1.8762151966238104e-05, 'epoch': 0.33} {'loss': 0.8365, 'learning_rate': 1.8761994204278524e-05, 'epoch': 0.33} {'loss': 1.0383, 'learning_rate': 1.8761836432929675e-05, 'epoch': 0.33} {'loss': 0.8624, 'learning_rate': 1.876167865219173e-05, 'epoch': 0.33} {'loss': 1.0839, 'learning_rate': 1.8761520862064856e-05, 'epoch': 0.33} {'loss': 0.8791, 'learning_rate': 1.876136306254922e-05, 'epoch': 0.33} {'loss': 0.7309, 'learning_rate': 1.8761205253644995e-05, 'epoch': 0.33} {'loss': 0.8142, 'learning_rate': 1.8761047435352347e-05, 'epoch': 0.33} {'loss': 0.79, 'learning_rate': 1.8760889607671443e-05, 'epoch': 0.33} {'loss': 0.8362, 'learning_rate': 1.8760731770602457e-05, 'epoch': 0.33} {'loss': 0.9737, 'learning_rate': 1.8760573924145557e-05, 'epoch': 0.33} {'loss': 1.0608, 'learning_rate': 1.876041606830091e-05, 'epoch': 0.33} {'loss': 0.8517, 'learning_rate': 1.8760258203068687e-05, 'epoch': 0.33} {'loss': 0.9204, 'learning_rate': 1.876010032844906e-05, 'epoch': 0.33} {'loss': 1.0077, 'learning_rate': 1.875994244444219e-05, 'epoch': 0.33} {'loss': 0.8608, 'learning_rate': 1.8759784551048254e-05, 'epoch': 0.33} {'loss': 0.8185, 'learning_rate': 1.8759626648267417e-05, 'epoch': 0.33} {'loss': 0.8763, 'learning_rate': 1.875946873609985e-05, 'epoch': 0.33} {'loss': 0.7917, 'learning_rate': 1.8759310814545723e-05, 'epoch': 0.33} {'loss': 0.7587, 'learning_rate': 1.87591528836052e-05, 'epoch': 0.33} {'loss': 0.7553, 'learning_rate': 1.8758994943278453e-05, 'epoch': 0.33} {'loss': 0.8896, 'learning_rate': 1.875883699356566e-05, 'epoch': 0.33} {'loss': 0.719, 'learning_rate': 1.8758679034466977e-05, 'epoch': 0.33} {'loss': 0.8252, 'learning_rate': 1.875852106598258e-05, 'epoch': 0.33} {'loss': 0.8681, 'learning_rate': 1.8758363088112638e-05, 'epoch': 0.33} {'loss': 0.965, 'learning_rate': 1.8758205100857317e-05, 'epoch': 0.33} {'loss': 0.8573, 'learning_rate': 1.8758047104216793e-05, 'epoch': 0.33} {'loss': 0.8231, 'learning_rate': 1.875788909819123e-05, 'epoch': 0.33} {'loss': 1.0369, 'learning_rate': 1.8757731082780794e-05, 'epoch': 0.33} {'loss': 0.7317, 'learning_rate': 1.8757573057985664e-05, 'epoch': 0.33} {'loss': 0.8952, 'learning_rate': 1.8757415023806002e-05, 'epoch': 0.33} {'loss': 0.8891, 'learning_rate': 1.8757256980241977e-05, 'epoch': 0.33} {'loss': 0.7939, 'learning_rate': 1.8757098927293766e-05, 'epoch': 0.33} {'loss': 0.8882, 'learning_rate': 1.8756940864961527e-05, 'epoch': 0.33} {'loss': 0.7131, 'learning_rate': 1.8756782793245437e-05, 'epoch': 0.33} {'loss': 0.9394, 'learning_rate': 1.875662471214567e-05, 'epoch': 0.33} {'loss': 0.8752, 'learning_rate': 1.8756466621662382e-05, 'epoch': 0.33} {'loss': 1.0658, 'learning_rate': 1.8756308521795752e-05, 'epoch': 0.33} {'loss': 0.9272, 'learning_rate': 1.875615041254595e-05, 'epoch': 0.33} {'loss': 0.8793, 'learning_rate': 1.8755992293913137e-05, 'epoch': 0.33} {'loss': 0.9431, 'learning_rate': 1.8755834165897492e-05, 'epoch': 0.33} {'loss': 0.8256, 'learning_rate': 1.8755676028499177e-05, 'epoch': 0.33} {'loss': 0.7203, 'learning_rate': 1.875551788171837e-05, 'epoch': 0.33} {'loss': 0.8018, 'learning_rate': 1.875535972555523e-05, 'epoch': 0.33} {'loss': 0.8352, 'learning_rate': 1.8755201560009937e-05, 'epoch': 0.33} {'loss': 1.0494, 'learning_rate': 1.8755043385082652e-05, 'epoch': 0.33} {'loss': 0.9199, 'learning_rate': 1.875488520077355e-05, 'epoch': 0.33} {'loss': 0.8638, 'learning_rate': 1.8754727007082797e-05, 'epoch': 0.33} {'loss': 0.8111, 'learning_rate': 1.8754568804010566e-05, 'epoch': 0.33} {'loss': 1.0589, 'learning_rate': 1.875441059155702e-05, 'epoch': 0.33} {'loss': 0.9821, 'learning_rate': 1.8754252369722336e-05, 'epoch': 0.33} {'loss': 0.9407, 'learning_rate': 1.875409413850668e-05, 'epoch': 0.33} {'loss': 1.0093, 'learning_rate': 1.8753935897910218e-05, 'epoch': 0.33} {'loss': 0.9003, 'learning_rate': 1.875377764793313e-05, 'epoch': 0.33} {'loss': 0.9406, 'learning_rate': 1.8753619388575573e-05, 'epoch': 0.33} {'loss': 0.9228, 'learning_rate': 1.875346111983773e-05, 'epoch': 0.33} {'loss': 0.9139, 'learning_rate': 1.8753302841719758e-05, 'epoch': 0.33} {'loss': 0.9391, 'learning_rate': 1.8753144554221832e-05, 'epoch': 0.33} {'loss': 0.879, 'learning_rate': 1.8752986257344124e-05, 'epoch': 0.33} {'loss': 0.9225, 'learning_rate': 1.87528279510868e-05, 'epoch': 0.33} {'loss': 0.8533, 'learning_rate': 1.8752669635450032e-05, 'epoch': 0.33} {'loss': 0.977, 'learning_rate': 1.8752511310433988e-05, 'epoch': 0.33} {'loss': 0.8667, 'learning_rate': 1.875235297603884e-05, 'epoch': 0.33} {'loss': 0.8694, 'learning_rate': 1.8752194632264752e-05, 'epoch': 0.33} {'loss': 0.8685, 'learning_rate': 1.87520362791119e-05, 'epoch': 0.33} {'loss': 0.7991, 'learning_rate': 1.875187791658045e-05, 'epoch': 0.33} {'loss': 0.9092, 'learning_rate': 1.875171954467057e-05, 'epoch': 0.33} {'loss': 1.1311, 'learning_rate': 1.8751561163382435e-05, 'epoch': 0.33} {'loss': 0.9749, 'learning_rate': 1.8751402772716215e-05, 'epoch': 0.33} {'loss': 0.9745, 'learning_rate': 1.8751244372672075e-05, 'epoch': 0.33} {'loss': 0.8725, 'learning_rate': 1.8751085963250187e-05, 'epoch': 0.33} {'loss': 0.9151, 'learning_rate': 1.8750927544450723e-05, 'epoch': 0.33} {'loss': 0.8386, 'learning_rate': 1.8750769116273848e-05, 'epoch': 0.33} {'loss': 0.7493, 'learning_rate': 1.8750610678719732e-05, 'epoch': 0.33} {'loss': 0.9618, 'learning_rate': 1.875045223178855e-05, 'epoch': 0.33} {'loss': 0.9568, 'learning_rate': 1.875029377548047e-05, 'epoch': 0.33} {'loss': 0.9294, 'learning_rate': 1.8750135309795657e-05, 'epoch': 0.33} {'loss': 0.9248, 'learning_rate': 1.8749976834734282e-05, 'epoch': 0.33} {'loss': 0.7462, 'learning_rate': 1.8749818350296524e-05, 'epoch': 0.33} {'loss': 0.771, 'learning_rate': 1.8749659856482544e-05, 'epoch': 0.33} {'loss': 1.0131, 'learning_rate': 1.8749501353292506e-05, 'epoch': 0.33} {'loss': 0.8269, 'learning_rate': 1.8749342840726596e-05, 'epoch': 0.33} {'loss': 0.8137, 'learning_rate': 1.8749184318784973e-05, 'epoch': 0.33} {'loss': 0.8827, 'learning_rate': 1.874902578746781e-05, 'epoch': 0.33} {'loss': 0.9739, 'learning_rate': 1.8748867246775276e-05, 'epoch': 0.33} {'loss': 0.7467, 'learning_rate': 1.874870869670754e-05, 'epoch': 0.33} {'loss': 0.7484, 'learning_rate': 1.8748550137264778e-05, 'epoch': 0.33} {'loss': 0.9178, 'learning_rate': 1.874839156844715e-05, 'epoch': 0.33} {'loss': 1.0104, 'learning_rate': 1.874823299025483e-05, 'epoch': 0.33} {'loss': 0.847, 'learning_rate': 1.874807440268799e-05, 'epoch': 0.33} {'loss': 1.0906, 'learning_rate': 1.8747915805746798e-05, 'epoch': 0.33} {'loss': 0.9123, 'learning_rate': 1.8747757199431427e-05, 'epoch': 0.33} {'loss': 1.0613, 'learning_rate': 1.8747598583742044e-05, 'epoch': 0.33} {'loss': 0.7607, 'learning_rate': 1.8747439958678818e-05, 'epoch': 0.33} {'loss': 0.9175, 'learning_rate': 1.8747281324241922e-05, 'epoch': 0.33} {'loss': 0.8731, 'learning_rate': 1.8747122680431523e-05, 'epoch': 0.33} {'loss': 0.7918, 'learning_rate': 1.8746964027247796e-05, 'epoch': 0.33} {'loss': 0.8728, 'learning_rate': 1.8746805364690905e-05, 'epoch': 0.33} {'loss': 0.8352, 'learning_rate': 1.874664669276102e-05, 'epoch': 0.33} {'loss': 0.8485, 'learning_rate': 1.8746488011458317e-05, 'epoch': 0.33} {'loss': 0.8712, 'learning_rate': 1.8746329320782964e-05, 'epoch': 0.33} {'loss': 0.8497, 'learning_rate': 1.8746170620735127e-05, 'epoch': 0.33} {'loss': 0.8583, 'learning_rate': 1.8746011911314982e-05, 'epoch': 0.33} {'loss': 0.7652, 'learning_rate': 1.8745853192522692e-05, 'epoch': 0.33} {'loss': 0.9735, 'learning_rate': 1.8745694464358433e-05, 'epoch': 0.33} {'loss': 0.9509, 'learning_rate': 1.874553572682237e-05, 'epoch': 0.33} {'loss': 1.0339, 'learning_rate': 1.874537697991468e-05, 'epoch': 0.33} {'loss': 1.0973, 'learning_rate': 1.874521822363553e-05, 'epoch': 0.33} {'loss': 1.0694, 'learning_rate': 1.8745059457985086e-05, 'epoch': 0.33} {'loss': 0.9834, 'learning_rate': 1.8744900682963523e-05, 'epoch': 0.33} {'loss': 1.0596, 'learning_rate': 1.874474189857101e-05, 'epoch': 0.33} {'loss': 0.7356, 'learning_rate': 1.8744583104807717e-05, 'epoch': 0.33} {'loss': 1.0, 'learning_rate': 1.8744424301673812e-05, 'epoch': 0.33} {'loss': 0.6768, 'learning_rate': 1.874426548916947e-05, 'epoch': 0.33} {'loss': 0.7679, 'learning_rate': 1.8744106667294855e-05, 'epoch': 0.33} {'loss': 0.9356, 'learning_rate': 1.874394783605014e-05, 'epoch': 0.33} {'loss': 0.8113, 'learning_rate': 1.87437889954355e-05, 'epoch': 0.33} {'loss': 0.8762, 'learning_rate': 1.87436301454511e-05, 'epoch': 0.33} {'loss': 0.7594, 'learning_rate': 1.874347128609711e-05, 'epoch': 0.33} {'loss': 0.951, 'learning_rate': 1.87433124173737e-05, 'epoch': 0.33} {'loss': 0.9427, 'learning_rate': 1.874315353928104e-05, 'epoch': 0.33} {'loss': 0.953, 'learning_rate': 1.8742994651819307e-05, 'epoch': 0.33} {'loss': 0.9354, 'learning_rate': 1.8742835754988664e-05, 'epoch': 0.33} {'loss': 0.7178, 'learning_rate': 1.8742676848789284e-05, 'epoch': 0.33} {'loss': 0.9733, 'learning_rate': 1.8742517933221337e-05, 'epoch': 0.33} {'loss': 1.0815, 'learning_rate': 1.8742359008284992e-05, 'epoch': 0.33} {'loss': 0.9627, 'learning_rate': 1.8742200073980418e-05, 'epoch': 0.33} {'loss': 0.9636, 'learning_rate': 1.874204113030779e-05, 'epoch': 0.33} {'loss': 0.8691, 'learning_rate': 1.8741882177267277e-05, 'epoch': 0.33} {'loss': 0.9919, 'learning_rate': 1.8741723214859045e-05, 'epoch': 0.33} {'loss': 0.8509, 'learning_rate': 1.874156424308327e-05, 'epoch': 0.33} {'loss': 0.7272, 'learning_rate': 1.874140526194012e-05, 'epoch': 0.33} {'loss': 0.9186, 'learning_rate': 1.8741246271429765e-05, 'epoch': 0.33} {'loss': 0.7963, 'learning_rate': 1.8741087271552377e-05, 'epoch': 0.33} {'loss': 0.8482, 'learning_rate': 1.874092826230812e-05, 'epoch': 0.33} {'loss': 1.0353, 'learning_rate': 1.8740769243697173e-05, 'epoch': 0.33} {'loss': 0.8502, 'learning_rate': 1.8740610215719704e-05, 'epoch': 0.33} {'loss': 0.9673, 'learning_rate': 1.874045117837588e-05, 'epoch': 0.33} {'loss': 0.8926, 'learning_rate': 1.8740292131665877e-05, 'epoch': 0.33} {'loss': 0.8865, 'learning_rate': 1.8740133075589858e-05, 'epoch': 0.33} {'loss': 0.8733, 'learning_rate': 1.8739974010148003e-05, 'epoch': 0.33} {'loss': 0.9044, 'learning_rate': 1.8739814935340474e-05, 'epoch': 0.33} {'loss': 0.8752, 'learning_rate': 1.8739655851167444e-05, 'epoch': 0.33} {'loss': 0.9563, 'learning_rate': 1.8739496757629082e-05, 'epoch': 0.33} {'loss': 0.6859, 'learning_rate': 1.873933765472556e-05, 'epoch': 0.33} {'loss': 0.7782, 'learning_rate': 1.8739178542457052e-05, 'epoch': 0.33} {'loss': 0.7652, 'learning_rate': 1.8739019420823722e-05, 'epoch': 0.33} {'loss': 0.7518, 'learning_rate': 1.873886028982575e-05, 'epoch': 0.33} {'loss': 0.921, 'learning_rate': 1.8738701149463297e-05, 'epoch': 0.33} {'loss': 0.9666, 'learning_rate': 1.8738541999736537e-05, 'epoch': 0.33} {'loss': 0.8018, 'learning_rate': 1.8738382840645642e-05, 'epoch': 0.33} {'loss': 0.9724, 'learning_rate': 1.8738223672190777e-05, 'epoch': 0.33} {'loss': 1.0765, 'learning_rate': 1.8738064494372122e-05, 'epoch': 0.33} {'loss': 0.982, 'learning_rate': 1.873790530718984e-05, 'epoch': 0.33} {'loss': 0.8661, 'learning_rate': 1.8737746110644103e-05, 'epoch': 0.33} {'loss': 0.7392, 'learning_rate': 1.873758690473508e-05, 'epoch': 0.33} {'loss': 0.8857, 'learning_rate': 1.8737427689462947e-05, 'epoch': 0.33} {'loss': 0.8839, 'learning_rate': 1.873726846482787e-05, 'epoch': 0.33} {'loss': 0.8685, 'learning_rate': 1.8737109230830026e-05, 'epoch': 0.33} {'loss': 0.8373, 'learning_rate': 1.8736949987469578e-05, 'epoch': 0.33} {'loss': 0.8845, 'learning_rate': 1.8736790734746698e-05, 'epoch': 0.33} {'loss': 0.9973, 'learning_rate': 1.873663147266156e-05, 'epoch': 0.33} {'loss': 0.9488, 'learning_rate': 1.8736472201214333e-05, 'epoch': 0.33} {'loss': 0.8528, 'learning_rate': 1.8736312920405186e-05, 'epoch': 0.33} {'loss': 1.1064, 'learning_rate': 1.8736153630234292e-05, 'epoch': 0.33} {'loss': 0.8513, 'learning_rate': 1.873599433070182e-05, 'epoch': 0.33} {'loss': 0.7388, 'learning_rate': 1.8735835021807944e-05, 'epoch': 0.33} {'loss': 0.9559, 'learning_rate': 1.873567570355283e-05, 'epoch': 0.33} {'loss': 0.7658, 'learning_rate': 1.8735516375936652e-05, 'epoch': 0.33} {'loss': 0.8701, 'learning_rate': 1.873535703895958e-05, 'epoch': 0.33} {'loss': 1.0121, 'learning_rate': 1.8735197692621783e-05, 'epoch': 0.33} {'loss': 0.8065, 'learning_rate': 1.8735038336923435e-05, 'epoch': 0.33} {'loss': 0.8438, 'learning_rate': 1.8734878971864705e-05, 'epoch': 0.33} {'loss': 0.9185, 'learning_rate': 1.8734719597445762e-05, 'epoch': 0.33} {'loss': 0.7251, 'learning_rate': 1.873456021366678e-05, 'epoch': 0.33} {'loss': 0.9135, 'learning_rate': 1.8734400820527926e-05, 'epoch': 0.33} {'loss': 0.8969, 'learning_rate': 1.8734241418029377e-05, 'epoch': 0.33} {'loss': 0.7921, 'learning_rate': 1.87340820061713e-05, 'epoch': 0.33} {'loss': 0.8064, 'learning_rate': 1.8733922584953863e-05, 'epoch': 0.33} {'loss': 0.9603, 'learning_rate': 1.873376315437724e-05, 'epoch': 0.33} {'loss': 0.787, 'learning_rate': 1.8733603714441603e-05, 'epoch': 0.33} {'loss': 1.1038, 'learning_rate': 1.873344426514712e-05, 'epoch': 0.33} {'loss': 0.8969, 'learning_rate': 1.8733284806493966e-05, 'epoch': 0.33} {'loss': 0.7835, 'learning_rate': 1.8733125338482304e-05, 'epoch': 0.33} {'loss': 0.9185, 'learning_rate': 1.8732965861112315e-05, 'epoch': 0.33} {'loss': 0.9158, 'learning_rate': 1.8732806374384163e-05, 'epoch': 0.33} {'loss': 0.9479, 'learning_rate': 1.873264687829802e-05, 'epoch': 0.33} {'loss': 0.953, 'learning_rate': 1.873248737285406e-05, 'epoch': 0.33} {'loss': 0.7817, 'learning_rate': 1.8732327858052447e-05, 'epoch': 0.33} {'loss': 0.9025, 'learning_rate': 1.873216833389336e-05, 'epoch': 0.33} {'loss': 0.797, 'learning_rate': 1.8732008800376968e-05, 'epoch': 0.33} {'loss': 0.9728, 'learning_rate': 1.8731849257503437e-05, 'epoch': 0.33} {'loss': 1.0174, 'learning_rate': 1.8731689705272943e-05, 'epoch': 0.33} {'loss': 0.9877, 'learning_rate': 1.8731530143685655e-05, 'epoch': 0.33} {'loss': 0.8198, 'learning_rate': 1.8731370572741747e-05, 'epoch': 0.33} {'loss': 0.8361, 'learning_rate': 1.8731210992441388e-05, 'epoch': 0.33} {'loss': 0.7271, 'learning_rate': 1.8731051402784743e-05, 'epoch': 0.33} {'loss': 0.8746, 'learning_rate': 1.8730891803771992e-05, 'epoch': 0.33} {'loss': 0.9412, 'learning_rate': 1.87307321954033e-05, 'epoch': 0.33} {'loss': 0.8902, 'learning_rate': 1.873057257767884e-05, 'epoch': 0.33} {'loss': 0.9658, 'learning_rate': 1.8730412950598787e-05, 'epoch': 0.33} {'loss': 0.8027, 'learning_rate': 1.8730253314163308e-05, 'epoch': 0.33} {'loss': 0.917, 'learning_rate': 1.8730093668372573e-05, 'epoch': 0.33} {'loss': 1.0049, 'learning_rate': 1.8729934013226753e-05, 'epoch': 0.33} {'loss': 0.8427, 'learning_rate': 1.8729774348726023e-05, 'epoch': 0.33} {'loss': 0.7463, 'learning_rate': 1.8729614674870552e-05, 'epoch': 0.33} {'loss': 0.9262, 'learning_rate': 1.872945499166051e-05, 'epoch': 0.33} {'loss': 0.9299, 'learning_rate': 1.8729295299096072e-05, 'epoch': 0.33} {'loss': 1.0213, 'learning_rate': 1.8729135597177404e-05, 'epoch': 0.33} {'loss': 0.9396, 'learning_rate': 1.872897588590468e-05, 'epoch': 0.33} {'loss': 1.1829, 'learning_rate': 1.872881616527807e-05, 'epoch': 0.33} {'loss': 0.8387, 'learning_rate': 1.8728656435297745e-05, 'epoch': 0.33} {'loss': 1.0, 'learning_rate': 1.8728496695963877e-05, 'epoch': 0.33} {'loss': 0.8176, 'learning_rate': 1.872833694727664e-05, 'epoch': 0.33} {'loss': 0.944, 'learning_rate': 1.87281771892362e-05, 'epoch': 0.33} {'loss': 0.9089, 'learning_rate': 1.8728017421842727e-05, 'epoch': 0.33} {'loss': 0.7531, 'learning_rate': 1.87278576450964e-05, 'epoch': 0.33} {'loss': 0.7598, 'learning_rate': 1.872769785899738e-05, 'epoch': 0.33} {'loss': 0.9061, 'learning_rate': 1.8727538063545852e-05, 'epoch': 0.33} {'loss': 1.0033, 'learning_rate': 1.8727378258741975e-05, 'epoch': 0.33} {'loss': 0.9236, 'learning_rate': 1.8727218444585925e-05, 'epoch': 0.33} {'loss': 1.0592, 'learning_rate': 1.8727058621077873e-05, 'epoch': 0.33} {'loss': 0.7135, 'learning_rate': 1.872689878821799e-05, 'epoch': 0.33} {'loss': 0.8083, 'learning_rate': 1.8726738946006445e-05, 'epoch': 0.33} {'loss': 0.8384, 'learning_rate': 1.8726579094443415e-05, 'epoch': 0.33} {'loss': 0.9847, 'learning_rate': 1.872641923352907e-05, 'epoch': 0.33} {'loss': 0.7823, 'learning_rate': 1.8726259363263576e-05, 'epoch': 0.33} {'loss': 0.7493, 'learning_rate': 1.8726099483647106e-05, 'epoch': 0.33} {'loss': 0.8722, 'learning_rate': 1.8725939594679833e-05, 'epoch': 0.33} {'loss': 0.7614, 'learning_rate': 1.872577969636193e-05, 'epoch': 0.33} {'loss': 0.738, 'learning_rate': 1.8725619788693564e-05, 'epoch': 0.33} {'loss': 0.8572, 'learning_rate': 1.872545987167491e-05, 'epoch': 0.33} {'loss': 0.9847, 'learning_rate': 1.8725299945306142e-05, 'epoch': 0.33} {'loss': 0.7955, 'learning_rate': 1.8725140009587424e-05, 'epoch': 0.33} {'loss': 0.9368, 'learning_rate': 1.8724980064518933e-05, 'epoch': 0.33} {'loss': 0.9997, 'learning_rate': 1.8724820110100838e-05, 'epoch': 0.33} {'loss': 0.7969, 'learning_rate': 1.8724660146333308e-05, 'epoch': 0.33} {'loss': 0.915, 'learning_rate': 1.8724500173216517e-05, 'epoch': 0.33} {'loss': 0.798, 'learning_rate': 1.872434019075064e-05, 'epoch': 0.33} {'loss': 0.8482, 'learning_rate': 1.8724180198935843e-05, 'epoch': 0.33} {'loss': 0.8002, 'learning_rate': 1.87240201977723e-05, 'epoch': 0.33} {'loss': 0.8743, 'learning_rate': 1.8723860187260183e-05, 'epoch': 0.33} {'loss': 0.9176, 'learning_rate': 1.8723700167399662e-05, 'epoch': 0.33} {'loss': 0.9458, 'learning_rate': 1.872354013819091e-05, 'epoch': 0.33} {'loss': 0.8405, 'learning_rate': 1.8723380099634093e-05, 'epoch': 0.33} {'loss': 0.9221, 'learning_rate': 1.872322005172939e-05, 'epoch': 0.33} {'loss': 0.8674, 'learning_rate': 1.872305999447697e-05, 'epoch': 0.33} {'loss': 0.924, 'learning_rate': 1.8722899927877e-05, 'epoch': 0.33} {'loss': 0.8831, 'learning_rate': 1.872273985192966e-05, 'epoch': 0.33} {'loss': 0.7867, 'learning_rate': 1.8722579766635116e-05, 'epoch': 0.33} {'loss': 0.6324, 'learning_rate': 1.872241967199354e-05, 'epoch': 0.33} {'loss': 1.041, 'learning_rate': 1.8722259568005102e-05, 'epoch': 0.33} {'loss': 0.8345, 'learning_rate': 1.8722099454669978e-05, 'epoch': 0.33} {'loss': 0.9486, 'learning_rate': 1.8721939331988337e-05, 'epoch': 0.33} {'loss': 0.8064, 'learning_rate': 1.8721779199960352e-05, 'epoch': 0.33} {'loss': 1.0365, 'learning_rate': 1.872161905858619e-05, 'epoch': 0.33} {'loss': 1.011, 'learning_rate': 1.872145890786603e-05, 'epoch': 0.33} {'loss': 0.6094, 'learning_rate': 1.872129874780004e-05, 'epoch': 0.33} {'loss': 1.1179, 'learning_rate': 1.8721138578388388e-05, 'epoch': 0.33} {'loss': 0.8256, 'learning_rate': 1.8720978399631248e-05, 'epoch': 0.33} {'loss': 0.9313, 'learning_rate': 1.8720818211528794e-05, 'epoch': 0.33} {'loss': 0.8046, 'learning_rate': 1.8720658014081198e-05, 'epoch': 0.33} {'loss': 1.0334, 'learning_rate': 1.8720497807288626e-05, 'epoch': 0.33} {'loss': 1.061, 'learning_rate': 1.872033759115126e-05, 'epoch': 0.33} {'loss': 0.9322, 'learning_rate': 1.8720177365669258e-05, 'epoch': 0.33} {'loss': 0.8775, 'learning_rate': 1.8720017130842802e-05, 'epoch': 0.33} {'loss': 0.8049, 'learning_rate': 1.871985688667206e-05, 'epoch': 0.33} {'loss': 0.8532, 'learning_rate': 1.8719696633157208e-05, 'epoch': 0.33} {'loss': 0.7295, 'learning_rate': 1.871953637029841e-05, 'epoch': 0.33} {'loss': 1.0188, 'learning_rate': 1.871937609809584e-05, 'epoch': 0.33} {'loss': 0.9529, 'learning_rate': 1.8719215816549678e-05, 'epoch': 0.33} {'loss': 0.7885, 'learning_rate': 1.8719055525660084e-05, 'epoch': 0.33} {'loss': 0.8312, 'learning_rate': 1.871889522542724e-05, 'epoch': 0.33} {'loss': 0.8784, 'learning_rate': 1.8718734915851305e-05, 'epoch': 0.33} {'loss': 0.8742, 'learning_rate': 1.8718574596932466e-05, 'epoch': 0.33} {'loss': 0.8592, 'learning_rate': 1.8718414268670884e-05, 'epoch': 0.33} {'loss': 0.7841, 'learning_rate': 1.8718253931066735e-05, 'epoch': 0.33} {'loss': 0.7486, 'learning_rate': 1.871809358412019e-05, 'epoch': 0.33} {'loss': 0.7845, 'learning_rate': 1.8717933227831418e-05, 'epoch': 0.33} {'loss': 0.9863, 'learning_rate': 1.87177728622006e-05, 'epoch': 0.33} {'loss': 0.7979, 'learning_rate': 1.8717612487227898e-05, 'epoch': 0.33} {'loss': 0.7851, 'learning_rate': 1.8717452102913484e-05, 'epoch': 0.33} {'loss': 0.788, 'learning_rate': 1.871729170925754e-05, 'epoch': 0.33} {'loss': 0.8743, 'learning_rate': 1.8717131306260224e-05, 'epoch': 0.33} {'loss': 0.7685, 'learning_rate': 1.871697089392172e-05, 'epoch': 0.33} {'loss': 0.9078, 'learning_rate': 1.8716810472242194e-05, 'epoch': 0.33} {'loss': 0.7743, 'learning_rate': 1.871665004122182e-05, 'epoch': 0.33} {'loss': 0.8848, 'learning_rate': 1.8716489600860764e-05, 'epoch': 0.33} {'loss': 0.8839, 'learning_rate': 1.8716329151159208e-05, 'epoch': 0.33} {'loss': 0.944, 'learning_rate': 1.8716168692117317e-05, 'epoch': 0.33} {'loss': 0.9516, 'learning_rate': 1.8716008223735266e-05, 'epoch': 0.33} {'loss': 0.8616, 'learning_rate': 1.8715847746013223e-05, 'epoch': 0.33} {'loss': 0.7264, 'learning_rate': 1.8715687258951364e-05, 'epoch': 0.33} {'loss': 0.986, 'learning_rate': 1.871552676254986e-05, 'epoch': 0.33} {'loss': 0.8982, 'learning_rate': 1.8715366256808877e-05, 'epoch': 0.33} {'loss': 0.8274, 'learning_rate': 1.87152057417286e-05, 'epoch': 0.33} {'loss': 0.9276, 'learning_rate': 1.871504521730919e-05, 'epoch': 0.33} {'loss': 0.9297, 'learning_rate': 1.871488468355082e-05, 'epoch': 0.33} {'loss': 0.8972, 'learning_rate': 1.871472414045367e-05, 'epoch': 0.33} {'loss': 0.8873, 'learning_rate': 1.87145635880179e-05, 'epoch': 0.33} {'loss': 0.8839, 'learning_rate': 1.8714403026243693e-05, 'epoch': 0.33} {'loss': 0.9943, 'learning_rate': 1.871424245513122e-05, 'epoch': 0.33} {'loss': 0.7846, 'learning_rate': 1.871408187468064e-05, 'epoch': 0.33} {'loss': 0.8825, 'learning_rate': 1.8713921284892144e-05, 'epoch': 0.33} {'loss': 0.7868, 'learning_rate': 1.8713760685765888e-05, 'epoch': 0.33} {'loss': 0.7647, 'learning_rate': 1.8713600077302053e-05, 'epoch': 0.33} {'loss': 1.0673, 'learning_rate': 1.871343945950081e-05, 'epoch': 0.33} {'loss': 0.8117, 'learning_rate': 1.8713278832362332e-05, 'epoch': 0.33} {'loss': 0.7978, 'learning_rate': 1.871311819588679e-05, 'epoch': 0.33} {'loss': 0.8642, 'learning_rate': 1.8712957550074347e-05, 'epoch': 0.33} {'loss': 0.7077, 'learning_rate': 1.871279689492519e-05, 'epoch': 0.33} {'loss': 0.9709, 'learning_rate': 1.871263623043949e-05, 'epoch': 0.33} {'loss': 0.8427, 'learning_rate': 1.8712475556617407e-05, 'epoch': 0.33} {'loss': 0.9662, 'learning_rate': 1.871231487345912e-05, 'epoch': 0.33} {'loss': 0.8135, 'learning_rate': 1.8712154180964802e-05, 'epoch': 0.33} {'loss': 0.8686, 'learning_rate': 1.8711993479134626e-05, 'epoch': 0.33} {'loss': 0.7159, 'learning_rate': 1.871183276796876e-05, 'epoch': 0.33} {'loss': 0.9281, 'learning_rate': 1.8711672047467383e-05, 'epoch': 0.33} {'loss': 0.7064, 'learning_rate': 1.8711511317630662e-05, 'epoch': 0.33} {'loss': 0.8404, 'learning_rate': 1.8711350578458768e-05, 'epoch': 0.33} {'loss': 0.7839, 'learning_rate': 1.8711189829951875e-05, 'epoch': 0.33} {'loss': 0.9559, 'learning_rate': 1.8711029072110158e-05, 'epoch': 0.33} {'loss': 0.8082, 'learning_rate': 1.8710868304933785e-05, 'epoch': 0.33} {'loss': 0.7698, 'learning_rate': 1.8710707528422937e-05, 'epoch': 0.33} {'loss': 0.851, 'learning_rate': 1.871054674257777e-05, 'epoch': 0.33} {'loss': 0.8069, 'learning_rate': 1.8710385947398473e-05, 'epoch': 0.33} {'loss': 0.771, 'learning_rate': 1.871022514288521e-05, 'epoch': 0.33} {'loss': 0.7748, 'learning_rate': 1.8710064329038155e-05, 'epoch': 0.33} {'loss': 0.8711, 'learning_rate': 1.8709903505857475e-05, 'epoch': 0.33} {'loss': 1.0228, 'learning_rate': 1.8709742673343356e-05, 'epoch': 0.33} {'loss': 0.7404, 'learning_rate': 1.8709581831495957e-05, 'epoch': 0.33} {'loss': 0.9245, 'learning_rate': 1.870942098031545e-05, 'epoch': 0.33} {'loss': 0.9643, 'learning_rate': 1.8709260119802017e-05, 'epoch': 0.33} {'loss': 0.9995, 'learning_rate': 1.8709099249955825e-05, 'epoch': 0.33} {'loss': 0.8417, 'learning_rate': 1.870893837077705e-05, 'epoch': 0.33} {'loss': 1.0719, 'learning_rate': 1.870877748226586e-05, 'epoch': 0.33} {'loss': 1.0205, 'learning_rate': 1.8708616584422426e-05, 'epoch': 0.33} {'loss': 0.7864, 'learning_rate': 1.8708455677246927e-05, 'epoch': 0.33} {'loss': 1.1292, 'learning_rate': 1.870829476073953e-05, 'epoch': 0.33} {'loss': 0.9393, 'learning_rate': 1.870813383490041e-05, 'epoch': 0.33} {'loss': 0.9034, 'learning_rate': 1.8707972899729738e-05, 'epoch': 0.33} {'loss': 0.7505, 'learning_rate': 1.870781195522769e-05, 'epoch': 0.33} {'loss': 0.773, 'learning_rate': 1.8707651001394433e-05, 'epoch': 0.33} {'loss': 0.741, 'learning_rate': 1.870749003823014e-05, 'epoch': 0.33} {'loss': 0.7616, 'learning_rate': 1.8707329065734984e-05, 'epoch': 0.33} {'loss': 0.9529, 'learning_rate': 1.8707168083909146e-05, 'epoch': 0.33} {'loss': 0.8334, 'learning_rate': 1.8707007092752786e-05, 'epoch': 0.33} {'loss': 0.7738, 'learning_rate': 1.8706846092266084e-05, 'epoch': 0.33} {'loss': 0.6432, 'learning_rate': 1.8706685082449212e-05, 'epoch': 0.33} {'loss': 0.9187, 'learning_rate': 1.8706524063302337e-05, 'epoch': 0.33} {'loss': 0.6884, 'learning_rate': 1.8706363034825637e-05, 'epoch': 0.33} {'loss': 0.7874, 'learning_rate': 1.8706201997019287e-05, 'epoch': 0.33} {'loss': 0.8774, 'learning_rate': 1.8706040949883455e-05, 'epoch': 0.33} {'loss': 0.9577, 'learning_rate': 1.870587989341831e-05, 'epoch': 0.33} {'loss': 0.828, 'learning_rate': 1.8705718827624033e-05, 'epoch': 0.33} {'loss': 0.8025, 'learning_rate': 1.870555775250079e-05, 'epoch': 0.33} {'loss': 1.0352, 'learning_rate': 1.8705396668048758e-05, 'epoch': 0.33} {'loss': 1.0547, 'learning_rate': 1.8705235574268105e-05, 'epoch': 0.33} {'loss': 0.8645, 'learning_rate': 1.870507447115901e-05, 'epoch': 0.33} {'loss': 0.7958, 'learning_rate': 1.870491335872164e-05, 'epoch': 0.33} {'loss': 0.7554, 'learning_rate': 1.8704752236956172e-05, 'epoch': 0.33} {'loss': 0.8342, 'learning_rate': 1.8704591105862773e-05, 'epoch': 0.33} {'loss': 0.8204, 'learning_rate': 1.870442996544162e-05, 'epoch': 0.33} {'loss': 0.8251, 'learning_rate': 1.8704268815692886e-05, 'epoch': 0.33} {'loss': 0.9884, 'learning_rate': 1.870410765661674e-05, 'epoch': 0.33} {'loss': 0.8968, 'learning_rate': 1.870394648821336e-05, 'epoch': 0.33} {'loss': 0.9012, 'learning_rate': 1.8703785310482913e-05, 'epoch': 0.33} {'loss': 0.9095, 'learning_rate': 1.8703624123425576e-05, 'epoch': 0.33} {'loss': 0.8325, 'learning_rate': 1.870346292704152e-05, 'epoch': 0.33} {'loss': 0.8938, 'learning_rate': 1.8703301721330917e-05, 'epoch': 0.33} {'loss': 0.8401, 'learning_rate': 1.870314050629394e-05, 'epoch': 0.33} {'loss': 0.693, 'learning_rate': 1.8702979281930766e-05, 'epoch': 0.33} {'loss': 0.96, 'learning_rate': 1.870281804824156e-05, 'epoch': 0.33} {'loss': 0.7299, 'learning_rate': 1.8702656805226504e-05, 'epoch': 0.33} {'loss': 0.8776, 'learning_rate': 1.8702495552885763e-05, 'epoch': 0.33} {'loss': 0.8872, 'learning_rate': 1.8702334291219514e-05, 'epoch': 0.33} {'loss': 0.9789, 'learning_rate': 1.8702173020227924e-05, 'epoch': 0.33} {'loss': 0.9422, 'learning_rate': 1.8702011739911176e-05, 'epoch': 0.33} {'loss': 0.9496, 'learning_rate': 1.870185045026943e-05, 'epoch': 0.33} {'loss': 0.944, 'learning_rate': 1.8701689151302874e-05, 'epoch': 0.33} {'loss': 0.7585, 'learning_rate': 1.8701527843011666e-05, 'epoch': 0.33} {'loss': 0.8123, 'learning_rate': 1.870136652539599e-05, 'epoch': 0.33} {'loss': 0.819, 'learning_rate': 1.8701205198456008e-05, 'epoch': 0.33} {'loss': 0.7979, 'learning_rate': 1.8701043862191907e-05, 'epoch': 0.33} {'loss': 0.8013, 'learning_rate': 1.870088251660385e-05, 'epoch': 0.33} {'loss': 0.8661, 'learning_rate': 1.870072116169201e-05, 'epoch': 0.33} {'loss': 0.7862, 'learning_rate': 1.8700559797456563e-05, 'epoch': 0.33} {'loss': 0.7782, 'learning_rate': 1.8700398423897682e-05, 'epoch': 0.33} {'loss': 0.876, 'learning_rate': 1.870023704101554e-05, 'epoch': 0.33} {'loss': 0.9401, 'learning_rate': 1.8700075648810303e-05, 'epoch': 0.33} {'loss': 0.9326, 'learning_rate': 1.8699914247282157e-05, 'epoch': 0.33} {'loss': 1.0147, 'learning_rate': 1.869975283643126e-05, 'epoch': 0.33} {'loss': 0.9495, 'learning_rate': 1.86995914162578e-05, 'epoch': 0.33} {'loss': 0.8858, 'learning_rate': 1.8699429986761937e-05, 'epoch': 0.33} {'loss': 0.7753, 'learning_rate': 1.8699268547943853e-05, 'epoch': 0.33} {'loss': 0.9449, 'learning_rate': 1.8699107099803715e-05, 'epoch': 0.33} {'loss': 0.7757, 'learning_rate': 1.86989456423417e-05, 'epoch': 0.33} {'loss': 0.761, 'learning_rate': 1.869878417555798e-05, 'epoch': 0.33} {'loss': 0.9045, 'learning_rate': 1.8698622699452728e-05, 'epoch': 0.33} {'loss': 1.0547, 'learning_rate': 1.8698461214026117e-05, 'epoch': 0.33} {'loss': 0.9393, 'learning_rate': 1.8698299719278316e-05, 'epoch': 0.33} {'loss': 0.9296, 'learning_rate': 1.8698138215209507e-05, 'epoch': 0.33} {'loss': 0.8874, 'learning_rate': 1.8697976701819852e-05, 'epoch': 0.33} {'loss': 0.7481, 'learning_rate': 1.8697815179109535e-05, 'epoch': 0.33} {'loss': 1.0486, 'learning_rate': 1.869765364707872e-05, 'epoch': 0.33} {'loss': 0.8594, 'learning_rate': 1.869749210572759e-05, 'epoch': 0.33} {'loss': 0.9408, 'learning_rate': 1.8697330555056306e-05, 'epoch': 0.33} {'loss': 1.072, 'learning_rate': 1.869716899506505e-05, 'epoch': 0.33} {'loss': 0.9183, 'learning_rate': 1.8697007425753996e-05, 'epoch': 0.33} {'loss': 0.8116, 'learning_rate': 1.8696845847123305e-05, 'epoch': 0.33} {'loss': 0.8559, 'learning_rate': 1.8696684259173166e-05, 'epoch': 0.33} {'loss': 0.8077, 'learning_rate': 1.8696522661903742e-05, 'epoch': 0.33} {'loss': 0.7618, 'learning_rate': 1.869636105531521e-05, 'epoch': 0.33} {'loss': 0.9226, 'learning_rate': 1.8696199439407743e-05, 'epoch': 0.33} {'loss': 0.854, 'learning_rate': 1.8696037814181513e-05, 'epoch': 0.33} {'loss': 0.8492, 'learning_rate': 1.869587617963669e-05, 'epoch': 0.33} {'loss': 1.0143, 'learning_rate': 1.8695714535773455e-05, 'epoch': 0.33} {'loss': 1.0515, 'learning_rate': 1.8695552882591976e-05, 'epoch': 0.33} {'loss': 0.9119, 'learning_rate': 1.8695391220092427e-05, 'epoch': 0.33} {'loss': 0.9354, 'learning_rate': 1.869522954827498e-05, 'epoch': 0.33} {'loss': 0.8832, 'learning_rate': 1.869506786713981e-05, 'epoch': 0.33} {'loss': 0.9083, 'learning_rate': 1.8694906176687094e-05, 'epoch': 0.33} {'loss': 0.8818, 'learning_rate': 1.8694744476916998e-05, 'epoch': 0.33} {'loss': 0.9349, 'learning_rate': 1.8694582767829698e-05, 'epoch': 0.33} {'loss': 0.9061, 'learning_rate': 1.8694421049425368e-05, 'epoch': 0.33} {'loss': 0.8479, 'learning_rate': 1.8694259321704183e-05, 'epoch': 0.33} {'loss': 0.8428, 'learning_rate': 1.8694097584666314e-05, 'epoch': 0.33} {'loss': 0.9332, 'learning_rate': 1.8693935838311933e-05, 'epoch': 0.33} {'loss': 0.9784, 'learning_rate': 1.869377408264122e-05, 'epoch': 0.33} {'loss': 0.7301, 'learning_rate': 1.8693612317654336e-05, 'epoch': 0.33} {'loss': 1.0547, 'learning_rate': 1.869345054335147e-05, 'epoch': 0.33} {'loss': 1.0089, 'learning_rate': 1.8693288759732778e-05, 'epoch': 0.33} {'loss': 0.8589, 'learning_rate': 1.869312696679845e-05, 'epoch': 0.33} {'loss': 0.7133, 'learning_rate': 1.8692965164548645e-05, 'epoch': 0.33} {'loss': 0.7728, 'learning_rate': 1.869280335298355e-05, 'epoch': 0.33} {'loss': 0.7995, 'learning_rate': 1.869264153210333e-05, 'epoch': 0.33} {'loss': 0.9141, 'learning_rate': 1.869247970190816e-05, 'epoch': 0.33} {'loss': 0.8606, 'learning_rate': 1.869231786239821e-05, 'epoch': 0.33} {'loss': 0.8763, 'learning_rate': 1.869215601357366e-05, 'epoch': 0.33} {'loss': 1.0612, 'learning_rate': 1.869199415543468e-05, 'epoch': 0.33} {'loss': 0.8769, 'learning_rate': 1.869183228798144e-05, 'epoch': 0.33} {'loss': 0.8792, 'learning_rate': 1.8691670411214124e-05, 'epoch': 0.33} {'loss': 0.7278, 'learning_rate': 1.8691508525132893e-05, 'epoch': 0.33} {'loss': 0.8347, 'learning_rate': 1.8691346629737928e-05, 'epoch': 0.33} {'loss': 0.8755, 'learning_rate': 1.8691184725029402e-05, 'epoch': 0.33} {'loss': 0.9489, 'learning_rate': 1.8691022811007485e-05, 'epoch': 0.33} {'loss': 0.977, 'learning_rate': 1.8690860887672353e-05, 'epoch': 0.33} {'loss': 0.8917, 'learning_rate': 1.869069895502418e-05, 'epoch': 0.33} {'loss': 0.8225, 'learning_rate': 1.869053701306314e-05, 'epoch': 0.33} {'loss': 0.8095, 'learning_rate': 1.86903750617894e-05, 'epoch': 0.33} {'loss': 0.9908, 'learning_rate': 1.8690213101203146e-05, 'epoch': 0.33} {'loss': 0.994, 'learning_rate': 1.8690051131304542e-05, 'epoch': 0.33} {'loss': 0.85, 'learning_rate': 1.868988915209376e-05, 'epoch': 0.33} {'loss': 1.0527, 'learning_rate': 1.8689727163570982e-05, 'epoch': 0.33} {'loss': 0.925, 'learning_rate': 1.8689565165736374e-05, 'epoch': 0.33} {'loss': 0.9225, 'learning_rate': 1.8689403158590113e-05, 'epoch': 0.33} {'loss': 0.8903, 'learning_rate': 1.8689241142132375e-05, 'epoch': 0.33} {'loss': 0.7774, 'learning_rate': 1.868907911636333e-05, 'epoch': 0.33} {'loss': 0.9121, 'learning_rate': 1.8688917081283148e-05, 'epoch': 0.33} {'loss': 0.6389, 'learning_rate': 1.8688755036892012e-05, 'epoch': 0.33} {'loss': 0.8723, 'learning_rate': 1.868859298319009e-05, 'epoch': 0.33} {'loss': 0.9192, 'learning_rate': 1.8688430920177557e-05, 'epoch': 0.33} {'loss': 0.895, 'learning_rate': 1.8688268847854584e-05, 'epoch': 0.33} {'loss': 0.7325, 'learning_rate': 1.8688106766221347e-05, 'epoch': 0.33} {'loss': 0.8379, 'learning_rate': 1.868794467527802e-05, 'epoch': 0.33} {'loss': 0.9986, 'learning_rate': 1.8687782575024774e-05, 'epoch': 0.34} {'loss': 0.922, 'learning_rate': 1.8687620465461788e-05, 'epoch': 0.34} {'loss': 0.9401, 'learning_rate': 1.8687458346589235e-05, 'epoch': 0.34} {'loss': 0.8632, 'learning_rate': 1.868729621840728e-05, 'epoch': 0.34} {'loss': 0.8108, 'learning_rate': 1.8687134080916108e-05, 'epoch': 0.34} {'loss': 0.8157, 'learning_rate': 1.8686971934115886e-05, 'epoch': 0.34} {'loss': 1.0289, 'learning_rate': 1.8686809778006786e-05, 'epoch': 0.34} {'loss': 0.8069, 'learning_rate': 1.868664761258899e-05, 'epoch': 0.34} {'loss': 0.7859, 'learning_rate': 1.8686485437862668e-05, 'epoch': 0.34} {'loss': 0.7705, 'learning_rate': 1.868632325382799e-05, 'epoch': 0.34} {'loss': 1.0072, 'learning_rate': 1.868616106048513e-05, 'epoch': 0.34} {'loss': 0.8788, 'learning_rate': 1.868599885783427e-05, 'epoch': 0.34} {'loss': 0.8808, 'learning_rate': 1.8685836645875577e-05, 'epoch': 0.34} {'loss': 0.8757, 'learning_rate': 1.8685674424609223e-05, 'epoch': 0.34} {'loss': 0.9269, 'learning_rate': 1.8685512194035386e-05, 'epoch': 0.34} {'loss': 1.0195, 'learning_rate': 1.868534995415424e-05, 'epoch': 0.34} {'loss': 1.0218, 'learning_rate': 1.868518770496596e-05, 'epoch': 0.34} {'loss': 0.7339, 'learning_rate': 1.8685025446470714e-05, 'epoch': 0.34} {'loss': 0.7976, 'learning_rate': 1.8684863178668678e-05, 'epoch': 0.34} {'loss': 1.1471, 'learning_rate': 1.868470090156003e-05, 'epoch': 0.34} {'loss': 0.9702, 'learning_rate': 1.868453861514494e-05, 'epoch': 0.34} {'loss': 0.9515, 'learning_rate': 1.8684376319423586e-05, 'epoch': 0.34} {'loss': 0.8912, 'learning_rate': 1.8684214014396133e-05, 'epoch': 0.34} {'loss': 0.7875, 'learning_rate': 1.8684051700062765e-05, 'epoch': 0.34} {'loss': 0.7368, 'learning_rate': 1.8683889376423653e-05, 'epoch': 0.34} {'loss': 0.7818, 'learning_rate': 1.8683727043478966e-05, 'epoch': 0.34} {'loss': 0.9662, 'learning_rate': 1.8683564701228883e-05, 'epoch': 0.34} {'loss': 0.8261, 'learning_rate': 1.868340234967358e-05, 'epoch': 0.34} {'loss': 0.9193, 'learning_rate': 1.8683239988813223e-05, 'epoch': 0.34} {'loss': 0.9933, 'learning_rate': 1.8683077618647997e-05, 'epoch': 0.34} {'loss': 0.9632, 'learning_rate': 1.8682915239178063e-05, 'epoch': 0.34} {'loss': 0.9333, 'learning_rate': 1.8682752850403602e-05, 'epoch': 0.34} {'loss': 0.9291, 'learning_rate': 1.8682590452324788e-05, 'epoch': 0.34} {'loss': 1.1009, 'learning_rate': 1.86824280449418e-05, 'epoch': 0.34} {'loss': 0.9243, 'learning_rate': 1.86822656282548e-05, 'epoch': 0.34} {'loss': 0.7911, 'learning_rate': 1.8682103202263973e-05, 'epoch': 0.34} {'loss': 0.9356, 'learning_rate': 1.868194076696949e-05, 'epoch': 0.34} {'loss': 0.9817, 'learning_rate': 1.868177832237152e-05, 'epoch': 0.34} {'loss': 0.8592, 'learning_rate': 1.8681615868470242e-05, 'epoch': 0.34} {'loss': 0.8181, 'learning_rate': 1.868145340526583e-05, 'epoch': 0.34} {'loss': 0.9497, 'learning_rate': 1.8681290932758454e-05, 'epoch': 0.34} {'loss': 0.7741, 'learning_rate': 1.8681128450948296e-05, 'epoch': 0.34} {'loss': 0.945, 'learning_rate': 1.868096595983552e-05, 'epoch': 0.34} {'loss': 0.9275, 'learning_rate': 1.868080345942031e-05, 'epoch': 0.34} {'loss': 0.8776, 'learning_rate': 1.8680640949702835e-05, 'epoch': 0.34} {'loss': 0.7429, 'learning_rate': 1.868047843068327e-05, 'epoch': 0.34} {'loss': 0.9121, 'learning_rate': 1.868031590236179e-05, 'epoch': 0.34} {'loss': 0.7691, 'learning_rate': 1.8680153364738563e-05, 'epoch': 0.34} {'loss': 0.8666, 'learning_rate': 1.867999081781377e-05, 'epoch': 0.34} {'loss': 1.0541, 'learning_rate': 1.8679828261587586e-05, 'epoch': 0.34} {'loss': 0.8275, 'learning_rate': 1.867966569606018e-05, 'epoch': 0.34} {'loss': 0.8872, 'learning_rate': 1.867950312123173e-05, 'epoch': 0.34} {'loss': 0.9892, 'learning_rate': 1.8679340537102408e-05, 'epoch': 0.34} {'loss': 0.8814, 'learning_rate': 1.867917794367239e-05, 'epoch': 0.34} {'loss': 0.8098, 'learning_rate': 1.8679015340941854e-05, 'epoch': 0.34} {'loss': 0.8434, 'learning_rate': 1.8678852728910964e-05, 'epoch': 0.34} {'loss': 1.0764, 'learning_rate': 1.86786901075799e-05, 'epoch': 0.34} {'loss': 0.9829, 'learning_rate': 1.8678527476948838e-05, 'epoch': 0.34} {'loss': 0.8993, 'learning_rate': 1.867836483701795e-05, 'epoch': 0.34} {'loss': 0.9407, 'learning_rate': 1.867820218778741e-05, 'epoch': 0.34} {'loss': 0.6795, 'learning_rate': 1.8678039529257397e-05, 'epoch': 0.34} {'loss': 0.7889, 'learning_rate': 1.8677876861428076e-05, 'epoch': 0.34} {'loss': 0.7983, 'learning_rate': 1.867771418429963e-05, 'epoch': 0.34} {'loss': 0.8888, 'learning_rate': 1.867755149787223e-05, 'epoch': 0.34} {'loss': 0.8924, 'learning_rate': 1.867738880214605e-05, 'epoch': 0.34} {'loss': 0.8863, 'learning_rate': 1.8677226097121264e-05, 'epoch': 0.34} {'loss': 0.7938, 'learning_rate': 1.8677063382798048e-05, 'epoch': 0.34} {'loss': 1.0429, 'learning_rate': 1.8676900659176575e-05, 'epoch': 0.34} {'loss': 0.9169, 'learning_rate': 1.867673792625702e-05, 'epoch': 0.34} {'loss': 1.0064, 'learning_rate': 1.8676575184039556e-05, 'epoch': 0.34} {'loss': 0.8871, 'learning_rate': 1.867641243252436e-05, 'epoch': 0.34} {'loss': 0.9892, 'learning_rate': 1.8676249671711605e-05, 'epoch': 0.34} {'loss': 0.9539, 'learning_rate': 1.8676086901601463e-05, 'epoch': 0.34} {'loss': 0.7732, 'learning_rate': 1.8675924122194112e-05, 'epoch': 0.34} {'loss': 0.8627, 'learning_rate': 1.8675761333489724e-05, 'epoch': 0.34} {'loss': 0.9299, 'learning_rate': 1.867559853548848e-05, 'epoch': 0.34} {'loss': 0.8845, 'learning_rate': 1.8675435728190545e-05, 'epoch': 0.34} {'loss': 0.8972, 'learning_rate': 1.86752729115961e-05, 'epoch': 0.34} {'loss': 0.9398, 'learning_rate': 1.8675110085705315e-05, 'epoch': 0.34} {'loss': 0.9124, 'learning_rate': 1.8674947250518368e-05, 'epoch': 0.34} {'loss': 0.8216, 'learning_rate': 1.867478440603543e-05, 'epoch': 0.34} {'loss': 1.0434, 'learning_rate': 1.867462155225668e-05, 'epoch': 0.34} {'loss': 0.8542, 'learning_rate': 1.8674458689182287e-05, 'epoch': 0.34} {'loss': 0.9777, 'learning_rate': 1.867429581681243e-05, 'epoch': 0.34} {'loss': 0.8302, 'learning_rate': 1.8674132935147283e-05, 'epoch': 0.34} {'loss': 0.7967, 'learning_rate': 1.8673970044187018e-05, 'epoch': 0.34} {'loss': 0.8704, 'learning_rate': 1.8673807143931812e-05, 'epoch': 0.34} {'loss': 0.935, 'learning_rate': 1.867364423438184e-05, 'epoch': 0.34} {'loss': 0.8941, 'learning_rate': 1.8673481315537274e-05, 'epoch': 0.34} {'loss': 0.7526, 'learning_rate': 1.867331838739829e-05, 'epoch': 0.34} {'loss': 0.9992, 'learning_rate': 1.8673155449965063e-05, 'epoch': 0.34} {'loss': 0.9572, 'learning_rate': 1.8672992503237765e-05, 'epoch': 0.34} {'loss': 0.6874, 'learning_rate': 1.8672829547216577e-05, 'epoch': 0.34} {'loss': 0.9217, 'learning_rate': 1.867266658190167e-05, 'epoch': 0.34} {'loss': 0.8216, 'learning_rate': 1.867250360729321e-05, 'epoch': 0.34} {'loss': 0.9375, 'learning_rate': 1.8672340623391387e-05, 'epoch': 0.34} {'loss': 0.7604, 'learning_rate': 1.8672177630196366e-05, 'epoch': 0.34} {'loss': 0.7222, 'learning_rate': 1.8672014627708326e-05, 'epoch': 0.34} {'loss': 1.0287, 'learning_rate': 1.8671851615927437e-05, 'epoch': 0.34} {'loss': 1.0403, 'learning_rate': 1.8671688594853875e-05, 'epoch': 0.34} {'loss': 0.8504, 'learning_rate': 1.867152556448782e-05, 'epoch': 0.34} {'loss': 0.9334, 'learning_rate': 1.867136252482944e-05, 'epoch': 0.34} {'loss': 0.9671, 'learning_rate': 1.867119947587891e-05, 'epoch': 0.34} {'loss': 0.7404, 'learning_rate': 1.867103641763641e-05, 'epoch': 0.34} {'loss': 0.8414, 'learning_rate': 1.8670873350102116e-05, 'epoch': 0.34} {'loss': 0.8097, 'learning_rate': 1.8670710273276195e-05, 'epoch': 0.34} {'loss': 0.8307, 'learning_rate': 1.8670547187158827e-05, 'epoch': 0.34} {'loss': 0.9924, 'learning_rate': 1.867038409175018e-05, 'epoch': 0.34} {'loss': 0.7353, 'learning_rate': 1.867022098705044e-05, 'epoch': 0.34} {'loss': 0.9591, 'learning_rate': 1.867005787305977e-05, 'epoch': 0.34} {'loss': 0.8938, 'learning_rate': 1.866989474977835e-05, 'epoch': 0.34} {'loss': 0.8982, 'learning_rate': 1.8669731617206363e-05, 'epoch': 0.34} {'loss': 0.8333, 'learning_rate': 1.866956847534397e-05, 'epoch': 0.34} {'loss': 1.0092, 'learning_rate': 1.8669405324191356e-05, 'epoch': 0.34} {'loss': 0.9229, 'learning_rate': 1.866924216374869e-05, 'epoch': 0.34} {'loss': 1.0802, 'learning_rate': 1.8669078994016146e-05, 'epoch': 0.34} {'loss': 0.9883, 'learning_rate': 1.8668915814993903e-05, 'epoch': 0.34} {'loss': 0.7876, 'learning_rate': 1.8668752626682132e-05, 'epoch': 0.34} {'loss': 0.8127, 'learning_rate': 1.8668589429081015e-05, 'epoch': 0.34} {'loss': 1.0022, 'learning_rate': 1.866842622219072e-05, 'epoch': 0.34} {'loss': 0.7627, 'learning_rate': 1.8668263006011424e-05, 'epoch': 0.34} {'loss': 0.8589, 'learning_rate': 1.86680997805433e-05, 'epoch': 0.34} {'loss': 0.8143, 'learning_rate': 1.8667936545786526e-05, 'epoch': 0.34} {'loss': 0.9807, 'learning_rate': 1.8667773301741278e-05, 'epoch': 0.34} {'loss': 0.9155, 'learning_rate': 1.8667610048407724e-05, 'epoch': 0.34} {'loss': 0.9199, 'learning_rate': 1.8667446785786047e-05, 'epoch': 0.34} {'loss': 0.9143, 'learning_rate': 1.866728351387642e-05, 'epoch': 0.34} {'loss': 0.8455, 'learning_rate': 1.8667120232679013e-05, 'epoch': 0.34} {'loss': 1.0643, 'learning_rate': 1.8666956942194004e-05, 'epoch': 0.34} {'loss': 0.9102, 'learning_rate': 1.866679364242157e-05, 'epoch': 0.34} {'loss': 1.0291, 'learning_rate': 1.8666630333361882e-05, 'epoch': 0.34} {'loss': 0.8278, 'learning_rate': 1.866646701501512e-05, 'epoch': 0.34} {'loss': 0.8498, 'learning_rate': 1.8666303687381456e-05, 'epoch': 0.34} {'loss': 0.9709, 'learning_rate': 1.8666140350461068e-05, 'epoch': 0.34} {'loss': 0.8138, 'learning_rate': 1.8665977004254126e-05, 'epoch': 0.34} {'loss': 0.8163, 'learning_rate': 1.8665813648760805e-05, 'epoch': 0.34} {'loss': 0.8887, 'learning_rate': 1.8665650283981283e-05, 'epoch': 0.34} {'loss': 0.9167, 'learning_rate': 1.866548690991574e-05, 'epoch': 0.34} {'loss': 0.8957, 'learning_rate': 1.8665323526564342e-05, 'epoch': 0.34} {'loss': 0.8541, 'learning_rate': 1.8665160133927265e-05, 'epoch': 0.34} {'loss': 0.8581, 'learning_rate': 1.866499673200469e-05, 'epoch': 0.34} {'loss': 0.8195, 'learning_rate': 1.866483332079679e-05, 'epoch': 0.34} {'loss': 0.9782, 'learning_rate': 1.8664669900303737e-05, 'epoch': 0.34} {'loss': 0.9538, 'learning_rate': 1.8664506470525708e-05, 'epoch': 0.34} {'loss': 0.7388, 'learning_rate': 1.866434303146288e-05, 'epoch': 0.34} {'loss': 0.6426, 'learning_rate': 1.8664179583115424e-05, 'epoch': 0.34} {'loss': 1.0712, 'learning_rate': 1.866401612548352e-05, 'epoch': 0.34} {'loss': 0.7878, 'learning_rate': 1.8663852658567342e-05, 'epoch': 0.34} {'loss': 0.9352, 'learning_rate': 1.866368918236706e-05, 'epoch': 0.34} {'loss': 0.8107, 'learning_rate': 1.8663525696882856e-05, 'epoch': 0.34} {'loss': 0.9473, 'learning_rate': 1.86633622021149e-05, 'epoch': 0.34} {'loss': 0.9794, 'learning_rate': 1.866319869806337e-05, 'epoch': 0.34} {'loss': 0.8057, 'learning_rate': 1.8663035184728443e-05, 'epoch': 0.34} {'loss': 1.0584, 'learning_rate': 1.8662871662110287e-05, 'epoch': 0.34} {'loss': 0.8145, 'learning_rate': 1.866270813020909e-05, 'epoch': 0.34} {'loss': 0.6766, 'learning_rate': 1.8662544589025014e-05, 'epoch': 0.34} {'loss': 0.8592, 'learning_rate': 1.866238103855824e-05, 'epoch': 0.34} {'loss': 0.7941, 'learning_rate': 1.8662217478808943e-05, 'epoch': 0.34} {'loss': 0.9333, 'learning_rate': 1.86620539097773e-05, 'epoch': 0.34} {'loss': 1.0836, 'learning_rate': 1.8661890331463482e-05, 'epoch': 0.34} {'loss': 0.9882, 'learning_rate': 1.8661726743867667e-05, 'epoch': 0.34} {'loss': 0.8222, 'learning_rate': 1.8661563146990032e-05, 'epoch': 0.34} {'loss': 1.0642, 'learning_rate': 1.8661399540830748e-05, 'epoch': 0.34} {'loss': 0.8152, 'learning_rate': 1.8661235925389993e-05, 'epoch': 0.34} {'loss': 0.9259, 'learning_rate': 1.866107230066794e-05, 'epoch': 0.34} {'loss': 0.8246, 'learning_rate': 1.8660908666664774e-05, 'epoch': 0.34} {'loss': 0.8876, 'learning_rate': 1.8660745023380656e-05, 'epoch': 0.34} {'loss': 0.8829, 'learning_rate': 1.8660581370815768e-05, 'epoch': 0.34} {'loss': 0.9125, 'learning_rate': 1.866041770897029e-05, 'epoch': 0.34} {'loss': 0.9811, 'learning_rate': 1.866025403784439e-05, 'epoch': 0.34} {'loss': 0.914, 'learning_rate': 1.8660090357438245e-05, 'epoch': 0.34} {'loss': 1.0442, 'learning_rate': 1.8659926667752032e-05, 'epoch': 0.34} {'loss': 0.9356, 'learning_rate': 1.8659762968785927e-05, 'epoch': 0.34} {'loss': 0.8274, 'learning_rate': 1.86595992605401e-05, 'epoch': 0.34} {'loss': 0.7921, 'learning_rate': 1.8659435543014735e-05, 'epoch': 0.34} {'loss': 0.9065, 'learning_rate': 1.8659271816210008e-05, 'epoch': 0.34} {'loss': 0.9015, 'learning_rate': 1.8659108080126082e-05, 'epoch': 0.34} {'loss': 0.8186, 'learning_rate': 1.8658944334763144e-05, 'epoch': 0.34} {'loss': 0.9343, 'learning_rate': 1.8658780580121363e-05, 'epoch': 0.34} {'loss': 1.0402, 'learning_rate': 1.865861681620092e-05, 'epoch': 0.34} {'loss': 0.9765, 'learning_rate': 1.8658453043001985e-05, 'epoch': 0.34} {'loss': 1.0436, 'learning_rate': 1.8658289260524736e-05, 'epoch': 0.34} {'loss': 0.8554, 'learning_rate': 1.865812546876935e-05, 'epoch': 0.34} {'loss': 0.8782, 'learning_rate': 1.8657961667736e-05, 'epoch': 0.34} {'loss': 0.8067, 'learning_rate': 1.8657797857424867e-05, 'epoch': 0.34} {'loss': 0.7755, 'learning_rate': 1.865763403783612e-05, 'epoch': 0.34} {'loss': 0.9784, 'learning_rate': 1.8657470208969933e-05, 'epoch': 0.34} {'loss': 0.9567, 'learning_rate': 1.8657306370826486e-05, 'epoch': 0.34} {'loss': 0.877, 'learning_rate': 1.8657142523405957e-05, 'epoch': 0.34} {'loss': 0.8552, 'learning_rate': 1.8656978666708517e-05, 'epoch': 0.34} {'loss': 0.8889, 'learning_rate': 1.8656814800734346e-05, 'epoch': 0.34} {'loss': 1.0004, 'learning_rate': 1.865665092548361e-05, 'epoch': 0.34} {'loss': 0.9411, 'learning_rate': 1.8656487040956497e-05, 'epoch': 0.34} {'loss': 0.8544, 'learning_rate': 1.8656323147153173e-05, 'epoch': 0.34} {'loss': 1.0454, 'learning_rate': 1.8656159244073818e-05, 'epoch': 0.34} {'loss': 1.128, 'learning_rate': 1.865599533171861e-05, 'epoch': 0.34} {'loss': 0.8877, 'learning_rate': 1.8655831410087718e-05, 'epoch': 0.34} {'loss': 0.8494, 'learning_rate': 1.865566747918133e-05, 'epoch': 0.34} {'loss': 0.9394, 'learning_rate': 1.8655503538999603e-05, 'epoch': 0.34} {'loss': 0.795, 'learning_rate': 1.8655339589542728e-05, 'epoch': 0.34} {'loss': 0.8736, 'learning_rate': 1.8655175630810873e-05, 'epoch': 0.34} {'loss': 1.0115, 'learning_rate': 1.8655011662804217e-05, 'epoch': 0.34} {'loss': 0.919, 'learning_rate': 1.8654847685522936e-05, 'epoch': 0.34} {'loss': 1.0, 'learning_rate': 1.86546836989672e-05, 'epoch': 0.34} {'loss': 0.8454, 'learning_rate': 1.8654519703137192e-05, 'epoch': 0.34} {'loss': 0.8562, 'learning_rate': 1.8654355698033085e-05, 'epoch': 0.34} {'loss': 0.8052, 'learning_rate': 1.8654191683655058e-05, 'epoch': 0.34} {'loss': 1.0484, 'learning_rate': 1.865402766000328e-05, 'epoch': 0.34} {'loss': 0.96, 'learning_rate': 1.8653863627077932e-05, 'epoch': 0.34} {'loss': 0.8794, 'learning_rate': 1.8653699584879185e-05, 'epoch': 0.34} {'loss': 0.8266, 'learning_rate': 1.865353553340722e-05, 'epoch': 0.34} {'loss': 0.9422, 'learning_rate': 1.865337147266221e-05, 'epoch': 0.34} {'loss': 0.9148, 'learning_rate': 1.8653207402644334e-05, 'epoch': 0.34} {'loss': 1.1493, 'learning_rate': 1.8653043323353764e-05, 'epoch': 0.34} {'loss': 0.7681, 'learning_rate': 1.8652879234790674e-05, 'epoch': 0.34} {'loss': 0.8802, 'learning_rate': 1.8652715136955246e-05, 'epoch': 0.34} {'loss': 0.7851, 'learning_rate': 1.8652551029847653e-05, 'epoch': 0.34} {'loss': 0.9291, 'learning_rate': 1.865238691346807e-05, 'epoch': 0.34} {'loss': 0.8745, 'learning_rate': 1.8652222787816675e-05, 'epoch': 0.34} {'loss': 0.8915, 'learning_rate': 1.865205865289364e-05, 'epoch': 0.34} {'loss': 0.985, 'learning_rate': 1.8651894508699145e-05, 'epoch': 0.34} {'loss': 1.0596, 'learning_rate': 1.8651730355233358e-05, 'epoch': 0.34} {'loss': 0.8778, 'learning_rate': 1.865156619249647e-05, 'epoch': 0.34} {'loss': 0.8344, 'learning_rate': 1.8651402020488644e-05, 'epoch': 0.34} {'loss': 0.893, 'learning_rate': 1.865123783921006e-05, 'epoch': 0.34} {'loss': 1.038, 'learning_rate': 1.8651073648660895e-05, 'epoch': 0.34} {'loss': 0.9186, 'learning_rate': 1.865090944884132e-05, 'epoch': 0.34} {'loss': 0.9876, 'learning_rate': 1.8650745239751518e-05, 'epoch': 0.34} {'loss': 1.0216, 'learning_rate': 1.865058102139166e-05, 'epoch': 0.34} {'loss': 0.851, 'learning_rate': 1.8650416793761924e-05, 'epoch': 0.34} {'loss': 0.8462, 'learning_rate': 1.865025255686249e-05, 'epoch': 0.34} {'loss': 0.8496, 'learning_rate': 1.8650088310693525e-05, 'epoch': 0.34} {'loss': 0.8125, 'learning_rate': 1.864992405525521e-05, 'epoch': 0.34} {'loss': 0.6987, 'learning_rate': 1.8649759790547722e-05, 'epoch': 0.34} {'loss': 0.9575, 'learning_rate': 1.8649595516571233e-05, 'epoch': 0.34} {'loss': 0.8003, 'learning_rate': 1.8649431233325925e-05, 'epoch': 0.34} {'loss': 1.0259, 'learning_rate': 1.864926694081197e-05, 'epoch': 0.34} {'loss': 0.9968, 'learning_rate': 1.8649102639029543e-05, 'epoch': 0.34} {'loss': 0.7857, 'learning_rate': 1.8648938327978825e-05, 'epoch': 0.34} {'loss': 0.8667, 'learning_rate': 1.8648774007659986e-05, 'epoch': 0.34} {'loss': 0.986, 'learning_rate': 1.864860967807321e-05, 'epoch': 0.34} {'loss': 0.9104, 'learning_rate': 1.8648445339218663e-05, 'epoch': 0.34} {'loss': 0.77, 'learning_rate': 1.864828099109653e-05, 'epoch': 0.34} {'loss': 0.6973, 'learning_rate': 1.8648116633706977e-05, 'epoch': 0.34} {'loss': 1.029, 'learning_rate': 1.8647952267050193e-05, 'epoch': 0.34} {'loss': 0.8164, 'learning_rate': 1.8647787891126344e-05, 'epoch': 0.34} {'loss': 0.8597, 'learning_rate': 1.864762350593561e-05, 'epoch': 0.34} {'loss': 0.9801, 'learning_rate': 1.864745911147817e-05, 'epoch': 0.34} {'loss': 0.9166, 'learning_rate': 1.8647294707754192e-05, 'epoch': 0.34} {'loss': 0.848, 'learning_rate': 1.8647130294763863e-05, 'epoch': 0.34} {'loss': 0.7247, 'learning_rate': 1.864696587250735e-05, 'epoch': 0.34} {'loss': 0.6546, 'learning_rate': 1.8646801440984833e-05, 'epoch': 0.34} {'loss': 0.9571, 'learning_rate': 1.8646637000196488e-05, 'epoch': 0.34} {'loss': 0.7275, 'learning_rate': 1.864647255014249e-05, 'epoch': 0.34} {'loss': 1.0446, 'learning_rate': 1.8646308090823016e-05, 'epoch': 0.34} {'loss': 0.9947, 'learning_rate': 1.8646143622238245e-05, 'epoch': 0.34} {'loss': 0.8618, 'learning_rate': 1.864597914438835e-05, 'epoch': 0.34} {'loss': 0.991, 'learning_rate': 1.864581465727351e-05, 'epoch': 0.34} {'loss': 0.9936, 'learning_rate': 1.8645650160893895e-05, 'epoch': 0.34} {'loss': 0.951, 'learning_rate': 1.8645485655249687e-05, 'epoch': 0.34} {'loss': 0.9116, 'learning_rate': 1.8645321140341064e-05, 'epoch': 0.34} {'loss': 0.6838, 'learning_rate': 1.8645156616168197e-05, 'epoch': 0.34} {'loss': 0.9333, 'learning_rate': 1.864499208273126e-05, 'epoch': 0.34} {'loss': 0.8972, 'learning_rate': 1.8644827540030438e-05, 'epoch': 0.34} {'loss': 0.8944, 'learning_rate': 1.8644662988065905e-05, 'epoch': 0.34} {'loss': 1.0114, 'learning_rate': 1.864449842683783e-05, 'epoch': 0.34} {'loss': 1.0183, 'learning_rate': 1.86443338563464e-05, 'epoch': 0.34} {'loss': 0.8786, 'learning_rate': 1.8644169276591784e-05, 'epoch': 0.34} {'loss': 0.8243, 'learning_rate': 1.864400468757416e-05, 'epoch': 0.34} {'loss': 0.871, 'learning_rate': 1.8643840089293707e-05, 'epoch': 0.34} {'loss': 0.7737, 'learning_rate': 1.8643675481750593e-05, 'epoch': 0.34} {'loss': 0.7504, 'learning_rate': 1.8643510864945007e-05, 'epoch': 0.34} {'loss': 0.8228, 'learning_rate': 1.8643346238877115e-05, 'epoch': 0.34} {'loss': 0.8519, 'learning_rate': 1.8643181603547102e-05, 'epoch': 0.34} {'loss': 0.9193, 'learning_rate': 1.8643016958955135e-05, 'epoch': 0.34} {'loss': 0.8389, 'learning_rate': 1.86428523051014e-05, 'epoch': 0.34} {'loss': 0.7462, 'learning_rate': 1.8642687641986062e-05, 'epoch': 0.34} {'loss': 0.8961, 'learning_rate': 1.8642522969609308e-05, 'epoch': 0.34} {'loss': 0.9586, 'learning_rate': 1.8642358287971312e-05, 'epoch': 0.34} {'loss': 1.013, 'learning_rate': 1.864219359707225e-05, 'epoch': 0.34} {'loss': 0.9534, 'learning_rate': 1.8642028896912294e-05, 'epoch': 0.34} {'loss': 0.8895, 'learning_rate': 1.8641864187491624e-05, 'epoch': 0.34} {'loss': 0.7351, 'learning_rate': 1.8641699468810417e-05, 'epoch': 0.34} {'loss': 1.0172, 'learning_rate': 1.864153474086885e-05, 'epoch': 0.34} {'loss': 0.8728, 'learning_rate': 1.86413700036671e-05, 'epoch': 0.34} {'loss': 0.6547, 'learning_rate': 1.8641205257205343e-05, 'epoch': 0.34} {'loss': 0.9905, 'learning_rate': 1.864104050148375e-05, 'epoch': 0.34} {'loss': 0.9321, 'learning_rate': 1.8640875736502505e-05, 'epoch': 0.34} {'loss': 0.881, 'learning_rate': 1.8640710962261778e-05, 'epoch': 0.34} {'loss': 0.7648, 'learning_rate': 1.8640546178761755e-05, 'epoch': 0.34} {'loss': 0.6852, 'learning_rate': 1.8640381386002604e-05, 'epoch': 0.34} {'loss': 0.9745, 'learning_rate': 1.8640216583984503e-05, 'epoch': 0.34} {'loss': 0.7091, 'learning_rate': 1.8640051772707633e-05, 'epoch': 0.34} {'loss': 0.7846, 'learning_rate': 1.8639886952172168e-05, 'epoch': 0.34} {'loss': 0.9019, 'learning_rate': 1.8639722122378284e-05, 'epoch': 0.34} {'loss': 0.7382, 'learning_rate': 1.8639557283326154e-05, 'epoch': 0.34} {'loss': 0.7581, 'learning_rate': 1.8639392435015964e-05, 'epoch': 0.34} {'loss': 1.0442, 'learning_rate': 1.8639227577447883e-05, 'epoch': 0.34} {'loss': 0.9979, 'learning_rate': 1.8639062710622088e-05, 'epoch': 0.34} {'loss': 1.0201, 'learning_rate': 1.863889783453876e-05, 'epoch': 0.34} {'loss': 0.8242, 'learning_rate': 1.8638732949198073e-05, 'epoch': 0.34} {'loss': 0.8768, 'learning_rate': 1.8638568054600205e-05, 'epoch': 0.34} {'loss': 0.8555, 'learning_rate': 1.863840315074533e-05, 'epoch': 0.34} {'loss': 1.0324, 'learning_rate': 1.8638238237633624e-05, 'epoch': 0.34} {'loss': 0.9241, 'learning_rate': 1.863807331526527e-05, 'epoch': 0.34} {'loss': 1.0226, 'learning_rate': 1.863790838364044e-05, 'epoch': 0.34} {'loss': 0.975, 'learning_rate': 1.863774344275931e-05, 'epoch': 0.34} {'loss': 0.8626, 'learning_rate': 1.8637578492622062e-05, 'epoch': 0.34} {'loss': 0.8493, 'learning_rate': 1.8637413533228864e-05, 'epoch': 0.34} {'loss': 0.8983, 'learning_rate': 1.86372485645799e-05, 'epoch': 0.34} {'loss': 0.8383, 'learning_rate': 1.8637083586675346e-05, 'epoch': 0.34} {'loss': 1.0196, 'learning_rate': 1.8636918599515375e-05, 'epoch': 0.34} {'loss': 0.9738, 'learning_rate': 1.863675360310017e-05, 'epoch': 0.34} {'loss': 0.7366, 'learning_rate': 1.86365885974299e-05, 'epoch': 0.34} {'loss': 0.7218, 'learning_rate': 1.8636423582504747e-05, 'epoch': 0.34} {'loss': 0.8919, 'learning_rate': 1.8636258558324886e-05, 'epoch': 0.34} {'loss': 0.8194, 'learning_rate': 1.8636093524890495e-05, 'epoch': 0.34} {'loss': 0.9359, 'learning_rate': 1.8635928482201754e-05, 'epoch': 0.34} {'loss': 0.9813, 'learning_rate': 1.863576343025883e-05, 'epoch': 0.34} {'loss': 0.8038, 'learning_rate': 1.863559836906191e-05, 'epoch': 0.34} {'loss': 0.8073, 'learning_rate': 1.8635433298611167e-05, 'epoch': 0.34} {'loss': 0.8118, 'learning_rate': 1.8635268218906778e-05, 'epoch': 0.34} {'loss': 0.7762, 'learning_rate': 1.8635103129948917e-05, 'epoch': 0.34} {'loss': 0.9237, 'learning_rate': 1.8634938031737763e-05, 'epoch': 0.34} {'loss': 0.9209, 'learning_rate': 1.8634772924273495e-05, 'epoch': 0.34} {'loss': 0.8565, 'learning_rate': 1.863460780755629e-05, 'epoch': 0.34} {'loss': 0.8669, 'learning_rate': 1.8634442681586322e-05, 'epoch': 0.34} {'loss': 0.8953, 'learning_rate': 1.8634277546363772e-05, 'epoch': 0.34} {'loss': 0.9359, 'learning_rate': 1.863411240188881e-05, 'epoch': 0.34} {'loss': 0.8635, 'learning_rate': 1.8633947248161622e-05, 'epoch': 0.34} {'loss': 0.6885, 'learning_rate': 1.863378208518238e-05, 'epoch': 0.34} {'loss': 0.8237, 'learning_rate': 1.8633616912951255e-05, 'epoch': 0.34} {'loss': 0.883, 'learning_rate': 1.8633451731468434e-05, 'epoch': 0.34} {'loss': 1.1143, 'learning_rate': 1.863328654073409e-05, 'epoch': 0.34} {'loss': 0.7686, 'learning_rate': 1.8633121340748402e-05, 'epoch': 0.34} {'loss': 0.7509, 'learning_rate': 1.8632956131511544e-05, 'epoch': 0.34} {'loss': 0.9688, 'learning_rate': 1.8632790913023697e-05, 'epoch': 0.34} {'loss': 1.0783, 'learning_rate': 1.863262568528503e-05, 'epoch': 0.34} {'loss': 1.0887, 'learning_rate': 1.8632460448295727e-05, 'epoch': 0.34} {'loss': 0.9776, 'learning_rate': 1.8632295202055966e-05, 'epoch': 0.34} {'loss': 0.9027, 'learning_rate': 1.863212994656592e-05, 'epoch': 0.34} {'loss': 0.779, 'learning_rate': 1.8631964681825766e-05, 'epoch': 0.34} {'loss': 0.9893, 'learning_rate': 1.8631799407835685e-05, 'epoch': 0.34} {'loss': 0.9226, 'learning_rate': 1.8631634124595856e-05, 'epoch': 0.34} {'loss': 0.8699, 'learning_rate': 1.8631468832106446e-05, 'epoch': 0.34} {'loss': 0.9332, 'learning_rate': 1.863130353036764e-05, 'epoch': 0.34} {'loss': 0.9934, 'learning_rate': 1.863113821937961e-05, 'epoch': 0.34} {'loss': 0.7889, 'learning_rate': 1.863097289914254e-05, 'epoch': 0.34} {'loss': 0.7607, 'learning_rate': 1.8630807569656603e-05, 'epoch': 0.34} {'loss': 0.6366, 'learning_rate': 1.8630642230921977e-05, 'epoch': 0.34} {'loss': 0.9221, 'learning_rate': 1.8630476882938838e-05, 'epoch': 0.34} {'loss': 0.9381, 'learning_rate': 1.8630311525707367e-05, 'epoch': 0.34} {'loss': 0.9138, 'learning_rate': 1.8630146159227736e-05, 'epoch': 0.34} {'loss': 0.91, 'learning_rate': 1.862998078350012e-05, 'epoch': 0.34} {'loss': 0.7888, 'learning_rate': 1.862981539852471e-05, 'epoch': 0.34} {'loss': 0.8416, 'learning_rate': 1.8629650004301666e-05, 'epoch': 0.34} {'loss': 0.7727, 'learning_rate': 1.8629484600831177e-05, 'epoch': 0.34} {'loss': 0.9191, 'learning_rate': 1.8629319188113414e-05, 'epoch': 0.34} {'loss': 1.1087, 'learning_rate': 1.862915376614856e-05, 'epoch': 0.34} {'loss': 0.7929, 'learning_rate': 1.8628988334936785e-05, 'epoch': 0.34} {'loss': 0.652, 'learning_rate': 1.8628822894478272e-05, 'epoch': 0.34} {'loss': 0.9223, 'learning_rate': 1.8628657444773198e-05, 'epoch': 0.34} {'loss': 0.7095, 'learning_rate': 1.8628491985821737e-05, 'epoch': 0.34} {'loss': 0.9088, 'learning_rate': 1.862832651762407e-05, 'epoch': 0.34} {'loss': 0.8191, 'learning_rate': 1.862816104018037e-05, 'epoch': 0.34} {'loss': 0.8359, 'learning_rate': 1.8627995553490818e-05, 'epoch': 0.34} {'loss': 0.7859, 'learning_rate': 1.8627830057555587e-05, 'epoch': 0.34} {'loss': 0.767, 'learning_rate': 1.862766455237486e-05, 'epoch': 0.34} {'loss': 0.9184, 'learning_rate': 1.8627499037948812e-05, 'epoch': 0.34} {'loss': 0.7434, 'learning_rate': 1.862733351427762e-05, 'epoch': 0.34} {'loss': 0.8479, 'learning_rate': 1.862716798136146e-05, 'epoch': 0.34} {'loss': 1.0914, 'learning_rate': 1.8627002439200514e-05, 'epoch': 0.34} {'loss': 0.7338, 'learning_rate': 1.8626836887794955e-05, 'epoch': 0.34} {'loss': 0.684, 'learning_rate': 1.862667132714496e-05, 'epoch': 0.34} {'loss': 0.8813, 'learning_rate': 1.8626505757250706e-05, 'epoch': 0.34} {'loss': 0.8785, 'learning_rate': 1.8626340178112378e-05, 'epoch': 0.34} {'loss': 1.0282, 'learning_rate': 1.8626174589730145e-05, 'epoch': 0.34} {'loss': 1.048, 'learning_rate': 1.8626008992104188e-05, 'epoch': 0.34} {'loss': 0.7613, 'learning_rate': 1.8625843385234685e-05, 'epoch': 0.34} {'loss': 0.9112, 'learning_rate': 1.862567776912181e-05, 'epoch': 0.34} {'loss': 1.0568, 'learning_rate': 1.8625512143765743e-05, 'epoch': 0.34} {'loss': 0.7511, 'learning_rate': 1.862534650916666e-05, 'epoch': 0.34} {'loss': 0.9031, 'learning_rate': 1.8625180865324743e-05, 'epoch': 0.34} {'loss': 0.7192, 'learning_rate': 1.8625015212240164e-05, 'epoch': 0.34} {'loss': 0.6937, 'learning_rate': 1.8624849549913104e-05, 'epoch': 0.34} {'loss': 0.8207, 'learning_rate': 1.862468387834374e-05, 'epoch': 0.34} {'loss': 0.8797, 'learning_rate': 1.8624518197532248e-05, 'epoch': 0.34} {'loss': 0.91, 'learning_rate': 1.8624352507478807e-05, 'epoch': 0.34} {'loss': 0.9016, 'learning_rate': 1.862418680818359e-05, 'epoch': 0.34} {'loss': 1.0402, 'learning_rate': 1.8624021099646783e-05, 'epoch': 0.34} {'loss': 0.9296, 'learning_rate': 1.8623855381868558e-05, 'epoch': 0.34} {'loss': 1.0329, 'learning_rate': 1.8623689654849092e-05, 'epoch': 0.34} {'loss': 0.8897, 'learning_rate': 1.8623523918588568e-05, 'epoch': 0.34} {'loss': 0.7111, 'learning_rate': 1.8623358173087155e-05, 'epoch': 0.34} {'loss': 0.7982, 'learning_rate': 1.862319241834504e-05, 'epoch': 0.34} {'loss': 1.0887, 'learning_rate': 1.8623026654362393e-05, 'epoch': 0.34} {'loss': 0.9212, 'learning_rate': 1.8622860881139394e-05, 'epoch': 0.34} {'loss': 0.8867, 'learning_rate': 1.862269509867622e-05, 'epoch': 0.34} {'loss': 0.8501, 'learning_rate': 1.8622529306973054e-05, 'epoch': 0.34} {'loss': 0.8515, 'learning_rate': 1.8622363506030068e-05, 'epoch': 0.34} {'loss': 0.7831, 'learning_rate': 1.862219769584744e-05, 'epoch': 0.34} {'loss': 0.6542, 'learning_rate': 1.862203187642535e-05, 'epoch': 0.34} {'loss': 0.8421, 'learning_rate': 1.8621866047763977e-05, 'epoch': 0.34} {'loss': 0.7664, 'learning_rate': 1.8621700209863497e-05, 'epoch': 0.34} {'loss': 0.8263, 'learning_rate': 1.862153436272408e-05, 'epoch': 0.34} {'loss': 0.9533, 'learning_rate': 1.8621368506345915e-05, 'epoch': 0.34} {'loss': 0.8273, 'learning_rate': 1.862120264072918e-05, 'epoch': 0.34} {'loss': 0.9093, 'learning_rate': 1.862103676587404e-05, 'epoch': 0.34} {'loss': 0.9694, 'learning_rate': 1.8620870881780686e-05, 'epoch': 0.34} {'loss': 0.9729, 'learning_rate': 1.862070498844929e-05, 'epoch': 0.34} {'loss': 0.8637, 'learning_rate': 1.862053908588003e-05, 'epoch': 0.34} {'loss': 0.8915, 'learning_rate': 1.8620373174073085e-05, 'epoch': 0.34} {'loss': 1.0143, 'learning_rate': 1.862020725302863e-05, 'epoch': 0.34} {'loss': 0.9344, 'learning_rate': 1.8620041322746848e-05, 'epoch': 0.34} {'loss': 0.8837, 'learning_rate': 1.8619875383227913e-05, 'epoch': 0.34} {'loss': 0.9135, 'learning_rate': 1.8619709434472003e-05, 'epoch': 0.34} {'loss': 0.9252, 'learning_rate': 1.8619543476479297e-05, 'epoch': 0.34} {'loss': 0.8052, 'learning_rate': 1.861937750924997e-05, 'epoch': 0.34} {'loss': 0.6457, 'learning_rate': 1.86192115327842e-05, 'epoch': 0.34} {'loss': 0.9158, 'learning_rate': 1.8619045547082174e-05, 'epoch': 0.34} {'loss': 0.7208, 'learning_rate': 1.861887955214406e-05, 'epoch': 0.34} {'loss': 0.8328, 'learning_rate': 1.8618713547970036e-05, 'epoch': 0.34} {'loss': 1.0481, 'learning_rate': 1.8618547534560284e-05, 'epoch': 0.34} {'loss': 0.8741, 'learning_rate': 1.861838151191498e-05, 'epoch': 0.34} {'loss': 0.9998, 'learning_rate': 1.86182154800343e-05, 'epoch': 0.34} {'loss': 0.8022, 'learning_rate': 1.861804943891843e-05, 'epoch': 0.34} {'loss': 0.7915, 'learning_rate': 1.8617883388567542e-05, 'epoch': 0.34} {'loss': 0.9043, 'learning_rate': 1.861771732898181e-05, 'epoch': 0.34} {'loss': 0.8442, 'learning_rate': 1.8617551260161418e-05, 'epoch': 0.34} {'loss': 0.7789, 'learning_rate': 1.8617385182106542e-05, 'epoch': 0.34} {'loss': 0.7853, 'learning_rate': 1.861721909481736e-05, 'epoch': 0.34} {'loss': 0.7622, 'learning_rate': 1.8617052998294052e-05, 'epoch': 0.34} {'loss': 0.8151, 'learning_rate': 1.861688689253679e-05, 'epoch': 0.34} {'loss': 0.9252, 'learning_rate': 1.8616720777545758e-05, 'epoch': 0.34} {'loss': 0.8808, 'learning_rate': 1.8616554653321132e-05, 'epoch': 0.34} {'loss': 0.8035, 'learning_rate': 1.8616388519863087e-05, 'epoch': 0.34} {'loss': 0.8922, 'learning_rate': 1.8616222377171808e-05, 'epoch': 0.34} {'loss': 1.0056, 'learning_rate': 1.861605622524747e-05, 'epoch': 0.34} {'loss': 0.9294, 'learning_rate': 1.8615890064090245e-05, 'epoch': 0.34} {'loss': 0.7769, 'learning_rate': 1.861572389370032e-05, 'epoch': 0.34} {'loss': 0.885, 'learning_rate': 1.861555771407787e-05, 'epoch': 0.34} {'loss': 0.8996, 'learning_rate': 1.861539152522307e-05, 'epoch': 0.34} {'loss': 0.9454, 'learning_rate': 1.86152253271361e-05, 'epoch': 0.34} {'loss': 0.9672, 'learning_rate': 1.861505911981714e-05, 'epoch': 0.34} {'loss': 0.9784, 'learning_rate': 1.8614892903266365e-05, 'epoch': 0.34} {'loss': 0.8237, 'learning_rate': 1.861472667748396e-05, 'epoch': 0.34} {'loss': 0.8316, 'learning_rate': 1.861456044247009e-05, 'epoch': 0.34} {'loss': 0.9809, 'learning_rate': 1.8614394198224947e-05, 'epoch': 0.34} {'loss': 0.9224, 'learning_rate': 1.86142279447487e-05, 'epoch': 0.34} {'loss': 0.9063, 'learning_rate': 1.8614061682041532e-05, 'epoch': 0.34} {'loss': 0.8313, 'learning_rate': 1.8613895410103617e-05, 'epoch': 0.34} {'loss': 1.027, 'learning_rate': 1.8613729128935135e-05, 'epoch': 0.34} {'loss': 0.9254, 'learning_rate': 1.861356283853627e-05, 'epoch': 0.34} {'loss': 0.7611, 'learning_rate': 1.8613396538907192e-05, 'epoch': 0.34} {'loss': 0.8918, 'learning_rate': 1.861323023004808e-05, 'epoch': 0.34} {'loss': 0.6816, 'learning_rate': 1.861306391195912e-05, 'epoch': 0.34} {'loss': 0.8759, 'learning_rate': 1.8612897584640478e-05, 'epoch': 0.34} {'loss': 0.9112, 'learning_rate': 1.8612731248092342e-05, 'epoch': 0.34} {'loss': 0.9556, 'learning_rate': 1.8612564902314888e-05, 'epoch': 0.34} {'loss': 0.9585, 'learning_rate': 1.8612398547308292e-05, 'epoch': 0.34} {'loss': 0.8876, 'learning_rate': 1.8612232183072736e-05, 'epoch': 0.34} {'loss': 0.9073, 'learning_rate': 1.8612065809608394e-05, 'epoch': 0.34} {'loss': 0.9951, 'learning_rate': 1.8611899426915445e-05, 'epoch': 0.34} {'loss': 0.8397, 'learning_rate': 1.8611733034994072e-05, 'epoch': 0.34} {'loss': 0.9346, 'learning_rate': 1.8611566633844448e-05, 'epoch': 0.34} {'loss': 1.0374, 'learning_rate': 1.8611400223466752e-05, 'epoch': 0.34} {'loss': 1.0934, 'learning_rate': 1.861123380386116e-05, 'epoch': 0.34} {'loss': 0.9487, 'learning_rate': 1.861106737502786e-05, 'epoch': 0.34} {'loss': 0.9503, 'learning_rate': 1.861090093696702e-05, 'epoch': 0.34} {'loss': 0.8821, 'learning_rate': 1.8610734489678828e-05, 'epoch': 0.34} {'loss': 0.854, 'learning_rate': 1.861056803316345e-05, 'epoch': 0.34} {'loss': 0.9263, 'learning_rate': 1.8610401567421076e-05, 'epoch': 0.34} {'loss': 0.8604, 'learning_rate': 1.8610235092451877e-05, 'epoch': 0.34} {'loss': 0.9049, 'learning_rate': 1.8610068608256036e-05, 'epoch': 0.34} {'loss': 0.9696, 'learning_rate': 1.860990211483373e-05, 'epoch': 0.34} {'loss': 0.8781, 'learning_rate': 1.8609735612185132e-05, 'epoch': 0.34} {'loss': 0.5543, 'learning_rate': 1.860956910031043e-05, 'epoch': 0.34} {'loss': 0.8778, 'learning_rate': 1.8609402579209797e-05, 'epoch': 0.34} {'loss': 0.8558, 'learning_rate': 1.860923604888341e-05, 'epoch': 0.34} {'loss': 0.8407, 'learning_rate': 1.860906950933145e-05, 'epoch': 0.34} {'loss': 0.7842, 'learning_rate': 1.8608902960554095e-05, 'epoch': 0.34} {'loss': 0.8814, 'learning_rate': 1.8608736402551526e-05, 'epoch': 0.35} {'loss': 0.728, 'learning_rate': 1.8608569835323918e-05, 'epoch': 0.35} {'loss': 0.8608, 'learning_rate': 1.860840325887145e-05, 'epoch': 0.35} {'loss': 0.87, 'learning_rate': 1.86082366731943e-05, 'epoch': 0.35} {'loss': 0.9271, 'learning_rate': 1.8608070078292648e-05, 'epoch': 0.35} {'loss': 0.6601, 'learning_rate': 1.8607903474166672e-05, 'epoch': 0.35} {'loss': 0.7462, 'learning_rate': 1.8607736860816548e-05, 'epoch': 0.35} {'loss': 0.8893, 'learning_rate': 1.8607570238242463e-05, 'epoch': 0.35} {'loss': 0.9638, 'learning_rate': 1.8607403606444584e-05, 'epoch': 0.35} {'loss': 0.9467, 'learning_rate': 1.86072369654231e-05, 'epoch': 0.35} {'loss': 0.8948, 'learning_rate': 1.860707031517818e-05, 'epoch': 0.35} {'loss': 0.9122, 'learning_rate': 1.860690365571001e-05, 'epoch': 0.35} {'loss': 0.6526, 'learning_rate': 1.8606736987018767e-05, 'epoch': 0.35} {'loss': 0.647, 'learning_rate': 1.8606570309104627e-05, 'epoch': 0.35} {'loss': 0.8623, 'learning_rate': 1.860640362196777e-05, 'epoch': 0.35} {'loss': 0.8157, 'learning_rate': 1.8606236925608372e-05, 'epoch': 0.35} {'loss': 0.6716, 'learning_rate': 1.8606070220026616e-05, 'epoch': 0.35} {'loss': 0.979, 'learning_rate': 1.860590350522268e-05, 'epoch': 0.35} {'loss': 0.9313, 'learning_rate': 1.8605736781196744e-05, 'epoch': 0.35} {'loss': 0.9864, 'learning_rate': 1.860557004794898e-05, 'epoch': 0.35} {'loss': 0.9696, 'learning_rate': 1.8605403305479574e-05, 'epoch': 0.35} {'loss': 0.8331, 'learning_rate': 1.8605236553788702e-05, 'epoch': 0.35} {'loss': 0.9872, 'learning_rate': 1.860506979287654e-05, 'epoch': 0.35} {'loss': 0.8852, 'learning_rate': 1.8604903022743272e-05, 'epoch': 0.35} {'loss': 0.8604, 'learning_rate': 1.8604736243389073e-05, 'epoch': 0.35} {'loss': 0.8641, 'learning_rate': 1.8604569454814117e-05, 'epoch': 0.35} {'loss': 0.904, 'learning_rate': 1.8604402657018595e-05, 'epoch': 0.35} {'loss': 0.9021, 'learning_rate': 1.8604235850002675e-05, 'epoch': 0.35} {'loss': 0.7943, 'learning_rate': 1.8604069033766544e-05, 'epoch': 0.35} {'loss': 0.9499, 'learning_rate': 1.860390220831037e-05, 'epoch': 0.35} {'loss': 0.9432, 'learning_rate': 1.8603735373634343e-05, 'epoch': 0.35} {'loss': 0.9004, 'learning_rate': 1.8603568529738635e-05, 'epoch': 0.35} {'loss': 0.9054, 'learning_rate': 1.860340167662343e-05, 'epoch': 0.35} {'loss': 0.6892, 'learning_rate': 1.86032348142889e-05, 'epoch': 0.35} {'loss': 0.6817, 'learning_rate': 1.860306794273523e-05, 'epoch': 0.35} {'loss': 0.885, 'learning_rate': 1.8602901061962595e-05, 'epoch': 0.35} {'loss': 0.8435, 'learning_rate': 1.8602734171971175e-05, 'epoch': 0.35} {'loss': 0.7956, 'learning_rate': 1.860256727276115e-05, 'epoch': 0.35} {'loss': 0.9246, 'learning_rate': 1.8602400364332696e-05, 'epoch': 0.35} {'loss': 0.9575, 'learning_rate': 1.8602233446685996e-05, 'epoch': 0.35} {'loss': 0.8609, 'learning_rate': 1.8602066519821226e-05, 'epoch': 0.35} {'loss': 0.7904, 'learning_rate': 1.8601899583738562e-05, 'epoch': 0.35} {'loss': 1.0469, 'learning_rate': 1.8601732638438185e-05, 'epoch': 0.35} {'loss': 1.0159, 'learning_rate': 1.8601565683920283e-05, 'epoch': 0.35} {'loss': 0.9819, 'learning_rate': 1.8601398720185022e-05, 'epoch': 0.35} {'loss': 0.9642, 'learning_rate': 1.8601231747232583e-05, 'epoch': 0.35} {'loss': 0.814, 'learning_rate': 1.8601064765063155e-05, 'epoch': 0.35} {'loss': 1.0464, 'learning_rate': 1.8600897773676904e-05, 'epoch': 0.35} {'loss': 0.9144, 'learning_rate': 1.860073077307402e-05, 'epoch': 0.35} {'loss': 0.8802, 'learning_rate': 1.860056376325467e-05, 'epoch': 0.35} {'loss': 0.7896, 'learning_rate': 1.8600396744219043e-05, 'epoch': 0.35} {'loss': 0.8887, 'learning_rate': 1.8600229715967316e-05, 'epoch': 0.35} {'loss': 1.1031, 'learning_rate': 1.8600062678499667e-05, 'epoch': 0.35} {'loss': 0.871, 'learning_rate': 1.8599895631816272e-05, 'epoch': 0.35} {'loss': 0.8036, 'learning_rate': 1.8599728575917315e-05, 'epoch': 0.35} {'loss': 0.7946, 'learning_rate': 1.859956151080297e-05, 'epoch': 0.35} {'loss': 1.0945, 'learning_rate': 1.859939443647342e-05, 'epoch': 0.35} {'loss': 0.9037, 'learning_rate': 1.8599227352928844e-05, 'epoch': 0.35} {'loss': 1.0352, 'learning_rate': 1.8599060260169416e-05, 'epoch': 0.35} {'loss': 0.8674, 'learning_rate': 1.8598893158195322e-05, 'epoch': 0.35} {'loss': 0.9597, 'learning_rate': 1.859872604700674e-05, 'epoch': 0.35} {'loss': 0.8935, 'learning_rate': 1.8598558926603846e-05, 'epoch': 0.35} {'loss': 0.855, 'learning_rate': 1.8598391796986815e-05, 'epoch': 0.35} {'loss': 0.9488, 'learning_rate': 1.8598224658155835e-05, 'epoch': 0.35} {'loss': 1.013, 'learning_rate': 1.859805751011108e-05, 'epoch': 0.35} {'loss': 0.9009, 'learning_rate': 1.8597890352852733e-05, 'epoch': 0.35} {'loss': 0.8875, 'learning_rate': 1.8597723186380966e-05, 'epoch': 0.35} {'loss': 0.7479, 'learning_rate': 1.859755601069597e-05, 'epoch': 0.35} {'loss': 0.9757, 'learning_rate': 1.859738882579791e-05, 'epoch': 0.35} {'loss': 0.6584, 'learning_rate': 1.8597221631686973e-05, 'epoch': 0.35} {'loss': 0.8544, 'learning_rate': 1.8597054428363338e-05, 'epoch': 0.35} {'loss': 0.829, 'learning_rate': 1.8596887215827182e-05, 'epoch': 0.35} {'loss': 0.7621, 'learning_rate': 1.8596719994078686e-05, 'epoch': 0.35} {'loss': 0.9538, 'learning_rate': 1.859655276311803e-05, 'epoch': 0.35} {'loss': 0.9922, 'learning_rate': 1.859638552294539e-05, 'epoch': 0.35} {'loss': 0.9223, 'learning_rate': 1.859621827356095e-05, 'epoch': 0.35} {'loss': 0.8021, 'learning_rate': 1.8596051014964886e-05, 'epoch': 0.35} {'loss': 1.0382, 'learning_rate': 1.8595883747157374e-05, 'epoch': 0.35} {'loss': 0.6919, 'learning_rate': 1.85957164701386e-05, 'epoch': 0.35} {'loss': 0.7555, 'learning_rate': 1.8595549183908738e-05, 'epoch': 0.35} {'loss': 0.8865, 'learning_rate': 1.8595381888467966e-05, 'epoch': 0.35} {'loss': 0.8863, 'learning_rate': 1.8595214583816476e-05, 'epoch': 0.35} {'loss': 0.7593, 'learning_rate': 1.859504726995443e-05, 'epoch': 0.35} {'loss': 0.8997, 'learning_rate': 1.8594879946882017e-05, 'epoch': 0.35} {'loss': 0.8848, 'learning_rate': 1.8594712614599415e-05, 'epoch': 0.35} {'loss': 0.9201, 'learning_rate': 1.85945452731068e-05, 'epoch': 0.35} {'loss': 0.697, 'learning_rate': 1.8594377922404358e-05, 'epoch': 0.35} {'loss': 0.663, 'learning_rate': 1.8594210562492262e-05, 'epoch': 0.35} {'loss': 0.8647, 'learning_rate': 1.8594043193370696e-05, 'epoch': 0.35} {'loss': 0.8841, 'learning_rate': 1.8593875815039835e-05, 'epoch': 0.35} {'loss': 0.9804, 'learning_rate': 1.8593708427499863e-05, 'epoch': 0.35} {'loss': 0.7438, 'learning_rate': 1.859354103075095e-05, 'epoch': 0.35} {'loss': 1.0199, 'learning_rate': 1.859337362479329e-05, 'epoch': 0.35} {'loss': 0.746, 'learning_rate': 1.8593206209627054e-05, 'epoch': 0.35} {'loss': 1.029, 'learning_rate': 1.8593038785252418e-05, 'epoch': 0.35} {'loss': 1.0235, 'learning_rate': 1.8592871351669567e-05, 'epoch': 0.35} {'loss': 0.9096, 'learning_rate': 1.8592703908878676e-05, 'epoch': 0.35} {'loss': 1.0444, 'learning_rate': 1.8592536456879933e-05, 'epoch': 0.35} {'loss': 0.8047, 'learning_rate': 1.8592368995673505e-05, 'epoch': 0.35} {'loss': 0.9196, 'learning_rate': 1.859220152525958e-05, 'epoch': 0.35} {'loss': 0.7589, 'learning_rate': 1.8592034045638342e-05, 'epoch': 0.35} {'loss': 0.78, 'learning_rate': 1.8591866556809957e-05, 'epoch': 0.35} {'loss': 0.8423, 'learning_rate': 1.8591699058774614e-05, 'epoch': 0.35} {'loss': 0.7337, 'learning_rate': 1.859153155153249e-05, 'epoch': 0.35} {'loss': 0.9444, 'learning_rate': 1.8591364035083767e-05, 'epoch': 0.35} {'loss': 0.7229, 'learning_rate': 1.8591196509428618e-05, 'epoch': 0.35} {'loss': 0.9796, 'learning_rate': 1.8591028974567227e-05, 'epoch': 0.35} {'loss': 0.8574, 'learning_rate': 1.8590861430499774e-05, 'epoch': 0.35} {'loss': 0.8526, 'learning_rate': 1.859069387722644e-05, 'epoch': 0.35} {'loss': 0.8291, 'learning_rate': 1.8590526314747396e-05, 'epoch': 0.35} {'loss': 0.8842, 'learning_rate': 1.859035874306283e-05, 'epoch': 0.35} {'loss': 0.8269, 'learning_rate': 1.8590191162172924e-05, 'epoch': 0.35} {'loss': 0.8538, 'learning_rate': 1.8590023572077846e-05, 'epoch': 0.35} {'loss': 0.963, 'learning_rate': 1.8589855972777787e-05, 'epoch': 0.35} {'loss': 0.9583, 'learning_rate': 1.8589688364272922e-05, 'epoch': 0.35} {'loss': 0.7868, 'learning_rate': 1.858952074656343e-05, 'epoch': 0.35} {'loss': 1.057, 'learning_rate': 1.858935311964949e-05, 'epoch': 0.35} {'loss': 0.7454, 'learning_rate': 1.8589185483531286e-05, 'epoch': 0.35} {'loss': 0.8637, 'learning_rate': 1.858901783820899e-05, 'epoch': 0.35} {'loss': 0.7195, 'learning_rate': 1.858885018368279e-05, 'epoch': 0.35} {'loss': 0.8488, 'learning_rate': 1.858868251995286e-05, 'epoch': 0.35} {'loss': 0.9532, 'learning_rate': 1.858851484701938e-05, 'epoch': 0.35} {'loss': 0.8917, 'learning_rate': 1.8588347164882534e-05, 'epoch': 0.35} {'loss': 0.8352, 'learning_rate': 1.85881794735425e-05, 'epoch': 0.35} {'loss': 0.9493, 'learning_rate': 1.858801177299945e-05, 'epoch': 0.35} {'loss': 0.7617, 'learning_rate': 1.8587844063253577e-05, 'epoch': 0.35} {'loss': 0.922, 'learning_rate': 1.858767634430505e-05, 'epoch': 0.35} {'loss': 1.0388, 'learning_rate': 1.8587508616154056e-05, 'epoch': 0.35} {'loss': 0.8988, 'learning_rate': 1.858734087880077e-05, 'epoch': 0.35} {'loss': 0.7822, 'learning_rate': 1.8587173132245374e-05, 'epoch': 0.35} {'loss': 0.8437, 'learning_rate': 1.8587005376488046e-05, 'epoch': 0.35} {'loss': 0.946, 'learning_rate': 1.8586837611528966e-05, 'epoch': 0.35} {'loss': 0.857, 'learning_rate': 1.8586669837368316e-05, 'epoch': 0.35} {'loss': 0.8117, 'learning_rate': 1.8586502054006273e-05, 'epoch': 0.35} {'loss': 0.9912, 'learning_rate': 1.858633426144302e-05, 'epoch': 0.35} {'loss': 0.8292, 'learning_rate': 1.858616645967873e-05, 'epoch': 0.35} {'loss': 0.8013, 'learning_rate': 1.8585998648713592e-05, 'epoch': 0.35} {'loss': 0.9308, 'learning_rate': 1.858583082854778e-05, 'epoch': 0.35} {'loss': 0.8121, 'learning_rate': 1.8585662999181478e-05, 'epoch': 0.35} {'loss': 0.8637, 'learning_rate': 1.858549516061486e-05, 'epoch': 0.35} {'loss': 0.9436, 'learning_rate': 1.858532731284811e-05, 'epoch': 0.35} {'loss': 0.8658, 'learning_rate': 1.8585159455881407e-05, 'epoch': 0.35} {'loss': 0.9397, 'learning_rate': 1.858499158971493e-05, 'epoch': 0.35} {'loss': 0.7457, 'learning_rate': 1.858482371434886e-05, 'epoch': 0.35} {'loss': 0.9143, 'learning_rate': 1.858465582978338e-05, 'epoch': 0.35} {'loss': 0.8366, 'learning_rate': 1.8584487936018663e-05, 'epoch': 0.35} {'loss': 0.9121, 'learning_rate': 1.8584320033054894e-05, 'epoch': 0.35} {'loss': 0.9286, 'learning_rate': 1.8584152120892248e-05, 'epoch': 0.35} {'loss': 0.8172, 'learning_rate': 1.858398419953091e-05, 'epoch': 0.35} {'loss': 0.9585, 'learning_rate': 1.858381626897106e-05, 'epoch': 0.35} {'loss': 0.7358, 'learning_rate': 1.8583648329212874e-05, 'epoch': 0.35} {'loss': 1.0704, 'learning_rate': 1.8583480380256537e-05, 'epoch': 0.35} {'loss': 0.7746, 'learning_rate': 1.8583312422102225e-05, 'epoch': 0.35} {'loss': 0.8536, 'learning_rate': 1.8583144454750118e-05, 'epoch': 0.35} {'loss': 0.8055, 'learning_rate': 1.8582976478200395e-05, 'epoch': 0.35} {'loss': 0.9505, 'learning_rate': 1.8582808492453242e-05, 'epoch': 0.35} {'loss': 0.9086, 'learning_rate': 1.8582640497508833e-05, 'epoch': 0.35} {'loss': 0.9151, 'learning_rate': 1.858247249336735e-05, 'epoch': 0.35} {'loss': 0.9291, 'learning_rate': 1.858230448002897e-05, 'epoch': 0.35} {'loss': 0.9262, 'learning_rate': 1.858213645749388e-05, 'epoch': 0.35} {'loss': 0.8631, 'learning_rate': 1.8581968425762258e-05, 'epoch': 0.35} {'loss': 0.8167, 'learning_rate': 1.858180038483428e-05, 'epoch': 0.35} {'loss': 0.9623, 'learning_rate': 1.8581632334710127e-05, 'epoch': 0.35} {'loss': 0.8445, 'learning_rate': 1.858146427538998e-05, 'epoch': 0.35} {'loss': 0.9082, 'learning_rate': 1.8581296206874025e-05, 'epoch': 0.35} {'loss': 0.8461, 'learning_rate': 1.8581128129162432e-05, 'epoch': 0.35} {'loss': 0.8092, 'learning_rate': 1.8580960042255385e-05, 'epoch': 0.35} {'loss': 0.8708, 'learning_rate': 1.8580791946153067e-05, 'epoch': 0.35} {'loss': 1.0831, 'learning_rate': 1.8580623840855657e-05, 'epoch': 0.35} {'loss': 0.7745, 'learning_rate': 1.8580455726363332e-05, 'epoch': 0.35} {'loss': 0.9183, 'learning_rate': 1.858028760267627e-05, 'epoch': 0.35} {'loss': 0.8469, 'learning_rate': 1.8580119469794665e-05, 'epoch': 0.35} {'loss': 0.9596, 'learning_rate': 1.857995132771868e-05, 'epoch': 0.35} {'loss': 0.7442, 'learning_rate': 1.8579783176448508e-05, 'epoch': 0.35} {'loss': 0.8737, 'learning_rate': 1.8579615015984317e-05, 'epoch': 0.35} {'loss': 0.7423, 'learning_rate': 1.85794468463263e-05, 'epoch': 0.35} {'loss': 0.9703, 'learning_rate': 1.857927866747463e-05, 'epoch': 0.35} {'loss': 0.8843, 'learning_rate': 1.8579110479429488e-05, 'epoch': 0.35} {'loss': 0.9751, 'learning_rate': 1.8578942282191057e-05, 'epoch': 0.35} {'loss': 0.7616, 'learning_rate': 1.8578774075759512e-05, 'epoch': 0.35} {'loss': 0.8517, 'learning_rate': 1.8578605860135038e-05, 'epoch': 0.35} {'loss': 0.8665, 'learning_rate': 1.8578437635317814e-05, 'epoch': 0.35} {'loss': 1.0216, 'learning_rate': 1.857826940130802e-05, 'epoch': 0.35} {'loss': 0.8833, 'learning_rate': 1.8578101158105835e-05, 'epoch': 0.35} {'loss': 0.8621, 'learning_rate': 1.857793290571144e-05, 'epoch': 0.35} {'loss': 0.7825, 'learning_rate': 1.8577764644125017e-05, 'epoch': 0.35} {'loss': 0.9376, 'learning_rate': 1.857759637334674e-05, 'epoch': 0.35} {'loss': 0.9487, 'learning_rate': 1.8577428093376803e-05, 'epoch': 0.35} {'loss': 0.9238, 'learning_rate': 1.8577259804215375e-05, 'epoch': 0.35} {'loss': 0.9369, 'learning_rate': 1.8577091505862636e-05, 'epoch': 0.35} {'loss': 0.7827, 'learning_rate': 1.857692319831877e-05, 'epoch': 0.35} {'loss': 0.8258, 'learning_rate': 1.8576754881583955e-05, 'epoch': 0.35} {'loss': 0.8228, 'learning_rate': 1.8576586555658376e-05, 'epoch': 0.35} {'loss': 0.9315, 'learning_rate': 1.857641822054221e-05, 'epoch': 0.35} {'loss': 0.9334, 'learning_rate': 1.8576249876235635e-05, 'epoch': 0.35} {'loss': 0.8422, 'learning_rate': 1.857608152273884e-05, 'epoch': 0.35} {'loss': 0.8659, 'learning_rate': 1.8575913160051993e-05, 'epoch': 0.35} {'loss': 0.8807, 'learning_rate': 1.8575744788175283e-05, 'epoch': 0.35} {'loss': 0.7569, 'learning_rate': 1.8575576407108893e-05, 'epoch': 0.35} {'loss': 0.8321, 'learning_rate': 1.8575408016852995e-05, 'epoch': 0.35} {'loss': 0.836, 'learning_rate': 1.8575239617407775e-05, 'epoch': 0.35} {'loss': 0.8613, 'learning_rate': 1.857507120877341e-05, 'epoch': 0.35} {'loss': 0.8048, 'learning_rate': 1.8574902790950082e-05, 'epoch': 0.35} {'loss': 1.0313, 'learning_rate': 1.8574734363937975e-05, 'epoch': 0.35} {'loss': 0.8727, 'learning_rate': 1.857456592773726e-05, 'epoch': 0.35} {'loss': 0.8854, 'learning_rate': 1.8574397482348128e-05, 'epoch': 0.35} {'loss': 0.8696, 'learning_rate': 1.8574229027770756e-05, 'epoch': 0.35} {'loss': 0.9712, 'learning_rate': 1.8574060564005324e-05, 'epoch': 0.35} {'loss': 0.7135, 'learning_rate': 1.8573892091052007e-05, 'epoch': 0.35} {'loss': 0.9735, 'learning_rate': 1.8573723608910997e-05, 'epoch': 0.35} {'loss': 0.8465, 'learning_rate': 1.8573555117582466e-05, 'epoch': 0.35} {'loss': 0.7591, 'learning_rate': 1.8573386617066598e-05, 'epoch': 0.35} {'loss': 0.9194, 'learning_rate': 1.857321810736357e-05, 'epoch': 0.35} {'loss': 0.9471, 'learning_rate': 1.8573049588473566e-05, 'epoch': 0.35} {'loss': 0.9033, 'learning_rate': 1.8572881060396767e-05, 'epoch': 0.35} {'loss': 0.8766, 'learning_rate': 1.857271252313335e-05, 'epoch': 0.35} {'loss': 0.9495, 'learning_rate': 1.8572543976683496e-05, 'epoch': 0.35} {'loss': 0.9619, 'learning_rate': 1.8572375421047393e-05, 'epoch': 0.35} {'loss': 1.0767, 'learning_rate': 1.857220685622521e-05, 'epoch': 0.35} {'loss': 0.9981, 'learning_rate': 1.857203828221714e-05, 'epoch': 0.35} {'loss': 0.9138, 'learning_rate': 1.8571869699023355e-05, 'epoch': 0.35} {'loss': 0.8283, 'learning_rate': 1.8571701106644036e-05, 'epoch': 0.35} {'loss': 0.9774, 'learning_rate': 1.8571532505079367e-05, 'epoch': 0.35} {'loss': 0.9853, 'learning_rate': 1.8571363894329527e-05, 'epoch': 0.35} {'loss': 0.9069, 'learning_rate': 1.8571195274394696e-05, 'epoch': 0.35} {'loss': 0.8537, 'learning_rate': 1.857102664527506e-05, 'epoch': 0.35} {'loss': 0.8252, 'learning_rate': 1.857085800697079e-05, 'epoch': 0.35} {'loss': 0.8149, 'learning_rate': 1.8570689359482075e-05, 'epoch': 0.35} {'loss': 0.8477, 'learning_rate': 1.857052070280909e-05, 'epoch': 0.35} {'loss': 0.9706, 'learning_rate': 1.857035203695202e-05, 'epoch': 0.35} {'loss': 0.9644, 'learning_rate': 1.8570183361911046e-05, 'epoch': 0.35} {'loss': 1.1104, 'learning_rate': 1.8570014677686346e-05, 'epoch': 0.35} {'loss': 0.8112, 'learning_rate': 1.85698459842781e-05, 'epoch': 0.35} {'loss': 0.8021, 'learning_rate': 1.8569677281686492e-05, 'epoch': 0.35} {'loss': 0.8105, 'learning_rate': 1.8569508569911703e-05, 'epoch': 0.35} {'loss': 0.7159, 'learning_rate': 1.8569339848953908e-05, 'epoch': 0.35} {'loss': 1.0989, 'learning_rate': 1.8569171118813297e-05, 'epoch': 0.35} {'loss': 0.8924, 'learning_rate': 1.8569002379490042e-05, 'epoch': 0.35} {'loss': 0.8332, 'learning_rate': 1.856883363098433e-05, 'epoch': 0.35} {'loss': 0.9725, 'learning_rate': 1.8568664873296338e-05, 'epoch': 0.35} {'loss': 0.7237, 'learning_rate': 1.8568496106426247e-05, 'epoch': 0.35} {'loss': 1.0138, 'learning_rate': 1.856832733037424e-05, 'epoch': 0.35} {'loss': 0.8216, 'learning_rate': 1.85681585451405e-05, 'epoch': 0.35} {'loss': 0.8884, 'learning_rate': 1.8567989750725202e-05, 'epoch': 0.35} {'loss': 0.8016, 'learning_rate': 1.8567820947128528e-05, 'epoch': 0.35} {'loss': 0.6711, 'learning_rate': 1.8567652134350664e-05, 'epoch': 0.35} {'loss': 0.9606, 'learning_rate': 1.8567483312391787e-05, 'epoch': 0.35} {'loss': 0.9676, 'learning_rate': 1.8567314481252078e-05, 'epoch': 0.35} {'loss': 0.7636, 'learning_rate': 1.8567145640931715e-05, 'epoch': 0.35} {'loss': 1.0317, 'learning_rate': 1.8566976791430884e-05, 'epoch': 0.35} {'loss': 0.7859, 'learning_rate': 1.8566807932749763e-05, 'epoch': 0.35} {'loss': 1.0995, 'learning_rate': 1.8566639064888537e-05, 'epoch': 0.35} {'loss': 0.7488, 'learning_rate': 1.8566470187847385e-05, 'epoch': 0.35} {'loss': 0.8446, 'learning_rate': 1.8566301301626482e-05, 'epoch': 0.35} {'loss': 0.9202, 'learning_rate': 1.856613240622602e-05, 'epoch': 0.35} {'loss': 0.8397, 'learning_rate': 1.8565963501646173e-05, 'epoch': 0.35} {'loss': 0.8586, 'learning_rate': 1.8565794587887118e-05, 'epoch': 0.35} {'loss': 1.1417, 'learning_rate': 1.856562566494904e-05, 'epoch': 0.35} {'loss': 0.8236, 'learning_rate': 1.856545673283213e-05, 'epoch': 0.35} {'loss': 0.8231, 'learning_rate': 1.8565287791536556e-05, 'epoch': 0.35} {'loss': 1.007, 'learning_rate': 1.85651188410625e-05, 'epoch': 0.35} {'loss': 1.0036, 'learning_rate': 1.856494988141015e-05, 'epoch': 0.35} {'loss': 0.7871, 'learning_rate': 1.856478091257968e-05, 'epoch': 0.35} {'loss': 0.8926, 'learning_rate': 1.8564611934571273e-05, 'epoch': 0.35} {'loss': 0.973, 'learning_rate': 1.8564442947385118e-05, 'epoch': 0.35} {'loss': 0.8726, 'learning_rate': 1.8564273951021384e-05, 'epoch': 0.35} {'loss': 0.9586, 'learning_rate': 1.8564104945480258e-05, 'epoch': 0.35} {'loss': 0.8243, 'learning_rate': 1.856393593076192e-05, 'epoch': 0.35} {'loss': 0.9584, 'learning_rate': 1.8563766906866555e-05, 'epoch': 0.35} {'loss': 0.605, 'learning_rate': 1.8563597873794338e-05, 'epoch': 0.35} {'loss': 0.7893, 'learning_rate': 1.8563428831545454e-05, 'epoch': 0.35} {'loss': 1.0059, 'learning_rate': 1.8563259780120086e-05, 'epoch': 0.35} {'loss': 0.7138, 'learning_rate': 1.8563090719518406e-05, 'epoch': 0.35} {'loss': 1.054, 'learning_rate': 1.8562921649740606e-05, 'epoch': 0.35} {'loss': 0.8973, 'learning_rate': 1.8562752570786863e-05, 'epoch': 0.35} {'loss': 0.8551, 'learning_rate': 1.8562583482657355e-05, 'epoch': 0.35} {'loss': 0.9414, 'learning_rate': 1.8562414385352268e-05, 'epoch': 0.35} {'loss': 0.9666, 'learning_rate': 1.8562245278871777e-05, 'epoch': 0.35} {'loss': 0.9331, 'learning_rate': 1.856207616321607e-05, 'epoch': 0.35} {'loss': 0.8271, 'learning_rate': 1.8561907038385326e-05, 'epoch': 0.35} {'loss': 0.7998, 'learning_rate': 1.8561737904379727e-05, 'epoch': 0.35} {'loss': 0.9824, 'learning_rate': 1.856156876119945e-05, 'epoch': 0.35} {'loss': 0.8383, 'learning_rate': 1.8561399608844683e-05, 'epoch': 0.35} {'loss': 0.7186, 'learning_rate': 1.8561230447315602e-05, 'epoch': 0.35} {'loss': 0.8045, 'learning_rate': 1.856106127661239e-05, 'epoch': 0.35} {'loss': 0.9971, 'learning_rate': 1.856089209673523e-05, 'epoch': 0.35} {'loss': 0.8281, 'learning_rate': 1.85607229076843e-05, 'epoch': 0.35} {'loss': 0.7684, 'learning_rate': 1.856055370945978e-05, 'epoch': 0.35} {'loss': 0.8737, 'learning_rate': 1.8560384502061858e-05, 'epoch': 0.35} {'loss': 0.9154, 'learning_rate': 1.856021528549071e-05, 'epoch': 0.35} {'loss': 0.8562, 'learning_rate': 1.856004605974652e-05, 'epoch': 0.35} {'loss': 0.9032, 'learning_rate': 1.8559876824829465e-05, 'epoch': 0.35} {'loss': 0.901, 'learning_rate': 1.855970758073973e-05, 'epoch': 0.35} {'loss': 0.7395, 'learning_rate': 1.8559538327477498e-05, 'epoch': 0.35} {'loss': 0.9354, 'learning_rate': 1.8559369065042948e-05, 'epoch': 0.35} {'loss': 0.864, 'learning_rate': 1.855919979343626e-05, 'epoch': 0.35} {'loss': 0.7729, 'learning_rate': 1.8559030512657616e-05, 'epoch': 0.35} {'loss': 0.8405, 'learning_rate': 1.8558861222707198e-05, 'epoch': 0.35} {'loss': 0.9589, 'learning_rate': 1.8558691923585194e-05, 'epoch': 0.35} {'loss': 0.8346, 'learning_rate': 1.8558522615291772e-05, 'epoch': 0.35} {'loss': 0.8782, 'learning_rate': 1.8558353297827125e-05, 'epoch': 0.35} {'loss': 0.761, 'learning_rate': 1.8558183971191424e-05, 'epoch': 0.35} {'loss': 1.0089, 'learning_rate': 1.855801463538486e-05, 'epoch': 0.35} {'loss': 0.9643, 'learning_rate': 1.8557845290407614e-05, 'epoch': 0.35} {'loss': 0.9584, 'learning_rate': 1.855767593625986e-05, 'epoch': 0.35} {'loss': 0.9477, 'learning_rate': 1.855750657294179e-05, 'epoch': 0.35} {'loss': 0.9363, 'learning_rate': 1.855733720045357e-05, 'epoch': 0.35} {'loss': 0.878, 'learning_rate': 1.8557167818795395e-05, 'epoch': 0.35} {'loss': 0.81, 'learning_rate': 1.8556998427967445e-05, 'epoch': 0.35} {'loss': 0.9146, 'learning_rate': 1.8556829027969896e-05, 'epoch': 0.35} {'loss': 0.8342, 'learning_rate': 1.8556659618802934e-05, 'epoch': 0.35} {'loss': 0.8297, 'learning_rate': 1.855649020046674e-05, 'epoch': 0.35} {'loss': 0.8969, 'learning_rate': 1.855632077296149e-05, 'epoch': 0.35} {'loss': 0.8458, 'learning_rate': 1.8556151336287374e-05, 'epoch': 0.35} {'loss': 0.9462, 'learning_rate': 1.855598189044457e-05, 'epoch': 0.35} {'loss': 0.8438, 'learning_rate': 1.8555812435433257e-05, 'epoch': 0.35} {'loss': 0.9747, 'learning_rate': 1.855564297125362e-05, 'epoch': 0.35} {'loss': 0.9006, 'learning_rate': 1.855547349790584e-05, 'epoch': 0.35} {'loss': 0.9955, 'learning_rate': 1.8555304015390093e-05, 'epoch': 0.35} {'loss': 1.043, 'learning_rate': 1.855513452370657e-05, 'epoch': 0.35} {'loss': 0.911, 'learning_rate': 1.8554965022855448e-05, 'epoch': 0.35} {'loss': 0.6061, 'learning_rate': 1.8554795512836908e-05, 'epoch': 0.35} {'loss': 0.9494, 'learning_rate': 1.8554625993651134e-05, 'epoch': 0.35} {'loss': 0.7741, 'learning_rate': 1.8554456465298305e-05, 'epoch': 0.35} {'loss': 0.6888, 'learning_rate': 1.8554286927778604e-05, 'epoch': 0.35} {'loss': 1.0064, 'learning_rate': 1.855411738109221e-05, 'epoch': 0.35} {'loss': 0.9359, 'learning_rate': 1.8553947825239312e-05, 'epoch': 0.35} {'loss': 0.976, 'learning_rate': 1.8553778260220083e-05, 'epoch': 0.35} {'loss': 0.956, 'learning_rate': 1.855360868603471e-05, 'epoch': 0.35} {'loss': 0.8688, 'learning_rate': 1.8553439102683372e-05, 'epoch': 0.35} {'loss': 0.9271, 'learning_rate': 1.8553269510166253e-05, 'epoch': 0.35} {'loss': 0.8531, 'learning_rate': 1.8553099908483535e-05, 'epoch': 0.35} {'loss': 0.8898, 'learning_rate': 1.85529302976354e-05, 'epoch': 0.35} {'loss': 0.9149, 'learning_rate': 1.8552760677622025e-05, 'epoch': 0.35} {'loss': 0.833, 'learning_rate': 1.8552591048443594e-05, 'epoch': 0.35} {'loss': 1.0494, 'learning_rate': 1.855242141010029e-05, 'epoch': 0.35} {'loss': 1.0054, 'learning_rate': 1.85522517625923e-05, 'epoch': 0.35} {'loss': 0.8562, 'learning_rate': 1.8552082105919792e-05, 'epoch': 0.35} {'loss': 0.9863, 'learning_rate': 1.855191244008296e-05, 'epoch': 0.35} {'loss': 0.7887, 'learning_rate': 1.8551742765081987e-05, 'epoch': 0.35} {'loss': 1.0416, 'learning_rate': 1.8551573080917044e-05, 'epoch': 0.35} {'loss': 1.0047, 'learning_rate': 1.855140338758832e-05, 'epoch': 0.35} {'loss': 0.9136, 'learning_rate': 1.8551233685095992e-05, 'epoch': 0.35} {'loss': 0.9752, 'learning_rate': 1.855106397344025e-05, 'epoch': 0.35} {'loss': 0.8704, 'learning_rate': 1.855089425262127e-05, 'epoch': 0.35} {'loss': 0.8352, 'learning_rate': 1.8550724522639238e-05, 'epoch': 0.35} {'loss': 0.9503, 'learning_rate': 1.8550554783494328e-05, 'epoch': 0.35} {'loss': 0.8706, 'learning_rate': 1.8550385035186728e-05, 'epoch': 0.35} {'loss': 0.7782, 'learning_rate': 1.855021527771662e-05, 'epoch': 0.35} {'loss': 0.9422, 'learning_rate': 1.8550045511084183e-05, 'epoch': 0.35} {'loss': 1.0297, 'learning_rate': 1.85498757352896e-05, 'epoch': 0.35} {'loss': 0.966, 'learning_rate': 1.8549705950333057e-05, 'epoch': 0.35} {'loss': 0.9236, 'learning_rate': 1.854953615621473e-05, 'epoch': 0.35} {'loss': 0.9066, 'learning_rate': 1.85493663529348e-05, 'epoch': 0.35} {'loss': 0.6837, 'learning_rate': 1.854919654049346e-05, 'epoch': 0.35} {'loss': 0.9452, 'learning_rate': 1.8549026718890878e-05, 'epoch': 0.35} {'loss': 1.0654, 'learning_rate': 1.8548856888127246e-05, 'epoch': 0.35} {'loss': 0.8207, 'learning_rate': 1.854868704820274e-05, 'epoch': 0.35} {'loss': 0.8401, 'learning_rate': 1.8548517199117548e-05, 'epoch': 0.35} {'loss': 0.8901, 'learning_rate': 1.8548347340871844e-05, 'epoch': 0.35} {'loss': 0.934, 'learning_rate': 1.8548177473465814e-05, 'epoch': 0.35} {'loss': 0.894, 'learning_rate': 1.8548007596899644e-05, 'epoch': 0.35} {'loss': 0.8514, 'learning_rate': 1.8547837711173508e-05, 'epoch': 0.35} {'loss': 1.0877, 'learning_rate': 1.8547667816287594e-05, 'epoch': 0.35} {'loss': 0.984, 'learning_rate': 1.8547497912242084e-05, 'epoch': 0.35} {'loss': 0.9564, 'learning_rate': 1.854732799903716e-05, 'epoch': 0.35} {'loss': 0.8239, 'learning_rate': 1.8547158076672998e-05, 'epoch': 0.35} {'loss': 0.8221, 'learning_rate': 1.8546988145149786e-05, 'epoch': 0.35} {'loss': 0.9741, 'learning_rate': 1.8546818204467708e-05, 'epoch': 0.35} {'loss': 0.8287, 'learning_rate': 1.854664825462694e-05, 'epoch': 0.35} {'loss': 1.0688, 'learning_rate': 1.8546478295627667e-05, 'epoch': 0.35} {'loss': 0.8382, 'learning_rate': 1.8546308327470074e-05, 'epoch': 0.35} {'loss': 0.8315, 'learning_rate': 1.8546138350154336e-05, 'epoch': 0.35} {'loss': 0.9464, 'learning_rate': 1.854596836368064e-05, 'epoch': 0.35} {'loss': 0.8835, 'learning_rate': 1.8545798368049174e-05, 'epoch': 0.35} {'loss': 0.9779, 'learning_rate': 1.8545628363260106e-05, 'epoch': 0.35} {'loss': 0.9965, 'learning_rate': 1.854545834931363e-05, 'epoch': 0.35} {'loss': 0.7778, 'learning_rate': 1.8545288326209922e-05, 'epoch': 0.35} {'loss': 0.7907, 'learning_rate': 1.8545118293949166e-05, 'epoch': 0.35} {'loss': 0.8975, 'learning_rate': 1.8544948252531547e-05, 'epoch': 0.35} {'loss': 0.9432, 'learning_rate': 1.8544778201957245e-05, 'epoch': 0.35} {'loss': 1.08, 'learning_rate': 1.8544608142226438e-05, 'epoch': 0.35} {'loss': 0.8635, 'learning_rate': 1.8544438073339313e-05, 'epoch': 0.35} {'loss': 0.8194, 'learning_rate': 1.8544267995296054e-05, 'epoch': 0.35} {'loss': 0.8981, 'learning_rate': 1.854409790809684e-05, 'epoch': 0.35} {'loss': 0.8588, 'learning_rate': 1.8543927811741852e-05, 'epoch': 0.35} {'loss': 0.8647, 'learning_rate': 1.8543757706231276e-05, 'epoch': 0.35} {'loss': 0.8885, 'learning_rate': 1.8543587591565294e-05, 'epoch': 0.35} {'loss': 0.8473, 'learning_rate': 1.8543417467744085e-05, 'epoch': 0.35} {'loss': 0.8322, 'learning_rate': 1.8543247334767832e-05, 'epoch': 0.35} {'loss': 0.8079, 'learning_rate': 1.854307719263672e-05, 'epoch': 0.35} {'loss': 0.8055, 'learning_rate': 1.854290704135093e-05, 'epoch': 0.35} {'loss': 0.8811, 'learning_rate': 1.8542736880910643e-05, 'epoch': 0.35} {'loss': 0.8506, 'learning_rate': 1.8542566711316044e-05, 'epoch': 0.35} {'loss': 0.9839, 'learning_rate': 1.8542396532567313e-05, 'epoch': 0.35} {'loss': 0.9513, 'learning_rate': 1.854222634466463e-05, 'epoch': 0.35} {'loss': 0.8653, 'learning_rate': 1.8542056147608186e-05, 'epoch': 0.35} {'loss': 0.9193, 'learning_rate': 1.8541885941398155e-05, 'epoch': 0.35} {'loss': 0.982, 'learning_rate': 1.854171572603472e-05, 'epoch': 0.35} {'loss': 0.8194, 'learning_rate': 1.854154550151807e-05, 'epoch': 0.35} {'loss': 0.8996, 'learning_rate': 1.854137526784838e-05, 'epoch': 0.35} {'loss': 0.7952, 'learning_rate': 1.8541205025025837e-05, 'epoch': 0.35} {'loss': 0.7462, 'learning_rate': 1.854103477305062e-05, 'epoch': 0.35} {'loss': 0.894, 'learning_rate': 1.8540864511922914e-05, 'epoch': 0.35} {'loss': 0.9725, 'learning_rate': 1.85406942416429e-05, 'epoch': 0.35} {'loss': 1.0424, 'learning_rate': 1.8540523962210766e-05, 'epoch': 0.35} {'loss': 0.8882, 'learning_rate': 1.8540353673626686e-05, 'epoch': 0.35} {'loss': 0.7419, 'learning_rate': 1.854018337589085e-05, 'epoch': 0.35} {'loss': 0.8415, 'learning_rate': 1.854001306900343e-05, 'epoch': 0.35} {'loss': 0.794, 'learning_rate': 1.853984275296462e-05, 'epoch': 0.35} {'loss': 0.8417, 'learning_rate': 1.8539672427774594e-05, 'epoch': 0.35} {'loss': 1.0094, 'learning_rate': 1.853950209343354e-05, 'epoch': 0.35} {'loss': 0.7677, 'learning_rate': 1.8539331749941642e-05, 'epoch': 0.35} {'loss': 1.011, 'learning_rate': 1.8539161397299076e-05, 'epoch': 0.35} {'loss': 0.9309, 'learning_rate': 1.853899103550603e-05, 'epoch': 0.35} {'loss': 0.7557, 'learning_rate': 1.853882066456268e-05, 'epoch': 0.35} {'loss': 0.8603, 'learning_rate': 1.8538650284469218e-05, 'epoch': 0.35} {'loss': 0.9715, 'learning_rate': 1.853847989522582e-05, 'epoch': 0.35} {'loss': 0.8979, 'learning_rate': 1.853830949683267e-05, 'epoch': 0.35} {'loss': 0.8893, 'learning_rate': 1.853813908928995e-05, 'epoch': 0.35} {'loss': 0.7337, 'learning_rate': 1.8537968672597845e-05, 'epoch': 0.35} {'loss': 0.9416, 'learning_rate': 1.8537798246756536e-05, 'epoch': 0.35} {'loss': 0.7789, 'learning_rate': 1.8537627811766203e-05, 'epoch': 0.35} {'loss': 0.8833, 'learning_rate': 1.8537457367627033e-05, 'epoch': 0.35} {'loss': 0.9248, 'learning_rate': 1.8537286914339206e-05, 'epoch': 0.35} {'loss': 0.8855, 'learning_rate': 1.8537116451902905e-05, 'epoch': 0.35} {'loss': 0.9701, 'learning_rate': 1.8536945980318313e-05, 'epoch': 0.35} {'loss': 0.8816, 'learning_rate': 1.8536775499585616e-05, 'epoch': 0.35} {'loss': 0.8818, 'learning_rate': 1.853660500970499e-05, 'epoch': 0.35} {'loss': 0.798, 'learning_rate': 1.8536434510676625e-05, 'epoch': 0.35} {'loss': 0.875, 'learning_rate': 1.8536264002500698e-05, 'epoch': 0.35} {'loss': 1.1436, 'learning_rate': 1.8536093485177394e-05, 'epoch': 0.35} {'loss': 1.0897, 'learning_rate': 1.8535922958706893e-05, 'epoch': 0.35} {'loss': 0.7575, 'learning_rate': 1.853575242308938e-05, 'epoch': 0.35} {'loss': 0.7783, 'learning_rate': 1.8535581878325042e-05, 'epoch': 0.35} {'loss': 0.8972, 'learning_rate': 1.8535411324414055e-05, 'epoch': 0.35} {'loss': 0.9705, 'learning_rate': 1.853524076135661e-05, 'epoch': 0.35} {'loss': 0.7502, 'learning_rate': 1.8535070189152875e-05, 'epoch': 0.35} {'loss': 0.9184, 'learning_rate': 1.8534899607803045e-05, 'epoch': 0.35} {'loss': 0.8464, 'learning_rate': 1.8534729017307302e-05, 'epoch': 0.35} {'loss': 0.8656, 'learning_rate': 1.8534558417665826e-05, 'epoch': 0.35} {'loss': 0.8621, 'learning_rate': 1.85343878088788e-05, 'epoch': 0.35} {'loss': 0.8602, 'learning_rate': 1.8534217190946406e-05, 'epoch': 0.35} {'loss': 0.826, 'learning_rate': 1.8534046563868832e-05, 'epoch': 0.35} {'loss': 0.9457, 'learning_rate': 1.8533875927646252e-05, 'epoch': 0.35} {'loss': 0.9887, 'learning_rate': 1.8533705282278855e-05, 'epoch': 0.35} {'loss': 0.9538, 'learning_rate': 1.853353462776682e-05, 'epoch': 0.35} {'loss': 0.8712, 'learning_rate': 1.853336396411034e-05, 'epoch': 0.35} {'loss': 0.8136, 'learning_rate': 1.8533193291309587e-05, 'epoch': 0.35} {'loss': 0.7402, 'learning_rate': 1.8533022609364742e-05, 'epoch': 0.35} {'loss': 0.7566, 'learning_rate': 1.8532851918275997e-05, 'epoch': 0.35} {'loss': 0.8825, 'learning_rate': 1.8532681218043534e-05, 'epoch': 0.35} {'loss': 0.9699, 'learning_rate': 1.853251050866753e-05, 'epoch': 0.35} {'loss': 0.8886, 'learning_rate': 1.853233979014817e-05, 'epoch': 0.35} {'loss': 0.8168, 'learning_rate': 1.8532169062485638e-05, 'epoch': 0.35} {'loss': 0.9327, 'learning_rate': 1.853199832568012e-05, 'epoch': 0.35} {'loss': 0.8038, 'learning_rate': 1.8531827579731794e-05, 'epoch': 0.35} {'loss': 0.8334, 'learning_rate': 1.8531656824640842e-05, 'epoch': 0.35} {'loss': 0.8491, 'learning_rate': 1.8531486060407454e-05, 'epoch': 0.35} {'loss': 0.9203, 'learning_rate': 1.8531315287031803e-05, 'epoch': 0.35} {'loss': 0.794, 'learning_rate': 1.8531144504514084e-05, 'epoch': 0.35} {'loss': 0.8593, 'learning_rate': 1.853097371285447e-05, 'epoch': 0.35} {'loss': 0.8225, 'learning_rate': 1.853080291205315e-05, 'epoch': 0.35} {'loss': 0.8786, 'learning_rate': 1.8530632102110302e-05, 'epoch': 0.35} {'loss': 0.8929, 'learning_rate': 1.8530461283026113e-05, 'epoch': 0.35} {'loss': 0.8926, 'learning_rate': 1.8530290454800765e-05, 'epoch': 0.35} {'loss': 0.7915, 'learning_rate': 1.853011961743444e-05, 'epoch': 0.35} {'loss': 0.911, 'learning_rate': 1.8529948770927323e-05, 'epoch': 0.35} {'loss': 0.9123, 'learning_rate': 1.8529777915279595e-05, 'epoch': 0.35} {'loss': 0.896, 'learning_rate': 1.852960705049144e-05, 'epoch': 0.35} {'loss': 1.0002, 'learning_rate': 1.8529436176563043e-05, 'epoch': 0.35} {'loss': 0.9847, 'learning_rate': 1.8529265293494585e-05, 'epoch': 0.35} {'loss': 0.8084, 'learning_rate': 1.852909440128625e-05, 'epoch': 0.35} {'loss': 0.764, 'learning_rate': 1.852892349993822e-05, 'epoch': 0.35} {'loss': 0.8075, 'learning_rate': 1.8528752589450675e-05, 'epoch': 0.35} {'loss': 0.6656, 'learning_rate': 1.8528581669823804e-05, 'epoch': 0.35} {'loss': 1.0253, 'learning_rate': 1.8528410741057793e-05, 'epoch': 0.35} {'loss': 1.0211, 'learning_rate': 1.8528239803152815e-05, 'epoch': 0.35} {'loss': 0.7733, 'learning_rate': 1.852806885610906e-05, 'epoch': 0.35} {'loss': 0.8291, 'learning_rate': 1.8527897899926707e-05, 'epoch': 0.35} {'loss': 0.8834, 'learning_rate': 1.8527726934605942e-05, 'epoch': 0.35} {'loss': 0.836, 'learning_rate': 1.852755596014695e-05, 'epoch': 0.36} {'loss': 0.8966, 'learning_rate': 1.852738497654991e-05, 'epoch': 0.36} {'loss': 1.1098, 'learning_rate': 1.8527213983815012e-05, 'epoch': 0.36} {'loss': 0.8554, 'learning_rate': 1.8527042981942428e-05, 'epoch': 0.36} {'loss': 0.8196, 'learning_rate': 1.852687197093235e-05, 'epoch': 0.36} {'loss': 0.9645, 'learning_rate': 1.8526700950784963e-05, 'epoch': 0.36} {'loss': 0.986, 'learning_rate': 1.8526529921500444e-05, 'epoch': 0.36} {'loss': 0.767, 'learning_rate': 1.8526358883078978e-05, 'epoch': 0.36} {'loss': 0.8839, 'learning_rate': 1.852618783552075e-05, 'epoch': 0.36} {'loss': 0.743, 'learning_rate': 1.852601677882594e-05, 'epoch': 0.36} {'loss': 0.8662, 'learning_rate': 1.8525845712994738e-05, 'epoch': 0.36} {'loss': 0.9096, 'learning_rate': 1.8525674638027317e-05, 'epoch': 0.36} {'loss': 0.8853, 'learning_rate': 1.8525503553923873e-05, 'epoch': 0.36} {'loss': 0.8436, 'learning_rate': 1.8525332460684575e-05, 'epoch': 0.36} {'loss': 0.8388, 'learning_rate': 1.8525161358309618e-05, 'epoch': 0.36} {'loss': 0.8394, 'learning_rate': 1.8524990246799182e-05, 'epoch': 0.36} {'loss': 0.8694, 'learning_rate': 1.8524819126153446e-05, 'epoch': 0.36} {'loss': 0.8842, 'learning_rate': 1.85246479963726e-05, 'epoch': 0.36} {'loss': 0.9607, 'learning_rate': 1.8524476857456822e-05, 'epoch': 0.36} {'loss': 0.7156, 'learning_rate': 1.8524305709406297e-05, 'epoch': 0.36} {'loss': 0.8336, 'learning_rate': 1.8524134552221213e-05, 'epoch': 0.36} {'loss': 1.025, 'learning_rate': 1.8523963385901746e-05, 'epoch': 0.36} {'loss': 0.9188, 'learning_rate': 1.8523792210448085e-05, 'epoch': 0.36} {'loss': 0.8045, 'learning_rate': 1.852362102586041e-05, 'epoch': 0.36} {'loss': 0.7687, 'learning_rate': 1.8523449832138907e-05, 'epoch': 0.36} {'loss': 0.9813, 'learning_rate': 1.8523278629283757e-05, 'epoch': 0.36} {'loss': 0.9081, 'learning_rate': 1.8523107417295147e-05, 'epoch': 0.36} {'loss': 0.7651, 'learning_rate': 1.8522936196173254e-05, 'epoch': 0.36} {'loss': 0.834, 'learning_rate': 1.8522764965918267e-05, 'epoch': 0.36} {'loss': 0.7906, 'learning_rate': 1.8522593726530373e-05, 'epoch': 0.36} {'loss': 0.7859, 'learning_rate': 1.8522422478009746e-05, 'epoch': 0.36} {'loss': 0.634, 'learning_rate': 1.8522251220356573e-05, 'epoch': 0.36} {'loss': 0.7785, 'learning_rate': 1.852207995357104e-05, 'epoch': 0.36} {'loss': 0.8601, 'learning_rate': 1.852190867765333e-05, 'epoch': 0.36} {'loss': 0.9424, 'learning_rate': 1.8521737392603624e-05, 'epoch': 0.36} {'loss': 0.7935, 'learning_rate': 1.852156609842211e-05, 'epoch': 0.36} {'loss': 0.9249, 'learning_rate': 1.8521394795108966e-05, 'epoch': 0.36} {'loss': 0.6928, 'learning_rate': 1.8521223482664382e-05, 'epoch': 0.36} {'loss': 0.7012, 'learning_rate': 1.8521052161088533e-05, 'epoch': 0.36} {'loss': 0.8177, 'learning_rate': 1.852088083038161e-05, 'epoch': 0.36} {'loss': 0.7677, 'learning_rate': 1.8520709490543795e-05, 'epoch': 0.36} {'loss': 0.8528, 'learning_rate': 1.852053814157527e-05, 'epoch': 0.36} {'loss': 0.8909, 'learning_rate': 1.8520366783476216e-05, 'epoch': 0.36} {'loss': 0.8912, 'learning_rate': 1.8520195416246826e-05, 'epoch': 0.36} {'loss': 0.957, 'learning_rate': 1.8520024039887277e-05, 'epoch': 0.36} {'loss': 0.9041, 'learning_rate': 1.851985265439775e-05, 'epoch': 0.36} {'loss': 0.8799, 'learning_rate': 1.851968125977843e-05, 'epoch': 0.36} {'loss': 0.8364, 'learning_rate': 1.851950985602951e-05, 'epoch': 0.36} {'loss': 1.0742, 'learning_rate': 1.851933844315116e-05, 'epoch': 0.36} {'loss': 0.723, 'learning_rate': 1.8519167021143572e-05, 'epoch': 0.36} {'loss': 0.9051, 'learning_rate': 1.8518995590006928e-05, 'epoch': 0.36} {'loss': 0.8831, 'learning_rate': 1.8518824149741414e-05, 'epoch': 0.36} {'loss': 0.8393, 'learning_rate': 1.8518652700347205e-05, 'epoch': 0.36} {'loss': 0.9352, 'learning_rate': 1.851848124182449e-05, 'epoch': 0.36} {'loss': 0.761, 'learning_rate': 1.851830977417346e-05, 'epoch': 0.36} {'loss': 0.7103, 'learning_rate': 1.851813829739429e-05, 'epoch': 0.36} {'loss': 0.8579, 'learning_rate': 1.8517966811487164e-05, 'epoch': 0.36} {'loss': 0.8757, 'learning_rate': 1.8517795316452272e-05, 'epoch': 0.36} {'loss': 0.8933, 'learning_rate': 1.851762381228979e-05, 'epoch': 0.36} {'loss': 1.0479, 'learning_rate': 1.8517452298999905e-05, 'epoch': 0.36} {'loss': 0.7986, 'learning_rate': 1.8517280776582803e-05, 'epoch': 0.36} {'loss': 0.9395, 'learning_rate': 1.8517109245038667e-05, 'epoch': 0.36} {'loss': 0.8967, 'learning_rate': 1.8516937704367676e-05, 'epoch': 0.36} {'loss': 0.8624, 'learning_rate': 1.8516766154570017e-05, 'epoch': 0.36} {'loss': 0.9488, 'learning_rate': 1.851659459564588e-05, 'epoch': 0.36} {'loss': 0.8536, 'learning_rate': 1.851642302759544e-05, 'epoch': 0.36} {'loss': 1.084, 'learning_rate': 1.8516251450418884e-05, 'epoch': 0.36} {'loss': 0.9499, 'learning_rate': 1.8516079864116395e-05, 'epoch': 0.36} {'loss': 0.9465, 'learning_rate': 1.851590826868816e-05, 'epoch': 0.36} {'loss': 0.8505, 'learning_rate': 1.8515736664134358e-05, 'epoch': 0.36} {'loss': 0.8131, 'learning_rate': 1.8515565050455178e-05, 'epoch': 0.36} {'loss': 0.911, 'learning_rate': 1.85153934276508e-05, 'epoch': 0.36} {'loss': 0.9726, 'learning_rate': 1.851522179572141e-05, 'epoch': 0.36} {'loss': 0.8583, 'learning_rate': 1.851505015466719e-05, 'epoch': 0.36} {'loss': 0.7831, 'learning_rate': 1.851487850448833e-05, 'epoch': 0.36} {'loss': 0.8641, 'learning_rate': 1.8514706845185003e-05, 'epoch': 0.36} {'loss': 0.7993, 'learning_rate': 1.8514535176757405e-05, 'epoch': 0.36} {'loss': 0.8837, 'learning_rate': 1.851436349920571e-05, 'epoch': 0.36} {'loss': 0.7908, 'learning_rate': 1.8514191812530105e-05, 'epoch': 0.36} {'loss': 1.0198, 'learning_rate': 1.8514020116730777e-05, 'epoch': 0.36} {'loss': 0.9855, 'learning_rate': 1.851384841180791e-05, 'epoch': 0.36} {'loss': 0.7881, 'learning_rate': 1.8513676697761682e-05, 'epoch': 0.36} {'loss': 0.7332, 'learning_rate': 1.8513504974592283e-05, 'epoch': 0.36} {'loss': 0.9491, 'learning_rate': 1.8513333242299895e-05, 'epoch': 0.36} {'loss': 0.73, 'learning_rate': 1.85131615008847e-05, 'epoch': 0.36} {'loss': 0.8136, 'learning_rate': 1.8512989750346888e-05, 'epoch': 0.36} {'loss': 0.9763, 'learning_rate': 1.8512817990686638e-05, 'epoch': 0.36} {'loss': 0.7591, 'learning_rate': 1.8512646221904135e-05, 'epoch': 0.36} {'loss': 0.9993, 'learning_rate': 1.851247444399956e-05, 'epoch': 0.36} {'loss': 0.7697, 'learning_rate': 1.8512302656973104e-05, 'epoch': 0.36} {'loss': 0.9345, 'learning_rate': 1.8512130860824945e-05, 'epoch': 0.36} {'loss': 0.8697, 'learning_rate': 1.8511959055555274e-05, 'epoch': 0.36} {'loss': 1.0318, 'learning_rate': 1.8511787241164265e-05, 'epoch': 0.36} {'loss': 1.0561, 'learning_rate': 1.8511615417652114e-05, 'epoch': 0.36} {'loss': 0.945, 'learning_rate': 1.8511443585018993e-05, 'epoch': 0.36} {'loss': 0.9117, 'learning_rate': 1.8511271743265093e-05, 'epoch': 0.36} {'loss': 0.983, 'learning_rate': 1.85110998923906e-05, 'epoch': 0.36} {'loss': 0.8993, 'learning_rate': 1.8510928032395692e-05, 'epoch': 0.36} {'loss': 0.7389, 'learning_rate': 1.8510756163280558e-05, 'epoch': 0.36} {'loss': 0.9959, 'learning_rate': 1.8510584285045382e-05, 'epoch': 0.36} {'loss': 0.9331, 'learning_rate': 1.8510412397690345e-05, 'epoch': 0.36} {'loss': 1.0011, 'learning_rate': 1.8510240501215633e-05, 'epoch': 0.36} {'loss': 0.8106, 'learning_rate': 1.8510068595621432e-05, 'epoch': 0.36} {'loss': 1.013, 'learning_rate': 1.8509896680907926e-05, 'epoch': 0.36} {'loss': 0.9927, 'learning_rate': 1.8509724757075293e-05, 'epoch': 0.36} {'loss': 0.7256, 'learning_rate': 1.8509552824123723e-05, 'epoch': 0.36} {'loss': 0.9781, 'learning_rate': 1.8509380882053397e-05, 'epoch': 0.36} {'loss': 0.9183, 'learning_rate': 1.8509208930864507e-05, 'epoch': 0.36} {'loss': 0.9545, 'learning_rate': 1.850903697055723e-05, 'epoch': 0.36} {'loss': 0.6899, 'learning_rate': 1.8508865001131747e-05, 'epoch': 0.36} {'loss': 0.8287, 'learning_rate': 1.850869302258825e-05, 'epoch': 0.36} {'loss': 0.9631, 'learning_rate': 1.8508521034926924e-05, 'epoch': 0.36} {'loss': 0.7842, 'learning_rate': 1.8508349038147946e-05, 'epoch': 0.36} {'loss': 0.8605, 'learning_rate': 1.8508177032251505e-05, 'epoch': 0.36} {'loss': 0.8157, 'learning_rate': 1.8508005017237785e-05, 'epoch': 0.36} {'loss': 0.8794, 'learning_rate': 1.8507832993106967e-05, 'epoch': 0.36} {'loss': 0.8217, 'learning_rate': 1.8507660959859243e-05, 'epoch': 0.36} {'loss': 0.8195, 'learning_rate': 1.8507488917494788e-05, 'epoch': 0.36} {'loss': 0.9716, 'learning_rate': 1.8507316866013792e-05, 'epoch': 0.36} {'loss': 0.7669, 'learning_rate': 1.8507144805416438e-05, 'epoch': 0.36} {'loss': 0.8341, 'learning_rate': 1.8506972735702912e-05, 'epoch': 0.36} {'loss': 0.8772, 'learning_rate': 1.8506800656873397e-05, 'epoch': 0.36} {'loss': 0.8568, 'learning_rate': 1.8506628568928076e-05, 'epoch': 0.36} {'loss': 0.7396, 'learning_rate': 1.8506456471867133e-05, 'epoch': 0.36} {'loss': 0.8942, 'learning_rate': 1.850628436569076e-05, 'epoch': 0.36} {'loss': 0.891, 'learning_rate': 1.850611225039913e-05, 'epoch': 0.36} {'loss': 0.7994, 'learning_rate': 1.8505940125992435e-05, 'epoch': 0.36} {'loss': 1.0761, 'learning_rate': 1.8505767992470857e-05, 'epoch': 0.36} {'loss': 1.0915, 'learning_rate': 1.8505595849834584e-05, 'epoch': 0.36} {'loss': 0.656, 'learning_rate': 1.850542369808379e-05, 'epoch': 0.36} {'loss': 0.834, 'learning_rate': 1.8505251537218673e-05, 'epoch': 0.36} {'loss': 0.9129, 'learning_rate': 1.850507936723941e-05, 'epoch': 0.36} {'loss': 0.9723, 'learning_rate': 1.850490718814619e-05, 'epoch': 0.36} {'loss': 0.993, 'learning_rate': 1.8504734999939188e-05, 'epoch': 0.36} {'loss': 1.0488, 'learning_rate': 1.8504562802618597e-05, 'epoch': 0.36} {'loss': 0.8986, 'learning_rate': 1.8504390596184602e-05, 'epoch': 0.36} {'loss': 0.8009, 'learning_rate': 1.850421838063738e-05, 'epoch': 0.36} {'loss': 1.0506, 'learning_rate': 1.8504046155977123e-05, 'epoch': 0.36} {'loss': 0.9445, 'learning_rate': 1.8503873922204018e-05, 'epoch': 0.36} {'loss': 0.8989, 'learning_rate': 1.8503701679318235e-05, 'epoch': 0.36} {'loss': 0.8943, 'learning_rate': 1.8503529427319976e-05, 'epoch': 0.36} {'loss': 0.9229, 'learning_rate': 1.8503357166209415e-05, 'epoch': 0.36} {'loss': 0.7985, 'learning_rate': 1.8503184895986738e-05, 'epoch': 0.36} {'loss': 0.8316, 'learning_rate': 1.850301261665213e-05, 'epoch': 0.36} {'loss': 0.7513, 'learning_rate': 1.8502840328205783e-05, 'epoch': 0.36} {'loss': 0.7909, 'learning_rate': 1.850266803064787e-05, 'epoch': 0.36} {'loss': 0.9333, 'learning_rate': 1.850249572397858e-05, 'epoch': 0.36} {'loss': 0.7931, 'learning_rate': 1.85023234081981e-05, 'epoch': 0.36} {'loss': 0.7457, 'learning_rate': 1.8502151083306615e-05, 'epoch': 0.36} {'loss': 0.8465, 'learning_rate': 1.8501978749304305e-05, 'epoch': 0.36} {'loss': 0.8287, 'learning_rate': 1.850180640619136e-05, 'epoch': 0.36} {'loss': 0.6691, 'learning_rate': 1.8501634053967958e-05, 'epoch': 0.36} {'loss': 0.6832, 'learning_rate': 1.850146169263429e-05, 'epoch': 0.36} {'loss': 0.8906, 'learning_rate': 1.850128932219054e-05, 'epoch': 0.36} {'loss': 0.8149, 'learning_rate': 1.850111694263689e-05, 'epoch': 0.36} {'loss': 0.8896, 'learning_rate': 1.8500944553973525e-05, 'epoch': 0.36} {'loss': 0.9631, 'learning_rate': 1.8500772156200632e-05, 'epoch': 0.36} {'loss': 0.8187, 'learning_rate': 1.8500599749318394e-05, 'epoch': 0.36} {'loss': 0.9908, 'learning_rate': 1.8500427333326994e-05, 'epoch': 0.36} {'loss': 0.862, 'learning_rate': 1.8500254908226623e-05, 'epoch': 0.36} {'loss': 0.9972, 'learning_rate': 1.850008247401746e-05, 'epoch': 0.36} {'loss': 1.0128, 'learning_rate': 1.849991003069969e-05, 'epoch': 0.36} {'loss': 0.8816, 'learning_rate': 1.84997375782735e-05, 'epoch': 0.36} {'loss': 0.9705, 'learning_rate': 1.8499565116739076e-05, 'epoch': 0.36} {'loss': 0.7903, 'learning_rate': 1.8499392646096596e-05, 'epoch': 0.36} {'loss': 0.9644, 'learning_rate': 1.8499220166346255e-05, 'epoch': 0.36} {'loss': 0.9614, 'learning_rate': 1.849904767748823e-05, 'epoch': 0.36} {'loss': 0.8518, 'learning_rate': 1.849887517952271e-05, 'epoch': 0.36} {'loss': 1.0333, 'learning_rate': 1.8498702672449877e-05, 'epoch': 0.36} {'loss': 1.0415, 'learning_rate': 1.8498530156269913e-05, 'epoch': 0.36} {'loss': 1.0387, 'learning_rate': 1.8498357630983013e-05, 'epoch': 0.36} {'loss': 0.7252, 'learning_rate': 1.8498185096589353e-05, 'epoch': 0.36} {'loss': 0.8178, 'learning_rate': 1.849801255308912e-05, 'epoch': 0.36} {'loss': 0.7874, 'learning_rate': 1.84978400004825e-05, 'epoch': 0.36} {'loss': 1.0146, 'learning_rate': 1.849766743876968e-05, 'epoch': 0.36} {'loss': 0.9208, 'learning_rate': 1.849749486795084e-05, 'epoch': 0.36} {'loss': 0.8385, 'learning_rate': 1.8497322288026168e-05, 'epoch': 0.36} {'loss': 0.8386, 'learning_rate': 1.8497149698995847e-05, 'epoch': 0.36} {'loss': 0.873, 'learning_rate': 1.8496977100860065e-05, 'epoch': 0.36} {'loss': 0.7727, 'learning_rate': 1.8496804493619004e-05, 'epoch': 0.36} {'loss': 0.9998, 'learning_rate': 1.849663187727285e-05, 'epoch': 0.36} {'loss': 0.8608, 'learning_rate': 1.849645925182179e-05, 'epoch': 0.36} {'loss': 0.8773, 'learning_rate': 1.8496286617266007e-05, 'epoch': 0.36} {'loss': 1.0084, 'learning_rate': 1.8496113973605687e-05, 'epoch': 0.36} {'loss': 0.9436, 'learning_rate': 1.849594132084101e-05, 'epoch': 0.36} {'loss': 0.8889, 'learning_rate': 1.8495768658972167e-05, 'epoch': 0.36} {'loss': 0.8307, 'learning_rate': 1.849559598799934e-05, 'epoch': 0.36} {'loss': 0.8048, 'learning_rate': 1.8495423307922716e-05, 'epoch': 0.36} {'loss': 0.8559, 'learning_rate': 1.849525061874248e-05, 'epoch': 0.36} {'loss': 0.9977, 'learning_rate': 1.8495077920458814e-05, 'epoch': 0.36} {'loss': 0.8971, 'learning_rate': 1.849490521307191e-05, 'epoch': 0.36} {'loss': 0.82, 'learning_rate': 1.849473249658194e-05, 'epoch': 0.36} {'loss': 0.9355, 'learning_rate': 1.8494559770989103e-05, 'epoch': 0.36} {'loss': 0.9123, 'learning_rate': 1.8494387036293578e-05, 'epoch': 0.36} {'loss': 0.8114, 'learning_rate': 1.8494214292495552e-05, 'epoch': 0.36} {'loss': 0.9192, 'learning_rate': 1.8494041539595205e-05, 'epoch': 0.36} {'loss': 0.7667, 'learning_rate': 1.849386877759273e-05, 'epoch': 0.36} {'loss': 0.9979, 'learning_rate': 1.8493696006488307e-05, 'epoch': 0.36} {'loss': 0.873, 'learning_rate': 1.849352322628212e-05, 'epoch': 0.36} {'loss': 0.9044, 'learning_rate': 1.8493350436974358e-05, 'epoch': 0.36} {'loss': 0.8336, 'learning_rate': 1.8493177638565205e-05, 'epoch': 0.36} {'loss': 0.9845, 'learning_rate': 1.8493004831054845e-05, 'epoch': 0.36} {'loss': 0.9199, 'learning_rate': 1.849283201444346e-05, 'epoch': 0.36} {'loss': 0.8079, 'learning_rate': 1.8492659188731244e-05, 'epoch': 0.36} {'loss': 0.8095, 'learning_rate': 1.8492486353918376e-05, 'epoch': 0.36} {'loss': 0.9755, 'learning_rate': 1.849231351000504e-05, 'epoch': 0.36} {'loss': 0.827, 'learning_rate': 1.8492140656991427e-05, 'epoch': 0.36} {'loss': 0.7247, 'learning_rate': 1.849196779487772e-05, 'epoch': 0.36} {'loss': 0.8417, 'learning_rate': 1.8491794923664098e-05, 'epoch': 0.36} {'loss': 0.9174, 'learning_rate': 1.8491622043350754e-05, 'epoch': 0.36} {'loss': 0.7418, 'learning_rate': 1.8491449153937872e-05, 'epoch': 0.36} {'loss': 0.9052, 'learning_rate': 1.8491276255425633e-05, 'epoch': 0.36} {'loss': 0.7714, 'learning_rate': 1.8491103347814227e-05, 'epoch': 0.36} {'loss': 0.7953, 'learning_rate': 1.8490930431103834e-05, 'epoch': 0.36} {'loss': 0.8745, 'learning_rate': 1.8490757505294647e-05, 'epoch': 0.36} {'loss': 0.8386, 'learning_rate': 1.8490584570386845e-05, 'epoch': 0.36} {'loss': 0.8284, 'learning_rate': 1.8490411626380616e-05, 'epoch': 0.36} {'loss': 0.7729, 'learning_rate': 1.8490238673276144e-05, 'epoch': 0.36} {'loss': 0.8894, 'learning_rate': 1.8490065711073614e-05, 'epoch': 0.36} {'loss': 0.9975, 'learning_rate': 1.8489892739773215e-05, 'epoch': 0.36} {'loss': 0.9144, 'learning_rate': 1.848971975937513e-05, 'epoch': 0.36} {'loss': 0.7822, 'learning_rate': 1.848954676987954e-05, 'epoch': 0.36} {'loss': 0.9347, 'learning_rate': 1.848937377128664e-05, 'epoch': 0.36} {'loss': 0.8252, 'learning_rate': 1.8489200763596603e-05, 'epoch': 0.36} {'loss': 0.8596, 'learning_rate': 1.8489027746809626e-05, 'epoch': 0.36} {'loss': 0.8748, 'learning_rate': 1.848885472092589e-05, 'epoch': 0.36} {'loss': 0.9044, 'learning_rate': 1.8488681685945576e-05, 'epoch': 0.36} {'loss': 0.8275, 'learning_rate': 1.8488508641868875e-05, 'epoch': 0.36} {'loss': 0.95, 'learning_rate': 1.8488335588695972e-05, 'epoch': 0.36} {'loss': 0.9243, 'learning_rate': 1.848816252642705e-05, 'epoch': 0.36} {'loss': 0.808, 'learning_rate': 1.8487989455062298e-05, 'epoch': 0.36} {'loss': 0.8311, 'learning_rate': 1.8487816374601896e-05, 'epoch': 0.36} {'loss': 0.7415, 'learning_rate': 1.8487643285046035e-05, 'epoch': 0.36} {'loss': 0.8079, 'learning_rate': 1.8487470186394896e-05, 'epoch': 0.36} {'loss': 0.8089, 'learning_rate': 1.848729707864867e-05, 'epoch': 0.36} {'loss': 0.8668, 'learning_rate': 1.8487123961807535e-05, 'epoch': 0.36} {'loss': 0.959, 'learning_rate': 1.8486950835871687e-05, 'epoch': 0.36} {'loss': 0.811, 'learning_rate': 1.84867777008413e-05, 'epoch': 0.36} {'loss': 0.8512, 'learning_rate': 1.8486604556716566e-05, 'epoch': 0.36} {'loss': 0.9241, 'learning_rate': 1.8486431403497668e-05, 'epoch': 0.36} {'loss': 1.0177, 'learning_rate': 1.8486258241184796e-05, 'epoch': 0.36} {'loss': 0.8201, 'learning_rate': 1.848608506977813e-05, 'epoch': 0.36} {'loss': 1.0794, 'learning_rate': 1.848591188927786e-05, 'epoch': 0.36} {'loss': 0.85, 'learning_rate': 1.8485738699684165e-05, 'epoch': 0.36} {'loss': 0.7851, 'learning_rate': 1.848556550099724e-05, 'epoch': 0.36} {'loss': 0.7451, 'learning_rate': 1.8485392293217262e-05, 'epoch': 0.36} {'loss': 0.8004, 'learning_rate': 1.8485219076344424e-05, 'epoch': 0.36} {'loss': 0.9814, 'learning_rate': 1.8485045850378903e-05, 'epoch': 0.36} {'loss': 0.8025, 'learning_rate': 1.848487261532089e-05, 'epoch': 0.36} {'loss': 0.8047, 'learning_rate': 1.8484699371170576e-05, 'epoch': 0.36} {'loss': 0.9713, 'learning_rate': 1.8484526117928135e-05, 'epoch': 0.36} {'loss': 1.0055, 'learning_rate': 1.848435285559376e-05, 'epoch': 0.36} {'loss': 1.048, 'learning_rate': 1.848417958416764e-05, 'epoch': 0.36} {'loss': 0.9421, 'learning_rate': 1.848400630364995e-05, 'epoch': 0.36} {'loss': 1.0216, 'learning_rate': 1.8483833014040883e-05, 'epoch': 0.36} {'loss': 0.6749, 'learning_rate': 1.8483659715340624e-05, 'epoch': 0.36} {'loss': 0.8729, 'learning_rate': 1.848348640754936e-05, 'epoch': 0.36} {'loss': 0.7654, 'learning_rate': 1.848331309066727e-05, 'epoch': 0.36} {'loss': 0.9718, 'learning_rate': 1.8483139764694547e-05, 'epoch': 0.36} {'loss': 0.9143, 'learning_rate': 1.8482966429631373e-05, 'epoch': 0.36} {'loss': 0.8417, 'learning_rate': 1.8482793085477936e-05, 'epoch': 0.36} {'loss': 0.7775, 'learning_rate': 1.848261973223442e-05, 'epoch': 0.36} {'loss': 0.9775, 'learning_rate': 1.848244636990101e-05, 'epoch': 0.36} {'loss': 0.8745, 'learning_rate': 1.8482272998477896e-05, 'epoch': 0.36} {'loss': 0.8911, 'learning_rate': 1.8482099617965258e-05, 'epoch': 0.36} {'loss': 1.038, 'learning_rate': 1.8481926228363286e-05, 'epoch': 0.36} {'loss': 0.7856, 'learning_rate': 1.8481752829672165e-05, 'epoch': 0.36} {'loss': 0.9448, 'learning_rate': 1.8481579421892083e-05, 'epoch': 0.36} {'loss': 0.7936, 'learning_rate': 1.8481406005023216e-05, 'epoch': 0.36} {'loss': 0.9045, 'learning_rate': 1.8481232579065763e-05, 'epoch': 0.36} {'loss': 0.854, 'learning_rate': 1.84810591440199e-05, 'epoch': 0.36} {'loss': 0.8921, 'learning_rate': 1.848088569988582e-05, 'epoch': 0.36} {'loss': 0.9039, 'learning_rate': 1.8480712246663703e-05, 'epoch': 0.36} {'loss': 0.9302, 'learning_rate': 1.848053878435374e-05, 'epoch': 0.36} {'loss': 0.8837, 'learning_rate': 1.8480365312956114e-05, 'epoch': 0.36} {'loss': 0.908, 'learning_rate': 1.8480191832471006e-05, 'epoch': 0.36} {'loss': 0.9335, 'learning_rate': 1.8480018342898614e-05, 'epoch': 0.36} {'loss': 0.7448, 'learning_rate': 1.8479844844239113e-05, 'epoch': 0.36} {'loss': 1.0901, 'learning_rate': 1.8479671336492694e-05, 'epoch': 0.36} {'loss': 0.7355, 'learning_rate': 1.8479497819659543e-05, 'epoch': 0.36} {'loss': 0.8785, 'learning_rate': 1.8479324293739842e-05, 'epoch': 0.36} {'loss': 0.8675, 'learning_rate': 1.8479150758733778e-05, 'epoch': 0.36} {'loss': 0.9003, 'learning_rate': 1.8478977214641545e-05, 'epoch': 0.36} {'loss': 1.05, 'learning_rate': 1.847880366146332e-05, 'epoch': 0.36} {'loss': 0.7809, 'learning_rate': 1.847863009919929e-05, 'epoch': 0.36} {'loss': 0.9148, 'learning_rate': 1.8478456527849644e-05, 'epoch': 0.36} {'loss': 0.9155, 'learning_rate': 1.8478282947414564e-05, 'epoch': 0.36} {'loss': 0.8021, 'learning_rate': 1.8478109357894242e-05, 'epoch': 0.36} {'loss': 0.856, 'learning_rate': 1.8477935759288862e-05, 'epoch': 0.36} {'loss': 0.8518, 'learning_rate': 1.8477762151598603e-05, 'epoch': 0.36} {'loss': 1.0474, 'learning_rate': 1.847758853482366e-05, 'epoch': 0.36} {'loss': 0.5902, 'learning_rate': 1.8477414908964217e-05, 'epoch': 0.36} {'loss': 1.0685, 'learning_rate': 1.847724127402046e-05, 'epoch': 0.36} {'loss': 0.7348, 'learning_rate': 1.847706762999257e-05, 'epoch': 0.36} {'loss': 0.7353, 'learning_rate': 1.8476893976880737e-05, 'epoch': 0.36} {'loss': 0.7036, 'learning_rate': 1.8476720314685147e-05, 'epoch': 0.36} {'loss': 0.7461, 'learning_rate': 1.8476546643405987e-05, 'epoch': 0.36} {'loss': 0.8236, 'learning_rate': 1.8476372963043442e-05, 'epoch': 0.36} {'loss': 1.016, 'learning_rate': 1.8476199273597698e-05, 'epoch': 0.36} {'loss': 0.8449, 'learning_rate': 1.8476025575068942e-05, 'epoch': 0.36} {'loss': 0.8202, 'learning_rate': 1.8475851867457364e-05, 'epoch': 0.36} {'loss': 0.9685, 'learning_rate': 1.847567815076314e-05, 'epoch': 0.36} {'loss': 1.0134, 'learning_rate': 1.8475504424986463e-05, 'epoch': 0.36} {'loss': 0.9268, 'learning_rate': 1.847533069012752e-05, 'epoch': 0.36} {'loss': 0.9411, 'learning_rate': 1.8475156946186494e-05, 'epoch': 0.36} {'loss': 0.8706, 'learning_rate': 1.8474983193163572e-05, 'epoch': 0.36} {'loss': 0.909, 'learning_rate': 1.847480943105894e-05, 'epoch': 0.36} {'loss': 0.8597, 'learning_rate': 1.8474635659872784e-05, 'epoch': 0.36} {'loss': 0.7591, 'learning_rate': 1.8474461879605295e-05, 'epoch': 0.36} {'loss': 0.7797, 'learning_rate': 1.847428809025665e-05, 'epoch': 0.36} {'loss': 0.7119, 'learning_rate': 1.8474114291827043e-05, 'epoch': 0.36} {'loss': 0.9813, 'learning_rate': 1.847394048431666e-05, 'epoch': 0.36} {'loss': 0.893, 'learning_rate': 1.847376666772568e-05, 'epoch': 0.36} {'loss': 0.8813, 'learning_rate': 1.84735928420543e-05, 'epoch': 0.36} {'loss': 0.8146, 'learning_rate': 1.8473419007302698e-05, 'epoch': 0.36} {'loss': 0.8728, 'learning_rate': 1.847324516347106e-05, 'epoch': 0.36} {'loss': 0.7424, 'learning_rate': 1.8473071310559577e-05, 'epoch': 0.36} {'loss': 0.8861, 'learning_rate': 1.8472897448568434e-05, 'epoch': 0.36} {'loss': 0.8497, 'learning_rate': 1.8472723577497817e-05, 'epoch': 0.36} {'loss': 0.8744, 'learning_rate': 1.847254969734791e-05, 'epoch': 0.36} {'loss': 0.8998, 'learning_rate': 1.8472375808118906e-05, 'epoch': 0.36} {'loss': 0.7778, 'learning_rate': 1.8472201909810982e-05, 'epoch': 0.36} {'loss': 0.9489, 'learning_rate': 1.8472028002424332e-05, 'epoch': 0.36} {'loss': 0.9035, 'learning_rate': 1.847185408595914e-05, 'epoch': 0.36} {'loss': 0.9422, 'learning_rate': 1.8471680160415585e-05, 'epoch': 0.36} {'loss': 0.9376, 'learning_rate': 1.8471506225793865e-05, 'epoch': 0.36} {'loss': 0.8486, 'learning_rate': 1.847133228209416e-05, 'epoch': 0.36} {'loss': 0.833, 'learning_rate': 1.847115832931666e-05, 'epoch': 0.36} {'loss': 0.7316, 'learning_rate': 1.8470984367461547e-05, 'epoch': 0.36} {'loss': 1.0808, 'learning_rate': 1.8470810396529015e-05, 'epoch': 0.36} {'loss': 0.7114, 'learning_rate': 1.8470636416519237e-05, 'epoch': 0.36} {'loss': 1.0373, 'learning_rate': 1.8470462427432413e-05, 'epoch': 0.36} {'loss': 0.7965, 'learning_rate': 1.8470288429268724e-05, 'epoch': 0.36} {'loss': 0.8494, 'learning_rate': 1.847011442202835e-05, 'epoch': 0.36} {'loss': 0.9538, 'learning_rate': 1.846994040571149e-05, 'epoch': 0.36} {'loss': 0.8113, 'learning_rate': 1.8469766380318326e-05, 'epoch': 0.36} {'loss': 0.8571, 'learning_rate': 1.846959234584904e-05, 'epoch': 0.36} {'loss': 0.9193, 'learning_rate': 1.846941830230382e-05, 'epoch': 0.36} {'loss': 0.9693, 'learning_rate': 1.8469244249682856e-05, 'epoch': 0.36} {'loss': 0.822, 'learning_rate': 1.8469070187986332e-05, 'epoch': 0.36} {'loss': 0.857, 'learning_rate': 1.8468896117214433e-05, 'epoch': 0.36} {'loss': 0.7963, 'learning_rate': 1.846872203736735e-05, 'epoch': 0.36} {'loss': 0.998, 'learning_rate': 1.8468547948445268e-05, 'epoch': 0.36} {'loss': 0.8642, 'learning_rate': 1.8468373850448367e-05, 'epoch': 0.36} {'loss': 0.8113, 'learning_rate': 1.8468199743376844e-05, 'epoch': 0.36} {'loss': 0.7537, 'learning_rate': 1.846802562723088e-05, 'epoch': 0.36} {'loss': 0.7016, 'learning_rate': 1.846785150201066e-05, 'epoch': 0.36} {'loss': 0.8467, 'learning_rate': 1.8467677367716376e-05, 'epoch': 0.36} {'loss': 0.9131, 'learning_rate': 1.846750322434821e-05, 'epoch': 0.36} {'loss': 0.8922, 'learning_rate': 1.846732907190635e-05, 'epoch': 0.36} {'loss': 0.7813, 'learning_rate': 1.8467154910390984e-05, 'epoch': 0.36} {'loss': 0.8266, 'learning_rate': 1.8466980739802296e-05, 'epoch': 0.36} {'loss': 0.8036, 'learning_rate': 1.8466806560140473e-05, 'epoch': 0.36} {'loss': 0.8177, 'learning_rate': 1.8466632371405704e-05, 'epoch': 0.36} {'loss': 1.0128, 'learning_rate': 1.8466458173598175e-05, 'epoch': 0.36} {'loss': 0.8806, 'learning_rate': 1.846628396671807e-05, 'epoch': 0.36} {'loss': 1.0462, 'learning_rate': 1.8466109750765576e-05, 'epoch': 0.36} {'loss': 0.7941, 'learning_rate': 1.8465935525740883e-05, 'epoch': 0.36} {'loss': 0.9691, 'learning_rate': 1.8465761291644176e-05, 'epoch': 0.36} {'loss': 0.885, 'learning_rate': 1.8465587048475644e-05, 'epoch': 0.36} {'loss': 0.8648, 'learning_rate': 1.846541279623547e-05, 'epoch': 0.36} {'loss': 0.8767, 'learning_rate': 1.8465238534923842e-05, 'epoch': 0.36} {'loss': 1.0699, 'learning_rate': 1.8465064264540944e-05, 'epoch': 0.36} {'loss': 0.9901, 'learning_rate': 1.846488998508697e-05, 'epoch': 0.36} {'loss': 0.8772, 'learning_rate': 1.8464715696562102e-05, 'epoch': 0.36} {'loss': 0.8838, 'learning_rate': 1.8464541398966526e-05, 'epoch': 0.36} {'loss': 0.8201, 'learning_rate': 1.846436709230043e-05, 'epoch': 0.36} {'loss': 0.8583, 'learning_rate': 1.8464192776564e-05, 'epoch': 0.36} {'loss': 0.7949, 'learning_rate': 1.8464018451757423e-05, 'epoch': 0.36} {'loss': 0.7813, 'learning_rate': 1.8463844117880885e-05, 'epoch': 0.36} {'loss': 0.7901, 'learning_rate': 1.846366977493458e-05, 'epoch': 0.36} {'loss': 0.8315, 'learning_rate': 1.8463495422918685e-05, 'epoch': 0.36} {'loss': 0.878, 'learning_rate': 1.846332106183339e-05, 'epoch': 0.36} {'loss': 0.8874, 'learning_rate': 1.8463146691678884e-05, 'epoch': 0.36} {'loss': 0.9617, 'learning_rate': 1.8462972312455353e-05, 'epoch': 0.36} {'loss': 0.9286, 'learning_rate': 1.8462797924162982e-05, 'epoch': 0.36} {'loss': 0.7659, 'learning_rate': 1.846262352680196e-05, 'epoch': 0.36} {'loss': 0.8031, 'learning_rate': 1.846244912037247e-05, 'epoch': 0.36} {'loss': 0.8743, 'learning_rate': 1.8462274704874706e-05, 'epoch': 0.36} {'loss': 0.8964, 'learning_rate': 1.846210028030885e-05, 'epoch': 0.36} {'loss': 0.9111, 'learning_rate': 1.846192584667509e-05, 'epoch': 0.36} {'loss': 0.8581, 'learning_rate': 1.8461751403973614e-05, 'epoch': 0.36} {'loss': 0.8779, 'learning_rate': 1.8461576952204604e-05, 'epoch': 0.36} {'loss': 0.8206, 'learning_rate': 1.8461402491368252e-05, 'epoch': 0.36} {'loss': 0.7787, 'learning_rate': 1.8461228021464745e-05, 'epoch': 0.36} {'loss': 0.898, 'learning_rate': 1.846105354249427e-05, 'epoch': 0.36} {'loss': 0.922, 'learning_rate': 1.846087905445701e-05, 'epoch': 0.36} {'loss': 0.964, 'learning_rate': 1.8460704557353153e-05, 'epoch': 0.36} {'loss': 0.8129, 'learning_rate': 1.8460530051182887e-05, 'epoch': 0.36} {'loss': 0.863, 'learning_rate': 1.8460355535946403e-05, 'epoch': 0.36} {'loss': 0.7443, 'learning_rate': 1.8460181011643882e-05, 'epoch': 0.36} {'loss': 0.7275, 'learning_rate': 1.8460006478275513e-05, 'epoch': 0.36} {'loss': 0.8236, 'learning_rate': 1.845983193584149e-05, 'epoch': 0.36} {'loss': 0.7125, 'learning_rate': 1.8459657384341984e-05, 'epoch': 0.36} {'loss': 0.8741, 'learning_rate': 1.8459482823777196e-05, 'epoch': 0.36} {'loss': 0.9226, 'learning_rate': 1.845930825414731e-05, 'epoch': 0.36} {'loss': 0.7848, 'learning_rate': 1.8459133675452506e-05, 'epoch': 0.36} {'loss': 0.9598, 'learning_rate': 1.8458959087692984e-05, 'epoch': 0.36} {'loss': 0.8896, 'learning_rate': 1.845878449086892e-05, 'epoch': 0.36} {'loss': 0.7065, 'learning_rate': 1.845860988498051e-05, 'epoch': 0.36} {'loss': 1.0977, 'learning_rate': 1.845843527002793e-05, 'epoch': 0.36} {'loss': 0.9659, 'learning_rate': 1.8458260646011375e-05, 'epoch': 0.36} {'loss': 0.9079, 'learning_rate': 1.845808601293103e-05, 'epoch': 0.36} {'loss': 0.9737, 'learning_rate': 1.8457911370787082e-05, 'epoch': 0.36} {'loss': 0.941, 'learning_rate': 1.845773671957972e-05, 'epoch': 0.36} {'loss': 0.7701, 'learning_rate': 1.845756205930913e-05, 'epoch': 0.36} {'loss': 0.7526, 'learning_rate': 1.8457387389975495e-05, 'epoch': 0.36} {'loss': 0.8278, 'learning_rate': 1.8457212711579012e-05, 'epoch': 0.36} {'loss': 0.9049, 'learning_rate': 1.8457038024119856e-05, 'epoch': 0.36} {'loss': 0.9299, 'learning_rate': 1.8456863327598227e-05, 'epoch': 0.36} {'loss': 0.9572, 'learning_rate': 1.8456688622014304e-05, 'epoch': 0.36} {'loss': 0.758, 'learning_rate': 1.845651390736827e-05, 'epoch': 0.36} {'loss': 0.8352, 'learning_rate': 1.8456339183660326e-05, 'epoch': 0.36} {'loss': 0.8699, 'learning_rate': 1.8456164450890647e-05, 'epoch': 0.36} {'loss': 0.6633, 'learning_rate': 1.8455989709059423e-05, 'epoch': 0.36} {'loss': 0.8503, 'learning_rate': 1.8455814958166847e-05, 'epoch': 0.36} {'loss': 0.815, 'learning_rate': 1.8455640198213102e-05, 'epoch': 0.36} {'loss': 0.9511, 'learning_rate': 1.8455465429198375e-05, 'epoch': 0.36} {'loss': 0.8164, 'learning_rate': 1.845529065112285e-05, 'epoch': 0.36} {'loss': 0.9413, 'learning_rate': 1.845511586398672e-05, 'epoch': 0.36} {'loss': 0.8044, 'learning_rate': 1.8454941067790172e-05, 'epoch': 0.36} {'loss': 0.8519, 'learning_rate': 1.8454766262533388e-05, 'epoch': 0.36} {'loss': 0.8419, 'learning_rate': 1.845459144821656e-05, 'epoch': 0.36} {'loss': 0.8025, 'learning_rate': 1.8454416624839876e-05, 'epoch': 0.36} {'loss': 0.8889, 'learning_rate': 1.845424179240352e-05, 'epoch': 0.36} {'loss': 0.9581, 'learning_rate': 1.8454066950907685e-05, 'epoch': 0.36} {'loss': 0.9673, 'learning_rate': 1.8453892100352545e-05, 'epoch': 0.36} {'loss': 0.7901, 'learning_rate': 1.8453717240738306e-05, 'epoch': 0.36} {'loss': 0.6553, 'learning_rate': 1.845354237206514e-05, 'epoch': 0.36} {'loss': 0.857, 'learning_rate': 1.8453367494333244e-05, 'epoch': 0.36} {'loss': 0.8541, 'learning_rate': 1.84531926075428e-05, 'epoch': 0.36} {'loss': 1.021, 'learning_rate': 1.8453017711693997e-05, 'epoch': 0.36} {'loss': 1.0009, 'learning_rate': 1.8452842806787026e-05, 'epoch': 0.36} {'loss': 0.8498, 'learning_rate': 1.8452667892822068e-05, 'epoch': 0.36} {'loss': 0.9057, 'learning_rate': 1.8452492969799316e-05, 'epoch': 0.36} {'loss': 0.7571, 'learning_rate': 1.8452318037718952e-05, 'epoch': 0.36} {'loss': 0.9349, 'learning_rate': 1.8452143096581167e-05, 'epoch': 0.36} {'loss': 0.9411, 'learning_rate': 1.8451968146386146e-05, 'epoch': 0.36} {'loss': 0.7772, 'learning_rate': 1.8451793187134077e-05, 'epoch': 0.36} {'loss': 0.9756, 'learning_rate': 1.8451618218825155e-05, 'epoch': 0.36} {'loss': 0.8851, 'learning_rate': 1.8451443241459557e-05, 'epoch': 0.36} {'loss': 0.8554, 'learning_rate': 1.8451268255037477e-05, 'epoch': 0.36} {'loss': 0.937, 'learning_rate': 1.84510932595591e-05, 'epoch': 0.36} {'loss': 0.8544, 'learning_rate': 1.845091825502461e-05, 'epoch': 0.36} {'loss': 1.1102, 'learning_rate': 1.8450743241434202e-05, 'epoch': 0.36} {'loss': 0.7916, 'learning_rate': 1.845056821878806e-05, 'epoch': 0.36} {'loss': 0.9065, 'learning_rate': 1.845039318708637e-05, 'epoch': 0.36} {'loss': 0.7058, 'learning_rate': 1.8450218146329323e-05, 'epoch': 0.36} {'loss': 0.9582, 'learning_rate': 1.84500430965171e-05, 'epoch': 0.36} {'loss': 0.7425, 'learning_rate': 1.84498680376499e-05, 'epoch': 0.36} {'loss': 0.8796, 'learning_rate': 1.8449692969727898e-05, 'epoch': 0.36} {'loss': 0.9413, 'learning_rate': 1.844951789275129e-05, 'epoch': 0.36} {'loss': 0.7348, 'learning_rate': 1.8449342806720262e-05, 'epoch': 0.36} {'loss': 0.8235, 'learning_rate': 1.8449167711634997e-05, 'epoch': 0.36} {'loss': 0.961, 'learning_rate': 1.844899260749569e-05, 'epoch': 0.36} {'loss': 0.9341, 'learning_rate': 1.844881749430252e-05, 'epoch': 0.36} {'loss': 0.8368, 'learning_rate': 1.8448642372055685e-05, 'epoch': 0.36} {'loss': 0.9729, 'learning_rate': 1.8448467240755364e-05, 'epoch': 0.36} {'loss': 0.8843, 'learning_rate': 1.8448292100401752e-05, 'epoch': 0.36} {'loss': 0.8676, 'learning_rate': 1.8448116950995024e-05, 'epoch': 0.36} {'loss': 0.702, 'learning_rate': 1.844794179253538e-05, 'epoch': 0.36} {'loss': 0.9194, 'learning_rate': 1.844776662502301e-05, 'epoch': 0.36} {'loss': 0.8822, 'learning_rate': 1.844759144845809e-05, 'epoch': 0.36} {'loss': 0.9573, 'learning_rate': 1.8447416262840815e-05, 'epoch': 0.36} {'loss': 0.9655, 'learning_rate': 1.8447241068171367e-05, 'epoch': 0.36} {'loss': 0.913, 'learning_rate': 1.8447065864449943e-05, 'epoch': 0.36} {'loss': 0.827, 'learning_rate': 1.8446890651676725e-05, 'epoch': 0.36} {'loss': 0.9389, 'learning_rate': 1.84467154298519e-05, 'epoch': 0.36} {'loss': 0.8361, 'learning_rate': 1.8446540198975652e-05, 'epoch': 0.36} {'loss': 1.0335, 'learning_rate': 1.844636495904818e-05, 'epoch': 0.36} {'loss': 0.8616, 'learning_rate': 1.8446189710069667e-05, 'epoch': 0.36} {'loss': 0.8682, 'learning_rate': 1.8446014452040295e-05, 'epoch': 0.36} {'loss': 0.9586, 'learning_rate': 1.8445839184960258e-05, 'epoch': 0.36} {'loss': 0.7372, 'learning_rate': 1.844566390882974e-05, 'epoch': 0.36} {'loss': 0.8447, 'learning_rate': 1.8445488623648935e-05, 'epoch': 0.36} {'loss': 0.8998, 'learning_rate': 1.8445313329418025e-05, 'epoch': 0.36} {'loss': 0.8159, 'learning_rate': 1.84451380261372e-05, 'epoch': 0.36} {'loss': 0.8553, 'learning_rate': 1.8444962713806648e-05, 'epoch': 0.36} {'loss': 1.0084, 'learning_rate': 1.8444787392426554e-05, 'epoch': 0.36} {'loss': 0.8833, 'learning_rate': 1.844461206199711e-05, 'epoch': 0.36} {'loss': 0.7226, 'learning_rate': 1.84444367225185e-05, 'epoch': 0.36} {'loss': 0.802, 'learning_rate': 1.8444261373990913e-05, 'epoch': 0.36} {'loss': 0.9668, 'learning_rate': 1.8444086016414536e-05, 'epoch': 0.37} {'loss': 0.8825, 'learning_rate': 1.8443910649789564e-05, 'epoch': 0.37} {'loss': 0.9906, 'learning_rate': 1.8443735274116176e-05, 'epoch': 0.37} {'loss': 0.8897, 'learning_rate': 1.8443559889394568e-05, 'epoch': 0.37} {'loss': 0.9858, 'learning_rate': 1.844338449562492e-05, 'epoch': 0.37} {'loss': 0.8505, 'learning_rate': 1.8443209092807426e-05, 'epoch': 0.37} {'loss': 0.8522, 'learning_rate': 1.8443033680942268e-05, 'epoch': 0.37} {'loss': 1.0415, 'learning_rate': 1.844285826002964e-05, 'epoch': 0.37} {'loss': 0.7394, 'learning_rate': 1.8442682830069726e-05, 'epoch': 0.37} {'loss': 1.0814, 'learning_rate': 1.8442507391062715e-05, 'epoch': 0.37} {'loss': 0.7955, 'learning_rate': 1.8442331943008796e-05, 'epoch': 0.37} {'loss': 0.84, 'learning_rate': 1.8442156485908156e-05, 'epoch': 0.37} {'loss': 0.8236, 'learning_rate': 1.8441981019760983e-05, 'epoch': 0.37} {'loss': 0.7542, 'learning_rate': 1.8441805544567467e-05, 'epoch': 0.37} {'loss': 0.954, 'learning_rate': 1.8441630060327796e-05, 'epoch': 0.37} {'loss': 1.0097, 'learning_rate': 1.844145456704215e-05, 'epoch': 0.37} {'loss': 0.8803, 'learning_rate': 1.844127906471073e-05, 'epoch': 0.37} {'loss': 0.7598, 'learning_rate': 1.8441103553333716e-05, 'epoch': 0.37} {'loss': 0.8679, 'learning_rate': 1.8440928032911297e-05, 'epoch': 0.37} {'loss': 0.8557, 'learning_rate': 1.844075250344366e-05, 'epoch': 0.37} {'loss': 0.7053, 'learning_rate': 1.8440576964930998e-05, 'epoch': 0.37} {'loss': 0.9031, 'learning_rate': 1.8440401417373496e-05, 'epoch': 0.37} {'loss': 0.8242, 'learning_rate': 1.844022586077134e-05, 'epoch': 0.37} {'loss': 0.8853, 'learning_rate': 1.844005029512472e-05, 'epoch': 0.37} {'loss': 1.0055, 'learning_rate': 1.8439874720433826e-05, 'epoch': 0.37} {'loss': 1.0181, 'learning_rate': 1.8439699136698842e-05, 'epoch': 0.37} {'loss': 0.8328, 'learning_rate': 1.8439523543919962e-05, 'epoch': 0.37} {'loss': 0.874, 'learning_rate': 1.843934794209737e-05, 'epoch': 0.37} {'loss': 0.9001, 'learning_rate': 1.8439172331231253e-05, 'epoch': 0.37} {'loss': 0.936, 'learning_rate': 1.8438996711321803e-05, 'epoch': 0.37} {'loss': 0.7283, 'learning_rate': 1.843882108236921e-05, 'epoch': 0.37} {'loss': 0.817, 'learning_rate': 1.843864544437365e-05, 'epoch': 0.37} {'loss': 0.9076, 'learning_rate': 1.8438469797335324e-05, 'epoch': 0.37} {'loss': 0.9322, 'learning_rate': 1.8438294141254416e-05, 'epoch': 0.37} {'loss': 1.0263, 'learning_rate': 1.8438118476131116e-05, 'epoch': 0.37} {'loss': 0.7485, 'learning_rate': 1.8437942801965607e-05, 'epoch': 0.37} {'loss': 0.8102, 'learning_rate': 1.8437767118758083e-05, 'epoch': 0.37} {'loss': 0.964, 'learning_rate': 1.843759142650873e-05, 'epoch': 0.37} {'loss': 0.9216, 'learning_rate': 1.8437415725217732e-05, 'epoch': 0.37} {'loss': 0.9388, 'learning_rate': 1.843724001488529e-05, 'epoch': 0.37} {'loss': 1.0323, 'learning_rate': 1.843706429551158e-05, 'epoch': 0.37} {'loss': 0.7021, 'learning_rate': 1.843688856709679e-05, 'epoch': 0.37} {'loss': 0.993, 'learning_rate': 1.8436712829641113e-05, 'epoch': 0.37} {'loss': 0.7475, 'learning_rate': 1.843653708314474e-05, 'epoch': 0.37} {'loss': 0.9861, 'learning_rate': 1.8436361327607856e-05, 'epoch': 0.37} {'loss': 0.8608, 'learning_rate': 1.843618556303065e-05, 'epoch': 0.37} {'loss': 0.8139, 'learning_rate': 1.8436009789413306e-05, 'epoch': 0.37} {'loss': 0.7571, 'learning_rate': 1.8435834006756023e-05, 'epoch': 0.37} {'loss': 0.7288, 'learning_rate': 1.8435658215058977e-05, 'epoch': 0.37} {'loss': 0.9397, 'learning_rate': 1.8435482414322362e-05, 'epoch': 0.37} {'loss': 0.8292, 'learning_rate': 1.8435306604546367e-05, 'epoch': 0.37} {'loss': 0.93, 'learning_rate': 1.8435130785731182e-05, 'epoch': 0.37} {'loss': 0.9502, 'learning_rate': 1.843495495787699e-05, 'epoch': 0.37} {'loss': 0.7944, 'learning_rate': 1.8434779120983984e-05, 'epoch': 0.37} {'loss': 0.8379, 'learning_rate': 1.843460327505235e-05, 'epoch': 0.37} {'loss': 0.8555, 'learning_rate': 1.8434427420082278e-05, 'epoch': 0.37} {'loss': 1.0384, 'learning_rate': 1.8434251556073955e-05, 'epoch': 0.37} {'loss': 0.9901, 'learning_rate': 1.843407568302757e-05, 'epoch': 0.37} {'loss': 0.923, 'learning_rate': 1.8433899800943313e-05, 'epoch': 0.37} {'loss': 0.9513, 'learning_rate': 1.843372390982137e-05, 'epoch': 0.37} {'loss': 0.7386, 'learning_rate': 1.843354800966193e-05, 'epoch': 0.37} {'loss': 1.1716, 'learning_rate': 1.8433372100465184e-05, 'epoch': 0.37} {'loss': 0.8888, 'learning_rate': 1.8433196182231316e-05, 'epoch': 0.37} {'loss': 0.8791, 'learning_rate': 1.843302025496052e-05, 'epoch': 0.37} {'loss': 0.8541, 'learning_rate': 1.843284431865298e-05, 'epoch': 0.37} {'loss': 0.8286, 'learning_rate': 1.8432668373308887e-05, 'epoch': 0.37} {'loss': 1.0791, 'learning_rate': 1.843249241892843e-05, 'epoch': 0.37} {'loss': 0.8021, 'learning_rate': 1.8432316455511795e-05, 'epoch': 0.37} {'loss': 0.8655, 'learning_rate': 1.8432140483059172e-05, 'epoch': 0.37} {'loss': 0.9737, 'learning_rate': 1.8431964501570747e-05, 'epoch': 0.37} {'loss': 0.8958, 'learning_rate': 1.8431788511046713e-05, 'epoch': 0.37} {'loss': 0.8329, 'learning_rate': 1.8431612511487257e-05, 'epoch': 0.37} {'loss': 0.9223, 'learning_rate': 1.8431436502892568e-05, 'epoch': 0.37} {'loss': 0.8914, 'learning_rate': 1.8431260485262836e-05, 'epoch': 0.37} {'loss': 0.9203, 'learning_rate': 1.843108445859824e-05, 'epoch': 0.37} {'loss': 0.606, 'learning_rate': 1.8430908422898982e-05, 'epoch': 0.37} {'loss': 0.8193, 'learning_rate': 1.8430732378165242e-05, 'epoch': 0.37} {'loss': 0.9514, 'learning_rate': 1.8430556324397212e-05, 'epoch': 0.37} {'loss': 0.7758, 'learning_rate': 1.843038026159508e-05, 'epoch': 0.37} {'loss': 0.8144, 'learning_rate': 1.8430204189759036e-05, 'epoch': 0.37} {'loss': 0.7923, 'learning_rate': 1.8430028108889265e-05, 'epoch': 0.37} {'loss': 1.1159, 'learning_rate': 1.842985201898596e-05, 'epoch': 0.37} {'loss': 0.8605, 'learning_rate': 1.8429675920049307e-05, 'epoch': 0.37} {'loss': 0.7827, 'learning_rate': 1.8429499812079497e-05, 'epoch': 0.37} {'loss': 0.7975, 'learning_rate': 1.8429323695076717e-05, 'epoch': 0.37} {'loss': 0.8045, 'learning_rate': 1.842914756904115e-05, 'epoch': 0.37} {'loss': 0.8693, 'learning_rate': 1.8428971433972997e-05, 'epoch': 0.37} {'loss': 0.789, 'learning_rate': 1.842879528987244e-05, 'epoch': 0.37} {'loss': 0.8353, 'learning_rate': 1.8428619136739666e-05, 'epoch': 0.37} {'loss': 1.0184, 'learning_rate': 1.8428442974574865e-05, 'epoch': 0.37} {'loss': 0.962, 'learning_rate': 1.8428266803378226e-05, 'epoch': 0.37} {'loss': 0.8831, 'learning_rate': 1.8428090623149942e-05, 'epoch': 0.37} {'loss': 0.773, 'learning_rate': 1.8427914433890196e-05, 'epoch': 0.37} {'loss': 0.7886, 'learning_rate': 1.842773823559918e-05, 'epoch': 0.37} {'loss': 0.8792, 'learning_rate': 1.8427562028277083e-05, 'epoch': 0.37} {'loss': 0.9756, 'learning_rate': 1.8427385811924087e-05, 'epoch': 0.37} {'loss': 0.8448, 'learning_rate': 1.8427209586540392e-05, 'epoch': 0.37} {'loss': 0.9373, 'learning_rate': 1.842703335212618e-05, 'epoch': 0.37} {'loss': 0.9053, 'learning_rate': 1.8426857108681643e-05, 'epoch': 0.37} {'loss': 0.7942, 'learning_rate': 1.8426680856206968e-05, 'epoch': 0.37} {'loss': 0.8082, 'learning_rate': 1.842650459470234e-05, 'epoch': 0.37} {'loss': 0.8569, 'learning_rate': 1.8426328324167952e-05, 'epoch': 0.37} {'loss': 0.7304, 'learning_rate': 1.8426152044603995e-05, 'epoch': 0.37} {'loss': 0.8503, 'learning_rate': 1.8425975756010656e-05, 'epoch': 0.37} {'loss': 0.9137, 'learning_rate': 1.8425799458388122e-05, 'epoch': 0.37} {'loss': 0.9031, 'learning_rate': 1.8425623151736586e-05, 'epoch': 0.37} {'loss': 0.7751, 'learning_rate': 1.842544683605623e-05, 'epoch': 0.37} {'loss': 0.866, 'learning_rate': 1.842527051134725e-05, 'epoch': 0.37} {'loss': 0.8147, 'learning_rate': 1.842509417760983e-05, 'epoch': 0.37} {'loss': 0.9185, 'learning_rate': 1.8424917834844164e-05, 'epoch': 0.37} {'loss': 0.8043, 'learning_rate': 1.8424741483050437e-05, 'epoch': 0.37} {'loss': 0.8164, 'learning_rate': 1.842456512222884e-05, 'epoch': 0.37} {'loss': 0.6849, 'learning_rate': 1.842438875237956e-05, 'epoch': 0.37} {'loss': 0.9806, 'learning_rate': 1.8424212373502788e-05, 'epoch': 0.37} {'loss': 0.8222, 'learning_rate': 1.8424035985598712e-05, 'epoch': 0.37} {'loss': 0.9305, 'learning_rate': 1.842385958866752e-05, 'epoch': 0.37} {'loss': 0.8104, 'learning_rate': 1.8423683182709406e-05, 'epoch': 0.37} {'loss': 0.7546, 'learning_rate': 1.8423506767724548e-05, 'epoch': 0.37} {'loss': 0.8914, 'learning_rate': 1.8423330343713148e-05, 'epoch': 0.37} {'loss': 0.8809, 'learning_rate': 1.8423153910675386e-05, 'epoch': 0.37} {'loss': 0.9167, 'learning_rate': 1.8422977468611457e-05, 'epoch': 0.37} {'loss': 0.9669, 'learning_rate': 1.8422801017521546e-05, 'epoch': 0.37} {'loss': 0.8506, 'learning_rate': 1.8422624557405844e-05, 'epoch': 0.37} {'loss': 0.8619, 'learning_rate': 1.842244808826454e-05, 'epoch': 0.37} {'loss': 0.8566, 'learning_rate': 1.842227161009782e-05, 'epoch': 0.37} {'loss': 0.9097, 'learning_rate': 1.8422095122905877e-05, 'epoch': 0.37} {'loss': 0.9085, 'learning_rate': 1.8421918626688903e-05, 'epoch': 0.37} {'loss': 0.9631, 'learning_rate': 1.842174212144708e-05, 'epoch': 0.37} {'loss': 1.0037, 'learning_rate': 1.8421565607180597e-05, 'epoch': 0.37} {'loss': 0.8971, 'learning_rate': 1.842138908388965e-05, 'epoch': 0.37} {'loss': 0.9676, 'learning_rate': 1.8421212551574427e-05, 'epoch': 0.37} {'loss': 0.8817, 'learning_rate': 1.842103601023511e-05, 'epoch': 0.37} {'loss': 0.9945, 'learning_rate': 1.8420859459871893e-05, 'epoch': 0.37} {'loss': 0.9779, 'learning_rate': 1.8420682900484967e-05, 'epoch': 0.37} {'loss': 0.8331, 'learning_rate': 1.842050633207452e-05, 'epoch': 0.37} {'loss': 0.7575, 'learning_rate': 1.8420329754640738e-05, 'epoch': 0.37} {'loss': 0.7291, 'learning_rate': 1.8420153168183814e-05, 'epoch': 0.37} {'loss': 0.8124, 'learning_rate': 1.8419976572703937e-05, 'epoch': 0.37} {'loss': 0.8761, 'learning_rate': 1.8419799968201295e-05, 'epoch': 0.37} {'loss': 0.9737, 'learning_rate': 1.841962335467608e-05, 'epoch': 0.37} {'loss': 0.7089, 'learning_rate': 1.8419446732128474e-05, 'epoch': 0.37} {'loss': 0.8743, 'learning_rate': 1.841927010055867e-05, 'epoch': 0.37} {'loss': 0.6299, 'learning_rate': 1.8419093459966858e-05, 'epoch': 0.37} {'loss': 0.6822, 'learning_rate': 1.841891681035323e-05, 'epoch': 0.37} {'loss': 0.8214, 'learning_rate': 1.8418740151717976e-05, 'epoch': 0.37} {'loss': 0.7503, 'learning_rate': 1.8418563484061276e-05, 'epoch': 0.37} {'loss': 0.9117, 'learning_rate': 1.841838680738333e-05, 'epoch': 0.37} {'loss': 0.7685, 'learning_rate': 1.841821012168432e-05, 'epoch': 0.37} {'loss': 0.9357, 'learning_rate': 1.841803342696444e-05, 'epoch': 0.37} {'loss': 0.7922, 'learning_rate': 1.8417856723223874e-05, 'epoch': 0.37} {'loss': 0.6948, 'learning_rate': 1.841768001046282e-05, 'epoch': 0.37} {'loss': 0.6748, 'learning_rate': 1.8417503288681455e-05, 'epoch': 0.37} {'loss': 0.9534, 'learning_rate': 1.841732655787998e-05, 'epoch': 0.37} {'loss': 0.8923, 'learning_rate': 1.841714981805858e-05, 'epoch': 0.37} {'loss': 1.0499, 'learning_rate': 1.8416973069217445e-05, 'epoch': 0.37} {'loss': 0.9252, 'learning_rate': 1.841679631135676e-05, 'epoch': 0.37} {'loss': 0.8609, 'learning_rate': 1.8416619544476723e-05, 'epoch': 0.37} {'loss': 0.6158, 'learning_rate': 1.8416442768577517e-05, 'epoch': 0.37} {'loss': 0.8121, 'learning_rate': 1.841626598365933e-05, 'epoch': 0.37} {'loss': 0.8267, 'learning_rate': 1.8416089189722358e-05, 'epoch': 0.37} {'loss': 0.8199, 'learning_rate': 1.8415912386766784e-05, 'epoch': 0.37} {'loss': 0.7853, 'learning_rate': 1.84157355747928e-05, 'epoch': 0.37} {'loss': 0.8958, 'learning_rate': 1.84155587538006e-05, 'epoch': 0.37} {'loss': 0.7769, 'learning_rate': 1.8415381923790366e-05, 'epoch': 0.37} {'loss': 0.7549, 'learning_rate': 1.8415205084762292e-05, 'epoch': 0.37} {'loss': 0.8098, 'learning_rate': 1.8415028236716566e-05, 'epoch': 0.37} {'loss': 0.8911, 'learning_rate': 1.8414851379653375e-05, 'epoch': 0.37} {'loss': 0.7374, 'learning_rate': 1.8414674513572916e-05, 'epoch': 0.37} {'loss': 1.0587, 'learning_rate': 1.841449763847537e-05, 'epoch': 0.37} {'loss': 1.061, 'learning_rate': 1.841432075436093e-05, 'epoch': 0.37} {'loss': 0.881, 'learning_rate': 1.8414143861229787e-05, 'epoch': 0.37} {'loss': 0.8858, 'learning_rate': 1.841396695908213e-05, 'epoch': 0.37} {'loss': 0.8565, 'learning_rate': 1.841379004791815e-05, 'epoch': 0.37} {'loss': 0.8182, 'learning_rate': 1.8413613127738032e-05, 'epoch': 0.37} {'loss': 0.8554, 'learning_rate': 1.841343619854197e-05, 'epoch': 0.37} {'loss': 0.8956, 'learning_rate': 1.841325926033015e-05, 'epoch': 0.37} {'loss': 0.7896, 'learning_rate': 1.841308231310276e-05, 'epoch': 0.37} {'loss': 1.0104, 'learning_rate': 1.841290535686e-05, 'epoch': 0.37} {'loss': 0.9341, 'learning_rate': 1.8412728391602045e-05, 'epoch': 0.37} {'loss': 0.9457, 'learning_rate': 1.8412551417329098e-05, 'epoch': 0.37} {'loss': 0.9066, 'learning_rate': 1.8412374434041345e-05, 'epoch': 0.37} {'loss': 0.8963, 'learning_rate': 1.841219744173897e-05, 'epoch': 0.37} {'loss': 1.034, 'learning_rate': 1.841202044042216e-05, 'epoch': 0.37} {'loss': 0.8458, 'learning_rate': 1.841184343009112e-05, 'epoch': 0.37} {'loss': 0.8807, 'learning_rate': 1.8411666410746028e-05, 'epoch': 0.37} {'loss': 0.7492, 'learning_rate': 1.841148938238708e-05, 'epoch': 0.37} {'loss': 1.0387, 'learning_rate': 1.8411312345014453e-05, 'epoch': 0.37} {'loss': 0.6753, 'learning_rate': 1.841113529862835e-05, 'epoch': 0.37} {'loss': 0.846, 'learning_rate': 1.841095824322896e-05, 'epoch': 0.37} {'loss': 0.7617, 'learning_rate': 1.8410781178816463e-05, 'epoch': 0.37} {'loss': 0.8855, 'learning_rate': 1.841060410539106e-05, 'epoch': 0.37} {'loss': 0.7792, 'learning_rate': 1.8410427022952932e-05, 'epoch': 0.37} {'loss': 0.926, 'learning_rate': 1.8410249931502274e-05, 'epoch': 0.37} {'loss': 0.7963, 'learning_rate': 1.8410072831039273e-05, 'epoch': 0.37} {'loss': 0.9026, 'learning_rate': 1.8409895721564123e-05, 'epoch': 0.37} {'loss': 0.8873, 'learning_rate': 1.8409718603077006e-05, 'epoch': 0.37} {'loss': 0.9355, 'learning_rate': 1.840954147557812e-05, 'epoch': 0.37} {'loss': 0.8763, 'learning_rate': 1.840936433906765e-05, 'epoch': 0.37} {'loss': 1.1306, 'learning_rate': 1.8409187193545786e-05, 'epoch': 0.37} {'loss': 0.8663, 'learning_rate': 1.840901003901272e-05, 'epoch': 0.37} {'loss': 0.7665, 'learning_rate': 1.8408832875468643e-05, 'epoch': 0.37} {'loss': 0.8331, 'learning_rate': 1.840865570291374e-05, 'epoch': 0.37} {'loss': 0.7331, 'learning_rate': 1.8408478521348205e-05, 'epoch': 0.37} {'loss': 0.7032, 'learning_rate': 1.8408301330772225e-05, 'epoch': 0.37} {'loss': 0.7677, 'learning_rate': 1.8408124131185993e-05, 'epoch': 0.37} {'loss': 1.0077, 'learning_rate': 1.8407946922589695e-05, 'epoch': 0.37} {'loss': 0.7575, 'learning_rate': 1.8407769704983525e-05, 'epoch': 0.37} {'loss': 0.9579, 'learning_rate': 1.840759247836767e-05, 'epoch': 0.37} {'loss': 0.7902, 'learning_rate': 1.8407415242742316e-05, 'epoch': 0.37} {'loss': 0.9087, 'learning_rate': 1.8407237998107664e-05, 'epoch': 0.37} {'loss': 0.8511, 'learning_rate': 1.8407060744463897e-05, 'epoch': 0.37} {'loss': 0.8472, 'learning_rate': 1.8406883481811204e-05, 'epoch': 0.37} {'loss': 0.8378, 'learning_rate': 1.8406706210149776e-05, 'epoch': 0.37} {'loss': 1.0396, 'learning_rate': 1.8406528929479804e-05, 'epoch': 0.37} {'loss': 0.8561, 'learning_rate': 1.840635163980148e-05, 'epoch': 0.37} {'loss': 0.6715, 'learning_rate': 1.840617434111499e-05, 'epoch': 0.37} {'loss': 1.0619, 'learning_rate': 1.8405997033420527e-05, 'epoch': 0.37} {'loss': 0.7274, 'learning_rate': 1.8405819716718278e-05, 'epoch': 0.37} {'loss': 0.7882, 'learning_rate': 1.8405642391008434e-05, 'epoch': 0.37} {'loss': 0.9939, 'learning_rate': 1.8405465056291187e-05, 'epoch': 0.37} {'loss': 0.8765, 'learning_rate': 1.8405287712566724e-05, 'epoch': 0.37} {'loss': 0.9593, 'learning_rate': 1.8405110359835237e-05, 'epoch': 0.37} {'loss': 0.9867, 'learning_rate': 1.8404932998096914e-05, 'epoch': 0.37} {'loss': 0.8663, 'learning_rate': 1.8404755627351948e-05, 'epoch': 0.37} {'loss': 0.9127, 'learning_rate': 1.8404578247600527e-05, 'epoch': 0.37} {'loss': 0.9665, 'learning_rate': 1.8404400858842843e-05, 'epoch': 0.37} {'loss': 0.8846, 'learning_rate': 1.8404223461079083e-05, 'epoch': 0.37} {'loss': 0.9859, 'learning_rate': 1.8404046054309446e-05, 'epoch': 0.37} {'loss': 0.8716, 'learning_rate': 1.8403868638534108e-05, 'epoch': 0.37} {'loss': 0.7337, 'learning_rate': 1.8403691213753267e-05, 'epoch': 0.37} {'loss': 0.8735, 'learning_rate': 1.8403513779967114e-05, 'epoch': 0.37} {'loss': 0.8314, 'learning_rate': 1.8403336337175836e-05, 'epoch': 0.37} {'loss': 0.9142, 'learning_rate': 1.840315888537963e-05, 'epoch': 0.37} {'loss': 0.8113, 'learning_rate': 1.8402981424578674e-05, 'epoch': 0.37} {'loss': 0.7386, 'learning_rate': 1.8402803954773167e-05, 'epoch': 0.37} {'loss': 0.761, 'learning_rate': 1.84026264759633e-05, 'epoch': 0.37} {'loss': 0.899, 'learning_rate': 1.8402448988149256e-05, 'epoch': 0.37} {'loss': 0.9051, 'learning_rate': 1.8402271491331235e-05, 'epoch': 0.37} {'loss': 0.7188, 'learning_rate': 1.8402093985509416e-05, 'epoch': 0.37} {'loss': 0.9234, 'learning_rate': 1.8401916470684e-05, 'epoch': 0.37} {'loss': 0.9769, 'learning_rate': 1.8401738946855164e-05, 'epoch': 0.37} {'loss': 0.8378, 'learning_rate': 1.8401561414023118e-05, 'epoch': 0.37} {'loss': 0.7987, 'learning_rate': 1.840138387218803e-05, 'epoch': 0.37} {'loss': 1.0082, 'learning_rate': 1.840120632135011e-05, 'epoch': 0.37} {'loss': 0.7842, 'learning_rate': 1.840102876150953e-05, 'epoch': 0.37} {'loss': 0.8442, 'learning_rate': 1.84008511926665e-05, 'epoch': 0.37} {'loss': 0.9292, 'learning_rate': 1.840067361482119e-05, 'epoch': 0.37} {'loss': 0.9641, 'learning_rate': 1.8400496027973805e-05, 'epoch': 0.37} {'loss': 1.0024, 'learning_rate': 1.8400318432124527e-05, 'epoch': 0.37} {'loss': 0.8283, 'learning_rate': 1.8400140827273555e-05, 'epoch': 0.37} {'loss': 0.9146, 'learning_rate': 1.839996321342107e-05, 'epoch': 0.37} {'loss': 0.9527, 'learning_rate': 1.8399785590567266e-05, 'epoch': 0.37} {'loss': 0.9096, 'learning_rate': 1.8399607958712335e-05, 'epoch': 0.37} {'loss': 0.781, 'learning_rate': 1.8399430317856467e-05, 'epoch': 0.37} {'loss': 0.908, 'learning_rate': 1.839925266799985e-05, 'epoch': 0.37} {'loss': 0.9271, 'learning_rate': 1.8399075009142673e-05, 'epoch': 0.37} {'loss': 0.819, 'learning_rate': 1.8398897341285132e-05, 'epoch': 0.37} {'loss': 0.8745, 'learning_rate': 1.8398719664427415e-05, 'epoch': 0.37} {'loss': 0.8375, 'learning_rate': 1.839854197856971e-05, 'epoch': 0.37} {'loss': 0.836, 'learning_rate': 1.839836428371221e-05, 'epoch': 0.37} {'loss': 0.8433, 'learning_rate': 1.8398186579855108e-05, 'epoch': 0.37} {'loss': 0.9297, 'learning_rate': 1.8398008866998585e-05, 'epoch': 0.37} {'loss': 0.9846, 'learning_rate': 1.8397831145142843e-05, 'epoch': 0.37} {'loss': 0.8433, 'learning_rate': 1.8397653414288063e-05, 'epoch': 0.37} {'loss': 0.7536, 'learning_rate': 1.839747567443444e-05, 'epoch': 0.37} {'loss': 0.8293, 'learning_rate': 1.8397297925582167e-05, 'epoch': 0.37} {'loss': 0.823, 'learning_rate': 1.8397120167731428e-05, 'epoch': 0.37} {'loss': 0.7545, 'learning_rate': 1.8396942400882417e-05, 'epoch': 0.37} {'loss': 0.8202, 'learning_rate': 1.8396764625035327e-05, 'epoch': 0.37} {'loss': 0.7803, 'learning_rate': 1.8396586840190345e-05, 'epoch': 0.37} {'loss': 0.9159, 'learning_rate': 1.839640904634766e-05, 'epoch': 0.37} {'loss': 0.6412, 'learning_rate': 1.8396231243507468e-05, 'epoch': 0.37} {'loss': 0.9114, 'learning_rate': 1.8396053431669955e-05, 'epoch': 0.37} {'loss': 0.7205, 'learning_rate': 1.8395875610835312e-05, 'epoch': 0.37} {'loss': 0.8764, 'learning_rate': 1.8395697781003733e-05, 'epoch': 0.37} {'loss': 0.9109, 'learning_rate': 1.83955199421754e-05, 'epoch': 0.37} {'loss': 1.0209, 'learning_rate': 1.8395342094350517e-05, 'epoch': 0.37} {'loss': 0.8438, 'learning_rate': 1.8395164237529263e-05, 'epoch': 0.37} {'loss': 0.9058, 'learning_rate': 1.8394986371711834e-05, 'epoch': 0.37} {'loss': 0.7787, 'learning_rate': 1.839480849689842e-05, 'epoch': 0.37} {'loss': 0.9466, 'learning_rate': 1.839463061308921e-05, 'epoch': 0.37} {'loss': 0.7865, 'learning_rate': 1.83944527202844e-05, 'epoch': 0.37} {'loss': 1.0148, 'learning_rate': 1.839427481848417e-05, 'epoch': 0.37} {'loss': 0.9812, 'learning_rate': 1.839409690768872e-05, 'epoch': 0.37} {'loss': 0.9784, 'learning_rate': 1.8393918987898236e-05, 'epoch': 0.37} {'loss': 0.9373, 'learning_rate': 1.8393741059112913e-05, 'epoch': 0.37} {'loss': 1.0465, 'learning_rate': 1.8393563121332935e-05, 'epoch': 0.37} {'loss': 0.9354, 'learning_rate': 1.83933851745585e-05, 'epoch': 0.37} {'loss': 0.8675, 'learning_rate': 1.8393207218789794e-05, 'epoch': 0.37} {'loss': 0.8858, 'learning_rate': 1.8393029254027008e-05, 'epoch': 0.37} {'loss': 0.8803, 'learning_rate': 1.8392851280270335e-05, 'epoch': 0.37} {'loss': 0.9983, 'learning_rate': 1.8392673297519964e-05, 'epoch': 0.37} {'loss': 1.0067, 'learning_rate': 1.8392495305776082e-05, 'epoch': 0.37} {'loss': 0.9847, 'learning_rate': 1.8392317305038892e-05, 'epoch': 0.37} {'loss': 0.925, 'learning_rate': 1.839213929530857e-05, 'epoch': 0.37} {'loss': 0.808, 'learning_rate': 1.8391961276585317e-05, 'epoch': 0.37} {'loss': 0.7724, 'learning_rate': 1.8391783248869318e-05, 'epoch': 0.37} {'loss': 0.7491, 'learning_rate': 1.8391605212160766e-05, 'epoch': 0.37} {'loss': 0.874, 'learning_rate': 1.8391427166459852e-05, 'epoch': 0.37} {'loss': 0.8499, 'learning_rate': 1.8391249111766768e-05, 'epoch': 0.37} {'loss': 0.7762, 'learning_rate': 1.83910710480817e-05, 'epoch': 0.37} {'loss': 0.9347, 'learning_rate': 1.8390892975404844e-05, 'epoch': 0.37} {'loss': 0.7595, 'learning_rate': 1.8390714893736387e-05, 'epoch': 0.37} {'loss': 0.8868, 'learning_rate': 1.8390536803076523e-05, 'epoch': 0.37} {'loss': 0.7686, 'learning_rate': 1.8390358703425444e-05, 'epoch': 0.37} {'loss': 0.9035, 'learning_rate': 1.8390180594783335e-05, 'epoch': 0.37} {'loss': 0.9605, 'learning_rate': 1.8390002477150394e-05, 'epoch': 0.37} {'loss': 0.9256, 'learning_rate': 1.8389824350526805e-05, 'epoch': 0.37} {'loss': 0.8667, 'learning_rate': 1.838964621491276e-05, 'epoch': 0.37} {'loss': 0.9404, 'learning_rate': 1.8389468070308454e-05, 'epoch': 0.37} {'loss': 0.9443, 'learning_rate': 1.8389289916714076e-05, 'epoch': 0.37} {'loss': 0.7617, 'learning_rate': 1.8389111754129814e-05, 'epoch': 0.37} {'loss': 0.9161, 'learning_rate': 1.8388933582555867e-05, 'epoch': 0.37} {'loss': 0.8733, 'learning_rate': 1.8388755401992417e-05, 'epoch': 0.37} {'loss': 0.9978, 'learning_rate': 1.838857721243966e-05, 'epoch': 0.37} {'loss': 0.884, 'learning_rate': 1.8388399013897787e-05, 'epoch': 0.37} {'loss': 0.8782, 'learning_rate': 1.8388220806366983e-05, 'epoch': 0.37} {'loss': 0.9425, 'learning_rate': 1.8388042589847445e-05, 'epoch': 0.37} {'loss': 1.0416, 'learning_rate': 1.8387864364339363e-05, 'epoch': 0.37} {'loss': 0.8421, 'learning_rate': 1.838768612984293e-05, 'epoch': 0.37} {'loss': 0.6828, 'learning_rate': 1.8387507886358328e-05, 'epoch': 0.37} {'loss': 0.8718, 'learning_rate': 1.8387329633885758e-05, 'epoch': 0.37} {'loss': 0.7673, 'learning_rate': 1.8387151372425406e-05, 'epoch': 0.37} {'loss': 0.8474, 'learning_rate': 1.8386973101977466e-05, 'epoch': 0.37} {'loss': 0.8372, 'learning_rate': 1.8386794822542126e-05, 'epoch': 0.37} {'loss': 0.8689, 'learning_rate': 1.8386616534119578e-05, 'epoch': 0.37} {'loss': 0.783, 'learning_rate': 1.8386438236710016e-05, 'epoch': 0.37} {'loss': 0.8861, 'learning_rate': 1.8386259930313625e-05, 'epoch': 0.37} {'loss': 0.9572, 'learning_rate': 1.8386081614930603e-05, 'epoch': 0.37} {'loss': 0.7874, 'learning_rate': 1.8385903290561135e-05, 'epoch': 0.37} {'loss': 1.0457, 'learning_rate': 1.8385724957205416e-05, 'epoch': 0.37} {'loss': 0.9646, 'learning_rate': 1.8385546614863637e-05, 'epoch': 0.37} {'loss': 0.8831, 'learning_rate': 1.8385368263535986e-05, 'epoch': 0.37} {'loss': 1.0535, 'learning_rate': 1.8385189903222658e-05, 'epoch': 0.37} {'loss': 0.8193, 'learning_rate': 1.8385011533923838e-05, 'epoch': 0.37} {'loss': 0.9903, 'learning_rate': 1.8384833155639727e-05, 'epoch': 0.37} {'loss': 0.9918, 'learning_rate': 1.8384654768370506e-05, 'epoch': 0.37} {'loss': 0.6995, 'learning_rate': 1.8384476372116374e-05, 'epoch': 0.37} {'loss': 0.7117, 'learning_rate': 1.8384297966877516e-05, 'epoch': 0.37} {'loss': 0.8489, 'learning_rate': 1.838411955265413e-05, 'epoch': 0.37} {'loss': 0.8764, 'learning_rate': 1.8383941129446398e-05, 'epoch': 0.37} {'loss': 0.7793, 'learning_rate': 1.8383762697254518e-05, 'epoch': 0.37} {'loss': 1.06, 'learning_rate': 1.838358425607868e-05, 'epoch': 0.37} {'loss': 0.9506, 'learning_rate': 1.8383405805919077e-05, 'epoch': 0.37} {'loss': 0.9856, 'learning_rate': 1.8383227346775893e-05, 'epoch': 0.37} {'loss': 0.7707, 'learning_rate': 1.838304887864933e-05, 'epoch': 0.37} {'loss': 0.7362, 'learning_rate': 1.838287040153957e-05, 'epoch': 0.37} {'loss': 0.8646, 'learning_rate': 1.8382691915446807e-05, 'epoch': 0.37} {'loss': 0.7989, 'learning_rate': 1.8382513420371238e-05, 'epoch': 0.37} {'loss': 1.0401, 'learning_rate': 1.8382334916313044e-05, 'epoch': 0.37} {'loss': 1.045, 'learning_rate': 1.8382156403272425e-05, 'epoch': 0.37} {'loss': 0.7627, 'learning_rate': 1.8381977881249566e-05, 'epoch': 0.37} {'loss': 0.9723, 'learning_rate': 1.8381799350244662e-05, 'epoch': 0.37} {'loss': 0.9972, 'learning_rate': 1.838162081025791e-05, 'epoch': 0.37} {'loss': 0.9745, 'learning_rate': 1.8381442261289483e-05, 'epoch': 0.37} {'loss': 0.757, 'learning_rate': 1.838126370333959e-05, 'epoch': 0.37} {'loss': 0.8466, 'learning_rate': 1.838108513640842e-05, 'epoch': 0.37} {'loss': 0.7735, 'learning_rate': 1.8380906560496154e-05, 'epoch': 0.37} {'loss': 0.8725, 'learning_rate': 1.8380727975602996e-05, 'epoch': 0.37} {'loss': 0.9035, 'learning_rate': 1.838054938172913e-05, 'epoch': 0.37} {'loss': 0.8487, 'learning_rate': 1.8380370778874746e-05, 'epoch': 0.37} {'loss': 0.7156, 'learning_rate': 1.8380192167040043e-05, 'epoch': 0.37} {'loss': 0.9705, 'learning_rate': 1.8380013546225204e-05, 'epoch': 0.37} {'loss': 0.8884, 'learning_rate': 1.8379834916430427e-05, 'epoch': 0.37} {'loss': 0.9314, 'learning_rate': 1.83796562776559e-05, 'epoch': 0.37} {'loss': 0.8217, 'learning_rate': 1.837947762990181e-05, 'epoch': 0.37} {'loss': 0.9023, 'learning_rate': 1.837929897316836e-05, 'epoch': 0.37} {'loss': 0.9701, 'learning_rate': 1.837912030745573e-05, 'epoch': 0.37} {'loss': 0.8512, 'learning_rate': 1.8378941632764122e-05, 'epoch': 0.37} {'loss': 0.9919, 'learning_rate': 1.8378762949093716e-05, 'epoch': 0.37} {'loss': 0.8896, 'learning_rate': 1.837858425644471e-05, 'epoch': 0.37} {'loss': 0.8463, 'learning_rate': 1.8378405554817294e-05, 'epoch': 0.37} {'loss': 0.8362, 'learning_rate': 1.8378226844211668e-05, 'epoch': 0.37} {'loss': 0.8911, 'learning_rate': 1.837804812462801e-05, 'epoch': 0.37} {'loss': 0.8365, 'learning_rate': 1.8377869396066515e-05, 'epoch': 0.37} {'loss': 0.948, 'learning_rate': 1.8377690658527382e-05, 'epoch': 0.37} {'loss': 0.9444, 'learning_rate': 1.8377511912010794e-05, 'epoch': 0.37} {'loss': 0.8543, 'learning_rate': 1.8377333156516948e-05, 'epoch': 0.37} {'loss': 0.8834, 'learning_rate': 1.837715439204603e-05, 'epoch': 0.37} {'loss': 0.9182, 'learning_rate': 1.8376975618598236e-05, 'epoch': 0.37} {'loss': 0.9168, 'learning_rate': 1.8376796836173757e-05, 'epoch': 0.37} {'loss': 0.8532, 'learning_rate': 1.8376618044772788e-05, 'epoch': 0.37} {'loss': 0.8443, 'learning_rate': 1.8376439244395513e-05, 'epoch': 0.37} {'loss': 0.9395, 'learning_rate': 1.8376260435042125e-05, 'epoch': 0.37} {'loss': 0.6985, 'learning_rate': 1.8376081616712823e-05, 'epoch': 0.37} {'loss': 0.7444, 'learning_rate': 1.837590278940779e-05, 'epoch': 0.37} {'loss': 0.8771, 'learning_rate': 1.8375723953127226e-05, 'epoch': 0.37} {'loss': 0.7856, 'learning_rate': 1.837554510787131e-05, 'epoch': 0.37} {'loss': 0.916, 'learning_rate': 1.837536625364025e-05, 'epoch': 0.37} {'loss': 0.835, 'learning_rate': 1.8375187390434224e-05, 'epoch': 0.37} {'loss': 0.7511, 'learning_rate': 1.8375008518253427e-05, 'epoch': 0.37} {'loss': 0.8653, 'learning_rate': 1.8374829637098056e-05, 'epoch': 0.37} {'loss': 0.9254, 'learning_rate': 1.83746507469683e-05, 'epoch': 0.37} {'loss': 0.9677, 'learning_rate': 1.8374471847864346e-05, 'epoch': 0.37} {'loss': 1.0292, 'learning_rate': 1.8374292939786395e-05, 'epoch': 0.37} {'loss': 0.9536, 'learning_rate': 1.8374114022734628e-05, 'epoch': 0.37} {'loss': 0.9839, 'learning_rate': 1.8373935096709244e-05, 'epoch': 0.37} {'loss': 0.9425, 'learning_rate': 1.8373756161710434e-05, 'epoch': 0.37} {'loss': 0.9764, 'learning_rate': 1.8373577217738384e-05, 'epoch': 0.37} {'loss': 0.9061, 'learning_rate': 1.8373398264793298e-05, 'epoch': 0.37} {'loss': 0.9303, 'learning_rate': 1.8373219302875354e-05, 'epoch': 0.37} {'loss': 0.8973, 'learning_rate': 1.837304033198475e-05, 'epoch': 0.37} {'loss': 0.9736, 'learning_rate': 1.837286135212168e-05, 'epoch': 0.37} {'loss': 0.8946, 'learning_rate': 1.837268236328633e-05, 'epoch': 0.37} {'loss': 0.9344, 'learning_rate': 1.83725033654789e-05, 'epoch': 0.37} {'loss': 0.8986, 'learning_rate': 1.8372324358699574e-05, 'epoch': 0.37} {'loss': 0.9496, 'learning_rate': 1.8372145342948546e-05, 'epoch': 0.37} {'loss': 0.9599, 'learning_rate': 1.8371966318226013e-05, 'epoch': 0.37} {'loss': 0.9546, 'learning_rate': 1.837178728453216e-05, 'epoch': 0.37} {'loss': 0.9102, 'learning_rate': 1.837160824186718e-05, 'epoch': 0.37} {'loss': 0.8741, 'learning_rate': 1.8371429190231265e-05, 'epoch': 0.37} {'loss': 0.9587, 'learning_rate': 1.8371250129624608e-05, 'epoch': 0.37} {'loss': 0.7964, 'learning_rate': 1.8371071060047404e-05, 'epoch': 0.37} {'loss': 0.8822, 'learning_rate': 1.8370891981499844e-05, 'epoch': 0.37} {'loss': 0.7687, 'learning_rate': 1.8370712893982113e-05, 'epoch': 0.37} {'loss': 0.8529, 'learning_rate': 1.8370533797494408e-05, 'epoch': 0.37} {'loss': 1.0099, 'learning_rate': 1.8370354692036923e-05, 'epoch': 0.37} {'loss': 0.8023, 'learning_rate': 1.8370175577609846e-05, 'epoch': 0.37} {'loss': 0.8174, 'learning_rate': 1.836999645421337e-05, 'epoch': 0.37} {'loss': 0.7057, 'learning_rate': 1.8369817321847686e-05, 'epoch': 0.37} {'loss': 0.8636, 'learning_rate': 1.8369638180512992e-05, 'epoch': 0.37} {'loss': 0.817, 'learning_rate': 1.836945903020947e-05, 'epoch': 0.37} {'loss': 0.9229, 'learning_rate': 1.836927987093732e-05, 'epoch': 0.37} {'loss': 0.8648, 'learning_rate': 1.836910070269673e-05, 'epoch': 0.37} {'loss': 1.0052, 'learning_rate': 1.8368921525487894e-05, 'epoch': 0.37} {'loss': 0.976, 'learning_rate': 1.8368742339311005e-05, 'epoch': 0.37} {'loss': 0.8727, 'learning_rate': 1.8368563144166252e-05, 'epoch': 0.37} {'loss': 0.8989, 'learning_rate': 1.836838394005383e-05, 'epoch': 0.37} {'loss': 0.8605, 'learning_rate': 1.8368204726973924e-05, 'epoch': 0.37} {'loss': 0.8553, 'learning_rate': 1.8368025504926737e-05, 'epoch': 0.37} {'loss': 0.9342, 'learning_rate': 1.836784627391245e-05, 'epoch': 0.37} {'loss': 0.7684, 'learning_rate': 1.8367667033931266e-05, 'epoch': 0.37} {'loss': 0.8413, 'learning_rate': 1.836748778498337e-05, 'epoch': 0.37} {'loss': 0.8566, 'learning_rate': 1.8367308527068953e-05, 'epoch': 0.37} {'loss': 0.9231, 'learning_rate': 1.836712926018821e-05, 'epoch': 0.37} {'loss': 0.8383, 'learning_rate': 1.8366949984341338e-05, 'epoch': 0.37} {'loss': 0.7716, 'learning_rate': 1.836677069952852e-05, 'epoch': 0.37} {'loss': 1.0234, 'learning_rate': 1.836659140574995e-05, 'epoch': 0.37} {'loss': 1.0051, 'learning_rate': 1.8366412103005827e-05, 'epoch': 0.37} {'loss': 0.9168, 'learning_rate': 1.836623279129633e-05, 'epoch': 0.37} {'loss': 0.7963, 'learning_rate': 1.8366053470621668e-05, 'epoch': 0.37} {'loss': 0.7645, 'learning_rate': 1.8365874140982022e-05, 'epoch': 0.37} {'loss': 0.9906, 'learning_rate': 1.8365694802377587e-05, 'epoch': 0.37} {'loss': 0.9821, 'learning_rate': 1.8365515454808554e-05, 'epoch': 0.37} {'loss': 0.9841, 'learning_rate': 1.8365336098275118e-05, 'epoch': 0.37} {'loss': 0.9334, 'learning_rate': 1.836515673277747e-05, 'epoch': 0.37} {'loss': 0.9788, 'learning_rate': 1.83649773583158e-05, 'epoch': 0.37} {'loss': 0.9411, 'learning_rate': 1.83647979748903e-05, 'epoch': 0.37} {'loss': 0.9011, 'learning_rate': 1.8364618582501162e-05, 'epoch': 0.37} {'loss': 0.8601, 'learning_rate': 1.8364439181148587e-05, 'epoch': 0.37} {'loss': 0.7878, 'learning_rate': 1.8364259770832756e-05, 'epoch': 0.37} {'loss': 0.9332, 'learning_rate': 1.8364080351553867e-05, 'epoch': 0.37} {'loss': 0.859, 'learning_rate': 1.836390092331211e-05, 'epoch': 0.37} {'loss': 0.9552, 'learning_rate': 1.836372148610768e-05, 'epoch': 0.37} {'loss': 0.9455, 'learning_rate': 1.8363542039940764e-05, 'epoch': 0.37} {'loss': 0.9179, 'learning_rate': 1.8363362584811564e-05, 'epoch': 0.37} {'loss': 0.8489, 'learning_rate': 1.836318312072026e-05, 'epoch': 0.37} {'loss': 0.8594, 'learning_rate': 1.8363003647667055e-05, 'epoch': 0.37} {'loss': 0.8779, 'learning_rate': 1.8362824165652135e-05, 'epoch': 0.37} {'loss': 0.7156, 'learning_rate': 1.8362644674675695e-05, 'epoch': 0.37} {'loss': 0.732, 'learning_rate': 1.8362465174737923e-05, 'epoch': 0.37} {'loss': 0.9731, 'learning_rate': 1.8362285665839018e-05, 'epoch': 0.37} {'loss': 0.8847, 'learning_rate': 1.8362106147979168e-05, 'epoch': 0.37} {'loss': 0.9528, 'learning_rate': 1.8361926621158566e-05, 'epoch': 0.37} {'loss': 0.7524, 'learning_rate': 1.8361747085377407e-05, 'epoch': 0.37} {'loss': 0.8774, 'learning_rate': 1.8361567540635882e-05, 'epoch': 0.37} {'loss': 0.8263, 'learning_rate': 1.8361387986934182e-05, 'epoch': 0.37} {'loss': 0.9516, 'learning_rate': 1.8361208424272496e-05, 'epoch': 0.37} {'loss': 0.6887, 'learning_rate': 1.8361028852651025e-05, 'epoch': 0.37} {'loss': 0.9068, 'learning_rate': 1.8360849272069954e-05, 'epoch': 0.37} {'loss': 0.805, 'learning_rate': 1.836066968252948e-05, 'epoch': 0.37} {'loss': 0.843, 'learning_rate': 1.8360490084029793e-05, 'epoch': 0.37} {'loss': 0.9724, 'learning_rate': 1.836031047657109e-05, 'epoch': 0.37} {'loss': 0.8577, 'learning_rate': 1.8360130860153555e-05, 'epoch': 0.37} {'loss': 0.9564, 'learning_rate': 1.8359951234777387e-05, 'epoch': 0.37} {'loss': 0.8509, 'learning_rate': 1.8359771600442778e-05, 'epoch': 0.37} {'loss': 0.874, 'learning_rate': 1.835959195714992e-05, 'epoch': 0.37} {'loss': 0.8464, 'learning_rate': 1.8359412304898998e-05, 'epoch': 0.37} {'loss': 0.8256, 'learning_rate': 1.8359232643690216e-05, 'epoch': 0.37} {'loss': 0.9673, 'learning_rate': 1.8359052973523762e-05, 'epoch': 0.37} {'loss': 0.8601, 'learning_rate': 1.835887329439983e-05, 'epoch': 0.37} {'loss': 0.9803, 'learning_rate': 1.8358693606318606e-05, 'epoch': 0.38} {'loss': 0.7341, 'learning_rate': 1.835851390928029e-05, 'epoch': 0.38} {'loss': 0.9521, 'learning_rate': 1.8358334203285075e-05, 'epoch': 0.38} {'loss': 0.8058, 'learning_rate': 1.8358154488333146e-05, 'epoch': 0.38} {'loss': 0.9675, 'learning_rate': 1.8357974764424705e-05, 'epoch': 0.38} {'loss': 0.9216, 'learning_rate': 1.8357795031559935e-05, 'epoch': 0.38} {'loss': 0.8663, 'learning_rate': 1.8357615289739034e-05, 'epoch': 0.38} {'loss': 0.8859, 'learning_rate': 1.8357435538962193e-05, 'epoch': 0.38} {'loss': 0.8019, 'learning_rate': 1.8357255779229608e-05, 'epoch': 0.38} {'loss': 0.9414, 'learning_rate': 1.835707601054147e-05, 'epoch': 0.38} {'loss': 1.012, 'learning_rate': 1.8356896232897966e-05, 'epoch': 0.38} {'loss': 0.9131, 'learning_rate': 1.8356716446299295e-05, 'epoch': 0.38} {'loss': 0.8254, 'learning_rate': 1.835653665074565e-05, 'epoch': 0.38} {'loss': 0.7668, 'learning_rate': 1.8356356846237223e-05, 'epoch': 0.38} {'loss': 0.7492, 'learning_rate': 1.8356177032774204e-05, 'epoch': 0.38} {'loss': 0.9523, 'learning_rate': 1.8355997210356787e-05, 'epoch': 0.38} {'loss': 0.7891, 'learning_rate': 1.8355817378985164e-05, 'epoch': 0.38} {'loss': 0.7639, 'learning_rate': 1.835563753865953e-05, 'epoch': 0.38} {'loss': 0.8984, 'learning_rate': 1.8355457689380075e-05, 'epoch': 0.38} {'loss': 0.799, 'learning_rate': 1.8355277831146994e-05, 'epoch': 0.38} {'loss': 0.8509, 'learning_rate': 1.835509796396048e-05, 'epoch': 0.38} {'loss': 0.8717, 'learning_rate': 1.835491808782072e-05, 'epoch': 0.38} {'loss': 0.8453, 'learning_rate': 1.8354738202727916e-05, 'epoch': 0.38} {'loss': 1.1123, 'learning_rate': 1.8354558308682252e-05, 'epoch': 0.38} {'loss': 0.737, 'learning_rate': 1.8354378405683924e-05, 'epoch': 0.38} {'loss': 1.0245, 'learning_rate': 1.8354198493733132e-05, 'epoch': 0.38} {'loss': 0.9224, 'learning_rate': 1.8354018572830056e-05, 'epoch': 0.38} {'loss': 0.8743, 'learning_rate': 1.8353838642974898e-05, 'epoch': 0.38} {'loss': 1.0527, 'learning_rate': 1.8353658704167846e-05, 'epoch': 0.38} {'loss': 0.8187, 'learning_rate': 1.83534787564091e-05, 'epoch': 0.38} {'loss': 0.7799, 'learning_rate': 1.835329879969884e-05, 'epoch': 0.38} {'loss': 0.8107, 'learning_rate': 1.835311883403727e-05, 'epoch': 0.38} {'loss': 0.7457, 'learning_rate': 1.8352938859424577e-05, 'epoch': 0.38} {'loss': 0.8253, 'learning_rate': 1.835275887586096e-05, 'epoch': 0.38} {'loss': 0.8013, 'learning_rate': 1.8352578883346606e-05, 'epoch': 0.38} {'loss': 0.7549, 'learning_rate': 1.835239888188171e-05, 'epoch': 0.38} {'loss': 0.8259, 'learning_rate': 1.8352218871466466e-05, 'epoch': 0.38} {'loss': 1.021, 'learning_rate': 1.8352038852101064e-05, 'epoch': 0.38} {'loss': 0.6942, 'learning_rate': 1.83518588237857e-05, 'epoch': 0.38} {'loss': 0.9744, 'learning_rate': 1.8351678786520563e-05, 'epoch': 0.38} {'loss': 0.9473, 'learning_rate': 1.835149874030585e-05, 'epoch': 0.38} {'loss': 0.8756, 'learning_rate': 1.8351318685141753e-05, 'epoch': 0.38} {'loss': 0.8721, 'learning_rate': 1.8351138621028465e-05, 'epoch': 0.38} {'loss': 0.8234, 'learning_rate': 1.8350958547966176e-05, 'epoch': 0.38} {'loss': 0.7263, 'learning_rate': 1.835077846595508e-05, 'epoch': 0.38} {'loss': 1.043, 'learning_rate': 1.8350598374995375e-05, 'epoch': 0.38} {'loss': 0.9735, 'learning_rate': 1.8350418275087247e-05, 'epoch': 0.38} {'loss': 0.8725, 'learning_rate': 1.8350238166230893e-05, 'epoch': 0.38} {'loss': 0.8307, 'learning_rate': 1.8350058048426507e-05, 'epoch': 0.38} {'loss': 0.911, 'learning_rate': 1.8349877921674276e-05, 'epoch': 0.38} {'loss': 0.7664, 'learning_rate': 1.83496977859744e-05, 'epoch': 0.38} {'loss': 0.7733, 'learning_rate': 1.8349517641327073e-05, 'epoch': 0.38} {'loss': 0.9491, 'learning_rate': 1.834933748773248e-05, 'epoch': 0.38} {'loss': 0.8155, 'learning_rate': 1.8349157325190815e-05, 'epoch': 0.38} {'loss': 0.8509, 'learning_rate': 1.8348977153702277e-05, 'epoch': 0.38} {'loss': 0.8275, 'learning_rate': 1.8348796973267062e-05, 'epoch': 0.38} {'loss': 0.9222, 'learning_rate': 1.834861678388535e-05, 'epoch': 0.38} {'loss': 0.9858, 'learning_rate': 1.8348436585557346e-05, 'epoch': 0.38} {'loss': 0.8817, 'learning_rate': 1.834825637828324e-05, 'epoch': 0.38} {'loss': 0.7355, 'learning_rate': 1.8348076162063216e-05, 'epoch': 0.38} {'loss': 0.8691, 'learning_rate': 1.8347895936897482e-05, 'epoch': 0.38} {'loss': 0.8399, 'learning_rate': 1.8347715702786223e-05, 'epoch': 0.38} {'loss': 0.8018, 'learning_rate': 1.8347535459729632e-05, 'epoch': 0.38} {'loss': 0.8906, 'learning_rate': 1.8347355207727905e-05, 'epoch': 0.38} {'loss': 0.8736, 'learning_rate': 1.834717494678123e-05, 'epoch': 0.38} {'loss': 0.8532, 'learning_rate': 1.8346994676889808e-05, 'epoch': 0.38} {'loss': 0.861, 'learning_rate': 1.8346814398053823e-05, 'epoch': 0.38} {'loss': 0.8327, 'learning_rate': 1.834663411027348e-05, 'epoch': 0.38} {'loss': 1.0348, 'learning_rate': 1.834645381354896e-05, 'epoch': 0.38} {'loss': 1.0728, 'learning_rate': 1.834627350788046e-05, 'epoch': 0.38} {'loss': 0.8361, 'learning_rate': 1.8346093193268176e-05, 'epoch': 0.38} {'loss': 0.831, 'learning_rate': 1.83459128697123e-05, 'epoch': 0.38} {'loss': 0.9041, 'learning_rate': 1.834573253721303e-05, 'epoch': 0.38} {'loss': 0.9438, 'learning_rate': 1.834555219577055e-05, 'epoch': 0.38} {'loss': 0.7793, 'learning_rate': 1.8345371845385054e-05, 'epoch': 0.38} {'loss': 1.0187, 'learning_rate': 1.8345191486056745e-05, 'epoch': 0.38} {'loss': 0.9309, 'learning_rate': 1.8345011117785808e-05, 'epoch': 0.38} {'loss': 0.7918, 'learning_rate': 1.8344830740572435e-05, 'epoch': 0.38} {'loss': 0.7341, 'learning_rate': 1.8344650354416827e-05, 'epoch': 0.38} {'loss': 0.7822, 'learning_rate': 1.8344469959319174e-05, 'epoch': 0.38} {'loss': 0.8876, 'learning_rate': 1.8344289555279665e-05, 'epoch': 0.38} {'loss': 0.905, 'learning_rate': 1.83441091422985e-05, 'epoch': 0.38} {'loss': 0.7619, 'learning_rate': 1.8343928720375866e-05, 'epoch': 0.38} {'loss': 0.7529, 'learning_rate': 1.834374828951196e-05, 'epoch': 0.38} {'loss': 0.7471, 'learning_rate': 1.8343567849706974e-05, 'epoch': 0.38} {'loss': 0.7543, 'learning_rate': 1.8343387400961103e-05, 'epoch': 0.38} {'loss': 0.8777, 'learning_rate': 1.834320694327454e-05, 'epoch': 0.38} {'loss': 0.8236, 'learning_rate': 1.8343026476647477e-05, 'epoch': 0.38} {'loss': 0.8214, 'learning_rate': 1.834284600108011e-05, 'epoch': 0.38} {'loss': 0.8937, 'learning_rate': 1.8342665516572625e-05, 'epoch': 0.38} {'loss': 0.8079, 'learning_rate': 1.8342485023125224e-05, 'epoch': 0.38} {'loss': 0.8173, 'learning_rate': 1.83423045207381e-05, 'epoch': 0.38} {'loss': 0.9406, 'learning_rate': 1.8342124009411438e-05, 'epoch': 0.38} {'loss': 0.8965, 'learning_rate': 1.8341943489145443e-05, 'epoch': 0.38} {'loss': 1.0775, 'learning_rate': 1.8341762959940302e-05, 'epoch': 0.38} {'loss': 0.8798, 'learning_rate': 1.8341582421796205e-05, 'epoch': 0.38} {'loss': 0.6674, 'learning_rate': 1.834140187471335e-05, 'epoch': 0.38} {'loss': 0.7916, 'learning_rate': 1.8341221318691936e-05, 'epoch': 0.38} {'loss': 0.8941, 'learning_rate': 1.8341040753732145e-05, 'epoch': 0.38} {'loss': 0.8784, 'learning_rate': 1.8340860179834178e-05, 'epoch': 0.38} {'loss': 0.8051, 'learning_rate': 1.8340679596998225e-05, 'epoch': 0.38} {'loss': 0.9939, 'learning_rate': 1.834049900522448e-05, 'epoch': 0.38} {'loss': 0.8915, 'learning_rate': 1.834031840451314e-05, 'epoch': 0.38} {'loss': 0.8345, 'learning_rate': 1.83401377948644e-05, 'epoch': 0.38} {'loss': 0.9841, 'learning_rate': 1.8339957176278442e-05, 'epoch': 0.38} {'loss': 0.8747, 'learning_rate': 1.8339776548755473e-05, 'epoch': 0.38} {'loss': 0.8569, 'learning_rate': 1.8339595912295676e-05, 'epoch': 0.38} {'loss': 0.8674, 'learning_rate': 1.8339415266899255e-05, 'epoch': 0.38} {'loss': 0.9615, 'learning_rate': 1.8339234612566393e-05, 'epoch': 0.38} {'loss': 0.9072, 'learning_rate': 1.8339053949297288e-05, 'epoch': 0.38} {'loss': 0.9661, 'learning_rate': 1.8338873277092135e-05, 'epoch': 0.38} {'loss': 0.822, 'learning_rate': 1.833869259595113e-05, 'epoch': 0.38} {'loss': 0.8225, 'learning_rate': 1.833851190587446e-05, 'epoch': 0.38} {'loss': 0.6405, 'learning_rate': 1.8338331206862324e-05, 'epoch': 0.38} {'loss': 0.9505, 'learning_rate': 1.833815049891491e-05, 'epoch': 0.38} {'loss': 1.0528, 'learning_rate': 1.8337969782032416e-05, 'epoch': 0.38} {'loss': 0.7258, 'learning_rate': 1.8337789056215038e-05, 'epoch': 0.38} {'loss': 0.8072, 'learning_rate': 1.8337608321462967e-05, 'epoch': 0.38} {'loss': 0.924, 'learning_rate': 1.833742757777639e-05, 'epoch': 0.38} {'loss': 0.9208, 'learning_rate': 1.8337246825155513e-05, 'epoch': 0.38} {'loss': 1.0119, 'learning_rate': 1.833706606360052e-05, 'epoch': 0.38} {'loss': 0.7704, 'learning_rate': 1.833688529311161e-05, 'epoch': 0.38} {'loss': 0.8252, 'learning_rate': 1.8336704513688973e-05, 'epoch': 0.38} {'loss': 0.8217, 'learning_rate': 1.8336523725332808e-05, 'epoch': 0.38} {'loss': 0.8513, 'learning_rate': 1.83363429280433e-05, 'epoch': 0.38} {'loss': 0.8845, 'learning_rate': 1.8336162121820656e-05, 'epoch': 0.38} {'loss': 0.883, 'learning_rate': 1.8335981306665056e-05, 'epoch': 0.38} {'loss': 0.7631, 'learning_rate': 1.83358004825767e-05, 'epoch': 0.38} {'loss': 0.7223, 'learning_rate': 1.8335619649555784e-05, 'epoch': 0.38} {'loss': 0.8607, 'learning_rate': 1.8335438807602498e-05, 'epoch': 0.38} {'loss': 0.9036, 'learning_rate': 1.8335257956717035e-05, 'epoch': 0.38} {'loss': 0.7457, 'learning_rate': 1.8335077096899594e-05, 'epoch': 0.38} {'loss': 0.9449, 'learning_rate': 1.8334896228150366e-05, 'epoch': 0.38} {'loss': 0.8539, 'learning_rate': 1.833471535046954e-05, 'epoch': 0.38} {'loss': 1.0639, 'learning_rate': 1.8334534463857317e-05, 'epoch': 0.38} {'loss': 1.0468, 'learning_rate': 1.833435356831389e-05, 'epoch': 0.38} {'loss': 0.9781, 'learning_rate': 1.8334172663839448e-05, 'epoch': 0.38} {'loss': 0.8772, 'learning_rate': 1.833399175043419e-05, 'epoch': 0.38} {'loss': 0.6822, 'learning_rate': 1.8333810828098306e-05, 'epoch': 0.38} {'loss': 0.8869, 'learning_rate': 1.8333629896831992e-05, 'epoch': 0.38} {'loss': 0.7297, 'learning_rate': 1.8333448956635444e-05, 'epoch': 0.38} {'loss': 0.748, 'learning_rate': 1.8333268007508847e-05, 'epoch': 0.38} {'loss': 0.8539, 'learning_rate': 1.8333087049452406e-05, 'epoch': 0.38} {'loss': 0.9421, 'learning_rate': 1.833290608246631e-05, 'epoch': 0.38} {'loss': 0.8921, 'learning_rate': 1.833272510655075e-05, 'epoch': 0.38} {'loss': 0.8208, 'learning_rate': 1.8332544121705927e-05, 'epoch': 0.38} {'loss': 0.9737, 'learning_rate': 1.833236312793203e-05, 'epoch': 0.38} {'loss': 0.7817, 'learning_rate': 1.833218212522925e-05, 'epoch': 0.38} {'loss': 0.9915, 'learning_rate': 1.8332001113597787e-05, 'epoch': 0.38} {'loss': 0.8653, 'learning_rate': 1.8331820093037836e-05, 'epoch': 0.38} {'loss': 0.8562, 'learning_rate': 1.833163906354958e-05, 'epoch': 0.38} {'loss': 0.9295, 'learning_rate': 1.833145802513323e-05, 'epoch': 0.38} {'loss': 0.7753, 'learning_rate': 1.833127697778897e-05, 'epoch': 0.38} {'loss': 0.8299, 'learning_rate': 1.8331095921516987e-05, 'epoch': 0.38} {'loss': 0.9725, 'learning_rate': 1.8330914856317488e-05, 'epoch': 0.38} {'loss': 0.9193, 'learning_rate': 1.833073378219066e-05, 'epoch': 0.38} {'loss': 0.8808, 'learning_rate': 1.83305526991367e-05, 'epoch': 0.38} {'loss': 0.8378, 'learning_rate': 1.8330371607155802e-05, 'epoch': 0.38} {'loss': 0.8972, 'learning_rate': 1.833019050624816e-05, 'epoch': 0.38} {'loss': 0.8274, 'learning_rate': 1.833000939641396e-05, 'epoch': 0.38} {'loss': 0.8732, 'learning_rate': 1.832982827765341e-05, 'epoch': 0.38} {'loss': 0.9497, 'learning_rate': 1.8329647149966695e-05, 'epoch': 0.38} {'loss': 0.7077, 'learning_rate': 1.832946601335401e-05, 'epoch': 0.38} {'loss': 0.8574, 'learning_rate': 1.8329284867815555e-05, 'epoch': 0.38} {'loss': 0.8808, 'learning_rate': 1.8329103713351513e-05, 'epoch': 0.38} {'loss': 0.9306, 'learning_rate': 1.832892254996209e-05, 'epoch': 0.38} {'loss': 1.0037, 'learning_rate': 1.8328741377647473e-05, 'epoch': 0.38} {'loss': 0.8744, 'learning_rate': 1.8328560196407855e-05, 'epoch': 0.38} {'loss': 0.9559, 'learning_rate': 1.8328379006243437e-05, 'epoch': 0.38} {'loss': 0.7486, 'learning_rate': 1.8328197807154406e-05, 'epoch': 0.38} {'loss': 0.7582, 'learning_rate': 1.8328016599140964e-05, 'epoch': 0.38} {'loss': 0.9275, 'learning_rate': 1.83278353822033e-05, 'epoch': 0.38} {'loss': 0.8059, 'learning_rate': 1.8327654156341602e-05, 'epoch': 0.38} {'loss': 0.822, 'learning_rate': 1.832747292155608e-05, 'epoch': 0.38} {'loss': 0.8074, 'learning_rate': 1.8327291677846914e-05, 'epoch': 0.38} {'loss': 1.0202, 'learning_rate': 1.8327110425214304e-05, 'epoch': 0.38} {'loss': 0.8116, 'learning_rate': 1.832692916365844e-05, 'epoch': 0.38} {'loss': 0.8401, 'learning_rate': 1.8326747893179523e-05, 'epoch': 0.38} {'loss': 0.9678, 'learning_rate': 1.8326566613777745e-05, 'epoch': 0.38} {'loss': 0.8763, 'learning_rate': 1.83263853254533e-05, 'epoch': 0.38} {'loss': 0.9967, 'learning_rate': 1.8326204028206382e-05, 'epoch': 0.38} {'loss': 1.0141, 'learning_rate': 1.8326022722037183e-05, 'epoch': 0.38} {'loss': 0.8958, 'learning_rate': 1.83258414069459e-05, 'epoch': 0.38} {'loss': 0.9954, 'learning_rate': 1.8325660082932725e-05, 'epoch': 0.38} {'loss': 0.8452, 'learning_rate': 1.8325478749997855e-05, 'epoch': 0.38} {'loss': 0.8883, 'learning_rate': 1.832529740814148e-05, 'epoch': 0.38} {'loss': 1.094, 'learning_rate': 1.8325116057363804e-05, 'epoch': 0.38} {'loss': 0.8684, 'learning_rate': 1.832493469766501e-05, 'epoch': 0.38} {'loss': 0.8655, 'learning_rate': 1.83247533290453e-05, 'epoch': 0.38} {'loss': 0.7238, 'learning_rate': 1.8324571951504864e-05, 'epoch': 0.38} {'loss': 0.8295, 'learning_rate': 1.8324390565043898e-05, 'epoch': 0.38} {'loss': 0.8934, 'learning_rate': 1.8324209169662594e-05, 'epoch': 0.38} {'loss': 0.7866, 'learning_rate': 1.832402776536115e-05, 'epoch': 0.38} {'loss': 0.9319, 'learning_rate': 1.832384635213976e-05, 'epoch': 0.38} {'loss': 0.997, 'learning_rate': 1.8323664929998615e-05, 'epoch': 0.38} {'loss': 0.9087, 'learning_rate': 1.8323483498937915e-05, 'epoch': 0.38} {'loss': 0.7323, 'learning_rate': 1.8323302058957847e-05, 'epoch': 0.38} {'loss': 0.9002, 'learning_rate': 1.8323120610058613e-05, 'epoch': 0.38} {'loss': 0.7841, 'learning_rate': 1.8322939152240403e-05, 'epoch': 0.38} {'loss': 0.758, 'learning_rate': 1.8322757685503414e-05, 'epoch': 0.38} {'loss': 0.974, 'learning_rate': 1.8322576209847836e-05, 'epoch': 0.38} {'loss': 0.8794, 'learning_rate': 1.8322394725273868e-05, 'epoch': 0.38} {'loss': 0.9168, 'learning_rate': 1.8322213231781704e-05, 'epoch': 0.38} {'loss': 0.7911, 'learning_rate': 1.832203172937154e-05, 'epoch': 0.38} {'loss': 1.0227, 'learning_rate': 1.832185021804356e-05, 'epoch': 0.38} {'loss': 0.7615, 'learning_rate': 1.8321668697797973e-05, 'epoch': 0.38} {'loss': 0.9119, 'learning_rate': 1.8321487168634965e-05, 'epoch': 0.38} {'loss': 1.0304, 'learning_rate': 1.8321305630554732e-05, 'epoch': 0.38} {'loss': 0.9251, 'learning_rate': 1.8321124083557468e-05, 'epoch': 0.38} {'loss': 0.7727, 'learning_rate': 1.832094252764337e-05, 'epoch': 0.38} {'loss': 1.0291, 'learning_rate': 1.832076096281263e-05, 'epoch': 0.38} {'loss': 0.8739, 'learning_rate': 1.8320579389065446e-05, 'epoch': 0.38} {'loss': 0.835, 'learning_rate': 1.8320397806402007e-05, 'epoch': 0.38} {'loss': 0.8073, 'learning_rate': 1.8320216214822512e-05, 'epoch': 0.38} {'loss': 0.8659, 'learning_rate': 1.8320034614327156e-05, 'epoch': 0.38} {'loss': 0.7304, 'learning_rate': 1.831985300491613e-05, 'epoch': 0.38} {'loss': 1.0098, 'learning_rate': 1.831967138658963e-05, 'epoch': 0.38} {'loss': 0.947, 'learning_rate': 1.8319489759347852e-05, 'epoch': 0.38} {'loss': 1.0142, 'learning_rate': 1.8319308123190992e-05, 'epoch': 0.38} {'loss': 0.8585, 'learning_rate': 1.831912647811924e-05, 'epoch': 0.38} {'loss': 0.6923, 'learning_rate': 1.8318944824132794e-05, 'epoch': 0.38} {'loss': 0.7636, 'learning_rate': 1.831876316123185e-05, 'epoch': 0.38} {'loss': 0.9744, 'learning_rate': 1.8318581489416595e-05, 'epoch': 0.38} {'loss': 0.8964, 'learning_rate': 1.831839980868723e-05, 'epoch': 0.38} {'loss': 0.9351, 'learning_rate': 1.8318218119043955e-05, 'epoch': 0.38} {'loss': 0.8695, 'learning_rate': 1.8318036420486957e-05, 'epoch': 0.38} {'loss': 0.8206, 'learning_rate': 1.8317854713016428e-05, 'epoch': 0.38} {'loss': 0.9084, 'learning_rate': 1.8317672996632568e-05, 'epoch': 0.38} {'loss': 0.8511, 'learning_rate': 1.831749127133557e-05, 'epoch': 0.38} {'loss': 0.7032, 'learning_rate': 1.831730953712563e-05, 'epoch': 0.38} {'loss': 0.7884, 'learning_rate': 1.8317127794002944e-05, 'epoch': 0.38} {'loss': 0.7721, 'learning_rate': 1.8316946041967704e-05, 'epoch': 0.38} {'loss': 1.1187, 'learning_rate': 1.8316764281020106e-05, 'epoch': 0.38} {'loss': 0.9952, 'learning_rate': 1.8316582511160342e-05, 'epoch': 0.38} {'loss': 0.848, 'learning_rate': 1.8316400732388613e-05, 'epoch': 0.38} {'loss': 0.9097, 'learning_rate': 1.8316218944705108e-05, 'epoch': 0.38} {'loss': 1.0055, 'learning_rate': 1.8316037148110023e-05, 'epoch': 0.38} {'loss': 0.7462, 'learning_rate': 1.8315855342603555e-05, 'epoch': 0.38} {'loss': 0.9445, 'learning_rate': 1.8315673528185898e-05, 'epoch': 0.38} {'loss': 0.8856, 'learning_rate': 1.8315491704857247e-05, 'epoch': 0.38} {'loss': 0.9341, 'learning_rate': 1.8315309872617796e-05, 'epoch': 0.38} {'loss': 0.8852, 'learning_rate': 1.8315128031467738e-05, 'epoch': 0.38} {'loss': 0.9298, 'learning_rate': 1.831494618140727e-05, 'epoch': 0.38} {'loss': 0.8612, 'learning_rate': 1.8314764322436587e-05, 'epoch': 0.38} {'loss': 0.9734, 'learning_rate': 1.831458245455588e-05, 'epoch': 0.38} {'loss': 0.7447, 'learning_rate': 1.8314400577765353e-05, 'epoch': 0.38} {'loss': 1.1459, 'learning_rate': 1.8314218692065194e-05, 'epoch': 0.38} {'loss': 0.9537, 'learning_rate': 1.83140367974556e-05, 'epoch': 0.38} {'loss': 1.0264, 'learning_rate': 1.831385489393676e-05, 'epoch': 0.38} {'loss': 1.019, 'learning_rate': 1.8313672981508878e-05, 'epoch': 0.38} {'loss': 0.7915, 'learning_rate': 1.8313491060172145e-05, 'epoch': 0.38} {'loss': 0.951, 'learning_rate': 1.8313309129926757e-05, 'epoch': 0.38} {'loss': 0.7452, 'learning_rate': 1.8313127190772907e-05, 'epoch': 0.38} {'loss': 0.8158, 'learning_rate': 1.831294524271079e-05, 'epoch': 0.38} {'loss': 1.051, 'learning_rate': 1.8312763285740606e-05, 'epoch': 0.38} {'loss': 0.8584, 'learning_rate': 1.831258131986254e-05, 'epoch': 0.38} {'loss': 0.9301, 'learning_rate': 1.8312399345076796e-05, 'epoch': 0.38} {'loss': 0.8566, 'learning_rate': 1.8312217361383565e-05, 'epoch': 0.38} {'loss': 0.8781, 'learning_rate': 1.8312035368783047e-05, 'epoch': 0.38} {'loss': 0.8163, 'learning_rate': 1.8311853367275425e-05, 'epoch': 0.38} {'loss': 0.7976, 'learning_rate': 1.8311671356860907e-05, 'epoch': 0.38} {'loss': 0.968, 'learning_rate': 1.8311489337539684e-05, 'epoch': 0.38} {'loss': 0.9571, 'learning_rate': 1.8311307309311947e-05, 'epoch': 0.38} {'loss': 1.0222, 'learning_rate': 1.8311125272177893e-05, 'epoch': 0.38} {'loss': 0.9936, 'learning_rate': 1.831094322613772e-05, 'epoch': 0.38} {'loss': 0.8711, 'learning_rate': 1.8310761171191624e-05, 'epoch': 0.38} {'loss': 0.8745, 'learning_rate': 1.8310579107339796e-05, 'epoch': 0.38} {'loss': 0.9951, 'learning_rate': 1.831039703458243e-05, 'epoch': 0.38} {'loss': 0.908, 'learning_rate': 1.8310214952919724e-05, 'epoch': 0.38} {'loss': 0.7448, 'learning_rate': 1.8310032862351874e-05, 'epoch': 0.38} {'loss': 0.9787, 'learning_rate': 1.8309850762879074e-05, 'epoch': 0.38} {'loss': 0.7751, 'learning_rate': 1.8309668654501516e-05, 'epoch': 0.38} {'loss': 0.8658, 'learning_rate': 1.83094865372194e-05, 'epoch': 0.38} {'loss': 0.8133, 'learning_rate': 1.8309304411032918e-05, 'epoch': 0.38} {'loss': 0.995, 'learning_rate': 1.8309122275942268e-05, 'epoch': 0.38} {'loss': 0.9698, 'learning_rate': 1.8308940131947645e-05, 'epoch': 0.38} {'loss': 0.8998, 'learning_rate': 1.8308757979049238e-05, 'epoch': 0.38} {'loss': 0.8866, 'learning_rate': 1.830857581724725e-05, 'epoch': 0.38} {'loss': 0.8305, 'learning_rate': 1.8308393646541875e-05, 'epoch': 0.38} {'loss': 0.9443, 'learning_rate': 1.8308211466933304e-05, 'epoch': 0.38} {'loss': 0.8379, 'learning_rate': 1.8308029278421733e-05, 'epoch': 0.38} {'loss': 0.9455, 'learning_rate': 1.830784708100736e-05, 'epoch': 0.38} {'loss': 0.8635, 'learning_rate': 1.830766487469038e-05, 'epoch': 0.38} {'loss': 0.8464, 'learning_rate': 1.830748265947099e-05, 'epoch': 0.38} {'loss': 0.8903, 'learning_rate': 1.8307300435349378e-05, 'epoch': 0.38} {'loss': 1.0824, 'learning_rate': 1.8307118202325745e-05, 'epoch': 0.38} {'loss': 0.8406, 'learning_rate': 1.8306935960400286e-05, 'epoch': 0.38} {'loss': 0.9677, 'learning_rate': 1.8306753709573195e-05, 'epoch': 0.38} {'loss': 0.9, 'learning_rate': 1.8306571449844666e-05, 'epoch': 0.38} {'loss': 0.9479, 'learning_rate': 1.8306389181214898e-05, 'epoch': 0.38} {'loss': 0.8191, 'learning_rate': 1.8306206903684084e-05, 'epoch': 0.38} {'loss': 0.9182, 'learning_rate': 1.8306024617252417e-05, 'epoch': 0.38} {'loss': 1.0886, 'learning_rate': 1.8305842321920098e-05, 'epoch': 0.38} {'loss': 0.8724, 'learning_rate': 1.830566001768732e-05, 'epoch': 0.38} {'loss': 0.9178, 'learning_rate': 1.8305477704554274e-05, 'epoch': 0.38} {'loss': 1.0112, 'learning_rate': 1.8305295382521162e-05, 'epoch': 0.38} {'loss': 0.7905, 'learning_rate': 1.8305113051588173e-05, 'epoch': 0.38} {'loss': 1.019, 'learning_rate': 1.830493071175551e-05, 'epoch': 0.38} {'loss': 0.8477, 'learning_rate': 1.830474836302336e-05, 'epoch': 0.38} {'loss': 0.9676, 'learning_rate': 1.8304566005391925e-05, 'epoch': 0.38} {'loss': 0.8354, 'learning_rate': 1.83043836388614e-05, 'epoch': 0.38} {'loss': 0.8726, 'learning_rate': 1.830420126343198e-05, 'epoch': 0.38} {'loss': 0.9167, 'learning_rate': 1.8304018879103853e-05, 'epoch': 0.38} {'loss': 0.8944, 'learning_rate': 1.8303836485877222e-05, 'epoch': 0.38} {'loss': 1.0057, 'learning_rate': 1.8303654083752283e-05, 'epoch': 0.38} {'loss': 0.9207, 'learning_rate': 1.8303471672729226e-05, 'epoch': 0.38} {'loss': 0.7606, 'learning_rate': 1.8303289252808253e-05, 'epoch': 0.38} {'loss': 0.8008, 'learning_rate': 1.8303106823989552e-05, 'epoch': 0.38} {'loss': 0.8081, 'learning_rate': 1.8302924386273326e-05, 'epoch': 0.38} {'loss': 0.9223, 'learning_rate': 1.8302741939659767e-05, 'epoch': 0.38} {'loss': 1.0223, 'learning_rate': 1.830255948414907e-05, 'epoch': 0.38} {'loss': 0.7871, 'learning_rate': 1.8302377019741427e-05, 'epoch': 0.38} {'loss': 0.7158, 'learning_rate': 1.8302194546437044e-05, 'epoch': 0.38} {'loss': 0.8502, 'learning_rate': 1.8302012064236107e-05, 'epoch': 0.38} {'loss': 0.829, 'learning_rate': 1.8301829573138817e-05, 'epoch': 0.38} {'loss': 0.9497, 'learning_rate': 1.8301647073145367e-05, 'epoch': 0.38} {'loss': 0.9726, 'learning_rate': 1.830146456425595e-05, 'epoch': 0.38} {'loss': 0.664, 'learning_rate': 1.8301282046470766e-05, 'epoch': 0.38} {'loss': 0.8065, 'learning_rate': 1.830109951979001e-05, 'epoch': 0.38} {'loss': 0.8581, 'learning_rate': 1.8300916984213873e-05, 'epoch': 0.38} {'loss': 0.996, 'learning_rate': 1.830073443974256e-05, 'epoch': 0.38} {'loss': 0.7952, 'learning_rate': 1.830055188637626e-05, 'epoch': 0.38} {'loss': 0.9732, 'learning_rate': 1.8300369324115165e-05, 'epoch': 0.38} {'loss': 0.7267, 'learning_rate': 1.830018675295948e-05, 'epoch': 0.38} {'loss': 1.0005, 'learning_rate': 1.8300004172909394e-05, 'epoch': 0.38} {'loss': 0.8727, 'learning_rate': 1.82998215839651e-05, 'epoch': 0.38} {'loss': 0.8543, 'learning_rate': 1.8299638986126803e-05, 'epoch': 0.38} {'loss': 0.9861, 'learning_rate': 1.8299456379394693e-05, 'epoch': 0.38} {'loss': 0.8116, 'learning_rate': 1.8299273763768967e-05, 'epoch': 0.38} {'loss': 0.7902, 'learning_rate': 1.829909113924982e-05, 'epoch': 0.38} {'loss': 0.8423, 'learning_rate': 1.8298908505837445e-05, 'epoch': 0.38} {'loss': 0.7006, 'learning_rate': 1.8298725863532044e-05, 'epoch': 0.38} {'loss': 0.9839, 'learning_rate': 1.8298543212333805e-05, 'epoch': 0.38} {'loss': 0.7193, 'learning_rate': 1.829836055224293e-05, 'epoch': 0.38} {'loss': 0.9361, 'learning_rate': 1.8298177883259616e-05, 'epoch': 0.38} {'loss': 0.8227, 'learning_rate': 1.8297995205384053e-05, 'epoch': 0.38} {'loss': 0.8066, 'learning_rate': 1.829781251861644e-05, 'epoch': 0.38} {'loss': 0.7825, 'learning_rate': 1.829762982295697e-05, 'epoch': 0.38} {'loss': 0.8139, 'learning_rate': 1.8297447118405842e-05, 'epoch': 0.38} {'loss': 0.8623, 'learning_rate': 1.829726440496325e-05, 'epoch': 0.38} {'loss': 1.0964, 'learning_rate': 1.829708168262939e-05, 'epoch': 0.38} {'loss': 0.9375, 'learning_rate': 1.829689895140446e-05, 'epoch': 0.38} {'loss': 0.8246, 'learning_rate': 1.8296716211288653e-05, 'epoch': 0.38} {'loss': 0.9027, 'learning_rate': 1.8296533462282163e-05, 'epoch': 0.38} {'loss': 0.6862, 'learning_rate': 1.8296350704385192e-05, 'epoch': 0.38} {'loss': 0.7697, 'learning_rate': 1.8296167937597933e-05, 'epoch': 0.38} {'loss': 0.874, 'learning_rate': 1.8295985161920578e-05, 'epoch': 0.38} {'loss': 0.7755, 'learning_rate': 1.8295802377353328e-05, 'epoch': 0.38} {'loss': 1.0739, 'learning_rate': 1.8295619583896375e-05, 'epoch': 0.38} {'loss': 0.8936, 'learning_rate': 1.829543678154992e-05, 'epoch': 0.38} {'loss': 0.9456, 'learning_rate': 1.8295253970314157e-05, 'epoch': 0.38} {'loss': 0.8344, 'learning_rate': 1.8295071150189273e-05, 'epoch': 0.38} {'loss': 1.1277, 'learning_rate': 1.829488832117548e-05, 'epoch': 0.38} {'loss': 0.8951, 'learning_rate': 1.8294705483272964e-05, 'epoch': 0.38} {'loss': 0.9079, 'learning_rate': 1.8294522636481918e-05, 'epoch': 0.38} {'loss': 0.8594, 'learning_rate': 1.8294339780802545e-05, 'epoch': 0.38} {'loss': 0.931, 'learning_rate': 1.829415691623504e-05, 'epoch': 0.38} {'loss': 0.8497, 'learning_rate': 1.8293974042779596e-05, 'epoch': 0.38} {'loss': 0.901, 'learning_rate': 1.829379116043641e-05, 'epoch': 0.38} {'loss': 0.6591, 'learning_rate': 1.8293608269205677e-05, 'epoch': 0.38} {'loss': 0.7147, 'learning_rate': 1.8293425369087595e-05, 'epoch': 0.38} {'loss': 0.8857, 'learning_rate': 1.829324246008236e-05, 'epoch': 0.38} {'loss': 0.9581, 'learning_rate': 1.8293059542190164e-05, 'epoch': 0.38} {'loss': 0.9841, 'learning_rate': 1.8292876615411212e-05, 'epoch': 0.38} {'loss': 0.8307, 'learning_rate': 1.8292693679745688e-05, 'epoch': 0.38} {'loss': 0.971, 'learning_rate': 1.82925107351938e-05, 'epoch': 0.38} {'loss': 0.8306, 'learning_rate': 1.8292327781755738e-05, 'epoch': 0.38} {'loss': 0.8276, 'learning_rate': 1.8292144819431692e-05, 'epoch': 0.38} {'loss': 0.8927, 'learning_rate': 1.829196184822187e-05, 'epoch': 0.38} {'loss': 0.8226, 'learning_rate': 1.829177886812646e-05, 'epoch': 0.38} {'loss': 0.6901, 'learning_rate': 1.8291595879145663e-05, 'epoch': 0.38} {'loss': 0.8604, 'learning_rate': 1.829141288127967e-05, 'epoch': 0.38} {'loss': 0.8325, 'learning_rate': 1.8291229874528678e-05, 'epoch': 0.38} {'loss': 0.8427, 'learning_rate': 1.829104685889289e-05, 'epoch': 0.38} {'loss': 0.8218, 'learning_rate': 1.8290863834372495e-05, 'epoch': 0.38} {'loss': 0.8443, 'learning_rate': 1.829068080096769e-05, 'epoch': 0.38} {'loss': 0.7778, 'learning_rate': 1.8290497758678675e-05, 'epoch': 0.38} {'loss': 0.8094, 'learning_rate': 1.829031470750564e-05, 'epoch': 0.38} {'loss': 0.9787, 'learning_rate': 1.8290131647448784e-05, 'epoch': 0.38} {'loss': 0.8501, 'learning_rate': 1.8289948578508308e-05, 'epoch': 0.38} {'loss': 0.9076, 'learning_rate': 1.82897655006844e-05, 'epoch': 0.38} {'loss': 0.8325, 'learning_rate': 1.8289582413977262e-05, 'epoch': 0.38} {'loss': 0.9546, 'learning_rate': 1.828939931838709e-05, 'epoch': 0.38} {'loss': 0.8114, 'learning_rate': 1.8289216213914076e-05, 'epoch': 0.38} {'loss': 0.8682, 'learning_rate': 1.8289033100558417e-05, 'epoch': 0.38} {'loss': 0.853, 'learning_rate': 1.8288849978320314e-05, 'epoch': 0.38} {'loss': 0.8224, 'learning_rate': 1.828866684719996e-05, 'epoch': 0.38} {'loss': 0.8363, 'learning_rate': 1.8288483707197548e-05, 'epoch': 0.38} {'loss': 0.9335, 'learning_rate': 1.8288300558313282e-05, 'epoch': 0.38} {'loss': 0.8706, 'learning_rate': 1.828811740054735e-05, 'epoch': 0.38} {'loss': 0.7125, 'learning_rate': 1.8287934233899957e-05, 'epoch': 0.38} {'loss': 1.1977, 'learning_rate': 1.828775105837129e-05, 'epoch': 0.38} {'loss': 0.7843, 'learning_rate': 1.828756787396155e-05, 'epoch': 0.38} {'loss': 0.8227, 'learning_rate': 1.8287384680670936e-05, 'epoch': 0.38} {'loss': 0.7192, 'learning_rate': 1.828720147849964e-05, 'epoch': 0.38} {'loss': 0.7502, 'learning_rate': 1.8287018267447857e-05, 'epoch': 0.38} {'loss': 0.9118, 'learning_rate': 1.828683504751579e-05, 'epoch': 0.38} {'loss': 0.9022, 'learning_rate': 1.828665181870363e-05, 'epoch': 0.38} {'loss': 0.8282, 'learning_rate': 1.8286468581011575e-05, 'epoch': 0.38} {'loss': 0.7885, 'learning_rate': 1.8286285334439816e-05, 'epoch': 0.38} {'loss': 0.7254, 'learning_rate': 1.828610207898856e-05, 'epoch': 0.38} {'loss': 0.9742, 'learning_rate': 1.8285918814658e-05, 'epoch': 0.38} {'loss': 0.6592, 'learning_rate': 1.8285735541448325e-05, 'epoch': 0.38} {'loss': 0.813, 'learning_rate': 1.828555225935974e-05, 'epoch': 0.38} {'loss': 0.8162, 'learning_rate': 1.8285368968392435e-05, 'epoch': 0.38} {'loss': 0.9752, 'learning_rate': 1.828518566854661e-05, 'epoch': 0.38} {'loss': 0.8052, 'learning_rate': 1.828500235982246e-05, 'epoch': 0.38} {'loss': 0.8542, 'learning_rate': 1.8284819042220185e-05, 'epoch': 0.38} {'loss': 0.9787, 'learning_rate': 1.8284635715739974e-05, 'epoch': 0.38} {'loss': 0.8714, 'learning_rate': 1.8284452380382032e-05, 'epoch': 0.38} {'loss': 0.7686, 'learning_rate': 1.828426903614655e-05, 'epoch': 0.38} {'loss': 0.7371, 'learning_rate': 1.8284085683033727e-05, 'epoch': 0.38} {'loss': 0.8445, 'learning_rate': 1.8283902321043758e-05, 'epoch': 0.38} {'loss': 0.8295, 'learning_rate': 1.8283718950176842e-05, 'epoch': 0.38} {'loss': 0.7127, 'learning_rate': 1.828353557043317e-05, 'epoch': 0.38} {'loss': 0.9448, 'learning_rate': 1.8283352181812943e-05, 'epoch': 0.38} {'loss': 0.7199, 'learning_rate': 1.828316878431636e-05, 'epoch': 0.38} {'loss': 0.8717, 'learning_rate': 1.828298537794361e-05, 'epoch': 0.38} {'loss': 0.763, 'learning_rate': 1.8282801962694893e-05, 'epoch': 0.38} {'loss': 0.824, 'learning_rate': 1.8282618538570408e-05, 'epoch': 0.38} {'loss': 0.8688, 'learning_rate': 1.828243510557035e-05, 'epoch': 0.38} {'loss': 0.8187, 'learning_rate': 1.8282251663694914e-05, 'epoch': 0.38} {'loss': 0.9049, 'learning_rate': 1.82820682129443e-05, 'epoch': 0.38} {'loss': 0.9005, 'learning_rate': 1.82818847533187e-05, 'epoch': 0.38} {'loss': 0.9353, 'learning_rate': 1.8281701284818316e-05, 'epoch': 0.38} {'loss': 0.8775, 'learning_rate': 1.828151780744334e-05, 'epoch': 0.38} {'loss': 0.9194, 'learning_rate': 1.828133432119397e-05, 'epoch': 0.38} {'loss': 0.9627, 'learning_rate': 1.82811508260704e-05, 'epoch': 0.38} {'loss': 0.9035, 'learning_rate': 1.8280967322072833e-05, 'epoch': 0.38} {'loss': 0.7911, 'learning_rate': 1.8280783809201464e-05, 'epoch': 0.38} {'loss': 0.8658, 'learning_rate': 1.8280600287456483e-05, 'epoch': 0.38} {'loss': 0.8306, 'learning_rate': 1.8280416756838093e-05, 'epoch': 0.38} {'loss': 0.9064, 'learning_rate': 1.828023321734649e-05, 'epoch': 0.38} {'loss': 0.7899, 'learning_rate': 1.828004966898187e-05, 'epoch': 0.38} {'loss': 0.901, 'learning_rate': 1.827986611174443e-05, 'epoch': 0.38} {'loss': 0.8899, 'learning_rate': 1.8279682545634363e-05, 'epoch': 0.38} {'loss': 0.8605, 'learning_rate': 1.827949897065187e-05, 'epoch': 0.38} {'loss': 0.9559, 'learning_rate': 1.827931538679715e-05, 'epoch': 0.38} {'loss': 0.8113, 'learning_rate': 1.8279131794070393e-05, 'epoch': 0.38} {'loss': 0.8448, 'learning_rate': 1.8278948192471798e-05, 'epoch': 0.38} {'loss': 0.9017, 'learning_rate': 1.8278764582001566e-05, 'epoch': 0.38} {'loss': 0.9003, 'learning_rate': 1.827858096265989e-05, 'epoch': 0.38} {'loss': 0.9282, 'learning_rate': 1.8278397334446964e-05, 'epoch': 0.38} {'loss': 0.7267, 'learning_rate': 1.827821369736299e-05, 'epoch': 0.38} {'loss': 0.8048, 'learning_rate': 1.8278030051408163e-05, 'epoch': 0.38} {'loss': 0.7767, 'learning_rate': 1.827784639658268e-05, 'epoch': 0.38} {'loss': 0.9482, 'learning_rate': 1.8277662732886742e-05, 'epoch': 0.38} {'loss': 1.0319, 'learning_rate': 1.8277479060320535e-05, 'epoch': 0.38} {'loss': 0.8225, 'learning_rate': 1.827729537888426e-05, 'epoch': 0.38} {'loss': 0.8443, 'learning_rate': 1.8277111688578123e-05, 'epoch': 0.38} {'loss': 0.9955, 'learning_rate': 1.8276927989402308e-05, 'epoch': 0.38} {'loss': 0.8949, 'learning_rate': 1.827674428135702e-05, 'epoch': 0.38} {'loss': 0.8094, 'learning_rate': 1.8276560564442455e-05, 'epoch': 0.38} {'loss': 0.9765, 'learning_rate': 1.8276376838658808e-05, 'epoch': 0.38} {'loss': 0.8876, 'learning_rate': 1.8276193104006275e-05, 'epoch': 0.38} {'loss': 1.0439, 'learning_rate': 1.8276009360485053e-05, 'epoch': 0.38} {'loss': 0.7467, 'learning_rate': 1.827582560809534e-05, 'epoch': 0.38} {'loss': 0.8923, 'learning_rate': 1.8275641846837337e-05, 'epoch': 0.38} {'loss': 0.8616, 'learning_rate': 1.8275458076711234e-05, 'epoch': 0.38} {'loss': 0.857, 'learning_rate': 1.827527429771723e-05, 'epoch': 0.38} {'loss': 0.832, 'learning_rate': 1.8275090509855524e-05, 'epoch': 0.38} {'loss': 0.8029, 'learning_rate': 1.827490671312631e-05, 'epoch': 0.38} {'loss': 0.7773, 'learning_rate': 1.827472290752979e-05, 'epoch': 0.38} {'loss': 0.9575, 'learning_rate': 1.827453909306616e-05, 'epoch': 0.38} {'loss': 0.6846, 'learning_rate': 1.8274355269735605e-05, 'epoch': 0.38} {'loss': 0.7622, 'learning_rate': 1.8274171437538334e-05, 'epoch': 0.38} {'loss': 0.8068, 'learning_rate': 1.8273987596474546e-05, 'epoch': 0.38} {'loss': 0.8459, 'learning_rate': 1.827380374654443e-05, 'epoch': 0.38} {'loss': 0.9152, 'learning_rate': 1.8273619887748187e-05, 'epoch': 0.38} {'loss': 0.8507, 'learning_rate': 1.8273436020086016e-05, 'epoch': 0.38} {'loss': 0.9984, 'learning_rate': 1.827325214355811e-05, 'epoch': 0.38} {'loss': 0.7687, 'learning_rate': 1.827306825816467e-05, 'epoch': 0.38} {'loss': 0.9792, 'learning_rate': 1.827288436390589e-05, 'epoch': 0.38} {'loss': 0.8807, 'learning_rate': 1.8272700460781965e-05, 'epoch': 0.38} {'loss': 0.8587, 'learning_rate': 1.8272516548793096e-05, 'epoch': 0.38} {'loss': 0.9771, 'learning_rate': 1.827233262793948e-05, 'epoch': 0.38} {'loss': 0.7631, 'learning_rate': 1.827214869822131e-05, 'epoch': 0.38} {'loss': 0.6914, 'learning_rate': 1.8271964759638787e-05, 'epoch': 0.38} {'loss': 0.8165, 'learning_rate': 1.827178081219211e-05, 'epoch': 0.38} {'loss': 0.8707, 'learning_rate': 1.827159685588147e-05, 'epoch': 0.38} {'loss': 0.8557, 'learning_rate': 1.827141289070707e-05, 'epoch': 0.38} {'loss': 0.7461, 'learning_rate': 1.82712289166691e-05, 'epoch': 0.39} {'loss': 0.9508, 'learning_rate': 1.8271044933767768e-05, 'epoch': 0.39} {'loss': 0.8614, 'learning_rate': 1.827086094200326e-05, 'epoch': 0.39} {'loss': 0.8806, 'learning_rate': 1.827067694137578e-05, 'epoch': 0.39} {'loss': 0.8066, 'learning_rate': 1.8270492931885525e-05, 'epoch': 0.39} {'loss': 0.9489, 'learning_rate': 1.827030891353269e-05, 'epoch': 0.39} {'loss': 0.9881, 'learning_rate': 1.8270124886317467e-05, 'epoch': 0.39} {'loss': 0.9654, 'learning_rate': 1.8269940850240063e-05, 'epoch': 0.39} {'loss': 0.7528, 'learning_rate': 1.8269756805300673e-05, 'epoch': 0.39} {'loss': 0.8789, 'learning_rate': 1.8269572751499488e-05, 'epoch': 0.39} {'loss': 0.9972, 'learning_rate': 1.8269388688836712e-05, 'epoch': 0.39} {'loss': 0.7902, 'learning_rate': 1.826920461731254e-05, 'epoch': 0.39} {'loss': 0.9166, 'learning_rate': 1.8269020536927167e-05, 'epoch': 0.39} {'loss': 0.8577, 'learning_rate': 1.826883644768079e-05, 'epoch': 0.39} {'loss': 0.9721, 'learning_rate': 1.8268652349573613e-05, 'epoch': 0.39} {'loss': 0.8777, 'learning_rate': 1.8268468242605827e-05, 'epoch': 0.39} {'loss': 0.7491, 'learning_rate': 1.8268284126777632e-05, 'epoch': 0.39} {'loss': 0.8937, 'learning_rate': 1.8268100002089222e-05, 'epoch': 0.39} {'loss': 0.8519, 'learning_rate': 1.82679158685408e-05, 'epoch': 0.39} {'loss': 1.0701, 'learning_rate': 1.8267731726132556e-05, 'epoch': 0.39} {'loss': 0.7034, 'learning_rate': 1.8267547574864696e-05, 'epoch': 0.39} {'loss': 0.7096, 'learning_rate': 1.826736341473741e-05, 'epoch': 0.39} {'loss': 1.0435, 'learning_rate': 1.8267179245750895e-05, 'epoch': 0.39} {'loss': 0.8673, 'learning_rate': 1.8266995067905357e-05, 'epoch': 0.39} {'loss': 0.8757, 'learning_rate': 1.8266810881200982e-05, 'epoch': 0.39} {'loss': 0.7988, 'learning_rate': 1.8266626685637975e-05, 'epoch': 0.39} {'loss': 0.8253, 'learning_rate': 1.8266442481216534e-05, 'epoch': 0.39} {'loss': 0.8917, 'learning_rate': 1.826625826793685e-05, 'epoch': 0.39} {'loss': 0.7756, 'learning_rate': 1.8266074045799126e-05, 'epoch': 0.39} {'loss': 0.9233, 'learning_rate': 1.8265889814803558e-05, 'epoch': 0.39} {'loss': 0.8355, 'learning_rate': 1.8265705574950343e-05, 'epoch': 0.39} {'loss': 0.7627, 'learning_rate': 1.826552132623968e-05, 'epoch': 0.39} {'loss': 1.0688, 'learning_rate': 1.8265337068671764e-05, 'epoch': 0.39} {'loss': 0.8614, 'learning_rate': 1.826515280224679e-05, 'epoch': 0.39} {'loss': 1.0718, 'learning_rate': 1.826496852696496e-05, 'epoch': 0.39} {'loss': 0.8361, 'learning_rate': 1.826478424282647e-05, 'epoch': 0.39} {'loss': 0.83, 'learning_rate': 1.8264599949831524e-05, 'epoch': 0.39} {'loss': 0.7823, 'learning_rate': 1.8264415647980308e-05, 'epoch': 0.39} {'loss': 0.9714, 'learning_rate': 1.8264231337273024e-05, 'epoch': 0.39} {'loss': 0.8537, 'learning_rate': 1.826404701770987e-05, 'epoch': 0.39} {'loss': 0.8886, 'learning_rate': 1.8263862689291044e-05, 'epoch': 0.39} {'loss': 0.7613, 'learning_rate': 1.8263678352016745e-05, 'epoch': 0.39} {'loss': 0.8479, 'learning_rate': 1.826349400588717e-05, 'epoch': 0.39} {'loss': 1.0249, 'learning_rate': 1.8263309650902515e-05, 'epoch': 0.39} {'loss': 0.6629, 'learning_rate': 1.8263125287062976e-05, 'epoch': 0.39} {'loss': 0.9167, 'learning_rate': 1.8262940914368753e-05, 'epoch': 0.39} {'loss': 1.0523, 'learning_rate': 1.826275653282004e-05, 'epoch': 0.39} {'loss': 0.7847, 'learning_rate': 1.826257214241704e-05, 'epoch': 0.39} {'loss': 0.8716, 'learning_rate': 1.826238774315995e-05, 'epoch': 0.39} {'loss': 1.0245, 'learning_rate': 1.8262203335048965e-05, 'epoch': 0.39} {'loss': 0.9945, 'learning_rate': 1.8262018918084285e-05, 'epoch': 0.39} {'loss': 0.8543, 'learning_rate': 1.82618344922661e-05, 'epoch': 0.39} {'loss': 0.7451, 'learning_rate': 1.826165005759462e-05, 'epoch': 0.39} {'loss': 0.9749, 'learning_rate': 1.8261465614070032e-05, 'epoch': 0.39} {'loss': 0.7922, 'learning_rate': 1.826128116169254e-05, 'epoch': 0.39} {'loss': 0.9023, 'learning_rate': 1.826109670046234e-05, 'epoch': 0.39} {'loss': 0.9305, 'learning_rate': 1.826091223037963e-05, 'epoch': 0.39} {'loss': 0.8309, 'learning_rate': 1.8260727751444605e-05, 'epoch': 0.39} {'loss': 0.8288, 'learning_rate': 1.8260543263657467e-05, 'epoch': 0.39} {'loss': 0.9431, 'learning_rate': 1.8260358767018407e-05, 'epoch': 0.39} {'loss': 0.7571, 'learning_rate': 1.8260174261527634e-05, 'epoch': 0.39} {'loss': 0.8969, 'learning_rate': 1.825998974718533e-05, 'epoch': 0.39} {'loss': 0.9743, 'learning_rate': 1.8259805223991708e-05, 'epoch': 0.39} {'loss': 0.7387, 'learning_rate': 1.8259620691946956e-05, 'epoch': 0.39} {'loss': 0.8838, 'learning_rate': 1.8259436151051276e-05, 'epoch': 0.39} {'loss': 1.0436, 'learning_rate': 1.8259251601304867e-05, 'epoch': 0.39} {'loss': 1.0849, 'learning_rate': 1.8259067042707922e-05, 'epoch': 0.39} {'loss': 0.7959, 'learning_rate': 1.8258882475260642e-05, 'epoch': 0.39} {'loss': 0.6942, 'learning_rate': 1.8258697898963223e-05, 'epoch': 0.39} {'loss': 0.8315, 'learning_rate': 1.8258513313815865e-05, 'epoch': 0.39} {'loss': 0.8494, 'learning_rate': 1.8258328719818764e-05, 'epoch': 0.39} {'loss': 0.9025, 'learning_rate': 1.8258144116972117e-05, 'epoch': 0.39} {'loss': 0.735, 'learning_rate': 1.8257959505276124e-05, 'epoch': 0.39} {'loss': 0.9415, 'learning_rate': 1.8257774884730984e-05, 'epoch': 0.39} {'loss': 0.9365, 'learning_rate': 1.825759025533689e-05, 'epoch': 0.39} {'loss': 0.9333, 'learning_rate': 1.8257405617094045e-05, 'epoch': 0.39} {'loss': 0.8972, 'learning_rate': 1.8257220970002643e-05, 'epoch': 0.39} {'loss': 0.9629, 'learning_rate': 1.8257036314062886e-05, 'epoch': 0.39} {'loss': 0.9259, 'learning_rate': 1.8256851649274966e-05, 'epoch': 0.39} {'loss': 0.9599, 'learning_rate': 1.8256666975639086e-05, 'epoch': 0.39} {'loss': 0.7086, 'learning_rate': 1.825648229315544e-05, 'epoch': 0.39} {'loss': 0.8986, 'learning_rate': 1.8256297601824233e-05, 'epoch': 0.39} {'loss': 0.8022, 'learning_rate': 1.8256112901645656e-05, 'epoch': 0.39} {'loss': 0.8802, 'learning_rate': 1.8255928192619906e-05, 'epoch': 0.39} {'loss': 0.7926, 'learning_rate': 1.8255743474747184e-05, 'epoch': 0.39} {'loss': 0.7881, 'learning_rate': 1.825555874802769e-05, 'epoch': 0.39} {'loss': 1.0098, 'learning_rate': 1.8255374012461624e-05, 'epoch': 0.39} {'loss': 1.0738, 'learning_rate': 1.825518926804917e-05, 'epoch': 0.39} {'loss': 0.8051, 'learning_rate': 1.8255004514790543e-05, 'epoch': 0.39} {'loss': 0.7282, 'learning_rate': 1.825481975268593e-05, 'epoch': 0.39} {'loss': 1.005, 'learning_rate': 1.8254634981735532e-05, 'epoch': 0.39} {'loss': 1.0207, 'learning_rate': 1.8254450201939552e-05, 'epoch': 0.39} {'loss': 0.7696, 'learning_rate': 1.825426541329818e-05, 'epoch': 0.39} {'loss': 0.8532, 'learning_rate': 1.8254080615811622e-05, 'epoch': 0.39} {'loss': 0.9366, 'learning_rate': 1.8253895809480065e-05, 'epoch': 0.39} {'loss': 0.7462, 'learning_rate': 1.8253710994303718e-05, 'epoch': 0.39} {'loss': 0.8898, 'learning_rate': 1.8253526170282772e-05, 'epoch': 0.39} {'loss': 0.8839, 'learning_rate': 1.825334133741743e-05, 'epoch': 0.39} {'loss': 0.8819, 'learning_rate': 1.8253156495707885e-05, 'epoch': 0.39} {'loss': 0.7746, 'learning_rate': 1.8252971645154344e-05, 'epoch': 0.39} {'loss': 0.8689, 'learning_rate': 1.8252786785756992e-05, 'epoch': 0.39} {'loss': 0.8631, 'learning_rate': 1.8252601917516037e-05, 'epoch': 0.39} {'loss': 0.8766, 'learning_rate': 1.8252417040431676e-05, 'epoch': 0.39} {'loss': 0.9729, 'learning_rate': 1.8252232154504104e-05, 'epoch': 0.39} {'loss': 0.8708, 'learning_rate': 1.8252047259733518e-05, 'epoch': 0.39} {'loss': 0.9263, 'learning_rate': 1.8251862356120122e-05, 'epoch': 0.39} {'loss': 0.8572, 'learning_rate': 1.8251677443664108e-05, 'epoch': 0.39} {'loss': 0.8116, 'learning_rate': 1.825149252236568e-05, 'epoch': 0.39} {'loss': 0.9905, 'learning_rate': 1.825130759222503e-05, 'epoch': 0.39} {'loss': 0.9926, 'learning_rate': 1.825112265324236e-05, 'epoch': 0.39} {'loss': 0.992, 'learning_rate': 1.8250937705417868e-05, 'epoch': 0.39} {'loss': 0.7599, 'learning_rate': 1.8250752748751752e-05, 'epoch': 0.39} {'loss': 0.9362, 'learning_rate': 1.8250567783244208e-05, 'epoch': 0.39} {'loss': 0.9068, 'learning_rate': 1.825038280889544e-05, 'epoch': 0.39} {'loss': 0.7064, 'learning_rate': 1.825019782570564e-05, 'epoch': 0.39} {'loss': 0.8933, 'learning_rate': 1.8250012833675007e-05, 'epoch': 0.39} {'loss': 0.7616, 'learning_rate': 1.824982783280374e-05, 'epoch': 0.39} {'loss': 0.8274, 'learning_rate': 1.824964282309204e-05, 'epoch': 0.39} {'loss': 0.736, 'learning_rate': 1.82494578045401e-05, 'epoch': 0.39} {'loss': 0.9211, 'learning_rate': 1.8249272777148123e-05, 'epoch': 0.39} {'loss': 0.8213, 'learning_rate': 1.8249087740916306e-05, 'epoch': 0.39} {'loss': 0.8119, 'learning_rate': 1.824890269584485e-05, 'epoch': 0.39} {'loss': 0.834, 'learning_rate': 1.8248717641933945e-05, 'epoch': 0.39} {'loss': 0.8976, 'learning_rate': 1.8248532579183796e-05, 'epoch': 0.39} {'loss': 1.1136, 'learning_rate': 1.8248347507594605e-05, 'epoch': 0.39} {'loss': 0.9155, 'learning_rate': 1.824816242716656e-05, 'epoch': 0.39} {'loss': 0.6649, 'learning_rate': 1.8247977337899863e-05, 'epoch': 0.39} {'loss': 0.6667, 'learning_rate': 1.824779223979472e-05, 'epoch': 0.39} {'loss': 0.8809, 'learning_rate': 1.8247607132851318e-05, 'epoch': 0.39} {'loss': 0.7623, 'learning_rate': 1.8247422017069863e-05, 'epoch': 0.39} {'loss': 0.7142, 'learning_rate': 1.824723689245055e-05, 'epoch': 0.39} {'loss': 0.661, 'learning_rate': 1.824705175899358e-05, 'epoch': 0.39} {'loss': 0.8568, 'learning_rate': 1.824686661669915e-05, 'epoch': 0.39} {'loss': 0.8346, 'learning_rate': 1.8246681465567455e-05, 'epoch': 0.39} {'loss': 1.0314, 'learning_rate': 1.8246496305598697e-05, 'epoch': 0.39} {'loss': 0.9226, 'learning_rate': 1.8246311136793075e-05, 'epoch': 0.39} {'loss': 0.9619, 'learning_rate': 1.8246125959150785e-05, 'epoch': 0.39} {'loss': 0.9536, 'learning_rate': 1.8245940772672027e-05, 'epoch': 0.39} {'loss': 1.0081, 'learning_rate': 1.8245755577357004e-05, 'epoch': 0.39} {'loss': 1.0352, 'learning_rate': 1.8245570373205903e-05, 'epoch': 0.39} {'loss': 0.9647, 'learning_rate': 1.8245385160218934e-05, 'epoch': 0.39} {'loss': 0.9259, 'learning_rate': 1.8245199938396286e-05, 'epoch': 0.39} {'loss': 0.7932, 'learning_rate': 1.8245014707738166e-05, 'epoch': 0.39} {'loss': 0.712, 'learning_rate': 1.8244829468244768e-05, 'epoch': 0.39} {'loss': 0.9681, 'learning_rate': 1.8244644219916287e-05, 'epoch': 0.39} {'loss': 0.8943, 'learning_rate': 1.824445896275293e-05, 'epoch': 0.39} {'loss': 0.8435, 'learning_rate': 1.824427369675489e-05, 'epoch': 0.39} {'loss': 0.8938, 'learning_rate': 1.824408842192237e-05, 'epoch': 0.39} {'loss': 1.0108, 'learning_rate': 1.8243903138255562e-05, 'epoch': 0.39} {'loss': 1.0001, 'learning_rate': 1.8243717845754665e-05, 'epoch': 0.39} {'loss': 0.8069, 'learning_rate': 1.8243532544419883e-05, 'epoch': 0.39} {'loss': 0.8616, 'learning_rate': 1.824334723425141e-05, 'epoch': 0.39} {'loss': 0.6538, 'learning_rate': 1.824316191524945e-05, 'epoch': 0.39} {'loss': 0.9184, 'learning_rate': 1.8242976587414197e-05, 'epoch': 0.39} {'loss': 0.8311, 'learning_rate': 1.824279125074585e-05, 'epoch': 0.39} {'loss': 0.9059, 'learning_rate': 1.824260590524461e-05, 'epoch': 0.39} {'loss': 1.0025, 'learning_rate': 1.8242420550910667e-05, 'epoch': 0.39} {'loss': 0.9035, 'learning_rate': 1.824223518774423e-05, 'epoch': 0.39} {'loss': 0.8468, 'learning_rate': 1.8242049815745498e-05, 'epoch': 0.39} {'loss': 0.8166, 'learning_rate': 1.8241864434914664e-05, 'epoch': 0.39} {'loss': 0.9739, 'learning_rate': 1.8241679045251927e-05, 'epoch': 0.39} {'loss': 0.8525, 'learning_rate': 1.8241493646757488e-05, 'epoch': 0.39} {'loss': 0.9074, 'learning_rate': 1.8241308239431545e-05, 'epoch': 0.39} {'loss': 0.7706, 'learning_rate': 1.8241122823274294e-05, 'epoch': 0.39} {'loss': 0.9181, 'learning_rate': 1.824093739828594e-05, 'epoch': 0.39} {'loss': 0.8365, 'learning_rate': 1.824075196446667e-05, 'epoch': 0.39} {'loss': 0.8001, 'learning_rate': 1.8240566521816697e-05, 'epoch': 0.39} {'loss': 0.6297, 'learning_rate': 1.8240381070336214e-05, 'epoch': 0.39} {'loss': 1.0721, 'learning_rate': 1.824019561002542e-05, 'epoch': 0.39} {'loss': 0.8917, 'learning_rate': 1.824001014088451e-05, 'epoch': 0.39} {'loss': 0.9071, 'learning_rate': 1.8239824662913684e-05, 'epoch': 0.39} {'loss': 0.8326, 'learning_rate': 1.8239639176113143e-05, 'epoch': 0.39} {'loss': 1.0179, 'learning_rate': 1.8239453680483087e-05, 'epoch': 0.39} {'loss': 0.8049, 'learning_rate': 1.823926817602371e-05, 'epoch': 0.39} {'loss': 0.9227, 'learning_rate': 1.8239082662735214e-05, 'epoch': 0.39} {'loss': 1.0426, 'learning_rate': 1.8238897140617797e-05, 'epoch': 0.39} {'loss': 0.8624, 'learning_rate': 1.823871160967166e-05, 'epoch': 0.39} {'loss': 0.9826, 'learning_rate': 1.8238526069897e-05, 'epoch': 0.39} {'loss': 0.8569, 'learning_rate': 1.823834052129401e-05, 'epoch': 0.39} {'loss': 0.868, 'learning_rate': 1.8238154963862902e-05, 'epoch': 0.39} {'loss': 0.9463, 'learning_rate': 1.8237969397603865e-05, 'epoch': 0.39} {'loss': 0.9818, 'learning_rate': 1.82377838225171e-05, 'epoch': 0.39} {'loss': 0.947, 'learning_rate': 1.8237598238602806e-05, 'epoch': 0.39} {'loss': 0.8313, 'learning_rate': 1.823741264586118e-05, 'epoch': 0.39} {'loss': 0.8928, 'learning_rate': 1.8237227044292426e-05, 'epoch': 0.39} {'loss': 0.7969, 'learning_rate': 1.8237041433896738e-05, 'epoch': 0.39} {'loss': 0.8983, 'learning_rate': 1.823685581467432e-05, 'epoch': 0.39} {'loss': 0.8481, 'learning_rate': 1.8236670186625366e-05, 'epoch': 0.39} {'loss': 0.9107, 'learning_rate': 1.8236484549750072e-05, 'epoch': 0.39} {'loss': 0.8688, 'learning_rate': 1.8236298904048647e-05, 'epoch': 0.39} {'loss': 0.838, 'learning_rate': 1.8236113249521282e-05, 'epoch': 0.39} {'loss': 1.0124, 'learning_rate': 1.823592758616818e-05, 'epoch': 0.39} {'loss': 0.9152, 'learning_rate': 1.8235741913989534e-05, 'epoch': 0.39} {'loss': 0.8855, 'learning_rate': 1.823555623298555e-05, 'epoch': 0.39} {'loss': 0.9038, 'learning_rate': 1.8235370543156424e-05, 'epoch': 0.39} {'loss': 1.015, 'learning_rate': 1.8235184844502356e-05, 'epoch': 0.39} {'loss': 0.782, 'learning_rate': 1.8234999137023542e-05, 'epoch': 0.39} {'loss': 0.889, 'learning_rate': 1.8234813420720187e-05, 'epoch': 0.39} {'loss': 0.8321, 'learning_rate': 1.8234627695592483e-05, 'epoch': 0.39} {'loss': 0.8565, 'learning_rate': 1.8234441961640633e-05, 'epoch': 0.39} {'loss': 0.8083, 'learning_rate': 1.8234256218864835e-05, 'epoch': 0.39} {'loss': 0.8629, 'learning_rate': 1.8234070467265292e-05, 'epoch': 0.39} {'loss': 0.8164, 'learning_rate': 1.8233884706842192e-05, 'epoch': 0.39} {'loss': 0.9812, 'learning_rate': 1.8233698937595744e-05, 'epoch': 0.39} {'loss': 0.829, 'learning_rate': 1.823351315952615e-05, 'epoch': 0.39} {'loss': 0.8471, 'learning_rate': 1.82333273726336e-05, 'epoch': 0.39} {'loss': 0.8518, 'learning_rate': 1.8233141576918293e-05, 'epoch': 0.39} {'loss': 0.7514, 'learning_rate': 1.8232955772380437e-05, 'epoch': 0.39} {'loss': 0.8673, 'learning_rate': 1.823276995902022e-05, 'epoch': 0.39} {'loss': 0.8041, 'learning_rate': 1.8232584136837853e-05, 'epoch': 0.39} {'loss': 0.9447, 'learning_rate': 1.8232398305833524e-05, 'epoch': 0.39} {'loss': 0.9191, 'learning_rate': 1.8232212466007442e-05, 'epoch': 0.39} {'loss': 0.7134, 'learning_rate': 1.8232026617359796e-05, 'epoch': 0.39} {'loss': 0.9612, 'learning_rate': 1.8231840759890794e-05, 'epoch': 0.39} {'loss': 0.8306, 'learning_rate': 1.823165489360063e-05, 'epoch': 0.39} {'loss': 0.983, 'learning_rate': 1.8231469018489508e-05, 'epoch': 0.39} {'loss': 0.6614, 'learning_rate': 1.8231283134557624e-05, 'epoch': 0.39} {'loss': 0.7038, 'learning_rate': 1.8231097241805173e-05, 'epoch': 0.39} {'loss': 0.6993, 'learning_rate': 1.823091134023236e-05, 'epoch': 0.39} {'loss': 0.9466, 'learning_rate': 1.8230725429839385e-05, 'epoch': 0.39} {'loss': 1.0794, 'learning_rate': 1.823053951062644e-05, 'epoch': 0.39} {'loss': 0.7842, 'learning_rate': 1.8230353582593732e-05, 'epoch': 0.39} {'loss': 0.9297, 'learning_rate': 1.823016764574146e-05, 'epoch': 0.39} {'loss': 0.7814, 'learning_rate': 1.8229981700069815e-05, 'epoch': 0.39} {'loss': 0.9094, 'learning_rate': 1.8229795745579006e-05, 'epoch': 0.39} {'loss': 0.9712, 'learning_rate': 1.822960978226923e-05, 'epoch': 0.39} {'loss': 0.8735, 'learning_rate': 1.822942381014068e-05, 'epoch': 0.39} {'loss': 0.8372, 'learning_rate': 1.822923782919356e-05, 'epoch': 0.39} {'loss': 0.7809, 'learning_rate': 1.822905183942807e-05, 'epoch': 0.39} {'loss': 0.8023, 'learning_rate': 1.8228865840844408e-05, 'epoch': 0.39} {'loss': 0.8593, 'learning_rate': 1.8228679833442774e-05, 'epoch': 0.39} {'loss': 0.7771, 'learning_rate': 1.822849381722337e-05, 'epoch': 0.39} {'loss': 0.8241, 'learning_rate': 1.8228307792186384e-05, 'epoch': 0.39} {'loss': 0.8399, 'learning_rate': 1.8228121758332026e-05, 'epoch': 0.39} {'loss': 0.8353, 'learning_rate': 1.8227935715660496e-05, 'epoch': 0.39} {'loss': 0.7679, 'learning_rate': 1.822774966417199e-05, 'epoch': 0.39} {'loss': 0.8525, 'learning_rate': 1.822756360386671e-05, 'epoch': 0.39} {'loss': 0.9973, 'learning_rate': 1.8227377534744847e-05, 'epoch': 0.39} {'loss': 0.7255, 'learning_rate': 1.822719145680661e-05, 'epoch': 0.39} {'loss': 0.7525, 'learning_rate': 1.822700537005219e-05, 'epoch': 0.39} {'loss': 0.9843, 'learning_rate': 1.82268192744818e-05, 'epoch': 0.39} {'loss': 0.7899, 'learning_rate': 1.8226633170095623e-05, 'epoch': 0.39} {'loss': 0.919, 'learning_rate': 1.822644705689387e-05, 'epoch': 0.39} {'loss': 0.9792, 'learning_rate': 1.8226260934876738e-05, 'epoch': 0.39} {'loss': 0.7436, 'learning_rate': 1.8226074804044423e-05, 'epoch': 0.39} {'loss': 0.6304, 'learning_rate': 1.8225888664397124e-05, 'epoch': 0.39} {'loss': 1.0353, 'learning_rate': 1.8225702515935045e-05, 'epoch': 0.39} {'loss': 0.7328, 'learning_rate': 1.8225516358658382e-05, 'epoch': 0.39} {'loss': 0.9772, 'learning_rate': 1.8225330192567335e-05, 'epoch': 0.39} {'loss': 0.8676, 'learning_rate': 1.822514401766211e-05, 'epoch': 0.39} {'loss': 0.9239, 'learning_rate': 1.8224957833942895e-05, 'epoch': 0.39} {'loss': 0.9685, 'learning_rate': 1.8224771641409898e-05, 'epoch': 0.39} {'loss': 0.904, 'learning_rate': 1.8224585440063317e-05, 'epoch': 0.39} {'loss': 0.709, 'learning_rate': 1.8224399229903348e-05, 'epoch': 0.39} {'loss': 0.8704, 'learning_rate': 1.8224213010930194e-05, 'epoch': 0.39} {'loss': 0.8135, 'learning_rate': 1.8224026783144052e-05, 'epoch': 0.39} {'loss': 0.8903, 'learning_rate': 1.8223840546545125e-05, 'epoch': 0.39} {'loss': 0.761, 'learning_rate': 1.822365430113361e-05, 'epoch': 0.39} {'loss': 0.9491, 'learning_rate': 1.8223468046909706e-05, 'epoch': 0.39} {'loss': 0.7533, 'learning_rate': 1.8223281783873614e-05, 'epoch': 0.39} {'loss': 0.9572, 'learning_rate': 1.8223095512025533e-05, 'epoch': 0.39} {'loss': 0.9682, 'learning_rate': 1.8222909231365663e-05, 'epoch': 0.39} {'loss': 0.9811, 'learning_rate': 1.8222722941894208e-05, 'epoch': 0.39} {'loss': 0.9551, 'learning_rate': 1.822253664361136e-05, 'epoch': 0.39} {'loss': 0.8979, 'learning_rate': 1.8222350336517317e-05, 'epoch': 0.39} {'loss': 0.7801, 'learning_rate': 1.822216402061229e-05, 'epoch': 0.39} {'loss': 0.9246, 'learning_rate': 1.8221977695896472e-05, 'epoch': 0.39} {'loss': 0.8317, 'learning_rate': 1.822179136237006e-05, 'epoch': 0.39} {'loss': 0.9119, 'learning_rate': 1.822160502003326e-05, 'epoch': 0.39} {'loss': 0.8239, 'learning_rate': 1.8221418668886263e-05, 'epoch': 0.39} {'loss': 0.796, 'learning_rate': 1.822123230892928e-05, 'epoch': 0.39} {'loss': 0.9151, 'learning_rate': 1.82210459401625e-05, 'epoch': 0.39} {'loss': 0.7851, 'learning_rate': 1.822085956258613e-05, 'epoch': 0.39} {'loss': 0.7855, 'learning_rate': 1.8220673176200362e-05, 'epoch': 0.39} {'loss': 0.8732, 'learning_rate': 1.8220486781005405e-05, 'epoch': 0.39} {'loss': 0.8002, 'learning_rate': 1.822030037700145e-05, 'epoch': 0.39} {'loss': 0.937, 'learning_rate': 1.8220113964188708e-05, 'epoch': 0.39} {'loss': 0.9539, 'learning_rate': 1.821992754256737e-05, 'epoch': 0.39} {'loss': 0.8159, 'learning_rate': 1.8219741112137638e-05, 'epoch': 0.39} {'loss': 0.8757, 'learning_rate': 1.821955467289971e-05, 'epoch': 0.39} {'loss': 1.0085, 'learning_rate': 1.8219368224853786e-05, 'epoch': 0.39} {'loss': 0.9678, 'learning_rate': 1.821918176800007e-05, 'epoch': 0.39} {'loss': 0.9077, 'learning_rate': 1.8218995302338757e-05, 'epoch': 0.39} {'loss': 0.9144, 'learning_rate': 1.8218808827870048e-05, 'epoch': 0.39} {'loss': 0.8302, 'learning_rate': 1.8218622344594147e-05, 'epoch': 0.39} {'loss': 0.9047, 'learning_rate': 1.8218435852511245e-05, 'epoch': 0.39} {'loss': 0.8374, 'learning_rate': 1.8218249351621552e-05, 'epoch': 0.39} {'loss': 0.8715, 'learning_rate': 1.821806284192526e-05, 'epoch': 0.39} {'loss': 0.7259, 'learning_rate': 1.8217876323422575e-05, 'epoch': 0.39} {'loss': 0.92, 'learning_rate': 1.821768979611369e-05, 'epoch': 0.39} {'loss': 0.7531, 'learning_rate': 1.821750325999881e-05, 'epoch': 0.39} {'loss': 0.8212, 'learning_rate': 1.8217316715078136e-05, 'epoch': 0.39} {'loss': 1.1496, 'learning_rate': 1.8217130161351863e-05, 'epoch': 0.39} {'loss': 0.8683, 'learning_rate': 1.8216943598820197e-05, 'epoch': 0.39} {'loss': 0.6931, 'learning_rate': 1.821675702748333e-05, 'epoch': 0.39} {'loss': 0.9868, 'learning_rate': 1.821657044734147e-05, 'epoch': 0.39} {'loss': 0.7741, 'learning_rate': 1.821638385839481e-05, 'epoch': 0.39} {'loss': 0.8592, 'learning_rate': 1.8216197260643553e-05, 'epoch': 0.39} {'loss': 0.708, 'learning_rate': 1.82160106540879e-05, 'epoch': 0.39} {'loss': 0.8622, 'learning_rate': 1.821582403872805e-05, 'epoch': 0.39} {'loss': 0.8235, 'learning_rate': 1.8215637414564203e-05, 'epoch': 0.39} {'loss': 1.0437, 'learning_rate': 1.821545078159656e-05, 'epoch': 0.39} {'loss': 0.8084, 'learning_rate': 1.821526413982532e-05, 'epoch': 0.39} {'loss': 1.0482, 'learning_rate': 1.8215077489250684e-05, 'epoch': 0.39} {'loss': 0.9141, 'learning_rate': 1.821489082987285e-05, 'epoch': 0.39} {'loss': 0.8969, 'learning_rate': 1.8214704161692015e-05, 'epoch': 0.39} {'loss': 0.839, 'learning_rate': 1.8214517484708387e-05, 'epoch': 0.39} {'loss': 0.8849, 'learning_rate': 1.821433079892216e-05, 'epoch': 0.39} {'loss': 0.8775, 'learning_rate': 1.821414410433354e-05, 'epoch': 0.39} {'loss': 1.0176, 'learning_rate': 1.821395740094272e-05, 'epoch': 0.39} {'loss': 0.9668, 'learning_rate': 1.8213770688749902e-05, 'epoch': 0.39} {'loss': 1.013, 'learning_rate': 1.821358396775529e-05, 'epoch': 0.39} {'loss': 0.7919, 'learning_rate': 1.8213397237959083e-05, 'epoch': 0.39} {'loss': 0.9605, 'learning_rate': 1.821321049936148e-05, 'epoch': 0.39} {'loss': 0.9125, 'learning_rate': 1.8213023751962677e-05, 'epoch': 0.39} {'loss': 0.7084, 'learning_rate': 1.8212836995762878e-05, 'epoch': 0.39} {'loss': 0.8711, 'learning_rate': 1.8212650230762284e-05, 'epoch': 0.39} {'loss': 0.7387, 'learning_rate': 1.8212463456961093e-05, 'epoch': 0.39} {'loss': 0.8433, 'learning_rate': 1.8212276674359507e-05, 'epoch': 0.39} {'loss': 0.667, 'learning_rate': 1.8212089882957727e-05, 'epoch': 0.39} {'loss': 1.0057, 'learning_rate': 1.8211903082755948e-05, 'epoch': 0.39} {'loss': 0.6541, 'learning_rate': 1.8211716273754375e-05, 'epoch': 0.39} {'loss': 0.8972, 'learning_rate': 1.821152945595321e-05, 'epoch': 0.39} {'loss': 0.7663, 'learning_rate': 1.8211342629352647e-05, 'epoch': 0.39} {'loss': 0.8497, 'learning_rate': 1.8211155793952892e-05, 'epoch': 0.39} {'loss': 0.9399, 'learning_rate': 1.821096894975414e-05, 'epoch': 0.39} {'loss': 0.9436, 'learning_rate': 1.8210782096756593e-05, 'epoch': 0.39} {'loss': 0.9554, 'learning_rate': 1.8210595234960452e-05, 'epoch': 0.39} {'loss': 0.6934, 'learning_rate': 1.8210408364365916e-05, 'epoch': 0.39} {'loss': 0.8895, 'learning_rate': 1.821022148497319e-05, 'epoch': 0.39} {'loss': 0.8068, 'learning_rate': 1.821003459678247e-05, 'epoch': 0.39} {'loss': 0.8191, 'learning_rate': 1.8209847699793957e-05, 'epoch': 0.39} {'loss': 0.8022, 'learning_rate': 1.8209660794007848e-05, 'epoch': 0.39} {'loss': 0.833, 'learning_rate': 1.820947387942435e-05, 'epoch': 0.39} {'loss': 0.9191, 'learning_rate': 1.820928695604366e-05, 'epoch': 0.39} {'loss': 0.7418, 'learning_rate': 1.8209100023865975e-05, 'epoch': 0.39} {'loss': 0.8, 'learning_rate': 1.8208913082891498e-05, 'epoch': 0.39} {'loss': 0.8271, 'learning_rate': 1.8208726133120435e-05, 'epoch': 0.39} {'loss': 0.9046, 'learning_rate': 1.8208539174552976e-05, 'epoch': 0.39} {'loss': 0.9444, 'learning_rate': 1.820835220718933e-05, 'epoch': 0.39} {'loss': 0.844, 'learning_rate': 1.820816523102969e-05, 'epoch': 0.39} {'loss': 0.7956, 'learning_rate': 1.820797824607426e-05, 'epoch': 0.39} {'loss': 0.8743, 'learning_rate': 1.8207791252323245e-05, 'epoch': 0.39} {'loss': 0.7723, 'learning_rate': 1.820760424977684e-05, 'epoch': 0.39} {'loss': 0.9481, 'learning_rate': 1.8207417238435242e-05, 'epoch': 0.39} {'loss': 0.6481, 'learning_rate': 1.820723021829866e-05, 'epoch': 0.39} {'loss': 0.8241, 'learning_rate': 1.8207043189367288e-05, 'epoch': 0.39} {'loss': 0.9325, 'learning_rate': 1.8206856151641327e-05, 'epoch': 0.39} {'loss': 0.8115, 'learning_rate': 1.820666910512098e-05, 'epoch': 0.39} {'loss': 0.946, 'learning_rate': 1.820648204980645e-05, 'epoch': 0.39} {'loss': 0.9453, 'learning_rate': 1.820629498569793e-05, 'epoch': 0.39} {'loss': 0.8961, 'learning_rate': 1.8206107912795627e-05, 'epoch': 0.39} {'loss': 0.9096, 'learning_rate': 1.820592083109974e-05, 'epoch': 0.39} {'loss': 0.9313, 'learning_rate': 1.8205733740610462e-05, 'epoch': 0.39} {'loss': 0.9083, 'learning_rate': 1.8205546641328004e-05, 'epoch': 0.39} {'loss': 0.8145, 'learning_rate': 1.8205359533252558e-05, 'epoch': 0.39} {'loss': 0.9724, 'learning_rate': 1.8205172416384334e-05, 'epoch': 0.39} {'loss': 0.7801, 'learning_rate': 1.8204985290723525e-05, 'epoch': 0.39} {'loss': 0.8962, 'learning_rate': 1.8204798156270335e-05, 'epoch': 0.39} {'loss': 0.8897, 'learning_rate': 1.820461101302496e-05, 'epoch': 0.39} {'loss': 0.9633, 'learning_rate': 1.8204423860987606e-05, 'epoch': 0.39} {'loss': 0.8319, 'learning_rate': 1.820423670015847e-05, 'epoch': 0.39} {'loss': 0.8821, 'learning_rate': 1.8204049530537756e-05, 'epoch': 0.39} {'loss': 1.0067, 'learning_rate': 1.820386235212566e-05, 'epoch': 0.39} {'loss': 0.8324, 'learning_rate': 1.820367516492239e-05, 'epoch': 0.39} {'loss': 0.7862, 'learning_rate': 1.8203487968928134e-05, 'epoch': 0.39} {'loss': 0.7615, 'learning_rate': 1.8203300764143105e-05, 'epoch': 0.39} {'loss': 0.8322, 'learning_rate': 1.82031135505675e-05, 'epoch': 0.39} {'loss': 0.9197, 'learning_rate': 1.8202926328201516e-05, 'epoch': 0.39} {'loss': 0.8057, 'learning_rate': 1.8202739097045355e-05, 'epoch': 0.39} {'loss': 1.0003, 'learning_rate': 1.8202551857099222e-05, 'epoch': 0.39} {'loss': 0.8167, 'learning_rate': 1.8202364608363314e-05, 'epoch': 0.39} {'loss': 0.9987, 'learning_rate': 1.820217735083783e-05, 'epoch': 0.39} {'loss': 0.9161, 'learning_rate': 1.8201990084522974e-05, 'epoch': 0.39} {'loss': 0.9264, 'learning_rate': 1.8201802809418946e-05, 'epoch': 0.39} {'loss': 0.8515, 'learning_rate': 1.8201615525525942e-05, 'epoch': 0.39} {'loss': 0.8061, 'learning_rate': 1.8201428232844168e-05, 'epoch': 0.39} {'loss': 0.9373, 'learning_rate': 1.8201240931373828e-05, 'epoch': 0.39} {'loss': 0.8822, 'learning_rate': 1.8201053621115114e-05, 'epoch': 0.39} {'loss': 0.9941, 'learning_rate': 1.8200866302068233e-05, 'epoch': 0.39} {'loss': 0.8335, 'learning_rate': 1.8200678974233382e-05, 'epoch': 0.39} {'loss': 0.952, 'learning_rate': 1.8200491637610765e-05, 'epoch': 0.39} {'loss': 0.9287, 'learning_rate': 1.820030429220058e-05, 'epoch': 0.39} {'loss': 0.7826, 'learning_rate': 1.8200116938003028e-05, 'epoch': 0.39} {'loss': 0.8554, 'learning_rate': 1.819992957501831e-05, 'epoch': 0.39} {'loss': 0.8569, 'learning_rate': 1.819974220324663e-05, 'epoch': 0.39} {'loss': 0.8828, 'learning_rate': 1.8199554822688182e-05, 'epoch': 0.39} {'loss': 0.8571, 'learning_rate': 1.8199367433343174e-05, 'epoch': 0.39} {'loss': 0.8127, 'learning_rate': 1.8199180035211806e-05, 'epoch': 0.39} {'loss': 1.016, 'learning_rate': 1.8198992628294272e-05, 'epoch': 0.39} {'loss': 0.9205, 'learning_rate': 1.8198805212590782e-05, 'epoch': 0.39} {'loss': 0.9404, 'learning_rate': 1.819861778810153e-05, 'epoch': 0.39} {'loss': 0.795, 'learning_rate': 1.8198430354826717e-05, 'epoch': 0.39} {'loss': 0.7576, 'learning_rate': 1.819824291276655e-05, 'epoch': 0.39} {'loss': 0.8484, 'learning_rate': 1.8198055461921223e-05, 'epoch': 0.39} {'loss': 0.9654, 'learning_rate': 1.819786800229094e-05, 'epoch': 0.39} {'loss': 1.256, 'learning_rate': 1.81976805338759e-05, 'epoch': 0.39} {'loss': 0.9392, 'learning_rate': 1.8197493056676307e-05, 'epoch': 0.39} {'loss': 0.9967, 'learning_rate': 1.819730557069236e-05, 'epoch': 0.39} {'loss': 0.6997, 'learning_rate': 1.8197118075924264e-05, 'epoch': 0.39} {'loss': 0.8708, 'learning_rate': 1.819693057237221e-05, 'epoch': 0.39} {'loss': 0.6871, 'learning_rate': 1.8196743060036407e-05, 'epoch': 0.39} {'loss': 0.8092, 'learning_rate': 1.8196555538917057e-05, 'epoch': 0.39} {'loss': 0.9255, 'learning_rate': 1.8196368009014355e-05, 'epoch': 0.39} {'loss': 0.9591, 'learning_rate': 1.8196180470328507e-05, 'epoch': 0.39} {'loss': 0.8383, 'learning_rate': 1.8195992922859707e-05, 'epoch': 0.39} {'loss': 0.8402, 'learning_rate': 1.819580536660817e-05, 'epoch': 0.39} {'loss': 0.8052, 'learning_rate': 1.819561780157408e-05, 'epoch': 0.39} {'loss': 0.802, 'learning_rate': 1.819543022775765e-05, 'epoch': 0.39} {'loss': 1.022, 'learning_rate': 1.8195242645159073e-05, 'epoch': 0.39} {'loss': 0.9425, 'learning_rate': 1.8195055053778557e-05, 'epoch': 0.39} {'loss': 0.8997, 'learning_rate': 1.8194867453616298e-05, 'epoch': 0.39} {'loss': 0.8093, 'learning_rate': 1.81946798446725e-05, 'epoch': 0.39} {'loss': 0.9446, 'learning_rate': 1.8194492226947362e-05, 'epoch': 0.39} {'loss': 0.9204, 'learning_rate': 1.8194304600441088e-05, 'epoch': 0.39} {'loss': 0.9278, 'learning_rate': 1.8194116965153873e-05, 'epoch': 0.39} {'loss': 0.793, 'learning_rate': 1.8193929321085926e-05, 'epoch': 0.39} {'loss': 0.894, 'learning_rate': 1.8193741668237442e-05, 'epoch': 0.39} {'loss': 0.8391, 'learning_rate': 1.8193554006608628e-05, 'epoch': 0.39} {'loss': 0.8615, 'learning_rate': 1.8193366336199677e-05, 'epoch': 0.39} {'loss': 0.8592, 'learning_rate': 1.8193178657010796e-05, 'epoch': 0.39} {'loss': 0.8988, 'learning_rate': 1.8192990969042185e-05, 'epoch': 0.39} {'loss': 0.8313, 'learning_rate': 1.8192803272294043e-05, 'epoch': 0.39} {'loss': 0.8866, 'learning_rate': 1.8192615566766574e-05, 'epoch': 0.39} {'loss': 0.9099, 'learning_rate': 1.8192427852459978e-05, 'epoch': 0.39} {'loss': 0.7577, 'learning_rate': 1.8192240129374458e-05, 'epoch': 0.39} {'loss': 0.8333, 'learning_rate': 1.819205239751021e-05, 'epoch': 0.39} {'loss': 0.7806, 'learning_rate': 1.819186465686744e-05, 'epoch': 0.39} {'loss': 0.9649, 'learning_rate': 1.8191676907446347e-05, 'epoch': 0.39} {'loss': 0.9785, 'learning_rate': 1.8191489149247134e-05, 'epoch': 0.39} {'loss': 0.8674, 'learning_rate': 1.819130138227e-05, 'epoch': 0.39} {'loss': 0.85, 'learning_rate': 1.8191113606515148e-05, 'epoch': 0.39} {'loss': 0.7507, 'learning_rate': 1.819092582198278e-05, 'epoch': 0.39} {'loss': 1.0493, 'learning_rate': 1.819073802867309e-05, 'epoch': 0.39} {'loss': 1.0409, 'learning_rate': 1.819055022658629e-05, 'epoch': 0.39} {'loss': 0.877, 'learning_rate': 1.8190362415722575e-05, 'epoch': 0.39} {'loss': 0.7352, 'learning_rate': 1.819017459608215e-05, 'epoch': 0.39} {'loss': 0.7505, 'learning_rate': 1.818998676766521e-05, 'epoch': 0.39} {'loss': 0.9178, 'learning_rate': 1.8189798930471962e-05, 'epoch': 0.39} {'loss': 1.035, 'learning_rate': 1.8189611084502605e-05, 'epoch': 0.39} {'loss': 0.8332, 'learning_rate': 1.818942322975734e-05, 'epoch': 0.39} {'loss': 0.6924, 'learning_rate': 1.818923536623637e-05, 'epoch': 0.39} {'loss': 0.9541, 'learning_rate': 1.8189047493939894e-05, 'epoch': 0.39} {'loss': 0.9309, 'learning_rate': 1.8188859612868117e-05, 'epoch': 0.39} {'loss': 0.9057, 'learning_rate': 1.8188671723021233e-05, 'epoch': 0.39} {'loss': 0.787, 'learning_rate': 1.818848382439945e-05, 'epoch': 0.39} {'loss': 0.8648, 'learning_rate': 1.818829591700297e-05, 'epoch': 0.39} {'loss': 1.0423, 'learning_rate': 1.818810800083199e-05, 'epoch': 0.39} {'loss': 0.8237, 'learning_rate': 1.8187920075886712e-05, 'epoch': 0.39} {'loss': 0.9657, 'learning_rate': 1.818773214216734e-05, 'epoch': 0.39} {'loss': 0.8259, 'learning_rate': 1.8187544199674074e-05, 'epoch': 0.39} {'loss': 0.8022, 'learning_rate': 1.8187356248407114e-05, 'epoch': 0.39} {'loss': 0.877, 'learning_rate': 1.8187168288366665e-05, 'epoch': 0.39} {'loss': 0.8662, 'learning_rate': 1.8186980319552926e-05, 'epoch': 0.39} {'loss': 0.9485, 'learning_rate': 1.8186792341966098e-05, 'epoch': 0.39} {'loss': 0.7201, 'learning_rate': 1.8186604355606384e-05, 'epoch': 0.39} {'loss': 0.8636, 'learning_rate': 1.8186416360473983e-05, 'epoch': 0.39} {'loss': 0.969, 'learning_rate': 1.81862283565691e-05, 'epoch': 0.39} {'loss': 0.9291, 'learning_rate': 1.8186040343891932e-05, 'epoch': 0.39} {'loss': 0.8471, 'learning_rate': 1.8185852322442682e-05, 'epoch': 0.39} {'loss': 0.6747, 'learning_rate': 1.8185664292221558e-05, 'epoch': 0.39} {'loss': 1.0124, 'learning_rate': 1.818547625322875e-05, 'epoch': 0.39} {'loss': 0.9217, 'learning_rate': 1.8185288205464468e-05, 'epoch': 0.39} {'loss': 0.7656, 'learning_rate': 1.818510014892891e-05, 'epoch': 0.39} {'loss': 0.8644, 'learning_rate': 1.8184912083622283e-05, 'epoch': 0.39} {'loss': 0.8502, 'learning_rate': 1.818472400954478e-05, 'epoch': 0.39} {'loss': 0.9157, 'learning_rate': 1.8184535926696604e-05, 'epoch': 0.39} {'loss': 0.7824, 'learning_rate': 1.8184347835077965e-05, 'epoch': 0.39} {'loss': 0.8264, 'learning_rate': 1.8184159734689052e-05, 'epoch': 0.39} {'loss': 0.9622, 'learning_rate': 1.8183971625530076e-05, 'epoch': 0.39} {'loss': 0.6266, 'learning_rate': 1.8183783507601238e-05, 'epoch': 0.39} {'loss': 1.061, 'learning_rate': 1.8183595380902737e-05, 'epoch': 0.39} {'loss': 1.2631, 'learning_rate': 1.8183407245434775e-05, 'epoch': 0.39} {'loss': 1.0056, 'learning_rate': 1.8183219101197548e-05, 'epoch': 0.39} {'loss': 0.6746, 'learning_rate': 1.818303094819127e-05, 'epoch': 0.39} {'loss': 0.8602, 'learning_rate': 1.8182842786416132e-05, 'epoch': 0.39} {'loss': 0.9767, 'learning_rate': 1.8182654615872342e-05, 'epoch': 0.39} {'loss': 0.8652, 'learning_rate': 1.8182466436560098e-05, 'epoch': 0.39} {'loss': 0.9795, 'learning_rate': 1.8182278248479602e-05, 'epoch': 0.39} {'loss': 0.6515, 'learning_rate': 1.8182090051631055e-05, 'epoch': 0.39} {'loss': 0.9381, 'learning_rate': 1.8181901846014663e-05, 'epoch': 0.39} {'loss': 0.8067, 'learning_rate': 1.8181713631630624e-05, 'epoch': 0.39} {'loss': 0.8068, 'learning_rate': 1.8181525408479135e-05, 'epoch': 0.4} {'loss': 0.8007, 'learning_rate': 1.818133717656041e-05, 'epoch': 0.4} {'loss': 0.8866, 'learning_rate': 1.818114893587464e-05, 'epoch': 0.4} {'loss': 0.8987, 'learning_rate': 1.8180960686422034e-05, 'epoch': 0.4} {'loss': 0.7995, 'learning_rate': 1.818077242820279e-05, 'epoch': 0.4} {'loss': 0.851, 'learning_rate': 1.818058416121711e-05, 'epoch': 0.4} {'loss': 0.9153, 'learning_rate': 1.8180395885465193e-05, 'epoch': 0.4} {'loss': 1.0468, 'learning_rate': 1.8180207600947245e-05, 'epoch': 0.4} {'loss': 1.0316, 'learning_rate': 1.8180019307663465e-05, 'epoch': 0.4} {'loss': 0.7666, 'learning_rate': 1.8179831005614056e-05, 'epoch': 0.4} {'loss': 0.828, 'learning_rate': 1.817964269479922e-05, 'epoch': 0.4} {'loss': 1.0163, 'learning_rate': 1.817945437521916e-05, 'epoch': 0.4} {'loss': 0.8343, 'learning_rate': 1.8179266046874076e-05, 'epoch': 0.4} {'loss': 0.8351, 'learning_rate': 1.817907770976417e-05, 'epoch': 0.4} {'loss': 0.9949, 'learning_rate': 1.8178889363889643e-05, 'epoch': 0.4} {'loss': 0.914, 'learning_rate': 1.81787010092507e-05, 'epoch': 0.4} {'loss': 0.8374, 'learning_rate': 1.817851264584754e-05, 'epoch': 0.4} {'loss': 0.8564, 'learning_rate': 1.8178324273680364e-05, 'epoch': 0.4} {'loss': 0.9062, 'learning_rate': 1.8178135892749376e-05, 'epoch': 0.4} {'loss': 1.0548, 'learning_rate': 1.8177947503054778e-05, 'epoch': 0.4} {'loss': 0.8617, 'learning_rate': 1.817775910459677e-05, 'epoch': 0.4} {'loss': 0.8177, 'learning_rate': 1.8177570697375556e-05, 'epoch': 0.4} {'loss': 0.8664, 'learning_rate': 1.817738228139134e-05, 'epoch': 0.4} {'loss': 0.9856, 'learning_rate': 1.8177193856644315e-05, 'epoch': 0.4} {'loss': 0.9651, 'learning_rate': 1.817700542313469e-05, 'epoch': 0.4} {'loss': 0.7915, 'learning_rate': 1.8176816980862668e-05, 'epoch': 0.4} {'loss': 0.7387, 'learning_rate': 1.8176628529828448e-05, 'epoch': 0.4} {'loss': 0.9892, 'learning_rate': 1.817644007003223e-05, 'epoch': 0.4} {'loss': 0.9092, 'learning_rate': 1.8176251601474223e-05, 'epoch': 0.4} {'loss': 0.8402, 'learning_rate': 1.8176063124154622e-05, 'epoch': 0.4} {'loss': 1.0723, 'learning_rate': 1.817587463807363e-05, 'epoch': 0.4} {'loss': 0.9218, 'learning_rate': 1.8175686143231453e-05, 'epoch': 0.4} {'loss': 0.8378, 'learning_rate': 1.817549763962829e-05, 'epoch': 0.4} {'loss': 0.8156, 'learning_rate': 1.8175309127264342e-05, 'epoch': 0.4} {'loss': 0.7908, 'learning_rate': 1.8175120606139812e-05, 'epoch': 0.4} {'loss': 0.9816, 'learning_rate': 1.8174932076254905e-05, 'epoch': 0.4} {'loss': 0.8955, 'learning_rate': 1.8174743537609818e-05, 'epoch': 0.4} {'loss': 0.8973, 'learning_rate': 1.817455499020476e-05, 'epoch': 0.4} {'loss': 1.0263, 'learning_rate': 1.8174366434039923e-05, 'epoch': 0.4} {'loss': 0.961, 'learning_rate': 1.8174177869115516e-05, 'epoch': 0.4} {'loss': 0.9007, 'learning_rate': 1.817398929543174e-05, 'epoch': 0.4} {'loss': 0.9151, 'learning_rate': 1.81738007129888e-05, 'epoch': 0.4} {'loss': 0.8588, 'learning_rate': 1.817361212178689e-05, 'epoch': 0.4} {'loss': 0.946, 'learning_rate': 1.817342352182622e-05, 'epoch': 0.4} {'loss': 0.9134, 'learning_rate': 1.8173234913106986e-05, 'epoch': 0.4} {'loss': 0.8382, 'learning_rate': 1.8173046295629392e-05, 'epoch': 0.4} {'loss': 0.8562, 'learning_rate': 1.8172857669393647e-05, 'epoch': 0.4} {'loss': 1.0137, 'learning_rate': 1.8172669034399944e-05, 'epoch': 0.4} {'loss': 0.8012, 'learning_rate': 1.817248039064849e-05, 'epoch': 0.4} {'loss': 0.7969, 'learning_rate': 1.8172291738139483e-05, 'epoch': 0.4} {'loss': 0.7723, 'learning_rate': 1.817210307687313e-05, 'epoch': 0.4} {'loss': 0.8461, 'learning_rate': 1.817191440684963e-05, 'epoch': 0.4} {'loss': 0.7701, 'learning_rate': 1.817172572806919e-05, 'epoch': 0.4} {'loss': 0.9918, 'learning_rate': 1.8171537040532002e-05, 'epoch': 0.4} {'loss': 0.8975, 'learning_rate': 1.8171348344238277e-05, 'epoch': 0.4} {'loss': 0.9575, 'learning_rate': 1.8171159639188217e-05, 'epoch': 0.4} {'loss': 0.8537, 'learning_rate': 1.8170970925382015e-05, 'epoch': 0.4} {'loss': 0.8107, 'learning_rate': 1.8170782202819887e-05, 'epoch': 0.4} {'loss': 0.8509, 'learning_rate': 1.8170593471502028e-05, 'epoch': 0.4} {'loss': 0.8303, 'learning_rate': 1.8170404731428636e-05, 'epoch': 0.4} {'loss': 1.0453, 'learning_rate': 1.8170215982599922e-05, 'epoch': 0.4} {'loss': 0.7776, 'learning_rate': 1.8170027225016086e-05, 'epoch': 0.4} {'loss': 0.8169, 'learning_rate': 1.8169838458677324e-05, 'epoch': 0.4} {'loss': 0.8347, 'learning_rate': 1.8169649683583846e-05, 'epoch': 0.4} {'loss': 0.9363, 'learning_rate': 1.816946089973585e-05, 'epoch': 0.4} {'loss': 0.8344, 'learning_rate': 1.8169272107133536e-05, 'epoch': 0.4} {'loss': 0.8788, 'learning_rate': 1.8169083305777114e-05, 'epoch': 0.4} {'loss': 0.9211, 'learning_rate': 1.816889449566678e-05, 'epoch': 0.4} {'loss': 0.9275, 'learning_rate': 1.8168705676802738e-05, 'epoch': 0.4} {'loss': 0.7278, 'learning_rate': 1.816851684918519e-05, 'epoch': 0.4} {'loss': 0.8447, 'learning_rate': 1.816832801281434e-05, 'epoch': 0.4} {'loss': 0.6782, 'learning_rate': 1.8168139167690392e-05, 'epoch': 0.4} {'loss': 0.7607, 'learning_rate': 1.8167950313813546e-05, 'epoch': 0.4} {'loss': 0.7363, 'learning_rate': 1.8167761451183998e-05, 'epoch': 0.4} {'loss': 0.9338, 'learning_rate': 1.816757257980196e-05, 'epoch': 0.4} {'loss': 0.8947, 'learning_rate': 1.816738369966763e-05, 'epoch': 0.4} {'loss': 0.6427, 'learning_rate': 1.8167194810781212e-05, 'epoch': 0.4} {'loss': 0.8489, 'learning_rate': 1.8167005913142904e-05, 'epoch': 0.4} {'loss': 0.8792, 'learning_rate': 1.8166817006752916e-05, 'epoch': 0.4} {'loss': 0.9353, 'learning_rate': 1.8166628091611448e-05, 'epoch': 0.4} {'loss': 0.8843, 'learning_rate': 1.8166439167718696e-05, 'epoch': 0.4} {'loss': 0.9852, 'learning_rate': 1.8166250235074874e-05, 'epoch': 0.4} {'loss': 0.9737, 'learning_rate': 1.8166061293680172e-05, 'epoch': 0.4} {'loss': 0.8423, 'learning_rate': 1.81658723435348e-05, 'epoch': 0.4} {'loss': 0.9498, 'learning_rate': 1.816568338463896e-05, 'epoch': 0.4} {'loss': 0.9206, 'learning_rate': 1.8165494416992854e-05, 'epoch': 0.4} {'loss': 0.7565, 'learning_rate': 1.816530544059668e-05, 'epoch': 0.4} {'loss': 0.8915, 'learning_rate': 1.8165116455450643e-05, 'epoch': 0.4} {'loss': 0.8229, 'learning_rate': 1.8164927461554955e-05, 'epoch': 0.4} {'loss': 1.0236, 'learning_rate': 1.8164738458909803e-05, 'epoch': 0.4} {'loss': 0.9773, 'learning_rate': 1.81645494475154e-05, 'epoch': 0.4} {'loss': 0.853, 'learning_rate': 1.8164360427371943e-05, 'epoch': 0.4} {'loss': 0.7254, 'learning_rate': 1.816417139847964e-05, 'epoch': 0.4} {'loss': 0.7737, 'learning_rate': 1.8163982360838687e-05, 'epoch': 0.4} {'loss': 1.059, 'learning_rate': 1.8163793314449294e-05, 'epoch': 0.4} {'loss': 1.0167, 'learning_rate': 1.8163604259311657e-05, 'epoch': 0.4} {'loss': 0.9089, 'learning_rate': 1.816341519542598e-05, 'epoch': 0.4} {'loss': 0.9756, 'learning_rate': 1.816322612279247e-05, 'epoch': 0.4} {'loss': 0.7481, 'learning_rate': 1.8163037041411326e-05, 'epoch': 0.4} {'loss': 0.9058, 'learning_rate': 1.816284795128275e-05, 'epoch': 0.4} {'loss': 0.8013, 'learning_rate': 1.8162658852406944e-05, 'epoch': 0.4} {'loss': 0.9396, 'learning_rate': 1.8162469744784113e-05, 'epoch': 0.4} {'loss': 0.8767, 'learning_rate': 1.816228062841446e-05, 'epoch': 0.4} {'loss': 0.7471, 'learning_rate': 1.8162091503298187e-05, 'epoch': 0.4} {'loss': 0.9055, 'learning_rate': 1.8161902369435495e-05, 'epoch': 0.4} {'loss': 0.8127, 'learning_rate': 1.8161713226826592e-05, 'epoch': 0.4} {'loss': 0.6784, 'learning_rate': 1.816152407547167e-05, 'epoch': 0.4} {'loss': 0.9477, 'learning_rate': 1.8161334915370943e-05, 'epoch': 0.4} {'loss': 0.8817, 'learning_rate': 1.816114574652461e-05, 'epoch': 0.4} {'loss': 1.0274, 'learning_rate': 1.8160956568932868e-05, 'epoch': 0.4} {'loss': 0.8129, 'learning_rate': 1.816076738259593e-05, 'epoch': 0.4} {'loss': 0.7328, 'learning_rate': 1.816057818751399e-05, 'epoch': 0.4} {'loss': 0.8398, 'learning_rate': 1.8160388983687253e-05, 'epoch': 0.4} {'loss': 0.8658, 'learning_rate': 1.8160199771115925e-05, 'epoch': 0.4} {'loss': 0.9563, 'learning_rate': 1.8160010549800205e-05, 'epoch': 0.4} {'loss': 1.0102, 'learning_rate': 1.8159821319740297e-05, 'epoch': 0.4} {'loss': 0.9661, 'learning_rate': 1.8159632080936403e-05, 'epoch': 0.4} {'loss': 0.6899, 'learning_rate': 1.815944283338873e-05, 'epoch': 0.4} {'loss': 0.827, 'learning_rate': 1.8159253577097474e-05, 'epoch': 0.4} {'loss': 0.7972, 'learning_rate': 1.8159064312062844e-05, 'epoch': 0.4} {'loss': 0.9349, 'learning_rate': 1.815887503828504e-05, 'epoch': 0.4} {'loss': 0.8606, 'learning_rate': 1.815868575576426e-05, 'epoch': 0.4} {'loss': 0.7157, 'learning_rate': 1.815849646450072e-05, 'epoch': 0.4} {'loss': 0.8996, 'learning_rate': 1.8158307164494613e-05, 'epoch': 0.4} {'loss': 0.7592, 'learning_rate': 1.815811785574614e-05, 'epoch': 0.4} {'loss': 0.8975, 'learning_rate': 1.815792853825551e-05, 'epoch': 0.4} {'loss': 1.0035, 'learning_rate': 1.8157739212022922e-05, 'epoch': 0.4} {'loss': 0.8498, 'learning_rate': 1.815754987704858e-05, 'epoch': 0.4} {'loss': 1.0096, 'learning_rate': 1.8157360533332686e-05, 'epoch': 0.4} {'loss': 0.7953, 'learning_rate': 1.8157171180875446e-05, 'epoch': 0.4} {'loss': 0.9209, 'learning_rate': 1.8156981819677063e-05, 'epoch': 0.4} {'loss': 0.903, 'learning_rate': 1.8156792449737734e-05, 'epoch': 0.4} {'loss': 1.0066, 'learning_rate': 1.8156603071057665e-05, 'epoch': 0.4} {'loss': 0.9151, 'learning_rate': 1.8156413683637063e-05, 'epoch': 0.4} {'loss': 0.7524, 'learning_rate': 1.8156224287476124e-05, 'epoch': 0.4} {'loss': 0.7888, 'learning_rate': 1.8156034882575056e-05, 'epoch': 0.4} {'loss': 0.8719, 'learning_rate': 1.815584546893406e-05, 'epoch': 0.4} {'loss': 0.7202, 'learning_rate': 1.8155656046553343e-05, 'epoch': 0.4} {'loss': 0.7579, 'learning_rate': 1.81554666154331e-05, 'epoch': 0.4} {'loss': 1.0034, 'learning_rate': 1.815527717557354e-05, 'epoch': 0.4} {'loss': 0.783, 'learning_rate': 1.8155087726974866e-05, 'epoch': 0.4} {'loss': 0.8392, 'learning_rate': 1.8154898269637278e-05, 'epoch': 0.4} {'loss': 0.9458, 'learning_rate': 1.815470880356098e-05, 'epoch': 0.4} {'loss': 0.8082, 'learning_rate': 1.8154519328746178e-05, 'epoch': 0.4} {'loss': 0.9442, 'learning_rate': 1.815432984519307e-05, 'epoch': 0.4} {'loss': 0.944, 'learning_rate': 1.815414035290186e-05, 'epoch': 0.4} {'loss': 0.906, 'learning_rate': 1.8153950851872757e-05, 'epoch': 0.4} {'loss': 0.6976, 'learning_rate': 1.8153761342105957e-05, 'epoch': 0.4} {'loss': 0.9055, 'learning_rate': 1.8153571823601667e-05, 'epoch': 0.4} {'loss': 0.854, 'learning_rate': 1.8153382296360086e-05, 'epoch': 0.4} {'loss': 0.9207, 'learning_rate': 1.8153192760381425e-05, 'epoch': 0.4} {'loss': 0.7834, 'learning_rate': 1.815300321566588e-05, 'epoch': 0.4} {'loss': 0.945, 'learning_rate': 1.8152813662213654e-05, 'epoch': 0.4} {'loss': 0.9868, 'learning_rate': 1.8152624100024954e-05, 'epoch': 0.4} {'loss': 0.8195, 'learning_rate': 1.815243452909998e-05, 'epoch': 0.4} {'loss': 1.0538, 'learning_rate': 1.815224494943894e-05, 'epoch': 0.4} {'loss': 0.8325, 'learning_rate': 1.8152055361042033e-05, 'epoch': 0.4} {'loss': 0.8061, 'learning_rate': 1.815186576390946e-05, 'epoch': 0.4} {'loss': 0.848, 'learning_rate': 1.8151676158041425e-05, 'epoch': 0.4} {'loss': 0.8311, 'learning_rate': 1.815148654343814e-05, 'epoch': 0.4} {'loss': 0.8267, 'learning_rate': 1.8151296920099797e-05, 'epoch': 0.4} {'loss': 0.9612, 'learning_rate': 1.8151107288026607e-05, 'epoch': 0.4} {'loss': 1.0822, 'learning_rate': 1.815091764721877e-05, 'epoch': 0.4} {'loss': 0.8048, 'learning_rate': 1.8150727997676486e-05, 'epoch': 0.4} {'loss': 0.8739, 'learning_rate': 1.8150538339399962e-05, 'epoch': 0.4} {'loss': 0.9134, 'learning_rate': 1.81503486723894e-05, 'epoch': 0.4} {'loss': 0.8557, 'learning_rate': 1.8150158996645003e-05, 'epoch': 0.4} {'loss': 0.9104, 'learning_rate': 1.814996931216698e-05, 'epoch': 0.4} {'loss': 0.673, 'learning_rate': 1.8149779618955526e-05, 'epoch': 0.4} {'loss': 0.8446, 'learning_rate': 1.8149589917010845e-05, 'epoch': 0.4} {'loss': 0.9733, 'learning_rate': 1.8149400206333146e-05, 'epoch': 0.4} {'loss': 0.8009, 'learning_rate': 1.814921048692263e-05, 'epoch': 0.4} {'loss': 0.8616, 'learning_rate': 1.8149020758779497e-05, 'epoch': 0.4} {'loss': 0.9427, 'learning_rate': 1.8148831021903953e-05, 'epoch': 0.4} {'loss': 0.6986, 'learning_rate': 1.81486412762962e-05, 'epoch': 0.4} {'loss': 0.8739, 'learning_rate': 1.8148451521956447e-05, 'epoch': 0.4} {'loss': 1.0331, 'learning_rate': 1.814826175888489e-05, 'epoch': 0.4} {'loss': 0.6559, 'learning_rate': 1.8148071987081735e-05, 'epoch': 0.4} {'loss': 0.8905, 'learning_rate': 1.8147882206547182e-05, 'epoch': 0.4} {'loss': 0.8288, 'learning_rate': 1.8147692417281444e-05, 'epoch': 0.4} {'loss': 0.9058, 'learning_rate': 1.8147502619284715e-05, 'epoch': 0.4} {'loss': 0.871, 'learning_rate': 1.8147312812557203e-05, 'epoch': 0.4} {'loss': 1.0711, 'learning_rate': 1.814712299709911e-05, 'epoch': 0.4} {'loss': 0.8578, 'learning_rate': 1.814693317291064e-05, 'epoch': 0.4} {'loss': 0.8315, 'learning_rate': 1.8146743339991992e-05, 'epoch': 0.4} {'loss': 0.89, 'learning_rate': 1.8146553498343376e-05, 'epoch': 0.4} {'loss': 0.7979, 'learning_rate': 1.814636364796499e-05, 'epoch': 0.4} {'loss': 0.9007, 'learning_rate': 1.8146173788857046e-05, 'epoch': 0.4} {'loss': 1.0153, 'learning_rate': 1.8145983921019736e-05, 'epoch': 0.4} {'loss': 0.8771, 'learning_rate': 1.814579404445327e-05, 'epoch': 0.4} {'loss': 0.9749, 'learning_rate': 1.8145604159157852e-05, 'epoch': 0.4} {'loss': 0.8363, 'learning_rate': 1.814541426513368e-05, 'epoch': 0.4} {'loss': 0.9267, 'learning_rate': 1.8145224362380965e-05, 'epoch': 0.4} {'loss': 0.8842, 'learning_rate': 1.814503445089991e-05, 'epoch': 0.4} {'loss': 0.8424, 'learning_rate': 1.8144844530690712e-05, 'epoch': 0.4} {'loss': 0.854, 'learning_rate': 1.8144654601753578e-05, 'epoch': 0.4} {'loss': 0.9484, 'learning_rate': 1.814446466408871e-05, 'epoch': 0.4} {'loss': 0.7702, 'learning_rate': 1.8144274717696316e-05, 'epoch': 0.4} {'loss': 0.9909, 'learning_rate': 1.8144084762576594e-05, 'epoch': 0.4} {'loss': 0.9084, 'learning_rate': 1.814389479872975e-05, 'epoch': 0.4} {'loss': 0.5453, 'learning_rate': 1.8143704826155992e-05, 'epoch': 0.4} {'loss': 0.8452, 'learning_rate': 1.8143514844855515e-05, 'epoch': 0.4} {'loss': 0.9347, 'learning_rate': 1.814332485482853e-05, 'epoch': 0.4} {'loss': 1.0162, 'learning_rate': 1.8143134856075236e-05, 'epoch': 0.4} {'loss': 0.8924, 'learning_rate': 1.8142944848595837e-05, 'epoch': 0.4} {'loss': 0.8968, 'learning_rate': 1.8142754832390535e-05, 'epoch': 0.4} {'loss': 0.8383, 'learning_rate': 1.814256480745954e-05, 'epoch': 0.4} {'loss': 0.9373, 'learning_rate': 1.8142374773803056e-05, 'epoch': 0.4} {'loss': 0.8964, 'learning_rate': 1.8142184731421275e-05, 'epoch': 0.4} {'loss': 0.8908, 'learning_rate': 1.814199468031441e-05, 'epoch': 0.4} {'loss': 0.966, 'learning_rate': 1.8141804620482666e-05, 'epoch': 0.4} {'loss': 0.9122, 'learning_rate': 1.8141614551926242e-05, 'epoch': 0.4} {'loss': 0.7398, 'learning_rate': 1.8141424474645342e-05, 'epoch': 0.4} {'loss': 0.8662, 'learning_rate': 1.814123438864017e-05, 'epoch': 0.4} {'loss': 0.9307, 'learning_rate': 1.8141044293910934e-05, 'epoch': 0.4} {'loss': 0.8373, 'learning_rate': 1.814085419045783e-05, 'epoch': 0.4} {'loss': 0.8648, 'learning_rate': 1.814066407828107e-05, 'epoch': 0.4} {'loss': 1.0358, 'learning_rate': 1.8140473957380852e-05, 'epoch': 0.4} {'loss': 0.8374, 'learning_rate': 1.814028382775738e-05, 'epoch': 0.4} {'loss': 0.9766, 'learning_rate': 1.8140093689410863e-05, 'epoch': 0.4} {'loss': 0.8291, 'learning_rate': 1.81399035423415e-05, 'epoch': 0.4} {'loss': 1.014, 'learning_rate': 1.813971338654949e-05, 'epoch': 0.4} {'loss': 0.9927, 'learning_rate': 1.8139523222035048e-05, 'epoch': 0.4} {'loss': 0.8594, 'learning_rate': 1.8139333048798372e-05, 'epoch': 0.4} {'loss': 0.8033, 'learning_rate': 1.8139142866839666e-05, 'epoch': 0.4} {'loss': 0.8036, 'learning_rate': 1.8138952676159133e-05, 'epoch': 0.4} {'loss': 0.8376, 'learning_rate': 1.8138762476756976e-05, 'epoch': 0.4} {'loss': 1.1045, 'learning_rate': 1.8138572268633402e-05, 'epoch': 0.4} {'loss': 0.854, 'learning_rate': 1.813838205178861e-05, 'epoch': 0.4} {'loss': 0.8373, 'learning_rate': 1.8138191826222812e-05, 'epoch': 0.4} {'loss': 0.8379, 'learning_rate': 1.8138001591936206e-05, 'epoch': 0.4} {'loss': 0.9276, 'learning_rate': 1.8137811348928996e-05, 'epoch': 0.4} {'loss': 0.8824, 'learning_rate': 1.8137621097201386e-05, 'epoch': 0.4} {'loss': 0.9316, 'learning_rate': 1.813743083675358e-05, 'epoch': 0.4} {'loss': 0.7489, 'learning_rate': 1.8137240567585786e-05, 'epoch': 0.4} {'loss': 0.9329, 'learning_rate': 1.81370502896982e-05, 'epoch': 0.4} {'loss': 0.8304, 'learning_rate': 1.8136860003091033e-05, 'epoch': 0.4} {'loss': 0.8122, 'learning_rate': 1.8136669707764485e-05, 'epoch': 0.4} {'loss': 0.8706, 'learning_rate': 1.813647940371876e-05, 'epoch': 0.4} {'loss': 0.7833, 'learning_rate': 1.8136289090954067e-05, 'epoch': 0.4} {'loss': 0.9349, 'learning_rate': 1.81360987694706e-05, 'epoch': 0.4} {'loss': 0.9973, 'learning_rate': 1.8135908439268575e-05, 'epoch': 0.4} {'loss': 0.8246, 'learning_rate': 1.8135718100348185e-05, 'epoch': 0.4} {'loss': 1.1245, 'learning_rate': 1.8135527752709642e-05, 'epoch': 0.4} {'loss': 0.6209, 'learning_rate': 1.8135337396353144e-05, 'epoch': 0.4} {'loss': 0.9047, 'learning_rate': 1.8135147031278898e-05, 'epoch': 0.4} {'loss': 0.954, 'learning_rate': 1.8134956657487107e-05, 'epoch': 0.4} {'loss': 0.8294, 'learning_rate': 1.813476627497798e-05, 'epoch': 0.4} {'loss': 0.8025, 'learning_rate': 1.8134575883751716e-05, 'epoch': 0.4} {'loss': 0.8817, 'learning_rate': 1.8134385483808515e-05, 'epoch': 0.4} {'loss': 0.8361, 'learning_rate': 1.813419507514859e-05, 'epoch': 0.4} {'loss': 0.844, 'learning_rate': 1.8134004657772136e-05, 'epoch': 0.4} {'loss': 0.8985, 'learning_rate': 1.8133814231679368e-05, 'epoch': 0.4} {'loss': 0.8675, 'learning_rate': 1.813362379687048e-05, 'epoch': 0.4} {'loss': 0.9395, 'learning_rate': 1.813343335334568e-05, 'epoch': 0.4} {'loss': 0.8931, 'learning_rate': 1.8133242901105175e-05, 'epoch': 0.4} {'loss': 0.9568, 'learning_rate': 1.8133052440149165e-05, 'epoch': 0.4} {'loss': 0.9434, 'learning_rate': 1.8132861970477852e-05, 'epoch': 0.4} {'loss': 1.0034, 'learning_rate': 1.813267149209145e-05, 'epoch': 0.4} {'loss': 0.8701, 'learning_rate': 1.813248100499015e-05, 'epoch': 0.4} {'loss': 0.8588, 'learning_rate': 1.8132290509174163e-05, 'epoch': 0.4} {'loss': 0.8065, 'learning_rate': 1.8132100004643698e-05, 'epoch': 0.4} {'loss': 0.8495, 'learning_rate': 1.813190949139895e-05, 'epoch': 0.4} {'loss': 0.9472, 'learning_rate': 1.8131718969440125e-05, 'epoch': 0.4} {'loss': 0.8572, 'learning_rate': 1.8131528438767435e-05, 'epoch': 0.4} {'loss': 0.7738, 'learning_rate': 1.8131337899381076e-05, 'epoch': 0.4} {'loss': 0.9371, 'learning_rate': 1.813114735128125e-05, 'epoch': 0.4} {'loss': 0.8972, 'learning_rate': 1.8130956794468172e-05, 'epoch': 0.4} {'loss': 0.8219, 'learning_rate': 1.8130766228942034e-05, 'epoch': 0.4} {'loss': 0.8629, 'learning_rate': 1.8130575654703055e-05, 'epoch': 0.4} {'loss': 0.7545, 'learning_rate': 1.8130385071751423e-05, 'epoch': 0.4} {'loss': 0.8798, 'learning_rate': 1.813019448008735e-05, 'epoch': 0.4} {'loss': 1.0857, 'learning_rate': 1.8130003879711044e-05, 'epoch': 0.4} {'loss': 0.875, 'learning_rate': 1.81298132706227e-05, 'epoch': 0.4} {'loss': 0.8823, 'learning_rate': 1.812962265282253e-05, 'epoch': 0.4} {'loss': 0.7573, 'learning_rate': 1.8129432026310734e-05, 'epoch': 0.4} {'loss': 0.6949, 'learning_rate': 1.812924139108752e-05, 'epoch': 0.4} {'loss': 0.7707, 'learning_rate': 1.812905074715309e-05, 'epoch': 0.4} {'loss': 0.9612, 'learning_rate': 1.812886009450765e-05, 'epoch': 0.4} {'loss': 0.8098, 'learning_rate': 1.81286694331514e-05, 'epoch': 0.4} {'loss': 0.9164, 'learning_rate': 1.8128478763084546e-05, 'epoch': 0.4} {'loss': 0.8652, 'learning_rate': 1.8128288084307294e-05, 'epoch': 0.4} {'loss': 0.8787, 'learning_rate': 1.812809739681985e-05, 'epoch': 0.4} {'loss': 0.9323, 'learning_rate': 1.8127906700622414e-05, 'epoch': 0.4} {'loss': 0.7521, 'learning_rate': 1.8127715995715195e-05, 'epoch': 0.4} {'loss': 0.7268, 'learning_rate': 1.812752528209839e-05, 'epoch': 0.4} {'loss': 1.0936, 'learning_rate': 1.812733455977221e-05, 'epoch': 0.4} {'loss': 0.9101, 'learning_rate': 1.812714382873686e-05, 'epoch': 0.4} {'loss': 0.7855, 'learning_rate': 1.812695308899254e-05, 'epoch': 0.4} {'loss': 0.8578, 'learning_rate': 1.812676234053946e-05, 'epoch': 0.4} {'loss': 1.0409, 'learning_rate': 1.8126571583377816e-05, 'epoch': 0.4} {'loss': 0.9224, 'learning_rate': 1.8126380817507817e-05, 'epoch': 0.4} {'loss': 0.9539, 'learning_rate': 1.8126190042929668e-05, 'epoch': 0.4} {'loss': 0.8095, 'learning_rate': 1.8125999259643574e-05, 'epoch': 0.4} {'loss': 0.9328, 'learning_rate': 1.812580846764974e-05, 'epoch': 0.4} {'loss': 0.8289, 'learning_rate': 1.8125617666948364e-05, 'epoch': 0.4} {'loss': 0.8241, 'learning_rate': 1.8125426857539658e-05, 'epoch': 0.4} {'loss': 0.9172, 'learning_rate': 1.8125236039423826e-05, 'epoch': 0.4} {'loss': 1.0119, 'learning_rate': 1.812504521260107e-05, 'epoch': 0.4} {'loss': 0.8361, 'learning_rate': 1.812485437707159e-05, 'epoch': 0.4} {'loss': 0.9737, 'learning_rate': 1.8124663532835598e-05, 'epoch': 0.4} {'loss': 0.7542, 'learning_rate': 1.8124472679893298e-05, 'epoch': 0.4} {'loss': 0.8451, 'learning_rate': 1.812428181824489e-05, 'epoch': 0.4} {'loss': 0.9866, 'learning_rate': 1.8124090947890577e-05, 'epoch': 0.4} {'loss': 1.017, 'learning_rate': 1.8123900068830573e-05, 'epoch': 0.4} {'loss': 0.9678, 'learning_rate': 1.8123709181065075e-05, 'epoch': 0.4} {'loss': 0.8846, 'learning_rate': 1.8123518284594288e-05, 'epoch': 0.4} {'loss': 0.8314, 'learning_rate': 1.812332737941842e-05, 'epoch': 0.4} {'loss': 0.9394, 'learning_rate': 1.8123136465537674e-05, 'epoch': 0.4} {'loss': 0.7511, 'learning_rate': 1.812294554295225e-05, 'epoch': 0.4} {'loss': 0.7838, 'learning_rate': 1.8122754611662362e-05, 'epoch': 0.4} {'loss': 0.7312, 'learning_rate': 1.8122563671668206e-05, 'epoch': 0.4} {'loss': 0.8843, 'learning_rate': 1.812237272296999e-05, 'epoch': 0.4} {'loss': 0.9943, 'learning_rate': 1.8122181765567923e-05, 'epoch': 0.4} {'loss': 0.8804, 'learning_rate': 1.81219907994622e-05, 'epoch': 0.4} {'loss': 0.8496, 'learning_rate': 1.8121799824653036e-05, 'epoch': 0.4} {'loss': 0.8442, 'learning_rate': 1.8121608841140625e-05, 'epoch': 0.4} {'loss': 0.8378, 'learning_rate': 1.8121417848925177e-05, 'epoch': 0.4} {'loss': 0.833, 'learning_rate': 1.81212268480069e-05, 'epoch': 0.4} {'loss': 0.9499, 'learning_rate': 1.8121035838385995e-05, 'epoch': 0.4} {'loss': 0.5798, 'learning_rate': 1.8120844820062667e-05, 'epoch': 0.4} {'loss': 1.0933, 'learning_rate': 1.8120653793037117e-05, 'epoch': 0.4} {'loss': 0.6857, 'learning_rate': 1.812046275730956e-05, 'epoch': 0.4} {'loss': 1.1002, 'learning_rate': 1.8120271712880188e-05, 'epoch': 0.4} {'loss': 0.8531, 'learning_rate': 1.8120080659749217e-05, 'epoch': 0.4} {'loss': 0.7435, 'learning_rate': 1.8119889597916843e-05, 'epoch': 0.4} {'loss': 0.7548, 'learning_rate': 1.8119698527383275e-05, 'epoch': 0.4} {'loss': 0.8091, 'learning_rate': 1.811950744814872e-05, 'epoch': 0.4} {'loss': 0.9316, 'learning_rate': 1.811931636021338e-05, 'epoch': 0.4} {'loss': 0.9835, 'learning_rate': 1.8119125263577455e-05, 'epoch': 0.4} {'loss': 0.8352, 'learning_rate': 1.8118934158241157e-05, 'epoch': 0.4} {'loss': 1.0757, 'learning_rate': 1.811874304420469e-05, 'epoch': 0.4} {'loss': 0.8264, 'learning_rate': 1.8118551921468253e-05, 'epoch': 0.4} {'loss': 0.7905, 'learning_rate': 1.8118360790032058e-05, 'epoch': 0.4} {'loss': 0.8444, 'learning_rate': 1.811816964989631e-05, 'epoch': 0.4} {'loss': 0.9287, 'learning_rate': 1.8117978501061206e-05, 'epoch': 0.4} {'loss': 0.857, 'learning_rate': 1.8117787343526957e-05, 'epoch': 0.4} {'loss': 0.7768, 'learning_rate': 1.8117596177293764e-05, 'epoch': 0.4} {'loss': 0.8484, 'learning_rate': 1.8117405002361834e-05, 'epoch': 0.4} {'loss': 0.8856, 'learning_rate': 1.8117213818731373e-05, 'epoch': 0.4} {'loss': 0.9375, 'learning_rate': 1.8117022626402585e-05, 'epoch': 0.4} {'loss': 1.0572, 'learning_rate': 1.8116831425375678e-05, 'epoch': 0.4} {'loss': 0.8588, 'learning_rate': 1.8116640215650846e-05, 'epoch': 0.4} {'loss': 0.9285, 'learning_rate': 1.8116448997228307e-05, 'epoch': 0.4} {'loss': 0.9587, 'learning_rate': 1.8116257770108258e-05, 'epoch': 0.4} {'loss': 0.8769, 'learning_rate': 1.811606653429091e-05, 'epoch': 0.4} {'loss': 0.8329, 'learning_rate': 1.811587528977646e-05, 'epoch': 0.4} {'loss': 0.9538, 'learning_rate': 1.8115684036565118e-05, 'epoch': 0.4} {'loss': 0.7528, 'learning_rate': 1.811549277465709e-05, 'epoch': 0.4} {'loss': 0.9351, 'learning_rate': 1.8115301504052575e-05, 'epoch': 0.4} {'loss': 0.893, 'learning_rate': 1.8115110224751786e-05, 'epoch': 0.4} {'loss': 0.9494, 'learning_rate': 1.8114918936754923e-05, 'epoch': 0.4} {'loss': 0.8043, 'learning_rate': 1.811472764006219e-05, 'epoch': 0.4} {'loss': 0.9532, 'learning_rate': 1.81145363346738e-05, 'epoch': 0.4} {'loss': 0.8963, 'learning_rate': 1.811434502058994e-05, 'epoch': 0.4} {'loss': 0.8112, 'learning_rate': 1.811415369781084e-05, 'epoch': 0.4} {'loss': 0.9205, 'learning_rate': 1.8113962366336687e-05, 'epoch': 0.4} {'loss': 0.9426, 'learning_rate': 1.8113771026167687e-05, 'epoch': 0.4} {'loss': 0.9623, 'learning_rate': 1.8113579677304053e-05, 'epoch': 0.4} {'loss': 0.8543, 'learning_rate': 1.8113388319745985e-05, 'epoch': 0.4} {'loss': 1.0006, 'learning_rate': 1.811319695349369e-05, 'epoch': 0.4} {'loss': 0.8531, 'learning_rate': 1.811300557854737e-05, 'epoch': 0.4} {'loss': 0.8456, 'learning_rate': 1.8112814194907237e-05, 'epoch': 0.4} {'loss': 1.0525, 'learning_rate': 1.8112622802573486e-05, 'epoch': 0.4} {'loss': 0.7918, 'learning_rate': 1.811243140154633e-05, 'epoch': 0.4} {'loss': 0.8651, 'learning_rate': 1.811223999182597e-05, 'epoch': 0.4} {'loss': 0.89, 'learning_rate': 1.8112048573412618e-05, 'epoch': 0.4} {'loss': 0.6888, 'learning_rate': 1.8111857146306467e-05, 'epoch': 0.4} {'loss': 0.9884, 'learning_rate': 1.8111665710507732e-05, 'epoch': 0.4} {'loss': 0.8227, 'learning_rate': 1.8111474266016616e-05, 'epoch': 0.4} {'loss': 0.95, 'learning_rate': 1.8111282812833322e-05, 'epoch': 0.4} {'loss': 0.9336, 'learning_rate': 1.8111091350958058e-05, 'epoch': 0.4} {'loss': 0.8734, 'learning_rate': 1.8110899880391023e-05, 'epoch': 0.4} {'loss': 0.8768, 'learning_rate': 1.811070840113243e-05, 'epoch': 0.4} {'loss': 0.9669, 'learning_rate': 1.8110516913182483e-05, 'epoch': 0.4} {'loss': 0.8632, 'learning_rate': 1.811032541654138e-05, 'epoch': 0.4} {'loss': 0.6817, 'learning_rate': 1.8110133911209335e-05, 'epoch': 0.4} {'loss': 1.0621, 'learning_rate': 1.810994239718655e-05, 'epoch': 0.4} {'loss': 0.8708, 'learning_rate': 1.8109750874473227e-05, 'epoch': 0.4} {'loss': 0.8926, 'learning_rate': 1.8109559343069575e-05, 'epoch': 0.4} {'loss': 0.8378, 'learning_rate': 1.81093678029758e-05, 'epoch': 0.4} {'loss': 0.7749, 'learning_rate': 1.81091762541921e-05, 'epoch': 0.4} {'loss': 0.9108, 'learning_rate': 1.8108984696718692e-05, 'epoch': 0.4} {'loss': 0.931, 'learning_rate': 1.8108793130555773e-05, 'epoch': 0.4} {'loss': 0.8734, 'learning_rate': 1.8108601555703552e-05, 'epoch': 0.4} {'loss': 0.7804, 'learning_rate': 1.810840997216223e-05, 'epoch': 0.4} {'loss': 0.8243, 'learning_rate': 1.8108218379932014e-05, 'epoch': 0.4} {'loss': 0.8431, 'learning_rate': 1.8108026779013113e-05, 'epoch': 0.4} {'loss': 0.826, 'learning_rate': 1.8107835169405728e-05, 'epoch': 0.4} {'loss': 0.7996, 'learning_rate': 1.8107643551110064e-05, 'epoch': 0.4} {'loss': 0.8817, 'learning_rate': 1.8107451924126334e-05, 'epoch': 0.4} {'loss': 0.7432, 'learning_rate': 1.810726028845473e-05, 'epoch': 0.4} {'loss': 1.0713, 'learning_rate': 1.8107068644095468e-05, 'epoch': 0.4} {'loss': 0.8577, 'learning_rate': 1.810687699104875e-05, 'epoch': 0.4} {'loss': 0.8729, 'learning_rate': 1.8106685329314785e-05, 'epoch': 0.4} {'loss': 0.7184, 'learning_rate': 1.8106493658893775e-05, 'epoch': 0.4} {'loss': 0.924, 'learning_rate': 1.810630197978592e-05, 'epoch': 0.4} {'loss': 0.7636, 'learning_rate': 1.8106110291991434e-05, 'epoch': 0.4} {'loss': 0.7307, 'learning_rate': 1.810591859551052e-05, 'epoch': 0.4} {'loss': 0.8588, 'learning_rate': 1.810572689034338e-05, 'epoch': 0.4} {'loss': 0.8522, 'learning_rate': 1.8105535176490225e-05, 'epoch': 0.4} {'loss': 0.991, 'learning_rate': 1.8105343453951257e-05, 'epoch': 0.4} {'loss': 0.9137, 'learning_rate': 1.8105151722726678e-05, 'epoch': 0.4} {'loss': 0.7897, 'learning_rate': 1.8104959982816704e-05, 'epoch': 0.4} {'loss': 1.085, 'learning_rate': 1.810476823422153e-05, 'epoch': 0.4} {'loss': 0.8305, 'learning_rate': 1.8104576476941366e-05, 'epoch': 0.4} {'loss': 0.8923, 'learning_rate': 1.8104384710976415e-05, 'epoch': 0.4} {'loss': 0.8656, 'learning_rate': 1.8104192936326886e-05, 'epoch': 0.4} {'loss': 1.024, 'learning_rate': 1.8104001152992982e-05, 'epoch': 0.4} {'loss': 0.7854, 'learning_rate': 1.810380936097491e-05, 'epoch': 0.4} {'loss': 0.9653, 'learning_rate': 1.8103617560272874e-05, 'epoch': 0.4} {'loss': 0.9889, 'learning_rate': 1.8103425750887083e-05, 'epoch': 0.4} {'loss': 0.9066, 'learning_rate': 1.8103233932817737e-05, 'epoch': 0.4} {'loss': 0.8375, 'learning_rate': 1.8103042106065046e-05, 'epoch': 0.4} {'loss': 0.7738, 'learning_rate': 1.8102850270629214e-05, 'epoch': 0.4} {'loss': 0.9115, 'learning_rate': 1.8102658426510444e-05, 'epoch': 0.4} {'loss': 0.7628, 'learning_rate': 1.810246657370895e-05, 'epoch': 0.4} {'loss': 0.8094, 'learning_rate': 1.8102274712224926e-05, 'epoch': 0.4} {'loss': 0.7814, 'learning_rate': 1.8102082842058585e-05, 'epoch': 0.4} {'loss': 0.8439, 'learning_rate': 1.8101890963210133e-05, 'epoch': 0.4} {'loss': 0.7677, 'learning_rate': 1.8101699075679772e-05, 'epoch': 0.4} {'loss': 0.8369, 'learning_rate': 1.8101507179467706e-05, 'epoch': 0.4} {'loss': 0.9632, 'learning_rate': 1.810131527457415e-05, 'epoch': 0.4} {'loss': 0.8832, 'learning_rate': 1.81011233609993e-05, 'epoch': 0.4} {'loss': 0.8256, 'learning_rate': 1.8100931438743364e-05, 'epoch': 0.4} {'loss': 0.9086, 'learning_rate': 1.8100739507806553e-05, 'epoch': 0.4} {'loss': 1.0144, 'learning_rate': 1.8100547568189063e-05, 'epoch': 0.4} {'loss': 0.7334, 'learning_rate': 1.810035561989111e-05, 'epoch': 0.4} {'loss': 0.9596, 'learning_rate': 1.8100163662912896e-05, 'epoch': 0.4} {'loss': 0.9743, 'learning_rate': 1.809997169725462e-05, 'epoch': 0.4} {'loss': 0.6145, 'learning_rate': 1.8099779722916496e-05, 'epoch': 0.4} {'loss': 0.8416, 'learning_rate': 1.809958773989873e-05, 'epoch': 0.4} {'loss': 0.8779, 'learning_rate': 1.8099395748201517e-05, 'epoch': 0.4} {'loss': 0.8283, 'learning_rate': 1.8099203747825077e-05, 'epoch': 0.4} {'loss': 0.9914, 'learning_rate': 1.8099011738769605e-05, 'epoch': 0.4} {'loss': 0.8356, 'learning_rate': 1.8098819721035315e-05, 'epoch': 0.4} {'loss': 0.9416, 'learning_rate': 1.8098627694622406e-05, 'epoch': 0.4} {'loss': 0.8381, 'learning_rate': 1.809843565953109e-05, 'epoch': 0.4} {'loss': 0.8068, 'learning_rate': 1.8098243615761565e-05, 'epoch': 0.4} {'loss': 0.8735, 'learning_rate': 1.8098051563314042e-05, 'epoch': 0.4} {'loss': 0.788, 'learning_rate': 1.8097859502188727e-05, 'epoch': 0.4} {'loss': 0.7403, 'learning_rate': 1.8097667432385824e-05, 'epoch': 0.4} {'loss': 0.8266, 'learning_rate': 1.809747535390554e-05, 'epoch': 0.4} {'loss': 0.8486, 'learning_rate': 1.809728326674808e-05, 'epoch': 0.4} {'loss': 0.7234, 'learning_rate': 1.809709117091365e-05, 'epoch': 0.4} {'loss': 0.9632, 'learning_rate': 1.8096899066402457e-05, 'epoch': 0.4} {'loss': 0.8175, 'learning_rate': 1.8096706953214706e-05, 'epoch': 0.4} {'loss': 1.0144, 'learning_rate': 1.8096514831350597e-05, 'epoch': 0.4} {'loss': 0.9814, 'learning_rate': 1.8096322700810346e-05, 'epoch': 0.4} {'loss': 1.0011, 'learning_rate': 1.8096130561594157e-05, 'epoch': 0.4} {'loss': 1.0119, 'learning_rate': 1.809593841370223e-05, 'epoch': 0.4} {'loss': 0.911, 'learning_rate': 1.8095746257134777e-05, 'epoch': 0.4} {'loss': 0.8942, 'learning_rate': 1.8095554091892e-05, 'epoch': 0.4} {'loss': 0.7123, 'learning_rate': 1.8095361917974104e-05, 'epoch': 0.4} {'loss': 0.9625, 'learning_rate': 1.80951697353813e-05, 'epoch': 0.4} {'loss': 0.9365, 'learning_rate': 1.8094977544113788e-05, 'epoch': 0.4} {'loss': 0.7845, 'learning_rate': 1.809478534417178e-05, 'epoch': 0.4} {'loss': 0.8998, 'learning_rate': 1.809459313555548e-05, 'epoch': 0.4} {'loss': 0.94, 'learning_rate': 1.809440091826509e-05, 'epoch': 0.4} {'loss': 0.9122, 'learning_rate': 1.8094208692300816e-05, 'epoch': 0.4} {'loss': 0.8693, 'learning_rate': 1.809401645766287e-05, 'epoch': 0.4} {'loss': 0.9136, 'learning_rate': 1.8093824214351457e-05, 'epoch': 0.4} {'loss': 0.924, 'learning_rate': 1.809363196236678e-05, 'epoch': 0.4} {'loss': 0.9103, 'learning_rate': 1.8093439701709045e-05, 'epoch': 0.4} {'loss': 0.8136, 'learning_rate': 1.8093247432378458e-05, 'epoch': 0.4} {'loss': 0.6421, 'learning_rate': 1.809305515437523e-05, 'epoch': 0.4} {'loss': 0.8964, 'learning_rate': 1.8092862867699555e-05, 'epoch': 0.4} {'loss': 0.7322, 'learning_rate': 1.809267057235165e-05, 'epoch': 0.4} {'loss': 0.8097, 'learning_rate': 1.8092478268331723e-05, 'epoch': 0.4} {'loss': 0.8593, 'learning_rate': 1.809228595563997e-05, 'epoch': 0.4} {'loss': 0.7841, 'learning_rate': 1.8092093634276604e-05, 'epoch': 0.4} {'loss': 0.9389, 'learning_rate': 1.809190130424183e-05, 'epoch': 0.4} {'loss': 0.9893, 'learning_rate': 1.8091708965535852e-05, 'epoch': 0.4} {'loss': 0.7454, 'learning_rate': 1.809151661815888e-05, 'epoch': 0.4} {'loss': 1.0328, 'learning_rate': 1.8091324262111113e-05, 'epoch': 0.4} {'loss': 0.8247, 'learning_rate': 1.8091131897392768e-05, 'epoch': 0.4} {'loss': 0.9963, 'learning_rate': 1.8090939524004037e-05, 'epoch': 0.4} {'loss': 0.9134, 'learning_rate': 1.8090747141945142e-05, 'epoch': 0.4} {'loss': 0.9265, 'learning_rate': 1.809055475121628e-05, 'epoch': 0.4} {'loss': 1.015, 'learning_rate': 1.8090362351817654e-05, 'epoch': 0.4} {'loss': 0.8036, 'learning_rate': 1.8090169943749477e-05, 'epoch': 0.4} {'loss': 0.9522, 'learning_rate': 1.808997752701195e-05, 'epoch': 0.41} {'loss': 0.7512, 'learning_rate': 1.8089785101605285e-05, 'epoch': 0.41} {'loss': 0.6601, 'learning_rate': 1.8089592667529686e-05, 'epoch': 0.41} {'loss': 0.7566, 'learning_rate': 1.8089400224785356e-05, 'epoch': 0.41} {'loss': 0.9143, 'learning_rate': 1.8089207773372504e-05, 'epoch': 0.41} {'loss': 0.9659, 'learning_rate': 1.8089015313291334e-05, 'epoch': 0.41} {'loss': 0.8533, 'learning_rate': 1.808882284454206e-05, 'epoch': 0.41} {'loss': 0.9792, 'learning_rate': 1.8088630367124876e-05, 'epoch': 0.41} {'loss': 1.1029, 'learning_rate': 1.8088437881039998e-05, 'epoch': 0.41} {'loss': 0.9178, 'learning_rate': 1.8088245386287628e-05, 'epoch': 0.41} {'loss': 0.8352, 'learning_rate': 1.8088052882867973e-05, 'epoch': 0.41} {'loss': 0.8322, 'learning_rate': 1.808786037078124e-05, 'epoch': 0.41} {'loss': 1.0255, 'learning_rate': 1.808766785002763e-05, 'epoch': 0.41} {'loss': 0.8847, 'learning_rate': 1.808747532060736e-05, 'epoch': 0.41} {'loss': 0.9745, 'learning_rate': 1.8087282782520627e-05, 'epoch': 0.41} {'loss': 0.7407, 'learning_rate': 1.808709023576764e-05, 'epoch': 0.41} {'loss': 0.8702, 'learning_rate': 1.808689768034861e-05, 'epoch': 0.41} {'loss': 0.8047, 'learning_rate': 1.8086705116263737e-05, 'epoch': 0.41} {'loss': 0.8839, 'learning_rate': 1.8086512543513226e-05, 'epoch': 0.41} {'loss': 1.0064, 'learning_rate': 1.8086319962097293e-05, 'epoch': 0.41} {'loss': 0.8425, 'learning_rate': 1.8086127372016132e-05, 'epoch': 0.41} {'loss': 0.9512, 'learning_rate': 1.808593477326996e-05, 'epoch': 0.41} {'loss': 0.8631, 'learning_rate': 1.808574216585898e-05, 'epoch': 0.41} {'loss': 0.8004, 'learning_rate': 1.8085549549783396e-05, 'epoch': 0.41} {'loss': 0.8598, 'learning_rate': 1.8085356925043416e-05, 'epoch': 0.41} {'loss': 0.8433, 'learning_rate': 1.8085164291639247e-05, 'epoch': 0.41} {'loss': 0.8615, 'learning_rate': 1.808497164957109e-05, 'epoch': 0.41} {'loss': 0.9332, 'learning_rate': 1.8084778998839164e-05, 'epoch': 0.41} {'loss': 0.8034, 'learning_rate': 1.808458633944366e-05, 'epoch': 0.41} {'loss': 0.8121, 'learning_rate': 1.8084393671384796e-05, 'epoch': 0.41} {'loss': 0.8449, 'learning_rate': 1.8084200994662776e-05, 'epoch': 0.41} {'loss': 0.8038, 'learning_rate': 1.8084008309277804e-05, 'epoch': 0.41} {'loss': 0.8689, 'learning_rate': 1.8083815615230085e-05, 'epoch': 0.41} {'loss': 0.8002, 'learning_rate': 1.808362291251983e-05, 'epoch': 0.41} {'loss': 0.8776, 'learning_rate': 1.8083430201147244e-05, 'epoch': 0.41} {'loss': 0.964, 'learning_rate': 1.808323748111253e-05, 'epoch': 0.41} {'loss': 0.9748, 'learning_rate': 1.80830447524159e-05, 'epoch': 0.41} {'loss': 0.9307, 'learning_rate': 1.8082852015057554e-05, 'epoch': 0.41} {'loss': 0.7415, 'learning_rate': 1.8082659269037708e-05, 'epoch': 0.41} {'loss': 1.0546, 'learning_rate': 1.808246651435656e-05, 'epoch': 0.41} {'loss': 0.9281, 'learning_rate': 1.8082273751014323e-05, 'epoch': 0.41} {'loss': 0.7756, 'learning_rate': 1.80820809790112e-05, 'epoch': 0.41} {'loss': 0.8841, 'learning_rate': 1.8081888198347392e-05, 'epoch': 0.41} {'loss': 0.9599, 'learning_rate': 1.8081695409023116e-05, 'epoch': 0.41} {'loss': 0.9548, 'learning_rate': 1.8081502611038572e-05, 'epoch': 0.41} {'loss': 0.8087, 'learning_rate': 1.8081309804393973e-05, 'epoch': 0.41} {'loss': 0.8596, 'learning_rate': 1.8081116989089516e-05, 'epoch': 0.41} {'loss': 0.8476, 'learning_rate': 1.8080924165125415e-05, 'epoch': 0.41} {'loss': 0.7101, 'learning_rate': 1.808073133250187e-05, 'epoch': 0.41} {'loss': 0.8451, 'learning_rate': 1.8080538491219097e-05, 'epoch': 0.41} {'loss': 0.8021, 'learning_rate': 1.8080345641277298e-05, 'epoch': 0.41} {'loss': 0.9741, 'learning_rate': 1.808015278267668e-05, 'epoch': 0.41} {'loss': 0.9027, 'learning_rate': 1.8079959915417445e-05, 'epoch': 0.41} {'loss': 0.8532, 'learning_rate': 1.8079767039499805e-05, 'epoch': 0.41} {'loss': 0.9716, 'learning_rate': 1.8079574154923967e-05, 'epoch': 0.41} {'loss': 0.9313, 'learning_rate': 1.8079381261690134e-05, 'epoch': 0.41} {'loss': 0.892, 'learning_rate': 1.8079188359798517e-05, 'epoch': 0.41} {'loss': 0.8258, 'learning_rate': 1.8078995449249318e-05, 'epoch': 0.41} {'loss': 0.8559, 'learning_rate': 1.8078802530042748e-05, 'epoch': 0.41} {'loss': 1.0158, 'learning_rate': 1.807860960217901e-05, 'epoch': 0.41} {'loss': 0.7518, 'learning_rate': 1.8078416665658314e-05, 'epoch': 0.41} {'loss': 0.9073, 'learning_rate': 1.8078223720480867e-05, 'epoch': 0.41} {'loss': 0.9712, 'learning_rate': 1.8078030766646872e-05, 'epoch': 0.41} {'loss': 0.9191, 'learning_rate': 1.807783780415654e-05, 'epoch': 0.41} {'loss': 0.8187, 'learning_rate': 1.8077644833010074e-05, 'epoch': 0.41} {'loss': 0.9112, 'learning_rate': 1.8077451853207682e-05, 'epoch': 0.41} {'loss': 0.8877, 'learning_rate': 1.8077258864749572e-05, 'epoch': 0.41} {'loss': 1.0493, 'learning_rate': 1.807706586763595e-05, 'epoch': 0.41} {'loss': 0.7543, 'learning_rate': 1.8076872861867025e-05, 'epoch': 0.41} {'loss': 0.8788, 'learning_rate': 1.8076679847442998e-05, 'epoch': 0.41} {'loss': 0.9067, 'learning_rate': 1.8076486824364083e-05, 'epoch': 0.41} {'loss': 1.0561, 'learning_rate': 1.807629379263048e-05, 'epoch': 0.41} {'loss': 0.7491, 'learning_rate': 1.8076100752242403e-05, 'epoch': 0.41} {'loss': 0.8653, 'learning_rate': 1.8075907703200054e-05, 'epoch': 0.41} {'loss': 0.8558, 'learning_rate': 1.8075714645503638e-05, 'epoch': 0.41} {'loss': 0.8711, 'learning_rate': 1.8075521579153368e-05, 'epoch': 0.41} {'loss': 0.9742, 'learning_rate': 1.807532850414945e-05, 'epoch': 0.41} {'loss': 0.7358, 'learning_rate': 1.8075135420492086e-05, 'epoch': 0.41} {'loss': 0.8317, 'learning_rate': 1.8074942328181482e-05, 'epoch': 0.41} {'loss': 0.9506, 'learning_rate': 1.8074749227217854e-05, 'epoch': 0.41} {'loss': 0.8798, 'learning_rate': 1.80745561176014e-05, 'epoch': 0.41} {'loss': 0.793, 'learning_rate': 1.807436299933233e-05, 'epoch': 0.41} {'loss': 0.7394, 'learning_rate': 1.8074169872410853e-05, 'epoch': 0.41} {'loss': 0.976, 'learning_rate': 1.8073976736837174e-05, 'epoch': 0.41} {'loss': 0.8913, 'learning_rate': 1.8073783592611504e-05, 'epoch': 0.41} {'loss': 0.8153, 'learning_rate': 1.8073590439734043e-05, 'epoch': 0.41} {'loss': 0.8687, 'learning_rate': 1.8073397278204997e-05, 'epoch': 0.41} {'loss': 0.8777, 'learning_rate': 1.807320410802458e-05, 'epoch': 0.41} {'loss': 0.9216, 'learning_rate': 1.8073010929192997e-05, 'epoch': 0.41} {'loss': 0.9327, 'learning_rate': 1.8072817741710456e-05, 'epoch': 0.41} {'loss': 0.8715, 'learning_rate': 1.807262454557716e-05, 'epoch': 0.41} {'loss': 0.8841, 'learning_rate': 1.807243134079332e-05, 'epoch': 0.41} {'loss': 0.8138, 'learning_rate': 1.807223812735914e-05, 'epoch': 0.41} {'loss': 0.9484, 'learning_rate': 1.8072044905274827e-05, 'epoch': 0.41} {'loss': 0.9194, 'learning_rate': 1.8071851674540588e-05, 'epoch': 0.41} {'loss': 0.8365, 'learning_rate': 1.8071658435156634e-05, 'epoch': 0.41} {'loss': 0.8623, 'learning_rate': 1.807146518712317e-05, 'epoch': 0.41} {'loss': 0.9795, 'learning_rate': 1.8071271930440402e-05, 'epoch': 0.41} {'loss': 0.8295, 'learning_rate': 1.8071078665108536e-05, 'epoch': 0.41} {'loss': 0.7591, 'learning_rate': 1.8070885391127783e-05, 'epoch': 0.41} {'loss': 0.8733, 'learning_rate': 1.8070692108498345e-05, 'epoch': 0.41} {'loss': 0.8229, 'learning_rate': 1.8070498817220437e-05, 'epoch': 0.41} {'loss': 0.9211, 'learning_rate': 1.8070305517294255e-05, 'epoch': 0.41} {'loss': 0.9766, 'learning_rate': 1.8070112208720016e-05, 'epoch': 0.41} {'loss': 0.7117, 'learning_rate': 1.8069918891497925e-05, 'epoch': 0.41} {'loss': 0.9031, 'learning_rate': 1.806972556562818e-05, 'epoch': 0.41} {'loss': 0.8874, 'learning_rate': 1.8069532231111003e-05, 'epoch': 0.41} {'loss': 0.8163, 'learning_rate': 1.8069338887946594e-05, 'epoch': 0.41} {'loss': 0.963, 'learning_rate': 1.8069145536135158e-05, 'epoch': 0.41} {'loss': 0.9197, 'learning_rate': 1.80689521756769e-05, 'epoch': 0.41} {'loss': 0.9452, 'learning_rate': 1.806875880657204e-05, 'epoch': 0.41} {'loss': 0.7488, 'learning_rate': 1.806856542882077e-05, 'epoch': 0.41} {'loss': 0.8494, 'learning_rate': 1.8068372042423308e-05, 'epoch': 0.41} {'loss': 0.8175, 'learning_rate': 1.8068178647379856e-05, 'epoch': 0.41} {'loss': 0.814, 'learning_rate': 1.8067985243690623e-05, 'epoch': 0.41} {'loss': 0.8094, 'learning_rate': 1.8067791831355813e-05, 'epoch': 0.41} {'loss': 0.9182, 'learning_rate': 1.8067598410375636e-05, 'epoch': 0.41} {'loss': 0.8111, 'learning_rate': 1.80674049807503e-05, 'epoch': 0.41} {'loss': 0.9589, 'learning_rate': 1.8067211542480014e-05, 'epoch': 0.41} {'loss': 0.7489, 'learning_rate': 1.806701809556498e-05, 'epoch': 0.41} {'loss': 1.0513, 'learning_rate': 1.806682464000541e-05, 'epoch': 0.41} {'loss': 0.8821, 'learning_rate': 1.8066631175801504e-05, 'epoch': 0.41} {'loss': 0.8544, 'learning_rate': 1.806643770295348e-05, 'epoch': 0.41} {'loss': 0.7716, 'learning_rate': 1.8066244221461538e-05, 'epoch': 0.41} {'loss': 0.7425, 'learning_rate': 1.8066050731325888e-05, 'epoch': 0.41} {'loss': 0.8271, 'learning_rate': 1.8065857232546738e-05, 'epoch': 0.41} {'loss': 0.7991, 'learning_rate': 1.806566372512429e-05, 'epoch': 0.41} {'loss': 0.7882, 'learning_rate': 1.806547020905876e-05, 'epoch': 0.41} {'loss': 0.7257, 'learning_rate': 1.806527668435035e-05, 'epoch': 0.41} {'loss': 0.867, 'learning_rate': 1.8065083150999267e-05, 'epoch': 0.41} {'loss': 0.8957, 'learning_rate': 1.8064889609005715e-05, 'epoch': 0.41} {'loss': 0.9079, 'learning_rate': 1.8064696058369914e-05, 'epoch': 0.41} {'loss': 0.9892, 'learning_rate': 1.806450249909206e-05, 'epoch': 0.41} {'loss': 0.8711, 'learning_rate': 1.806430893117236e-05, 'epoch': 0.41} {'loss': 0.8959, 'learning_rate': 1.806411535461103e-05, 'epoch': 0.41} {'loss': 0.862, 'learning_rate': 1.806392176940827e-05, 'epoch': 0.41} {'loss': 1.0234, 'learning_rate': 1.806372817556429e-05, 'epoch': 0.41} {'loss': 0.9536, 'learning_rate': 1.80635345730793e-05, 'epoch': 0.41} {'loss': 0.9024, 'learning_rate': 1.8063340961953502e-05, 'epoch': 0.41} {'loss': 0.7196, 'learning_rate': 1.806314734218711e-05, 'epoch': 0.41} {'loss': 0.6672, 'learning_rate': 1.8062953713780324e-05, 'epoch': 0.41} {'loss': 0.9498, 'learning_rate': 1.8062760076733355e-05, 'epoch': 0.41} {'loss': 0.8317, 'learning_rate': 1.8062566431046413e-05, 'epoch': 0.41} {'loss': 0.7679, 'learning_rate': 1.8062372776719704e-05, 'epoch': 0.41} {'loss': 0.932, 'learning_rate': 1.8062179113753432e-05, 'epoch': 0.41} {'loss': 0.8185, 'learning_rate': 1.806198544214781e-05, 'epoch': 0.41} {'loss': 0.9292, 'learning_rate': 1.8061791761903042e-05, 'epoch': 0.41} {'loss': 0.8724, 'learning_rate': 1.8061598073019334e-05, 'epoch': 0.41} {'loss': 0.9959, 'learning_rate': 1.8061404375496902e-05, 'epoch': 0.41} {'loss': 0.6855, 'learning_rate': 1.8061210669335945e-05, 'epoch': 0.41} {'loss': 0.938, 'learning_rate': 1.806101695453667e-05, 'epoch': 0.41} {'loss': 0.9122, 'learning_rate': 1.806082323109929e-05, 'epoch': 0.41} {'loss': 0.935, 'learning_rate': 1.8060629499024013e-05, 'epoch': 0.41} {'loss': 0.691, 'learning_rate': 1.806043575831104e-05, 'epoch': 0.41} {'loss': 0.8416, 'learning_rate': 1.8060242008960587e-05, 'epoch': 0.41} {'loss': 0.9609, 'learning_rate': 1.8060048250972855e-05, 'epoch': 0.41} {'loss': 0.8807, 'learning_rate': 1.8059854484348053e-05, 'epoch': 0.41} {'loss': 0.6528, 'learning_rate': 1.8059660709086388e-05, 'epoch': 0.41} {'loss': 0.9292, 'learning_rate': 1.8059466925188073e-05, 'epoch': 0.41} {'loss': 0.9176, 'learning_rate': 1.805927313265331e-05, 'epoch': 0.41} {'loss': 0.7772, 'learning_rate': 1.805907933148231e-05, 'epoch': 0.41} {'loss': 0.9744, 'learning_rate': 1.8058885521675273e-05, 'epoch': 0.41} {'loss': 0.9265, 'learning_rate': 1.8058691703232417e-05, 'epoch': 0.41} {'loss': 0.7992, 'learning_rate': 1.8058497876153945e-05, 'epoch': 0.41} {'loss': 1.0977, 'learning_rate': 1.8058304040440067e-05, 'epoch': 0.41} {'loss': 0.8565, 'learning_rate': 1.8058110196090987e-05, 'epoch': 0.41} {'loss': 0.9656, 'learning_rate': 1.8057916343106917e-05, 'epoch': 0.41} {'loss': 0.8479, 'learning_rate': 1.805772248148806e-05, 'epoch': 0.41} {'loss': 0.8145, 'learning_rate': 1.8057528611234626e-05, 'epoch': 0.41} {'loss': 0.8123, 'learning_rate': 1.8057334732346825e-05, 'epoch': 0.41} {'loss': 0.7943, 'learning_rate': 1.805714084482486e-05, 'epoch': 0.41} {'loss': 0.8594, 'learning_rate': 1.8056946948668945e-05, 'epoch': 0.41} {'loss': 0.9245, 'learning_rate': 1.8056753043879283e-05, 'epoch': 0.41} {'loss': 0.8964, 'learning_rate': 1.8056559130456078e-05, 'epoch': 0.41} {'loss': 0.8923, 'learning_rate': 1.8056365208399548e-05, 'epoch': 0.41} {'loss': 0.8163, 'learning_rate': 1.805617127770989e-05, 'epoch': 0.41} {'loss': 1.0025, 'learning_rate': 1.8055977338387326e-05, 'epoch': 0.41} {'loss': 0.7729, 'learning_rate': 1.8055783390432052e-05, 'epoch': 0.41} {'loss': 1.0144, 'learning_rate': 1.8055589433844276e-05, 'epoch': 0.41} {'loss': 0.7003, 'learning_rate': 1.8055395468624213e-05, 'epoch': 0.41} {'loss': 0.9227, 'learning_rate': 1.8055201494772062e-05, 'epoch': 0.41} {'loss': 0.9041, 'learning_rate': 1.805500751228804e-05, 'epoch': 0.41} {'loss': 0.9306, 'learning_rate': 1.8054813521172346e-05, 'epoch': 0.41} {'loss': 0.7807, 'learning_rate': 1.8054619521425195e-05, 'epoch': 0.41} {'loss': 0.7504, 'learning_rate': 1.8054425513046792e-05, 'epoch': 0.41} {'loss': 0.8114, 'learning_rate': 1.8054231496037346e-05, 'epoch': 0.41} {'loss': 0.8071, 'learning_rate': 1.8054037470397062e-05, 'epoch': 0.41} {'loss': 0.7786, 'learning_rate': 1.805384343612615e-05, 'epoch': 0.41} {'loss': 1.0809, 'learning_rate': 1.805364939322482e-05, 'epoch': 0.41} {'loss': 0.9265, 'learning_rate': 1.8053455341693277e-05, 'epoch': 0.41} {'loss': 0.9505, 'learning_rate': 1.8053261281531728e-05, 'epoch': 0.41} {'loss': 0.7624, 'learning_rate': 1.8053067212740383e-05, 'epoch': 0.41} {'loss': 0.8654, 'learning_rate': 1.8052873135319453e-05, 'epoch': 0.41} {'loss': 0.815, 'learning_rate': 1.805267904926914e-05, 'epoch': 0.41} {'loss': 0.9041, 'learning_rate': 1.805248495458965e-05, 'epoch': 0.41} {'loss': 0.8512, 'learning_rate': 1.8052290851281203e-05, 'epoch': 0.41} {'loss': 0.8275, 'learning_rate': 1.8052096739343996e-05, 'epoch': 0.41} {'loss': 0.7894, 'learning_rate': 1.8051902618778244e-05, 'epoch': 0.41} {'loss': 0.8583, 'learning_rate': 1.8051708489584146e-05, 'epoch': 0.41} {'loss': 0.9073, 'learning_rate': 1.805151435176192e-05, 'epoch': 0.41} {'loss': 0.703, 'learning_rate': 1.805132020531177e-05, 'epoch': 0.41} {'loss': 0.9443, 'learning_rate': 1.8051126050233904e-05, 'epoch': 0.41} {'loss': 0.8936, 'learning_rate': 1.8050931886528523e-05, 'epoch': 0.41} {'loss': 0.6376, 'learning_rate': 1.805073771419585e-05, 'epoch': 0.41} {'loss': 0.9886, 'learning_rate': 1.8050543533236084e-05, 'epoch': 0.41} {'loss': 0.8155, 'learning_rate': 1.805034934364943e-05, 'epoch': 0.41} {'loss': 0.8145, 'learning_rate': 1.80501551454361e-05, 'epoch': 0.41} {'loss': 0.8453, 'learning_rate': 1.8049960938596306e-05, 'epoch': 0.41} {'loss': 0.7715, 'learning_rate': 1.804976672313025e-05, 'epoch': 0.41} {'loss': 0.9063, 'learning_rate': 1.8049572499038142e-05, 'epoch': 0.41} {'loss': 0.8422, 'learning_rate': 1.8049378266320193e-05, 'epoch': 0.41} {'loss': 0.7653, 'learning_rate': 1.8049184024976606e-05, 'epoch': 0.41} {'loss': 0.857, 'learning_rate': 1.8048989775007594e-05, 'epoch': 0.41} {'loss': 0.7344, 'learning_rate': 1.804879551641336e-05, 'epoch': 0.41} {'loss': 0.8571, 'learning_rate': 1.8048601249194116e-05, 'epoch': 0.41} {'loss': 1.0585, 'learning_rate': 1.804840697335007e-05, 'epoch': 0.41} {'loss': 0.8901, 'learning_rate': 1.804821268888143e-05, 'epoch': 0.41} {'loss': 0.8782, 'learning_rate': 1.8048018395788403e-05, 'epoch': 0.41} {'loss': 0.9252, 'learning_rate': 1.80478240940712e-05, 'epoch': 0.41} {'loss': 0.8855, 'learning_rate': 1.8047629783730024e-05, 'epoch': 0.41} {'loss': 0.9148, 'learning_rate': 1.804743546476509e-05, 'epoch': 0.41} {'loss': 0.9709, 'learning_rate': 1.80472411371766e-05, 'epoch': 0.41} {'loss': 0.9397, 'learning_rate': 1.8047046800964764e-05, 'epoch': 0.41} {'loss': 0.7578, 'learning_rate': 1.8046852456129794e-05, 'epoch': 0.41} {'loss': 0.9419, 'learning_rate': 1.8046658102671896e-05, 'epoch': 0.41} {'loss': 0.9718, 'learning_rate': 1.804646374059127e-05, 'epoch': 0.41} {'loss': 1.0355, 'learning_rate': 1.804626936988814e-05, 'epoch': 0.41} {'loss': 0.9692, 'learning_rate': 1.80460749905627e-05, 'epoch': 0.41} {'loss': 1.0365, 'learning_rate': 1.804588060261517e-05, 'epoch': 0.41} {'loss': 0.9452, 'learning_rate': 1.8045686206045752e-05, 'epoch': 0.41} {'loss': 0.8277, 'learning_rate': 1.804549180085465e-05, 'epoch': 0.41} {'loss': 0.8751, 'learning_rate': 1.8045297387042083e-05, 'epoch': 0.41} {'loss': 1.1082, 'learning_rate': 1.8045102964608252e-05, 'epoch': 0.41} {'loss': 0.7785, 'learning_rate': 1.8044908533553368e-05, 'epoch': 0.41} {'loss': 0.8631, 'learning_rate': 1.8044714093877632e-05, 'epoch': 0.41} {'loss': 0.9574, 'learning_rate': 1.8044519645581267e-05, 'epoch': 0.41} {'loss': 1.019, 'learning_rate': 1.804432518866447e-05, 'epoch': 0.41} {'loss': 0.7671, 'learning_rate': 1.804413072312745e-05, 'epoch': 0.41} {'loss': 0.7729, 'learning_rate': 1.8043936248970424e-05, 'epoch': 0.41} {'loss': 0.9582, 'learning_rate': 1.804374176619359e-05, 'epoch': 0.41} {'loss': 0.988, 'learning_rate': 1.8043547274797162e-05, 'epoch': 0.41} {'loss': 0.9115, 'learning_rate': 1.8043352774781345e-05, 'epoch': 0.41} {'loss': 0.8104, 'learning_rate': 1.804315826614635e-05, 'epoch': 0.41} {'loss': 0.9107, 'learning_rate': 1.8042963748892388e-05, 'epoch': 0.41} {'loss': 1.0783, 'learning_rate': 1.8042769223019663e-05, 'epoch': 0.41} {'loss': 0.8392, 'learning_rate': 1.804257468852838e-05, 'epoch': 0.41} {'loss': 0.8708, 'learning_rate': 1.804238014541876e-05, 'epoch': 0.41} {'loss': 0.8907, 'learning_rate': 1.8042185593691e-05, 'epoch': 0.41} {'loss': 0.9367, 'learning_rate': 1.8041991033345315e-05, 'epoch': 0.41} {'loss': 0.7953, 'learning_rate': 1.8041796464381906e-05, 'epoch': 0.41} {'loss': 0.9017, 'learning_rate': 1.8041601886800988e-05, 'epoch': 0.41} {'loss': 0.9466, 'learning_rate': 1.804140730060277e-05, 'epoch': 0.41} {'loss': 0.9186, 'learning_rate': 1.8041212705787458e-05, 'epoch': 0.41} {'loss': 0.8819, 'learning_rate': 1.8041018102355256e-05, 'epoch': 0.41} {'loss': 0.9042, 'learning_rate': 1.804082349030638e-05, 'epoch': 0.41} {'loss': 0.997, 'learning_rate': 1.804062886964104e-05, 'epoch': 0.41} {'loss': 1.1426, 'learning_rate': 1.804043424035944e-05, 'epoch': 0.41} {'loss': 0.9297, 'learning_rate': 1.8040239602461783e-05, 'epoch': 0.41} {'loss': 0.7079, 'learning_rate': 1.804004495594829e-05, 'epoch': 0.41} {'loss': 0.8349, 'learning_rate': 1.8039850300819157e-05, 'epoch': 0.41} {'loss': 0.8123, 'learning_rate': 1.80396556370746e-05, 'epoch': 0.41} {'loss': 0.9597, 'learning_rate': 1.8039460964714832e-05, 'epoch': 0.41} {'loss': 0.7646, 'learning_rate': 1.803926628374005e-05, 'epoch': 0.41} {'loss': 0.88, 'learning_rate': 1.8039071594150474e-05, 'epoch': 0.41} {'loss': 0.9285, 'learning_rate': 1.8038876895946303e-05, 'epoch': 0.41} {'loss': 1.1819, 'learning_rate': 1.803868218912775e-05, 'epoch': 0.41} {'loss': 0.721, 'learning_rate': 1.8038487473695022e-05, 'epoch': 0.41} {'loss': 0.9995, 'learning_rate': 1.8038292749648334e-05, 'epoch': 0.41} {'loss': 0.9367, 'learning_rate': 1.8038098016987887e-05, 'epoch': 0.41} {'loss': 0.9285, 'learning_rate': 1.8037903275713894e-05, 'epoch': 0.41} {'loss': 0.9265, 'learning_rate': 1.803770852582656e-05, 'epoch': 0.41} {'loss': 0.8611, 'learning_rate': 1.8037513767326097e-05, 'epoch': 0.41} {'loss': 0.9089, 'learning_rate': 1.8037319000212713e-05, 'epoch': 0.41} {'loss': 1.0205, 'learning_rate': 1.8037124224486614e-05, 'epoch': 0.41} {'loss': 0.9165, 'learning_rate': 1.8036929440148016e-05, 'epoch': 0.41} {'loss': 0.7867, 'learning_rate': 1.8036734647197115e-05, 'epoch': 0.41} {'loss': 0.8933, 'learning_rate': 1.8036539845634133e-05, 'epoch': 0.41} {'loss': 0.8983, 'learning_rate': 1.8036345035459274e-05, 'epoch': 0.41} {'loss': 0.8438, 'learning_rate': 1.8036150216672744e-05, 'epoch': 0.41} {'loss': 0.9175, 'learning_rate': 1.8035955389274752e-05, 'epoch': 0.41} {'loss': 1.0332, 'learning_rate': 1.803576055326551e-05, 'epoch': 0.41} {'loss': 0.8241, 'learning_rate': 1.8035565708645228e-05, 'epoch': 0.41} {'loss': 0.891, 'learning_rate': 1.803537085541411e-05, 'epoch': 0.41} {'loss': 0.9229, 'learning_rate': 1.8035175993572366e-05, 'epoch': 0.41} {'loss': 0.6644, 'learning_rate': 1.8034981123120207e-05, 'epoch': 0.41} {'loss': 0.929, 'learning_rate': 1.8034786244057836e-05, 'epoch': 0.41} {'loss': 0.797, 'learning_rate': 1.8034591356385474e-05, 'epoch': 0.41} {'loss': 0.8492, 'learning_rate': 1.8034396460103317e-05, 'epoch': 0.41} {'loss': 0.8938, 'learning_rate': 1.803420155521158e-05, 'epoch': 0.41} {'loss': 1.0178, 'learning_rate': 1.8034006641710474e-05, 'epoch': 0.41} {'loss': 0.7984, 'learning_rate': 1.80338117196002e-05, 'epoch': 0.41} {'loss': 0.9565, 'learning_rate': 1.8033616788880974e-05, 'epoch': 0.41} {'loss': 0.9426, 'learning_rate': 1.8033421849553002e-05, 'epoch': 0.41} {'loss': 0.8062, 'learning_rate': 1.8033226901616496e-05, 'epoch': 0.41} {'loss': 0.9098, 'learning_rate': 1.803303194507166e-05, 'epoch': 0.41} {'loss': 1.0005, 'learning_rate': 1.8032836979918705e-05, 'epoch': 0.41} {'loss': 1.0423, 'learning_rate': 1.803264200615784e-05, 'epoch': 0.41} {'loss': 0.9605, 'learning_rate': 1.8032447023789275e-05, 'epoch': 0.41} {'loss': 0.8086, 'learning_rate': 1.803225203281322e-05, 'epoch': 0.41} {'loss': 0.7817, 'learning_rate': 1.8032057033229877e-05, 'epoch': 0.41} {'loss': 0.7082, 'learning_rate': 1.8031862025039465e-05, 'epoch': 0.41} {'loss': 0.9003, 'learning_rate': 1.8031667008242185e-05, 'epoch': 0.41} {'loss': 0.8173, 'learning_rate': 1.8031471982838247e-05, 'epoch': 0.41} {'loss': 0.93, 'learning_rate': 1.8031276948827865e-05, 'epoch': 0.41} {'loss': 0.9405, 'learning_rate': 1.8031081906211242e-05, 'epoch': 0.41} {'loss': 0.9104, 'learning_rate': 1.8030886854988595e-05, 'epoch': 0.41} {'loss': 0.8462, 'learning_rate': 1.8030691795160123e-05, 'epoch': 0.41} {'loss': 1.2227, 'learning_rate': 1.803049672672604e-05, 'epoch': 0.41} {'loss': 0.9748, 'learning_rate': 1.8030301649686558e-05, 'epoch': 0.41} {'loss': 1.02, 'learning_rate': 1.8030106564041884e-05, 'epoch': 0.41} {'loss': 0.9746, 'learning_rate': 1.8029911469792223e-05, 'epoch': 0.41} {'loss': 0.8996, 'learning_rate': 1.8029716366937788e-05, 'epoch': 0.41} {'loss': 0.7358, 'learning_rate': 1.802952125547879e-05, 'epoch': 0.41} {'loss': 0.8125, 'learning_rate': 1.8029326135415426e-05, 'epoch': 0.41} {'loss': 0.9415, 'learning_rate': 1.8029131006747923e-05, 'epoch': 0.41} {'loss': 0.6473, 'learning_rate': 1.802893586947648e-05, 'epoch': 0.41} {'loss': 0.7999, 'learning_rate': 1.802874072360131e-05, 'epoch': 0.41} {'loss': 0.9518, 'learning_rate': 1.8028545569122615e-05, 'epoch': 0.41} {'loss': 0.8507, 'learning_rate': 1.802835040604061e-05, 'epoch': 0.41} {'loss': 0.8889, 'learning_rate': 1.8028155234355502e-05, 'epoch': 0.41} {'loss': 0.8731, 'learning_rate': 1.80279600540675e-05, 'epoch': 0.41} {'loss': 0.8036, 'learning_rate': 1.802776486517682e-05, 'epoch': 0.41} {'loss': 0.7912, 'learning_rate': 1.802756966768366e-05, 'epoch': 0.41} {'loss': 0.8056, 'learning_rate': 1.8027374461588238e-05, 'epoch': 0.41} {'loss': 0.8461, 'learning_rate': 1.802717924689076e-05, 'epoch': 0.41} {'loss': 0.9116, 'learning_rate': 1.802698402359143e-05, 'epoch': 0.41} {'loss': 0.9141, 'learning_rate': 1.8026788791690466e-05, 'epoch': 0.41} {'loss': 0.8439, 'learning_rate': 1.802659355118807e-05, 'epoch': 0.41} {'loss': 0.8466, 'learning_rate': 1.8026398302084463e-05, 'epoch': 0.41} {'loss': 0.9352, 'learning_rate': 1.802620304437984e-05, 'epoch': 0.41} {'loss': 0.7928, 'learning_rate': 1.8026007778074412e-05, 'epoch': 0.41} {'loss': 0.7946, 'learning_rate': 1.8025812503168398e-05, 'epoch': 0.41} {'loss': 0.9571, 'learning_rate': 1.8025617219662e-05, 'epoch': 0.41} {'loss': 0.7865, 'learning_rate': 1.802542192755543e-05, 'epoch': 0.41} {'loss': 0.9465, 'learning_rate': 1.8025226626848893e-05, 'epoch': 0.41} {'loss': 0.9476, 'learning_rate': 1.8025031317542602e-05, 'epoch': 0.41} {'loss': 0.9422, 'learning_rate': 1.8024835999636768e-05, 'epoch': 0.41} {'loss': 0.7381, 'learning_rate': 1.8024640673131597e-05, 'epoch': 0.41} {'loss': 0.7851, 'learning_rate': 1.8024445338027298e-05, 'epoch': 0.41} {'loss': 0.77, 'learning_rate': 1.8024249994324082e-05, 'epoch': 0.41} {'loss': 0.8501, 'learning_rate': 1.802405464202216e-05, 'epoch': 0.41} {'loss': 0.9447, 'learning_rate': 1.8023859281121738e-05, 'epoch': 0.41} {'loss': 1.0586, 'learning_rate': 1.8023663911623025e-05, 'epoch': 0.41} {'loss': 0.8496, 'learning_rate': 1.8023468533526233e-05, 'epoch': 0.41} {'loss': 0.6941, 'learning_rate': 1.802327314683157e-05, 'epoch': 0.41} {'loss': 0.9789, 'learning_rate': 1.8023077751539246e-05, 'epoch': 0.41} {'loss': 0.9438, 'learning_rate': 1.802288234764947e-05, 'epoch': 0.41} {'loss': 0.9698, 'learning_rate': 1.802268693516245e-05, 'epoch': 0.41} {'loss': 1.1787, 'learning_rate': 1.8022491514078398e-05, 'epoch': 0.41} {'loss': 0.6352, 'learning_rate': 1.8022296084397527e-05, 'epoch': 0.41} {'loss': 0.8671, 'learning_rate': 1.8022100646120037e-05, 'epoch': 0.41} {'loss': 0.8667, 'learning_rate': 1.8021905199246142e-05, 'epoch': 0.41} {'loss': 0.8221, 'learning_rate': 1.802170974377605e-05, 'epoch': 0.41} {'loss': 0.9068, 'learning_rate': 1.8021514279709976e-05, 'epoch': 0.41} {'loss': 0.9204, 'learning_rate': 1.8021318807048126e-05, 'epoch': 0.41} {'loss': 0.9034, 'learning_rate': 1.8021123325790703e-05, 'epoch': 0.41} {'loss': 0.7726, 'learning_rate': 1.8020927835937926e-05, 'epoch': 0.41} {'loss': 0.9232, 'learning_rate': 1.8020732337490004e-05, 'epoch': 0.41} {'loss': 0.8013, 'learning_rate': 1.8020536830447137e-05, 'epoch': 0.41} {'loss': 0.8238, 'learning_rate': 1.8020341314809546e-05, 'epoch': 0.41} {'loss': 0.7901, 'learning_rate': 1.8020145790577432e-05, 'epoch': 0.41} {'loss': 0.9181, 'learning_rate': 1.801995025775101e-05, 'epoch': 0.41} {'loss': 0.8921, 'learning_rate': 1.8019754716330485e-05, 'epoch': 0.41} {'loss': 0.7568, 'learning_rate': 1.8019559166316072e-05, 'epoch': 0.41} {'loss': 0.8118, 'learning_rate': 1.8019363607707977e-05, 'epoch': 0.41} {'loss': 0.9021, 'learning_rate': 1.801916804050641e-05, 'epoch': 0.41} {'loss': 0.902, 'learning_rate': 1.801897246471158e-05, 'epoch': 0.41} {'loss': 0.8993, 'learning_rate': 1.8018776880323695e-05, 'epoch': 0.41} {'loss': 0.7889, 'learning_rate': 1.8018581287342973e-05, 'epoch': 0.41} {'loss': 1.0291, 'learning_rate': 1.8018385685769613e-05, 'epoch': 0.41} {'loss': 0.8898, 'learning_rate': 1.801819007560383e-05, 'epoch': 0.41} {'loss': 1.0191, 'learning_rate': 1.801799445684583e-05, 'epoch': 0.41} {'loss': 0.8055, 'learning_rate': 1.8017798829495828e-05, 'epoch': 0.41} {'loss': 1.0096, 'learning_rate': 1.801760319355403e-05, 'epoch': 0.41} {'loss': 0.9125, 'learning_rate': 1.8017407549020648e-05, 'epoch': 0.41} {'loss': 0.9089, 'learning_rate': 1.801721189589589e-05, 'epoch': 0.41} {'loss': 0.9261, 'learning_rate': 1.8017016234179966e-05, 'epoch': 0.41} {'loss': 0.8224, 'learning_rate': 1.8016820563873084e-05, 'epoch': 0.41} {'loss': 0.8513, 'learning_rate': 1.8016624884975455e-05, 'epoch': 0.41} {'loss': 0.7463, 'learning_rate': 1.8016429197487292e-05, 'epoch': 0.41} {'loss': 0.7987, 'learning_rate': 1.80162335014088e-05, 'epoch': 0.41} {'loss': 0.8613, 'learning_rate': 1.801603779674019e-05, 'epoch': 0.41} {'loss': 0.8486, 'learning_rate': 1.801584208348167e-05, 'epoch': 0.41} {'loss': 0.9205, 'learning_rate': 1.8015646361633453e-05, 'epoch': 0.41} {'loss': 0.9575, 'learning_rate': 1.801545063119575e-05, 'epoch': 0.41} {'loss': 0.9324, 'learning_rate': 1.8015254892168762e-05, 'epoch': 0.41} {'loss': 0.913, 'learning_rate': 1.801505914455271e-05, 'epoch': 0.41} {'loss': 0.7937, 'learning_rate': 1.80148633883478e-05, 'epoch': 0.41} {'loss': 0.8176, 'learning_rate': 1.8014667623554236e-05, 'epoch': 0.41} {'loss': 1.0087, 'learning_rate': 1.8014471850172233e-05, 'epoch': 0.41} {'loss': 0.8276, 'learning_rate': 1.8014276068202004e-05, 'epoch': 0.41} {'loss': 0.9196, 'learning_rate': 1.8014080277643752e-05, 'epoch': 0.41} {'loss': 0.92, 'learning_rate': 1.801388447849769e-05, 'epoch': 0.41} {'loss': 0.9119, 'learning_rate': 1.8013688670764026e-05, 'epoch': 0.41} {'loss': 0.7898, 'learning_rate': 1.8013492854442972e-05, 'epoch': 0.41} {'loss': 0.9167, 'learning_rate': 1.801329702953474e-05, 'epoch': 0.41} {'loss': 0.9278, 'learning_rate': 1.8013101196039536e-05, 'epoch': 0.41} {'loss': 0.9136, 'learning_rate': 1.801290535395757e-05, 'epoch': 0.41} {'loss': 0.9777, 'learning_rate': 1.8012709503289053e-05, 'epoch': 0.41} {'loss': 0.798, 'learning_rate': 1.8012513644034193e-05, 'epoch': 0.41} {'loss': 0.9233, 'learning_rate': 1.8012317776193204e-05, 'epoch': 0.41} {'loss': 0.9371, 'learning_rate': 1.801212189976629e-05, 'epoch': 0.41} {'loss': 0.9112, 'learning_rate': 1.8011926014753668e-05, 'epoch': 0.41} {'loss': 1.0006, 'learning_rate': 1.8011730121155538e-05, 'epoch': 0.41} {'loss': 0.78, 'learning_rate': 1.8011534218972123e-05, 'epoch': 0.41} {'loss': 0.472, 'learning_rate': 1.8011338308203623e-05, 'epoch': 0.41} {'loss': 0.7187, 'learning_rate': 1.801114238885025e-05, 'epoch': 0.41} {'loss': 0.8345, 'learning_rate': 1.801094646091222e-05, 'epoch': 0.41} {'loss': 0.791, 'learning_rate': 1.8010750524389733e-05, 'epoch': 0.41} {'loss': 0.7052, 'learning_rate': 1.8010554579283004e-05, 'epoch': 0.41} {'loss': 0.9302, 'learning_rate': 1.8010358625592244e-05, 'epoch': 0.41} {'loss': 0.9108, 'learning_rate': 1.801016266331766e-05, 'epoch': 0.41} {'loss': 0.9611, 'learning_rate': 1.8009966692459466e-05, 'epoch': 0.41} {'loss': 1.0435, 'learning_rate': 1.800977071301787e-05, 'epoch': 0.41} {'loss': 0.8298, 'learning_rate': 1.800957472499308e-05, 'epoch': 0.41} {'loss': 0.7783, 'learning_rate': 1.8009378728385306e-05, 'epoch': 0.41} {'loss': 0.8822, 'learning_rate': 1.8009182723194763e-05, 'epoch': 0.41} {'loss': 0.9497, 'learning_rate': 1.8008986709421655e-05, 'epoch': 0.41} {'loss': 0.8921, 'learning_rate': 1.80087906870662e-05, 'epoch': 0.41} {'loss': 1.0036, 'learning_rate': 1.80085946561286e-05, 'epoch': 0.41} {'loss': 0.8198, 'learning_rate': 1.8008398616609065e-05, 'epoch': 0.41} {'loss': 0.7501, 'learning_rate': 1.8008202568507813e-05, 'epoch': 0.41} {'loss': 0.9758, 'learning_rate': 1.8008006511825046e-05, 'epoch': 0.41} {'loss': 0.8631, 'learning_rate': 1.800781044656098e-05, 'epoch': 0.41} {'loss': 1.1262, 'learning_rate': 1.800761437271582e-05, 'epoch': 0.41} {'loss': 0.9563, 'learning_rate': 1.800741829028978e-05, 'epoch': 0.41} {'loss': 0.9916, 'learning_rate': 1.8007222199283067e-05, 'epoch': 0.41} {'loss': 1.0637, 'learning_rate': 1.8007026099695893e-05, 'epoch': 0.41} {'loss': 0.9078, 'learning_rate': 1.8006829991528468e-05, 'epoch': 0.41} {'loss': 0.8727, 'learning_rate': 1.8006633874781003e-05, 'epoch': 0.41} {'loss': 0.875, 'learning_rate': 1.8006437749453707e-05, 'epoch': 0.41} {'loss': 0.7228, 'learning_rate': 1.800624161554679e-05, 'epoch': 0.41} {'loss': 0.8966, 'learning_rate': 1.8006045473060464e-05, 'epoch': 0.41} {'loss': 0.9778, 'learning_rate': 1.8005849321994933e-05, 'epoch': 0.41} {'loss': 0.8783, 'learning_rate': 1.8005653162350416e-05, 'epoch': 0.41} {'loss': 0.6753, 'learning_rate': 1.800545699412712e-05, 'epoch': 0.41} {'loss': 0.9246, 'learning_rate': 1.800526081732525e-05, 'epoch': 0.41} {'loss': 0.9784, 'learning_rate': 1.8005064631945024e-05, 'epoch': 0.41} {'loss': 0.8707, 'learning_rate': 1.8004868437986646e-05, 'epoch': 0.41} {'loss': 0.8401, 'learning_rate': 1.8004672235450332e-05, 'epoch': 0.41} {'loss': 1.0239, 'learning_rate': 1.8004476024336284e-05, 'epoch': 0.41} {'loss': 0.8031, 'learning_rate': 1.8004279804644724e-05, 'epoch': 0.41} {'loss': 0.7266, 'learning_rate': 1.8004083576375854e-05, 'epoch': 0.41} {'loss': 1.0323, 'learning_rate': 1.8003887339529884e-05, 'epoch': 0.41} {'loss': 0.8024, 'learning_rate': 1.8003691094107028e-05, 'epoch': 0.41} {'loss': 0.889, 'learning_rate': 1.8003494840107492e-05, 'epoch': 0.41} {'loss': 0.9859, 'learning_rate': 1.800329857753149e-05, 'epoch': 0.41} {'loss': 0.9312, 'learning_rate': 1.8003102306379233e-05, 'epoch': 0.41} {'loss': 0.8823, 'learning_rate': 1.800290602665093e-05, 'epoch': 0.41} {'loss': 0.6923, 'learning_rate': 1.800270973834679e-05, 'epoch': 0.41} {'loss': 0.8607, 'learning_rate': 1.800251344146702e-05, 'epoch': 0.41} {'loss': 0.8037, 'learning_rate': 1.8002317136011843e-05, 'epoch': 0.41} {'loss': 0.8496, 'learning_rate': 1.8002120821981456e-05, 'epoch': 0.41} {'loss': 0.9128, 'learning_rate': 1.8001924499376074e-05, 'epoch': 0.41} {'loss': 0.964, 'learning_rate': 1.8001728168195906e-05, 'epoch': 0.41} {'loss': 0.7985, 'learning_rate': 1.800153182844117e-05, 'epoch': 0.41} {'loss': 0.8258, 'learning_rate': 1.8001335480112067e-05, 'epoch': 0.41} {'loss': 1.0121, 'learning_rate': 1.800113912320881e-05, 'epoch': 0.41} {'loss': 0.7755, 'learning_rate': 1.800094275773161e-05, 'epoch': 0.41} {'loss': 0.9042, 'learning_rate': 1.8000746383680678e-05, 'epoch': 0.41} {'loss': 0.9083, 'learning_rate': 1.8000550001056225e-05, 'epoch': 0.41} {'loss': 0.8159, 'learning_rate': 1.800035360985846e-05, 'epoch': 0.41} {'loss': 0.8305, 'learning_rate': 1.8000157210087593e-05, 'epoch': 0.41} {'loss': 0.8228, 'learning_rate': 1.7999960801743838e-05, 'epoch': 0.41} {'loss': 1.095, 'learning_rate': 1.79997643848274e-05, 'epoch': 0.41} {'loss': 1.1273, 'learning_rate': 1.7999567959338494e-05, 'epoch': 0.41} {'loss': 0.8105, 'learning_rate': 1.799937152527733e-05, 'epoch': 0.41} {'loss': 0.715, 'learning_rate': 1.7999175082644117e-05, 'epoch': 0.41} {'loss': 0.9047, 'learning_rate': 1.799897863143907e-05, 'epoch': 0.41} {'loss': 0.7795, 'learning_rate': 1.799878217166239e-05, 'epoch': 0.41} {'loss': 0.9402, 'learning_rate': 1.7998585703314292e-05, 'epoch': 0.41} {'loss': 0.9313, 'learning_rate': 1.799838922639499e-05, 'epoch': 0.41} {'loss': 0.7831, 'learning_rate': 1.799819274090469e-05, 'epoch': 0.41} {'loss': 0.929, 'learning_rate': 1.7997996246843604e-05, 'epoch': 0.41} {'loss': 0.8398, 'learning_rate': 1.799779974421195e-05, 'epoch': 0.41} {'loss': 0.7535, 'learning_rate': 1.7997603233009924e-05, 'epoch': 0.41} {'loss': 0.9435, 'learning_rate': 1.799740671323775e-05, 'epoch': 0.41} {'loss': 0.9263, 'learning_rate': 1.799721018489563e-05, 'epoch': 0.41} {'loss': 0.9981, 'learning_rate': 1.7997013647983775e-05, 'epoch': 0.41} {'loss': 0.8314, 'learning_rate': 1.79968171025024e-05, 'epoch': 0.41} {'loss': 0.8509, 'learning_rate': 1.7996620548451717e-05, 'epoch': 0.41} {'loss': 0.6745, 'learning_rate': 1.7996423985831932e-05, 'epoch': 0.41} {'loss': 0.8804, 'learning_rate': 1.7996227414643254e-05, 'epoch': 0.42} {'loss': 0.8891, 'learning_rate': 1.79960308348859e-05, 'epoch': 0.42} {'loss': 0.8385, 'learning_rate': 1.7995834246560074e-05, 'epoch': 0.42} {'loss': 0.8911, 'learning_rate': 1.7995637649665992e-05, 'epoch': 0.42} {'loss': 0.9553, 'learning_rate': 1.7995441044203864e-05, 'epoch': 0.42} {'loss': 0.8827, 'learning_rate': 1.7995244430173896e-05, 'epoch': 0.42} {'loss': 0.8295, 'learning_rate': 1.7995047807576304e-05, 'epoch': 0.42} {'loss': 0.7162, 'learning_rate': 1.7994851176411297e-05, 'epoch': 0.42} {'loss': 0.905, 'learning_rate': 1.7994654536679083e-05, 'epoch': 0.42} {'loss': 0.687, 'learning_rate': 1.7994457888379876e-05, 'epoch': 0.42} {'loss': 0.6794, 'learning_rate': 1.799426123151389e-05, 'epoch': 0.42} {'loss': 0.9, 'learning_rate': 1.7994064566081327e-05, 'epoch': 0.42} {'loss': 0.8755, 'learning_rate': 1.79938678920824e-05, 'epoch': 0.42} {'loss': 0.8756, 'learning_rate': 1.7993671209517327e-05, 'epoch': 0.42} {'loss': 0.8484, 'learning_rate': 1.7993474518386314e-05, 'epoch': 0.42} {'loss': 0.9153, 'learning_rate': 1.7993277818689568e-05, 'epoch': 0.42} {'loss': 0.8161, 'learning_rate': 1.7993081110427306e-05, 'epoch': 0.42} {'loss': 0.8714, 'learning_rate': 1.7992884393599735e-05, 'epoch': 0.42} {'loss': 0.8156, 'learning_rate': 1.7992687668207066e-05, 'epoch': 0.42} {'loss': 0.9121, 'learning_rate': 1.7992490934249514e-05, 'epoch': 0.42} {'loss': 0.8939, 'learning_rate': 1.7992294191727284e-05, 'epoch': 0.42} {'loss': 0.8468, 'learning_rate': 1.799209744064059e-05, 'epoch': 0.42} {'loss': 0.7503, 'learning_rate': 1.7991900680989644e-05, 'epoch': 0.42} {'loss': 0.9441, 'learning_rate': 1.7991703912774655e-05, 'epoch': 0.42} {'loss': 0.7884, 'learning_rate': 1.799150713599583e-05, 'epoch': 0.42} {'loss': 0.9972, 'learning_rate': 1.7991310350653387e-05, 'epoch': 0.42} {'loss': 0.8333, 'learning_rate': 1.7991113556747533e-05, 'epoch': 0.42} {'loss': 0.9741, 'learning_rate': 1.799091675427848e-05, 'epoch': 0.42} {'loss': 0.7483, 'learning_rate': 1.7990719943246436e-05, 'epoch': 0.42} {'loss': 0.9177, 'learning_rate': 1.7990523123651617e-05, 'epoch': 0.42} {'loss': 0.7874, 'learning_rate': 1.7990326295494234e-05, 'epoch': 0.42} {'loss': 0.8267, 'learning_rate': 1.799012945877449e-05, 'epoch': 0.42} {'loss': 1.0404, 'learning_rate': 1.7989932613492604e-05, 'epoch': 0.42} {'loss': 0.9196, 'learning_rate': 1.7989735759648784e-05, 'epoch': 0.42} {'loss': 0.7823, 'learning_rate': 1.7989538897243236e-05, 'epoch': 0.42} {'loss': 0.9168, 'learning_rate': 1.798934202627618e-05, 'epoch': 0.42} {'loss': 0.8294, 'learning_rate': 1.7989145146747825e-05, 'epoch': 0.42} {'loss': 0.8704, 'learning_rate': 1.7988948258658378e-05, 'epoch': 0.42} {'loss': 0.87, 'learning_rate': 1.7988751362008054e-05, 'epoch': 0.42} {'loss': 1.0272, 'learning_rate': 1.798855445679706e-05, 'epoch': 0.42} {'loss': 0.8423, 'learning_rate': 1.7988357543025607e-05, 'epoch': 0.42} {'loss': 0.9923, 'learning_rate': 1.798816062069391e-05, 'epoch': 0.42} {'loss': 0.6981, 'learning_rate': 1.798796368980218e-05, 'epoch': 0.42} {'loss': 0.8243, 'learning_rate': 1.798776675035062e-05, 'epoch': 0.42} {'loss': 0.8285, 'learning_rate': 1.798756980233945e-05, 'epoch': 0.42} {'loss': 0.8232, 'learning_rate': 1.798737284576888e-05, 'epoch': 0.42} {'loss': 0.9218, 'learning_rate': 1.798717588063912e-05, 'epoch': 0.42} {'loss': 0.8578, 'learning_rate': 1.7986978906950373e-05, 'epoch': 0.42} {'loss': 0.716, 'learning_rate': 1.7986781924702863e-05, 'epoch': 0.42} {'loss': 0.8332, 'learning_rate': 1.7986584933896797e-05, 'epoch': 0.42} {'loss': 0.8991, 'learning_rate': 1.7986387934532378e-05, 'epoch': 0.42} {'loss': 0.8358, 'learning_rate': 1.798619092660983e-05, 'epoch': 0.42} {'loss': 0.8175, 'learning_rate': 1.7985993910129354e-05, 'epoch': 0.42} {'loss': 0.8467, 'learning_rate': 1.7985796885091163e-05, 'epoch': 0.42} {'loss': 0.8521, 'learning_rate': 1.7985599851495476e-05, 'epoch': 0.42} {'loss': 0.9393, 'learning_rate': 1.7985402809342493e-05, 'epoch': 0.42} {'loss': 0.9113, 'learning_rate': 1.798520575863243e-05, 'epoch': 0.42} {'loss': 0.8799, 'learning_rate': 1.7985008699365502e-05, 'epoch': 0.42} {'loss': 0.9188, 'learning_rate': 1.7984811631541915e-05, 'epoch': 0.42} {'loss': 0.7774, 'learning_rate': 1.7984614555161883e-05, 'epoch': 0.42} {'loss': 0.9335, 'learning_rate': 1.798441747022561e-05, 'epoch': 0.42} {'loss': 1.0246, 'learning_rate': 1.7984220376733317e-05, 'epoch': 0.42} {'loss': 0.7579, 'learning_rate': 1.798402327468521e-05, 'epoch': 0.42} {'loss': 0.8562, 'learning_rate': 1.7983826164081503e-05, 'epoch': 0.42} {'loss': 0.8077, 'learning_rate': 1.7983629044922407e-05, 'epoch': 0.42} {'loss': 0.9045, 'learning_rate': 1.7983431917208132e-05, 'epoch': 0.42} {'loss': 0.9454, 'learning_rate': 1.7983234780938886e-05, 'epoch': 0.42} {'loss': 0.8329, 'learning_rate': 1.7983037636114884e-05, 'epoch': 0.42} {'loss': 0.8887, 'learning_rate': 1.7982840482736338e-05, 'epoch': 0.42} {'loss': 0.9115, 'learning_rate': 1.7982643320803457e-05, 'epoch': 0.42} {'loss': 1.0204, 'learning_rate': 1.7982446150316454e-05, 'epoch': 0.42} {'loss': 1.0235, 'learning_rate': 1.798224897127554e-05, 'epoch': 0.42} {'loss': 1.0041, 'learning_rate': 1.798205178368092e-05, 'epoch': 0.42} {'loss': 0.8957, 'learning_rate': 1.798185458753282e-05, 'epoch': 0.42} {'loss': 0.7808, 'learning_rate': 1.7981657382831438e-05, 'epoch': 0.42} {'loss': 0.8914, 'learning_rate': 1.798146016957699e-05, 'epoch': 0.42} {'loss': 0.8673, 'learning_rate': 1.7981262947769687e-05, 'epoch': 0.42} {'loss': 0.9145, 'learning_rate': 1.798106571740974e-05, 'epoch': 0.42} {'loss': 0.7814, 'learning_rate': 1.798086847849736e-05, 'epoch': 0.42} {'loss': 0.9847, 'learning_rate': 1.7980671231032762e-05, 'epoch': 0.42} {'loss': 0.9278, 'learning_rate': 1.7980473975016154e-05, 'epoch': 0.42} {'loss': 0.7214, 'learning_rate': 1.7980276710447745e-05, 'epoch': 0.42} {'loss': 0.7925, 'learning_rate': 1.7980079437327752e-05, 'epoch': 0.42} {'loss': 1.0271, 'learning_rate': 1.797988215565638e-05, 'epoch': 0.42} {'loss': 0.9574, 'learning_rate': 1.797968486543385e-05, 'epoch': 0.42} {'loss': 0.9109, 'learning_rate': 1.7979487566660363e-05, 'epoch': 0.42} {'loss': 0.7777, 'learning_rate': 1.7979290259336133e-05, 'epoch': 0.42} {'loss': 0.973, 'learning_rate': 1.797909294346138e-05, 'epoch': 0.42} {'loss': 0.9389, 'learning_rate': 1.7978895619036304e-05, 'epoch': 0.42} {'loss': 0.9594, 'learning_rate': 1.797869828606112e-05, 'epoch': 0.42} {'loss': 0.8486, 'learning_rate': 1.7978500944536046e-05, 'epoch': 0.42} {'loss': 0.833, 'learning_rate': 1.7978303594461284e-05, 'epoch': 0.42} {'loss': 0.8505, 'learning_rate': 1.797810623583705e-05, 'epoch': 0.42} {'loss': 0.735, 'learning_rate': 1.7977908868663554e-05, 'epoch': 0.42} {'loss': 0.8345, 'learning_rate': 1.797771149294101e-05, 'epoch': 0.42} {'loss': 0.8905, 'learning_rate': 1.797751410866963e-05, 'epoch': 0.42} {'loss': 0.8687, 'learning_rate': 1.7977316715849623e-05, 'epoch': 0.42} {'loss': 0.6888, 'learning_rate': 1.7977119314481202e-05, 'epoch': 0.42} {'loss': 0.7422, 'learning_rate': 1.7976921904564575e-05, 'epoch': 0.42} {'loss': 1.0765, 'learning_rate': 1.7976724486099956e-05, 'epoch': 0.42} {'loss': 0.8317, 'learning_rate': 1.797652705908756e-05, 'epoch': 0.42} {'loss': 0.9059, 'learning_rate': 1.7976329623527592e-05, 'epoch': 0.42} {'loss': 0.8148, 'learning_rate': 1.797613217942027e-05, 'epoch': 0.42} {'loss': 0.6697, 'learning_rate': 1.7975934726765797e-05, 'epoch': 0.42} {'loss': 0.7652, 'learning_rate': 1.7975737265564395e-05, 'epoch': 0.42} {'loss': 0.724, 'learning_rate': 1.7975539795816268e-05, 'epoch': 0.42} {'loss': 1.0235, 'learning_rate': 1.7975342317521632e-05, 'epoch': 0.42} {'loss': 0.8713, 'learning_rate': 1.79751448306807e-05, 'epoch': 0.42} {'loss': 0.9789, 'learning_rate': 1.7974947335293674e-05, 'epoch': 0.42} {'loss': 0.8716, 'learning_rate': 1.7974749831360774e-05, 'epoch': 0.42} {'loss': 0.7173, 'learning_rate': 1.7974552318882213e-05, 'epoch': 0.42} {'loss': 0.8936, 'learning_rate': 1.7974354797858198e-05, 'epoch': 0.42} {'loss': 0.9457, 'learning_rate': 1.7974157268288942e-05, 'epoch': 0.42} {'loss': 1.0218, 'learning_rate': 1.7973959730174654e-05, 'epoch': 0.42} {'loss': 0.8874, 'learning_rate': 1.797376218351555e-05, 'epoch': 0.42} {'loss': 0.7697, 'learning_rate': 1.797356462831184e-05, 'epoch': 0.42} {'loss': 0.8258, 'learning_rate': 1.797336706456374e-05, 'epoch': 0.42} {'loss': 0.8685, 'learning_rate': 1.7973169492271454e-05, 'epoch': 0.42} {'loss': 0.8241, 'learning_rate': 1.7972971911435196e-05, 'epoch': 0.42} {'loss': 1.1439, 'learning_rate': 1.7972774322055178e-05, 'epoch': 0.42} {'loss': 0.8228, 'learning_rate': 1.797257672413162e-05, 'epoch': 0.42} {'loss': 0.8085, 'learning_rate': 1.797237911766472e-05, 'epoch': 0.42} {'loss': 0.8403, 'learning_rate': 1.7972181502654696e-05, 'epoch': 0.42} {'loss': 0.9929, 'learning_rate': 1.7971983879101764e-05, 'epoch': 0.42} {'loss': 0.8985, 'learning_rate': 1.797178624700613e-05, 'epoch': 0.42} {'loss': 0.911, 'learning_rate': 1.7971588606368007e-05, 'epoch': 0.42} {'loss': 0.898, 'learning_rate': 1.7971390957187608e-05, 'epoch': 0.42} {'loss': 0.8938, 'learning_rate': 1.797119329946514e-05, 'epoch': 0.42} {'loss': 0.8975, 'learning_rate': 1.7970995633200826e-05, 'epoch': 0.42} {'loss': 0.7684, 'learning_rate': 1.7970797958394865e-05, 'epoch': 0.42} {'loss': 0.9171, 'learning_rate': 1.797060027504748e-05, 'epoch': 0.42} {'loss': 0.8665, 'learning_rate': 1.7970402583158873e-05, 'epoch': 0.42} {'loss': 0.8988, 'learning_rate': 1.797020488272926e-05, 'epoch': 0.42} {'loss': 0.8421, 'learning_rate': 1.7970007173758856e-05, 'epoch': 0.42} {'loss': 0.7339, 'learning_rate': 1.796980945624787e-05, 'epoch': 0.42} {'loss': 0.8299, 'learning_rate': 1.796961173019651e-05, 'epoch': 0.42} {'loss': 1.1012, 'learning_rate': 1.7969413995604993e-05, 'epoch': 0.42} {'loss': 0.7703, 'learning_rate': 1.7969216252473533e-05, 'epoch': 0.42} {'loss': 0.7261, 'learning_rate': 1.7969018500802334e-05, 'epoch': 0.42} {'loss': 0.9445, 'learning_rate': 1.7968820740591617e-05, 'epoch': 0.42} {'loss': 0.7555, 'learning_rate': 1.7968622971841588e-05, 'epoch': 0.42} {'loss': 0.85, 'learning_rate': 1.796842519455246e-05, 'epoch': 0.42} {'loss': 0.9207, 'learning_rate': 1.7968227408724445e-05, 'epoch': 0.42} {'loss': 0.8775, 'learning_rate': 1.796802961435775e-05, 'epoch': 0.42} {'loss': 0.8699, 'learning_rate': 1.7967831811452602e-05, 'epoch': 0.42} {'loss': 0.9282, 'learning_rate': 1.7967634000009196e-05, 'epoch': 0.42} {'loss': 0.8969, 'learning_rate': 1.7967436180027754e-05, 'epoch': 0.42} {'loss': 0.9604, 'learning_rate': 1.7967238351508482e-05, 'epoch': 0.42} {'loss': 0.8494, 'learning_rate': 1.79670405144516e-05, 'epoch': 0.42} {'loss': 0.8476, 'learning_rate': 1.796684266885731e-05, 'epoch': 0.42} {'loss': 0.8364, 'learning_rate': 1.7966644814725832e-05, 'epoch': 0.42} {'loss': 0.8984, 'learning_rate': 1.7966446952057373e-05, 'epoch': 0.42} {'loss': 0.8125, 'learning_rate': 1.7966249080852146e-05, 'epoch': 0.42} {'loss': 0.9159, 'learning_rate': 1.796605120111037e-05, 'epoch': 0.42} {'loss': 0.9787, 'learning_rate': 1.7965853312832247e-05, 'epoch': 0.42} {'loss': 0.7967, 'learning_rate': 1.7965655416017993e-05, 'epoch': 0.42} {'loss': 0.788, 'learning_rate': 1.796545751066782e-05, 'epoch': 0.42} {'loss': 0.8807, 'learning_rate': 1.7965259596781942e-05, 'epoch': 0.42} {'loss': 0.7732, 'learning_rate': 1.796506167436057e-05, 'epoch': 0.42} {'loss': 0.8087, 'learning_rate': 1.7964863743403914e-05, 'epoch': 0.42} {'loss': 0.9386, 'learning_rate': 1.7964665803912186e-05, 'epoch': 0.42} {'loss': 0.8367, 'learning_rate': 1.7964467855885604e-05, 'epoch': 0.42} {'loss': 0.8141, 'learning_rate': 1.7964269899324372e-05, 'epoch': 0.42} {'loss': 0.9731, 'learning_rate': 1.7964071934228708e-05, 'epoch': 0.42} {'loss': 0.7337, 'learning_rate': 1.796387396059882e-05, 'epoch': 0.42} {'loss': 0.7984, 'learning_rate': 1.7963675978434927e-05, 'epoch': 0.42} {'loss': 0.8196, 'learning_rate': 1.796347798773723e-05, 'epoch': 0.42} {'loss': 0.9106, 'learning_rate': 1.7963279988505953e-05, 'epoch': 0.42} {'loss': 0.8324, 'learning_rate': 1.7963081980741298e-05, 'epoch': 0.42} {'loss': 1.0592, 'learning_rate': 1.7962883964443488e-05, 'epoch': 0.42} {'loss': 1.0198, 'learning_rate': 1.7962685939612722e-05, 'epoch': 0.42} {'loss': 0.7432, 'learning_rate': 1.7962487906249225e-05, 'epoch': 0.42} {'loss': 0.8305, 'learning_rate': 1.7962289864353205e-05, 'epoch': 0.42} {'loss': 0.8059, 'learning_rate': 1.7962091813924866e-05, 'epoch': 0.42} {'loss': 0.7751, 'learning_rate': 1.796189375496443e-05, 'epoch': 0.42} {'loss': 0.8128, 'learning_rate': 1.7961695687472107e-05, 'epoch': 0.42} {'loss': 0.7858, 'learning_rate': 1.796149761144811e-05, 'epoch': 0.42} {'loss': 0.9189, 'learning_rate': 1.7961299526892644e-05, 'epoch': 0.42} {'loss': 0.7957, 'learning_rate': 1.7961101433805934e-05, 'epoch': 0.42} {'loss': 0.8333, 'learning_rate': 1.7960903332188183e-05, 'epoch': 0.42} {'loss': 0.8964, 'learning_rate': 1.7960705222039603e-05, 'epoch': 0.42} {'loss': 0.8137, 'learning_rate': 1.796050710336041e-05, 'epoch': 0.42} {'loss': 0.7695, 'learning_rate': 1.7960308976150814e-05, 'epoch': 0.42} {'loss': 0.9062, 'learning_rate': 1.7960110840411032e-05, 'epoch': 0.42} {'loss': 0.8154, 'learning_rate': 1.795991269614127e-05, 'epoch': 0.42} {'loss': 0.8541, 'learning_rate': 1.7959714543341747e-05, 'epoch': 0.42} {'loss': 0.8025, 'learning_rate': 1.7959516382012666e-05, 'epoch': 0.42} {'loss': 0.8872, 'learning_rate': 1.7959318212154247e-05, 'epoch': 0.42} {'loss': 0.8342, 'learning_rate': 1.79591200337667e-05, 'epoch': 0.42} {'loss': 0.8786, 'learning_rate': 1.795892184685024e-05, 'epoch': 0.42} {'loss': 0.8122, 'learning_rate': 1.7958723651405075e-05, 'epoch': 0.42} {'loss': 0.9086, 'learning_rate': 1.7958525447431418e-05, 'epoch': 0.42} {'loss': 0.9089, 'learning_rate': 1.7958327234929488e-05, 'epoch': 0.42} {'loss': 0.8106, 'learning_rate': 1.7958129013899485e-05, 'epoch': 0.42} {'loss': 0.8112, 'learning_rate': 1.795793078434163e-05, 'epoch': 0.42} {'loss': 0.9064, 'learning_rate': 1.7957732546256135e-05, 'epoch': 0.42} {'loss': 0.7582, 'learning_rate': 1.7957534299643213e-05, 'epoch': 0.42} {'loss': 0.9542, 'learning_rate': 1.7957336044503074e-05, 'epoch': 0.42} {'loss': 0.7815, 'learning_rate': 1.7957137780835932e-05, 'epoch': 0.42} {'loss': 0.7752, 'learning_rate': 1.7956939508641995e-05, 'epoch': 0.42} {'loss': 0.7364, 'learning_rate': 1.7956741227921485e-05, 'epoch': 0.42} {'loss': 0.8675, 'learning_rate': 1.7956542938674602e-05, 'epoch': 0.42} {'loss': 0.84, 'learning_rate': 1.7956344640901567e-05, 'epoch': 0.42} {'loss': 0.805, 'learning_rate': 1.7956146334602597e-05, 'epoch': 0.42} {'loss': 0.9976, 'learning_rate': 1.795594801977789e-05, 'epoch': 0.42} {'loss': 0.6399, 'learning_rate': 1.795574969642767e-05, 'epoch': 0.42} {'loss': 1.0035, 'learning_rate': 1.7955551364552146e-05, 'epoch': 0.42} {'loss': 0.9708, 'learning_rate': 1.795535302415153e-05, 'epoch': 0.42} {'loss': 0.8458, 'learning_rate': 1.7955154675226037e-05, 'epoch': 0.42} {'loss': 0.9998, 'learning_rate': 1.7954956317775875e-05, 'epoch': 0.42} {'loss': 0.7451, 'learning_rate': 1.7954757951801262e-05, 'epoch': 0.42} {'loss': 0.9307, 'learning_rate': 1.7954559577302407e-05, 'epoch': 0.42} {'loss': 0.6687, 'learning_rate': 1.7954361194279524e-05, 'epoch': 0.42} {'loss': 0.8405, 'learning_rate': 1.7954162802732824e-05, 'epoch': 0.42} {'loss': 0.8355, 'learning_rate': 1.7953964402662522e-05, 'epoch': 0.42} {'loss': 1.004, 'learning_rate': 1.7953765994068826e-05, 'epoch': 0.42} {'loss': 0.8809, 'learning_rate': 1.7953567576951955e-05, 'epoch': 0.42} {'loss': 0.891, 'learning_rate': 1.7953369151312118e-05, 'epoch': 0.42} {'loss': 0.8225, 'learning_rate': 1.7953170717149526e-05, 'epoch': 0.42} {'loss': 0.9749, 'learning_rate': 1.7952972274464397e-05, 'epoch': 0.42} {'loss': 0.9145, 'learning_rate': 1.795277382325694e-05, 'epoch': 0.42} {'loss': 0.9263, 'learning_rate': 1.7952575363527364e-05, 'epoch': 0.42} {'loss': 0.9763, 'learning_rate': 1.795237689527589e-05, 'epoch': 0.42} {'loss': 0.8812, 'learning_rate': 1.7952178418502723e-05, 'epoch': 0.42} {'loss': 0.8436, 'learning_rate': 1.7951979933208083e-05, 'epoch': 0.42} {'loss': 0.9771, 'learning_rate': 1.7951781439392176e-05, 'epoch': 0.42} {'loss': 0.6786, 'learning_rate': 1.795158293705522e-05, 'epoch': 0.42} {'loss': 0.8685, 'learning_rate': 1.7951384426197426e-05, 'epoch': 0.42} {'loss': 0.8666, 'learning_rate': 1.7951185906819e-05, 'epoch': 0.42} {'loss': 0.8449, 'learning_rate': 1.7950987378920164e-05, 'epoch': 0.42} {'loss': 0.9192, 'learning_rate': 1.795078884250113e-05, 'epoch': 0.42} {'loss': 0.8399, 'learning_rate': 1.7950590297562105e-05, 'epoch': 0.42} {'loss': 0.7443, 'learning_rate': 1.7950391744103305e-05, 'epoch': 0.42} {'loss': 0.7938, 'learning_rate': 1.7950193182124942e-05, 'epoch': 0.42} {'loss': 0.6969, 'learning_rate': 1.7949994611627234e-05, 'epoch': 0.42} {'loss': 0.9564, 'learning_rate': 1.7949796032610383e-05, 'epoch': 0.42} {'loss': 0.7567, 'learning_rate': 1.794959744507461e-05, 'epoch': 0.42} {'loss': 0.8758, 'learning_rate': 1.794939884902013e-05, 'epoch': 0.42} {'loss': 0.947, 'learning_rate': 1.7949200244447147e-05, 'epoch': 0.42} {'loss': 0.7571, 'learning_rate': 1.794900163135588e-05, 'epoch': 0.42} {'loss': 0.9605, 'learning_rate': 1.7948803009746542e-05, 'epoch': 0.42} {'loss': 0.6554, 'learning_rate': 1.7948604379619344e-05, 'epoch': 0.42} {'loss': 0.5998, 'learning_rate': 1.7948405740974495e-05, 'epoch': 0.42} {'loss': 0.7892, 'learning_rate': 1.7948207093812217e-05, 'epoch': 0.42} {'loss': 0.9709, 'learning_rate': 1.7948008438132715e-05, 'epoch': 0.42} {'loss': 0.8726, 'learning_rate': 1.7947809773936202e-05, 'epoch': 0.42} {'loss': 0.8919, 'learning_rate': 1.7947611101222898e-05, 'epoch': 0.42} {'loss': 0.847, 'learning_rate': 1.794741241999301e-05, 'epoch': 0.42} {'loss': 0.8413, 'learning_rate': 1.794721373024675e-05, 'epoch': 0.42} {'loss': 0.6952, 'learning_rate': 1.7947015031984337e-05, 'epoch': 0.42} {'loss': 0.7855, 'learning_rate': 1.7946816325205977e-05, 'epoch': 0.42} {'loss': 0.7771, 'learning_rate': 1.7946617609911886e-05, 'epoch': 0.42} {'loss': 0.6699, 'learning_rate': 1.794641888610228e-05, 'epoch': 0.42} {'loss': 0.9017, 'learning_rate': 1.7946220153777367e-05, 'epoch': 0.42} {'loss': 0.7646, 'learning_rate': 1.7946021412937362e-05, 'epoch': 0.42} {'loss': 0.9276, 'learning_rate': 1.7945822663582477e-05, 'epoch': 0.42} {'loss': 0.8843, 'learning_rate': 1.794562390571293e-05, 'epoch': 0.42} {'loss': 0.9118, 'learning_rate': 1.7945425139328925e-05, 'epoch': 0.42} {'loss': 0.8521, 'learning_rate': 1.794522636443068e-05, 'epoch': 0.42} {'loss': 0.9525, 'learning_rate': 1.794502758101841e-05, 'epoch': 0.42} {'loss': 1.0757, 'learning_rate': 1.7944828789092327e-05, 'epoch': 0.42} {'loss': 0.9637, 'learning_rate': 1.794462998865264e-05, 'epoch': 0.42} {'loss': 0.7976, 'learning_rate': 1.7944431179699566e-05, 'epoch': 0.42} {'loss': 0.8103, 'learning_rate': 1.794423236223332e-05, 'epoch': 0.42} {'loss': 0.9866, 'learning_rate': 1.7944033536254106e-05, 'epoch': 0.42} {'loss': 0.8457, 'learning_rate': 1.7943834701762147e-05, 'epoch': 0.42} {'loss': 0.8812, 'learning_rate': 1.794363585875765e-05, 'epoch': 0.42} {'loss': 0.7744, 'learning_rate': 1.7943437007240834e-05, 'epoch': 0.42} {'loss': 1.0226, 'learning_rate': 1.7943238147211906e-05, 'epoch': 0.42} {'loss': 0.7648, 'learning_rate': 1.794303927867108e-05, 'epoch': 0.42} {'loss': 1.0735, 'learning_rate': 1.7942840401618574e-05, 'epoch': 0.42} {'loss': 0.848, 'learning_rate': 1.794264151605459e-05, 'epoch': 0.42} {'loss': 0.988, 'learning_rate': 1.7942442621979357e-05, 'epoch': 0.42} {'loss': 0.9205, 'learning_rate': 1.7942243719393078e-05, 'epoch': 0.42} {'loss': 0.9782, 'learning_rate': 1.7942044808295965e-05, 'epoch': 0.42} {'loss': 0.897, 'learning_rate': 1.7941845888688237e-05, 'epoch': 0.42} {'loss': 0.8642, 'learning_rate': 1.79416469605701e-05, 'epoch': 0.42} {'loss': 0.9593, 'learning_rate': 1.7941448023941778e-05, 'epoch': 0.42} {'loss': 1.0034, 'learning_rate': 1.7941249078803474e-05, 'epoch': 0.42} {'loss': 0.694, 'learning_rate': 1.794105012515541e-05, 'epoch': 0.42} {'loss': 0.8734, 'learning_rate': 1.7940851162997788e-05, 'epoch': 0.42} {'loss': 0.9522, 'learning_rate': 1.7940652192330826e-05, 'epoch': 0.42} {'loss': 1.022, 'learning_rate': 1.7940453213154744e-05, 'epoch': 0.42} {'loss': 0.9609, 'learning_rate': 1.7940254225469748e-05, 'epoch': 0.42} {'loss': 0.794, 'learning_rate': 1.794005522927605e-05, 'epoch': 0.42} {'loss': 0.8403, 'learning_rate': 1.793985622457387e-05, 'epoch': 0.42} {'loss': 0.932, 'learning_rate': 1.7939657211363414e-05, 'epoch': 0.42} {'loss': 0.7617, 'learning_rate': 1.7939458189644902e-05, 'epoch': 0.42} {'loss': 0.9845, 'learning_rate': 1.7939259159418544e-05, 'epoch': 0.42} {'loss': 1.076, 'learning_rate': 1.793906012068455e-05, 'epoch': 0.42} {'loss': 0.835, 'learning_rate': 1.7938861073443135e-05, 'epoch': 0.42} {'loss': 0.9059, 'learning_rate': 1.793866201769452e-05, 'epoch': 0.42} {'loss': 0.8525, 'learning_rate': 1.7938462953438907e-05, 'epoch': 0.42} {'loss': 0.88, 'learning_rate': 1.7938263880676516e-05, 'epoch': 0.42} {'loss': 0.8879, 'learning_rate': 1.7938064799407563e-05, 'epoch': 0.42} {'loss': 0.717, 'learning_rate': 1.793786570963225e-05, 'epoch': 0.42} {'loss': 0.8375, 'learning_rate': 1.7937666611350803e-05, 'epoch': 0.42} {'loss': 0.9043, 'learning_rate': 1.7937467504563427e-05, 'epoch': 0.42} {'loss': 0.7933, 'learning_rate': 1.793726838927034e-05, 'epoch': 0.42} {'loss': 0.7805, 'learning_rate': 1.793706926547175e-05, 'epoch': 0.42} {'loss': 0.7321, 'learning_rate': 1.793687013316788e-05, 'epoch': 0.42} {'loss': 0.7974, 'learning_rate': 1.793667099235893e-05, 'epoch': 0.42} {'loss': 0.762, 'learning_rate': 1.7936471843045127e-05, 'epoch': 0.42} {'loss': 0.7998, 'learning_rate': 1.7936272685226676e-05, 'epoch': 0.42} {'loss': 0.8489, 'learning_rate': 1.793607351890379e-05, 'epoch': 0.42} {'loss': 0.7581, 'learning_rate': 1.7935874344076687e-05, 'epoch': 0.42} {'loss': 1.0278, 'learning_rate': 1.793567516074558e-05, 'epoch': 0.42} {'loss': 0.9772, 'learning_rate': 1.7935475968910678e-05, 'epoch': 0.42} {'loss': 1.0001, 'learning_rate': 1.79352767685722e-05, 'epoch': 0.42} {'loss': 0.9189, 'learning_rate': 1.7935077559730353e-05, 'epoch': 0.42} {'loss': 0.8049, 'learning_rate': 1.7934878342385357e-05, 'epoch': 0.42} {'loss': 0.878, 'learning_rate': 1.793467911653742e-05, 'epoch': 0.42} {'loss': 0.9059, 'learning_rate': 1.7934479882186764e-05, 'epoch': 0.42} {'loss': 0.9867, 'learning_rate': 1.793428063933359e-05, 'epoch': 0.42} {'loss': 0.8226, 'learning_rate': 1.7934081387978125e-05, 'epoch': 0.42} {'loss': 0.7593, 'learning_rate': 1.793388212812057e-05, 'epoch': 0.42} {'loss': 0.8059, 'learning_rate': 1.7933682859761147e-05, 'epoch': 0.42} {'loss': 0.9086, 'learning_rate': 1.7933483582900065e-05, 'epoch': 0.42} {'loss': 0.9382, 'learning_rate': 1.7933284297537537e-05, 'epoch': 0.42} {'loss': 0.934, 'learning_rate': 1.7933085003673784e-05, 'epoch': 0.42} {'loss': 0.7653, 'learning_rate': 1.7932885701309014e-05, 'epoch': 0.42} {'loss': 0.9603, 'learning_rate': 1.7932686390443436e-05, 'epoch': 0.42} {'loss': 1.0783, 'learning_rate': 1.7932487071077275e-05, 'epoch': 0.42} {'loss': 0.6316, 'learning_rate': 1.7932287743210732e-05, 'epoch': 0.42} {'loss': 0.8686, 'learning_rate': 1.793208840684403e-05, 'epoch': 0.42} {'loss': 0.7596, 'learning_rate': 1.793188906197738e-05, 'epoch': 0.42} {'loss': 0.8778, 'learning_rate': 1.7931689708610995e-05, 'epoch': 0.42} {'loss': 0.9868, 'learning_rate': 1.793149034674509e-05, 'epoch': 0.42} {'loss': 0.9317, 'learning_rate': 1.793129097637987e-05, 'epoch': 0.42} {'loss': 1.0802, 'learning_rate': 1.7931091597515564e-05, 'epoch': 0.42} {'loss': 0.818, 'learning_rate': 1.7930892210152374e-05, 'epoch': 0.42} {'loss': 0.8792, 'learning_rate': 1.793069281429052e-05, 'epoch': 0.42} {'loss': 1.0728, 'learning_rate': 1.793049340993021e-05, 'epoch': 0.42} {'loss': 1.0083, 'learning_rate': 1.793029399707166e-05, 'epoch': 0.42} {'loss': 0.7181, 'learning_rate': 1.7930094575715084e-05, 'epoch': 0.42} {'loss': 1.109, 'learning_rate': 1.79298951458607e-05, 'epoch': 0.42} {'loss': 0.8835, 'learning_rate': 1.7929695707508713e-05, 'epoch': 0.42} {'loss': 0.9163, 'learning_rate': 1.792949626065934e-05, 'epoch': 0.42} {'loss': 0.7338, 'learning_rate': 1.79292968053128e-05, 'epoch': 0.42} {'loss': 0.7918, 'learning_rate': 1.7929097341469304e-05, 'epoch': 0.42} {'loss': 0.9272, 'learning_rate': 1.7928897869129064e-05, 'epoch': 0.42} {'loss': 0.9883, 'learning_rate': 1.7928698388292288e-05, 'epoch': 0.42} {'loss': 1.0624, 'learning_rate': 1.7928498898959205e-05, 'epoch': 0.42} {'loss': 0.9907, 'learning_rate': 1.7928299401130013e-05, 'epoch': 0.42} {'loss': 0.8874, 'learning_rate': 1.7928099894804937e-05, 'epoch': 0.42} {'loss': 0.8882, 'learning_rate': 1.7927900379984186e-05, 'epoch': 0.42} {'loss': 0.8376, 'learning_rate': 1.7927700856667972e-05, 'epoch': 0.42} {'loss': 0.9269, 'learning_rate': 1.7927501324856512e-05, 'epoch': 0.42} {'loss': 0.6553, 'learning_rate': 1.7927301784550017e-05, 'epoch': 0.42} {'loss': 0.9829, 'learning_rate': 1.7927102235748706e-05, 'epoch': 0.42} {'loss': 0.7218, 'learning_rate': 1.792690267845279e-05, 'epoch': 0.42} {'loss': 0.8163, 'learning_rate': 1.7926703112662477e-05, 'epoch': 0.42} {'loss': 0.911, 'learning_rate': 1.792650353837799e-05, 'epoch': 0.42} {'loss': 0.7097, 'learning_rate': 1.7926303955599538e-05, 'epoch': 0.42} {'loss': 1.0158, 'learning_rate': 1.7926104364327338e-05, 'epoch': 0.42} {'loss': 0.8485, 'learning_rate': 1.7925904764561603e-05, 'epoch': 0.42} {'loss': 0.9365, 'learning_rate': 1.792570515630254e-05, 'epoch': 0.42} {'loss': 1.0218, 'learning_rate': 1.7925505539550372e-05, 'epoch': 0.42} {'loss': 0.9858, 'learning_rate': 1.7925305914305306e-05, 'epoch': 0.42} {'loss': 0.8349, 'learning_rate': 1.7925106280567567e-05, 'epoch': 0.42} {'loss': 0.9065, 'learning_rate': 1.7924906638337356e-05, 'epoch': 0.42} {'loss': 0.7409, 'learning_rate': 1.792470698761489e-05, 'epoch': 0.42} {'loss': 0.8165, 'learning_rate': 1.7924507328400393e-05, 'epoch': 0.42} {'loss': 0.7757, 'learning_rate': 1.7924307660694064e-05, 'epoch': 0.42} {'loss': 0.8119, 'learning_rate': 1.7924107984496128e-05, 'epoch': 0.42} {'loss': 0.8665, 'learning_rate': 1.792390829980679e-05, 'epoch': 0.42} {'loss': 0.771, 'learning_rate': 1.7923708606626275e-05, 'epoch': 0.42} {'loss': 0.8616, 'learning_rate': 1.792350890495479e-05, 'epoch': 0.42} {'loss': 0.8557, 'learning_rate': 1.7923309194792546e-05, 'epoch': 0.42} {'loss': 0.9078, 'learning_rate': 1.7923109476139763e-05, 'epoch': 0.42} {'loss': 0.8196, 'learning_rate': 1.7922909748996655e-05, 'epoch': 0.42} {'loss': 0.9474, 'learning_rate': 1.7922710013363433e-05, 'epoch': 0.42} {'loss': 0.772, 'learning_rate': 1.7922510269240316e-05, 'epoch': 0.42} {'loss': 0.9066, 'learning_rate': 1.792231051662751e-05, 'epoch': 0.42} {'loss': 0.891, 'learning_rate': 1.792211075552523e-05, 'epoch': 0.42} {'loss': 0.9974, 'learning_rate': 1.79219109859337e-05, 'epoch': 0.42} {'loss': 0.8574, 'learning_rate': 1.7921711207853122e-05, 'epoch': 0.42} {'loss': 1.0139, 'learning_rate': 1.792151142128372e-05, 'epoch': 0.42} {'loss': 0.671, 'learning_rate': 1.79213116262257e-05, 'epoch': 0.42} {'loss': 1.0306, 'learning_rate': 1.7921111822679283e-05, 'epoch': 0.42} {'loss': 1.1399, 'learning_rate': 1.7920912010644676e-05, 'epoch': 0.42} {'loss': 0.8147, 'learning_rate': 1.7920712190122097e-05, 'epoch': 0.42} {'loss': 0.9025, 'learning_rate': 1.7920512361111763e-05, 'epoch': 0.42} {'loss': 0.9188, 'learning_rate': 1.7920312523613885e-05, 'epoch': 0.42} {'loss': 0.9198, 'learning_rate': 1.7920112677628676e-05, 'epoch': 0.42} {'loss': 0.8587, 'learning_rate': 1.7919912823156353e-05, 'epoch': 0.42} {'loss': 0.8982, 'learning_rate': 1.7919712960197125e-05, 'epoch': 0.42} {'loss': 1.023, 'learning_rate': 1.7919513088751213e-05, 'epoch': 0.42} {'loss': 0.8901, 'learning_rate': 1.7919313208818824e-05, 'epoch': 0.42} {'loss': 0.9465, 'learning_rate': 1.7919113320400182e-05, 'epoch': 0.42} {'loss': 1.0932, 'learning_rate': 1.791891342349549e-05, 'epoch': 0.42} {'loss': 0.8735, 'learning_rate': 1.7918713518104972e-05, 'epoch': 0.42} {'loss': 0.8433, 'learning_rate': 1.7918513604228836e-05, 'epoch': 0.42} {'loss': 0.9626, 'learning_rate': 1.7918313681867296e-05, 'epoch': 0.42} {'loss': 0.9782, 'learning_rate': 1.7918113751020573e-05, 'epoch': 0.42} {'loss': 0.7603, 'learning_rate': 1.791791381168887e-05, 'epoch': 0.42} {'loss': 0.9661, 'learning_rate': 1.791771386387241e-05, 'epoch': 0.42} {'loss': 0.8599, 'learning_rate': 1.7917513907571406e-05, 'epoch': 0.42} {'loss': 0.6878, 'learning_rate': 1.7917313942786072e-05, 'epoch': 0.42} {'loss': 0.8762, 'learning_rate': 1.7917113969516622e-05, 'epoch': 0.42} {'loss': 0.8739, 'learning_rate': 1.791691398776327e-05, 'epoch': 0.42} {'loss': 0.9145, 'learning_rate': 1.7916713997526226e-05, 'epoch': 0.42} {'loss': 1.0096, 'learning_rate': 1.7916513998805713e-05, 'epoch': 0.42} {'loss': 0.9675, 'learning_rate': 1.7916313991601938e-05, 'epoch': 0.42} {'loss': 0.9119, 'learning_rate': 1.791611397591512e-05, 'epoch': 0.42} {'loss': 0.8115, 'learning_rate': 1.791591395174547e-05, 'epoch': 0.42} {'loss': 0.7731, 'learning_rate': 1.7915713919093202e-05, 'epoch': 0.42} {'loss': 0.9511, 'learning_rate': 1.7915513877958534e-05, 'epoch': 0.42} {'loss': 0.8411, 'learning_rate': 1.791531382834168e-05, 'epoch': 0.42} {'loss': 0.8679, 'learning_rate': 1.791511377024285e-05, 'epoch': 0.42} {'loss': 0.8545, 'learning_rate': 1.7914913703662266e-05, 'epoch': 0.42} {'loss': 0.9213, 'learning_rate': 1.7914713628600134e-05, 'epoch': 0.42} {'loss': 0.7511, 'learning_rate': 1.791451354505667e-05, 'epoch': 0.42} {'loss': 0.782, 'learning_rate': 1.7914313453032093e-05, 'epoch': 0.42} {'loss': 0.9747, 'learning_rate': 1.7914113352526613e-05, 'epoch': 0.42} {'loss': 0.9939, 'learning_rate': 1.791391324354045e-05, 'epoch': 0.42} {'loss': 0.7545, 'learning_rate': 1.7913713126073813e-05, 'epoch': 0.42} {'loss': 0.7978, 'learning_rate': 1.7913513000126915e-05, 'epoch': 0.42} {'loss': 0.8374, 'learning_rate': 1.7913312865699977e-05, 'epoch': 0.42} {'loss': 1.0401, 'learning_rate': 1.791311272279321e-05, 'epoch': 0.42} {'loss': 0.9373, 'learning_rate': 1.791291257140683e-05, 'epoch': 0.42} {'loss': 0.9682, 'learning_rate': 1.7912712411541046e-05, 'epoch': 0.42} {'loss': 0.8078, 'learning_rate': 1.791251224319608e-05, 'epoch': 0.42} {'loss': 1.0773, 'learning_rate': 1.791231206637214e-05, 'epoch': 0.42} {'loss': 0.8037, 'learning_rate': 1.7912111881069443e-05, 'epoch': 0.42} {'loss': 0.9277, 'learning_rate': 1.7911911687288206e-05, 'epoch': 0.42} {'loss': 0.7109, 'learning_rate': 1.7911711485028643e-05, 'epoch': 0.42} {'loss': 0.9374, 'learning_rate': 1.7911511274290966e-05, 'epoch': 0.42} {'loss': 0.8404, 'learning_rate': 1.791131105507539e-05, 'epoch': 0.42} {'loss': 0.9188, 'learning_rate': 1.7911110827382128e-05, 'epoch': 0.42} {'loss': 0.8747, 'learning_rate': 1.7910910591211398e-05, 'epoch': 0.42} {'loss': 0.8677, 'learning_rate': 1.7910710346563417e-05, 'epoch': 0.42} {'loss': 0.8566, 'learning_rate': 1.791051009343839e-05, 'epoch': 0.42} {'loss': 0.9451, 'learning_rate': 1.791030983183654e-05, 'epoch': 0.42} {'loss': 0.9077, 'learning_rate': 1.791010956175808e-05, 'epoch': 0.42} {'loss': 0.6869, 'learning_rate': 1.7909909283203224e-05, 'epoch': 0.42} {'loss': 0.9036, 'learning_rate': 1.7909708996172184e-05, 'epoch': 0.42} {'loss': 0.9325, 'learning_rate': 1.790950870066518e-05, 'epoch': 0.42} {'loss': 1.0432, 'learning_rate': 1.7909308396682422e-05, 'epoch': 0.42} {'loss': 0.779, 'learning_rate': 1.7909108084224124e-05, 'epoch': 0.42} {'loss': 1.0175, 'learning_rate': 1.7908907763290506e-05, 'epoch': 0.42} {'loss': 0.8079, 'learning_rate': 1.7908707433881778e-05, 'epoch': 0.42} {'loss': 0.8792, 'learning_rate': 1.7908507095998156e-05, 'epoch': 0.42} {'loss': 0.8774, 'learning_rate': 1.7908306749639858e-05, 'epoch': 0.42} {'loss': 0.7721, 'learning_rate': 1.790810639480709e-05, 'epoch': 0.42} {'loss': 0.8124, 'learning_rate': 1.7907906031500076e-05, 'epoch': 0.42} {'loss': 0.9405, 'learning_rate': 1.7907705659719026e-05, 'epoch': 0.42} {'loss': 0.7189, 'learning_rate': 1.7907505279464157e-05, 'epoch': 0.42} {'loss': 0.9651, 'learning_rate': 1.7907304890735678e-05, 'epoch': 0.42} {'loss': 0.7896, 'learning_rate': 1.7907104493533817e-05, 'epoch': 0.42} {'loss': 0.9524, 'learning_rate': 1.790690408785877e-05, 'epoch': 0.42} {'loss': 0.933, 'learning_rate': 1.790670367371077e-05, 'epoch': 0.42} {'loss': 0.7657, 'learning_rate': 1.7906503251090015e-05, 'epoch': 0.42} {'loss': 0.9923, 'learning_rate': 1.7906302819996733e-05, 'epoch': 0.42} {'loss': 0.7975, 'learning_rate': 1.7906102380431133e-05, 'epoch': 0.42} {'loss': 1.0103, 'learning_rate': 1.790590193239343e-05, 'epoch': 0.42} {'loss': 0.949, 'learning_rate': 1.7905701475883845e-05, 'epoch': 0.42} {'loss': 0.9135, 'learning_rate': 1.790550101090258e-05, 'epoch': 0.42} {'loss': 0.7998, 'learning_rate': 1.7905300537449862e-05, 'epoch': 0.42} {'loss': 0.761, 'learning_rate': 1.79051000555259e-05, 'epoch': 0.42} {'loss': 0.8335, 'learning_rate': 1.7904899565130905e-05, 'epoch': 0.42} {'loss': 0.7641, 'learning_rate': 1.7904699066265104e-05, 'epoch': 0.42} {'loss': 0.8173, 'learning_rate': 1.79044985589287e-05, 'epoch': 0.42} {'loss': 0.835, 'learning_rate': 1.7904298043121914e-05, 'epoch': 0.42} {'loss': 0.7749, 'learning_rate': 1.7904097518844962e-05, 'epoch': 0.42} {'loss': 0.9541, 'learning_rate': 1.790389698609805e-05, 'epoch': 0.42} {'loss': 0.6772, 'learning_rate': 1.79036964448814e-05, 'epoch': 0.42} {'loss': 1.0111, 'learning_rate': 1.7903495895195232e-05, 'epoch': 0.42} {'loss': 0.7661, 'learning_rate': 1.7903295337039748e-05, 'epoch': 0.42} {'loss': 1.1399, 'learning_rate': 1.7903094770415173e-05, 'epoch': 0.42} {'loss': 0.8473, 'learning_rate': 1.790289419532172e-05, 'epoch': 0.42} {'loss': 0.8827, 'learning_rate': 1.79026936117596e-05, 'epoch': 0.42} {'loss': 0.7503, 'learning_rate': 1.790249301972903e-05, 'epoch': 0.42} {'loss': 0.84, 'learning_rate': 1.7902292419230227e-05, 'epoch': 0.42} {'loss': 1.0079, 'learning_rate': 1.79020918102634e-05, 'epoch': 0.42} {'loss': 0.7144, 'learning_rate': 1.7901891192828776e-05, 'epoch': 0.42} {'loss': 0.8454, 'learning_rate': 1.7901690566926556e-05, 'epoch': 0.42} {'loss': 1.0353, 'learning_rate': 1.7901489932556967e-05, 'epoch': 0.42} {'loss': 1.1283, 'learning_rate': 1.7901289289720214e-05, 'epoch': 0.42} {'loss': 0.9647, 'learning_rate': 1.7901088638416516e-05, 'epoch': 0.42} {'loss': 0.8435, 'learning_rate': 1.7900887978646093e-05, 'epoch': 0.42} {'loss': 0.95, 'learning_rate': 1.7900687310409153e-05, 'epoch': 0.43} {'loss': 0.7156, 'learning_rate': 1.790048663370591e-05, 'epoch': 0.43} {'loss': 0.9395, 'learning_rate': 1.790028594853659e-05, 'epoch': 0.43} {'loss': 0.7762, 'learning_rate': 1.7900085254901396e-05, 'epoch': 0.43} {'loss': 0.7203, 'learning_rate': 1.789988455280055e-05, 'epoch': 0.43} {'loss': 0.8208, 'learning_rate': 1.7899683842234263e-05, 'epoch': 0.43} {'loss': 0.8239, 'learning_rate': 1.789948312320275e-05, 'epoch': 0.43} {'loss': 0.9775, 'learning_rate': 1.7899282395706228e-05, 'epoch': 0.43} {'loss': 0.8689, 'learning_rate': 1.7899081659744914e-05, 'epoch': 0.43} {'loss': 0.923, 'learning_rate': 1.789888091531902e-05, 'epoch': 0.43} {'loss': 0.7596, 'learning_rate': 1.7898680162428763e-05, 'epoch': 0.43} {'loss': 0.8124, 'learning_rate': 1.7898479401074357e-05, 'epoch': 0.43} {'loss': 0.9016, 'learning_rate': 1.7898278631256018e-05, 'epoch': 0.43} {'loss': 0.9526, 'learning_rate': 1.789807785297396e-05, 'epoch': 0.43} {'loss': 0.8918, 'learning_rate': 1.78978770662284e-05, 'epoch': 0.43} {'loss': 0.8438, 'learning_rate': 1.789767627101955e-05, 'epoch': 0.43} {'loss': 0.9235, 'learning_rate': 1.7897475467347624e-05, 'epoch': 0.43} {'loss': 0.7949, 'learning_rate': 1.7897274655212844e-05, 'epoch': 0.43} {'loss': 1.0425, 'learning_rate': 1.7897073834615422e-05, 'epoch': 0.43} {'loss': 0.8477, 'learning_rate': 1.789687300555557e-05, 'epoch': 0.43} {'loss': 0.7462, 'learning_rate': 1.789667216803351e-05, 'epoch': 0.43} {'loss': 0.8706, 'learning_rate': 1.789647132204945e-05, 'epoch': 0.43} {'loss': 0.8918, 'learning_rate': 1.7896270467603608e-05, 'epoch': 0.43} {'loss': 0.8648, 'learning_rate': 1.78960696046962e-05, 'epoch': 0.43} {'loss': 0.9202, 'learning_rate': 1.7895868733327443e-05, 'epoch': 0.43} {'loss': 0.7853, 'learning_rate': 1.789566785349755e-05, 'epoch': 0.43} {'loss': 0.8513, 'learning_rate': 1.7895466965206734e-05, 'epoch': 0.43} {'loss': 0.9831, 'learning_rate': 1.789526606845521e-05, 'epoch': 0.43} {'loss': 0.8495, 'learning_rate': 1.78950651632432e-05, 'epoch': 0.43} {'loss': 0.9376, 'learning_rate': 1.7894864249570914e-05, 'epoch': 0.43} {'loss': 1.0424, 'learning_rate': 1.7894663327438572e-05, 'epoch': 0.43} {'loss': 0.8415, 'learning_rate': 1.789446239684638e-05, 'epoch': 0.43} {'loss': 0.9473, 'learning_rate': 1.789426145779456e-05, 'epoch': 0.43} {'loss': 1.0021, 'learning_rate': 1.789406051028333e-05, 'epoch': 0.43} {'loss': 0.7775, 'learning_rate': 1.7893859554312895e-05, 'epoch': 0.43} {'loss': 0.7523, 'learning_rate': 1.789365858988348e-05, 'epoch': 0.43} {'loss': 0.9804, 'learning_rate': 1.7893457616995302e-05, 'epoch': 0.43} {'loss': 1.1222, 'learning_rate': 1.7893256635648567e-05, 'epoch': 0.43} {'loss': 1.0153, 'learning_rate': 1.7893055645843496e-05, 'epoch': 0.43} {'loss': 0.7633, 'learning_rate': 1.7892854647580304e-05, 'epoch': 0.43} {'loss': 0.7822, 'learning_rate': 1.7892653640859206e-05, 'epoch': 0.43} {'loss': 0.7664, 'learning_rate': 1.789245262568042e-05, 'epoch': 0.43} {'loss': 1.0844, 'learning_rate': 1.7892251602044152e-05, 'epoch': 0.43} {'loss': 0.9421, 'learning_rate': 1.789205056995063e-05, 'epoch': 0.43} {'loss': 0.9027, 'learning_rate': 1.7891849529400062e-05, 'epoch': 0.43} {'loss': 1.1286, 'learning_rate': 1.7891648480392664e-05, 'epoch': 0.43} {'loss': 0.752, 'learning_rate': 1.789144742292865e-05, 'epoch': 0.43} {'loss': 0.9421, 'learning_rate': 1.7891246357008244e-05, 'epoch': 0.43} {'loss': 0.8615, 'learning_rate': 1.789104528263165e-05, 'epoch': 0.43} {'loss': 0.6985, 'learning_rate': 1.7890844199799092e-05, 'epoch': 0.43} {'loss': 0.8843, 'learning_rate': 1.7890643108510777e-05, 'epoch': 0.43} {'loss': 0.7598, 'learning_rate': 1.7890442008766932e-05, 'epoch': 0.43} {'loss': 0.8299, 'learning_rate': 1.7890240900567764e-05, 'epoch': 0.43} {'loss': 0.8875, 'learning_rate': 1.7890039783913492e-05, 'epoch': 0.43} {'loss': 0.647, 'learning_rate': 1.7889838658804327e-05, 'epoch': 0.43} {'loss': 0.852, 'learning_rate': 1.788963752524049e-05, 'epoch': 0.43} {'loss': 0.9195, 'learning_rate': 1.7889436383222195e-05, 'epoch': 0.43} {'loss': 0.8849, 'learning_rate': 1.7889235232749652e-05, 'epoch': 0.43} {'loss': 1.006, 'learning_rate': 1.788903407382309e-05, 'epoch': 0.43} {'loss': 0.7368, 'learning_rate': 1.7888832906442708e-05, 'epoch': 0.43} {'loss': 0.7312, 'learning_rate': 1.788863173060873e-05, 'epoch': 0.43} {'loss': 1.0076, 'learning_rate': 1.7888430546321375e-05, 'epoch': 0.43} {'loss': 0.8792, 'learning_rate': 1.7888229353580855e-05, 'epoch': 0.43} {'loss': 0.7487, 'learning_rate': 1.7888028152387386e-05, 'epoch': 0.43} {'loss': 1.0538, 'learning_rate': 1.7887826942741178e-05, 'epoch': 0.43} {'loss': 0.8861, 'learning_rate': 1.7887625724642456e-05, 'epoch': 0.43} {'loss': 0.8719, 'learning_rate': 1.7887424498091426e-05, 'epoch': 0.43} {'loss': 0.9426, 'learning_rate': 1.788722326308831e-05, 'epoch': 0.43} {'loss': 0.9248, 'learning_rate': 1.7887022019633326e-05, 'epoch': 0.43} {'loss': 0.9432, 'learning_rate': 1.7886820767726683e-05, 'epoch': 0.43} {'loss': 0.8373, 'learning_rate': 1.7886619507368603e-05, 'epoch': 0.43} {'loss': 0.9801, 'learning_rate': 1.78864182385593e-05, 'epoch': 0.43} {'loss': 0.9458, 'learning_rate': 1.7886216961298985e-05, 'epoch': 0.43} {'loss': 0.9093, 'learning_rate': 1.7886015675587874e-05, 'epoch': 0.43} {'loss': 0.9862, 'learning_rate': 1.788581438142619e-05, 'epoch': 0.43} {'loss': 0.8372, 'learning_rate': 1.7885613078814138e-05, 'epoch': 0.43} {'loss': 0.921, 'learning_rate': 1.7885411767751944e-05, 'epoch': 0.43} {'loss': 0.9541, 'learning_rate': 1.788521044823982e-05, 'epoch': 0.43} {'loss': 0.9427, 'learning_rate': 1.788500912027798e-05, 'epoch': 0.43} {'loss': 1.0008, 'learning_rate': 1.7884807783866645e-05, 'epoch': 0.43} {'loss': 0.7895, 'learning_rate': 1.788460643900602e-05, 'epoch': 0.43} {'loss': 0.7919, 'learning_rate': 1.7884405085696334e-05, 'epoch': 0.43} {'loss': 0.7249, 'learning_rate': 1.788420372393779e-05, 'epoch': 0.43} {'loss': 0.8484, 'learning_rate': 1.7884002353730614e-05, 'epoch': 0.43} {'loss': 0.8122, 'learning_rate': 1.7883800975075018e-05, 'epoch': 0.43} {'loss': 0.8842, 'learning_rate': 1.7883599587971217e-05, 'epoch': 0.43} {'loss': 0.903, 'learning_rate': 1.788339819241943e-05, 'epoch': 0.43} {'loss': 0.862, 'learning_rate': 1.7883196788419867e-05, 'epoch': 0.43} {'loss': 0.9981, 'learning_rate': 1.7882995375972746e-05, 'epoch': 0.43} {'loss': 0.872, 'learning_rate': 1.7882793955078286e-05, 'epoch': 0.43} {'loss': 0.8028, 'learning_rate': 1.7882592525736703e-05, 'epoch': 0.43} {'loss': 0.9025, 'learning_rate': 1.788239108794821e-05, 'epoch': 0.43} {'loss': 0.6647, 'learning_rate': 1.788218964171302e-05, 'epoch': 0.43} {'loss': 0.9617, 'learning_rate': 1.7881988187031356e-05, 'epoch': 0.43} {'loss': 0.8543, 'learning_rate': 1.788178672390343e-05, 'epoch': 0.43} {'loss': 1.0102, 'learning_rate': 1.7881585252329455e-05, 'epoch': 0.43} {'loss': 0.7398, 'learning_rate': 1.7881383772309654e-05, 'epoch': 0.43} {'loss': 0.9156, 'learning_rate': 1.7881182283844235e-05, 'epoch': 0.43} {'loss': 0.8502, 'learning_rate': 1.788098078693342e-05, 'epoch': 0.43} {'loss': 0.8915, 'learning_rate': 1.7880779281577424e-05, 'epoch': 0.43} {'loss': 0.9437, 'learning_rate': 1.788057776777646e-05, 'epoch': 0.43} {'loss': 1.0911, 'learning_rate': 1.7880376245530745e-05, 'epoch': 0.43} {'loss': 0.7382, 'learning_rate': 1.7880174714840497e-05, 'epoch': 0.43} {'loss': 0.8208, 'learning_rate': 1.787997317570593e-05, 'epoch': 0.43} {'loss': 0.8698, 'learning_rate': 1.7879771628127262e-05, 'epoch': 0.43} {'loss': 0.8438, 'learning_rate': 1.7879570072104705e-05, 'epoch': 0.43} {'loss': 0.7916, 'learning_rate': 1.7879368507638476e-05, 'epoch': 0.43} {'loss': 0.9171, 'learning_rate': 1.78791669347288e-05, 'epoch': 0.43} {'loss': 0.7928, 'learning_rate': 1.7878965353375878e-05, 'epoch': 0.43} {'loss': 0.7293, 'learning_rate': 1.7878763763579935e-05, 'epoch': 0.43} {'loss': 0.9032, 'learning_rate': 1.787856216534119e-05, 'epoch': 0.43} {'loss': 0.8411, 'learning_rate': 1.7878360558659847e-05, 'epoch': 0.43} {'loss': 0.7874, 'learning_rate': 1.7878158943536135e-05, 'epoch': 0.43} {'loss': 0.9854, 'learning_rate': 1.7877957319970263e-05, 'epoch': 0.43} {'loss': 0.8502, 'learning_rate': 1.787775568796245e-05, 'epoch': 0.43} {'loss': 0.9928, 'learning_rate': 1.787755404751291e-05, 'epoch': 0.43} {'loss': 0.725, 'learning_rate': 1.7877352398621858e-05, 'epoch': 0.43} {'loss': 0.9179, 'learning_rate': 1.7877150741289515e-05, 'epoch': 0.43} {'loss': 1.0186, 'learning_rate': 1.7876949075516093e-05, 'epoch': 0.43} {'loss': 0.8438, 'learning_rate': 1.7876747401301808e-05, 'epoch': 0.43} {'loss': 0.9535, 'learning_rate': 1.787654571864688e-05, 'epoch': 0.43} {'loss': 1.0882, 'learning_rate': 1.787634402755152e-05, 'epoch': 0.43} {'loss': 0.9234, 'learning_rate': 1.7876142328015946e-05, 'epoch': 0.43} {'loss': 0.7649, 'learning_rate': 1.7875940620040374e-05, 'epoch': 0.43} {'loss': 0.8502, 'learning_rate': 1.7875738903625027e-05, 'epoch': 0.43} {'loss': 1.0563, 'learning_rate': 1.7875537178770108e-05, 'epoch': 0.43} {'loss': 0.7444, 'learning_rate': 1.7875335445475844e-05, 'epoch': 0.43} {'loss': 0.9664, 'learning_rate': 1.7875133703742445e-05, 'epoch': 0.43} {'loss': 0.9281, 'learning_rate': 1.787493195357013e-05, 'epoch': 0.43} {'loss': 0.8431, 'learning_rate': 1.7874730194959113e-05, 'epoch': 0.43} {'loss': 0.7328, 'learning_rate': 1.7874528427909613e-05, 'epoch': 0.43} {'loss': 0.9598, 'learning_rate': 1.7874326652421846e-05, 'epoch': 0.43} {'loss': 0.8726, 'learning_rate': 1.7874124868496028e-05, 'epoch': 0.43} {'loss': 0.7837, 'learning_rate': 1.7873923076132373e-05, 'epoch': 0.43} {'loss': 0.7833, 'learning_rate': 1.78737212753311e-05, 'epoch': 0.43} {'loss': 1.0245, 'learning_rate': 1.7873519466092425e-05, 'epoch': 0.43} {'loss': 0.7392, 'learning_rate': 1.787331764841656e-05, 'epoch': 0.43} {'loss': 0.8217, 'learning_rate': 1.7873115822303727e-05, 'epoch': 0.43} {'loss': 0.888, 'learning_rate': 1.7872913987754138e-05, 'epoch': 0.43} {'loss': 0.8099, 'learning_rate': 1.787271214476801e-05, 'epoch': 0.43} {'loss': 0.871, 'learning_rate': 1.7872510293345564e-05, 'epoch': 0.43} {'loss': 1.0472, 'learning_rate': 1.787230843348701e-05, 'epoch': 0.43} {'loss': 0.7902, 'learning_rate': 1.7872106565192567e-05, 'epoch': 0.43} {'loss': 0.8328, 'learning_rate': 1.7871904688462452e-05, 'epoch': 0.43} {'loss': 0.7803, 'learning_rate': 1.787170280329688e-05, 'epoch': 0.43} {'loss': 0.9389, 'learning_rate': 1.7871500909696072e-05, 'epoch': 0.43} {'loss': 0.8892, 'learning_rate': 1.7871299007660237e-05, 'epoch': 0.43} {'loss': 0.8547, 'learning_rate': 1.7871097097189595e-05, 'epoch': 0.43} {'loss': 0.9787, 'learning_rate': 1.7870895178284364e-05, 'epoch': 0.43} {'loss': 0.7958, 'learning_rate': 1.787069325094475e-05, 'epoch': 0.43} {'loss': 0.622, 'learning_rate': 1.7870491315170988e-05, 'epoch': 0.43} {'loss': 0.8599, 'learning_rate': 1.787028937096328e-05, 'epoch': 0.43} {'loss': 0.857, 'learning_rate': 1.787008741832185e-05, 'epoch': 0.43} {'loss': 0.759, 'learning_rate': 1.7869885457246907e-05, 'epoch': 0.43} {'loss': 0.7815, 'learning_rate': 1.786968348773867e-05, 'epoch': 0.43} {'loss': 1.0061, 'learning_rate': 1.786948150979736e-05, 'epoch': 0.43} {'loss': 0.7072, 'learning_rate': 1.786927952342319e-05, 'epoch': 0.43} {'loss': 0.7812, 'learning_rate': 1.7869077528616378e-05, 'epoch': 0.43} {'loss': 0.8441, 'learning_rate': 1.7868875525377135e-05, 'epoch': 0.43} {'loss': 0.8372, 'learning_rate': 1.786867351370569e-05, 'epoch': 0.43} {'loss': 0.875, 'learning_rate': 1.786847149360224e-05, 'epoch': 0.43} {'loss': 0.8269, 'learning_rate': 1.786826946506702e-05, 'epoch': 0.43} {'loss': 0.7427, 'learning_rate': 1.786806742810024e-05, 'epoch': 0.43} {'loss': 0.8151, 'learning_rate': 1.786786538270211e-05, 'epoch': 0.43} {'loss': 0.8468, 'learning_rate': 1.7867663328872855e-05, 'epoch': 0.43} {'loss': 0.8751, 'learning_rate': 1.7867461266612688e-05, 'epoch': 0.43} {'loss': 0.719, 'learning_rate': 1.7867259195921826e-05, 'epoch': 0.43} {'loss': 0.8669, 'learning_rate': 1.786705711680049e-05, 'epoch': 0.43} {'loss': 0.8754, 'learning_rate': 1.7866855029248885e-05, 'epoch': 0.43} {'loss': 0.6815, 'learning_rate': 1.786665293326724e-05, 'epoch': 0.43} {'loss': 0.9058, 'learning_rate': 1.7866450828855765e-05, 'epoch': 0.43} {'loss': 0.7252, 'learning_rate': 1.7866248716014677e-05, 'epoch': 0.43} {'loss': 0.7942, 'learning_rate': 1.7866046594744195e-05, 'epoch': 0.43} {'loss': 0.8945, 'learning_rate': 1.7865844465044532e-05, 'epoch': 0.43} {'loss': 0.9305, 'learning_rate': 1.786564232691591e-05, 'epoch': 0.43} {'loss': 0.874, 'learning_rate': 1.786544018035854e-05, 'epoch': 0.43} {'loss': 0.8467, 'learning_rate': 1.786523802537264e-05, 'epoch': 0.43} {'loss': 1.0155, 'learning_rate': 1.786503586195843e-05, 'epoch': 0.43} {'loss': 0.8625, 'learning_rate': 1.7864833690116122e-05, 'epoch': 0.43} {'loss': 0.8657, 'learning_rate': 1.786463150984594e-05, 'epoch': 0.43} {'loss': 0.8237, 'learning_rate': 1.7864429321148087e-05, 'epoch': 0.43} {'loss': 0.9611, 'learning_rate': 1.7864227124022796e-05, 'epoch': 0.43} {'loss': 0.9853, 'learning_rate': 1.7864024918470272e-05, 'epoch': 0.43} {'loss': 0.9063, 'learning_rate': 1.7863822704490733e-05, 'epoch': 0.43} {'loss': 0.8424, 'learning_rate': 1.78636204820844e-05, 'epoch': 0.43} {'loss': 0.9096, 'learning_rate': 1.7863418251251492e-05, 'epoch': 0.43} {'loss': 0.853, 'learning_rate': 1.7863216011992217e-05, 'epoch': 0.43} {'loss': 0.9303, 'learning_rate': 1.78630137643068e-05, 'epoch': 0.43} {'loss': 0.9346, 'learning_rate': 1.7862811508195453e-05, 'epoch': 0.43} {'loss': 0.6551, 'learning_rate': 1.786260924365839e-05, 'epoch': 0.43} {'loss': 0.7198, 'learning_rate': 1.7862406970695838e-05, 'epoch': 0.43} {'loss': 0.864, 'learning_rate': 1.7862204689308003e-05, 'epoch': 0.43} {'loss': 0.8681, 'learning_rate': 1.7862002399495105e-05, 'epoch': 0.43} {'loss': 0.9475, 'learning_rate': 1.7861800101257363e-05, 'epoch': 0.43} {'loss': 0.7763, 'learning_rate': 1.7861597794594995e-05, 'epoch': 0.43} {'loss': 0.8619, 'learning_rate': 1.7861395479508216e-05, 'epoch': 0.43} {'loss': 0.9325, 'learning_rate': 1.786119315599724e-05, 'epoch': 0.43} {'loss': 0.8832, 'learning_rate': 1.7860990824062284e-05, 'epoch': 0.43} {'loss': 0.8563, 'learning_rate': 1.786078848370357e-05, 'epoch': 0.43} {'loss': 0.8091, 'learning_rate': 1.786058613492131e-05, 'epoch': 0.43} {'loss': 0.8431, 'learning_rate': 1.7860383777715724e-05, 'epoch': 0.43} {'loss': 0.8781, 'learning_rate': 1.7860181412087025e-05, 'epoch': 0.43} {'loss': 0.9312, 'learning_rate': 1.7859979038035433e-05, 'epoch': 0.43} {'loss': 0.8062, 'learning_rate': 1.7859776655561165e-05, 'epoch': 0.43} {'loss': 0.8277, 'learning_rate': 1.785957426466444e-05, 'epoch': 0.43} {'loss': 0.8981, 'learning_rate': 1.785937186534547e-05, 'epoch': 0.43} {'loss': 0.7327, 'learning_rate': 1.785916945760447e-05, 'epoch': 0.43} {'loss': 0.8371, 'learning_rate': 1.7858967041441662e-05, 'epoch': 0.43} {'loss': 0.8225, 'learning_rate': 1.7858764616857264e-05, 'epoch': 0.43} {'loss': 0.8299, 'learning_rate': 1.7858562183851488e-05, 'epoch': 0.43} {'loss': 0.8366, 'learning_rate': 1.7858359742424554e-05, 'epoch': 0.43} {'loss': 0.9678, 'learning_rate': 1.7858157292576676e-05, 'epoch': 0.43} {'loss': 1.0327, 'learning_rate': 1.7857954834308075e-05, 'epoch': 0.43} {'loss': 0.7728, 'learning_rate': 1.7857752367618966e-05, 'epoch': 0.43} {'loss': 0.8045, 'learning_rate': 1.7857549892509567e-05, 'epoch': 0.43} {'loss': 0.9915, 'learning_rate': 1.7857347408980095e-05, 'epoch': 0.43} {'loss': 0.741, 'learning_rate': 1.7857144917030763e-05, 'epoch': 0.43} {'loss': 0.8949, 'learning_rate': 1.7856942416661795e-05, 'epoch': 0.43} {'loss': 0.9312, 'learning_rate': 1.78567399078734e-05, 'epoch': 0.43} {'loss': 1.0734, 'learning_rate': 1.7856537390665804e-05, 'epoch': 0.43} {'loss': 0.791, 'learning_rate': 1.7856334865039214e-05, 'epoch': 0.43} {'loss': 0.8969, 'learning_rate': 1.7856132330993853e-05, 'epoch': 0.43} {'loss': 0.7056, 'learning_rate': 1.7855929788529942e-05, 'epoch': 0.43} {'loss': 0.8496, 'learning_rate': 1.785572723764769e-05, 'epoch': 0.43} {'loss': 1.1084, 'learning_rate': 1.7855524678347316e-05, 'epoch': 0.43} {'loss': 0.8606, 'learning_rate': 1.7855322110629037e-05, 'epoch': 0.43} {'loss': 0.9, 'learning_rate': 1.7855119534493073e-05, 'epoch': 0.43} {'loss': 0.8758, 'learning_rate': 1.7854916949939642e-05, 'epoch': 0.43} {'loss': 0.8328, 'learning_rate': 1.785471435696896e-05, 'epoch': 0.43} {'loss': 0.8601, 'learning_rate': 1.7854511755581236e-05, 'epoch': 0.43} {'loss': 0.8835, 'learning_rate': 1.7854309145776695e-05, 'epoch': 0.43} {'loss': 0.934, 'learning_rate': 1.7854106527555557e-05, 'epoch': 0.43} {'loss': 0.9504, 'learning_rate': 1.7853903900918033e-05, 'epoch': 0.43} {'loss': 0.7727, 'learning_rate': 1.7853701265864344e-05, 'epoch': 0.43} {'loss': 0.7988, 'learning_rate': 1.78534986223947e-05, 'epoch': 0.43} {'loss': 0.7182, 'learning_rate': 1.7853295970509328e-05, 'epoch': 0.43} {'loss': 1.0598, 'learning_rate': 1.7853093310208437e-05, 'epoch': 0.43} {'loss': 0.8077, 'learning_rate': 1.785289064149225e-05, 'epoch': 0.43} {'loss': 0.8685, 'learning_rate': 1.7852687964360984e-05, 'epoch': 0.43} {'loss': 0.7581, 'learning_rate': 1.785248527881485e-05, 'epoch': 0.43} {'loss': 0.8602, 'learning_rate': 1.785228258485407e-05, 'epoch': 0.43} {'loss': 0.808, 'learning_rate': 1.7852079882478864e-05, 'epoch': 0.43} {'loss': 0.9824, 'learning_rate': 1.7851877171689443e-05, 'epoch': 0.43} {'loss': 0.8432, 'learning_rate': 1.7851674452486026e-05, 'epoch': 0.43} {'loss': 0.8184, 'learning_rate': 1.7851471724868835e-05, 'epoch': 0.43} {'loss': 0.8818, 'learning_rate': 1.785126898883808e-05, 'epoch': 0.43} {'loss': 0.8969, 'learning_rate': 1.7851066244393982e-05, 'epoch': 0.43} {'loss': 0.8974, 'learning_rate': 1.7850863491536757e-05, 'epoch': 0.43} {'loss': 0.9529, 'learning_rate': 1.7850660730266625e-05, 'epoch': 0.43} {'loss': 0.9501, 'learning_rate': 1.7850457960583803e-05, 'epoch': 0.43} {'loss': 0.8925, 'learning_rate': 1.7850255182488503e-05, 'epoch': 0.43} {'loss': 0.8675, 'learning_rate': 1.785005239598095e-05, 'epoch': 0.43} {'loss': 0.9074, 'learning_rate': 1.7849849601061353e-05, 'epoch': 0.43} {'loss': 0.8313, 'learning_rate': 1.7849646797729936e-05, 'epoch': 0.43} {'loss': 0.7677, 'learning_rate': 1.7849443985986913e-05, 'epoch': 0.43} {'loss': 0.8279, 'learning_rate': 1.7849241165832504e-05, 'epoch': 0.43} {'loss': 0.726, 'learning_rate': 1.7849038337266926e-05, 'epoch': 0.43} {'loss': 0.864, 'learning_rate': 1.784883550029039e-05, 'epoch': 0.43} {'loss': 0.9186, 'learning_rate': 1.784863265490312e-05, 'epoch': 0.43} {'loss': 0.9416, 'learning_rate': 1.7848429801105336e-05, 'epoch': 0.43} {'loss': 0.7798, 'learning_rate': 1.7848226938897246e-05, 'epoch': 0.43} {'loss': 0.8952, 'learning_rate': 1.7848024068279077e-05, 'epoch': 0.43} {'loss': 0.9989, 'learning_rate': 1.784782118925104e-05, 'epoch': 0.43} {'loss': 0.9526, 'learning_rate': 1.784761830181335e-05, 'epoch': 0.43} {'loss': 0.9254, 'learning_rate': 1.7847415405966234e-05, 'epoch': 0.43} {'loss': 0.8341, 'learning_rate': 1.7847212501709904e-05, 'epoch': 0.43} {'loss': 1.0418, 'learning_rate': 1.7847009589044575e-05, 'epoch': 0.43} {'loss': 1.0338, 'learning_rate': 1.784680666797047e-05, 'epoch': 0.43} {'loss': 1.0502, 'learning_rate': 1.7846603738487797e-05, 'epoch': 0.43} {'loss': 0.8858, 'learning_rate': 1.7846400800596788e-05, 'epoch': 0.43} {'loss': 1.0955, 'learning_rate': 1.7846197854297648e-05, 'epoch': 0.43} {'loss': 0.9813, 'learning_rate': 1.7845994899590598e-05, 'epoch': 0.43} {'loss': 1.072, 'learning_rate': 1.784579193647586e-05, 'epoch': 0.43} {'loss': 0.8899, 'learning_rate': 1.7845588964953643e-05, 'epoch': 0.43} {'loss': 0.916, 'learning_rate': 1.7845385985024175e-05, 'epoch': 0.43} {'loss': 0.8356, 'learning_rate': 1.784518299668766e-05, 'epoch': 0.43} {'loss': 0.7814, 'learning_rate': 1.784497999994433e-05, 'epoch': 0.43} {'loss': 0.9949, 'learning_rate': 1.7844776994794396e-05, 'epoch': 0.43} {'loss': 0.8168, 'learning_rate': 1.7844573981238075e-05, 'epoch': 0.43} {'loss': 0.719, 'learning_rate': 1.784437095927558e-05, 'epoch': 0.43} {'loss': 0.7854, 'learning_rate': 1.784416792890714e-05, 'epoch': 0.43} {'loss': 0.7967, 'learning_rate': 1.784396489013296e-05, 'epoch': 0.43} {'loss': 1.0243, 'learning_rate': 1.7843761842953267e-05, 'epoch': 0.43} {'loss': 0.7296, 'learning_rate': 1.7843558787368277e-05, 'epoch': 0.43} {'loss': 0.8338, 'learning_rate': 1.7843355723378205e-05, 'epoch': 0.43} {'loss': 0.8305, 'learning_rate': 1.7843152650983266e-05, 'epoch': 0.43} {'loss': 0.8237, 'learning_rate': 1.7842949570183683e-05, 'epoch': 0.43} {'loss': 0.7261, 'learning_rate': 1.7842746480979674e-05, 'epoch': 0.43} {'loss': 0.7376, 'learning_rate': 1.784254338337145e-05, 'epoch': 0.43} {'loss': 0.9239, 'learning_rate': 1.7842340277359237e-05, 'epoch': 0.43} {'loss': 0.8942, 'learning_rate': 1.7842137162943248e-05, 'epoch': 0.43} {'loss': 0.9574, 'learning_rate': 1.7841934040123696e-05, 'epoch': 0.43} {'loss': 1.0305, 'learning_rate': 1.784173090890081e-05, 'epoch': 0.43} {'loss': 0.9008, 'learning_rate': 1.78415277692748e-05, 'epoch': 0.43} {'loss': 0.757, 'learning_rate': 1.7841324621245884e-05, 'epoch': 0.43} {'loss': 0.9399, 'learning_rate': 1.784112146481428e-05, 'epoch': 0.43} {'loss': 0.8967, 'learning_rate': 1.7840918299980208e-05, 'epoch': 0.43} {'loss': 0.8663, 'learning_rate': 1.7840715126743886e-05, 'epoch': 0.43} {'loss': 0.8899, 'learning_rate': 1.784051194510553e-05, 'epoch': 0.43} {'loss': 0.8373, 'learning_rate': 1.7840308755065353e-05, 'epoch': 0.43} {'loss': 1.024, 'learning_rate': 1.7840105556623584e-05, 'epoch': 0.43} {'loss': 0.8412, 'learning_rate': 1.783990234978043e-05, 'epoch': 0.43} {'loss': 0.7205, 'learning_rate': 1.7839699134536115e-05, 'epoch': 0.43} {'loss': 0.9008, 'learning_rate': 1.7839495910890853e-05, 'epoch': 0.43} {'loss': 0.7748, 'learning_rate': 1.7839292678844867e-05, 'epoch': 0.43} {'loss': 0.8465, 'learning_rate': 1.7839089438398368e-05, 'epoch': 0.43} {'loss': 0.7965, 'learning_rate': 1.7838886189551575e-05, 'epoch': 0.43} {'loss': 0.6943, 'learning_rate': 1.7838682932304716e-05, 'epoch': 0.43} {'loss': 0.8151, 'learning_rate': 1.7838479666657994e-05, 'epoch': 0.43} {'loss': 0.8657, 'learning_rate': 1.7838276392611636e-05, 'epoch': 0.43} {'loss': 0.9323, 'learning_rate': 1.7838073110165858e-05, 'epoch': 0.43} {'loss': 0.7274, 'learning_rate': 1.7837869819320875e-05, 'epoch': 0.43} {'loss': 0.7483, 'learning_rate': 1.7837666520076906e-05, 'epoch': 0.43} {'loss': 0.8889, 'learning_rate': 1.7837463212434175e-05, 'epoch': 0.43} {'loss': 0.919, 'learning_rate': 1.783725989639289e-05, 'epoch': 0.43} {'loss': 0.91, 'learning_rate': 1.7837056571953274e-05, 'epoch': 0.43} {'loss': 0.8644, 'learning_rate': 1.7836853239115548e-05, 'epoch': 0.43} {'loss': 0.7625, 'learning_rate': 1.7836649897879924e-05, 'epoch': 0.43} {'loss': 0.9472, 'learning_rate': 1.7836446548246625e-05, 'epoch': 0.43} {'loss': 0.9422, 'learning_rate': 1.7836243190215863e-05, 'epoch': 0.43} {'loss': 0.8918, 'learning_rate': 1.783603982378786e-05, 'epoch': 0.43} {'loss': 0.9331, 'learning_rate': 1.7835836448962832e-05, 'epoch': 0.43} {'loss': 0.8487, 'learning_rate': 1.7835633065741e-05, 'epoch': 0.43} {'loss': 0.7665, 'learning_rate': 1.783542967412258e-05, 'epoch': 0.43} {'loss': 0.8679, 'learning_rate': 1.783522627410779e-05, 'epoch': 0.43} {'loss': 0.9252, 'learning_rate': 1.783502286569685e-05, 'epoch': 0.43} {'loss': 0.9002, 'learning_rate': 1.7834819448889972e-05, 'epoch': 0.43} {'loss': 0.7475, 'learning_rate': 1.7834616023687375e-05, 'epoch': 0.43} {'loss': 0.9327, 'learning_rate': 1.7834412590089287e-05, 'epoch': 0.43} {'loss': 0.8774, 'learning_rate': 1.7834209148095912e-05, 'epoch': 0.43} {'loss': 0.9173, 'learning_rate': 1.783400569770748e-05, 'epoch': 0.43} {'loss': 0.9227, 'learning_rate': 1.7833802238924204e-05, 'epoch': 0.43} {'loss': 0.8784, 'learning_rate': 1.78335987717463e-05, 'epoch': 0.43} {'loss': 0.7568, 'learning_rate': 1.7833395296173988e-05, 'epoch': 0.43} {'loss': 0.7943, 'learning_rate': 1.7833191812207485e-05, 'epoch': 0.43} {'loss': 0.8998, 'learning_rate': 1.783298831984701e-05, 'epoch': 0.43} {'loss': 0.9039, 'learning_rate': 1.7832784819092782e-05, 'epoch': 0.43} {'loss': 0.8389, 'learning_rate': 1.7832581309945016e-05, 'epoch': 0.43} {'loss': 0.857, 'learning_rate': 1.7832377792403933e-05, 'epoch': 0.43} {'loss': 0.9231, 'learning_rate': 1.7832174266469752e-05, 'epoch': 0.43} {'loss': 0.7038, 'learning_rate': 1.783197073214269e-05, 'epoch': 0.43} {'loss': 0.8194, 'learning_rate': 1.7831767189422965e-05, 'epoch': 0.43} {'loss': 0.944, 'learning_rate': 1.783156363831079e-05, 'epoch': 0.43} {'loss': 0.9735, 'learning_rate': 1.783136007880639e-05, 'epoch': 0.43} {'loss': 0.9073, 'learning_rate': 1.7831156510909985e-05, 'epoch': 0.43} {'loss': 0.9144, 'learning_rate': 1.7830952934621783e-05, 'epoch': 0.43} {'loss': 1.0081, 'learning_rate': 1.7830749349942012e-05, 'epoch': 0.43} {'loss': 1.0103, 'learning_rate': 1.7830545756870882e-05, 'epoch': 0.43} {'loss': 0.8122, 'learning_rate': 1.783034215540862e-05, 'epoch': 0.43} {'loss': 0.8323, 'learning_rate': 1.7830138545555437e-05, 'epoch': 0.43} {'loss': 0.7612, 'learning_rate': 1.7829934927311555e-05, 'epoch': 0.43} {'loss': 0.776, 'learning_rate': 1.7829731300677192e-05, 'epoch': 0.43} {'loss': 0.8738, 'learning_rate': 1.7829527665652564e-05, 'epoch': 0.43} {'loss': 0.8168, 'learning_rate': 1.782932402223789e-05, 'epoch': 0.43} {'loss': 0.846, 'learning_rate': 1.782912037043339e-05, 'epoch': 0.43} {'loss': 0.7468, 'learning_rate': 1.782891671023928e-05, 'epoch': 0.43} {'loss': 1.008, 'learning_rate': 1.782871304165578e-05, 'epoch': 0.43} {'loss': 0.7112, 'learning_rate': 1.7828509364683105e-05, 'epoch': 0.43} {'loss': 0.6609, 'learning_rate': 1.7828305679321478e-05, 'epoch': 0.43} {'loss': 0.9128, 'learning_rate': 1.7828101985571114e-05, 'epoch': 0.43} {'loss': 0.8443, 'learning_rate': 1.7827898283432234e-05, 'epoch': 0.43} {'loss': 0.8814, 'learning_rate': 1.782769457290505e-05, 'epoch': 0.43} {'loss': 0.8588, 'learning_rate': 1.782749085398979e-05, 'epoch': 0.43} {'loss': 0.9724, 'learning_rate': 1.7827287126686665e-05, 'epoch': 0.43} {'loss': 1.0369, 'learning_rate': 1.7827083390995895e-05, 'epoch': 0.43} {'loss': 0.9131, 'learning_rate': 1.78268796469177e-05, 'epoch': 0.43} {'loss': 0.8768, 'learning_rate': 1.7826675894452293e-05, 'epoch': 0.43} {'loss': 1.009, 'learning_rate': 1.78264721335999e-05, 'epoch': 0.43} {'loss': 0.8575, 'learning_rate': 1.7826268364360734e-05, 'epoch': 0.43} {'loss': 0.8224, 'learning_rate': 1.7826064586735017e-05, 'epoch': 0.43} {'loss': 0.8607, 'learning_rate': 1.782586080072296e-05, 'epoch': 0.43} {'loss': 1.1812, 'learning_rate': 1.7825657006324795e-05, 'epoch': 0.43} {'loss': 0.8323, 'learning_rate': 1.782545320354073e-05, 'epoch': 0.43} {'loss': 0.9122, 'learning_rate': 1.7825249392370985e-05, 'epoch': 0.43} {'loss': 0.823, 'learning_rate': 1.7825045572815774e-05, 'epoch': 0.43} {'loss': 0.7167, 'learning_rate': 1.7824841744875327e-05, 'epoch': 0.43} {'loss': 0.7735, 'learning_rate': 1.782463790854985e-05, 'epoch': 0.43} {'loss': 0.8239, 'learning_rate': 1.7824434063839574e-05, 'epoch': 0.43} {'loss': 0.8271, 'learning_rate': 1.7824230210744708e-05, 'epoch': 0.43} {'loss': 0.8774, 'learning_rate': 1.782402634926547e-05, 'epoch': 0.43} {'loss': 0.7316, 'learning_rate': 1.7823822479402085e-05, 'epoch': 0.43} {'loss': 0.9498, 'learning_rate': 1.7823618601154766e-05, 'epoch': 0.43} {'loss': 0.897, 'learning_rate': 1.7823414714523734e-05, 'epoch': 0.43} {'loss': 0.8661, 'learning_rate': 1.7823210819509208e-05, 'epoch': 0.43} {'loss': 0.8283, 'learning_rate': 1.7823006916111406e-05, 'epoch': 0.43} {'loss': 0.9119, 'learning_rate': 1.7822803004330547e-05, 'epoch': 0.43} {'loss': 0.754, 'learning_rate': 1.7822599084166843e-05, 'epoch': 0.43} {'loss': 0.9615, 'learning_rate': 1.7822395155620525e-05, 'epoch': 0.43} {'loss': 0.8529, 'learning_rate': 1.7822191218691803e-05, 'epoch': 0.43} {'loss': 0.7064, 'learning_rate': 1.7821987273380894e-05, 'epoch': 0.43} {'loss': 0.9057, 'learning_rate': 1.7821783319688018e-05, 'epoch': 0.43} {'loss': 0.9267, 'learning_rate': 1.7821579357613402e-05, 'epoch': 0.43} {'loss': 0.7281, 'learning_rate': 1.7821375387157252e-05, 'epoch': 0.43} {'loss': 0.9557, 'learning_rate': 1.7821171408319797e-05, 'epoch': 0.43} {'loss': 0.8646, 'learning_rate': 1.7820967421101248e-05, 'epoch': 0.43} {'loss': 0.82, 'learning_rate': 1.7820763425501827e-05, 'epoch': 0.43} {'loss': 0.7823, 'learning_rate': 1.7820559421521753e-05, 'epoch': 0.43} {'loss': 0.9214, 'learning_rate': 1.782035540916124e-05, 'epoch': 0.43} {'loss': 0.9109, 'learning_rate': 1.7820151388420516e-05, 'epoch': 0.43} {'loss': 0.852, 'learning_rate': 1.781994735929979e-05, 'epoch': 0.43} {'loss': 0.9097, 'learning_rate': 1.7819743321799285e-05, 'epoch': 0.43} {'loss': 0.7979, 'learning_rate': 1.7819539275919222e-05, 'epoch': 0.43} {'loss': 1.1037, 'learning_rate': 1.781933522165981e-05, 'epoch': 0.43} {'loss': 0.8894, 'learning_rate': 1.7819131159021283e-05, 'epoch': 0.43} {'loss': 0.7851, 'learning_rate': 1.7818927088003847e-05, 'epoch': 0.43} {'loss': 0.8537, 'learning_rate': 1.7818723008607727e-05, 'epoch': 0.43} {'loss': 0.8086, 'learning_rate': 1.7818518920833137e-05, 'epoch': 0.43} {'loss': 0.8508, 'learning_rate': 1.78183148246803e-05, 'epoch': 0.43} {'loss': 0.8272, 'learning_rate': 1.7818110720149433e-05, 'epoch': 0.43} {'loss': 0.8505, 'learning_rate': 1.7817906607240753e-05, 'epoch': 0.43} {'loss': 0.7487, 'learning_rate': 1.7817702485954483e-05, 'epoch': 0.43} {'loss': 0.8176, 'learning_rate': 1.7817498356290838e-05, 'epoch': 0.43} {'loss': 0.9669, 'learning_rate': 1.781729421825004e-05, 'epoch': 0.43} {'loss': 0.9642, 'learning_rate': 1.78170900718323e-05, 'epoch': 0.43} {'loss': 0.7189, 'learning_rate': 1.7816885917037846e-05, 'epoch': 0.43} {'loss': 0.8681, 'learning_rate': 1.7816681753866895e-05, 'epoch': 0.43} {'loss': 1.1268, 'learning_rate': 1.7816477582319662e-05, 'epoch': 0.43} {'loss': 1.0175, 'learning_rate': 1.7816273402396368e-05, 'epoch': 0.43} {'loss': 0.8082, 'learning_rate': 1.7816069214097233e-05, 'epoch': 0.43} {'loss': 0.7756, 'learning_rate': 1.7815865017422473e-05, 'epoch': 0.43} {'loss': 0.7753, 'learning_rate': 1.7815660812372305e-05, 'epoch': 0.43} {'loss': 0.9324, 'learning_rate': 1.7815456598946953e-05, 'epoch': 0.43} {'loss': 1.0015, 'learning_rate': 1.7815252377146638e-05, 'epoch': 0.43} {'loss': 1.009, 'learning_rate': 1.7815048146971573e-05, 'epoch': 0.43} {'loss': 0.809, 'learning_rate': 1.7814843908421977e-05, 'epoch': 0.43} {'loss': 0.7504, 'learning_rate': 1.781463966149807e-05, 'epoch': 0.43} {'loss': 0.9988, 'learning_rate': 1.7814435406200073e-05, 'epoch': 0.43} {'loss': 0.7643, 'learning_rate': 1.78142311425282e-05, 'epoch': 0.43} {'loss': 1.0912, 'learning_rate': 1.7814026870482675e-05, 'epoch': 0.43} {'loss': 0.7919, 'learning_rate': 1.781382259006372e-05, 'epoch': 0.43} {'loss': 0.7779, 'learning_rate': 1.781361830127154e-05, 'epoch': 0.43} {'loss': 0.857, 'learning_rate': 1.7813414004106368e-05, 'epoch': 0.43} {'loss': 0.8797, 'learning_rate': 1.7813209698568416e-05, 'epoch': 0.43} {'loss': 0.8887, 'learning_rate': 1.7813005384657906e-05, 'epoch': 0.43} {'loss': 0.887, 'learning_rate': 1.7812801062375055e-05, 'epoch': 0.43} {'loss': 0.931, 'learning_rate': 1.7812596731720083e-05, 'epoch': 0.43} {'loss': 1.0765, 'learning_rate': 1.7812392392693206e-05, 'epoch': 0.43} {'loss': 0.859, 'learning_rate': 1.781218804529465e-05, 'epoch': 0.43} {'loss': 1.035, 'learning_rate': 1.7811983689524625e-05, 'epoch': 0.43} {'loss': 0.9031, 'learning_rate': 1.7811779325383357e-05, 'epoch': 0.43} {'loss': 0.8656, 'learning_rate': 1.781157495287106e-05, 'epoch': 0.43} {'loss': 0.8053, 'learning_rate': 1.7811370571987958e-05, 'epoch': 0.43} {'loss': 0.906, 'learning_rate': 1.7811166182734267e-05, 'epoch': 0.43} {'loss': 0.8416, 'learning_rate': 1.7810961785110207e-05, 'epoch': 0.43} {'loss': 0.9835, 'learning_rate': 1.781075737911599e-05, 'epoch': 0.43} {'loss': 0.7997, 'learning_rate': 1.781055296475185e-05, 'epoch': 0.43} {'loss': 0.8961, 'learning_rate': 1.781034854201799e-05, 'epoch': 0.43} {'loss': 0.9242, 'learning_rate': 1.7810144110914646e-05, 'epoch': 0.43} {'loss': 0.8516, 'learning_rate': 1.780993967144202e-05, 'epoch': 0.43} {'loss': 0.9968, 'learning_rate': 1.7809735223600343e-05, 'epoch': 0.43} {'loss': 0.8189, 'learning_rate': 1.7809530767389826e-05, 'epoch': 0.43} {'loss': 0.8343, 'learning_rate': 1.7809326302810694e-05, 'epoch': 0.43} {'loss': 0.8988, 'learning_rate': 1.7809121829863162e-05, 'epoch': 0.43} {'loss': 0.7968, 'learning_rate': 1.7808917348547456e-05, 'epoch': 0.43} {'loss': 0.8574, 'learning_rate': 1.7808712858863786e-05, 'epoch': 0.43} {'loss': 0.669, 'learning_rate': 1.780850836081238e-05, 'epoch': 0.43} {'loss': 0.8945, 'learning_rate': 1.780830385439345e-05, 'epoch': 0.43} {'loss': 0.7515, 'learning_rate': 1.7808099339607215e-05, 'epoch': 0.43} {'loss': 0.8241, 'learning_rate': 1.78078948164539e-05, 'epoch': 0.43} {'loss': 0.8763, 'learning_rate': 1.7807690284933716e-05, 'epoch': 0.43} {'loss': 0.9192, 'learning_rate': 1.780748574504689e-05, 'epoch': 0.43} {'loss': 0.8378, 'learning_rate': 1.780728119679364e-05, 'epoch': 0.43} {'loss': 0.9096, 'learning_rate': 1.7807076640174185e-05, 'epoch': 0.43} {'loss': 0.8102, 'learning_rate': 1.780687207518874e-05, 'epoch': 0.43} {'loss': 0.7727, 'learning_rate': 1.7806667501837527e-05, 'epoch': 0.43} {'loss': 1.0871, 'learning_rate': 1.780646292012077e-05, 'epoch': 0.43} {'loss': 0.8225, 'learning_rate': 1.7806258330038678e-05, 'epoch': 0.43} {'loss': 0.9016, 'learning_rate': 1.7806053731591478e-05, 'epoch': 0.43} {'loss': 0.7731, 'learning_rate': 1.7805849124779384e-05, 'epoch': 0.43} {'loss': 0.7147, 'learning_rate': 1.780564450960262e-05, 'epoch': 0.43} {'loss': 1.0127, 'learning_rate': 1.7805439886061404e-05, 'epoch': 0.43} {'loss': 0.9459, 'learning_rate': 1.7805235254155952e-05, 'epoch': 0.43} {'loss': 0.9167, 'learning_rate': 1.780503061388649e-05, 'epoch': 0.43} {'loss': 0.9198, 'learning_rate': 1.780482596525323e-05, 'epoch': 0.43} {'loss': 0.8413, 'learning_rate': 1.7804621308256397e-05, 'epoch': 0.43} {'loss': 0.8685, 'learning_rate': 1.7804416642896207e-05, 'epoch': 0.43} {'loss': 0.7973, 'learning_rate': 1.7804211969172877e-05, 'epoch': 0.43} {'loss': 0.8693, 'learning_rate': 1.7804007287086632e-05, 'epoch': 0.43} {'loss': 0.7593, 'learning_rate': 1.7803802596637688e-05, 'epoch': 0.43} {'loss': 0.953, 'learning_rate': 1.780359789782627e-05, 'epoch': 0.43} {'loss': 0.87, 'learning_rate': 1.780339319065259e-05, 'epoch': 0.43} {'loss': 0.7515, 'learning_rate': 1.7803188475116867e-05, 'epoch': 0.44} {'loss': 0.7962, 'learning_rate': 1.7802983751219324e-05, 'epoch': 0.44} {'loss': 0.9449, 'learning_rate': 1.780277901896018e-05, 'epoch': 0.44} {'loss': 1.0179, 'learning_rate': 1.7802574278339655e-05, 'epoch': 0.44} {'loss': 0.914, 'learning_rate': 1.7802369529357966e-05, 'epoch': 0.44} {'loss': 0.9709, 'learning_rate': 1.7802164772015337e-05, 'epoch': 0.44} {'loss': 0.8345, 'learning_rate': 1.780196000631198e-05, 'epoch': 0.44} {'loss': 0.8814, 'learning_rate': 1.7801755232248123e-05, 'epoch': 0.44} {'loss': 1.0101, 'learning_rate': 1.7801550449823978e-05, 'epoch': 0.44} {'loss': 0.848, 'learning_rate': 1.780134565903977e-05, 'epoch': 0.44} {'loss': 0.9937, 'learning_rate': 1.7801140859895713e-05, 'epoch': 0.44} {'loss': 0.858, 'learning_rate': 1.7800936052392033e-05, 'epoch': 0.44} {'loss': 0.8037, 'learning_rate': 1.780073123652894e-05, 'epoch': 0.44} {'loss': 0.7652, 'learning_rate': 1.7800526412306665e-05, 'epoch': 0.44} {'loss': 0.7697, 'learning_rate': 1.7800321579725423e-05, 'epoch': 0.44} {'loss': 1.0749, 'learning_rate': 1.780011673878543e-05, 'epoch': 0.44} {'loss': 0.6657, 'learning_rate': 1.7799911889486905e-05, 'epoch': 0.44} {'loss': 0.7935, 'learning_rate': 1.7799707031830073e-05, 'epoch': 0.44} {'loss': 0.9372, 'learning_rate': 1.779950216581515e-05, 'epoch': 0.44} {'loss': 0.9399, 'learning_rate': 1.779929729144236e-05, 'epoch': 0.44} {'loss': 0.9118, 'learning_rate': 1.7799092408711915e-05, 'epoch': 0.44} {'loss': 0.821, 'learning_rate': 1.779888751762404e-05, 'epoch': 0.44} {'loss': 0.8952, 'learning_rate': 1.7798682618178953e-05, 'epoch': 0.44} {'loss': 0.9581, 'learning_rate': 1.7798477710376873e-05, 'epoch': 0.44} {'loss': 0.9212, 'learning_rate': 1.7798272794218023e-05, 'epoch': 0.44} {'loss': 0.7282, 'learning_rate': 1.7798067869702616e-05, 'epoch': 0.44} {'loss': 0.7853, 'learning_rate': 1.7797862936830878e-05, 'epoch': 0.44} {'loss': 0.9022, 'learning_rate': 1.7797657995603027e-05, 'epoch': 0.44} {'loss': 0.8831, 'learning_rate': 1.7797453046019278e-05, 'epoch': 0.44} {'loss': 0.8449, 'learning_rate': 1.779724808807986e-05, 'epoch': 0.44} {'loss': 0.9497, 'learning_rate': 1.779704312178498e-05, 'epoch': 0.44} {'loss': 0.8451, 'learning_rate': 1.779683814713487e-05, 'epoch': 0.44} {'loss': 0.7147, 'learning_rate': 1.7796633164129742e-05, 'epoch': 0.44} {'loss': 0.9672, 'learning_rate': 1.7796428172769816e-05, 'epoch': 0.44} {'loss': 1.0259, 'learning_rate': 1.779622317305532e-05, 'epoch': 0.44} {'loss': 0.9442, 'learning_rate': 1.7796018164986463e-05, 'epoch': 0.44} {'loss': 0.92, 'learning_rate': 1.779581314856347e-05, 'epoch': 0.44} {'loss': 0.9892, 'learning_rate': 1.7795608123786555e-05, 'epoch': 0.44} {'loss': 0.7436, 'learning_rate': 1.7795403090655945e-05, 'epoch': 0.44} {'loss': 0.8487, 'learning_rate': 1.779519804917186e-05, 'epoch': 0.44} {'loss': 0.9524, 'learning_rate': 1.7794992999334512e-05, 'epoch': 0.44} {'loss': 0.9745, 'learning_rate': 1.7794787941144127e-05, 'epoch': 0.44} {'loss': 0.9106, 'learning_rate': 1.7794582874600927e-05, 'epoch': 0.44} {'loss': 0.8224, 'learning_rate': 1.7794377799705124e-05, 'epoch': 0.44} {'loss': 0.8387, 'learning_rate': 1.779417271645694e-05, 'epoch': 0.44} {'loss': 0.7689, 'learning_rate': 1.7793967624856604e-05, 'epoch': 0.44} {'loss': 0.838, 'learning_rate': 1.779376252490432e-05, 'epoch': 0.44} {'loss': 0.8228, 'learning_rate': 1.779355741660032e-05, 'epoch': 0.44} {'loss': 0.9833, 'learning_rate': 1.779335229994482e-05, 'epoch': 0.44} {'loss': 0.7292, 'learning_rate': 1.779314717493804e-05, 'epoch': 0.44} {'loss': 0.9995, 'learning_rate': 1.7792942041580195e-05, 'epoch': 0.44} {'loss': 0.8953, 'learning_rate': 1.7792736899871515e-05, 'epoch': 0.44} {'loss': 0.8994, 'learning_rate': 1.779253174981221e-05, 'epoch': 0.44} {'loss': 0.8957, 'learning_rate': 1.7792326591402507e-05, 'epoch': 0.44} {'loss': 0.8746, 'learning_rate': 1.779212142464262e-05, 'epoch': 0.44} {'loss': 1.0176, 'learning_rate': 1.7791916249532774e-05, 'epoch': 0.44} {'loss': 0.7695, 'learning_rate': 1.7791711066073186e-05, 'epoch': 0.44} {'loss': 0.7269, 'learning_rate': 1.7791505874264075e-05, 'epoch': 0.44} {'loss': 0.9777, 'learning_rate': 1.7791300674105662e-05, 'epoch': 0.44} {'loss': 0.8821, 'learning_rate': 1.779109546559817e-05, 'epoch': 0.44} {'loss': 0.9386, 'learning_rate': 1.779089024874181e-05, 'epoch': 0.44} {'loss': 0.989, 'learning_rate': 1.7790685023536814e-05, 'epoch': 0.44} {'loss': 0.8505, 'learning_rate': 1.7790479789983396e-05, 'epoch': 0.44} {'loss': 1.0602, 'learning_rate': 1.7790274548081773e-05, 'epoch': 0.44} {'loss': 0.9279, 'learning_rate': 1.7790069297832166e-05, 'epoch': 0.44} {'loss': 0.7244, 'learning_rate': 1.7789864039234802e-05, 'epoch': 0.44} {'loss': 0.9642, 'learning_rate': 1.778965877228989e-05, 'epoch': 0.44} {'loss': 0.7752, 'learning_rate': 1.778945349699766e-05, 'epoch': 0.44} {'loss': 0.7893, 'learning_rate': 1.7789248213358326e-05, 'epoch': 0.44} {'loss': 0.7179, 'learning_rate': 1.778904292137211e-05, 'epoch': 0.44} {'loss': 0.7954, 'learning_rate': 1.7788837621039227e-05, 'epoch': 0.44} {'loss': 0.9965, 'learning_rate': 1.7788632312359908e-05, 'epoch': 0.44} {'loss': 0.8632, 'learning_rate': 1.7788426995334364e-05, 'epoch': 0.44} {'loss': 1.0319, 'learning_rate': 1.7788221669962818e-05, 'epoch': 0.44} {'loss': 0.8622, 'learning_rate': 1.7788016336245487e-05, 'epoch': 0.44} {'loss': 0.8848, 'learning_rate': 1.7787810994182594e-05, 'epoch': 0.44} {'loss': 0.876, 'learning_rate': 1.778760564377436e-05, 'epoch': 0.44} {'loss': 0.9283, 'learning_rate': 1.7787400285021005e-05, 'epoch': 0.44} {'loss': 1.0105, 'learning_rate': 1.778719491792275e-05, 'epoch': 0.44} {'loss': 0.8753, 'learning_rate': 1.7786989542479806e-05, 'epoch': 0.44} {'loss': 0.8557, 'learning_rate': 1.7786784158692402e-05, 'epoch': 0.44} {'loss': 0.7504, 'learning_rate': 1.7786578766560758e-05, 'epoch': 0.44} {'loss': 0.7695, 'learning_rate': 1.778637336608509e-05, 'epoch': 0.44} {'loss': 0.8647, 'learning_rate': 1.7786167957265624e-05, 'epoch': 0.44} {'loss': 0.8156, 'learning_rate': 1.778596254010257e-05, 'epoch': 0.44} {'loss': 0.7458, 'learning_rate': 1.778575711459616e-05, 'epoch': 0.44} {'loss': 0.7754, 'learning_rate': 1.7785551680746608e-05, 'epoch': 0.44} {'loss': 0.8421, 'learning_rate': 1.7785346238554134e-05, 'epoch': 0.44} {'loss': 0.9184, 'learning_rate': 1.778514078801896e-05, 'epoch': 0.44} {'loss': 0.8968, 'learning_rate': 1.7784935329141298e-05, 'epoch': 0.44} {'loss': 1.0817, 'learning_rate': 1.7784729861921383e-05, 'epoch': 0.44} {'loss': 0.9411, 'learning_rate': 1.7784524386359423e-05, 'epoch': 0.44} {'loss': 0.8724, 'learning_rate': 1.7784318902455646e-05, 'epoch': 0.44} {'loss': 1.0195, 'learning_rate': 1.7784113410210264e-05, 'epoch': 0.44} {'loss': 0.7948, 'learning_rate': 1.7783907909623505e-05, 'epoch': 0.44} {'loss': 0.8078, 'learning_rate': 1.7783702400695586e-05, 'epoch': 0.44} {'loss': 0.8537, 'learning_rate': 1.7783496883426727e-05, 'epoch': 0.44} {'loss': 0.7903, 'learning_rate': 1.778329135781715e-05, 'epoch': 0.44} {'loss': 0.7375, 'learning_rate': 1.7783085823867072e-05, 'epoch': 0.44} {'loss': 0.9078, 'learning_rate': 1.7782880281576717e-05, 'epoch': 0.44} {'loss': 0.968, 'learning_rate': 1.77826747309463e-05, 'epoch': 0.44} {'loss': 0.7692, 'learning_rate': 1.778246917197605e-05, 'epoch': 0.44} {'loss': 0.928, 'learning_rate': 1.778226360466618e-05, 'epoch': 0.44} {'loss': 0.8977, 'learning_rate': 1.7782058029016908e-05, 'epoch': 0.44} {'loss': 0.9831, 'learning_rate': 1.778185244502846e-05, 'epoch': 0.44} {'loss': 0.8006, 'learning_rate': 1.7781646852701056e-05, 'epoch': 0.44} {'loss': 0.7657, 'learning_rate': 1.7781441252034915e-05, 'epoch': 0.44} {'loss': 1.0223, 'learning_rate': 1.7781235643030257e-05, 'epoch': 0.44} {'loss': 0.9065, 'learning_rate': 1.7781030025687304e-05, 'epoch': 0.44} {'loss': 0.7081, 'learning_rate': 1.7780824400006274e-05, 'epoch': 0.44} {'loss': 0.8697, 'learning_rate': 1.7780618765987388e-05, 'epoch': 0.44} {'loss': 0.9023, 'learning_rate': 1.7780413123630868e-05, 'epoch': 0.44} {'loss': 0.7715, 'learning_rate': 1.778020747293693e-05, 'epoch': 0.44} {'loss': 0.8419, 'learning_rate': 1.77800018139058e-05, 'epoch': 0.44} {'loss': 0.8612, 'learning_rate': 1.7779796146537697e-05, 'epoch': 0.44} {'loss': 0.9121, 'learning_rate': 1.777959047083284e-05, 'epoch': 0.44} {'loss': 0.8807, 'learning_rate': 1.7779384786791446e-05, 'epoch': 0.44} {'loss': 0.8257, 'learning_rate': 1.7779179094413745e-05, 'epoch': 0.44} {'loss': 0.9777, 'learning_rate': 1.7778973393699948e-05, 'epoch': 0.44} {'loss': 0.7347, 'learning_rate': 1.7778767684650277e-05, 'epoch': 0.44} {'loss': 0.7506, 'learning_rate': 1.7778561967264957e-05, 'epoch': 0.44} {'loss': 0.688, 'learning_rate': 1.7778356241544207e-05, 'epoch': 0.44} {'loss': 0.8458, 'learning_rate': 1.7778150507488242e-05, 'epoch': 0.44} {'loss': 0.8026, 'learning_rate': 1.7777944765097287e-05, 'epoch': 0.44} {'loss': 0.8169, 'learning_rate': 1.7777739014371568e-05, 'epoch': 0.44} {'loss': 0.7587, 'learning_rate': 1.7777533255311296e-05, 'epoch': 0.44} {'loss': 0.8953, 'learning_rate': 1.7777327487916694e-05, 'epoch': 0.44} {'loss': 0.9082, 'learning_rate': 1.7777121712187986e-05, 'epoch': 0.44} {'loss': 0.9048, 'learning_rate': 1.7776915928125388e-05, 'epoch': 0.44} {'loss': 0.8165, 'learning_rate': 1.777671013572912e-05, 'epoch': 0.44} {'loss': 0.8761, 'learning_rate': 1.7776504334999412e-05, 'epoch': 0.44} {'loss': 0.9575, 'learning_rate': 1.7776298525936475e-05, 'epoch': 0.44} {'loss': 0.9452, 'learning_rate': 1.7776092708540532e-05, 'epoch': 0.44} {'loss': 0.7597, 'learning_rate': 1.7775886882811804e-05, 'epoch': 0.44} {'loss': 0.9454, 'learning_rate': 1.777568104875051e-05, 'epoch': 0.44} {'loss': 1.0176, 'learning_rate': 1.7775475206356875e-05, 'epoch': 0.44} {'loss': 0.9635, 'learning_rate': 1.777526935563111e-05, 'epoch': 0.44} {'loss': 0.7172, 'learning_rate': 1.777506349657345e-05, 'epoch': 0.44} {'loss': 0.9338, 'learning_rate': 1.7774857629184104e-05, 'epoch': 0.44} {'loss': 0.7667, 'learning_rate': 1.7774651753463295e-05, 'epoch': 0.44} {'loss': 0.9487, 'learning_rate': 1.7774445869411246e-05, 'epoch': 0.44} {'loss': 0.977, 'learning_rate': 1.777423997702818e-05, 'epoch': 0.44} {'loss': 0.8385, 'learning_rate': 1.777403407631431e-05, 'epoch': 0.44} {'loss': 0.7899, 'learning_rate': 1.7773828167269863e-05, 'epoch': 0.44} {'loss': 0.69, 'learning_rate': 1.7773622249895054e-05, 'epoch': 0.44} {'loss': 0.803, 'learning_rate': 1.7773416324190113e-05, 'epoch': 0.44} {'loss': 0.9058, 'learning_rate': 1.777321039015525e-05, 'epoch': 0.44} {'loss': 0.861, 'learning_rate': 1.7773004447790695e-05, 'epoch': 0.44} {'loss': 0.7393, 'learning_rate': 1.777279849709666e-05, 'epoch': 0.44} {'loss': 0.5866, 'learning_rate': 1.777259253807337e-05, 'epoch': 0.44} {'loss': 0.9057, 'learning_rate': 1.7772386570721047e-05, 'epoch': 0.44} {'loss': 0.8395, 'learning_rate': 1.777218059503991e-05, 'epoch': 0.44} {'loss': 0.751, 'learning_rate': 1.7771974611030182e-05, 'epoch': 0.44} {'loss': 0.9926, 'learning_rate': 1.777176861869208e-05, 'epoch': 0.44} {'loss': 0.8514, 'learning_rate': 1.7771562618025827e-05, 'epoch': 0.44} {'loss': 0.9171, 'learning_rate': 1.777135660903164e-05, 'epoch': 0.44} {'loss': 1.0106, 'learning_rate': 1.7771150591709746e-05, 'epoch': 0.44} {'loss': 0.8032, 'learning_rate': 1.7770944566060362e-05, 'epoch': 0.44} {'loss': 0.989, 'learning_rate': 1.777073853208371e-05, 'epoch': 0.44} {'loss': 0.8757, 'learning_rate': 1.777053248978001e-05, 'epoch': 0.44} {'loss': 0.787, 'learning_rate': 1.7770326439149482e-05, 'epoch': 0.44} {'loss': 0.8125, 'learning_rate': 1.777012038019235e-05, 'epoch': 0.44} {'loss': 0.7975, 'learning_rate': 1.7769914312908833e-05, 'epoch': 0.44} {'loss': 0.8038, 'learning_rate': 1.776970823729915e-05, 'epoch': 0.44} {'loss': 0.8815, 'learning_rate': 1.7769502153363523e-05, 'epoch': 0.44} {'loss': 0.8393, 'learning_rate': 1.7769296061102174e-05, 'epoch': 0.44} {'loss': 0.8194, 'learning_rate': 1.7769089960515324e-05, 'epoch': 0.44} {'loss': 0.8715, 'learning_rate': 1.776888385160319e-05, 'epoch': 0.44} {'loss': 0.8786, 'learning_rate': 1.7768677734366e-05, 'epoch': 0.44} {'loss': 0.8006, 'learning_rate': 1.7768471608803967e-05, 'epoch': 0.44} {'loss': 0.7745, 'learning_rate': 1.7768265474917318e-05, 'epoch': 0.44} {'loss': 0.7073, 'learning_rate': 1.7768059332706273e-05, 'epoch': 0.44} {'loss': 0.7961, 'learning_rate': 1.7767853182171045e-05, 'epoch': 0.44} {'loss': 0.8652, 'learning_rate': 1.7767647023311866e-05, 'epoch': 0.44} {'loss': 0.8653, 'learning_rate': 1.776744085612895e-05, 'epoch': 0.44} {'loss': 0.9235, 'learning_rate': 1.776723468062252e-05, 'epoch': 0.44} {'loss': 0.7973, 'learning_rate': 1.7767028496792797e-05, 'epoch': 0.44} {'loss': 0.903, 'learning_rate': 1.7766822304640005e-05, 'epoch': 0.44} {'loss': 0.8699, 'learning_rate': 1.7766616104164362e-05, 'epoch': 0.44} {'loss': 0.8632, 'learning_rate': 1.7766409895366085e-05, 'epoch': 0.44} {'loss': 0.8646, 'learning_rate': 1.77662036782454e-05, 'epoch': 0.44} {'loss': 0.931, 'learning_rate': 1.7765997452802527e-05, 'epoch': 0.44} {'loss': 0.8486, 'learning_rate': 1.7765791219037686e-05, 'epoch': 0.44} {'loss': 0.8692, 'learning_rate': 1.7765584976951102e-05, 'epoch': 0.44} {'loss': 0.656, 'learning_rate': 1.776537872654299e-05, 'epoch': 0.44} {'loss': 0.7701, 'learning_rate': 1.7765172467813573e-05, 'epoch': 0.44} {'loss': 0.8377, 'learning_rate': 1.7764966200763075e-05, 'epoch': 0.44} {'loss': 0.861, 'learning_rate': 1.7764759925391715e-05, 'epoch': 0.44} {'loss': 0.7895, 'learning_rate': 1.7764553641699714e-05, 'epoch': 0.44} {'loss': 0.8177, 'learning_rate': 1.7764347349687294e-05, 'epoch': 0.44} {'loss': 0.8147, 'learning_rate': 1.7764141049354672e-05, 'epoch': 0.44} {'loss': 0.9627, 'learning_rate': 1.7763934740702073e-05, 'epoch': 0.44} {'loss': 0.8545, 'learning_rate': 1.7763728423729716e-05, 'epoch': 0.44} {'loss': 0.9525, 'learning_rate': 1.7763522098437826e-05, 'epoch': 0.44} {'loss': 0.89, 'learning_rate': 1.7763315764826622e-05, 'epoch': 0.44} {'loss': 0.9238, 'learning_rate': 1.776310942289632e-05, 'epoch': 0.44} {'loss': 0.7977, 'learning_rate': 1.776290307264715e-05, 'epoch': 0.44} {'loss': 0.8636, 'learning_rate': 1.7762696714079326e-05, 'epoch': 0.44} {'loss': 0.8663, 'learning_rate': 1.7762490347193073e-05, 'epoch': 0.44} {'loss': 0.9939, 'learning_rate': 1.776228397198861e-05, 'epoch': 0.44} {'loss': 0.7849, 'learning_rate': 1.7762077588466163e-05, 'epoch': 0.44} {'loss': 0.764, 'learning_rate': 1.7761871196625943e-05, 'epoch': 0.44} {'loss': 0.8161, 'learning_rate': 1.7761664796468182e-05, 'epoch': 0.44} {'loss': 0.8031, 'learning_rate': 1.7761458387993095e-05, 'epoch': 0.44} {'loss': 0.9116, 'learning_rate': 1.7761251971200904e-05, 'epoch': 0.44} {'loss': 0.9076, 'learning_rate': 1.7761045546091832e-05, 'epoch': 0.44} {'loss': 0.9797, 'learning_rate': 1.7760839112666103e-05, 'epoch': 0.44} {'loss': 0.8876, 'learning_rate': 1.776063267092393e-05, 'epoch': 0.44} {'loss': 0.8333, 'learning_rate': 1.776042622086554e-05, 'epoch': 0.44} {'loss': 0.808, 'learning_rate': 1.776021976249115e-05, 'epoch': 0.44} {'loss': 0.9118, 'learning_rate': 1.776001329580099e-05, 'epoch': 0.44} {'loss': 0.9397, 'learning_rate': 1.775980682079527e-05, 'epoch': 0.44} {'loss': 0.908, 'learning_rate': 1.7759600337474218e-05, 'epoch': 0.44} {'loss': 0.8757, 'learning_rate': 1.7759393845838057e-05, 'epoch': 0.44} {'loss': 0.7297, 'learning_rate': 1.7759187345887e-05, 'epoch': 0.44} {'loss': 0.8297, 'learning_rate': 1.7758980837621275e-05, 'epoch': 0.44} {'loss': 0.8942, 'learning_rate': 1.7758774321041102e-05, 'epoch': 0.44} {'loss': 1.09, 'learning_rate': 1.7758567796146704e-05, 'epoch': 0.44} {'loss': 0.8453, 'learning_rate': 1.77583612629383e-05, 'epoch': 0.44} {'loss': 0.9096, 'learning_rate': 1.775815472141611e-05, 'epoch': 0.44} {'loss': 0.8782, 'learning_rate': 1.7757948171580357e-05, 'epoch': 0.44} {'loss': 1.0023, 'learning_rate': 1.7757741613431262e-05, 'epoch': 0.44} {'loss': 0.8334, 'learning_rate': 1.775753504696905e-05, 'epoch': 0.44} {'loss': 0.9043, 'learning_rate': 1.7757328472193936e-05, 'epoch': 0.44} {'loss': 0.849, 'learning_rate': 1.7757121889106145e-05, 'epoch': 0.44} {'loss': 0.9251, 'learning_rate': 1.7756915297705898e-05, 'epoch': 0.44} {'loss': 0.6745, 'learning_rate': 1.775670869799342e-05, 'epoch': 0.44} {'loss': 0.9083, 'learning_rate': 1.775650208996892e-05, 'epoch': 0.44} {'loss': 0.8243, 'learning_rate': 1.7756295473632636e-05, 'epoch': 0.44} {'loss': 0.8724, 'learning_rate': 1.7756088848984777e-05, 'epoch': 0.44} {'loss': 0.9449, 'learning_rate': 1.775588221602557e-05, 'epoch': 0.44} {'loss': 0.9308, 'learning_rate': 1.7755675574755235e-05, 'epoch': 0.44} {'loss': 0.9771, 'learning_rate': 1.7755468925173992e-05, 'epoch': 0.44} {'loss': 0.9432, 'learning_rate': 1.775526226728207e-05, 'epoch': 0.44} {'loss': 0.8608, 'learning_rate': 1.7755055601079674e-05, 'epoch': 0.44} {'loss': 0.8597, 'learning_rate': 1.7754848926567047e-05, 'epoch': 0.44} {'loss': 0.9676, 'learning_rate': 1.7754642243744392e-05, 'epoch': 0.44} {'loss': 0.7746, 'learning_rate': 1.775443555261194e-05, 'epoch': 0.44} {'loss': 0.998, 'learning_rate': 1.775422885316991e-05, 'epoch': 0.44} {'loss': 0.7863, 'learning_rate': 1.7754022145418525e-05, 'epoch': 0.44} {'loss': 0.809, 'learning_rate': 1.7753815429358006e-05, 'epoch': 0.44} {'loss': 0.8943, 'learning_rate': 1.7753608704988576e-05, 'epoch': 0.44} {'loss': 0.7993, 'learning_rate': 1.775340197231045e-05, 'epoch': 0.44} {'loss': 0.843, 'learning_rate': 1.7753195231323855e-05, 'epoch': 0.44} {'loss': 0.8118, 'learning_rate': 1.7752988482029013e-05, 'epoch': 0.44} {'loss': 0.8301, 'learning_rate': 1.7752781724426143e-05, 'epoch': 0.44} {'loss': 0.9533, 'learning_rate': 1.775257495851547e-05, 'epoch': 0.44} {'loss': 0.7448, 'learning_rate': 1.775236818429721e-05, 'epoch': 0.44} {'loss': 0.7341, 'learning_rate': 1.775216140177159e-05, 'epoch': 0.44} {'loss': 0.8425, 'learning_rate': 1.775195461093883e-05, 'epoch': 0.44} {'loss': 0.8803, 'learning_rate': 1.7751747811799148e-05, 'epoch': 0.44} {'loss': 0.9534, 'learning_rate': 1.7751541004352767e-05, 'epoch': 0.44} {'loss': 0.9417, 'learning_rate': 1.7751334188599916e-05, 'epoch': 0.44} {'loss': 0.9583, 'learning_rate': 1.775112736454081e-05, 'epoch': 0.44} {'loss': 0.9659, 'learning_rate': 1.7750920532175667e-05, 'epoch': 0.44} {'loss': 0.8508, 'learning_rate': 1.7750713691504716e-05, 'epoch': 0.44} {'loss': 0.7415, 'learning_rate': 1.7750506842528174e-05, 'epoch': 0.44} {'loss': 0.7967, 'learning_rate': 1.7750299985246267e-05, 'epoch': 0.44} {'loss': 1.0783, 'learning_rate': 1.775009311965921e-05, 'epoch': 0.44} {'loss': 0.8833, 'learning_rate': 1.7749886245767232e-05, 'epoch': 0.44} {'loss': 0.7048, 'learning_rate': 1.7749679363570552e-05, 'epoch': 0.44} {'loss': 0.8822, 'learning_rate': 1.7749472473069392e-05, 'epoch': 0.44} {'loss': 0.8385, 'learning_rate': 1.774926557426397e-05, 'epoch': 0.44} {'loss': 0.8821, 'learning_rate': 1.774905866715451e-05, 'epoch': 0.44} {'loss': 0.7312, 'learning_rate': 1.7748851751741237e-05, 'epoch': 0.44} {'loss': 0.9999, 'learning_rate': 1.7748644828024368e-05, 'epoch': 0.44} {'loss': 0.8588, 'learning_rate': 1.7748437896004125e-05, 'epoch': 0.44} {'loss': 0.7398, 'learning_rate': 1.7748230955680738e-05, 'epoch': 0.44} {'loss': 0.8308, 'learning_rate': 1.7748024007054415e-05, 'epoch': 0.44} {'loss': 0.8697, 'learning_rate': 1.7747817050125387e-05, 'epoch': 0.44} {'loss': 0.8566, 'learning_rate': 1.7747610084893877e-05, 'epoch': 0.44} {'loss': 0.7594, 'learning_rate': 1.77474031113601e-05, 'epoch': 0.44} {'loss': 0.9662, 'learning_rate': 1.774719612952428e-05, 'epoch': 0.44} {'loss': 0.7259, 'learning_rate': 1.7746989139386645e-05, 'epoch': 0.44} {'loss': 0.8689, 'learning_rate': 1.774678214094741e-05, 'epoch': 0.44} {'loss': 0.8092, 'learning_rate': 1.77465751342068e-05, 'epoch': 0.44} {'loss': 0.7091, 'learning_rate': 1.7746368119165033e-05, 'epoch': 0.44} {'loss': 0.8485, 'learning_rate': 1.7746161095822333e-05, 'epoch': 0.44} {'loss': 0.7373, 'learning_rate': 1.7745954064178924e-05, 'epoch': 0.44} {'loss': 0.8736, 'learning_rate': 1.7745747024235026e-05, 'epoch': 0.44} {'loss': 0.7018, 'learning_rate': 1.774553997599086e-05, 'epoch': 0.44} {'loss': 0.8521, 'learning_rate': 1.774533291944665e-05, 'epoch': 0.44} {'loss': 0.9095, 'learning_rate': 1.7745125854602615e-05, 'epoch': 0.44} {'loss': 0.9429, 'learning_rate': 1.774491878145898e-05, 'epoch': 0.44} {'loss': 0.9142, 'learning_rate': 1.7744711700015966e-05, 'epoch': 0.44} {'loss': 0.8935, 'learning_rate': 1.7744504610273795e-05, 'epoch': 0.44} {'loss': 0.9404, 'learning_rate': 1.7744297512232686e-05, 'epoch': 0.44} {'loss': 1.0051, 'learning_rate': 1.7744090405892863e-05, 'epoch': 0.44} {'loss': 0.8438, 'learning_rate': 1.774388329125455e-05, 'epoch': 0.44} {'loss': 0.7766, 'learning_rate': 1.7743676168317968e-05, 'epoch': 0.44} {'loss': 0.7928, 'learning_rate': 1.7743469037083335e-05, 'epoch': 0.44} {'loss': 0.8845, 'learning_rate': 1.7743261897550877e-05, 'epoch': 0.44} {'loss': 0.8701, 'learning_rate': 1.7743054749720815e-05, 'epoch': 0.44} {'loss': 0.6733, 'learning_rate': 1.7742847593593372e-05, 'epoch': 0.44} {'loss': 0.8544, 'learning_rate': 1.774264042916877e-05, 'epoch': 0.44} {'loss': 0.8586, 'learning_rate': 1.7742433256447226e-05, 'epoch': 0.44} {'loss': 0.7197, 'learning_rate': 1.774222607542897e-05, 'epoch': 0.44} {'loss': 0.9729, 'learning_rate': 1.7742018886114217e-05, 'epoch': 0.44} {'loss': 0.8897, 'learning_rate': 1.7741811688503196e-05, 'epoch': 0.44} {'loss': 0.7665, 'learning_rate': 1.774160448259612e-05, 'epoch': 0.44} {'loss': 0.9599, 'learning_rate': 1.7741397268393222e-05, 'epoch': 0.44} {'loss': 0.9309, 'learning_rate': 1.7741190045894713e-05, 'epoch': 0.44} {'loss': 0.9949, 'learning_rate': 1.774098281510082e-05, 'epoch': 0.44} {'loss': 0.7344, 'learning_rate': 1.774077557601177e-05, 'epoch': 0.44} {'loss': 0.985, 'learning_rate': 1.7740568328627777e-05, 'epoch': 0.44} {'loss': 0.9677, 'learning_rate': 1.7740361072949066e-05, 'epoch': 0.44} {'loss': 0.8452, 'learning_rate': 1.774015380897586e-05, 'epoch': 0.44} {'loss': 0.8019, 'learning_rate': 1.7739946536708382e-05, 'epoch': 0.44} {'loss': 0.9027, 'learning_rate': 1.773973925614685e-05, 'epoch': 0.44} {'loss': 0.684, 'learning_rate': 1.7739531967291493e-05, 'epoch': 0.44} {'loss': 0.8516, 'learning_rate': 1.7739324670142527e-05, 'epoch': 0.44} {'loss': 0.93, 'learning_rate': 1.7739117364700174e-05, 'epoch': 0.44} {'loss': 0.8668, 'learning_rate': 1.773891005096466e-05, 'epoch': 0.44} {'loss': 0.9846, 'learning_rate': 1.7738702728936204e-05, 'epoch': 0.44} {'loss': 0.9961, 'learning_rate': 1.773849539861503e-05, 'epoch': 0.44} {'loss': 0.9086, 'learning_rate': 1.773828806000136e-05, 'epoch': 0.44} {'loss': 0.6877, 'learning_rate': 1.773808071309542e-05, 'epoch': 0.44} {'loss': 0.9299, 'learning_rate': 1.7737873357897425e-05, 'epoch': 0.44} {'loss': 0.9193, 'learning_rate': 1.77376659944076e-05, 'epoch': 0.44} {'loss': 0.922, 'learning_rate': 1.7737458622626163e-05, 'epoch': 0.44} {'loss': 0.9049, 'learning_rate': 1.773725124255335e-05, 'epoch': 0.44} {'loss': 0.7505, 'learning_rate': 1.7737043854189367e-05, 'epoch': 0.44} {'loss': 0.8337, 'learning_rate': 1.7736836457534446e-05, 'epoch': 0.44} {'loss': 0.7877, 'learning_rate': 1.7736629052588804e-05, 'epoch': 0.44} {'loss': 0.9845, 'learning_rate': 1.773642163935267e-05, 'epoch': 0.44} {'loss': 0.968, 'learning_rate': 1.773621421782626e-05, 'epoch': 0.44} {'loss': 0.9051, 'learning_rate': 1.7736006788009795e-05, 'epoch': 0.44} {'loss': 0.8017, 'learning_rate': 1.7735799349903504e-05, 'epoch': 0.44} {'loss': 0.9126, 'learning_rate': 1.7735591903507604e-05, 'epoch': 0.44} {'loss': 0.967, 'learning_rate': 1.773538444882232e-05, 'epoch': 0.44} {'loss': 0.9597, 'learning_rate': 1.7735176985847875e-05, 'epoch': 0.44} {'loss': 0.9105, 'learning_rate': 1.7734969514584486e-05, 'epoch': 0.44} {'loss': 0.8096, 'learning_rate': 1.7734762035032383e-05, 'epoch': 0.44} {'loss': 1.0567, 'learning_rate': 1.7734554547191783e-05, 'epoch': 0.44} {'loss': 0.8815, 'learning_rate': 1.773434705106291e-05, 'epoch': 0.44} {'loss': 0.9044, 'learning_rate': 1.7734139546645984e-05, 'epoch': 0.44} {'loss': 0.9325, 'learning_rate': 1.773393203394123e-05, 'epoch': 0.44} {'loss': 0.8947, 'learning_rate': 1.773372451294887e-05, 'epoch': 0.44} {'loss': 0.9392, 'learning_rate': 1.773351698366913e-05, 'epoch': 0.44} {'loss': 0.8362, 'learning_rate': 1.7733309446102224e-05, 'epoch': 0.44} {'loss': 0.8399, 'learning_rate': 1.7733101900248376e-05, 'epoch': 0.44} {'loss': 1.0088, 'learning_rate': 1.7732894346107818e-05, 'epoch': 0.44} {'loss': 0.7622, 'learning_rate': 1.7732686783680763e-05, 'epoch': 0.44} {'loss': 0.8737, 'learning_rate': 1.7732479212967437e-05, 'epoch': 0.44} {'loss': 0.9652, 'learning_rate': 1.773227163396806e-05, 'epoch': 0.44} {'loss': 1.0275, 'learning_rate': 1.7732064046682856e-05, 'epoch': 0.44} {'loss': 0.8753, 'learning_rate': 1.7731856451112053e-05, 'epoch': 0.44} {'loss': 0.7023, 'learning_rate': 1.7731648847255862e-05, 'epoch': 0.44} {'loss': 0.777, 'learning_rate': 1.7731441235114513e-05, 'epoch': 0.44} {'loss': 1.0026, 'learning_rate': 1.773123361468823e-05, 'epoch': 0.44} {'loss': 0.8203, 'learning_rate': 1.773102598597723e-05, 'epoch': 0.44} {'loss': 0.865, 'learning_rate': 1.7730818348981734e-05, 'epoch': 0.44} {'loss': 0.8998, 'learning_rate': 1.7730610703701972e-05, 'epoch': 0.44} {'loss': 0.8016, 'learning_rate': 1.7730403050138164e-05, 'epoch': 0.44} {'loss': 0.7715, 'learning_rate': 1.7730195388290526e-05, 'epoch': 0.44} {'loss': 0.7451, 'learning_rate': 1.7729987718159292e-05, 'epoch': 0.44} {'loss': 1.0721, 'learning_rate': 1.7729780039744676e-05, 'epoch': 0.44} {'loss': 0.9403, 'learning_rate': 1.7729572353046904e-05, 'epoch': 0.44} {'loss': 0.8452, 'learning_rate': 1.7729364658066197e-05, 'epoch': 0.44} {'loss': 0.8818, 'learning_rate': 1.772915695480278e-05, 'epoch': 0.44} {'loss': 0.7517, 'learning_rate': 1.772894924325687e-05, 'epoch': 0.44} {'loss': 0.9183, 'learning_rate': 1.7728741523428696e-05, 'epoch': 0.44} {'loss': 0.9021, 'learning_rate': 1.7728533795318477e-05, 'epoch': 0.44} {'loss': 0.9701, 'learning_rate': 1.772832605892644e-05, 'epoch': 0.44} {'loss': 1.0534, 'learning_rate': 1.7728118314252798e-05, 'epoch': 0.44} {'loss': 0.7662, 'learning_rate': 1.772791056129778e-05, 'epoch': 0.44} {'loss': 0.888, 'learning_rate': 1.7727702800061615e-05, 'epoch': 0.44} {'loss': 0.7124, 'learning_rate': 1.7727495030544512e-05, 'epoch': 0.44} {'loss': 0.9038, 'learning_rate': 1.7727287252746707e-05, 'epoch': 0.44} {'loss': 0.7822, 'learning_rate': 1.7727079466668412e-05, 'epoch': 0.44} {'loss': 0.8004, 'learning_rate': 1.7726871672309852e-05, 'epoch': 0.44} {'loss': 0.7714, 'learning_rate': 1.7726663869671258e-05, 'epoch': 0.44} {'loss': 0.9655, 'learning_rate': 1.772645605875284e-05, 'epoch': 0.44} {'loss': 0.8363, 'learning_rate': 1.772624823955483e-05, 'epoch': 0.44} {'loss': 0.8599, 'learning_rate': 1.7726040412077448e-05, 'epoch': 0.44} {'loss': 0.9896, 'learning_rate': 1.7725832576320912e-05, 'epoch': 0.44} {'loss': 0.9346, 'learning_rate': 1.7725624732285456e-05, 'epoch': 0.44} {'loss': 0.7036, 'learning_rate': 1.7725416879971292e-05, 'epoch': 0.44} {'loss': 0.687, 'learning_rate': 1.7725209019378646e-05, 'epoch': 0.44} {'loss': 0.9133, 'learning_rate': 1.7725001150507743e-05, 'epoch': 0.44} {'loss': 0.8552, 'learning_rate': 1.7724793273358804e-05, 'epoch': 0.44} {'loss': 0.7684, 'learning_rate': 1.7724585387932052e-05, 'epoch': 0.44} {'loss': 0.7548, 'learning_rate': 1.7724377494227705e-05, 'epoch': 0.44} {'loss': 0.7538, 'learning_rate': 1.7724169592245996e-05, 'epoch': 0.44} {'loss': 0.7546, 'learning_rate': 1.772396168198714e-05, 'epoch': 0.44} {'loss': 0.8353, 'learning_rate': 1.7723753763451364e-05, 'epoch': 0.44} {'loss': 0.7844, 'learning_rate': 1.7723545836638884e-05, 'epoch': 0.44} {'loss': 0.9429, 'learning_rate': 1.7723337901549934e-05, 'epoch': 0.44} {'loss': 0.8791, 'learning_rate': 1.7723129958184726e-05, 'epoch': 0.44} {'loss': 0.7716, 'learning_rate': 1.7722922006543485e-05, 'epoch': 0.44} {'loss': 0.7663, 'learning_rate': 1.772271404662644e-05, 'epoch': 0.44} {'loss': 0.8481, 'learning_rate': 1.7722506078433813e-05, 'epoch': 0.44} {'loss': 0.841, 'learning_rate': 1.772229810196582e-05, 'epoch': 0.44} {'loss': 0.7293, 'learning_rate': 1.7722090117222682e-05, 'epoch': 0.44} {'loss': 0.9048, 'learning_rate': 1.7721882124204633e-05, 'epoch': 0.44} {'loss': 0.8195, 'learning_rate': 1.7721674122911893e-05, 'epoch': 0.44} {'loss': 0.9327, 'learning_rate': 1.7721466113344677e-05, 'epoch': 0.44} {'loss': 0.8007, 'learning_rate': 1.7721258095503217e-05, 'epoch': 0.44} {'loss': 0.8788, 'learning_rate': 1.772105006938773e-05, 'epoch': 0.44} {'loss': 0.9022, 'learning_rate': 1.7720842034998442e-05, 'epoch': 0.44} {'loss': 1.0793, 'learning_rate': 1.7720633992335576e-05, 'epoch': 0.44} {'loss': 0.85, 'learning_rate': 1.7720425941399352e-05, 'epoch': 0.44} {'loss': 0.8728, 'learning_rate': 1.7720217882189995e-05, 'epoch': 0.44} {'loss': 0.8363, 'learning_rate': 1.7720009814707725e-05, 'epoch': 0.44} {'loss': 0.8632, 'learning_rate': 1.7719801738952772e-05, 'epoch': 0.44} {'loss': 0.9264, 'learning_rate': 1.7719593654925353e-05, 'epoch': 0.44} {'loss': 0.9175, 'learning_rate': 1.7719385562625695e-05, 'epoch': 0.44} {'loss': 0.9406, 'learning_rate': 1.7719177462054015e-05, 'epoch': 0.44} {'loss': 0.8928, 'learning_rate': 1.7718969353210543e-05, 'epoch': 0.44} {'loss': 0.9116, 'learning_rate': 1.7718761236095496e-05, 'epoch': 0.44} {'loss': 1.0089, 'learning_rate': 1.7718553110709102e-05, 'epoch': 0.44} {'loss': 0.8346, 'learning_rate': 1.771834497705158e-05, 'epoch': 0.44} {'loss': 0.8376, 'learning_rate': 1.7718136835123153e-05, 'epoch': 0.44} {'loss': 0.74, 'learning_rate': 1.771792868492405e-05, 'epoch': 0.44} {'loss': 0.7259, 'learning_rate': 1.7717720526454486e-05, 'epoch': 0.44} {'loss': 0.8807, 'learning_rate': 1.7717512359714686e-05, 'epoch': 0.44} {'loss': 0.8368, 'learning_rate': 1.771730418470488e-05, 'epoch': 0.44} {'loss': 1.0188, 'learning_rate': 1.7717096001425288e-05, 'epoch': 0.44} {'loss': 0.8379, 'learning_rate': 1.7716887809876127e-05, 'epoch': 0.44} {'loss': 0.8023, 'learning_rate': 1.7716679610057623e-05, 'epoch': 0.44} {'loss': 0.84, 'learning_rate': 1.771647140197e-05, 'epoch': 0.44} {'loss': 1.0265, 'learning_rate': 1.7716263185613485e-05, 'epoch': 0.44} {'loss': 0.9236, 'learning_rate': 1.7716054960988297e-05, 'epoch': 0.44} {'loss': 0.8648, 'learning_rate': 1.7715846728094658e-05, 'epoch': 0.44} {'loss': 0.876, 'learning_rate': 1.7715638486932795e-05, 'epoch': 0.44} {'loss': 1.0635, 'learning_rate': 1.7715430237502928e-05, 'epoch': 0.44} {'loss': 0.9996, 'learning_rate': 1.771522197980528e-05, 'epoch': 0.44} {'loss': 0.9359, 'learning_rate': 1.7715013713840074e-05, 'epoch': 0.44} {'loss': 0.9106, 'learning_rate': 1.7714805439607537e-05, 'epoch': 0.44} {'loss': 0.9475, 'learning_rate': 1.771459715710789e-05, 'epoch': 0.44} {'loss': 0.8493, 'learning_rate': 1.7714388866341356e-05, 'epoch': 0.44} {'loss': 0.8496, 'learning_rate': 1.7714180567308156e-05, 'epoch': 0.44} {'loss': 0.7686, 'learning_rate': 1.7713972260008517e-05, 'epoch': 0.44} {'loss': 0.6472, 'learning_rate': 1.771376394444266e-05, 'epoch': 0.44} {'loss': 0.7861, 'learning_rate': 1.7713555620610808e-05, 'epoch': 0.44} {'loss': 0.905, 'learning_rate': 1.771334728851319e-05, 'epoch': 0.44} {'loss': 0.9493, 'learning_rate': 1.7713138948150018e-05, 'epoch': 0.44} {'loss': 0.7817, 'learning_rate': 1.7712930599521524e-05, 'epoch': 0.44} {'loss': 0.776, 'learning_rate': 1.7712722242627927e-05, 'epoch': 0.44} {'loss': 0.6692, 'learning_rate': 1.7712513877469452e-05, 'epoch': 0.44} {'loss': 0.996, 'learning_rate': 1.7712305504046322e-05, 'epoch': 0.44} {'loss': 0.7759, 'learning_rate': 1.7712097122358762e-05, 'epoch': 0.44} {'loss': 0.7888, 'learning_rate': 1.7711888732406993e-05, 'epoch': 0.44} {'loss': 0.9362, 'learning_rate': 1.7711680334191242e-05, 'epoch': 0.44} {'loss': 0.8916, 'learning_rate': 1.7711471927711726e-05, 'epoch': 0.44} {'loss': 0.83, 'learning_rate': 1.7711263512968675e-05, 'epoch': 0.44} {'loss': 1.0212, 'learning_rate': 1.7711055089962306e-05, 'epoch': 0.44} {'loss': 0.7439, 'learning_rate': 1.771084665869285e-05, 'epoch': 0.44} {'loss': 0.7844, 'learning_rate': 1.7710638219160522e-05, 'epoch': 0.44} {'loss': 0.8402, 'learning_rate': 1.7710429771365548e-05, 'epoch': 0.44} {'loss': 0.7483, 'learning_rate': 1.7710221315308156e-05, 'epoch': 0.44} {'loss': 1.0128, 'learning_rate': 1.771001285098856e-05, 'epoch': 0.44} {'loss': 0.7095, 'learning_rate': 1.7709804378406997e-05, 'epoch': 0.44} {'loss': 0.8741, 'learning_rate': 1.770959589756368e-05, 'epoch': 0.44} {'loss': 0.859, 'learning_rate': 1.7709387408458835e-05, 'epoch': 0.44} {'loss': 0.8266, 'learning_rate': 1.7709178911092687e-05, 'epoch': 0.44} {'loss': 1.0017, 'learning_rate': 1.7708970405465457e-05, 'epoch': 0.44} {'loss': 0.9998, 'learning_rate': 1.7708761891577365e-05, 'epoch': 0.44} {'loss': 0.8491, 'learning_rate': 1.7708553369428646e-05, 'epoch': 0.44} {'loss': 0.848, 'learning_rate': 1.7708344839019512e-05, 'epoch': 0.44} {'loss': 0.9338, 'learning_rate': 1.770813630035019e-05, 'epoch': 0.44} {'loss': 0.7954, 'learning_rate': 1.770792775342091e-05, 'epoch': 0.44} {'loss': 0.6538, 'learning_rate': 1.770771919823188e-05, 'epoch': 0.44} {'loss': 0.9262, 'learning_rate': 1.7707510634783343e-05, 'epoch': 0.44} {'loss': 0.8888, 'learning_rate': 1.770730206307551e-05, 'epoch': 0.44} {'loss': 1.0302, 'learning_rate': 1.7707093483108605e-05, 'epoch': 0.44} {'loss': 0.8956, 'learning_rate': 1.7706884894882853e-05, 'epoch': 0.44} {'loss': 0.7123, 'learning_rate': 1.770667629839848e-05, 'epoch': 0.44} {'loss': 0.8944, 'learning_rate': 1.7706467693655708e-05, 'epoch': 0.44} {'loss': 0.7438, 'learning_rate': 1.770625908065476e-05, 'epoch': 0.44} {'loss': 0.7168, 'learning_rate': 1.7706050459395857e-05, 'epoch': 0.44} {'loss': 0.9234, 'learning_rate': 1.770584182987923e-05, 'epoch': 0.44} {'loss': 0.8463, 'learning_rate': 1.77056331921051e-05, 'epoch': 0.44} {'loss': 0.9331, 'learning_rate': 1.770542454607368e-05, 'epoch': 0.44} {'loss': 0.8298, 'learning_rate': 1.7705215891785207e-05, 'epoch': 0.44} {'loss': 0.7723, 'learning_rate': 1.7705007229239902e-05, 'epoch': 0.44} {'loss': 0.8413, 'learning_rate': 1.7704798558437985e-05, 'epoch': 0.44} {'loss': 0.9641, 'learning_rate': 1.770458987937968e-05, 'epoch': 0.44} {'loss': 0.9206, 'learning_rate': 1.7704381192065213e-05, 'epoch': 0.44} {'loss': 0.782, 'learning_rate': 1.7704172496494802e-05, 'epoch': 0.44} {'loss': 0.9014, 'learning_rate': 1.7703963792668676e-05, 'epoch': 0.44} {'loss': 0.8616, 'learning_rate': 1.770375508058706e-05, 'epoch': 0.44} {'loss': 1.0172, 'learning_rate': 1.7703546360250173e-05, 'epoch': 0.45} {'loss': 0.7399, 'learning_rate': 1.7703337631658244e-05, 'epoch': 0.45} {'loss': 0.9087, 'learning_rate': 1.770312889481149e-05, 'epoch': 0.45} {'loss': 0.8859, 'learning_rate': 1.770292014971014e-05, 'epoch': 0.45} {'loss': 0.7141, 'learning_rate': 1.7702711396354417e-05, 'epoch': 0.45} {'loss': 0.8992, 'learning_rate': 1.770250263474454e-05, 'epoch': 0.45} {'loss': 0.7022, 'learning_rate': 1.7702293864880737e-05, 'epoch': 0.45} {'loss': 0.9461, 'learning_rate': 1.7702085086763235e-05, 'epoch': 0.45} {'loss': 0.9885, 'learning_rate': 1.7701876300392247e-05, 'epoch': 0.45} {'loss': 0.8448, 'learning_rate': 1.770166750576801e-05, 'epoch': 0.45} {'loss': 0.9301, 'learning_rate': 1.7701458702890737e-05, 'epoch': 0.45} {'loss': 0.7831, 'learning_rate': 1.7701249891760657e-05, 'epoch': 0.45} {'loss': 0.7092, 'learning_rate': 1.7701041072377994e-05, 'epoch': 0.45} {'loss': 0.7459, 'learning_rate': 1.7700832244742973e-05, 'epoch': 0.45} {'loss': 0.7806, 'learning_rate': 1.7700623408855808e-05, 'epoch': 0.45} {'loss': 0.8587, 'learning_rate': 1.7700414564716736e-05, 'epoch': 0.45} {'loss': 0.7965, 'learning_rate': 1.770020571232597e-05, 'epoch': 0.45} {'loss': 0.7127, 'learning_rate': 1.769999685168374e-05, 'epoch': 0.45} {'loss': 0.8901, 'learning_rate': 1.769978798279027e-05, 'epoch': 0.45} {'loss': 0.9719, 'learning_rate': 1.769957910564578e-05, 'epoch': 0.45} {'loss': 0.985, 'learning_rate': 1.76993702202505e-05, 'epoch': 0.45} {'loss': 0.8962, 'learning_rate': 1.7699161326604647e-05, 'epoch': 0.45} {'loss': 0.8054, 'learning_rate': 1.7698952424708445e-05, 'epoch': 0.45} {'loss': 0.8388, 'learning_rate': 1.7698743514562126e-05, 'epoch': 0.45} {'loss': 0.8543, 'learning_rate': 1.7698534596165905e-05, 'epoch': 0.45} {'loss': 0.8623, 'learning_rate': 1.769832566952001e-05, 'epoch': 0.45} {'loss': 0.7989, 'learning_rate': 1.7698116734624665e-05, 'epoch': 0.45} {'loss': 0.912, 'learning_rate': 1.7697907791480096e-05, 'epoch': 0.45} {'loss': 0.6091, 'learning_rate': 1.7697698840086518e-05, 'epoch': 0.45} {'loss': 0.8497, 'learning_rate': 1.7697489880444166e-05, 'epoch': 0.45} {'loss': 0.9101, 'learning_rate': 1.769728091255326e-05, 'epoch': 0.45} {'loss': 0.8611, 'learning_rate': 1.7697071936414016e-05, 'epoch': 0.45} {'loss': 0.6206, 'learning_rate': 1.769686295202667e-05, 'epoch': 0.45} {'loss': 0.8323, 'learning_rate': 1.7696653959391435e-05, 'epoch': 0.45} {'loss': 1.0495, 'learning_rate': 1.7696444958508547e-05, 'epoch': 0.45} {'loss': 0.6287, 'learning_rate': 1.769623594937822e-05, 'epoch': 0.45} {'loss': 0.9973, 'learning_rate': 1.7696026932000685e-05, 'epoch': 0.45} {'loss': 0.8987, 'learning_rate': 1.769581790637616e-05, 'epoch': 0.45} {'loss': 0.7571, 'learning_rate': 1.7695608872504874e-05, 'epoch': 0.45} {'loss': 0.7834, 'learning_rate': 1.7695399830387043e-05, 'epoch': 0.45} {'loss': 1.0138, 'learning_rate': 1.76951907800229e-05, 'epoch': 0.45} {'loss': 0.8435, 'learning_rate': 1.7694981721412666e-05, 'epoch': 0.45} {'loss': 0.9228, 'learning_rate': 1.7694772654556564e-05, 'epoch': 0.45} {'loss': 0.8974, 'learning_rate': 1.7694563579454816e-05, 'epoch': 0.45} {'loss': 0.7878, 'learning_rate': 1.7694354496107653e-05, 'epoch': 0.45} {'loss': 0.916, 'learning_rate': 1.7694145404515292e-05, 'epoch': 0.45} {'loss': 0.892, 'learning_rate': 1.769393630467796e-05, 'epoch': 0.45} {'loss': 0.8714, 'learning_rate': 1.7693727196595883e-05, 'epoch': 0.45} {'loss': 0.8519, 'learning_rate': 1.7693518080269282e-05, 'epoch': 0.45} {'loss': 1.018, 'learning_rate': 1.769330895569838e-05, 'epoch': 0.45} {'loss': 1.0181, 'learning_rate': 1.7693099822883403e-05, 'epoch': 0.45} {'loss': 0.9779, 'learning_rate': 1.7692890681824576e-05, 'epoch': 0.45} {'loss': 1.0242, 'learning_rate': 1.7692681532522125e-05, 'epoch': 0.45} {'loss': 0.9332, 'learning_rate': 1.769247237497627e-05, 'epoch': 0.45} {'loss': 0.8756, 'learning_rate': 1.7692263209187236e-05, 'epoch': 0.45} {'loss': 0.7177, 'learning_rate': 1.7692054035155246e-05, 'epoch': 0.45} {'loss': 0.9238, 'learning_rate': 1.7691844852880527e-05, 'epoch': 0.45} {'loss': 0.8634, 'learning_rate': 1.7691635662363303e-05, 'epoch': 0.45} {'loss': 1.0267, 'learning_rate': 1.7691426463603798e-05, 'epoch': 0.45} {'loss': 0.8768, 'learning_rate': 1.7691217256602232e-05, 'epoch': 0.45} {'loss': 0.7579, 'learning_rate': 1.7691008041358836e-05, 'epoch': 0.45} {'loss': 0.8211, 'learning_rate': 1.769079881787383e-05, 'epoch': 0.45} {'loss': 0.9376, 'learning_rate': 1.7690589586147436e-05, 'epoch': 0.45} {'loss': 0.9258, 'learning_rate': 1.7690380346179887e-05, 'epoch': 0.45} {'loss': 1.1134, 'learning_rate': 1.7690171097971394e-05, 'epoch': 0.45} {'loss': 1.0031, 'learning_rate': 1.7689961841522193e-05, 'epoch': 0.45} {'loss': 0.8276, 'learning_rate': 1.7689752576832503e-05, 'epoch': 0.45} {'loss': 0.8711, 'learning_rate': 1.768954330390255e-05, 'epoch': 0.45} {'loss': 0.8133, 'learning_rate': 1.7689334022732558e-05, 'epoch': 0.45} {'loss': 0.8494, 'learning_rate': 1.7689124733322747e-05, 'epoch': 0.45} {'loss': 0.9233, 'learning_rate': 1.768891543567335e-05, 'epoch': 0.45} {'loss': 0.7058, 'learning_rate': 1.7688706129784582e-05, 'epoch': 0.45} {'loss': 0.9894, 'learning_rate': 1.768849681565667e-05, 'epoch': 0.45} {'loss': 1.0214, 'learning_rate': 1.7688287493289843e-05, 'epoch': 0.45} {'loss': 1.0032, 'learning_rate': 1.768807816268432e-05, 'epoch': 0.45} {'loss': 0.7235, 'learning_rate': 1.768786882384033e-05, 'epoch': 0.45} {'loss': 0.9052, 'learning_rate': 1.7687659476758093e-05, 'epoch': 0.45} {'loss': 0.7386, 'learning_rate': 1.7687450121437836e-05, 'epoch': 0.45} {'loss': 1.0116, 'learning_rate': 1.7687240757879784e-05, 'epoch': 0.45} {'loss': 0.8883, 'learning_rate': 1.7687031386084153e-05, 'epoch': 0.45} {'loss': 0.8853, 'learning_rate': 1.768682200605118e-05, 'epoch': 0.45} {'loss': 0.9749, 'learning_rate': 1.7686612617781082e-05, 'epoch': 0.45} {'loss': 0.9805, 'learning_rate': 1.7686403221274085e-05, 'epoch': 0.45} {'loss': 0.6479, 'learning_rate': 1.7686193816530414e-05, 'epoch': 0.45} {'loss': 0.9108, 'learning_rate': 1.768598440355029e-05, 'epoch': 0.45} {'loss': 0.7677, 'learning_rate': 1.7685774982333943e-05, 'epoch': 0.45} {'loss': 0.8242, 'learning_rate': 1.7685565552881593e-05, 'epoch': 0.45} {'loss': 0.9033, 'learning_rate': 1.7685356115193463e-05, 'epoch': 0.45} {'loss': 1.062, 'learning_rate': 1.7685146669269785e-05, 'epoch': 0.45} {'loss': 0.7963, 'learning_rate': 1.7684937215110778e-05, 'epoch': 0.45} {'loss': 0.7375, 'learning_rate': 1.7684727752716666e-05, 'epoch': 0.45} {'loss': 0.8193, 'learning_rate': 1.7684518282087673e-05, 'epoch': 0.45} {'loss': 0.8488, 'learning_rate': 1.7684308803224025e-05, 'epoch': 0.45} {'loss': 0.836, 'learning_rate': 1.768409931612595e-05, 'epoch': 0.45} {'loss': 0.7809, 'learning_rate': 1.7683889820793667e-05, 'epoch': 0.45} {'loss': 0.774, 'learning_rate': 1.76836803172274e-05, 'epoch': 0.45} {'loss': 0.9732, 'learning_rate': 1.7683470805427382e-05, 'epoch': 0.45} {'loss': 0.8283, 'learning_rate': 1.768326128539383e-05, 'epoch': 0.45} {'loss': 0.7365, 'learning_rate': 1.768305175712697e-05, 'epoch': 0.45} {'loss': 0.7481, 'learning_rate': 1.7682842220627022e-05, 'epoch': 0.45} {'loss': 0.9272, 'learning_rate': 1.768263267589422e-05, 'epoch': 0.45} {'loss': 0.7696, 'learning_rate': 1.7682423122928782e-05, 'epoch': 0.45} {'loss': 0.9006, 'learning_rate': 1.7682213561730933e-05, 'epoch': 0.45} {'loss': 0.8552, 'learning_rate': 1.76820039923009e-05, 'epoch': 0.45} {'loss': 0.933, 'learning_rate': 1.768179441463891e-05, 'epoch': 0.45} {'loss': 0.9993, 'learning_rate': 1.7681584828745177e-05, 'epoch': 0.45} {'loss': 0.8849, 'learning_rate': 1.768137523461994e-05, 'epoch': 0.45} {'loss': 0.7734, 'learning_rate': 1.7681165632263407e-05, 'epoch': 0.45} {'loss': 0.8192, 'learning_rate': 1.768095602167582e-05, 'epoch': 0.45} {'loss': 0.8805, 'learning_rate': 1.7680746402857388e-05, 'epoch': 0.45} {'loss': 0.8529, 'learning_rate': 1.768053677580835e-05, 'epoch': 0.45} {'loss': 0.8305, 'learning_rate': 1.768032714052892e-05, 'epoch': 0.45} {'loss': 1.0487, 'learning_rate': 1.7680117497019327e-05, 'epoch': 0.45} {'loss': 0.7212, 'learning_rate': 1.7679907845279795e-05, 'epoch': 0.45} {'loss': 0.7339, 'learning_rate': 1.767969818531055e-05, 'epoch': 0.45} {'loss': 0.8869, 'learning_rate': 1.7679488517111815e-05, 'epoch': 0.45} {'loss': 0.8128, 'learning_rate': 1.767927884068381e-05, 'epoch': 0.45} {'loss': 1.0069, 'learning_rate': 1.767906915602677e-05, 'epoch': 0.45} {'loss': 0.8477, 'learning_rate': 1.7678859463140914e-05, 'epoch': 0.45} {'loss': 0.803, 'learning_rate': 1.7678649762026463e-05, 'epoch': 0.45} {'loss': 0.7911, 'learning_rate': 1.7678440052683653e-05, 'epoch': 0.45} {'loss': 0.8497, 'learning_rate': 1.7678230335112694e-05, 'epoch': 0.45} {'loss': 0.8564, 'learning_rate': 1.767802060931382e-05, 'epoch': 0.45} {'loss': 0.9264, 'learning_rate': 1.7677810875287255e-05, 'epoch': 0.45} {'loss': 0.8749, 'learning_rate': 1.7677601133033224e-05, 'epoch': 0.45} {'loss': 0.848, 'learning_rate': 1.767739138255195e-05, 'epoch': 0.45} {'loss': 0.871, 'learning_rate': 1.7677181623843654e-05, 'epoch': 0.45} {'loss': 0.9841, 'learning_rate': 1.767697185690857e-05, 'epoch': 0.45} {'loss': 0.9165, 'learning_rate': 1.7676762081746915e-05, 'epoch': 0.45} {'loss': 1.0761, 'learning_rate': 1.767655229835892e-05, 'epoch': 0.45} {'loss': 0.8937, 'learning_rate': 1.7676342506744803e-05, 'epoch': 0.45} {'loss': 0.8956, 'learning_rate': 1.7676132706904793e-05, 'epoch': 0.45} {'loss': 0.6959, 'learning_rate': 1.7675922898839113e-05, 'epoch': 0.45} {'loss': 0.8301, 'learning_rate': 1.7675713082547995e-05, 'epoch': 0.45} {'loss': 0.7668, 'learning_rate': 1.767550325803165e-05, 'epoch': 0.45} {'loss': 0.9189, 'learning_rate': 1.767529342529031e-05, 'epoch': 0.45} {'loss': 0.8377, 'learning_rate': 1.7675083584324208e-05, 'epoch': 0.45} {'loss': 0.8643, 'learning_rate': 1.7674873735133554e-05, 'epoch': 0.45} {'loss': 0.9315, 'learning_rate': 1.7674663877718587e-05, 'epoch': 0.45} {'loss': 0.8368, 'learning_rate': 1.767445401207952e-05, 'epoch': 0.45} {'loss': 0.8541, 'learning_rate': 1.767424413821658e-05, 'epoch': 0.45} {'loss': 0.838, 'learning_rate': 1.767403425613e-05, 'epoch': 0.45} {'loss': 0.7241, 'learning_rate': 1.767382436582e-05, 'epoch': 0.45} {'loss': 0.7635, 'learning_rate': 1.76736144672868e-05, 'epoch': 0.45} {'loss': 0.676, 'learning_rate': 1.7673404560530633e-05, 'epoch': 0.45} {'loss': 0.7035, 'learning_rate': 1.767319464555172e-05, 'epoch': 0.45} {'loss': 0.9391, 'learning_rate': 1.7672984722350288e-05, 'epoch': 0.45} {'loss': 0.8459, 'learning_rate': 1.7672774790926556e-05, 'epoch': 0.45} {'loss': 0.8049, 'learning_rate': 1.767256485128076e-05, 'epoch': 0.45} {'loss': 0.922, 'learning_rate': 1.767235490341311e-05, 'epoch': 0.45} {'loss': 0.917, 'learning_rate': 1.7672144947323847e-05, 'epoch': 0.45} {'loss': 0.8296, 'learning_rate': 1.7671934983013183e-05, 'epoch': 0.45} {'loss': 0.906, 'learning_rate': 1.767172501048135e-05, 'epoch': 0.45} {'loss': 0.9678, 'learning_rate': 1.767151502972857e-05, 'epoch': 0.45} {'loss': 0.7227, 'learning_rate': 1.767130504075507e-05, 'epoch': 0.45} {'loss': 0.8334, 'learning_rate': 1.7671095043561075e-05, 'epoch': 0.45} {'loss': 0.8572, 'learning_rate': 1.767088503814681e-05, 'epoch': 0.45} {'loss': 0.8074, 'learning_rate': 1.7670675024512495e-05, 'epoch': 0.45} {'loss': 0.8784, 'learning_rate': 1.7670465002658366e-05, 'epoch': 0.45} {'loss': 0.8773, 'learning_rate': 1.7670254972584636e-05, 'epoch': 0.45} {'loss': 0.9774, 'learning_rate': 1.7670044934291536e-05, 'epoch': 0.45} {'loss': 0.7865, 'learning_rate': 1.7669834887779292e-05, 'epoch': 0.45} {'loss': 0.8934, 'learning_rate': 1.766962483304813e-05, 'epoch': 0.45} {'loss': 0.8693, 'learning_rate': 1.7669414770098268e-05, 'epoch': 0.45} {'loss': 0.9245, 'learning_rate': 1.766920469892994e-05, 'epoch': 0.45} {'loss': 0.945, 'learning_rate': 1.7668994619543367e-05, 'epoch': 0.45} {'loss': 0.9905, 'learning_rate': 1.766878453193877e-05, 'epoch': 0.45} {'loss': 0.8136, 'learning_rate': 1.766857443611638e-05, 'epoch': 0.45} {'loss': 0.8034, 'learning_rate': 1.766836433207642e-05, 'epoch': 0.45} {'loss': 0.8557, 'learning_rate': 1.766815421981912e-05, 'epoch': 0.45} {'loss': 0.8738, 'learning_rate': 1.7667944099344697e-05, 'epoch': 0.45} {'loss': 0.9121, 'learning_rate': 1.7667733970653378e-05, 'epoch': 0.45} {'loss': 0.8808, 'learning_rate': 1.7667523833745392e-05, 'epoch': 0.45} {'loss': 0.751, 'learning_rate': 1.7667313688620962e-05, 'epoch': 0.45} {'loss': 0.602, 'learning_rate': 1.7667103535280317e-05, 'epoch': 0.45} {'loss': 0.7217, 'learning_rate': 1.7666893373723675e-05, 'epoch': 0.45} {'loss': 0.7218, 'learning_rate': 1.766668320395126e-05, 'epoch': 0.45} {'loss': 0.9342, 'learning_rate': 1.7666473025963312e-05, 'epoch': 0.45} {'loss': 0.8019, 'learning_rate': 1.7666262839760038e-05, 'epoch': 0.45} {'loss': 0.8429, 'learning_rate': 1.7666052645341676e-05, 'epoch': 0.45} {'loss': 0.9973, 'learning_rate': 1.7665842442708446e-05, 'epoch': 0.45} {'loss': 0.7284, 'learning_rate': 1.766563223186057e-05, 'epoch': 0.45} {'loss': 0.9928, 'learning_rate': 1.7665422012798284e-05, 'epoch': 0.45} {'loss': 0.7467, 'learning_rate': 1.7665211785521803e-05, 'epoch': 0.45} {'loss': 0.7475, 'learning_rate': 1.7665001550031355e-05, 'epoch': 0.45} {'loss': 0.9606, 'learning_rate': 1.7664791306327164e-05, 'epoch': 0.45} {'loss': 0.8831, 'learning_rate': 1.766458105440946e-05, 'epoch': 0.45} {'loss': 0.8784, 'learning_rate': 1.7664370794278466e-05, 'epoch': 0.45} {'loss': 0.7493, 'learning_rate': 1.766416052593441e-05, 'epoch': 0.45} {'loss': 0.9413, 'learning_rate': 1.766395024937751e-05, 'epoch': 0.45} {'loss': 0.7923, 'learning_rate': 1.7663739964607997e-05, 'epoch': 0.45} {'loss': 0.7884, 'learning_rate': 1.7663529671626092e-05, 'epoch': 0.45} {'loss': 1.0109, 'learning_rate': 1.7663319370432024e-05, 'epoch': 0.45} {'loss': 0.7564, 'learning_rate': 1.7663109061026022e-05, 'epoch': 0.45} {'loss': 0.8672, 'learning_rate': 1.76628987434083e-05, 'epoch': 0.45} {'loss': 0.8073, 'learning_rate': 1.7662688417579098e-05, 'epoch': 0.45} {'loss': 0.7947, 'learning_rate': 1.766247808353863e-05, 'epoch': 0.45} {'loss': 0.758, 'learning_rate': 1.7662267741287123e-05, 'epoch': 0.45} {'loss': 0.7111, 'learning_rate': 1.766205739082481e-05, 'epoch': 0.45} {'loss': 0.8729, 'learning_rate': 1.7661847032151906e-05, 'epoch': 0.45} {'loss': 0.9006, 'learning_rate': 1.7661636665268644e-05, 'epoch': 0.45} {'loss': 0.8858, 'learning_rate': 1.7661426290175247e-05, 'epoch': 0.45} {'loss': 0.9303, 'learning_rate': 1.766121590687194e-05, 'epoch': 0.45} {'loss': 0.8746, 'learning_rate': 1.7661005515358948e-05, 'epoch': 0.45} {'loss': 0.8117, 'learning_rate': 1.7660795115636496e-05, 'epoch': 0.45} {'loss': 0.8422, 'learning_rate': 1.766058470770481e-05, 'epoch': 0.45} {'loss': 0.7584, 'learning_rate': 1.766037429156412e-05, 'epoch': 0.45} {'loss': 0.9078, 'learning_rate': 1.7660163867214645e-05, 'epoch': 0.45} {'loss': 1.0036, 'learning_rate': 1.7659953434656612e-05, 'epoch': 0.45} {'loss': 0.8438, 'learning_rate': 1.765974299389025e-05, 'epoch': 0.45} {'loss': 0.8876, 'learning_rate': 1.7659532544915784e-05, 'epoch': 0.45} {'loss': 0.884, 'learning_rate': 1.7659322087733432e-05, 'epoch': 0.45} {'loss': 0.8005, 'learning_rate': 1.765911162234343e-05, 'epoch': 0.45} {'loss': 0.8209, 'learning_rate': 1.7658901148745996e-05, 'epoch': 0.45} {'loss': 0.8086, 'learning_rate': 1.765869066694136e-05, 'epoch': 0.45} {'loss': 0.7646, 'learning_rate': 1.7658480176929742e-05, 'epoch': 0.45} {'loss': 0.9035, 'learning_rate': 1.765826967871137e-05, 'epoch': 0.45} {'loss': 0.7522, 'learning_rate': 1.765805917228648e-05, 'epoch': 0.45} {'loss': 0.7319, 'learning_rate': 1.765784865765528e-05, 'epoch': 0.45} {'loss': 0.7764, 'learning_rate': 1.7657638134818008e-05, 'epoch': 0.45} {'loss': 0.8771, 'learning_rate': 1.7657427603774885e-05, 'epoch': 0.45} {'loss': 0.7232, 'learning_rate': 1.7657217064526134e-05, 'epoch': 0.45} {'loss': 0.9125, 'learning_rate': 1.7657006517071988e-05, 'epoch': 0.45} {'loss': 0.9839, 'learning_rate': 1.7656795961412668e-05, 'epoch': 0.45} {'loss': 0.7507, 'learning_rate': 1.7656585397548397e-05, 'epoch': 0.45} {'loss': 0.8467, 'learning_rate': 1.7656374825479406e-05, 'epoch': 0.45} {'loss': 0.9377, 'learning_rate': 1.7656164245205918e-05, 'epoch': 0.45} {'loss': 0.7802, 'learning_rate': 1.765595365672816e-05, 'epoch': 0.45} {'loss': 0.8569, 'learning_rate': 1.7655743060046354e-05, 'epoch': 0.45} {'loss': 0.8072, 'learning_rate': 1.765553245516073e-05, 'epoch': 0.45} {'loss': 0.8176, 'learning_rate': 1.7655321842071514e-05, 'epoch': 0.45} {'loss': 0.7575, 'learning_rate': 1.7655111220778924e-05, 'epoch': 0.45} {'loss': 0.8421, 'learning_rate': 1.7654900591283196e-05, 'epoch': 0.45} {'loss': 0.8781, 'learning_rate': 1.765468995358455e-05, 'epoch': 0.45} {'loss': 0.9472, 'learning_rate': 1.765447930768321e-05, 'epoch': 0.45} {'loss': 0.8227, 'learning_rate': 1.765426865357941e-05, 'epoch': 0.45} {'loss': 0.813, 'learning_rate': 1.7654057991273368e-05, 'epoch': 0.45} {'loss': 0.9216, 'learning_rate': 1.765384732076531e-05, 'epoch': 0.45} {'loss': 0.8057, 'learning_rate': 1.765363664205547e-05, 'epoch': 0.45} {'loss': 0.7969, 'learning_rate': 1.765342595514406e-05, 'epoch': 0.45} {'loss': 0.6741, 'learning_rate': 1.765321526003132e-05, 'epoch': 0.45} {'loss': 0.72, 'learning_rate': 1.7653004556717466e-05, 'epoch': 0.45} {'loss': 0.7742, 'learning_rate': 1.7652793845202725e-05, 'epoch': 0.45} {'loss': 0.9036, 'learning_rate': 1.7652583125487326e-05, 'epoch': 0.45} {'loss': 0.88, 'learning_rate': 1.7652372397571493e-05, 'epoch': 0.45} {'loss': 0.8227, 'learning_rate': 1.7652161661455452e-05, 'epoch': 0.45} {'loss': 0.927, 'learning_rate': 1.765195091713943e-05, 'epoch': 0.45} {'loss': 1.0322, 'learning_rate': 1.7651740164623654e-05, 'epoch': 0.45} {'loss': 1.1202, 'learning_rate': 1.7651529403908347e-05, 'epoch': 0.45} {'loss': 0.8932, 'learning_rate': 1.7651318634993733e-05, 'epoch': 0.45} {'loss': 1.0375, 'learning_rate': 1.765110785788004e-05, 'epoch': 0.45} {'loss': 0.7048, 'learning_rate': 1.76508970725675e-05, 'epoch': 0.45} {'loss': 0.8524, 'learning_rate': 1.7650686279056328e-05, 'epoch': 0.45} {'loss': 0.6947, 'learning_rate': 1.7650475477346757e-05, 'epoch': 0.45} {'loss': 0.9389, 'learning_rate': 1.7650264667439012e-05, 'epoch': 0.45} {'loss': 0.9613, 'learning_rate': 1.7650053849333316e-05, 'epoch': 0.45} {'loss': 0.9386, 'learning_rate': 1.7649843023029897e-05, 'epoch': 0.45} {'loss': 0.8798, 'learning_rate': 1.7649632188528984e-05, 'epoch': 0.45} {'loss': 0.8932, 'learning_rate': 1.7649421345830794e-05, 'epoch': 0.45} {'loss': 0.9824, 'learning_rate': 1.7649210494935562e-05, 'epoch': 0.45} {'loss': 0.944, 'learning_rate': 1.764899963584351e-05, 'epoch': 0.45} {'loss': 0.8309, 'learning_rate': 1.7648788768554867e-05, 'epoch': 0.45} {'loss': 0.9629, 'learning_rate': 1.7648577893069855e-05, 'epoch': 0.45} {'loss': 0.7387, 'learning_rate': 1.76483670093887e-05, 'epoch': 0.45} {'loss': 0.8182, 'learning_rate': 1.7648156117511626e-05, 'epoch': 0.45} {'loss': 0.7711, 'learning_rate': 1.764794521743887e-05, 'epoch': 0.45} {'loss': 0.8616, 'learning_rate': 1.7647734309170648e-05, 'epoch': 0.45} {'loss': 0.8793, 'learning_rate': 1.7647523392707188e-05, 'epoch': 0.45} {'loss': 0.92, 'learning_rate': 1.7647312468048715e-05, 'epoch': 0.45} {'loss': 0.866, 'learning_rate': 1.7647101535195456e-05, 'epoch': 0.45} {'loss': 0.7921, 'learning_rate': 1.764689059414764e-05, 'epoch': 0.45} {'loss': 0.9914, 'learning_rate': 1.764667964490549e-05, 'epoch': 0.45} {'loss': 0.8229, 'learning_rate': 1.764646868746923e-05, 'epoch': 0.45} {'loss': 0.8054, 'learning_rate': 1.7646257721839092e-05, 'epoch': 0.45} {'loss': 0.7143, 'learning_rate': 1.7646046748015296e-05, 'epoch': 0.45} {'loss': 0.891, 'learning_rate': 1.7645835765998076e-05, 'epoch': 0.45} {'loss': 0.8939, 'learning_rate': 1.764562477578765e-05, 'epoch': 0.45} {'loss': 0.8528, 'learning_rate': 1.7645413777384245e-05, 'epoch': 0.45} {'loss': 0.8952, 'learning_rate': 1.764520277078809e-05, 'epoch': 0.45} {'loss': 0.8405, 'learning_rate': 1.764499175599941e-05, 'epoch': 0.45} {'loss': 0.8172, 'learning_rate': 1.7644780733018433e-05, 'epoch': 0.45} {'loss': 1.0265, 'learning_rate': 1.7644569701845383e-05, 'epoch': 0.45} {'loss': 0.8336, 'learning_rate': 1.7644358662480482e-05, 'epoch': 0.45} {'loss': 0.8009, 'learning_rate': 1.764414761492397e-05, 'epoch': 0.45} {'loss': 0.9039, 'learning_rate': 1.7643936559176055e-05, 'epoch': 0.45} {'loss': 0.8668, 'learning_rate': 1.7643725495236976e-05, 'epoch': 0.45} {'loss': 0.8862, 'learning_rate': 1.7643514423106953e-05, 'epoch': 0.45} {'loss': 0.8953, 'learning_rate': 1.764330334278622e-05, 'epoch': 0.45} {'loss': 0.7975, 'learning_rate': 1.7643092254274993e-05, 'epoch': 0.45} {'loss': 0.8399, 'learning_rate': 1.76428811575735e-05, 'epoch': 0.45} {'loss': 0.9667, 'learning_rate': 1.7642670052681977e-05, 'epoch': 0.45} {'loss': 1.0779, 'learning_rate': 1.764245893960064e-05, 'epoch': 0.45} {'loss': 0.9608, 'learning_rate': 1.764224781832972e-05, 'epoch': 0.45} {'loss': 0.8775, 'learning_rate': 1.764203668886944e-05, 'epoch': 0.45} {'loss': 0.8507, 'learning_rate': 1.7641825551220026e-05, 'epoch': 0.45} {'loss': 0.7981, 'learning_rate': 1.7641614405381707e-05, 'epoch': 0.45} {'loss': 0.7903, 'learning_rate': 1.764140325135471e-05, 'epoch': 0.45} {'loss': 0.8394, 'learning_rate': 1.7641192089139262e-05, 'epoch': 0.45} {'loss': 0.8227, 'learning_rate': 1.7640980918735585e-05, 'epoch': 0.45} {'loss': 0.9676, 'learning_rate': 1.7640769740143902e-05, 'epoch': 0.45} {'loss': 0.8235, 'learning_rate': 1.7640558553364453e-05, 'epoch': 0.45} {'loss': 0.8198, 'learning_rate': 1.764034735839745e-05, 'epoch': 0.45} {'loss': 0.8573, 'learning_rate': 1.7640136155243127e-05, 'epoch': 0.45} {'loss': 0.907, 'learning_rate': 1.763992494390171e-05, 'epoch': 0.45} {'loss': 1.0341, 'learning_rate': 1.7639713724373427e-05, 'epoch': 0.45} {'loss': 0.8576, 'learning_rate': 1.7639502496658495e-05, 'epoch': 0.45} {'loss': 0.871, 'learning_rate': 1.763929126075715e-05, 'epoch': 0.45} {'loss': 0.9334, 'learning_rate': 1.7639080016669612e-05, 'epoch': 0.45} {'loss': 0.9516, 'learning_rate': 1.7638868764396112e-05, 'epoch': 0.45} {'loss': 0.6746, 'learning_rate': 1.7638657503936875e-05, 'epoch': 0.45} {'loss': 1.0468, 'learning_rate': 1.7638446235292125e-05, 'epoch': 0.45} {'loss': 0.9591, 'learning_rate': 1.7638234958462096e-05, 'epoch': 0.45} {'loss': 0.7762, 'learning_rate': 1.7638023673447e-05, 'epoch': 0.45} {'loss': 0.888, 'learning_rate': 1.7637812380247078e-05, 'epoch': 0.45} {'loss': 0.763, 'learning_rate': 1.7637601078862553e-05, 'epoch': 0.45} {'loss': 0.8691, 'learning_rate': 1.7637389769293647e-05, 'epoch': 0.45} {'loss': 0.8361, 'learning_rate': 1.7637178451540587e-05, 'epoch': 0.45} {'loss': 0.7853, 'learning_rate': 1.7636967125603602e-05, 'epoch': 0.45} {'loss': 0.9359, 'learning_rate': 1.7636755791482914e-05, 'epoch': 0.45} {'loss': 0.997, 'learning_rate': 1.763654444917876e-05, 'epoch': 0.45} {'loss': 0.8777, 'learning_rate': 1.7636333098691356e-05, 'epoch': 0.45} {'loss': 0.9244, 'learning_rate': 1.763612174002093e-05, 'epoch': 0.45} {'loss': 0.9221, 'learning_rate': 1.763591037316771e-05, 'epoch': 0.45} {'loss': 0.7768, 'learning_rate': 1.7635698998131925e-05, 'epoch': 0.45} {'loss': 0.8584, 'learning_rate': 1.76354876149138e-05, 'epoch': 0.45} {'loss': 0.8259, 'learning_rate': 1.7635276223513558e-05, 'epoch': 0.45} {'loss': 0.5327, 'learning_rate': 1.763506482393143e-05, 'epoch': 0.45} {'loss': 0.8329, 'learning_rate': 1.763485341616764e-05, 'epoch': 0.45} {'loss': 0.9294, 'learning_rate': 1.7634642000222418e-05, 'epoch': 0.45} {'loss': 0.9257, 'learning_rate': 1.7634430576095985e-05, 'epoch': 0.45} {'loss': 0.9303, 'learning_rate': 1.7634219143788573e-05, 'epoch': 0.45} {'loss': 0.7777, 'learning_rate': 1.7634007703300404e-05, 'epoch': 0.45} {'loss': 0.9351, 'learning_rate': 1.7633796254631707e-05, 'epoch': 0.45} {'loss': 0.9437, 'learning_rate': 1.763358479778271e-05, 'epoch': 0.45} {'loss': 1.045, 'learning_rate': 1.763337333275364e-05, 'epoch': 0.45} {'loss': 0.7662, 'learning_rate': 1.7633161859544717e-05, 'epoch': 0.45} {'loss': 0.9912, 'learning_rate': 1.7632950378156174e-05, 'epoch': 0.45} {'loss': 0.8193, 'learning_rate': 1.7632738888588233e-05, 'epoch': 0.45} {'loss': 0.8865, 'learning_rate': 1.763252739084113e-05, 'epoch': 0.45} {'loss': 0.9115, 'learning_rate': 1.7632315884915078e-05, 'epoch': 0.45} {'loss': 1.0018, 'learning_rate': 1.7632104370810314e-05, 'epoch': 0.45} {'loss': 0.739, 'learning_rate': 1.763189284852706e-05, 'epoch': 0.45} {'loss': 0.7706, 'learning_rate': 1.7631681318065548e-05, 'epoch': 0.45} {'loss': 0.8323, 'learning_rate': 1.7631469779425997e-05, 'epoch': 0.45} {'loss': 0.7941, 'learning_rate': 1.7631258232608637e-05, 'epoch': 0.45} {'loss': 0.8554, 'learning_rate': 1.7631046677613697e-05, 'epoch': 0.45} {'loss': 0.8837, 'learning_rate': 1.76308351144414e-05, 'epoch': 0.45} {'loss': 0.9613, 'learning_rate': 1.7630623543091976e-05, 'epoch': 0.45} {'loss': 0.9166, 'learning_rate': 1.763041196356565e-05, 'epoch': 0.45} {'loss': 0.9254, 'learning_rate': 1.7630200375862647e-05, 'epoch': 0.45} {'loss': 0.715, 'learning_rate': 1.7629988779983198e-05, 'epoch': 0.45} {'loss': 1.0452, 'learning_rate': 1.7629777175927526e-05, 'epoch': 0.45} {'loss': 0.9637, 'learning_rate': 1.762956556369586e-05, 'epoch': 0.45} {'loss': 0.923, 'learning_rate': 1.7629353943288425e-05, 'epoch': 0.45} {'loss': 0.838, 'learning_rate': 1.762914231470545e-05, 'epoch': 0.45} {'loss': 0.7674, 'learning_rate': 1.7628930677947158e-05, 'epoch': 0.45} {'loss': 0.8636, 'learning_rate': 1.7628719033013778e-05, 'epoch': 0.45} {'loss': 1.0618, 'learning_rate': 1.762850737990554e-05, 'epoch': 0.45} {'loss': 0.8176, 'learning_rate': 1.7628295718622666e-05, 'epoch': 0.45} {'loss': 0.7412, 'learning_rate': 1.7628084049165385e-05, 'epoch': 0.45} {'loss': 0.9471, 'learning_rate': 1.7627872371533924e-05, 'epoch': 0.45} {'loss': 0.8333, 'learning_rate': 1.762766068572851e-05, 'epoch': 0.45} {'loss': 0.814, 'learning_rate': 1.7627448991749368e-05, 'epoch': 0.45} {'loss': 0.7689, 'learning_rate': 1.7627237289596727e-05, 'epoch': 0.45} {'loss': 0.738, 'learning_rate': 1.762702557927081e-05, 'epoch': 0.45} {'loss': 0.8485, 'learning_rate': 1.7626813860771846e-05, 'epoch': 0.45} {'loss': 0.8925, 'learning_rate': 1.7626602134100068e-05, 'epoch': 0.45} {'loss': 0.8169, 'learning_rate': 1.7626390399255695e-05, 'epoch': 0.45} {'loss': 0.874, 'learning_rate': 1.7626178656238956e-05, 'epoch': 0.45} {'loss': 0.7448, 'learning_rate': 1.7625966905050077e-05, 'epoch': 0.45} {'loss': 0.801, 'learning_rate': 1.762575514568929e-05, 'epoch': 0.45} {'loss': 0.8603, 'learning_rate': 1.7625543378156813e-05, 'epoch': 0.45} {'loss': 0.8213, 'learning_rate': 1.7625331602452882e-05, 'epoch': 0.45} {'loss': 0.8283, 'learning_rate': 1.762511981857772e-05, 'epoch': 0.45} {'loss': 0.8413, 'learning_rate': 1.762490802653155e-05, 'epoch': 0.45} {'loss': 0.909, 'learning_rate': 1.7624696226314606e-05, 'epoch': 0.45} {'loss': 0.8325, 'learning_rate': 1.762448441792711e-05, 'epoch': 0.45} {'loss': 0.8867, 'learning_rate': 1.7624272601369293e-05, 'epoch': 0.45} {'loss': 0.9275, 'learning_rate': 1.762406077664138e-05, 'epoch': 0.45} {'loss': 0.8693, 'learning_rate': 1.7623848943743595e-05, 'epoch': 0.45} {'loss': 0.8242, 'learning_rate': 1.762363710267617e-05, 'epoch': 0.45} {'loss': 0.9131, 'learning_rate': 1.762342525343933e-05, 'epoch': 0.45} {'loss': 0.8376, 'learning_rate': 1.7623213396033297e-05, 'epoch': 0.45} {'loss': 0.8663, 'learning_rate': 1.7623001530458307e-05, 'epoch': 0.45} {'loss': 0.8257, 'learning_rate': 1.762278965671458e-05, 'epoch': 0.45} {'loss': 0.9186, 'learning_rate': 1.762257777480235e-05, 'epoch': 0.45} {'loss': 0.7649, 'learning_rate': 1.7622365884721838e-05, 'epoch': 0.45} {'loss': 1.067, 'learning_rate': 1.7622153986473276e-05, 'epoch': 0.45} {'loss': 0.8768, 'learning_rate': 1.7621942080056885e-05, 'epoch': 0.45} {'loss': 0.6456, 'learning_rate': 1.7621730165472894e-05, 'epoch': 0.45} {'loss': 0.9717, 'learning_rate': 1.7621518242721533e-05, 'epoch': 0.45} {'loss': 1.0707, 'learning_rate': 1.762130631180303e-05, 'epoch': 0.45} {'loss': 0.9387, 'learning_rate': 1.7621094372717604e-05, 'epoch': 0.45} {'loss': 1.0199, 'learning_rate': 1.762088242546549e-05, 'epoch': 0.45} {'loss': 0.8056, 'learning_rate': 1.762067047004691e-05, 'epoch': 0.45} {'loss': 0.9635, 'learning_rate': 1.7620458506462097e-05, 'epoch': 0.45} {'loss': 0.8974, 'learning_rate': 1.7620246534711273e-05, 'epoch': 0.45} {'loss': 0.8921, 'learning_rate': 1.762003455479467e-05, 'epoch': 0.45} {'loss': 0.8113, 'learning_rate': 1.7619822566712513e-05, 'epoch': 0.45} {'loss': 0.8515, 'learning_rate': 1.7619610570465022e-05, 'epoch': 0.45} {'loss': 0.8752, 'learning_rate': 1.7619398566052438e-05, 'epoch': 0.45} {'loss': 0.8668, 'learning_rate': 1.7619186553474978e-05, 'epoch': 0.45} {'loss': 0.8028, 'learning_rate': 1.761897453273287e-05, 'epoch': 0.45} {'loss': 0.8015, 'learning_rate': 1.7618762503826345e-05, 'epoch': 0.45} {'loss': 0.8368, 'learning_rate': 1.7618550466755626e-05, 'epoch': 0.45} {'loss': 0.7205, 'learning_rate': 1.7618338421520943e-05, 'epoch': 0.45} {'loss': 0.8254, 'learning_rate': 1.7618126368122526e-05, 'epoch': 0.45} {'loss': 0.9091, 'learning_rate': 1.7617914306560595e-05, 'epoch': 0.45} {'loss': 0.748, 'learning_rate': 1.7617702236835384e-05, 'epoch': 0.45} {'loss': 0.8942, 'learning_rate': 1.7617490158947116e-05, 'epoch': 0.45} {'loss': 0.8906, 'learning_rate': 1.761727807289602e-05, 'epoch': 0.45} {'loss': 0.7167, 'learning_rate': 1.7617065978682327e-05, 'epoch': 0.45} {'loss': 0.6043, 'learning_rate': 1.7616853876306256e-05, 'epoch': 0.45} {'loss': 0.833, 'learning_rate': 1.761664176576804e-05, 'epoch': 0.45} {'loss': 0.917, 'learning_rate': 1.76164296470679e-05, 'epoch': 0.45} {'loss': 0.7763, 'learning_rate': 1.7616217520206076e-05, 'epoch': 0.45} {'loss': 0.9341, 'learning_rate': 1.7616005385182784e-05, 'epoch': 0.45} {'loss': 0.8746, 'learning_rate': 1.7615793241998257e-05, 'epoch': 0.45} {'loss': 0.8556, 'learning_rate': 1.7615581090652714e-05, 'epoch': 0.45} {'loss': 0.8817, 'learning_rate': 1.7615368931146395e-05, 'epoch': 0.45} {'loss': 1.0059, 'learning_rate': 1.7615156763479517e-05, 'epoch': 0.45} {'loss': 0.7208, 'learning_rate': 1.7614944587652313e-05, 'epoch': 0.45} {'loss': 0.8252, 'learning_rate': 1.761473240366501e-05, 'epoch': 0.45} {'loss': 0.708, 'learning_rate': 1.7614520211517832e-05, 'epoch': 0.45} {'loss': 0.8118, 'learning_rate': 1.7614308011211007e-05, 'epoch': 0.45} {'loss': 0.8291, 'learning_rate': 1.7614095802744767e-05, 'epoch': 0.45} {'loss': 0.801, 'learning_rate': 1.7613883586119333e-05, 'epoch': 0.45} {'loss': 0.7159, 'learning_rate': 1.761367136133494e-05, 'epoch': 0.45} {'loss': 0.768, 'learning_rate': 1.7613459128391805e-05, 'epoch': 0.45} {'loss': 0.8045, 'learning_rate': 1.7613246887290165e-05, 'epoch': 0.45} {'loss': 0.8029, 'learning_rate': 1.7613034638030243e-05, 'epoch': 0.45} {'loss': 0.9482, 'learning_rate': 1.7612822380612268e-05, 'epoch': 0.45} {'loss': 0.966, 'learning_rate': 1.7612610115036468e-05, 'epoch': 0.45} {'loss': 0.8889, 'learning_rate': 1.7612397841303064e-05, 'epoch': 0.45} {'loss': 0.8566, 'learning_rate': 1.7612185559412294e-05, 'epoch': 0.45} {'loss': 0.7965, 'learning_rate': 1.7611973269364378e-05, 'epoch': 0.45} {'loss': 0.8186, 'learning_rate': 1.7611760971159544e-05, 'epoch': 0.45} {'loss': 0.8506, 'learning_rate': 1.7611548664798024e-05, 'epoch': 0.45} {'loss': 0.8805, 'learning_rate': 1.761133635028004e-05, 'epoch': 0.45} {'loss': 0.9812, 'learning_rate': 1.7611124027605827e-05, 'epoch': 0.45} {'loss': 1.0075, 'learning_rate': 1.7610911696775602e-05, 'epoch': 0.45} {'loss': 0.9406, 'learning_rate': 1.76106993577896e-05, 'epoch': 0.45} {'loss': 0.8823, 'learning_rate': 1.761048701064805e-05, 'epoch': 0.45} {'loss': 0.9731, 'learning_rate': 1.7610274655351172e-05, 'epoch': 0.45} {'loss': 0.9134, 'learning_rate': 1.76100622918992e-05, 'epoch': 0.45} {'loss': 0.8979, 'learning_rate': 1.760984992029236e-05, 'epoch': 0.45} {'loss': 0.8467, 'learning_rate': 1.7609637540530876e-05, 'epoch': 0.45} {'loss': 0.8687, 'learning_rate': 1.760942515261498e-05, 'epoch': 0.45} {'loss': 0.8678, 'learning_rate': 1.76092127565449e-05, 'epoch': 0.45} {'loss': 0.9239, 'learning_rate': 1.7609000352320858e-05, 'epoch': 0.45} {'loss': 0.8436, 'learning_rate': 1.7608787939943088e-05, 'epoch': 0.45} {'loss': 0.886, 'learning_rate': 1.7608575519411816e-05, 'epoch': 0.45} {'loss': 1.0009, 'learning_rate': 1.7608363090727265e-05, 'epoch': 0.45} {'loss': 0.7542, 'learning_rate': 1.7608150653889667e-05, 'epoch': 0.45} {'loss': 0.8925, 'learning_rate': 1.7607938208899252e-05, 'epoch': 0.45} {'loss': 0.7826, 'learning_rate': 1.7607725755756246e-05, 'epoch': 0.45} {'loss': 0.8247, 'learning_rate': 1.760751329446087e-05, 'epoch': 0.45} {'loss': 0.7727, 'learning_rate': 1.7607300825013357e-05, 'epoch': 0.45} {'loss': 0.87, 'learning_rate': 1.7607088347413938e-05, 'epoch': 0.45} {'loss': 0.8624, 'learning_rate': 1.7606875861662837e-05, 'epoch': 0.45} {'loss': 0.8211, 'learning_rate': 1.760666336776028e-05, 'epoch': 0.45} {'loss': 0.8768, 'learning_rate': 1.7606450865706498e-05, 'epoch': 0.45} {'loss': 0.7494, 'learning_rate': 1.7606238355501715e-05, 'epoch': 0.45} {'loss': 0.7601, 'learning_rate': 1.7606025837146164e-05, 'epoch': 0.45} {'loss': 0.8661, 'learning_rate': 1.7605813310640066e-05, 'epoch': 0.45} {'loss': 1.0821, 'learning_rate': 1.7605600775983657e-05, 'epoch': 0.45} {'loss': 0.8533, 'learning_rate': 1.760538823317716e-05, 'epoch': 0.45} {'loss': 0.9084, 'learning_rate': 1.76051756822208e-05, 'epoch': 0.45} {'loss': 0.9568, 'learning_rate': 1.760496312311481e-05, 'epoch': 0.45} {'loss': 0.8472, 'learning_rate': 1.7604750555859416e-05, 'epoch': 0.45} {'loss': 0.9713, 'learning_rate': 1.7604537980454845e-05, 'epoch': 0.45} {'loss': 0.7856, 'learning_rate': 1.7604325396901325e-05, 'epoch': 0.45} {'loss': 1.0633, 'learning_rate': 1.7604112805199084e-05, 'epoch': 0.45} {'loss': 0.9063, 'learning_rate': 1.760390020534835e-05, 'epoch': 0.45} {'loss': 0.8376, 'learning_rate': 1.760368759734935e-05, 'epoch': 0.45} {'loss': 0.9504, 'learning_rate': 1.760347498120231e-05, 'epoch': 0.45} {'loss': 0.9303, 'learning_rate': 1.7603262356907464e-05, 'epoch': 0.45} {'loss': 0.9247, 'learning_rate': 1.7603049724465035e-05, 'epoch': 0.45} {'loss': 0.7394, 'learning_rate': 1.7602837083875254e-05, 'epoch': 0.45} {'loss': 0.824, 'learning_rate': 1.7602624435138344e-05, 'epoch': 0.45} {'loss': 0.9862, 'learning_rate': 1.7602411778254535e-05, 'epoch': 0.45} {'loss': 0.769, 'learning_rate': 1.760219911322406e-05, 'epoch': 0.46} {'loss': 0.7766, 'learning_rate': 1.7601986440047135e-05, 'epoch': 0.46} {'loss': 0.8319, 'learning_rate': 1.7601773758724e-05, 'epoch': 0.46} {'loss': 0.8484, 'learning_rate': 1.760156106925488e-05, 'epoch': 0.46} {'loss': 0.7918, 'learning_rate': 1.760134837164e-05, 'epoch': 0.46} {'loss': 0.9326, 'learning_rate': 1.760113566587959e-05, 'epoch': 0.46} {'loss': 1.0227, 'learning_rate': 1.7600922951973878e-05, 'epoch': 0.46} {'loss': 0.9722, 'learning_rate': 1.760071022992309e-05, 'epoch': 0.46} {'loss': 0.9181, 'learning_rate': 1.760049749972745e-05, 'epoch': 0.46} {'loss': 0.7839, 'learning_rate': 1.7600284761387194e-05, 'epoch': 0.46} {'loss': 0.9593, 'learning_rate': 1.7600072014902553e-05, 'epoch': 0.46} {'loss': 0.8861, 'learning_rate': 1.7599859260273738e-05, 'epoch': 0.46} {'loss': 0.7142, 'learning_rate': 1.7599646497500996e-05, 'epoch': 0.46} {'loss': 0.8139, 'learning_rate': 1.7599433726584544e-05, 'epoch': 0.46} {'loss': 0.9746, 'learning_rate': 1.7599220947524615e-05, 'epoch': 0.46} {'loss': 0.8552, 'learning_rate': 1.7599008160321433e-05, 'epoch': 0.46} {'loss': 0.9337, 'learning_rate': 1.7598795364975226e-05, 'epoch': 0.46} {'loss': 0.915, 'learning_rate': 1.7598582561486227e-05, 'epoch': 0.46} {'loss': 0.9014, 'learning_rate': 1.7598369749854662e-05, 'epoch': 0.46} {'loss': 0.9214, 'learning_rate': 1.7598156930080757e-05, 'epoch': 0.46} {'loss': 0.8656, 'learning_rate': 1.759794410216474e-05, 'epoch': 0.46} {'loss': 0.8868, 'learning_rate': 1.759773126610684e-05, 'epoch': 0.46} {'loss': 0.7367, 'learning_rate': 1.7597518421907285e-05, 'epoch': 0.46} {'loss': 1.0488, 'learning_rate': 1.7597305569566304e-05, 'epoch': 0.46} {'loss': 0.8873, 'learning_rate': 1.7597092709084124e-05, 'epoch': 0.46} {'loss': 0.8874, 'learning_rate': 1.759687984046097e-05, 'epoch': 0.46} {'loss': 0.805, 'learning_rate': 1.759666696369708e-05, 'epoch': 0.46} {'loss': 0.9021, 'learning_rate': 1.7596454078792673e-05, 'epoch': 0.46} {'loss': 0.7969, 'learning_rate': 1.759624118574798e-05, 'epoch': 0.46} {'loss': 0.8504, 'learning_rate': 1.7596028284563228e-05, 'epoch': 0.46} {'loss': 0.8071, 'learning_rate': 1.7595815375238648e-05, 'epoch': 0.46} {'loss': 0.7228, 'learning_rate': 1.7595602457774464e-05, 'epoch': 0.46} {'loss': 0.7428, 'learning_rate': 1.7595389532170907e-05, 'epoch': 0.46} {'loss': 0.9514, 'learning_rate': 1.7595176598428206e-05, 'epoch': 0.46} {'loss': 0.8628, 'learning_rate': 1.7594963656546587e-05, 'epoch': 0.46} {'loss': 0.7602, 'learning_rate': 1.759475070652628e-05, 'epoch': 0.46} {'loss': 0.9278, 'learning_rate': 1.759453774836751e-05, 'epoch': 0.46} {'loss': 0.8568, 'learning_rate': 1.759432478207051e-05, 'epoch': 0.46} {'loss': 0.6371, 'learning_rate': 1.7594111807635502e-05, 'epoch': 0.46} {'loss': 0.8197, 'learning_rate': 1.759389882506272e-05, 'epoch': 0.46} {'loss': 0.7939, 'learning_rate': 1.759368583435239e-05, 'epoch': 0.46} {'loss': 0.9123, 'learning_rate': 1.7593472835504738e-05, 'epoch': 0.46} {'loss': 0.9015, 'learning_rate': 1.759325982852e-05, 'epoch': 0.46} {'loss': 0.7505, 'learning_rate': 1.7593046813398392e-05, 'epoch': 0.46} {'loss': 0.921, 'learning_rate': 1.7592833790140152e-05, 'epoch': 0.46} {'loss': 0.7632, 'learning_rate': 1.759262075874551e-05, 'epoch': 0.46} {'loss': 0.8747, 'learning_rate': 1.7592407719214683e-05, 'epoch': 0.46} {'loss': 0.85, 'learning_rate': 1.7592194671547908e-05, 'epoch': 0.46} {'loss': 0.8719, 'learning_rate': 1.7591981615745412e-05, 'epoch': 0.46} {'loss': 0.9593, 'learning_rate': 1.759176855180742e-05, 'epoch': 0.46} {'loss': 0.8164, 'learning_rate': 1.7591555479734165e-05, 'epoch': 0.46} {'loss': 0.8901, 'learning_rate': 1.7591342399525872e-05, 'epoch': 0.46} {'loss': 0.9924, 'learning_rate': 1.7591129311182772e-05, 'epoch': 0.46} {'loss': 0.8054, 'learning_rate': 1.7590916214705093e-05, 'epoch': 0.46} {'loss': 0.7796, 'learning_rate': 1.759070311009306e-05, 'epoch': 0.46} {'loss': 0.7719, 'learning_rate': 1.7590489997346903e-05, 'epoch': 0.46} {'loss': 0.8491, 'learning_rate': 1.759027687646685e-05, 'epoch': 0.46} {'loss': 0.8261, 'learning_rate': 1.759006374745313e-05, 'epoch': 0.46} {'loss': 0.8672, 'learning_rate': 1.7589850610305977e-05, 'epoch': 0.46} {'loss': 0.8118, 'learning_rate': 1.7589637465025607e-05, 'epoch': 0.46} {'loss': 0.8286, 'learning_rate': 1.758942431161226e-05, 'epoch': 0.46} {'loss': 1.0273, 'learning_rate': 1.758921115006616e-05, 'epoch': 0.46} {'loss': 0.7329, 'learning_rate': 1.7588997980387533e-05, 'epoch': 0.46} {'loss': 0.7144, 'learning_rate': 1.758878480257661e-05, 'epoch': 0.46} {'loss': 0.7152, 'learning_rate': 1.758857161663362e-05, 'epoch': 0.46} {'loss': 0.8329, 'learning_rate': 1.7588358422558792e-05, 'epoch': 0.46} {'loss': 0.8418, 'learning_rate': 1.758814522035235e-05, 'epoch': 0.46} {'loss': 0.9875, 'learning_rate': 1.7587932010014527e-05, 'epoch': 0.46} {'loss': 0.8269, 'learning_rate': 1.758771879154555e-05, 'epoch': 0.46} {'loss': 0.8101, 'learning_rate': 1.7587505564945647e-05, 'epoch': 0.46} {'loss': 0.8409, 'learning_rate': 1.7587292330215047e-05, 'epoch': 0.46} {'loss': 0.7617, 'learning_rate': 1.7587079087353978e-05, 'epoch': 0.46} {'loss': 0.8481, 'learning_rate': 1.7586865836362674e-05, 'epoch': 0.46} {'loss': 0.8973, 'learning_rate': 1.7586652577241353e-05, 'epoch': 0.46} {'loss': 0.7919, 'learning_rate': 1.758643930999025e-05, 'epoch': 0.46} {'loss': 0.8843, 'learning_rate': 1.7586226034609592e-05, 'epoch': 0.46} {'loss': 0.7931, 'learning_rate': 1.7586012751099612e-05, 'epoch': 0.46} {'loss': 0.6865, 'learning_rate': 1.7585799459460528e-05, 'epoch': 0.46} {'loss': 1.0, 'learning_rate': 1.758558615969258e-05, 'epoch': 0.46} {'loss': 0.902, 'learning_rate': 1.7585372851795993e-05, 'epoch': 0.46} {'loss': 0.7547, 'learning_rate': 1.758515953577099e-05, 'epoch': 0.46} {'loss': 0.8311, 'learning_rate': 1.7584946211617806e-05, 'epoch': 0.46} {'loss': 0.8654, 'learning_rate': 1.758473287933667e-05, 'epoch': 0.46} {'loss': 0.8445, 'learning_rate': 1.7584519538927805e-05, 'epoch': 0.46} {'loss': 0.6371, 'learning_rate': 1.758430619039144e-05, 'epoch': 0.46} {'loss': 0.8101, 'learning_rate': 1.7584092833727813e-05, 'epoch': 0.46} {'loss': 0.9293, 'learning_rate': 1.758387946893714e-05, 'epoch': 0.46} {'loss': 0.7517, 'learning_rate': 1.758366609601966e-05, 'epoch': 0.46} {'loss': 0.6834, 'learning_rate': 1.7583452714975595e-05, 'epoch': 0.46} {'loss': 0.9985, 'learning_rate': 1.758323932580518e-05, 'epoch': 0.46} {'loss': 0.8504, 'learning_rate': 1.7583025928508636e-05, 'epoch': 0.46} {'loss': 0.9459, 'learning_rate': 1.7582812523086196e-05, 'epoch': 0.46} {'loss': 0.7569, 'learning_rate': 1.7582599109538088e-05, 'epoch': 0.46} {'loss': 0.915, 'learning_rate': 1.7582385687864542e-05, 'epoch': 0.46} {'loss': 0.8558, 'learning_rate': 1.758217225806578e-05, 'epoch': 0.46} {'loss': 0.8766, 'learning_rate': 1.7581958820142044e-05, 'epoch': 0.46} {'loss': 0.8017, 'learning_rate': 1.758174537409355e-05, 'epoch': 0.46} {'loss': 0.7482, 'learning_rate': 1.758153191992053e-05, 'epoch': 0.46} {'loss': 0.75, 'learning_rate': 1.7581318457623217e-05, 'epoch': 0.46} {'loss': 0.8807, 'learning_rate': 1.7581104987201837e-05, 'epoch': 0.46} {'loss': 0.9822, 'learning_rate': 1.758089150865662e-05, 'epoch': 0.46} {'loss': 0.7632, 'learning_rate': 1.7580678021987792e-05, 'epoch': 0.46} {'loss': 0.7862, 'learning_rate': 1.7580464527195584e-05, 'epoch': 0.46} {'loss': 0.8319, 'learning_rate': 1.758025102428022e-05, 'epoch': 0.46} {'loss': 0.9818, 'learning_rate': 1.7580037513241937e-05, 'epoch': 0.46} {'loss': 0.8674, 'learning_rate': 1.7579823994080957e-05, 'epoch': 0.46} {'loss': 0.8322, 'learning_rate': 1.7579610466797517e-05, 'epoch': 0.46} {'loss': 0.7962, 'learning_rate': 1.7579396931391834e-05, 'epoch': 0.46} {'loss': 0.8568, 'learning_rate': 1.7579183387864148e-05, 'epoch': 0.46} {'loss': 0.6653, 'learning_rate': 1.757896983621468e-05, 'epoch': 0.46} {'loss': 0.955, 'learning_rate': 1.757875627644366e-05, 'epoch': 0.46} {'loss': 0.8895, 'learning_rate': 1.7578542708551323e-05, 'epoch': 0.46} {'loss': 0.7403, 'learning_rate': 1.757832913253789e-05, 'epoch': 0.46} {'loss': 0.806, 'learning_rate': 1.75781155484036e-05, 'epoch': 0.46} {'loss': 0.9869, 'learning_rate': 1.7577901956148666e-05, 'epoch': 0.46} {'loss': 0.7906, 'learning_rate': 1.7577688355773333e-05, 'epoch': 0.46} {'loss': 0.955, 'learning_rate': 1.7577474747277817e-05, 'epoch': 0.46} {'loss': 0.8401, 'learning_rate': 1.757726113066236e-05, 'epoch': 0.46} {'loss': 0.827, 'learning_rate': 1.757704750592718e-05, 'epoch': 0.46} {'loss': 0.8028, 'learning_rate': 1.7576833873072506e-05, 'epoch': 0.46} {'loss': 0.9112, 'learning_rate': 1.7576620232098576e-05, 'epoch': 0.46} {'loss': 0.7749, 'learning_rate': 1.757640658300561e-05, 'epoch': 0.46} {'loss': 0.8126, 'learning_rate': 1.7576192925793846e-05, 'epoch': 0.46} {'loss': 0.8174, 'learning_rate': 1.75759792604635e-05, 'epoch': 0.46} {'loss': 0.8231, 'learning_rate': 1.7575765587014815e-05, 'epoch': 0.46} {'loss': 0.8802, 'learning_rate': 1.757555190544801e-05, 'epoch': 0.46} {'loss': 0.732, 'learning_rate': 1.757533821576332e-05, 'epoch': 0.46} {'loss': 0.7927, 'learning_rate': 1.7575124517960965e-05, 'epoch': 0.46} {'loss': 0.8122, 'learning_rate': 1.7574910812041187e-05, 'epoch': 0.46} {'loss': 0.9196, 'learning_rate': 1.7574697098004207e-05, 'epoch': 0.46} {'loss': 0.8822, 'learning_rate': 1.7574483375850256e-05, 'epoch': 0.46} {'loss': 0.7592, 'learning_rate': 1.757426964557956e-05, 'epoch': 0.46} {'loss': 0.8788, 'learning_rate': 1.757405590719235e-05, 'epoch': 0.46} {'loss': 0.8753, 'learning_rate': 1.7573842160688858e-05, 'epoch': 0.46} {'loss': 0.8267, 'learning_rate': 1.757362840606931e-05, 'epoch': 0.46} {'loss': 0.7816, 'learning_rate': 1.7573414643333936e-05, 'epoch': 0.46} {'loss': 0.9293, 'learning_rate': 1.7573200872482963e-05, 'epoch': 0.46} {'loss': 0.8187, 'learning_rate': 1.757298709351662e-05, 'epoch': 0.46} {'loss': 0.9011, 'learning_rate': 1.7572773306435143e-05, 'epoch': 0.46} {'loss': 0.7923, 'learning_rate': 1.7572559511238753e-05, 'epoch': 0.46} {'loss': 0.9169, 'learning_rate': 1.757234570792768e-05, 'epoch': 0.46} {'loss': 0.974, 'learning_rate': 1.757213189650216e-05, 'epoch': 0.46} {'loss': 0.6681, 'learning_rate': 1.7571918076962416e-05, 'epoch': 0.46} {'loss': 0.6309, 'learning_rate': 1.7571704249308675e-05, 'epoch': 0.46} {'loss': 0.9388, 'learning_rate': 1.7571490413541172e-05, 'epoch': 0.46} {'loss': 0.7049, 'learning_rate': 1.7571276569660133e-05, 'epoch': 0.46} {'loss': 0.8534, 'learning_rate': 1.757106271766579e-05, 'epoch': 0.46} {'loss': 0.8683, 'learning_rate': 1.7570848857558368e-05, 'epoch': 0.46} {'loss': 0.9581, 'learning_rate': 1.7570634989338095e-05, 'epoch': 0.46} {'loss': 1.0196, 'learning_rate': 1.7570421113005208e-05, 'epoch': 0.46} {'loss': 0.8932, 'learning_rate': 1.757020722855993e-05, 'epoch': 0.46} {'loss': 0.8226, 'learning_rate': 1.7569993336002494e-05, 'epoch': 0.46} {'loss': 0.739, 'learning_rate': 1.7569779435333124e-05, 'epoch': 0.46} {'loss': 0.8479, 'learning_rate': 1.756956552655205e-05, 'epoch': 0.46} {'loss': 0.9173, 'learning_rate': 1.756935160965951e-05, 'epoch': 0.46} {'loss': 0.975, 'learning_rate': 1.756913768465572e-05, 'epoch': 0.46} {'loss': 0.7399, 'learning_rate': 1.756892375154092e-05, 'epoch': 0.46} {'loss': 0.722, 'learning_rate': 1.756870981031533e-05, 'epoch': 0.46} {'loss': 0.9784, 'learning_rate': 1.756849586097919e-05, 'epoch': 0.46} {'loss': 0.9402, 'learning_rate': 1.7568281903532722e-05, 'epoch': 0.46} {'loss': 0.9051, 'learning_rate': 1.7568067937976156e-05, 'epoch': 0.46} {'loss': 0.7905, 'learning_rate': 1.7567853964309724e-05, 'epoch': 0.46} {'loss': 0.9428, 'learning_rate': 1.756763998253365e-05, 'epoch': 0.46} {'loss': 0.8746, 'learning_rate': 1.756742599264817e-05, 'epoch': 0.46} {'loss': 0.9769, 'learning_rate': 1.7567211994653507e-05, 'epoch': 0.46} {'loss': 0.9366, 'learning_rate': 1.7566997988549898e-05, 'epoch': 0.46} {'loss': 0.7722, 'learning_rate': 1.7566783974337564e-05, 'epoch': 0.46} {'loss': 1.0033, 'learning_rate': 1.7566569952016736e-05, 'epoch': 0.46} {'loss': 0.8838, 'learning_rate': 1.756635592158765e-05, 'epoch': 0.46} {'loss': 0.7811, 'learning_rate': 1.756614188305053e-05, 'epoch': 0.46} {'loss': 0.8843, 'learning_rate': 1.7565927836405606e-05, 'epoch': 0.46} {'loss': 0.8462, 'learning_rate': 1.7565713781653106e-05, 'epoch': 0.46} {'loss': 1.0579, 'learning_rate': 1.756549971879326e-05, 'epoch': 0.46} {'loss': 0.917, 'learning_rate': 1.75652856478263e-05, 'epoch': 0.46} {'loss': 0.8338, 'learning_rate': 1.7565071568752452e-05, 'epoch': 0.46} {'loss': 0.6677, 'learning_rate': 1.7564857481571947e-05, 'epoch': 0.46} {'loss': 0.6236, 'learning_rate': 1.7564643386285017e-05, 'epoch': 0.46} {'loss': 0.8646, 'learning_rate': 1.7564429282891888e-05, 'epoch': 0.46} {'loss': 0.9067, 'learning_rate': 1.7564215171392788e-05, 'epoch': 0.46} {'loss': 1.0033, 'learning_rate': 1.756400105178795e-05, 'epoch': 0.46} {'loss': 0.8046, 'learning_rate': 1.7563786924077605e-05, 'epoch': 0.46} {'loss': 0.8306, 'learning_rate': 1.7563572788261975e-05, 'epoch': 0.46} {'loss': 0.7966, 'learning_rate': 1.7563358644341297e-05, 'epoch': 0.46} {'loss': 0.8985, 'learning_rate': 1.7563144492315798e-05, 'epoch': 0.46} {'loss': 0.804, 'learning_rate': 1.7562930332185705e-05, 'epoch': 0.46} {'loss': 0.7315, 'learning_rate': 1.756271616395125e-05, 'epoch': 0.46} {'loss': 0.9333, 'learning_rate': 1.7562501987612664e-05, 'epoch': 0.46} {'loss': 0.7492, 'learning_rate': 1.7562287803170173e-05, 'epoch': 0.46} {'loss': 0.8227, 'learning_rate': 1.7562073610624007e-05, 'epoch': 0.46} {'loss': 0.7624, 'learning_rate': 1.75618594099744e-05, 'epoch': 0.46} {'loss': 0.89, 'learning_rate': 1.7561645201221575e-05, 'epoch': 0.46} {'loss': 0.7243, 'learning_rate': 1.7561430984365766e-05, 'epoch': 0.46} {'loss': 1.0288, 'learning_rate': 1.75612167594072e-05, 'epoch': 0.46} {'loss': 0.7007, 'learning_rate': 1.756100252634611e-05, 'epoch': 0.46} {'loss': 0.8905, 'learning_rate': 1.756078828518272e-05, 'epoch': 0.46} {'loss': 0.8418, 'learning_rate': 1.7560574035917265e-05, 'epoch': 0.46} {'loss': 0.8485, 'learning_rate': 1.7560359778549974e-05, 'epoch': 0.46} {'loss': 0.9546, 'learning_rate': 1.756014551308107e-05, 'epoch': 0.46} {'loss': 0.8079, 'learning_rate': 1.7559931239510796e-05, 'epoch': 0.46} {'loss': 0.8298, 'learning_rate': 1.7559716957839366e-05, 'epoch': 0.46} {'loss': 0.8973, 'learning_rate': 1.755950266806702e-05, 'epoch': 0.46} {'loss': 0.6198, 'learning_rate': 1.7559288370193985e-05, 'epoch': 0.46} {'loss': 0.8707, 'learning_rate': 1.755907406422049e-05, 'epoch': 0.46} {'loss': 0.8518, 'learning_rate': 1.7558859750146764e-05, 'epoch': 0.46} {'loss': 0.689, 'learning_rate': 1.755864542797304e-05, 'epoch': 0.46} {'loss': 0.8571, 'learning_rate': 1.755843109769954e-05, 'epoch': 0.46} {'loss': 1.0067, 'learning_rate': 1.7558216759326505e-05, 'epoch': 0.46} {'loss': 0.8655, 'learning_rate': 1.7558002412854157e-05, 'epoch': 0.46} {'loss': 0.7974, 'learning_rate': 1.7557788058282725e-05, 'epoch': 0.46} {'loss': 0.7763, 'learning_rate': 1.755757369561244e-05, 'epoch': 0.46} {'loss': 0.9607, 'learning_rate': 1.7557359324843536e-05, 'epoch': 0.46} {'loss': 0.5299, 'learning_rate': 1.7557144945976237e-05, 'epoch': 0.46} {'loss': 0.8499, 'learning_rate': 1.7556930559010778e-05, 'epoch': 0.46} {'loss': 0.8643, 'learning_rate': 1.7556716163947382e-05, 'epoch': 0.46} {'loss': 0.9301, 'learning_rate': 1.7556501760786284e-05, 'epoch': 0.46} {'loss': 0.8527, 'learning_rate': 1.7556287349527713e-05, 'epoch': 0.46} {'loss': 0.7404, 'learning_rate': 1.7556072930171897e-05, 'epoch': 0.46} {'loss': 1.0176, 'learning_rate': 1.755585850271907e-05, 'epoch': 0.46} {'loss': 0.8337, 'learning_rate': 1.7555644067169457e-05, 'epoch': 0.46} {'loss': 0.7377, 'learning_rate': 1.7555429623523288e-05, 'epoch': 0.46} {'loss': 0.8038, 'learning_rate': 1.7555215171780794e-05, 'epoch': 0.46} {'loss': 1.0834, 'learning_rate': 1.755500071194221e-05, 'epoch': 0.46} {'loss': 1.017, 'learning_rate': 1.7554786244007754e-05, 'epoch': 0.46} {'loss': 0.7988, 'learning_rate': 1.7554571767977665e-05, 'epoch': 0.46} {'loss': 0.907, 'learning_rate': 1.7554357283852174e-05, 'epoch': 0.46} {'loss': 0.9905, 'learning_rate': 1.7554142791631504e-05, 'epoch': 0.46} {'loss': 0.8291, 'learning_rate': 1.755392829131589e-05, 'epoch': 0.46} {'loss': 0.9979, 'learning_rate': 1.7553713782905557e-05, 'epoch': 0.46} {'loss': 1.0022, 'learning_rate': 1.755349926640074e-05, 'epoch': 0.46} {'loss': 0.9714, 'learning_rate': 1.7553284741801666e-05, 'epoch': 0.46} {'loss': 0.7054, 'learning_rate': 1.7553070209108566e-05, 'epoch': 0.46} {'loss': 0.7872, 'learning_rate': 1.755285566832167e-05, 'epoch': 0.46} {'loss': 0.8075, 'learning_rate': 1.7552641119441208e-05, 'epoch': 0.46} {'loss': 0.7805, 'learning_rate': 1.755242656246741e-05, 'epoch': 0.46} {'loss': 0.9207, 'learning_rate': 1.75522119974005e-05, 'epoch': 0.46} {'loss': 0.9335, 'learning_rate': 1.755199742424072e-05, 'epoch': 0.46} {'loss': 0.7339, 'learning_rate': 1.755178284298829e-05, 'epoch': 0.46} {'loss': 0.8205, 'learning_rate': 1.7551568253643446e-05, 'epoch': 0.46} {'loss': 0.7528, 'learning_rate': 1.755135365620641e-05, 'epoch': 0.46} {'loss': 0.9156, 'learning_rate': 1.755113905067742e-05, 'epoch': 0.46} {'loss': 1.0244, 'learning_rate': 1.7550924437056702e-05, 'epoch': 0.46} {'loss': 0.8483, 'learning_rate': 1.755070981534449e-05, 'epoch': 0.46} {'loss': 0.7457, 'learning_rate': 1.7550495185541006e-05, 'epoch': 0.46} {'loss': 0.7749, 'learning_rate': 1.7550280547646488e-05, 'epoch': 0.46} {'loss': 0.9488, 'learning_rate': 1.755006590166116e-05, 'epoch': 0.46} {'loss': 0.8944, 'learning_rate': 1.754985124758526e-05, 'epoch': 0.46} {'loss': 0.8701, 'learning_rate': 1.754963658541901e-05, 'epoch': 0.46} {'loss': 1.0432, 'learning_rate': 1.7549421915162642e-05, 'epoch': 0.46} {'loss': 0.8285, 'learning_rate': 1.754920723681639e-05, 'epoch': 0.46} {'loss': 1.0174, 'learning_rate': 1.7548992550380477e-05, 'epoch': 0.46} {'loss': 0.9498, 'learning_rate': 1.7548777855855142e-05, 'epoch': 0.46} {'loss': 0.9441, 'learning_rate': 1.7548563153240605e-05, 'epoch': 0.46} {'loss': 0.8744, 'learning_rate': 1.7548348442537104e-05, 'epoch': 0.46} {'loss': 0.8488, 'learning_rate': 1.7548133723744868e-05, 'epoch': 0.46} {'loss': 0.8882, 'learning_rate': 1.7547918996864122e-05, 'epoch': 0.46} {'loss': 0.937, 'learning_rate': 1.7547704261895102e-05, 'epoch': 0.46} {'loss': 0.7643, 'learning_rate': 1.7547489518838035e-05, 'epoch': 0.46} {'loss': 0.8599, 'learning_rate': 1.7547274767693153e-05, 'epoch': 0.46} {'loss': 0.6084, 'learning_rate': 1.7547060008460684e-05, 'epoch': 0.46} {'loss': 0.7109, 'learning_rate': 1.7546845241140857e-05, 'epoch': 0.46} {'loss': 0.8496, 'learning_rate': 1.7546630465733905e-05, 'epoch': 0.46} {'loss': 0.8715, 'learning_rate': 1.7546415682240058e-05, 'epoch': 0.46} {'loss': 0.8992, 'learning_rate': 1.7546200890659547e-05, 'epoch': 0.46} {'loss': 0.9051, 'learning_rate': 1.75459860909926e-05, 'epoch': 0.46} {'loss': 0.9912, 'learning_rate': 1.7545771283239447e-05, 'epoch': 0.46} {'loss': 0.7707, 'learning_rate': 1.754555646740032e-05, 'epoch': 0.46} {'loss': 0.8047, 'learning_rate': 1.7545341643475448e-05, 'epoch': 0.46} {'loss': 0.8461, 'learning_rate': 1.7545126811465055e-05, 'epoch': 0.46} {'loss': 0.8403, 'learning_rate': 1.7544911971369387e-05, 'epoch': 0.46} {'loss': 0.8835, 'learning_rate': 1.754469712318866e-05, 'epoch': 0.46} {'loss': 0.8151, 'learning_rate': 1.754448226692311e-05, 'epoch': 0.46} {'loss': 0.7686, 'learning_rate': 1.7544267402572968e-05, 'epoch': 0.46} {'loss': 0.8138, 'learning_rate': 1.7544052530138463e-05, 'epoch': 0.46} {'loss': 0.6311, 'learning_rate': 1.754383764961982e-05, 'epoch': 0.46} {'loss': 0.8072, 'learning_rate': 1.754362276101728e-05, 'epoch': 0.46} {'loss': 0.8547, 'learning_rate': 1.7543407864331062e-05, 'epoch': 0.46} {'loss': 0.7591, 'learning_rate': 1.7543192959561403e-05, 'epoch': 0.46} {'loss': 0.9102, 'learning_rate': 1.7542978046708535e-05, 'epoch': 0.46} {'loss': 0.9608, 'learning_rate': 1.7542763125772683e-05, 'epoch': 0.46} {'loss': 0.8738, 'learning_rate': 1.754254819675408e-05, 'epoch': 0.46} {'loss': 0.9565, 'learning_rate': 1.7542333259652956e-05, 'epoch': 0.46} {'loss': 0.8597, 'learning_rate': 1.7542118314469542e-05, 'epoch': 0.46} {'loss': 0.8783, 'learning_rate': 1.7541903361204065e-05, 'epoch': 0.46} {'loss': 1.0108, 'learning_rate': 1.754168839985676e-05, 'epoch': 0.46} {'loss': 0.8776, 'learning_rate': 1.7541473430427857e-05, 'epoch': 0.46} {'loss': 0.7608, 'learning_rate': 1.7541258452917576e-05, 'epoch': 0.46} {'loss': 1.0427, 'learning_rate': 1.7541043467326164e-05, 'epoch': 0.46} {'loss': 0.7154, 'learning_rate': 1.754082847365384e-05, 'epoch': 0.46} {'loss': 0.8505, 'learning_rate': 1.754061347190084e-05, 'epoch': 0.46} {'loss': 0.9374, 'learning_rate': 1.7540398462067393e-05, 'epoch': 0.46} {'loss': 0.7468, 'learning_rate': 1.7540183444153725e-05, 'epoch': 0.46} {'loss': 0.9082, 'learning_rate': 1.753996841816007e-05, 'epoch': 0.46} {'loss': 0.843, 'learning_rate': 1.7539753384086662e-05, 'epoch': 0.46} {'loss': 0.7233, 'learning_rate': 1.7539538341933724e-05, 'epoch': 0.46} {'loss': 0.8247, 'learning_rate': 1.7539323291701494e-05, 'epoch': 0.46} {'loss': 0.8548, 'learning_rate': 1.7539108233390193e-05, 'epoch': 0.46} {'loss': 0.8925, 'learning_rate': 1.753889316700006e-05, 'epoch': 0.46} {'loss': 0.9212, 'learning_rate': 1.7538678092531324e-05, 'epoch': 0.46} {'loss': 0.7396, 'learning_rate': 1.753846300998421e-05, 'epoch': 0.46} {'loss': 0.7473, 'learning_rate': 1.753824791935896e-05, 'epoch': 0.46} {'loss': 0.8621, 'learning_rate': 1.753803282065579e-05, 'epoch': 0.46} {'loss': 0.9227, 'learning_rate': 1.753781771387494e-05, 'epoch': 0.46} {'loss': 0.815, 'learning_rate': 1.753760259901664e-05, 'epoch': 0.46} {'loss': 0.8737, 'learning_rate': 1.7537387476081113e-05, 'epoch': 0.46} {'loss': 0.861, 'learning_rate': 1.75371723450686e-05, 'epoch': 0.46} {'loss': 0.832, 'learning_rate': 1.7536957205979325e-05, 'epoch': 0.46} {'loss': 1.0108, 'learning_rate': 1.7536742058813522e-05, 'epoch': 0.46} {'loss': 0.7992, 'learning_rate': 1.7536526903571416e-05, 'epoch': 0.46} {'loss': 0.771, 'learning_rate': 1.7536311740253243e-05, 'epoch': 0.46} {'loss': 0.7019, 'learning_rate': 1.7536096568859232e-05, 'epoch': 0.46} {'loss': 0.7152, 'learning_rate': 1.753588138938961e-05, 'epoch': 0.46} {'loss': 0.8701, 'learning_rate': 1.7535666201844617e-05, 'epoch': 0.46} {'loss': 1.0193, 'learning_rate': 1.7535451006224473e-05, 'epoch': 0.46} {'loss': 0.8661, 'learning_rate': 1.7535235802529416e-05, 'epoch': 0.46} {'loss': 0.9471, 'learning_rate': 1.7535020590759672e-05, 'epoch': 0.46} {'loss': 0.8483, 'learning_rate': 1.7534805370915474e-05, 'epoch': 0.46} {'loss': 0.9945, 'learning_rate': 1.753459014299705e-05, 'epoch': 0.46} {'loss': 0.8098, 'learning_rate': 1.7534374907004633e-05, 'epoch': 0.46} {'loss': 0.8333, 'learning_rate': 1.7534159662938458e-05, 'epoch': 0.46} {'loss': 0.9775, 'learning_rate': 1.7533944410798747e-05, 'epoch': 0.46} {'loss': 0.8364, 'learning_rate': 1.7533729150585735e-05, 'epoch': 0.46} {'loss': 0.9361, 'learning_rate': 1.753351388229965e-05, 'epoch': 0.46} {'loss': 0.9606, 'learning_rate': 1.753329860594073e-05, 'epoch': 0.46} {'loss': 0.872, 'learning_rate': 1.75330833215092e-05, 'epoch': 0.46} {'loss': 0.7347, 'learning_rate': 1.7532868029005287e-05, 'epoch': 0.46} {'loss': 0.887, 'learning_rate': 1.753265272842923e-05, 'epoch': 0.46} {'loss': 0.8542, 'learning_rate': 1.753243741978125e-05, 'epoch': 0.46} {'loss': 0.7958, 'learning_rate': 1.753222210306159e-05, 'epoch': 0.46} {'loss': 0.9105, 'learning_rate': 1.753200677827047e-05, 'epoch': 0.46} {'loss': 0.8618, 'learning_rate': 1.7531791445408127e-05, 'epoch': 0.46} {'loss': 0.7209, 'learning_rate': 1.7531576104474786e-05, 'epoch': 0.46} {'loss': 0.7596, 'learning_rate': 1.7531360755470688e-05, 'epoch': 0.46} {'loss': 0.8226, 'learning_rate': 1.7531145398396053e-05, 'epoch': 0.46} {'loss': 0.8591, 'learning_rate': 1.7530930033251116e-05, 'epoch': 0.46} {'loss': 0.8376, 'learning_rate': 1.7530714660036112e-05, 'epoch': 0.46} {'loss': 0.8883, 'learning_rate': 1.7530499278751263e-05, 'epoch': 0.46} {'loss': 0.9157, 'learning_rate': 1.7530283889396806e-05, 'epoch': 0.46} {'loss': 0.8913, 'learning_rate': 1.7530068491972968e-05, 'epoch': 0.46} {'loss': 0.8938, 'learning_rate': 1.7529853086479985e-05, 'epoch': 0.46} {'loss': 0.8535, 'learning_rate': 1.752963767291808e-05, 'epoch': 0.46} {'loss': 0.6784, 'learning_rate': 1.7529422251287495e-05, 'epoch': 0.46} {'loss': 0.7854, 'learning_rate': 1.752920682158845e-05, 'epoch': 0.46} {'loss': 0.8728, 'learning_rate': 1.7528991383821186e-05, 'epoch': 0.46} {'loss': 0.8233, 'learning_rate': 1.752877593798592e-05, 'epoch': 0.46} {'loss': 0.9111, 'learning_rate': 1.7528560484082898e-05, 'epoch': 0.46} {'loss': 0.9234, 'learning_rate': 1.752834502211234e-05, 'epoch': 0.46} {'loss': 0.9267, 'learning_rate': 1.7528129552074484e-05, 'epoch': 0.46} {'loss': 0.8498, 'learning_rate': 1.7527914073969555e-05, 'epoch': 0.46} {'loss': 0.9236, 'learning_rate': 1.7527698587797788e-05, 'epoch': 0.46} {'loss': 0.7341, 'learning_rate': 1.752748309355941e-05, 'epoch': 0.46} {'loss': 0.8213, 'learning_rate': 1.7527267591254656e-05, 'epoch': 0.46} {'loss': 0.8729, 'learning_rate': 1.7527052080883758e-05, 'epoch': 0.46} {'loss': 0.8789, 'learning_rate': 1.752683656244694e-05, 'epoch': 0.46} {'loss': 0.9018, 'learning_rate': 1.752662103594444e-05, 'epoch': 0.46} {'loss': 0.9415, 'learning_rate': 1.7526405501376483e-05, 'epoch': 0.46} {'loss': 0.9285, 'learning_rate': 1.7526189958743306e-05, 'epoch': 0.46} {'loss': 1.0093, 'learning_rate': 1.7525974408045143e-05, 'epoch': 0.46} {'loss': 0.673, 'learning_rate': 1.752575884928221e-05, 'epoch': 0.46} {'loss': 0.8428, 'learning_rate': 1.752554328245475e-05, 'epoch': 0.46} {'loss': 0.8044, 'learning_rate': 1.7525327707562993e-05, 'epoch': 0.46} {'loss': 0.9049, 'learning_rate': 1.7525112124607165e-05, 'epoch': 0.46} {'loss': 0.6622, 'learning_rate': 1.7524896533587502e-05, 'epoch': 0.46} {'loss': 0.9451, 'learning_rate': 1.752468093450423e-05, 'epoch': 0.46} {'loss': 0.7455, 'learning_rate': 1.752446532735759e-05, 'epoch': 0.46} {'loss': 0.9909, 'learning_rate': 1.7524249712147804e-05, 'epoch': 0.46} {'loss': 0.8825, 'learning_rate': 1.75240340888751e-05, 'epoch': 0.46} {'loss': 0.8455, 'learning_rate': 1.752381845753972e-05, 'epoch': 0.46} {'loss': 0.7783, 'learning_rate': 1.7523602818141888e-05, 'epoch': 0.46} {'loss': 0.8115, 'learning_rate': 1.7523387170681835e-05, 'epoch': 0.46} {'loss': 0.7816, 'learning_rate': 1.7523171515159796e-05, 'epoch': 0.46} {'loss': 0.7571, 'learning_rate': 1.7522955851575997e-05, 'epoch': 0.46} {'loss': 0.91, 'learning_rate': 1.7522740179930676e-05, 'epoch': 0.46} {'loss': 0.776, 'learning_rate': 1.7522524500224058e-05, 'epoch': 0.46} {'loss': 0.9379, 'learning_rate': 1.7522308812456373e-05, 'epoch': 0.46} {'loss': 0.9498, 'learning_rate': 1.7522093116627855e-05, 'epoch': 0.46} {'loss': 0.8097, 'learning_rate': 1.752187741273874e-05, 'epoch': 0.46} {'loss': 0.8575, 'learning_rate': 1.752166170078925e-05, 'epoch': 0.46} {'loss': 0.8667, 'learning_rate': 1.7521445980779627e-05, 'epoch': 0.46} {'loss': 0.8974, 'learning_rate': 1.752123025271009e-05, 'epoch': 0.46} {'loss': 0.7583, 'learning_rate': 1.7521014516580877e-05, 'epoch': 0.46} {'loss': 0.8521, 'learning_rate': 1.752079877239222e-05, 'epoch': 0.46} {'loss': 0.879, 'learning_rate': 1.7520583020144347e-05, 'epoch': 0.46} {'loss': 0.9771, 'learning_rate': 1.752036725983749e-05, 'epoch': 0.46} {'loss': 0.836, 'learning_rate': 1.7520151491471882e-05, 'epoch': 0.46} {'loss': 0.755, 'learning_rate': 1.7519935715047752e-05, 'epoch': 0.46} {'loss': 0.9792, 'learning_rate': 1.7519719930565334e-05, 'epoch': 0.46} {'loss': 0.7664, 'learning_rate': 1.751950413802485e-05, 'epoch': 0.46} {'loss': 0.9564, 'learning_rate': 1.751928833742655e-05, 'epoch': 0.46} {'loss': 0.8396, 'learning_rate': 1.7519072528770648e-05, 'epoch': 0.46} {'loss': 0.8619, 'learning_rate': 1.751885671205738e-05, 'epoch': 0.46} {'loss': 0.9406, 'learning_rate': 1.7518640887286983e-05, 'epoch': 0.46} {'loss': 0.7401, 'learning_rate': 1.751842505445968e-05, 'epoch': 0.46} {'loss': 0.887, 'learning_rate': 1.7518209213575704e-05, 'epoch': 0.46} {'loss': 0.7875, 'learning_rate': 1.751799336463529e-05, 'epoch': 0.46} {'loss': 0.6412, 'learning_rate': 1.751777750763867e-05, 'epoch': 0.46} {'loss': 0.8711, 'learning_rate': 1.751756164258607e-05, 'epoch': 0.46} {'loss': 0.7558, 'learning_rate': 1.751734576947773e-05, 'epoch': 0.46} {'loss': 0.8931, 'learning_rate': 1.7517129888313865e-05, 'epoch': 0.46} {'loss': 0.9263, 'learning_rate': 1.7516913999094725e-05, 'epoch': 0.46} {'loss': 0.7131, 'learning_rate': 1.7516698101820532e-05, 'epoch': 0.46} {'loss': 0.8931, 'learning_rate': 1.7516482196491516e-05, 'epoch': 0.46} {'loss': 0.9653, 'learning_rate': 1.7516266283107915e-05, 'epoch': 0.46} {'loss': 0.7202, 'learning_rate': 1.7516050361669953e-05, 'epoch': 0.46} {'loss': 0.7442, 'learning_rate': 1.7515834432177866e-05, 'epoch': 0.46} {'loss': 0.8714, 'learning_rate': 1.751561849463188e-05, 'epoch': 0.46} {'loss': 0.8212, 'learning_rate': 1.7515402549032235e-05, 'epoch': 0.46} {'loss': 0.8887, 'learning_rate': 1.751518659537916e-05, 'epoch': 0.46} {'loss': 0.98, 'learning_rate': 1.7514970633672882e-05, 'epoch': 0.46} {'loss': 0.743, 'learning_rate': 1.751475466391363e-05, 'epoch': 0.46} {'loss': 0.9489, 'learning_rate': 1.7514538686101645e-05, 'epoch': 0.46} {'loss': 0.8434, 'learning_rate': 1.7514322700237153e-05, 'epoch': 0.46} {'loss': 0.8572, 'learning_rate': 1.7514106706320387e-05, 'epoch': 0.46} {'loss': 0.8925, 'learning_rate': 1.7513890704351577e-05, 'epoch': 0.46} {'loss': 0.8751, 'learning_rate': 1.7513674694330952e-05, 'epoch': 0.46} {'loss': 0.8581, 'learning_rate': 1.7513458676258748e-05, 'epoch': 0.46} {'loss': 0.8751, 'learning_rate': 1.7513242650135197e-05, 'epoch': 0.46} {'loss': 0.9652, 'learning_rate': 1.7513026615960527e-05, 'epoch': 0.46} {'loss': 0.981, 'learning_rate': 1.751281057373497e-05, 'epoch': 0.46} {'loss': 0.82, 'learning_rate': 1.7512594523458758e-05, 'epoch': 0.46} {'loss': 0.7402, 'learning_rate': 1.7512378465132122e-05, 'epoch': 0.46} {'loss': 0.9107, 'learning_rate': 1.7512162398755296e-05, 'epoch': 0.46} {'loss': 0.812, 'learning_rate': 1.7511946324328512e-05, 'epoch': 0.46} {'loss': 1.0577, 'learning_rate': 1.7511730241852e-05, 'epoch': 0.46} {'loss': 0.7658, 'learning_rate': 1.751151415132599e-05, 'epoch': 0.46} {'loss': 0.997, 'learning_rate': 1.751129805275071e-05, 'epoch': 0.46} {'loss': 0.9391, 'learning_rate': 1.75110819461264e-05, 'epoch': 0.46} {'loss': 0.906, 'learning_rate': 1.751086583145329e-05, 'epoch': 0.46} {'loss': 0.8817, 'learning_rate': 1.7510649708731605e-05, 'epoch': 0.46} {'loss': 0.8207, 'learning_rate': 1.7510433577961583e-05, 'epoch': 0.46} {'loss': 0.6613, 'learning_rate': 1.7510217439143453e-05, 'epoch': 0.46} {'loss': 0.8016, 'learning_rate': 1.751000129227745e-05, 'epoch': 0.46} {'loss': 0.7752, 'learning_rate': 1.7509785137363796e-05, 'epoch': 0.46} {'loss': 0.746, 'learning_rate': 1.7509568974402737e-05, 'epoch': 0.46} {'loss': 0.8504, 'learning_rate': 1.750935280339449e-05, 'epoch': 0.46} {'loss': 0.9099, 'learning_rate': 1.75091366243393e-05, 'epoch': 0.46} {'loss': 0.8852, 'learning_rate': 1.750892043723739e-05, 'epoch': 0.46} {'loss': 0.9402, 'learning_rate': 1.7508704242088994e-05, 'epoch': 0.46} {'loss': 0.8637, 'learning_rate': 1.7508488038894344e-05, 'epoch': 0.46} {'loss': 0.8572, 'learning_rate': 1.750827182765367e-05, 'epoch': 0.46} {'loss': 0.8646, 'learning_rate': 1.7508055608367207e-05, 'epoch': 0.46} {'loss': 0.9247, 'learning_rate': 1.7507839381035185e-05, 'epoch': 0.46} {'loss': 0.8414, 'learning_rate': 1.7507623145657833e-05, 'epoch': 0.46} {'loss': 0.812, 'learning_rate': 1.7507406902235386e-05, 'epoch': 0.46} {'loss': 0.6552, 'learning_rate': 1.7507190650768078e-05, 'epoch': 0.46} {'loss': 0.7105, 'learning_rate': 1.7506974391256135e-05, 'epoch': 0.46} {'loss': 0.8164, 'learning_rate': 1.750675812369979e-05, 'epoch': 0.46} {'loss': 0.7449, 'learning_rate': 1.750654184809928e-05, 'epoch': 0.46} {'loss': 0.7373, 'learning_rate': 1.7506325564454828e-05, 'epoch': 0.46} {'loss': 0.8397, 'learning_rate': 1.7506109272766672e-05, 'epoch': 0.46} {'loss': 0.7056, 'learning_rate': 1.7505892973035047e-05, 'epoch': 0.46} {'loss': 0.6459, 'learning_rate': 1.7505676665260177e-05, 'epoch': 0.46} {'loss': 0.9224, 'learning_rate': 1.7505460349442295e-05, 'epoch': 0.46} {'loss': 0.842, 'learning_rate': 1.750524402558164e-05, 'epoch': 0.46} {'loss': 0.7555, 'learning_rate': 1.7505027693678435e-05, 'epoch': 0.46} {'loss': 0.9143, 'learning_rate': 1.7504811353732914e-05, 'epoch': 0.46} {'loss': 0.7367, 'learning_rate': 1.750459500574531e-05, 'epoch': 0.46} {'loss': 0.9313, 'learning_rate': 1.7504378649715858e-05, 'epoch': 0.46} {'loss': 0.9698, 'learning_rate': 1.750416228564479e-05, 'epoch': 0.46} {'loss': 0.8605, 'learning_rate': 1.7503945913532328e-05, 'epoch': 0.46} {'loss': 0.9586, 'learning_rate': 1.7503729533378716e-05, 'epoch': 0.46} {'loss': 1.1329, 'learning_rate': 1.7503513145184176e-05, 'epoch': 0.46} {'loss': 0.8572, 'learning_rate': 1.7503296748948946e-05, 'epoch': 0.46} {'loss': 0.8538, 'learning_rate': 1.7503080344673258e-05, 'epoch': 0.46} {'loss': 0.847, 'learning_rate': 1.750286393235734e-05, 'epoch': 0.46} {'loss': 0.9214, 'learning_rate': 1.7502647512001428e-05, 'epoch': 0.46} {'loss': 0.8767, 'learning_rate': 1.7502431083605752e-05, 'epoch': 0.46} {'loss': 0.9532, 'learning_rate': 1.7502214647170544e-05, 'epoch': 0.46} {'loss': 0.912, 'learning_rate': 1.7501998202696032e-05, 'epoch': 0.46} {'loss': 0.7696, 'learning_rate': 1.750178175018246e-05, 'epoch': 0.46} {'loss': 0.8602, 'learning_rate': 1.7501565289630044e-05, 'epoch': 0.46} {'loss': 0.9458, 'learning_rate': 1.7501348821039027e-05, 'epoch': 0.46} {'loss': 0.6697, 'learning_rate': 1.7501132344409636e-05, 'epoch': 0.46} {'loss': 0.794, 'learning_rate': 1.750091585974211e-05, 'epoch': 0.46} {'loss': 0.7903, 'learning_rate': 1.750069936703667e-05, 'epoch': 0.46} {'loss': 0.8531, 'learning_rate': 1.7500482866293555e-05, 'epoch': 0.46} {'loss': 0.8711, 'learning_rate': 1.7500266357512996e-05, 'epoch': 0.46} {'loss': 1.0024, 'learning_rate': 1.7500049840695222e-05, 'epoch': 0.46} {'loss': 0.7302, 'learning_rate': 1.7499833315840475e-05, 'epoch': 0.46} {'loss': 0.8921, 'learning_rate': 1.749961678294897e-05, 'epoch': 0.46} {'loss': 1.0037, 'learning_rate': 1.7499400242020956e-05, 'epoch': 0.46} {'loss': 0.9193, 'learning_rate': 1.7499183693056652e-05, 'epoch': 0.46} {'loss': 0.8562, 'learning_rate': 1.7498967136056303e-05, 'epoch': 0.47} {'loss': 0.7278, 'learning_rate': 1.749875057102013e-05, 'epoch': 0.47} {'loss': 0.7318, 'learning_rate': 1.749853399794837e-05, 'epoch': 0.47} {'loss': 0.8324, 'learning_rate': 1.7498317416841252e-05, 'epoch': 0.47} {'loss': 0.8457, 'learning_rate': 1.749810082769901e-05, 'epoch': 0.47} {'loss': 0.9992, 'learning_rate': 1.7497884230521877e-05, 'epoch': 0.47} {'loss': 0.9908, 'learning_rate': 1.7497667625310086e-05, 'epoch': 0.47} {'loss': 0.8563, 'learning_rate': 1.749745101206387e-05, 'epoch': 0.47} {'loss': 1.1026, 'learning_rate': 1.7497234390783453e-05, 'epoch': 0.47} {'loss': 0.7028, 'learning_rate': 1.7497017761469072e-05, 'epoch': 0.47} {'loss': 0.9658, 'learning_rate': 1.7496801124120963e-05, 'epoch': 0.47} {'loss': 0.7921, 'learning_rate': 1.7496584478739357e-05, 'epoch': 0.47} {'loss': 0.898, 'learning_rate': 1.749636782532448e-05, 'epoch': 0.47} {'loss': 0.8005, 'learning_rate': 1.749615116387657e-05, 'epoch': 0.47} {'loss': 0.8874, 'learning_rate': 1.7495934494395858e-05, 'epoch': 0.47} {'loss': 0.8996, 'learning_rate': 1.7495717816882575e-05, 'epoch': 0.47} {'loss': 0.8989, 'learning_rate': 1.7495501131336953e-05, 'epoch': 0.47} {'loss': 0.9815, 'learning_rate': 1.7495284437759225e-05, 'epoch': 0.47} {'loss': 0.9527, 'learning_rate': 1.7495067736149624e-05, 'epoch': 0.47} {'loss': 0.8759, 'learning_rate': 1.749485102650838e-05, 'epoch': 0.47} {'loss': 0.9331, 'learning_rate': 1.749463430883573e-05, 'epoch': 0.47} {'loss': 0.8415, 'learning_rate': 1.74944175831319e-05, 'epoch': 0.47} {'loss': 0.9272, 'learning_rate': 1.7494200849397124e-05, 'epoch': 0.47} {'loss': 0.9956, 'learning_rate': 1.7493984107631638e-05, 'epoch': 0.47} {'loss': 0.7434, 'learning_rate': 1.7493767357835674e-05, 'epoch': 0.47} {'loss': 0.9054, 'learning_rate': 1.7493550600009457e-05, 'epoch': 0.47} {'loss': 0.8701, 'learning_rate': 1.7493333834153226e-05, 'epoch': 0.47} {'loss': 0.8171, 'learning_rate': 1.7493117060267214e-05, 'epoch': 0.47} {'loss': 0.9393, 'learning_rate': 1.749290027835165e-05, 'epoch': 0.47} {'loss': 0.736, 'learning_rate': 1.7492683488406763e-05, 'epoch': 0.47} {'loss': 0.9058, 'learning_rate': 1.749246669043279e-05, 'epoch': 0.47} {'loss': 0.9274, 'learning_rate': 1.7492249884429966e-05, 'epoch': 0.47} {'loss': 0.8856, 'learning_rate': 1.749203307039852e-05, 'epoch': 0.47} {'loss': 0.87, 'learning_rate': 1.749181624833868e-05, 'epoch': 0.47} {'loss': 0.8083, 'learning_rate': 1.7491599418250688e-05, 'epoch': 0.47} {'loss': 0.8847, 'learning_rate': 1.7491382580134767e-05, 'epoch': 0.47} {'loss': 0.9527, 'learning_rate': 1.749116573399116e-05, 'epoch': 0.47} {'loss': 0.9706, 'learning_rate': 1.7490948879820085e-05, 'epoch': 0.47} {'loss': 0.9696, 'learning_rate': 1.7490732017621785e-05, 'epoch': 0.47} {'loss': 0.8614, 'learning_rate': 1.7490515147396488e-05, 'epoch': 0.47} {'loss': 1.0121, 'learning_rate': 1.749029826914443e-05, 'epoch': 0.47} {'loss': 0.9533, 'learning_rate': 1.7490081382865843e-05, 'epoch': 0.47} {'loss': 0.9372, 'learning_rate': 1.7489864488560955e-05, 'epoch': 0.47} {'loss': 0.8611, 'learning_rate': 1.748964758623e-05, 'epoch': 0.47} {'loss': 0.7078, 'learning_rate': 1.7489430675873214e-05, 'epoch': 0.47} {'loss': 0.7021, 'learning_rate': 1.748921375749083e-05, 'epoch': 0.47} {'loss': 0.7728, 'learning_rate': 1.748899683108307e-05, 'epoch': 0.47} {'loss': 0.7783, 'learning_rate': 1.7488779896650183e-05, 'epoch': 0.47} {'loss': 0.8853, 'learning_rate': 1.7488562954192386e-05, 'epoch': 0.47} {'loss': 0.7939, 'learning_rate': 1.748834600370992e-05, 'epoch': 0.47} {'loss': 0.7678, 'learning_rate': 1.7488129045203017e-05, 'epoch': 0.47} {'loss': 0.7, 'learning_rate': 1.7487912078671904e-05, 'epoch': 0.47} {'loss': 1.001, 'learning_rate': 1.7487695104116817e-05, 'epoch': 0.47} {'loss': 0.9061, 'learning_rate': 1.7487478121537994e-05, 'epoch': 0.47} {'loss': 0.92, 'learning_rate': 1.748726113093566e-05, 'epoch': 0.47} {'loss': 0.8833, 'learning_rate': 1.7487044132310047e-05, 'epoch': 0.47} {'loss': 0.9008, 'learning_rate': 1.7486827125661394e-05, 'epoch': 0.47} {'loss': 0.9858, 'learning_rate': 1.748661011098993e-05, 'epoch': 0.47} {'loss': 0.7837, 'learning_rate': 1.7486393088295887e-05, 'epoch': 0.47} {'loss': 0.7684, 'learning_rate': 1.7486176057579497e-05, 'epoch': 0.47} {'loss': 0.9589, 'learning_rate': 1.7485959018840994e-05, 'epoch': 0.47} {'loss': 0.7538, 'learning_rate': 1.748574197208061e-05, 'epoch': 0.47} {'loss': 0.7999, 'learning_rate': 1.748552491729858e-05, 'epoch': 0.47} {'loss': 0.9642, 'learning_rate': 1.7485307854495134e-05, 'epoch': 0.47} {'loss': 0.894, 'learning_rate': 1.74850907836705e-05, 'epoch': 0.47} {'loss': 0.8301, 'learning_rate': 1.7484873704824923e-05, 'epoch': 0.47} {'loss': 0.991, 'learning_rate': 1.748465661795862e-05, 'epoch': 0.47} {'loss': 1.0492, 'learning_rate': 1.748443952307184e-05, 'epoch': 0.47} {'loss': 0.8632, 'learning_rate': 1.7484222420164806e-05, 'epoch': 0.47} {'loss': 0.8384, 'learning_rate': 1.7484005309237747e-05, 'epoch': 0.47} {'loss': 0.705, 'learning_rate': 1.7483788190290906e-05, 'epoch': 0.47} {'loss': 0.8368, 'learning_rate': 1.748357106332451e-05, 'epoch': 0.47} {'loss': 0.8156, 'learning_rate': 1.748335392833879e-05, 'epoch': 0.47} {'loss': 0.8815, 'learning_rate': 1.748313678533398e-05, 'epoch': 0.47} {'loss': 0.8597, 'learning_rate': 1.7482919634310316e-05, 'epoch': 0.47} {'loss': 0.7559, 'learning_rate': 1.748270247526803e-05, 'epoch': 0.47} {'loss': 0.8669, 'learning_rate': 1.7482485308207347e-05, 'epoch': 0.47} {'loss': 0.8265, 'learning_rate': 1.7482268133128513e-05, 'epoch': 0.47} {'loss': 0.6706, 'learning_rate': 1.7482050950031747e-05, 'epoch': 0.47} {'loss': 1.0287, 'learning_rate': 1.7481833758917292e-05, 'epoch': 0.47} {'loss': 0.8296, 'learning_rate': 1.7481616559785375e-05, 'epoch': 0.47} {'loss': 0.758, 'learning_rate': 1.748139935263623e-05, 'epoch': 0.47} {'loss': 0.9393, 'learning_rate': 1.7481182137470095e-05, 'epoch': 0.47} {'loss': 0.7846, 'learning_rate': 1.7480964914287193e-05, 'epoch': 0.47} {'loss': 0.9728, 'learning_rate': 1.748074768308776e-05, 'epoch': 0.47} {'loss': 1.0596, 'learning_rate': 1.7480530443872036e-05, 'epoch': 0.47} {'loss': 0.8827, 'learning_rate': 1.748031319664025e-05, 'epoch': 0.47} {'loss': 1.0049, 'learning_rate': 1.7480095941392626e-05, 'epoch': 0.47} {'loss': 0.7612, 'learning_rate': 1.747987867812941e-05, 'epoch': 0.47} {'loss': 0.796, 'learning_rate': 1.7479661406850827e-05, 'epoch': 0.47} {'loss': 0.964, 'learning_rate': 1.7479444127557112e-05, 'epoch': 0.47} {'loss': 0.871, 'learning_rate': 1.7479226840248496e-05, 'epoch': 0.47} {'loss': 0.7642, 'learning_rate': 1.7479009544925217e-05, 'epoch': 0.47} {'loss': 0.675, 'learning_rate': 1.7478792241587502e-05, 'epoch': 0.47} {'loss': 0.9143, 'learning_rate': 1.7478574930235582e-05, 'epoch': 0.47} {'loss': 0.7004, 'learning_rate': 1.74783576108697e-05, 'epoch': 0.47} {'loss': 0.8161, 'learning_rate': 1.747814028349008e-05, 'epoch': 0.47} {'loss': 0.7638, 'learning_rate': 1.747792294809696e-05, 'epoch': 0.47} {'loss': 0.8559, 'learning_rate': 1.7477705604690567e-05, 'epoch': 0.47} {'loss': 1.0805, 'learning_rate': 1.747748825327114e-05, 'epoch': 0.47} {'loss': 0.9091, 'learning_rate': 1.7477270893838908e-05, 'epoch': 0.47} {'loss': 0.9468, 'learning_rate': 1.747705352639411e-05, 'epoch': 0.47} {'loss': 0.8172, 'learning_rate': 1.747683615093697e-05, 'epoch': 0.47} {'loss': 0.9509, 'learning_rate': 1.7476618767467724e-05, 'epoch': 0.47} {'loss': 0.9155, 'learning_rate': 1.7476401375986613e-05, 'epoch': 0.47} {'loss': 0.8936, 'learning_rate': 1.7476183976493853e-05, 'epoch': 0.47} {'loss': 0.8718, 'learning_rate': 1.7475966568989694e-05, 'epoch': 0.47} {'loss': 0.7724, 'learning_rate': 1.747574915347436e-05, 'epoch': 0.47} {'loss': 0.9197, 'learning_rate': 1.7475531729948088e-05, 'epoch': 0.47} {'loss': 0.8027, 'learning_rate': 1.7475314298411107e-05, 'epoch': 0.47} {'loss': 0.7284, 'learning_rate': 1.747509685886365e-05, 'epoch': 0.47} {'loss': 0.8534, 'learning_rate': 1.747487941130596e-05, 'epoch': 0.47} {'loss': 0.9324, 'learning_rate': 1.7474661955738256e-05, 'epoch': 0.47} {'loss': 0.7938, 'learning_rate': 1.7474444492160776e-05, 'epoch': 0.47} {'loss': 0.6607, 'learning_rate': 1.7474227020573756e-05, 'epoch': 0.47} {'loss': 0.9973, 'learning_rate': 1.7474009540977426e-05, 'epoch': 0.47} {'loss': 0.7835, 'learning_rate': 1.747379205337202e-05, 'epoch': 0.47} {'loss': 0.997, 'learning_rate': 1.7473574557757776e-05, 'epoch': 0.47} {'loss': 0.802, 'learning_rate': 1.747335705413492e-05, 'epoch': 0.47} {'loss': 0.9574, 'learning_rate': 1.747313954250368e-05, 'epoch': 0.47} {'loss': 0.9043, 'learning_rate': 1.7472922022864306e-05, 'epoch': 0.47} {'loss': 0.876, 'learning_rate': 1.747270449521702e-05, 'epoch': 0.47} {'loss': 0.9272, 'learning_rate': 1.7472486959562054e-05, 'epoch': 0.47} {'loss': 0.9531, 'learning_rate': 1.747226941589965e-05, 'epoch': 0.47} {'loss': 1.0252, 'learning_rate': 1.7472051864230028e-05, 'epoch': 0.47} {'loss': 0.7359, 'learning_rate': 1.7471834304553428e-05, 'epoch': 0.47} {'loss': 0.8405, 'learning_rate': 1.7471616736870086e-05, 'epoch': 0.47} {'loss': 0.8282, 'learning_rate': 1.747139916118023e-05, 'epoch': 0.47} {'loss': 0.8102, 'learning_rate': 1.7471181577484096e-05, 'epoch': 0.47} {'loss': 0.924, 'learning_rate': 1.747096398578192e-05, 'epoch': 0.47} {'loss': 0.9025, 'learning_rate': 1.7470746386073925e-05, 'epoch': 0.47} {'loss': 1.0279, 'learning_rate': 1.7470528778360356e-05, 'epoch': 0.47} {'loss': 0.9355, 'learning_rate': 1.7470311162641444e-05, 'epoch': 0.47} {'loss': 0.7838, 'learning_rate': 1.7470093538917413e-05, 'epoch': 0.47} {'loss': 0.738, 'learning_rate': 1.7469875907188504e-05, 'epoch': 0.47} {'loss': 0.9139, 'learning_rate': 1.746965826745495e-05, 'epoch': 0.47} {'loss': 0.7851, 'learning_rate': 1.7469440619716987e-05, 'epoch': 0.47} {'loss': 0.9083, 'learning_rate': 1.7469222963974837e-05, 'epoch': 0.47} {'loss': 0.7945, 'learning_rate': 1.7469005300228743e-05, 'epoch': 0.47} {'loss': 0.9127, 'learning_rate': 1.7468787628478937e-05, 'epoch': 0.47} {'loss': 0.7332, 'learning_rate': 1.7468569948725652e-05, 'epoch': 0.47} {'loss': 0.822, 'learning_rate': 1.7468352260969115e-05, 'epoch': 0.47} {'loss': 0.9163, 'learning_rate': 1.746813456520957e-05, 'epoch': 0.47} {'loss': 0.9217, 'learning_rate': 1.7467916861447242e-05, 'epoch': 0.47} {'loss': 0.802, 'learning_rate': 1.746769914968237e-05, 'epoch': 0.47} {'loss': 0.8809, 'learning_rate': 1.746748142991518e-05, 'epoch': 0.47} {'loss': 0.6758, 'learning_rate': 1.7467263702145912e-05, 'epoch': 0.47} {'loss': 0.8687, 'learning_rate': 1.7467045966374798e-05, 'epoch': 0.47} {'loss': 0.8785, 'learning_rate': 1.746682822260207e-05, 'epoch': 0.47} {'loss': 0.9391, 'learning_rate': 1.746661047082796e-05, 'epoch': 0.47} {'loss': 0.8721, 'learning_rate': 1.7466392711052705e-05, 'epoch': 0.47} {'loss': 0.8701, 'learning_rate': 1.7466174943276532e-05, 'epoch': 0.47} {'loss': 0.9097, 'learning_rate': 1.7465957167499685e-05, 'epoch': 0.47} {'loss': 0.9056, 'learning_rate': 1.7465739383722386e-05, 'epoch': 0.47} {'loss': 0.7821, 'learning_rate': 1.7465521591944877e-05, 'epoch': 0.47} {'loss': 0.8899, 'learning_rate': 1.7465303792167386e-05, 'epoch': 0.47} {'loss': 0.8562, 'learning_rate': 1.746508598439015e-05, 'epoch': 0.47} {'loss': 0.9468, 'learning_rate': 1.7464868168613396e-05, 'epoch': 0.47} {'loss': 0.8769, 'learning_rate': 1.7464650344837368e-05, 'epoch': 0.47} {'loss': 0.872, 'learning_rate': 1.7464432513062285e-05, 'epoch': 0.47} {'loss': 0.8686, 'learning_rate': 1.7464214673288397e-05, 'epoch': 0.47} {'loss': 1.0115, 'learning_rate': 1.7463996825515925e-05, 'epoch': 0.47} {'loss': 0.8183, 'learning_rate': 1.7463778969745108e-05, 'epoch': 0.47} {'loss': 0.8327, 'learning_rate': 1.7463561105976178e-05, 'epoch': 0.47} {'loss': 0.7494, 'learning_rate': 1.746334323420937e-05, 'epoch': 0.47} {'loss': 0.8759, 'learning_rate': 1.7463125354444915e-05, 'epoch': 0.47} {'loss': 0.7377, 'learning_rate': 1.746290746668305e-05, 'epoch': 0.47} {'loss': 0.8382, 'learning_rate': 1.7462689570924003e-05, 'epoch': 0.47} {'loss': 0.9123, 'learning_rate': 1.746247166716801e-05, 'epoch': 0.47} {'loss': 1.0026, 'learning_rate': 1.7462253755415308e-05, 'epoch': 0.47} {'loss': 1.013, 'learning_rate': 1.7462035835666123e-05, 'epoch': 0.47} {'loss': 0.9106, 'learning_rate': 1.7461817907920697e-05, 'epoch': 0.47} {'loss': 0.7714, 'learning_rate': 1.746159997217926e-05, 'epoch': 0.47} {'loss': 0.9419, 'learning_rate': 1.7461382028442044e-05, 'epoch': 0.47} {'loss': 0.9257, 'learning_rate': 1.7461164076709285e-05, 'epoch': 0.47} {'loss': 0.8635, 'learning_rate': 1.7460946116981213e-05, 'epoch': 0.47} {'loss': 0.8777, 'learning_rate': 1.7460728149258065e-05, 'epoch': 0.47} {'loss': 0.7625, 'learning_rate': 1.7460510173540074e-05, 'epoch': 0.47} {'loss': 0.6965, 'learning_rate': 1.7460292189827474e-05, 'epoch': 0.47} {'loss': 0.8491, 'learning_rate': 1.7460074198120493e-05, 'epoch': 0.47} {'loss': 0.986, 'learning_rate': 1.745985619841937e-05, 'epoch': 0.47} {'loss': 0.8517, 'learning_rate': 1.745963819072434e-05, 'epoch': 0.47} {'loss': 0.8361, 'learning_rate': 1.7459420175035634e-05, 'epoch': 0.47} {'loss': 0.8846, 'learning_rate': 1.7459202151353488e-05, 'epoch': 0.47} {'loss': 0.9263, 'learning_rate': 1.7458984119678132e-05, 'epoch': 0.47} {'loss': 0.9552, 'learning_rate': 1.74587660800098e-05, 'epoch': 0.47} {'loss': 0.6582, 'learning_rate': 1.745854803234873e-05, 'epoch': 0.47} {'loss': 0.7808, 'learning_rate': 1.7458329976695153e-05, 'epoch': 0.47} {'loss': 0.9208, 'learning_rate': 1.7458111913049297e-05, 'epoch': 0.47} {'loss': 0.8815, 'learning_rate': 1.7457893841411405e-05, 'epoch': 0.47} {'loss': 0.9416, 'learning_rate': 1.7457675761781706e-05, 'epoch': 0.47} {'loss': 0.8123, 'learning_rate': 1.745745767416043e-05, 'epoch': 0.47} {'loss': 0.9377, 'learning_rate': 1.7457239578547822e-05, 'epoch': 0.47} {'loss': 0.8919, 'learning_rate': 1.7457021474944106e-05, 'epoch': 0.47} {'loss': 0.8462, 'learning_rate': 1.7456803363349518e-05, 'epoch': 0.47} {'loss': 0.7443, 'learning_rate': 1.7456585243764292e-05, 'epoch': 0.47} {'loss': 0.8075, 'learning_rate': 1.7456367116188662e-05, 'epoch': 0.47} {'loss': 0.8329, 'learning_rate': 1.7456148980622862e-05, 'epoch': 0.47} {'loss': 0.8306, 'learning_rate': 1.745593083706713e-05, 'epoch': 0.47} {'loss': 0.8986, 'learning_rate': 1.7455712685521686e-05, 'epoch': 0.47} {'loss': 0.7197, 'learning_rate': 1.745549452598678e-05, 'epoch': 0.47} {'loss': 0.7853, 'learning_rate': 1.7455276358462635e-05, 'epoch': 0.47} {'loss': 0.8567, 'learning_rate': 1.7455058182949488e-05, 'epoch': 0.47} {'loss': 0.812, 'learning_rate': 1.7454839999447576e-05, 'epoch': 0.47} {'loss': 0.9024, 'learning_rate': 1.745462180795713e-05, 'epoch': 0.47} {'loss': 0.7452, 'learning_rate': 1.7454403608478384e-05, 'epoch': 0.47} {'loss': 0.8779, 'learning_rate': 1.7454185401011566e-05, 'epoch': 0.47} {'loss': 0.948, 'learning_rate': 1.7453967185556925e-05, 'epoch': 0.47} {'loss': 0.8037, 'learning_rate': 1.745374896211468e-05, 'epoch': 0.47} {'loss': 0.7957, 'learning_rate': 1.7453530730685068e-05, 'epoch': 0.47} {'loss': 0.8145, 'learning_rate': 1.745331249126833e-05, 'epoch': 0.47} {'loss': 0.7955, 'learning_rate': 1.7453094243864693e-05, 'epoch': 0.47} {'loss': 0.8911, 'learning_rate': 1.745287598847439e-05, 'epoch': 0.47} {'loss': 0.7302, 'learning_rate': 1.745265772509766e-05, 'epoch': 0.47} {'loss': 0.8117, 'learning_rate': 1.745243945373474e-05, 'epoch': 0.47} {'loss': 0.9153, 'learning_rate': 1.7452221174385852e-05, 'epoch': 0.47} {'loss': 0.8397, 'learning_rate': 1.7452002887051236e-05, 'epoch': 0.47} {'loss': 1.0404, 'learning_rate': 1.745178459173113e-05, 'epoch': 0.47} {'loss': 1.0087, 'learning_rate': 1.745156628842576e-05, 'epoch': 0.47} {'loss': 0.9272, 'learning_rate': 1.745134797713537e-05, 'epoch': 0.47} {'loss': 0.7463, 'learning_rate': 1.7451129657860182e-05, 'epoch': 0.47} {'loss': 0.6632, 'learning_rate': 1.7450911330600438e-05, 'epoch': 0.47} {'loss': 0.8031, 'learning_rate': 1.7450692995356372e-05, 'epoch': 0.47} {'loss': 0.6917, 'learning_rate': 1.7450474652128214e-05, 'epoch': 0.47} {'loss': 0.8287, 'learning_rate': 1.7450256300916204e-05, 'epoch': 0.47} {'loss': 0.7573, 'learning_rate': 1.7450037941720567e-05, 'epoch': 0.47} {'loss': 0.7589, 'learning_rate': 1.7449819574541546e-05, 'epoch': 0.47} {'loss': 0.949, 'learning_rate': 1.7449601199379368e-05, 'epoch': 0.47} {'loss': 0.7722, 'learning_rate': 1.744938281623427e-05, 'epoch': 0.47} {'loss': 0.9182, 'learning_rate': 1.7449164425106487e-05, 'epoch': 0.47} {'loss': 0.7829, 'learning_rate': 1.744894602599625e-05, 'epoch': 0.47} {'loss': 1.0681, 'learning_rate': 1.7448727618903798e-05, 'epoch': 0.47} {'loss': 0.989, 'learning_rate': 1.744850920382936e-05, 'epoch': 0.47} {'loss': 0.8785, 'learning_rate': 1.7448290780773175e-05, 'epoch': 0.47} {'loss': 0.8495, 'learning_rate': 1.744807234973547e-05, 'epoch': 0.47} {'loss': 0.8171, 'learning_rate': 1.7447853910716487e-05, 'epoch': 0.47} {'loss': 0.9112, 'learning_rate': 1.7447635463716452e-05, 'epoch': 0.47} {'loss': 0.8048, 'learning_rate': 1.7447417008735608e-05, 'epoch': 0.47} {'loss': 0.7198, 'learning_rate': 1.7447198545774183e-05, 'epoch': 0.47} {'loss': 0.9427, 'learning_rate': 1.7446980074832413e-05, 'epoch': 0.47} {'loss': 0.7596, 'learning_rate': 1.744676159591053e-05, 'epoch': 0.47} {'loss': 0.7802, 'learning_rate': 1.744654310900877e-05, 'epoch': 0.47} {'loss': 0.8121, 'learning_rate': 1.744632461412737e-05, 'epoch': 0.47} {'loss': 0.8458, 'learning_rate': 1.7446106111266555e-05, 'epoch': 0.47} {'loss': 0.966, 'learning_rate': 1.744588760042657e-05, 'epoch': 0.47} {'loss': 0.893, 'learning_rate': 1.7445669081607643e-05, 'epoch': 0.47} {'loss': 0.8347, 'learning_rate': 1.744545055481001e-05, 'epoch': 0.47} {'loss': 0.7968, 'learning_rate': 1.7445232020033906e-05, 'epoch': 0.47} {'loss': 1.0573, 'learning_rate': 1.744501347727956e-05, 'epoch': 0.47} {'loss': 0.748, 'learning_rate': 1.7444794926547213e-05, 'epoch': 0.47} {'loss': 0.8185, 'learning_rate': 1.7444576367837095e-05, 'epoch': 0.47} {'loss': 0.8278, 'learning_rate': 1.7444357801149444e-05, 'epoch': 0.47} {'loss': 0.7179, 'learning_rate': 1.7444139226484492e-05, 'epoch': 0.47} {'loss': 0.9095, 'learning_rate': 1.7443920643842468e-05, 'epoch': 0.47} {'loss': 0.869, 'learning_rate': 1.7443702053223616e-05, 'epoch': 0.47} {'loss': 0.9781, 'learning_rate': 1.7443483454628163e-05, 'epoch': 0.47} {'loss': 0.8863, 'learning_rate': 1.7443264848056347e-05, 'epoch': 0.47} {'loss': 0.8271, 'learning_rate': 1.74430462335084e-05, 'epoch': 0.47} {'loss': 1.0669, 'learning_rate': 1.744282761098456e-05, 'epoch': 0.47} {'loss': 0.8727, 'learning_rate': 1.7442608980485055e-05, 'epoch': 0.47} {'loss': 0.8574, 'learning_rate': 1.7442390342010122e-05, 'epoch': 0.47} {'loss': 0.7497, 'learning_rate': 1.7442171695559998e-05, 'epoch': 0.47} {'loss': 0.7648, 'learning_rate': 1.7441953041134917e-05, 'epoch': 0.47} {'loss': 0.9712, 'learning_rate': 1.7441734378735108e-05, 'epoch': 0.47} {'loss': 0.7435, 'learning_rate': 1.7441515708360813e-05, 'epoch': 0.47} {'loss': 0.8775, 'learning_rate': 1.7441297030012258e-05, 'epoch': 0.47} {'loss': 0.7573, 'learning_rate': 1.7441078343689684e-05, 'epoch': 0.47} {'loss': 0.8915, 'learning_rate': 1.7440859649393322e-05, 'epoch': 0.47} {'loss': 0.9576, 'learning_rate': 1.744064094712341e-05, 'epoch': 0.47} {'loss': 0.8954, 'learning_rate': 1.7440422236880174e-05, 'epoch': 0.47} {'loss': 0.8361, 'learning_rate': 1.744020351866386e-05, 'epoch': 0.47} {'loss': 0.9143, 'learning_rate': 1.7439984792474693e-05, 'epoch': 0.47} {'loss': 0.9966, 'learning_rate': 1.743976605831291e-05, 'epoch': 0.47} {'loss': 0.71, 'learning_rate': 1.7439547316178747e-05, 'epoch': 0.47} {'loss': 1.0638, 'learning_rate': 1.743932856607244e-05, 'epoch': 0.47} {'loss': 0.8742, 'learning_rate': 1.743910980799422e-05, 'epoch': 0.47} {'loss': 0.9034, 'learning_rate': 1.743889104194432e-05, 'epoch': 0.47} {'loss': 0.9222, 'learning_rate': 1.7438672267922982e-05, 'epoch': 0.47} {'loss': 0.7212, 'learning_rate': 1.7438453485930432e-05, 'epoch': 0.47} {'loss': 0.8318, 'learning_rate': 1.7438234695966906e-05, 'epoch': 0.47} {'loss': 0.9093, 'learning_rate': 1.7438015898032644e-05, 'epoch': 0.47} {'loss': 0.945, 'learning_rate': 1.7437797092127873e-05, 'epoch': 0.47} {'loss': 0.6623, 'learning_rate': 1.7437578278252834e-05, 'epoch': 0.47} {'loss': 1.0189, 'learning_rate': 1.7437359456407757e-05, 'epoch': 0.47} {'loss': 0.7719, 'learning_rate': 1.743714062659288e-05, 'epoch': 0.47} {'loss': 0.7915, 'learning_rate': 1.743692178880843e-05, 'epoch': 0.47} {'loss': 0.8396, 'learning_rate': 1.7436702943054653e-05, 'epoch': 0.47} {'loss': 0.8461, 'learning_rate': 1.7436484089331775e-05, 'epoch': 0.47} {'loss': 0.7566, 'learning_rate': 1.7436265227640035e-05, 'epoch': 0.47} {'loss': 0.7983, 'learning_rate': 1.7436046357979664e-05, 'epoch': 0.47} {'loss': 0.9106, 'learning_rate': 1.74358274803509e-05, 'epoch': 0.47} {'loss': 0.8711, 'learning_rate': 1.7435608594753974e-05, 'epoch': 0.47} {'loss': 0.8342, 'learning_rate': 1.743538970118912e-05, 'epoch': 0.47} {'loss': 0.8444, 'learning_rate': 1.743517079965658e-05, 'epoch': 0.47} {'loss': 0.9152, 'learning_rate': 1.743495189015658e-05, 'epoch': 0.47} {'loss': 0.657, 'learning_rate': 1.743473297268936e-05, 'epoch': 0.47} {'loss': 0.8485, 'learning_rate': 1.743451404725515e-05, 'epoch': 0.47} {'loss': 0.8629, 'learning_rate': 1.743429511385419e-05, 'epoch': 0.47} {'loss': 0.9577, 'learning_rate': 1.743407617248671e-05, 'epoch': 0.47} {'loss': 0.8555, 'learning_rate': 1.743385722315295e-05, 'epoch': 0.47} {'loss': 0.6659, 'learning_rate': 1.7433638265853135e-05, 'epoch': 0.47} {'loss': 0.8737, 'learning_rate': 1.7433419300587507e-05, 'epoch': 0.47} {'loss': 0.9185, 'learning_rate': 1.74332003273563e-05, 'epoch': 0.47} {'loss': 0.759, 'learning_rate': 1.7432981346159752e-05, 'epoch': 0.47} {'loss': 0.8784, 'learning_rate': 1.7432762356998088e-05, 'epoch': 0.47} {'loss': 0.8738, 'learning_rate': 1.7432543359871554e-05, 'epoch': 0.47} {'loss': 0.6817, 'learning_rate': 1.743232435478037e-05, 'epoch': 0.47} {'loss': 0.9688, 'learning_rate': 1.743210534172479e-05, 'epoch': 0.47} {'loss': 0.9101, 'learning_rate': 1.743188632070503e-05, 'epoch': 0.47} {'loss': 0.8072, 'learning_rate': 1.743166729172134e-05, 'epoch': 0.47} {'loss': 0.7468, 'learning_rate': 1.7431448254773943e-05, 'epoch': 0.47} {'loss': 0.9588, 'learning_rate': 1.743122920986308e-05, 'epoch': 0.47} {'loss': 0.7359, 'learning_rate': 1.7431010156988985e-05, 'epoch': 0.47} {'loss': 0.9073, 'learning_rate': 1.743079109615189e-05, 'epoch': 0.47} {'loss': 1.0418, 'learning_rate': 1.7430572027352034e-05, 'epoch': 0.47} {'loss': 0.7817, 'learning_rate': 1.7430352950589647e-05, 'epoch': 0.47} {'loss': 0.7877, 'learning_rate': 1.7430133865864968e-05, 'epoch': 0.47} {'loss': 0.7567, 'learning_rate': 1.742991477317823e-05, 'epoch': 0.47} {'loss': 0.9077, 'learning_rate': 1.7429695672529666e-05, 'epoch': 0.47} {'loss': 0.8539, 'learning_rate': 1.7429476563919514e-05, 'epoch': 0.47} {'loss': 0.8294, 'learning_rate': 1.7429257447348008e-05, 'epoch': 0.47} {'loss': 0.9857, 'learning_rate': 1.7429038322815382e-05, 'epoch': 0.47} {'loss': 0.8914, 'learning_rate': 1.742881919032187e-05, 'epoch': 0.47} {'loss': 0.8081, 'learning_rate': 1.7428600049867704e-05, 'epoch': 0.47} {'loss': 0.8498, 'learning_rate': 1.742838090145313e-05, 'epoch': 0.47} {'loss': 0.8528, 'learning_rate': 1.742816174507837e-05, 'epoch': 0.47} {'loss': 1.0854, 'learning_rate': 1.7427942580743666e-05, 'epoch': 0.47} {'loss': 0.8326, 'learning_rate': 1.742772340844925e-05, 'epoch': 0.47} {'loss': 0.8714, 'learning_rate': 1.742750422819536e-05, 'epoch': 0.47} {'loss': 0.9194, 'learning_rate': 1.7427285039982226e-05, 'epoch': 0.47} {'loss': 0.757, 'learning_rate': 1.7427065843810087e-05, 'epoch': 0.47} {'loss': 0.8045, 'learning_rate': 1.7426846639679176e-05, 'epoch': 0.47} {'loss': 0.8282, 'learning_rate': 1.7426627427589734e-05, 'epoch': 0.47} {'loss': 1.0781, 'learning_rate': 1.7426408207541986e-05, 'epoch': 0.47} {'loss': 0.8607, 'learning_rate': 1.742618897953617e-05, 'epoch': 0.47} {'loss': 0.7992, 'learning_rate': 1.7425969743572522e-05, 'epoch': 0.47} {'loss': 0.8362, 'learning_rate': 1.7425750499651283e-05, 'epoch': 0.47} {'loss': 0.8733, 'learning_rate': 1.7425531247772674e-05, 'epoch': 0.47} {'loss': 0.8372, 'learning_rate': 1.7425311987936943e-05, 'epoch': 0.47} {'loss': 0.7529, 'learning_rate': 1.742509272014432e-05, 'epoch': 0.47} {'loss': 0.8604, 'learning_rate': 1.742487344439504e-05, 'epoch': 0.47} {'loss': 0.9165, 'learning_rate': 1.7424654160689337e-05, 'epoch': 0.47} {'loss': 0.8676, 'learning_rate': 1.7424434869027447e-05, 'epoch': 0.47} {'loss': 0.8495, 'learning_rate': 1.7424215569409604e-05, 'epoch': 0.47} {'loss': 0.8762, 'learning_rate': 1.7423996261836045e-05, 'epoch': 0.47} {'loss': 0.8737, 'learning_rate': 1.7423776946307003e-05, 'epoch': 0.47} {'loss': 0.9607, 'learning_rate': 1.7423557622822716e-05, 'epoch': 0.47} {'loss': 0.9976, 'learning_rate': 1.7423338291383417e-05, 'epoch': 0.47} {'loss': 0.721, 'learning_rate': 1.7423118951989337e-05, 'epoch': 0.47} {'loss': 0.8657, 'learning_rate': 1.742289960464072e-05, 'epoch': 0.47} {'loss': 0.7662, 'learning_rate': 1.7422680249337792e-05, 'epoch': 0.47} {'loss': 0.7664, 'learning_rate': 1.7422460886080795e-05, 'epoch': 0.47} {'loss': 0.836, 'learning_rate': 1.742224151486996e-05, 'epoch': 0.47} {'loss': 0.8761, 'learning_rate': 1.7422022135705524e-05, 'epoch': 0.47} {'loss': 0.839, 'learning_rate': 1.742180274858772e-05, 'epoch': 0.47} {'loss': 0.8042, 'learning_rate': 1.7421583353516786e-05, 'epoch': 0.47} {'loss': 0.8152, 'learning_rate': 1.7421363950492954e-05, 'epoch': 0.47} {'loss': 0.8525, 'learning_rate': 1.7421144539516462e-05, 'epoch': 0.47} {'loss': 0.7885, 'learning_rate': 1.7420925120587547e-05, 'epoch': 0.47} {'loss': 0.9273, 'learning_rate': 1.7420705693706436e-05, 'epoch': 0.47} {'loss': 0.8248, 'learning_rate': 1.7420486258873373e-05, 'epoch': 0.47} {'loss': 0.8826, 'learning_rate': 1.7420266816088584e-05, 'epoch': 0.47} {'loss': 0.867, 'learning_rate': 1.742004736535231e-05, 'epoch': 0.47} {'loss': 0.8377, 'learning_rate': 1.741982790666479e-05, 'epoch': 0.47} {'loss': 1.0107, 'learning_rate': 1.7419608440026254e-05, 'epoch': 0.47} {'loss': 0.97, 'learning_rate': 1.7419388965436937e-05, 'epoch': 0.47} {'loss': 0.6716, 'learning_rate': 1.7419169482897074e-05, 'epoch': 0.47} {'loss': 1.0752, 'learning_rate': 1.7418949992406902e-05, 'epoch': 0.47} {'loss': 0.8873, 'learning_rate': 1.7418730493966655e-05, 'epoch': 0.47} {'loss': 0.8734, 'learning_rate': 1.741851098757657e-05, 'epoch': 0.47} {'loss': 0.8434, 'learning_rate': 1.741829147323688e-05, 'epoch': 0.47} {'loss': 0.7303, 'learning_rate': 1.7418071950947822e-05, 'epoch': 0.47} {'loss': 0.8999, 'learning_rate': 1.7417852420709627e-05, 'epoch': 0.47} {'loss': 0.6926, 'learning_rate': 1.741763288252254e-05, 'epoch': 0.47} {'loss': 0.8555, 'learning_rate': 1.7417413336386784e-05, 'epoch': 0.47} {'loss': 0.8299, 'learning_rate': 1.7417193782302602e-05, 'epoch': 0.47} {'loss': 0.8943, 'learning_rate': 1.7416974220270225e-05, 'epoch': 0.47} {'loss': 1.0605, 'learning_rate': 1.7416754650289894e-05, 'epoch': 0.47} {'loss': 0.9088, 'learning_rate': 1.7416535072361843e-05, 'epoch': 0.47} {'loss': 0.8139, 'learning_rate': 1.74163154864863e-05, 'epoch': 0.47} {'loss': 0.8435, 'learning_rate': 1.741609589266351e-05, 'epoch': 0.47} {'loss': 0.7897, 'learning_rate': 1.74158762908937e-05, 'epoch': 0.47} {'loss': 0.8827, 'learning_rate': 1.7415656681177113e-05, 'epoch': 0.47} {'loss': 0.74, 'learning_rate': 1.7415437063513977e-05, 'epoch': 0.47} {'loss': 0.9402, 'learning_rate': 1.7415217437904533e-05, 'epoch': 0.47} {'loss': 0.837, 'learning_rate': 1.7414997804349016e-05, 'epoch': 0.47} {'loss': 0.8067, 'learning_rate': 1.7414778162847655e-05, 'epoch': 0.47} {'loss': 0.8161, 'learning_rate': 1.7414558513400696e-05, 'epoch': 0.47} {'loss': 0.9646, 'learning_rate': 1.7414338856008363e-05, 'epoch': 0.47} {'loss': 0.8453, 'learning_rate': 1.74141191906709e-05, 'epoch': 0.47} {'loss': 0.6692, 'learning_rate': 1.7413899517388537e-05, 'epoch': 0.47} {'loss': 0.9798, 'learning_rate': 1.741367983616151e-05, 'epoch': 0.47} {'loss': 0.8677, 'learning_rate': 1.741346014699006e-05, 'epoch': 0.47} {'loss': 0.9289, 'learning_rate': 1.741324044987442e-05, 'epoch': 0.47} {'loss': 0.9419, 'learning_rate': 1.7413020744814816e-05, 'epoch': 0.47} {'loss': 0.7437, 'learning_rate': 1.7412801031811498e-05, 'epoch': 0.47} {'loss': 0.8446, 'learning_rate': 1.741258131086469e-05, 'epoch': 0.47} {'loss': 0.769, 'learning_rate': 1.7412361581974637e-05, 'epoch': 0.47} {'loss': 0.8186, 'learning_rate': 1.7412141845141564e-05, 'epoch': 0.47} {'loss': 1.0252, 'learning_rate': 1.7411922100365715e-05, 'epoch': 0.47} {'loss': 0.8796, 'learning_rate': 1.7411702347647326e-05, 'epoch': 0.47} {'loss': 1.0848, 'learning_rate': 1.7411482586986624e-05, 'epoch': 0.47} {'loss': 0.8569, 'learning_rate': 1.741126281838385e-05, 'epoch': 0.47} {'loss': 0.9854, 'learning_rate': 1.741104304183924e-05, 'epoch': 0.47} {'loss': 0.7732, 'learning_rate': 1.741082325735303e-05, 'epoch': 0.47} {'loss': 0.7144, 'learning_rate': 1.7410603464925452e-05, 'epoch': 0.47} {'loss': 0.8317, 'learning_rate': 1.7410383664556743e-05, 'epoch': 0.47} {'loss': 0.8909, 'learning_rate': 1.741016385624714e-05, 'epoch': 0.47} {'loss': 0.9368, 'learning_rate': 1.7409944039996877e-05, 'epoch': 0.47} {'loss': 1.0271, 'learning_rate': 1.7409724215806193e-05, 'epoch': 0.47} {'loss': 0.8447, 'learning_rate': 1.7409504383675314e-05, 'epoch': 0.47} {'loss': 0.9922, 'learning_rate': 1.7409284543604487e-05, 'epoch': 0.47} {'loss': 0.9651, 'learning_rate': 1.7409064695593943e-05, 'epoch': 0.47} {'loss': 0.9425, 'learning_rate': 1.740884483964392e-05, 'epoch': 0.47} {'loss': 0.9134, 'learning_rate': 1.7408624975754647e-05, 'epoch': 0.47} {'loss': 0.856, 'learning_rate': 1.7408405103926367e-05, 'epoch': 0.47} {'loss': 0.8174, 'learning_rate': 1.740818522415931e-05, 'epoch': 0.47} {'loss': 0.8473, 'learning_rate': 1.7407965336453712e-05, 'epoch': 0.47} {'loss': 0.9663, 'learning_rate': 1.7407745440809813e-05, 'epoch': 0.47} {'loss': 0.9202, 'learning_rate': 1.740752553722785e-05, 'epoch': 0.47} {'loss': 0.8685, 'learning_rate': 1.7407305625708045e-05, 'epoch': 0.47} {'loss': 0.8841, 'learning_rate': 1.740708570625065e-05, 'epoch': 0.47} {'loss': 0.7343, 'learning_rate': 1.7406865778855894e-05, 'epoch': 0.47} {'loss': 0.7786, 'learning_rate': 1.7406645843524012e-05, 'epoch': 0.47} {'loss': 0.7901, 'learning_rate': 1.740642590025524e-05, 'epoch': 0.47} {'loss': 0.8267, 'learning_rate': 1.7406205949049815e-05, 'epoch': 0.47} {'loss': 0.7955, 'learning_rate': 1.7405985989907972e-05, 'epoch': 0.47} {'loss': 0.9009, 'learning_rate': 1.7405766022829946e-05, 'epoch': 0.47} {'loss': 0.9773, 'learning_rate': 1.7405546047815973e-05, 'epoch': 0.47} {'loss': 0.8673, 'learning_rate': 1.740532606486629e-05, 'epoch': 0.47} {'loss': 0.7603, 'learning_rate': 1.7405106073981132e-05, 'epoch': 0.47} {'loss': 0.8513, 'learning_rate': 1.7404886075160732e-05, 'epoch': 0.47} {'loss': 0.9187, 'learning_rate': 1.740466606840533e-05, 'epoch': 0.47} {'loss': 0.9871, 'learning_rate': 1.740444605371516e-05, 'epoch': 0.47} {'loss': 0.8685, 'learning_rate': 1.740422603109046e-05, 'epoch': 0.47} {'loss': 0.9872, 'learning_rate': 1.740400600053146e-05, 'epoch': 0.47} {'loss': 0.9268, 'learning_rate': 1.74037859620384e-05, 'epoch': 0.47} {'loss': 0.8055, 'learning_rate': 1.7403565915611514e-05, 'epoch': 0.47} {'loss': 0.8336, 'learning_rate': 1.7403345861251042e-05, 'epoch': 0.47} {'loss': 0.7853, 'learning_rate': 1.7403125798957215e-05, 'epoch': 0.47} {'loss': 0.9078, 'learning_rate': 1.740290572873027e-05, 'epoch': 0.47} {'loss': 1.0501, 'learning_rate': 1.7402685650570446e-05, 'epoch': 0.47} {'loss': 0.989, 'learning_rate': 1.740246556447797e-05, 'epoch': 0.47} {'loss': 0.9774, 'learning_rate': 1.740224547045309e-05, 'epoch': 0.47} {'loss': 0.7184, 'learning_rate': 1.7402025368496034e-05, 'epoch': 0.47} {'loss': 0.7794, 'learning_rate': 1.740180525860704e-05, 'epoch': 0.47} {'loss': 0.7557, 'learning_rate': 1.7401585140786344e-05, 'epoch': 0.47} {'loss': 0.8777, 'learning_rate': 1.740136501503418e-05, 'epoch': 0.47} {'loss': 0.9491, 'learning_rate': 1.7401144881350787e-05, 'epoch': 0.47} {'loss': 0.7957, 'learning_rate': 1.74009247397364e-05, 'epoch': 0.47} {'loss': 0.7792, 'learning_rate': 1.740070459019125e-05, 'epoch': 0.47} {'loss': 0.8476, 'learning_rate': 1.7400484432715587e-05, 'epoch': 0.47} {'loss': 0.9135, 'learning_rate': 1.7400264267309627e-05, 'epoch': 0.47} {'loss': 0.9285, 'learning_rate': 1.740004409397362e-05, 'epoch': 0.47} {'loss': 0.8328, 'learning_rate': 1.7399823912707794e-05, 'epoch': 0.47} {'loss': 0.6958, 'learning_rate': 1.7399603723512393e-05, 'epoch': 0.47} {'loss': 0.7495, 'learning_rate': 1.7399383526387648e-05, 'epoch': 0.47} {'loss': 0.8748, 'learning_rate': 1.7399163321333793e-05, 'epoch': 0.47} {'loss': 0.912, 'learning_rate': 1.739894310835107e-05, 'epoch': 0.47} {'loss': 0.887, 'learning_rate': 1.7398722887439712e-05, 'epoch': 0.47} {'loss': 0.7483, 'learning_rate': 1.7398502658599953e-05, 'epoch': 0.47} {'loss': 0.8809, 'learning_rate': 1.739828242183203e-05, 'epoch': 0.47} {'loss': 0.868, 'learning_rate': 1.739806217713618e-05, 'epoch': 0.47} {'loss': 0.6333, 'learning_rate': 1.7397841924512637e-05, 'epoch': 0.47} {'loss': 0.942, 'learning_rate': 1.7397621663961645e-05, 'epoch': 0.47} {'loss': 0.8404, 'learning_rate': 1.7397401395483427e-05, 'epoch': 0.47} {'loss': 0.8647, 'learning_rate': 1.7397181119078224e-05, 'epoch': 0.47} {'loss': 0.9236, 'learning_rate': 1.739696083474628e-05, 'epoch': 0.47} {'loss': 0.9105, 'learning_rate': 1.7396740542487823e-05, 'epoch': 0.47} {'loss': 0.7487, 'learning_rate': 1.7396520242303092e-05, 'epoch': 0.47} {'loss': 0.7945, 'learning_rate': 1.739629993419232e-05, 'epoch': 0.47} {'loss': 0.9324, 'learning_rate': 1.7396079618155745e-05, 'epoch': 0.47} {'loss': 0.8797, 'learning_rate': 1.7395859294193606e-05, 'epoch': 0.47} {'loss': 0.7676, 'learning_rate': 1.7395638962306133e-05, 'epoch': 0.47} {'loss': 0.9795, 'learning_rate': 1.7395418622493565e-05, 'epoch': 0.47} {'loss': 0.7727, 'learning_rate': 1.7395198274756143e-05, 'epoch': 0.47} {'loss': 0.9208, 'learning_rate': 1.7394977919094095e-05, 'epoch': 0.47} {'loss': 1.0428, 'learning_rate': 1.739475755550766e-05, 'epoch': 0.47} {'loss': 0.6957, 'learning_rate': 1.7394537183997076e-05, 'epoch': 0.47} {'loss': 0.7587, 'learning_rate': 1.7394316804562577e-05, 'epoch': 0.47} {'loss': 0.8241, 'learning_rate': 1.7394096417204404e-05, 'epoch': 0.47} {'loss': 0.8547, 'learning_rate': 1.7393876021922785e-05, 'epoch': 0.47} {'loss': 0.8535, 'learning_rate': 1.739365561871796e-05, 'epoch': 0.48} {'loss': 0.8557, 'learning_rate': 1.739343520759017e-05, 'epoch': 0.48} {'loss': 0.7906, 'learning_rate': 1.7393214788539647e-05, 'epoch': 0.48} {'loss': 0.9958, 'learning_rate': 1.7392994361566623e-05, 'epoch': 0.48} {'loss': 0.9539, 'learning_rate': 1.739277392667134e-05, 'epoch': 0.48} {'loss': 0.7925, 'learning_rate': 1.739255348385403e-05, 'epoch': 0.48} {'loss': 0.9508, 'learning_rate': 1.7392333033114936e-05, 'epoch': 0.48} {'loss': 0.9039, 'learning_rate': 1.7392112574454287e-05, 'epoch': 0.48} {'loss': 0.9444, 'learning_rate': 1.7391892107872323e-05, 'epoch': 0.48} {'loss': 0.7699, 'learning_rate': 1.739167163336928e-05, 'epoch': 0.48} {'loss': 0.9148, 'learning_rate': 1.7391451150945395e-05, 'epoch': 0.48} {'loss': 0.9574, 'learning_rate': 1.7391230660600903e-05, 'epoch': 0.48} {'loss': 0.718, 'learning_rate': 1.7391010162336037e-05, 'epoch': 0.48} {'loss': 0.8235, 'learning_rate': 1.739078965615104e-05, 'epoch': 0.48} {'loss': 0.91, 'learning_rate': 1.7390569142046142e-05, 'epoch': 0.48} {'loss': 0.6563, 'learning_rate': 1.7390348620021585e-05, 'epoch': 0.48} {'loss': 0.8044, 'learning_rate': 1.7390128090077598e-05, 'epoch': 0.48} {'loss': 0.9152, 'learning_rate': 1.7389907552214426e-05, 'epoch': 0.48} {'loss': 0.7981, 'learning_rate': 1.7389687006432302e-05, 'epoch': 0.48} {'loss': 1.0038, 'learning_rate': 1.7389466452731457e-05, 'epoch': 0.48} {'loss': 0.8969, 'learning_rate': 1.738924589111213e-05, 'epoch': 0.48} {'loss': 0.7926, 'learning_rate': 1.7389025321574565e-05, 'epoch': 0.48} {'loss': 0.8372, 'learning_rate': 1.7388804744118993e-05, 'epoch': 0.48} {'loss': 0.9118, 'learning_rate': 1.7388584158745644e-05, 'epoch': 0.48} {'loss': 0.8081, 'learning_rate': 1.7388363565454764e-05, 'epoch': 0.48} {'loss': 0.8321, 'learning_rate': 1.7388142964246585e-05, 'epoch': 0.48} {'loss': 0.7069, 'learning_rate': 1.7387922355121345e-05, 'epoch': 0.48} {'loss': 0.8419, 'learning_rate': 1.7387701738079278e-05, 'epoch': 0.48} {'loss': 0.8696, 'learning_rate': 1.738748111312062e-05, 'epoch': 0.48} {'loss': 0.942, 'learning_rate': 1.738726048024561e-05, 'epoch': 0.48} {'loss': 0.799, 'learning_rate': 1.738703983945449e-05, 'epoch': 0.48} {'loss': 0.9785, 'learning_rate': 1.7386819190747483e-05, 'epoch': 0.48} {'loss': 0.8029, 'learning_rate': 1.7386598534124833e-05, 'epoch': 0.48} {'loss': 0.967, 'learning_rate': 1.7386377869586775e-05, 'epoch': 0.48} {'loss': 0.7226, 'learning_rate': 1.7386157197133554e-05, 'epoch': 0.48} {'loss': 0.9103, 'learning_rate': 1.7385936516765393e-05, 'epoch': 0.48} {'loss': 0.7514, 'learning_rate': 1.7385715828482536e-05, 'epoch': 0.48} {'loss': 0.859, 'learning_rate': 1.7385495132285216e-05, 'epoch': 0.48} {'loss': 0.8114, 'learning_rate': 1.7385274428173674e-05, 'epoch': 0.48} {'loss': 0.8285, 'learning_rate': 1.738505371614814e-05, 'epoch': 0.48} {'loss': 0.9059, 'learning_rate': 1.738483299620886e-05, 'epoch': 0.48} {'loss': 0.7241, 'learning_rate': 1.738461226835606e-05, 'epoch': 0.48} {'loss': 0.9729, 'learning_rate': 1.7384391532589985e-05, 'epoch': 0.48} {'loss': 0.7922, 'learning_rate': 1.7384170788910864e-05, 'epoch': 0.48} {'loss': 0.7242, 'learning_rate': 1.738395003731894e-05, 'epoch': 0.48} {'loss': 0.7902, 'learning_rate': 1.7383729277814447e-05, 'epoch': 0.48} {'loss': 0.8008, 'learning_rate': 1.738350851039762e-05, 'epoch': 0.48} {'loss': 0.7546, 'learning_rate': 1.73832877350687e-05, 'epoch': 0.48} {'loss': 0.7885, 'learning_rate': 1.738306695182792e-05, 'epoch': 0.48} {'loss': 0.7821, 'learning_rate': 1.7382846160675518e-05, 'epoch': 0.48} {'loss': 1.0921, 'learning_rate': 1.7382625361611728e-05, 'epoch': 0.48} {'loss': 0.9443, 'learning_rate': 1.738240455463679e-05, 'epoch': 0.48} {'loss': 0.9842, 'learning_rate': 1.738218373975094e-05, 'epoch': 0.48} {'loss': 0.8511, 'learning_rate': 1.7381962916954413e-05, 'epoch': 0.48} {'loss': 0.8572, 'learning_rate': 1.7381742086247447e-05, 'epoch': 0.48} {'loss': 0.9973, 'learning_rate': 1.7381521247630276e-05, 'epoch': 0.48} {'loss': 0.915, 'learning_rate': 1.7381300401103137e-05, 'epoch': 0.48} {'loss': 0.902, 'learning_rate': 1.7381079546666273e-05, 'epoch': 0.48} {'loss': 0.747, 'learning_rate': 1.7380858684319917e-05, 'epoch': 0.48} {'loss': 1.0085, 'learning_rate': 1.73806378140643e-05, 'epoch': 0.48} {'loss': 0.9995, 'learning_rate': 1.7380416935899664e-05, 'epoch': 0.48} {'loss': 0.8197, 'learning_rate': 1.738019604982625e-05, 'epoch': 0.48} {'loss': 0.8281, 'learning_rate': 1.7379975155844285e-05, 'epoch': 0.48} {'loss': 0.9635, 'learning_rate': 1.7379754253954013e-05, 'epoch': 0.48} {'loss': 0.7374, 'learning_rate': 1.7379533344155665e-05, 'epoch': 0.48} {'loss': 0.9556, 'learning_rate': 1.7379312426449485e-05, 'epoch': 0.48} {'loss': 0.83, 'learning_rate': 1.7379091500835704e-05, 'epoch': 0.48} {'loss': 0.8987, 'learning_rate': 1.7378870567314562e-05, 'epoch': 0.48} {'loss': 0.8945, 'learning_rate': 1.7378649625886293e-05, 'epoch': 0.48} {'loss': 0.9838, 'learning_rate': 1.7378428676551134e-05, 'epoch': 0.48} {'loss': 0.7312, 'learning_rate': 1.7378207719309325e-05, 'epoch': 0.48} {'loss': 0.8051, 'learning_rate': 1.7377986754161094e-05, 'epoch': 0.48} {'loss': 0.9199, 'learning_rate': 1.7377765781106695e-05, 'epoch': 0.48} {'loss': 1.0281, 'learning_rate': 1.7377544800146348e-05, 'epoch': 0.48} {'loss': 0.7285, 'learning_rate': 1.7377323811280293e-05, 'epoch': 0.48} {'loss': 0.8321, 'learning_rate': 1.737710281450877e-05, 'epoch': 0.48} {'loss': 0.905, 'learning_rate': 1.7376881809832024e-05, 'epoch': 0.48} {'loss': 0.942, 'learning_rate': 1.7376660797250276e-05, 'epoch': 0.48} {'loss': 0.8337, 'learning_rate': 1.737643977676377e-05, 'epoch': 0.48} {'loss': 0.855, 'learning_rate': 1.7376218748372746e-05, 'epoch': 0.48} {'loss': 0.9703, 'learning_rate': 1.737599771207744e-05, 'epoch': 0.48} {'loss': 0.8836, 'learning_rate': 1.737577666787808e-05, 'epoch': 0.48} {'loss': 0.9973, 'learning_rate': 1.7375555615774915e-05, 'epoch': 0.48} {'loss': 0.9942, 'learning_rate': 1.7375334555768172e-05, 'epoch': 0.48} {'loss': 0.7043, 'learning_rate': 1.7375113487858097e-05, 'epoch': 0.48} {'loss': 0.7619, 'learning_rate': 1.737489241204492e-05, 'epoch': 0.48} {'loss': 0.9957, 'learning_rate': 1.7374671328328882e-05, 'epoch': 0.48} {'loss': 0.816, 'learning_rate': 1.7374450236710216e-05, 'epoch': 0.48} {'loss': 0.8736, 'learning_rate': 1.737422913718916e-05, 'epoch': 0.48} {'loss': 0.7965, 'learning_rate': 1.7374008029765953e-05, 'epoch': 0.48} {'loss': 0.7222, 'learning_rate': 1.737378691444083e-05, 'epoch': 0.48} {'loss': 0.8491, 'learning_rate': 1.7373565791214032e-05, 'epoch': 0.48} {'loss': 0.7975, 'learning_rate': 1.7373344660085792e-05, 'epoch': 0.48} {'loss': 0.883, 'learning_rate': 1.7373123521056347e-05, 'epoch': 0.48} {'loss': 0.9192, 'learning_rate': 1.737290237412593e-05, 'epoch': 0.48} {'loss': 0.7337, 'learning_rate': 1.737268121929479e-05, 'epoch': 0.48} {'loss': 0.9418, 'learning_rate': 1.7372460056563153e-05, 'epoch': 0.48} {'loss': 0.7815, 'learning_rate': 1.7372238885931262e-05, 'epoch': 0.48} {'loss': 0.9967, 'learning_rate': 1.7372017707399348e-05, 'epoch': 0.48} {'loss': 0.7936, 'learning_rate': 1.7371796520967656e-05, 'epoch': 0.48} {'loss': 0.909, 'learning_rate': 1.7371575326636413e-05, 'epoch': 0.48} {'loss': 0.8233, 'learning_rate': 1.7371354124405865e-05, 'epoch': 0.48} {'loss': 1.0065, 'learning_rate': 1.7371132914276245e-05, 'epoch': 0.48} {'loss': 0.8835, 'learning_rate': 1.737091169624779e-05, 'epoch': 0.48} {'loss': 0.9153, 'learning_rate': 1.737069047032074e-05, 'epoch': 0.48} {'loss': 0.8104, 'learning_rate': 1.737046923649533e-05, 'epoch': 0.48} {'loss': 1.012, 'learning_rate': 1.7370247994771797e-05, 'epoch': 0.48} {'loss': 0.8072, 'learning_rate': 1.7370026745150377e-05, 'epoch': 0.48} {'loss': 0.9283, 'learning_rate': 1.7369805487631306e-05, 'epoch': 0.48} {'loss': 0.8721, 'learning_rate': 1.7369584222214828e-05, 'epoch': 0.48} {'loss': 0.77, 'learning_rate': 1.7369362948901174e-05, 'epoch': 0.48} {'loss': 0.8042, 'learning_rate': 1.7369141667690578e-05, 'epoch': 0.48} {'loss': 0.9084, 'learning_rate': 1.7368920378583287e-05, 'epoch': 0.48} {'loss': 1.0623, 'learning_rate': 1.736869908157953e-05, 'epoch': 0.48} {'loss': 0.936, 'learning_rate': 1.7368477776679548e-05, 'epoch': 0.48} {'loss': 0.7945, 'learning_rate': 1.7368256463883578e-05, 'epoch': 0.48} {'loss': 0.8112, 'learning_rate': 1.736803514319185e-05, 'epoch': 0.48} {'loss': 0.8693, 'learning_rate': 1.7367813814604615e-05, 'epoch': 0.48} {'loss': 0.7292, 'learning_rate': 1.73675924781221e-05, 'epoch': 0.48} {'loss': 1.033, 'learning_rate': 1.7367371133744544e-05, 'epoch': 0.48} {'loss': 0.9582, 'learning_rate': 1.7367149781472186e-05, 'epoch': 0.48} {'loss': 0.7051, 'learning_rate': 1.736692842130526e-05, 'epoch': 0.48} {'loss': 0.7472, 'learning_rate': 1.7366707053244007e-05, 'epoch': 0.48} {'loss': 0.933, 'learning_rate': 1.7366485677288662e-05, 'epoch': 0.48} {'loss': 1.0101, 'learning_rate': 1.7366264293439462e-05, 'epoch': 0.48} {'loss': 0.8168, 'learning_rate': 1.7366042901696646e-05, 'epoch': 0.48} {'loss': 0.7514, 'learning_rate': 1.736582150206045e-05, 'epoch': 0.48} {'loss': 0.7699, 'learning_rate': 1.736560009453111e-05, 'epoch': 0.48} {'loss': 1.0093, 'learning_rate': 1.736537867910887e-05, 'epoch': 0.48} {'loss': 0.8566, 'learning_rate': 1.7365157255793955e-05, 'epoch': 0.48} {'loss': 0.8402, 'learning_rate': 1.7364935824586614e-05, 'epoch': 0.48} {'loss': 0.8769, 'learning_rate': 1.7364714385487078e-05, 'epoch': 0.48} {'loss': 0.9086, 'learning_rate': 1.7364492938495586e-05, 'epoch': 0.48} {'loss': 0.8778, 'learning_rate': 1.7364271483612373e-05, 'epoch': 0.48} {'loss': 0.8372, 'learning_rate': 1.7364050020837683e-05, 'epoch': 0.48} {'loss': 0.9286, 'learning_rate': 1.7363828550171743e-05, 'epoch': 0.48} {'loss': 0.8885, 'learning_rate': 1.73636070716148e-05, 'epoch': 0.48} {'loss': 0.9165, 'learning_rate': 1.7363385585167087e-05, 'epoch': 0.48} {'loss': 0.9502, 'learning_rate': 1.7363164090828842e-05, 'epoch': 0.48} {'loss': 0.8729, 'learning_rate': 1.73629425886003e-05, 'epoch': 0.48} {'loss': 0.9148, 'learning_rate': 1.7362721078481702e-05, 'epoch': 0.48} {'loss': 0.8329, 'learning_rate': 1.7362499560473284e-05, 'epoch': 0.48} {'loss': 0.9232, 'learning_rate': 1.7362278034575283e-05, 'epoch': 0.48} {'loss': 0.9072, 'learning_rate': 1.7362056500787936e-05, 'epoch': 0.48} {'loss': 0.8613, 'learning_rate': 1.7361834959111483e-05, 'epoch': 0.48} {'loss': 0.8177, 'learning_rate': 1.7361613409546158e-05, 'epoch': 0.48} {'loss': 0.9594, 'learning_rate': 1.73613918520922e-05, 'epoch': 0.48} {'loss': 0.8805, 'learning_rate': 1.7361170286749845e-05, 'epoch': 0.48} {'loss': 0.787, 'learning_rate': 1.7360948713519335e-05, 'epoch': 0.48} {'loss': 0.7167, 'learning_rate': 1.7360727132400898e-05, 'epoch': 0.48} {'loss': 0.8178, 'learning_rate': 1.7360505543394785e-05, 'epoch': 0.48} {'loss': 0.9103, 'learning_rate': 1.7360283946501223e-05, 'epoch': 0.48} {'loss': 0.8364, 'learning_rate': 1.736006234172045e-05, 'epoch': 0.48} {'loss': 0.8443, 'learning_rate': 1.7359840729052705e-05, 'epoch': 0.48} {'loss': 0.8714, 'learning_rate': 1.735961910849823e-05, 'epoch': 0.48} {'loss': 0.8974, 'learning_rate': 1.7359397480057258e-05, 'epoch': 0.48} {'loss': 0.9311, 'learning_rate': 1.7359175843730027e-05, 'epoch': 0.48} {'loss': 1.0382, 'learning_rate': 1.7358954199516776e-05, 'epoch': 0.48} {'loss': 0.9342, 'learning_rate': 1.735873254741774e-05, 'epoch': 0.48} {'loss': 0.7216, 'learning_rate': 1.7358510887433157e-05, 'epoch': 0.48} {'loss': 0.9469, 'learning_rate': 1.735828921956327e-05, 'epoch': 0.48} {'loss': 0.8735, 'learning_rate': 1.7358067543808307e-05, 'epoch': 0.48} {'loss': 0.8735, 'learning_rate': 1.7357845860168515e-05, 'epoch': 0.48} {'loss': 0.9064, 'learning_rate': 1.735762416864412e-05, 'epoch': 0.48} {'loss': 0.759, 'learning_rate': 1.735740246923537e-05, 'epoch': 0.48} {'loss': 0.7577, 'learning_rate': 1.7357180761942503e-05, 'epoch': 0.48} {'loss': 1.1451, 'learning_rate': 1.735695904676575e-05, 'epoch': 0.48} {'loss': 0.7983, 'learning_rate': 1.7356737323705354e-05, 'epoch': 0.48} {'loss': 0.651, 'learning_rate': 1.7356515592761544e-05, 'epoch': 0.48} {'loss': 0.8079, 'learning_rate': 1.7356293853934568e-05, 'epoch': 0.48} {'loss': 0.873, 'learning_rate': 1.735607210722466e-05, 'epoch': 0.48} {'loss': 0.7661, 'learning_rate': 1.7355850352632055e-05, 'epoch': 0.48} {'loss': 0.8163, 'learning_rate': 1.735562859015699e-05, 'epoch': 0.48} {'loss': 0.9617, 'learning_rate': 1.7355406819799706e-05, 'epoch': 0.48} {'loss': 0.919, 'learning_rate': 1.7355185041560442e-05, 'epoch': 0.48} {'loss': 0.9512, 'learning_rate': 1.7354963255439436e-05, 'epoch': 0.48} {'loss': 1.0794, 'learning_rate': 1.735474146143692e-05, 'epoch': 0.48} {'loss': 0.8298, 'learning_rate': 1.735451965955313e-05, 'epoch': 0.48} {'loss': 1.0079, 'learning_rate': 1.7354297849788314e-05, 'epoch': 0.48} {'loss': 0.9386, 'learning_rate': 1.7354076032142703e-05, 'epoch': 0.48} {'loss': 0.8657, 'learning_rate': 1.7353854206616538e-05, 'epoch': 0.48} {'loss': 0.7994, 'learning_rate': 1.735363237321005e-05, 'epoch': 0.48} {'loss': 1.0171, 'learning_rate': 1.7353410531923484e-05, 'epoch': 0.48} {'loss': 0.8156, 'learning_rate': 1.7353188682757072e-05, 'epoch': 0.48} {'loss': 0.7087, 'learning_rate': 1.735296682571106e-05, 'epoch': 0.48} {'loss': 0.9294, 'learning_rate': 1.735274496078568e-05, 'epoch': 0.48} {'loss': 0.942, 'learning_rate': 1.7352523087981163e-05, 'epoch': 0.48} {'loss': 1.0279, 'learning_rate': 1.7352301207297757e-05, 'epoch': 0.48} {'loss': 0.8242, 'learning_rate': 1.7352079318735698e-05, 'epoch': 0.48} {'loss': 0.829, 'learning_rate': 1.7351857422295223e-05, 'epoch': 0.48} {'loss': 0.8751, 'learning_rate': 1.735163551797657e-05, 'epoch': 0.48} {'loss': 0.7744, 'learning_rate': 1.7351413605779973e-05, 'epoch': 0.48} {'loss': 0.6259, 'learning_rate': 1.7351191685705676e-05, 'epoch': 0.48} {'loss': 0.9299, 'learning_rate': 1.7350969757753912e-05, 'epoch': 0.48} {'loss': 0.9105, 'learning_rate': 1.7350747821924924e-05, 'epoch': 0.48} {'loss': 0.961, 'learning_rate': 1.735052587821894e-05, 'epoch': 0.48} {'loss': 1.021, 'learning_rate': 1.7350303926636206e-05, 'epoch': 0.48} {'loss': 0.8261, 'learning_rate': 1.735008196717696e-05, 'epoch': 0.48} {'loss': 0.9143, 'learning_rate': 1.7349859999841437e-05, 'epoch': 0.48} {'loss': 1.0114, 'learning_rate': 1.7349638024629873e-05, 'epoch': 0.48} {'loss': 0.7408, 'learning_rate': 1.734941604154251e-05, 'epoch': 0.48} {'loss': 0.5749, 'learning_rate': 1.7349194050579587e-05, 'epoch': 0.48} {'loss': 1.0638, 'learning_rate': 1.7348972051741336e-05, 'epoch': 0.48} {'loss': 0.9032, 'learning_rate': 1.7348750045028003e-05, 'epoch': 0.48} {'loss': 0.8563, 'learning_rate': 1.7348528030439818e-05, 'epoch': 0.48} {'loss': 0.6982, 'learning_rate': 1.7348306007977022e-05, 'epoch': 0.48} {'loss': 0.7769, 'learning_rate': 1.7348083977639852e-05, 'epoch': 0.48} {'loss': 0.8449, 'learning_rate': 1.7347861939428545e-05, 'epoch': 0.48} {'loss': 0.7712, 'learning_rate': 1.7347639893343345e-05, 'epoch': 0.48} {'loss': 0.892, 'learning_rate': 1.7347417839384483e-05, 'epoch': 0.48} {'loss': 1.0351, 'learning_rate': 1.73471957775522e-05, 'epoch': 0.48} {'loss': 0.7176, 'learning_rate': 1.7346973707846736e-05, 'epoch': 0.48} {'loss': 0.9421, 'learning_rate': 1.7346751630268323e-05, 'epoch': 0.48} {'loss': 0.9651, 'learning_rate': 1.7346529544817206e-05, 'epoch': 0.48} {'loss': 0.7975, 'learning_rate': 1.7346307451493616e-05, 'epoch': 0.48} {'loss': 0.7542, 'learning_rate': 1.7346085350297796e-05, 'epoch': 0.48} {'loss': 0.9609, 'learning_rate': 1.734586324122998e-05, 'epoch': 0.48} {'loss': 0.9112, 'learning_rate': 1.7345641124290414e-05, 'epoch': 0.48} {'loss': 0.9, 'learning_rate': 1.734541899947933e-05, 'epoch': 0.48} {'loss': 0.8199, 'learning_rate': 1.734519686679696e-05, 'epoch': 0.48} {'loss': 0.8779, 'learning_rate': 1.7344974726243555e-05, 'epoch': 0.48} {'loss': 1.0122, 'learning_rate': 1.7344752577819343e-05, 'epoch': 0.48} {'loss': 0.8223, 'learning_rate': 1.734453042152457e-05, 'epoch': 0.48} {'loss': 0.5992, 'learning_rate': 1.7344308257359466e-05, 'epoch': 0.48} {'loss': 0.9052, 'learning_rate': 1.7344086085324275e-05, 'epoch': 0.48} {'loss': 0.7896, 'learning_rate': 1.734386390541923e-05, 'epoch': 0.48} {'loss': 0.8658, 'learning_rate': 1.7343641717644575e-05, 'epoch': 0.48} {'loss': 0.8268, 'learning_rate': 1.7343419522000543e-05, 'epoch': 0.48} {'loss': 0.8297, 'learning_rate': 1.7343197318487375e-05, 'epoch': 0.48} {'loss': 0.7405, 'learning_rate': 1.7342975107105312e-05, 'epoch': 0.48} {'loss': 0.9565, 'learning_rate': 1.734275288785458e-05, 'epoch': 0.48} {'loss': 0.9107, 'learning_rate': 1.7342530660735434e-05, 'epoch': 0.48} {'loss': 1.0529, 'learning_rate': 1.7342308425748097e-05, 'epoch': 0.48} {'loss': 0.8381, 'learning_rate': 1.7342086182892817e-05, 'epoch': 0.48} {'loss': 0.8616, 'learning_rate': 1.7341863932169828e-05, 'epoch': 0.48} {'loss': 0.8679, 'learning_rate': 1.7341641673579372e-05, 'epoch': 0.48} {'loss': 0.9399, 'learning_rate': 1.7341419407121685e-05, 'epoch': 0.48} {'loss': 0.8026, 'learning_rate': 1.7341197132797e-05, 'epoch': 0.48} {'loss': 0.7927, 'learning_rate': 1.734097485060556e-05, 'epoch': 0.48} {'loss': 0.8022, 'learning_rate': 1.7340752560547608e-05, 'epoch': 0.48} {'loss': 0.9398, 'learning_rate': 1.734053026262337e-05, 'epoch': 0.48} {'loss': 0.9301, 'learning_rate': 1.73403079568331e-05, 'epoch': 0.48} {'loss': 0.9675, 'learning_rate': 1.734008564317702e-05, 'epoch': 0.48} {'loss': 0.8649, 'learning_rate': 1.7339863321655377e-05, 'epoch': 0.48} {'loss': 0.8217, 'learning_rate': 1.733964099226841e-05, 'epoch': 0.48} {'loss': 0.8631, 'learning_rate': 1.7339418655016356e-05, 'epoch': 0.48} {'loss': 0.9294, 'learning_rate': 1.733919630989945e-05, 'epoch': 0.48} {'loss': 0.8331, 'learning_rate': 1.733897395691793e-05, 'epoch': 0.48} {'loss': 0.7304, 'learning_rate': 1.7338751596072044e-05, 'epoch': 0.48} {'loss': 0.756, 'learning_rate': 1.733852922736202e-05, 'epoch': 0.48} {'loss': 0.8453, 'learning_rate': 1.7338306850788098e-05, 'epoch': 0.48} {'loss': 0.7744, 'learning_rate': 1.733808446635052e-05, 'epoch': 0.48} {'loss': 0.8736, 'learning_rate': 1.7337862074049523e-05, 'epoch': 0.48} {'loss': 0.7452, 'learning_rate': 1.733763967388534e-05, 'epoch': 0.48} {'loss': 0.9643, 'learning_rate': 1.733741726585822e-05, 'epoch': 0.48} {'loss': 1.0443, 'learning_rate': 1.733719484996839e-05, 'epoch': 0.48} {'loss': 0.8964, 'learning_rate': 1.7336972426216097e-05, 'epoch': 0.48} {'loss': 1.1342, 'learning_rate': 1.7336749994601574e-05, 'epoch': 0.48} {'loss': 0.7953, 'learning_rate': 1.733652755512506e-05, 'epoch': 0.48} {'loss': 0.8431, 'learning_rate': 1.7336305107786798e-05, 'epoch': 0.48} {'loss': 0.7478, 'learning_rate': 1.733608265258702e-05, 'epoch': 0.48} {'loss': 0.7075, 'learning_rate': 1.7335860189525968e-05, 'epoch': 0.48} {'loss': 0.9124, 'learning_rate': 1.7335637718603882e-05, 'epoch': 0.48} {'loss': 0.8462, 'learning_rate': 1.7335415239820995e-05, 'epoch': 0.48} {'loss': 0.8146, 'learning_rate': 1.733519275317755e-05, 'epoch': 0.48} {'loss': 0.9094, 'learning_rate': 1.7334970258673783e-05, 'epoch': 0.48} {'loss': 0.8548, 'learning_rate': 1.7334747756309936e-05, 'epoch': 0.48} {'loss': 0.7351, 'learning_rate': 1.7334525246086242e-05, 'epoch': 0.48} {'loss': 0.8529, 'learning_rate': 1.7334302728002944e-05, 'epoch': 0.48} {'loss': 0.6896, 'learning_rate': 1.7334080202060278e-05, 'epoch': 0.48} {'loss': 0.749, 'learning_rate': 1.733385766825848e-05, 'epoch': 0.48} {'loss': 0.9396, 'learning_rate': 1.7333635126597797e-05, 'epoch': 0.48} {'loss': 0.8158, 'learning_rate': 1.7333412577078457e-05, 'epoch': 0.48} {'loss': 1.0177, 'learning_rate': 1.7333190019700707e-05, 'epoch': 0.48} {'loss': 0.7269, 'learning_rate': 1.7332967454464782e-05, 'epoch': 0.48} {'loss': 0.6571, 'learning_rate': 1.733274488137092e-05, 'epoch': 0.48} {'loss': 0.8542, 'learning_rate': 1.7332522300419358e-05, 'epoch': 0.48} {'loss': 0.9275, 'learning_rate': 1.733229971161034e-05, 'epoch': 0.48} {'loss': 0.9569, 'learning_rate': 1.73320771149441e-05, 'epoch': 0.48} {'loss': 1.0024, 'learning_rate': 1.7331854510420875e-05, 'epoch': 0.48} {'loss': 1.0387, 'learning_rate': 1.733163189804091e-05, 'epoch': 0.48} {'loss': 0.8513, 'learning_rate': 1.7331409277804434e-05, 'epoch': 0.48} {'loss': 0.7291, 'learning_rate': 1.7331186649711695e-05, 'epoch': 0.48} {'loss': 0.7465, 'learning_rate': 1.733096401376293e-05, 'epoch': 0.48} {'loss': 0.7654, 'learning_rate': 1.7330741369958372e-05, 'epoch': 0.48} {'loss': 0.6669, 'learning_rate': 1.7330518718298263e-05, 'epoch': 0.48} {'loss': 0.9191, 'learning_rate': 1.733029605878284e-05, 'epoch': 0.48} {'loss': 0.6025, 'learning_rate': 1.733007339141235e-05, 'epoch': 0.48} {'loss': 0.9717, 'learning_rate': 1.732985071618702e-05, 'epoch': 0.48} {'loss': 0.8939, 'learning_rate': 1.7329628033107097e-05, 'epoch': 0.48} {'loss': 0.8451, 'learning_rate': 1.732940534217281e-05, 'epoch': 0.48} {'loss': 0.8057, 'learning_rate': 1.7329182643384408e-05, 'epoch': 0.48} {'loss': 0.828, 'learning_rate': 1.7328959936742126e-05, 'epoch': 0.48} {'loss': 0.7457, 'learning_rate': 1.73287372222462e-05, 'epoch': 0.48} {'loss': 0.8066, 'learning_rate': 1.732851449989687e-05, 'epoch': 0.48} {'loss': 0.9561, 'learning_rate': 1.7328291769694377e-05, 'epoch': 0.48} {'loss': 0.8595, 'learning_rate': 1.7328069031638954e-05, 'epoch': 0.48} {'loss': 0.9598, 'learning_rate': 1.7327846285730847e-05, 'epoch': 0.48} {'loss': 0.934, 'learning_rate': 1.7327623531970294e-05, 'epoch': 0.48} {'loss': 0.9144, 'learning_rate': 1.7327400770357522e-05, 'epoch': 0.48} {'loss': 1.0192, 'learning_rate': 1.7327178000892785e-05, 'epoch': 0.48} {'loss': 0.8978, 'learning_rate': 1.7326955223576317e-05, 'epoch': 0.48} {'loss': 0.6911, 'learning_rate': 1.7326732438408352e-05, 'epoch': 0.48} {'loss': 0.8311, 'learning_rate': 1.7326509645389133e-05, 'epoch': 0.48} {'loss': 0.8453, 'learning_rate': 1.73262868445189e-05, 'epoch': 0.48} {'loss': 0.7968, 'learning_rate': 1.7326064035797887e-05, 'epoch': 0.48} {'loss': 0.7598, 'learning_rate': 1.7325841219226335e-05, 'epoch': 0.48} {'loss': 1.0866, 'learning_rate': 1.7325618394804484e-05, 'epoch': 0.48} {'loss': 0.9669, 'learning_rate': 1.732539556253257e-05, 'epoch': 0.48} {'loss': 0.6198, 'learning_rate': 1.7325172722410834e-05, 'epoch': 0.48} {'loss': 0.7345, 'learning_rate': 1.7324949874439516e-05, 'epoch': 0.48} {'loss': 0.9295, 'learning_rate': 1.7324727018618852e-05, 'epoch': 0.48} {'loss': 0.8161, 'learning_rate': 1.732450415494908e-05, 'epoch': 0.48} {'loss': 0.8895, 'learning_rate': 1.7324281283430445e-05, 'epoch': 0.48} {'loss': 0.8545, 'learning_rate': 1.7324058404063177e-05, 'epoch': 0.48} {'loss': 0.8349, 'learning_rate': 1.732383551684752e-05, 'epoch': 0.48} {'loss': 0.8957, 'learning_rate': 1.7323612621783716e-05, 'epoch': 0.48} {'loss': 0.7281, 'learning_rate': 1.7323389718871998e-05, 'epoch': 0.48} {'loss': 0.7805, 'learning_rate': 1.7323166808112607e-05, 'epoch': 0.48} {'loss': 0.9245, 'learning_rate': 1.7322943889505782e-05, 'epoch': 0.48} {'loss': 0.8838, 'learning_rate': 1.732272096305176e-05, 'epoch': 0.48} {'loss': 0.7455, 'learning_rate': 1.7322498028750782e-05, 'epoch': 0.48} {'loss': 0.9305, 'learning_rate': 1.7322275086603088e-05, 'epoch': 0.48} {'loss': 0.561, 'learning_rate': 1.7322052136608915e-05, 'epoch': 0.48} {'loss': 0.9327, 'learning_rate': 1.7321829178768502e-05, 'epoch': 0.48} {'loss': 0.8139, 'learning_rate': 1.732160621308209e-05, 'epoch': 0.48} {'loss': 0.841, 'learning_rate': 1.7321383239549913e-05, 'epoch': 0.48} {'loss': 0.793, 'learning_rate': 1.7321160258172214e-05, 'epoch': 0.48} {'loss': 0.7718, 'learning_rate': 1.732093726894923e-05, 'epoch': 0.48} {'loss': 1.0723, 'learning_rate': 1.73207142718812e-05, 'epoch': 0.48} {'loss': 0.8769, 'learning_rate': 1.7320491266968366e-05, 'epoch': 0.48} {'loss': 0.8788, 'learning_rate': 1.732026825421097e-05, 'epoch': 0.48} {'loss': 0.8822, 'learning_rate': 1.732004523360924e-05, 'epoch': 0.48} {'loss': 0.7988, 'learning_rate': 1.731982220516342e-05, 'epoch': 0.48} {'loss': 0.9475, 'learning_rate': 1.731959916887375e-05, 'epoch': 0.48} {'loss': 0.9623, 'learning_rate': 1.7319376124740472e-05, 'epoch': 0.48} {'loss': 0.8458, 'learning_rate': 1.731915307276382e-05, 'epoch': 0.48} {'loss': 0.7263, 'learning_rate': 1.7318930012944036e-05, 'epoch': 0.48} {'loss': 0.8809, 'learning_rate': 1.731870694528136e-05, 'epoch': 0.48} {'loss': 0.8189, 'learning_rate': 1.7318483869776023e-05, 'epoch': 0.48} {'loss': 0.9128, 'learning_rate': 1.7318260786428272e-05, 'epoch': 0.48} {'loss': 0.9294, 'learning_rate': 1.7318037695238345e-05, 'epoch': 0.48} {'loss': 0.827, 'learning_rate': 1.731781459620648e-05, 'epoch': 0.48} {'loss': 0.7465, 'learning_rate': 1.731759148933292e-05, 'epoch': 0.48} {'loss': 0.8712, 'learning_rate': 1.7317368374617892e-05, 'epoch': 0.48} {'loss': 0.7263, 'learning_rate': 1.731714525206165e-05, 'epoch': 0.48} {'loss': 0.9242, 'learning_rate': 1.7316922121664425e-05, 'epoch': 0.48} {'loss': 0.9301, 'learning_rate': 1.7316698983426456e-05, 'epoch': 0.48} {'loss': 0.9055, 'learning_rate': 1.7316475837347987e-05, 'epoch': 0.48} {'loss': 0.9116, 'learning_rate': 1.7316252683429253e-05, 'epoch': 0.48} {'loss': 0.7569, 'learning_rate': 1.731602952167049e-05, 'epoch': 0.48} {'loss': 0.8576, 'learning_rate': 1.7315806352071942e-05, 'epoch': 0.48} {'loss': 0.8608, 'learning_rate': 1.731558317463385e-05, 'epoch': 0.48} {'loss': 0.8504, 'learning_rate': 1.731535998935645e-05, 'epoch': 0.48} {'loss': 0.83, 'learning_rate': 1.7315136796239978e-05, 'epoch': 0.48} {'loss': 0.8552, 'learning_rate': 1.731491359528468e-05, 'epoch': 0.48} {'loss': 0.8541, 'learning_rate': 1.7314690386490795e-05, 'epoch': 0.48} {'loss': 0.9291, 'learning_rate': 1.7314467169858554e-05, 'epoch': 0.48} {'loss': 0.9771, 'learning_rate': 1.73142439453882e-05, 'epoch': 0.48} {'loss': 0.8874, 'learning_rate': 1.7314020713079974e-05, 'epoch': 0.48} {'loss': 0.9919, 'learning_rate': 1.7313797472934116e-05, 'epoch': 0.48} {'loss': 0.8619, 'learning_rate': 1.7313574224950865e-05, 'epoch': 0.48} {'loss': 0.9094, 'learning_rate': 1.731335096913046e-05, 'epoch': 0.48} {'loss': 0.9243, 'learning_rate': 1.7313127705473138e-05, 'epoch': 0.48} {'loss': 0.8259, 'learning_rate': 1.7312904433979142e-05, 'epoch': 0.48} {'loss': 0.8844, 'learning_rate': 1.7312681154648706e-05, 'epoch': 0.48} {'loss': 0.7512, 'learning_rate': 1.731245786748207e-05, 'epoch': 0.48} {'loss': 0.8005, 'learning_rate': 1.7312234572479482e-05, 'epoch': 0.48} {'loss': 1.1626, 'learning_rate': 1.7312011269641168e-05, 'epoch': 0.48} {'loss': 0.8454, 'learning_rate': 1.7311787958967376e-05, 'epoch': 0.48} {'loss': 0.7329, 'learning_rate': 1.7311564640458346e-05, 'epoch': 0.48} {'loss': 0.8434, 'learning_rate': 1.731134131411431e-05, 'epoch': 0.48} {'loss': 0.9795, 'learning_rate': 1.7311117979935514e-05, 'epoch': 0.48} {'loss': 0.9341, 'learning_rate': 1.7310894637922197e-05, 'epoch': 0.48} {'loss': 0.8489, 'learning_rate': 1.7310671288074595e-05, 'epoch': 0.48} {'loss': 0.9888, 'learning_rate': 1.7310447930392947e-05, 'epoch': 0.48} {'loss': 0.8162, 'learning_rate': 1.73102245648775e-05, 'epoch': 0.48} {'loss': 0.9642, 'learning_rate': 1.7310001191528483e-05, 'epoch': 0.48} {'loss': 0.9534, 'learning_rate': 1.730977781034614e-05, 'epoch': 0.48} {'loss': 0.8066, 'learning_rate': 1.730955442133071e-05, 'epoch': 0.48} {'loss': 0.8497, 'learning_rate': 1.7309331024482436e-05, 'epoch': 0.48} {'loss': 0.7319, 'learning_rate': 1.7309107619801552e-05, 'epoch': 0.48} {'loss': 0.9039, 'learning_rate': 1.7308884207288297e-05, 'epoch': 0.48} {'loss': 0.791, 'learning_rate': 1.7308660786942915e-05, 'epoch': 0.48} {'loss': 0.8406, 'learning_rate': 1.7308437358765643e-05, 'epoch': 0.48} {'loss': 0.8593, 'learning_rate': 1.7308213922756724e-05, 'epoch': 0.48} {'loss': 0.955, 'learning_rate': 1.730799047891639e-05, 'epoch': 0.48} {'loss': 0.6041, 'learning_rate': 1.730776702724489e-05, 'epoch': 0.48} {'loss': 0.7637, 'learning_rate': 1.730754356774245e-05, 'epoch': 0.48} {'loss': 0.9018, 'learning_rate': 1.7307320100409323e-05, 'epoch': 0.48} {'loss': 0.8896, 'learning_rate': 1.730709662524574e-05, 'epoch': 0.48} {'loss': 0.9378, 'learning_rate': 1.7306873142251948e-05, 'epoch': 0.48} {'loss': 0.8943, 'learning_rate': 1.7306649651428176e-05, 'epoch': 0.48} {'loss': 0.817, 'learning_rate': 1.7306426152774673e-05, 'epoch': 0.48} {'loss': 0.9102, 'learning_rate': 1.7306202646291678e-05, 'epoch': 0.48} {'loss': 0.8198, 'learning_rate': 1.730597913197942e-05, 'epoch': 0.48} {'loss': 0.7967, 'learning_rate': 1.730575560983815e-05, 'epoch': 0.48} {'loss': 0.7677, 'learning_rate': 1.7305532079868105e-05, 'epoch': 0.48} {'loss': 0.7148, 'learning_rate': 1.7305308542069523e-05, 'epoch': 0.48} {'loss': 0.8384, 'learning_rate': 1.730508499644264e-05, 'epoch': 0.48} {'loss': 0.8692, 'learning_rate': 1.7304861442987705e-05, 'epoch': 0.48} {'loss': 0.724, 'learning_rate': 1.7304637881704945e-05, 'epoch': 0.48} {'loss': 0.8933, 'learning_rate': 1.730441431259461e-05, 'epoch': 0.48} {'loss': 0.8401, 'learning_rate': 1.7304190735656933e-05, 'epoch': 0.48} {'loss': 0.8064, 'learning_rate': 1.730396715089216e-05, 'epoch': 0.48} {'loss': 0.9186, 'learning_rate': 1.7303743558300526e-05, 'epoch': 0.48} {'loss': 0.7878, 'learning_rate': 1.730351995788227e-05, 'epoch': 0.48} {'loss': 0.9354, 'learning_rate': 1.7303296349637633e-05, 'epoch': 0.48} {'loss': 0.7388, 'learning_rate': 1.7303072733566857e-05, 'epoch': 0.48} {'loss': 0.8506, 'learning_rate': 1.7302849109670177e-05, 'epoch': 0.48} {'loss': 0.8106, 'learning_rate': 1.7302625477947835e-05, 'epoch': 0.48} {'loss': 0.7988, 'learning_rate': 1.730240183840007e-05, 'epoch': 0.48} {'loss': 1.0646, 'learning_rate': 1.7302178191027127e-05, 'epoch': 0.48} {'loss': 0.7318, 'learning_rate': 1.7301954535829236e-05, 'epoch': 0.48} {'loss': 0.73, 'learning_rate': 1.7301730872806645e-05, 'epoch': 0.48} {'loss': 0.8538, 'learning_rate': 1.730150720195959e-05, 'epoch': 0.48} {'loss': 0.8082, 'learning_rate': 1.7301283523288312e-05, 'epoch': 0.48} {'loss': 0.8561, 'learning_rate': 1.7301059836793045e-05, 'epoch': 0.48} {'loss': 0.8093, 'learning_rate': 1.730083614247404e-05, 'epoch': 0.48} {'loss': 0.8742, 'learning_rate': 1.7300612440331522e-05, 'epoch': 0.48} {'loss': 0.9005, 'learning_rate': 1.7300388730365745e-05, 'epoch': 0.48} {'loss': 0.8051, 'learning_rate': 1.730016501257694e-05, 'epoch': 0.48} {'loss': 0.7211, 'learning_rate': 1.7299941286965353e-05, 'epoch': 0.48} {'loss': 0.8083, 'learning_rate': 1.7299717553531216e-05, 'epoch': 0.48} {'loss': 0.7435, 'learning_rate': 1.729949381227477e-05, 'epoch': 0.48} {'loss': 0.9063, 'learning_rate': 1.7299270063196268e-05, 'epoch': 0.48} {'loss': 1.0568, 'learning_rate': 1.729904630629593e-05, 'epoch': 0.48} {'loss': 0.8326, 'learning_rate': 1.729882254157401e-05, 'epoch': 0.48} {'loss': 0.9112, 'learning_rate': 1.729859876903074e-05, 'epoch': 0.48} {'loss': 0.8994, 'learning_rate': 1.7298374988666366e-05, 'epoch': 0.48} {'loss': 0.9285, 'learning_rate': 1.729815120048112e-05, 'epoch': 0.48} {'loss': 1.0054, 'learning_rate': 1.7297927404475247e-05, 'epoch': 0.48} {'loss': 1.0573, 'learning_rate': 1.7297703600648986e-05, 'epoch': 0.48} {'loss': 0.7924, 'learning_rate': 1.729747978900258e-05, 'epoch': 0.48} {'loss': 0.9295, 'learning_rate': 1.7297255969536264e-05, 'epoch': 0.48} {'loss': 0.8352, 'learning_rate': 1.729703214225028e-05, 'epoch': 0.48} {'loss': 0.8472, 'learning_rate': 1.729680830714487e-05, 'epoch': 0.48} {'loss': 1.0155, 'learning_rate': 1.729658446422027e-05, 'epoch': 0.48} {'loss': 0.8254, 'learning_rate': 1.7296360613476717e-05, 'epoch': 0.48} {'loss': 0.8274, 'learning_rate': 1.729613675491446e-05, 'epoch': 0.48} {'loss': 0.7934, 'learning_rate': 1.729591288853373e-05, 'epoch': 0.48} {'loss': 0.7784, 'learning_rate': 1.7295689014334773e-05, 'epoch': 0.48} {'loss': 0.8194, 'learning_rate': 1.7295465132317827e-05, 'epoch': 0.48} {'loss': 0.7219, 'learning_rate': 1.729524124248313e-05, 'epoch': 0.48} {'loss': 0.918, 'learning_rate': 1.7295017344830924e-05, 'epoch': 0.48} {'loss': 0.7992, 'learning_rate': 1.729479343936145e-05, 'epoch': 0.48} {'loss': 0.9675, 'learning_rate': 1.7294569526074946e-05, 'epoch': 0.48} {'loss': 0.9703, 'learning_rate': 1.729434560497165e-05, 'epoch': 0.48} {'loss': 0.7792, 'learning_rate': 1.7294121676051807e-05, 'epoch': 0.48} {'loss': 0.8765, 'learning_rate': 1.7293897739315655e-05, 'epoch': 0.48} {'loss': 0.8388, 'learning_rate': 1.729367379476343e-05, 'epoch': 0.48} {'loss': 0.9868, 'learning_rate': 1.7293449842395378e-05, 'epoch': 0.48} {'loss': 0.8226, 'learning_rate': 1.7293225882211734e-05, 'epoch': 0.48} {'loss': 0.9622, 'learning_rate': 1.7293001914212744e-05, 'epoch': 0.48} {'loss': 0.916, 'learning_rate': 1.729277793839864e-05, 'epoch': 0.48} {'loss': 0.7203, 'learning_rate': 1.729255395476967e-05, 'epoch': 0.48} {'loss': 0.7049, 'learning_rate': 1.7292329963326064e-05, 'epoch': 0.48} {'loss': 0.8625, 'learning_rate': 1.7292105964068073e-05, 'epoch': 0.48} {'loss': 0.8197, 'learning_rate': 1.7291881956995934e-05, 'epoch': 0.48} {'loss': 0.7877, 'learning_rate': 1.7291657942109883e-05, 'epoch': 0.48} {'loss': 0.9157, 'learning_rate': 1.7291433919410163e-05, 'epoch': 0.48} {'loss': 0.9419, 'learning_rate': 1.7291209888897015e-05, 'epoch': 0.48} {'loss': 0.6889, 'learning_rate': 1.7290985850570675e-05, 'epoch': 0.48} {'loss': 0.8654, 'learning_rate': 1.7290761804431385e-05, 'epoch': 0.48} {'loss': 0.7202, 'learning_rate': 1.7290537750479385e-05, 'epoch': 0.48} {'loss': 0.8903, 'learning_rate': 1.729031368871492e-05, 'epoch': 0.48} {'loss': 1.0117, 'learning_rate': 1.729008961913822e-05, 'epoch': 0.48} {'loss': 0.8263, 'learning_rate': 1.7289865541749537e-05, 'epoch': 0.48} {'loss': 0.8561, 'learning_rate': 1.7289641456549102e-05, 'epoch': 0.48} {'loss': 1.0901, 'learning_rate': 1.7289417363537157e-05, 'epoch': 0.48} {'loss': 0.8378, 'learning_rate': 1.7289193262713948e-05, 'epoch': 0.48} {'loss': 0.7795, 'learning_rate': 1.7288969154079706e-05, 'epoch': 0.48} {'loss': 0.8402, 'learning_rate': 1.728874503763468e-05, 'epoch': 0.48} {'loss': 0.7852, 'learning_rate': 1.72885209133791e-05, 'epoch': 0.48} {'loss': 0.6889, 'learning_rate': 1.7288296781313217e-05, 'epoch': 0.48} {'loss': 1.0735, 'learning_rate': 1.7288072641437263e-05, 'epoch': 0.48} {'loss': 0.9718, 'learning_rate': 1.7287848493751482e-05, 'epoch': 0.48} {'loss': 0.8895, 'learning_rate': 1.728762433825612e-05, 'epoch': 0.48} {'loss': 0.8324, 'learning_rate': 1.7287400174951403e-05, 'epoch': 0.48} {'loss': 0.9052, 'learning_rate': 1.728717600383758e-05, 'epoch': 0.48} {'loss': 0.7496, 'learning_rate': 1.7286951824914893e-05, 'epoch': 0.48} {'loss': 0.6105, 'learning_rate': 1.7286727638183576e-05, 'epoch': 0.49} {'loss': 0.8235, 'learning_rate': 1.7286503443643873e-05, 'epoch': 0.49} {'loss': 0.881, 'learning_rate': 1.7286279241296027e-05, 'epoch': 0.49} {'loss': 1.0364, 'learning_rate': 1.7286055031140272e-05, 'epoch': 0.49} {'loss': 0.9855, 'learning_rate': 1.7285830813176856e-05, 'epoch': 0.49} {'loss': 0.9679, 'learning_rate': 1.728560658740601e-05, 'epoch': 0.49} {'loss': 1.0582, 'learning_rate': 1.7285382353827983e-05, 'epoch': 0.49} {'loss': 0.8154, 'learning_rate': 1.7285158112443007e-05, 'epoch': 0.49} {'loss': 0.9437, 'learning_rate': 1.728493386325133e-05, 'epoch': 0.49} {'loss': 1.1049, 'learning_rate': 1.7284709606253185e-05, 'epoch': 0.49} {'loss': 0.9008, 'learning_rate': 1.728448534144882e-05, 'epoch': 0.49} {'loss': 0.8066, 'learning_rate': 1.728426106883847e-05, 'epoch': 0.49} {'loss': 0.7313, 'learning_rate': 1.7284036788422375e-05, 'epoch': 0.49} {'loss': 0.9424, 'learning_rate': 1.7283812500200777e-05, 'epoch': 0.49} {'loss': 1.1559, 'learning_rate': 1.728358820417392e-05, 'epoch': 0.49} {'loss': 0.6738, 'learning_rate': 1.728336390034204e-05, 'epoch': 0.49} {'loss': 1.0537, 'learning_rate': 1.728313958870538e-05, 'epoch': 0.49} {'loss': 0.9089, 'learning_rate': 1.7282915269264172e-05, 'epoch': 0.49} {'loss': 0.7788, 'learning_rate': 1.728269094201867e-05, 'epoch': 0.49} {'loss': 0.9003, 'learning_rate': 1.7282466606969105e-05, 'epoch': 0.49} {'loss': 0.7876, 'learning_rate': 1.728224226411572e-05, 'epoch': 0.49} {'loss': 0.8725, 'learning_rate': 1.7282017913458753e-05, 'epoch': 0.49} {'loss': 0.8662, 'learning_rate': 1.7281793554998446e-05, 'epoch': 0.49} {'loss': 0.7681, 'learning_rate': 1.7281569188735044e-05, 'epoch': 0.49} {'loss': 0.8887, 'learning_rate': 1.728134481466878e-05, 'epoch': 0.49} {'loss': 0.7364, 'learning_rate': 1.72811204327999e-05, 'epoch': 0.49} {'loss': 0.8832, 'learning_rate': 1.7280896043128642e-05, 'epoch': 0.49} {'loss': 0.8754, 'learning_rate': 1.7280671645655248e-05, 'epoch': 0.49} {'loss': 0.7538, 'learning_rate': 1.728044724037995e-05, 'epoch': 0.49} {'loss': 0.7015, 'learning_rate': 1.7280222827303003e-05, 'epoch': 0.49} {'loss': 0.8657, 'learning_rate': 1.7279998406424638e-05, 'epoch': 0.49} {'loss': 1.0807, 'learning_rate': 1.72797739777451e-05, 'epoch': 0.49} {'loss': 0.8319, 'learning_rate': 1.7279549541264624e-05, 'epoch': 0.49} {'loss': 0.9711, 'learning_rate': 1.7279325096983454e-05, 'epoch': 0.49} {'loss': 0.9942, 'learning_rate': 1.727910064490183e-05, 'epoch': 0.49} {'loss': 0.7139, 'learning_rate': 1.7278876185019994e-05, 'epoch': 0.49} {'loss': 1.017, 'learning_rate': 1.7278651717338187e-05, 'epoch': 0.49} {'loss': 0.9077, 'learning_rate': 1.7278427241856642e-05, 'epoch': 0.49} {'loss': 0.9136, 'learning_rate': 1.727820275857561e-05, 'epoch': 0.49} {'loss': 0.8411, 'learning_rate': 1.727797826749533e-05, 'epoch': 0.49} {'loss': 0.8561, 'learning_rate': 1.7277753768616034e-05, 'epoch': 0.49} {'loss': 0.8372, 'learning_rate': 1.7277529261937967e-05, 'epoch': 0.49} {'loss': 0.842, 'learning_rate': 1.727730474746137e-05, 'epoch': 0.49} {'loss': 0.8885, 'learning_rate': 1.727708022518649e-05, 'epoch': 0.49} {'loss': 0.8904, 'learning_rate': 1.7276855695113557e-05, 'epoch': 0.49} {'loss': 0.7902, 'learning_rate': 1.727663115724282e-05, 'epoch': 0.49} {'loss': 0.7241, 'learning_rate': 1.727640661157451e-05, 'epoch': 0.49} {'loss': 0.715, 'learning_rate': 1.727618205810888e-05, 'epoch': 0.49} {'loss': 0.7636, 'learning_rate': 1.7275957496846163e-05, 'epoch': 0.49} {'loss': 0.8435, 'learning_rate': 1.7275732927786597e-05, 'epoch': 0.49} {'loss': 0.8514, 'learning_rate': 1.727550835093043e-05, 'epoch': 0.49} {'loss': 0.8097, 'learning_rate': 1.7275283766277897e-05, 'epoch': 0.49} {'loss': 1.0557, 'learning_rate': 1.7275059173829244e-05, 'epoch': 0.49} {'loss': 0.8911, 'learning_rate': 1.7274834573584704e-05, 'epoch': 0.49} {'loss': 0.9284, 'learning_rate': 1.7274609965544526e-05, 'epoch': 0.49} {'loss': 0.9899, 'learning_rate': 1.7274385349708944e-05, 'epoch': 0.49} {'loss': 0.8215, 'learning_rate': 1.7274160726078203e-05, 'epoch': 0.49} {'loss': 0.8238, 'learning_rate': 1.7273936094652543e-05, 'epoch': 0.49} {'loss': 0.9893, 'learning_rate': 1.72737114554322e-05, 'epoch': 0.49} {'loss': 0.7799, 'learning_rate': 1.7273486808417425e-05, 'epoch': 0.49} {'loss': 0.8996, 'learning_rate': 1.727326215360845e-05, 'epoch': 0.49} {'loss': 0.8598, 'learning_rate': 1.7273037491005514e-05, 'epoch': 0.49} {'loss': 0.7802, 'learning_rate': 1.7272812820608868e-05, 'epoch': 0.49} {'loss': 0.9024, 'learning_rate': 1.7272588142418743e-05, 'epoch': 0.49} {'loss': 0.8422, 'learning_rate': 1.7272363456435382e-05, 'epoch': 0.49} {'loss': 1.0736, 'learning_rate': 1.727213876265903e-05, 'epoch': 0.49} {'loss': 0.7329, 'learning_rate': 1.727191406108993e-05, 'epoch': 0.49} {'loss': 0.9584, 'learning_rate': 1.7271689351728306e-05, 'epoch': 0.49} {'loss': 1.0183, 'learning_rate': 1.7271464634574418e-05, 'epoch': 0.49} {'loss': 0.8132, 'learning_rate': 1.7271239909628497e-05, 'epoch': 0.49} {'loss': 0.8692, 'learning_rate': 1.7271015176890792e-05, 'epoch': 0.49} {'loss': 0.7562, 'learning_rate': 1.727079043636153e-05, 'epoch': 0.49} {'loss': 0.7985, 'learning_rate': 1.7270565688040965e-05, 'epoch': 0.49} {'loss': 0.9104, 'learning_rate': 1.7270340931929327e-05, 'epoch': 0.49} {'loss': 0.7471, 'learning_rate': 1.727011616802687e-05, 'epoch': 0.49} {'loss': 0.8982, 'learning_rate': 1.7269891396333822e-05, 'epoch': 0.49} {'loss': 0.7397, 'learning_rate': 1.726966661685043e-05, 'epoch': 0.49} {'loss': 0.9523, 'learning_rate': 1.7269441829576936e-05, 'epoch': 0.49} {'loss': 1.0542, 'learning_rate': 1.7269217034513578e-05, 'epoch': 0.49} {'loss': 0.6705, 'learning_rate': 1.72689922316606e-05, 'epoch': 0.49} {'loss': 0.8609, 'learning_rate': 1.7268767421018234e-05, 'epoch': 0.49} {'loss': 1.0168, 'learning_rate': 1.7268542602586734e-05, 'epoch': 0.49} {'loss': 0.9342, 'learning_rate': 1.7268317776366332e-05, 'epoch': 0.49} {'loss': 0.8794, 'learning_rate': 1.7268092942357272e-05, 'epoch': 0.49} {'loss': 0.7885, 'learning_rate': 1.7267868100559796e-05, 'epoch': 0.49} {'loss': 0.8185, 'learning_rate': 1.7267643250974143e-05, 'epoch': 0.49} {'loss': 0.7939, 'learning_rate': 1.7267418393600553e-05, 'epoch': 0.49} {'loss': 0.8471, 'learning_rate': 1.726719352843927e-05, 'epoch': 0.49} {'loss': 0.654, 'learning_rate': 1.726696865549053e-05, 'epoch': 0.49} {'loss': 0.9762, 'learning_rate': 1.726674377475458e-05, 'epoch': 0.49} {'loss': 0.8122, 'learning_rate': 1.7266518886231654e-05, 'epoch': 0.49} {'loss': 0.8488, 'learning_rate': 1.7266293989922003e-05, 'epoch': 0.49} {'loss': 0.8843, 'learning_rate': 1.726606908582586e-05, 'epoch': 0.49} {'loss': 0.8209, 'learning_rate': 1.7265844173943468e-05, 'epoch': 0.49} {'loss': 0.6463, 'learning_rate': 1.7265619254275067e-05, 'epoch': 0.49} {'loss': 0.8285, 'learning_rate': 1.72653943268209e-05, 'epoch': 0.49} {'loss': 0.7869, 'learning_rate': 1.7265169391581208e-05, 'epoch': 0.49} {'loss': 0.875, 'learning_rate': 1.726494444855623e-05, 'epoch': 0.49} {'loss': 0.8636, 'learning_rate': 1.726471949774621e-05, 'epoch': 0.49} {'loss': 0.9596, 'learning_rate': 1.7264494539151383e-05, 'epoch': 0.49} {'loss': 0.7295, 'learning_rate': 1.7264269572772e-05, 'epoch': 0.49} {'loss': 0.978, 'learning_rate': 1.7264044598608294e-05, 'epoch': 0.49} {'loss': 0.7886, 'learning_rate': 1.726381961666051e-05, 'epoch': 0.49} {'loss': 0.8651, 'learning_rate': 1.7263594626928887e-05, 'epoch': 0.49} {'loss': 0.8502, 'learning_rate': 1.7263369629413666e-05, 'epoch': 0.49} {'loss': 0.9756, 'learning_rate': 1.7263144624115086e-05, 'epoch': 0.49} {'loss': 0.8402, 'learning_rate': 1.7262919611033396e-05, 'epoch': 0.49} {'loss': 0.8435, 'learning_rate': 1.726269459016883e-05, 'epoch': 0.49} {'loss': 0.8254, 'learning_rate': 1.7262469561521632e-05, 'epoch': 0.49} {'loss': 0.8607, 'learning_rate': 1.7262244525092044e-05, 'epoch': 0.49} {'loss': 0.9959, 'learning_rate': 1.72620194808803e-05, 'epoch': 0.49} {'loss': 0.8326, 'learning_rate': 1.726179442888665e-05, 'epoch': 0.49} {'loss': 0.8475, 'learning_rate': 1.7261569369111333e-05, 'epoch': 0.49} {'loss': 0.6951, 'learning_rate': 1.726134430155459e-05, 'epoch': 0.49} {'loss': 0.8184, 'learning_rate': 1.7261119226216657e-05, 'epoch': 0.49} {'loss': 0.7922, 'learning_rate': 1.7260894143097783e-05, 'epoch': 0.49} {'loss': 0.7067, 'learning_rate': 1.7260669052198203e-05, 'epoch': 0.49} {'loss': 0.9026, 'learning_rate': 1.726044395351816e-05, 'epoch': 0.49} {'loss': 1.0567, 'learning_rate': 1.7260218847057898e-05, 'epoch': 0.49} {'loss': 0.9817, 'learning_rate': 1.725999373281766e-05, 'epoch': 0.49} {'loss': 1.0309, 'learning_rate': 1.7259768610797677e-05, 'epoch': 0.49} {'loss': 0.9067, 'learning_rate': 1.72595434809982e-05, 'epoch': 0.49} {'loss': 0.9285, 'learning_rate': 1.7259318343419468e-05, 'epoch': 0.49} {'loss': 0.9344, 'learning_rate': 1.7259093198061717e-05, 'epoch': 0.49} {'loss': 1.0164, 'learning_rate': 1.7258868044925195e-05, 'epoch': 0.49} {'loss': 0.7731, 'learning_rate': 1.7258642884010143e-05, 'epoch': 0.49} {'loss': 0.9854, 'learning_rate': 1.7258417715316797e-05, 'epoch': 0.49} {'loss': 0.8284, 'learning_rate': 1.72581925388454e-05, 'epoch': 0.49} {'loss': 0.7725, 'learning_rate': 1.7257967354596197e-05, 'epoch': 0.49} {'loss': 0.8916, 'learning_rate': 1.7257742162569425e-05, 'epoch': 0.49} {'loss': 0.8634, 'learning_rate': 1.725751696276533e-05, 'epoch': 0.49} {'loss': 0.9489, 'learning_rate': 1.725729175518415e-05, 'epoch': 0.49} {'loss': 0.7809, 'learning_rate': 1.7257066539826127e-05, 'epoch': 0.49} {'loss': 0.8603, 'learning_rate': 1.72568413166915e-05, 'epoch': 0.49} {'loss': 0.7667, 'learning_rate': 1.7256616085780514e-05, 'epoch': 0.49} {'loss': 0.7755, 'learning_rate': 1.725639084709341e-05, 'epoch': 0.49} {'loss': 0.7593, 'learning_rate': 1.725616560063043e-05, 'epoch': 0.49} {'loss': 0.8889, 'learning_rate': 1.7255940346391808e-05, 'epoch': 0.49} {'loss': 0.9322, 'learning_rate': 1.7255715084377796e-05, 'epoch': 0.49} {'loss': 0.869, 'learning_rate': 1.7255489814588625e-05, 'epoch': 0.49} {'loss': 0.7034, 'learning_rate': 1.725526453702455e-05, 'epoch': 0.49} {'loss': 0.8533, 'learning_rate': 1.7255039251685794e-05, 'epoch': 0.49} {'loss': 0.9086, 'learning_rate': 1.7254813958572616e-05, 'epoch': 0.49} {'loss': 0.8716, 'learning_rate': 1.7254588657685247e-05, 'epoch': 0.49} {'loss': 0.9091, 'learning_rate': 1.725436334902393e-05, 'epoch': 0.49} {'loss': 0.8643, 'learning_rate': 1.7254138032588914e-05, 'epoch': 0.49} {'loss': 0.9063, 'learning_rate': 1.725391270838043e-05, 'epoch': 0.49} {'loss': 0.5669, 'learning_rate': 1.7253687376398726e-05, 'epoch': 0.49} {'loss': 0.6635, 'learning_rate': 1.7253462036644037e-05, 'epoch': 0.49} {'loss': 0.7504, 'learning_rate': 1.7253236689116612e-05, 'epoch': 0.49} {'loss': 0.9228, 'learning_rate': 1.725301133381669e-05, 'epoch': 0.49} {'loss': 0.7149, 'learning_rate': 1.7252785970744512e-05, 'epoch': 0.49} {'loss': 0.9079, 'learning_rate': 1.7252560599900316e-05, 'epoch': 0.49} {'loss': 0.8358, 'learning_rate': 1.7252335221284352e-05, 'epoch': 0.49} {'loss': 0.9256, 'learning_rate': 1.725210983489685e-05, 'epoch': 0.49} {'loss': 0.8581, 'learning_rate': 1.725188444073806e-05, 'epoch': 0.49} {'loss': 0.8199, 'learning_rate': 1.7251659038808225e-05, 'epoch': 0.49} {'loss': 1.0179, 'learning_rate': 1.7251433629107578e-05, 'epoch': 0.49} {'loss': 0.7996, 'learning_rate': 1.7251208211636366e-05, 'epoch': 0.49} {'loss': 0.9059, 'learning_rate': 1.7250982786394833e-05, 'epoch': 0.49} {'loss': 0.8834, 'learning_rate': 1.7250757353383213e-05, 'epoch': 0.49} {'loss': 0.8115, 'learning_rate': 1.7250531912601756e-05, 'epoch': 0.49} {'loss': 0.9383, 'learning_rate': 1.72503064640507e-05, 'epoch': 0.49} {'loss': 0.7992, 'learning_rate': 1.7250081007730284e-05, 'epoch': 0.49} {'loss': 0.8303, 'learning_rate': 1.724985554364075e-05, 'epoch': 0.49} {'loss': 0.9637, 'learning_rate': 1.7249630071782343e-05, 'epoch': 0.49} {'loss': 0.9893, 'learning_rate': 1.7249404592155308e-05, 'epoch': 0.49} {'loss': 0.877, 'learning_rate': 1.7249179104759876e-05, 'epoch': 0.49} {'loss': 1.0019, 'learning_rate': 1.7248953609596295e-05, 'epoch': 0.49} {'loss': 0.8981, 'learning_rate': 1.7248728106664805e-05, 'epoch': 0.49} {'loss': 0.9655, 'learning_rate': 1.7248502595965654e-05, 'epoch': 0.49} {'loss': 0.8265, 'learning_rate': 1.7248277077499072e-05, 'epoch': 0.49} {'loss': 0.974, 'learning_rate': 1.7248051551265313e-05, 'epoch': 0.49} {'loss': 0.8359, 'learning_rate': 1.7247826017264607e-05, 'epoch': 0.49} {'loss': 0.8568, 'learning_rate': 1.7247600475497202e-05, 'epoch': 0.49} {'loss': 0.8769, 'learning_rate': 1.7247374925963342e-05, 'epoch': 0.49} {'loss': 0.7745, 'learning_rate': 1.7247149368663264e-05, 'epoch': 0.49} {'loss': 0.8332, 'learning_rate': 1.724692380359721e-05, 'epoch': 0.49} {'loss': 0.5914, 'learning_rate': 1.7246698230765426e-05, 'epoch': 0.49} {'loss': 0.8945, 'learning_rate': 1.724647265016815e-05, 'epoch': 0.49} {'loss': 0.7503, 'learning_rate': 1.7246247061805622e-05, 'epoch': 0.49} {'loss': 0.8058, 'learning_rate': 1.724602146567809e-05, 'epoch': 0.49} {'loss': 0.9376, 'learning_rate': 1.724579586178579e-05, 'epoch': 0.49} {'loss': 0.937, 'learning_rate': 1.7245570250128966e-05, 'epoch': 0.49} {'loss': 0.8238, 'learning_rate': 1.7245344630707857e-05, 'epoch': 0.49} {'loss': 0.8766, 'learning_rate': 1.7245119003522712e-05, 'epoch': 0.49} {'loss': 0.942, 'learning_rate': 1.7244893368573765e-05, 'epoch': 0.49} {'loss': 0.8461, 'learning_rate': 1.7244667725861263e-05, 'epoch': 0.49} {'loss': 0.9091, 'learning_rate': 1.7244442075385443e-05, 'epoch': 0.49} {'loss': 0.7395, 'learning_rate': 1.724421641714655e-05, 'epoch': 0.49} {'loss': 0.8319, 'learning_rate': 1.7243990751144825e-05, 'epoch': 0.49} {'loss': 0.8372, 'learning_rate': 1.7243765077380512e-05, 'epoch': 0.49} {'loss': 0.7409, 'learning_rate': 1.724353939585385e-05, 'epoch': 0.49} {'loss': 0.9566, 'learning_rate': 1.7243313706565083e-05, 'epoch': 0.49} {'loss': 0.9711, 'learning_rate': 1.724308800951445e-05, 'epoch': 0.49} {'loss': 0.9791, 'learning_rate': 1.7242862304702193e-05, 'epoch': 0.49} {'loss': 0.7171, 'learning_rate': 1.7242636592128558e-05, 'epoch': 0.49} {'loss': 0.7672, 'learning_rate': 1.7242410871793784e-05, 'epoch': 0.49} {'loss': 0.7763, 'learning_rate': 1.7242185143698114e-05, 'epoch': 0.49} {'loss': 0.8206, 'learning_rate': 1.7241959407841786e-05, 'epoch': 0.49} {'loss': 0.8263, 'learning_rate': 1.7241733664225045e-05, 'epoch': 0.49} {'loss': 0.8401, 'learning_rate': 1.7241507912848136e-05, 'epoch': 0.49} {'loss': 0.8068, 'learning_rate': 1.7241282153711294e-05, 'epoch': 0.49} {'loss': 0.8401, 'learning_rate': 1.7241056386814766e-05, 'epoch': 0.49} {'loss': 0.8634, 'learning_rate': 1.7240830612158793e-05, 'epoch': 0.49} {'loss': 0.6862, 'learning_rate': 1.7240604829743616e-05, 'epoch': 0.49} {'loss': 0.9027, 'learning_rate': 1.7240379039569477e-05, 'epoch': 0.49} {'loss': 0.8424, 'learning_rate': 1.7240153241636622e-05, 'epoch': 0.49} {'loss': 0.8218, 'learning_rate': 1.7239927435945287e-05, 'epoch': 0.49} {'loss': 0.7523, 'learning_rate': 1.7239701622495714e-05, 'epoch': 0.49} {'loss': 1.0892, 'learning_rate': 1.723947580128815e-05, 'epoch': 0.49} {'loss': 0.7973, 'learning_rate': 1.7239249972322832e-05, 'epoch': 0.49} {'loss': 1.0839, 'learning_rate': 1.7239024135600008e-05, 'epoch': 0.49} {'loss': 0.8995, 'learning_rate': 1.7238798291119914e-05, 'epoch': 0.49} {'loss': 0.7641, 'learning_rate': 1.723857243888279e-05, 'epoch': 0.49} {'loss': 0.7817, 'learning_rate': 1.723834657888889e-05, 'epoch': 0.49} {'loss': 0.705, 'learning_rate': 1.7238120711138445e-05, 'epoch': 0.49} {'loss': 0.7175, 'learning_rate': 1.7237894835631697e-05, 'epoch': 0.49} {'loss': 0.9036, 'learning_rate': 1.7237668952368896e-05, 'epoch': 0.49} {'loss': 0.8212, 'learning_rate': 1.723744306135028e-05, 'epoch': 0.49} {'loss': 0.9283, 'learning_rate': 1.7237217162576087e-05, 'epoch': 0.49} {'loss': 0.9295, 'learning_rate': 1.7236991256046564e-05, 'epoch': 0.49} {'loss': 0.8222, 'learning_rate': 1.7236765341761953e-05, 'epoch': 0.49} {'loss': 0.8376, 'learning_rate': 1.7236539419722495e-05, 'epoch': 0.49} {'loss': 0.8637, 'learning_rate': 1.723631348992843e-05, 'epoch': 0.49} {'loss': 0.987, 'learning_rate': 1.7236087552380004e-05, 'epoch': 0.49} {'loss': 0.7928, 'learning_rate': 1.7235861607077457e-05, 'epoch': 0.49} {'loss': 0.9991, 'learning_rate': 1.7235635654021027e-05, 'epoch': 0.49} {'loss': 0.767, 'learning_rate': 1.7235409693210963e-05, 'epoch': 0.49} {'loss': 0.8742, 'learning_rate': 1.7235183724647505e-05, 'epoch': 0.49} {'loss': 1.0164, 'learning_rate': 1.7234957748330894e-05, 'epoch': 0.49} {'loss': 0.7258, 'learning_rate': 1.7234731764261373e-05, 'epoch': 0.49} {'loss': 0.7073, 'learning_rate': 1.7234505772439187e-05, 'epoch': 0.49} {'loss': 0.9213, 'learning_rate': 1.723427977286457e-05, 'epoch': 0.49} {'loss': 0.861, 'learning_rate': 1.723405376553777e-05, 'epoch': 0.49} {'loss': 0.8683, 'learning_rate': 1.7233827750459033e-05, 'epoch': 0.49} {'loss': 0.8061, 'learning_rate': 1.7233601727628593e-05, 'epoch': 0.49} {'loss': 1.0009, 'learning_rate': 1.7233375697046694e-05, 'epoch': 0.49} {'loss': 0.7587, 'learning_rate': 1.7233149658713583e-05, 'epoch': 0.49} {'loss': 0.8985, 'learning_rate': 1.72329236126295e-05, 'epoch': 0.49} {'loss': 0.8795, 'learning_rate': 1.7232697558794683e-05, 'epoch': 0.49} {'loss': 1.0329, 'learning_rate': 1.7232471497209382e-05, 'epoch': 0.49} {'loss': 0.8151, 'learning_rate': 1.7232245427873832e-05, 'epoch': 0.49} {'loss': 0.9828, 'learning_rate': 1.723201935078828e-05, 'epoch': 0.49} {'loss': 0.7417, 'learning_rate': 1.7231793265952967e-05, 'epoch': 0.49} {'loss': 0.7424, 'learning_rate': 1.7231567173368135e-05, 'epoch': 0.49} {'loss': 0.7184, 'learning_rate': 1.723134107303402e-05, 'epoch': 0.49} {'loss': 0.9404, 'learning_rate': 1.7231114964950877e-05, 'epoch': 0.49} {'loss': 0.9156, 'learning_rate': 1.7230888849118944e-05, 'epoch': 0.49} {'loss': 0.8444, 'learning_rate': 1.7230662725538455e-05, 'epoch': 0.49} {'loss': 0.7067, 'learning_rate': 1.723043659420966e-05, 'epoch': 0.49} {'loss': 0.7676, 'learning_rate': 1.7230210455132802e-05, 'epoch': 0.49} {'loss': 0.8378, 'learning_rate': 1.7229984308308116e-05, 'epoch': 0.49} {'loss': 0.6615, 'learning_rate': 1.722975815373585e-05, 'epoch': 0.49} {'loss': 0.8012, 'learning_rate': 1.7229531991416252e-05, 'epoch': 0.49} {'loss': 0.9081, 'learning_rate': 1.722930582134955e-05, 'epoch': 0.49} {'loss': 0.9544, 'learning_rate': 1.7229079643536e-05, 'epoch': 0.49} {'loss': 0.8285, 'learning_rate': 1.7228853457975836e-05, 'epoch': 0.49} {'loss': 0.7369, 'learning_rate': 1.7228627264669305e-05, 'epoch': 0.49} {'loss': 0.8766, 'learning_rate': 1.7228401063616645e-05, 'epoch': 0.49} {'loss': 0.9137, 'learning_rate': 1.72281748548181e-05, 'epoch': 0.49} {'loss': 0.7759, 'learning_rate': 1.7227948638273918e-05, 'epoch': 0.49} {'loss': 0.8585, 'learning_rate': 1.7227722413984332e-05, 'epoch': 0.49} {'loss': 0.9068, 'learning_rate': 1.7227496181949592e-05, 'epoch': 0.49} {'loss': 0.9395, 'learning_rate': 1.7227269942169935e-05, 'epoch': 0.49} {'loss': 0.8738, 'learning_rate': 1.722704369464561e-05, 'epoch': 0.49} {'loss': 0.9166, 'learning_rate': 1.722681743937685e-05, 'epoch': 0.49} {'loss': 0.7086, 'learning_rate': 1.722659117636391e-05, 'epoch': 0.49} {'loss': 0.7719, 'learning_rate': 1.7226364905607017e-05, 'epoch': 0.49} {'loss': 0.9352, 'learning_rate': 1.7226138627106424e-05, 'epoch': 0.49} {'loss': 0.8144, 'learning_rate': 1.7225912340862375e-05, 'epoch': 0.49} {'loss': 0.9805, 'learning_rate': 1.7225686046875107e-05, 'epoch': 0.49} {'loss': 0.7492, 'learning_rate': 1.7225459745144863e-05, 'epoch': 0.49} {'loss': 0.8922, 'learning_rate': 1.7225233435671887e-05, 'epoch': 0.49} {'loss': 1.1436, 'learning_rate': 1.7225007118456424e-05, 'epoch': 0.49} {'loss': 0.7963, 'learning_rate': 1.7224780793498713e-05, 'epoch': 0.49} {'loss': 0.8295, 'learning_rate': 1.7224554460798997e-05, 'epoch': 0.49} {'loss': 0.7524, 'learning_rate': 1.7224328120357517e-05, 'epoch': 0.49} {'loss': 0.758, 'learning_rate': 1.722410177217452e-05, 'epoch': 0.49} {'loss': 0.8721, 'learning_rate': 1.7223875416250243e-05, 'epoch': 0.49} {'loss': 0.911, 'learning_rate': 1.7223649052584933e-05, 'epoch': 0.49} {'loss': 0.6668, 'learning_rate': 1.722342268117883e-05, 'epoch': 0.49} {'loss': 0.7947, 'learning_rate': 1.722319630203218e-05, 'epoch': 0.49} {'loss': 0.8234, 'learning_rate': 1.722296991514522e-05, 'epoch': 0.49} {'loss': 0.7998, 'learning_rate': 1.72227435205182e-05, 'epoch': 0.49} {'loss': 0.8946, 'learning_rate': 1.7222517118151355e-05, 'epoch': 0.49} {'loss': 0.8989, 'learning_rate': 1.722229070804493e-05, 'epoch': 0.49} {'loss': 0.9868, 'learning_rate': 1.7222064290199174e-05, 'epoch': 0.49} {'loss': 1.0249, 'learning_rate': 1.722183786461432e-05, 'epoch': 0.49} {'loss': 0.796, 'learning_rate': 1.7221611431290615e-05, 'epoch': 0.49} {'loss': 0.8882, 'learning_rate': 1.7221384990228302e-05, 'epoch': 0.49} {'loss': 0.9282, 'learning_rate': 1.7221158541427626e-05, 'epoch': 0.49} {'loss': 0.9067, 'learning_rate': 1.7220932084888823e-05, 'epoch': 0.49} {'loss': 0.8129, 'learning_rate': 1.7220705620612143e-05, 'epoch': 0.49} {'loss': 1.0397, 'learning_rate': 1.722047914859782e-05, 'epoch': 0.49} {'loss': 0.855, 'learning_rate': 1.7220252668846106e-05, 'epoch': 0.49} {'loss': 0.8438, 'learning_rate': 1.7220026181357237e-05, 'epoch': 0.49} {'loss': 1.0987, 'learning_rate': 1.7219799686131464e-05, 'epoch': 0.49} {'loss': 0.8932, 'learning_rate': 1.721957318316902e-05, 'epoch': 0.49} {'loss': 0.9341, 'learning_rate': 1.7219346672470152e-05, 'epoch': 0.49} {'loss': 0.8034, 'learning_rate': 1.72191201540351e-05, 'epoch': 0.49} {'loss': 0.8671, 'learning_rate': 1.7218893627864114e-05, 'epoch': 0.49} {'loss': 0.8754, 'learning_rate': 1.7218667093957426e-05, 'epoch': 0.49} {'loss': 0.8403, 'learning_rate': 1.721844055231529e-05, 'epoch': 0.49} {'loss': 0.9422, 'learning_rate': 1.721821400293794e-05, 'epoch': 0.49} {'loss': 0.7446, 'learning_rate': 1.7217987445825625e-05, 'epoch': 0.49} {'loss': 1.1031, 'learning_rate': 1.7217760880978582e-05, 'epoch': 0.49} {'loss': 0.8781, 'learning_rate': 1.7217534308397058e-05, 'epoch': 0.49} {'loss': 0.9017, 'learning_rate': 1.7217307728081296e-05, 'epoch': 0.49} {'loss': 0.817, 'learning_rate': 1.7217081140031537e-05, 'epoch': 0.49} {'loss': 0.7511, 'learning_rate': 1.7216854544248025e-05, 'epoch': 0.49} {'loss': 0.6784, 'learning_rate': 1.7216627940731e-05, 'epoch': 0.49} {'loss': 0.8517, 'learning_rate': 1.7216401329480708e-05, 'epoch': 0.49} {'loss': 0.7836, 'learning_rate': 1.7216174710497387e-05, 'epoch': 0.49} {'loss': 0.8161, 'learning_rate': 1.721594808378129e-05, 'epoch': 0.49} {'loss': 0.6798, 'learning_rate': 1.7215721449332648e-05, 'epoch': 0.49} {'loss': 0.8705, 'learning_rate': 1.721549480715171e-05, 'epoch': 0.49} {'loss': 0.7214, 'learning_rate': 1.721526815723872e-05, 'epoch': 0.49} {'loss': 0.8926, 'learning_rate': 1.721504149959392e-05, 'epoch': 0.49} {'loss': 0.8652, 'learning_rate': 1.721481483421755e-05, 'epoch': 0.49} {'loss': 0.8501, 'learning_rate': 1.7214588161109854e-05, 'epoch': 0.49} {'loss': 0.7772, 'learning_rate': 1.721436148027108e-05, 'epoch': 0.49} {'loss': 0.9091, 'learning_rate': 1.721413479170146e-05, 'epoch': 0.49} {'loss': 0.9553, 'learning_rate': 1.7213908095401246e-05, 'epoch': 0.49} {'loss': 0.879, 'learning_rate': 1.7213681391370678e-05, 'epoch': 0.49} {'loss': 0.7367, 'learning_rate': 1.7213454679610002e-05, 'epoch': 0.49} {'loss': 0.8317, 'learning_rate': 1.7213227960119456e-05, 'epoch': 0.49} {'loss': 0.8126, 'learning_rate': 1.7213001232899283e-05, 'epoch': 0.49} {'loss': 0.9135, 'learning_rate': 1.7212774497949732e-05, 'epoch': 0.49} {'loss': 0.7539, 'learning_rate': 1.721254775527104e-05, 'epoch': 0.49} {'loss': 0.938, 'learning_rate': 1.7212321004863452e-05, 'epoch': 0.49} {'loss': 0.6666, 'learning_rate': 1.7212094246727214e-05, 'epoch': 0.49} {'loss': 0.8381, 'learning_rate': 1.7211867480862566e-05, 'epoch': 0.49} {'loss': 0.8907, 'learning_rate': 1.721164070726975e-05, 'epoch': 0.49} {'loss': 0.8726, 'learning_rate': 1.7211413925949006e-05, 'epoch': 0.49} {'loss': 0.846, 'learning_rate': 1.7211187136900585e-05, 'epoch': 0.49} {'loss': 0.904, 'learning_rate': 1.7210960340124727e-05, 'epoch': 0.49} {'loss': 0.944, 'learning_rate': 1.7210733535621672e-05, 'epoch': 0.49} {'loss': 0.8638, 'learning_rate': 1.7210506723391664e-05, 'epoch': 0.49} {'loss': 0.8878, 'learning_rate': 1.7210279903434953e-05, 'epoch': 0.49} {'loss': 0.6911, 'learning_rate': 1.721005307575177e-05, 'epoch': 0.49} {'loss': 0.9747, 'learning_rate': 1.7209826240342367e-05, 'epoch': 0.49} {'loss': 0.8822, 'learning_rate': 1.7209599397206986e-05, 'epoch': 0.49} {'loss': 0.8149, 'learning_rate': 1.7209372546345865e-05, 'epoch': 0.49} {'loss': 0.749, 'learning_rate': 1.720914568775925e-05, 'epoch': 0.49} {'loss': 0.6762, 'learning_rate': 1.720891882144739e-05, 'epoch': 0.49} {'loss': 0.9336, 'learning_rate': 1.7208691947410518e-05, 'epoch': 0.49} {'loss': 0.5861, 'learning_rate': 1.7208465065648886e-05, 'epoch': 0.49} {'loss': 0.8376, 'learning_rate': 1.720823817616273e-05, 'epoch': 0.49} {'loss': 0.745, 'learning_rate': 1.7208011278952295e-05, 'epoch': 0.49} {'loss': 0.8251, 'learning_rate': 1.720778437401783e-05, 'epoch': 0.49} {'loss': 0.7332, 'learning_rate': 1.720755746135957e-05, 'epoch': 0.49} {'loss': 0.9557, 'learning_rate': 1.7207330540977764e-05, 'epoch': 0.49} {'loss': 0.9324, 'learning_rate': 1.7207103612872652e-05, 'epoch': 0.49} {'loss': 0.8237, 'learning_rate': 1.7206876677044477e-05, 'epoch': 0.49} {'loss': 0.7855, 'learning_rate': 1.7206649733493483e-05, 'epoch': 0.49} {'loss': 0.7501, 'learning_rate': 1.7206422782219916e-05, 'epoch': 0.49} {'loss': 0.7904, 'learning_rate': 1.720619582322401e-05, 'epoch': 0.49} {'loss': 0.8375, 'learning_rate': 1.7205968856506025e-05, 'epoch': 0.49} {'loss': 0.8478, 'learning_rate': 1.7205741882066185e-05, 'epoch': 0.49} {'loss': 0.8971, 'learning_rate': 1.720551489990475e-05, 'epoch': 0.49} {'loss': 0.766, 'learning_rate': 1.720528791002195e-05, 'epoch': 0.49} {'loss': 0.8562, 'learning_rate': 1.7205060912418036e-05, 'epoch': 0.49} {'loss': 0.897, 'learning_rate': 1.7204833907093243e-05, 'epoch': 0.49} {'loss': 0.7882, 'learning_rate': 1.7204606894047827e-05, 'epoch': 0.49} {'loss': 0.9206, 'learning_rate': 1.720437987328202e-05, 'epoch': 0.49} {'loss': 0.6055, 'learning_rate': 1.7204152844796075e-05, 'epoch': 0.49} {'loss': 0.7923, 'learning_rate': 1.7203925808590226e-05, 'epoch': 0.49} {'loss': 0.8194, 'learning_rate': 1.7203698764664723e-05, 'epoch': 0.49} {'loss': 0.8637, 'learning_rate': 1.7203471713019805e-05, 'epoch': 0.49} {'loss': 0.806, 'learning_rate': 1.7203244653655717e-05, 'epoch': 0.49} {'loss': 0.7459, 'learning_rate': 1.7203017586572702e-05, 'epoch': 0.49} {'loss': 0.8406, 'learning_rate': 1.7202790511771e-05, 'epoch': 0.49} {'loss': 0.8369, 'learning_rate': 1.7202563429250865e-05, 'epoch': 0.49} {'loss': 0.8332, 'learning_rate': 1.7202336339012528e-05, 'epoch': 0.49} {'loss': 0.9948, 'learning_rate': 1.720210924105624e-05, 'epoch': 0.49} {'loss': 0.8047, 'learning_rate': 1.720188213538224e-05, 'epoch': 0.49} {'loss': 0.8996, 'learning_rate': 1.7201655021990776e-05, 'epoch': 0.49} {'loss': 0.989, 'learning_rate': 1.720142790088209e-05, 'epoch': 0.49} {'loss': 0.8312, 'learning_rate': 1.720120077205642e-05, 'epoch': 0.49} {'loss': 0.9223, 'learning_rate': 1.7200973635514014e-05, 'epoch': 0.49} {'loss': 0.9121, 'learning_rate': 1.7200746491255117e-05, 'epoch': 0.49} {'loss': 0.8431, 'learning_rate': 1.7200519339279966e-05, 'epoch': 0.49} {'loss': 0.8402, 'learning_rate': 1.720029217958881e-05, 'epoch': 0.49} {'loss': 0.8211, 'learning_rate': 1.7200065012181895e-05, 'epoch': 0.49} {'loss': 0.7111, 'learning_rate': 1.7199837837059455e-05, 'epoch': 0.49} {'loss': 0.8402, 'learning_rate': 1.7199610654221744e-05, 'epoch': 0.49} {'loss': 1.0296, 'learning_rate': 1.7199383463668997e-05, 'epoch': 0.49} {'loss': 0.9962, 'learning_rate': 1.7199156265401463e-05, 'epoch': 0.49} {'loss': 0.7982, 'learning_rate': 1.7198929059419383e-05, 'epoch': 0.49} {'loss': 0.7927, 'learning_rate': 1.7198701845723002e-05, 'epoch': 0.49} {'loss': 0.8848, 'learning_rate': 1.719847462431256e-05, 'epoch': 0.49} {'loss': 0.8611, 'learning_rate': 1.7198247395188303e-05, 'epoch': 0.49} {'loss': 0.9543, 'learning_rate': 1.7198020158350473e-05, 'epoch': 0.49} {'loss': 0.9064, 'learning_rate': 1.7197792913799318e-05, 'epoch': 0.49} {'loss': 0.7681, 'learning_rate': 1.7197565661535077e-05, 'epoch': 0.49} {'loss': 0.8584, 'learning_rate': 1.719733840155799e-05, 'epoch': 0.49} {'loss': 0.6908, 'learning_rate': 1.719711113386831e-05, 'epoch': 0.49} {'loss': 0.7267, 'learning_rate': 1.7196883858466277e-05, 'epoch': 0.49} {'loss': 0.9637, 'learning_rate': 1.719665657535213e-05, 'epoch': 0.49} {'loss': 0.9511, 'learning_rate': 1.719642928452612e-05, 'epoch': 0.49} {'loss': 0.8469, 'learning_rate': 1.7196201985988485e-05, 'epoch': 0.49} {'loss': 0.7365, 'learning_rate': 1.7195974679739466e-05, 'epoch': 0.49} {'loss': 0.7918, 'learning_rate': 1.7195747365779314e-05, 'epoch': 0.49} {'loss': 0.9098, 'learning_rate': 1.7195520044108268e-05, 'epoch': 0.49} {'loss': 0.8323, 'learning_rate': 1.7195292714726576e-05, 'epoch': 0.49} {'loss': 0.727, 'learning_rate': 1.7195065377634476e-05, 'epoch': 0.49} {'loss': 0.9956, 'learning_rate': 1.7194838032832214e-05, 'epoch': 0.49} {'loss': 0.7823, 'learning_rate': 1.7194610680320035e-05, 'epoch': 0.49} {'loss': 0.9392, 'learning_rate': 1.7194383320098182e-05, 'epoch': 0.49} {'loss': 0.7347, 'learning_rate': 1.7194155952166896e-05, 'epoch': 0.49} {'loss': 0.8944, 'learning_rate': 1.719392857652642e-05, 'epoch': 0.49} {'loss': 0.8258, 'learning_rate': 1.7193701193177004e-05, 'epoch': 0.49} {'loss': 0.9929, 'learning_rate': 1.7193473802118886e-05, 'epoch': 0.49} {'loss': 0.7523, 'learning_rate': 1.7193246403352315e-05, 'epoch': 0.49} {'loss': 0.7976, 'learning_rate': 1.719301899687753e-05, 'epoch': 0.49} {'loss': 0.779, 'learning_rate': 1.7192791582694776e-05, 'epoch': 0.49} {'loss': 0.9031, 'learning_rate': 1.7192564160804292e-05, 'epoch': 0.49} {'loss': 0.6939, 'learning_rate': 1.7192336731206328e-05, 'epoch': 0.49} {'loss': 0.7693, 'learning_rate': 1.719210929390113e-05, 'epoch': 0.49} {'loss': 0.9718, 'learning_rate': 1.7191881848888937e-05, 'epoch': 0.49} {'loss': 0.7973, 'learning_rate': 1.719165439616999e-05, 'epoch': 0.49} {'loss': 1.0409, 'learning_rate': 1.7191426935744538e-05, 'epoch': 0.49} {'loss': 0.7048, 'learning_rate': 1.7191199467612825e-05, 'epoch': 0.49} {'loss': 0.8976, 'learning_rate': 1.719097199177509e-05, 'epoch': 0.49} {'loss': 0.9235, 'learning_rate': 1.719074450823158e-05, 'epoch': 0.49} {'loss': 0.9295, 'learning_rate': 1.7190517016982537e-05, 'epoch': 0.49} {'loss': 0.986, 'learning_rate': 1.719028951802821e-05, 'epoch': 0.49} {'loss': 0.7247, 'learning_rate': 1.7190062011368835e-05, 'epoch': 0.49} {'loss': 0.7162, 'learning_rate': 1.718983449700466e-05, 'epoch': 0.49} {'loss': 0.758, 'learning_rate': 1.7189606974935934e-05, 'epoch': 0.49} {'loss': 0.7513, 'learning_rate': 1.718937944516289e-05, 'epoch': 0.49} {'loss': 0.82, 'learning_rate': 1.7189151907685775e-05, 'epoch': 0.49} {'loss': 0.9282, 'learning_rate': 1.718892436250484e-05, 'epoch': 0.49} {'loss': 0.7998, 'learning_rate': 1.718869680962032e-05, 'epoch': 0.49} {'loss': 0.9744, 'learning_rate': 1.7188469249032465e-05, 'epoch': 0.49} {'loss': 0.9834, 'learning_rate': 1.7188241680741516e-05, 'epoch': 0.49} {'loss': 0.8827, 'learning_rate': 1.7188014104747717e-05, 'epoch': 0.49} {'loss': 0.6335, 'learning_rate': 1.718778652105131e-05, 'epoch': 0.49} {'loss': 1.0452, 'learning_rate': 1.7187558929652544e-05, 'epoch': 0.49} {'loss': 0.8207, 'learning_rate': 1.718733133055166e-05, 'epoch': 0.49} {'loss': 0.8853, 'learning_rate': 1.71871037237489e-05, 'epoch': 0.49} {'loss': 0.9154, 'learning_rate': 1.7186876109244506e-05, 'epoch': 0.49} {'loss': 0.7964, 'learning_rate': 1.7186648487038734e-05, 'epoch': 0.49} {'loss': 1.0029, 'learning_rate': 1.7186420857131813e-05, 'epoch': 0.49} {'loss': 0.7864, 'learning_rate': 1.7186193219523993e-05, 'epoch': 0.49} {'loss': 0.6624, 'learning_rate': 1.7185965574215523e-05, 'epoch': 0.49} {'loss': 0.9606, 'learning_rate': 1.718573792120664e-05, 'epoch': 0.49} {'loss': 0.953, 'learning_rate': 1.718551026049759e-05, 'epoch': 0.49} {'loss': 0.7128, 'learning_rate': 1.718528259208862e-05, 'epoch': 0.49} {'loss': 0.9331, 'learning_rate': 1.7185054915979972e-05, 'epoch': 0.49} {'loss': 1.0101, 'learning_rate': 1.7184827232171882e-05, 'epoch': 0.49} {'loss': 0.8389, 'learning_rate': 1.718459954066461e-05, 'epoch': 0.49} {'loss': 1.0259, 'learning_rate': 1.7184371841458385e-05, 'epoch': 0.49} {'loss': 0.8385, 'learning_rate': 1.7184144134553458e-05, 'epoch': 0.49} {'loss': 1.008, 'learning_rate': 1.7183916419950072e-05, 'epoch': 0.49} {'loss': 0.9269, 'learning_rate': 1.7183688697648472e-05, 'epoch': 0.49} {'loss': 0.9514, 'learning_rate': 1.71834609676489e-05, 'epoch': 0.49} {'loss': 0.7191, 'learning_rate': 1.7183233229951602e-05, 'epoch': 0.49} {'loss': 0.8203, 'learning_rate': 1.7183005484556824e-05, 'epoch': 0.49} {'loss': 0.8063, 'learning_rate': 1.7182777731464803e-05, 'epoch': 0.49} {'loss': 0.7816, 'learning_rate': 1.718254997067579e-05, 'epoch': 0.49} {'loss': 0.8878, 'learning_rate': 1.7182322202190027e-05, 'epoch': 0.49} {'loss': 0.7099, 'learning_rate': 1.7182094426007756e-05, 'epoch': 0.49} {'loss': 0.9159, 'learning_rate': 1.7181866642129222e-05, 'epoch': 0.49} {'loss': 0.8776, 'learning_rate': 1.718163885055467e-05, 'epoch': 0.49} {'loss': 0.852, 'learning_rate': 1.7181411051284343e-05, 'epoch': 0.49} {'loss': 0.9438, 'learning_rate': 1.718118324431849e-05, 'epoch': 0.49} {'loss': 0.7805, 'learning_rate': 1.7180955429657348e-05, 'epoch': 0.49} {'loss': 0.9974, 'learning_rate': 1.7180727607301163e-05, 'epoch': 0.49} {'loss': 0.7894, 'learning_rate': 1.7180499777250182e-05, 'epoch': 0.49} {'loss': 0.9502, 'learning_rate': 1.7180271939504648e-05, 'epoch': 0.49} {'loss': 0.8827, 'learning_rate': 1.7180044094064803e-05, 'epoch': 0.49} {'loss': 0.8845, 'learning_rate': 1.7179816240930893e-05, 'epoch': 0.49} {'loss': 0.9544, 'learning_rate': 1.7179588380103163e-05, 'epoch': 0.49} {'loss': 0.8727, 'learning_rate': 1.7179360511581856e-05, 'epoch': 0.49} {'loss': 0.7698, 'learning_rate': 1.7179132635367214e-05, 'epoch': 0.49} {'loss': 0.8206, 'learning_rate': 1.7178904751459486e-05, 'epoch': 0.49} {'loss': 0.7441, 'learning_rate': 1.7178676859858913e-05, 'epoch': 0.49} {'loss': 0.8977, 'learning_rate': 1.717844896056574e-05, 'epoch': 0.49} {'loss': 0.8622, 'learning_rate': 1.717822105358021e-05, 'epoch': 0.49} {'loss': 0.8194, 'learning_rate': 1.717799313890257e-05, 'epoch': 0.5} {'loss': 0.9109, 'learning_rate': 1.7177765216533057e-05, 'epoch': 0.5} {'loss': 0.7171, 'learning_rate': 1.7177537286471927e-05, 'epoch': 0.5} {'loss': 0.9037, 'learning_rate': 1.7177309348719416e-05, 'epoch': 0.5} {'loss': 0.9454, 'learning_rate': 1.7177081403275767e-05, 'epoch': 0.5} {'loss': 0.9509, 'learning_rate': 1.7176853450141233e-05, 'epoch': 0.5} {'loss': 0.787, 'learning_rate': 1.717662548931605e-05, 'epoch': 0.5} {'loss': 0.9302, 'learning_rate': 1.7176397520800466e-05, 'epoch': 0.5} {'loss': 0.8257, 'learning_rate': 1.7176169544594726e-05, 'epoch': 0.5} {'loss': 0.749, 'learning_rate': 1.7175941560699068e-05, 'epoch': 0.5} {'loss': 0.9309, 'learning_rate': 1.7175713569113744e-05, 'epoch': 0.5} {'loss': 0.8124, 'learning_rate': 1.7175485569838994e-05, 'epoch': 0.5} {'loss': 0.8839, 'learning_rate': 1.7175257562875064e-05, 'epoch': 0.5} {'loss': 1.1084, 'learning_rate': 1.7175029548222197e-05, 'epoch': 0.5} {'loss': 0.8574, 'learning_rate': 1.7174801525880642e-05, 'epoch': 0.5} {'loss': 0.8516, 'learning_rate': 1.7174573495850637e-05, 'epoch': 0.5} {'loss': 0.9561, 'learning_rate': 1.717434545813243e-05, 'epoch': 0.5} {'loss': 0.9293, 'learning_rate': 1.7174117412726262e-05, 'epoch': 0.5} {'loss': 0.7885, 'learning_rate': 1.7173889359632383e-05, 'epoch': 0.5} {'loss': 0.6811, 'learning_rate': 1.717366129885103e-05, 'epoch': 0.5} {'loss': 0.753, 'learning_rate': 1.7173433230382453e-05, 'epoch': 0.5} {'loss': 0.9373, 'learning_rate': 1.7173205154226896e-05, 'epoch': 0.5} {'loss': 0.9012, 'learning_rate': 1.7172977070384603e-05, 'epoch': 0.5} {'loss': 0.7151, 'learning_rate': 1.7172748978855814e-05, 'epoch': 0.5} {'loss': 0.8995, 'learning_rate': 1.717252087964078e-05, 'epoch': 0.5} {'loss': 0.8643, 'learning_rate': 1.717229277273974e-05, 'epoch': 0.5} {'loss': 0.8056, 'learning_rate': 1.7172064658152944e-05, 'epoch': 0.5} {'loss': 0.8735, 'learning_rate': 1.717183653588063e-05, 'epoch': 0.5} {'loss': 1.0187, 'learning_rate': 1.717160840592305e-05, 'epoch': 0.5} {'loss': 0.786, 'learning_rate': 1.7171380268280445e-05, 'epoch': 0.5} {'loss': 0.899, 'learning_rate': 1.7171152122953054e-05, 'epoch': 0.5} {'loss': 0.9742, 'learning_rate': 1.717092396994113e-05, 'epoch': 0.5} {'loss': 1.1095, 'learning_rate': 1.717069580924491e-05, 'epoch': 0.5} {'loss': 0.7491, 'learning_rate': 1.7170467640864648e-05, 'epoch': 0.5} {'loss': 0.7024, 'learning_rate': 1.717023946480058e-05, 'epoch': 0.5} {'loss': 0.8044, 'learning_rate': 1.7170011281052952e-05, 'epoch': 0.5} {'loss': 0.6628, 'learning_rate': 1.7169783089622008e-05, 'epoch': 0.5} {'loss': 0.7477, 'learning_rate': 1.7169554890507994e-05, 'epoch': 0.5} {'loss': 0.732, 'learning_rate': 1.716932668371116e-05, 'epoch': 0.5} {'loss': 0.6977, 'learning_rate': 1.7169098469231742e-05, 'epoch': 0.5} {'loss': 0.8295, 'learning_rate': 1.7168870247069992e-05, 'epoch': 0.5} {'loss': 0.6854, 'learning_rate': 1.7168642017226145e-05, 'epoch': 0.5} {'loss': 0.8355, 'learning_rate': 1.7168413779700454e-05, 'epoch': 0.5} {'loss': 0.6291, 'learning_rate': 1.7168185534493157e-05, 'epoch': 0.5} {'loss': 0.7147, 'learning_rate': 1.7167957281604507e-05, 'epoch': 0.5} {'loss': 0.945, 'learning_rate': 1.7167729021034743e-05, 'epoch': 0.5} {'loss': 0.8838, 'learning_rate': 1.716750075278411e-05, 'epoch': 0.5} {'loss': 0.8531, 'learning_rate': 1.7167272476852848e-05, 'epoch': 0.5} {'loss': 0.6933, 'learning_rate': 1.7167044193241213e-05, 'epoch': 0.5} {'loss': 0.9476, 'learning_rate': 1.716681590194944e-05, 'epoch': 0.5} {'loss': 0.8433, 'learning_rate': 1.716658760297778e-05, 'epoch': 0.5} {'loss': 0.8402, 'learning_rate': 1.7166359296326474e-05, 'epoch': 0.5} {'loss': 0.8237, 'learning_rate': 1.7166130981995765e-05, 'epoch': 0.5} {'loss': 0.8382, 'learning_rate': 1.7165902659985904e-05, 'epoch': 0.5} {'loss': 0.8826, 'learning_rate': 1.7165674330297126e-05, 'epoch': 0.5} {'loss': 0.7598, 'learning_rate': 1.7165445992929686e-05, 'epoch': 0.5} {'loss': 0.8432, 'learning_rate': 1.7165217647883822e-05, 'epoch': 0.5} {'loss': 0.89, 'learning_rate': 1.7164989295159776e-05, 'epoch': 0.5} {'loss': 0.9151, 'learning_rate': 1.71647609347578e-05, 'epoch': 0.5} {'loss': 0.8273, 'learning_rate': 1.7164532566678143e-05, 'epoch': 0.5} {'loss': 0.8852, 'learning_rate': 1.7164304190921035e-05, 'epoch': 0.5} {'loss': 0.9604, 'learning_rate': 1.716407580748673e-05, 'epoch': 0.5} {'loss': 0.8309, 'learning_rate': 1.7163847416375473e-05, 'epoch': 0.5} {'loss': 0.7317, 'learning_rate': 1.7163619017587506e-05, 'epoch': 0.5} {'loss': 1.0299, 'learning_rate': 1.7163390611123075e-05, 'epoch': 0.5} {'loss': 0.9991, 'learning_rate': 1.7163162196982423e-05, 'epoch': 0.5} {'loss': 0.8865, 'learning_rate': 1.7162933775165798e-05, 'epoch': 0.5} {'loss': 0.8814, 'learning_rate': 1.716270534567344e-05, 'epoch': 0.5} {'loss': 0.7847, 'learning_rate': 1.7162476908505603e-05, 'epoch': 0.5} {'loss': 0.9388, 'learning_rate': 1.716224846366252e-05, 'epoch': 0.5} {'loss': 0.8907, 'learning_rate': 1.716202001114444e-05, 'epoch': 0.5} {'loss': 0.7285, 'learning_rate': 1.7161791550951613e-05, 'epoch': 0.5} {'loss': 0.8053, 'learning_rate': 1.7161563083084277e-05, 'epoch': 0.5} {'loss': 0.8977, 'learning_rate': 1.7161334607542683e-05, 'epoch': 0.5} {'loss': 0.8896, 'learning_rate': 1.716110612432707e-05, 'epoch': 0.5} {'loss': 1.1091, 'learning_rate': 1.7160877633437686e-05, 'epoch': 0.5} {'loss': 0.9367, 'learning_rate': 1.7160649134874778e-05, 'epoch': 0.5} {'loss': 0.9311, 'learning_rate': 1.7160420628638584e-05, 'epoch': 0.5} {'loss': 0.7879, 'learning_rate': 1.7160192114729356e-05, 'epoch': 0.5} {'loss': 0.7427, 'learning_rate': 1.7159963593147334e-05, 'epoch': 0.5} {'loss': 0.9743, 'learning_rate': 1.7159735063892766e-05, 'epoch': 0.5} {'loss': 0.9201, 'learning_rate': 1.7159506526965895e-05, 'epoch': 0.5} {'loss': 0.7925, 'learning_rate': 1.7159277982366966e-05, 'epoch': 0.5} {'loss': 0.9467, 'learning_rate': 1.7159049430096226e-05, 'epoch': 0.5} {'loss': 1.0916, 'learning_rate': 1.715882087015392e-05, 'epoch': 0.5} {'loss': 0.9381, 'learning_rate': 1.7158592302540287e-05, 'epoch': 0.5} {'loss': 0.8115, 'learning_rate': 1.715836372725558e-05, 'epoch': 0.5} {'loss': 0.8432, 'learning_rate': 1.7158135144300038e-05, 'epoch': 0.5} {'loss': 0.9788, 'learning_rate': 1.7157906553673908e-05, 'epoch': 0.5} {'loss': 0.8457, 'learning_rate': 1.7157677955377437e-05, 'epoch': 0.5} {'loss': 0.9017, 'learning_rate': 1.7157449349410866e-05, 'epoch': 0.5} {'loss': 0.8997, 'learning_rate': 1.715722073577444e-05, 'epoch': 0.5} {'loss': 0.7782, 'learning_rate': 1.7156992114468415e-05, 'epoch': 0.5} {'loss': 0.9022, 'learning_rate': 1.7156763485493017e-05, 'epoch': 0.5} {'loss': 0.7995, 'learning_rate': 1.715653484884851e-05, 'epoch': 0.5} {'loss': 0.8331, 'learning_rate': 1.7156306204535123e-05, 'epoch': 0.5} {'loss': 0.8822, 'learning_rate': 1.7156077552553107e-05, 'epoch': 0.5} {'loss': 0.859, 'learning_rate': 1.7155848892902713e-05, 'epoch': 0.5} {'loss': 0.8002, 'learning_rate': 1.7155620225584176e-05, 'epoch': 0.5} {'loss': 0.8031, 'learning_rate': 1.7155391550597752e-05, 'epoch': 0.5} {'loss': 0.7862, 'learning_rate': 1.7155162867943674e-05, 'epoch': 0.5} {'loss': 0.8497, 'learning_rate': 1.71549341776222e-05, 'epoch': 0.5} {'loss': 0.7411, 'learning_rate': 1.7154705479633566e-05, 'epoch': 0.5} {'loss': 0.8713, 'learning_rate': 1.7154476773978017e-05, 'epoch': 0.5} {'loss': 0.8437, 'learning_rate': 1.71542480606558e-05, 'epoch': 0.5} {'loss': 0.9899, 'learning_rate': 1.715401933966716e-05, 'epoch': 0.5} {'loss': 0.8023, 'learning_rate': 1.7153790611012344e-05, 'epoch': 0.5} {'loss': 0.7266, 'learning_rate': 1.7153561874691596e-05, 'epoch': 0.5} {'loss': 0.9207, 'learning_rate': 1.7153333130705164e-05, 'epoch': 0.5} {'loss': 0.7434, 'learning_rate': 1.7153104379053286e-05, 'epoch': 0.5} {'loss': 0.9147, 'learning_rate': 1.715287561973621e-05, 'epoch': 0.5} {'loss': 0.8968, 'learning_rate': 1.7152646852754185e-05, 'epoch': 0.5} {'loss': 0.8335, 'learning_rate': 1.7152418078107454e-05, 'epoch': 0.5} {'loss': 0.8543, 'learning_rate': 1.715218929579626e-05, 'epoch': 0.5} {'loss': 0.7864, 'learning_rate': 1.7151960505820847e-05, 'epoch': 0.5} {'loss': 1.0068, 'learning_rate': 1.7151731708181467e-05, 'epoch': 0.5} {'loss': 0.8569, 'learning_rate': 1.715150290287836e-05, 'epoch': 0.5} {'loss': 0.816, 'learning_rate': 1.715127408991177e-05, 'epoch': 0.5} {'loss': 0.8546, 'learning_rate': 1.7151045269281947e-05, 'epoch': 0.5} {'loss': 0.8455, 'learning_rate': 1.7150816440989133e-05, 'epoch': 0.5} {'loss': 0.8512, 'learning_rate': 1.7150587605033573e-05, 'epoch': 0.5} {'loss': 0.6866, 'learning_rate': 1.7150358761415514e-05, 'epoch': 0.5} {'loss': 0.8788, 'learning_rate': 1.7150129910135197e-05, 'epoch': 0.5} {'loss': 0.9545, 'learning_rate': 1.7149901051192875e-05, 'epoch': 0.5} {'loss': 0.9273, 'learning_rate': 1.7149672184588784e-05, 'epoch': 0.5} {'loss': 0.9388, 'learning_rate': 1.7149443310323178e-05, 'epoch': 0.5} {'loss': 0.7447, 'learning_rate': 1.7149214428396298e-05, 'epoch': 0.5} {'loss': 0.9083, 'learning_rate': 1.7148985538808388e-05, 'epoch': 0.5} {'loss': 1.0049, 'learning_rate': 1.7148756641559695e-05, 'epoch': 0.5} {'loss': 1.012, 'learning_rate': 1.7148527736650464e-05, 'epoch': 0.5} {'loss': 0.8453, 'learning_rate': 1.714829882408094e-05, 'epoch': 0.5} {'loss': 0.9941, 'learning_rate': 1.714806990385137e-05, 'epoch': 0.5} {'loss': 1.058, 'learning_rate': 1.7147840975961995e-05, 'epoch': 0.5} {'loss': 0.8984, 'learning_rate': 1.7147612040413068e-05, 'epoch': 0.5} {'loss': 0.739, 'learning_rate': 1.7147383097204825e-05, 'epoch': 0.5} {'loss': 0.8828, 'learning_rate': 1.714715414633752e-05, 'epoch': 0.5} {'loss': 0.8427, 'learning_rate': 1.714692518781139e-05, 'epoch': 0.5} {'loss': 0.9088, 'learning_rate': 1.7146696221626688e-05, 'epoch': 0.5} {'loss': 0.9237, 'learning_rate': 1.7146467247783655e-05, 'epoch': 0.5} {'loss': 0.8457, 'learning_rate': 1.7146238266282536e-05, 'epoch': 0.5} {'loss': 0.7734, 'learning_rate': 1.7146009277123576e-05, 'epoch': 0.5} {'loss': 0.7845, 'learning_rate': 1.7145780280307027e-05, 'epoch': 0.5} {'loss': 0.906, 'learning_rate': 1.7145551275833128e-05, 'epoch': 0.5} {'loss': 0.7016, 'learning_rate': 1.7145322263702126e-05, 'epoch': 0.5} {'loss': 0.8698, 'learning_rate': 1.7145093243914264e-05, 'epoch': 0.5} {'loss': 0.9397, 'learning_rate': 1.714486421646979e-05, 'epoch': 0.5} {'loss': 0.8268, 'learning_rate': 1.7144635181368952e-05, 'epoch': 0.5} {'loss': 0.8313, 'learning_rate': 1.714440613861199e-05, 'epoch': 0.5} {'loss': 0.8828, 'learning_rate': 1.7144177088199154e-05, 'epoch': 0.5} {'loss': 0.8707, 'learning_rate': 1.7143948030130685e-05, 'epoch': 0.5} {'loss': 0.706, 'learning_rate': 1.7143718964406834e-05, 'epoch': 0.5} {'loss': 0.9092, 'learning_rate': 1.714348989102784e-05, 'epoch': 0.5} {'loss': 0.7825, 'learning_rate': 1.7143260809993954e-05, 'epoch': 0.5} {'loss': 0.8449, 'learning_rate': 1.7143031721305417e-05, 'epoch': 0.5} {'loss': 0.8579, 'learning_rate': 1.714280262496248e-05, 'epoch': 0.5} {'loss': 0.739, 'learning_rate': 1.7142573520965382e-05, 'epoch': 0.5} {'loss': 0.7855, 'learning_rate': 1.7142344409314374e-05, 'epoch': 0.5} {'loss': 0.6732, 'learning_rate': 1.71421152900097e-05, 'epoch': 0.5} {'loss': 0.9405, 'learning_rate': 1.7141886163051604e-05, 'epoch': 0.5} {'loss': 0.8311, 'learning_rate': 1.7141657028440332e-05, 'epoch': 0.5} {'loss': 1.118, 'learning_rate': 1.714142788617613e-05, 'epoch': 0.5} {'loss': 1.1126, 'learning_rate': 1.7141198736259245e-05, 'epoch': 0.5} {'loss': 0.7773, 'learning_rate': 1.714096957868992e-05, 'epoch': 0.5} {'loss': 0.7685, 'learning_rate': 1.71407404134684e-05, 'epoch': 0.5} {'loss': 0.8343, 'learning_rate': 1.714051124059493e-05, 'epoch': 0.5} {'loss': 0.8305, 'learning_rate': 1.7140282060069764e-05, 'epoch': 0.5} {'loss': 0.8977, 'learning_rate': 1.7140052871893138e-05, 'epoch': 0.5} {'loss': 0.8532, 'learning_rate': 1.71398236760653e-05, 'epoch': 0.5} {'loss': 1.0029, 'learning_rate': 1.71395944725865e-05, 'epoch': 0.5} {'loss': 0.8363, 'learning_rate': 1.713936526145698e-05, 'epoch': 0.5} {'loss': 0.925, 'learning_rate': 1.713913604267698e-05, 'epoch': 0.5} {'loss': 0.7869, 'learning_rate': 1.7138906816246755e-05, 'epoch': 0.5} {'loss': 0.9001, 'learning_rate': 1.713867758216655e-05, 'epoch': 0.5} {'loss': 0.8436, 'learning_rate': 1.7138448340436605e-05, 'epoch': 0.5} {'loss': 0.8744, 'learning_rate': 1.7138219091057163e-05, 'epoch': 0.5} {'loss': 0.8816, 'learning_rate': 1.7137989834028482e-05, 'epoch': 0.5} {'loss': 0.8952, 'learning_rate': 1.71377605693508e-05, 'epoch': 0.5} {'loss': 0.8347, 'learning_rate': 1.7137531297024363e-05, 'epoch': 0.5} {'loss': 0.7979, 'learning_rate': 1.7137302017049416e-05, 'epoch': 0.5} {'loss': 0.8638, 'learning_rate': 1.7137072729426206e-05, 'epoch': 0.5} {'loss': 0.6652, 'learning_rate': 1.7136843434154976e-05, 'epoch': 0.5} {'loss': 0.8424, 'learning_rate': 1.7136614131235978e-05, 'epoch': 0.5} {'loss': 0.8294, 'learning_rate': 1.713638482066945e-05, 'epoch': 0.5} {'loss': 0.7498, 'learning_rate': 1.7136155502455645e-05, 'epoch': 0.5} {'loss': 0.9654, 'learning_rate': 1.7135926176594803e-05, 'epoch': 0.5} {'loss': 0.9755, 'learning_rate': 1.7135696843087175e-05, 'epoch': 0.5} {'loss': 0.8383, 'learning_rate': 1.7135467501933e-05, 'epoch': 0.5} {'loss': 0.7778, 'learning_rate': 1.713523815313253e-05, 'epoch': 0.5} {'loss': 0.8315, 'learning_rate': 1.713500879668601e-05, 'epoch': 0.5} {'loss': 0.6439, 'learning_rate': 1.713477943259368e-05, 'epoch': 0.5} {'loss': 0.9321, 'learning_rate': 1.7134550060855794e-05, 'epoch': 0.5} {'loss': 0.8782, 'learning_rate': 1.7134320681472593e-05, 'epoch': 0.5} {'loss': 0.7639, 'learning_rate': 1.7134091294444317e-05, 'epoch': 0.5} {'loss': 0.8329, 'learning_rate': 1.7133861899771226e-05, 'epoch': 0.5} {'loss': 0.8047, 'learning_rate': 1.7133632497453555e-05, 'epoch': 0.5} {'loss': 0.7512, 'learning_rate': 1.7133403087491554e-05, 'epoch': 0.5} {'loss': 0.8836, 'learning_rate': 1.7133173669885463e-05, 'epoch': 0.5} {'loss': 0.6524, 'learning_rate': 1.713294424463554e-05, 'epoch': 0.5} {'loss': 1.0082, 'learning_rate': 1.713271481174202e-05, 'epoch': 0.5} {'loss': 0.9609, 'learning_rate': 1.713248537120515e-05, 'epoch': 0.5} {'loss': 0.966, 'learning_rate': 1.713225592302518e-05, 'epoch': 0.5} {'loss': 0.9223, 'learning_rate': 1.7132026467202356e-05, 'epoch': 0.5} {'loss': 1.0284, 'learning_rate': 1.7131797003736922e-05, 'epoch': 0.5} {'loss': 0.9946, 'learning_rate': 1.713156753262912e-05, 'epoch': 0.5} {'loss': 0.8994, 'learning_rate': 1.7131338053879204e-05, 'epoch': 0.5} {'loss': 0.9326, 'learning_rate': 1.7131108567487414e-05, 'epoch': 0.5} {'loss': 0.6723, 'learning_rate': 1.7130879073453997e-05, 'epoch': 0.5} {'loss': 0.9335, 'learning_rate': 1.71306495717792e-05, 'epoch': 0.5} {'loss': 0.7792, 'learning_rate': 1.7130420062463268e-05, 'epoch': 0.5} {'loss': 0.7634, 'learning_rate': 1.7130190545506447e-05, 'epoch': 0.5} {'loss': 0.8599, 'learning_rate': 1.712996102090898e-05, 'epoch': 0.5} {'loss': 0.7792, 'learning_rate': 1.7129731488671123e-05, 'epoch': 0.5} {'loss': 0.9005, 'learning_rate': 1.7129501948793112e-05, 'epoch': 0.5} {'loss': 0.8928, 'learning_rate': 1.7129272401275197e-05, 'epoch': 0.5} {'loss': 0.8568, 'learning_rate': 1.7129042846117623e-05, 'epoch': 0.5} {'loss': 1.0109, 'learning_rate': 1.7128813283320632e-05, 'epoch': 0.5} {'loss': 0.9913, 'learning_rate': 1.712858371288448e-05, 'epoch': 0.5} {'loss': 0.9796, 'learning_rate': 1.7128354134809404e-05, 'epoch': 0.5} {'loss': 0.7344, 'learning_rate': 1.7128124549095656e-05, 'epoch': 0.5} {'loss': 0.8386, 'learning_rate': 1.712789495574348e-05, 'epoch': 0.5} {'loss': 0.8937, 'learning_rate': 1.7127665354753115e-05, 'epoch': 0.5} {'loss': 1.0602, 'learning_rate': 1.712743574612482e-05, 'epoch': 0.5} {'loss': 0.6117, 'learning_rate': 1.712720612985883e-05, 'epoch': 0.5} {'loss': 1.0172, 'learning_rate': 1.7126976505955393e-05, 'epoch': 0.5} {'loss': 0.9608, 'learning_rate': 1.712674687441476e-05, 'epoch': 0.5} {'loss': 0.7714, 'learning_rate': 1.712651723523718e-05, 'epoch': 0.5} {'loss': 0.8407, 'learning_rate': 1.712628758842289e-05, 'epoch': 0.5} {'loss': 0.665, 'learning_rate': 1.712605793397214e-05, 'epoch': 0.5} {'loss': 0.8742, 'learning_rate': 1.7125828271885173e-05, 'epoch': 0.5} {'loss': 0.8739, 'learning_rate': 1.712559860216224e-05, 'epoch': 0.5} {'loss': 0.7589, 'learning_rate': 1.7125368924803582e-05, 'epoch': 0.5} {'loss': 0.8179, 'learning_rate': 1.712513923980945e-05, 'epoch': 0.5} {'loss': 0.977, 'learning_rate': 1.712490954718009e-05, 'epoch': 0.5} {'loss': 0.7702, 'learning_rate': 1.7124679846915743e-05, 'epoch': 0.5} {'loss': 0.7488, 'learning_rate': 1.712445013901666e-05, 'epoch': 0.5} {'loss': 0.6979, 'learning_rate': 1.7124220423483086e-05, 'epoch': 0.5} {'loss': 0.8064, 'learning_rate': 1.712399070031527e-05, 'epoch': 0.5} {'loss': 0.7031, 'learning_rate': 1.712376096951345e-05, 'epoch': 0.5} {'loss': 0.7279, 'learning_rate': 1.712353123107788e-05, 'epoch': 0.5} {'loss': 0.703, 'learning_rate': 1.7123301485008804e-05, 'epoch': 0.5} {'loss': 0.8354, 'learning_rate': 1.7123071731306464e-05, 'epoch': 0.5} {'loss': 0.9239, 'learning_rate': 1.712284196997111e-05, 'epoch': 0.5} {'loss': 1.1063, 'learning_rate': 1.712261220100299e-05, 'epoch': 0.5} {'loss': 0.8805, 'learning_rate': 1.712238242440235e-05, 'epoch': 0.5} {'loss': 1.0251, 'learning_rate': 1.712215264016943e-05, 'epoch': 0.5} {'loss': 0.6694, 'learning_rate': 1.7121922848304482e-05, 'epoch': 0.5} {'loss': 0.7822, 'learning_rate': 1.7121693048807753e-05, 'epoch': 0.5} {'loss': 0.7952, 'learning_rate': 1.7121463241679487e-05, 'epoch': 0.5} {'loss': 0.7427, 'learning_rate': 1.7121233426919928e-05, 'epoch': 0.5} {'loss': 0.826, 'learning_rate': 1.7121003604529324e-05, 'epoch': 0.5} {'loss': 0.9313, 'learning_rate': 1.7120773774507926e-05, 'epoch': 0.5} {'loss': 0.909, 'learning_rate': 1.7120543936855974e-05, 'epoch': 0.5} {'loss': 0.7781, 'learning_rate': 1.712031409157372e-05, 'epoch': 0.5} {'loss': 0.8599, 'learning_rate': 1.71200842386614e-05, 'epoch': 0.5} {'loss': 1.0813, 'learning_rate': 1.711985437811927e-05, 'epoch': 0.5} {'loss': 0.8105, 'learning_rate': 1.7119624509947573e-05, 'epoch': 0.5} {'loss': 0.7859, 'learning_rate': 1.711939463414656e-05, 'epoch': 0.5} {'loss': 0.785, 'learning_rate': 1.7119164750716467e-05, 'epoch': 0.5} {'loss': 0.9319, 'learning_rate': 1.711893485965755e-05, 'epoch': 0.5} {'loss': 0.8461, 'learning_rate': 1.711870496097005e-05, 'epoch': 0.5} {'loss': 0.9347, 'learning_rate': 1.711847505465422e-05, 'epoch': 0.5} {'loss': 0.7332, 'learning_rate': 1.7118245140710294e-05, 'epoch': 0.5} {'loss': 0.9246, 'learning_rate': 1.711801521913853e-05, 'epoch': 0.5} {'loss': 0.8511, 'learning_rate': 1.7117785289939167e-05, 'epoch': 0.5} {'loss': 0.8881, 'learning_rate': 1.7117555353112458e-05, 'epoch': 0.5} {'loss': 0.867, 'learning_rate': 1.7117325408658646e-05, 'epoch': 0.5} {'loss': 0.8267, 'learning_rate': 1.7117095456577978e-05, 'epoch': 0.5} {'loss': 0.7417, 'learning_rate': 1.71168654968707e-05, 'epoch': 0.5} {'loss': 0.9474, 'learning_rate': 1.7116635529537054e-05, 'epoch': 0.5} {'loss': 0.7965, 'learning_rate': 1.7116405554577293e-05, 'epoch': 0.5} {'loss': 0.8964, 'learning_rate': 1.7116175571991665e-05, 'epoch': 0.5} {'loss': 0.9415, 'learning_rate': 1.7115945581780405e-05, 'epoch': 0.5} {'loss': 0.9249, 'learning_rate': 1.7115715583943772e-05, 'epoch': 0.5} {'loss': 0.931, 'learning_rate': 1.7115485578482006e-05, 'epoch': 0.5} {'loss': 0.8428, 'learning_rate': 1.711525556539536e-05, 'epoch': 0.5} {'loss': 0.9775, 'learning_rate': 1.711502554468407e-05, 'epoch': 0.5} {'loss': 0.6962, 'learning_rate': 1.7114795516348392e-05, 'epoch': 0.5} {'loss': 0.8467, 'learning_rate': 1.7114565480388564e-05, 'epoch': 0.5} {'loss': 1.0841, 'learning_rate': 1.7114335436804837e-05, 'epoch': 0.5} {'loss': 0.8744, 'learning_rate': 1.711410538559746e-05, 'epoch': 0.5} {'loss': 0.8225, 'learning_rate': 1.7113875326766677e-05, 'epoch': 0.5} {'loss': 0.6335, 'learning_rate': 1.7113645260312735e-05, 'epoch': 0.5} {'loss': 0.9682, 'learning_rate': 1.711341518623588e-05, 'epoch': 0.5} {'loss': 0.9279, 'learning_rate': 1.7113185104536354e-05, 'epoch': 0.5} {'loss': 0.8679, 'learning_rate': 1.7112955015214413e-05, 'epoch': 0.5} {'loss': 0.9809, 'learning_rate': 1.7112724918270297e-05, 'epoch': 0.5} {'loss': 0.928, 'learning_rate': 1.7112494813704253e-05, 'epoch': 0.5} {'loss': 0.9013, 'learning_rate': 1.7112264701516533e-05, 'epoch': 0.5} {'loss': 0.7277, 'learning_rate': 1.711203458170738e-05, 'epoch': 0.5} {'loss': 0.8879, 'learning_rate': 1.7111804454277033e-05, 'epoch': 0.5} {'loss': 0.9444, 'learning_rate': 1.7111574319225748e-05, 'epoch': 0.5} {'loss': 1.0945, 'learning_rate': 1.7111344176553772e-05, 'epoch': 0.5} {'loss': 0.9916, 'learning_rate': 1.711111402626135e-05, 'epoch': 0.5} {'loss': 0.8461, 'learning_rate': 1.7110883868348724e-05, 'epoch': 0.5} {'loss': 0.9321, 'learning_rate': 1.7110653702816145e-05, 'epoch': 0.5} {'loss': 0.8855, 'learning_rate': 1.711042352966386e-05, 'epoch': 0.5} {'loss': 0.8438, 'learning_rate': 1.7110193348892114e-05, 'epoch': 0.5} {'loss': 0.9169, 'learning_rate': 1.7109963160501152e-05, 'epoch': 0.5} {'loss': 0.864, 'learning_rate': 1.7109732964491224e-05, 'epoch': 0.5} {'loss': 0.76, 'learning_rate': 1.7109502760862576e-05, 'epoch': 0.5} {'loss': 0.7179, 'learning_rate': 1.7109272549615453e-05, 'epoch': 0.5} {'loss': 0.8305, 'learning_rate': 1.7109042330750106e-05, 'epoch': 0.5} {'loss': 0.8471, 'learning_rate': 1.7108812104266775e-05, 'epoch': 0.5} {'loss': 0.7614, 'learning_rate': 1.7108581870165714e-05, 'epoch': 0.5} {'loss': 0.6921, 'learning_rate': 1.710835162844716e-05, 'epoch': 0.5} {'loss': 0.9257, 'learning_rate': 1.710812137911137e-05, 'epoch': 0.5} {'loss': 0.8063, 'learning_rate': 1.7107891122158585e-05, 'epoch': 0.5} {'loss': 0.6702, 'learning_rate': 1.7107660857589054e-05, 'epoch': 0.5} {'loss': 0.8983, 'learning_rate': 1.7107430585403024e-05, 'epoch': 0.5} {'loss': 0.7641, 'learning_rate': 1.710720030560074e-05, 'epoch': 0.5} {'loss': 0.8526, 'learning_rate': 1.710697001818245e-05, 'epoch': 0.5} {'loss': 0.8566, 'learning_rate': 1.7106739723148395e-05, 'epoch': 0.5} {'loss': 1.0449, 'learning_rate': 1.710650942049883e-05, 'epoch': 0.5} {'loss': 0.8192, 'learning_rate': 1.7106279110234e-05, 'epoch': 0.5} {'loss': 0.8195, 'learning_rate': 1.710604879235415e-05, 'epoch': 0.5} {'loss': 0.8503, 'learning_rate': 1.710581846685953e-05, 'epoch': 0.5} {'loss': 1.0075, 'learning_rate': 1.710558813375038e-05, 'epoch': 0.5} {'loss': 0.794, 'learning_rate': 1.7105357793026953e-05, 'epoch': 0.5} {'loss': 0.7814, 'learning_rate': 1.7105127444689492e-05, 'epoch': 0.5} {'loss': 0.8481, 'learning_rate': 1.710489708873825e-05, 'epoch': 0.5} {'loss': 0.9024, 'learning_rate': 1.7104666725173467e-05, 'epoch': 0.5} {'loss': 0.9503, 'learning_rate': 1.710443635399539e-05, 'epoch': 0.5} {'loss': 0.9502, 'learning_rate': 1.710420597520427e-05, 'epoch': 0.5} {'loss': 0.8716, 'learning_rate': 1.7103975588800353e-05, 'epoch': 0.5} {'loss': 0.884, 'learning_rate': 1.7103745194783883e-05, 'epoch': 0.5} {'loss': 0.9774, 'learning_rate': 1.710351479315511e-05, 'epoch': 0.5} {'loss': 0.6497, 'learning_rate': 1.7103284383914284e-05, 'epoch': 0.5} {'loss': 0.9176, 'learning_rate': 1.710305396706164e-05, 'epoch': 0.5} {'loss': 0.961, 'learning_rate': 1.7102823542597435e-05, 'epoch': 0.5} {'loss': 0.8212, 'learning_rate': 1.7102593110521915e-05, 'epoch': 0.5} {'loss': 0.8689, 'learning_rate': 1.7102362670835326e-05, 'epoch': 0.5} {'loss': 1.1462, 'learning_rate': 1.710213222353791e-05, 'epoch': 0.5} {'loss': 0.8261, 'learning_rate': 1.7101901768629923e-05, 'epoch': 0.5} {'loss': 1.0287, 'learning_rate': 1.710167130611161e-05, 'epoch': 0.5} {'loss': 0.8554, 'learning_rate': 1.710144083598321e-05, 'epoch': 0.5} {'loss': 0.8704, 'learning_rate': 1.7101210358244974e-05, 'epoch': 0.5} {'loss': 0.9092, 'learning_rate': 1.7100979872897156e-05, 'epoch': 0.5} {'loss': 0.8521, 'learning_rate': 1.710074937993999e-05, 'epoch': 0.5} {'loss': 0.8653, 'learning_rate': 1.7100518879373735e-05, 'epoch': 0.5} {'loss': 0.8972, 'learning_rate': 1.7100288371198633e-05, 'epoch': 0.5} {'loss': 0.8762, 'learning_rate': 1.710005785541493e-05, 'epoch': 0.5} {'loss': 0.8427, 'learning_rate': 1.7099827332022877e-05, 'epoch': 0.5} {'loss': 0.8538, 'learning_rate': 1.7099596801022714e-05, 'epoch': 0.5} {'loss': 0.987, 'learning_rate': 1.7099366262414695e-05, 'epoch': 0.5} {'loss': 0.9216, 'learning_rate': 1.7099135716199062e-05, 'epoch': 0.5} {'loss': 0.9623, 'learning_rate': 1.7098905162376067e-05, 'epoch': 0.5} {'loss': 1.0056, 'learning_rate': 1.709867460094595e-05, 'epoch': 0.5} {'loss': 0.7743, 'learning_rate': 1.7098444031908967e-05, 'epoch': 0.5} {'loss': 0.8728, 'learning_rate': 1.709821345526536e-05, 'epoch': 0.5} {'loss': 0.919, 'learning_rate': 1.7097982871015376e-05, 'epoch': 0.5} {'loss': 0.8342, 'learning_rate': 1.7097752279159264e-05, 'epoch': 0.5} {'loss': 0.9192, 'learning_rate': 1.7097521679697266e-05, 'epoch': 0.5} {'loss': 0.9371, 'learning_rate': 1.7097291072629635e-05, 'epoch': 0.5} {'loss': 0.8582, 'learning_rate': 1.7097060457956616e-05, 'epoch': 0.5} {'loss': 0.9378, 'learning_rate': 1.709682983567846e-05, 'epoch': 0.5} {'loss': 0.9117, 'learning_rate': 1.7096599205795405e-05, 'epoch': 0.5} {'loss': 0.7235, 'learning_rate': 1.7096368568307703e-05, 'epoch': 0.5} {'loss': 0.7763, 'learning_rate': 1.7096137923215604e-05, 'epoch': 0.5} {'loss': 0.9796, 'learning_rate': 1.709590727051935e-05, 'epoch': 0.5} {'loss': 0.9618, 'learning_rate': 1.7095676610219195e-05, 'epoch': 0.5} {'loss': 0.9041, 'learning_rate': 1.709544594231538e-05, 'epoch': 0.5} {'loss': 0.9376, 'learning_rate': 1.7095215266808154e-05, 'epoch': 0.5} {'loss': 0.8482, 'learning_rate': 1.7094984583697767e-05, 'epoch': 0.5} {'loss': 1.0044, 'learning_rate': 1.709475389298446e-05, 'epoch': 0.5} {'loss': 0.9193, 'learning_rate': 1.709452319466849e-05, 'epoch': 0.5} {'loss': 0.8256, 'learning_rate': 1.709429248875009e-05, 'epoch': 0.5} {'loss': 1.0501, 'learning_rate': 1.709406177522952e-05, 'epoch': 0.5} {'loss': 0.8574, 'learning_rate': 1.7093831054107018e-05, 'epoch': 0.5} {'loss': 0.8456, 'learning_rate': 1.7093600325382843e-05, 'epoch': 0.5} {'loss': 0.7813, 'learning_rate': 1.709336958905723e-05, 'epoch': 0.5} {'loss': 0.8164, 'learning_rate': 1.709313884513043e-05, 'epoch': 0.5} {'loss': 0.8418, 'learning_rate': 1.70929080936027e-05, 'epoch': 0.5} {'loss': 0.8207, 'learning_rate': 1.709267733447427e-05, 'epoch': 0.5} {'loss': 0.9096, 'learning_rate': 1.70924465677454e-05, 'epoch': 0.5} {'loss': 0.8817, 'learning_rate': 1.7092215793416334e-05, 'epoch': 0.5} {'loss': 0.8358, 'learning_rate': 1.7091985011487316e-05, 'epoch': 0.5} {'loss': 0.9141, 'learning_rate': 1.7091754221958596e-05, 'epoch': 0.5} {'loss': 0.7293, 'learning_rate': 1.7091523424830422e-05, 'epoch': 0.5} {'loss': 0.8963, 'learning_rate': 1.709129262010304e-05, 'epoch': 0.5} {'loss': 0.9998, 'learning_rate': 1.70910618077767e-05, 'epoch': 0.5} {'loss': 0.661, 'learning_rate': 1.7090830987851647e-05, 'epoch': 0.5} {'loss': 0.686, 'learning_rate': 1.709060016032813e-05, 'epoch': 0.5} {'loss': 0.7534, 'learning_rate': 1.7090369325206388e-05, 'epoch': 0.5} {'loss': 0.6769, 'learning_rate': 1.7090138482486682e-05, 'epoch': 0.5} {'loss': 0.7987, 'learning_rate': 1.708990763216925e-05, 'epoch': 0.5} {'loss': 0.9034, 'learning_rate': 1.7089676774254346e-05, 'epoch': 0.5} {'loss': 0.9872, 'learning_rate': 1.7089445908742207e-05, 'epoch': 0.5} {'loss': 0.9016, 'learning_rate': 1.708921503563309e-05, 'epoch': 0.5} {'loss': 0.8861, 'learning_rate': 1.708898415492724e-05, 'epoch': 0.5} {'loss': 0.9469, 'learning_rate': 1.7088753266624904e-05, 'epoch': 0.5} {'loss': 0.8253, 'learning_rate': 1.7088522370726325e-05, 'epoch': 0.5} {'loss': 0.7526, 'learning_rate': 1.7088291467231762e-05, 'epoch': 0.5} {'loss': 0.8853, 'learning_rate': 1.7088060556141447e-05, 'epoch': 0.5} {'loss': 0.936, 'learning_rate': 1.708782963745564e-05, 'epoch': 0.5} {'loss': 0.9156, 'learning_rate': 1.7087598711174582e-05, 'epoch': 0.5} {'loss': 0.8769, 'learning_rate': 1.7087367777298525e-05, 'epoch': 0.5} {'loss': 0.8588, 'learning_rate': 1.708713683582771e-05, 'epoch': 0.5} {'loss': 0.8469, 'learning_rate': 1.708690588676239e-05, 'epoch': 0.5} {'loss': 0.8591, 'learning_rate': 1.7086674930102813e-05, 'epoch': 0.5} {'loss': 1.033, 'learning_rate': 1.708644396584922e-05, 'epoch': 0.5} {'loss': 0.9526, 'learning_rate': 1.7086212994001866e-05, 'epoch': 0.5} {'loss': 0.8634, 'learning_rate': 1.708598201456099e-05, 'epoch': 0.5} {'loss': 0.9099, 'learning_rate': 1.708575102752685e-05, 'epoch': 0.5} {'loss': 0.8353, 'learning_rate': 1.7085520032899687e-05, 'epoch': 0.5} {'loss': 1.0148, 'learning_rate': 1.708528903067975e-05, 'epoch': 0.5} {'loss': 0.9351, 'learning_rate': 1.7085058020867285e-05, 'epoch': 0.5} {'loss': 0.9191, 'learning_rate': 1.7084827003462542e-05, 'epoch': 0.5} {'loss': 0.8971, 'learning_rate': 1.7084595978465768e-05, 'epoch': 0.5} {'loss': 1.0205, 'learning_rate': 1.708436494587721e-05, 'epoch': 0.5} {'loss': 0.9326, 'learning_rate': 1.7084133905697112e-05, 'epoch': 0.5} {'loss': 0.8392, 'learning_rate': 1.708390285792573e-05, 'epoch': 0.5} {'loss': 0.777, 'learning_rate': 1.7083671802563305e-05, 'epoch': 0.5} {'loss': 0.9191, 'learning_rate': 1.7083440739610083e-05, 'epoch': 0.5} {'loss': 0.8961, 'learning_rate': 1.7083209669066318e-05, 'epoch': 0.5} {'loss': 0.7655, 'learning_rate': 1.7082978590932257e-05, 'epoch': 0.5} {'loss': 0.8544, 'learning_rate': 1.708274750520814e-05, 'epoch': 0.5} {'loss': 0.8066, 'learning_rate': 1.7082516411894224e-05, 'epoch': 0.5} {'loss': 0.9607, 'learning_rate': 1.7082285310990752e-05, 'epoch': 0.5} {'loss': 0.6945, 'learning_rate': 1.708205420249797e-05, 'epoch': 0.5} {'loss': 0.8578, 'learning_rate': 1.7081823086416127e-05, 'epoch': 0.5} {'loss': 0.8652, 'learning_rate': 1.7081591962745472e-05, 'epoch': 0.5} {'loss': 0.8942, 'learning_rate': 1.7081360831486253e-05, 'epoch': 0.5} {'loss': 0.7764, 'learning_rate': 1.7081129692638717e-05, 'epoch': 0.5} {'loss': 0.9041, 'learning_rate': 1.7080898546203113e-05, 'epoch': 0.5} {'loss': 0.8768, 'learning_rate': 1.7080667392179684e-05, 'epoch': 0.5} {'loss': 0.7188, 'learning_rate': 1.708043623056868e-05, 'epoch': 0.5} {'loss': 0.8007, 'learning_rate': 1.7080205061370352e-05, 'epoch': 0.5} {'loss': 0.9378, 'learning_rate': 1.7079973884584945e-05, 'epoch': 0.5} {'loss': 0.8176, 'learning_rate': 1.7079742700212708e-05, 'epoch': 0.5} {'loss': 0.8301, 'learning_rate': 1.707951150825389e-05, 'epoch': 0.5} {'loss': 0.8771, 'learning_rate': 1.707928030870873e-05, 'epoch': 0.5} {'loss': 0.8505, 'learning_rate': 1.7079049101577486e-05, 'epoch': 0.5} {'loss': 0.9032, 'learning_rate': 1.70788178868604e-05, 'epoch': 0.5} {'loss': 0.8537, 'learning_rate': 1.7078586664557725e-05, 'epoch': 0.5} {'loss': 0.7945, 'learning_rate': 1.70783554346697e-05, 'epoch': 0.5} {'loss': 0.8316, 'learning_rate': 1.7078124197196582e-05, 'epoch': 0.5} {'loss': 0.943, 'learning_rate': 1.7077892952138616e-05, 'epoch': 0.5} {'loss': 0.7466, 'learning_rate': 1.7077661699496048e-05, 'epoch': 0.5} {'loss': 0.9204, 'learning_rate': 1.7077430439269124e-05, 'epoch': 0.5} {'loss': 0.9001, 'learning_rate': 1.7077199171458097e-05, 'epoch': 0.5} {'loss': 0.9191, 'learning_rate': 1.707696789606321e-05, 'epoch': 0.5} {'loss': 0.9054, 'learning_rate': 1.7076736613084718e-05, 'epoch': 0.5} {'loss': 0.7418, 'learning_rate': 1.707650532252286e-05, 'epoch': 0.5} {'loss': 0.8218, 'learning_rate': 1.707627402437789e-05, 'epoch': 0.5} {'loss': 0.9638, 'learning_rate': 1.7076042718650053e-05, 'epoch': 0.5} {'loss': 0.8727, 'learning_rate': 1.7075811405339597e-05, 'epoch': 0.5} {'loss': 0.7886, 'learning_rate': 1.707558008444677e-05, 'epoch': 0.5} {'loss': 0.9253, 'learning_rate': 1.7075348755971824e-05, 'epoch': 0.5} {'loss': 1.0094, 'learning_rate': 1.7075117419915e-05, 'epoch': 0.5} {'loss': 0.979, 'learning_rate': 1.707488607627655e-05, 'epoch': 0.5} {'loss': 0.8363, 'learning_rate': 1.7074654725056722e-05, 'epoch': 0.5} {'loss': 0.9743, 'learning_rate': 1.707442336625576e-05, 'epoch': 0.5} {'loss': 1.0314, 'learning_rate': 1.7074191999873915e-05, 'epoch': 0.5} {'loss': 0.8462, 'learning_rate': 1.7073960625911436e-05, 'epoch': 0.5} {'loss': 0.8202, 'learning_rate': 1.707372924436857e-05, 'epoch': 0.5} {'loss': 0.8153, 'learning_rate': 1.7073497855245565e-05, 'epoch': 0.5} {'loss': 0.9262, 'learning_rate': 1.7073266458542667e-05, 'epoch': 0.5} {'loss': 1.0212, 'learning_rate': 1.7073035054260127e-05, 'epoch': 0.5} {'loss': 0.8182, 'learning_rate': 1.707280364239819e-05, 'epoch': 0.5} {'loss': 0.8369, 'learning_rate': 1.707257222295711e-05, 'epoch': 0.5} {'loss': 0.8579, 'learning_rate': 1.7072340795937127e-05, 'epoch': 0.5} {'loss': 0.9963, 'learning_rate': 1.7072109361338492e-05, 'epoch': 0.5} {'loss': 0.7829, 'learning_rate': 1.7071877919161454e-05, 'epoch': 0.5} {'loss': 0.9547, 'learning_rate': 1.7071646469406262e-05, 'epoch': 0.5} {'loss': 0.707, 'learning_rate': 1.7071415012073162e-05, 'epoch': 0.5} {'loss': 0.8716, 'learning_rate': 1.7071183547162403e-05, 'epoch': 0.5} {'loss': 0.9233, 'learning_rate': 1.7070952074674233e-05, 'epoch': 0.5} {'loss': 0.8284, 'learning_rate': 1.7070720594608896e-05, 'epoch': 0.5} {'loss': 0.7204, 'learning_rate': 1.7070489106966646e-05, 'epoch': 0.5} {'loss': 0.7965, 'learning_rate': 1.707025761174773e-05, 'epoch': 0.5} {'loss': 0.7899, 'learning_rate': 1.707002610895239e-05, 'epoch': 0.5} {'loss': 0.8741, 'learning_rate': 1.7069794598580885e-05, 'epoch': 0.5} {'loss': 0.803, 'learning_rate': 1.7069563080633456e-05, 'epoch': 0.5} {'loss': 0.8447, 'learning_rate': 1.7069331555110348e-05, 'epoch': 0.5} {'loss': 0.8262, 'learning_rate': 1.7069100022011817e-05, 'epoch': 0.5} {'loss': 0.6994, 'learning_rate': 1.7068868481338108e-05, 'epoch': 0.5} {'loss': 1.0016, 'learning_rate': 1.7068636933089465e-05, 'epoch': 0.5} {'loss': 0.9052, 'learning_rate': 1.7068405377266138e-05, 'epoch': 0.5} {'loss': 0.9201, 'learning_rate': 1.706817381386838e-05, 'epoch': 0.5} {'loss': 0.8065, 'learning_rate': 1.706794224289644e-05, 'epoch': 0.5} {'loss': 0.7691, 'learning_rate': 1.7067710664350556e-05, 'epoch': 0.5} {'loss': 0.6991, 'learning_rate': 1.7067479078230982e-05, 'epoch': 0.5} {'loss': 0.9198, 'learning_rate': 1.706724748453797e-05, 'epoch': 0.51} {'loss': 0.9658, 'learning_rate': 1.7067015883271763e-05, 'epoch': 0.51} {'loss': 0.8631, 'learning_rate': 1.7066784274432607e-05, 'epoch': 0.51} {'loss': 0.8561, 'learning_rate': 1.706655265802076e-05, 'epoch': 0.51} {'loss': 0.8966, 'learning_rate': 1.706632103403646e-05, 'epoch': 0.51} {'loss': 0.9833, 'learning_rate': 1.7066089402479962e-05, 'epoch': 0.51} {'loss': 0.7835, 'learning_rate': 1.7065857763351507e-05, 'epoch': 0.51} {'loss': 0.744, 'learning_rate': 1.706562611665135e-05, 'epoch': 0.51} {'loss': 0.9055, 'learning_rate': 1.7065394462379736e-05, 'epoch': 0.51} {'loss': 0.8462, 'learning_rate': 1.706516280053692e-05, 'epoch': 0.51} {'loss': 0.8285, 'learning_rate': 1.7064931131123138e-05, 'epoch': 0.51} {'loss': 0.877, 'learning_rate': 1.7064699454138646e-05, 'epoch': 0.51} {'loss': 0.8026, 'learning_rate': 1.706446776958369e-05, 'epoch': 0.51} {'loss': 0.8867, 'learning_rate': 1.706423607745852e-05, 'epoch': 0.51} {'loss': 0.8206, 'learning_rate': 1.7064004377763385e-05, 'epoch': 0.51} {'loss': 0.8102, 'learning_rate': 1.7063772670498532e-05, 'epoch': 0.51} {'loss': 0.9225, 'learning_rate': 1.7063540955664207e-05, 'epoch': 0.51} {'loss': 0.8298, 'learning_rate': 1.7063309233260664e-05, 'epoch': 0.51} {'loss': 0.9452, 'learning_rate': 1.7063077503288142e-05, 'epoch': 0.51} {'loss': 0.9809, 'learning_rate': 1.7062845765746897e-05, 'epoch': 0.51} {'loss': 0.8222, 'learning_rate': 1.7062614020637175e-05, 'epoch': 0.51} {'loss': 0.8245, 'learning_rate': 1.7062382267959227e-05, 'epoch': 0.51} {'loss': 0.6833, 'learning_rate': 1.7062150507713297e-05, 'epoch': 0.51} {'loss': 0.8361, 'learning_rate': 1.7061918739899637e-05, 'epoch': 0.51} {'loss': 0.8916, 'learning_rate': 1.7061686964518492e-05, 'epoch': 0.51} {'loss': 0.8161, 'learning_rate': 1.7061455181570114e-05, 'epoch': 0.51} {'loss': 0.8774, 'learning_rate': 1.7061223391054747e-05, 'epoch': 0.51} {'loss': 0.8668, 'learning_rate': 1.7060991592972645e-05, 'epoch': 0.51} {'loss': 0.6856, 'learning_rate': 1.7060759787324052e-05, 'epoch': 0.51} {'loss': 0.7869, 'learning_rate': 1.7060527974109215e-05, 'epoch': 0.51} {'loss': 0.7153, 'learning_rate': 1.7060296153328385e-05, 'epoch': 0.51} {'loss': 0.8525, 'learning_rate': 1.7060064324981813e-05, 'epoch': 0.51} {'loss': 0.9785, 'learning_rate': 1.7059832489069746e-05, 'epoch': 0.51} {'loss': 0.8519, 'learning_rate': 1.7059600645592427e-05, 'epoch': 0.51} {'loss': 0.9399, 'learning_rate': 1.7059368794550112e-05, 'epoch': 0.51} {'loss': 0.9057, 'learning_rate': 1.7059136935943047e-05, 'epoch': 0.51} {'loss': 0.6897, 'learning_rate': 1.7058905069771477e-05, 'epoch': 0.51} {'loss': 0.9706, 'learning_rate': 1.7058673196035655e-05, 'epoch': 0.51} {'loss': 0.8139, 'learning_rate': 1.7058441314735825e-05, 'epoch': 0.51} {'loss': 0.7563, 'learning_rate': 1.7058209425872242e-05, 'epoch': 0.51} {'loss': 0.8261, 'learning_rate': 1.7057977529445146e-05, 'epoch': 0.51} {'loss': 0.8499, 'learning_rate': 1.705774562545479e-05, 'epoch': 0.51} {'loss': 0.8419, 'learning_rate': 1.7057513713901428e-05, 'epoch': 0.51} {'loss': 0.8284, 'learning_rate': 1.70572817947853e-05, 'epoch': 0.51} {'loss': 0.8692, 'learning_rate': 1.7057049868106656e-05, 'epoch': 0.51} {'loss': 0.8065, 'learning_rate': 1.705681793386575e-05, 'epoch': 0.51} {'loss': 0.8057, 'learning_rate': 1.705658599206282e-05, 'epoch': 0.51} {'loss': 0.9726, 'learning_rate': 1.705635404269813e-05, 'epoch': 0.51} {'loss': 0.9226, 'learning_rate': 1.7056122085771916e-05, 'epoch': 0.51} {'loss': 0.929, 'learning_rate': 1.7055890121284428e-05, 'epoch': 0.51} {'loss': 0.997, 'learning_rate': 1.7055658149235918e-05, 'epoch': 0.51} {'loss': 0.9147, 'learning_rate': 1.7055426169626636e-05, 'epoch': 0.51} {'loss': 0.7175, 'learning_rate': 1.7055194182456825e-05, 'epoch': 0.51} {'loss': 0.785, 'learning_rate': 1.7054962187726738e-05, 'epoch': 0.51} {'loss': 0.947, 'learning_rate': 1.7054730185436624e-05, 'epoch': 0.51} {'loss': 0.8782, 'learning_rate': 1.7054498175586727e-05, 'epoch': 0.51} {'loss': 0.9011, 'learning_rate': 1.7054266158177298e-05, 'epoch': 0.51} {'loss': 0.7462, 'learning_rate': 1.7054034133208585e-05, 'epoch': 0.51} {'loss': 0.8907, 'learning_rate': 1.705380210068084e-05, 'epoch': 0.51} {'loss': 0.9437, 'learning_rate': 1.7053570060594315e-05, 'epoch': 0.51} {'loss': 0.8799, 'learning_rate': 1.705333801294925e-05, 'epoch': 0.51} {'loss': 0.7525, 'learning_rate': 1.705310595774589e-05, 'epoch': 0.51} {'loss': 0.88, 'learning_rate': 1.7052873894984496e-05, 'epoch': 0.51} {'loss': 0.8087, 'learning_rate': 1.705264182466531e-05, 'epoch': 0.51} {'loss': 0.869, 'learning_rate': 1.705240974678858e-05, 'epoch': 0.51} {'loss': 0.7814, 'learning_rate': 1.705217766135456e-05, 'epoch': 0.51} {'loss': 0.8061, 'learning_rate': 1.7051945568363493e-05, 'epoch': 0.51} {'loss': 0.8845, 'learning_rate': 1.705171346781563e-05, 'epoch': 0.51} {'loss': 0.7946, 'learning_rate': 1.705148135971122e-05, 'epoch': 0.51} {'loss': 0.9915, 'learning_rate': 1.705124924405051e-05, 'epoch': 0.51} {'loss': 0.9387, 'learning_rate': 1.705101712083375e-05, 'epoch': 0.51} {'loss': 0.8057, 'learning_rate': 1.705078499006119e-05, 'epoch': 0.51} {'loss': 0.9369, 'learning_rate': 1.705055285173308e-05, 'epoch': 0.51} {'loss': 0.8141, 'learning_rate': 1.705032070584966e-05, 'epoch': 0.51} {'loss': 0.7591, 'learning_rate': 1.705008855241119e-05, 'epoch': 0.51} {'loss': 0.9426, 'learning_rate': 1.7049856391417913e-05, 'epoch': 0.51} {'loss': 0.7353, 'learning_rate': 1.704962422287008e-05, 'epoch': 0.51} {'loss': 1.0141, 'learning_rate': 1.7049392046767933e-05, 'epoch': 0.51} {'loss': 0.9197, 'learning_rate': 1.704915986311173e-05, 'epoch': 0.51} {'loss': 0.8708, 'learning_rate': 1.7048927671901715e-05, 'epoch': 0.51} {'loss': 0.8606, 'learning_rate': 1.7048695473138138e-05, 'epoch': 0.51} {'loss': 0.8493, 'learning_rate': 1.704846326682125e-05, 'epoch': 0.51} {'loss': 0.8843, 'learning_rate': 1.7048231052951294e-05, 'epoch': 0.51} {'loss': 0.8617, 'learning_rate': 1.7047998831528522e-05, 'epoch': 0.51} {'loss': 0.7541, 'learning_rate': 1.7047766602553187e-05, 'epoch': 0.51} {'loss': 0.8657, 'learning_rate': 1.704753436602553e-05, 'epoch': 0.51} {'loss': 0.7006, 'learning_rate': 1.704730212194581e-05, 'epoch': 0.51} {'loss': 0.8569, 'learning_rate': 1.7047069870314264e-05, 'epoch': 0.51} {'loss': 0.8184, 'learning_rate': 1.7046837611131146e-05, 'epoch': 0.51} {'loss': 0.7819, 'learning_rate': 1.7046605344396706e-05, 'epoch': 0.51} {'loss': 0.7407, 'learning_rate': 1.7046373070111197e-05, 'epoch': 0.51} {'loss': 0.9675, 'learning_rate': 1.704614078827486e-05, 'epoch': 0.51} {'loss': 0.6961, 'learning_rate': 1.7045908498887946e-05, 'epoch': 0.51} {'loss': 0.8565, 'learning_rate': 1.7045676201950706e-05, 'epoch': 0.51} {'loss': 0.8452, 'learning_rate': 1.7045443897463387e-05, 'epoch': 0.51} {'loss': 0.873, 'learning_rate': 1.7045211585426243e-05, 'epoch': 0.51} {'loss': 0.8032, 'learning_rate': 1.7044979265839515e-05, 'epoch': 0.51} {'loss': 0.8389, 'learning_rate': 1.704474693870346e-05, 'epoch': 0.51} {'loss': 0.8732, 'learning_rate': 1.7044514604018315e-05, 'epoch': 0.51} {'loss': 0.9048, 'learning_rate': 1.7044282261784344e-05, 'epoch': 0.51} {'loss': 0.8274, 'learning_rate': 1.704404991200179e-05, 'epoch': 0.51} {'loss': 1.0757, 'learning_rate': 1.7043817554670893e-05, 'epoch': 0.51} {'loss': 0.7422, 'learning_rate': 1.7043585189791914e-05, 'epoch': 0.51} {'loss': 0.9034, 'learning_rate': 1.70433528173651e-05, 'epoch': 0.51} {'loss': 0.9669, 'learning_rate': 1.7043120437390698e-05, 'epoch': 0.51} {'loss': 0.8273, 'learning_rate': 1.704288804986895e-05, 'epoch': 0.51} {'loss': 1.0297, 'learning_rate': 1.7042655654800116e-05, 'epoch': 0.51} {'loss': 0.878, 'learning_rate': 1.704242325218444e-05, 'epoch': 0.51} {'loss': 0.9515, 'learning_rate': 1.7042190842022175e-05, 'epoch': 0.51} {'loss': 0.8507, 'learning_rate': 1.7041958424313564e-05, 'epoch': 0.51} {'loss': 1.1253, 'learning_rate': 1.704172599905886e-05, 'epoch': 0.51} {'loss': 0.8471, 'learning_rate': 1.704149356625831e-05, 'epoch': 0.51} {'loss': 0.7964, 'learning_rate': 1.7041261125912165e-05, 'epoch': 0.51} {'loss': 0.779, 'learning_rate': 1.7041028678020674e-05, 'epoch': 0.51} {'loss': 0.8737, 'learning_rate': 1.7040796222584084e-05, 'epoch': 0.51} {'loss': 0.9433, 'learning_rate': 1.7040563759602643e-05, 'epoch': 0.51} {'loss': 0.9338, 'learning_rate': 1.704033128907661e-05, 'epoch': 0.51} {'loss': 0.9015, 'learning_rate': 1.704009881100622e-05, 'epoch': 0.51} {'loss': 0.8745, 'learning_rate': 1.703986632539173e-05, 'epoch': 0.51} {'loss': 1.0261, 'learning_rate': 1.703963383223339e-05, 'epoch': 0.51} {'loss': 0.8325, 'learning_rate': 1.7039401331531444e-05, 'epoch': 0.51} {'loss': 0.8597, 'learning_rate': 1.7039168823286145e-05, 'epoch': 0.51} {'loss': 0.7966, 'learning_rate': 1.7038936307497743e-05, 'epoch': 0.51} {'loss': 0.8069, 'learning_rate': 1.7038703784166482e-05, 'epoch': 0.51} {'loss': 0.9162, 'learning_rate': 1.703847125329262e-05, 'epoch': 0.51} {'loss': 0.8484, 'learning_rate': 1.7038238714876393e-05, 'epoch': 0.51} {'loss': 0.8316, 'learning_rate': 1.7038006168918063e-05, 'epoch': 0.51} {'loss': 1.0488, 'learning_rate': 1.7037773615417874e-05, 'epoch': 0.51} {'loss': 0.9692, 'learning_rate': 1.7037541054376076e-05, 'epoch': 0.51} {'loss': 0.9901, 'learning_rate': 1.703730848579292e-05, 'epoch': 0.51} {'loss': 0.817, 'learning_rate': 1.7037075909668647e-05, 'epoch': 0.51} {'loss': 0.693, 'learning_rate': 1.7036843326003513e-05, 'epoch': 0.51} {'loss': 0.9424, 'learning_rate': 1.703661073479777e-05, 'epoch': 0.51} {'loss': 0.8758, 'learning_rate': 1.703637813605166e-05, 'epoch': 0.51} {'loss': 0.8541, 'learning_rate': 1.7036145529765438e-05, 'epoch': 0.51} {'loss': 0.9285, 'learning_rate': 1.703591291593935e-05, 'epoch': 0.51} {'loss': 0.809, 'learning_rate': 1.7035680294573643e-05, 'epoch': 0.51} {'loss': 0.8964, 'learning_rate': 1.7035447665668575e-05, 'epoch': 0.51} {'loss': 0.8135, 'learning_rate': 1.703521502922439e-05, 'epoch': 0.51} {'loss': 0.7713, 'learning_rate': 1.703498238524133e-05, 'epoch': 0.51} {'loss': 0.8549, 'learning_rate': 1.7034749733719657e-05, 'epoch': 0.51} {'loss': 0.7975, 'learning_rate': 1.703451707465962e-05, 'epoch': 0.51} {'loss': 0.8112, 'learning_rate': 1.7034284408061453e-05, 'epoch': 0.51} {'loss': 0.7538, 'learning_rate': 1.703405173392542e-05, 'epoch': 0.51} {'loss': 0.6446, 'learning_rate': 1.7033819052251767e-05, 'epoch': 0.51} {'loss': 0.9902, 'learning_rate': 1.7033586363040738e-05, 'epoch': 0.51} {'loss': 0.9411, 'learning_rate': 1.7033353666292586e-05, 'epoch': 0.51} {'loss': 0.8994, 'learning_rate': 1.703312096200757e-05, 'epoch': 0.51} {'loss': 0.7426, 'learning_rate': 1.703288825018592e-05, 'epoch': 0.51} {'loss': 0.7386, 'learning_rate': 1.7032655530827898e-05, 'epoch': 0.51} {'loss': 0.7917, 'learning_rate': 1.7032422803933753e-05, 'epoch': 0.51} {'loss': 0.89, 'learning_rate': 1.7032190069503728e-05, 'epoch': 0.51} {'loss': 0.9449, 'learning_rate': 1.703195732753808e-05, 'epoch': 0.51} {'loss': 0.8772, 'learning_rate': 1.7031724578037056e-05, 'epoch': 0.51} {'loss': 0.8466, 'learning_rate': 1.7031491821000904e-05, 'epoch': 0.51} {'loss': 0.7122, 'learning_rate': 1.7031259056429872e-05, 'epoch': 0.51} {'loss': 0.8536, 'learning_rate': 1.703102628432421e-05, 'epoch': 0.51} {'loss': 0.9057, 'learning_rate': 1.7030793504684172e-05, 'epoch': 0.51} {'loss': 0.8154, 'learning_rate': 1.7030560717510005e-05, 'epoch': 0.51} {'loss': 0.7846, 'learning_rate': 1.7030327922801958e-05, 'epoch': 0.51} {'loss': 0.837, 'learning_rate': 1.7030095120560277e-05, 'epoch': 0.51} {'loss': 0.8263, 'learning_rate': 1.7029862310785215e-05, 'epoch': 0.51} {'loss': 0.8868, 'learning_rate': 1.702962949347702e-05, 'epoch': 0.51} {'loss': 0.8291, 'learning_rate': 1.7029396668635946e-05, 'epoch': 0.51} {'loss': 0.703, 'learning_rate': 1.7029163836262234e-05, 'epoch': 0.51} {'loss': 0.8263, 'learning_rate': 1.7028930996356146e-05, 'epoch': 0.51} {'loss': 0.8953, 'learning_rate': 1.7028698148917916e-05, 'epoch': 0.51} {'loss': 0.9838, 'learning_rate': 1.7028465293947808e-05, 'epoch': 0.51} {'loss': 0.8433, 'learning_rate': 1.7028232431446062e-05, 'epoch': 0.51} {'loss': 0.8559, 'learning_rate': 1.702799956141293e-05, 'epoch': 0.51} {'loss': 0.7589, 'learning_rate': 1.7027766683848662e-05, 'epoch': 0.51} {'loss': 1.0133, 'learning_rate': 1.7027533798753512e-05, 'epoch': 0.51} {'loss': 0.9101, 'learning_rate': 1.702730090612772e-05, 'epoch': 0.51} {'loss': 0.9302, 'learning_rate': 1.7027068005971546e-05, 'epoch': 0.51} {'loss': 0.8558, 'learning_rate': 1.702683509828523e-05, 'epoch': 0.51} {'loss': 0.9035, 'learning_rate': 1.7026602183069027e-05, 'epoch': 0.51} {'loss': 0.8009, 'learning_rate': 1.7026369260323185e-05, 'epoch': 0.51} {'loss': 0.8624, 'learning_rate': 1.7026136330047955e-05, 'epoch': 0.51} {'loss': 0.831, 'learning_rate': 1.7025903392243584e-05, 'epoch': 0.51} {'loss': 0.8127, 'learning_rate': 1.702567044691033e-05, 'epoch': 0.51} {'loss': 0.8744, 'learning_rate': 1.7025437494048432e-05, 'epoch': 0.51} {'loss': 0.9686, 'learning_rate': 1.702520453365814e-05, 'epoch': 0.51} {'loss': 0.828, 'learning_rate': 1.702497156573971e-05, 'epoch': 0.51} {'loss': 0.8792, 'learning_rate': 1.702473859029339e-05, 'epoch': 0.51} {'loss': 0.892, 'learning_rate': 1.7024505607319425e-05, 'epoch': 0.51} {'loss': 0.8278, 'learning_rate': 1.7024272616818075e-05, 'epoch': 0.51} {'loss': 0.7399, 'learning_rate': 1.7024039618789577e-05, 'epoch': 0.51} {'loss': 0.8351, 'learning_rate': 1.702380661323419e-05, 'epoch': 0.51} {'loss': 1.0175, 'learning_rate': 1.7023573600152158e-05, 'epoch': 0.51} {'loss': 0.859, 'learning_rate': 1.7023340579543733e-05, 'epoch': 0.51} {'loss': 0.8516, 'learning_rate': 1.7023107551409164e-05, 'epoch': 0.51} {'loss': 0.6834, 'learning_rate': 1.7022874515748707e-05, 'epoch': 0.51} {'loss': 0.9772, 'learning_rate': 1.70226414725626e-05, 'epoch': 0.51} {'loss': 0.7258, 'learning_rate': 1.70224084218511e-05, 'epoch': 0.51} {'loss': 0.944, 'learning_rate': 1.7022175363614455e-05, 'epoch': 0.51} {'loss': 0.9242, 'learning_rate': 1.7021942297852917e-05, 'epoch': 0.51} {'loss': 0.7193, 'learning_rate': 1.702170922456673e-05, 'epoch': 0.51} {'loss': 0.8287, 'learning_rate': 1.7021476143756156e-05, 'epoch': 0.51} {'loss': 0.9166, 'learning_rate': 1.7021243055421433e-05, 'epoch': 0.51} {'loss': 0.817, 'learning_rate': 1.7021009959562812e-05, 'epoch': 0.51} {'loss': 0.778, 'learning_rate': 1.7020776856180546e-05, 'epoch': 0.51} {'loss': 0.8927, 'learning_rate': 1.7020543745274883e-05, 'epoch': 0.51} {'loss': 0.8506, 'learning_rate': 1.7020310626846076e-05, 'epoch': 0.51} {'loss': 0.7454, 'learning_rate': 1.7020077500894374e-05, 'epoch': 0.51} {'loss': 0.6851, 'learning_rate': 1.7019844367420022e-05, 'epoch': 0.51} {'loss': 0.9141, 'learning_rate': 1.7019611226423273e-05, 'epoch': 0.51} {'loss': 0.8141, 'learning_rate': 1.701937807790438e-05, 'epoch': 0.51} {'loss': 0.9969, 'learning_rate': 1.701914492186359e-05, 'epoch': 0.51} {'loss': 0.9991, 'learning_rate': 1.7018911758301148e-05, 'epoch': 0.51} {'loss': 0.9265, 'learning_rate': 1.7018678587217314e-05, 'epoch': 0.51} {'loss': 1.1729, 'learning_rate': 1.701844540861233e-05, 'epoch': 0.51} {'loss': 0.936, 'learning_rate': 1.7018212222486446e-05, 'epoch': 0.51} {'loss': 0.8295, 'learning_rate': 1.7017979028839918e-05, 'epoch': 0.51} {'loss': 0.8315, 'learning_rate': 1.701774582767299e-05, 'epoch': 0.51} {'loss': 1.1562, 'learning_rate': 1.701751261898591e-05, 'epoch': 0.51} {'loss': 0.9329, 'learning_rate': 1.701727940277894e-05, 'epoch': 0.51} {'loss': 0.9256, 'learning_rate': 1.7017046179052315e-05, 'epoch': 0.51} {'loss': 0.8307, 'learning_rate': 1.7016812947806296e-05, 'epoch': 0.51} {'loss': 0.8664, 'learning_rate': 1.7016579709041128e-05, 'epoch': 0.51} {'loss': 0.8115, 'learning_rate': 1.7016346462757058e-05, 'epoch': 0.51} {'loss': 0.8262, 'learning_rate': 1.7016113208954344e-05, 'epoch': 0.51} {'loss': 0.9733, 'learning_rate': 1.7015879947633228e-05, 'epoch': 0.51} {'loss': 0.9425, 'learning_rate': 1.701564667879397e-05, 'epoch': 0.51} {'loss': 0.9905, 'learning_rate': 1.7015413402436807e-05, 'epoch': 0.51} {'loss': 0.7563, 'learning_rate': 1.7015180118561995e-05, 'epoch': 0.51} {'loss': 1.0286, 'learning_rate': 1.7014946827169785e-05, 'epoch': 0.51} {'loss': 0.8946, 'learning_rate': 1.701471352826043e-05, 'epoch': 0.51} {'loss': 0.6293, 'learning_rate': 1.701448022183417e-05, 'epoch': 0.51} {'loss': 0.9587, 'learning_rate': 1.7014246907891268e-05, 'epoch': 0.51} {'loss': 0.6823, 'learning_rate': 1.7014013586431964e-05, 'epoch': 0.51} {'loss': 0.7531, 'learning_rate': 1.7013780257456513e-05, 'epoch': 0.51} {'loss': 0.9135, 'learning_rate': 1.701354692096516e-05, 'epoch': 0.51} {'loss': 0.7968, 'learning_rate': 1.7013313576958163e-05, 'epoch': 0.51} {'loss': 1.0244, 'learning_rate': 1.7013080225435766e-05, 'epoch': 0.51} {'loss': 1.0394, 'learning_rate': 1.7012846866398218e-05, 'epoch': 0.51} {'loss': 0.8724, 'learning_rate': 1.7012613499845776e-05, 'epoch': 0.51} {'loss': 0.6561, 'learning_rate': 1.7012380125778682e-05, 'epoch': 0.51} {'loss': 0.8965, 'learning_rate': 1.701214674419719e-05, 'epoch': 0.51} {'loss': 0.732, 'learning_rate': 1.701191335510155e-05, 'epoch': 0.51} {'loss': 0.788, 'learning_rate': 1.7011679958492015e-05, 'epoch': 0.51} {'loss': 0.7333, 'learning_rate': 1.7011446554368827e-05, 'epoch': 0.51} {'loss': 0.9553, 'learning_rate': 1.7011213142732244e-05, 'epoch': 0.51} {'loss': 1.0351, 'learning_rate': 1.7010979723582516e-05, 'epoch': 0.51} {'loss': 0.9282, 'learning_rate': 1.701074629691989e-05, 'epoch': 0.51} {'loss': 0.6704, 'learning_rate': 1.701051286274461e-05, 'epoch': 0.51} {'loss': 0.859, 'learning_rate': 1.701027942105694e-05, 'epoch': 0.51} {'loss': 1.0453, 'learning_rate': 1.7010045971857117e-05, 'epoch': 0.51} {'loss': 0.7776, 'learning_rate': 1.70098125151454e-05, 'epoch': 0.51} {'loss': 0.7702, 'learning_rate': 1.7009579050922042e-05, 'epoch': 0.51} {'loss': 0.8527, 'learning_rate': 1.700934557918728e-05, 'epoch': 0.51} {'loss': 0.7986, 'learning_rate': 1.7009112099941372e-05, 'epoch': 0.51} {'loss': 0.8838, 'learning_rate': 1.700887861318457e-05, 'epoch': 0.51} {'loss': 0.7411, 'learning_rate': 1.7008645118917122e-05, 'epoch': 0.51} {'loss': 0.8879, 'learning_rate': 1.700841161713928e-05, 'epoch': 0.51} {'loss': 0.8298, 'learning_rate': 1.7008178107851286e-05, 'epoch': 0.51} {'loss': 1.0074, 'learning_rate': 1.70079445910534e-05, 'epoch': 0.51} {'loss': 0.9782, 'learning_rate': 1.700771106674587e-05, 'epoch': 0.51} {'loss': 0.9597, 'learning_rate': 1.7007477534928943e-05, 'epoch': 0.51} {'loss': 0.9311, 'learning_rate': 1.7007243995602875e-05, 'epoch': 0.51} {'loss': 0.7315, 'learning_rate': 1.700701044876791e-05, 'epoch': 0.51} {'loss': 1.0096, 'learning_rate': 1.70067768944243e-05, 'epoch': 0.51} {'loss': 0.8627, 'learning_rate': 1.70065433325723e-05, 'epoch': 0.51} {'loss': 0.8442, 'learning_rate': 1.700630976321215e-05, 'epoch': 0.51} {'loss': 0.9064, 'learning_rate': 1.7006076186344112e-05, 'epoch': 0.51} {'loss': 0.8296, 'learning_rate': 1.700584260196843e-05, 'epoch': 0.51} {'loss': 0.7534, 'learning_rate': 1.7005609010085354e-05, 'epoch': 0.51} {'loss': 0.8999, 'learning_rate': 1.7005375410695136e-05, 'epoch': 0.51} {'loss': 0.7041, 'learning_rate': 1.7005141803798027e-05, 'epoch': 0.51} {'loss': 0.966, 'learning_rate': 1.700490818939428e-05, 'epoch': 0.51} {'loss': 0.6693, 'learning_rate': 1.7004674567484135e-05, 'epoch': 0.51} {'loss': 1.0383, 'learning_rate': 1.700444093806785e-05, 'epoch': 0.51} {'loss': 0.8776, 'learning_rate': 1.7004207301145676e-05, 'epoch': 0.51} {'loss': 0.7195, 'learning_rate': 1.700397365671786e-05, 'epoch': 0.51} {'loss': 0.9586, 'learning_rate': 1.700374000478466e-05, 'epoch': 0.51} {'loss': 0.7287, 'learning_rate': 1.7003506345346314e-05, 'epoch': 0.51} {'loss': 0.8237, 'learning_rate': 1.700327267840308e-05, 'epoch': 0.51} {'loss': 0.8331, 'learning_rate': 1.700303900395521e-05, 'epoch': 0.51} {'loss': 0.8633, 'learning_rate': 1.700280532200295e-05, 'epoch': 0.51} {'loss': 0.9058, 'learning_rate': 1.700257163254655e-05, 'epoch': 0.51} {'loss': 0.9766, 'learning_rate': 1.7002337935586264e-05, 'epoch': 0.51} {'loss': 0.9015, 'learning_rate': 1.700210423112234e-05, 'epoch': 0.51} {'loss': 0.8101, 'learning_rate': 1.7001870519155033e-05, 'epoch': 0.51} {'loss': 0.9065, 'learning_rate': 1.7001636799684583e-05, 'epoch': 0.51} {'loss': 0.8877, 'learning_rate': 1.7001403072711254e-05, 'epoch': 0.51} {'loss': 0.983, 'learning_rate': 1.7001169338235287e-05, 'epoch': 0.51} {'loss': 0.917, 'learning_rate': 1.7000935596256935e-05, 'epoch': 0.51} {'loss': 0.7695, 'learning_rate': 1.700070184677645e-05, 'epoch': 0.51} {'loss': 1.0816, 'learning_rate': 1.700046808979408e-05, 'epoch': 0.51} {'loss': 0.8549, 'learning_rate': 1.7000234325310078e-05, 'epoch': 0.51} {'loss': 0.8902, 'learning_rate': 1.7000000553324693e-05, 'epoch': 0.51} {'loss': 0.846, 'learning_rate': 1.699976677383817e-05, 'epoch': 0.51} {'loss': 0.851, 'learning_rate': 1.699953298685077e-05, 'epoch': 0.51} {'loss': 0.9231, 'learning_rate': 1.699929919236274e-05, 'epoch': 0.51} {'loss': 1.0027, 'learning_rate': 1.6999065390374326e-05, 'epoch': 0.51} {'loss': 0.9543, 'learning_rate': 1.6998831580885785e-05, 'epoch': 0.51} {'loss': 0.8248, 'learning_rate': 1.6998597763897363e-05, 'epoch': 0.51} {'loss': 0.7724, 'learning_rate': 1.699836393940931e-05, 'epoch': 0.51} {'loss': 0.9353, 'learning_rate': 1.6998130107421878e-05, 'epoch': 0.51} {'loss': 0.7891, 'learning_rate': 1.6997896267935323e-05, 'epoch': 0.51} {'loss': 0.7141, 'learning_rate': 1.6997662420949887e-05, 'epoch': 0.51} {'loss': 0.8546, 'learning_rate': 1.6997428566465824e-05, 'epoch': 0.51} {'loss': 0.8335, 'learning_rate': 1.6997194704483385e-05, 'epoch': 0.51} {'loss': 0.8991, 'learning_rate': 1.699696083500282e-05, 'epoch': 0.51} {'loss': 0.7579, 'learning_rate': 1.699672695802438e-05, 'epoch': 0.51} {'loss': 0.8303, 'learning_rate': 1.6996493073548314e-05, 'epoch': 0.51} {'loss': 0.709, 'learning_rate': 1.6996259181574878e-05, 'epoch': 0.51} {'loss': 0.8157, 'learning_rate': 1.699602528210432e-05, 'epoch': 0.51} {'loss': 0.9073, 'learning_rate': 1.6995791375136885e-05, 'epoch': 0.51} {'loss': 0.9181, 'learning_rate': 1.699555746067283e-05, 'epoch': 0.51} {'loss': 0.9586, 'learning_rate': 1.69953235387124e-05, 'epoch': 0.51} {'loss': 0.782, 'learning_rate': 1.6995089609255853e-05, 'epoch': 0.51} {'loss': 0.7463, 'learning_rate': 1.699485567230344e-05, 'epoch': 0.51} {'loss': 0.7285, 'learning_rate': 1.6994621727855404e-05, 'epoch': 0.51} {'loss': 0.8049, 'learning_rate': 1.6994387775911998e-05, 'epoch': 0.51} {'loss': 0.7458, 'learning_rate': 1.6994153816473475e-05, 'epoch': 0.51} {'loss': 0.7749, 'learning_rate': 1.6993919849540086e-05, 'epoch': 0.51} {'loss': 0.9992, 'learning_rate': 1.6993685875112078e-05, 'epoch': 0.51} {'loss': 0.9705, 'learning_rate': 1.699345189318971e-05, 'epoch': 0.51} {'loss': 0.8924, 'learning_rate': 1.6993217903773223e-05, 'epoch': 0.51} {'loss': 0.9432, 'learning_rate': 1.6992983906862874e-05, 'epoch': 0.51} {'loss': 0.9364, 'learning_rate': 1.6992749902458905e-05, 'epoch': 0.51} {'loss': 0.9494, 'learning_rate': 1.6992515890561582e-05, 'epoch': 0.51} {'loss': 0.8138, 'learning_rate': 1.699228187117114e-05, 'epoch': 0.51} {'loss': 0.9136, 'learning_rate': 1.6992047844287843e-05, 'epoch': 0.51} {'loss': 0.9449, 'learning_rate': 1.6991813809911933e-05, 'epoch': 0.51} {'loss': 0.8266, 'learning_rate': 1.6991579768043663e-05, 'epoch': 0.51} {'loss': 0.7558, 'learning_rate': 1.6991345718683282e-05, 'epoch': 0.51} {'loss': 0.9506, 'learning_rate': 1.6991111661831044e-05, 'epoch': 0.51} {'loss': 0.8717, 'learning_rate': 1.6990877597487206e-05, 'epoch': 0.51} {'loss': 0.8087, 'learning_rate': 1.6990643525652005e-05, 'epoch': 0.51} {'loss': 1.0308, 'learning_rate': 1.69904094463257e-05, 'epoch': 0.51} {'loss': 0.7853, 'learning_rate': 1.6990175359508542e-05, 'epoch': 0.51} {'loss': 0.7707, 'learning_rate': 1.6989941265200775e-05, 'epoch': 0.51} {'loss': 0.823, 'learning_rate': 1.698970716340266e-05, 'epoch': 0.51} {'loss': 0.7821, 'learning_rate': 1.698947305411444e-05, 'epoch': 0.51} {'loss': 0.8264, 'learning_rate': 1.698923893733637e-05, 'epoch': 0.51} {'loss': 0.7651, 'learning_rate': 1.6989004813068702e-05, 'epoch': 0.51} {'loss': 0.7795, 'learning_rate': 1.698877068131168e-05, 'epoch': 0.51} {'loss': 0.9749, 'learning_rate': 1.6988536542065562e-05, 'epoch': 0.51} {'loss': 0.7783, 'learning_rate': 1.69883023953306e-05, 'epoch': 0.51} {'loss': 0.9684, 'learning_rate': 1.6988068241107034e-05, 'epoch': 0.51} {'loss': 0.7886, 'learning_rate': 1.6987834079395125e-05, 'epoch': 0.51} {'loss': 0.7608, 'learning_rate': 1.6987599910195124e-05, 'epoch': 0.51} {'loss': 0.7569, 'learning_rate': 1.6987365733507276e-05, 'epoch': 0.51} {'loss': 0.9373, 'learning_rate': 1.6987131549331834e-05, 'epoch': 0.51} {'loss': 0.9534, 'learning_rate': 1.698689735766905e-05, 'epoch': 0.51} {'loss': 0.9211, 'learning_rate': 1.698666315851918e-05, 'epoch': 0.51} {'loss': 0.8118, 'learning_rate': 1.6986428951882464e-05, 'epoch': 0.51} {'loss': 0.9197, 'learning_rate': 1.6986194737759162e-05, 'epoch': 0.51} {'loss': 0.7938, 'learning_rate': 1.698596051614952e-05, 'epoch': 0.51} {'loss': 0.8954, 'learning_rate': 1.6985726287053794e-05, 'epoch': 0.51} {'loss': 0.8754, 'learning_rate': 1.6985492050472227e-05, 'epoch': 0.51} {'loss': 0.8518, 'learning_rate': 1.6985257806405077e-05, 'epoch': 0.51} {'loss': 0.7739, 'learning_rate': 1.6985023554852592e-05, 'epoch': 0.51} {'loss': 0.8404, 'learning_rate': 1.698478929581503e-05, 'epoch': 0.51} {'loss': 0.7932, 'learning_rate': 1.698455502929263e-05, 'epoch': 0.51} {'loss': 0.8908, 'learning_rate': 1.698432075528565e-05, 'epoch': 0.51} {'loss': 0.9287, 'learning_rate': 1.6984086473794337e-05, 'epoch': 0.51} {'loss': 0.8457, 'learning_rate': 1.6983852184818944e-05, 'epoch': 0.51} {'loss': 0.9249, 'learning_rate': 1.698361788835973e-05, 'epoch': 0.51} {'loss': 0.7656, 'learning_rate': 1.6983383584416936e-05, 'epoch': 0.51} {'loss': 0.6186, 'learning_rate': 1.6983149272990815e-05, 'epoch': 0.51} {'loss': 0.7925, 'learning_rate': 1.698291495408162e-05, 'epoch': 0.51} {'loss': 0.7548, 'learning_rate': 1.6982680627689603e-05, 'epoch': 0.51} {'loss': 0.925, 'learning_rate': 1.6982446293815012e-05, 'epoch': 0.51} {'loss': 0.8148, 'learning_rate': 1.6982211952458095e-05, 'epoch': 0.51} {'loss': 0.8149, 'learning_rate': 1.6981977603619115e-05, 'epoch': 0.51} {'loss': 0.9475, 'learning_rate': 1.6981743247298314e-05, 'epoch': 0.51} {'loss': 0.6868, 'learning_rate': 1.6981508883495946e-05, 'epoch': 0.51} {'loss': 0.9418, 'learning_rate': 1.6981274512212257e-05, 'epoch': 0.51} {'loss': 0.8252, 'learning_rate': 1.6981040133447505e-05, 'epoch': 0.51} {'loss': 0.8834, 'learning_rate': 1.6980805747201938e-05, 'epoch': 0.51} {'loss': 0.8649, 'learning_rate': 1.698057135347581e-05, 'epoch': 0.51} {'loss': 0.7907, 'learning_rate': 1.6980336952269363e-05, 'epoch': 0.51} {'loss': 0.7526, 'learning_rate': 1.698010254358286e-05, 'epoch': 0.51} {'loss': 0.9321, 'learning_rate': 1.6979868127416546e-05, 'epoch': 0.51} {'loss': 0.9695, 'learning_rate': 1.6979633703770676e-05, 'epoch': 0.51} {'loss': 0.8943, 'learning_rate': 1.6979399272645495e-05, 'epoch': 0.51} {'loss': 0.8106, 'learning_rate': 1.697916483404126e-05, 'epoch': 0.51} {'loss': 0.7713, 'learning_rate': 1.6978930387958217e-05, 'epoch': 0.51} {'loss': 0.8507, 'learning_rate': 1.6978695934396624e-05, 'epoch': 0.51} {'loss': 0.799, 'learning_rate': 1.6978461473356726e-05, 'epoch': 0.51} {'loss': 0.8066, 'learning_rate': 1.6978227004838777e-05, 'epoch': 0.51} {'loss': 0.8523, 'learning_rate': 1.697799252884303e-05, 'epoch': 0.51} {'loss': 0.8422, 'learning_rate': 1.697775804536973e-05, 'epoch': 0.51} {'loss': 0.9214, 'learning_rate': 1.697752355441913e-05, 'epoch': 0.51} {'loss': 0.8848, 'learning_rate': 1.6977289055991494e-05, 'epoch': 0.51} {'loss': 0.6852, 'learning_rate': 1.6977054550087056e-05, 'epoch': 0.51} {'loss': 0.8402, 'learning_rate': 1.697682003670608e-05, 'epoch': 0.51} {'loss': 0.8157, 'learning_rate': 1.6976585515848806e-05, 'epoch': 0.51} {'loss': 1.0101, 'learning_rate': 1.697635098751549e-05, 'epoch': 0.51} {'loss': 0.834, 'learning_rate': 1.697611645170639e-05, 'epoch': 0.51} {'loss': 0.9972, 'learning_rate': 1.6975881908421747e-05, 'epoch': 0.51} {'loss': 0.9538, 'learning_rate': 1.6975647357661816e-05, 'epoch': 0.51} {'loss': 0.8218, 'learning_rate': 1.6975412799426853e-05, 'epoch': 0.51} {'loss': 0.7435, 'learning_rate': 1.6975178233717105e-05, 'epoch': 0.51} {'loss': 0.8775, 'learning_rate': 1.6974943660532823e-05, 'epoch': 0.51} {'loss': 0.7632, 'learning_rate': 1.6974709079874258e-05, 'epoch': 0.51} {'loss': 0.8226, 'learning_rate': 1.6974474491741664e-05, 'epoch': 0.51} {'loss': 0.9619, 'learning_rate': 1.6974239896135292e-05, 'epoch': 0.51} {'loss': 0.8307, 'learning_rate': 1.6974005293055393e-05, 'epoch': 0.51} {'loss': 0.8108, 'learning_rate': 1.6973770682502216e-05, 'epoch': 0.51} {'loss': 0.6945, 'learning_rate': 1.6973536064476017e-05, 'epoch': 0.51} {'loss': 0.7505, 'learning_rate': 1.6973301438977042e-05, 'epoch': 0.51} {'loss': 0.9022, 'learning_rate': 1.6973066806005543e-05, 'epoch': 0.51} {'loss': 0.8608, 'learning_rate': 1.697283216556178e-05, 'epoch': 0.51} {'loss': 0.7685, 'learning_rate': 1.6972597517645994e-05, 'epoch': 0.51} {'loss': 0.7991, 'learning_rate': 1.697236286225844e-05, 'epoch': 0.51} {'loss': 0.9524, 'learning_rate': 1.6972128199399372e-05, 'epoch': 0.51} {'loss': 0.8029, 'learning_rate': 1.6971893529069037e-05, 'epoch': 0.51} {'loss': 0.9379, 'learning_rate': 1.697165885126769e-05, 'epoch': 0.51} {'loss': 0.8441, 'learning_rate': 1.697142416599558e-05, 'epoch': 0.51} {'loss': 0.7982, 'learning_rate': 1.6971189473252962e-05, 'epoch': 0.51} {'loss': 0.7505, 'learning_rate': 1.6970954773040084e-05, 'epoch': 0.51} {'loss': 0.7612, 'learning_rate': 1.69707200653572e-05, 'epoch': 0.51} {'loss': 0.8079, 'learning_rate': 1.6970485350204558e-05, 'epoch': 0.51} {'loss': 0.9367, 'learning_rate': 1.6970250627582414e-05, 'epoch': 0.51} {'loss': 0.8058, 'learning_rate': 1.6970015897491015e-05, 'epoch': 0.51} {'loss': 0.7904, 'learning_rate': 1.6969781159930618e-05, 'epoch': 0.51} {'loss': 0.7651, 'learning_rate': 1.696954641490147e-05, 'epoch': 0.51} {'loss': 0.7754, 'learning_rate': 1.6969311662403824e-05, 'epoch': 0.51} {'loss': 0.7663, 'learning_rate': 1.6969076902437932e-05, 'epoch': 0.51} {'loss': 0.7961, 'learning_rate': 1.6968842135004046e-05, 'epoch': 0.51} {'loss': 0.8926, 'learning_rate': 1.6968607360102415e-05, 'epoch': 0.51} {'loss': 1.1264, 'learning_rate': 1.696837257773329e-05, 'epoch': 0.51} {'loss': 0.8495, 'learning_rate': 1.6968137787896928e-05, 'epoch': 0.51} {'loss': 0.9212, 'learning_rate': 1.6967902990593576e-05, 'epoch': 0.51} {'loss': 0.8652, 'learning_rate': 1.696766818582349e-05, 'epoch': 0.51} {'loss': 0.9511, 'learning_rate': 1.6967433373586914e-05, 'epoch': 0.51} {'loss': 0.8459, 'learning_rate': 1.6967198553884108e-05, 'epoch': 0.51} {'loss': 0.7305, 'learning_rate': 1.6966963726715316e-05, 'epoch': 0.51} {'loss': 0.7365, 'learning_rate': 1.69667288920808e-05, 'epoch': 0.51} {'loss': 0.9162, 'learning_rate': 1.69664940499808e-05, 'epoch': 0.51} {'loss': 0.7583, 'learning_rate': 1.6966259200415573e-05, 'epoch': 0.51} {'loss': 0.8112, 'learning_rate': 1.6966024343385373e-05, 'epoch': 0.51} {'loss': 0.5826, 'learning_rate': 1.696578947889045e-05, 'epoch': 0.51} {'loss': 0.9179, 'learning_rate': 1.6965554606931053e-05, 'epoch': 0.51} {'loss': 0.792, 'learning_rate': 1.6965319727507434e-05, 'epoch': 0.51} {'loss': 0.8887, 'learning_rate': 1.6965084840619848e-05, 'epoch': 0.51} {'loss': 0.7557, 'learning_rate': 1.6964849946268544e-05, 'epoch': 0.51} {'loss': 1.0012, 'learning_rate': 1.6964615044453774e-05, 'epoch': 0.51} {'loss': 0.7721, 'learning_rate': 1.6964380135175794e-05, 'epoch': 0.51} {'loss': 0.909, 'learning_rate': 1.6964145218434847e-05, 'epoch': 0.51} {'loss': 0.8846, 'learning_rate': 1.6963910294231195e-05, 'epoch': 0.51} {'loss': 0.8266, 'learning_rate': 1.696367536256508e-05, 'epoch': 0.51} {'loss': 0.9295, 'learning_rate': 1.696344042343676e-05, 'epoch': 0.51} {'loss': 0.8236, 'learning_rate': 1.696320547684649e-05, 'epoch': 0.51} {'loss': 0.8798, 'learning_rate': 1.696297052279451e-05, 'epoch': 0.51} {'loss': 0.8424, 'learning_rate': 1.6962735561281082e-05, 'epoch': 0.51} {'loss': 0.8193, 'learning_rate': 1.6962500592306456e-05, 'epoch': 0.51} {'loss': 0.9584, 'learning_rate': 1.696226561587088e-05, 'epoch': 0.51} {'loss': 1.0287, 'learning_rate': 1.6962030631974606e-05, 'epoch': 0.51} {'loss': 1.0913, 'learning_rate': 1.696179564061789e-05, 'epoch': 0.51} {'loss': 0.768, 'learning_rate': 1.696156064180098e-05, 'epoch': 0.51} {'loss': 0.8305, 'learning_rate': 1.696132563552413e-05, 'epoch': 0.51} {'loss': 0.8768, 'learning_rate': 1.6961090621787593e-05, 'epoch': 0.51} {'loss': 0.6651, 'learning_rate': 1.696085560059162e-05, 'epoch': 0.51} {'loss': 0.8096, 'learning_rate': 1.696062057193646e-05, 'epoch': 0.51} {'loss': 0.7565, 'learning_rate': 1.6960385535822363e-05, 'epoch': 0.51} {'loss': 0.9989, 'learning_rate': 1.696015049224959e-05, 'epoch': 0.51} {'loss': 0.7576, 'learning_rate': 1.6959915441218386e-05, 'epoch': 0.51} {'loss': 0.7526, 'learning_rate': 1.6959680382729006e-05, 'epoch': 0.51} {'loss': 0.8152, 'learning_rate': 1.6959445316781698e-05, 'epoch': 0.51} {'loss': 0.8594, 'learning_rate': 1.695921024337672e-05, 'epoch': 0.51} {'loss': 0.8684, 'learning_rate': 1.6958975162514316e-05, 'epoch': 0.51} {'loss': 0.8391, 'learning_rate': 1.6958740074194743e-05, 'epoch': 0.51} {'loss': 0.7745, 'learning_rate': 1.695850497841825e-05, 'epoch': 0.51} {'loss': 0.8727, 'learning_rate': 1.6958269875185095e-05, 'epoch': 0.51} {'loss': 0.8912, 'learning_rate': 1.6958034764495525e-05, 'epoch': 0.51} {'loss': 0.8491, 'learning_rate': 1.695779964634979e-05, 'epoch': 0.51} {'loss': 0.7529, 'learning_rate': 1.6957564520748145e-05, 'epoch': 0.51} {'loss': 0.7826, 'learning_rate': 1.6957329387690843e-05, 'epoch': 0.51} {'loss': 0.8996, 'learning_rate': 1.6957094247178133e-05, 'epoch': 0.51} {'loss': 0.8336, 'learning_rate': 1.6956859099210274e-05, 'epoch': 0.51} {'loss': 0.9151, 'learning_rate': 1.6956623943787507e-05, 'epoch': 0.51} {'loss': 0.7892, 'learning_rate': 1.6956388780910092e-05, 'epoch': 0.51} {'loss': 1.0971, 'learning_rate': 1.695615361057828e-05, 'epoch': 0.51} {'loss': 0.8331, 'learning_rate': 1.695591843279232e-05, 'epoch': 0.51} {'loss': 0.8629, 'learning_rate': 1.695568324755246e-05, 'epoch': 0.51} {'loss': 0.8764, 'learning_rate': 1.695544805485896e-05, 'epoch': 0.51} {'loss': 0.7857, 'learning_rate': 1.6955212854712076e-05, 'epoch': 0.51} {'loss': 0.7833, 'learning_rate': 1.6954977647112053e-05, 'epoch': 0.52} {'loss': 0.8124, 'learning_rate': 1.695474243205914e-05, 'epoch': 0.52} {'loss': 0.7329, 'learning_rate': 1.6954507209553594e-05, 'epoch': 0.52} {'loss': 0.8615, 'learning_rate': 1.6954271979595665e-05, 'epoch': 0.52} {'loss': 0.7173, 'learning_rate': 1.6954036742185606e-05, 'epoch': 0.52} {'loss': 0.8451, 'learning_rate': 1.6953801497323668e-05, 'epoch': 0.52} {'loss': 0.938, 'learning_rate': 1.6953566245010104e-05, 'epoch': 0.52} {'loss': 0.8799, 'learning_rate': 1.6953330985245168e-05, 'epoch': 0.52} {'loss': 0.6845, 'learning_rate': 1.6953095718029113e-05, 'epoch': 0.52} {'loss': 0.8987, 'learning_rate': 1.6952860443362183e-05, 'epoch': 0.52} {'loss': 0.6348, 'learning_rate': 1.6952625161244637e-05, 'epoch': 0.52} {'loss': 0.6413, 'learning_rate': 1.6952389871676728e-05, 'epoch': 0.52} {'loss': 0.8689, 'learning_rate': 1.6952154574658703e-05, 'epoch': 0.52} {'loss': 0.7638, 'learning_rate': 1.695191927019082e-05, 'epoch': 0.52} {'loss': 0.7032, 'learning_rate': 1.6951683958273326e-05, 'epoch': 0.52} {'loss': 0.9093, 'learning_rate': 1.6951448638906472e-05, 'epoch': 0.52} {'loss': 0.8634, 'learning_rate': 1.6951213312090516e-05, 'epoch': 0.52} {'loss': 0.8041, 'learning_rate': 1.6950977977825708e-05, 'epoch': 0.52} {'loss': 0.8879, 'learning_rate': 1.6950742636112302e-05, 'epoch': 0.52} {'loss': 0.7855, 'learning_rate': 1.6950507286950546e-05, 'epoch': 0.52} {'loss': 0.7561, 'learning_rate': 1.6950271930340694e-05, 'epoch': 0.52} {'loss': 0.8412, 'learning_rate': 1.6950036566282996e-05, 'epoch': 0.52} {'loss': 0.8962, 'learning_rate': 1.694980119477771e-05, 'epoch': 0.52} {'loss': 0.8906, 'learning_rate': 1.6949565815825084e-05, 'epoch': 0.52} {'loss': 0.8422, 'learning_rate': 1.694933042942537e-05, 'epoch': 0.52} {'loss': 0.8758, 'learning_rate': 1.6949095035578822e-05, 'epoch': 0.52} {'loss': 0.7644, 'learning_rate': 1.6948859634285692e-05, 'epoch': 0.52} {'loss': 0.8004, 'learning_rate': 1.694862422554623e-05, 'epoch': 0.52} {'loss': 0.6929, 'learning_rate': 1.6948388809360692e-05, 'epoch': 0.52} {'loss': 0.776, 'learning_rate': 1.6948153385729327e-05, 'epoch': 0.52} {'loss': 0.918, 'learning_rate': 1.6947917954652387e-05, 'epoch': 0.52} {'loss': 0.6668, 'learning_rate': 1.6947682516130132e-05, 'epoch': 0.52} {'loss': 0.619, 'learning_rate': 1.69474470701628e-05, 'epoch': 0.52} {'loss': 0.9618, 'learning_rate': 1.6947211616750655e-05, 'epoch': 0.52} {'loss': 0.8413, 'learning_rate': 1.6946976155893947e-05, 'epoch': 0.52} {'loss': 0.7096, 'learning_rate': 1.6946740687592928e-05, 'epoch': 0.52} {'loss': 0.9598, 'learning_rate': 1.6946505211847844e-05, 'epoch': 0.52} {'loss': 0.8296, 'learning_rate': 1.694626972865896e-05, 'epoch': 0.52} {'loss': 0.9784, 'learning_rate': 1.6946034238026514e-05, 'epoch': 0.52} {'loss': 0.9666, 'learning_rate': 1.694579873995077e-05, 'epoch': 0.52} {'loss': 0.9782, 'learning_rate': 1.6945563234431972e-05, 'epoch': 0.52} {'loss': 0.7431, 'learning_rate': 1.6945327721470378e-05, 'epoch': 0.52} {'loss': 0.9104, 'learning_rate': 1.694509220106624e-05, 'epoch': 0.52} {'loss': 0.9589, 'learning_rate': 1.694485667321981e-05, 'epoch': 0.52} {'loss': 0.7975, 'learning_rate': 1.6944621137931334e-05, 'epoch': 0.52} {'loss': 0.8975, 'learning_rate': 1.6944385595201072e-05, 'epoch': 0.52} {'loss': 0.7976, 'learning_rate': 1.6944150045029277e-05, 'epoch': 0.52} {'loss': 0.8492, 'learning_rate': 1.6943914487416196e-05, 'epoch': 0.52} {'loss': 0.7885, 'learning_rate': 1.6943678922362083e-05, 'epoch': 0.52} {'loss': 0.9281, 'learning_rate': 1.694344334986719e-05, 'epoch': 0.52} {'loss': 0.8968, 'learning_rate': 1.6943207769931776e-05, 'epoch': 0.52} {'loss': 0.9224, 'learning_rate': 1.6942972182556085e-05, 'epoch': 0.52} {'loss': 0.7419, 'learning_rate': 1.694273658774037e-05, 'epoch': 0.52} {'loss': 0.9025, 'learning_rate': 1.6942500985484893e-05, 'epoch': 0.52} {'loss': 1.0669, 'learning_rate': 1.6942265375789894e-05, 'epoch': 0.52} {'loss': 0.8606, 'learning_rate': 1.6942029758655634e-05, 'epoch': 0.52} {'loss': 0.8966, 'learning_rate': 1.6941794134082362e-05, 'epoch': 0.52} {'loss': 0.8211, 'learning_rate': 1.694155850207033e-05, 'epoch': 0.52} {'loss': 0.9925, 'learning_rate': 1.694132286261979e-05, 'epoch': 0.52} {'loss': 0.8765, 'learning_rate': 1.6941087215731e-05, 'epoch': 0.52} {'loss': 0.878, 'learning_rate': 1.6940851561404206e-05, 'epoch': 0.52} {'loss': 0.9088, 'learning_rate': 1.6940615899639663e-05, 'epoch': 0.52} {'loss': 0.7815, 'learning_rate': 1.6940380230437624e-05, 'epoch': 0.52} {'loss': 0.851, 'learning_rate': 1.694014455379834e-05, 'epoch': 0.52} {'loss': 0.7727, 'learning_rate': 1.693990886972207e-05, 'epoch': 0.52} {'loss': 0.6886, 'learning_rate': 1.6939673178209057e-05, 'epoch': 0.52} {'loss': 0.8323, 'learning_rate': 1.6939437479259556e-05, 'epoch': 0.52} {'loss': 0.8838, 'learning_rate': 1.6939201772873825e-05, 'epoch': 0.52} {'loss': 0.8696, 'learning_rate': 1.693896605905211e-05, 'epoch': 0.52} {'loss': 0.719, 'learning_rate': 1.693873033779467e-05, 'epoch': 0.52} {'loss': 0.8034, 'learning_rate': 1.6938494609101752e-05, 'epoch': 0.52} {'loss': 0.8433, 'learning_rate': 1.693825887297361e-05, 'epoch': 0.52} {'loss': 0.9742, 'learning_rate': 1.69380231294105e-05, 'epoch': 0.52} {'loss': 0.8416, 'learning_rate': 1.693778737841267e-05, 'epoch': 0.52} {'loss': 0.856, 'learning_rate': 1.6937551619980376e-05, 'epoch': 0.52} {'loss': 0.9033, 'learning_rate': 1.693731585411387e-05, 'epoch': 0.52} {'loss': 0.8146, 'learning_rate': 1.69370800808134e-05, 'epoch': 0.52} {'loss': 0.7244, 'learning_rate': 1.6936844300079227e-05, 'epoch': 0.52} {'loss': 0.8553, 'learning_rate': 1.6936608511911597e-05, 'epoch': 0.52} {'loss': 0.9428, 'learning_rate': 1.693637271631077e-05, 'epoch': 0.52} {'loss': 0.7691, 'learning_rate': 1.6936136913276982e-05, 'epoch': 0.52} {'loss': 0.8835, 'learning_rate': 1.6935901102810505e-05, 'epoch': 0.52} {'loss': 0.9819, 'learning_rate': 1.6935665284911586e-05, 'epoch': 0.52} {'loss': 0.8034, 'learning_rate': 1.6935429459580473e-05, 'epoch': 0.52} {'loss': 0.837, 'learning_rate': 1.693519362681742e-05, 'epoch': 0.52} {'loss': 0.8962, 'learning_rate': 1.693495778662268e-05, 'epoch': 0.52} {'loss': 0.8408, 'learning_rate': 1.693472193899651e-05, 'epoch': 0.52} {'loss': 0.8205, 'learning_rate': 1.693448608393916e-05, 'epoch': 0.52} {'loss': 0.8433, 'learning_rate': 1.693425022145088e-05, 'epoch': 0.52} {'loss': 0.8631, 'learning_rate': 1.6934014351531927e-05, 'epoch': 0.52} {'loss': 0.8095, 'learning_rate': 1.6933778474182553e-05, 'epoch': 0.52} {'loss': 0.8239, 'learning_rate': 1.6933542589403006e-05, 'epoch': 0.52} {'loss': 0.7755, 'learning_rate': 1.693330669719354e-05, 'epoch': 0.52} {'loss': 0.764, 'learning_rate': 1.6933070797554416e-05, 'epoch': 0.52} {'loss': 0.8083, 'learning_rate': 1.693283489048588e-05, 'epoch': 0.52} {'loss': 0.8152, 'learning_rate': 1.6932598975988183e-05, 'epoch': 0.52} {'loss': 0.9261, 'learning_rate': 1.693236305406158e-05, 'epoch': 0.52} {'loss': 1.0085, 'learning_rate': 1.6932127124706327e-05, 'epoch': 0.52} {'loss': 0.7741, 'learning_rate': 1.6931891187922674e-05, 'epoch': 0.52} {'loss': 0.8784, 'learning_rate': 1.693165524371087e-05, 'epoch': 0.52} {'loss': 0.6861, 'learning_rate': 1.6931419292071177e-05, 'epoch': 0.52} {'loss': 0.7187, 'learning_rate': 1.6931183333003842e-05, 'epoch': 0.52} {'loss': 0.7561, 'learning_rate': 1.693094736650912e-05, 'epoch': 0.52} {'loss': 0.7862, 'learning_rate': 1.6930711392587256e-05, 'epoch': 0.52} {'loss': 0.9947, 'learning_rate': 1.6930475411238512e-05, 'epoch': 0.52} {'loss': 0.7626, 'learning_rate': 1.693023942246314e-05, 'epoch': 0.52} {'loss': 0.8494, 'learning_rate': 1.693000342626139e-05, 'epoch': 0.52} {'loss': 0.8833, 'learning_rate': 1.6929767422633518e-05, 'epoch': 0.52} {'loss': 0.873, 'learning_rate': 1.692953141157977e-05, 'epoch': 0.52} {'loss': 0.884, 'learning_rate': 1.6929295393100405e-05, 'epoch': 0.52} {'loss': 0.7945, 'learning_rate': 1.6929059367195676e-05, 'epoch': 0.52} {'loss': 0.9229, 'learning_rate': 1.6928823333865835e-05, 'epoch': 0.52} {'loss': 0.8964, 'learning_rate': 1.692858729311113e-05, 'epoch': 0.52} {'loss': 0.9529, 'learning_rate': 1.6928351244931823e-05, 'epoch': 0.52} {'loss': 0.8328, 'learning_rate': 1.6928115189328163e-05, 'epoch': 0.52} {'loss': 0.9192, 'learning_rate': 1.69278791263004e-05, 'epoch': 0.52} {'loss': 0.8925, 'learning_rate': 1.6927643055848787e-05, 'epoch': 0.52} {'loss': 0.8956, 'learning_rate': 1.6927406977973585e-05, 'epoch': 0.52} {'loss': 0.8458, 'learning_rate': 1.6927170892675037e-05, 'epoch': 0.52} {'loss': 1.0295, 'learning_rate': 1.6926934799953404e-05, 'epoch': 0.52} {'loss': 0.778, 'learning_rate': 1.692669869980893e-05, 'epoch': 0.52} {'loss': 0.8197, 'learning_rate': 1.6926462592241873e-05, 'epoch': 0.52} {'loss': 0.7478, 'learning_rate': 1.6926226477252493e-05, 'epoch': 0.52} {'loss': 0.8844, 'learning_rate': 1.6925990354841027e-05, 'epoch': 0.52} {'loss': 0.9047, 'learning_rate': 1.6925754225007744e-05, 'epoch': 0.52} {'loss': 0.9532, 'learning_rate': 1.692551808775289e-05, 'epoch': 0.52} {'loss': 0.8818, 'learning_rate': 1.6925281943076716e-05, 'epoch': 0.52} {'loss': 0.8465, 'learning_rate': 1.692504579097948e-05, 'epoch': 0.52} {'loss': 0.9312, 'learning_rate': 1.6924809631461428e-05, 'epoch': 0.52} {'loss': 0.8023, 'learning_rate': 1.692457346452282e-05, 'epoch': 0.52} {'loss': 0.8571, 'learning_rate': 1.6924337290163907e-05, 'epoch': 0.52} {'loss': 1.1105, 'learning_rate': 1.692410110838494e-05, 'epoch': 0.52} {'loss': 0.7781, 'learning_rate': 1.6923864919186175e-05, 'epoch': 0.52} {'loss': 0.8335, 'learning_rate': 1.6923628722567868e-05, 'epoch': 0.52} {'loss': 0.742, 'learning_rate': 1.6923392518530263e-05, 'epoch': 0.52} {'loss': 0.858, 'learning_rate': 1.6923156307073615e-05, 'epoch': 0.52} {'loss': 0.7637, 'learning_rate': 1.6922920088198185e-05, 'epoch': 0.52} {'loss': 0.9837, 'learning_rate': 1.692268386190422e-05, 'epoch': 0.52} {'loss': 1.0377, 'learning_rate': 1.6922447628191974e-05, 'epoch': 0.52} {'loss': 0.8386, 'learning_rate': 1.6922211387061702e-05, 'epoch': 0.52} {'loss': 0.7004, 'learning_rate': 1.6921975138513655e-05, 'epoch': 0.52} {'loss': 0.771, 'learning_rate': 1.6921738882548085e-05, 'epoch': 0.52} {'loss': 0.8678, 'learning_rate': 1.6921502619165248e-05, 'epoch': 0.52} {'loss': 0.9235, 'learning_rate': 1.69212663483654e-05, 'epoch': 0.52} {'loss': 0.9383, 'learning_rate': 1.6921030070148787e-05, 'epoch': 0.52} {'loss': 0.8689, 'learning_rate': 1.6920793784515665e-05, 'epoch': 0.52} {'loss': 0.7543, 'learning_rate': 1.692055749146629e-05, 'epoch': 0.52} {'loss': 0.8657, 'learning_rate': 1.692032119100091e-05, 'epoch': 0.52} {'loss': 0.9092, 'learning_rate': 1.6920084883119783e-05, 'epoch': 0.52} {'loss': 0.6575, 'learning_rate': 1.691984856782316e-05, 'epoch': 0.52} {'loss': 0.8501, 'learning_rate': 1.6919612245111297e-05, 'epoch': 0.52} {'loss': 0.9328, 'learning_rate': 1.6919375914984445e-05, 'epoch': 0.52} {'loss': 0.7914, 'learning_rate': 1.6919139577442854e-05, 'epoch': 0.52} {'loss': 0.76, 'learning_rate': 1.6918903232486783e-05, 'epoch': 0.52} {'loss': 0.9117, 'learning_rate': 1.691866688011648e-05, 'epoch': 0.52} {'loss': 0.8773, 'learning_rate': 1.6918430520332207e-05, 'epoch': 0.52} {'loss': 0.7687, 'learning_rate': 1.6918194153134203e-05, 'epoch': 0.52} {'loss': 1.013, 'learning_rate': 1.6917957778522732e-05, 'epoch': 0.52} {'loss': 0.6664, 'learning_rate': 1.6917721396498047e-05, 'epoch': 0.52} {'loss': 0.8009, 'learning_rate': 1.69174850070604e-05, 'epoch': 0.52} {'loss': 0.9823, 'learning_rate': 1.6917248610210043e-05, 'epoch': 0.52} {'loss': 0.935, 'learning_rate': 1.691701220594723e-05, 'epoch': 0.52} {'loss': 0.7358, 'learning_rate': 1.691677579427221e-05, 'epoch': 0.52} {'loss': 0.8015, 'learning_rate': 1.6916539375185244e-05, 'epoch': 0.52} {'loss': 1.0171, 'learning_rate': 1.691630294868658e-05, 'epoch': 0.52} {'loss': 0.8651, 'learning_rate': 1.6916066514776477e-05, 'epoch': 0.52} {'loss': 0.8353, 'learning_rate': 1.6915830073455182e-05, 'epoch': 0.52} {'loss': 0.8858, 'learning_rate': 1.691559362472295e-05, 'epoch': 0.52} {'loss': 0.8774, 'learning_rate': 1.6915357168580034e-05, 'epoch': 0.52} {'loss': 0.716, 'learning_rate': 1.691512070502669e-05, 'epoch': 0.52} {'loss': 0.7299, 'learning_rate': 1.6914884234063175e-05, 'epoch': 0.52} {'loss': 0.8404, 'learning_rate': 1.691464775568973e-05, 'epoch': 0.52} {'loss': 0.9488, 'learning_rate': 1.691441126990662e-05, 'epoch': 0.52} {'loss': 0.6402, 'learning_rate': 1.6914174776714092e-05, 'epoch': 0.52} {'loss': 0.6798, 'learning_rate': 1.6913938276112403e-05, 'epoch': 0.52} {'loss': 0.7976, 'learning_rate': 1.6913701768101806e-05, 'epoch': 0.52} {'loss': 0.7598, 'learning_rate': 1.691346525268255e-05, 'epoch': 0.52} {'loss': 0.8394, 'learning_rate': 1.6913228729854896e-05, 'epoch': 0.52} {'loss': 0.7786, 'learning_rate': 1.6912992199619093e-05, 'epoch': 0.52} {'loss': 0.9594, 'learning_rate': 1.6912755661975393e-05, 'epoch': 0.52} {'loss': 0.7976, 'learning_rate': 1.6912519116924052e-05, 'epoch': 0.52} {'loss': 0.8887, 'learning_rate': 1.6912282564465322e-05, 'epoch': 0.52} {'loss': 0.8335, 'learning_rate': 1.691204600459946e-05, 'epoch': 0.52} {'loss': 0.7254, 'learning_rate': 1.6911809437326717e-05, 'epoch': 0.52} {'loss': 0.9451, 'learning_rate': 1.691157286264734e-05, 'epoch': 0.52} {'loss': 0.781, 'learning_rate': 1.6911336280561595e-05, 'epoch': 0.52} {'loss': 0.9402, 'learning_rate': 1.691109969106973e-05, 'epoch': 0.52} {'loss': 0.9731, 'learning_rate': 1.6910863094171995e-05, 'epoch': 0.52} {'loss': 0.8765, 'learning_rate': 1.691062648986865e-05, 'epoch': 0.52} {'loss': 0.9078, 'learning_rate': 1.691038987815994e-05, 'epoch': 0.52} {'loss': 0.8899, 'learning_rate': 1.6910153259046125e-05, 'epoch': 0.52} {'loss': 0.7366, 'learning_rate': 1.690991663252746e-05, 'epoch': 0.52} {'loss': 0.7732, 'learning_rate': 1.6909679998604192e-05, 'epoch': 0.52} {'loss': 0.6204, 'learning_rate': 1.690944335727658e-05, 'epoch': 0.52} {'loss': 0.9432, 'learning_rate': 1.6909206708544877e-05, 'epoch': 0.52} {'loss': 0.771, 'learning_rate': 1.6908970052409335e-05, 'epoch': 0.52} {'loss': 0.6849, 'learning_rate': 1.6908733388870207e-05, 'epoch': 0.52} {'loss': 0.8434, 'learning_rate': 1.690849671792775e-05, 'epoch': 0.52} {'loss': 0.9702, 'learning_rate': 1.6908260039582208e-05, 'epoch': 0.52} {'loss': 0.9063, 'learning_rate': 1.690802335383385e-05, 'epoch': 0.52} {'loss': 0.9274, 'learning_rate': 1.6907786660682917e-05, 'epoch': 0.52} {'loss': 1.0096, 'learning_rate': 1.690754996012967e-05, 'epoch': 0.52} {'loss': 0.8249, 'learning_rate': 1.690731325217436e-05, 'epoch': 0.52} {'loss': 0.9198, 'learning_rate': 1.6907076536817238e-05, 'epoch': 0.52} {'loss': 0.9476, 'learning_rate': 1.6906839814058557e-05, 'epoch': 0.52} {'loss': 1.0578, 'learning_rate': 1.690660308389858e-05, 'epoch': 0.52} {'loss': 0.7237, 'learning_rate': 1.690636634633755e-05, 'epoch': 0.52} {'loss': 0.9296, 'learning_rate': 1.690612960137573e-05, 'epoch': 0.52} {'loss': 1.0672, 'learning_rate': 1.6905892849013366e-05, 'epoch': 0.52} {'loss': 0.7962, 'learning_rate': 1.6905656089250712e-05, 'epoch': 0.52} {'loss': 0.8461, 'learning_rate': 1.6905419322088027e-05, 'epoch': 0.52} {'loss': 0.6959, 'learning_rate': 1.6905182547525563e-05, 'epoch': 0.52} {'loss': 0.8189, 'learning_rate': 1.690494576556357e-05, 'epoch': 0.52} {'loss': 0.8872, 'learning_rate': 1.6904708976202307e-05, 'epoch': 0.52} {'loss': 0.853, 'learning_rate': 1.6904472179442023e-05, 'epoch': 0.52} {'loss': 0.7362, 'learning_rate': 1.6904235375282974e-05, 'epoch': 0.52} {'loss': 0.8746, 'learning_rate': 1.6903998563725418e-05, 'epoch': 0.52} {'loss': 0.9191, 'learning_rate': 1.6903761744769598e-05, 'epoch': 0.52} {'loss': 0.9234, 'learning_rate': 1.6903524918415775e-05, 'epoch': 0.52} {'loss': 0.9107, 'learning_rate': 1.6903288084664208e-05, 'epoch': 0.52} {'loss': 0.9285, 'learning_rate': 1.6903051243515142e-05, 'epoch': 0.52} {'loss': 0.8055, 'learning_rate': 1.690281439496883e-05, 'epoch': 0.52} {'loss': 1.0568, 'learning_rate': 1.690257753902553e-05, 'epoch': 0.52} {'loss': 0.8106, 'learning_rate': 1.69023406756855e-05, 'epoch': 0.52} {'loss': 0.7773, 'learning_rate': 1.6902103804948983e-05, 'epoch': 0.52} {'loss': 0.8769, 'learning_rate': 1.6901866926816243e-05, 'epoch': 0.52} {'loss': 0.8211, 'learning_rate': 1.6901630041287526e-05, 'epoch': 0.52} {'loss': 0.9685, 'learning_rate': 1.6901393148363094e-05, 'epoch': 0.52} {'loss': 1.007, 'learning_rate': 1.6901156248043193e-05, 'epoch': 0.52} {'loss': 0.8229, 'learning_rate': 1.6900919340328082e-05, 'epoch': 0.52} {'loss': 0.6599, 'learning_rate': 1.690068242521801e-05, 'epoch': 0.52} {'loss': 0.9102, 'learning_rate': 1.6900445502713236e-05, 'epoch': 0.52} {'loss': 0.8625, 'learning_rate': 1.6900208572814016e-05, 'epoch': 0.52} {'loss': 0.8541, 'learning_rate': 1.6899971635520595e-05, 'epoch': 0.52} {'loss': 0.8462, 'learning_rate': 1.689973469083323e-05, 'epoch': 0.52} {'loss': 0.9356, 'learning_rate': 1.689949773875218e-05, 'epoch': 0.52} {'loss': 1.1085, 'learning_rate': 1.6899260779277694e-05, 'epoch': 0.52} {'loss': 0.8255, 'learning_rate': 1.689902381241003e-05, 'epoch': 0.52} {'loss': 0.9201, 'learning_rate': 1.689878683814944e-05, 'epoch': 0.52} {'loss': 0.7755, 'learning_rate': 1.689854985649617e-05, 'epoch': 0.52} {'loss': 0.8195, 'learning_rate': 1.6898312867450487e-05, 'epoch': 0.52} {'loss': 1.0139, 'learning_rate': 1.6898075871012638e-05, 'epoch': 0.52} {'loss': 0.7988, 'learning_rate': 1.689783886718288e-05, 'epoch': 0.52} {'loss': 0.744, 'learning_rate': 1.6897601855961462e-05, 'epoch': 0.52} {'loss': 0.8846, 'learning_rate': 1.6897364837348643e-05, 'epoch': 0.52} {'loss': 0.9171, 'learning_rate': 1.6897127811344673e-05, 'epoch': 0.52} {'loss': 0.8155, 'learning_rate': 1.6896890777949808e-05, 'epoch': 0.52} {'loss': 1.0078, 'learning_rate': 1.6896653737164302e-05, 'epoch': 0.52} {'loss': 0.8306, 'learning_rate': 1.6896416688988414e-05, 'epoch': 0.52} {'loss': 0.7519, 'learning_rate': 1.6896179633422387e-05, 'epoch': 0.52} {'loss': 0.8965, 'learning_rate': 1.6895942570466485e-05, 'epoch': 0.52} {'loss': 0.8569, 'learning_rate': 1.689570550012096e-05, 'epoch': 0.52} {'loss': 0.9095, 'learning_rate': 1.6895468422386058e-05, 'epoch': 0.52} {'loss': 0.8623, 'learning_rate': 1.689523133726204e-05, 'epoch': 0.52} {'loss': 0.7309, 'learning_rate': 1.6894994244749164e-05, 'epoch': 0.52} {'loss': 0.8689, 'learning_rate': 1.6894757144847674e-05, 'epoch': 0.52} {'loss': 0.8414, 'learning_rate': 1.689452003755783e-05, 'epoch': 0.52} {'loss': 0.8993, 'learning_rate': 1.689428292287989e-05, 'epoch': 0.52} {'loss': 0.7261, 'learning_rate': 1.6894045800814104e-05, 'epoch': 0.52} {'loss': 0.8341, 'learning_rate': 1.6893808671360722e-05, 'epoch': 0.52} {'loss': 0.9341, 'learning_rate': 1.689357153452e-05, 'epoch': 0.52} {'loss': 0.8406, 'learning_rate': 1.68933343902922e-05, 'epoch': 0.52} {'loss': 0.9026, 'learning_rate': 1.689309723867756e-05, 'epoch': 0.52} {'loss': 0.8956, 'learning_rate': 1.6892860079676357e-05, 'epoch': 0.52} {'loss': 0.7838, 'learning_rate': 1.6892622913288825e-05, 'epoch': 0.52} {'loss': 0.8834, 'learning_rate': 1.6892385739515227e-05, 'epoch': 0.52} {'loss': 0.852, 'learning_rate': 1.6892148558355813e-05, 'epoch': 0.52} {'loss': 0.9035, 'learning_rate': 1.6891911369810844e-05, 'epoch': 0.52} {'loss': 0.8995, 'learning_rate': 1.6891674173880565e-05, 'epoch': 0.52} {'loss': 1.0498, 'learning_rate': 1.689143697056524e-05, 'epoch': 0.52} {'loss': 0.6934, 'learning_rate': 1.6891199759865114e-05, 'epoch': 0.52} {'loss': 0.7897, 'learning_rate': 1.689096254178045e-05, 'epoch': 0.52} {'loss': 0.6704, 'learning_rate': 1.6890725316311497e-05, 'epoch': 0.52} {'loss': 0.8227, 'learning_rate': 1.6890488083458506e-05, 'epoch': 0.52} {'loss': 0.8897, 'learning_rate': 1.689025084322174e-05, 'epoch': 0.52} {'loss': 0.8261, 'learning_rate': 1.6890013595601444e-05, 'epoch': 0.52} {'loss': 0.8569, 'learning_rate': 1.6889776340597877e-05, 'epoch': 0.52} {'loss': 0.8406, 'learning_rate': 1.6889539078211297e-05, 'epoch': 0.52} {'loss': 0.7292, 'learning_rate': 1.688930180844195e-05, 'epoch': 0.52} {'loss': 0.9305, 'learning_rate': 1.6889064531290095e-05, 'epoch': 0.52} {'loss': 0.8536, 'learning_rate': 1.688882724675599e-05, 'epoch': 0.52} {'loss': 0.8623, 'learning_rate': 1.6888589954839878e-05, 'epoch': 0.52} {'loss': 0.8692, 'learning_rate': 1.6888352655542025e-05, 'epoch': 0.52} {'loss': 0.8541, 'learning_rate': 1.6888115348862675e-05, 'epoch': 0.52} {'loss': 0.8205, 'learning_rate': 1.6887878034802095e-05, 'epoch': 0.52} {'loss': 0.7763, 'learning_rate': 1.6887640713360527e-05, 'epoch': 0.52} {'loss': 0.9471, 'learning_rate': 1.6887403384538232e-05, 'epoch': 0.52} {'loss': 0.8371, 'learning_rate': 1.688716604833546e-05, 'epoch': 0.52} {'loss': 0.8099, 'learning_rate': 1.6886928704752472e-05, 'epoch': 0.52} {'loss': 0.7969, 'learning_rate': 1.688669135378952e-05, 'epoch': 0.52} {'loss': 0.7652, 'learning_rate': 1.688645399544685e-05, 'epoch': 0.52} {'loss': 0.7844, 'learning_rate': 1.6886216629724725e-05, 'epoch': 0.52} {'loss': 0.8782, 'learning_rate': 1.68859792566234e-05, 'epoch': 0.52} {'loss': 0.8833, 'learning_rate': 1.6885741876143124e-05, 'epoch': 0.52} {'loss': 0.7973, 'learning_rate': 1.6885504488284157e-05, 'epoch': 0.52} {'loss': 0.7946, 'learning_rate': 1.6885267093046748e-05, 'epoch': 0.52} {'loss': 0.9708, 'learning_rate': 1.6885029690431153e-05, 'epoch': 0.52} {'loss': 0.7811, 'learning_rate': 1.6884792280437633e-05, 'epoch': 0.52} {'loss': 0.891, 'learning_rate': 1.6884554863066432e-05, 'epoch': 0.52} {'loss': 0.8641, 'learning_rate': 1.688431743831781e-05, 'epoch': 0.52} {'loss': 0.8945, 'learning_rate': 1.688408000619202e-05, 'epoch': 0.52} {'loss': 0.7582, 'learning_rate': 1.688384256668932e-05, 'epoch': 0.52} {'loss': 0.8043, 'learning_rate': 1.6883605119809957e-05, 'epoch': 0.52} {'loss': 0.8244, 'learning_rate': 1.6883367665554188e-05, 'epoch': 0.52} {'loss': 0.926, 'learning_rate': 1.6883130203922274e-05, 'epoch': 0.52} {'loss': 0.8175, 'learning_rate': 1.688289273491446e-05, 'epoch': 0.52} {'loss': 0.7386, 'learning_rate': 1.688265525853101e-05, 'epoch': 0.52} {'loss': 0.6935, 'learning_rate': 1.6882417774772176e-05, 'epoch': 0.52} {'loss': 0.9579, 'learning_rate': 1.6882180283638206e-05, 'epoch': 0.52} {'loss': 0.8969, 'learning_rate': 1.688194278512936e-05, 'epoch': 0.52} {'loss': 0.8019, 'learning_rate': 1.688170527924589e-05, 'epoch': 0.52} {'loss': 0.8125, 'learning_rate': 1.688146776598805e-05, 'epoch': 0.52} {'loss': 0.8087, 'learning_rate': 1.68812302453561e-05, 'epoch': 0.52} {'loss': 1.012, 'learning_rate': 1.688099271735029e-05, 'epoch': 0.52} {'loss': 0.8286, 'learning_rate': 1.6880755181970873e-05, 'epoch': 0.52} {'loss': 0.7709, 'learning_rate': 1.6880517639218105e-05, 'epoch': 0.52} {'loss': 0.7569, 'learning_rate': 1.6880280089092247e-05, 'epoch': 0.52} {'loss': 0.8975, 'learning_rate': 1.6880042531593543e-05, 'epoch': 0.52} {'loss': 0.8818, 'learning_rate': 1.687980496672225e-05, 'epoch': 0.52} {'loss': 0.9269, 'learning_rate': 1.6879567394478632e-05, 'epoch': 0.52} {'loss': 0.9706, 'learning_rate': 1.6879329814862936e-05, 'epoch': 0.52} {'loss': 0.8573, 'learning_rate': 1.6879092227875414e-05, 'epoch': 0.52} {'loss': 0.8894, 'learning_rate': 1.6878854633516324e-05, 'epoch': 0.52} {'loss': 0.9037, 'learning_rate': 1.687861703178592e-05, 'epoch': 0.52} {'loss': 0.8343, 'learning_rate': 1.6878379422684457e-05, 'epoch': 0.52} {'loss': 0.6591, 'learning_rate': 1.6878141806212192e-05, 'epoch': 0.52} {'loss': 0.905, 'learning_rate': 1.6877904182369372e-05, 'epoch': 0.52} {'loss': 0.7128, 'learning_rate': 1.6877666551156265e-05, 'epoch': 0.52} {'loss': 0.653, 'learning_rate': 1.6877428912573113e-05, 'epoch': 0.52} {'loss': 0.824, 'learning_rate': 1.6877191266620175e-05, 'epoch': 0.52} {'loss': 0.8846, 'learning_rate': 1.6876953613297705e-05, 'epoch': 0.52} {'loss': 0.848, 'learning_rate': 1.687671595260596e-05, 'epoch': 0.52} {'loss': 0.9118, 'learning_rate': 1.6876478284545194e-05, 'epoch': 0.52} {'loss': 0.7089, 'learning_rate': 1.6876240609115662e-05, 'epoch': 0.52} {'loss': 0.6948, 'learning_rate': 1.6876002926317614e-05, 'epoch': 0.52} {'loss': 0.6507, 'learning_rate': 1.6875765236151308e-05, 'epoch': 0.52} {'loss': 0.7503, 'learning_rate': 1.6875527538617e-05, 'epoch': 0.52} {'loss': 0.8914, 'learning_rate': 1.6875289833714944e-05, 'epoch': 0.52} {'loss': 0.7254, 'learning_rate': 1.6875052121445398e-05, 'epoch': 0.52} {'loss': 0.8085, 'learning_rate': 1.687481440180861e-05, 'epoch': 0.52} {'loss': 0.8578, 'learning_rate': 1.6874576674804837e-05, 'epoch': 0.52} {'loss': 0.8545, 'learning_rate': 1.6874338940434335e-05, 'epoch': 0.52} {'loss': 0.9769, 'learning_rate': 1.687410119869736e-05, 'epoch': 0.52} {'loss': 0.8377, 'learning_rate': 1.6873863449594165e-05, 'epoch': 0.52} {'loss': 0.7954, 'learning_rate': 1.6873625693125003e-05, 'epoch': 0.52} {'loss': 0.8508, 'learning_rate': 1.687338792929013e-05, 'epoch': 0.52} {'loss': 0.9305, 'learning_rate': 1.6873150158089805e-05, 'epoch': 0.52} {'loss': 0.9183, 'learning_rate': 1.6872912379524274e-05, 'epoch': 0.52} {'loss': 0.8173, 'learning_rate': 1.6872674593593802e-05, 'epoch': 0.52} {'loss': 0.9949, 'learning_rate': 1.6872436800298636e-05, 'epoch': 0.52} {'loss': 0.8357, 'learning_rate': 1.6872198999639037e-05, 'epoch': 0.52} {'loss': 0.7822, 'learning_rate': 1.6871961191615255e-05, 'epoch': 0.52} {'loss': 0.9505, 'learning_rate': 1.6871723376227545e-05, 'epoch': 0.52} {'loss': 0.7196, 'learning_rate': 1.687148555347616e-05, 'epoch': 0.52} {'loss': 0.9118, 'learning_rate': 1.6871247723361364e-05, 'epoch': 0.52} {'loss': 0.9614, 'learning_rate': 1.6871009885883404e-05, 'epoch': 0.52} {'loss': 0.9153, 'learning_rate': 1.687077204104254e-05, 'epoch': 0.52} {'loss': 0.8067, 'learning_rate': 1.6870534188839016e-05, 'epoch': 0.52} {'loss': 0.8837, 'learning_rate': 1.68702963292731e-05, 'epoch': 0.52} {'loss': 0.9469, 'learning_rate': 1.687005846234504e-05, 'epoch': 0.52} {'loss': 0.8446, 'learning_rate': 1.6869820588055094e-05, 'epoch': 0.52} {'loss': 0.8339, 'learning_rate': 1.6869582706403512e-05, 'epoch': 0.52} {'loss': 0.8395, 'learning_rate': 1.6869344817390553e-05, 'epoch': 0.52} {'loss': 0.9308, 'learning_rate': 1.6869106921016475e-05, 'epoch': 0.52} {'loss': 0.9166, 'learning_rate': 1.6868869017281528e-05, 'epoch': 0.52} {'loss': 0.8026, 'learning_rate': 1.6868631106185966e-05, 'epoch': 0.52} {'loss': 0.7294, 'learning_rate': 1.686839318773004e-05, 'epoch': 0.52} {'loss': 0.7961, 'learning_rate': 1.6868155261914018e-05, 'epoch': 0.52} {'loss': 0.7246, 'learning_rate': 1.6867917328738147e-05, 'epoch': 0.52} {'loss': 0.9539, 'learning_rate': 1.686767938820268e-05, 'epoch': 0.52} {'loss': 1.045, 'learning_rate': 1.6867441440307878e-05, 'epoch': 0.52} {'loss': 0.8277, 'learning_rate': 1.686720348505399e-05, 'epoch': 0.52} {'loss': 0.9003, 'learning_rate': 1.6866965522441276e-05, 'epoch': 0.52} {'loss': 0.6918, 'learning_rate': 1.6866727552469985e-05, 'epoch': 0.52} {'loss': 0.6932, 'learning_rate': 1.686648957514038e-05, 'epoch': 0.52} {'loss': 0.9195, 'learning_rate': 1.686625159045271e-05, 'epoch': 0.52} {'loss': 0.8028, 'learning_rate': 1.6866013598407232e-05, 'epoch': 0.52} {'loss': 0.9033, 'learning_rate': 1.68657755990042e-05, 'epoch': 0.52} {'loss': 0.7393, 'learning_rate': 1.686553759224387e-05, 'epoch': 0.52} {'loss': 0.6634, 'learning_rate': 1.6865299578126495e-05, 'epoch': 0.52} {'loss': 0.9493, 'learning_rate': 1.6865061556652332e-05, 'epoch': 0.52} {'loss': 0.9336, 'learning_rate': 1.686482352782164e-05, 'epoch': 0.52} {'loss': 0.749, 'learning_rate': 1.686458549163467e-05, 'epoch': 0.52} {'loss': 0.8287, 'learning_rate': 1.6864347448091673e-05, 'epoch': 0.52} {'loss': 0.5704, 'learning_rate': 1.686410939719291e-05, 'epoch': 0.52} {'loss': 0.7645, 'learning_rate': 1.6863871338938635e-05, 'epoch': 0.52} {'loss': 0.7564, 'learning_rate': 1.68636332733291e-05, 'epoch': 0.52} {'loss': 1.0417, 'learning_rate': 1.6863395200364564e-05, 'epoch': 0.52} {'loss': 0.8095, 'learning_rate': 1.686315712004528e-05, 'epoch': 0.52} {'loss': 0.8101, 'learning_rate': 1.6862919032371508e-05, 'epoch': 0.52} {'loss': 0.8281, 'learning_rate': 1.6862680937343494e-05, 'epoch': 0.52} {'loss': 0.7282, 'learning_rate': 1.6862442834961496e-05, 'epoch': 0.52} {'loss': 0.6454, 'learning_rate': 1.6862204725225778e-05, 'epoch': 0.52} {'loss': 0.7878, 'learning_rate': 1.686196660813658e-05, 'epoch': 0.52} {'loss': 0.7721, 'learning_rate': 1.686172848369417e-05, 'epoch': 0.52} {'loss': 0.8276, 'learning_rate': 1.6861490351898798e-05, 'epoch': 0.52} {'loss': 0.9013, 'learning_rate': 1.686125221275072e-05, 'epoch': 0.52} {'loss': 0.8203, 'learning_rate': 1.6861014066250196e-05, 'epoch': 0.52} {'loss': 0.8726, 'learning_rate': 1.686077591239747e-05, 'epoch': 0.52} {'loss': 0.7165, 'learning_rate': 1.6860537751192806e-05, 'epoch': 0.52} {'loss': 0.8056, 'learning_rate': 1.6860299582636453e-05, 'epoch': 0.52} {'loss': 0.9113, 'learning_rate': 1.6860061406728675e-05, 'epoch': 0.52} {'loss': 0.6386, 'learning_rate': 1.685982322346972e-05, 'epoch': 0.52} {'loss': 0.7739, 'learning_rate': 1.6859585032859843e-05, 'epoch': 0.52} {'loss': 0.9642, 'learning_rate': 1.68593468348993e-05, 'epoch': 0.52} {'loss': 0.8092, 'learning_rate': 1.6859108629588356e-05, 'epoch': 0.52} {'loss': 0.7732, 'learning_rate': 1.6858870416927252e-05, 'epoch': 0.52} {'loss': 0.7814, 'learning_rate': 1.685863219691625e-05, 'epoch': 0.52} {'loss': 0.7957, 'learning_rate': 1.6858393969555604e-05, 'epoch': 0.52} {'loss': 0.9203, 'learning_rate': 1.6858155734845572e-05, 'epoch': 0.52} {'loss': 0.9231, 'learning_rate': 1.6857917492786404e-05, 'epoch': 0.52} {'loss': 0.7102, 'learning_rate': 1.685767924337836e-05, 'epoch': 0.52} {'loss': 0.822, 'learning_rate': 1.6857440986621695e-05, 'epoch': 0.52} {'loss': 0.9777, 'learning_rate': 1.6857202722516662e-05, 'epoch': 0.52} {'loss': 0.8368, 'learning_rate': 1.6856964451063516e-05, 'epoch': 0.52} {'loss': 0.8108, 'learning_rate': 1.6856726172262515e-05, 'epoch': 0.52} {'loss': 0.7048, 'learning_rate': 1.6856487886113914e-05, 'epoch': 0.52} {'loss': 0.8313, 'learning_rate': 1.6856249592617966e-05, 'epoch': 0.52} {'loss': 0.6764, 'learning_rate': 1.6856011291774928e-05, 'epoch': 0.52} {'loss': 0.8959, 'learning_rate': 1.6855772983585055e-05, 'epoch': 0.52} {'loss': 0.8487, 'learning_rate': 1.68555346680486e-05, 'epoch': 0.52} {'loss': 1.0028, 'learning_rate': 1.6855296345165828e-05, 'epoch': 0.52} {'loss': 0.9719, 'learning_rate': 1.685505801493698e-05, 'epoch': 0.52} {'loss': 0.8533, 'learning_rate': 1.6854819677362326e-05, 'epoch': 0.52} {'loss': 0.9488, 'learning_rate': 1.685458133244211e-05, 'epoch': 0.52} {'loss': 0.9314, 'learning_rate': 1.685434298017659e-05, 'epoch': 0.52} {'loss': 0.7986, 'learning_rate': 1.6854104620566027e-05, 'epoch': 0.52} {'loss': 0.8539, 'learning_rate': 1.685386625361067e-05, 'epoch': 0.52} {'loss': 0.9141, 'learning_rate': 1.6853627879310775e-05, 'epoch': 0.52} {'loss': 0.736, 'learning_rate': 1.68533894976666e-05, 'epoch': 0.52} {'loss': 0.8298, 'learning_rate': 1.68531511086784e-05, 'epoch': 0.52} {'loss': 0.9051, 'learning_rate': 1.6852912712346427e-05, 'epoch': 0.52} {'loss': 0.7913, 'learning_rate': 1.6852674308670943e-05, 'epoch': 0.52} {'loss': 0.9223, 'learning_rate': 1.68524358976522e-05, 'epoch': 0.52} {'loss': 0.8915, 'learning_rate': 1.6852197479290452e-05, 'epoch': 0.52} {'loss': 0.8674, 'learning_rate': 1.6851959053585956e-05, 'epoch': 0.52} {'loss': 1.0157, 'learning_rate': 1.685172062053897e-05, 'epoch': 0.52} {'loss': 0.8641, 'learning_rate': 1.6851482180149746e-05, 'epoch': 0.52} {'loss': 0.836, 'learning_rate': 1.6851243732418537e-05, 'epoch': 0.52} {'loss': 0.8187, 'learning_rate': 1.6851005277345606e-05, 'epoch': 0.52} {'loss': 0.8339, 'learning_rate': 1.6850766814931203e-05, 'epoch': 0.52} {'loss': 0.8591, 'learning_rate': 1.6850528345175586e-05, 'epoch': 0.52} {'loss': 0.771, 'learning_rate': 1.6850289868079006e-05, 'epoch': 0.52} {'loss': 0.943, 'learning_rate': 1.6850051383641726e-05, 'epoch': 0.52} {'loss': 0.8276, 'learning_rate': 1.6849812891863994e-05, 'epoch': 0.52} {'loss': 0.7923, 'learning_rate': 1.684957439274607e-05, 'epoch': 0.52} {'loss': 0.947, 'learning_rate': 1.6849335886288215e-05, 'epoch': 0.52} {'loss': 0.7894, 'learning_rate': 1.6849097372490676e-05, 'epoch': 0.52} {'loss': 0.7015, 'learning_rate': 1.6848858851353705e-05, 'epoch': 0.52} {'loss': 0.9431, 'learning_rate': 1.684862032287757e-05, 'epoch': 0.52} {'loss': 0.99, 'learning_rate': 1.6848381787062517e-05, 'epoch': 0.52} {'loss': 0.7745, 'learning_rate': 1.6848143243908802e-05, 'epoch': 0.52} {'loss': 0.7938, 'learning_rate': 1.684790469341669e-05, 'epoch': 0.52} {'loss': 0.9063, 'learning_rate': 1.6847666135586426e-05, 'epoch': 0.52} {'loss': 0.7475, 'learning_rate': 1.684742757041827e-05, 'epoch': 0.52} {'loss': 0.994, 'learning_rate': 1.684718899791248e-05, 'epoch': 0.52} {'loss': 0.9522, 'learning_rate': 1.6846950418069306e-05, 'epoch': 0.52} {'loss': 0.9256, 'learning_rate': 1.684671183088901e-05, 'epoch': 0.52} {'loss': 0.8887, 'learning_rate': 1.684647323637184e-05, 'epoch': 0.52} {'loss': 0.7249, 'learning_rate': 1.684623463451806e-05, 'epoch': 0.52} {'loss': 0.8288, 'learning_rate': 1.6845996025327918e-05, 'epoch': 0.52} {'loss': 0.9656, 'learning_rate': 1.6845757408801675e-05, 'epoch': 0.52} {'loss': 0.9243, 'learning_rate': 1.6845518784939587e-05, 'epoch': 0.52} {'loss': 0.7501, 'learning_rate': 1.6845280153741902e-05, 'epoch': 0.52} {'loss': 0.9588, 'learning_rate': 1.684504151520889e-05, 'epoch': 0.52} {'loss': 0.74, 'learning_rate': 1.684480286934079e-05, 'epoch': 0.52} {'loss': 0.8366, 'learning_rate': 1.684456421613787e-05, 'epoch': 0.52} {'loss': 0.899, 'learning_rate': 1.684432555560038e-05, 'epoch': 0.52} {'loss': 0.6604, 'learning_rate': 1.6844086887728583e-05, 'epoch': 0.52} {'loss': 0.8528, 'learning_rate': 1.6843848212522722e-05, 'epoch': 0.52} {'loss': 0.9299, 'learning_rate': 1.6843609529983064e-05, 'epoch': 0.52} {'loss': 0.9034, 'learning_rate': 1.684337084010986e-05, 'epoch': 0.52} {'loss': 0.9195, 'learning_rate': 1.6843132142903368e-05, 'epoch': 0.52} {'loss': 1.0185, 'learning_rate': 1.6842893438363838e-05, 'epoch': 0.52} {'loss': 0.7907, 'learning_rate': 1.684265472649153e-05, 'epoch': 0.52} {'loss': 1.0227, 'learning_rate': 1.6842416007286703e-05, 'epoch': 0.52} {'loss': 0.9804, 'learning_rate': 1.684217728074961e-05, 'epoch': 0.52} {'loss': 0.7649, 'learning_rate': 1.6841938546880506e-05, 'epoch': 0.52} {'loss': 0.7734, 'learning_rate': 1.6841699805679646e-05, 'epoch': 0.52} {'loss': 0.85, 'learning_rate': 1.6841461057147288e-05, 'epoch': 0.52} {'loss': 0.8786, 'learning_rate': 1.6841222301283688e-05, 'epoch': 0.52} {'loss': 0.9112, 'learning_rate': 1.6840983538089098e-05, 'epoch': 0.53} {'loss': 0.8589, 'learning_rate': 1.684074476756378e-05, 'epoch': 0.53} {'loss': 0.775, 'learning_rate': 1.6840505989707986e-05, 'epoch': 0.53} {'loss': 0.9103, 'learning_rate': 1.684026720452197e-05, 'epoch': 0.53} {'loss': 0.8248, 'learning_rate': 1.6840028412005992e-05, 'epoch': 0.53} {'loss': 0.8674, 'learning_rate': 1.6839789612160307e-05, 'epoch': 0.53} {'loss': 0.7672, 'learning_rate': 1.6839550804985168e-05, 'epoch': 0.53} {'loss': 0.7354, 'learning_rate': 1.6839311990480833e-05, 'epoch': 0.53} {'loss': 0.8791, 'learning_rate': 1.683907316864756e-05, 'epoch': 0.53} {'loss': 0.9494, 'learning_rate': 1.6838834339485603e-05, 'epoch': 0.53} {'loss': 0.8245, 'learning_rate': 1.6838595502995216e-05, 'epoch': 0.53} {'loss': 1.0088, 'learning_rate': 1.6838356659176656e-05, 'epoch': 0.53} {'loss': 0.7687, 'learning_rate': 1.683811780803018e-05, 'epoch': 0.53} {'loss': 0.9234, 'learning_rate': 1.6837878949556047e-05, 'epoch': 0.53} {'loss': 0.8302, 'learning_rate': 1.6837640083754505e-05, 'epoch': 0.53} {'loss': 0.7679, 'learning_rate': 1.6837401210625817e-05, 'epoch': 0.53} {'loss': 1.0114, 'learning_rate': 1.6837162330170236e-05, 'epoch': 0.53} {'loss': 0.8888, 'learning_rate': 1.6836923442388016e-05, 'epoch': 0.53} {'loss': 0.7749, 'learning_rate': 1.683668454727942e-05, 'epoch': 0.53} {'loss': 0.9842, 'learning_rate': 1.6836445644844695e-05, 'epoch': 0.53} {'loss': 0.9856, 'learning_rate': 1.6836206735084106e-05, 'epoch': 0.53} {'loss': 0.8366, 'learning_rate': 1.6835967817997904e-05, 'epoch': 0.53} {'loss': 0.9814, 'learning_rate': 1.6835728893586344e-05, 'epoch': 0.53} {'loss': 0.843, 'learning_rate': 1.683548996184968e-05, 'epoch': 0.53} {'loss': 0.8894, 'learning_rate': 1.683525102278818e-05, 'epoch': 0.53} {'loss': 0.7584, 'learning_rate': 1.6835012076402084e-05, 'epoch': 0.53} {'loss': 0.9189, 'learning_rate': 1.6834773122691658e-05, 'epoch': 0.53} {'loss': 0.7868, 'learning_rate': 1.6834534161657155e-05, 'epoch': 0.53} {'loss': 0.6415, 'learning_rate': 1.6834295193298836e-05, 'epoch': 0.53} {'loss': 0.8033, 'learning_rate': 1.683405621761695e-05, 'epoch': 0.53} {'loss': 0.8751, 'learning_rate': 1.6833817234611753e-05, 'epoch': 0.53} {'loss': 0.813, 'learning_rate': 1.6833578244283507e-05, 'epoch': 0.53} {'loss': 0.8829, 'learning_rate': 1.6833339246632464e-05, 'epoch': 0.53} {'loss': 0.7094, 'learning_rate': 1.6833100241658883e-05, 'epoch': 0.53} {'loss': 0.7356, 'learning_rate': 1.6832861229363016e-05, 'epoch': 0.53} {'loss': 0.9488, 'learning_rate': 1.6832622209745123e-05, 'epoch': 0.53} {'loss': 0.9261, 'learning_rate': 1.683238318280546e-05, 'epoch': 0.53} {'loss': 0.6966, 'learning_rate': 1.683214414854428e-05, 'epoch': 0.53} {'loss': 0.7325, 'learning_rate': 1.683190510696184e-05, 'epoch': 0.53} {'loss': 1.0502, 'learning_rate': 1.6831666058058397e-05, 'epoch': 0.53} {'loss': 0.8948, 'learning_rate': 1.6831427001834213e-05, 'epoch': 0.53} {'loss': 0.9672, 'learning_rate': 1.6831187938289533e-05, 'epoch': 0.53} {'loss': 0.8993, 'learning_rate': 1.6830948867424618e-05, 'epoch': 0.53} {'loss': 0.7371, 'learning_rate': 1.6830709789239726e-05, 'epoch': 0.53} {'loss': 0.8114, 'learning_rate': 1.6830470703735114e-05, 'epoch': 0.53} {'loss': 0.9296, 'learning_rate': 1.6830231610911033e-05, 'epoch': 0.53} {'loss': 0.8194, 'learning_rate': 1.6829992510767743e-05, 'epoch': 0.53} {'loss': 0.8908, 'learning_rate': 1.68297534033055e-05, 'epoch': 0.53} {'loss': 0.9427, 'learning_rate': 1.682951428852456e-05, 'epoch': 0.53} {'loss': 0.8868, 'learning_rate': 1.6829275166425182e-05, 'epoch': 0.53} {'loss': 0.7285, 'learning_rate': 1.6829036037007614e-05, 'epoch': 0.53} {'loss': 0.8113, 'learning_rate': 1.682879690027212e-05, 'epoch': 0.53} {'loss': 0.9514, 'learning_rate': 1.6828557756218953e-05, 'epoch': 0.53} {'loss': 0.9243, 'learning_rate': 1.6828318604848374e-05, 'epoch': 0.53} {'loss': 0.9621, 'learning_rate': 1.682807944616063e-05, 'epoch': 0.53} {'loss': 0.8575, 'learning_rate': 1.6827840280155982e-05, 'epoch': 0.53} {'loss': 0.8015, 'learning_rate': 1.682760110683469e-05, 'epoch': 0.53} {'loss': 1.1112, 'learning_rate': 1.6827361926197007e-05, 'epoch': 0.53} {'loss': 1.0563, 'learning_rate': 1.682712273824319e-05, 'epoch': 0.53} {'loss': 1.1243, 'learning_rate': 1.6826883542973496e-05, 'epoch': 0.53} {'loss': 0.8493, 'learning_rate': 1.682664434038818e-05, 'epoch': 0.53} {'loss': 0.9015, 'learning_rate': 1.6826405130487495e-05, 'epoch': 0.53} {'loss': 0.7642, 'learning_rate': 1.68261659132717e-05, 'epoch': 0.53} {'loss': 0.8082, 'learning_rate': 1.6825926688741055e-05, 'epoch': 0.53} {'loss': 0.9101, 'learning_rate': 1.682568745689581e-05, 'epoch': 0.53} {'loss': 0.9827, 'learning_rate': 1.6825448217736227e-05, 'epoch': 0.53} {'loss': 0.8169, 'learning_rate': 1.6825208971262565e-05, 'epoch': 0.53} {'loss': 0.9528, 'learning_rate': 1.682496971747507e-05, 'epoch': 0.53} {'loss': 0.8105, 'learning_rate': 1.6824730456374007e-05, 'epoch': 0.53} {'loss': 0.8535, 'learning_rate': 1.6824491187959626e-05, 'epoch': 0.53} {'loss': 0.8678, 'learning_rate': 1.682425191223219e-05, 'epoch': 0.53} {'loss': 0.7521, 'learning_rate': 1.682401262919195e-05, 'epoch': 0.53} {'loss': 0.8087, 'learning_rate': 1.6823773338839165e-05, 'epoch': 0.53} {'loss': 0.9787, 'learning_rate': 1.682353404117409e-05, 'epoch': 0.53} {'loss': 0.9332, 'learning_rate': 1.6823294736196984e-05, 'epoch': 0.53} {'loss': 0.8196, 'learning_rate': 1.6823055423908103e-05, 'epoch': 0.53} {'loss': 0.7449, 'learning_rate': 1.68228161043077e-05, 'epoch': 0.53} {'loss': 0.825, 'learning_rate': 1.6822576777396036e-05, 'epoch': 0.53} {'loss': 0.6538, 'learning_rate': 1.6822337443173365e-05, 'epoch': 0.53} {'loss': 0.6907, 'learning_rate': 1.682209810163994e-05, 'epoch': 0.53} {'loss': 0.8299, 'learning_rate': 1.6821858752796026e-05, 'epoch': 0.53} {'loss': 0.9162, 'learning_rate': 1.682161939664187e-05, 'epoch': 0.53} {'loss': 0.8469, 'learning_rate': 1.6821380033177735e-05, 'epoch': 0.53} {'loss': 0.8698, 'learning_rate': 1.6821140662403878e-05, 'epoch': 0.53} {'loss': 0.713, 'learning_rate': 1.682090128432055e-05, 'epoch': 0.53} {'loss': 0.8445, 'learning_rate': 1.6820661898928013e-05, 'epoch': 0.53} {'loss': 0.8904, 'learning_rate': 1.682042250622652e-05, 'epoch': 0.53} {'loss': 0.7039, 'learning_rate': 1.6820183106216328e-05, 'epoch': 0.53} {'loss': 0.7728, 'learning_rate': 1.6819943698897695e-05, 'epoch': 0.53} {'loss': 0.9477, 'learning_rate': 1.6819704284270876e-05, 'epoch': 0.53} {'loss': 0.7191, 'learning_rate': 1.681946486233613e-05, 'epoch': 0.53} {'loss': 0.9074, 'learning_rate': 1.681922543309371e-05, 'epoch': 0.53} {'loss': 0.6937, 'learning_rate': 1.6818985996543876e-05, 'epoch': 0.53} {'loss': 0.9826, 'learning_rate': 1.6818746552686882e-05, 'epoch': 0.53} {'loss': 0.8311, 'learning_rate': 1.6818507101522988e-05, 'epoch': 0.53} {'loss': 0.8108, 'learning_rate': 1.6818267643052442e-05, 'epoch': 0.53} {'loss': 0.7949, 'learning_rate': 1.6818028177275512e-05, 'epoch': 0.53} {'loss': 0.8437, 'learning_rate': 1.681778870419245e-05, 'epoch': 0.53} {'loss': 0.8988, 'learning_rate': 1.681754922380351e-05, 'epoch': 0.53} {'loss': 0.966, 'learning_rate': 1.6817309736108952e-05, 'epoch': 0.53} {'loss': 0.9014, 'learning_rate': 1.681707024110903e-05, 'epoch': 0.53} {'loss': 0.8432, 'learning_rate': 1.6816830738804004e-05, 'epoch': 0.53} {'loss': 0.9888, 'learning_rate': 1.681659122919413e-05, 'epoch': 0.53} {'loss': 0.7384, 'learning_rate': 1.6816351712279658e-05, 'epoch': 0.53} {'loss': 0.9122, 'learning_rate': 1.6816112188060853e-05, 'epoch': 0.53} {'loss': 0.8297, 'learning_rate': 1.6815872656537968e-05, 'epoch': 0.53} {'loss': 0.6622, 'learning_rate': 1.681563311771126e-05, 'epoch': 0.53} {'loss': 0.9588, 'learning_rate': 1.6815393571580986e-05, 'epoch': 0.53} {'loss': 0.6872, 'learning_rate': 1.6815154018147405e-05, 'epoch': 0.53} {'loss': 0.7706, 'learning_rate': 1.6814914457410764e-05, 'epoch': 0.53} {'loss': 0.864, 'learning_rate': 1.6814674889371336e-05, 'epoch': 0.53} {'loss': 0.7745, 'learning_rate': 1.6814435314029363e-05, 'epoch': 0.53} {'loss': 0.9387, 'learning_rate': 1.6814195731385112e-05, 'epoch': 0.53} {'loss': 0.8405, 'learning_rate': 1.681395614143883e-05, 'epoch': 0.53} {'loss': 0.8322, 'learning_rate': 1.6813716544190783e-05, 'epoch': 0.53} {'loss': 0.8113, 'learning_rate': 1.6813476939641223e-05, 'epoch': 0.53} {'loss': 0.9183, 'learning_rate': 1.681323732779041e-05, 'epoch': 0.53} {'loss': 0.6501, 'learning_rate': 1.681299770863859e-05, 'epoch': 0.53} {'loss': 0.9999, 'learning_rate': 1.6812758082186036e-05, 'epoch': 0.53} {'loss': 0.8646, 'learning_rate': 1.6812518448432996e-05, 'epoch': 0.53} {'loss': 0.8472, 'learning_rate': 1.6812278807379725e-05, 'epoch': 0.53} {'loss': 0.9278, 'learning_rate': 1.6812039159026483e-05, 'epoch': 0.53} {'loss': 0.9262, 'learning_rate': 1.6811799503373528e-05, 'epoch': 0.53} {'loss': 0.7633, 'learning_rate': 1.6811559840421114e-05, 'epoch': 0.53} {'loss': 0.8524, 'learning_rate': 1.6811320170169496e-05, 'epoch': 0.53} {'loss': 0.7541, 'learning_rate': 1.6811080492618937e-05, 'epoch': 0.53} {'loss': 0.8336, 'learning_rate': 1.681084080776969e-05, 'epoch': 0.53} {'loss': 0.9439, 'learning_rate': 1.681060111562201e-05, 'epoch': 0.53} {'loss': 0.8262, 'learning_rate': 1.681036141617616e-05, 'epoch': 0.53} {'loss': 1.0735, 'learning_rate': 1.6810121709432392e-05, 'epoch': 0.53} {'loss': 0.7424, 'learning_rate': 1.6809881995390962e-05, 'epoch': 0.53} {'loss': 0.9468, 'learning_rate': 1.680964227405213e-05, 'epoch': 0.53} {'loss': 0.9256, 'learning_rate': 1.680940254541615e-05, 'epoch': 0.53} {'loss': 0.8919, 'learning_rate': 1.6809162809483283e-05, 'epoch': 0.53} {'loss': 0.7884, 'learning_rate': 1.6808923066253783e-05, 'epoch': 0.53} {'loss': 0.7837, 'learning_rate': 1.680868331572791e-05, 'epoch': 0.53} {'loss': 0.8016, 'learning_rate': 1.6808443557905912e-05, 'epoch': 0.53} {'loss': 0.8784, 'learning_rate': 1.6808203792788057e-05, 'epoch': 0.53} {'loss': 0.6632, 'learning_rate': 1.6807964020374595e-05, 'epoch': 0.53} {'loss': 0.8245, 'learning_rate': 1.6807724240665785e-05, 'epoch': 0.53} {'loss': 0.6931, 'learning_rate': 1.6807484453661886e-05, 'epoch': 0.53} {'loss': 0.8273, 'learning_rate': 1.6807244659363156e-05, 'epoch': 0.53} {'loss': 0.8924, 'learning_rate': 1.6807004857769843e-05, 'epoch': 0.53} {'loss': 0.7959, 'learning_rate': 1.680676504888221e-05, 'epoch': 0.53} {'loss': 0.8101, 'learning_rate': 1.6806525232700517e-05, 'epoch': 0.53} {'loss': 0.7635, 'learning_rate': 1.6806285409225016e-05, 'epoch': 0.53} {'loss': 0.7806, 'learning_rate': 1.680604557845597e-05, 'epoch': 0.53} {'loss': 0.7326, 'learning_rate': 1.6805805740393625e-05, 'epoch': 0.53} {'loss': 1.0634, 'learning_rate': 1.680556589503825e-05, 'epoch': 0.53} {'loss': 0.8911, 'learning_rate': 1.6805326042390097e-05, 'epoch': 0.53} {'loss': 0.7474, 'learning_rate': 1.6805086182449417e-05, 'epoch': 0.53} {'loss': 0.9997, 'learning_rate': 1.680484631521648e-05, 'epoch': 0.53} {'loss': 0.812, 'learning_rate': 1.6804606440691532e-05, 'epoch': 0.53} {'loss': 0.7449, 'learning_rate': 1.6804366558874834e-05, 'epoch': 0.53} {'loss': 0.918, 'learning_rate': 1.6804126669766646e-05, 'epoch': 0.53} {'loss': 0.9592, 'learning_rate': 1.680388677336722e-05, 'epoch': 0.53} {'loss': 0.958, 'learning_rate': 1.6803646869676817e-05, 'epoch': 0.53} {'loss': 0.7291, 'learning_rate': 1.680340695869569e-05, 'epoch': 0.53} {'loss': 0.8489, 'learning_rate': 1.6803167040424097e-05, 'epoch': 0.53} {'loss': 0.786, 'learning_rate': 1.68029271148623e-05, 'epoch': 0.53} {'loss': 0.7584, 'learning_rate': 1.680268718201055e-05, 'epoch': 0.53} {'loss': 0.9008, 'learning_rate': 1.6802447241869112e-05, 'epoch': 0.53} {'loss': 0.8679, 'learning_rate': 1.680220729443823e-05, 'epoch': 0.53} {'loss': 0.8533, 'learning_rate': 1.6801967339718175e-05, 'epoch': 0.53} {'loss': 0.9733, 'learning_rate': 1.6801727377709195e-05, 'epoch': 0.53} {'loss': 0.7559, 'learning_rate': 1.680148740841155e-05, 'epoch': 0.53} {'loss': 0.9217, 'learning_rate': 1.68012474318255e-05, 'epoch': 0.53} {'loss': 0.7712, 'learning_rate': 1.6801007447951297e-05, 'epoch': 0.53} {'loss': 1.0375, 'learning_rate': 1.68007674567892e-05, 'epoch': 0.53} {'loss': 0.8427, 'learning_rate': 1.6800527458339472e-05, 'epoch': 0.53} {'loss': 0.8858, 'learning_rate': 1.6800287452602362e-05, 'epoch': 0.53} {'loss': 0.8767, 'learning_rate': 1.680004743957813e-05, 'epoch': 0.53} {'loss': 0.7947, 'learning_rate': 1.6799807419267035e-05, 'epoch': 0.53} {'loss': 0.7504, 'learning_rate': 1.679956739166933e-05, 'epoch': 0.53} {'loss': 0.9369, 'learning_rate': 1.6799327356785274e-05, 'epoch': 0.53} {'loss': 0.8875, 'learning_rate': 1.679908731461513e-05, 'epoch': 0.53} {'loss': 0.9228, 'learning_rate': 1.6798847265159145e-05, 'epoch': 0.53} {'loss': 0.915, 'learning_rate': 1.6798607208417584e-05, 'epoch': 0.53} {'loss': 0.744, 'learning_rate': 1.6798367144390703e-05, 'epoch': 0.53} {'loss': 0.9041, 'learning_rate': 1.6798127073078755e-05, 'epoch': 0.53} {'loss': 0.9725, 'learning_rate': 1.6797886994482002e-05, 'epoch': 0.53} {'loss': 0.9535, 'learning_rate': 1.6797646908600698e-05, 'epoch': 0.53} {'loss': 0.6856, 'learning_rate': 1.6797406815435104e-05, 'epoch': 0.53} {'loss': 0.8335, 'learning_rate': 1.6797166714985474e-05, 'epoch': 0.53} {'loss': 0.8878, 'learning_rate': 1.6796926607252065e-05, 'epoch': 0.53} {'loss': 0.8346, 'learning_rate': 1.6796686492235138e-05, 'epoch': 0.53} {'loss': 0.9484, 'learning_rate': 1.6796446369934948e-05, 'epoch': 0.53} {'loss': 0.8341, 'learning_rate': 1.679620624035175e-05, 'epoch': 0.53} {'loss': 0.8536, 'learning_rate': 1.6795966103485807e-05, 'epoch': 0.53} {'loss': 0.8838, 'learning_rate': 1.679572595933737e-05, 'epoch': 0.53} {'loss': 0.851, 'learning_rate': 1.67954858079067e-05, 'epoch': 0.53} {'loss': 0.8401, 'learning_rate': 1.6795245649194055e-05, 'epoch': 0.53} {'loss': 0.9521, 'learning_rate': 1.679500548319969e-05, 'epoch': 0.53} {'loss': 0.9153, 'learning_rate': 1.6794765309923865e-05, 'epoch': 0.53} {'loss': 0.8201, 'learning_rate': 1.6794525129366832e-05, 'epoch': 0.53} {'loss': 0.8413, 'learning_rate': 1.6794284941528857e-05, 'epoch': 0.53} {'loss': 0.9403, 'learning_rate': 1.6794044746410186e-05, 'epoch': 0.53} {'loss': 0.9152, 'learning_rate': 1.6793804544011087e-05, 'epoch': 0.53} {'loss': 0.8462, 'learning_rate': 1.679356433433181e-05, 'epoch': 0.53} {'loss': 0.9158, 'learning_rate': 1.6793324117372623e-05, 'epoch': 0.53} {'loss': 0.9635, 'learning_rate': 1.679308389313377e-05, 'epoch': 0.53} {'loss': 0.7763, 'learning_rate': 1.6792843661615515e-05, 'epoch': 0.53} {'loss': 0.8903, 'learning_rate': 1.6792603422818116e-05, 'epoch': 0.53} {'loss': 0.7711, 'learning_rate': 1.6792363176741828e-05, 'epoch': 0.53} {'loss': 0.8208, 'learning_rate': 1.6792122923386914e-05, 'epoch': 0.53} {'loss': 0.8959, 'learning_rate': 1.6791882662753623e-05, 'epoch': 0.53} {'loss': 0.9112, 'learning_rate': 1.6791642394842218e-05, 'epoch': 0.53} {'loss': 1.0618, 'learning_rate': 1.6791402119652957e-05, 'epoch': 0.53} {'loss': 0.7033, 'learning_rate': 1.679116183718609e-05, 'epoch': 0.53} {'loss': 0.8719, 'learning_rate': 1.6790921547441886e-05, 'epoch': 0.53} {'loss': 0.9411, 'learning_rate': 1.6790681250420595e-05, 'epoch': 0.53} {'loss': 0.8615, 'learning_rate': 1.6790440946122474e-05, 'epoch': 0.53} {'loss': 0.8279, 'learning_rate': 1.6790200634547787e-05, 'epoch': 0.53} {'loss': 0.7492, 'learning_rate': 1.6789960315696783e-05, 'epoch': 0.53} {'loss': 0.8663, 'learning_rate': 1.6789719989569725e-05, 'epoch': 0.53} {'loss': 0.9071, 'learning_rate': 1.6789479656166868e-05, 'epoch': 0.53} {'loss': 0.9682, 'learning_rate': 1.6789239315488475e-05, 'epoch': 0.53} {'loss': 0.8367, 'learning_rate': 1.6788998967534794e-05, 'epoch': 0.53} {'loss': 0.815, 'learning_rate': 1.6788758612306093e-05, 'epoch': 0.53} {'loss': 0.9406, 'learning_rate': 1.678851824980262e-05, 'epoch': 0.53} {'loss': 0.9427, 'learning_rate': 1.678827788002464e-05, 'epoch': 0.53} {'loss': 0.9144, 'learning_rate': 1.6788037502972406e-05, 'epoch': 0.53} {'loss': 0.8402, 'learning_rate': 1.6787797118646176e-05, 'epoch': 0.53} {'loss': 0.7828, 'learning_rate': 1.6787556727046212e-05, 'epoch': 0.53} {'loss': 0.7064, 'learning_rate': 1.6787316328172766e-05, 'epoch': 0.53} {'loss': 0.8869, 'learning_rate': 1.67870759220261e-05, 'epoch': 0.53} {'loss': 0.8359, 'learning_rate': 1.678683550860647e-05, 'epoch': 0.53} {'loss': 0.7635, 'learning_rate': 1.6786595087914128e-05, 'epoch': 0.53} {'loss': 0.7452, 'learning_rate': 1.6786354659949343e-05, 'epoch': 0.53} {'loss': 0.817, 'learning_rate': 1.6786114224712362e-05, 'epoch': 0.53} {'loss': 1.0383, 'learning_rate': 1.678587378220345e-05, 'epoch': 0.53} {'loss': 0.707, 'learning_rate': 1.678563333242286e-05, 'epoch': 0.53} {'loss': 1.0627, 'learning_rate': 1.6785392875370853e-05, 'epoch': 0.53} {'loss': 0.9114, 'learning_rate': 1.6785152411047683e-05, 'epoch': 0.53} {'loss': 0.69, 'learning_rate': 1.678491193945361e-05, 'epoch': 0.53} {'loss': 0.8372, 'learning_rate': 1.6784671460588896e-05, 'epoch': 0.53} {'loss': 0.9063, 'learning_rate': 1.6784430974453787e-05, 'epoch': 0.53} {'loss': 0.866, 'learning_rate': 1.678419048104855e-05, 'epoch': 0.53} {'loss': 0.6357, 'learning_rate': 1.6783949980373444e-05, 'epoch': 0.53} {'loss': 0.7074, 'learning_rate': 1.678370947242872e-05, 'epoch': 0.53} {'loss': 0.7526, 'learning_rate': 1.6783468957214643e-05, 'epoch': 0.53} {'loss': 0.8625, 'learning_rate': 1.6783228434731463e-05, 'epoch': 0.53} {'loss': 0.8914, 'learning_rate': 1.6782987904979443e-05, 'epoch': 0.53} {'loss': 0.7722, 'learning_rate': 1.678274736795884e-05, 'epoch': 0.53} {'loss': 0.914, 'learning_rate': 1.678250682366991e-05, 'epoch': 0.53} {'loss': 0.8711, 'learning_rate': 1.678226627211291e-05, 'epoch': 0.53} {'loss': 0.666, 'learning_rate': 1.6782025713288103e-05, 'epoch': 0.53} {'loss': 0.854, 'learning_rate': 1.678178514719574e-05, 'epoch': 0.53} {'loss': 0.9147, 'learning_rate': 1.6781544573836086e-05, 'epoch': 0.53} {'loss': 0.9975, 'learning_rate': 1.678130399320939e-05, 'epoch': 0.53} {'loss': 0.8041, 'learning_rate': 1.678106340531592e-05, 'epoch': 0.53} {'loss': 0.8241, 'learning_rate': 1.6780822810155925e-05, 'epoch': 0.53} {'loss': 0.7506, 'learning_rate': 1.6780582207729667e-05, 'epoch': 0.53} {'loss': 0.8549, 'learning_rate': 1.6780341598037405e-05, 'epoch': 0.53} {'loss': 0.7924, 'learning_rate': 1.6780100981079393e-05, 'epoch': 0.53} {'loss': 0.6902, 'learning_rate': 1.677986035685589e-05, 'epoch': 0.53} {'loss': 0.8127, 'learning_rate': 1.6779619725367157e-05, 'epoch': 0.53} {'loss': 0.8324, 'learning_rate': 1.677937908661345e-05, 'epoch': 0.53} {'loss': 0.8273, 'learning_rate': 1.6779138440595023e-05, 'epoch': 0.53} {'loss': 0.8932, 'learning_rate': 1.677889778731214e-05, 'epoch': 0.53} {'loss': 0.7164, 'learning_rate': 1.6778657126765055e-05, 'epoch': 0.53} {'loss': 0.774, 'learning_rate': 1.6778416458954027e-05, 'epoch': 0.53} {'loss': 0.8417, 'learning_rate': 1.6778175783879316e-05, 'epoch': 0.53} {'loss': 0.915, 'learning_rate': 1.6777935101541178e-05, 'epoch': 0.53} {'loss': 0.9494, 'learning_rate': 1.6777694411939868e-05, 'epoch': 0.53} {'loss': 0.7504, 'learning_rate': 1.6777453715075647e-05, 'epoch': 0.53} {'loss': 0.8172, 'learning_rate': 1.6777213010948773e-05, 'epoch': 0.53} {'loss': 0.7792, 'learning_rate': 1.6776972299559503e-05, 'epoch': 0.53} {'loss': 0.8347, 'learning_rate': 1.67767315809081e-05, 'epoch': 0.53} {'loss': 0.6477, 'learning_rate': 1.677649085499481e-05, 'epoch': 0.53} {'loss': 0.8037, 'learning_rate': 1.6776250121819906e-05, 'epoch': 0.53} {'loss': 0.9002, 'learning_rate': 1.6776009381383633e-05, 'epoch': 0.53} {'loss': 0.9828, 'learning_rate': 1.6775768633686258e-05, 'epoch': 0.53} {'loss': 0.8804, 'learning_rate': 1.6775527878728035e-05, 'epoch': 0.53} {'loss': 0.8062, 'learning_rate': 1.677528711650922e-05, 'epoch': 0.53} {'loss': 0.927, 'learning_rate': 1.6775046347030076e-05, 'epoch': 0.53} {'loss': 0.6907, 'learning_rate': 1.6774805570290852e-05, 'epoch': 0.53} {'loss': 0.7101, 'learning_rate': 1.677456478629182e-05, 'epoch': 0.53} {'loss': 0.7835, 'learning_rate': 1.6774323995033224e-05, 'epoch': 0.53} {'loss': 0.7319, 'learning_rate': 1.6774083196515336e-05, 'epoch': 0.53} {'loss': 0.8963, 'learning_rate': 1.6773842390738403e-05, 'epoch': 0.53} {'loss': 0.9487, 'learning_rate': 1.6773601577702685e-05, 'epoch': 0.53} {'loss': 0.9493, 'learning_rate': 1.6773360757408444e-05, 'epoch': 0.53} {'loss': 0.8045, 'learning_rate': 1.6773119929855933e-05, 'epoch': 0.53} {'loss': 0.806, 'learning_rate': 1.6772879095045414e-05, 'epoch': 0.53} {'loss': 0.6685, 'learning_rate': 1.6772638252977144e-05, 'epoch': 0.53} {'loss': 0.7222, 'learning_rate': 1.677239740365138e-05, 'epoch': 0.53} {'loss': 1.0538, 'learning_rate': 1.677215654706838e-05, 'epoch': 0.53} {'loss': 0.8759, 'learning_rate': 1.6771915683228406e-05, 'epoch': 0.53} {'loss': 0.7791, 'learning_rate': 1.677167481213171e-05, 'epoch': 0.53} {'loss': 0.9152, 'learning_rate': 1.6771433933778554e-05, 'epoch': 0.53} {'loss': 0.8889, 'learning_rate': 1.6771193048169195e-05, 'epoch': 0.53} {'loss': 0.9424, 'learning_rate': 1.6770952155303895e-05, 'epoch': 0.53} {'loss': 0.8516, 'learning_rate': 1.6770711255182908e-05, 'epoch': 0.53} {'loss': 0.8178, 'learning_rate': 1.677047034780649e-05, 'epoch': 0.53} {'loss': 0.7688, 'learning_rate': 1.67702294331749e-05, 'epoch': 0.53} {'loss': 0.8175, 'learning_rate': 1.6769988511288404e-05, 'epoch': 0.53} {'loss': 0.7364, 'learning_rate': 1.676974758214725e-05, 'epoch': 0.53} {'loss': 1.0394, 'learning_rate': 1.6769506645751704e-05, 'epoch': 0.53} {'loss': 0.8943, 'learning_rate': 1.676926570210202e-05, 'epoch': 0.53} {'loss': 0.7393, 'learning_rate': 1.6769024751198454e-05, 'epoch': 0.53} {'loss': 0.8173, 'learning_rate': 1.676878379304127e-05, 'epoch': 0.53} {'loss': 0.9407, 'learning_rate': 1.6768542827630718e-05, 'epoch': 0.53} {'loss': 0.9057, 'learning_rate': 1.6768301854967064e-05, 'epoch': 0.53} {'loss': 0.921, 'learning_rate': 1.6768060875050568e-05, 'epoch': 0.53} {'loss': 0.8534, 'learning_rate': 1.676781988788148e-05, 'epoch': 0.53} {'loss': 0.8398, 'learning_rate': 1.676757889346006e-05, 'epoch': 0.53} {'loss': 0.8401, 'learning_rate': 1.6767337891786572e-05, 'epoch': 0.53} {'loss': 0.7817, 'learning_rate': 1.6767096882861272e-05, 'epoch': 0.53} {'loss': 0.8384, 'learning_rate': 1.6766855866684414e-05, 'epoch': 0.53} {'loss': 0.849, 'learning_rate': 1.676661484325626e-05, 'epoch': 0.53} {'loss': 1.0171, 'learning_rate': 1.676637381257707e-05, 'epoch': 0.53} {'loss': 0.8032, 'learning_rate': 1.6766132774647093e-05, 'epoch': 0.53} {'loss': 0.7082, 'learning_rate': 1.67658917294666e-05, 'epoch': 0.53} {'loss': 0.7239, 'learning_rate': 1.676565067703584e-05, 'epoch': 0.53} {'loss': 1.0535, 'learning_rate': 1.676540961735508e-05, 'epoch': 0.53} {'loss': 0.8389, 'learning_rate': 1.6765168550424566e-05, 'epoch': 0.53} {'loss': 0.9087, 'learning_rate': 1.676492747624457e-05, 'epoch': 0.53} {'loss': 0.7958, 'learning_rate': 1.676468639481534e-05, 'epoch': 0.53} {'loss': 0.8094, 'learning_rate': 1.6764445306137136e-05, 'epoch': 0.53} {'loss': 0.8963, 'learning_rate': 1.676420421021022e-05, 'epoch': 0.53} {'loss': 0.9076, 'learning_rate': 1.6763963107034847e-05, 'epoch': 0.53} {'loss': 0.7418, 'learning_rate': 1.6763721996611286e-05, 'epoch': 0.53} {'loss': 0.8798, 'learning_rate': 1.676348087893978e-05, 'epoch': 0.53} {'loss': 0.8652, 'learning_rate': 1.676323975402059e-05, 'epoch': 0.53} {'loss': 0.7422, 'learning_rate': 1.676299862185398e-05, 'epoch': 0.53} {'loss': 0.7491, 'learning_rate': 1.676275748244021e-05, 'epoch': 0.53} {'loss': 0.7346, 'learning_rate': 1.6762516335779532e-05, 'epoch': 0.53} {'loss': 0.9151, 'learning_rate': 1.6762275181872206e-05, 'epoch': 0.53} {'loss': 0.7663, 'learning_rate': 1.67620340207185e-05, 'epoch': 0.53} {'loss': 0.9463, 'learning_rate': 1.6761792852318657e-05, 'epoch': 0.53} {'loss': 0.9567, 'learning_rate': 1.6761551676672946e-05, 'epoch': 0.53} {'loss': 0.7352, 'learning_rate': 1.676131049378162e-05, 'epoch': 0.53} {'loss': 0.9632, 'learning_rate': 1.676106930364494e-05, 'epoch': 0.53} {'loss': 0.6474, 'learning_rate': 1.676082810626316e-05, 'epoch': 0.53} {'loss': 0.9949, 'learning_rate': 1.676058690163655e-05, 'epoch': 0.53} {'loss': 0.7411, 'learning_rate': 1.676034568976536e-05, 'epoch': 0.53} {'loss': 0.8271, 'learning_rate': 1.6760104470649846e-05, 'epoch': 0.53} {'loss': 1.0166, 'learning_rate': 1.675986324429027e-05, 'epoch': 0.53} {'loss': 0.8447, 'learning_rate': 1.6759622010686887e-05, 'epoch': 0.53} {'loss': 0.7279, 'learning_rate': 1.6759380769839964e-05, 'epoch': 0.53} {'loss': 0.6658, 'learning_rate': 1.6759139521749754e-05, 'epoch': 0.53} {'loss': 0.8074, 'learning_rate': 1.675889826641652e-05, 'epoch': 0.53} {'loss': 0.7299, 'learning_rate': 1.6758657003840507e-05, 'epoch': 0.53} {'loss': 0.9258, 'learning_rate': 1.6758415734021987e-05, 'epoch': 0.53} {'loss': 0.8287, 'learning_rate': 1.6758174456961218e-05, 'epoch': 0.53} {'loss': 0.8711, 'learning_rate': 1.6757933172658455e-05, 'epoch': 0.53} {'loss': 0.8842, 'learning_rate': 1.6757691881113954e-05, 'epoch': 0.53} {'loss': 0.802, 'learning_rate': 1.6757450582327975e-05, 'epoch': 0.53} {'loss': 0.8424, 'learning_rate': 1.675720927630078e-05, 'epoch': 0.53} {'loss': 0.7647, 'learning_rate': 1.6756967963032624e-05, 'epoch': 0.53} {'loss': 0.8677, 'learning_rate': 1.6756726642523767e-05, 'epoch': 0.53} {'loss': 0.8932, 'learning_rate': 1.675648531477447e-05, 'epoch': 0.53} {'loss': 0.8748, 'learning_rate': 1.6756243979784987e-05, 'epoch': 0.53} {'loss': 0.8782, 'learning_rate': 1.6756002637555576e-05, 'epoch': 0.53} {'loss': 0.9474, 'learning_rate': 1.6755761288086507e-05, 'epoch': 0.53} {'loss': 0.8645, 'learning_rate': 1.6755519931378023e-05, 'epoch': 0.53} {'loss': 0.716, 'learning_rate': 1.6755278567430392e-05, 'epoch': 0.53} {'loss': 0.8428, 'learning_rate': 1.675503719624387e-05, 'epoch': 0.53} {'loss': 0.8118, 'learning_rate': 1.6754795817818714e-05, 'epoch': 0.53} {'loss': 0.9648, 'learning_rate': 1.6754554432155184e-05, 'epoch': 0.53} {'loss': 0.7432, 'learning_rate': 1.6754313039253545e-05, 'epoch': 0.53} {'loss': 0.8109, 'learning_rate': 1.6754071639114047e-05, 'epoch': 0.53} {'loss': 0.6586, 'learning_rate': 1.6753830231736953e-05, 'epoch': 0.53} {'loss': 0.8672, 'learning_rate': 1.6753588817122515e-05, 'epoch': 0.53} {'loss': 1.0404, 'learning_rate': 1.6753347395271e-05, 'epoch': 0.53} {'loss': 0.9987, 'learning_rate': 1.6753105966182664e-05, 'epoch': 0.53} {'loss': 1.0168, 'learning_rate': 1.675286452985777e-05, 'epoch': 0.53} {'loss': 0.8224, 'learning_rate': 1.6752623086296566e-05, 'epoch': 0.53} {'loss': 0.837, 'learning_rate': 1.6752381635499317e-05, 'epoch': 0.53} {'loss': 0.7642, 'learning_rate': 1.6752140177466282e-05, 'epoch': 0.53} {'loss': 0.89, 'learning_rate': 1.6751898712197726e-05, 'epoch': 0.53} {'loss': 0.9186, 'learning_rate': 1.675165723969389e-05, 'epoch': 0.53} {'loss': 0.6922, 'learning_rate': 1.675141575995505e-05, 'epoch': 0.53} {'loss': 0.9427, 'learning_rate': 1.6751174272981462e-05, 'epoch': 0.53} {'loss': 0.9365, 'learning_rate': 1.6750932778773378e-05, 'epoch': 0.53} {'loss': 0.8931, 'learning_rate': 1.6750691277331063e-05, 'epoch': 0.53} {'loss': 0.9895, 'learning_rate': 1.6750449768654765e-05, 'epoch': 0.53} {'loss': 0.793, 'learning_rate': 1.6750208252744758e-05, 'epoch': 0.53} {'loss': 0.7712, 'learning_rate': 1.6749966729601293e-05, 'epoch': 0.53} {'loss': 0.7609, 'learning_rate': 1.6749725199224628e-05, 'epoch': 0.53} {'loss': 0.8024, 'learning_rate': 1.6749483661615022e-05, 'epoch': 0.53} {'loss': 1.1015, 'learning_rate': 1.674924211677274e-05, 'epoch': 0.53} {'loss': 0.8337, 'learning_rate': 1.674900056469803e-05, 'epoch': 0.53} {'loss': 0.7829, 'learning_rate': 1.6748759005391157e-05, 'epoch': 0.53} {'loss': 0.8977, 'learning_rate': 1.6748517438852382e-05, 'epoch': 0.53} {'loss': 0.9329, 'learning_rate': 1.674827586508196e-05, 'epoch': 0.53} {'loss': 0.949, 'learning_rate': 1.6748034284080155e-05, 'epoch': 0.53} {'loss': 0.8105, 'learning_rate': 1.674779269584722e-05, 'epoch': 0.53} {'loss': 0.9723, 'learning_rate': 1.6747551100383414e-05, 'epoch': 0.53} {'loss': 0.7664, 'learning_rate': 1.6747309497689e-05, 'epoch': 0.53} {'loss': 0.8507, 'learning_rate': 1.6747067887764235e-05, 'epoch': 0.53} {'loss': 0.8421, 'learning_rate': 1.6746826270609376e-05, 'epoch': 0.53} {'loss': 1.1776, 'learning_rate': 1.6746584646224688e-05, 'epoch': 0.53} {'loss': 0.7411, 'learning_rate': 1.674634301461042e-05, 'epoch': 0.53} {'loss': 0.8981, 'learning_rate': 1.6746101375766843e-05, 'epoch': 0.53} {'loss': 0.8479, 'learning_rate': 1.67458597296942e-05, 'epoch': 0.53} {'loss': 0.7183, 'learning_rate': 1.674561807639277e-05, 'epoch': 0.53} {'loss': 0.885, 'learning_rate': 1.6745376415862794e-05, 'epoch': 0.53} {'loss': 0.8173, 'learning_rate': 1.6745134748104544e-05, 'epoch': 0.53} {'loss': 0.839, 'learning_rate': 1.674489307311827e-05, 'epoch': 0.53} {'loss': 0.8887, 'learning_rate': 1.6744651390904233e-05, 'epoch': 0.53} {'loss': 0.9832, 'learning_rate': 1.6744409701462695e-05, 'epoch': 0.53} {'loss': 0.7536, 'learning_rate': 1.6744168004793912e-05, 'epoch': 0.53} {'loss': 0.736, 'learning_rate': 1.6743926300898146e-05, 'epoch': 0.53} {'loss': 0.8118, 'learning_rate': 1.6743684589775658e-05, 'epoch': 0.53} {'loss': 0.7971, 'learning_rate': 1.6743442871426698e-05, 'epoch': 0.53} {'loss': 0.896, 'learning_rate': 1.674320114585153e-05, 'epoch': 0.53} {'loss': 1.1024, 'learning_rate': 1.6742959413050416e-05, 'epoch': 0.53} {'loss': 1.0557, 'learning_rate': 1.674271767302361e-05, 'epoch': 0.53} {'loss': 0.8456, 'learning_rate': 1.6742475925771374e-05, 'epoch': 0.53} {'loss': 0.6677, 'learning_rate': 1.674223417129397e-05, 'epoch': 0.53} {'loss': 0.9369, 'learning_rate': 1.674199240959165e-05, 'epoch': 0.53} {'loss': 0.7458, 'learning_rate': 1.674175064066468e-05, 'epoch': 0.53} {'loss': 0.8877, 'learning_rate': 1.6741508864513313e-05, 'epoch': 0.53} {'loss': 0.7939, 'learning_rate': 1.674126708113781e-05, 'epoch': 0.53} {'loss': 0.7334, 'learning_rate': 1.674102529053843e-05, 'epoch': 0.53} {'loss': 0.8445, 'learning_rate': 1.6740783492715434e-05, 'epoch': 0.53} {'loss': 0.8125, 'learning_rate': 1.674054168766908e-05, 'epoch': 0.53} {'loss': 0.7111, 'learning_rate': 1.6740299875399627e-05, 'epoch': 0.53} {'loss': 0.9023, 'learning_rate': 1.674005805590734e-05, 'epoch': 0.53} {'loss': 0.8762, 'learning_rate': 1.6739816229192464e-05, 'epoch': 0.53} {'loss': 0.9427, 'learning_rate': 1.673957439525527e-05, 'epoch': 0.53} {'loss': 0.9061, 'learning_rate': 1.6739332554096016e-05, 'epoch': 0.53} {'loss': 0.9587, 'learning_rate': 1.673909070571496e-05, 'epoch': 0.53} {'loss': 0.7759, 'learning_rate': 1.6738848850112357e-05, 'epoch': 0.53} {'loss': 0.8604, 'learning_rate': 1.6738606987288467e-05, 'epoch': 0.53} {'loss': 0.7715, 'learning_rate': 1.6738365117243556e-05, 'epoch': 0.53} {'loss': 0.7805, 'learning_rate': 1.6738123239977876e-05, 'epoch': 0.53} {'loss': 0.8947, 'learning_rate': 1.673788135549169e-05, 'epoch': 0.53} {'loss': 0.9472, 'learning_rate': 1.6737639463785254e-05, 'epoch': 0.53} {'loss': 0.7994, 'learning_rate': 1.673739756485883e-05, 'epoch': 0.53} {'loss': 0.863, 'learning_rate': 1.6737155658712678e-05, 'epoch': 0.53} {'loss': 0.8225, 'learning_rate': 1.6736913745347053e-05, 'epoch': 0.53} {'loss': 0.929, 'learning_rate': 1.6736671824762217e-05, 'epoch': 0.53} {'loss': 0.8831, 'learning_rate': 1.6736429896958432e-05, 'epoch': 0.53} {'loss': 0.8117, 'learning_rate': 1.6736187961935953e-05, 'epoch': 0.53} {'loss': 0.7486, 'learning_rate': 1.6735946019695043e-05, 'epoch': 0.53} {'loss': 0.8828, 'learning_rate': 1.6735704070235956e-05, 'epoch': 0.53} {'loss': 0.9017, 'learning_rate': 1.673546211355895e-05, 'epoch': 0.53} {'loss': 0.7729, 'learning_rate': 1.6735220149664298e-05, 'epoch': 0.53} {'loss': 0.8083, 'learning_rate': 1.6734978178552243e-05, 'epoch': 0.53} {'loss': 0.7078, 'learning_rate': 1.673473620022305e-05, 'epoch': 0.53} {'loss': 0.8207, 'learning_rate': 1.6734494214676984e-05, 'epoch': 0.53} {'loss': 0.7697, 'learning_rate': 1.67342522219143e-05, 'epoch': 0.53} {'loss': 0.7883, 'learning_rate': 1.6734010221935253e-05, 'epoch': 0.53} {'loss': 0.87, 'learning_rate': 1.6733768214740106e-05, 'epoch': 0.53} {'loss': 0.8461, 'learning_rate': 1.6733526200329122e-05, 'epoch': 0.53} {'loss': 0.8296, 'learning_rate': 1.6733284178702557e-05, 'epoch': 0.53} {'loss': 0.8648, 'learning_rate': 1.6733042149860666e-05, 'epoch': 0.53} {'loss': 0.8372, 'learning_rate': 1.6732800113803715e-05, 'epoch': 0.53} {'loss': 0.7905, 'learning_rate': 1.6732558070531964e-05, 'epoch': 0.53} {'loss': 0.7267, 'learning_rate': 1.6732316020045664e-05, 'epoch': 0.53} {'loss': 0.9578, 'learning_rate': 1.6732073962345083e-05, 'epoch': 0.53} {'loss': 0.8166, 'learning_rate': 1.673183189743048e-05, 'epoch': 0.53} {'loss': 0.9722, 'learning_rate': 1.6731589825302104e-05, 'epoch': 0.53} {'loss': 0.7664, 'learning_rate': 1.6731347745960228e-05, 'epoch': 0.53} {'loss': 0.7515, 'learning_rate': 1.6731105659405104e-05, 'epoch': 0.53} {'loss': 0.7756, 'learning_rate': 1.6730863565636993e-05, 'epoch': 0.53} {'loss': 0.806, 'learning_rate': 1.6730621464656152e-05, 'epoch': 0.53} {'loss': 0.8679, 'learning_rate': 1.6730379356462843e-05, 'epoch': 0.53} {'loss': 0.9137, 'learning_rate': 1.6730137241057326e-05, 'epoch': 0.53} {'loss': 0.8731, 'learning_rate': 1.672989511843986e-05, 'epoch': 0.53} {'loss': 0.9241, 'learning_rate': 1.67296529886107e-05, 'epoch': 0.53} {'loss': 0.8366, 'learning_rate': 1.6729410851570117e-05, 'epoch': 0.53} {'loss': 0.8239, 'learning_rate': 1.672916870731836e-05, 'epoch': 0.53} {'loss': 0.7327, 'learning_rate': 1.6728926555855688e-05, 'epoch': 0.53} {'loss': 0.6777, 'learning_rate': 1.6728684397182366e-05, 'epoch': 0.53} {'loss': 0.815, 'learning_rate': 1.6728442231298656e-05, 'epoch': 0.53} {'loss': 0.7943, 'learning_rate': 1.6728200058204804e-05, 'epoch': 0.53} {'loss': 0.8479, 'learning_rate': 1.6727957877901083e-05, 'epoch': 0.53} {'loss': 0.8447, 'learning_rate': 1.672771569038775e-05, 'epoch': 0.53} {'loss': 0.7442, 'learning_rate': 1.6727473495665058e-05, 'epoch': 0.53} {'loss': 0.9113, 'learning_rate': 1.6727231293733272e-05, 'epoch': 0.53} {'loss': 0.8812, 'learning_rate': 1.6726989084592653e-05, 'epoch': 0.53} {'loss': 0.7876, 'learning_rate': 1.6726746868243458e-05, 'epoch': 0.53} {'loss': 0.8379, 'learning_rate': 1.6726504644685945e-05, 'epoch': 0.53} {'loss': 0.8988, 'learning_rate': 1.6726262413920372e-05, 'epoch': 0.53} {'loss': 0.7639, 'learning_rate': 1.672602017594701e-05, 'epoch': 0.53} {'loss': 0.8148, 'learning_rate': 1.6725777930766103e-05, 'epoch': 0.53} {'loss': 0.8662, 'learning_rate': 1.6725535678377923e-05, 'epoch': 0.53} {'loss': 0.7806, 'learning_rate': 1.672529341878272e-05, 'epoch': 0.53} {'loss': 0.7957, 'learning_rate': 1.672505115198076e-05, 'epoch': 0.54} {'loss': 0.7483, 'learning_rate': 1.6724808877972298e-05, 'epoch': 0.54} {'loss': 0.8623, 'learning_rate': 1.6724566596757598e-05, 'epoch': 0.54} {'loss': 0.7429, 'learning_rate': 1.672432430833692e-05, 'epoch': 0.54} {'loss': 1.0077, 'learning_rate': 1.6724082012710524e-05, 'epoch': 0.54} {'loss': 0.7867, 'learning_rate': 1.6723839709878663e-05, 'epoch': 0.54} {'loss': 0.8251, 'learning_rate': 1.67235973998416e-05, 'epoch': 0.54} {'loss': 0.8285, 'learning_rate': 1.67233550825996e-05, 'epoch': 0.54} {'loss': 0.7864, 'learning_rate': 1.672311275815291e-05, 'epoch': 0.54} {'loss': 0.845, 'learning_rate': 1.6722870426501807e-05, 'epoch': 0.54} {'loss': 0.9207, 'learning_rate': 1.672262808764654e-05, 'epoch': 0.54} {'loss': 0.7844, 'learning_rate': 1.6722385741587367e-05, 'epoch': 0.54} {'loss': 0.9479, 'learning_rate': 1.672214338832455e-05, 'epoch': 0.54} {'loss': 0.9392, 'learning_rate': 1.672190102785835e-05, 'epoch': 0.54} {'loss': 0.8004, 'learning_rate': 1.672165866018903e-05, 'epoch': 0.54} {'loss': 0.8771, 'learning_rate': 1.6721416285316844e-05, 'epoch': 0.54} {'loss': 0.7005, 'learning_rate': 1.6721173903242055e-05, 'epoch': 0.54} {'loss': 0.813, 'learning_rate': 1.672093151396492e-05, 'epoch': 0.54} {'loss': 1.0492, 'learning_rate': 1.67206891174857e-05, 'epoch': 0.54} {'loss': 0.8323, 'learning_rate': 1.6720446713804655e-05, 'epoch': 0.54} {'loss': 0.826, 'learning_rate': 1.672020430292205e-05, 'epoch': 0.54} {'loss': 0.7868, 'learning_rate': 1.671996188483813e-05, 'epoch': 0.54} {'loss': 0.5737, 'learning_rate': 1.6719719459553172e-05, 'epoch': 0.54} {'loss': 0.8425, 'learning_rate': 1.6719477027067424e-05, 'epoch': 0.54} {'loss': 0.8885, 'learning_rate': 1.6719234587381154e-05, 'epoch': 0.54} {'loss': 0.9173, 'learning_rate': 1.6718992140494616e-05, 'epoch': 0.54} {'loss': 0.8211, 'learning_rate': 1.671874968640807e-05, 'epoch': 0.54} {'loss': 0.7478, 'learning_rate': 1.671850722512178e-05, 'epoch': 0.54} {'loss': 0.7388, 'learning_rate': 1.6718264756636e-05, 'epoch': 0.54} {'loss': 0.9899, 'learning_rate': 1.671802228095099e-05, 'epoch': 0.54} {'loss': 0.7081, 'learning_rate': 1.671777979806702e-05, 'epoch': 0.54} {'loss': 0.828, 'learning_rate': 1.671753730798434e-05, 'epoch': 0.54} {'loss': 0.8899, 'learning_rate': 1.671729481070321e-05, 'epoch': 0.54} {'loss': 0.9769, 'learning_rate': 1.6717052306223896e-05, 'epoch': 0.54} {'loss': 0.866, 'learning_rate': 1.6716809794546653e-05, 'epoch': 0.54} {'loss': 0.8824, 'learning_rate': 1.6716567275671736e-05, 'epoch': 0.54} {'loss': 1.0265, 'learning_rate': 1.671632474959942e-05, 'epoch': 0.54} {'loss': 1.0095, 'learning_rate': 1.6716082216329953e-05, 'epoch': 0.54} {'loss': 0.7873, 'learning_rate': 1.6715839675863598e-05, 'epoch': 0.54} {'loss': 1.0212, 'learning_rate': 1.671559712820061e-05, 'epoch': 0.54} {'loss': 0.7966, 'learning_rate': 1.6715354573341257e-05, 'epoch': 0.54} {'loss': 0.9958, 'learning_rate': 1.6715112011285797e-05, 'epoch': 0.54} {'loss': 0.9424, 'learning_rate': 1.671486944203449e-05, 'epoch': 0.54} {'loss': 0.7141, 'learning_rate': 1.6714626865587592e-05, 'epoch': 0.54} {'loss': 0.6183, 'learning_rate': 1.6714384281945362e-05, 'epoch': 0.54} {'loss': 0.8452, 'learning_rate': 1.6714141691108068e-05, 'epoch': 0.54} {'loss': 0.7982, 'learning_rate': 1.671389909307596e-05, 'epoch': 0.54} {'loss': 0.829, 'learning_rate': 1.671365648784931e-05, 'epoch': 0.54} {'loss': 0.754, 'learning_rate': 1.6713413875428365e-05, 'epoch': 0.54} {'loss': 0.7372, 'learning_rate': 1.6713171255813395e-05, 'epoch': 0.54} {'loss': 0.8534, 'learning_rate': 1.6712928629004655e-05, 'epoch': 0.54} {'loss': 0.8396, 'learning_rate': 1.6712685995002406e-05, 'epoch': 0.54} {'loss': 0.8889, 'learning_rate': 1.6712443353806906e-05, 'epoch': 0.54} {'loss': 0.8605, 'learning_rate': 1.671220070541842e-05, 'epoch': 0.54} {'loss': 0.8456, 'learning_rate': 1.6711958049837203e-05, 'epoch': 0.54} {'loss': 0.9964, 'learning_rate': 1.671171538706352e-05, 'epoch': 0.54} {'loss': 0.7957, 'learning_rate': 1.6711472717097627e-05, 'epoch': 0.54} {'loss': 0.7788, 'learning_rate': 1.6711230039939784e-05, 'epoch': 0.54} {'loss': 0.7821, 'learning_rate': 1.6710987355590253e-05, 'epoch': 0.54} {'loss': 0.7586, 'learning_rate': 1.6710744664049293e-05, 'epoch': 0.54} {'loss': 0.9957, 'learning_rate': 1.6710501965317166e-05, 'epoch': 0.54} {'loss': 0.6918, 'learning_rate': 1.671025925939413e-05, 'epoch': 0.54} {'loss': 0.8357, 'learning_rate': 1.6710016546280443e-05, 'epoch': 0.54} {'loss': 0.813, 'learning_rate': 1.670977382597637e-05, 'epoch': 0.54} {'loss': 0.9155, 'learning_rate': 1.6709531098482167e-05, 'epoch': 0.54} {'loss': 0.9891, 'learning_rate': 1.67092883637981e-05, 'epoch': 0.54} {'loss': 0.7829, 'learning_rate': 1.670904562192442e-05, 'epoch': 0.54} {'loss': 0.8088, 'learning_rate': 1.6708802872861395e-05, 'epoch': 0.54} {'loss': 0.7589, 'learning_rate': 1.670856011660928e-05, 'epoch': 0.54} {'loss': 0.8474, 'learning_rate': 1.6708317353168338e-05, 'epoch': 0.54} {'loss': 0.8251, 'learning_rate': 1.6708074582538828e-05, 'epoch': 0.54} {'loss': 0.8452, 'learning_rate': 1.6707831804721017e-05, 'epoch': 0.54} {'loss': 0.9638, 'learning_rate': 1.670758901971515e-05, 'epoch': 0.54} {'loss': 0.7507, 'learning_rate': 1.67073462275215e-05, 'epoch': 0.54} {'loss': 0.942, 'learning_rate': 1.6707103428140324e-05, 'epoch': 0.54} {'loss': 0.8562, 'learning_rate': 1.6706860621571877e-05, 'epoch': 0.54} {'loss': 0.8446, 'learning_rate': 1.670661780781643e-05, 'epoch': 0.54} {'loss': 1.0295, 'learning_rate': 1.6706374986874233e-05, 'epoch': 0.54} {'loss': 0.7345, 'learning_rate': 1.6706132158745548e-05, 'epoch': 0.54} {'loss': 0.8576, 'learning_rate': 1.6705889323430642e-05, 'epoch': 0.54} {'loss': 0.8415, 'learning_rate': 1.6705646480929767e-05, 'epoch': 0.54} {'loss': 0.8674, 'learning_rate': 1.6705403631243185e-05, 'epoch': 0.54} {'loss': 0.9808, 'learning_rate': 1.6705160774371162e-05, 'epoch': 0.54} {'loss': 0.7582, 'learning_rate': 1.6704917910313955e-05, 'epoch': 0.54} {'loss': 0.8309, 'learning_rate': 1.670467503907182e-05, 'epoch': 0.54} {'loss': 0.9823, 'learning_rate': 1.6704432160645016e-05, 'epoch': 0.54} {'loss': 0.8176, 'learning_rate': 1.6704189275033816e-05, 'epoch': 0.54} {'loss': 0.9047, 'learning_rate': 1.6703946382238468e-05, 'epoch': 0.54} {'loss': 0.9053, 'learning_rate': 1.6703703482259237e-05, 'epoch': 0.54} {'loss': 0.8726, 'learning_rate': 1.6703460575096385e-05, 'epoch': 0.54} {'loss': 0.854, 'learning_rate': 1.6703217660750168e-05, 'epoch': 0.54} {'loss': 0.9874, 'learning_rate': 1.6702974739220847e-05, 'epoch': 0.54} {'loss': 0.7841, 'learning_rate': 1.6702731810508683e-05, 'epoch': 0.54} {'loss': 0.971, 'learning_rate': 1.670248887461394e-05, 'epoch': 0.54} {'loss': 0.7371, 'learning_rate': 1.6702245931536875e-05, 'epoch': 0.54} {'loss': 0.861, 'learning_rate': 1.6702002981277745e-05, 'epoch': 0.54} {'loss': 0.7132, 'learning_rate': 1.670176002383682e-05, 'epoch': 0.54} {'loss': 0.8759, 'learning_rate': 1.6701517059214348e-05, 'epoch': 0.54} {'loss': 0.9158, 'learning_rate': 1.6701274087410596e-05, 'epoch': 0.54} {'loss': 0.7583, 'learning_rate': 1.6701031108425828e-05, 'epoch': 0.54} {'loss': 0.7754, 'learning_rate': 1.67007881222603e-05, 'epoch': 0.54} {'loss': 0.8988, 'learning_rate': 1.670054512891427e-05, 'epoch': 0.54} {'loss': 0.8079, 'learning_rate': 1.6700302128388e-05, 'epoch': 0.54} {'loss': 0.7953, 'learning_rate': 1.6700059120681755e-05, 'epoch': 0.54} {'loss': 1.0072, 'learning_rate': 1.6699816105795793e-05, 'epoch': 0.54} {'loss': 1.0256, 'learning_rate': 1.669957308373037e-05, 'epoch': 0.54} {'loss': 0.9454, 'learning_rate': 1.6699330054485753e-05, 'epoch': 0.54} {'loss': 0.7935, 'learning_rate': 1.6699087018062197e-05, 'epoch': 0.54} {'loss': 0.7581, 'learning_rate': 1.6698843974459965e-05, 'epoch': 0.54} {'loss': 0.9036, 'learning_rate': 1.6698600923679315e-05, 'epoch': 0.54} {'loss': 0.7437, 'learning_rate': 1.6698357865720515e-05, 'epoch': 0.54} {'loss': 1.0654, 'learning_rate': 1.6698114800583812e-05, 'epoch': 0.54} {'loss': 0.7649, 'learning_rate': 1.6697871728269484e-05, 'epoch': 0.54} {'loss': 0.8448, 'learning_rate': 1.6697628648777775e-05, 'epoch': 0.54} {'loss': 0.8054, 'learning_rate': 1.6697385562108956e-05, 'epoch': 0.54} {'loss': 0.9492, 'learning_rate': 1.6697142468263277e-05, 'epoch': 0.54} {'loss': 0.9045, 'learning_rate': 1.6696899367241014e-05, 'epoch': 0.54} {'loss': 0.9896, 'learning_rate': 1.6696656259042416e-05, 'epoch': 0.54} {'loss': 0.8701, 'learning_rate': 1.6696413143667746e-05, 'epoch': 0.54} {'loss': 0.8242, 'learning_rate': 1.6696170021117262e-05, 'epoch': 0.54} {'loss': 1.0615, 'learning_rate': 1.669592689139123e-05, 'epoch': 0.54} {'loss': 0.7903, 'learning_rate': 1.6695683754489912e-05, 'epoch': 0.54} {'loss': 0.8548, 'learning_rate': 1.6695440610413557e-05, 'epoch': 0.54} {'loss': 1.0263, 'learning_rate': 1.6695197459162436e-05, 'epoch': 0.54} {'loss': 0.8881, 'learning_rate': 1.669495430073681e-05, 'epoch': 0.54} {'loss': 0.8527, 'learning_rate': 1.6694711135136935e-05, 'epoch': 0.54} {'loss': 0.9018, 'learning_rate': 1.669446796236307e-05, 'epoch': 0.54} {'loss': 0.9385, 'learning_rate': 1.669422478241548e-05, 'epoch': 0.54} {'loss': 0.9228, 'learning_rate': 1.6693981595294424e-05, 'epoch': 0.54} {'loss': 0.8447, 'learning_rate': 1.6693738401000162e-05, 'epoch': 0.54} {'loss': 0.9057, 'learning_rate': 1.6693495199532958e-05, 'epoch': 0.54} {'loss': 0.7303, 'learning_rate': 1.6693251990893068e-05, 'epoch': 0.54} {'loss': 0.9074, 'learning_rate': 1.6693008775080754e-05, 'epoch': 0.54} {'loss': 0.7822, 'learning_rate': 1.6692765552096273e-05, 'epoch': 0.54} {'loss': 0.8094, 'learning_rate': 1.6692522321939893e-05, 'epoch': 0.54} {'loss': 0.7837, 'learning_rate': 1.6692279084611875e-05, 'epoch': 0.54} {'loss': 0.9608, 'learning_rate': 1.669203584011247e-05, 'epoch': 0.54} {'loss': 0.9123, 'learning_rate': 1.6691792588441947e-05, 'epoch': 0.54} {'loss': 0.8309, 'learning_rate': 1.6691549329600566e-05, 'epoch': 0.54} {'loss': 0.7936, 'learning_rate': 1.6691306063588583e-05, 'epoch': 0.54} {'loss': 0.6857, 'learning_rate': 1.6691062790406263e-05, 'epoch': 0.54} {'loss': 0.9409, 'learning_rate': 1.6690819510053864e-05, 'epoch': 0.54} {'loss': 0.9175, 'learning_rate': 1.6690576222531652e-05, 'epoch': 0.54} {'loss': 0.9561, 'learning_rate': 1.669033292783988e-05, 'epoch': 0.54} {'loss': 0.7653, 'learning_rate': 1.6690089625978813e-05, 'epoch': 0.54} {'loss': 0.7674, 'learning_rate': 1.6689846316948714e-05, 'epoch': 0.54} {'loss': 0.9639, 'learning_rate': 1.668960300074984e-05, 'epoch': 0.54} {'loss': 0.8029, 'learning_rate': 1.6689359677382447e-05, 'epoch': 0.54} {'loss': 0.8133, 'learning_rate': 1.6689116346846805e-05, 'epoch': 0.54} {'loss': 0.8049, 'learning_rate': 1.6688873009143173e-05, 'epoch': 0.54} {'loss': 0.9684, 'learning_rate': 1.668862966427181e-05, 'epoch': 0.54} {'loss': 0.8925, 'learning_rate': 1.6688386312232973e-05, 'epoch': 0.54} {'loss': 0.7757, 'learning_rate': 1.668814295302693e-05, 'epoch': 0.54} {'loss': 0.7398, 'learning_rate': 1.6687899586653936e-05, 'epoch': 0.54} {'loss': 0.9326, 'learning_rate': 1.6687656213114254e-05, 'epoch': 0.54} {'loss': 0.6116, 'learning_rate': 1.6687412832408146e-05, 'epoch': 0.54} {'loss': 0.8922, 'learning_rate': 1.6687169444535874e-05, 'epoch': 0.54} {'loss': 0.7561, 'learning_rate': 1.668692604949769e-05, 'epoch': 0.54} {'loss': 0.9159, 'learning_rate': 1.6686682647293862e-05, 'epoch': 0.54} {'loss': 0.8387, 'learning_rate': 1.6686439237924657e-05, 'epoch': 0.54} {'loss': 0.7224, 'learning_rate': 1.668619582139032e-05, 'epoch': 0.54} {'loss': 0.9189, 'learning_rate': 1.6685952397691128e-05, 'epoch': 0.54} {'loss': 0.7637, 'learning_rate': 1.6685708966827333e-05, 'epoch': 0.54} {'loss': 0.9278, 'learning_rate': 1.6685465528799195e-05, 'epoch': 0.54} {'loss': 0.8714, 'learning_rate': 1.668522208360698e-05, 'epoch': 0.54} {'loss': 0.8061, 'learning_rate': 1.668497863125094e-05, 'epoch': 0.54} {'loss': 0.9357, 'learning_rate': 1.668473517173135e-05, 'epoch': 0.54} {'loss': 0.6391, 'learning_rate': 1.6684491705048458e-05, 'epoch': 0.54} {'loss': 0.8215, 'learning_rate': 1.6684248231202532e-05, 'epoch': 0.54} {'loss': 0.8744, 'learning_rate': 1.668400475019383e-05, 'epoch': 0.54} {'loss': 0.8168, 'learning_rate': 1.6683761262022616e-05, 'epoch': 0.54} {'loss': 0.8087, 'learning_rate': 1.6683517766689145e-05, 'epoch': 0.54} {'loss': 0.99, 'learning_rate': 1.668327426419368e-05, 'epoch': 0.54} {'loss': 0.8547, 'learning_rate': 1.668303075453649e-05, 'epoch': 0.54} {'loss': 0.7595, 'learning_rate': 1.6682787237717825e-05, 'epoch': 0.54} {'loss': 0.8478, 'learning_rate': 1.668254371373795e-05, 'epoch': 0.54} {'loss': 0.8359, 'learning_rate': 1.668230018259713e-05, 'epoch': 0.54} {'loss': 0.7889, 'learning_rate': 1.6682056644295615e-05, 'epoch': 0.54} {'loss': 0.8485, 'learning_rate': 1.668181309883368e-05, 'epoch': 0.54} {'loss': 0.8578, 'learning_rate': 1.6681569546211576e-05, 'epoch': 0.54} {'loss': 0.8566, 'learning_rate': 1.668132598642957e-05, 'epoch': 0.54} {'loss': 0.9921, 'learning_rate': 1.6681082419487917e-05, 'epoch': 0.54} {'loss': 0.7326, 'learning_rate': 1.6680838845386883e-05, 'epoch': 0.54} {'loss': 0.6915, 'learning_rate': 1.6680595264126727e-05, 'epoch': 0.54} {'loss': 0.7421, 'learning_rate': 1.668035167570771e-05, 'epoch': 0.54} {'loss': 0.8705, 'learning_rate': 1.6680108080130094e-05, 'epoch': 0.54} {'loss': 0.7399, 'learning_rate': 1.6679864477394136e-05, 'epoch': 0.54} {'loss': 1.0663, 'learning_rate': 1.6679620867500103e-05, 'epoch': 0.54} {'loss': 1.0103, 'learning_rate': 1.6679377250448254e-05, 'epoch': 0.54} {'loss': 0.864, 'learning_rate': 1.667913362623885e-05, 'epoch': 0.54} {'loss': 0.8276, 'learning_rate': 1.6678889994872147e-05, 'epoch': 0.54} {'loss': 0.8551, 'learning_rate': 1.6678646356348413e-05, 'epoch': 0.54} {'loss': 0.9185, 'learning_rate': 1.667840271066791e-05, 'epoch': 0.54} {'loss': 0.8485, 'learning_rate': 1.667815905783089e-05, 'epoch': 0.54} {'loss': 0.8427, 'learning_rate': 1.6677915397837626e-05, 'epoch': 0.54} {'loss': 0.8284, 'learning_rate': 1.6677671730688366e-05, 'epoch': 0.54} {'loss': 0.6373, 'learning_rate': 1.6677428056383382e-05, 'epoch': 0.54} {'loss': 0.9361, 'learning_rate': 1.667718437492293e-05, 'epoch': 0.54} {'loss': 0.891, 'learning_rate': 1.6676940686307276e-05, 'epoch': 0.54} {'loss': 0.752, 'learning_rate': 1.667669699053667e-05, 'epoch': 0.54} {'loss': 0.8361, 'learning_rate': 1.6676453287611386e-05, 'epoch': 0.54} {'loss': 0.7808, 'learning_rate': 1.667620957753168e-05, 'epoch': 0.54} {'loss': 0.7522, 'learning_rate': 1.6675965860297814e-05, 'epoch': 0.54} {'loss': 0.7817, 'learning_rate': 1.6675722135910045e-05, 'epoch': 0.54} {'loss': 0.6789, 'learning_rate': 1.6675478404368636e-05, 'epoch': 0.54} {'loss': 0.9027, 'learning_rate': 1.667523466567385e-05, 'epoch': 0.54} {'loss': 0.8767, 'learning_rate': 1.6674990919825954e-05, 'epoch': 0.54} {'loss': 0.9965, 'learning_rate': 1.6674747166825196e-05, 'epoch': 0.54} {'loss': 0.8403, 'learning_rate': 1.6674503406671844e-05, 'epoch': 0.54} {'loss': 0.7433, 'learning_rate': 1.6674259639366163e-05, 'epoch': 0.54} {'loss': 0.8901, 'learning_rate': 1.6674015864908406e-05, 'epoch': 0.54} {'loss': 0.8947, 'learning_rate': 1.6673772083298843e-05, 'epoch': 0.54} {'loss': 0.823, 'learning_rate': 1.667352829453773e-05, 'epoch': 0.54} {'loss': 0.7771, 'learning_rate': 1.6673284498625326e-05, 'epoch': 0.54} {'loss': 0.9458, 'learning_rate': 1.6673040695561895e-05, 'epoch': 0.54} {'loss': 0.7721, 'learning_rate': 1.6672796885347703e-05, 'epoch': 0.54} {'loss': 0.8975, 'learning_rate': 1.6672553067983005e-05, 'epoch': 0.54} {'loss': 0.8955, 'learning_rate': 1.6672309243468065e-05, 'epoch': 0.54} {'loss': 0.9149, 'learning_rate': 1.667206541180314e-05, 'epoch': 0.54} {'loss': 1.0062, 'learning_rate': 1.6671821572988498e-05, 'epoch': 0.54} {'loss': 0.8611, 'learning_rate': 1.6671577727024396e-05, 'epoch': 0.54} {'loss': 0.9116, 'learning_rate': 1.6671333873911096e-05, 'epoch': 0.54} {'loss': 0.7807, 'learning_rate': 1.667109001364886e-05, 'epoch': 0.54} {'loss': 0.8738, 'learning_rate': 1.6670846146237947e-05, 'epoch': 0.54} {'loss': 0.9241, 'learning_rate': 1.6670602271678623e-05, 'epoch': 0.54} {'loss': 0.9391, 'learning_rate': 1.6670358389971147e-05, 'epoch': 0.54} {'loss': 0.7476, 'learning_rate': 1.667011450111578e-05, 'epoch': 0.54} {'loss': 0.7897, 'learning_rate': 1.666987060511278e-05, 'epoch': 0.54} {'loss': 0.8353, 'learning_rate': 1.6669626701962412e-05, 'epoch': 0.54} {'loss': 1.01, 'learning_rate': 1.6669382791664942e-05, 'epoch': 0.54} {'loss': 0.8433, 'learning_rate': 1.666913887422062e-05, 'epoch': 0.54} {'loss': 0.8126, 'learning_rate': 1.666889494962972e-05, 'epoch': 0.54} {'loss': 0.8794, 'learning_rate': 1.666865101789249e-05, 'epoch': 0.54} {'loss': 0.9091, 'learning_rate': 1.6668407079009204e-05, 'epoch': 0.54} {'loss': 0.9216, 'learning_rate': 1.6668163132980117e-05, 'epoch': 0.54} {'loss': 0.8754, 'learning_rate': 1.6667919179805493e-05, 'epoch': 0.54} {'loss': 0.8267, 'learning_rate': 1.6667675219485588e-05, 'epoch': 0.54} {'loss': 0.8237, 'learning_rate': 1.6667431252020668e-05, 'epoch': 0.54} {'loss': 0.7949, 'learning_rate': 1.6667187277410995e-05, 'epoch': 0.54} {'loss': 0.8932, 'learning_rate': 1.666694329565683e-05, 'epoch': 0.54} {'loss': 0.7832, 'learning_rate': 1.666669930675843e-05, 'epoch': 0.54} {'loss': 1.0438, 'learning_rate': 1.6666455310716063e-05, 'epoch': 0.54} {'loss': 0.816, 'learning_rate': 1.6666211307529985e-05, 'epoch': 0.54} {'loss': 0.8724, 'learning_rate': 1.6665967297200462e-05, 'epoch': 0.54} {'loss': 0.9079, 'learning_rate': 1.6665723279727754e-05, 'epoch': 0.54} {'loss': 0.8594, 'learning_rate': 1.666547925511212e-05, 'epoch': 0.54} {'loss': 0.865, 'learning_rate': 1.6665235223353827e-05, 'epoch': 0.54} {'loss': 0.8345, 'learning_rate': 1.6664991184453126e-05, 'epoch': 0.54} {'loss': 0.7931, 'learning_rate': 1.666474713841029e-05, 'epoch': 0.54} {'loss': 0.7349, 'learning_rate': 1.6664503085225576e-05, 'epoch': 0.54} {'loss': 0.9727, 'learning_rate': 1.6664259024899245e-05, 'epoch': 0.54} {'loss': 0.8645, 'learning_rate': 1.666401495743156e-05, 'epoch': 0.54} {'loss': 0.7764, 'learning_rate': 1.666377088282278e-05, 'epoch': 0.54} {'loss': 0.7893, 'learning_rate': 1.666352680107317e-05, 'epoch': 0.54} {'loss': 0.8565, 'learning_rate': 1.6663282712182986e-05, 'epoch': 0.54} {'loss': 0.9924, 'learning_rate': 1.6663038616152495e-05, 'epoch': 0.54} {'loss': 0.7271, 'learning_rate': 1.6662794512981956e-05, 'epoch': 0.54} {'loss': 0.8096, 'learning_rate': 1.6662550402671635e-05, 'epoch': 0.54} {'loss': 0.8769, 'learning_rate': 1.6662306285221785e-05, 'epoch': 0.54} {'loss': 0.8443, 'learning_rate': 1.6662062160632674e-05, 'epoch': 0.54} {'loss': 1.0048, 'learning_rate': 1.6661818028904565e-05, 'epoch': 0.54} {'loss': 0.9418, 'learning_rate': 1.666157389003771e-05, 'epoch': 0.54} {'loss': 0.7395, 'learning_rate': 1.6661329744032384e-05, 'epoch': 0.54} {'loss': 1.0717, 'learning_rate': 1.666108559088884e-05, 'epoch': 0.54} {'loss': 1.0221, 'learning_rate': 1.6660841430607342e-05, 'epoch': 0.54} {'loss': 0.8651, 'learning_rate': 1.6660597263188152e-05, 'epoch': 0.54} {'loss': 0.8494, 'learning_rate': 1.666035308863153e-05, 'epoch': 0.54} {'loss': 0.9455, 'learning_rate': 1.6660108906937735e-05, 'epoch': 0.54} {'loss': 0.7932, 'learning_rate': 1.6659864718107036e-05, 'epoch': 0.54} {'loss': 0.7381, 'learning_rate': 1.665962052213969e-05, 'epoch': 0.54} {'loss': 0.7828, 'learning_rate': 1.6659376319035962e-05, 'epoch': 0.54} {'loss': 0.7941, 'learning_rate': 1.6659132108796105e-05, 'epoch': 0.54} {'loss': 1.0046, 'learning_rate': 1.6658887891420393e-05, 'epoch': 0.54} {'loss': 0.8334, 'learning_rate': 1.6658643666909078e-05, 'epoch': 0.54} {'loss': 0.9524, 'learning_rate': 1.6658399435262425e-05, 'epoch': 0.54} {'loss': 0.8138, 'learning_rate': 1.66581551964807e-05, 'epoch': 0.54} {'loss': 0.9154, 'learning_rate': 1.6657910950564157e-05, 'epoch': 0.54} {'loss': 0.7654, 'learning_rate': 1.6657666697513064e-05, 'epoch': 0.54} {'loss': 0.7992, 'learning_rate': 1.665742243732768e-05, 'epoch': 0.54} {'loss': 0.9216, 'learning_rate': 1.6657178170008264e-05, 'epoch': 0.54} {'loss': 0.83, 'learning_rate': 1.6656933895555084e-05, 'epoch': 0.54} {'loss': 0.7559, 'learning_rate': 1.66566896139684e-05, 'epoch': 0.54} {'loss': 0.8598, 'learning_rate': 1.665644532524847e-05, 'epoch': 0.54} {'loss': 0.6423, 'learning_rate': 1.6656201029395554e-05, 'epoch': 0.54} {'loss': 0.9905, 'learning_rate': 1.6655956726409924e-05, 'epoch': 0.54} {'loss': 0.7489, 'learning_rate': 1.665571241629183e-05, 'epoch': 0.54} {'loss': 0.7979, 'learning_rate': 1.6655468099041546e-05, 'epoch': 0.54} {'loss': 0.9054, 'learning_rate': 1.665522377465932e-05, 'epoch': 0.54} {'loss': 0.9882, 'learning_rate': 1.665497944314543e-05, 'epoch': 0.54} {'loss': 0.7598, 'learning_rate': 1.6654735104500122e-05, 'epoch': 0.54} {'loss': 0.8251, 'learning_rate': 1.6654490758723664e-05, 'epoch': 0.54} {'loss': 0.7662, 'learning_rate': 1.6654246405816324e-05, 'epoch': 0.54} {'loss': 1.0309, 'learning_rate': 1.6654002045778352e-05, 'epoch': 0.54} {'loss': 0.8756, 'learning_rate': 1.665375767861002e-05, 'epoch': 0.54} {'loss': 0.9511, 'learning_rate': 1.6653513304311587e-05, 'epoch': 0.54} {'loss': 0.7707, 'learning_rate': 1.6653268922883316e-05, 'epoch': 0.54} {'loss': 0.7485, 'learning_rate': 1.6653024534325463e-05, 'epoch': 0.54} {'loss': 0.7624, 'learning_rate': 1.665278013863829e-05, 'epoch': 0.54} {'loss': 0.8875, 'learning_rate': 1.665253573582207e-05, 'epoch': 0.54} {'loss': 0.7942, 'learning_rate': 1.6652291325877053e-05, 'epoch': 0.54} {'loss': 0.7933, 'learning_rate': 1.665204690880351e-05, 'epoch': 0.54} {'loss': 0.6427, 'learning_rate': 1.6651802484601692e-05, 'epoch': 0.54} {'loss': 0.8368, 'learning_rate': 1.6651558053271874e-05, 'epoch': 0.54} {'loss': 0.9595, 'learning_rate': 1.6651313614814308e-05, 'epoch': 0.54} {'loss': 0.796, 'learning_rate': 1.6651069169229257e-05, 'epoch': 0.54} {'loss': 1.0365, 'learning_rate': 1.6650824716516987e-05, 'epoch': 0.54} {'loss': 0.8753, 'learning_rate': 1.6650580256677757e-05, 'epoch': 0.54} {'loss': 0.7914, 'learning_rate': 1.6650335789711834e-05, 'epoch': 0.54} {'loss': 0.8667, 'learning_rate': 1.6650091315619472e-05, 'epoch': 0.54} {'loss': 1.0949, 'learning_rate': 1.664984683440094e-05, 'epoch': 0.54} {'loss': 0.9262, 'learning_rate': 1.6649602346056492e-05, 'epoch': 0.54} {'loss': 0.9495, 'learning_rate': 1.66493578505864e-05, 'epoch': 0.54} {'loss': 0.87, 'learning_rate': 1.6649113347990918e-05, 'epoch': 0.54} {'loss': 0.8376, 'learning_rate': 1.6648868838270312e-05, 'epoch': 0.54} {'loss': 0.842, 'learning_rate': 1.6648624321424844e-05, 'epoch': 0.54} {'loss': 0.8812, 'learning_rate': 1.664837979745477e-05, 'epoch': 0.54} {'loss': 0.7631, 'learning_rate': 1.6648135266360362e-05, 'epoch': 0.54} {'loss': 0.7821, 'learning_rate': 1.6647890728141874e-05, 'epoch': 0.54} {'loss': 0.9336, 'learning_rate': 1.6647646182799575e-05, 'epoch': 0.54} {'loss': 0.7874, 'learning_rate': 1.6647401630333722e-05, 'epoch': 0.54} {'loss': 0.8661, 'learning_rate': 1.6647157070744576e-05, 'epoch': 0.54} {'loss': 0.8722, 'learning_rate': 1.66469125040324e-05, 'epoch': 0.54} {'loss': 0.9782, 'learning_rate': 1.664666793019746e-05, 'epoch': 0.54} {'loss': 0.8446, 'learning_rate': 1.664642334924002e-05, 'epoch': 0.54} {'loss': 0.712, 'learning_rate': 1.6646178761160327e-05, 'epoch': 0.54} {'loss': 0.8577, 'learning_rate': 1.6645934165958663e-05, 'epoch': 0.54} {'loss': 0.806, 'learning_rate': 1.6645689563635278e-05, 'epoch': 0.54} {'loss': 0.7328, 'learning_rate': 1.6645444954190433e-05, 'epoch': 0.54} {'loss': 0.8115, 'learning_rate': 1.6645200337624396e-05, 'epoch': 0.54} {'loss': 0.7636, 'learning_rate': 1.6644955713937428e-05, 'epoch': 0.54} {'loss': 0.932, 'learning_rate': 1.664471108312979e-05, 'epoch': 0.54} {'loss': 0.9008, 'learning_rate': 1.6644466445201744e-05, 'epoch': 0.54} {'loss': 0.8499, 'learning_rate': 1.6644221800153553e-05, 'epoch': 0.54} {'loss': 0.8058, 'learning_rate': 1.6643977147985478e-05, 'epoch': 0.54} {'loss': 0.7599, 'learning_rate': 1.6643732488697782e-05, 'epoch': 0.54} {'loss': 0.6907, 'learning_rate': 1.6643487822290727e-05, 'epoch': 0.54} {'loss': 0.8766, 'learning_rate': 1.6643243148764577e-05, 'epoch': 0.54} {'loss': 0.7272, 'learning_rate': 1.664299846811959e-05, 'epoch': 0.54} {'loss': 0.8932, 'learning_rate': 1.6642753780356032e-05, 'epoch': 0.54} {'loss': 0.8816, 'learning_rate': 1.6642509085474162e-05, 'epoch': 0.54} {'loss': 0.8721, 'learning_rate': 1.6642264383474244e-05, 'epoch': 0.54} {'loss': 0.7624, 'learning_rate': 1.6642019674356543e-05, 'epoch': 0.54} {'loss': 0.8034, 'learning_rate': 1.6641774958121318e-05, 'epoch': 0.54} {'loss': 0.8574, 'learning_rate': 1.664153023476883e-05, 'epoch': 0.54} {'loss': 0.7518, 'learning_rate': 1.6641285504299346e-05, 'epoch': 0.54} {'loss': 0.7354, 'learning_rate': 1.664104076671312e-05, 'epoch': 0.54} {'loss': 0.835, 'learning_rate': 1.6640796022010423e-05, 'epoch': 0.54} {'loss': 0.9658, 'learning_rate': 1.6640551270191513e-05, 'epoch': 0.54} {'loss': 1.048, 'learning_rate': 1.664030651125665e-05, 'epoch': 0.54} {'loss': 0.8584, 'learning_rate': 1.6640061745206102e-05, 'epoch': 0.54} {'loss': 0.9485, 'learning_rate': 1.663981697204013e-05, 'epoch': 0.54} {'loss': 0.877, 'learning_rate': 1.6639572191758992e-05, 'epoch': 0.54} {'loss': 0.7645, 'learning_rate': 1.6639327404362954e-05, 'epoch': 0.54} {'loss': 0.88, 'learning_rate': 1.663908260985228e-05, 'epoch': 0.54} {'loss': 0.9409, 'learning_rate': 1.6638837808227226e-05, 'epoch': 0.54} {'loss': 0.9157, 'learning_rate': 1.6638592999488058e-05, 'epoch': 0.54} {'loss': 0.7398, 'learning_rate': 1.6638348183635043e-05, 'epoch': 0.54} {'loss': 0.9076, 'learning_rate': 1.6638103360668436e-05, 'epoch': 0.54} {'loss': 0.8651, 'learning_rate': 1.6637858530588503e-05, 'epoch': 0.54} {'loss': 0.8034, 'learning_rate': 1.6637613693395503e-05, 'epoch': 0.54} {'loss': 0.831, 'learning_rate': 1.6637368849089703e-05, 'epoch': 0.54} {'loss': 0.9592, 'learning_rate': 1.6637123997671363e-05, 'epoch': 0.54} {'loss': 0.9302, 'learning_rate': 1.6636879139140743e-05, 'epoch': 0.54} {'loss': 0.7225, 'learning_rate': 1.6636634273498115e-05, 'epoch': 0.54} {'loss': 0.947, 'learning_rate': 1.6636389400743727e-05, 'epoch': 0.54} {'loss': 0.9538, 'learning_rate': 1.663614452087785e-05, 'epoch': 0.54} {'loss': 0.9222, 'learning_rate': 1.6635899633900747e-05, 'epoch': 0.54} {'loss': 0.9941, 'learning_rate': 1.663565473981268e-05, 'epoch': 0.54} {'loss': 0.8535, 'learning_rate': 1.6635409838613905e-05, 'epoch': 0.54} {'loss': 0.7301, 'learning_rate': 1.6635164930304693e-05, 'epoch': 0.54} {'loss': 0.9489, 'learning_rate': 1.6634920014885307e-05, 'epoch': 0.54} {'loss': 0.6572, 'learning_rate': 1.6634675092355997e-05, 'epoch': 0.54} {'loss': 0.6933, 'learning_rate': 1.6634430162717038e-05, 'epoch': 0.54} {'loss': 0.8899, 'learning_rate': 1.6634185225968688e-05, 'epoch': 0.54} {'loss': 0.8494, 'learning_rate': 1.663394028211121e-05, 'epoch': 0.54} {'loss': 0.6925, 'learning_rate': 1.6633695331144867e-05, 'epoch': 0.54} {'loss': 0.9374, 'learning_rate': 1.6633450373069918e-05, 'epoch': 0.54} {'loss': 0.8293, 'learning_rate': 1.663320540788663e-05, 'epoch': 0.54} {'loss': 0.8212, 'learning_rate': 1.6632960435595267e-05, 'epoch': 0.54} {'loss': 0.7991, 'learning_rate': 1.6632715456196084e-05, 'epoch': 0.54} {'loss': 0.8265, 'learning_rate': 1.663247046968935e-05, 'epoch': 0.54} {'loss': 0.8798, 'learning_rate': 1.663222547607532e-05, 'epoch': 0.54} {'loss': 0.8047, 'learning_rate': 1.6631980475354268e-05, 'epoch': 0.54} {'loss': 0.8836, 'learning_rate': 1.663173546752645e-05, 'epoch': 0.54} {'loss': 0.9506, 'learning_rate': 1.6631490452592124e-05, 'epoch': 0.54} {'loss': 0.9491, 'learning_rate': 1.663124543055156e-05, 'epoch': 0.54} {'loss': 0.8671, 'learning_rate': 1.663100040140502e-05, 'epoch': 0.54} {'loss': 0.8621, 'learning_rate': 1.6630755365152763e-05, 'epoch': 0.54} {'loss': 0.8877, 'learning_rate': 1.6630510321795054e-05, 'epoch': 0.54} {'loss': 0.983, 'learning_rate': 1.6630265271332154e-05, 'epoch': 0.54} {'loss': 0.6252, 'learning_rate': 1.6630020213764326e-05, 'epoch': 0.54} {'loss': 0.8759, 'learning_rate': 1.6629775149091832e-05, 'epoch': 0.54} {'loss': 0.8192, 'learning_rate': 1.6629530077314937e-05, 'epoch': 0.54} {'loss': 1.0091, 'learning_rate': 1.6629284998433903e-05, 'epoch': 0.54} {'loss': 0.8748, 'learning_rate': 1.6629039912448993e-05, 'epoch': 0.54} {'loss': 0.972, 'learning_rate': 1.6628794819360465e-05, 'epoch': 0.54} {'loss': 0.7653, 'learning_rate': 1.6628549719168586e-05, 'epoch': 0.54} {'loss': 0.7544, 'learning_rate': 1.662830461187362e-05, 'epoch': 0.54} {'loss': 0.8401, 'learning_rate': 1.662805949747582e-05, 'epoch': 0.54} {'loss': 0.7161, 'learning_rate': 1.6627814375975464e-05, 'epoch': 0.54} {'loss': 0.7531, 'learning_rate': 1.6627569247372803e-05, 'epoch': 0.54} {'loss': 0.7812, 'learning_rate': 1.6627324111668106e-05, 'epoch': 0.54} {'loss': 0.8838, 'learning_rate': 1.662707896886163e-05, 'epoch': 0.54} {'loss': 0.8291, 'learning_rate': 1.6626833818953644e-05, 'epoch': 0.54} {'loss': 1.0187, 'learning_rate': 1.6626588661944405e-05, 'epoch': 0.54} {'loss': 0.6978, 'learning_rate': 1.662634349783418e-05, 'epoch': 0.54} {'loss': 0.8454, 'learning_rate': 1.6626098326623227e-05, 'epoch': 0.54} {'loss': 0.8924, 'learning_rate': 1.6625853148311818e-05, 'epoch': 0.54} {'loss': 0.806, 'learning_rate': 1.66256079629002e-05, 'epoch': 0.54} {'loss': 0.8607, 'learning_rate': 1.662536277038865e-05, 'epoch': 0.54} {'loss': 0.9925, 'learning_rate': 1.6625117570777428e-05, 'epoch': 0.54} {'loss': 0.9024, 'learning_rate': 1.662487236406679e-05, 'epoch': 0.54} {'loss': 0.9018, 'learning_rate': 1.6624627150257008e-05, 'epoch': 0.54} {'loss': 0.8705, 'learning_rate': 1.6624381929348335e-05, 'epoch': 0.54} {'loss': 0.807, 'learning_rate': 1.662413670134104e-05, 'epoch': 0.54} {'loss': 0.9056, 'learning_rate': 1.6623891466235388e-05, 'epoch': 0.54} {'loss': 0.6773, 'learning_rate': 1.6623646224031636e-05, 'epoch': 0.54} {'loss': 0.917, 'learning_rate': 1.662340097473005e-05, 'epoch': 0.54} {'loss': 0.8543, 'learning_rate': 1.6623155718330893e-05, 'epoch': 0.54} {'loss': 0.7178, 'learning_rate': 1.6622910454834426e-05, 'epoch': 0.54} {'loss': 0.7044, 'learning_rate': 1.662266518424091e-05, 'epoch': 0.54} {'loss': 0.7559, 'learning_rate': 1.6622419906550616e-05, 'epoch': 0.54} {'loss': 0.8786, 'learning_rate': 1.6622174621763797e-05, 'epoch': 0.54} {'loss': 1.0122, 'learning_rate': 1.6621929329880725e-05, 'epoch': 0.54} {'loss': 0.8961, 'learning_rate': 1.6621684030901653e-05, 'epoch': 0.54} {'loss': 0.8111, 'learning_rate': 1.662143872482685e-05, 'epoch': 0.54} {'loss': 0.8863, 'learning_rate': 1.6621193411656576e-05, 'epoch': 0.54} {'loss': 0.8745, 'learning_rate': 1.66209480913911e-05, 'epoch': 0.54} {'loss': 0.6998, 'learning_rate': 1.6620702764030678e-05, 'epoch': 0.54} {'loss': 0.6292, 'learning_rate': 1.6620457429575575e-05, 'epoch': 0.54} {'loss': 0.7502, 'learning_rate': 1.6620212088026056e-05, 'epoch': 0.54} {'loss': 0.8183, 'learning_rate': 1.6619966739382382e-05, 'epoch': 0.54} {'loss': 0.741, 'learning_rate': 1.6619721383644817e-05, 'epoch': 0.54} {'loss': 0.9348, 'learning_rate': 1.6619476020813622e-05, 'epoch': 0.54} {'loss': 0.9026, 'learning_rate': 1.661923065088906e-05, 'epoch': 0.54} {'loss': 0.8277, 'learning_rate': 1.6618985273871393e-05, 'epoch': 0.54} {'loss': 1.0434, 'learning_rate': 1.661873988976089e-05, 'epoch': 0.54} {'loss': 0.7292, 'learning_rate': 1.661849449855781e-05, 'epoch': 0.54} {'loss': 0.8843, 'learning_rate': 1.6618249100262413e-05, 'epoch': 0.54} {'loss': 0.8852, 'learning_rate': 1.6618003694874968e-05, 'epoch': 0.54} {'loss': 0.8649, 'learning_rate': 1.661775828239573e-05, 'epoch': 0.54} {'loss': 0.8781, 'learning_rate': 1.6617512862824973e-05, 'epoch': 0.54} {'loss': 0.8562, 'learning_rate': 1.6617267436162947e-05, 'epoch': 0.54} {'loss': 0.8052, 'learning_rate': 1.6617022002409924e-05, 'epoch': 0.54} {'loss': 1.0415, 'learning_rate': 1.6616776561566165e-05, 'epoch': 0.54} {'loss': 0.7451, 'learning_rate': 1.6616531113631934e-05, 'epoch': 0.54} {'loss': 0.9379, 'learning_rate': 1.6616285658607494e-05, 'epoch': 0.54} {'loss': 0.899, 'learning_rate': 1.6616040196493105e-05, 'epoch': 0.54} {'loss': 0.7621, 'learning_rate': 1.661579472728903e-05, 'epoch': 0.54} {'loss': 0.9749, 'learning_rate': 1.661554925099553e-05, 'epoch': 0.54} {'loss': 0.7306, 'learning_rate': 1.661530376761288e-05, 'epoch': 0.54} {'loss': 0.7506, 'learning_rate': 1.6615058277141335e-05, 'epoch': 0.54} {'loss': 0.7503, 'learning_rate': 1.6614812779581154e-05, 'epoch': 0.54} {'loss': 1.2278, 'learning_rate': 1.6614567274932605e-05, 'epoch': 0.54} {'loss': 0.8037, 'learning_rate': 1.6614321763195952e-05, 'epoch': 0.54} {'loss': 0.7406, 'learning_rate': 1.6614076244371453e-05, 'epoch': 0.54} {'loss': 0.5701, 'learning_rate': 1.6613830718459376e-05, 'epoch': 0.54} {'loss': 0.8438, 'learning_rate': 1.6613585185459983e-05, 'epoch': 0.54} {'loss': 0.8166, 'learning_rate': 1.6613339645373538e-05, 'epoch': 0.54} {'loss': 0.9241, 'learning_rate': 1.6613094098200296e-05, 'epoch': 0.54} {'loss': 0.9043, 'learning_rate': 1.6612848543940533e-05, 'epoch': 0.54} {'loss': 0.9081, 'learning_rate': 1.6612602982594505e-05, 'epoch': 0.54} {'loss': 0.9541, 'learning_rate': 1.6612357414162478e-05, 'epoch': 0.54} {'loss': 0.7852, 'learning_rate': 1.661211183864471e-05, 'epoch': 0.54} {'loss': 0.6562, 'learning_rate': 1.6611866256041468e-05, 'epoch': 0.54} {'loss': 1.019, 'learning_rate': 1.6611620666353013e-05, 'epoch': 0.54} {'loss': 0.8991, 'learning_rate': 1.6611375069579613e-05, 'epoch': 0.54} {'loss': 1.0614, 'learning_rate': 1.6611129465721524e-05, 'epoch': 0.54} {'loss': 0.8379, 'learning_rate': 1.6610883854779017e-05, 'epoch': 0.54} {'loss': 0.9303, 'learning_rate': 1.6610638236752347e-05, 'epoch': 0.54} {'loss': 0.8239, 'learning_rate': 1.6610392611641787e-05, 'epoch': 0.54} {'loss': 0.7938, 'learning_rate': 1.6610146979447593e-05, 'epoch': 0.54} {'loss': 0.963, 'learning_rate': 1.660990134017003e-05, 'epoch': 0.54} {'loss': 0.8735, 'learning_rate': 1.6609655693809357e-05, 'epoch': 0.54} {'loss': 0.8554, 'learning_rate': 1.6609410040365844e-05, 'epoch': 0.54} {'loss': 0.819, 'learning_rate': 1.6609164379839753e-05, 'epoch': 0.54} {'loss': 0.7417, 'learning_rate': 1.6608918712231345e-05, 'epoch': 0.54} {'loss': 0.8051, 'learning_rate': 1.6608673037540885e-05, 'epoch': 0.54} {'loss': 0.7127, 'learning_rate': 1.6608427355768633e-05, 'epoch': 0.54} {'loss': 0.9836, 'learning_rate': 1.6608181666914856e-05, 'epoch': 0.54} {'loss': 0.8484, 'learning_rate': 1.6607935970979814e-05, 'epoch': 0.54} {'loss': 0.6186, 'learning_rate': 1.6607690267963775e-05, 'epoch': 0.55} {'loss': 0.9429, 'learning_rate': 1.6607444557866995e-05, 'epoch': 0.55} {'loss': 0.8978, 'learning_rate': 1.6607198840689748e-05, 'epoch': 0.55} {'loss': 1.033, 'learning_rate': 1.660695311643229e-05, 'epoch': 0.55} {'loss': 0.7871, 'learning_rate': 1.6606707385094884e-05, 'epoch': 0.55} {'loss': 0.7873, 'learning_rate': 1.660646164667779e-05, 'epoch': 0.55} {'loss': 0.7506, 'learning_rate': 1.660621590118128e-05, 'epoch': 0.55} {'loss': 0.9365, 'learning_rate': 1.6605970148605616e-05, 'epoch': 0.55} {'loss': 0.8355, 'learning_rate': 1.660572438895106e-05, 'epoch': 0.55} {'loss': 0.7102, 'learning_rate': 1.660547862221787e-05, 'epoch': 0.55} {'loss': 0.7668, 'learning_rate': 1.6605232848406312e-05, 'epoch': 0.55} {'loss': 0.7547, 'learning_rate': 1.6604987067516653e-05, 'epoch': 0.55} {'loss': 0.9359, 'learning_rate': 1.6604741279549156e-05, 'epoch': 0.55} {'loss': 0.8807, 'learning_rate': 1.660449548450408e-05, 'epoch': 0.55} {'loss': 0.837, 'learning_rate': 1.6604249682381692e-05, 'epoch': 0.55} {'loss': 0.7972, 'learning_rate': 1.6604003873182254e-05, 'epoch': 0.55} {'loss': 0.7924, 'learning_rate': 1.660375805690603e-05, 'epoch': 0.55} {'loss': 0.8258, 'learning_rate': 1.6603512233553286e-05, 'epoch': 0.55} {'loss': 0.7328, 'learning_rate': 1.660326640312428e-05, 'epoch': 0.55} {'loss': 0.9185, 'learning_rate': 1.6603020565619276e-05, 'epoch': 0.55} {'loss': 0.8927, 'learning_rate': 1.6602774721038543e-05, 'epoch': 0.55} {'loss': 0.7971, 'learning_rate': 1.660252886938234e-05, 'epoch': 0.55} {'loss': 0.9911, 'learning_rate': 1.660228301065093e-05, 'epoch': 0.55} {'loss': 0.9446, 'learning_rate': 1.6602037144844578e-05, 'epoch': 0.55} {'loss': 0.9238, 'learning_rate': 1.660179127196355e-05, 'epoch': 0.55} {'loss': 0.6547, 'learning_rate': 1.66015453920081e-05, 'epoch': 0.55} {'loss': 0.8745, 'learning_rate': 1.6601299504978506e-05, 'epoch': 0.55} {'loss': 0.827, 'learning_rate': 1.6601053610875023e-05, 'epoch': 0.55} {'loss': 0.7619, 'learning_rate': 1.6600807709697913e-05, 'epoch': 0.55} {'loss': 0.7508, 'learning_rate': 1.660056180144744e-05, 'epoch': 0.55} {'loss': 0.6944, 'learning_rate': 1.6600315886123872e-05, 'epoch': 0.55} {'loss': 0.7739, 'learning_rate': 1.660006996372747e-05, 'epoch': 0.55} {'loss': 0.9127, 'learning_rate': 1.6599824034258497e-05, 'epoch': 0.55} {'loss': 0.807, 'learning_rate': 1.6599578097717217e-05, 'epoch': 0.55} {'loss': 0.8455, 'learning_rate': 1.6599332154103892e-05, 'epoch': 0.55} {'loss': 1.0097, 'learning_rate': 1.6599086203418788e-05, 'epoch': 0.55} {'loss': 1.082, 'learning_rate': 1.6598840245662168e-05, 'epoch': 0.55} {'loss': 0.7609, 'learning_rate': 1.6598594280834293e-05, 'epoch': 0.55} {'loss': 0.9682, 'learning_rate': 1.659834830893543e-05, 'epoch': 0.55} {'loss': 0.9883, 'learning_rate': 1.659810232996584e-05, 'epoch': 0.55} {'loss': 0.7502, 'learning_rate': 1.659785634392579e-05, 'epoch': 0.55} {'loss': 0.8279, 'learning_rate': 1.659761035081554e-05, 'epoch': 0.55} {'loss': 0.9475, 'learning_rate': 1.6597364350635356e-05, 'epoch': 0.55} {'loss': 1.028, 'learning_rate': 1.65971183433855e-05, 'epoch': 0.55} {'loss': 0.8183, 'learning_rate': 1.659687232906624e-05, 'epoch': 0.55} {'loss': 0.7642, 'learning_rate': 1.659662630767783e-05, 'epoch': 0.55} {'loss': 0.7188, 'learning_rate': 1.6596380279220543e-05, 'epoch': 0.55} {'loss': 0.8537, 'learning_rate': 1.6596134243694637e-05, 'epoch': 0.55} {'loss': 0.9086, 'learning_rate': 1.659588820110038e-05, 'epoch': 0.55} {'loss': 1.0277, 'learning_rate': 1.659564215143803e-05, 'epoch': 0.55} {'loss': 0.8005, 'learning_rate': 1.6595396094707858e-05, 'epoch': 0.55} {'loss': 0.8063, 'learning_rate': 1.6595150030910123e-05, 'epoch': 0.55} {'loss': 0.6848, 'learning_rate': 1.6594903960045087e-05, 'epoch': 0.55} {'loss': 0.6695, 'learning_rate': 1.659465788211302e-05, 'epoch': 0.55} {'loss': 0.7052, 'learning_rate': 1.659441179711418e-05, 'epoch': 0.55} {'loss': 0.8513, 'learning_rate': 1.659416570504883e-05, 'epoch': 0.55} {'loss': 0.7762, 'learning_rate': 1.659391960591724e-05, 'epoch': 0.55} {'loss': 0.8835, 'learning_rate': 1.659367349971967e-05, 'epoch': 0.55} {'loss': 0.8679, 'learning_rate': 1.6593427386456383e-05, 'epoch': 0.55} {'loss': 0.8559, 'learning_rate': 1.6593181266127642e-05, 'epoch': 0.55} {'loss': 0.8975, 'learning_rate': 1.6592935138733715e-05, 'epoch': 0.55} {'loss': 0.6456, 'learning_rate': 1.659268900427486e-05, 'epoch': 0.55} {'loss': 0.7435, 'learning_rate': 1.6592442862751347e-05, 'epoch': 0.55} {'loss': 0.8846, 'learning_rate': 1.659219671416343e-05, 'epoch': 0.55} {'loss': 0.868, 'learning_rate': 1.6591950558511384e-05, 'epoch': 0.55} {'loss': 0.6816, 'learning_rate': 1.659170439579547e-05, 'epoch': 0.55} {'loss': 0.9638, 'learning_rate': 1.6591458226015946e-05, 'epoch': 0.55} {'loss': 0.8838, 'learning_rate': 1.659121204917308e-05, 'epoch': 0.55} {'loss': 0.9195, 'learning_rate': 1.6590965865267136e-05, 'epoch': 0.55} {'loss': 0.6103, 'learning_rate': 1.6590719674298378e-05, 'epoch': 0.55} {'loss': 0.8681, 'learning_rate': 1.659047347626707e-05, 'epoch': 0.55} {'loss': 0.8552, 'learning_rate': 1.6590227271173474e-05, 'epoch': 0.55} {'loss': 0.8179, 'learning_rate': 1.658998105901785e-05, 'epoch': 0.55} {'loss': 0.9365, 'learning_rate': 1.6589734839800473e-05, 'epoch': 0.55} {'loss': 0.8349, 'learning_rate': 1.6589488613521598e-05, 'epoch': 0.55} {'loss': 1.0032, 'learning_rate': 1.658924238018149e-05, 'epoch': 0.55} {'loss': 0.8748, 'learning_rate': 1.658899613978042e-05, 'epoch': 0.55} {'loss': 0.7819, 'learning_rate': 1.6588749892318642e-05, 'epoch': 0.55} {'loss': 0.834, 'learning_rate': 1.658850363779642e-05, 'epoch': 0.55} {'loss': 0.8487, 'learning_rate': 1.6588257376214025e-05, 'epoch': 0.55} {'loss': 0.9561, 'learning_rate': 1.6588011107571715e-05, 'epoch': 0.55} {'loss': 0.8132, 'learning_rate': 1.658776483186976e-05, 'epoch': 0.55} {'loss': 0.7932, 'learning_rate': 1.658751854910842e-05, 'epoch': 0.55} {'loss': 0.9199, 'learning_rate': 1.658727225928796e-05, 'epoch': 0.55} {'loss': 0.8417, 'learning_rate': 1.658702596240864e-05, 'epoch': 0.55} {'loss': 0.8618, 'learning_rate': 1.658677965847073e-05, 'epoch': 0.55} {'loss': 0.9441, 'learning_rate': 1.658653334747449e-05, 'epoch': 0.55} {'loss': 0.869, 'learning_rate': 1.6586287029420184e-05, 'epoch': 0.55} {'loss': 0.8307, 'learning_rate': 1.6586040704308078e-05, 'epoch': 0.55} {'loss': 0.8081, 'learning_rate': 1.6585794372138437e-05, 'epoch': 0.55} {'loss': 0.8235, 'learning_rate': 1.658554803291152e-05, 'epoch': 0.55} {'loss': 0.7696, 'learning_rate': 1.6585301686627592e-05, 'epoch': 0.55} {'loss': 0.6645, 'learning_rate': 1.6585055333286924e-05, 'epoch': 0.55} {'loss': 0.9226, 'learning_rate': 1.658480897288977e-05, 'epoch': 0.55} {'loss': 0.95, 'learning_rate': 1.6584562605436403e-05, 'epoch': 0.55} {'loss': 0.7682, 'learning_rate': 1.658431623092708e-05, 'epoch': 0.55} {'loss': 0.9147, 'learning_rate': 1.6584069849362072e-05, 'epoch': 0.55} {'loss': 0.9939, 'learning_rate': 1.658382346074164e-05, 'epoch': 0.55} {'loss': 0.8928, 'learning_rate': 1.6583577065066037e-05, 'epoch': 0.55} {'loss': 0.9282, 'learning_rate': 1.6583330662335546e-05, 'epoch': 0.55} {'loss': 0.867, 'learning_rate': 1.658308425255042e-05, 'epoch': 0.55} {'loss': 0.8481, 'learning_rate': 1.658283783571092e-05, 'epoch': 0.55} {'loss': 1.087, 'learning_rate': 1.658259141181732e-05, 'epoch': 0.55} {'loss': 0.8205, 'learning_rate': 1.658234498086988e-05, 'epoch': 0.55} {'loss': 0.8746, 'learning_rate': 1.658209854286886e-05, 'epoch': 0.55} {'loss': 0.7851, 'learning_rate': 1.658185209781453e-05, 'epoch': 0.55} {'loss': 0.8405, 'learning_rate': 1.6581605645707152e-05, 'epoch': 0.55} {'loss': 0.8264, 'learning_rate': 1.6581359186546987e-05, 'epoch': 0.55} {'loss': 0.8925, 'learning_rate': 1.6581112720334304e-05, 'epoch': 0.55} {'loss': 0.8767, 'learning_rate': 1.6580866247069363e-05, 'epoch': 0.55} {'loss': 0.7629, 'learning_rate': 1.6580619766752432e-05, 'epoch': 0.55} {'loss': 0.8872, 'learning_rate': 1.658037327938377e-05, 'epoch': 0.55} {'loss': 0.7477, 'learning_rate': 1.6580126784963645e-05, 'epoch': 0.55} {'loss': 0.7713, 'learning_rate': 1.657988028349232e-05, 'epoch': 0.55} {'loss': 0.764, 'learning_rate': 1.6579633774970057e-05, 'epoch': 0.55} {'loss': 0.9167, 'learning_rate': 1.657938725939713e-05, 'epoch': 0.55} {'loss': 0.8526, 'learning_rate': 1.657914073677379e-05, 'epoch': 0.55} {'loss': 0.9589, 'learning_rate': 1.6578894207100306e-05, 'epoch': 0.55} {'loss': 1.0146, 'learning_rate': 1.6578647670376948e-05, 'epoch': 0.55} {'loss': 0.956, 'learning_rate': 1.6578401126603968e-05, 'epoch': 0.55} {'loss': 0.8481, 'learning_rate': 1.6578154575781645e-05, 'epoch': 0.55} {'loss': 0.7609, 'learning_rate': 1.6577908017910235e-05, 'epoch': 0.55} {'loss': 0.6834, 'learning_rate': 1.6577661452989997e-05, 'epoch': 0.55} {'loss': 0.7614, 'learning_rate': 1.6577414881021205e-05, 'epoch': 0.55} {'loss': 1.001, 'learning_rate': 1.657716830200412e-05, 'epoch': 0.55} {'loss': 0.8057, 'learning_rate': 1.6576921715939004e-05, 'epoch': 0.55} {'loss': 0.9743, 'learning_rate': 1.657667512282612e-05, 'epoch': 0.55} {'loss': 0.6889, 'learning_rate': 1.6576428522665742e-05, 'epoch': 0.55} {'loss': 0.7105, 'learning_rate': 1.6576181915458122e-05, 'epoch': 0.55} {'loss': 0.9345, 'learning_rate': 1.657593530120353e-05, 'epoch': 0.55} {'loss': 0.7977, 'learning_rate': 1.6575688679902232e-05, 'epoch': 0.55} {'loss': 0.8952, 'learning_rate': 1.657544205155449e-05, 'epoch': 0.55} {'loss': 0.8566, 'learning_rate': 1.6575195416160568e-05, 'epoch': 0.55} {'loss': 0.8553, 'learning_rate': 1.657494877372073e-05, 'epoch': 0.55} {'loss': 1.0776, 'learning_rate': 1.6574702124235242e-05, 'epoch': 0.55} {'loss': 0.9483, 'learning_rate': 1.6574455467704362e-05, 'epoch': 0.55} {'loss': 0.7065, 'learning_rate': 1.6574208804128367e-05, 'epoch': 0.55} {'loss': 0.819, 'learning_rate': 1.6573962133507507e-05, 'epoch': 0.55} {'loss': 0.8948, 'learning_rate': 1.6573715455842058e-05, 'epoch': 0.55} {'loss': 1.0176, 'learning_rate': 1.657346877113228e-05, 'epoch': 0.55} {'loss': 0.9504, 'learning_rate': 1.657322207937844e-05, 'epoch': 0.55} {'loss': 0.9384, 'learning_rate': 1.657297538058079e-05, 'epoch': 0.55} {'loss': 0.8132, 'learning_rate': 1.657272867473961e-05, 'epoch': 0.55} {'loss': 0.8905, 'learning_rate': 1.6572481961855157e-05, 'epoch': 0.55} {'loss': 0.9182, 'learning_rate': 1.6572235241927693e-05, 'epoch': 0.55} {'loss': 0.9067, 'learning_rate': 1.657198851495749e-05, 'epoch': 0.55} {'loss': 0.9444, 'learning_rate': 1.6571741780944806e-05, 'epoch': 0.55} {'loss': 0.7855, 'learning_rate': 1.6571495039889907e-05, 'epoch': 0.55} {'loss': 1.0491, 'learning_rate': 1.6571248291793058e-05, 'epoch': 0.55} {'loss': 1.0419, 'learning_rate': 1.6571001536654526e-05, 'epoch': 0.55} {'loss': 0.7969, 'learning_rate': 1.657075477447457e-05, 'epoch': 0.55} {'loss': 0.8827, 'learning_rate': 1.657050800525346e-05, 'epoch': 0.55} {'loss': 0.8616, 'learning_rate': 1.6570261228991457e-05, 'epoch': 0.55} {'loss': 0.9329, 'learning_rate': 1.6570014445688825e-05, 'epoch': 0.55} {'loss': 0.7641, 'learning_rate': 1.656976765534583e-05, 'epoch': 0.55} {'loss': 1.0682, 'learning_rate': 1.6569520857962734e-05, 'epoch': 0.55} {'loss': 0.8514, 'learning_rate': 1.6569274053539807e-05, 'epoch': 0.55} {'loss': 0.8132, 'learning_rate': 1.6569027242077304e-05, 'epoch': 0.55} {'loss': 0.8648, 'learning_rate': 1.65687804235755e-05, 'epoch': 0.55} {'loss': 0.8518, 'learning_rate': 1.656853359803466e-05, 'epoch': 0.55} {'loss': 0.7819, 'learning_rate': 1.6568286765455035e-05, 'epoch': 0.55} {'loss': 0.7967, 'learning_rate': 1.65680399258369e-05, 'epoch': 0.55} {'loss': 0.7666, 'learning_rate': 1.656779307918052e-05, 'epoch': 0.55} {'loss': 0.8714, 'learning_rate': 1.6567546225486153e-05, 'epoch': 0.55} {'loss': 0.8874, 'learning_rate': 1.656729936475407e-05, 'epoch': 0.55} {'loss': 0.793, 'learning_rate': 1.656705249698453e-05, 'epoch': 0.55} {'loss': 0.8528, 'learning_rate': 1.6566805622177805e-05, 'epoch': 0.55} {'loss': 0.8816, 'learning_rate': 1.6566558740334152e-05, 'epoch': 0.55} {'loss': 0.8725, 'learning_rate': 1.656631185145384e-05, 'epoch': 0.55} {'loss': 0.8891, 'learning_rate': 1.6566064955537135e-05, 'epoch': 0.55} {'loss': 0.7637, 'learning_rate': 1.6565818052584296e-05, 'epoch': 0.55} {'loss': 0.9601, 'learning_rate': 1.656557114259559e-05, 'epoch': 0.55} {'loss': 0.8293, 'learning_rate': 1.656532422557128e-05, 'epoch': 0.55} {'loss': 0.837, 'learning_rate': 1.6565077301511636e-05, 'epoch': 0.55} {'loss': 0.7945, 'learning_rate': 1.6564830370416916e-05, 'epoch': 0.55} {'loss': 0.8659, 'learning_rate': 1.6564583432287392e-05, 'epoch': 0.55} {'loss': 0.7794, 'learning_rate': 1.656433648712332e-05, 'epoch': 0.55} {'loss': 0.9626, 'learning_rate': 1.656408953492497e-05, 'epoch': 0.55} {'loss': 0.8953, 'learning_rate': 1.6563842575692607e-05, 'epoch': 0.55} {'loss': 0.8374, 'learning_rate': 1.6563595609426495e-05, 'epoch': 0.55} {'loss': 0.877, 'learning_rate': 1.6563348636126896e-05, 'epoch': 0.55} {'loss': 0.7564, 'learning_rate': 1.6563101655794077e-05, 'epoch': 0.55} {'loss': 1.0109, 'learning_rate': 1.6562854668428303e-05, 'epoch': 0.55} {'loss': 0.8311, 'learning_rate': 1.6562607674029834e-05, 'epoch': 0.55} {'loss': 0.6983, 'learning_rate': 1.6562360672598946e-05, 'epoch': 0.55} {'loss': 0.754, 'learning_rate': 1.6562113664135892e-05, 'epoch': 0.55} {'loss': 0.8542, 'learning_rate': 1.656186664864094e-05, 'epoch': 0.55} {'loss': 0.7113, 'learning_rate': 1.6561619626114357e-05, 'epoch': 0.55} {'loss': 0.6831, 'learning_rate': 1.6561372596556408e-05, 'epoch': 0.55} {'loss': 0.7084, 'learning_rate': 1.6561125559967354e-05, 'epoch': 0.55} {'loss': 0.8962, 'learning_rate': 1.6560878516347462e-05, 'epoch': 0.55} {'loss': 0.8053, 'learning_rate': 1.6560631465696997e-05, 'epoch': 0.55} {'loss': 1.0005, 'learning_rate': 1.6560384408016222e-05, 'epoch': 0.55} {'loss': 0.8216, 'learning_rate': 1.6560137343305403e-05, 'epoch': 0.55} {'loss': 0.9382, 'learning_rate': 1.6559890271564804e-05, 'epoch': 0.55} {'loss': 0.9135, 'learning_rate': 1.655964319279469e-05, 'epoch': 0.55} {'loss': 0.8054, 'learning_rate': 1.655939610699533e-05, 'epoch': 0.55} {'loss': 0.9027, 'learning_rate': 1.6559149014166985e-05, 'epoch': 0.55} {'loss': 0.6814, 'learning_rate': 1.6558901914309916e-05, 'epoch': 0.55} {'loss': 0.9456, 'learning_rate': 1.6558654807424394e-05, 'epoch': 0.55} {'loss': 0.9319, 'learning_rate': 1.655840769351068e-05, 'epoch': 0.55} {'loss': 0.8363, 'learning_rate': 1.6558160572569045e-05, 'epoch': 0.55} {'loss': 0.8851, 'learning_rate': 1.6557913444599742e-05, 'epoch': 0.55} {'loss': 0.9105, 'learning_rate': 1.6557666309603047e-05, 'epoch': 0.55} {'loss': 0.7893, 'learning_rate': 1.655741916757922e-05, 'epoch': 0.55} {'loss': 0.83, 'learning_rate': 1.655717201852853e-05, 'epoch': 0.55} {'loss': 0.8972, 'learning_rate': 1.655692486245123e-05, 'epoch': 0.55} {'loss': 0.7662, 'learning_rate': 1.65566776993476e-05, 'epoch': 0.55} {'loss': 1.0043, 'learning_rate': 1.6556430529217896e-05, 'epoch': 0.55} {'loss': 0.8244, 'learning_rate': 1.6556183352062386e-05, 'epoch': 0.55} {'loss': 0.7495, 'learning_rate': 1.655593616788133e-05, 'epoch': 0.55} {'loss': 0.791, 'learning_rate': 1.6555688976675e-05, 'epoch': 0.55} {'loss': 0.8412, 'learning_rate': 1.655544177844366e-05, 'epoch': 0.55} {'loss': 0.8161, 'learning_rate': 1.655519457318757e-05, 'epoch': 0.55} {'loss': 0.8782, 'learning_rate': 1.6554947360906995e-05, 'epoch': 0.55} {'loss': 0.7355, 'learning_rate': 1.6554700141602204e-05, 'epoch': 0.55} {'loss': 0.7865, 'learning_rate': 1.6554452915273463e-05, 'epoch': 0.55} {'loss': 0.8307, 'learning_rate': 1.655420568192103e-05, 'epoch': 0.55} {'loss': 0.7311, 'learning_rate': 1.6553958441545176e-05, 'epoch': 0.55} {'loss': 0.8738, 'learning_rate': 1.6553711194146162e-05, 'epoch': 0.55} {'loss': 0.89, 'learning_rate': 1.6553463939724256e-05, 'epoch': 0.55} {'loss': 0.8787, 'learning_rate': 1.6553216678279725e-05, 'epoch': 0.55} {'loss': 0.9273, 'learning_rate': 1.6552969409812826e-05, 'epoch': 0.55} {'loss': 0.7534, 'learning_rate': 1.655272213432383e-05, 'epoch': 0.55} {'loss': 0.8203, 'learning_rate': 1.6552474851813e-05, 'epoch': 0.55} {'loss': 0.8266, 'learning_rate': 1.6552227562280607e-05, 'epoch': 0.55} {'loss': 0.7694, 'learning_rate': 1.655198026572691e-05, 'epoch': 0.55} {'loss': 0.6969, 'learning_rate': 1.655173296215217e-05, 'epoch': 0.55} {'loss': 0.8592, 'learning_rate': 1.655148565155666e-05, 'epoch': 0.55} {'loss': 0.6514, 'learning_rate': 1.655123833394064e-05, 'epoch': 0.55} {'loss': 0.7752, 'learning_rate': 1.655099100930438e-05, 'epoch': 0.55} {'loss': 1.057, 'learning_rate': 1.655074367764814e-05, 'epoch': 0.55} {'loss': 0.8317, 'learning_rate': 1.6550496338972183e-05, 'epoch': 0.55} {'loss': 0.8744, 'learning_rate': 1.655024899327678e-05, 'epoch': 0.55} {'loss': 1.0041, 'learning_rate': 1.65500016405622e-05, 'epoch': 0.55} {'loss': 0.8026, 'learning_rate': 1.6549754280828694e-05, 'epoch': 0.55} {'loss': 0.9181, 'learning_rate': 1.654950691407654e-05, 'epoch': 0.55} {'loss': 0.775, 'learning_rate': 1.6549259540306e-05, 'epoch': 0.55} {'loss': 0.782, 'learning_rate': 1.6549012159517334e-05, 'epoch': 0.55} {'loss': 0.8716, 'learning_rate': 1.6548764771710808e-05, 'epoch': 0.55} {'loss': 0.9706, 'learning_rate': 1.6548517376886692e-05, 'epoch': 0.55} {'loss': 0.9173, 'learning_rate': 1.6548269975045247e-05, 'epoch': 0.55} {'loss': 0.8506, 'learning_rate': 1.6548022566186744e-05, 'epoch': 0.55} {'loss': 1.0535, 'learning_rate': 1.654777515031144e-05, 'epoch': 0.55} {'loss': 0.8445, 'learning_rate': 1.6547527727419604e-05, 'epoch': 0.55} {'loss': 0.8691, 'learning_rate': 1.6547280297511502e-05, 'epoch': 0.55} {'loss': 0.7742, 'learning_rate': 1.65470328605874e-05, 'epoch': 0.55} {'loss': 0.9792, 'learning_rate': 1.654678541664756e-05, 'epoch': 0.55} {'loss': 0.818, 'learning_rate': 1.6546537965692247e-05, 'epoch': 0.55} {'loss': 0.8219, 'learning_rate': 1.654629050772173e-05, 'epoch': 0.55} {'loss': 0.8578, 'learning_rate': 1.6546043042736273e-05, 'epoch': 0.55} {'loss': 0.7901, 'learning_rate': 1.6545795570736136e-05, 'epoch': 0.55} {'loss': 0.8921, 'learning_rate': 1.654554809172159e-05, 'epoch': 0.55} {'loss': 0.8243, 'learning_rate': 1.65453006056929e-05, 'epoch': 0.55} {'loss': 0.7292, 'learning_rate': 1.654505311265033e-05, 'epoch': 0.55} {'loss': 0.9501, 'learning_rate': 1.654480561259414e-05, 'epoch': 0.55} {'loss': 0.8582, 'learning_rate': 1.6544558105524604e-05, 'epoch': 0.55} {'loss': 0.7183, 'learning_rate': 1.6544310591441983e-05, 'epoch': 0.55} {'loss': 0.8692, 'learning_rate': 1.6544063070346542e-05, 'epoch': 0.55} {'loss': 0.9809, 'learning_rate': 1.654381554223855e-05, 'epoch': 0.55} {'loss': 0.8159, 'learning_rate': 1.6543568007118263e-05, 'epoch': 0.55} {'loss': 0.9271, 'learning_rate': 1.6543320464985956e-05, 'epoch': 0.55} {'loss': 0.7857, 'learning_rate': 1.654307291584189e-05, 'epoch': 0.55} {'loss': 0.8103, 'learning_rate': 1.654282535968633e-05, 'epoch': 0.55} {'loss': 0.8128, 'learning_rate': 1.6542577796519545e-05, 'epoch': 0.55} {'loss': 0.7947, 'learning_rate': 1.654233022634179e-05, 'epoch': 0.55} {'loss': 0.9076, 'learning_rate': 1.6542082649153348e-05, 'epoch': 0.55} {'loss': 0.7471, 'learning_rate': 1.6541835064954468e-05, 'epoch': 0.55} {'loss': 0.8898, 'learning_rate': 1.654158747374542e-05, 'epoch': 0.55} {'loss': 0.9265, 'learning_rate': 1.6541339875526475e-05, 'epoch': 0.55} {'loss': 0.8979, 'learning_rate': 1.6541092270297888e-05, 'epoch': 0.55} {'loss': 0.9702, 'learning_rate': 1.6540844658059937e-05, 'epoch': 0.55} {'loss': 0.9613, 'learning_rate': 1.6540597038812876e-05, 'epoch': 0.55} {'loss': 0.6994, 'learning_rate': 1.6540349412556977e-05, 'epoch': 0.55} {'loss': 0.8097, 'learning_rate': 1.6540101779292504e-05, 'epoch': 0.55} {'loss': 0.9443, 'learning_rate': 1.653985413901972e-05, 'epoch': 0.55} {'loss': 0.9793, 'learning_rate': 1.6539606491738892e-05, 'epoch': 0.55} {'loss': 0.8675, 'learning_rate': 1.6539358837450285e-05, 'epoch': 0.55} {'loss': 0.8079, 'learning_rate': 1.6539111176154168e-05, 'epoch': 0.55} {'loss': 0.7205, 'learning_rate': 1.65388635078508e-05, 'epoch': 0.55} {'loss': 0.8901, 'learning_rate': 1.653861583254045e-05, 'epoch': 0.55} {'loss': 0.9, 'learning_rate': 1.6538368150223384e-05, 'epoch': 0.55} {'loss': 0.5893, 'learning_rate': 1.6538120460899864e-05, 'epoch': 0.55} {'loss': 0.9297, 'learning_rate': 1.653787276457016e-05, 'epoch': 0.55} {'loss': 0.8689, 'learning_rate': 1.6537625061234537e-05, 'epoch': 0.55} {'loss': 0.7997, 'learning_rate': 1.6537377350893257e-05, 'epoch': 0.55} {'loss': 0.7684, 'learning_rate': 1.6537129633546584e-05, 'epoch': 0.55} {'loss': 0.9972, 'learning_rate': 1.653688190919479e-05, 'epoch': 0.55} {'loss': 0.8451, 'learning_rate': 1.6536634177838138e-05, 'epoch': 0.55} {'loss': 0.9971, 'learning_rate': 1.653638643947689e-05, 'epoch': 0.55} {'loss': 0.8246, 'learning_rate': 1.6536138694111313e-05, 'epoch': 0.55} {'loss': 0.9066, 'learning_rate': 1.6535890941741678e-05, 'epoch': 0.55} {'loss': 0.8873, 'learning_rate': 1.6535643182368242e-05, 'epoch': 0.55} {'loss': 0.6024, 'learning_rate': 1.6535395415991274e-05, 'epoch': 0.55} {'loss': 0.8223, 'learning_rate': 1.653514764261104e-05, 'epoch': 0.55} {'loss': 0.8664, 'learning_rate': 1.6534899862227807e-05, 'epoch': 0.55} {'loss': 0.8904, 'learning_rate': 1.6534652074841844e-05, 'epoch': 0.55} {'loss': 0.8335, 'learning_rate': 1.6534404280453405e-05, 'epoch': 0.55} {'loss': 0.701, 'learning_rate': 1.6534156479062765e-05, 'epoch': 0.55} {'loss': 1.0537, 'learning_rate': 1.6533908670670184e-05, 'epoch': 0.55} {'loss': 0.7738, 'learning_rate': 1.653366085527593e-05, 'epoch': 0.55} {'loss': 0.8286, 'learning_rate': 1.6533413032880273e-05, 'epoch': 0.55} {'loss': 0.7478, 'learning_rate': 1.653316520348347e-05, 'epoch': 0.55} {'loss': 0.7598, 'learning_rate': 1.6532917367085796e-05, 'epoch': 0.55} {'loss': 0.6857, 'learning_rate': 1.6532669523687505e-05, 'epoch': 0.55} {'loss': 0.7475, 'learning_rate': 1.653242167328887e-05, 'epoch': 0.55} {'loss': 0.6859, 'learning_rate': 1.6532173815890158e-05, 'epoch': 0.55} {'loss': 0.994, 'learning_rate': 1.653192595149163e-05, 'epoch': 0.55} {'loss': 0.7535, 'learning_rate': 1.6531678080093555e-05, 'epoch': 0.55} {'loss': 0.8138, 'learning_rate': 1.6531430201696198e-05, 'epoch': 0.55} {'loss': 0.916, 'learning_rate': 1.6531182316299825e-05, 'epoch': 0.55} {'loss': 0.7041, 'learning_rate': 1.65309344239047e-05, 'epoch': 0.55} {'loss': 0.8805, 'learning_rate': 1.6530686524511088e-05, 'epoch': 0.55} {'loss': 0.8064, 'learning_rate': 1.6530438618119255e-05, 'epoch': 0.55} {'loss': 0.6941, 'learning_rate': 1.653019070472947e-05, 'epoch': 0.55} {'loss': 1.0162, 'learning_rate': 1.6529942784341993e-05, 'epoch': 0.55} {'loss': 0.8524, 'learning_rate': 1.65296948569571e-05, 'epoch': 0.55} {'loss': 0.8163, 'learning_rate': 1.6529446922575042e-05, 'epoch': 0.55} {'loss': 1.0997, 'learning_rate': 1.6529198981196097e-05, 'epoch': 0.55} {'loss': 0.6787, 'learning_rate': 1.6528951032820524e-05, 'epoch': 0.55} {'loss': 1.046, 'learning_rate': 1.652870307744859e-05, 'epoch': 0.55} {'loss': 1.0, 'learning_rate': 1.6528455115080562e-05, 'epoch': 0.55} {'loss': 0.8713, 'learning_rate': 1.6528207145716705e-05, 'epoch': 0.55} {'loss': 0.668, 'learning_rate': 1.6527959169357288e-05, 'epoch': 0.55} {'loss': 0.7615, 'learning_rate': 1.652771118600257e-05, 'epoch': 0.55} {'loss': 0.8982, 'learning_rate': 1.652746319565282e-05, 'epoch': 0.55} {'loss': 0.9092, 'learning_rate': 1.6527215198308307e-05, 'epoch': 0.55} {'loss': 0.9625, 'learning_rate': 1.652696719396929e-05, 'epoch': 0.55} {'loss': 0.7787, 'learning_rate': 1.6526719182636042e-05, 'epoch': 0.55} {'loss': 0.8411, 'learning_rate': 1.6526471164308822e-05, 'epoch': 0.55} {'loss': 0.977, 'learning_rate': 1.6526223138987902e-05, 'epoch': 0.55} {'loss': 0.9276, 'learning_rate': 1.6525975106673543e-05, 'epoch': 0.55} {'loss': 0.8077, 'learning_rate': 1.6525727067366015e-05, 'epoch': 0.55} {'loss': 0.8216, 'learning_rate': 1.652547902106558e-05, 'epoch': 0.55} {'loss': 0.7457, 'learning_rate': 1.6525230967772504e-05, 'epoch': 0.55} {'loss': 0.8481, 'learning_rate': 1.6524982907487057e-05, 'epoch': 0.55} {'loss': 0.7229, 'learning_rate': 1.65247348402095e-05, 'epoch': 0.55} {'loss': 0.9152, 'learning_rate': 1.6524486765940102e-05, 'epoch': 0.55} {'loss': 1.0429, 'learning_rate': 1.6524238684679124e-05, 'epoch': 0.55} {'loss': 0.9705, 'learning_rate': 1.652399059642684e-05, 'epoch': 0.55} {'loss': 0.8861, 'learning_rate': 1.652374250118351e-05, 'epoch': 0.55} {'loss': 0.7991, 'learning_rate': 1.6523494398949403e-05, 'epoch': 0.55} {'loss': 0.7759, 'learning_rate': 1.652324628972478e-05, 'epoch': 0.55} {'loss': 0.9271, 'learning_rate': 1.6522998173509907e-05, 'epoch': 0.55} {'loss': 0.9054, 'learning_rate': 1.6522750050305057e-05, 'epoch': 0.55} {'loss': 0.9255, 'learning_rate': 1.652250192011049e-05, 'epoch': 0.55} {'loss': 0.7057, 'learning_rate': 1.6522253782926472e-05, 'epoch': 0.55} {'loss': 0.8343, 'learning_rate': 1.6522005638753277e-05, 'epoch': 0.55} {'loss': 0.7473, 'learning_rate': 1.652175748759116e-05, 'epoch': 0.55} {'loss': 0.8361, 'learning_rate': 1.652150932944039e-05, 'epoch': 0.55} {'loss': 0.764, 'learning_rate': 1.6521261164301234e-05, 'epoch': 0.55} {'loss': 0.7001, 'learning_rate': 1.652101299217396e-05, 'epoch': 0.55} {'loss': 0.7495, 'learning_rate': 1.652076481305883e-05, 'epoch': 0.55} {'loss': 0.8094, 'learning_rate': 1.652051662695611e-05, 'epoch': 0.55} {'loss': 0.7735, 'learning_rate': 1.6520268433866075e-05, 'epoch': 0.55} {'loss': 0.9738, 'learning_rate': 1.652002023378898e-05, 'epoch': 0.55} {'loss': 0.6351, 'learning_rate': 1.6519772026725093e-05, 'epoch': 0.55} {'loss': 0.7985, 'learning_rate': 1.6519523812674685e-05, 'epoch': 0.55} {'loss': 1.0085, 'learning_rate': 1.6519275591638017e-05, 'epoch': 0.55} {'loss': 0.8897, 'learning_rate': 1.6519027363615357e-05, 'epoch': 0.55} {'loss': 0.9148, 'learning_rate': 1.6518779128606972e-05, 'epoch': 0.55} {'loss': 0.8759, 'learning_rate': 1.6518530886613126e-05, 'epoch': 0.55} {'loss': 0.8135, 'learning_rate': 1.6518282637634085e-05, 'epoch': 0.55} {'loss': 0.8293, 'learning_rate': 1.6518034381670115e-05, 'epoch': 0.55} {'loss': 0.7868, 'learning_rate': 1.6517786118721484e-05, 'epoch': 0.55} {'loss': 0.9078, 'learning_rate': 1.6517537848788457e-05, 'epoch': 0.55} {'loss': 0.7969, 'learning_rate': 1.65172895718713e-05, 'epoch': 0.55} {'loss': 0.9047, 'learning_rate': 1.651704128797028e-05, 'epoch': 0.55} {'loss': 0.7508, 'learning_rate': 1.6516792997085663e-05, 'epoch': 0.55} {'loss': 0.8508, 'learning_rate': 1.6516544699217713e-05, 'epoch': 0.55} {'loss': 0.7628, 'learning_rate': 1.6516296394366694e-05, 'epoch': 0.55} {'loss': 0.7199, 'learning_rate': 1.6516048082532878e-05, 'epoch': 0.55} {'loss': 0.9183, 'learning_rate': 1.651579976371653e-05, 'epoch': 0.55} {'loss': 0.7322, 'learning_rate': 1.651555143791791e-05, 'epoch': 0.55} {'loss': 0.7855, 'learning_rate': 1.6515303105137293e-05, 'epoch': 0.55} {'loss': 0.8236, 'learning_rate': 1.6515054765374937e-05, 'epoch': 0.55} {'loss': 0.7915, 'learning_rate': 1.6514806418631116e-05, 'epoch': 0.55} {'loss': 0.8562, 'learning_rate': 1.651455806490609e-05, 'epoch': 0.55} {'loss': 0.7217, 'learning_rate': 1.6514309704200126e-05, 'epoch': 0.55} {'loss': 0.9702, 'learning_rate': 1.6514061336513493e-05, 'epoch': 0.55} {'loss': 0.9418, 'learning_rate': 1.6513812961846455e-05, 'epoch': 0.55} {'loss': 0.8744, 'learning_rate': 1.651356458019928e-05, 'epoch': 0.55} {'loss': 0.9183, 'learning_rate': 1.651331619157223e-05, 'epoch': 0.55} {'loss': 0.82, 'learning_rate': 1.651306779596557e-05, 'epoch': 0.55} {'loss': 0.8078, 'learning_rate': 1.6512819393379574e-05, 'epoch': 0.55} {'loss': 0.675, 'learning_rate': 1.6512570983814507e-05, 'epoch': 0.55} {'loss': 0.9093, 'learning_rate': 1.651232256727063e-05, 'epoch': 0.55} {'loss': 0.8896, 'learning_rate': 1.6512074143748213e-05, 'epoch': 0.55} {'loss': 0.7563, 'learning_rate': 1.6511825713247517e-05, 'epoch': 0.55} {'loss': 1.021, 'learning_rate': 1.6511577275768815e-05, 'epoch': 0.55} {'loss': 1.0593, 'learning_rate': 1.6511328831312367e-05, 'epoch': 0.55} {'loss': 0.7477, 'learning_rate': 1.6511080379878448e-05, 'epoch': 0.55} {'loss': 0.8455, 'learning_rate': 1.6510831921467315e-05, 'epoch': 0.55} {'loss': 0.7089, 'learning_rate': 1.651058345607924e-05, 'epoch': 0.55} {'loss': 0.9203, 'learning_rate': 1.6510334983714483e-05, 'epoch': 0.55} {'loss': 0.8056, 'learning_rate': 1.651008650437332e-05, 'epoch': 0.55} {'loss': 0.9004, 'learning_rate': 1.6509838018056008e-05, 'epoch': 0.55} {'loss': 0.776, 'learning_rate': 1.650958952476282e-05, 'epoch': 0.55} {'loss': 0.7263, 'learning_rate': 1.6509341024494018e-05, 'epoch': 0.55} {'loss': 0.8027, 'learning_rate': 1.6509092517249867e-05, 'epoch': 0.55} {'loss': 0.8531, 'learning_rate': 1.6508844003030637e-05, 'epoch': 0.55} {'loss': 0.6608, 'learning_rate': 1.6508595481836596e-05, 'epoch': 0.55} {'loss': 0.6809, 'learning_rate': 1.6508346953668004e-05, 'epoch': 0.55} {'loss': 0.9607, 'learning_rate': 1.6508098418525132e-05, 'epoch': 0.55} {'loss': 0.7201, 'learning_rate': 1.6507849876408245e-05, 'epoch': 0.55} {'loss': 0.7805, 'learning_rate': 1.6507601327317614e-05, 'epoch': 0.55} {'loss': 0.815, 'learning_rate': 1.6507352771253496e-05, 'epoch': 0.55} {'loss': 0.8278, 'learning_rate': 1.6507104208216163e-05, 'epoch': 0.55} {'loss': 0.8631, 'learning_rate': 1.6506855638205878e-05, 'epoch': 0.55} {'loss': 0.9422, 'learning_rate': 1.6506607061222916e-05, 'epoch': 0.55} {'loss': 0.8914, 'learning_rate': 1.650635847726753e-05, 'epoch': 0.55} {'loss': 0.876, 'learning_rate': 1.650610988634e-05, 'epoch': 0.55} {'loss': 0.7988, 'learning_rate': 1.6505861288440584e-05, 'epoch': 0.55} {'loss': 0.7992, 'learning_rate': 1.650561268356955e-05, 'epoch': 0.55} {'loss': 0.7985, 'learning_rate': 1.6505364071727164e-05, 'epoch': 0.55} {'loss': 1.0909, 'learning_rate': 1.6505115452913694e-05, 'epoch': 0.55} {'loss': 0.9289, 'learning_rate': 1.6504866827129407e-05, 'epoch': 0.55} {'loss': 0.8856, 'learning_rate': 1.6504618194374566e-05, 'epoch': 0.55} {'loss': 0.8504, 'learning_rate': 1.6504369554649438e-05, 'epoch': 0.55} {'loss': 0.904, 'learning_rate': 1.6504120907954296e-05, 'epoch': 0.55} {'loss': 0.8479, 'learning_rate': 1.65038722542894e-05, 'epoch': 0.55} {'loss': 0.8799, 'learning_rate': 1.6503623593655013e-05, 'epoch': 0.55} {'loss': 0.8653, 'learning_rate': 1.650337492605141e-05, 'epoch': 0.55} {'loss': 0.835, 'learning_rate': 1.6503126251478857e-05, 'epoch': 0.55} {'loss': 0.7379, 'learning_rate': 1.6502877569937612e-05, 'epoch': 0.55} {'loss': 0.7487, 'learning_rate': 1.650262888142795e-05, 'epoch': 0.55} {'loss': 0.9145, 'learning_rate': 1.650238018595013e-05, 'epoch': 0.55} {'loss': 0.7917, 'learning_rate': 1.6502131483504425e-05, 'epoch': 0.55} {'loss': 0.897, 'learning_rate': 1.65018827740911e-05, 'epoch': 0.55} {'loss': 0.887, 'learning_rate': 1.6501634057710423e-05, 'epoch': 0.55} {'loss': 0.8633, 'learning_rate': 1.6501385334362658e-05, 'epoch': 0.55} {'loss': 0.7931, 'learning_rate': 1.650113660404807e-05, 'epoch': 0.55} {'loss': 0.7695, 'learning_rate': 1.6500887866766925e-05, 'epoch': 0.55} {'loss': 0.7606, 'learning_rate': 1.6500639122519497e-05, 'epoch': 0.55} {'loss': 0.8405, 'learning_rate': 1.6500390371306042e-05, 'epoch': 0.55} {'loss': 0.9591, 'learning_rate': 1.6500141613126835e-05, 'epoch': 0.55} {'loss': 0.9919, 'learning_rate': 1.649989284798214e-05, 'epoch': 0.55} {'loss': 0.8324, 'learning_rate': 1.6499644075872225e-05, 'epoch': 0.55} {'loss': 0.7284, 'learning_rate': 1.6499395296797353e-05, 'epoch': 0.55} {'loss': 0.8941, 'learning_rate': 1.6499146510757786e-05, 'epoch': 0.55} {'loss': 0.8285, 'learning_rate': 1.6498897717753806e-05, 'epoch': 0.55} {'loss': 0.9478, 'learning_rate': 1.6498648917785666e-05, 'epoch': 0.55} {'loss': 0.9304, 'learning_rate': 1.649840011085364e-05, 'epoch': 0.55} {'loss': 0.8427, 'learning_rate': 1.6498151296957988e-05, 'epoch': 0.55} {'loss': 0.9398, 'learning_rate': 1.6497902476098984e-05, 'epoch': 0.55} {'loss': 0.7377, 'learning_rate': 1.6497653648276887e-05, 'epoch': 0.55} {'loss': 0.9877, 'learning_rate': 1.649740481349197e-05, 'epoch': 0.55} {'loss': 1.0435, 'learning_rate': 1.6497155971744497e-05, 'epoch': 0.55} {'loss': 0.9152, 'learning_rate': 1.6496907123034738e-05, 'epoch': 0.55} {'loss': 1.0161, 'learning_rate': 1.6496658267362954e-05, 'epoch': 0.55} {'loss': 0.8828, 'learning_rate': 1.6496409404729413e-05, 'epoch': 0.55} {'loss': 0.9335, 'learning_rate': 1.6496160535134383e-05, 'epoch': 0.55} {'loss': 0.792, 'learning_rate': 1.649591165857813e-05, 'epoch': 0.55} {'loss': 0.9017, 'learning_rate': 1.6495662775060925e-05, 'epoch': 0.55} {'loss': 0.8674, 'learning_rate': 1.6495413884583033e-05, 'epoch': 0.55} {'loss': 0.6829, 'learning_rate': 1.6495164987144715e-05, 'epoch': 0.55} {'loss': 0.7688, 'learning_rate': 1.649491608274624e-05, 'epoch': 0.55} {'loss': 0.9228, 'learning_rate': 1.6494667171387874e-05, 'epoch': 0.55} {'loss': 0.8882, 'learning_rate': 1.6494418253069892e-05, 'epoch': 0.55} {'loss': 0.6908, 'learning_rate': 1.6494169327792552e-05, 'epoch': 0.55} {'loss': 0.8785, 'learning_rate': 1.6493920395556126e-05, 'epoch': 0.55} {'loss': 0.7489, 'learning_rate': 1.6493671456360876e-05, 'epoch': 0.55} {'loss': 0.8681, 'learning_rate': 1.6493422510207067e-05, 'epoch': 0.55} {'loss': 1.0717, 'learning_rate': 1.6493173557094975e-05, 'epoch': 0.55} {'loss': 0.8564, 'learning_rate': 1.6492924597024862e-05, 'epoch': 0.55} {'loss': 0.7172, 'learning_rate': 1.649267562999699e-05, 'epoch': 0.55} {'loss': 0.7297, 'learning_rate': 1.649242665601163e-05, 'epoch': 0.55} {'loss': 0.7649, 'learning_rate': 1.6492177675069055e-05, 'epoch': 0.55} {'loss': 0.8089, 'learning_rate': 1.6491928687169523e-05, 'epoch': 0.55} {'loss': 0.915, 'learning_rate': 1.6491679692313302e-05, 'epoch': 0.55} {'loss': 0.8111, 'learning_rate': 1.649143069050066e-05, 'epoch': 0.55} {'loss': 0.7126, 'learning_rate': 1.6491181681731866e-05, 'epoch': 0.55} {'loss': 0.7069, 'learning_rate': 1.6490932666007182e-05, 'epoch': 0.55} {'loss': 0.9619, 'learning_rate': 1.6490683643326885e-05, 'epoch': 0.55} {'loss': 0.8669, 'learning_rate': 1.6490434613691227e-05, 'epoch': 0.55} {'loss': 0.8433, 'learning_rate': 1.6490185577100483e-05, 'epoch': 0.55} {'loss': 0.8333, 'learning_rate': 1.648993653355492e-05, 'epoch': 0.55} {'loss': 0.8239, 'learning_rate': 1.648968748305481e-05, 'epoch': 0.55} {'loss': 1.0236, 'learning_rate': 1.6489438425600407e-05, 'epoch': 0.55} {'loss': 1.0482, 'learning_rate': 1.6489189361191987e-05, 'epoch': 0.55} {'loss': 0.877, 'learning_rate': 1.648894028982982e-05, 'epoch': 0.55} {'loss': 0.877, 'learning_rate': 1.648869121151416e-05, 'epoch': 0.56} {'loss': 0.9864, 'learning_rate': 1.6488442126245285e-05, 'epoch': 0.56} {'loss': 0.721, 'learning_rate': 1.648819303402346e-05, 'epoch': 0.56} {'loss': 0.8224, 'learning_rate': 1.6487943934848945e-05, 'epoch': 0.56} {'loss': 0.6917, 'learning_rate': 1.648769482872202e-05, 'epoch': 0.56} {'loss': 0.8234, 'learning_rate': 1.648744571564294e-05, 'epoch': 0.56} {'loss': 0.734, 'learning_rate': 1.648719659561198e-05, 'epoch': 0.56} {'loss': 0.7186, 'learning_rate': 1.64869474686294e-05, 'epoch': 0.56} {'loss': 0.8909, 'learning_rate': 1.648669833469547e-05, 'epoch': 0.56} {'loss': 0.812, 'learning_rate': 1.648644919381046e-05, 'epoch': 0.56} {'loss': 0.7547, 'learning_rate': 1.6486200045974632e-05, 'epoch': 0.56} {'loss': 0.9499, 'learning_rate': 1.6485950891188257e-05, 'epoch': 0.56} {'loss': 0.9631, 'learning_rate': 1.64857017294516e-05, 'epoch': 0.56} {'loss': 0.7337, 'learning_rate': 1.6485452560764924e-05, 'epoch': 0.56} {'loss': 0.7437, 'learning_rate': 1.6485203385128504e-05, 'epoch': 0.56} {'loss': 0.8968, 'learning_rate': 1.6484954202542606e-05, 'epoch': 0.56} {'loss': 0.7264, 'learning_rate': 1.648470501300749e-05, 'epoch': 0.56} {'loss': 0.7906, 'learning_rate': 1.6484455816523432e-05, 'epoch': 0.56} {'loss': 0.8613, 'learning_rate': 1.6484206613090687e-05, 'epoch': 0.56} {'loss': 0.6546, 'learning_rate': 1.6483957402709535e-05, 'epoch': 0.56} {'loss': 0.873, 'learning_rate': 1.6483708185380233e-05, 'epoch': 0.56} {'loss': 0.8668, 'learning_rate': 1.6483458961103055e-05, 'epoch': 0.56} {'loss': 0.8971, 'learning_rate': 1.6483209729878268e-05, 'epoch': 0.56} {'loss': 0.7926, 'learning_rate': 1.6482960491706134e-05, 'epoch': 0.56} {'loss': 0.7578, 'learning_rate': 1.648271124658692e-05, 'epoch': 0.56} {'loss': 0.9425, 'learning_rate': 1.6482461994520903e-05, 'epoch': 0.56} {'loss': 0.7023, 'learning_rate': 1.6482212735508336e-05, 'epoch': 0.56} {'loss': 0.8233, 'learning_rate': 1.6481963469549497e-05, 'epoch': 0.56} {'loss': 0.8973, 'learning_rate': 1.648171419664465e-05, 'epoch': 0.56} {'loss': 0.8292, 'learning_rate': 1.6481464916794055e-05, 'epoch': 0.56} {'loss': 0.7312, 'learning_rate': 1.6481215629997992e-05, 'epoch': 0.56} {'loss': 0.9598, 'learning_rate': 1.648096633625672e-05, 'epoch': 0.56} {'loss': 0.9925, 'learning_rate': 1.6480717035570504e-05, 'epoch': 0.56} {'loss': 0.8107, 'learning_rate': 1.648046772793962e-05, 'epoch': 0.56} {'loss': 0.8126, 'learning_rate': 1.6480218413364327e-05, 'epoch': 0.56} {'loss': 0.8481, 'learning_rate': 1.6479969091844894e-05, 'epoch': 0.56} {'loss': 0.8119, 'learning_rate': 1.6479719763381592e-05, 'epoch': 0.56} {'loss': 0.8678, 'learning_rate': 1.647947042797468e-05, 'epoch': 0.56} {'loss': 0.8331, 'learning_rate': 1.6479221085624437e-05, 'epoch': 0.56} {'loss': 0.6674, 'learning_rate': 1.6478971736331125e-05, 'epoch': 0.56} {'loss': 0.7157, 'learning_rate': 1.6478722380095002e-05, 'epoch': 0.56} {'loss': 0.7722, 'learning_rate': 1.647847301691635e-05, 'epoch': 0.56} {'loss': 0.6363, 'learning_rate': 1.647822364679543e-05, 'epoch': 0.56} {'loss': 0.8679, 'learning_rate': 1.6477974269732505e-05, 'epoch': 0.56} {'loss': 0.8933, 'learning_rate': 1.6477724885727844e-05, 'epoch': 0.56} {'loss': 0.8522, 'learning_rate': 1.6477475494781717e-05, 'epoch': 0.56} {'loss': 0.7721, 'learning_rate': 1.6477226096894396e-05, 'epoch': 0.56} {'loss': 0.7811, 'learning_rate': 1.6476976692066138e-05, 'epoch': 0.56} {'loss': 0.7085, 'learning_rate': 1.6476727280297217e-05, 'epoch': 0.56} {'loss': 0.7905, 'learning_rate': 1.6476477861587895e-05, 'epoch': 0.56} {'loss': 0.8114, 'learning_rate': 1.6476228435938445e-05, 'epoch': 0.56} {'loss': 0.6826, 'learning_rate': 1.6475979003349133e-05, 'epoch': 0.56} {'loss': 0.7802, 'learning_rate': 1.647572956382022e-05, 'epoch': 0.56} {'loss': 0.9391, 'learning_rate': 1.6475480117351984e-05, 'epoch': 0.56} {'loss': 0.8132, 'learning_rate': 1.6475230663944685e-05, 'epoch': 0.56} {'loss': 0.7863, 'learning_rate': 1.6474981203598588e-05, 'epoch': 0.56} {'loss': 0.9958, 'learning_rate': 1.6474731736313965e-05, 'epoch': 0.56} {'loss': 0.8273, 'learning_rate': 1.6474482262091086e-05, 'epoch': 0.56} {'loss': 0.8131, 'learning_rate': 1.6474232780930215e-05, 'epoch': 0.56} {'loss': 0.7468, 'learning_rate': 1.6473983292831618e-05, 'epoch': 0.56} {'loss': 0.8557, 'learning_rate': 1.6473733797795564e-05, 'epoch': 0.56} {'loss': 0.9093, 'learning_rate': 1.647348429582232e-05, 'epoch': 0.56} {'loss': 0.8121, 'learning_rate': 1.6473234786912154e-05, 'epoch': 0.56} {'loss': 0.811, 'learning_rate': 1.647298527106533e-05, 'epoch': 0.56} {'loss': 0.7343, 'learning_rate': 1.6472735748282117e-05, 'epoch': 0.56} {'loss': 0.7149, 'learning_rate': 1.6472486218562788e-05, 'epoch': 0.56} {'loss': 1.0079, 'learning_rate': 1.6472236681907604e-05, 'epoch': 0.56} {'loss': 0.8049, 'learning_rate': 1.6471987138316833e-05, 'epoch': 0.56} {'loss': 0.8949, 'learning_rate': 1.6471737587790746e-05, 'epoch': 0.56} {'loss': 0.8954, 'learning_rate': 1.6471488030329604e-05, 'epoch': 0.56} {'loss': 1.1111, 'learning_rate': 1.6471238465933684e-05, 'epoch': 0.56} {'loss': 0.8244, 'learning_rate': 1.6470988894603245e-05, 'epoch': 0.56} {'loss': 0.8897, 'learning_rate': 1.6470739316338557e-05, 'epoch': 0.56} {'loss': 0.7847, 'learning_rate': 1.6470489731139888e-05, 'epoch': 0.56} {'loss': 0.7946, 'learning_rate': 1.6470240139007505e-05, 'epoch': 0.56} {'loss': 0.9898, 'learning_rate': 1.6469990539941677e-05, 'epoch': 0.56} {'loss': 1.0058, 'learning_rate': 1.646974093394267e-05, 'epoch': 0.56} {'loss': 0.9914, 'learning_rate': 1.646949132101075e-05, 'epoch': 0.56} {'loss': 0.8281, 'learning_rate': 1.646924170114619e-05, 'epoch': 0.56} {'loss': 0.8897, 'learning_rate': 1.6468992074349248e-05, 'epoch': 0.56} {'loss': 0.9264, 'learning_rate': 1.64687424406202e-05, 'epoch': 0.56} {'loss': 0.8855, 'learning_rate': 1.646849279995931e-05, 'epoch': 0.56} {'loss': 0.6825, 'learning_rate': 1.6468243152366848e-05, 'epoch': 0.56} {'loss': 0.8263, 'learning_rate': 1.646799349784308e-05, 'epoch': 0.56} {'loss': 0.7611, 'learning_rate': 1.6467743836388266e-05, 'epoch': 0.56} {'loss': 0.7406, 'learning_rate': 1.6467494168002688e-05, 'epoch': 0.56} {'loss': 0.9475, 'learning_rate': 1.6467244492686608e-05, 'epoch': 0.56} {'loss': 0.7935, 'learning_rate': 1.6466994810440287e-05, 'epoch': 0.56} {'loss': 0.8689, 'learning_rate': 1.6466745121264e-05, 'epoch': 0.56} {'loss': 0.9381, 'learning_rate': 1.646649542515801e-05, 'epoch': 0.56} {'loss': 0.706, 'learning_rate': 1.6466245722122586e-05, 'epoch': 0.56} {'loss': 0.7628, 'learning_rate': 1.6465996012157996e-05, 'epoch': 0.56} {'loss': 0.8999, 'learning_rate': 1.646574629526451e-05, 'epoch': 0.56} {'loss': 0.9668, 'learning_rate': 1.6465496571442395e-05, 'epoch': 0.56} {'loss': 0.7838, 'learning_rate': 1.646524684069191e-05, 'epoch': 0.56} {'loss': 0.9542, 'learning_rate': 1.646499710301334e-05, 'epoch': 0.56} {'loss': 0.9409, 'learning_rate': 1.6464747358406932e-05, 'epoch': 0.56} {'loss': 0.6701, 'learning_rate': 1.646449760687297e-05, 'epoch': 0.56} {'loss': 0.7232, 'learning_rate': 1.646424784841171e-05, 'epoch': 0.56} {'loss': 0.6776, 'learning_rate': 1.646399808302343e-05, 'epoch': 0.56} {'loss': 0.9066, 'learning_rate': 1.646374831070839e-05, 'epoch': 0.56} {'loss': 0.8918, 'learning_rate': 1.6463498531466862e-05, 'epoch': 0.56} {'loss': 0.8075, 'learning_rate': 1.6463248745299106e-05, 'epoch': 0.56} {'loss': 0.9627, 'learning_rate': 1.6462998952205402e-05, 'epoch': 0.56} {'loss': 0.7299, 'learning_rate': 1.646274915218601e-05, 'epoch': 0.56} {'loss': 0.7832, 'learning_rate': 1.64624993452412e-05, 'epoch': 0.56} {'loss': 0.9659, 'learning_rate': 1.6462249531371236e-05, 'epoch': 0.56} {'loss': 0.9115, 'learning_rate': 1.646199971057639e-05, 'epoch': 0.56} {'loss': 0.771, 'learning_rate': 1.6461749882856928e-05, 'epoch': 0.56} {'loss': 0.709, 'learning_rate': 1.646150004821312e-05, 'epoch': 0.56} {'loss': 0.7532, 'learning_rate': 1.646125020664523e-05, 'epoch': 0.56} {'loss': 0.9902, 'learning_rate': 1.6461000358153523e-05, 'epoch': 0.56} {'loss': 0.8018, 'learning_rate': 1.6460750502738276e-05, 'epoch': 0.56} {'loss': 0.7561, 'learning_rate': 1.646050064039975e-05, 'epoch': 0.56} {'loss': 0.8003, 'learning_rate': 1.6460250771138215e-05, 'epoch': 0.56} {'loss': 0.915, 'learning_rate': 1.6460000894953936e-05, 'epoch': 0.56} {'loss': 0.7107, 'learning_rate': 1.6459751011847186e-05, 'epoch': 0.56} {'loss': 0.9136, 'learning_rate': 1.6459501121818225e-05, 'epoch': 0.56} {'loss': 0.9687, 'learning_rate': 1.645925122486733e-05, 'epoch': 0.56} {'loss': 0.8194, 'learning_rate': 1.6459001320994766e-05, 'epoch': 0.56} {'loss': 0.9047, 'learning_rate': 1.6458751410200796e-05, 'epoch': 0.56} {'loss': 0.8536, 'learning_rate': 1.645850149248569e-05, 'epoch': 0.56} {'loss': 0.7496, 'learning_rate': 1.645825156784972e-05, 'epoch': 0.56} {'loss': 0.8474, 'learning_rate': 1.6458001636293146e-05, 'epoch': 0.56} {'loss': 0.9908, 'learning_rate': 1.6457751697816245e-05, 'epoch': 0.56} {'loss': 0.9808, 'learning_rate': 1.6457501752419278e-05, 'epoch': 0.56} {'loss': 0.83, 'learning_rate': 1.6457251800102516e-05, 'epoch': 0.56} {'loss': 0.9127, 'learning_rate': 1.6457001840866223e-05, 'epoch': 0.56} {'loss': 0.9256, 'learning_rate': 1.645675187471067e-05, 'epoch': 0.56} {'loss': 0.8926, 'learning_rate': 1.6456501901636127e-05, 'epoch': 0.56} {'loss': 0.866, 'learning_rate': 1.645625192164286e-05, 'epoch': 0.56} {'loss': 0.9649, 'learning_rate': 1.6456001934731136e-05, 'epoch': 0.56} {'loss': 0.9085, 'learning_rate': 1.6455751940901225e-05, 'epoch': 0.56} {'loss': 0.9716, 'learning_rate': 1.6455501940153393e-05, 'epoch': 0.56} {'loss': 0.7674, 'learning_rate': 1.64552519324879e-05, 'epoch': 0.56} {'loss': 0.7512, 'learning_rate': 1.6455001917905028e-05, 'epoch': 0.56} {'loss': 0.7931, 'learning_rate': 1.645475189640504e-05, 'epoch': 0.56} {'loss': 0.9089, 'learning_rate': 1.6454501867988203e-05, 'epoch': 0.56} {'loss': 0.8328, 'learning_rate': 1.6454251832654785e-05, 'epoch': 0.56} {'loss': 0.7866, 'learning_rate': 1.645400179040505e-05, 'epoch': 0.56} {'loss': 0.7426, 'learning_rate': 1.645375174123927e-05, 'epoch': 0.56} {'loss': 0.8511, 'learning_rate': 1.6453501685157714e-05, 'epoch': 0.56} {'loss': 0.9555, 'learning_rate': 1.6453251622160648e-05, 'epoch': 0.56} {'loss': 0.8551, 'learning_rate': 1.6453001552248344e-05, 'epoch': 0.56} {'loss': 0.6054, 'learning_rate': 1.645275147542106e-05, 'epoch': 0.56} {'loss': 0.8157, 'learning_rate': 1.6452501391679075e-05, 'epoch': 0.56} {'loss': 0.8671, 'learning_rate': 1.645225130102265e-05, 'epoch': 0.56} {'loss': 0.8936, 'learning_rate': 1.6452001203452056e-05, 'epoch': 0.56} {'loss': 0.8165, 'learning_rate': 1.645175109896756e-05, 'epoch': 0.56} {'loss': 0.9745, 'learning_rate': 1.6451500987569432e-05, 'epoch': 0.56} {'loss': 0.8073, 'learning_rate': 1.645125086925794e-05, 'epoch': 0.56} {'loss': 1.0249, 'learning_rate': 1.6451000744033347e-05, 'epoch': 0.56} {'loss': 0.9603, 'learning_rate': 1.6450750611895922e-05, 'epoch': 0.56} {'loss': 0.6091, 'learning_rate': 1.645050047284594e-05, 'epoch': 0.56} {'loss': 0.8038, 'learning_rate': 1.6450250326883662e-05, 'epoch': 0.56} {'loss': 0.7545, 'learning_rate': 1.6450000174009363e-05, 'epoch': 0.56} {'loss': 0.9111, 'learning_rate': 1.6449750014223302e-05, 'epoch': 0.56} {'loss': 0.6404, 'learning_rate': 1.6449499847525754e-05, 'epoch': 0.56} {'loss': 0.8237, 'learning_rate': 1.6449249673916986e-05, 'epoch': 0.56} {'loss': 0.8869, 'learning_rate': 1.644899949339726e-05, 'epoch': 0.56} {'loss': 0.5901, 'learning_rate': 1.6448749305966852e-05, 'epoch': 0.56} {'loss': 0.7416, 'learning_rate': 1.6448499111626028e-05, 'epoch': 0.56} {'loss': 0.818, 'learning_rate': 1.6448248910375054e-05, 'epoch': 0.56} {'loss': 0.7308, 'learning_rate': 1.64479987022142e-05, 'epoch': 0.56} {'loss': 0.9014, 'learning_rate': 1.644774848714373e-05, 'epoch': 0.56} {'loss': 0.8739, 'learning_rate': 1.644749826516392e-05, 'epoch': 0.56} {'loss': 0.8752, 'learning_rate': 1.6447248036275035e-05, 'epoch': 0.56} {'loss': 0.8128, 'learning_rate': 1.644699780047734e-05, 'epoch': 0.56} {'loss': 0.7825, 'learning_rate': 1.6446747557771102e-05, 'epoch': 0.56} {'loss': 0.735, 'learning_rate': 1.6446497308156594e-05, 'epoch': 0.56} {'loss': 0.878, 'learning_rate': 1.6446247051634082e-05, 'epoch': 0.56} {'loss': 0.666, 'learning_rate': 1.6445996788203836e-05, 'epoch': 0.56} {'loss': 0.8884, 'learning_rate': 1.6445746517866122e-05, 'epoch': 0.56} {'loss': 0.822, 'learning_rate': 1.644549624062121e-05, 'epoch': 0.56} {'loss': 0.7637, 'learning_rate': 1.6445245956469363e-05, 'epoch': 0.56} {'loss': 0.8452, 'learning_rate': 1.6444995665410858e-05, 'epoch': 0.56} {'loss': 0.9626, 'learning_rate': 1.6444745367445954e-05, 'epoch': 0.56} {'loss': 0.9828, 'learning_rate': 1.6444495062574926e-05, 'epoch': 0.56} {'loss': 0.8676, 'learning_rate': 1.644424475079804e-05, 'epoch': 0.56} {'loss': 0.8198, 'learning_rate': 1.6443994432115563e-05, 'epoch': 0.56} {'loss': 0.7945, 'learning_rate': 1.6443744106527766e-05, 'epoch': 0.56} {'loss': 0.6775, 'learning_rate': 1.6443493774034916e-05, 'epoch': 0.56} {'loss': 0.89, 'learning_rate': 1.644324343463728e-05, 'epoch': 0.56} {'loss': 0.8648, 'learning_rate': 1.6442993088335127e-05, 'epoch': 0.56} {'loss': 0.7738, 'learning_rate': 1.6442742735128723e-05, 'epoch': 0.56} {'loss': 1.0033, 'learning_rate': 1.644249237501834e-05, 'epoch': 0.56} {'loss': 0.7037, 'learning_rate': 1.644224200800425e-05, 'epoch': 0.56} {'loss': 0.8916, 'learning_rate': 1.644199163408671e-05, 'epoch': 0.56} {'loss': 0.749, 'learning_rate': 1.6441741253265996e-05, 'epoch': 0.56} {'loss': 0.7753, 'learning_rate': 1.6441490865542377e-05, 'epoch': 0.56} {'loss': 0.6628, 'learning_rate': 1.644124047091612e-05, 'epoch': 0.56} {'loss': 0.7445, 'learning_rate': 1.6440990069387485e-05, 'epoch': 0.56} {'loss': 0.7345, 'learning_rate': 1.6440739660956756e-05, 'epoch': 0.56} {'loss': 0.9628, 'learning_rate': 1.644048924562419e-05, 'epoch': 0.56} {'loss': 0.8909, 'learning_rate': 1.644023882339006e-05, 'epoch': 0.56} {'loss': 0.9293, 'learning_rate': 1.643998839425463e-05, 'epoch': 0.56} {'loss': 0.783, 'learning_rate': 1.643973795821817e-05, 'epoch': 0.56} {'loss': 0.7931, 'learning_rate': 1.6439487515280955e-05, 'epoch': 0.56} {'loss': 0.7689, 'learning_rate': 1.6439237065443244e-05, 'epoch': 0.56} {'loss': 0.8165, 'learning_rate': 1.643898660870531e-05, 'epoch': 0.56} {'loss': 0.9079, 'learning_rate': 1.643873614506742e-05, 'epoch': 0.56} {'loss': 0.771, 'learning_rate': 1.6438485674529843e-05, 'epoch': 0.56} {'loss': 0.7981, 'learning_rate': 1.643823519709285e-05, 'epoch': 0.56} {'loss': 0.7789, 'learning_rate': 1.6437984712756704e-05, 'epoch': 0.56} {'loss': 0.7785, 'learning_rate': 1.643773422152168e-05, 'epoch': 0.56} {'loss': 0.729, 'learning_rate': 1.6437483723388038e-05, 'epoch': 0.56} {'loss': 0.7911, 'learning_rate': 1.643723321835606e-05, 'epoch': 0.56} {'loss': 0.8474, 'learning_rate': 1.6436982706425996e-05, 'epoch': 0.56} {'loss': 0.9069, 'learning_rate': 1.643673218759813e-05, 'epoch': 0.56} {'loss': 0.8358, 'learning_rate': 1.643648166187272e-05, 'epoch': 0.56} {'loss': 0.8885, 'learning_rate': 1.643623112925004e-05, 'epoch': 0.56} {'loss': 0.8633, 'learning_rate': 1.6435980589730357e-05, 'epoch': 0.56} {'loss': 0.7152, 'learning_rate': 1.6435730043313946e-05, 'epoch': 0.56} {'loss': 0.9647, 'learning_rate': 1.643547949000106e-05, 'epoch': 0.56} {'loss': 0.8088, 'learning_rate': 1.643522892979198e-05, 'epoch': 0.56} {'loss': 0.8585, 'learning_rate': 1.6434978362686976e-05, 'epoch': 0.56} {'loss': 0.7833, 'learning_rate': 1.643472778868631e-05, 'epoch': 0.56} {'loss': 0.7987, 'learning_rate': 1.643447720779025e-05, 'epoch': 0.56} {'loss': 0.7802, 'learning_rate': 1.6434226619999068e-05, 'epoch': 0.56} {'loss': 0.9919, 'learning_rate': 1.6433976025313034e-05, 'epoch': 0.56} {'loss': 0.6649, 'learning_rate': 1.643372542373241e-05, 'epoch': 0.56} {'loss': 0.8054, 'learning_rate': 1.643347481525747e-05, 'epoch': 0.56} {'loss': 0.7649, 'learning_rate': 1.6433224199888482e-05, 'epoch': 0.56} {'loss': 0.7868, 'learning_rate': 1.6432973577625712e-05, 'epoch': 0.56} {'loss': 0.9094, 'learning_rate': 1.643272294846943e-05, 'epoch': 0.56} {'loss': 0.8421, 'learning_rate': 1.6432472312419906e-05, 'epoch': 0.56} {'loss': 0.7715, 'learning_rate': 1.643222166947741e-05, 'epoch': 0.56} {'loss': 0.9549, 'learning_rate': 1.6431971019642205e-05, 'epoch': 0.56} {'loss': 0.8589, 'learning_rate': 1.643172036291456e-05, 'epoch': 0.56} {'loss': 0.9032, 'learning_rate': 1.643146969929475e-05, 'epoch': 0.56} {'loss': 0.7604, 'learning_rate': 1.6431219028783035e-05, 'epoch': 0.56} {'loss': 0.7015, 'learning_rate': 1.6430968351379693e-05, 'epoch': 0.56} {'loss': 0.8525, 'learning_rate': 1.643071766708499e-05, 'epoch': 0.56} {'loss': 0.8591, 'learning_rate': 1.643046697589919e-05, 'epoch': 0.56} {'loss': 0.932, 'learning_rate': 1.6430216277822562e-05, 'epoch': 0.56} {'loss': 0.8233, 'learning_rate': 1.6429965572855377e-05, 'epoch': 0.56} {'loss': 0.9244, 'learning_rate': 1.6429714860997906e-05, 'epoch': 0.56} {'loss': 0.8614, 'learning_rate': 1.6429464142250416e-05, 'epoch': 0.56} {'loss': 0.7341, 'learning_rate': 1.6429213416613173e-05, 'epoch': 0.56} {'loss': 0.983, 'learning_rate': 1.642896268408645e-05, 'epoch': 0.56} {'loss': 0.699, 'learning_rate': 1.6428711944670507e-05, 'epoch': 0.56} {'loss': 0.6709, 'learning_rate': 1.6428461198365623e-05, 'epoch': 0.56} {'loss': 0.8203, 'learning_rate': 1.642821044517206e-05, 'epoch': 0.56} {'loss': 0.8933, 'learning_rate': 1.6427959685090094e-05, 'epoch': 0.56} {'loss': 0.9732, 'learning_rate': 1.6427708918119988e-05, 'epoch': 0.56} {'loss': 0.7808, 'learning_rate': 1.642745814426201e-05, 'epoch': 0.56} {'loss': 0.8134, 'learning_rate': 1.642720736351643e-05, 'epoch': 0.56} {'loss': 0.9464, 'learning_rate': 1.642695657588352e-05, 'epoch': 0.56} {'loss': 0.7902, 'learning_rate': 1.6426705781363543e-05, 'epoch': 0.56} {'loss': 1.0801, 'learning_rate': 1.642645497995677e-05, 'epoch': 0.56} {'loss': 0.8717, 'learning_rate': 1.6426204171663478e-05, 'epoch': 0.56} {'loss': 0.8834, 'learning_rate': 1.6425953356483922e-05, 'epoch': 0.56} {'loss': 0.8979, 'learning_rate': 1.6425702534418375e-05, 'epoch': 0.56} {'loss': 0.8598, 'learning_rate': 1.642545170546711e-05, 'epoch': 0.56} {'loss': 0.7862, 'learning_rate': 1.6425200869630397e-05, 'epoch': 0.56} {'loss': 0.6749, 'learning_rate': 1.6424950026908498e-05, 'epoch': 0.56} {'loss': 0.9136, 'learning_rate': 1.6424699177301685e-05, 'epoch': 0.56} {'loss': 0.7194, 'learning_rate': 1.6424448320810228e-05, 'epoch': 0.56} {'loss': 0.9589, 'learning_rate': 1.6424197457434393e-05, 'epoch': 0.56} {'loss': 0.7964, 'learning_rate': 1.6423946587174453e-05, 'epoch': 0.56} {'loss': 0.7284, 'learning_rate': 1.6423695710030673e-05, 'epoch': 0.56} {'loss': 0.8953, 'learning_rate': 1.6423444826003325e-05, 'epoch': 0.56} {'loss': 0.8571, 'learning_rate': 1.6423193935092678e-05, 'epoch': 0.56} {'loss': 0.9777, 'learning_rate': 1.6422943037298993e-05, 'epoch': 0.56} {'loss': 0.6421, 'learning_rate': 1.642269213262255e-05, 'epoch': 0.56} {'loss': 0.8226, 'learning_rate': 1.6422441221063605e-05, 'epoch': 0.56} {'loss': 0.8837, 'learning_rate': 1.6422190302622442e-05, 'epoch': 0.56} {'loss': 0.7744, 'learning_rate': 1.642193937729932e-05, 'epoch': 0.56} {'loss': 0.8919, 'learning_rate': 1.642168844509451e-05, 'epoch': 0.56} {'loss': 0.8257, 'learning_rate': 1.6421437506008283e-05, 'epoch': 0.56} {'loss': 0.6434, 'learning_rate': 1.6421186560040905e-05, 'epoch': 0.56} {'loss': 0.9277, 'learning_rate': 1.6420935607192644e-05, 'epoch': 0.56} {'loss': 0.8626, 'learning_rate': 1.6420684647463775e-05, 'epoch': 0.56} {'loss': 0.8376, 'learning_rate': 1.642043368085456e-05, 'epoch': 0.56} {'loss': 0.6146, 'learning_rate': 1.6420182707365274e-05, 'epoch': 0.56} {'loss': 0.889, 'learning_rate': 1.641993172699618e-05, 'epoch': 0.56} {'loss': 0.9506, 'learning_rate': 1.6419680739747547e-05, 'epoch': 0.56} {'loss': 0.8237, 'learning_rate': 1.6419429745619654e-05, 'epoch': 0.56} {'loss': 0.9066, 'learning_rate': 1.641917874461276e-05, 'epoch': 0.56} {'loss': 0.9161, 'learning_rate': 1.641892773672713e-05, 'epoch': 0.56} {'loss': 0.9217, 'learning_rate': 1.6418676721963044e-05, 'epoch': 0.56} {'loss': 0.7403, 'learning_rate': 1.641842570032077e-05, 'epoch': 0.56} {'loss': 0.8587, 'learning_rate': 1.641817467180057e-05, 'epoch': 0.56} {'loss': 0.9471, 'learning_rate': 1.6417923636402718e-05, 'epoch': 0.56} {'loss': 0.6939, 'learning_rate': 1.641767259412748e-05, 'epoch': 0.56} {'loss': 0.7958, 'learning_rate': 1.641742154497513e-05, 'epoch': 0.56} {'loss': 0.9619, 'learning_rate': 1.6417170488945927e-05, 'epoch': 0.56} {'loss': 0.901, 'learning_rate': 1.6416919426040155e-05, 'epoch': 0.56} {'loss': 0.7425, 'learning_rate': 1.641666835625807e-05, 'epoch': 0.56} {'loss': 0.8369, 'learning_rate': 1.6416417279599946e-05, 'epoch': 0.56} {'loss': 0.9618, 'learning_rate': 1.641616619606605e-05, 'epoch': 0.56} {'loss': 0.8103, 'learning_rate': 1.6415915105656655e-05, 'epoch': 0.56} {'loss': 0.9799, 'learning_rate': 1.6415664008372027e-05, 'epoch': 0.56} {'loss': 0.6533, 'learning_rate': 1.6415412904212437e-05, 'epoch': 0.56} {'loss': 0.7111, 'learning_rate': 1.6415161793178157e-05, 'epoch': 0.56} {'loss': 0.8304, 'learning_rate': 1.6414910675269443e-05, 'epoch': 0.56} {'loss': 0.7425, 'learning_rate': 1.6414659550486582e-05, 'epoch': 0.56} {'loss': 0.7909, 'learning_rate': 1.641440841882983e-05, 'epoch': 0.56} {'loss': 0.8876, 'learning_rate': 1.641415728029946e-05, 'epoch': 0.56} {'loss': 0.7156, 'learning_rate': 1.641390613489574e-05, 'epoch': 0.56} {'loss': 1.0457, 'learning_rate': 1.6413654982618944e-05, 'epoch': 0.56} {'loss': 0.7066, 'learning_rate': 1.6413403823469337e-05, 'epoch': 0.56} {'loss': 0.8288, 'learning_rate': 1.641315265744719e-05, 'epoch': 0.56} {'loss': 0.7618, 'learning_rate': 1.6412901484552773e-05, 'epoch': 0.56} {'loss': 0.7658, 'learning_rate': 1.6412650304786347e-05, 'epoch': 0.56} {'loss': 0.6558, 'learning_rate': 1.641239911814819e-05, 'epoch': 0.56} {'loss': 0.9318, 'learning_rate': 1.641214792463857e-05, 'epoch': 0.56} {'loss': 0.7938, 'learning_rate': 1.6411896724257755e-05, 'epoch': 0.56} {'loss': 0.7297, 'learning_rate': 1.641164551700601e-05, 'epoch': 0.56} {'loss': 0.6978, 'learning_rate': 1.6411394302883614e-05, 'epoch': 0.56} {'loss': 0.8813, 'learning_rate': 1.6411143081890827e-05, 'epoch': 0.56} {'loss': 0.8778, 'learning_rate': 1.6410891854027923e-05, 'epoch': 0.56} {'loss': 0.8513, 'learning_rate': 1.6410640619295167e-05, 'epoch': 0.56} {'loss': 0.8588, 'learning_rate': 1.6410389377692836e-05, 'epoch': 0.56} {'loss': 1.1541, 'learning_rate': 1.641013812922119e-05, 'epoch': 0.56} {'loss': 0.917, 'learning_rate': 1.6409886873880502e-05, 'epoch': 0.56} {'loss': 0.7486, 'learning_rate': 1.6409635611671045e-05, 'epoch': 0.56} {'loss': 0.9116, 'learning_rate': 1.640938434259308e-05, 'epoch': 0.56} {'loss': 0.8149, 'learning_rate': 1.6409133066646885e-05, 'epoch': 0.56} {'loss': 0.8716, 'learning_rate': 1.6408881783832725e-05, 'epoch': 0.56} {'loss': 0.7775, 'learning_rate': 1.6408630494150872e-05, 'epoch': 0.56} {'loss': 0.8819, 'learning_rate': 1.640837919760159e-05, 'epoch': 0.56} {'loss': 0.8424, 'learning_rate': 1.640812789418515e-05, 'epoch': 0.56} {'loss': 0.8822, 'learning_rate': 1.6407876583901824e-05, 'epoch': 0.56} {'loss': 0.9474, 'learning_rate': 1.6407625266751882e-05, 'epoch': 0.56} {'loss': 0.8516, 'learning_rate': 1.640737394273559e-05, 'epoch': 0.56} {'loss': 0.8921, 'learning_rate': 1.6407122611853217e-05, 'epoch': 0.56} {'loss': 0.7413, 'learning_rate': 1.6406871274105033e-05, 'epoch': 0.56} {'loss': 0.7998, 'learning_rate': 1.640661992949131e-05, 'epoch': 0.56} {'loss': 0.9062, 'learning_rate': 1.6406368578012317e-05, 'epoch': 0.56} {'loss': 0.6639, 'learning_rate': 1.640611721966832e-05, 'epoch': 0.56} {'loss': 0.8207, 'learning_rate': 1.6405865854459592e-05, 'epoch': 0.56} {'loss': 0.868, 'learning_rate': 1.6405614482386398e-05, 'epoch': 0.56} {'loss': 0.9184, 'learning_rate': 1.640536310344901e-05, 'epoch': 0.56} {'loss': 0.6963, 'learning_rate': 1.64051117176477e-05, 'epoch': 0.56} {'loss': 0.9076, 'learning_rate': 1.6404860324982733e-05, 'epoch': 0.56} {'loss': 0.8694, 'learning_rate': 1.640460892545438e-05, 'epoch': 0.56} {'loss': 0.8641, 'learning_rate': 1.640435751906291e-05, 'epoch': 0.56} {'loss': 1.021, 'learning_rate': 1.6404106105808595e-05, 'epoch': 0.56} {'loss': 0.7795, 'learning_rate': 1.64038546856917e-05, 'epoch': 0.56} {'loss': 0.7589, 'learning_rate': 1.6403603258712497e-05, 'epoch': 0.56} {'loss': 0.724, 'learning_rate': 1.6403351824871254e-05, 'epoch': 0.56} {'loss': 0.9023, 'learning_rate': 1.6403100384168245e-05, 'epoch': 0.56} {'loss': 0.7563, 'learning_rate': 1.6402848936603733e-05, 'epoch': 0.56} {'loss': 0.7669, 'learning_rate': 1.6402597482177994e-05, 'epoch': 0.56} {'loss': 1.0135, 'learning_rate': 1.640234602089129e-05, 'epoch': 0.56} {'loss': 0.6703, 'learning_rate': 1.6402094552743896e-05, 'epoch': 0.56} {'loss': 0.7549, 'learning_rate': 1.6401843077736083e-05, 'epoch': 0.56} {'loss': 0.6537, 'learning_rate': 1.6401591595868113e-05, 'epoch': 0.56} {'loss': 0.999, 'learning_rate': 1.640134010714026e-05, 'epoch': 0.56} {'loss': 0.785, 'learning_rate': 1.6401088611552792e-05, 'epoch': 0.56} {'loss': 0.769, 'learning_rate': 1.6400837109105987e-05, 'epoch': 0.56} {'loss': 0.8438, 'learning_rate': 1.6400585599800102e-05, 'epoch': 0.56} {'loss': 0.7287, 'learning_rate': 1.6400334083635412e-05, 'epoch': 0.56} {'loss': 0.7747, 'learning_rate': 1.6400082560612185e-05, 'epoch': 0.56} {'loss': 0.8302, 'learning_rate': 1.6399831030730694e-05, 'epoch': 0.56} {'loss': 0.73, 'learning_rate': 1.6399579493991208e-05, 'epoch': 0.56} {'loss': 0.9074, 'learning_rate': 1.6399327950393994e-05, 'epoch': 0.56} {'loss': 0.8511, 'learning_rate': 1.639907639993932e-05, 'epoch': 0.56} {'loss': 0.7907, 'learning_rate': 1.639882484262746e-05, 'epoch': 0.56} {'loss': 0.9854, 'learning_rate': 1.6398573278458682e-05, 'epoch': 0.56} {'loss': 0.819, 'learning_rate': 1.639832170743325e-05, 'epoch': 0.56} {'loss': 0.7461, 'learning_rate': 1.6398070129551446e-05, 'epoch': 0.56} {'loss': 0.687, 'learning_rate': 1.639781854481353e-05, 'epoch': 0.56} {'loss': 0.6491, 'learning_rate': 1.6397566953219773e-05, 'epoch': 0.56} {'loss': 0.8408, 'learning_rate': 1.6397315354770447e-05, 'epoch': 0.56} {'loss': 0.9275, 'learning_rate': 1.639706374946582e-05, 'epoch': 0.56} {'loss': 0.7633, 'learning_rate': 1.639681213730616e-05, 'epoch': 0.56} {'loss': 0.9274, 'learning_rate': 1.639656051829174e-05, 'epoch': 0.56} {'loss': 0.9371, 'learning_rate': 1.639630889242283e-05, 'epoch': 0.56} {'loss': 0.8181, 'learning_rate': 1.6396057259699695e-05, 'epoch': 0.56} {'loss': 1.0444, 'learning_rate': 1.6395805620122606e-05, 'epoch': 0.56} {'loss': 0.9861, 'learning_rate': 1.6395553973691834e-05, 'epoch': 0.56} {'loss': 0.7139, 'learning_rate': 1.6395302320407652e-05, 'epoch': 0.56} {'loss': 0.7075, 'learning_rate': 1.6395050660270326e-05, 'epoch': 0.56} {'loss': 0.7593, 'learning_rate': 1.6394798993280127e-05, 'epoch': 0.56} {'loss': 0.9625, 'learning_rate': 1.6394547319437323e-05, 'epoch': 0.56} {'loss': 0.8035, 'learning_rate': 1.639429563874218e-05, 'epoch': 0.56} {'loss': 0.8122, 'learning_rate': 1.6394043951194974e-05, 'epoch': 0.56} {'loss': 0.8564, 'learning_rate': 1.639379225679598e-05, 'epoch': 0.56} {'loss': 0.9059, 'learning_rate': 1.639354055554545e-05, 'epoch': 0.56} {'loss': 0.7723, 'learning_rate': 1.639328884744367e-05, 'epoch': 0.56} {'loss': 0.9982, 'learning_rate': 1.6393037132490903e-05, 'epoch': 0.56} {'loss': 0.5811, 'learning_rate': 1.639278541068742e-05, 'epoch': 0.56} {'loss': 0.8462, 'learning_rate': 1.639253368203349e-05, 'epoch': 0.56} {'loss': 0.8741, 'learning_rate': 1.639228194652938e-05, 'epoch': 0.56} {'loss': 0.7693, 'learning_rate': 1.6392030204175368e-05, 'epoch': 0.56} {'loss': 0.767, 'learning_rate': 1.6391778454971717e-05, 'epoch': 0.56} {'loss': 0.8, 'learning_rate': 1.6391526698918698e-05, 'epoch': 0.56} {'loss': 0.7091, 'learning_rate': 1.6391274936016583e-05, 'epoch': 0.56} {'loss': 0.8238, 'learning_rate': 1.6391023166265638e-05, 'epoch': 0.56} {'loss': 0.8862, 'learning_rate': 1.6390771389666133e-05, 'epoch': 0.56} {'loss': 0.8498, 'learning_rate': 1.6390519606218343e-05, 'epoch': 0.56} {'loss': 0.7455, 'learning_rate': 1.6390267815922536e-05, 'epoch': 0.56} {'loss': 0.8527, 'learning_rate': 1.639001601877898e-05, 'epoch': 0.56} {'loss': 1.0147, 'learning_rate': 1.638976421478794e-05, 'epoch': 0.56} {'loss': 0.9127, 'learning_rate': 1.6389512403949693e-05, 'epoch': 0.56} {'loss': 0.8725, 'learning_rate': 1.638926058626451e-05, 'epoch': 0.56} {'loss': 0.9435, 'learning_rate': 1.638900876173265e-05, 'epoch': 0.56} {'loss': 0.8763, 'learning_rate': 1.63887569303544e-05, 'epoch': 0.56} {'loss': 0.8137, 'learning_rate': 1.6388505092130016e-05, 'epoch': 0.56} {'loss': 0.7981, 'learning_rate': 1.6388253247059773e-05, 'epoch': 0.56} {'loss': 0.9796, 'learning_rate': 1.638800139514394e-05, 'epoch': 0.56} {'loss': 0.9453, 'learning_rate': 1.6387749536382783e-05, 'epoch': 0.56} {'loss': 0.7884, 'learning_rate': 1.6387497670776582e-05, 'epoch': 0.56} {'loss': 0.6766, 'learning_rate': 1.6387245798325596e-05, 'epoch': 0.56} {'loss': 0.8173, 'learning_rate': 1.6386993919030102e-05, 'epoch': 0.56} {'loss': 0.8723, 'learning_rate': 1.638674203289037e-05, 'epoch': 0.56} {'loss': 0.726, 'learning_rate': 1.6386490139906664e-05, 'epoch': 0.56} {'loss': 0.8723, 'learning_rate': 1.6386238240079254e-05, 'epoch': 0.56} {'loss': 0.7175, 'learning_rate': 1.638598633340842e-05, 'epoch': 0.56} {'loss': 0.7259, 'learning_rate': 1.6385734419894423e-05, 'epoch': 0.56} {'loss': 0.9656, 'learning_rate': 1.6385482499537537e-05, 'epoch': 0.56} {'loss': 0.9435, 'learning_rate': 1.6385230572338024e-05, 'epoch': 0.56} {'loss': 0.8756, 'learning_rate': 1.6384978638296165e-05, 'epoch': 0.56} {'loss': 0.5735, 'learning_rate': 1.6384726697412224e-05, 'epoch': 0.56} {'loss': 0.6309, 'learning_rate': 1.6384474749686474e-05, 'epoch': 0.56} {'loss': 1.0179, 'learning_rate': 1.638422279511918e-05, 'epoch': 0.56} {'loss': 0.8098, 'learning_rate': 1.6383970833710615e-05, 'epoch': 0.56} {'loss': 0.7863, 'learning_rate': 1.6383718865461053e-05, 'epoch': 0.56} {'loss': 0.8711, 'learning_rate': 1.6383466890370758e-05, 'epoch': 0.56} {'loss': 0.89, 'learning_rate': 1.638321490844e-05, 'epoch': 0.56} {'loss': 0.9078, 'learning_rate': 1.6382962919669053e-05, 'epoch': 0.56} {'loss': 0.8779, 'learning_rate': 1.638271092405819e-05, 'epoch': 0.56} {'loss': 0.8729, 'learning_rate': 1.6382458921607665e-05, 'epoch': 0.56} {'loss': 0.778, 'learning_rate': 1.6382206912317768e-05, 'epoch': 0.56} {'loss': 0.8303, 'learning_rate': 1.6381954896188757e-05, 'epoch': 0.56} {'loss': 0.9249, 'learning_rate': 1.6381702873220907e-05, 'epoch': 0.56} {'loss': 0.8789, 'learning_rate': 1.6381450843414482e-05, 'epoch': 0.56} {'loss': 0.7404, 'learning_rate': 1.638119880676976e-05, 'epoch': 0.56} {'loss': 0.6878, 'learning_rate': 1.638094676328701e-05, 'epoch': 0.56} {'loss': 0.9127, 'learning_rate': 1.6380694712966498e-05, 'epoch': 0.56} {'loss': 0.7724, 'learning_rate': 1.638044265580849e-05, 'epoch': 0.56} {'loss': 0.8291, 'learning_rate': 1.638019059181327e-05, 'epoch': 0.56} {'loss': 0.9433, 'learning_rate': 1.6379938520981095e-05, 'epoch': 0.56} {'loss': 0.9042, 'learning_rate': 1.637968644331224e-05, 'epoch': 0.56} {'loss': 0.881, 'learning_rate': 1.637943435880698e-05, 'epoch': 0.56} {'loss': 0.8524, 'learning_rate': 1.6379182267465576e-05, 'epoch': 0.56} {'loss': 0.8443, 'learning_rate': 1.6378930169288302e-05, 'epoch': 0.56} {'loss': 0.7885, 'learning_rate': 1.637867806427543e-05, 'epoch': 0.56} {'loss': 0.74, 'learning_rate': 1.6378425952427228e-05, 'epoch': 0.56} {'loss': 0.7494, 'learning_rate': 1.6378173833743967e-05, 'epoch': 0.56} {'loss': 0.9532, 'learning_rate': 1.637792170822592e-05, 'epoch': 0.56} {'loss': 0.9085, 'learning_rate': 1.637766957587335e-05, 'epoch': 0.56} {'loss': 1.0524, 'learning_rate': 1.6377417436686535e-05, 'epoch': 0.56} {'loss': 0.8269, 'learning_rate': 1.637716529066574e-05, 'epoch': 0.56} {'loss': 1.0307, 'learning_rate': 1.6376913137811235e-05, 'epoch': 0.56} {'loss': 0.8918, 'learning_rate': 1.6376660978123292e-05, 'epoch': 0.56} {'loss': 0.768, 'learning_rate': 1.6376408811602186e-05, 'epoch': 0.56} {'loss': 0.843, 'learning_rate': 1.637615663824818e-05, 'epoch': 0.56} {'loss': 0.6066, 'learning_rate': 1.6375904458061548e-05, 'epoch': 0.56} {'loss': 0.9217, 'learning_rate': 1.6375652271042556e-05, 'epoch': 0.56} {'loss': 0.8685, 'learning_rate': 1.6375400077191477e-05, 'epoch': 0.56} {'loss': 0.9785, 'learning_rate': 1.6375147876508583e-05, 'epoch': 0.56} {'loss': 0.6952, 'learning_rate': 1.637489566899414e-05, 'epoch': 0.56} {'loss': 0.885, 'learning_rate': 1.6374643454648426e-05, 'epoch': 0.56} {'loss': 0.7935, 'learning_rate': 1.6374391233471702e-05, 'epoch': 0.56} {'loss': 0.8849, 'learning_rate': 1.6374139005464243e-05, 'epoch': 0.56} {'loss': 0.9013, 'learning_rate': 1.637388677062632e-05, 'epoch': 0.56} {'loss': 0.8512, 'learning_rate': 1.6373634528958203e-05, 'epoch': 0.56} {'loss': 0.9126, 'learning_rate': 1.637338228046016e-05, 'epoch': 0.56} {'loss': 0.8542, 'learning_rate': 1.6373130025132463e-05, 'epoch': 0.56} {'loss': 0.9159, 'learning_rate': 1.637287776297538e-05, 'epoch': 0.56} {'loss': 0.8949, 'learning_rate': 1.6372625493989186e-05, 'epoch': 0.56} {'loss': 0.9678, 'learning_rate': 1.6372373218174148e-05, 'epoch': 0.56} {'loss': 0.9817, 'learning_rate': 1.6372120935530536e-05, 'epoch': 0.56} {'loss': 0.754, 'learning_rate': 1.6371868646058623e-05, 'epoch': 0.56} {'loss': 0.8159, 'learning_rate': 1.6371616349758676e-05, 'epoch': 0.56} {'loss': 0.9496, 'learning_rate': 1.6371364046630965e-05, 'epoch': 0.56} {'loss': 0.8522, 'learning_rate': 1.6371111736675765e-05, 'epoch': 0.56} {'loss': 0.9086, 'learning_rate': 1.6370859419893345e-05, 'epoch': 0.56} {'loss': 0.7117, 'learning_rate': 1.637060709628397e-05, 'epoch': 0.56} {'loss': 0.7315, 'learning_rate': 1.637035476584792e-05, 'epoch': 0.56} {'loss': 0.6473, 'learning_rate': 1.6370102428585457e-05, 'epoch': 0.56} {'loss': 0.8824, 'learning_rate': 1.6369850084496853e-05, 'epoch': 0.56} {'loss': 0.9257, 'learning_rate': 1.636959773358238e-05, 'epoch': 0.56} {'loss': 0.8164, 'learning_rate': 1.636934537584231e-05, 'epoch': 0.56} {'loss': 0.9126, 'learning_rate': 1.6369093011276912e-05, 'epoch': 0.56} {'loss': 0.9618, 'learning_rate': 1.6368840639886453e-05, 'epoch': 0.56} {'loss': 0.8213, 'learning_rate': 1.6368588261671213e-05, 'epoch': 0.56} {'loss': 0.912, 'learning_rate': 1.6368335876631446e-05, 'epoch': 0.56} {'loss': 0.8387, 'learning_rate': 1.636808348476744e-05, 'epoch': 0.56} {'loss': 0.9261, 'learning_rate': 1.6367831086079456e-05, 'epoch': 0.57} {'loss': 0.9046, 'learning_rate': 1.6367578680567767e-05, 'epoch': 0.57} {'loss': 0.7104, 'learning_rate': 1.636732626823264e-05, 'epoch': 0.57} {'loss': 0.9019, 'learning_rate': 1.6367073849074348e-05, 'epoch': 0.57} {'loss': 0.8583, 'learning_rate': 1.6366821423093165e-05, 'epoch': 0.57} {'loss': 0.8556, 'learning_rate': 1.6366568990289352e-05, 'epoch': 0.57} {'loss': 0.9662, 'learning_rate': 1.6366316550663193e-05, 'epoch': 0.57} {'loss': 1.0755, 'learning_rate': 1.636606410421495e-05, 'epoch': 0.57} {'loss': 0.9617, 'learning_rate': 1.6365811650944893e-05, 'epoch': 0.57} {'loss': 0.7504, 'learning_rate': 1.6365559190853293e-05, 'epoch': 0.57} {'loss': 0.9073, 'learning_rate': 1.6365306723940422e-05, 'epoch': 0.57} {'loss': 1.0107, 'learning_rate': 1.6365054250206554e-05, 'epoch': 0.57} {'loss': 0.8801, 'learning_rate': 1.6364801769651953e-05, 'epoch': 0.57} {'loss': 1.022, 'learning_rate': 1.636454928227689e-05, 'epoch': 0.57} {'loss': 0.9315, 'learning_rate': 1.6364296788081644e-05, 'epoch': 0.57} {'loss': 0.7539, 'learning_rate': 1.6364044287066474e-05, 'epoch': 0.57} {'loss': 0.8908, 'learning_rate': 1.636379177923166e-05, 'epoch': 0.57} {'loss': 0.8301, 'learning_rate': 1.6363539264577467e-05, 'epoch': 0.57} {'loss': 0.712, 'learning_rate': 1.6363286743104168e-05, 'epoch': 0.57} {'loss': 0.9587, 'learning_rate': 1.6363034214812033e-05, 'epoch': 0.57} {'loss': 0.7563, 'learning_rate': 1.636278167970133e-05, 'epoch': 0.57} {'loss': 0.9699, 'learning_rate': 1.6362529137772335e-05, 'epoch': 0.57} {'loss': 0.8849, 'learning_rate': 1.6362276589025318e-05, 'epoch': 0.57} {'loss': 0.9071, 'learning_rate': 1.6362024033460538e-05, 'epoch': 0.57} {'loss': 0.89, 'learning_rate': 1.6361771471078285e-05, 'epoch': 0.57} {'loss': 0.8732, 'learning_rate': 1.6361518901878817e-05, 'epoch': 0.57} {'loss': 0.7192, 'learning_rate': 1.6361266325862407e-05, 'epoch': 0.57} {'loss': 0.9011, 'learning_rate': 1.6361013743029323e-05, 'epoch': 0.57} {'loss': 0.8966, 'learning_rate': 1.6360761153379843e-05, 'epoch': 0.57} {'loss': 0.8277, 'learning_rate': 1.636050855691423e-05, 'epoch': 0.57} {'loss': 0.7847, 'learning_rate': 1.636025595363276e-05, 'epoch': 0.57} {'loss': 0.8602, 'learning_rate': 1.63600033435357e-05, 'epoch': 0.57} {'loss': 0.8715, 'learning_rate': 1.6359750726623326e-05, 'epoch': 0.57} {'loss': 0.7404, 'learning_rate': 1.63594981028959e-05, 'epoch': 0.57} {'loss': 0.7533, 'learning_rate': 1.63592454723537e-05, 'epoch': 0.57} {'loss': 0.7805, 'learning_rate': 1.6358992834996997e-05, 'epoch': 0.57} {'loss': 0.8266, 'learning_rate': 1.6358740190826056e-05, 'epoch': 0.57} {'loss': 0.7638, 'learning_rate': 1.6358487539841152e-05, 'epoch': 0.57} {'loss': 0.8156, 'learning_rate': 1.6358234882042555e-05, 'epoch': 0.57} {'loss': 0.9081, 'learning_rate': 1.6357982217430538e-05, 'epoch': 0.57} {'loss': 0.9685, 'learning_rate': 1.6357729546005366e-05, 'epoch': 0.57} {'loss': 0.8799, 'learning_rate': 1.6357476867767312e-05, 'epoch': 0.57} {'loss': 0.7531, 'learning_rate': 1.635722418271665e-05, 'epoch': 0.57} {'loss': 1.0207, 'learning_rate': 1.6356971490853645e-05, 'epoch': 0.57} {'loss': 0.7902, 'learning_rate': 1.6356718792178577e-05, 'epoch': 0.57} {'loss': 0.8997, 'learning_rate': 1.6356466086691707e-05, 'epoch': 0.57} {'loss': 0.6803, 'learning_rate': 1.6356213374393313e-05, 'epoch': 0.57} {'loss': 0.8046, 'learning_rate': 1.635596065528366e-05, 'epoch': 0.57} {'loss': 0.7842, 'learning_rate': 1.635570792936302e-05, 'epoch': 0.57} {'loss': 0.8582, 'learning_rate': 1.6355455196631668e-05, 'epoch': 0.57} {'loss': 0.8849, 'learning_rate': 1.6355202457089872e-05, 'epoch': 0.57} {'loss': 0.8001, 'learning_rate': 1.6354949710737905e-05, 'epoch': 0.57} {'loss': 0.8344, 'learning_rate': 1.6354696957576033e-05, 'epoch': 0.57} {'loss': 0.9548, 'learning_rate': 1.6354444197604527e-05, 'epoch': 0.57} {'loss': 0.7779, 'learning_rate': 1.6354191430823666e-05, 'epoch': 0.57} {'loss': 1.0606, 'learning_rate': 1.6353938657233714e-05, 'epoch': 0.57} {'loss': 0.6819, 'learning_rate': 1.6353685876834942e-05, 'epoch': 0.57} {'loss': 0.8207, 'learning_rate': 1.635343308962762e-05, 'epoch': 0.57} {'loss': 1.0069, 'learning_rate': 1.6353180295612022e-05, 'epoch': 0.57} {'loss': 0.6944, 'learning_rate': 1.6352927494788426e-05, 'epoch': 0.57} {'loss': 0.7944, 'learning_rate': 1.6352674687157083e-05, 'epoch': 0.57} {'loss': 0.6705, 'learning_rate': 1.6352421872718283e-05, 'epoch': 0.57} {'loss': 0.8608, 'learning_rate': 1.6352169051472286e-05, 'epoch': 0.57} {'loss': 0.7639, 'learning_rate': 1.6351916223419372e-05, 'epoch': 0.57} {'loss': 0.8016, 'learning_rate': 1.63516633885598e-05, 'epoch': 0.57} {'loss': 0.8936, 'learning_rate': 1.6351410546893847e-05, 'epoch': 0.57} {'loss': 0.8077, 'learning_rate': 1.635115769842179e-05, 'epoch': 0.57} {'loss': 0.925, 'learning_rate': 1.635090484314389e-05, 'epoch': 0.57} {'loss': 0.8746, 'learning_rate': 1.6350651981060422e-05, 'epoch': 0.57} {'loss': 0.7587, 'learning_rate': 1.635039911217166e-05, 'epoch': 0.57} {'loss': 0.9348, 'learning_rate': 1.6350146236477874e-05, 'epoch': 0.57} {'loss': 1.0428, 'learning_rate': 1.634989335397933e-05, 'epoch': 0.57} {'loss': 0.942, 'learning_rate': 1.63496404646763e-05, 'epoch': 0.57} {'loss': 0.8062, 'learning_rate': 1.634938756856906e-05, 'epoch': 0.57} {'loss': 0.8287, 'learning_rate': 1.634913466565788e-05, 'epoch': 0.57} {'loss': 0.8682, 'learning_rate': 1.6348881755943024e-05, 'epoch': 0.57} {'loss': 0.7672, 'learning_rate': 1.6348628839424773e-05, 'epoch': 0.57} {'loss': 0.8623, 'learning_rate': 1.634837591610339e-05, 'epoch': 0.57} {'loss': 0.8799, 'learning_rate': 1.634812298597915e-05, 'epoch': 0.57} {'loss': 0.7563, 'learning_rate': 1.6347870049052326e-05, 'epoch': 0.57} {'loss': 0.9804, 'learning_rate': 1.6347617105323183e-05, 'epoch': 0.57} {'loss': 0.8692, 'learning_rate': 1.6347364154792e-05, 'epoch': 0.57} {'loss': 0.7551, 'learning_rate': 1.6347111197459038e-05, 'epoch': 0.57} {'loss': 0.6278, 'learning_rate': 1.6346858233324576e-05, 'epoch': 0.57} {'loss': 0.7572, 'learning_rate': 1.6346605262388883e-05, 'epoch': 0.57} {'loss': 0.8543, 'learning_rate': 1.6346352284652227e-05, 'epoch': 0.57} {'loss': 0.8369, 'learning_rate': 1.6346099300114883e-05, 'epoch': 0.57} {'loss': 0.8186, 'learning_rate': 1.634584630877712e-05, 'epoch': 0.57} {'loss': 0.9458, 'learning_rate': 1.6345593310639212e-05, 'epoch': 0.57} {'loss': 0.8267, 'learning_rate': 1.6345340305701428e-05, 'epoch': 0.57} {'loss': 1.0591, 'learning_rate': 1.6345087293964036e-05, 'epoch': 0.57} {'loss': 0.8502, 'learning_rate': 1.6344834275427314e-05, 'epoch': 0.57} {'loss': 0.8987, 'learning_rate': 1.634458125009153e-05, 'epoch': 0.57} {'loss': 0.7324, 'learning_rate': 1.634432821795695e-05, 'epoch': 0.57} {'loss': 0.9611, 'learning_rate': 1.6344075179023852e-05, 'epoch': 0.57} {'loss': 0.7726, 'learning_rate': 1.6343822133292507e-05, 'epoch': 0.57} {'loss': 0.881, 'learning_rate': 1.634356908076318e-05, 'epoch': 0.57} {'loss': 0.9802, 'learning_rate': 1.634331602143615e-05, 'epoch': 0.57} {'loss': 0.9091, 'learning_rate': 1.6343062955311682e-05, 'epoch': 0.57} {'loss': 0.7325, 'learning_rate': 1.634280988239005e-05, 'epoch': 0.57} {'loss': 0.6786, 'learning_rate': 1.6342556802671526e-05, 'epoch': 0.57} {'loss': 0.8297, 'learning_rate': 1.634230371615638e-05, 'epoch': 0.57} {'loss': 0.9706, 'learning_rate': 1.6342050622844882e-05, 'epoch': 0.57} {'loss': 0.8239, 'learning_rate': 1.6341797522737305e-05, 'epoch': 0.57} {'loss': 0.8639, 'learning_rate': 1.634154441583392e-05, 'epoch': 0.57} {'loss': 0.8244, 'learning_rate': 1.6341291302134993e-05, 'epoch': 0.57} {'loss': 0.8638, 'learning_rate': 1.6341038181640804e-05, 'epoch': 0.57} {'loss': 0.7916, 'learning_rate': 1.634078505435162e-05, 'epoch': 0.57} {'loss': 0.8126, 'learning_rate': 1.6340531920267716e-05, 'epoch': 0.57} {'loss': 1.0148, 'learning_rate': 1.6340278779389357e-05, 'epoch': 0.57} {'loss': 0.8781, 'learning_rate': 1.6340025631716814e-05, 'epoch': 0.57} {'loss': 0.8155, 'learning_rate': 1.6339772477250362e-05, 'epoch': 0.57} {'loss': 0.9199, 'learning_rate': 1.6339519315990276e-05, 'epoch': 0.57} {'loss': 0.8962, 'learning_rate': 1.6339266147936816e-05, 'epoch': 0.57} {'loss': 0.8763, 'learning_rate': 1.6339012973090268e-05, 'epoch': 0.57} {'loss': 0.9009, 'learning_rate': 1.6338759791450894e-05, 'epoch': 0.57} {'loss': 0.8051, 'learning_rate': 1.6338506603018963e-05, 'epoch': 0.57} {'loss': 0.7759, 'learning_rate': 1.633825340779475e-05, 'epoch': 0.57} {'loss': 1.0018, 'learning_rate': 1.6338000205778528e-05, 'epoch': 0.57} {'loss': 0.7598, 'learning_rate': 1.6337746996970566e-05, 'epoch': 0.57} {'loss': 0.8848, 'learning_rate': 1.6337493781371138e-05, 'epoch': 0.57} {'loss': 0.8679, 'learning_rate': 1.633724055898051e-05, 'epoch': 0.57} {'loss': 0.9361, 'learning_rate': 1.6336987329798964e-05, 'epoch': 0.57} {'loss': 0.9899, 'learning_rate': 1.633673409382676e-05, 'epoch': 0.57} {'loss': 0.7323, 'learning_rate': 1.633648085106417e-05, 'epoch': 0.57} {'loss': 0.9154, 'learning_rate': 1.633622760151147e-05, 'epoch': 0.57} {'loss': 0.9627, 'learning_rate': 1.6335974345168934e-05, 'epoch': 0.57} {'loss': 0.688, 'learning_rate': 1.6335721082036826e-05, 'epoch': 0.57} {'loss': 0.817, 'learning_rate': 1.6335467812115423e-05, 'epoch': 0.57} {'loss': 0.8828, 'learning_rate': 1.6335214535404997e-05, 'epoch': 0.57} {'loss': 0.9938, 'learning_rate': 1.633496125190581e-05, 'epoch': 0.57} {'loss': 1.0529, 'learning_rate': 1.6334707961618145e-05, 'epoch': 0.57} {'loss': 0.9307, 'learning_rate': 1.633445466454227e-05, 'epoch': 0.57} {'loss': 0.8294, 'learning_rate': 1.6334201360678453e-05, 'epoch': 0.57} {'loss': 0.8016, 'learning_rate': 1.6333948050026966e-05, 'epoch': 0.57} {'loss': 0.8917, 'learning_rate': 1.6333694732588082e-05, 'epoch': 0.57} {'loss': 0.8367, 'learning_rate': 1.6333441408362076e-05, 'epoch': 0.57} {'loss': 0.7435, 'learning_rate': 1.6333188077349214e-05, 'epoch': 0.57} {'loss': 0.7585, 'learning_rate': 1.633293473954977e-05, 'epoch': 0.57} {'loss': 0.6907, 'learning_rate': 1.6332681394964015e-05, 'epoch': 0.57} {'loss': 0.8395, 'learning_rate': 1.6332428043592218e-05, 'epoch': 0.57} {'loss': 0.747, 'learning_rate': 1.633217468543465e-05, 'epoch': 0.57} {'loss': 0.9913, 'learning_rate': 1.633192132049159e-05, 'epoch': 0.57} {'loss': 0.979, 'learning_rate': 1.6331667948763306e-05, 'epoch': 0.57} {'loss': 0.6151, 'learning_rate': 1.6331414570250067e-05, 'epoch': 0.57} {'loss': 0.9473, 'learning_rate': 1.6331161184952145e-05, 'epoch': 0.57} {'loss': 0.8391, 'learning_rate': 1.6330907792869814e-05, 'epoch': 0.57} {'loss': 1.0437, 'learning_rate': 1.6330654394003342e-05, 'epoch': 0.57} {'loss': 0.8011, 'learning_rate': 1.6330400988353e-05, 'epoch': 0.57} {'loss': 0.8096, 'learning_rate': 1.6330147575919066e-05, 'epoch': 0.57} {'loss': 0.8277, 'learning_rate': 1.6329894156701808e-05, 'epoch': 0.57} {'loss': 0.9605, 'learning_rate': 1.6329640730701496e-05, 'epoch': 0.57} {'loss': 0.9029, 'learning_rate': 1.6329387297918402e-05, 'epoch': 0.57} {'loss': 0.6693, 'learning_rate': 1.6329133858352797e-05, 'epoch': 0.57} {'loss': 0.7522, 'learning_rate': 1.6328880412004954e-05, 'epoch': 0.57} {'loss': 0.7942, 'learning_rate': 1.6328626958875146e-05, 'epoch': 0.57} {'loss': 0.9186, 'learning_rate': 1.6328373498963647e-05, 'epoch': 0.57} {'loss': 0.9026, 'learning_rate': 1.6328120032270717e-05, 'epoch': 0.57} {'loss': 0.9112, 'learning_rate': 1.632786655879664e-05, 'epoch': 0.57} {'loss': 0.8375, 'learning_rate': 1.632761307854168e-05, 'epoch': 0.57} {'loss': 0.7289, 'learning_rate': 1.6327359591506116e-05, 'epoch': 0.57} {'loss': 0.7391, 'learning_rate': 1.6327106097690212e-05, 'epoch': 0.57} {'loss': 0.9879, 'learning_rate': 1.6326852597094243e-05, 'epoch': 0.57} {'loss': 0.8982, 'learning_rate': 1.632659908971848e-05, 'epoch': 0.57} {'loss': 1.0043, 'learning_rate': 1.6326345575563197e-05, 'epoch': 0.57} {'loss': 0.7312, 'learning_rate': 1.632609205462866e-05, 'epoch': 0.57} {'loss': 0.9585, 'learning_rate': 1.6325838526915147e-05, 'epoch': 0.57} {'loss': 0.7716, 'learning_rate': 1.632558499242293e-05, 'epoch': 0.57} {'loss': 0.9326, 'learning_rate': 1.632533145115227e-05, 'epoch': 0.57} {'loss': 0.7908, 'learning_rate': 1.6325077903103453e-05, 'epoch': 0.57} {'loss': 0.7697, 'learning_rate': 1.632482434827674e-05, 'epoch': 0.57} {'loss': 0.7986, 'learning_rate': 1.6324570786672408e-05, 'epoch': 0.57} {'loss': 0.8036, 'learning_rate': 1.632431721829073e-05, 'epoch': 0.57} {'loss': 0.8605, 'learning_rate': 1.6324063643131975e-05, 'epoch': 0.57} {'loss': 0.8266, 'learning_rate': 1.632381006119641e-05, 'epoch': 0.57} {'loss': 0.764, 'learning_rate': 1.632355647248432e-05, 'epoch': 0.57} {'loss': 0.9815, 'learning_rate': 1.6323302876995964e-05, 'epoch': 0.57} {'loss': 0.889, 'learning_rate': 1.6323049274731616e-05, 'epoch': 0.57} {'loss': 0.9041, 'learning_rate': 1.6322795665691554e-05, 'epoch': 0.57} {'loss': 0.7635, 'learning_rate': 1.6322542049876044e-05, 'epoch': 0.57} {'loss': 0.834, 'learning_rate': 1.632228842728536e-05, 'epoch': 0.57} {'loss': 0.9652, 'learning_rate': 1.632203479791977e-05, 'epoch': 0.57} {'loss': 0.96, 'learning_rate': 1.6321781161779554e-05, 'epoch': 0.57} {'loss': 0.8243, 'learning_rate': 1.6321527518864977e-05, 'epoch': 0.57} {'loss': 0.8604, 'learning_rate': 1.632127386917631e-05, 'epoch': 0.57} {'loss': 0.734, 'learning_rate': 1.6321020212713832e-05, 'epoch': 0.57} {'loss': 0.9013, 'learning_rate': 1.632076654947781e-05, 'epoch': 0.57} {'loss': 0.8149, 'learning_rate': 1.6320512879468516e-05, 'epoch': 0.57} {'loss': 0.8296, 'learning_rate': 1.632025920268622e-05, 'epoch': 0.57} {'loss': 0.8018, 'learning_rate': 1.6320005519131196e-05, 'epoch': 0.57} {'loss': 0.7974, 'learning_rate': 1.6319751828803716e-05, 'epoch': 0.57} {'loss': 0.7929, 'learning_rate': 1.631949813170405e-05, 'epoch': 0.57} {'loss': 0.9912, 'learning_rate': 1.6319244427832474e-05, 'epoch': 0.57} {'loss': 0.9265, 'learning_rate': 1.6318990717189254e-05, 'epoch': 0.57} {'loss': 0.6576, 'learning_rate': 1.631873699977467e-05, 'epoch': 0.57} {'loss': 0.9106, 'learning_rate': 1.6318483275588986e-05, 'epoch': 0.57} {'loss': 0.9935, 'learning_rate': 1.6318229544632476e-05, 'epoch': 0.57} {'loss': 0.962, 'learning_rate': 1.6317975806905416e-05, 'epoch': 0.57} {'loss': 0.8006, 'learning_rate': 1.631772206240807e-05, 'epoch': 0.57} {'loss': 0.7364, 'learning_rate': 1.631746831114072e-05, 'epoch': 0.57} {'loss': 1.0667, 'learning_rate': 1.631721455310363e-05, 'epoch': 0.57} {'loss': 0.8413, 'learning_rate': 1.6316960788297074e-05, 'epoch': 0.57} {'loss': 0.9945, 'learning_rate': 1.6316707016721327e-05, 'epoch': 0.57} {'loss': 0.926, 'learning_rate': 1.6316453238376654e-05, 'epoch': 0.57} {'loss': 0.9139, 'learning_rate': 1.6316199453263334e-05, 'epoch': 0.57} {'loss': 0.7563, 'learning_rate': 1.6315945661381635e-05, 'epoch': 0.57} {'loss': 0.8762, 'learning_rate': 1.631569186273183e-05, 'epoch': 0.57} {'loss': 0.7803, 'learning_rate': 1.6315438057314193e-05, 'epoch': 0.57} {'loss': 0.8387, 'learning_rate': 1.6315184245128993e-05, 'epoch': 0.57} {'loss': 1.0414, 'learning_rate': 1.6314930426176503e-05, 'epoch': 0.57} {'loss': 0.8422, 'learning_rate': 1.6314676600456993e-05, 'epoch': 0.57} {'loss': 0.9373, 'learning_rate': 1.631442276797074e-05, 'epoch': 0.57} {'loss': 0.7089, 'learning_rate': 1.6314168928718012e-05, 'epoch': 0.57} {'loss': 0.7444, 'learning_rate': 1.6313915082699083e-05, 'epoch': 0.57} {'loss': 0.7938, 'learning_rate': 1.6313661229914225e-05, 'epoch': 0.57} {'loss': 0.7666, 'learning_rate': 1.6313407370363707e-05, 'epoch': 0.57} {'loss': 0.8633, 'learning_rate': 1.6313153504047802e-05, 'epoch': 0.57} {'loss': 0.9091, 'learning_rate': 1.6312899630966787e-05, 'epoch': 0.57} {'loss': 0.7127, 'learning_rate': 1.631264575112093e-05, 'epoch': 0.57} {'loss': 0.8172, 'learning_rate': 1.6312391864510498e-05, 'epoch': 0.57} {'loss': 0.8004, 'learning_rate': 1.6312137971135777e-05, 'epoch': 0.57} {'loss': 0.7688, 'learning_rate': 1.6311884070997023e-05, 'epoch': 0.57} {'loss': 0.8854, 'learning_rate': 1.6311630164094517e-05, 'epoch': 0.57} {'loss': 0.7705, 'learning_rate': 1.6311376250428532e-05, 'epoch': 0.57} {'loss': 0.8568, 'learning_rate': 1.6311122329999338e-05, 'epoch': 0.57} {'loss': 0.8723, 'learning_rate': 1.6310868402807205e-05, 'epoch': 0.57} {'loss': 0.8471, 'learning_rate': 1.6310614468852405e-05, 'epoch': 0.57} {'loss': 0.8105, 'learning_rate': 1.6310360528135217e-05, 'epoch': 0.57} {'loss': 0.8672, 'learning_rate': 1.6310106580655903e-05, 'epoch': 0.57} {'loss': 0.8751, 'learning_rate': 1.6309852626414742e-05, 'epoch': 0.57} {'loss': 0.7605, 'learning_rate': 1.6309598665412006e-05, 'epoch': 0.57} {'loss': 0.8845, 'learning_rate': 1.6309344697647964e-05, 'epoch': 0.57} {'loss': 0.8528, 'learning_rate': 1.630909072312289e-05, 'epoch': 0.57} {'loss': 0.8729, 'learning_rate': 1.6308836741837056e-05, 'epoch': 0.57} {'loss': 0.8034, 'learning_rate': 1.6308582753790736e-05, 'epoch': 0.57} {'loss': 0.8197, 'learning_rate': 1.63083287589842e-05, 'epoch': 0.57} {'loss': 0.9238, 'learning_rate': 1.6308074757417718e-05, 'epoch': 0.57} {'loss': 0.8399, 'learning_rate': 1.6307820749091562e-05, 'epoch': 0.57} {'loss': 0.9434, 'learning_rate': 1.630756673400601e-05, 'epoch': 0.57} {'loss': 0.8337, 'learning_rate': 1.6307312712161333e-05, 'epoch': 0.57} {'loss': 0.7823, 'learning_rate': 1.6307058683557798e-05, 'epoch': 0.57} {'loss': 0.782, 'learning_rate': 1.6306804648195682e-05, 'epoch': 0.57} {'loss': 1.0228, 'learning_rate': 1.6306550606075256e-05, 'epoch': 0.57} {'loss': 0.8346, 'learning_rate': 1.630629655719679e-05, 'epoch': 0.57} {'loss': 0.7933, 'learning_rate': 1.630604250156056e-05, 'epoch': 0.57} {'loss': 0.8279, 'learning_rate': 1.6305788439166833e-05, 'epoch': 0.57} {'loss': 0.6535, 'learning_rate': 1.630553437001589e-05, 'epoch': 0.57} {'loss': 0.9656, 'learning_rate': 1.6305280294107993e-05, 'epoch': 0.57} {'loss': 0.914, 'learning_rate': 1.6305026211443424e-05, 'epoch': 0.57} {'loss': 0.8563, 'learning_rate': 1.6304772122022442e-05, 'epoch': 0.57} {'loss': 0.9619, 'learning_rate': 1.6304518025845335e-05, 'epoch': 0.57} {'loss': 0.9442, 'learning_rate': 1.6304263922912366e-05, 'epoch': 0.57} {'loss': 0.9126, 'learning_rate': 1.630400981322381e-05, 'epoch': 0.57} {'loss': 0.9605, 'learning_rate': 1.6303755696779936e-05, 'epoch': 0.57} {'loss': 0.8916, 'learning_rate': 1.630350157358102e-05, 'epoch': 0.57} {'loss': 0.9056, 'learning_rate': 1.630324744362733e-05, 'epoch': 0.57} {'loss': 0.7083, 'learning_rate': 1.630299330691915e-05, 'epoch': 0.57} {'loss': 0.5993, 'learning_rate': 1.6302739163456734e-05, 'epoch': 0.57} {'loss': 0.7607, 'learning_rate': 1.6302485013240373e-05, 'epoch': 0.57} {'loss': 0.9275, 'learning_rate': 1.6302230856270326e-05, 'epoch': 0.57} {'loss': 0.8651, 'learning_rate': 1.630197669254687e-05, 'epoch': 0.57} {'loss': 0.9355, 'learning_rate': 1.6301722522070275e-05, 'epoch': 0.57} {'loss': 0.7619, 'learning_rate': 1.630146834484082e-05, 'epoch': 0.57} {'loss': 0.8749, 'learning_rate': 1.630121416085877e-05, 'epoch': 0.57} {'loss': 0.8471, 'learning_rate': 1.6300959970124402e-05, 'epoch': 0.57} {'loss': 0.7293, 'learning_rate': 1.6300705772637984e-05, 'epoch': 0.57} {'loss': 0.8914, 'learning_rate': 1.6300451568399792e-05, 'epoch': 0.57} {'loss': 0.6891, 'learning_rate': 1.6300197357410098e-05, 'epoch': 0.57} {'loss': 0.798, 'learning_rate': 1.6299943139669174e-05, 'epoch': 0.57} {'loss': 0.8347, 'learning_rate': 1.6299688915177293e-05, 'epoch': 0.57} {'loss': 0.7582, 'learning_rate': 1.6299434683934725e-05, 'epoch': 0.57} {'loss': 0.7766, 'learning_rate': 1.6299180445941745e-05, 'epoch': 0.57} {'loss': 0.8735, 'learning_rate': 1.6298926201198625e-05, 'epoch': 0.57} {'loss': 0.7238, 'learning_rate': 1.6298671949705637e-05, 'epoch': 0.57} {'loss': 0.9696, 'learning_rate': 1.6298417691463057e-05, 'epoch': 0.57} {'loss': 0.8184, 'learning_rate': 1.6298163426471146e-05, 'epoch': 0.57} {'loss': 0.8615, 'learning_rate': 1.6297909154730192e-05, 'epoch': 0.57} {'loss': 0.8237, 'learning_rate': 1.6297654876240455e-05, 'epoch': 0.57} {'loss': 0.7643, 'learning_rate': 1.6297400591002217e-05, 'epoch': 0.57} {'loss': 0.9192, 'learning_rate': 1.6297146299015745e-05, 'epoch': 0.57} {'loss': 0.6714, 'learning_rate': 1.6296892000281308e-05, 'epoch': 0.57} {'loss': 0.7788, 'learning_rate': 1.6296637694799185e-05, 'epoch': 0.57} {'loss': 0.8584, 'learning_rate': 1.6296383382569646e-05, 'epoch': 0.57} {'loss': 0.8153, 'learning_rate': 1.6296129063592968e-05, 'epoch': 0.57} {'loss': 0.9265, 'learning_rate': 1.6295874737869414e-05, 'epoch': 0.57} {'loss': 0.8885, 'learning_rate': 1.6295620405399267e-05, 'epoch': 0.57} {'loss': 0.9229, 'learning_rate': 1.629536606618279e-05, 'epoch': 0.57} {'loss': 0.8683, 'learning_rate': 1.6295111720220263e-05, 'epoch': 0.57} {'loss': 0.8364, 'learning_rate': 1.6294857367511954e-05, 'epoch': 0.57} {'loss': 0.7928, 'learning_rate': 1.6294603008058136e-05, 'epoch': 0.57} {'loss': 0.7903, 'learning_rate': 1.6294348641859086e-05, 'epoch': 0.57} {'loss': 0.8626, 'learning_rate': 1.6294094268915072e-05, 'epoch': 0.57} {'loss': 0.9764, 'learning_rate': 1.6293839889226365e-05, 'epoch': 0.57} {'loss': 0.9216, 'learning_rate': 1.6293585502793247e-05, 'epoch': 0.57} {'loss': 0.9091, 'learning_rate': 1.6293331109615977e-05, 'epoch': 0.57} {'loss': 0.9167, 'learning_rate': 1.6293076709694838e-05, 'epoch': 0.57} {'loss': 0.7422, 'learning_rate': 1.62928223030301e-05, 'epoch': 0.57} {'loss': 0.8344, 'learning_rate': 1.6292567889622035e-05, 'epoch': 0.57} {'loss': 1.001, 'learning_rate': 1.6292313469470917e-05, 'epoch': 0.57} {'loss': 0.9363, 'learning_rate': 1.6292059042577013e-05, 'epoch': 0.57} {'loss': 0.8223, 'learning_rate': 1.62918046089406e-05, 'epoch': 0.57} {'loss': 0.7016, 'learning_rate': 1.6291550168561954e-05, 'epoch': 0.57} {'loss': 0.7782, 'learning_rate': 1.6291295721441343e-05, 'epoch': 0.57} {'loss': 0.8568, 'learning_rate': 1.6291041267579042e-05, 'epoch': 0.57} {'loss': 0.9941, 'learning_rate': 1.6290786806975318e-05, 'epoch': 0.57} {'loss': 0.9054, 'learning_rate': 1.629053233963045e-05, 'epoch': 0.57} {'loss': 1.0562, 'learning_rate': 1.6290277865544713e-05, 'epoch': 0.57} {'loss': 0.7846, 'learning_rate': 1.629002338471837e-05, 'epoch': 0.57} {'loss': 0.8788, 'learning_rate': 1.6289768897151704e-05, 'epoch': 0.57} {'loss': 1.0653, 'learning_rate': 1.628951440284498e-05, 'epoch': 0.57} {'loss': 0.9965, 'learning_rate': 1.6289259901798474e-05, 'epoch': 0.57} {'loss': 0.7795, 'learning_rate': 1.628900539401246e-05, 'epoch': 0.57} {'loss': 0.7352, 'learning_rate': 1.6288750879487207e-05, 'epoch': 0.57} {'loss': 0.8383, 'learning_rate': 1.6288496358222987e-05, 'epoch': 0.57} {'loss': 0.8029, 'learning_rate': 1.6288241830220078e-05, 'epoch': 0.57} {'loss': 0.9661, 'learning_rate': 1.6287987295478755e-05, 'epoch': 0.57} {'loss': 0.7671, 'learning_rate': 1.628773275399928e-05, 'epoch': 0.57} {'loss': 0.7939, 'learning_rate': 1.6287478205781938e-05, 'epoch': 0.57} {'loss': 0.8126, 'learning_rate': 1.628722365082699e-05, 'epoch': 0.57} {'loss': 0.9698, 'learning_rate': 1.6286969089134714e-05, 'epoch': 0.57} {'loss': 1.0355, 'learning_rate': 1.6286714520705386e-05, 'epoch': 0.57} {'loss': 0.7548, 'learning_rate': 1.6286459945539276e-05, 'epoch': 0.57} {'loss': 0.929, 'learning_rate': 1.628620536363666e-05, 'epoch': 0.57} {'loss': 0.8808, 'learning_rate': 1.6285950774997802e-05, 'epoch': 0.57} {'loss': 0.8926, 'learning_rate': 1.628569617962298e-05, 'epoch': 0.57} {'loss': 0.7332, 'learning_rate': 1.628544157751247e-05, 'epoch': 0.57} {'loss': 0.8336, 'learning_rate': 1.6285186968666543e-05, 'epoch': 0.57} {'loss': 0.7369, 'learning_rate': 1.628493235308547e-05, 'epoch': 0.57} {'loss': 0.8647, 'learning_rate': 1.6284677730769524e-05, 'epoch': 0.57} {'loss': 0.7044, 'learning_rate': 1.628442310171898e-05, 'epoch': 0.57} {'loss': 0.7808, 'learning_rate': 1.6284168465934106e-05, 'epoch': 0.57} {'loss': 0.9033, 'learning_rate': 1.628391382341518e-05, 'epoch': 0.57} {'loss': 0.6587, 'learning_rate': 1.6283659174162475e-05, 'epoch': 0.57} {'loss': 0.9428, 'learning_rate': 1.628340451817626e-05, 'epoch': 0.57} {'loss': 0.8818, 'learning_rate': 1.6283149855456813e-05, 'epoch': 0.57} {'loss': 0.665, 'learning_rate': 1.62828951860044e-05, 'epoch': 0.57} {'loss': 0.8914, 'learning_rate': 1.6282640509819297e-05, 'epoch': 0.57} {'loss': 0.7327, 'learning_rate': 1.628238582690178e-05, 'epoch': 0.57} {'loss': 0.7862, 'learning_rate': 1.628213113725212e-05, 'epoch': 0.57} {'loss': 0.8817, 'learning_rate': 1.628187644087059e-05, 'epoch': 0.57} {'loss': 0.8127, 'learning_rate': 1.628162173775746e-05, 'epoch': 0.57} {'loss': 0.7827, 'learning_rate': 1.6281367027913008e-05, 'epoch': 0.57} {'loss': 0.8555, 'learning_rate': 1.6281112311337502e-05, 'epoch': 0.57} {'loss': 0.7781, 'learning_rate': 1.628085758803122e-05, 'epoch': 0.57} {'loss': 0.9907, 'learning_rate': 1.628060285799443e-05, 'epoch': 0.57} {'loss': 0.853, 'learning_rate': 1.6280348121227408e-05, 'epoch': 0.57} {'loss': 0.8718, 'learning_rate': 1.6280093377730427e-05, 'epoch': 0.57} {'loss': 0.8999, 'learning_rate': 1.6279838627503756e-05, 'epoch': 0.57} {'loss': 0.8394, 'learning_rate': 1.6279583870547672e-05, 'epoch': 0.57} {'loss': 0.7993, 'learning_rate': 1.627932910686245e-05, 'epoch': 0.57} {'loss': 0.6683, 'learning_rate': 1.6279074336448358e-05, 'epoch': 0.57} {'loss': 0.8947, 'learning_rate': 1.6278819559305673e-05, 'epoch': 0.57} {'loss': 0.7855, 'learning_rate': 1.6278564775434664e-05, 'epoch': 0.57} {'loss': 0.7144, 'learning_rate': 1.6278309984835607e-05, 'epoch': 0.57} {'loss': 1.0164, 'learning_rate': 1.6278055187508774e-05, 'epoch': 0.57} {'loss': 0.8348, 'learning_rate': 1.6277800383454436e-05, 'epoch': 0.57} {'loss': 0.9438, 'learning_rate': 1.627754557267287e-05, 'epoch': 0.57} {'loss': 0.7752, 'learning_rate': 1.627729075516435e-05, 'epoch': 0.57} {'loss': 0.8086, 'learning_rate': 1.6277035930929144e-05, 'epoch': 0.57} {'loss': 0.7848, 'learning_rate': 1.6276781099967528e-05, 'epoch': 0.57} {'loss': 0.8111, 'learning_rate': 1.627652626227977e-05, 'epoch': 0.57} {'loss': 0.921, 'learning_rate': 1.6276271417866153e-05, 'epoch': 0.57} {'loss': 0.8586, 'learning_rate': 1.6276016566726945e-05, 'epoch': 0.57} {'loss': 0.8048, 'learning_rate': 1.6275761708862416e-05, 'epoch': 0.57} {'loss': 0.7986, 'learning_rate': 1.6275506844272846e-05, 'epoch': 0.57} {'loss': 0.7228, 'learning_rate': 1.6275251972958502e-05, 'epoch': 0.57} {'loss': 0.8504, 'learning_rate': 1.6274997094919655e-05, 'epoch': 0.57} {'loss': 0.7717, 'learning_rate': 1.6274742210156586e-05, 'epoch': 0.57} {'loss': 0.9804, 'learning_rate': 1.6274487318669566e-05, 'epoch': 0.57} {'loss': 0.9314, 'learning_rate': 1.6274232420458863e-05, 'epoch': 0.57} {'loss': 0.81, 'learning_rate': 1.6273977515524757e-05, 'epoch': 0.57} {'loss': 0.906, 'learning_rate': 1.6273722603867518e-05, 'epoch': 0.57} {'loss': 0.8293, 'learning_rate': 1.6273467685487415e-05, 'epoch': 0.57} {'loss': 0.6965, 'learning_rate': 1.6273212760384727e-05, 'epoch': 0.57} {'loss': 0.9286, 'learning_rate': 1.6272957828559725e-05, 'epoch': 0.57} {'loss': 1.0695, 'learning_rate': 1.6272702890012683e-05, 'epoch': 0.57} {'loss': 0.991, 'learning_rate': 1.6272447944743875e-05, 'epoch': 0.57} {'loss': 0.9203, 'learning_rate': 1.627219299275357e-05, 'epoch': 0.57} {'loss': 0.6989, 'learning_rate': 1.6271938034042047e-05, 'epoch': 0.57} {'loss': 0.7903, 'learning_rate': 1.6271683068609573e-05, 'epoch': 0.57} {'loss': 0.8363, 'learning_rate': 1.6271428096456427e-05, 'epoch': 0.57} {'loss': 0.7795, 'learning_rate': 1.6271173117582878e-05, 'epoch': 0.57} {'loss': 0.9428, 'learning_rate': 1.6270918131989203e-05, 'epoch': 0.57} {'loss': 0.8372, 'learning_rate': 1.6270663139675674e-05, 'epoch': 0.57} {'loss': 0.7179, 'learning_rate': 1.627040814064256e-05, 'epoch': 0.57} {'loss': 0.919, 'learning_rate': 1.6270153134890143e-05, 'epoch': 0.57} {'loss': 1.0272, 'learning_rate': 1.626989812241869e-05, 'epoch': 0.57} {'loss': 0.8896, 'learning_rate': 1.626964310322847e-05, 'epoch': 0.57} {'loss': 0.8509, 'learning_rate': 1.6269388077319767e-05, 'epoch': 0.57} {'loss': 0.8999, 'learning_rate': 1.6269133044692843e-05, 'epoch': 0.57} {'loss': 0.9638, 'learning_rate': 1.6268878005347982e-05, 'epoch': 0.57} {'loss': 0.7475, 'learning_rate': 1.6268622959285452e-05, 'epoch': 0.57} {'loss': 0.8106, 'learning_rate': 1.6268367906505527e-05, 'epoch': 0.57} {'loss': 0.6689, 'learning_rate': 1.626811284700848e-05, 'epoch': 0.57} {'loss': 0.8399, 'learning_rate': 1.6267857780794577e-05, 'epoch': 0.57} {'loss': 0.8699, 'learning_rate': 1.6267602707864108e-05, 'epoch': 0.57} {'loss': 0.8066, 'learning_rate': 1.6267347628217335e-05, 'epoch': 0.57} {'loss': 0.8572, 'learning_rate': 1.6267092541854532e-05, 'epoch': 0.57} {'loss': 0.915, 'learning_rate': 1.6266837448775975e-05, 'epoch': 0.57} {'loss': 0.6999, 'learning_rate': 1.6266582348981933e-05, 'epoch': 0.57} {'loss': 0.8878, 'learning_rate': 1.6266327242472682e-05, 'epoch': 0.57} {'loss': 0.8789, 'learning_rate': 1.6266072129248497e-05, 'epoch': 0.57} {'loss': 0.8546, 'learning_rate': 1.6265817009309654e-05, 'epoch': 0.57} {'loss': 0.7665, 'learning_rate': 1.626556188265642e-05, 'epoch': 0.57} {'loss': 0.7677, 'learning_rate': 1.626530674928907e-05, 'epoch': 0.57} {'loss': 0.8361, 'learning_rate': 1.6265051609207882e-05, 'epoch': 0.57} {'loss': 0.9409, 'learning_rate': 1.626479646241312e-05, 'epoch': 0.57} {'loss': 0.8248, 'learning_rate': 1.6264541308905068e-05, 'epoch': 0.57} {'loss': 0.9238, 'learning_rate': 1.626428614868399e-05, 'epoch': 0.57} {'loss': 0.5544, 'learning_rate': 1.626403098175017e-05, 'epoch': 0.57} {'loss': 0.795, 'learning_rate': 1.6263775808103872e-05, 'epoch': 0.57} {'loss': 0.8619, 'learning_rate': 1.626352062774537e-05, 'epoch': 0.57} {'loss': 0.804, 'learning_rate': 1.6263265440674944e-05, 'epoch': 0.57} {'loss': 0.8252, 'learning_rate': 1.6263010246892866e-05, 'epoch': 0.57} {'loss': 0.7994, 'learning_rate': 1.6262755046399404e-05, 'epoch': 0.57} {'loss': 0.7212, 'learning_rate': 1.6262499839194832e-05, 'epoch': 0.57} {'loss': 0.8643, 'learning_rate': 1.6262244625279432e-05, 'epoch': 0.57} {'loss': 0.5971, 'learning_rate': 1.6261989404653468e-05, 'epoch': 0.57} {'loss': 0.9425, 'learning_rate': 1.626173417731722e-05, 'epoch': 0.57} {'loss': 0.7509, 'learning_rate': 1.6261478943270957e-05, 'epoch': 0.57} {'loss': 0.8993, 'learning_rate': 1.626122370251495e-05, 'epoch': 0.57} {'loss': 0.9248, 'learning_rate': 1.6260968455049482e-05, 'epoch': 0.57} {'loss': 0.6925, 'learning_rate': 1.626071320087482e-05, 'epoch': 0.57} {'loss': 0.8535, 'learning_rate': 1.626045793999124e-05, 'epoch': 0.57} {'loss': 0.8386, 'learning_rate': 1.6260202672399012e-05, 'epoch': 0.57} {'loss': 0.7709, 'learning_rate': 1.625994739809841e-05, 'epoch': 0.57} {'loss': 0.9393, 'learning_rate': 1.6259692117089712e-05, 'epoch': 0.57} {'loss': 0.8269, 'learning_rate': 1.6259436829373192e-05, 'epoch': 0.57} {'loss': 0.6824, 'learning_rate': 1.625918153494912e-05, 'epoch': 0.57} {'loss': 0.8896, 'learning_rate': 1.6258926233817765e-05, 'epoch': 0.57} {'loss': 0.7997, 'learning_rate': 1.6258670925979408e-05, 'epoch': 0.57} {'loss': 0.9272, 'learning_rate': 1.625841561143432e-05, 'epoch': 0.57} {'loss': 0.5715, 'learning_rate': 1.6258160290182775e-05, 'epoch': 0.57} {'loss': 0.8203, 'learning_rate': 1.6257904962225047e-05, 'epoch': 0.57} {'loss': 0.8367, 'learning_rate': 1.625764962756141e-05, 'epoch': 0.57} {'loss': 0.713, 'learning_rate': 1.6257394286192133e-05, 'epoch': 0.57} {'loss': 0.7637, 'learning_rate': 1.6257138938117495e-05, 'epoch': 0.57} {'loss': 0.8032, 'learning_rate': 1.6256883583337768e-05, 'epoch': 0.57} {'loss': 0.7565, 'learning_rate': 1.625662822185323e-05, 'epoch': 0.57} {'loss': 0.8621, 'learning_rate': 1.6256372853664144e-05, 'epoch': 0.57} {'loss': 0.8334, 'learning_rate': 1.6256117478770793e-05, 'epoch': 0.57} {'loss': 0.8041, 'learning_rate': 1.6255862097173447e-05, 'epoch': 0.57} {'loss': 0.8398, 'learning_rate': 1.6255606708872377e-05, 'epoch': 0.57} {'loss': 0.8685, 'learning_rate': 1.625535131386786e-05, 'epoch': 0.57} {'loss': 0.7988, 'learning_rate': 1.6255095912160175e-05, 'epoch': 0.57} {'loss': 0.9384, 'learning_rate': 1.6254840503749588e-05, 'epoch': 0.57} {'loss': 0.7893, 'learning_rate': 1.625458508863637e-05, 'epoch': 0.57} {'loss': 0.819, 'learning_rate': 1.6254329666820806e-05, 'epoch': 0.57} {'loss': 0.8253, 'learning_rate': 1.625407423830316e-05, 'epoch': 0.57} {'loss': 0.9972, 'learning_rate': 1.625381880308371e-05, 'epoch': 0.57} {'loss': 0.8145, 'learning_rate': 1.6253563361162728e-05, 'epoch': 0.57} {'loss': 0.9209, 'learning_rate': 1.625330791254049e-05, 'epoch': 0.57} {'loss': 0.8848, 'learning_rate': 1.6253052457217266e-05, 'epoch': 0.57} {'loss': 0.755, 'learning_rate': 1.6252796995193335e-05, 'epoch': 0.57} {'loss': 0.849, 'learning_rate': 1.6252541526468967e-05, 'epoch': 0.57} {'loss': 1.0246, 'learning_rate': 1.6252286051044433e-05, 'epoch': 0.57} {'loss': 0.6586, 'learning_rate': 1.625203056892001e-05, 'epoch': 0.57} {'loss': 0.9174, 'learning_rate': 1.6251775080095975e-05, 'epoch': 0.57} {'loss': 0.9255, 'learning_rate': 1.6251519584572596e-05, 'epoch': 0.57} {'loss': 0.9043, 'learning_rate': 1.6251264082350155e-05, 'epoch': 0.57} {'loss': 0.8443, 'learning_rate': 1.6251008573428918e-05, 'epoch': 0.57} {'loss': 0.7669, 'learning_rate': 1.6250753057809157e-05, 'epoch': 0.57} {'loss': 0.9044, 'learning_rate': 1.6250497535491154e-05, 'epoch': 0.57} {'loss': 0.7059, 'learning_rate': 1.6250242006475178e-05, 'epoch': 0.57} {'loss': 0.9398, 'learning_rate': 1.6249986470761502e-05, 'epoch': 0.57} {'loss': 0.6287, 'learning_rate': 1.6249730928350404e-05, 'epoch': 0.57} {'loss': 0.9116, 'learning_rate': 1.6249475379242152e-05, 'epoch': 0.57} {'loss': 0.8671, 'learning_rate': 1.6249219823437027e-05, 'epoch': 0.57} {'loss': 1.0003, 'learning_rate': 1.6248964260935297e-05, 'epoch': 0.57} {'loss': 0.8682, 'learning_rate': 1.6248708691737237e-05, 'epoch': 0.57} {'loss': 0.7186, 'learning_rate': 1.624845311584312e-05, 'epoch': 0.57} {'loss': 0.8165, 'learning_rate': 1.6248197533253224e-05, 'epoch': 0.57} {'loss': 0.7114, 'learning_rate': 1.624794194396782e-05, 'epoch': 0.57} {'loss': 0.8438, 'learning_rate': 1.6247686347987185e-05, 'epoch': 0.57} {'loss': 0.7698, 'learning_rate': 1.6247430745311587e-05, 'epoch': 0.57} {'loss': 0.9432, 'learning_rate': 1.6247175135941305e-05, 'epoch': 0.57} {'loss': 0.7941, 'learning_rate': 1.6246919519876606e-05, 'epoch': 0.57} {'loss': 0.8771, 'learning_rate': 1.6246663897117775e-05, 'epoch': 0.57} {'loss': 0.969, 'learning_rate': 1.6246408267665077e-05, 'epoch': 0.57} {'loss': 0.8733, 'learning_rate': 1.624615263151879e-05, 'epoch': 0.57} {'loss': 0.9551, 'learning_rate': 1.6245896988679186e-05, 'epoch': 0.57} {'loss': 0.704, 'learning_rate': 1.624564133914654e-05, 'epoch': 0.58} {'loss': 0.8397, 'learning_rate': 1.6245385682921124e-05, 'epoch': 0.58} {'loss': 0.9041, 'learning_rate': 1.6245130020003215e-05, 'epoch': 0.58} {'loss': 1.0052, 'learning_rate': 1.6244874350393085e-05, 'epoch': 0.58} {'loss': 0.7451, 'learning_rate': 1.6244618674091008e-05, 'epoch': 0.58} {'loss': 0.9112, 'learning_rate': 1.6244362991097262e-05, 'epoch': 0.58} {'loss': 0.748, 'learning_rate': 1.6244107301412112e-05, 'epoch': 0.58} {'loss': 0.9911, 'learning_rate': 1.6243851605035842e-05, 'epoch': 0.58} {'loss': 0.8289, 'learning_rate': 1.6243595901968717e-05, 'epoch': 0.58} {'loss': 0.7752, 'learning_rate': 1.624334019221102e-05, 'epoch': 0.58} {'loss': 0.8901, 'learning_rate': 1.624308447576302e-05, 'epoch': 0.58} {'loss': 0.892, 'learning_rate': 1.624282875262499e-05, 'epoch': 0.58} {'loss': 0.9921, 'learning_rate': 1.6242573022797206e-05, 'epoch': 0.58} {'loss': 0.9629, 'learning_rate': 1.624231728627994e-05, 'epoch': 0.58} {'loss': 0.7254, 'learning_rate': 1.6242061543073468e-05, 'epoch': 0.58} {'loss': 0.8572, 'learning_rate': 1.6241805793178065e-05, 'epoch': 0.58} {'loss': 0.8294, 'learning_rate': 1.6241550036594006e-05, 'epoch': 0.58} {'loss': 0.8321, 'learning_rate': 1.624129427332156e-05, 'epoch': 0.58} {'loss': 0.6807, 'learning_rate': 1.6241038503361e-05, 'epoch': 0.58} {'loss': 0.7936, 'learning_rate': 1.6240782726712608e-05, 'epoch': 0.58} {'loss': 0.8347, 'learning_rate': 1.6240526943376656e-05, 'epoch': 0.58} {'loss': 0.7927, 'learning_rate': 1.6240271153353413e-05, 'epoch': 0.58} {'loss': 0.9779, 'learning_rate': 1.624001535664316e-05, 'epoch': 0.58} {'loss': 0.8327, 'learning_rate': 1.6239759553246164e-05, 'epoch': 0.58} {'loss': 0.8477, 'learning_rate': 1.6239503743162704e-05, 'epoch': 0.58} {'loss': 0.7615, 'learning_rate': 1.623924792639305e-05, 'epoch': 0.58} {'loss': 0.792, 'learning_rate': 1.623899210293748e-05, 'epoch': 0.58} {'loss': 0.8502, 'learning_rate': 1.6238736272796267e-05, 'epoch': 0.58} {'loss': 0.7811, 'learning_rate': 1.6238480435969687e-05, 'epoch': 0.58} {'loss': 0.8185, 'learning_rate': 1.623822459245801e-05, 'epoch': 0.58} {'loss': 0.8693, 'learning_rate': 1.6237968742261513e-05, 'epoch': 0.58} {'loss': 0.8873, 'learning_rate': 1.623771288538047e-05, 'epoch': 0.58} {'loss': 0.8239, 'learning_rate': 1.623745702181515e-05, 'epoch': 0.58} {'loss': 0.7776, 'learning_rate': 1.6237201151565836e-05, 'epoch': 0.58} {'loss': 0.8805, 'learning_rate': 1.6236945274632798e-05, 'epoch': 0.58} {'loss': 0.7765, 'learning_rate': 1.623668939101631e-05, 'epoch': 0.58} {'loss': 0.8402, 'learning_rate': 1.6236433500716652e-05, 'epoch': 0.58} {'loss': 0.741, 'learning_rate': 1.6236177603734086e-05, 'epoch': 0.58} {'loss': 0.8027, 'learning_rate': 1.623592170006889e-05, 'epoch': 0.58} {'loss': 0.7466, 'learning_rate': 1.6235665789721348e-05, 'epoch': 0.58} {'loss': 0.7695, 'learning_rate': 1.623540987269172e-05, 'epoch': 0.58} {'loss': 0.7773, 'learning_rate': 1.6235153948980296e-05, 'epoch': 0.58} {'loss': 0.812, 'learning_rate': 1.6234898018587336e-05, 'epoch': 0.58} {'loss': 0.8706, 'learning_rate': 1.6234642081513125e-05, 'epoch': 0.58} {'loss': 0.6445, 'learning_rate': 1.623438613775793e-05, 'epoch': 0.58} {'loss': 0.9145, 'learning_rate': 1.6234130187322024e-05, 'epoch': 0.58} {'loss': 1.0254, 'learning_rate': 1.6233874230205685e-05, 'epoch': 0.58} {'loss': 0.9187, 'learning_rate': 1.623361826640919e-05, 'epoch': 0.58} {'loss': 0.8183, 'learning_rate': 1.6233362295932812e-05, 'epoch': 0.58} {'loss': 0.916, 'learning_rate': 1.623310631877682e-05, 'epoch': 0.58} {'loss': 0.8207, 'learning_rate': 1.6232850334941495e-05, 'epoch': 0.58} {'loss': 0.7611, 'learning_rate': 1.6232594344427105e-05, 'epoch': 0.58} {'loss': 0.804, 'learning_rate': 1.623233834723393e-05, 'epoch': 0.58} {'loss': 0.9787, 'learning_rate': 1.6232082343362245e-05, 'epoch': 0.58} {'loss': 0.862, 'learning_rate': 1.6231826332812313e-05, 'epoch': 0.58} {'loss': 0.8794, 'learning_rate': 1.6231570315584425e-05, 'epoch': 0.58} {'loss': 0.8474, 'learning_rate': 1.6231314291678845e-05, 'epoch': 0.58} {'loss': 0.9303, 'learning_rate': 1.6231058261095846e-05, 'epoch': 0.58} {'loss': 0.8498, 'learning_rate': 1.6230802223835706e-05, 'epoch': 0.58} {'loss': 0.8577, 'learning_rate': 1.62305461798987e-05, 'epoch': 0.58} {'loss': 0.8033, 'learning_rate': 1.62302901292851e-05, 'epoch': 0.58} {'loss': 0.9116, 'learning_rate': 1.6230034071995187e-05, 'epoch': 0.58} {'loss': 0.7734, 'learning_rate': 1.6229778008029223e-05, 'epoch': 0.58} {'loss': 0.9132, 'learning_rate': 1.62295219373875e-05, 'epoch': 0.58} {'loss': 1.1673, 'learning_rate': 1.622926586007027e-05, 'epoch': 0.58} {'loss': 0.8667, 'learning_rate': 1.6229009776077825e-05, 'epoch': 0.58} {'loss': 0.8005, 'learning_rate': 1.6228753685410436e-05, 'epoch': 0.58} {'loss': 0.6989, 'learning_rate': 1.6228497588068376e-05, 'epoch': 0.58} {'loss': 0.9056, 'learning_rate': 1.6228241484051913e-05, 'epoch': 0.58} {'loss': 0.9598, 'learning_rate': 1.622798537336133e-05, 'epoch': 0.58} {'loss': 0.858, 'learning_rate': 1.6227729255996897e-05, 'epoch': 0.58} {'loss': 0.9606, 'learning_rate': 1.622747313195889e-05, 'epoch': 0.58} {'loss': 0.757, 'learning_rate': 1.6227217001247587e-05, 'epoch': 0.58} {'loss': 0.8695, 'learning_rate': 1.6226960863863258e-05, 'epoch': 0.58} {'loss': 0.7263, 'learning_rate': 1.6226704719806175e-05, 'epoch': 0.58} {'loss': 0.9143, 'learning_rate': 1.6226448569076618e-05, 'epoch': 0.58} {'loss': 0.9, 'learning_rate': 1.622619241167486e-05, 'epoch': 0.58} {'loss': 0.8397, 'learning_rate': 1.6225936247601173e-05, 'epoch': 0.58} {'loss': 0.8218, 'learning_rate': 1.6225680076855838e-05, 'epoch': 0.58} {'loss': 0.7698, 'learning_rate': 1.622542389943912e-05, 'epoch': 0.58} {'loss': 0.7741, 'learning_rate': 1.62251677153513e-05, 'epoch': 0.58} {'loss': 0.7864, 'learning_rate': 1.622491152459265e-05, 'epoch': 0.58} {'loss': 0.8042, 'learning_rate': 1.6224655327163444e-05, 'epoch': 0.58} {'loss': 1.0192, 'learning_rate': 1.6224399123063964e-05, 'epoch': 0.58} {'loss': 0.7032, 'learning_rate': 1.6224142912294475e-05, 'epoch': 0.58} {'loss': 0.8022, 'learning_rate': 1.6223886694855256e-05, 'epoch': 0.58} {'loss': 1.0247, 'learning_rate': 1.6223630470746577e-05, 'epoch': 0.58} {'loss': 0.7484, 'learning_rate': 1.622337423996872e-05, 'epoch': 0.58} {'loss': 0.7952, 'learning_rate': 1.6223118002521956e-05, 'epoch': 0.58} {'loss': 0.6402, 'learning_rate': 1.622286175840656e-05, 'epoch': 0.58} {'loss': 0.7835, 'learning_rate': 1.6222605507622803e-05, 'epoch': 0.58} {'loss': 0.994, 'learning_rate': 1.6222349250170964e-05, 'epoch': 0.58} {'loss': 0.7438, 'learning_rate': 1.6222092986051315e-05, 'epoch': 0.58} {'loss': 1.0058, 'learning_rate': 1.622183671526413e-05, 'epoch': 0.58} {'loss': 0.7021, 'learning_rate': 1.622158043780969e-05, 'epoch': 0.58} {'loss': 0.9349, 'learning_rate': 1.6221324153688262e-05, 'epoch': 0.58} {'loss': 0.7844, 'learning_rate': 1.6221067862900123e-05, 'epoch': 0.58} {'loss': 1.0339, 'learning_rate': 1.6220811565445554e-05, 'epoch': 0.58} {'loss': 0.8184, 'learning_rate': 1.6220555261324818e-05, 'epoch': 0.58} {'loss': 0.735, 'learning_rate': 1.62202989505382e-05, 'epoch': 0.58} {'loss': 0.8256, 'learning_rate': 1.6220042633085966e-05, 'epoch': 0.58} {'loss': 0.7453, 'learning_rate': 1.62197863089684e-05, 'epoch': 0.58} {'loss': 0.8138, 'learning_rate': 1.6219529978185766e-05, 'epoch': 0.58} {'loss': 0.7711, 'learning_rate': 1.6219273640738346e-05, 'epoch': 0.58} {'loss': 0.8403, 'learning_rate': 1.6219017296626413e-05, 'epoch': 0.58} {'loss': 0.9022, 'learning_rate': 1.6218760945850245e-05, 'epoch': 0.58} {'loss': 0.8807, 'learning_rate': 1.621850458841011e-05, 'epoch': 0.58} {'loss': 0.7114, 'learning_rate': 1.6218248224306286e-05, 'epoch': 0.58} {'loss': 0.8459, 'learning_rate': 1.621799185353905e-05, 'epoch': 0.58} {'loss': 0.8198, 'learning_rate': 1.6217735476108673e-05, 'epoch': 0.58} {'loss': 0.8528, 'learning_rate': 1.621747909201543e-05, 'epoch': 0.58} {'loss': 0.7318, 'learning_rate': 1.6217222701259598e-05, 'epoch': 0.58} {'loss': 0.7234, 'learning_rate': 1.6216966303841453e-05, 'epoch': 0.58} {'loss': 0.8706, 'learning_rate': 1.6216709899761265e-05, 'epoch': 0.58} {'loss': 0.8552, 'learning_rate': 1.621645348901931e-05, 'epoch': 0.58} {'loss': 0.7395, 'learning_rate': 1.6216197071615867e-05, 'epoch': 0.58} {'loss': 0.7086, 'learning_rate': 1.6215940647551204e-05, 'epoch': 0.58} {'loss': 0.7174, 'learning_rate': 1.6215684216825605e-05, 'epoch': 0.58} {'loss': 0.9263, 'learning_rate': 1.6215427779439336e-05, 'epoch': 0.58} {'loss': 0.7684, 'learning_rate': 1.6215171335392678e-05, 'epoch': 0.58} {'loss': 0.7233, 'learning_rate': 1.62149148846859e-05, 'epoch': 0.58} {'loss': 0.8273, 'learning_rate': 1.621465842731928e-05, 'epoch': 0.58} {'loss': 0.8546, 'learning_rate': 1.6214401963293093e-05, 'epoch': 0.58} {'loss': 0.8101, 'learning_rate': 1.6214145492607614e-05, 'epoch': 0.58} {'loss': 0.9103, 'learning_rate': 1.6213889015263114e-05, 'epoch': 0.58} {'loss': 0.8146, 'learning_rate': 1.6213632531259875e-05, 'epoch': 0.58} {'loss': 0.9297, 'learning_rate': 1.6213376040598164e-05, 'epoch': 0.58} {'loss': 0.8648, 'learning_rate': 1.6213119543278267e-05, 'epoch': 0.58} {'loss': 0.6213, 'learning_rate': 1.6212863039300442e-05, 'epoch': 0.58} {'loss': 0.8796, 'learning_rate': 1.6212606528664983e-05, 'epoch': 0.58} {'loss': 0.8092, 'learning_rate': 1.621235001137215e-05, 'epoch': 0.58} {'loss': 0.825, 'learning_rate': 1.6212093487422224e-05, 'epoch': 0.58} {'loss': 0.7851, 'learning_rate': 1.621183695681548e-05, 'epoch': 0.58} {'loss': 0.783, 'learning_rate': 1.621158041955219e-05, 'epoch': 0.58} {'loss': 0.8218, 'learning_rate': 1.6211323875632633e-05, 'epoch': 0.58} {'loss': 0.8416, 'learning_rate': 1.6211067325057084e-05, 'epoch': 0.58} {'loss': 0.7397, 'learning_rate': 1.621081076782581e-05, 'epoch': 0.58} {'loss': 0.6549, 'learning_rate': 1.6210554203939097e-05, 'epoch': 0.58} {'loss': 0.7856, 'learning_rate': 1.621029763339721e-05, 'epoch': 0.58} {'loss': 0.8968, 'learning_rate': 1.621004105620043e-05, 'epoch': 0.58} {'loss': 0.7805, 'learning_rate': 1.6209784472349036e-05, 'epoch': 0.58} {'loss': 0.7814, 'learning_rate': 1.620952788184329e-05, 'epoch': 0.58} {'loss': 0.8083, 'learning_rate': 1.620927128468348e-05, 'epoch': 0.58} {'loss': 0.6822, 'learning_rate': 1.620901468086987e-05, 'epoch': 0.58} {'loss': 0.8415, 'learning_rate': 1.6208758070402748e-05, 'epoch': 0.58} {'loss': 0.9481, 'learning_rate': 1.6208501453282372e-05, 'epoch': 0.58} {'loss': 0.7876, 'learning_rate': 1.6208244829509034e-05, 'epoch': 0.58} {'loss': 0.7919, 'learning_rate': 1.6207988199082994e-05, 'epoch': 0.58} {'loss': 0.5501, 'learning_rate': 1.620773156200454e-05, 'epoch': 0.58} {'loss': 0.9296, 'learning_rate': 1.620747491827394e-05, 'epoch': 0.58} {'loss': 0.9953, 'learning_rate': 1.620721826789147e-05, 'epoch': 0.58} {'loss': 0.9209, 'learning_rate': 1.6206961610857406e-05, 'epoch': 0.58} {'loss': 0.8425, 'learning_rate': 1.620670494717202e-05, 'epoch': 0.58} {'loss': 0.8372, 'learning_rate': 1.6206448276835594e-05, 'epoch': 0.58} {'loss': 0.717, 'learning_rate': 1.6206191599848397e-05, 'epoch': 0.58} {'loss': 0.7489, 'learning_rate': 1.6205934916210704e-05, 'epoch': 0.58} {'loss': 0.767, 'learning_rate': 1.6205678225922792e-05, 'epoch': 0.58} {'loss': 0.9506, 'learning_rate': 1.6205421528984933e-05, 'epoch': 0.58} {'loss': 0.7298, 'learning_rate': 1.6205164825397412e-05, 'epoch': 0.58} {'loss': 0.9189, 'learning_rate': 1.620490811516049e-05, 'epoch': 0.58} {'loss': 0.7843, 'learning_rate': 1.620465139827445e-05, 'epoch': 0.58} {'loss': 0.9072, 'learning_rate': 1.620439467473957e-05, 'epoch': 0.58} {'loss': 0.8876, 'learning_rate': 1.6204137944556117e-05, 'epoch': 0.58} {'loss': 0.844, 'learning_rate': 1.620388120772437e-05, 'epoch': 0.58} {'loss': 0.7978, 'learning_rate': 1.6203624464244607e-05, 'epoch': 0.58} {'loss': 0.8152, 'learning_rate': 1.62033677141171e-05, 'epoch': 0.58} {'loss': 0.7795, 'learning_rate': 1.6203110957342124e-05, 'epoch': 0.58} {'loss': 0.7652, 'learning_rate': 1.6202854193919958e-05, 'epoch': 0.58} {'loss': 0.9841, 'learning_rate': 1.620259742385087e-05, 'epoch': 0.58} {'loss': 0.949, 'learning_rate': 1.620234064713514e-05, 'epoch': 0.58} {'loss': 0.9055, 'learning_rate': 1.620208386377304e-05, 'epoch': 0.58} {'loss': 0.9927, 'learning_rate': 1.6201827073764852e-05, 'epoch': 0.58} {'loss': 0.7852, 'learning_rate': 1.6201570277110842e-05, 'epoch': 0.58} {'loss': 0.7175, 'learning_rate': 1.6201313473811294e-05, 'epoch': 0.58} {'loss': 0.8589, 'learning_rate': 1.6201056663866473e-05, 'epoch': 0.58} {'loss': 0.8018, 'learning_rate': 1.6200799847276665e-05, 'epoch': 0.58} {'loss': 0.831, 'learning_rate': 1.620054302404214e-05, 'epoch': 0.58} {'loss': 0.8321, 'learning_rate': 1.6200286194163174e-05, 'epoch': 0.58} {'loss': 0.8895, 'learning_rate': 1.6200029357640038e-05, 'epoch': 0.58} {'loss': 0.9303, 'learning_rate': 1.6199772514473013e-05, 'epoch': 0.58} {'loss': 0.8641, 'learning_rate': 1.6199515664662374e-05, 'epoch': 0.58} {'loss': 0.8711, 'learning_rate': 1.6199258808208394e-05, 'epoch': 0.58} {'loss': 0.7239, 'learning_rate': 1.6199001945111344e-05, 'epoch': 0.58} {'loss': 1.0475, 'learning_rate': 1.619874507537151e-05, 'epoch': 0.58} {'loss': 0.6697, 'learning_rate': 1.619848819898916e-05, 'epoch': 0.58} {'loss': 0.8715, 'learning_rate': 1.6198231315964565e-05, 'epoch': 0.58} {'loss': 0.9864, 'learning_rate': 1.619797442629801e-05, 'epoch': 0.58} {'loss': 0.7374, 'learning_rate': 1.6197717529989768e-05, 'epoch': 0.58} {'loss': 0.6942, 'learning_rate': 1.619746062704011e-05, 'epoch': 0.58} {'loss': 0.9394, 'learning_rate': 1.6197203717449313e-05, 'epoch': 0.58} {'loss': 0.7743, 'learning_rate': 1.6196946801217653e-05, 'epoch': 0.58} {'loss': 0.6977, 'learning_rate': 1.6196689878345408e-05, 'epoch': 0.58} {'loss': 0.8863, 'learning_rate': 1.6196432948832847e-05, 'epoch': 0.58} {'loss': 0.9453, 'learning_rate': 1.6196176012680253e-05, 'epoch': 0.58} {'loss': 0.8694, 'learning_rate': 1.619591906988789e-05, 'epoch': 0.58} {'loss': 0.6087, 'learning_rate': 1.6195662120456045e-05, 'epoch': 0.58} {'loss': 0.7205, 'learning_rate': 1.619540516438499e-05, 'epoch': 0.58} {'loss': 0.7303, 'learning_rate': 1.6195148201674995e-05, 'epoch': 0.58} {'loss': 0.8838, 'learning_rate': 1.6194891232326343e-05, 'epoch': 0.58} {'loss': 1.0952, 'learning_rate': 1.6194634256339304e-05, 'epoch': 0.58} {'loss': 0.8252, 'learning_rate': 1.619437727371416e-05, 'epoch': 0.58} {'loss': 0.8517, 'learning_rate': 1.6194120284451176e-05, 'epoch': 0.58} {'loss': 0.9594, 'learning_rate': 1.6193863288550637e-05, 'epoch': 0.58} {'loss': 0.799, 'learning_rate': 1.6193606286012814e-05, 'epoch': 0.58} {'loss': 0.7445, 'learning_rate': 1.619334927683798e-05, 'epoch': 0.58} {'loss': 1.0303, 'learning_rate': 1.6193092261026414e-05, 'epoch': 0.58} {'loss': 0.713, 'learning_rate': 1.6192835238578394e-05, 'epoch': 0.58} {'loss': 0.8906, 'learning_rate': 1.6192578209494187e-05, 'epoch': 0.58} {'loss': 0.8066, 'learning_rate': 1.6192321173774076e-05, 'epoch': 0.58} {'loss': 1.0222, 'learning_rate': 1.6192064131418336e-05, 'epoch': 0.58} {'loss': 0.7619, 'learning_rate': 1.6191807082427238e-05, 'epoch': 0.58} {'loss': 0.8196, 'learning_rate': 1.619155002680106e-05, 'epoch': 0.58} {'loss': 0.9483, 'learning_rate': 1.6191292964540076e-05, 'epoch': 0.58} {'loss': 0.8512, 'learning_rate': 1.6191035895644568e-05, 'epoch': 0.58} {'loss': 0.8886, 'learning_rate': 1.61907788201148e-05, 'epoch': 0.58} {'loss': 0.8566, 'learning_rate': 1.619052173795106e-05, 'epoch': 0.58} {'loss': 0.8519, 'learning_rate': 1.619026464915361e-05, 'epoch': 0.58} {'loss': 0.8476, 'learning_rate': 1.619000755372274e-05, 'epoch': 0.58} {'loss': 0.9918, 'learning_rate': 1.6189750451658715e-05, 'epoch': 0.58} {'loss': 0.9033, 'learning_rate': 1.6189493342961813e-05, 'epoch': 0.58} {'loss': 0.7872, 'learning_rate': 1.618923622763231e-05, 'epoch': 0.58} {'loss': 0.8842, 'learning_rate': 1.618897910567048e-05, 'epoch': 0.58} {'loss': 0.7454, 'learning_rate': 1.6188721977076605e-05, 'epoch': 0.58} {'loss': 0.8982, 'learning_rate': 1.6188464841850953e-05, 'epoch': 0.58} {'loss': 0.8348, 'learning_rate': 1.6188207699993802e-05, 'epoch': 0.58} {'loss': 0.7164, 'learning_rate': 1.618795055150543e-05, 'epoch': 0.58} {'loss': 0.7116, 'learning_rate': 1.6187693396386112e-05, 'epoch': 0.58} {'loss': 0.7568, 'learning_rate': 1.6187436234636118e-05, 'epoch': 0.58} {'loss': 0.7113, 'learning_rate': 1.6187179066255726e-05, 'epoch': 0.58} {'loss': 0.7809, 'learning_rate': 1.6186921891245218e-05, 'epoch': 0.58} {'loss': 0.7904, 'learning_rate': 1.6186664709604864e-05, 'epoch': 0.58} {'loss': 0.6433, 'learning_rate': 1.618640752133494e-05, 'epoch': 0.58} {'loss': 0.7411, 'learning_rate': 1.618615032643572e-05, 'epoch': 0.58} {'loss': 0.7845, 'learning_rate': 1.6185893124907484e-05, 'epoch': 0.58} {'loss': 0.7033, 'learning_rate': 1.6185635916750503e-05, 'epoch': 0.58} {'loss': 0.8339, 'learning_rate': 1.6185378701965056e-05, 'epoch': 0.58} {'loss': 0.9085, 'learning_rate': 1.6185121480551416e-05, 'epoch': 0.58} {'loss': 0.9465, 'learning_rate': 1.6184864252509866e-05, 'epoch': 0.58} {'loss': 0.8898, 'learning_rate': 1.618460701784067e-05, 'epoch': 0.58} {'loss': 0.8797, 'learning_rate': 1.618434977654411e-05, 'epoch': 0.58} {'loss': 0.9765, 'learning_rate': 1.618409252862046e-05, 'epoch': 0.58} {'loss': 0.9409, 'learning_rate': 1.618383527407e-05, 'epoch': 0.58} {'loss': 0.7707, 'learning_rate': 1.6183578012893e-05, 'epoch': 0.58} {'loss': 0.7792, 'learning_rate': 1.618332074508974e-05, 'epoch': 0.58} {'loss': 0.8151, 'learning_rate': 1.6183063470660494e-05, 'epoch': 0.58} {'loss': 0.9147, 'learning_rate': 1.6182806189605537e-05, 'epoch': 0.58} {'loss': 0.9035, 'learning_rate': 1.6182548901925142e-05, 'epoch': 0.58} {'loss': 0.7665, 'learning_rate': 1.6182291607619587e-05, 'epoch': 0.58} {'loss': 0.9022, 'learning_rate': 1.618203430668915e-05, 'epoch': 0.58} {'loss': 0.8493, 'learning_rate': 1.618177699913411e-05, 'epoch': 0.58} {'loss': 1.0077, 'learning_rate': 1.6181519684954737e-05, 'epoch': 0.58} {'loss': 0.7066, 'learning_rate': 1.6181262364151305e-05, 'epoch': 0.58} {'loss': 0.7569, 'learning_rate': 1.6181005036724093e-05, 'epoch': 0.58} {'loss': 0.9272, 'learning_rate': 1.6180747702673377e-05, 'epoch': 0.58} {'loss': 0.917, 'learning_rate': 1.618049036199943e-05, 'epoch': 0.58} {'loss': 0.8911, 'learning_rate': 1.6180233014702532e-05, 'epoch': 0.58} {'loss': 0.8091, 'learning_rate': 1.6179975660782954e-05, 'epoch': 0.58} {'loss': 0.7293, 'learning_rate': 1.617971830024098e-05, 'epoch': 0.58} {'loss': 0.8501, 'learning_rate': 1.6179460933076875e-05, 'epoch': 0.58} {'loss': 0.9173, 'learning_rate': 1.617920355929092e-05, 'epoch': 0.58} {'loss': 0.8481, 'learning_rate': 1.617894617888339e-05, 'epoch': 0.58} {'loss': 0.6478, 'learning_rate': 1.6178688791854563e-05, 'epoch': 0.58} {'loss': 0.6226, 'learning_rate': 1.6178431398204716e-05, 'epoch': 0.58} {'loss': 0.8364, 'learning_rate': 1.6178173997934116e-05, 'epoch': 0.58} {'loss': 0.6904, 'learning_rate': 1.617791659104305e-05, 'epoch': 0.58} {'loss': 0.7715, 'learning_rate': 1.6177659177531787e-05, 'epoch': 0.58} {'loss': 0.8839, 'learning_rate': 1.6177401757400603e-05, 'epoch': 0.58} {'loss': 0.899, 'learning_rate': 1.6177144330649782e-05, 'epoch': 0.58} {'loss': 0.8189, 'learning_rate': 1.6176886897279588e-05, 'epoch': 0.58} {'loss': 0.9237, 'learning_rate': 1.61766294572903e-05, 'epoch': 0.58} {'loss': 0.8728, 'learning_rate': 1.6176372010682197e-05, 'epoch': 0.58} {'loss': 0.9444, 'learning_rate': 1.6176114557455558e-05, 'epoch': 0.58} {'loss': 0.8475, 'learning_rate': 1.617585709761065e-05, 'epoch': 0.58} {'loss': 0.9245, 'learning_rate': 1.6175599631147758e-05, 'epoch': 0.58} {'loss': 1.0785, 'learning_rate': 1.6175342158067152e-05, 'epoch': 0.58} {'loss': 0.8078, 'learning_rate': 1.617508467836911e-05, 'epoch': 0.58} {'loss': 1.0007, 'learning_rate': 1.617482719205391e-05, 'epoch': 0.58} {'loss': 0.9583, 'learning_rate': 1.617456969912182e-05, 'epoch': 0.58} {'loss': 0.8731, 'learning_rate': 1.6174312199573124e-05, 'epoch': 0.58} {'loss': 0.9606, 'learning_rate': 1.6174054693408092e-05, 'epoch': 0.58} {'loss': 0.8055, 'learning_rate': 1.6173797180627007e-05, 'epoch': 0.58} {'loss': 0.7397, 'learning_rate': 1.617353966123014e-05, 'epoch': 0.58} {'loss': 0.7056, 'learning_rate': 1.617328213521777e-05, 'epoch': 0.58} {'loss': 0.7247, 'learning_rate': 1.6173024602590167e-05, 'epoch': 0.58} {'loss': 0.9261, 'learning_rate': 1.6172767063347614e-05, 'epoch': 0.58} {'loss': 0.7314, 'learning_rate': 1.617250951749038e-05, 'epoch': 0.58} {'loss': 0.9455, 'learning_rate': 1.6172251965018752e-05, 'epoch': 0.58} {'loss': 0.7578, 'learning_rate': 1.6171994405932995e-05, 'epoch': 0.58} {'loss': 0.7924, 'learning_rate': 1.617173684023339e-05, 'epoch': 0.58} {'loss': 0.9258, 'learning_rate': 1.617147926792021e-05, 'epoch': 0.58} {'loss': 0.9128, 'learning_rate': 1.6171221688993732e-05, 'epoch': 0.58} {'loss': 0.7822, 'learning_rate': 1.6170964103454236e-05, 'epoch': 0.58} {'loss': 0.8529, 'learning_rate': 1.6170706511301993e-05, 'epoch': 0.58} {'loss': 0.7552, 'learning_rate': 1.6170448912537283e-05, 'epoch': 0.58} {'loss': 0.793, 'learning_rate': 1.6170191307160376e-05, 'epoch': 0.58} {'loss': 0.8685, 'learning_rate': 1.6169933695171557e-05, 'epoch': 0.58} {'loss': 0.8879, 'learning_rate': 1.6169676076571094e-05, 'epoch': 0.58} {'loss': 0.8443, 'learning_rate': 1.616941845135927e-05, 'epoch': 0.58} {'loss': 0.6995, 'learning_rate': 1.6169160819536355e-05, 'epoch': 0.58} {'loss': 0.9213, 'learning_rate': 1.6168903181102626e-05, 'epoch': 0.58} {'loss': 0.985, 'learning_rate': 1.616864553605836e-05, 'epoch': 0.58} {'loss': 0.8982, 'learning_rate': 1.6168387884403835e-05, 'epoch': 0.58} {'loss': 0.898, 'learning_rate': 1.6168130226139325e-05, 'epoch': 0.58} {'loss': 0.8332, 'learning_rate': 1.6167872561265107e-05, 'epoch': 0.58} {'loss': 1.0019, 'learning_rate': 1.616761488978146e-05, 'epoch': 0.58} {'loss': 0.7521, 'learning_rate': 1.6167357211688654e-05, 'epoch': 0.58} {'loss': 0.7558, 'learning_rate': 1.6167099526986966e-05, 'epoch': 0.58} {'loss': 0.802, 'learning_rate': 1.616684183567668e-05, 'epoch': 0.58} {'loss': 1.0314, 'learning_rate': 1.6166584137758062e-05, 'epoch': 0.58} {'loss': 0.7354, 'learning_rate': 1.6166326433231395e-05, 'epoch': 0.58} {'loss': 0.9307, 'learning_rate': 1.616606872209695e-05, 'epoch': 0.58} {'loss': 0.9422, 'learning_rate': 1.6165811004355007e-05, 'epoch': 0.58} {'loss': 0.959, 'learning_rate': 1.616555328000584e-05, 'epoch': 0.58} {'loss': 0.8047, 'learning_rate': 1.6165295549049727e-05, 'epoch': 0.58} {'loss': 0.9059, 'learning_rate': 1.6165037811486945e-05, 'epoch': 0.58} {'loss': 0.7594, 'learning_rate': 1.6164780067317764e-05, 'epoch': 0.58} {'loss': 0.8334, 'learning_rate': 1.616452231654247e-05, 'epoch': 0.58} {'loss': 0.9249, 'learning_rate': 1.616426455916133e-05, 'epoch': 0.58} {'loss': 0.7987, 'learning_rate': 1.616400679517463e-05, 'epoch': 0.58} {'loss': 0.8066, 'learning_rate': 1.6163749024582634e-05, 'epoch': 0.58} {'loss': 0.9392, 'learning_rate': 1.616349124738563e-05, 'epoch': 0.58} {'loss': 0.9285, 'learning_rate': 1.616323346358388e-05, 'epoch': 0.58} {'loss': 0.8727, 'learning_rate': 1.616297567317768e-05, 'epoch': 0.58} {'loss': 0.9737, 'learning_rate': 1.616271787616729e-05, 'epoch': 0.58} {'loss': 0.8392, 'learning_rate': 1.6162460072552994e-05, 'epoch': 0.58} {'loss': 0.8171, 'learning_rate': 1.616220226233506e-05, 'epoch': 0.58} {'loss': 0.7629, 'learning_rate': 1.6161944445513776e-05, 'epoch': 0.58} {'loss': 0.78, 'learning_rate': 1.616168662208941e-05, 'epoch': 0.58} {'loss': 0.9701, 'learning_rate': 1.6161428792062238e-05, 'epoch': 0.58} {'loss': 0.7998, 'learning_rate': 1.6161170955432543e-05, 'epoch': 0.58} {'loss': 0.9689, 'learning_rate': 1.61609131122006e-05, 'epoch': 0.58} {'loss': 0.8777, 'learning_rate': 1.6160655262366676e-05, 'epoch': 0.58} {'loss': 0.7624, 'learning_rate': 1.6160397405931054e-05, 'epoch': 0.58} {'loss': 0.6839, 'learning_rate': 1.6160139542894015e-05, 'epoch': 0.58} {'loss': 0.6745, 'learning_rate': 1.6159881673255826e-05, 'epoch': 0.58} {'loss': 1.0431, 'learning_rate': 1.615962379701677e-05, 'epoch': 0.58} {'loss': 0.7485, 'learning_rate': 1.6159365914177124e-05, 'epoch': 0.58} {'loss': 0.8836, 'learning_rate': 1.6159108024737158e-05, 'epoch': 0.58} {'loss': 0.79, 'learning_rate': 1.615885012869715e-05, 'epoch': 0.58} {'loss': 0.6753, 'learning_rate': 1.6158592226057382e-05, 'epoch': 0.58} {'loss': 1.0018, 'learning_rate': 1.6158334316818126e-05, 'epoch': 0.58} {'loss': 0.7402, 'learning_rate': 1.6158076400979656e-05, 'epoch': 0.58} {'loss': 0.8752, 'learning_rate': 1.6157818478542254e-05, 'epoch': 0.58} {'loss': 0.8512, 'learning_rate': 1.6157560549506194e-05, 'epoch': 0.58} {'loss': 0.882, 'learning_rate': 1.6157302613871754e-05, 'epoch': 0.58} {'loss': 0.8428, 'learning_rate': 1.6157044671639205e-05, 'epoch': 0.58} {'loss': 0.5314, 'learning_rate': 1.6156786722808826e-05, 'epoch': 0.58} {'loss': 0.8813, 'learning_rate': 1.6156528767380896e-05, 'epoch': 0.58} {'loss': 0.8926, 'learning_rate': 1.6156270805355688e-05, 'epoch': 0.58} {'loss': 0.7543, 'learning_rate': 1.6156012836733486e-05, 'epoch': 0.58} {'loss': 0.7327, 'learning_rate': 1.6155754861514554e-05, 'epoch': 0.58} {'loss': 0.9063, 'learning_rate': 1.615549687969918e-05, 'epoch': 0.58} {'loss': 1.079, 'learning_rate': 1.6155238891287632e-05, 'epoch': 0.58} {'loss': 0.7635, 'learning_rate': 1.615498089628019e-05, 'epoch': 0.58} {'loss': 0.8743, 'learning_rate': 1.6154722894677134e-05, 'epoch': 0.58} {'loss': 0.8967, 'learning_rate': 1.6154464886478737e-05, 'epoch': 0.58} {'loss': 0.8865, 'learning_rate': 1.615420687168527e-05, 'epoch': 0.58} {'loss': 0.8653, 'learning_rate': 1.615394885029702e-05, 'epoch': 0.58} {'loss': 1.0364, 'learning_rate': 1.6153690822314256e-05, 'epoch': 0.58} {'loss': 0.8496, 'learning_rate': 1.6153432787737257e-05, 'epoch': 0.58} {'loss': 0.7034, 'learning_rate': 1.6153174746566297e-05, 'epoch': 0.58} {'loss': 0.8153, 'learning_rate': 1.615291669880166e-05, 'epoch': 0.58} {'loss': 0.8771, 'learning_rate': 1.6152658644443616e-05, 'epoch': 0.58} {'loss': 0.9543, 'learning_rate': 1.615240058349244e-05, 'epoch': 0.58} {'loss': 1.0992, 'learning_rate': 1.6152142515948414e-05, 'epoch': 0.58} {'loss': 0.8125, 'learning_rate': 1.6151884441811813e-05, 'epoch': 0.58} {'loss': 0.9065, 'learning_rate': 1.615162636108291e-05, 'epoch': 0.58} {'loss': 0.9753, 'learning_rate': 1.6151368273761985e-05, 'epoch': 0.58} {'loss': 0.7569, 'learning_rate': 1.6151110179849316e-05, 'epoch': 0.58} {'loss': 0.7615, 'learning_rate': 1.6150852079345175e-05, 'epoch': 0.58} {'loss': 0.8198, 'learning_rate': 1.6150593972249836e-05, 'epoch': 0.58} {'loss': 0.8591, 'learning_rate': 1.615033585856359e-05, 'epoch': 0.58} {'loss': 0.7346, 'learning_rate': 1.6150077738286697e-05, 'epoch': 0.58} {'loss': 0.8438, 'learning_rate': 1.614981961141944e-05, 'epoch': 0.58} {'loss': 0.7696, 'learning_rate': 1.6149561477962103e-05, 'epoch': 0.58} {'loss': 0.913, 'learning_rate': 1.614930333791495e-05, 'epoch': 0.58} {'loss': 0.6158, 'learning_rate': 1.6149045191278268e-05, 'epoch': 0.58} {'loss': 0.8962, 'learning_rate': 1.6148787038052326e-05, 'epoch': 0.58} {'loss': 0.8188, 'learning_rate': 1.6148528878237403e-05, 'epoch': 0.58} {'loss': 0.8911, 'learning_rate': 1.614827071183378e-05, 'epoch': 0.58} {'loss': 0.7122, 'learning_rate': 1.6148012538841725e-05, 'epoch': 0.58} {'loss': 0.6805, 'learning_rate': 1.6147754359261526e-05, 'epoch': 0.58} {'loss': 0.7712, 'learning_rate': 1.614749617309345e-05, 'epoch': 0.58} {'loss': 0.8473, 'learning_rate': 1.6147237980337774e-05, 'epoch': 0.58} {'loss': 0.7208, 'learning_rate': 1.614697978099478e-05, 'epoch': 0.58} {'loss': 0.7917, 'learning_rate': 1.6146721575064742e-05, 'epoch': 0.58} {'loss': 0.8493, 'learning_rate': 1.614646336254794e-05, 'epoch': 0.58} {'loss': 0.8225, 'learning_rate': 1.6146205143444645e-05, 'epoch': 0.58} {'loss': 0.9957, 'learning_rate': 1.6145946917755136e-05, 'epoch': 0.58} {'loss': 0.9166, 'learning_rate': 1.6145688685479696e-05, 'epoch': 0.58} {'loss': 0.8986, 'learning_rate': 1.6145430446618587e-05, 'epoch': 0.58} {'loss': 0.8532, 'learning_rate': 1.61451722011721e-05, 'epoch': 0.58} {'loss': 0.9165, 'learning_rate': 1.6144913949140507e-05, 'epoch': 0.58} {'loss': 0.8757, 'learning_rate': 1.614465569052408e-05, 'epoch': 0.58} {'loss': 0.9148, 'learning_rate': 1.6144397425323103e-05, 'epoch': 0.58} {'loss': 0.9374, 'learning_rate': 1.6144139153537847e-05, 'epoch': 0.58} {'loss': 0.8527, 'learning_rate': 1.6143880875168595e-05, 'epoch': 0.58} {'loss': 1.0763, 'learning_rate': 1.6143622590215616e-05, 'epoch': 0.58} {'loss': 0.8073, 'learning_rate': 1.6143364298679193e-05, 'epoch': 0.58} {'loss': 0.7622, 'learning_rate': 1.6143106000559602e-05, 'epoch': 0.58} {'loss': 0.8281, 'learning_rate': 1.614284769585712e-05, 'epoch': 0.58} {'loss': 0.9576, 'learning_rate': 1.614258938457202e-05, 'epoch': 0.58} {'loss': 0.8904, 'learning_rate': 1.6142331066704578e-05, 'epoch': 0.58} {'loss': 0.9553, 'learning_rate': 1.6142072742255076e-05, 'epoch': 0.58} {'loss': 0.7539, 'learning_rate': 1.614181441122379e-05, 'epoch': 0.58} {'loss': 0.9169, 'learning_rate': 1.6141556073610993e-05, 'epoch': 0.58} {'loss': 0.8591, 'learning_rate': 1.6141297729416967e-05, 'epoch': 0.58} {'loss': 0.7863, 'learning_rate': 1.6141039378641986e-05, 'epoch': 0.58} {'loss': 0.7992, 'learning_rate': 1.6140781021286325e-05, 'epoch': 0.58} {'loss': 0.9071, 'learning_rate': 1.6140522657350265e-05, 'epoch': 0.58} {'loss': 0.7571, 'learning_rate': 1.614026428683408e-05, 'epoch': 0.58} {'loss': 0.9997, 'learning_rate': 1.6140005909738046e-05, 'epoch': 0.58} {'loss': 0.9507, 'learning_rate': 1.6139747526062442e-05, 'epoch': 0.58} {'loss': 0.8683, 'learning_rate': 1.613948913580755e-05, 'epoch': 0.58} {'loss': 0.8949, 'learning_rate': 1.6139230738973632e-05, 'epoch': 0.58} {'loss': 0.8875, 'learning_rate': 1.6138972335560978e-05, 'epoch': 0.58} {'loss': 0.962, 'learning_rate': 1.6138713925569863e-05, 'epoch': 0.58} {'loss': 0.841, 'learning_rate': 1.613845550900056e-05, 'epoch': 0.58} {'loss': 1.0275, 'learning_rate': 1.6138197085853355e-05, 'epoch': 0.58} {'loss': 0.7609, 'learning_rate': 1.6137938656128506e-05, 'epoch': 0.58} {'loss': 0.7829, 'learning_rate': 1.613768021982631e-05, 'epoch': 0.58} {'loss': 1.0122, 'learning_rate': 1.6137421776947032e-05, 'epoch': 0.58} {'loss': 0.8267, 'learning_rate': 1.613716332749095e-05, 'epoch': 0.58} {'loss': 0.8677, 'learning_rate': 1.613690487145835e-05, 'epoch': 0.58} {'loss': 0.828, 'learning_rate': 1.61366464088495e-05, 'epoch': 0.58} {'loss': 0.9443, 'learning_rate': 1.6136387939664682e-05, 'epoch': 0.58} {'loss': 0.773, 'learning_rate': 1.6136129463904166e-05, 'epoch': 0.58} {'loss': 0.7391, 'learning_rate': 1.6135870981568234e-05, 'epoch': 0.58} {'loss': 0.8807, 'learning_rate': 1.6135612492657166e-05, 'epoch': 0.58} {'loss': 0.905, 'learning_rate': 1.613535399717123e-05, 'epoch': 0.58} {'loss': 0.8198, 'learning_rate': 1.613509549511071e-05, 'epoch': 0.58} {'loss': 0.8438, 'learning_rate': 1.6134836986475887e-05, 'epoch': 0.58} {'loss': 0.989, 'learning_rate': 1.6134578471267027e-05, 'epoch': 0.58} {'loss': 0.8859, 'learning_rate': 1.6134319949484412e-05, 'epoch': 0.58} {'loss': 0.825, 'learning_rate': 1.613406142112832e-05, 'epoch': 0.58} {'loss': 0.7418, 'learning_rate': 1.6133802886199033e-05, 'epoch': 0.58} {'loss': 0.863, 'learning_rate': 1.613354434469682e-05, 'epoch': 0.58} {'loss': 0.8157, 'learning_rate': 1.6133285796621957e-05, 'epoch': 0.58} {'loss': 1.0028, 'learning_rate': 1.6133027241974728e-05, 'epoch': 0.58} {'loss': 0.7965, 'learning_rate': 1.6132768680755404e-05, 'epoch': 0.58} {'loss': 0.7509, 'learning_rate': 1.6132510112964267e-05, 'epoch': 0.58} {'loss': 1.0791, 'learning_rate': 1.6132251538601594e-05, 'epoch': 0.58} {'loss': 0.8584, 'learning_rate': 1.6131992957667656e-05, 'epoch': 0.58} {'loss': 0.8499, 'learning_rate': 1.613173437016274e-05, 'epoch': 0.58} {'loss': 0.8726, 'learning_rate': 1.613147577608711e-05, 'epoch': 0.58} {'loss': 0.8487, 'learning_rate': 1.613121717544105e-05, 'epoch': 0.58} {'loss': 0.8847, 'learning_rate': 1.6130958568224843e-05, 'epoch': 0.58} {'loss': 0.8191, 'learning_rate': 1.6130699954438756e-05, 'epoch': 0.58} {'loss': 0.9043, 'learning_rate': 1.6130441334083072e-05, 'epoch': 0.58} {'loss': 0.9264, 'learning_rate': 1.6130182707158068e-05, 'epoch': 0.58} {'loss': 0.9169, 'learning_rate': 1.612992407366402e-05, 'epoch': 0.58} {'loss': 0.8783, 'learning_rate': 1.6129665433601207e-05, 'epoch': 0.58} {'loss': 0.925, 'learning_rate': 1.61294067869699e-05, 'epoch': 0.58} {'loss': 0.7712, 'learning_rate': 1.612914813377038e-05, 'epoch': 0.58} {'loss': 0.8013, 'learning_rate': 1.6128889474002928e-05, 'epoch': 0.58} {'loss': 0.7636, 'learning_rate': 1.6128630807667818e-05, 'epoch': 0.58} {'loss': 0.8378, 'learning_rate': 1.6128372134765323e-05, 'epoch': 0.58} {'loss': 0.8348, 'learning_rate': 1.6128113455295728e-05, 'epoch': 0.58} {'loss': 0.6553, 'learning_rate': 1.6127854769259306e-05, 'epoch': 0.58} {'loss': 0.807, 'learning_rate': 1.6127596076656333e-05, 'epoch': 0.58} {'loss': 0.9337, 'learning_rate': 1.612733737748709e-05, 'epoch': 0.58} {'loss': 0.6002, 'learning_rate': 1.612707867175185e-05, 'epoch': 0.58} {'loss': 0.8651, 'learning_rate': 1.6126819959450894e-05, 'epoch': 0.58} {'loss': 0.9162, 'learning_rate': 1.612656124058449e-05, 'epoch': 0.58} {'loss': 0.7895, 'learning_rate': 1.612630251515293e-05, 'epoch': 0.58} {'loss': 0.8043, 'learning_rate': 1.6126043783156484e-05, 'epoch': 0.58} {'loss': 0.8803, 'learning_rate': 1.6125785044595427e-05, 'epoch': 0.58} {'loss': 0.7387, 'learning_rate': 1.612552629947004e-05, 'epoch': 0.58} {'loss': 0.7504, 'learning_rate': 1.6125267547780597e-05, 'epoch': 0.58} {'loss': 0.7907, 'learning_rate': 1.612500878952738e-05, 'epoch': 0.58} {'loss': 0.8236, 'learning_rate': 1.612475002471066e-05, 'epoch': 0.58} {'loss': 0.8427, 'learning_rate': 1.612449125333072e-05, 'epoch': 0.58} {'loss': 0.818, 'learning_rate': 1.612423247538783e-05, 'epoch': 0.58} {'loss': 0.602, 'learning_rate': 1.6123973690882277e-05, 'epoch': 0.58} {'loss': 0.9206, 'learning_rate': 1.6123714899814333e-05, 'epoch': 0.58} {'loss': 0.7826, 'learning_rate': 1.6123456102184275e-05, 'epoch': 0.58} {'loss': 0.9358, 'learning_rate': 1.612319729799238e-05, 'epoch': 0.58} {'loss': 0.8313, 'learning_rate': 1.6122938487238927e-05, 'epoch': 0.58} {'loss': 0.924, 'learning_rate': 1.6122679669924192e-05, 'epoch': 0.58} {'loss': 0.9784, 'learning_rate': 1.6122420846048456e-05, 'epoch': 0.58} {'loss': 0.8761, 'learning_rate': 1.6122162015611992e-05, 'epoch': 0.58} {'loss': 0.7772, 'learning_rate': 1.6121903178615078e-05, 'epoch': 0.59} {'loss': 0.6016, 'learning_rate': 1.6121644335057992e-05, 'epoch': 0.59} {'loss': 0.9526, 'learning_rate': 1.6121385484941016e-05, 'epoch': 0.59} {'loss': 1.0493, 'learning_rate': 1.6121126628264417e-05, 'epoch': 0.59} {'loss': 0.8738, 'learning_rate': 1.6120867765028482e-05, 'epoch': 0.59} {'loss': 0.8, 'learning_rate': 1.6120608895233484e-05, 'epoch': 0.59} {'loss': 0.7473, 'learning_rate': 1.61203500188797e-05, 'epoch': 0.59} {'loss': 0.8098, 'learning_rate': 1.612009113596741e-05, 'epoch': 0.59} {'loss': 0.7374, 'learning_rate': 1.6119832246496886e-05, 'epoch': 0.59} {'loss': 0.965, 'learning_rate': 1.6119573350468413e-05, 'epoch': 0.59} {'loss': 1.0345, 'learning_rate': 1.6119314447882266e-05, 'epoch': 0.59} {'loss': 0.7508, 'learning_rate': 1.611905553873872e-05, 'epoch': 0.59} {'loss': 0.8317, 'learning_rate': 1.6118796623038054e-05, 'epoch': 0.59} {'loss': 1.0343, 'learning_rate': 1.611853770078054e-05, 'epoch': 0.59} {'loss': 0.9406, 'learning_rate': 1.611827877196647e-05, 'epoch': 0.59} {'loss': 0.7943, 'learning_rate': 1.6118019836596105e-05, 'epoch': 0.59} {'loss': 0.8145, 'learning_rate': 1.6117760894669735e-05, 'epoch': 0.59} {'loss': 0.9523, 'learning_rate': 1.6117501946187626e-05, 'epoch': 0.59} {'loss': 0.8552, 'learning_rate': 1.6117242991150064e-05, 'epoch': 0.59} {'loss': 0.8923, 'learning_rate': 1.6116984029557324e-05, 'epoch': 0.59} {'loss': 0.7789, 'learning_rate': 1.6116725061409685e-05, 'epoch': 0.59} {'loss': 0.7857, 'learning_rate': 1.6116466086707423e-05, 'epoch': 0.59} {'loss': 0.8653, 'learning_rate': 1.6116207105450814e-05, 'epoch': 0.59} {'loss': 0.9543, 'learning_rate': 1.6115948117640138e-05, 'epoch': 0.59} {'loss': 0.8074, 'learning_rate': 1.611568912327567e-05, 'epoch': 0.59} {'loss': 0.8774, 'learning_rate': 1.611543012235769e-05, 'epoch': 0.59} {'loss': 0.698, 'learning_rate': 1.6115171114886475e-05, 'epoch': 0.59} {'loss': 0.9191, 'learning_rate': 1.6114912100862305e-05, 'epoch': 0.59} {'loss': 0.7564, 'learning_rate': 1.611465308028545e-05, 'epoch': 0.59} {'loss': 0.6361, 'learning_rate': 1.6114394053156196e-05, 'epoch': 0.59} {'loss': 0.8465, 'learning_rate': 1.6114135019474813e-05, 'epoch': 0.59} {'loss': 0.8662, 'learning_rate': 1.6113875979241583e-05, 'epoch': 0.59} {'loss': 0.7797, 'learning_rate': 1.6113616932456787e-05, 'epoch': 0.59} {'loss': 0.881, 'learning_rate': 1.6113357879120696e-05, 'epoch': 0.59} {'loss': 0.9121, 'learning_rate': 1.611309881923359e-05, 'epoch': 0.59} {'loss': 0.8366, 'learning_rate': 1.6112839752795747e-05, 'epoch': 0.59} {'loss': 0.8854, 'learning_rate': 1.6112580679807445e-05, 'epoch': 0.59} {'loss': 0.97, 'learning_rate': 1.6112321600268962e-05, 'epoch': 0.59} {'loss': 0.8716, 'learning_rate': 1.6112062514180577e-05, 'epoch': 0.59} {'loss': 0.7093, 'learning_rate': 1.611180342154256e-05, 'epoch': 0.59} {'loss': 0.6631, 'learning_rate': 1.6111544322355197e-05, 'epoch': 0.59} {'loss': 0.9012, 'learning_rate': 1.611128521661876e-05, 'epoch': 0.59} {'loss': 0.7703, 'learning_rate': 1.6111026104333534e-05, 'epoch': 0.59} {'loss': 0.7489, 'learning_rate': 1.6110766985499787e-05, 'epoch': 0.59} {'loss': 0.985, 'learning_rate': 1.6110507860117804e-05, 'epoch': 0.59} {'loss': 0.9499, 'learning_rate': 1.6110248728187864e-05, 'epoch': 0.59} {'loss': 0.7735, 'learning_rate': 1.6109989589710236e-05, 'epoch': 0.59} {'loss': 0.88, 'learning_rate': 1.6109730444685204e-05, 'epoch': 0.59} {'loss': 0.6762, 'learning_rate': 1.6109471293113044e-05, 'epoch': 0.59} {'loss': 0.8238, 'learning_rate': 1.6109212134994034e-05, 'epoch': 0.59} {'loss': 1.0488, 'learning_rate': 1.6108952970328452e-05, 'epoch': 0.59} {'loss': 0.7814, 'learning_rate': 1.6108693799116576e-05, 'epoch': 0.59} {'loss': 0.9302, 'learning_rate': 1.6108434621358684e-05, 'epoch': 0.59} {'loss': 0.8814, 'learning_rate': 1.6108175437055053e-05, 'epoch': 0.59} {'loss': 0.7849, 'learning_rate': 1.6107916246205958e-05, 'epoch': 0.59} {'loss': 0.8205, 'learning_rate': 1.610765704881168e-05, 'epoch': 0.59} {'loss': 0.6481, 'learning_rate': 1.6107397844872498e-05, 'epoch': 0.59} {'loss': 0.6702, 'learning_rate': 1.6107138634388688e-05, 'epoch': 0.59} {'loss': 0.8509, 'learning_rate': 1.6106879417360525e-05, 'epoch': 0.59} {'loss': 0.7868, 'learning_rate': 1.6106620193788295e-05, 'epoch': 0.59} {'loss': 0.7991, 'learning_rate': 1.6106360963672267e-05, 'epoch': 0.59} {'loss': 0.8704, 'learning_rate': 1.610610172701272e-05, 'epoch': 0.59} {'loss': 1.1489, 'learning_rate': 1.6105842483809935e-05, 'epoch': 0.59} {'loss': 0.9303, 'learning_rate': 1.610558323406419e-05, 'epoch': 0.59} {'loss': 0.8384, 'learning_rate': 1.6105323977775762e-05, 'epoch': 0.59} {'loss': 0.7096, 'learning_rate': 1.6105064714944926e-05, 'epoch': 0.59} {'loss': 0.9785, 'learning_rate': 1.6104805445571964e-05, 'epoch': 0.59} {'loss': 0.9567, 'learning_rate': 1.6104546169657153e-05, 'epoch': 0.59} {'loss': 0.7902, 'learning_rate': 1.6104286887200767e-05, 'epoch': 0.59} {'loss': 0.9218, 'learning_rate': 1.6104027598203088e-05, 'epoch': 0.59} {'loss': 0.7657, 'learning_rate': 1.6103768302664393e-05, 'epoch': 0.59} {'loss': 0.8723, 'learning_rate': 1.6103509000584958e-05, 'epoch': 0.59} {'loss': 1.0578, 'learning_rate': 1.6103249691965063e-05, 'epoch': 0.59} {'loss': 0.7219, 'learning_rate': 1.6102990376804986e-05, 'epoch': 0.59} {'loss': 0.7459, 'learning_rate': 1.6102731055105005e-05, 'epoch': 0.59} {'loss': 0.875, 'learning_rate': 1.610247172686539e-05, 'epoch': 0.59} {'loss': 0.8441, 'learning_rate': 1.6102212392086434e-05, 'epoch': 0.59} {'loss': 0.9636, 'learning_rate': 1.6101953050768404e-05, 'epoch': 0.59} {'loss': 0.8494, 'learning_rate': 1.6101693702911578e-05, 'epoch': 0.59} {'loss': 0.706, 'learning_rate': 1.610143434851624e-05, 'epoch': 0.59} {'loss': 0.9152, 'learning_rate': 1.6101174987582662e-05, 'epoch': 0.59} {'loss': 1.0292, 'learning_rate': 1.6100915620111125e-05, 'epoch': 0.59} {'loss': 0.7586, 'learning_rate': 1.610065624610191e-05, 'epoch': 0.59} {'loss': 0.8049, 'learning_rate': 1.6100396865555286e-05, 'epoch': 0.59} {'loss': 0.6474, 'learning_rate': 1.6100137478471537e-05, 'epoch': 0.59} {'loss': 0.9198, 'learning_rate': 1.609987808485094e-05, 'epoch': 0.59} {'loss': 0.7679, 'learning_rate': 1.6099618684693777e-05, 'epoch': 0.59} {'loss': 0.7138, 'learning_rate': 1.6099359278000318e-05, 'epoch': 0.59} {'loss': 0.7433, 'learning_rate': 1.6099099864770848e-05, 'epoch': 0.59} {'loss': 0.754, 'learning_rate': 1.609884044500564e-05, 'epoch': 0.59} {'loss': 0.9255, 'learning_rate': 1.6098581018704974e-05, 'epoch': 0.59} {'loss': 0.9716, 'learning_rate': 1.6098321585869127e-05, 'epoch': 0.59} {'loss': 0.8754, 'learning_rate': 1.609806214649838e-05, 'epoch': 0.59} {'loss': 0.8577, 'learning_rate': 1.6097802700593005e-05, 'epoch': 0.59} {'loss': 0.6568, 'learning_rate': 1.609754324815329e-05, 'epoch': 0.59} {'loss': 0.8766, 'learning_rate': 1.6097283789179505e-05, 'epoch': 0.59} {'loss': 0.8978, 'learning_rate': 1.6097024323671927e-05, 'epoch': 0.59} {'loss': 0.8548, 'learning_rate': 1.609676485163084e-05, 'epoch': 0.59} {'loss': 0.9404, 'learning_rate': 1.609650537305652e-05, 'epoch': 0.59} {'loss': 0.8878, 'learning_rate': 1.6096245887949243e-05, 'epoch': 0.59} {'loss': 0.7731, 'learning_rate': 1.609598639630929e-05, 'epoch': 0.59} {'loss': 0.704, 'learning_rate': 1.6095726898136935e-05, 'epoch': 0.59} {'loss': 0.7942, 'learning_rate': 1.609546739343246e-05, 'epoch': 0.59} {'loss': 0.8353, 'learning_rate': 1.609520788219614e-05, 'epoch': 0.59} {'loss': 0.9896, 'learning_rate': 1.6094948364428257e-05, 'epoch': 0.59} {'loss': 0.8453, 'learning_rate': 1.6094688840129084e-05, 'epoch': 0.59} {'loss': 0.75, 'learning_rate': 1.60944293092989e-05, 'epoch': 0.59} {'loss': 0.8376, 'learning_rate': 1.6094169771937992e-05, 'epoch': 0.59} {'loss': 0.7853, 'learning_rate': 1.6093910228046625e-05, 'epoch': 0.59} {'loss': 0.7953, 'learning_rate': 1.6093650677625085e-05, 'epoch': 0.59} {'loss': 0.8918, 'learning_rate': 1.609339112067365e-05, 'epoch': 0.59} {'loss': 0.8951, 'learning_rate': 1.6093131557192593e-05, 'epoch': 0.59} {'loss': 0.9022, 'learning_rate': 1.60928719871822e-05, 'epoch': 0.59} {'loss': 0.8641, 'learning_rate': 1.609261241064274e-05, 'epoch': 0.59} {'loss': 0.8708, 'learning_rate': 1.60923528275745e-05, 'epoch': 0.59} {'loss': 0.8453, 'learning_rate': 1.6092093237977754e-05, 'epoch': 0.59} {'loss': 0.7668, 'learning_rate': 1.6091833641852776e-05, 'epoch': 0.59} {'loss': 0.88, 'learning_rate': 1.609157403919985e-05, 'epoch': 0.59} {'loss': 0.8618, 'learning_rate': 1.6091314430019255e-05, 'epoch': 0.59} {'loss': 1.0396, 'learning_rate': 1.6091054814311265e-05, 'epoch': 0.59} {'loss': 0.86, 'learning_rate': 1.609079519207616e-05, 'epoch': 0.59} {'loss': 0.8963, 'learning_rate': 1.6090535563314217e-05, 'epoch': 0.59} {'loss': 0.8022, 'learning_rate': 1.6090275928025718e-05, 'epoch': 0.59} {'loss': 0.9469, 'learning_rate': 1.609001628621094e-05, 'epoch': 0.59} {'loss': 0.895, 'learning_rate': 1.6089756637870154e-05, 'epoch': 0.59} {'loss': 0.8115, 'learning_rate': 1.608949698300365e-05, 'epoch': 0.59} {'loss': 0.7697, 'learning_rate': 1.6089237321611698e-05, 'epoch': 0.59} {'loss': 0.7587, 'learning_rate': 1.608897765369458e-05, 'epoch': 0.59} {'loss': 0.7839, 'learning_rate': 1.608871797925257e-05, 'epoch': 0.59} {'loss': 0.7219, 'learning_rate': 1.608845829828595e-05, 'epoch': 0.59} {'loss': 0.9886, 'learning_rate': 1.6088198610794998e-05, 'epoch': 0.59} {'loss': 0.8368, 'learning_rate': 1.608793891677999e-05, 'epoch': 0.59} {'loss': 0.9317, 'learning_rate': 1.608767921624121e-05, 'epoch': 0.59} {'loss': 0.8942, 'learning_rate': 1.608741950917893e-05, 'epoch': 0.59} {'loss': 0.8206, 'learning_rate': 1.608715979559343e-05, 'epoch': 0.59} {'loss': 1.0599, 'learning_rate': 1.608690007548499e-05, 'epoch': 0.59} {'loss': 0.7541, 'learning_rate': 1.608664034885389e-05, 'epoch': 0.59} {'loss': 1.0407, 'learning_rate': 1.60863806157004e-05, 'epoch': 0.59} {'loss': 0.6532, 'learning_rate': 1.6086120876024804e-05, 'epoch': 0.59} {'loss': 0.8595, 'learning_rate': 1.6085861129827384e-05, 'epoch': 0.59} {'loss': 0.9215, 'learning_rate': 1.6085601377108413e-05, 'epoch': 0.59} {'loss': 0.9183, 'learning_rate': 1.6085341617868172e-05, 'epoch': 0.59} {'loss': 0.7149, 'learning_rate': 1.6085081852106936e-05, 'epoch': 0.59} {'loss': 0.7747, 'learning_rate': 1.6084822079824987e-05, 'epoch': 0.59} {'loss': 0.8492, 'learning_rate': 1.60845623010226e-05, 'epoch': 0.59} {'loss': 0.8576, 'learning_rate': 1.6084302515700055e-05, 'epoch': 0.59} {'loss': 0.8068, 'learning_rate': 1.6084042723857635e-05, 'epoch': 0.59} {'loss': 0.9139, 'learning_rate': 1.6083782925495612e-05, 'epoch': 0.59} {'loss': 0.8966, 'learning_rate': 1.6083523120614265e-05, 'epoch': 0.59} {'loss': 0.86, 'learning_rate': 1.6083263309213875e-05, 'epoch': 0.59} {'loss': 0.8582, 'learning_rate': 1.608300349129472e-05, 'epoch': 0.59} {'loss': 0.8295, 'learning_rate': 1.6082743666857078e-05, 'epoch': 0.59} {'loss': 0.7635, 'learning_rate': 1.6082483835901227e-05, 'epoch': 0.59} {'loss': 0.8512, 'learning_rate': 1.6082223998427445e-05, 'epoch': 0.59} {'loss': 0.9683, 'learning_rate': 1.6081964154436008e-05, 'epoch': 0.59} {'loss': 0.852, 'learning_rate': 1.6081704303927202e-05, 'epoch': 0.59} {'loss': 0.797, 'learning_rate': 1.6081444446901297e-05, 'epoch': 0.59} {'loss': 0.6807, 'learning_rate': 1.608118458335858e-05, 'epoch': 0.59} {'loss': 0.8466, 'learning_rate': 1.6080924713299323e-05, 'epoch': 0.59} {'loss': 0.9408, 'learning_rate': 1.6080664836723806e-05, 'epoch': 0.59} {'loss': 0.7528, 'learning_rate': 1.6080404953632305e-05, 'epoch': 0.59} {'loss': 1.0369, 'learning_rate': 1.6080145064025105e-05, 'epoch': 0.59} {'loss': 0.8331, 'learning_rate': 1.607988516790248e-05, 'epoch': 0.59} {'loss': 0.8229, 'learning_rate': 1.6079625265264708e-05, 'epoch': 0.59} {'loss': 0.7524, 'learning_rate': 1.607936535611207e-05, 'epoch': 0.59} {'loss': 0.9424, 'learning_rate': 1.607910544044484e-05, 'epoch': 0.59} {'loss': 0.8956, 'learning_rate': 1.6078845518263305e-05, 'epoch': 0.59} {'loss': 0.8355, 'learning_rate': 1.6078585589567736e-05, 'epoch': 0.59} {'loss': 0.9281, 'learning_rate': 1.6078325654358417e-05, 'epoch': 0.59} {'loss': 0.8999, 'learning_rate': 1.607806571263562e-05, 'epoch': 0.59} {'loss': 0.8604, 'learning_rate': 1.607780576439963e-05, 'epoch': 0.59} {'loss': 0.9722, 'learning_rate': 1.607754580965072e-05, 'epoch': 0.59} {'loss': 0.9686, 'learning_rate': 1.6077285848389167e-05, 'epoch': 0.59} {'loss': 0.8802, 'learning_rate': 1.607702588061526e-05, 'epoch': 0.59} {'loss': 0.9155, 'learning_rate': 1.6076765906329268e-05, 'epoch': 0.59} {'loss': 0.9125, 'learning_rate': 1.6076505925531476e-05, 'epoch': 0.59} {'loss': 0.8166, 'learning_rate': 1.607624593822216e-05, 'epoch': 0.59} {'loss': 0.9203, 'learning_rate': 1.6075985944401592e-05, 'epoch': 0.59} {'loss': 0.7218, 'learning_rate': 1.6075725944070063e-05, 'epoch': 0.59} {'loss': 0.8977, 'learning_rate': 1.607546593722784e-05, 'epoch': 0.59} {'loss': 0.9871, 'learning_rate': 1.607520592387521e-05, 'epoch': 0.59} {'loss': 0.7223, 'learning_rate': 1.6074945904012448e-05, 'epoch': 0.59} {'loss': 1.0502, 'learning_rate': 1.607468587763983e-05, 'epoch': 0.59} {'loss': 0.8282, 'learning_rate': 1.6074425844757645e-05, 'epoch': 0.59} {'loss': 0.8473, 'learning_rate': 1.6074165805366164e-05, 'epoch': 0.59} {'loss': 0.9073, 'learning_rate': 1.6073905759465664e-05, 'epoch': 0.59} {'loss': 0.906, 'learning_rate': 1.607364570705642e-05, 'epoch': 0.59} {'loss': 0.8229, 'learning_rate': 1.6073385648138722e-05, 'epoch': 0.59} {'loss': 0.8928, 'learning_rate': 1.6073125582712842e-05, 'epoch': 0.59} {'loss': 0.5423, 'learning_rate': 1.6072865510779062e-05, 'epoch': 0.59} {'loss': 0.8275, 'learning_rate': 1.6072605432337654e-05, 'epoch': 0.59} {'loss': 0.8225, 'learning_rate': 1.60723453473889e-05, 'epoch': 0.59} {'loss': 0.9262, 'learning_rate': 1.607208525593309e-05, 'epoch': 0.59} {'loss': 0.7569, 'learning_rate': 1.6071825157970482e-05, 'epoch': 0.59} {'loss': 0.8143, 'learning_rate': 1.607156505350137e-05, 'epoch': 0.59} {'loss': 0.6339, 'learning_rate': 1.6071304942526026e-05, 'epoch': 0.59} {'loss': 0.7059, 'learning_rate': 1.6071044825044734e-05, 'epoch': 0.59} {'loss': 0.8892, 'learning_rate': 1.6070784701057767e-05, 'epoch': 0.59} {'loss': 0.8534, 'learning_rate': 1.607052457056541e-05, 'epoch': 0.59} {'loss': 0.9599, 'learning_rate': 1.607026443356793e-05, 'epoch': 0.59} {'loss': 0.9934, 'learning_rate': 1.607000429006562e-05, 'epoch': 0.59} {'loss': 0.7027, 'learning_rate': 1.6069744140058755e-05, 'epoch': 0.59} {'loss': 0.7208, 'learning_rate': 1.6069483983547603e-05, 'epoch': 0.59} {'loss': 0.7688, 'learning_rate': 1.606922382053246e-05, 'epoch': 0.59} {'loss': 0.8684, 'learning_rate': 1.606896365101359e-05, 'epoch': 0.59} {'loss': 0.8425, 'learning_rate': 1.606870347499128e-05, 'epoch': 0.59} {'loss': 0.7692, 'learning_rate': 1.6068443292465804e-05, 'epoch': 0.59} {'loss': 0.8244, 'learning_rate': 1.6068183103437448e-05, 'epoch': 0.59} {'loss': 0.9979, 'learning_rate': 1.606792290790648e-05, 'epoch': 0.59} {'loss': 0.8472, 'learning_rate': 1.6067662705873194e-05, 'epoch': 0.59} {'loss': 0.8181, 'learning_rate': 1.606740249733785e-05, 'epoch': 0.59} {'loss': 0.7092, 'learning_rate': 1.6067142282300742e-05, 'epoch': 0.59} {'loss': 0.7667, 'learning_rate': 1.606688206076214e-05, 'epoch': 0.59} {'loss': 0.8213, 'learning_rate': 1.606662183272233e-05, 'epoch': 0.59} {'loss': 0.6712, 'learning_rate': 1.6066361598181585e-05, 'epoch': 0.59} {'loss': 0.6007, 'learning_rate': 1.6066101357140188e-05, 'epoch': 0.59} {'loss': 1.0204, 'learning_rate': 1.6065841109598413e-05, 'epoch': 0.59} {'loss': 0.8422, 'learning_rate': 1.6065580855556544e-05, 'epoch': 0.59} {'loss': 0.9165, 'learning_rate': 1.6065320595014857e-05, 'epoch': 0.59} {'loss': 0.9822, 'learning_rate': 1.606506032797363e-05, 'epoch': 0.59} {'loss': 0.6823, 'learning_rate': 1.606480005443315e-05, 'epoch': 0.59} {'loss': 0.9011, 'learning_rate': 1.606453977439368e-05, 'epoch': 0.59} {'loss': 0.8545, 'learning_rate': 1.606427948785551e-05, 'epoch': 0.59} {'loss': 0.8818, 'learning_rate': 1.6064019194818922e-05, 'epoch': 0.59} {'loss': 0.8577, 'learning_rate': 1.6063758895284188e-05, 'epoch': 0.59} {'loss': 0.8795, 'learning_rate': 1.606349858925159e-05, 'epoch': 0.59} {'loss': 0.7826, 'learning_rate': 1.6063238276721405e-05, 'epoch': 0.59} {'loss': 0.8183, 'learning_rate': 1.606297795769391e-05, 'epoch': 0.59} {'loss': 0.9908, 'learning_rate': 1.606271763216939e-05, 'epoch': 0.59} {'loss': 0.9534, 'learning_rate': 1.6062457300148124e-05, 'epoch': 0.59} {'loss': 0.7001, 'learning_rate': 1.6062196961630382e-05, 'epoch': 0.59} {'loss': 0.7138, 'learning_rate': 1.6061936616616453e-05, 'epoch': 0.59} {'loss': 0.9271, 'learning_rate': 1.6061676265106608e-05, 'epoch': 0.59} {'loss': 0.9063, 'learning_rate': 1.6061415907101135e-05, 'epoch': 0.59} {'loss': 0.9307, 'learning_rate': 1.6061155542600305e-05, 'epoch': 0.59} {'loss': 0.7739, 'learning_rate': 1.60608951716044e-05, 'epoch': 0.59} {'loss': 0.7801, 'learning_rate': 1.6060634794113696e-05, 'epoch': 0.59} {'loss': 0.8527, 'learning_rate': 1.6060374410128476e-05, 'epoch': 0.59} {'loss': 0.8129, 'learning_rate': 1.606011401964902e-05, 'epoch': 0.59} {'loss': 0.8991, 'learning_rate': 1.6059853622675604e-05, 'epoch': 0.59} {'loss': 0.8395, 'learning_rate': 1.6059593219208507e-05, 'epoch': 0.59} {'loss': 0.843, 'learning_rate': 1.605933280924801e-05, 'epoch': 0.59} {'loss': 0.8636, 'learning_rate': 1.605907239279439e-05, 'epoch': 0.59} {'loss': 0.8392, 'learning_rate': 1.6058811969847927e-05, 'epoch': 0.59} {'loss': 0.5987, 'learning_rate': 1.60585515404089e-05, 'epoch': 0.59} {'loss': 0.8946, 'learning_rate': 1.605829110447759e-05, 'epoch': 0.59} {'loss': 0.8916, 'learning_rate': 1.6058030662054274e-05, 'epoch': 0.59} {'loss': 0.8675, 'learning_rate': 1.605777021313923e-05, 'epoch': 0.59} {'loss': 0.966, 'learning_rate': 1.6057509757732738e-05, 'epoch': 0.59} {'loss': 0.9349, 'learning_rate': 1.605724929583508e-05, 'epoch': 0.59} {'loss': 0.8556, 'learning_rate': 1.6056988827446533e-05, 'epoch': 0.59} {'loss': 0.8215, 'learning_rate': 1.6056728352567373e-05, 'epoch': 0.59} {'loss': 0.7443, 'learning_rate': 1.6056467871197883e-05, 'epoch': 0.59} {'loss': 0.9405, 'learning_rate': 1.605620738333834e-05, 'epoch': 0.59} {'loss': 0.8504, 'learning_rate': 1.6055946888989026e-05, 'epoch': 0.59} {'loss': 1.0022, 'learning_rate': 1.6055686388150217e-05, 'epoch': 0.59} {'loss': 0.7428, 'learning_rate': 1.6055425880822193e-05, 'epoch': 0.59} {'loss': 0.9717, 'learning_rate': 1.6055165367005237e-05, 'epoch': 0.59} {'loss': 0.7574, 'learning_rate': 1.605490484669962e-05, 'epoch': 0.59} {'loss': 0.8908, 'learning_rate': 1.605464431990563e-05, 'epoch': 0.59} {'loss': 0.8252, 'learning_rate': 1.605438378662354e-05, 'epoch': 0.59} {'loss': 0.8069, 'learning_rate': 1.6054123246853633e-05, 'epoch': 0.59} {'loss': 0.927, 'learning_rate': 1.6053862700596185e-05, 'epoch': 0.59} {'loss': 0.7774, 'learning_rate': 1.605360214785148e-05, 'epoch': 0.59} {'loss': 0.7367, 'learning_rate': 1.605334158861979e-05, 'epoch': 0.59} {'loss': 0.9715, 'learning_rate': 1.60530810229014e-05, 'epoch': 0.59} {'loss': 0.9137, 'learning_rate': 1.6052820450696583e-05, 'epoch': 0.59} {'loss': 0.8667, 'learning_rate': 1.6052559872005627e-05, 'epoch': 0.59} {'loss': 0.9354, 'learning_rate': 1.6052299286828808e-05, 'epoch': 0.59} {'loss': 0.8202, 'learning_rate': 1.60520386951664e-05, 'epoch': 0.59} {'loss': 0.836, 'learning_rate': 1.6051778097018687e-05, 'epoch': 0.59} {'loss': 0.7486, 'learning_rate': 1.605151749238595e-05, 'epoch': 0.59} {'loss': 0.7097, 'learning_rate': 1.6051256881268467e-05, 'epoch': 0.59} {'loss': 1.0052, 'learning_rate': 1.605099626366651e-05, 'epoch': 0.59} {'loss': 0.7684, 'learning_rate': 1.6050735639580373e-05, 'epoch': 0.59} {'loss': 0.7734, 'learning_rate': 1.605047500901032e-05, 'epoch': 0.59} {'loss': 0.8508, 'learning_rate': 1.605021437195664e-05, 'epoch': 0.59} {'loss': 0.9358, 'learning_rate': 1.604995372841961e-05, 'epoch': 0.59} {'loss': 0.7786, 'learning_rate': 1.6049693078399503e-05, 'epoch': 0.59} {'loss': 0.7957, 'learning_rate': 1.6049432421896608e-05, 'epoch': 0.59} {'loss': 0.9021, 'learning_rate': 1.60491717589112e-05, 'epoch': 0.59} {'loss': 0.7718, 'learning_rate': 1.6048911089443557e-05, 'epoch': 0.59} {'loss': 1.017, 'learning_rate': 1.6048650413493964e-05, 'epoch': 0.59} {'loss': 0.7478, 'learning_rate': 1.6048389731062692e-05, 'epoch': 0.59} {'loss': 0.925, 'learning_rate': 1.6048129042150025e-05, 'epoch': 0.59} {'loss': 0.7456, 'learning_rate': 1.6047868346756242e-05, 'epoch': 0.59} {'loss': 0.8236, 'learning_rate': 1.6047607644881624e-05, 'epoch': 0.59} {'loss': 0.8387, 'learning_rate': 1.6047346936526444e-05, 'epoch': 0.59} {'loss': 0.9859, 'learning_rate': 1.604708622169099e-05, 'epoch': 0.59} {'loss': 0.9927, 'learning_rate': 1.6046825500375537e-05, 'epoch': 0.59} {'loss': 0.939, 'learning_rate': 1.6046564772580365e-05, 'epoch': 0.59} {'loss': 0.8532, 'learning_rate': 1.604630403830575e-05, 'epoch': 0.59} {'loss': 0.801, 'learning_rate': 1.604604329755198e-05, 'epoch': 0.59} {'loss': 0.8667, 'learning_rate': 1.6045782550319327e-05, 'epoch': 0.59} {'loss': 0.9086, 'learning_rate': 1.6045521796608068e-05, 'epoch': 0.59} {'loss': 0.826, 'learning_rate': 1.604526103641849e-05, 'epoch': 0.59} {'loss': 0.6506, 'learning_rate': 1.604500026975087e-05, 'epoch': 0.59} {'loss': 0.8694, 'learning_rate': 1.6044739496605485e-05, 'epoch': 0.59} {'loss': 0.9795, 'learning_rate': 1.6044478716982617e-05, 'epoch': 0.59} {'loss': 0.8975, 'learning_rate': 1.6044217930882546e-05, 'epoch': 0.59} {'loss': 0.9058, 'learning_rate': 1.6043957138305545e-05, 'epoch': 0.59} {'loss': 1.025, 'learning_rate': 1.6043696339251904e-05, 'epoch': 0.59} {'loss': 0.9254, 'learning_rate': 1.6043435533721896e-05, 'epoch': 0.59} {'loss': 0.9546, 'learning_rate': 1.6043174721715796e-05, 'epoch': 0.59} {'loss': 0.8029, 'learning_rate': 1.6042913903233896e-05, 'epoch': 0.59} {'loss': 0.8843, 'learning_rate': 1.6042653078276466e-05, 'epoch': 0.59} {'loss': 0.8534, 'learning_rate': 1.6042392246843784e-05, 'epoch': 0.59} {'loss': 0.7699, 'learning_rate': 1.6042131408936138e-05, 'epoch': 0.59} {'loss': 0.7642, 'learning_rate': 1.60418705645538e-05, 'epoch': 0.59} {'loss': 0.9311, 'learning_rate': 1.6041609713697056e-05, 'epoch': 0.59} {'loss': 1.0286, 'learning_rate': 1.6041348856366176e-05, 'epoch': 0.59} {'loss': 0.8688, 'learning_rate': 1.604108799256145e-05, 'epoch': 0.59} {'loss': 0.9646, 'learning_rate': 1.6040827122283153e-05, 'epoch': 0.59} {'loss': 0.8724, 'learning_rate': 1.6040566245531562e-05, 'epoch': 0.59} {'loss': 1.1174, 'learning_rate': 1.604030536230696e-05, 'epoch': 0.59} {'loss': 0.8478, 'learning_rate': 1.604004447260963e-05, 'epoch': 0.59} {'loss': 0.8088, 'learning_rate': 1.603978357643984e-05, 'epoch': 0.59} {'loss': 0.9165, 'learning_rate': 1.6039522673797882e-05, 'epoch': 0.59} {'loss': 0.7128, 'learning_rate': 1.6039261764684025e-05, 'epoch': 0.59} {'loss': 0.6404, 'learning_rate': 1.603900084909856e-05, 'epoch': 0.59} {'loss': 0.7597, 'learning_rate': 1.6038739927041754e-05, 'epoch': 0.59} {'loss': 0.8354, 'learning_rate': 1.60384789985139e-05, 'epoch': 0.59} {'loss': 0.885, 'learning_rate': 1.6038218063515268e-05, 'epoch': 0.59} {'loss': 0.7882, 'learning_rate': 1.603795712204614e-05, 'epoch': 0.59} {'loss': 0.7902, 'learning_rate': 1.6037696174106795e-05, 'epoch': 0.59} {'loss': 0.8788, 'learning_rate': 1.6037435219697516e-05, 'epoch': 0.59} {'loss': 0.7689, 'learning_rate': 1.6037174258818576e-05, 'epoch': 0.59} {'loss': 0.7253, 'learning_rate': 1.6036913291470266e-05, 'epoch': 0.59} {'loss': 0.7746, 'learning_rate': 1.6036652317652853e-05, 'epoch': 0.59} {'loss': 0.8495, 'learning_rate': 1.6036391337366623e-05, 'epoch': 0.59} {'loss': 0.8934, 'learning_rate': 1.6036130350611856e-05, 'epoch': 0.59} {'loss': 0.7676, 'learning_rate': 1.603586935738883e-05, 'epoch': 0.59} {'loss': 0.8381, 'learning_rate': 1.6035608357697824e-05, 'epoch': 0.59} {'loss': 0.9219, 'learning_rate': 1.603534735153912e-05, 'epoch': 0.59} {'loss': 0.845, 'learning_rate': 1.6035086338912997e-05, 'epoch': 0.59} {'loss': 0.76, 'learning_rate': 1.6034825319819735e-05, 'epoch': 0.59} {'loss': 0.8589, 'learning_rate': 1.603456429425961e-05, 'epoch': 0.59} {'loss': 0.8393, 'learning_rate': 1.6034303262232908e-05, 'epoch': 0.59} {'loss': 0.8678, 'learning_rate': 1.60340422237399e-05, 'epoch': 0.59} {'loss': 0.7614, 'learning_rate': 1.603378117878088e-05, 'epoch': 0.59} {'loss': 0.8409, 'learning_rate': 1.6033520127356116e-05, 'epoch': 0.59} {'loss': 0.938, 'learning_rate': 1.6033259069465886e-05, 'epoch': 0.59} {'loss': 0.8844, 'learning_rate': 1.6032998005110477e-05, 'epoch': 0.59} {'loss': 0.7702, 'learning_rate': 1.6032736934290167e-05, 'epoch': 0.59} {'loss': 0.7764, 'learning_rate': 1.6032475857005233e-05, 'epoch': 0.59} {'loss': 0.7578, 'learning_rate': 1.6032214773255958e-05, 'epoch': 0.59} {'loss': 0.849, 'learning_rate': 1.603195368304262e-05, 'epoch': 0.59} {'loss': 0.6776, 'learning_rate': 1.60316925863655e-05, 'epoch': 0.59} {'loss': 0.8214, 'learning_rate': 1.6031431483224875e-05, 'epoch': 0.59} {'loss': 0.6814, 'learning_rate': 1.603117037362103e-05, 'epoch': 0.59} {'loss': 0.6832, 'learning_rate': 1.603090925755424e-05, 'epoch': 0.59} {'loss': 0.7339, 'learning_rate': 1.6030648135024787e-05, 'epoch': 0.59} {'loss': 0.8163, 'learning_rate': 1.6030387006032947e-05, 'epoch': 0.59} {'loss': 0.897, 'learning_rate': 1.603012587057901e-05, 'epoch': 0.59} {'loss': 0.6557, 'learning_rate': 1.602986472866324e-05, 'epoch': 0.59} {'loss': 0.723, 'learning_rate': 1.602960358028593e-05, 'epoch': 0.59} {'loss': 0.7733, 'learning_rate': 1.6029342425447357e-05, 'epoch': 0.59} {'loss': 0.9452, 'learning_rate': 1.6029081264147797e-05, 'epoch': 0.59} {'loss': 0.6978, 'learning_rate': 1.6028820096387534e-05, 'epoch': 0.59} {'loss': 0.6842, 'learning_rate': 1.6028558922166846e-05, 'epoch': 0.59} {'loss': 0.768, 'learning_rate': 1.602829774148601e-05, 'epoch': 0.59} {'loss': 0.7351, 'learning_rate': 1.6028036554345315e-05, 'epoch': 0.59} {'loss': 0.8274, 'learning_rate': 1.6027775360745028e-05, 'epoch': 0.59} {'loss': 0.727, 'learning_rate': 1.602751416068544e-05, 'epoch': 0.59} {'loss': 0.8194, 'learning_rate': 1.6027252954166827e-05, 'epoch': 0.59} {'loss': 0.7299, 'learning_rate': 1.6026991741189465e-05, 'epoch': 0.59} {'loss': 0.8235, 'learning_rate': 1.602673052175364e-05, 'epoch': 0.59} {'loss': 0.8359, 'learning_rate': 1.6026469295859628e-05, 'epoch': 0.59} {'loss': 0.8104, 'learning_rate': 1.6026208063507713e-05, 'epoch': 0.59} {'loss': 1.0077, 'learning_rate': 1.6025946824698167e-05, 'epoch': 0.59} {'loss': 0.934, 'learning_rate': 1.602568557943128e-05, 'epoch': 0.59} {'loss': 0.7824, 'learning_rate': 1.6025424327707323e-05, 'epoch': 0.59} {'loss': 0.8645, 'learning_rate': 1.6025163069526584e-05, 'epoch': 0.59} {'loss': 0.9865, 'learning_rate': 1.6024901804889337e-05, 'epoch': 0.59} {'loss': 0.8377, 'learning_rate': 1.6024640533795862e-05, 'epoch': 0.59} {'loss': 0.7636, 'learning_rate': 1.602437925624644e-05, 'epoch': 0.59} {'loss': 0.7135, 'learning_rate': 1.602411797224136e-05, 'epoch': 0.59} {'loss': 0.7402, 'learning_rate': 1.6023856681780885e-05, 'epoch': 0.59} {'loss': 0.7012, 'learning_rate': 1.602359538486531e-05, 'epoch': 0.59} {'loss': 0.9194, 'learning_rate': 1.6023334081494906e-05, 'epoch': 0.59} {'loss': 0.8041, 'learning_rate': 1.6023072771669955e-05, 'epoch': 0.59} {'loss': 0.7986, 'learning_rate': 1.602281145539074e-05, 'epoch': 0.59} {'loss': 0.8552, 'learning_rate': 1.6022550132657538e-05, 'epoch': 0.59} {'loss': 0.9784, 'learning_rate': 1.602228880347063e-05, 'epoch': 0.59} {'loss': 0.7793, 'learning_rate': 1.6022027467830297e-05, 'epoch': 0.59} {'loss': 0.9008, 'learning_rate': 1.6021766125736816e-05, 'epoch': 0.59} {'loss': 0.8878, 'learning_rate': 1.602150477719047e-05, 'epoch': 0.59} {'loss': 0.7986, 'learning_rate': 1.602124342219154e-05, 'epoch': 0.59} {'loss': 0.8643, 'learning_rate': 1.60209820607403e-05, 'epoch': 0.59} {'loss': 0.9974, 'learning_rate': 1.602072069283704e-05, 'epoch': 0.59} {'loss': 0.8684, 'learning_rate': 1.602045931848203e-05, 'epoch': 0.59} {'loss': 0.7764, 'learning_rate': 1.6020197937675557e-05, 'epoch': 0.59} {'loss': 0.777, 'learning_rate': 1.6019936550417897e-05, 'epoch': 0.59} {'loss': 0.6279, 'learning_rate': 1.6019675156709332e-05, 'epoch': 0.59} {'loss': 0.8621, 'learning_rate': 1.601941375655014e-05, 'epoch': 0.59} {'loss': 0.8997, 'learning_rate': 1.6019152349940603e-05, 'epoch': 0.59} {'loss': 0.7005, 'learning_rate': 1.6018890936881004e-05, 'epoch': 0.59} {'loss': 0.8311, 'learning_rate': 1.601862951737162e-05, 'epoch': 0.59} {'loss': 0.835, 'learning_rate': 1.601836809141273e-05, 'epoch': 0.59} {'loss': 0.8527, 'learning_rate': 1.6018106659004614e-05, 'epoch': 0.59} {'loss': 0.8931, 'learning_rate': 1.6017845220147553e-05, 'epoch': 0.59} {'loss': 0.6542, 'learning_rate': 1.601758377484183e-05, 'epoch': 0.59} {'loss': 0.6498, 'learning_rate': 1.6017322323087724e-05, 'epoch': 0.59} {'loss': 0.7863, 'learning_rate': 1.6017060864885515e-05, 'epoch': 0.59} {'loss': 1.0123, 'learning_rate': 1.6016799400235478e-05, 'epoch': 0.59} {'loss': 0.6614, 'learning_rate': 1.60165379291379e-05, 'epoch': 0.59} {'loss': 0.9323, 'learning_rate': 1.6016276451593057e-05, 'epoch': 0.59} {'loss': 0.8317, 'learning_rate': 1.601601496760123e-05, 'epoch': 0.59} {'loss': 0.8355, 'learning_rate': 1.60157534771627e-05, 'epoch': 0.59} {'loss': 0.7791, 'learning_rate': 1.601549198027775e-05, 'epoch': 0.59} {'loss': 1.0444, 'learning_rate': 1.6015230476946655e-05, 'epoch': 0.59} {'loss': 0.7623, 'learning_rate': 1.60149689671697e-05, 'epoch': 0.59} {'loss': 0.8797, 'learning_rate': 1.601470745094716e-05, 'epoch': 0.59} {'loss': 0.8228, 'learning_rate': 1.601444592827932e-05, 'epoch': 0.59} {'loss': 0.8104, 'learning_rate': 1.6014184399166458e-05, 'epoch': 0.59} {'loss': 0.9094, 'learning_rate': 1.6013922863608856e-05, 'epoch': 0.59} {'loss': 0.7847, 'learning_rate': 1.601366132160679e-05, 'epoch': 0.59} {'loss': 0.9379, 'learning_rate': 1.6013399773160546e-05, 'epoch': 0.59} {'loss': 0.9627, 'learning_rate': 1.60131382182704e-05, 'epoch': 0.59} {'loss': 0.8045, 'learning_rate': 1.6012876656936634e-05, 'epoch': 0.59} {'loss': 0.7441, 'learning_rate': 1.6012615089159526e-05, 'epoch': 0.59} {'loss': 0.8256, 'learning_rate': 1.6012353514939363e-05, 'epoch': 0.59} {'loss': 0.6786, 'learning_rate': 1.6012091934276413e-05, 'epoch': 0.59} {'loss': 0.6905, 'learning_rate': 1.6011830347170972e-05, 'epoch': 0.59} {'loss': 0.8137, 'learning_rate': 1.601156875362331e-05, 'epoch': 0.59} {'loss': 0.9667, 'learning_rate': 1.6011307153633704e-05, 'epoch': 0.59} {'loss': 0.8457, 'learning_rate': 1.6011045547202443e-05, 'epoch': 0.59} {'loss': 0.9129, 'learning_rate': 1.601078393432981e-05, 'epoch': 0.59} {'loss': 0.865, 'learning_rate': 1.601052231501607e-05, 'epoch': 0.59} {'loss': 0.8602, 'learning_rate': 1.601026068926152e-05, 'epoch': 0.59} {'loss': 0.7813, 'learning_rate': 1.600999905706643e-05, 'epoch': 0.59} {'loss': 0.7241, 'learning_rate': 1.6009737418431082e-05, 'epoch': 0.59} {'loss': 0.6972, 'learning_rate': 1.600947577335576e-05, 'epoch': 0.59} {'loss': 0.8005, 'learning_rate': 1.6009214121840747e-05, 'epoch': 0.59} {'loss': 0.8459, 'learning_rate': 1.6008952463886312e-05, 'epoch': 0.59} {'loss': 0.8016, 'learning_rate': 1.6008690799492743e-05, 'epoch': 0.59} {'loss': 0.8805, 'learning_rate': 1.600842912866032e-05, 'epoch': 0.59} {'loss': 0.971, 'learning_rate': 1.6008167451389326e-05, 'epoch': 0.59} {'loss': 0.8659, 'learning_rate': 1.6007905767680038e-05, 'epoch': 0.59} {'loss': 0.7552, 'learning_rate': 1.600764407753273e-05, 'epoch': 0.59} {'loss': 0.7982, 'learning_rate': 1.6007382380947697e-05, 'epoch': 0.59} {'loss': 0.7667, 'learning_rate': 1.6007120677925207e-05, 'epoch': 0.59} {'loss': 0.8911, 'learning_rate': 1.6006858968465545e-05, 'epoch': 0.59} {'loss': 0.8652, 'learning_rate': 1.6006597252568994e-05, 'epoch': 0.59} {'loss': 0.7795, 'learning_rate': 1.6006335530235834e-05, 'epoch': 0.59} {'loss': 0.8637, 'learning_rate': 1.6006073801466334e-05, 'epoch': 0.59} {'loss': 1.023, 'learning_rate': 1.600581206626079e-05, 'epoch': 0.59} {'loss': 0.8116, 'learning_rate': 1.600555032461948e-05, 'epoch': 0.59} {'loss': 0.7138, 'learning_rate': 1.6005288576542677e-05, 'epoch': 0.59} {'loss': 0.9498, 'learning_rate': 1.6005026822030664e-05, 'epoch': 0.59} {'loss': 0.7784, 'learning_rate': 1.6004765061083724e-05, 'epoch': 0.59} {'loss': 0.9266, 'learning_rate': 1.600450329370214e-05, 'epoch': 0.59} {'loss': 0.9517, 'learning_rate': 1.600424151988618e-05, 'epoch': 0.59} {'loss': 0.8715, 'learning_rate': 1.600397973963614e-05, 'epoch': 0.59} {'loss': 0.9205, 'learning_rate': 1.6003717952952293e-05, 'epoch': 0.59} {'loss': 1.0242, 'learning_rate': 1.600345615983492e-05, 'epoch': 0.59} {'loss': 0.8831, 'learning_rate': 1.6003194360284302e-05, 'epoch': 0.59} {'loss': 0.912, 'learning_rate': 1.6002932554300715e-05, 'epoch': 0.59} {'loss': 0.7271, 'learning_rate': 1.600267074188445e-05, 'epoch': 0.59} {'loss': 0.9339, 'learning_rate': 1.600240892303578e-05, 'epoch': 0.59} {'loss': 0.8076, 'learning_rate': 1.6002147097754987e-05, 'epoch': 0.59} {'loss': 0.712, 'learning_rate': 1.600188526604235e-05, 'epoch': 0.59} {'loss': 0.7407, 'learning_rate': 1.6001623427898154e-05, 'epoch': 0.59} {'loss': 0.6142, 'learning_rate': 1.6001361583322675e-05, 'epoch': 0.59} {'loss': 0.7336, 'learning_rate': 1.6001099732316194e-05, 'epoch': 0.59} {'loss': 0.7882, 'learning_rate': 1.6000837874878995e-05, 'epoch': 0.59} {'loss': 0.9435, 'learning_rate': 1.600057601101136e-05, 'epoch': 0.59} {'loss': 0.9361, 'learning_rate': 1.600031414071356e-05, 'epoch': 0.59} {'loss': 0.6957, 'learning_rate': 1.6000052263985883e-05, 'epoch': 0.59} {'loss': 0.6978, 'learning_rate': 1.599979038082861e-05, 'epoch': 0.59} {'loss': 0.7115, 'learning_rate': 1.599952849124202e-05, 'epoch': 0.59} {'loss': 0.7916, 'learning_rate': 1.599926659522639e-05, 'epoch': 0.59} {'loss': 0.8003, 'learning_rate': 1.599900469278201e-05, 'epoch': 0.59} {'loss': 0.9947, 'learning_rate': 1.5998742783909157e-05, 'epoch': 0.59} {'loss': 0.7492, 'learning_rate': 1.5998480868608104e-05, 'epoch': 0.59} {'loss': 0.8609, 'learning_rate': 1.599821894687914e-05, 'epoch': 0.59} {'loss': 0.9222, 'learning_rate': 1.599795701872254e-05, 'epoch': 0.59} {'loss': 0.724, 'learning_rate': 1.599769508413859e-05, 'epoch': 0.59} {'loss': 0.8713, 'learning_rate': 1.599743314312757e-05, 'epoch': 0.59} {'loss': 0.8211, 'learning_rate': 1.5997171195689758e-05, 'epoch': 0.59} {'loss': 0.7403, 'learning_rate': 1.5996909241825434e-05, 'epoch': 0.59} {'loss': 0.795, 'learning_rate': 1.599664728153488e-05, 'epoch': 0.59} {'loss': 0.8036, 'learning_rate': 1.599638531481838e-05, 'epoch': 0.6} {'loss': 0.742, 'learning_rate': 1.599612334167621e-05, 'epoch': 0.6} {'loss': 0.8712, 'learning_rate': 1.5995861362108652e-05, 'epoch': 0.6} {'loss': 0.9954, 'learning_rate': 1.599559937611599e-05, 'epoch': 0.6} {'loss': 0.8738, 'learning_rate': 1.59953373836985e-05, 'epoch': 0.6} {'loss': 0.907, 'learning_rate': 1.5995075384856464e-05, 'epoch': 0.6} {'loss': 0.7755, 'learning_rate': 1.599481337959017e-05, 'epoch': 0.6} {'loss': 0.8996, 'learning_rate': 1.5994551367899887e-05, 'epoch': 0.6} {'loss': 0.788, 'learning_rate': 1.5994289349785898e-05, 'epoch': 0.6} {'loss': 0.9894, 'learning_rate': 1.5994027325248492e-05, 'epoch': 0.6} {'loss': 0.9032, 'learning_rate': 1.5993765294287944e-05, 'epoch': 0.6} {'loss': 0.7665, 'learning_rate': 1.5993503256904537e-05, 'epoch': 0.6} {'loss': 0.9029, 'learning_rate': 1.5993241213098548e-05, 'epoch': 0.6} {'loss': 0.7698, 'learning_rate': 1.599297916287026e-05, 'epoch': 0.6} {'loss': 0.8541, 'learning_rate': 1.5992717106219954e-05, 'epoch': 0.6} {'loss': 0.8819, 'learning_rate': 1.5992455043147913e-05, 'epoch': 0.6} {'loss': 0.8872, 'learning_rate': 1.5992192973654412e-05, 'epoch': 0.6} {'loss': 0.8829, 'learning_rate': 1.599193089773974e-05, 'epoch': 0.6} {'loss': 0.8773, 'learning_rate': 1.5991668815404165e-05, 'epoch': 0.6} {'loss': 0.957, 'learning_rate': 1.5991406726647984e-05, 'epoch': 0.6} {'loss': 0.8305, 'learning_rate': 1.5991144631471465e-05, 'epoch': 0.6} {'loss': 0.9208, 'learning_rate': 1.5990882529874898e-05, 'epoch': 0.6} {'loss': 0.7516, 'learning_rate': 1.599062042185856e-05, 'epoch': 0.6} {'loss': 0.9687, 'learning_rate': 1.5990358307422728e-05, 'epoch': 0.6} {'loss': 0.8599, 'learning_rate': 1.5990096186567687e-05, 'epoch': 0.6} {'loss': 0.9089, 'learning_rate': 1.598983405929372e-05, 'epoch': 0.6} {'loss': 0.921, 'learning_rate': 1.5989571925601102e-05, 'epoch': 0.6} {'loss': 0.8578, 'learning_rate': 1.598930978549012e-05, 'epoch': 0.6} {'loss': 0.7665, 'learning_rate': 1.598904763896105e-05, 'epoch': 0.6} {'loss': 0.7429, 'learning_rate': 1.5988785486014174e-05, 'epoch': 0.6} {'loss': 0.8091, 'learning_rate': 1.5988523326649773e-05, 'epoch': 0.6} {'loss': 0.8879, 'learning_rate': 1.598826116086813e-05, 'epoch': 0.6} {'loss': 1.0448, 'learning_rate': 1.5987998988669526e-05, 'epoch': 0.6} {'loss': 0.9132, 'learning_rate': 1.598773681005424e-05, 'epoch': 0.6} {'loss': 0.8675, 'learning_rate': 1.5987474625022557e-05, 'epoch': 0.6} {'loss': 0.7369, 'learning_rate': 1.598721243357475e-05, 'epoch': 0.6} {'loss': 0.7208, 'learning_rate': 1.5986950235711107e-05, 'epoch': 0.6} {'loss': 0.93, 'learning_rate': 1.5986688031431903e-05, 'epoch': 0.6} {'loss': 0.7144, 'learning_rate': 1.5986425820737424e-05, 'epoch': 0.6} {'loss': 0.8915, 'learning_rate': 1.5986163603627952e-05, 'epoch': 0.6} {'loss': 0.8977, 'learning_rate': 1.5985901380103763e-05, 'epoch': 0.6} {'loss': 0.903, 'learning_rate': 1.5985639150165143e-05, 'epoch': 0.6} {'loss': 0.9349, 'learning_rate': 1.5985376913812366e-05, 'epoch': 0.6} {'loss': 0.8034, 'learning_rate': 1.5985114671045724e-05, 'epoch': 0.6} {'loss': 0.9828, 'learning_rate': 1.5984852421865483e-05, 'epoch': 0.6} {'loss': 0.756, 'learning_rate': 1.598459016627194e-05, 'epoch': 0.6} {'loss': 0.8693, 'learning_rate': 1.5984327904265364e-05, 'epoch': 0.6} {'loss': 0.7803, 'learning_rate': 1.5984065635846044e-05, 'epoch': 0.6} {'loss': 0.6978, 'learning_rate': 1.598380336101425e-05, 'epoch': 0.6} {'loss': 0.8361, 'learning_rate': 1.598354107977028e-05, 'epoch': 0.6} {'loss': 0.7736, 'learning_rate': 1.59832787921144e-05, 'epoch': 0.6} {'loss': 0.8872, 'learning_rate': 1.5983016498046896e-05, 'epoch': 0.6} {'loss': 0.7357, 'learning_rate': 1.5982754197568056e-05, 'epoch': 0.6} {'loss': 0.7567, 'learning_rate': 1.598249189067815e-05, 'epoch': 0.6} {'loss': 0.8962, 'learning_rate': 1.5982229577377464e-05, 'epoch': 0.6} {'loss': 0.7642, 'learning_rate': 1.598196725766628e-05, 'epoch': 0.6} {'loss': 0.972, 'learning_rate': 1.5981704931544878e-05, 'epoch': 0.6} {'loss': 0.8822, 'learning_rate': 1.598144259901354e-05, 'epoch': 0.6} {'loss': 0.7126, 'learning_rate': 1.5981180260072546e-05, 'epoch': 0.6} {'loss': 0.8629, 'learning_rate': 1.5980917914722177e-05, 'epoch': 0.6} {'loss': 0.843, 'learning_rate': 1.5980655562962716e-05, 'epoch': 0.6} {'loss': 0.8495, 'learning_rate': 1.598039320479444e-05, 'epoch': 0.6} {'loss': 0.9163, 'learning_rate': 1.5980130840217637e-05, 'epoch': 0.6} {'loss': 0.7042, 'learning_rate': 1.597986846923258e-05, 'epoch': 0.6} {'loss': 0.8115, 'learning_rate': 1.597960609183956e-05, 'epoch': 0.6} {'loss': 0.8322, 'learning_rate': 1.5979343708038844e-05, 'epoch': 0.6} {'loss': 0.9006, 'learning_rate': 1.597908131783073e-05, 'epoch': 0.6} {'loss': 0.7934, 'learning_rate': 1.5978818921215486e-05, 'epoch': 0.6} {'loss': 0.8852, 'learning_rate': 1.5978556518193398e-05, 'epoch': 0.6} {'loss': 0.8022, 'learning_rate': 1.5978294108764746e-05, 'epoch': 0.6} {'loss': 0.9966, 'learning_rate': 1.5978031692929817e-05, 'epoch': 0.6} {'loss': 0.9306, 'learning_rate': 1.5977769270688884e-05, 'epoch': 0.6} {'loss': 0.8651, 'learning_rate': 1.5977506842042233e-05, 'epoch': 0.6} {'loss': 0.7969, 'learning_rate': 1.5977244406990143e-05, 'epoch': 0.6} {'loss': 0.9005, 'learning_rate': 1.5976981965532895e-05, 'epoch': 0.6} {'loss': 0.7607, 'learning_rate': 1.5976719517670773e-05, 'epoch': 0.6} {'loss': 0.8201, 'learning_rate': 1.5976457063404056e-05, 'epoch': 0.6} {'loss': 0.7945, 'learning_rate': 1.5976194602733028e-05, 'epoch': 0.6} {'loss': 0.888, 'learning_rate': 1.5975932135657966e-05, 'epoch': 0.6} {'loss': 0.7132, 'learning_rate': 1.5975669662179152e-05, 'epoch': 0.6} {'loss': 0.8611, 'learning_rate': 1.597540718229687e-05, 'epoch': 0.6} {'loss': 0.8769, 'learning_rate': 1.5975144696011404e-05, 'epoch': 0.6} {'loss': 0.8011, 'learning_rate': 1.5974882203323025e-05, 'epoch': 0.6} {'loss': 0.9438, 'learning_rate': 1.597461970423202e-05, 'epoch': 0.6} {'loss': 0.8685, 'learning_rate': 1.5974357198738676e-05, 'epoch': 0.6} {'loss': 0.894, 'learning_rate': 1.5974094686843266e-05, 'epoch': 0.6} {'loss': 0.8743, 'learning_rate': 1.5973832168546075e-05, 'epoch': 0.6} {'loss': 0.7471, 'learning_rate': 1.5973569643847383e-05, 'epoch': 0.6} {'loss': 0.882, 'learning_rate': 1.5973307112747472e-05, 'epoch': 0.6} {'loss': 0.9817, 'learning_rate': 1.5973044575246622e-05, 'epoch': 0.6} {'loss': 0.7852, 'learning_rate': 1.597278203134512e-05, 'epoch': 0.6} {'loss': 0.8325, 'learning_rate': 1.597251948104324e-05, 'epoch': 0.6} {'loss': 0.9088, 'learning_rate': 1.5972256924341267e-05, 'epoch': 0.6} {'loss': 1.0433, 'learning_rate': 1.597199436123948e-05, 'epoch': 0.6} {'loss': 0.7426, 'learning_rate': 1.5971731791738165e-05, 'epoch': 0.6} {'loss': 0.7205, 'learning_rate': 1.5971469215837598e-05, 'epoch': 0.6} {'loss': 0.8383, 'learning_rate': 1.5971206633538063e-05, 'epoch': 0.6} {'loss': 0.9095, 'learning_rate': 1.5970944044839844e-05, 'epoch': 0.6} {'loss': 0.8413, 'learning_rate': 1.5970681449743217e-05, 'epoch': 0.6} {'loss': 0.9843, 'learning_rate': 1.5970418848248465e-05, 'epoch': 0.6} {'loss': 0.8217, 'learning_rate': 1.5970156240355873e-05, 'epoch': 0.6} {'loss': 0.8406, 'learning_rate': 1.596989362606572e-05, 'epoch': 0.6} {'loss': 0.5943, 'learning_rate': 1.596963100537828e-05, 'epoch': 0.6} {'loss': 0.9567, 'learning_rate': 1.596936837829385e-05, 'epoch': 0.6} {'loss': 0.8469, 'learning_rate': 1.59691057448127e-05, 'epoch': 0.6} {'loss': 0.924, 'learning_rate': 1.5968843104935117e-05, 'epoch': 0.6} {'loss': 0.8859, 'learning_rate': 1.5968580458661375e-05, 'epoch': 0.6} {'loss': 0.8903, 'learning_rate': 1.5968317805991766e-05, 'epoch': 0.6} {'loss': 0.5624, 'learning_rate': 1.596805514692656e-05, 'epoch': 0.6} {'loss': 0.8868, 'learning_rate': 1.5967792481466048e-05, 'epoch': 0.6} {'loss': 0.7894, 'learning_rate': 1.596752980961051e-05, 'epoch': 0.6} {'loss': 0.8985, 'learning_rate': 1.596726713136022e-05, 'epoch': 0.6} {'loss': 0.7415, 'learning_rate': 1.5967004446715465e-05, 'epoch': 0.6} {'loss': 0.8413, 'learning_rate': 1.5966741755676527e-05, 'epoch': 0.6} {'loss': 1.0239, 'learning_rate': 1.5966479058243686e-05, 'epoch': 0.6} {'loss': 0.7143, 'learning_rate': 1.5966216354417227e-05, 'epoch': 0.6} {'loss': 0.8512, 'learning_rate': 1.5965953644197427e-05, 'epoch': 0.6} {'loss': 0.932, 'learning_rate': 1.596569092758457e-05, 'epoch': 0.6} {'loss': 0.7982, 'learning_rate': 1.5965428204578936e-05, 'epoch': 0.6} {'loss': 0.687, 'learning_rate': 1.5965165475180806e-05, 'epoch': 0.6} {'loss': 0.7624, 'learning_rate': 1.5964902739390465e-05, 'epoch': 0.6} {'loss': 0.9287, 'learning_rate': 1.5964639997208192e-05, 'epoch': 0.6} {'loss': 0.9393, 'learning_rate': 1.596437724863427e-05, 'epoch': 0.6} {'loss': 0.8684, 'learning_rate': 1.5964114493668976e-05, 'epoch': 0.6} {'loss': 0.8322, 'learning_rate': 1.5963851732312598e-05, 'epoch': 0.6} {'loss': 0.9391, 'learning_rate': 1.596358896456541e-05, 'epoch': 0.6} {'loss': 0.8674, 'learning_rate': 1.5963326190427702e-05, 'epoch': 0.6} {'loss': 1.042, 'learning_rate': 1.5963063409899753e-05, 'epoch': 0.6} {'loss': 0.752, 'learning_rate': 1.5962800622981842e-05, 'epoch': 0.6} {'loss': 0.937, 'learning_rate': 1.596253782967425e-05, 'epoch': 0.6} {'loss': 0.9008, 'learning_rate': 1.5962275029977265e-05, 'epoch': 0.6} {'loss': 0.7329, 'learning_rate': 1.596201222389116e-05, 'epoch': 0.6} {'loss': 0.9297, 'learning_rate': 1.5961749411416222e-05, 'epoch': 0.6} {'loss': 0.8012, 'learning_rate': 1.596148659255273e-05, 'epoch': 0.6} {'loss': 0.8355, 'learning_rate': 1.5961223767300972e-05, 'epoch': 0.6} {'loss': 0.9167, 'learning_rate': 1.5960960935661222e-05, 'epoch': 0.6} {'loss': 0.8874, 'learning_rate': 1.5960698097633763e-05, 'epoch': 0.6} {'loss': 0.7702, 'learning_rate': 1.5960435253218876e-05, 'epoch': 0.6} {'loss': 0.95, 'learning_rate': 1.5960172402416853e-05, 'epoch': 0.6} {'loss': 0.8366, 'learning_rate': 1.595990954522796e-05, 'epoch': 0.6} {'loss': 1.0908, 'learning_rate': 1.5959646681652486e-05, 'epoch': 0.6} {'loss': 0.7577, 'learning_rate': 1.5959383811690716e-05, 'epoch': 0.6} {'loss': 0.726, 'learning_rate': 1.5959120935342928e-05, 'epoch': 0.6} {'loss': 0.8033, 'learning_rate': 1.5958858052609402e-05, 'epoch': 0.6} {'loss': 0.8646, 'learning_rate': 1.5958595163490423e-05, 'epoch': 0.6} {'loss': 0.8296, 'learning_rate': 1.595833226798627e-05, 'epoch': 0.6} {'loss': 0.8459, 'learning_rate': 1.595806936609723e-05, 'epoch': 0.6} {'loss': 0.6909, 'learning_rate': 1.595780645782358e-05, 'epoch': 0.6} {'loss': 0.9083, 'learning_rate': 1.5957543543165595e-05, 'epoch': 0.6} {'loss': 0.8506, 'learning_rate': 1.5957280622123574e-05, 'epoch': 0.6} {'loss': 0.7758, 'learning_rate': 1.5957017694697785e-05, 'epoch': 0.6} {'loss': 0.8549, 'learning_rate': 1.5956754760888514e-05, 'epoch': 0.6} {'loss': 0.7476, 'learning_rate': 1.5956491820696044e-05, 'epoch': 0.6} {'loss': 0.9454, 'learning_rate': 1.5956228874120652e-05, 'epoch': 0.6} {'loss': 0.7944, 'learning_rate': 1.5955965921162627e-05, 'epoch': 0.6} {'loss': 0.9609, 'learning_rate': 1.5955702961822245e-05, 'epoch': 0.6} {'loss': 0.6966, 'learning_rate': 1.5955439996099792e-05, 'epoch': 0.6} {'loss': 1.0167, 'learning_rate': 1.595517702399555e-05, 'epoch': 0.6} {'loss': 1.026, 'learning_rate': 1.595491404550979e-05, 'epoch': 0.6} {'loss': 0.8062, 'learning_rate': 1.5954651060642806e-05, 'epoch': 0.6} {'loss': 1.0073, 'learning_rate': 1.595438806939488e-05, 'epoch': 0.6} {'loss': 0.859, 'learning_rate': 1.5954125071766285e-05, 'epoch': 0.6} {'loss': 0.7228, 'learning_rate': 1.5953862067757305e-05, 'epoch': 0.6} {'loss': 0.8171, 'learning_rate': 1.595359905736823e-05, 'epoch': 0.6} {'loss': 0.7431, 'learning_rate': 1.5953336040599333e-05, 'epoch': 0.6} {'loss': 1.012, 'learning_rate': 1.59530730174509e-05, 'epoch': 0.6} {'loss': 0.7461, 'learning_rate': 1.5952809987923216e-05, 'epoch': 0.6} {'loss': 0.8591, 'learning_rate': 1.5952546952016555e-05, 'epoch': 0.6} {'loss': 0.8562, 'learning_rate': 1.5952283909731203e-05, 'epoch': 0.6} {'loss': 0.8464, 'learning_rate': 1.595202086106744e-05, 'epoch': 0.6} {'loss': 0.7954, 'learning_rate': 1.595175780602555e-05, 'epoch': 0.6} {'loss': 0.951, 'learning_rate': 1.5951494744605815e-05, 'epoch': 0.6} {'loss': 0.8129, 'learning_rate': 1.595123167680852e-05, 'epoch': 0.6} {'loss': 0.7385, 'learning_rate': 1.595096860263394e-05, 'epoch': 0.6} {'loss': 0.8359, 'learning_rate': 1.595070552208236e-05, 'epoch': 0.6} {'loss': 0.7349, 'learning_rate': 1.595044243515406e-05, 'epoch': 0.6} {'loss': 0.6206, 'learning_rate': 1.5950179341849326e-05, 'epoch': 0.6} {'loss': 0.7453, 'learning_rate': 1.5949916242168436e-05, 'epoch': 0.6} {'loss': 0.9036, 'learning_rate': 1.5949653136111675e-05, 'epoch': 0.6} {'loss': 0.7252, 'learning_rate': 1.5949390023679324e-05, 'epoch': 0.6} {'loss': 0.6857, 'learning_rate': 1.5949126904871664e-05, 'epoch': 0.6} {'loss': 0.7201, 'learning_rate': 1.5948863779688977e-05, 'epoch': 0.6} {'loss': 0.8405, 'learning_rate': 1.5948600648131547e-05, 'epoch': 0.6} {'loss': 0.9564, 'learning_rate': 1.5948337510199653e-05, 'epoch': 0.6} {'loss': 0.8923, 'learning_rate': 1.594807436589358e-05, 'epoch': 0.6} {'loss': 0.7497, 'learning_rate': 1.594781121521361e-05, 'epoch': 0.6} {'loss': 1.0015, 'learning_rate': 1.594754805816002e-05, 'epoch': 0.6} {'loss': 0.8572, 'learning_rate': 1.5947284894733098e-05, 'epoch': 0.6} {'loss': 0.8949, 'learning_rate': 1.594702172493312e-05, 'epoch': 0.6} {'loss': 0.8818, 'learning_rate': 1.5946758548760374e-05, 'epoch': 0.6} {'loss': 0.7567, 'learning_rate': 1.594649536621514e-05, 'epoch': 0.6} {'loss': 0.914, 'learning_rate': 1.59462321772977e-05, 'epoch': 0.6} {'loss': 0.8711, 'learning_rate': 1.5945968982008334e-05, 'epoch': 0.6} {'loss': 0.8943, 'learning_rate': 1.5945705780347327e-05, 'epoch': 0.6} {'loss': 0.8749, 'learning_rate': 1.5945442572314958e-05, 'epoch': 0.6} {'loss': 0.9102, 'learning_rate': 1.5945179357911512e-05, 'epoch': 0.6} {'loss': 0.7653, 'learning_rate': 1.5944916137137268e-05, 'epoch': 0.6} {'loss': 0.8181, 'learning_rate': 1.5944652909992512e-05, 'epoch': 0.6} {'loss': 0.9917, 'learning_rate': 1.594438967647752e-05, 'epoch': 0.6} {'loss': 0.7719, 'learning_rate': 1.5944126436592582e-05, 'epoch': 0.6} {'loss': 0.8537, 'learning_rate': 1.5943863190337973e-05, 'epoch': 0.6} {'loss': 0.8422, 'learning_rate': 1.5943599937713982e-05, 'epoch': 0.6} {'loss': 0.773, 'learning_rate': 1.5943336678720882e-05, 'epoch': 0.6} {'loss': 0.8018, 'learning_rate': 1.5943073413358966e-05, 'epoch': 0.6} {'loss': 0.7088, 'learning_rate': 1.5942810141628506e-05, 'epoch': 0.6} {'loss': 0.7707, 'learning_rate': 1.5942546863529793e-05, 'epoch': 0.6} {'loss': 0.9178, 'learning_rate': 1.5942283579063102e-05, 'epoch': 0.6} {'loss': 0.8783, 'learning_rate': 1.5942020288228716e-05, 'epoch': 0.6} {'loss': 0.8443, 'learning_rate': 1.594175699102692e-05, 'epoch': 0.6} {'loss': 0.8056, 'learning_rate': 1.5941493687457995e-05, 'epoch': 0.6} {'loss': 0.712, 'learning_rate': 1.5941230377522227e-05, 'epoch': 0.6} {'loss': 0.7488, 'learning_rate': 1.594096706121989e-05, 'epoch': 0.6} {'loss': 0.8809, 'learning_rate': 1.5940703738551272e-05, 'epoch': 0.6} {'loss': 0.8142, 'learning_rate': 1.5940440409516652e-05, 'epoch': 0.6} {'loss': 0.8652, 'learning_rate': 1.5940177074116315e-05, 'epoch': 0.6} {'loss': 0.7573, 'learning_rate': 1.5939913732350546e-05, 'epoch': 0.6} {'loss': 0.7909, 'learning_rate': 1.593965038421962e-05, 'epoch': 0.6} {'loss': 0.6795, 'learning_rate': 1.5939387029723822e-05, 'epoch': 0.6} {'loss': 0.7507, 'learning_rate': 1.5939123668863437e-05, 'epoch': 0.6} {'loss': 0.8307, 'learning_rate': 1.5938860301638744e-05, 'epoch': 0.6} {'loss': 0.9043, 'learning_rate': 1.5938596928050025e-05, 'epoch': 0.6} {'loss': 0.7177, 'learning_rate': 1.593833354809756e-05, 'epoch': 0.6} {'loss': 0.8402, 'learning_rate': 1.5938070161781643e-05, 'epoch': 0.6} {'loss': 0.7838, 'learning_rate': 1.5937806769102543e-05, 'epoch': 0.6} {'loss': 0.8589, 'learning_rate': 1.593754337006055e-05, 'epoch': 0.6} {'loss': 0.8101, 'learning_rate': 1.5937279964655937e-05, 'epoch': 0.6} {'loss': 0.7894, 'learning_rate': 1.5937016552889e-05, 'epoch': 0.6} {'loss': 0.663, 'learning_rate': 1.593675313476001e-05, 'epoch': 0.6} {'loss': 0.8213, 'learning_rate': 1.593648971026925e-05, 'epoch': 0.6} {'loss': 0.7697, 'learning_rate': 1.5936226279417012e-05, 'epoch': 0.6} {'loss': 0.8138, 'learning_rate': 1.593596284220357e-05, 'epoch': 0.6} {'loss': 0.8251, 'learning_rate': 1.5935699398629207e-05, 'epoch': 0.6} {'loss': 0.8541, 'learning_rate': 1.5935435948694203e-05, 'epoch': 0.6} {'loss': 0.7717, 'learning_rate': 1.593517249239885e-05, 'epoch': 0.6} {'loss': 0.6819, 'learning_rate': 1.5934909029743423e-05, 'epoch': 0.6} {'loss': 0.7678, 'learning_rate': 1.5934645560728203e-05, 'epoch': 0.6} {'loss': 0.9007, 'learning_rate': 1.5934382085353476e-05, 'epoch': 0.6} {'loss': 0.905, 'learning_rate': 1.593411860361952e-05, 'epoch': 0.6} {'loss': 1.0047, 'learning_rate': 1.593385511552662e-05, 'epoch': 0.6} {'loss': 0.6821, 'learning_rate': 1.5933591621075062e-05, 'epoch': 0.6} {'loss': 0.807, 'learning_rate': 1.5933328120265125e-05, 'epoch': 0.6} {'loss': 0.8569, 'learning_rate': 1.5933064613097094e-05, 'epoch': 0.6} {'loss': 0.7861, 'learning_rate': 1.593280109957124e-05, 'epoch': 0.6} {'loss': 0.823, 'learning_rate': 1.5932537579687863e-05, 'epoch': 0.6} {'loss': 0.8835, 'learning_rate': 1.5932274053447232e-05, 'epoch': 0.6} {'loss': 0.6291, 'learning_rate': 1.5932010520849636e-05, 'epoch': 0.6} {'loss': 0.9721, 'learning_rate': 1.5931746981895352e-05, 'epoch': 0.6} {'loss': 0.9289, 'learning_rate': 1.593148343658467e-05, 'epoch': 0.6} {'loss': 0.7845, 'learning_rate': 1.5931219884917864e-05, 'epoch': 0.6} {'loss': 0.6632, 'learning_rate': 1.5930956326895226e-05, 'epoch': 0.6} {'loss': 0.7911, 'learning_rate': 1.5930692762517028e-05, 'epoch': 0.6} {'loss': 0.8214, 'learning_rate': 1.593042919178356e-05, 'epoch': 0.6} {'loss': 0.795, 'learning_rate': 1.59301656146951e-05, 'epoch': 0.6} {'loss': 0.8925, 'learning_rate': 1.592990203125193e-05, 'epoch': 0.6} {'loss': 0.888, 'learning_rate': 1.5929638441454342e-05, 'epoch': 0.6} {'loss': 0.5921, 'learning_rate': 1.5929374845302604e-05, 'epoch': 0.6} {'loss': 0.6295, 'learning_rate': 1.5929111242797014e-05, 'epoch': 0.6} {'loss': 0.8307, 'learning_rate': 1.592884763393784e-05, 'epoch': 0.6} {'loss': 0.6763, 'learning_rate': 1.592858401872537e-05, 'epoch': 0.6} {'loss': 0.8403, 'learning_rate': 1.5928320397159887e-05, 'epoch': 0.6} {'loss': 0.7445, 'learning_rate': 1.592805676924168e-05, 'epoch': 0.6} {'loss': 0.8047, 'learning_rate': 1.592779313497102e-05, 'epoch': 0.6} {'loss': 0.8495, 'learning_rate': 1.5927529494348197e-05, 'epoch': 0.6} {'loss': 0.7786, 'learning_rate': 1.592726584737349e-05, 'epoch': 0.6} {'loss': 0.6834, 'learning_rate': 1.592700219404718e-05, 'epoch': 0.6} {'loss': 0.7723, 'learning_rate': 1.592673853436955e-05, 'epoch': 0.6} {'loss': 0.6347, 'learning_rate': 1.5926474868340894e-05, 'epoch': 0.6} {'loss': 0.8442, 'learning_rate': 1.592621119596148e-05, 'epoch': 0.6} {'loss': 0.7167, 'learning_rate': 1.5925947517231594e-05, 'epoch': 0.6} {'loss': 0.8823, 'learning_rate': 1.5925683832151523e-05, 'epoch': 0.6} {'loss': 0.8054, 'learning_rate': 1.5925420140721547e-05, 'epoch': 0.6} {'loss': 0.955, 'learning_rate': 1.5925156442941945e-05, 'epoch': 0.6} {'loss': 0.922, 'learning_rate': 1.5924892738813008e-05, 'epoch': 0.6} {'loss': 0.8755, 'learning_rate': 1.5924629028335013e-05, 'epoch': 0.6} {'loss': 0.7729, 'learning_rate': 1.5924365311508246e-05, 'epoch': 0.6} {'loss': 0.8675, 'learning_rate': 1.592410158833298e-05, 'epoch': 0.6} {'loss': 1.0003, 'learning_rate': 1.5923837858809507e-05, 'epoch': 0.6} {'loss': 0.9384, 'learning_rate': 1.5923574122938108e-05, 'epoch': 0.6} {'loss': 0.8436, 'learning_rate': 1.5923310380719065e-05, 'epoch': 0.6} {'loss': 0.7964, 'learning_rate': 1.5923046632152658e-05, 'epoch': 0.6} {'loss': 0.8953, 'learning_rate': 1.5922782877239176e-05, 'epoch': 0.6} {'loss': 1.0048, 'learning_rate': 1.5922519115978893e-05, 'epoch': 0.6} {'loss': 0.7041, 'learning_rate': 1.5922255348372097e-05, 'epoch': 0.6} {'loss': 0.8811, 'learning_rate': 1.5921991574419072e-05, 'epoch': 0.6} {'loss': 0.8532, 'learning_rate': 1.5921727794120098e-05, 'epoch': 0.6} {'loss': 0.8108, 'learning_rate': 1.592146400747546e-05, 'epoch': 0.6} {'loss': 0.6218, 'learning_rate': 1.5921200214485435e-05, 'epoch': 0.6} {'loss': 0.9749, 'learning_rate': 1.5920936415150313e-05, 'epoch': 0.6} {'loss': 0.7267, 'learning_rate': 1.5920672609470372e-05, 'epoch': 0.6} {'loss': 0.9309, 'learning_rate': 1.5920408797445893e-05, 'epoch': 0.6} {'loss': 0.6894, 'learning_rate': 1.5920144979077165e-05, 'epoch': 0.6} {'loss': 0.9655, 'learning_rate': 1.5919881154364468e-05, 'epoch': 0.6} {'loss': 0.7101, 'learning_rate': 1.591961732330808e-05, 'epoch': 0.6} {'loss': 0.9281, 'learning_rate': 1.591935348590829e-05, 'epoch': 0.6} {'loss': 0.8344, 'learning_rate': 1.591908964216538e-05, 'epoch': 0.6} {'loss': 0.7483, 'learning_rate': 1.591882579207963e-05, 'epoch': 0.6} {'loss': 0.859, 'learning_rate': 1.5918561935651323e-05, 'epoch': 0.6} {'loss': 0.7945, 'learning_rate': 1.5918298072880745e-05, 'epoch': 0.6} {'loss': 0.8457, 'learning_rate': 1.5918034203768177e-05, 'epoch': 0.6} {'loss': 0.8811, 'learning_rate': 1.5917770328313897e-05, 'epoch': 0.6} {'loss': 0.8523, 'learning_rate': 1.5917506446518193e-05, 'epoch': 0.6} {'loss': 0.8373, 'learning_rate': 1.591724255838135e-05, 'epoch': 0.6} {'loss': 0.9673, 'learning_rate': 1.5916978663903645e-05, 'epoch': 0.6} {'loss': 0.9328, 'learning_rate': 1.5916714763085363e-05, 'epoch': 0.6} {'loss': 0.8043, 'learning_rate': 1.591645085592679e-05, 'epoch': 0.6} {'loss': 0.8628, 'learning_rate': 1.5916186942428204e-05, 'epoch': 0.6} {'loss': 0.9071, 'learning_rate': 1.591592302258989e-05, 'epoch': 0.6} {'loss': 1.0134, 'learning_rate': 1.5915659096412128e-05, 'epoch': 0.6} {'loss': 0.8285, 'learning_rate': 1.5915395163895203e-05, 'epoch': 0.6} {'loss': 0.9123, 'learning_rate': 1.5915131225039403e-05, 'epoch': 0.6} {'loss': 0.7892, 'learning_rate': 1.5914867279845007e-05, 'epoch': 0.6} {'loss': 1.0257, 'learning_rate': 1.591460332831229e-05, 'epoch': 0.6} {'loss': 0.7171, 'learning_rate': 1.5914339370441546e-05, 'epoch': 0.6} {'loss': 0.8598, 'learning_rate': 1.5914075406233053e-05, 'epoch': 0.6} {'loss': 0.8104, 'learning_rate': 1.5913811435687094e-05, 'epoch': 0.6} {'loss': 0.789, 'learning_rate': 1.5913547458803952e-05, 'epoch': 0.6} {'loss': 0.7555, 'learning_rate': 1.591328347558391e-05, 'epoch': 0.6} {'loss': 0.7629, 'learning_rate': 1.5913019486027255e-05, 'epoch': 0.6} {'loss': 0.9541, 'learning_rate': 1.591275549013426e-05, 'epoch': 0.6} {'loss': 1.0232, 'learning_rate': 1.5912491487905217e-05, 'epoch': 0.6} {'loss': 0.8608, 'learning_rate': 1.5912227479340404e-05, 'epoch': 0.6} {'loss': 0.7772, 'learning_rate': 1.5911963464440106e-05, 'epoch': 0.6} {'loss': 0.7542, 'learning_rate': 1.591169944320461e-05, 'epoch': 0.6} {'loss': 0.8554, 'learning_rate': 1.5911435415634192e-05, 'epoch': 0.6} {'loss': 0.9343, 'learning_rate': 1.5911171381729135e-05, 'epoch': 0.6} {'loss': 0.8221, 'learning_rate': 1.5910907341489725e-05, 'epoch': 0.6} {'loss': 0.9423, 'learning_rate': 1.5910643294916246e-05, 'epoch': 0.6} {'loss': 0.856, 'learning_rate': 1.5910379242008977e-05, 'epoch': 0.6} {'loss': 0.6706, 'learning_rate': 1.5910115182768205e-05, 'epoch': 0.6} {'loss': 0.8377, 'learning_rate': 1.590985111719421e-05, 'epoch': 0.6} {'loss': 0.6717, 'learning_rate': 1.590958704528728e-05, 'epoch': 0.6} {'loss': 0.957, 'learning_rate': 1.5909322967047687e-05, 'epoch': 0.6} {'loss': 0.9047, 'learning_rate': 1.5909058882475725e-05, 'epoch': 0.6} {'loss': 0.8697, 'learning_rate': 1.5908794791571676e-05, 'epoch': 0.6} {'loss': 0.8458, 'learning_rate': 1.5908530694335815e-05, 'epoch': 0.6} {'loss': 0.804, 'learning_rate': 1.5908266590768433e-05, 'epoch': 0.6} {'loss': 0.9067, 'learning_rate': 1.590800248086981e-05, 'epoch': 0.6} {'loss': 0.7299, 'learning_rate': 1.5907738364640227e-05, 'epoch': 0.6} {'loss': 0.7214, 'learning_rate': 1.5907474242079972e-05, 'epoch': 0.6} {'loss': 0.7911, 'learning_rate': 1.590721011318932e-05, 'epoch': 0.6} {'loss': 0.7555, 'learning_rate': 1.5906945977968566e-05, 'epoch': 0.6} {'loss': 0.8115, 'learning_rate': 1.5906681836417984e-05, 'epoch': 0.6} {'loss': 1.0368, 'learning_rate': 1.5906417688537857e-05, 'epoch': 0.6} {'loss': 0.9657, 'learning_rate': 1.5906153534328473e-05, 'epoch': 0.6} {'loss': 0.782, 'learning_rate': 1.590588937379011e-05, 'epoch': 0.6} {'loss': 0.8371, 'learning_rate': 1.5905625206923055e-05, 'epoch': 0.6} {'loss': 0.8386, 'learning_rate': 1.5905361033727587e-05, 'epoch': 0.6} {'loss': 0.8407, 'learning_rate': 1.5905096854203996e-05, 'epoch': 0.6} {'loss': 1.068, 'learning_rate': 1.5904832668352558e-05, 'epoch': 0.6} {'loss': 0.789, 'learning_rate': 1.590456847617356e-05, 'epoch': 0.6} {'loss': 0.8372, 'learning_rate': 1.5904304277667284e-05, 'epoch': 0.6} {'loss': 0.7388, 'learning_rate': 1.5904040072834013e-05, 'epoch': 0.6} {'loss': 0.835, 'learning_rate': 1.590377586167403e-05, 'epoch': 0.6} {'loss': 0.8278, 'learning_rate': 1.5903511644187616e-05, 'epoch': 0.6} {'loss': 0.6459, 'learning_rate': 1.590324742037506e-05, 'epoch': 0.6} {'loss': 0.8251, 'learning_rate': 1.590298319023664e-05, 'epoch': 0.6} {'loss': 0.8529, 'learning_rate': 1.590271895377264e-05, 'epoch': 0.6} {'loss': 0.9312, 'learning_rate': 1.5902454710983345e-05, 'epoch': 0.6} {'loss': 0.9215, 'learning_rate': 1.5902190461869035e-05, 'epoch': 0.6} {'loss': 0.805, 'learning_rate': 1.590192620643e-05, 'epoch': 0.6} {'loss': 0.7743, 'learning_rate': 1.5901661944666512e-05, 'epoch': 0.6} {'loss': 1.0285, 'learning_rate': 1.5901397676578868e-05, 'epoch': 0.6} {'loss': 0.7629, 'learning_rate': 1.590113340216734e-05, 'epoch': 0.6} {'loss': 0.9902, 'learning_rate': 1.5900869121432213e-05, 'epoch': 0.6} {'loss': 0.8853, 'learning_rate': 1.5900604834373775e-05, 'epoch': 0.6} {'loss': 0.7821, 'learning_rate': 1.5900340540992303e-05, 'epoch': 0.6} {'loss': 0.9052, 'learning_rate': 1.5900076241288087e-05, 'epoch': 0.6} {'loss': 0.8845, 'learning_rate': 1.5899811935261403e-05, 'epoch': 0.6} {'loss': 0.8241, 'learning_rate': 1.5899547622912543e-05, 'epoch': 0.6} {'loss': 0.9045, 'learning_rate': 1.5899283304241782e-05, 'epoch': 0.6} {'loss': 0.9392, 'learning_rate': 1.5899018979249407e-05, 'epoch': 0.6} {'loss': 0.803, 'learning_rate': 1.58987546479357e-05, 'epoch': 0.6} {'loss': 0.8812, 'learning_rate': 1.589849031030095e-05, 'epoch': 0.6} {'loss': 0.969, 'learning_rate': 1.589822596634543e-05, 'epoch': 0.6} {'loss': 0.6844, 'learning_rate': 1.5897961616069427e-05, 'epoch': 0.6} {'loss': 0.7825, 'learning_rate': 1.5897697259473233e-05, 'epoch': 0.6} {'loss': 0.724, 'learning_rate': 1.589743289655712e-05, 'epoch': 0.6} {'loss': 0.8435, 'learning_rate': 1.589716852732137e-05, 'epoch': 0.6} {'loss': 0.7615, 'learning_rate': 1.589690415176628e-05, 'epoch': 0.6} {'loss': 0.902, 'learning_rate': 1.589663976989212e-05, 'epoch': 0.6} {'loss': 0.8766, 'learning_rate': 1.5896375381699183e-05, 'epoch': 0.6} {'loss': 0.6243, 'learning_rate': 1.5896110987187744e-05, 'epoch': 0.6} {'loss': 0.9745, 'learning_rate': 1.589584658635809e-05, 'epoch': 0.6} {'loss': 0.8066, 'learning_rate': 1.5895582179210506e-05, 'epoch': 0.6} {'loss': 0.7503, 'learning_rate': 1.5895317765745272e-05, 'epoch': 0.6} {'loss': 0.859, 'learning_rate': 1.5895053345962673e-05, 'epoch': 0.6} {'loss': 0.9362, 'learning_rate': 1.5894788919862994e-05, 'epoch': 0.6} {'loss': 0.7269, 'learning_rate': 1.5894524487446513e-05, 'epoch': 0.6} {'loss': 0.8351, 'learning_rate': 1.589426004871352e-05, 'epoch': 0.6} {'loss': 0.7521, 'learning_rate': 1.5893995603664295e-05, 'epoch': 0.6} {'loss': 0.8403, 'learning_rate': 1.589373115229912e-05, 'epoch': 0.6} {'loss': 0.9353, 'learning_rate': 1.5893466694618282e-05, 'epoch': 0.6} {'loss': 0.8661, 'learning_rate': 1.589320223062206e-05, 'epoch': 0.6} {'loss': 0.7527, 'learning_rate': 1.5892937760310746e-05, 'epoch': 0.6} {'loss': 0.9906, 'learning_rate': 1.5892673283684613e-05, 'epoch': 0.6} {'loss': 0.9396, 'learning_rate': 1.5892408800743948e-05, 'epoch': 0.6} {'loss': 0.8266, 'learning_rate': 1.5892144311489035e-05, 'epoch': 0.6} {'loss': 0.9186, 'learning_rate': 1.589187981592016e-05, 'epoch': 0.6} {'loss': 0.7445, 'learning_rate': 1.5891615314037604e-05, 'epoch': 0.6} {'loss': 0.7774, 'learning_rate': 1.589135080584165e-05, 'epoch': 0.6} {'loss': 0.7625, 'learning_rate': 1.5891086291332577e-05, 'epoch': 0.6} {'loss': 0.8299, 'learning_rate': 1.5890821770510677e-05, 'epoch': 0.6} {'loss': 0.824, 'learning_rate': 1.589055724337623e-05, 'epoch': 0.6} {'loss': 0.7591, 'learning_rate': 1.5890292709929522e-05, 'epoch': 0.6} {'loss': 0.9386, 'learning_rate': 1.589002817017083e-05, 'epoch': 0.6} {'loss': 0.7725, 'learning_rate': 1.5889763624100442e-05, 'epoch': 0.6} {'loss': 0.8173, 'learning_rate': 1.5889499071718644e-05, 'epoch': 0.6} {'loss': 0.9426, 'learning_rate': 1.588923451302571e-05, 'epoch': 0.6} {'loss': 0.9292, 'learning_rate': 1.5888969948021933e-05, 'epoch': 0.6} {'loss': 0.8626, 'learning_rate': 1.5888705376707593e-05, 'epoch': 0.6} {'loss': 0.9041, 'learning_rate': 1.5888440799082972e-05, 'epoch': 0.6} {'loss': 0.7108, 'learning_rate': 1.588817621514836e-05, 'epoch': 0.6} {'loss': 0.8345, 'learning_rate': 1.588791162490403e-05, 'epoch': 0.6} {'loss': 0.8245, 'learning_rate': 1.5887647028350276e-05, 'epoch': 0.6} {'loss': 0.8153, 'learning_rate': 1.5887382425487374e-05, 'epoch': 0.6} {'loss': 0.7269, 'learning_rate': 1.588711781631561e-05, 'epoch': 0.6} {'loss': 1.0004, 'learning_rate': 1.5886853200835273e-05, 'epoch': 0.6} {'loss': 0.7469, 'learning_rate': 1.5886588579046636e-05, 'epoch': 0.6} {'loss': 0.8943, 'learning_rate': 1.5886323950949992e-05, 'epoch': 0.6} {'loss': 0.8776, 'learning_rate': 1.5886059316545616e-05, 'epoch': 0.6} {'loss': 0.869, 'learning_rate': 1.58857946758338e-05, 'epoch': 0.6} {'loss': 0.6999, 'learning_rate': 1.588553002881482e-05, 'epoch': 0.6} {'loss': 1.0133, 'learning_rate': 1.5885265375488966e-05, 'epoch': 0.6} {'loss': 0.7396, 'learning_rate': 1.588500071585652e-05, 'epoch': 0.6} {'loss': 0.8409, 'learning_rate': 1.5884736049917765e-05, 'epoch': 0.6} {'loss': 0.8616, 'learning_rate': 1.588447137767298e-05, 'epoch': 0.6} {'loss': 0.798, 'learning_rate': 1.5884206699122454e-05, 'epoch': 0.6} {'loss': 0.7315, 'learning_rate': 1.588394201426647e-05, 'epoch': 0.6} {'loss': 0.9167, 'learning_rate': 1.5883677323105314e-05, 'epoch': 0.6} {'loss': 0.8746, 'learning_rate': 1.5883412625639264e-05, 'epoch': 0.6} {'loss': 0.7432, 'learning_rate': 1.5883147921868605e-05, 'epoch': 0.6} {'loss': 0.7748, 'learning_rate': 1.5882883211793626e-05, 'epoch': 0.6} {'loss': 0.7661, 'learning_rate': 1.5882618495414604e-05, 'epoch': 0.6} {'loss': 0.9412, 'learning_rate': 1.5882353772731827e-05, 'epoch': 0.6} {'loss': 0.8878, 'learning_rate': 1.5882089043745574e-05, 'epoch': 0.6} {'loss': 0.7924, 'learning_rate': 1.5881824308456135e-05, 'epoch': 0.6} {'loss': 0.8341, 'learning_rate': 1.5881559566863788e-05, 'epoch': 0.6} {'loss': 0.8619, 'learning_rate': 1.588129481896882e-05, 'epoch': 0.6} {'loss': 0.597, 'learning_rate': 1.5881030064771513e-05, 'epoch': 0.6} {'loss': 0.9584, 'learning_rate': 1.588076530427215e-05, 'epoch': 0.6} {'loss': 0.8852, 'learning_rate': 1.588050053747102e-05, 'epoch': 0.6} {'loss': 0.8703, 'learning_rate': 1.58802357643684e-05, 'epoch': 0.6} {'loss': 0.794, 'learning_rate': 1.587997098496458e-05, 'epoch': 0.6} {'loss': 0.7957, 'learning_rate': 1.5879706199259838e-05, 'epoch': 0.6} {'loss': 0.6912, 'learning_rate': 1.5879441407254462e-05, 'epoch': 0.6} {'loss': 0.942, 'learning_rate': 1.5879176608948733e-05, 'epoch': 0.6} {'loss': 0.9344, 'learning_rate': 1.5878911804342932e-05, 'epoch': 0.6} {'loss': 0.8025, 'learning_rate': 1.587864699343735e-05, 'epoch': 0.6} {'loss': 0.613, 'learning_rate': 1.5878382176232267e-05, 'epoch': 0.6} {'loss': 0.7359, 'learning_rate': 1.5878117352727968e-05, 'epoch': 0.6} {'loss': 0.9758, 'learning_rate': 1.5877852522924733e-05, 'epoch': 0.6} {'loss': 0.7883, 'learning_rate': 1.587758768682285e-05, 'epoch': 0.6} {'loss': 0.7494, 'learning_rate': 1.58773228444226e-05, 'epoch': 0.6} {'loss': 0.8642, 'learning_rate': 1.587705799572427e-05, 'epoch': 0.6} {'loss': 0.8962, 'learning_rate': 1.5876793140728142e-05, 'epoch': 0.6} {'loss': 0.9563, 'learning_rate': 1.58765282794345e-05, 'epoch': 0.6} {'loss': 0.7309, 'learning_rate': 1.5876263411843626e-05, 'epoch': 0.6} {'loss': 0.8835, 'learning_rate': 1.5875998537955805e-05, 'epoch': 0.6} {'loss': 0.9374, 'learning_rate': 1.587573365777132e-05, 'epoch': 0.6} {'loss': 0.7926, 'learning_rate': 1.5875468771290458e-05, 'epoch': 0.6} {'loss': 0.7381, 'learning_rate': 1.58752038785135e-05, 'epoch': 0.6} {'loss': 0.8895, 'learning_rate': 1.587493897944073e-05, 'epoch': 0.6} {'loss': 0.6765, 'learning_rate': 1.587467407407244e-05, 'epoch': 0.6} {'loss': 0.9132, 'learning_rate': 1.5874409162408898e-05, 'epoch': 0.6} {'loss': 0.7305, 'learning_rate': 1.58741442444504e-05, 'epoch': 0.6} {'loss': 0.9229, 'learning_rate': 1.5873879320197224e-05, 'epoch': 0.6} {'loss': 0.7281, 'learning_rate': 1.587361438964966e-05, 'epoch': 0.6} {'loss': 0.8101, 'learning_rate': 1.5873349452807988e-05, 'epoch': 0.6} {'loss': 0.8873, 'learning_rate': 1.5873084509672486e-05, 'epoch': 0.6} {'loss': 0.8807, 'learning_rate': 1.587281956024345e-05, 'epoch': 0.6} {'loss': 0.6832, 'learning_rate': 1.5872554604521155e-05, 'epoch': 0.6} {'loss': 0.8542, 'learning_rate': 1.587228964250589e-05, 'epoch': 0.6} {'loss': 0.8495, 'learning_rate': 1.5872024674197933e-05, 'epoch': 0.6} {'loss': 0.8875, 'learning_rate': 1.5871759699597573e-05, 'epoch': 0.6} {'loss': 0.857, 'learning_rate': 1.5871494718705093e-05, 'epoch': 0.6} {'loss': 0.9522, 'learning_rate': 1.5871229731520778e-05, 'epoch': 0.6} {'loss': 0.6391, 'learning_rate': 1.587096473804491e-05, 'epoch': 0.6} {'loss': 0.7582, 'learning_rate': 1.5870699738277767e-05, 'epoch': 0.6} {'loss': 0.9179, 'learning_rate': 1.5870434732219647e-05, 'epoch': 0.6} {'loss': 0.7434, 'learning_rate': 1.5870169719870823e-05, 'epoch': 0.6} {'loss': 0.808, 'learning_rate': 1.5869904701231583e-05, 'epoch': 0.6} {'loss': 0.8161, 'learning_rate': 1.586963967630221e-05, 'epoch': 0.61} {'loss': 0.8889, 'learning_rate': 1.586937464508299e-05, 'epoch': 0.61} {'loss': 0.9281, 'learning_rate': 1.5869109607574204e-05, 'epoch': 0.61} {'loss': 0.966, 'learning_rate': 1.5868844563776134e-05, 'epoch': 0.61} {'loss': 0.8117, 'learning_rate': 1.5868579513689075e-05, 'epoch': 0.61} {'loss': 0.7712, 'learning_rate': 1.58683144573133e-05, 'epoch': 0.61} {'loss': 0.7991, 'learning_rate': 1.5868049394649095e-05, 'epoch': 0.61} {'loss': 1.0049, 'learning_rate': 1.5867784325696745e-05, 'epoch': 0.61} {'loss': 0.9102, 'learning_rate': 1.5867519250456535e-05, 'epoch': 0.61} {'loss': 0.8132, 'learning_rate': 1.5867254168928748e-05, 'epoch': 0.61} {'loss': 0.9235, 'learning_rate': 1.586698908111367e-05, 'epoch': 0.61} {'loss': 0.9331, 'learning_rate': 1.5866723987011584e-05, 'epoch': 0.61} {'loss': 0.9224, 'learning_rate': 1.5866458886622776e-05, 'epoch': 0.61} {'loss': 0.8741, 'learning_rate': 1.5866193779947523e-05, 'epoch': 0.61} {'loss': 0.7684, 'learning_rate': 1.5865928666986116e-05, 'epoch': 0.61} {'loss': 0.8703, 'learning_rate': 1.5865663547738838e-05, 'epoch': 0.61} {'loss': 0.9718, 'learning_rate': 1.586539842220597e-05, 'epoch': 0.61} {'loss': 0.7547, 'learning_rate': 1.58651332903878e-05, 'epoch': 0.61} {'loss': 0.6421, 'learning_rate': 1.5864868152284608e-05, 'epoch': 0.61} {'loss': 0.8078, 'learning_rate': 1.5864603007896684e-05, 'epoch': 0.61} {'loss': 0.8266, 'learning_rate': 1.5864337857224306e-05, 'epoch': 0.61} {'loss': 0.661, 'learning_rate': 1.586407270026776e-05, 'epoch': 0.61} {'loss': 0.7999, 'learning_rate': 1.5863807537027333e-05, 'epoch': 0.61} {'loss': 1.0168, 'learning_rate': 1.5863542367503306e-05, 'epoch': 0.61} {'loss': 0.7175, 'learning_rate': 1.5863277191695965e-05, 'epoch': 0.61} {'loss': 0.9686, 'learning_rate': 1.586301200960559e-05, 'epoch': 0.61} {'loss': 0.8612, 'learning_rate': 1.586274682123247e-05, 'epoch': 0.61} {'loss': 0.7444, 'learning_rate': 1.5862481626576892e-05, 'epoch': 0.61} {'loss': 0.9529, 'learning_rate': 1.586221642563913e-05, 'epoch': 0.61} {'loss': 0.923, 'learning_rate': 1.5861951218419478e-05, 'epoch': 0.61} {'loss': 0.9373, 'learning_rate': 1.5861686004918215e-05, 'epoch': 0.61} {'loss': 0.9946, 'learning_rate': 1.5861420785135627e-05, 'epoch': 0.61} {'loss': 0.8005, 'learning_rate': 1.5861155559071995e-05, 'epoch': 0.61} {'loss': 0.7635, 'learning_rate': 1.5860890326727606e-05, 'epoch': 0.61} {'loss': 0.9708, 'learning_rate': 1.5860625088102747e-05, 'epoch': 0.61} {'loss': 0.8852, 'learning_rate': 1.5860359843197697e-05, 'epoch': 0.61} {'loss': 0.7138, 'learning_rate': 1.586009459201274e-05, 'epoch': 0.61} {'loss': 0.8384, 'learning_rate': 1.585982933454817e-05, 'epoch': 0.61} {'loss': 0.7142, 'learning_rate': 1.5859564070804258e-05, 'epoch': 0.61} {'loss': 0.8177, 'learning_rate': 1.5859298800781296e-05, 'epoch': 0.61} {'loss': 0.7685, 'learning_rate': 1.5859033524479567e-05, 'epoch': 0.61} {'loss': 0.7698, 'learning_rate': 1.5858768241899352e-05, 'epoch': 0.61} {'loss': 0.7786, 'learning_rate': 1.5858502953040943e-05, 'epoch': 0.61} {'loss': 0.6762, 'learning_rate': 1.5858237657904617e-05, 'epoch': 0.61} {'loss': 0.7509, 'learning_rate': 1.585797235649066e-05, 'epoch': 0.61} {'loss': 0.7126, 'learning_rate': 1.585770704879936e-05, 'epoch': 0.61} {'loss': 0.7043, 'learning_rate': 1.5857441734830993e-05, 'epoch': 0.61} {'loss': 0.8935, 'learning_rate': 1.5857176414585852e-05, 'epoch': 0.61} {'loss': 0.754, 'learning_rate': 1.5856911088064214e-05, 'epoch': 0.61} {'loss': 0.9409, 'learning_rate': 1.5856645755266373e-05, 'epoch': 0.61} {'loss': 0.8652, 'learning_rate': 1.5856380416192605e-05, 'epoch': 0.61} {'loss': 0.9379, 'learning_rate': 1.5856115070843196e-05, 'epoch': 0.61} {'loss': 0.7992, 'learning_rate': 1.585584971921843e-05, 'epoch': 0.61} {'loss': 1.0822, 'learning_rate': 1.5855584361318594e-05, 'epoch': 0.61} {'loss': 0.6247, 'learning_rate': 1.585531899714397e-05, 'epoch': 0.61} {'loss': 0.7303, 'learning_rate': 1.5855053626694844e-05, 'epoch': 0.61} {'loss': 0.8012, 'learning_rate': 1.58547882499715e-05, 'epoch': 0.61} {'loss': 0.9127, 'learning_rate': 1.5854522866974226e-05, 'epoch': 0.61} {'loss': 0.8491, 'learning_rate': 1.5854257477703293e-05, 'epoch': 0.61} {'loss': 0.7799, 'learning_rate': 1.5853992082159e-05, 'epoch': 0.61} {'loss': 0.6921, 'learning_rate': 1.585372668034163e-05, 'epoch': 0.61} {'loss': 0.8203, 'learning_rate': 1.5853461272251456e-05, 'epoch': 0.61} {'loss': 0.7612, 'learning_rate': 1.5853195857888775e-05, 'epoch': 0.61} {'loss': 0.9189, 'learning_rate': 1.585293043725386e-05, 'epoch': 0.61} {'loss': 0.9953, 'learning_rate': 1.585266501034701e-05, 'epoch': 0.61} {'loss': 0.8615, 'learning_rate': 1.5852399577168496e-05, 'epoch': 0.61} {'loss': 0.9702, 'learning_rate': 1.585213413771861e-05, 'epoch': 0.61} {'loss': 0.752, 'learning_rate': 1.5851868691997633e-05, 'epoch': 0.61} {'loss': 0.9182, 'learning_rate': 1.585160324000585e-05, 'epoch': 0.61} {'loss': 1.0137, 'learning_rate': 1.585133778174355e-05, 'epoch': 0.61} {'loss': 0.7959, 'learning_rate': 1.5851072317211008e-05, 'epoch': 0.61} {'loss': 0.9072, 'learning_rate': 1.585080684640852e-05, 'epoch': 0.61} {'loss': 0.8526, 'learning_rate': 1.5850541369336356e-05, 'epoch': 0.61} {'loss': 0.7742, 'learning_rate': 1.5850275885994814e-05, 'epoch': 0.61} {'loss': 0.7534, 'learning_rate': 1.5850010396384175e-05, 'epoch': 0.61} {'loss': 0.7782, 'learning_rate': 1.5849744900504716e-05, 'epoch': 0.61} {'loss': 0.8168, 'learning_rate': 1.5849479398356736e-05, 'epoch': 0.61} {'loss': 0.8213, 'learning_rate': 1.5849213889940505e-05, 'epoch': 0.61} {'loss': 0.8943, 'learning_rate': 1.5848948375256312e-05, 'epoch': 0.61} {'loss': 0.8625, 'learning_rate': 1.5848682854304444e-05, 'epoch': 0.61} {'loss': 0.7951, 'learning_rate': 1.5848417327085187e-05, 'epoch': 0.61} {'loss': 1.0021, 'learning_rate': 1.5848151793598824e-05, 'epoch': 0.61} {'loss': 0.8507, 'learning_rate': 1.5847886253845633e-05, 'epoch': 0.61} {'loss': 0.6071, 'learning_rate': 1.584762070782591e-05, 'epoch': 0.61} {'loss': 0.8439, 'learning_rate': 1.584735515553993e-05, 'epoch': 0.61} {'loss': 0.8729, 'learning_rate': 1.584708959698798e-05, 'epoch': 0.61} {'loss': 0.8741, 'learning_rate': 1.584682403217035e-05, 'epoch': 0.61} {'loss': 0.8284, 'learning_rate': 1.5846558461087318e-05, 'epoch': 0.61} {'loss': 1.1114, 'learning_rate': 1.584629288373917e-05, 'epoch': 0.61} {'loss': 0.7191, 'learning_rate': 1.5846027300126193e-05, 'epoch': 0.61} {'loss': 0.8285, 'learning_rate': 1.584576171024867e-05, 'epoch': 0.61} {'loss': 0.8282, 'learning_rate': 1.5845496114106886e-05, 'epoch': 0.61} {'loss': 0.9004, 'learning_rate': 1.5845230511701125e-05, 'epoch': 0.61} {'loss': 0.7691, 'learning_rate': 1.584496490303167e-05, 'epoch': 0.61} {'loss': 0.7876, 'learning_rate': 1.584469928809881e-05, 'epoch': 0.61} {'loss': 0.8906, 'learning_rate': 1.5844433666902826e-05, 'epoch': 0.61} {'loss': 0.796, 'learning_rate': 1.5844168039444006e-05, 'epoch': 0.61} {'loss': 0.73, 'learning_rate': 1.584390240572263e-05, 'epoch': 0.61} {'loss': 1.0182, 'learning_rate': 1.5843636765738984e-05, 'epoch': 0.61} {'loss': 0.7709, 'learning_rate': 1.584337111949336e-05, 'epoch': 0.61} {'loss': 0.8841, 'learning_rate': 1.584310546698603e-05, 'epoch': 0.61} {'loss': 0.8765, 'learning_rate': 1.5842839808217287e-05, 'epoch': 0.61} {'loss': 0.8213, 'learning_rate': 1.5842574143187415e-05, 'epoch': 0.61} {'loss': 0.7503, 'learning_rate': 1.5842308471896696e-05, 'epoch': 0.61} {'loss': 0.9018, 'learning_rate': 1.5842042794345414e-05, 'epoch': 0.61} {'loss': 0.7054, 'learning_rate': 1.584177711053386e-05, 'epoch': 0.61} {'loss': 0.7349, 'learning_rate': 1.5841511420462318e-05, 'epoch': 0.61} {'loss': 0.7996, 'learning_rate': 1.5841245724131062e-05, 'epoch': 0.61} {'loss': 0.8091, 'learning_rate': 1.5840980021540385e-05, 'epoch': 0.61} {'loss': 0.7844, 'learning_rate': 1.584071431269057e-05, 'epoch': 0.61} {'loss': 0.8601, 'learning_rate': 1.5840448597581907e-05, 'epoch': 0.61} {'loss': 0.7532, 'learning_rate': 1.5840182876214674e-05, 'epoch': 0.61} {'loss': 0.8324, 'learning_rate': 1.583991714858916e-05, 'epoch': 0.61} {'loss': 0.7532, 'learning_rate': 1.5839651414705643e-05, 'epoch': 0.61} {'loss': 1.0877, 'learning_rate': 1.5839385674564417e-05, 'epoch': 0.61} {'loss': 0.8641, 'learning_rate': 1.583911992816576e-05, 'epoch': 0.61} {'loss': 1.0164, 'learning_rate': 1.5838854175509956e-05, 'epoch': 0.61} {'loss': 0.6968, 'learning_rate': 1.5838588416597297e-05, 'epoch': 0.61} {'loss': 0.8596, 'learning_rate': 1.5838322651428063e-05, 'epoch': 0.61} {'loss': 0.9308, 'learning_rate': 1.5838056880002542e-05, 'epoch': 0.61} {'loss': 0.7776, 'learning_rate': 1.5837791102321012e-05, 'epoch': 0.61} {'loss': 0.7734, 'learning_rate': 1.583752531838376e-05, 'epoch': 0.61} {'loss': 0.7675, 'learning_rate': 1.5837259528191077e-05, 'epoch': 0.61} {'loss': 0.845, 'learning_rate': 1.583699373174324e-05, 'epoch': 0.61} {'loss': 0.7976, 'learning_rate': 1.583672792904054e-05, 'epoch': 0.61} {'loss': 0.9047, 'learning_rate': 1.583646212008326e-05, 'epoch': 0.61} {'loss': 0.8525, 'learning_rate': 1.5836196304871686e-05, 'epoch': 0.61} {'loss': 0.8547, 'learning_rate': 1.5835930483406095e-05, 'epoch': 0.61} {'loss': 0.8469, 'learning_rate': 1.583566465568678e-05, 'epoch': 0.61} {'loss': 0.6942, 'learning_rate': 1.5835398821714023e-05, 'epoch': 0.61} {'loss': 0.918, 'learning_rate': 1.583513298148811e-05, 'epoch': 0.61} {'loss': 0.7827, 'learning_rate': 1.583486713500933e-05, 'epoch': 0.61} {'loss': 0.847, 'learning_rate': 1.5834601282277957e-05, 'epoch': 0.61} {'loss': 0.7458, 'learning_rate': 1.5834335423294284e-05, 'epoch': 0.61} {'loss': 0.7586, 'learning_rate': 1.5834069558058597e-05, 'epoch': 0.61} {'loss': 0.8987, 'learning_rate': 1.583380368657117e-05, 'epoch': 0.61} {'loss': 0.8039, 'learning_rate': 1.5833537808832305e-05, 'epoch': 0.61} {'loss': 0.6408, 'learning_rate': 1.5833271924842275e-05, 'epoch': 0.61} {'loss': 0.8855, 'learning_rate': 1.5833006034601366e-05, 'epoch': 0.61} {'loss': 1.0086, 'learning_rate': 1.5832740138109865e-05, 'epoch': 0.61} {'loss': 0.8337, 'learning_rate': 1.5832474235368054e-05, 'epoch': 0.61} {'loss': 0.8892, 'learning_rate': 1.5832208326376224e-05, 'epoch': 0.61} {'loss': 0.9184, 'learning_rate': 1.5831942411134656e-05, 'epoch': 0.61} {'loss': 0.9498, 'learning_rate': 1.583167648964363e-05, 'epoch': 0.61} {'loss': 1.0718, 'learning_rate': 1.5831410561903446e-05, 'epoch': 0.61} {'loss': 0.8108, 'learning_rate': 1.5831144627914376e-05, 'epoch': 0.61} {'loss': 0.8731, 'learning_rate': 1.5830878687676703e-05, 'epoch': 0.61} {'loss': 0.9175, 'learning_rate': 1.5830612741190722e-05, 'epoch': 0.61} {'loss': 0.6408, 'learning_rate': 1.5830346788456708e-05, 'epoch': 0.61} {'loss': 0.7784, 'learning_rate': 1.583008082947496e-05, 'epoch': 0.61} {'loss': 0.9144, 'learning_rate': 1.5829814864245748e-05, 'epoch': 0.61} {'loss': 0.7122, 'learning_rate': 1.5829548892769365e-05, 'epoch': 0.61} {'loss': 0.8569, 'learning_rate': 1.5829282915046093e-05, 'epoch': 0.61} {'loss': 0.8256, 'learning_rate': 1.5829016931076218e-05, 'epoch': 0.61} {'loss': 0.9415, 'learning_rate': 1.5828750940860027e-05, 'epoch': 0.61} {'loss': 0.9605, 'learning_rate': 1.58284849443978e-05, 'epoch': 0.61} {'loss': 0.8509, 'learning_rate': 1.582821894168983e-05, 'epoch': 0.61} {'loss': 0.8404, 'learning_rate': 1.58279529327364e-05, 'epoch': 0.61} {'loss': 0.7523, 'learning_rate': 1.5827686917537784e-05, 'epoch': 0.61} {'loss': 0.9436, 'learning_rate': 1.5827420896094276e-05, 'epoch': 0.61} {'loss': 0.8532, 'learning_rate': 1.5827154868406168e-05, 'epoch': 0.61} {'loss': 0.8891, 'learning_rate': 1.5826888834473732e-05, 'epoch': 0.61} {'loss': 0.8818, 'learning_rate': 1.582662279429726e-05, 'epoch': 0.61} {'loss': 0.7484, 'learning_rate': 1.5826356747877035e-05, 'epoch': 0.61} {'loss': 0.8923, 'learning_rate': 1.5826090695213344e-05, 'epoch': 0.61} {'loss': 0.9856, 'learning_rate': 1.582582463630647e-05, 'epoch': 0.61} {'loss': 0.8295, 'learning_rate': 1.58255585711567e-05, 'epoch': 0.61} {'loss': 0.967, 'learning_rate': 1.5825292499764317e-05, 'epoch': 0.61} {'loss': 0.7801, 'learning_rate': 1.582502642212961e-05, 'epoch': 0.61} {'loss': 0.8212, 'learning_rate': 1.5824760338252862e-05, 'epoch': 0.61} {'loss': 0.811, 'learning_rate': 1.5824494248134352e-05, 'epoch': 0.61} {'loss': 0.7977, 'learning_rate': 1.5824228151774376e-05, 'epoch': 0.61} {'loss': 0.8495, 'learning_rate': 1.5823962049173213e-05, 'epoch': 0.61} {'loss': 0.9132, 'learning_rate': 1.5823695940331145e-05, 'epoch': 0.61} {'loss': 0.9005, 'learning_rate': 1.5823429825248464e-05, 'epoch': 0.61} {'loss': 0.7974, 'learning_rate': 1.5823163703925453e-05, 'epoch': 0.61} {'loss': 0.8998, 'learning_rate': 1.5822897576362396e-05, 'epoch': 0.61} {'loss': 0.7333, 'learning_rate': 1.5822631442559578e-05, 'epoch': 0.61} {'loss': 0.7063, 'learning_rate': 1.5822365302517286e-05, 'epoch': 0.61} {'loss': 0.86, 'learning_rate': 1.5822099156235803e-05, 'epoch': 0.61} {'loss': 0.8391, 'learning_rate': 1.5821833003715417e-05, 'epoch': 0.61} {'loss': 0.8949, 'learning_rate': 1.582156684495641e-05, 'epoch': 0.61} {'loss': 0.8556, 'learning_rate': 1.582130067995907e-05, 'epoch': 0.61} {'loss': 1.0196, 'learning_rate': 1.582103450872368e-05, 'epoch': 0.61} {'loss': 0.5852, 'learning_rate': 1.5820768331250525e-05, 'epoch': 0.61} {'loss': 0.8156, 'learning_rate': 1.5820502147539893e-05, 'epoch': 0.61} {'loss': 0.7918, 'learning_rate': 1.5820235957592065e-05, 'epoch': 0.61} {'loss': 0.7459, 'learning_rate': 1.581996976140733e-05, 'epoch': 0.61} {'loss': 0.6592, 'learning_rate': 1.5819703558985975e-05, 'epoch': 0.61} {'loss': 0.8784, 'learning_rate': 1.581943735032828e-05, 'epoch': 0.61} {'loss': 0.9272, 'learning_rate': 1.5819171135434534e-05, 'epoch': 0.61} {'loss': 0.8669, 'learning_rate': 1.5818904914305022e-05, 'epoch': 0.61} {'loss': 0.7827, 'learning_rate': 1.5818638686940026e-05, 'epoch': 0.61} {'loss': 0.8305, 'learning_rate': 1.581837245333983e-05, 'epoch': 0.61} {'loss': 0.7919, 'learning_rate': 1.581810621350473e-05, 'epoch': 0.61} {'loss': 0.8322, 'learning_rate': 1.5817839967435e-05, 'epoch': 0.61} {'loss': 0.9379, 'learning_rate': 1.581757371513093e-05, 'epoch': 0.61} {'loss': 0.6814, 'learning_rate': 1.5817307456592803e-05, 'epoch': 0.61} {'loss': 0.7025, 'learning_rate': 1.5817041191820907e-05, 'epoch': 0.61} {'loss': 0.8541, 'learning_rate': 1.5816774920815527e-05, 'epoch': 0.61} {'loss': 0.8917, 'learning_rate': 1.581650864357695e-05, 'epoch': 0.61} {'loss': 0.8207, 'learning_rate': 1.5816242360105457e-05, 'epoch': 0.61} {'loss': 0.871, 'learning_rate': 1.5815976070401333e-05, 'epoch': 0.61} {'loss': 0.808, 'learning_rate': 1.581570977446487e-05, 'epoch': 0.61} {'loss': 0.823, 'learning_rate': 1.5815443472296344e-05, 'epoch': 0.61} {'loss': 0.8305, 'learning_rate': 1.5815177163896048e-05, 'epoch': 0.61} {'loss': 0.8891, 'learning_rate': 1.5814910849264266e-05, 'epoch': 0.61} {'loss': 0.9068, 'learning_rate': 1.581464452840128e-05, 'epoch': 0.61} {'loss': 0.796, 'learning_rate': 1.581437820130738e-05, 'epoch': 0.61} {'loss': 0.9015, 'learning_rate': 1.581411186798285e-05, 'epoch': 0.61} {'loss': 0.8552, 'learning_rate': 1.5813845528427973e-05, 'epoch': 0.61} {'loss': 0.7854, 'learning_rate': 1.581357918264303e-05, 'epoch': 0.61} {'loss': 0.8244, 'learning_rate': 1.581331283062832e-05, 'epoch': 0.61} {'loss': 0.8699, 'learning_rate': 1.581304647238412e-05, 'epoch': 0.61} {'loss': 0.8095, 'learning_rate': 1.581278010791071e-05, 'epoch': 0.61} {'loss': 0.9174, 'learning_rate': 1.5812513737208387e-05, 'epoch': 0.61} {'loss': 0.7155, 'learning_rate': 1.581224736027743e-05, 'epoch': 0.61} {'loss': 0.9439, 'learning_rate': 1.5811980977118125e-05, 'epoch': 0.61} {'loss': 0.8825, 'learning_rate': 1.5811714587730756e-05, 'epoch': 0.61} {'loss': 0.95, 'learning_rate': 1.5811448192115614e-05, 'epoch': 0.61} {'loss': 0.7938, 'learning_rate': 1.5811181790272978e-05, 'epoch': 0.61} {'loss': 0.6925, 'learning_rate': 1.5810915382203135e-05, 'epoch': 0.61} {'loss': 0.7891, 'learning_rate': 1.5810648967906374e-05, 'epoch': 0.61} {'loss': 0.7339, 'learning_rate': 1.5810382547382978e-05, 'epoch': 0.61} {'loss': 0.7907, 'learning_rate': 1.581011612063323e-05, 'epoch': 0.61} {'loss': 0.8657, 'learning_rate': 1.5809849687657423e-05, 'epoch': 0.61} {'loss': 0.9707, 'learning_rate': 1.5809583248455833e-05, 'epoch': 0.61} {'loss': 0.7973, 'learning_rate': 1.5809316803028757e-05, 'epoch': 0.61} {'loss': 0.8754, 'learning_rate': 1.5809050351376467e-05, 'epoch': 0.61} {'loss': 0.8107, 'learning_rate': 1.5808783893499254e-05, 'epoch': 0.61} {'loss': 0.861, 'learning_rate': 1.580851742939741e-05, 'epoch': 0.61} {'loss': 0.9146, 'learning_rate': 1.5808250959071214e-05, 'epoch': 0.61} {'loss': 0.7087, 'learning_rate': 1.5807984482520953e-05, 'epoch': 0.61} {'loss': 0.7939, 'learning_rate': 1.580771799974691e-05, 'epoch': 0.61} {'loss': 0.8308, 'learning_rate': 1.5807451510749375e-05, 'epoch': 0.61} {'loss': 0.7802, 'learning_rate': 1.580718501552863e-05, 'epoch': 0.61} {'loss': 0.6693, 'learning_rate': 1.5806918514084965e-05, 'epoch': 0.61} {'loss': 0.7702, 'learning_rate': 1.580665200641866e-05, 'epoch': 0.61} {'loss': 0.8477, 'learning_rate': 1.5806385492530005e-05, 'epoch': 0.61} {'loss': 0.8415, 'learning_rate': 1.5806118972419285e-05, 'epoch': 0.61} {'loss': 0.6265, 'learning_rate': 1.5805852446086784e-05, 'epoch': 0.61} {'loss': 1.0257, 'learning_rate': 1.5805585913532785e-05, 'epoch': 0.61} {'loss': 0.7989, 'learning_rate': 1.580531937475758e-05, 'epoch': 0.61} {'loss': 0.7255, 'learning_rate': 1.5805052829761448e-05, 'epoch': 0.61} {'loss': 0.6897, 'learning_rate': 1.580478627854468e-05, 'epoch': 0.61} {'loss': 0.691, 'learning_rate': 1.580451972110756e-05, 'epoch': 0.61} {'loss': 0.9425, 'learning_rate': 1.5804253157450372e-05, 'epoch': 0.61} {'loss': 0.9292, 'learning_rate': 1.5803986587573404e-05, 'epoch': 0.61} {'loss': 0.9707, 'learning_rate': 1.5803720011476938e-05, 'epoch': 0.61} {'loss': 0.7798, 'learning_rate': 1.5803453429161267e-05, 'epoch': 0.61} {'loss': 0.919, 'learning_rate': 1.5803186840626667e-05, 'epoch': 0.61} {'loss': 0.5792, 'learning_rate': 1.5802920245873433e-05, 'epoch': 0.61} {'loss': 0.9544, 'learning_rate': 1.580265364490184e-05, 'epoch': 0.61} {'loss': 0.8592, 'learning_rate': 1.5802387037712184e-05, 'epoch': 0.61} {'loss': 0.852, 'learning_rate': 1.5802120424304747e-05, 'epoch': 0.61} {'loss': 0.7496, 'learning_rate': 1.5801853804679813e-05, 'epoch': 0.61} {'loss': 0.8177, 'learning_rate': 1.580158717883767e-05, 'epoch': 0.61} {'loss': 0.8495, 'learning_rate': 1.5801320546778604e-05, 'epoch': 0.61} {'loss': 0.8291, 'learning_rate': 1.5801053908502896e-05, 'epoch': 0.61} {'loss': 0.8671, 'learning_rate': 1.5800787264010836e-05, 'epoch': 0.61} {'loss': 0.8131, 'learning_rate': 1.580052061330271e-05, 'epoch': 0.61} {'loss': 0.7929, 'learning_rate': 1.5800253956378805e-05, 'epoch': 0.61} {'loss': 0.9694, 'learning_rate': 1.57999872932394e-05, 'epoch': 0.61} {'loss': 1.1201, 'learning_rate': 1.579972062388479e-05, 'epoch': 0.61} {'loss': 1.0765, 'learning_rate': 1.579945394831525e-05, 'epoch': 0.61} {'loss': 0.8089, 'learning_rate': 1.5799187266531077e-05, 'epoch': 0.61} {'loss': 0.6158, 'learning_rate': 1.579892057853255e-05, 'epoch': 0.61} {'loss': 0.8486, 'learning_rate': 1.5798653884319954e-05, 'epoch': 0.61} {'loss': 0.6743, 'learning_rate': 1.5798387183893576e-05, 'epoch': 0.61} {'loss': 0.9688, 'learning_rate': 1.5798120477253706e-05, 'epoch': 0.61} {'loss': 0.9118, 'learning_rate': 1.5797853764400626e-05, 'epoch': 0.61} {'loss': 0.9826, 'learning_rate': 1.5797587045334623e-05, 'epoch': 0.61} {'loss': 0.7392, 'learning_rate': 1.579732032005598e-05, 'epoch': 0.61} {'loss': 0.8529, 'learning_rate': 1.5797053588564987e-05, 'epoch': 0.61} {'loss': 0.7273, 'learning_rate': 1.579678685086193e-05, 'epoch': 0.61} {'loss': 0.6569, 'learning_rate': 1.5796520106947086e-05, 'epoch': 0.61} {'loss': 0.7714, 'learning_rate': 1.579625335682075e-05, 'epoch': 0.61} {'loss': 0.8793, 'learning_rate': 1.579598660048321e-05, 'epoch': 0.61} {'loss': 0.9377, 'learning_rate': 1.5795719837934743e-05, 'epoch': 0.61} {'loss': 0.787, 'learning_rate': 1.579545306917564e-05, 'epoch': 0.61} {'loss': 0.7957, 'learning_rate': 1.5795186294206184e-05, 'epoch': 0.61} {'loss': 0.7414, 'learning_rate': 1.5794919513026666e-05, 'epoch': 0.61} {'loss': 0.8469, 'learning_rate': 1.579465272563737e-05, 'epoch': 0.61} {'loss': 0.8439, 'learning_rate': 1.5794385932038573e-05, 'epoch': 0.61} {'loss': 0.9392, 'learning_rate': 1.5794119132230578e-05, 'epoch': 0.61} {'loss': 0.9696, 'learning_rate': 1.5793852326213655e-05, 'epoch': 0.61} {'loss': 0.7804, 'learning_rate': 1.57935855139881e-05, 'epoch': 0.61} {'loss': 0.749, 'learning_rate': 1.5793318695554192e-05, 'epoch': 0.61} {'loss': 0.7019, 'learning_rate': 1.579305187091222e-05, 'epoch': 0.61} {'loss': 0.8625, 'learning_rate': 1.5792785040062474e-05, 'epoch': 0.61} {'loss': 0.8366, 'learning_rate': 1.5792518203005233e-05, 'epoch': 0.61} {'loss': 0.8486, 'learning_rate': 1.5792251359740785e-05, 'epoch': 0.61} {'loss': 0.8276, 'learning_rate': 1.579198451026942e-05, 'epoch': 0.61} {'loss': 0.6976, 'learning_rate': 1.5791717654591422e-05, 'epoch': 0.61} {'loss': 0.783, 'learning_rate': 1.579145079270707e-05, 'epoch': 0.61} {'loss': 0.9005, 'learning_rate': 1.579118392461666e-05, 'epoch': 0.61} {'loss': 0.8331, 'learning_rate': 1.5790917050320474e-05, 'epoch': 0.61} {'loss': 0.9028, 'learning_rate': 1.5790650169818794e-05, 'epoch': 0.61} {'loss': 0.9143, 'learning_rate': 1.5790383283111913e-05, 'epoch': 0.61} {'loss': 0.8599, 'learning_rate': 1.5790116390200113e-05, 'epoch': 0.61} {'loss': 0.9106, 'learning_rate': 1.578984949108368e-05, 'epoch': 0.61} {'loss': 0.8886, 'learning_rate': 1.5789582585762903e-05, 'epoch': 0.61} {'loss': 0.7713, 'learning_rate': 1.5789315674238062e-05, 'epoch': 0.61} {'loss': 0.7431, 'learning_rate': 1.5789048756509447e-05, 'epoch': 0.61} {'loss': 1.0579, 'learning_rate': 1.578878183257735e-05, 'epoch': 0.61} {'loss': 0.7628, 'learning_rate': 1.5788514902442046e-05, 'epoch': 0.61} {'loss': 0.8549, 'learning_rate': 1.5788247966103826e-05, 'epoch': 0.61} {'loss': 0.779, 'learning_rate': 1.5787981023562976e-05, 'epoch': 0.61} {'loss': 0.9001, 'learning_rate': 1.5787714074819782e-05, 'epoch': 0.61} {'loss': 0.8412, 'learning_rate': 1.578744711987453e-05, 'epoch': 0.61} {'loss': 0.8916, 'learning_rate': 1.5787180158727505e-05, 'epoch': 0.61} {'loss': 0.7206, 'learning_rate': 1.5786913191378995e-05, 'epoch': 0.61} {'loss': 0.8397, 'learning_rate': 1.5786646217829286e-05, 'epoch': 0.61} {'loss': 0.9534, 'learning_rate': 1.5786379238078665e-05, 'epoch': 0.61} {'loss': 0.7686, 'learning_rate': 1.578611225212741e-05, 'epoch': 0.61} {'loss': 0.6807, 'learning_rate': 1.5785845259975818e-05, 'epoch': 0.61} {'loss': 0.9113, 'learning_rate': 1.578557826162417e-05, 'epoch': 0.61} {'loss': 0.9942, 'learning_rate': 1.5785311257072754e-05, 'epoch': 0.61} {'loss': 0.7361, 'learning_rate': 1.5785044246321852e-05, 'epoch': 0.61} {'loss': 0.8578, 'learning_rate': 1.5784777229371754e-05, 'epoch': 0.61} {'loss': 0.9796, 'learning_rate': 1.5784510206222746e-05, 'epoch': 0.61} {'loss': 1.0052, 'learning_rate': 1.5784243176875114e-05, 'epoch': 0.61} {'loss': 0.9125, 'learning_rate': 1.5783976141329142e-05, 'epoch': 0.61} {'loss': 0.9064, 'learning_rate': 1.578370909958512e-05, 'epoch': 0.61} {'loss': 0.9531, 'learning_rate': 1.5783442051643328e-05, 'epoch': 0.61} {'loss': 0.9014, 'learning_rate': 1.5783174997504055e-05, 'epoch': 0.61} {'loss': 0.8993, 'learning_rate': 1.5782907937167594e-05, 'epoch': 0.61} {'loss': 0.7388, 'learning_rate': 1.578264087063422e-05, 'epoch': 0.61} {'loss': 0.806, 'learning_rate': 1.5782373797904226e-05, 'epoch': 0.61} {'loss': 0.9315, 'learning_rate': 1.5782106718977895e-05, 'epoch': 0.61} {'loss': 1.0129, 'learning_rate': 1.578183963385552e-05, 'epoch': 0.61} {'loss': 0.9239, 'learning_rate': 1.5781572542537374e-05, 'epoch': 0.61} {'loss': 0.8173, 'learning_rate': 1.578130544502376e-05, 'epoch': 0.61} {'loss': 0.844, 'learning_rate': 1.578103834131495e-05, 'epoch': 0.61} {'loss': 0.8498, 'learning_rate': 1.5780771231411235e-05, 'epoch': 0.61} {'loss': 0.7694, 'learning_rate': 1.5780504115312904e-05, 'epoch': 0.61} {'loss': 0.8036, 'learning_rate': 1.5780236993020238e-05, 'epoch': 0.61} {'loss': 0.9779, 'learning_rate': 1.5779969864533532e-05, 'epoch': 0.61} {'loss': 0.933, 'learning_rate': 1.577970272985306e-05, 'epoch': 0.61} {'loss': 0.7436, 'learning_rate': 1.577943558897912e-05, 'epoch': 0.61} {'loss': 0.9396, 'learning_rate': 1.5779168441911995e-05, 'epoch': 0.61} {'loss': 0.8483, 'learning_rate': 1.5778901288651964e-05, 'epoch': 0.61} {'loss': 0.9344, 'learning_rate': 1.577863412919932e-05, 'epoch': 0.61} {'loss': 0.7868, 'learning_rate': 1.577836696355435e-05, 'epoch': 0.61} {'loss': 0.782, 'learning_rate': 1.5778099791717336e-05, 'epoch': 0.61} {'loss': 0.9522, 'learning_rate': 1.5777832613688568e-05, 'epoch': 0.61} {'loss': 0.7986, 'learning_rate': 1.577756542946833e-05, 'epoch': 0.61} {'loss': 0.7538, 'learning_rate': 1.577729823905691e-05, 'epoch': 0.61} {'loss': 0.891, 'learning_rate': 1.5777031042454592e-05, 'epoch': 0.61} {'loss': 0.8261, 'learning_rate': 1.5776763839661663e-05, 'epoch': 0.61} {'loss': 0.7379, 'learning_rate': 1.5776496630678414e-05, 'epoch': 0.61} {'loss': 0.9348, 'learning_rate': 1.5776229415505127e-05, 'epoch': 0.61} {'loss': 0.8757, 'learning_rate': 1.5775962194142088e-05, 'epoch': 0.61} {'loss': 1.0086, 'learning_rate': 1.5775694966589583e-05, 'epoch': 0.61} {'loss': 0.9189, 'learning_rate': 1.57754277328479e-05, 'epoch': 0.61} {'loss': 0.7356, 'learning_rate': 1.5775160492917324e-05, 'epoch': 0.61} {'loss': 0.7674, 'learning_rate': 1.5774893246798145e-05, 'epoch': 0.61} {'loss': 0.7211, 'learning_rate': 1.5774625994490644e-05, 'epoch': 0.61} {'loss': 0.9194, 'learning_rate': 1.577435873599511e-05, 'epoch': 0.61} {'loss': 0.9182, 'learning_rate': 1.5774091471311833e-05, 'epoch': 0.61} {'loss': 0.7267, 'learning_rate': 1.577382420044109e-05, 'epoch': 0.61} {'loss': 0.7481, 'learning_rate': 1.577355692338318e-05, 'epoch': 0.61} {'loss': 0.8634, 'learning_rate': 1.5773289640138377e-05, 'epoch': 0.61} {'loss': 0.8772, 'learning_rate': 1.5773022350706978e-05, 'epoch': 0.61} {'loss': 0.8379, 'learning_rate': 1.577275505508926e-05, 'epoch': 0.61} {'loss': 0.9187, 'learning_rate': 1.5772487753285515e-05, 'epoch': 0.61} {'loss': 0.6219, 'learning_rate': 1.577222044529603e-05, 'epoch': 0.61} {'loss': 0.9717, 'learning_rate': 1.577195313112109e-05, 'epoch': 0.61} {'loss': 0.9913, 'learning_rate': 1.577168581076098e-05, 'epoch': 0.61} {'loss': 0.7344, 'learning_rate': 1.577141848421599e-05, 'epoch': 0.61} {'loss': 0.8933, 'learning_rate': 1.5771151151486403e-05, 'epoch': 0.61} {'loss': 0.9327, 'learning_rate': 1.57708838125725e-05, 'epoch': 0.61} {'loss': 0.8169, 'learning_rate': 1.5770616467474585e-05, 'epoch': 0.61} {'loss': 0.7631, 'learning_rate': 1.5770349116192928e-05, 'epoch': 0.61} {'loss': 1.0329, 'learning_rate': 1.577008175872782e-05, 'epoch': 0.61} {'loss': 0.863, 'learning_rate': 1.576981439507955e-05, 'epoch': 0.61} {'loss': 0.8451, 'learning_rate': 1.5769547025248403e-05, 'epoch': 0.61} {'loss': 1.0097, 'learning_rate': 1.5769279649234668e-05, 'epoch': 0.61} {'loss': 1.0276, 'learning_rate': 1.576901226703863e-05, 'epoch': 0.61} {'loss': 0.9033, 'learning_rate': 1.576874487866057e-05, 'epoch': 0.61} {'loss': 1.0319, 'learning_rate': 1.576847748410078e-05, 'epoch': 0.61} {'loss': 0.8671, 'learning_rate': 1.5768210083359545e-05, 'epoch': 0.61} {'loss': 0.8395, 'learning_rate': 1.5767942676437154e-05, 'epoch': 0.61} {'loss': 0.899, 'learning_rate': 1.5767675263333893e-05, 'epoch': 0.61} {'loss': 0.657, 'learning_rate': 1.5767407844050046e-05, 'epoch': 0.61} {'loss': 1.0327, 'learning_rate': 1.57671404185859e-05, 'epoch': 0.61} {'loss': 0.7192, 'learning_rate': 1.5766872986941746e-05, 'epoch': 0.61} {'loss': 0.7502, 'learning_rate': 1.5766605549117863e-05, 'epoch': 0.61} {'loss': 0.8332, 'learning_rate': 1.5766338105114548e-05, 'epoch': 0.61} {'loss': 1.0678, 'learning_rate': 1.5766070654932074e-05, 'epoch': 0.61} {'loss': 0.8827, 'learning_rate': 1.576580319857074e-05, 'epoch': 0.61} {'loss': 0.8513, 'learning_rate': 1.5765535736030824e-05, 'epoch': 0.61} {'loss': 0.6747, 'learning_rate': 1.5765268267312616e-05, 'epoch': 0.61} {'loss': 0.7318, 'learning_rate': 1.5765000792416404e-05, 'epoch': 0.61} {'loss': 0.9373, 'learning_rate': 1.5764733311342473e-05, 'epoch': 0.61} {'loss': 0.8454, 'learning_rate': 1.576446582409111e-05, 'epoch': 0.61} {'loss': 0.9256, 'learning_rate': 1.5764198330662606e-05, 'epoch': 0.61} {'loss': 0.867, 'learning_rate': 1.5763930831057237e-05, 'epoch': 0.61} {'loss': 0.8064, 'learning_rate': 1.5763663325275297e-05, 'epoch': 0.61} {'loss': 0.9278, 'learning_rate': 1.5763395813317074e-05, 'epoch': 0.61} {'loss': 0.7145, 'learning_rate': 1.576312829518285e-05, 'epoch': 0.61} {'loss': 0.7479, 'learning_rate': 1.5762860770872917e-05, 'epoch': 0.61} {'loss': 0.7748, 'learning_rate': 1.5762593240387552e-05, 'epoch': 0.61} {'loss': 0.8632, 'learning_rate': 1.5762325703727056e-05, 'epoch': 0.61} {'loss': 0.8668, 'learning_rate': 1.5762058160891704e-05, 'epoch': 0.61} {'loss': 0.7215, 'learning_rate': 1.5761790611881783e-05, 'epoch': 0.61} {'loss': 0.7121, 'learning_rate': 1.576152305669759e-05, 'epoch': 0.61} {'loss': 0.8855, 'learning_rate': 1.5761255495339404e-05, 'epoch': 0.61} {'loss': 0.8539, 'learning_rate': 1.5760987927807508e-05, 'epoch': 0.61} {'loss': 0.9979, 'learning_rate': 1.57607203541022e-05, 'epoch': 0.61} {'loss': 0.8951, 'learning_rate': 1.5760452774223755e-05, 'epoch': 0.61} {'loss': 0.9135, 'learning_rate': 1.5760185188172466e-05, 'epoch': 0.61} {'loss': 0.9853, 'learning_rate': 1.575991759594862e-05, 'epoch': 0.61} {'loss': 0.889, 'learning_rate': 1.5759649997552502e-05, 'epoch': 0.61} {'loss': 0.9432, 'learning_rate': 1.5759382392984403e-05, 'epoch': 0.61} {'loss': 0.8611, 'learning_rate': 1.5759114782244598e-05, 'epoch': 0.61} {'loss': 0.7847, 'learning_rate': 1.5758847165333385e-05, 'epoch': 0.61} {'loss': 0.9621, 'learning_rate': 1.575857954225105e-05, 'epoch': 0.61} {'loss': 0.7726, 'learning_rate': 1.5758311912997876e-05, 'epoch': 0.61} {'loss': 0.9518, 'learning_rate': 1.5758044277574148e-05, 'epoch': 0.61} {'loss': 1.0081, 'learning_rate': 1.575777663598016e-05, 'epoch': 0.61} {'loss': 0.6415, 'learning_rate': 1.5757508988216194e-05, 'epoch': 0.61} {'loss': 0.9092, 'learning_rate': 1.5757241334282536e-05, 'epoch': 0.61} {'loss': 0.7882, 'learning_rate': 1.5756973674179474e-05, 'epoch': 0.61} {'loss': 0.8951, 'learning_rate': 1.5756706007907297e-05, 'epoch': 0.61} {'loss': 0.7145, 'learning_rate': 1.5756438335466285e-05, 'epoch': 0.61} {'loss': 0.7593, 'learning_rate': 1.575617065685674e-05, 'epoch': 0.61} {'loss': 0.8165, 'learning_rate': 1.575590297207893e-05, 'epoch': 0.61} {'loss': 0.6886, 'learning_rate': 1.5755635281133154e-05, 'epoch': 0.61} {'loss': 0.8901, 'learning_rate': 1.575536758401969e-05, 'epoch': 0.61} {'loss': 0.7089, 'learning_rate': 1.5755099880738836e-05, 'epoch': 0.61} {'loss': 0.7882, 'learning_rate': 1.575483217129087e-05, 'epoch': 0.61} {'loss': 0.9398, 'learning_rate': 1.5754564455676083e-05, 'epoch': 0.61} {'loss': 0.9562, 'learning_rate': 1.575429673389476e-05, 'epoch': 0.61} {'loss': 0.8395, 'learning_rate': 1.5754029005947192e-05, 'epoch': 0.61} {'loss': 0.9282, 'learning_rate': 1.575376127183366e-05, 'epoch': 0.61} {'loss': 0.9327, 'learning_rate': 1.5753493531554457e-05, 'epoch': 0.61} {'loss': 0.9557, 'learning_rate': 1.575322578510986e-05, 'epoch': 0.61} {'loss': 0.7259, 'learning_rate': 1.5752958032500164e-05, 'epoch': 0.61} {'loss': 0.8889, 'learning_rate': 1.5752690273725658e-05, 'epoch': 0.61} {'loss': 0.8181, 'learning_rate': 1.5752422508786622e-05, 'epoch': 0.61} {'loss': 0.9109, 'learning_rate': 1.575215473768335e-05, 'epoch': 0.61} {'loss': 0.8664, 'learning_rate': 1.575188696041612e-05, 'epoch': 0.61} {'loss': 0.8681, 'learning_rate': 1.5751619176985226e-05, 'epoch': 0.61} {'loss': 0.7858, 'learning_rate': 1.575135138739095e-05, 'epoch': 0.61} {'loss': 0.855, 'learning_rate': 1.575108359163359e-05, 'epoch': 0.61} {'loss': 0.6871, 'learning_rate': 1.5750815789713417e-05, 'epoch': 0.61} {'loss': 0.7547, 'learning_rate': 1.5750547981630728e-05, 'epoch': 0.61} {'loss': 0.8299, 'learning_rate': 1.575028016738581e-05, 'epoch': 0.61} {'loss': 0.7971, 'learning_rate': 1.5750012346978945e-05, 'epoch': 0.61} {'loss': 0.7695, 'learning_rate': 1.5749744520410422e-05, 'epoch': 0.61} {'loss': 0.9513, 'learning_rate': 1.5749476687680534e-05, 'epoch': 0.61} {'loss': 0.7928, 'learning_rate': 1.5749208848789558e-05, 'epoch': 0.61} {'loss': 0.8152, 'learning_rate': 1.5748941003737787e-05, 'epoch': 0.61} {'loss': 1.0166, 'learning_rate': 1.5748673152525507e-05, 'epoch': 0.61} {'loss': 0.5581, 'learning_rate': 1.5748405295153005e-05, 'epoch': 0.61} {'loss': 0.9634, 'learning_rate': 1.5748137431620567e-05, 'epoch': 0.61} {'loss': 0.8743, 'learning_rate': 1.574786956192848e-05, 'epoch': 0.61} {'loss': 0.8125, 'learning_rate': 1.5747601686077037e-05, 'epoch': 0.61} {'loss': 0.7381, 'learning_rate': 1.5747333804066518e-05, 'epoch': 0.61} {'loss': 1.0465, 'learning_rate': 1.5747065915897212e-05, 'epoch': 0.61} {'loss': 0.7, 'learning_rate': 1.5746798021569404e-05, 'epoch': 0.61} {'loss': 0.673, 'learning_rate': 1.5746530121083385e-05, 'epoch': 0.61} {'loss': 0.8568, 'learning_rate': 1.574626221443944e-05, 'epoch': 0.61} {'loss': 0.7507, 'learning_rate': 1.5745994301637857e-05, 'epoch': 0.61} {'loss': 0.9677, 'learning_rate': 1.574572638267892e-05, 'epoch': 0.61} {'loss': 0.8415, 'learning_rate': 1.574545845756292e-05, 'epoch': 0.61} {'loss': 0.9096, 'learning_rate': 1.574519052629014e-05, 'epoch': 0.61} {'loss': 0.7839, 'learning_rate': 1.5744922588860875e-05, 'epoch': 0.61} {'loss': 0.8132, 'learning_rate': 1.5744654645275404e-05, 'epoch': 0.61} {'loss': 0.8389, 'learning_rate': 1.574438669553402e-05, 'epoch': 0.61} {'loss': 0.7192, 'learning_rate': 1.5744118739637003e-05, 'epoch': 0.61} {'loss': 0.9596, 'learning_rate': 1.5743850777584648e-05, 'epoch': 0.61} {'loss': 0.8034, 'learning_rate': 1.5743582809377237e-05, 'epoch': 0.61} {'loss': 0.9299, 'learning_rate': 1.5743314835015058e-05, 'epoch': 0.61} {'loss': 0.8167, 'learning_rate': 1.5743046854498398e-05, 'epoch': 0.61} {'loss': 0.7396, 'learning_rate': 1.5742778867827546e-05, 'epoch': 0.61} {'loss': 0.6498, 'learning_rate': 1.574251087500279e-05, 'epoch': 0.61} {'loss': 0.985, 'learning_rate': 1.5742242876024413e-05, 'epoch': 0.61} {'loss': 0.9031, 'learning_rate': 1.5741974870892708e-05, 'epoch': 0.61} {'loss': 0.9776, 'learning_rate': 1.5741706859607953e-05, 'epoch': 0.61} {'loss': 0.7508, 'learning_rate': 1.574143884217044e-05, 'epoch': 0.61} {'loss': 0.8135, 'learning_rate': 1.5741170818580466e-05, 'epoch': 0.62} {'loss': 0.8373, 'learning_rate': 1.5740902788838303e-05, 'epoch': 0.62} {'loss': 0.8196, 'learning_rate': 1.5740634752944246e-05, 'epoch': 0.62} {'loss': 0.9425, 'learning_rate': 1.574036671089858e-05, 'epoch': 0.62} {'loss': 0.7326, 'learning_rate': 1.5740098662701593e-05, 'epoch': 0.62} {'loss': 0.7541, 'learning_rate': 1.573983060835357e-05, 'epoch': 0.62} {'loss': 0.7188, 'learning_rate': 1.5739562547854802e-05, 'epoch': 0.62} {'loss': 0.8442, 'learning_rate': 1.5739294481205577e-05, 'epoch': 0.62} {'loss': 0.8061, 'learning_rate': 1.573902640840618e-05, 'epoch': 0.62} {'loss': 0.8462, 'learning_rate': 1.5738758329456895e-05, 'epoch': 0.62} {'loss': 0.7583, 'learning_rate': 1.5738490244358015e-05, 'epoch': 0.62} {'loss': 0.7866, 'learning_rate': 1.5738222153109823e-05, 'epoch': 0.62} {'loss': 0.6863, 'learning_rate': 1.573795405571261e-05, 'epoch': 0.62} {'loss': 0.7996, 'learning_rate': 1.5737685952166662e-05, 'epoch': 0.62} {'loss': 0.9151, 'learning_rate': 1.5737417842472264e-05, 'epoch': 0.62} {'loss': 0.7958, 'learning_rate': 1.5737149726629707e-05, 'epoch': 0.62} {'loss': 0.6538, 'learning_rate': 1.573688160463927e-05, 'epoch': 0.62} {'loss': 0.7968, 'learning_rate': 1.573661347650125e-05, 'epoch': 0.62} {'loss': 0.6128, 'learning_rate': 1.5736345342215934e-05, 'epoch': 0.62} {'loss': 0.7482, 'learning_rate': 1.5736077201783604e-05, 'epoch': 0.62} {'loss': 0.8602, 'learning_rate': 1.573580905520455e-05, 'epoch': 0.62} {'loss': 0.9008, 'learning_rate': 1.5735540902479058e-05, 'epoch': 0.62} {'loss': 0.9435, 'learning_rate': 1.5735272743607417e-05, 'epoch': 0.62} {'loss': 0.8169, 'learning_rate': 1.5735004578589916e-05, 'epoch': 0.62} {'loss': 0.9904, 'learning_rate': 1.5734736407426834e-05, 'epoch': 0.62} {'loss': 0.781, 'learning_rate': 1.5734468230118468e-05, 'epoch': 0.62} {'loss': 0.8796, 'learning_rate': 1.57342000466651e-05, 'epoch': 0.62} {'loss': 0.7983, 'learning_rate': 1.573393185706702e-05, 'epoch': 0.62} {'loss': 1.0177, 'learning_rate': 1.5733663661324518e-05, 'epoch': 0.62} {'loss': 0.9334, 'learning_rate': 1.5733395459437874e-05, 'epoch': 0.62} {'loss': 0.9565, 'learning_rate': 1.573312725140738e-05, 'epoch': 0.62} {'loss': 0.8268, 'learning_rate': 1.573285903723332e-05, 'epoch': 0.62} {'loss': 0.7316, 'learning_rate': 1.5732590816915988e-05, 'epoch': 0.62} {'loss': 0.7296, 'learning_rate': 1.5732322590455668e-05, 'epoch': 0.62} {'loss': 0.8458, 'learning_rate': 1.5732054357852645e-05, 'epoch': 0.62} {'loss': 0.8033, 'learning_rate': 1.573178611910721e-05, 'epoch': 0.62} {'loss': 0.7648, 'learning_rate': 1.573151787421965e-05, 'epoch': 0.62} {'loss': 0.7929, 'learning_rate': 1.5731249623190244e-05, 'epoch': 0.62} {'loss': 0.7172, 'learning_rate': 1.5730981366019295e-05, 'epoch': 0.62} {'loss': 0.8484, 'learning_rate': 1.573071310270708e-05, 'epoch': 0.62} {'loss': 0.8373, 'learning_rate': 1.5730444833253888e-05, 'epoch': 0.62} {'loss': 0.9859, 'learning_rate': 1.5730176557660006e-05, 'epoch': 0.62} {'loss': 0.8598, 'learning_rate': 1.572990827592572e-05, 'epoch': 0.62} {'loss': 0.786, 'learning_rate': 1.5729639988051325e-05, 'epoch': 0.62} {'loss': 0.8141, 'learning_rate': 1.5729371694037102e-05, 'epoch': 0.62} {'loss': 0.8325, 'learning_rate': 1.5729103393883344e-05, 'epoch': 0.62} {'loss': 0.9144, 'learning_rate': 1.572883508759033e-05, 'epoch': 0.62} {'loss': 0.9032, 'learning_rate': 1.572856677515835e-05, 'epoch': 0.62} {'loss': 0.8326, 'learning_rate': 1.5728298456587697e-05, 'epoch': 0.62} {'loss': 0.7221, 'learning_rate': 1.5728030131878657e-05, 'epoch': 0.62} {'loss': 0.7667, 'learning_rate': 1.5727761801031515e-05, 'epoch': 0.62} {'loss': 0.9302, 'learning_rate': 1.572749346404656e-05, 'epoch': 0.62} {'loss': 0.6796, 'learning_rate': 1.5727225120924076e-05, 'epoch': 0.62} {'loss': 1.0579, 'learning_rate': 1.5726956771664352e-05, 'epoch': 0.62} {'loss': 0.9194, 'learning_rate': 1.5726688416267678e-05, 'epoch': 0.62} {'loss': 0.8792, 'learning_rate': 1.572642005473434e-05, 'epoch': 0.62} {'loss': 0.9464, 'learning_rate': 1.572615168706463e-05, 'epoch': 0.62} {'loss': 0.9017, 'learning_rate': 1.572588331325883e-05, 'epoch': 0.62} {'loss': 0.7133, 'learning_rate': 1.5725614933317228e-05, 'epoch': 0.62} {'loss': 0.8171, 'learning_rate': 1.5725346547240112e-05, 'epoch': 0.62} {'loss': 0.7332, 'learning_rate': 1.5725078155027774e-05, 'epoch': 0.62} {'loss': 0.7441, 'learning_rate': 1.5724809756680495e-05, 'epoch': 0.62} {'loss': 1.1345, 'learning_rate': 1.5724541352198567e-05, 'epoch': 0.62} {'loss': 0.8682, 'learning_rate': 1.5724272941582276e-05, 'epoch': 0.62} {'loss': 0.9321, 'learning_rate': 1.5724004524831912e-05, 'epoch': 0.62} {'loss': 0.8177, 'learning_rate': 1.5723736101947756e-05, 'epoch': 0.62} {'loss': 0.856, 'learning_rate': 1.57234676729301e-05, 'epoch': 0.62} {'loss': 0.8861, 'learning_rate': 1.5723199237779234e-05, 'epoch': 0.62} {'loss': 0.7576, 'learning_rate': 1.5722930796495445e-05, 'epoch': 0.62} {'loss': 0.8256, 'learning_rate': 1.5722662349079015e-05, 'epoch': 0.62} {'loss': 0.8345, 'learning_rate': 1.5722393895530243e-05, 'epoch': 0.62} {'loss': 0.7931, 'learning_rate': 1.5722125435849404e-05, 'epoch': 0.62} {'loss': 0.9235, 'learning_rate': 1.572185697003679e-05, 'epoch': 0.62} {'loss': 0.8945, 'learning_rate': 1.5721588498092692e-05, 'epoch': 0.62} {'loss': 0.9746, 'learning_rate': 1.5721320020017397e-05, 'epoch': 0.62} {'loss': 0.6871, 'learning_rate': 1.572105153581119e-05, 'epoch': 0.62} {'loss': 0.7208, 'learning_rate': 1.572078304547436e-05, 'epoch': 0.62} {'loss': 0.9312, 'learning_rate': 1.5720514549007195e-05, 'epoch': 0.62} {'loss': 0.8496, 'learning_rate': 1.572024604640998e-05, 'epoch': 0.62} {'loss': 0.8179, 'learning_rate': 1.5719977537683005e-05, 'epoch': 0.62} {'loss': 0.8731, 'learning_rate': 1.571970902282656e-05, 'epoch': 0.62} {'loss': 0.8074, 'learning_rate': 1.5719440501840933e-05, 'epoch': 0.62} {'loss': 0.9968, 'learning_rate': 1.5719171974726404e-05, 'epoch': 0.62} {'loss': 0.9525, 'learning_rate': 1.571890344148327e-05, 'epoch': 0.62} {'loss': 0.711, 'learning_rate': 1.5718634902111812e-05, 'epoch': 0.62} {'loss': 0.8695, 'learning_rate': 1.571836635661232e-05, 'epoch': 0.62} {'loss': 0.8985, 'learning_rate': 1.5718097804985086e-05, 'epoch': 0.62} {'loss': 0.8309, 'learning_rate': 1.5717829247230394e-05, 'epoch': 0.62} {'loss': 0.8784, 'learning_rate': 1.5717560683348527e-05, 'epoch': 0.62} {'loss': 0.7202, 'learning_rate': 1.5717292113339782e-05, 'epoch': 0.62} {'loss': 0.9914, 'learning_rate': 1.5717023537204445e-05, 'epoch': 0.62} {'loss': 0.74, 'learning_rate': 1.5716754954942796e-05, 'epoch': 0.62} {'loss': 0.8406, 'learning_rate': 1.5716486366555127e-05, 'epoch': 0.62} {'loss': 0.763, 'learning_rate': 1.571621777204173e-05, 'epoch': 0.62} {'loss': 0.763, 'learning_rate': 1.5715949171402887e-05, 'epoch': 0.62} {'loss': 0.856, 'learning_rate': 1.5715680564638893e-05, 'epoch': 0.62} {'loss': 0.6946, 'learning_rate': 1.571541195175003e-05, 'epoch': 0.62} {'loss': 0.871, 'learning_rate': 1.5715143332736587e-05, 'epoch': 0.62} {'loss': 0.8952, 'learning_rate': 1.5714874707598852e-05, 'epoch': 0.62} {'loss': 0.9532, 'learning_rate': 1.571460607633711e-05, 'epoch': 0.62} {'loss': 0.8657, 'learning_rate': 1.5714337438951654e-05, 'epoch': 0.62} {'loss': 0.7369, 'learning_rate': 1.571406879544277e-05, 'epoch': 0.62} {'loss': 0.7721, 'learning_rate': 1.5713800145810747e-05, 'epoch': 0.62} {'loss': 0.817, 'learning_rate': 1.571353149005587e-05, 'epoch': 0.62} {'loss': 0.8926, 'learning_rate': 1.571326282817843e-05, 'epoch': 0.62} {'loss': 0.9347, 'learning_rate': 1.571299416017871e-05, 'epoch': 0.62} {'loss': 0.8573, 'learning_rate': 1.5712725486057003e-05, 'epoch': 0.62} {'loss': 0.7417, 'learning_rate': 1.5712456805813595e-05, 'epoch': 0.62} {'loss': 0.8651, 'learning_rate': 1.5712188119448775e-05, 'epoch': 0.62} {'loss': 0.7457, 'learning_rate': 1.5711919426962827e-05, 'epoch': 0.62} {'loss': 0.7822, 'learning_rate': 1.5711650728356046e-05, 'epoch': 0.62} {'loss': 0.666, 'learning_rate': 1.5711382023628713e-05, 'epoch': 0.62} {'loss': 0.9333, 'learning_rate': 1.5711113312781117e-05, 'epoch': 0.62} {'loss': 0.838, 'learning_rate': 1.571084459581355e-05, 'epoch': 0.62} {'loss': 0.8739, 'learning_rate': 1.5710575872726296e-05, 'epoch': 0.62} {'loss': 0.7764, 'learning_rate': 1.5710307143519647e-05, 'epoch': 0.62} {'loss': 0.8173, 'learning_rate': 1.5710038408193886e-05, 'epoch': 0.62} {'loss': 0.7863, 'learning_rate': 1.5709769666749305e-05, 'epoch': 0.62} {'loss': 0.7849, 'learning_rate': 1.5709500919186188e-05, 'epoch': 0.62} {'loss': 0.8481, 'learning_rate': 1.570923216550483e-05, 'epoch': 0.62} {'loss': 0.7882, 'learning_rate': 1.570896340570551e-05, 'epoch': 0.62} {'loss': 0.8707, 'learning_rate': 1.5708694639788523e-05, 'epoch': 0.62} {'loss': 0.8315, 'learning_rate': 1.5708425867754153e-05, 'epoch': 0.62} {'loss': 0.6927, 'learning_rate': 1.570815708960269e-05, 'epoch': 0.62} {'loss': 0.642, 'learning_rate': 1.570788830533442e-05, 'epoch': 0.62} {'loss': 0.8772, 'learning_rate': 1.5707619514949635e-05, 'epoch': 0.62} {'loss': 0.8529, 'learning_rate': 1.570735071844862e-05, 'epoch': 0.62} {'loss': 0.8829, 'learning_rate': 1.5707081915831666e-05, 'epoch': 0.62} {'loss': 0.8409, 'learning_rate': 1.5706813107099055e-05, 'epoch': 0.62} {'loss': 0.7361, 'learning_rate': 1.5706544292251083e-05, 'epoch': 0.62} {'loss': 0.9426, 'learning_rate': 1.5706275471288028e-05, 'epoch': 0.62} {'loss': 0.8074, 'learning_rate': 1.5706006644210184e-05, 'epoch': 0.62} {'loss': 0.7075, 'learning_rate': 1.5705737811017844e-05, 'epoch': 0.62} {'loss': 0.8708, 'learning_rate': 1.5705468971711287e-05, 'epoch': 0.62} {'loss': 0.7709, 'learning_rate': 1.5705200126290807e-05, 'epoch': 0.62} {'loss': 0.6056, 'learning_rate': 1.5704931274756686e-05, 'epoch': 0.62} {'loss': 0.6882, 'learning_rate': 1.5704662417109223e-05, 'epoch': 0.62} {'loss': 0.7352, 'learning_rate': 1.5704393553348697e-05, 'epoch': 0.62} {'loss': 0.7367, 'learning_rate': 1.5704124683475398e-05, 'epoch': 0.62} {'loss': 0.8107, 'learning_rate': 1.570385580748961e-05, 'epoch': 0.62} {'loss': 0.8771, 'learning_rate': 1.570358692539163e-05, 'epoch': 0.62} {'loss': 0.7913, 'learning_rate': 1.5703318037181743e-05, 'epoch': 0.62} {'loss': 0.8363, 'learning_rate': 1.5703049142860237e-05, 'epoch': 0.62} {'loss': 0.901, 'learning_rate': 1.5702780242427392e-05, 'epoch': 0.62} {'loss': 0.63, 'learning_rate': 1.570251133588351e-05, 'epoch': 0.62} {'loss': 0.6758, 'learning_rate': 1.5702242423228867e-05, 'epoch': 0.62} {'loss': 0.8046, 'learning_rate': 1.5701973504463763e-05, 'epoch': 0.62} {'loss': 0.9125, 'learning_rate': 1.5701704579588474e-05, 'epoch': 0.62} {'loss': 0.9283, 'learning_rate': 1.5701435648603297e-05, 'epoch': 0.62} {'loss': 0.799, 'learning_rate': 1.5701166711508518e-05, 'epoch': 0.62} {'loss': 0.8468, 'learning_rate': 1.5700897768304422e-05, 'epoch': 0.62} {'loss': 0.7525, 'learning_rate': 1.5700628818991298e-05, 'epoch': 0.62} {'loss': 0.9376, 'learning_rate': 1.570035986356944e-05, 'epoch': 0.62} {'loss': 1.0107, 'learning_rate': 1.570009090203913e-05, 'epoch': 0.62} {'loss': 0.7041, 'learning_rate': 1.5699821934400658e-05, 'epoch': 0.62} {'loss': 0.8797, 'learning_rate': 1.5699552960654313e-05, 'epoch': 0.62} {'loss': 0.8152, 'learning_rate': 1.5699283980800382e-05, 'epoch': 0.62} {'loss': 0.9177, 'learning_rate': 1.5699014994839155e-05, 'epoch': 0.62} {'loss': 0.6935, 'learning_rate': 1.5698746002770918e-05, 'epoch': 0.62} {'loss': 0.7837, 'learning_rate': 1.569847700459596e-05, 'epoch': 0.62} {'loss': 0.9283, 'learning_rate': 1.569820800031457e-05, 'epoch': 0.62} {'loss': 0.9446, 'learning_rate': 1.5697938989927034e-05, 'epoch': 0.62} {'loss': 0.7005, 'learning_rate': 1.5697669973433643e-05, 'epoch': 0.62} {'loss': 0.6594, 'learning_rate': 1.5697400950834687e-05, 'epoch': 0.62} {'loss': 0.8438, 'learning_rate': 1.569713192213045e-05, 'epoch': 0.62} {'loss': 0.7579, 'learning_rate': 1.5696862887321224e-05, 'epoch': 0.62} {'loss': 0.8583, 'learning_rate': 1.569659384640729e-05, 'epoch': 0.62} {'loss': 0.7488, 'learning_rate': 1.5696324799388943e-05, 'epoch': 0.62} {'loss': 0.881, 'learning_rate': 1.5696055746266473e-05, 'epoch': 0.62} {'loss': 0.734, 'learning_rate': 1.5695786687040165e-05, 'epoch': 0.62} {'loss': 0.9099, 'learning_rate': 1.5695517621710307e-05, 'epoch': 0.62} {'loss': 1.017, 'learning_rate': 1.5695248550277187e-05, 'epoch': 0.62} {'loss': 0.7378, 'learning_rate': 1.5694979472741093e-05, 'epoch': 0.62} {'loss': 0.9921, 'learning_rate': 1.5694710389102316e-05, 'epoch': 0.62} {'loss': 0.8823, 'learning_rate': 1.5694441299361144e-05, 'epoch': 0.62} {'loss': 0.8477, 'learning_rate': 1.569417220351786e-05, 'epoch': 0.62} {'loss': 0.8937, 'learning_rate': 1.569390310157276e-05, 'epoch': 0.62} {'loss': 0.9164, 'learning_rate': 1.569363399352613e-05, 'epoch': 0.62} {'loss': 0.955, 'learning_rate': 1.569336487937825e-05, 'epoch': 0.62} {'loss': 0.752, 'learning_rate': 1.5693095759129423e-05, 'epoch': 0.62} {'loss': 0.9028, 'learning_rate': 1.569282663277993e-05, 'epoch': 0.62} {'loss': 0.8074, 'learning_rate': 1.5692557500330058e-05, 'epoch': 0.62} {'loss': 0.9731, 'learning_rate': 1.5692288361780094e-05, 'epoch': 0.62} {'loss': 1.0104, 'learning_rate': 1.5692019217130333e-05, 'epoch': 0.62} {'loss': 0.854, 'learning_rate': 1.5691750066381058e-05, 'epoch': 0.62} {'loss': 0.8176, 'learning_rate': 1.569148090953256e-05, 'epoch': 0.62} {'loss': 0.7837, 'learning_rate': 1.5691211746585126e-05, 'epoch': 0.62} {'loss': 0.6778, 'learning_rate': 1.5690942577539045e-05, 'epoch': 0.62} {'loss': 0.8569, 'learning_rate': 1.5690673402394604e-05, 'epoch': 0.62} {'loss': 0.8974, 'learning_rate': 1.5690404221152092e-05, 'epoch': 0.62} {'loss': 0.7696, 'learning_rate': 1.5690135033811803e-05, 'epoch': 0.62} {'loss': 0.8491, 'learning_rate': 1.568986584037402e-05, 'epoch': 0.62} {'loss': 0.8089, 'learning_rate': 1.5689596640839028e-05, 'epoch': 0.62} {'loss': 0.8091, 'learning_rate': 1.568932743520712e-05, 'epoch': 0.62} {'loss': 0.9862, 'learning_rate': 1.5689058223478588e-05, 'epoch': 0.62} {'loss': 0.8532, 'learning_rate': 1.5688789005653716e-05, 'epoch': 0.62} {'loss': 0.8255, 'learning_rate': 1.568851978173279e-05, 'epoch': 0.62} {'loss': 0.7779, 'learning_rate': 1.5688250551716103e-05, 'epoch': 0.62} {'loss': 0.8756, 'learning_rate': 1.5687981315603945e-05, 'epoch': 0.62} {'loss': 0.8708, 'learning_rate': 1.5687712073396596e-05, 'epoch': 0.62} {'loss': 0.67, 'learning_rate': 1.5687442825094357e-05, 'epoch': 0.62} {'loss': 0.7929, 'learning_rate': 1.5687173570697505e-05, 'epoch': 0.62} {'loss': 0.7911, 'learning_rate': 1.5686904310206337e-05, 'epoch': 0.62} {'loss': 0.7742, 'learning_rate': 1.5686635043621135e-05, 'epoch': 0.62} {'loss': 0.9246, 'learning_rate': 1.568636577094219e-05, 'epoch': 0.62} {'loss': 0.7238, 'learning_rate': 1.568609649216979e-05, 'epoch': 0.62} {'loss': 0.751, 'learning_rate': 1.5685827207304225e-05, 'epoch': 0.62} {'loss': 0.7666, 'learning_rate': 1.5685557916345782e-05, 'epoch': 0.62} {'loss': 0.7357, 'learning_rate': 1.5685288619294754e-05, 'epoch': 0.62} {'loss': 0.7269, 'learning_rate': 1.5685019316151424e-05, 'epoch': 0.62} {'loss': 0.6565, 'learning_rate': 1.5684750006916084e-05, 'epoch': 0.62} {'loss': 0.8306, 'learning_rate': 1.568448069158902e-05, 'epoch': 0.62} {'loss': 0.8156, 'learning_rate': 1.5684211370170523e-05, 'epoch': 0.62} {'loss': 0.7003, 'learning_rate': 1.5683942042660878e-05, 'epoch': 0.62} {'loss': 0.758, 'learning_rate': 1.5683672709060378e-05, 'epoch': 0.62} {'loss': 0.6836, 'learning_rate': 1.568340336936931e-05, 'epoch': 0.62} {'loss': 0.7528, 'learning_rate': 1.5683134023587962e-05, 'epoch': 0.62} {'loss': 0.856, 'learning_rate': 1.5682864671716626e-05, 'epoch': 0.62} {'loss': 0.8031, 'learning_rate': 1.568259531375558e-05, 'epoch': 0.62} {'loss': 0.5821, 'learning_rate': 1.5682325949705127e-05, 'epoch': 0.62} {'loss': 0.817, 'learning_rate': 1.5682056579565546e-05, 'epoch': 0.62} {'loss': 0.8298, 'learning_rate': 1.5681787203337127e-05, 'epoch': 0.62} {'loss': 0.8373, 'learning_rate': 1.5681517821020164e-05, 'epoch': 0.62} {'loss': 0.7849, 'learning_rate': 1.5681248432614942e-05, 'epoch': 0.62} {'loss': 0.8672, 'learning_rate': 1.5680979038121745e-05, 'epoch': 0.62} {'loss': 0.7756, 'learning_rate': 1.568070963754087e-05, 'epoch': 0.62} {'loss': 0.7755, 'learning_rate': 1.56804402308726e-05, 'epoch': 0.62} {'loss': 0.8921, 'learning_rate': 1.5680170818117225e-05, 'epoch': 0.62} {'loss': 0.9338, 'learning_rate': 1.567990139927504e-05, 'epoch': 0.62} {'loss': 0.6923, 'learning_rate': 1.5679631974346322e-05, 'epoch': 0.62} {'loss': 0.6903, 'learning_rate': 1.5679362543331368e-05, 'epoch': 0.62} {'loss': 0.8726, 'learning_rate': 1.5679093106230462e-05, 'epoch': 0.62} {'loss': 0.7429, 'learning_rate': 1.5678823663043895e-05, 'epoch': 0.62} {'loss': 1.017, 'learning_rate': 1.567855421377196e-05, 'epoch': 0.62} {'loss': 0.8445, 'learning_rate': 1.5678284758414942e-05, 'epoch': 0.62} {'loss': 0.9376, 'learning_rate': 1.5678015296973125e-05, 'epoch': 0.62} {'loss': 0.9407, 'learning_rate': 1.5677745829446806e-05, 'epoch': 0.62} {'loss': 0.7908, 'learning_rate': 1.5677476355836266e-05, 'epoch': 0.62} {'loss': 0.9609, 'learning_rate': 1.56772068761418e-05, 'epoch': 0.62} {'loss': 0.9314, 'learning_rate': 1.5676937390363692e-05, 'epoch': 0.62} {'loss': 0.9298, 'learning_rate': 1.567666789850224e-05, 'epoch': 0.62} {'loss': 0.904, 'learning_rate': 1.567639840055772e-05, 'epoch': 0.62} {'loss': 0.77, 'learning_rate': 1.5676128896530426e-05, 'epoch': 0.62} {'loss': 0.8144, 'learning_rate': 1.567585938642065e-05, 'epoch': 0.62} {'loss': 0.558, 'learning_rate': 1.567558987022868e-05, 'epoch': 0.62} {'loss': 0.7312, 'learning_rate': 1.56753203479548e-05, 'epoch': 0.62} {'loss': 0.6752, 'learning_rate': 1.5675050819599303e-05, 'epoch': 0.62} {'loss': 0.806, 'learning_rate': 1.5674781285162477e-05, 'epoch': 0.62} {'loss': 1.0196, 'learning_rate': 1.5674511744644608e-05, 'epoch': 0.62} {'loss': 1.0026, 'learning_rate': 1.567424219804599e-05, 'epoch': 0.62} {'loss': 0.8344, 'learning_rate': 1.5673972645366914e-05, 'epoch': 0.62} {'loss': 0.94, 'learning_rate': 1.567370308660766e-05, 'epoch': 0.62} {'loss': 0.9076, 'learning_rate': 1.567343352176852e-05, 'epoch': 0.62} {'loss': 0.6889, 'learning_rate': 1.5673163950849784e-05, 'epoch': 0.62} {'loss': 0.9911, 'learning_rate': 1.567289437385174e-05, 'epoch': 0.62} {'loss': 0.9635, 'learning_rate': 1.567262479077468e-05, 'epoch': 0.62} {'loss': 0.6666, 'learning_rate': 1.567235520161889e-05, 'epoch': 0.62} {'loss': 1.0343, 'learning_rate': 1.567208560638466e-05, 'epoch': 0.62} {'loss': 0.8318, 'learning_rate': 1.567181600507228e-05, 'epoch': 0.62} {'loss': 0.9861, 'learning_rate': 1.5671546397682033e-05, 'epoch': 0.62} {'loss': 0.885, 'learning_rate': 1.5671276784214214e-05, 'epoch': 0.62} {'loss': 0.7641, 'learning_rate': 1.567100716466911e-05, 'epoch': 0.62} {'loss': 0.9673, 'learning_rate': 1.567073753904701e-05, 'epoch': 0.62} {'loss': 1.0023, 'learning_rate': 1.5670467907348203e-05, 'epoch': 0.62} {'loss': 0.9093, 'learning_rate': 1.5670198269572974e-05, 'epoch': 0.62} {'loss': 0.8394, 'learning_rate': 1.5669928625721623e-05, 'epoch': 0.62} {'loss': 0.9172, 'learning_rate': 1.566965897579443e-05, 'epoch': 0.62} {'loss': 0.8316, 'learning_rate': 1.566938931979168e-05, 'epoch': 0.62} {'loss': 0.8494, 'learning_rate': 1.5669119657713674e-05, 'epoch': 0.62} {'loss': 0.819, 'learning_rate': 1.566884998956069e-05, 'epoch': 0.62} {'loss': 1.093, 'learning_rate': 1.5668580315333025e-05, 'epoch': 0.62} {'loss': 0.8221, 'learning_rate': 1.5668310635030966e-05, 'epoch': 0.62} {'loss': 0.9565, 'learning_rate': 1.5668040948654796e-05, 'epoch': 0.62} {'loss': 0.8086, 'learning_rate': 1.566777125620481e-05, 'epoch': 0.62} {'loss': 0.7206, 'learning_rate': 1.5667501557681297e-05, 'epoch': 0.62} {'loss': 0.6487, 'learning_rate': 1.5667231853084543e-05, 'epoch': 0.62} {'loss': 0.8576, 'learning_rate': 1.5666962142414838e-05, 'epoch': 0.62} {'loss': 0.9134, 'learning_rate': 1.5666692425672472e-05, 'epoch': 0.62} {'loss': 0.9118, 'learning_rate': 1.5666422702857738e-05, 'epoch': 0.62} {'loss': 0.8495, 'learning_rate': 1.5666152973970915e-05, 'epoch': 0.62} {'loss': 0.7732, 'learning_rate': 1.56658832390123e-05, 'epoch': 0.62} {'loss': 0.7498, 'learning_rate': 1.5665613497982183e-05, 'epoch': 0.62} {'loss': 0.8275, 'learning_rate': 1.5665343750880845e-05, 'epoch': 0.62} {'loss': 0.9818, 'learning_rate': 1.566507399770858e-05, 'epoch': 0.62} {'loss': 0.7549, 'learning_rate': 1.5664804238465677e-05, 'epoch': 0.62} {'loss': 0.6884, 'learning_rate': 1.566453447315243e-05, 'epoch': 0.62} {'loss': 0.9174, 'learning_rate': 1.5664264701769118e-05, 'epoch': 0.62} {'loss': 0.9793, 'learning_rate': 1.566399492431603e-05, 'epoch': 0.62} {'loss': 1.0459, 'learning_rate': 1.566372514079347e-05, 'epoch': 0.62} {'loss': 0.713, 'learning_rate': 1.5663455351201714e-05, 'epoch': 0.62} {'loss': 0.8476, 'learning_rate': 1.5663185555541055e-05, 'epoch': 0.62} {'loss': 0.8601, 'learning_rate': 1.566291575381178e-05, 'epoch': 0.62} {'loss': 0.6807, 'learning_rate': 1.566264594601418e-05, 'epoch': 0.62} {'loss': 0.883, 'learning_rate': 1.5662376132148543e-05, 'epoch': 0.62} {'loss': 0.9494, 'learning_rate': 1.5662106312215162e-05, 'epoch': 0.62} {'loss': 0.9609, 'learning_rate': 1.566183648621432e-05, 'epoch': 0.62} {'loss': 0.8797, 'learning_rate': 1.566156665414631e-05, 'epoch': 0.62} {'loss': 0.6422, 'learning_rate': 1.5661296816011424e-05, 'epoch': 0.62} {'loss': 0.7819, 'learning_rate': 1.5661026971809942e-05, 'epoch': 0.62} {'loss': 0.93, 'learning_rate': 1.5660757121542164e-05, 'epoch': 0.62} {'loss': 0.8606, 'learning_rate': 1.566048726520837e-05, 'epoch': 0.62} {'loss': 0.9041, 'learning_rate': 1.5660217402808852e-05, 'epoch': 0.62} {'loss': 0.7428, 'learning_rate': 1.56599475343439e-05, 'epoch': 0.62} {'loss': 0.8112, 'learning_rate': 1.565967765981381e-05, 'epoch': 0.62} {'loss': 0.9886, 'learning_rate': 1.5659407779218856e-05, 'epoch': 0.62} {'loss': 0.8633, 'learning_rate': 1.565913789255934e-05, 'epoch': 0.62} {'loss': 0.8917, 'learning_rate': 1.5658867999835546e-05, 'epoch': 0.62} {'loss': 0.8627, 'learning_rate': 1.5658598101047765e-05, 'epoch': 0.62} {'loss': 0.7794, 'learning_rate': 1.5658328196196285e-05, 'epoch': 0.62} {'loss': 0.9616, 'learning_rate': 1.5658058285281398e-05, 'epoch': 0.62} {'loss': 0.9426, 'learning_rate': 1.5657788368303388e-05, 'epoch': 0.62} {'loss': 0.8501, 'learning_rate': 1.5657518445262547e-05, 'epoch': 0.62} {'loss': 0.784, 'learning_rate': 1.5657248516159165e-05, 'epoch': 0.62} {'loss': 0.8746, 'learning_rate': 1.565697858099353e-05, 'epoch': 0.62} {'loss': 0.7222, 'learning_rate': 1.5656708639765934e-05, 'epoch': 0.62} {'loss': 0.9881, 'learning_rate': 1.565643869247666e-05, 'epoch': 0.62} {'loss': 0.6918, 'learning_rate': 1.565616873912601e-05, 'epoch': 0.62} {'loss': 0.8451, 'learning_rate': 1.5655898779714257e-05, 'epoch': 0.62} {'loss': 0.7865, 'learning_rate': 1.5655628814241696e-05, 'epoch': 0.62} {'loss': 0.8683, 'learning_rate': 1.5655358842708625e-05, 'epoch': 0.62} {'loss': 0.8499, 'learning_rate': 1.565508886511532e-05, 'epoch': 0.62} {'loss': 0.7744, 'learning_rate': 1.5654818881462083e-05, 'epoch': 0.62} {'loss': 0.7618, 'learning_rate': 1.5654548891749194e-05, 'epoch': 0.62} {'loss': 0.8494, 'learning_rate': 1.5654278895976947e-05, 'epoch': 0.62} {'loss': 0.7824, 'learning_rate': 1.565400889414563e-05, 'epoch': 0.62} {'loss': 0.7483, 'learning_rate': 1.565373888625553e-05, 'epoch': 0.62} {'loss': 1.0067, 'learning_rate': 1.565346887230694e-05, 'epoch': 0.62} {'loss': 0.9382, 'learning_rate': 1.565319885230015e-05, 'epoch': 0.62} {'loss': 0.8784, 'learning_rate': 1.5652928826235446e-05, 'epoch': 0.62} {'loss': 0.7661, 'learning_rate': 1.5652658794113116e-05, 'epoch': 0.62} {'loss': 0.6275, 'learning_rate': 1.5652388755933453e-05, 'epoch': 0.62} {'loss': 0.8479, 'learning_rate': 1.5652118711696745e-05, 'epoch': 0.62} {'loss': 0.9399, 'learning_rate': 1.565184866140328e-05, 'epoch': 0.62} {'loss': 0.7803, 'learning_rate': 1.565157860505335e-05, 'epoch': 0.62} {'loss': 0.6961, 'learning_rate': 1.565130854264725e-05, 'epoch': 0.62} {'loss': 0.7161, 'learning_rate': 1.5651038474185256e-05, 'epoch': 0.62} {'loss': 0.7579, 'learning_rate': 1.5650768399667663e-05, 'epoch': 0.62} {'loss': 0.7437, 'learning_rate': 1.5650498319094767e-05, 'epoch': 0.62} {'loss': 0.904, 'learning_rate': 1.565022823246685e-05, 'epoch': 0.62} {'loss': 0.801, 'learning_rate': 1.5649958139784203e-05, 'epoch': 0.62} {'loss': 0.9499, 'learning_rate': 1.5649688041047116e-05, 'epoch': 0.62} {'loss': 0.9042, 'learning_rate': 1.5649417936255877e-05, 'epoch': 0.62} {'loss': 0.9384, 'learning_rate': 1.564914782541078e-05, 'epoch': 0.62} {'loss': 0.974, 'learning_rate': 1.564887770851211e-05, 'epoch': 0.62} {'loss': 0.782, 'learning_rate': 1.5648607585560155e-05, 'epoch': 0.62} {'loss': 0.7466, 'learning_rate': 1.5648337456555206e-05, 'epoch': 0.62} {'loss': 0.9098, 'learning_rate': 1.564806732149756e-05, 'epoch': 0.62} {'loss': 0.777, 'learning_rate': 1.56477971803875e-05, 'epoch': 0.62} {'loss': 0.8564, 'learning_rate': 1.564752703322531e-05, 'epoch': 0.62} {'loss': 0.7785, 'learning_rate': 1.564725688001129e-05, 'epoch': 0.62} {'loss': 0.8913, 'learning_rate': 1.564698672074572e-05, 'epoch': 0.62} {'loss': 1.0284, 'learning_rate': 1.5646716555428896e-05, 'epoch': 0.62} {'loss': 0.7999, 'learning_rate': 1.5646446384061102e-05, 'epoch': 0.62} {'loss': 0.8605, 'learning_rate': 1.564617620664264e-05, 'epoch': 0.62} {'loss': 0.6966, 'learning_rate': 1.5645906023173783e-05, 'epoch': 0.62} {'loss': 0.7585, 'learning_rate': 1.564563583365483e-05, 'epoch': 0.62} {'loss': 0.9151, 'learning_rate': 1.564536563808607e-05, 'epoch': 0.62} {'loss': 0.8243, 'learning_rate': 1.564509543646779e-05, 'epoch': 0.62} {'loss': 0.7967, 'learning_rate': 1.564482522880028e-05, 'epoch': 0.62} {'loss': 0.695, 'learning_rate': 1.5644555015083833e-05, 'epoch': 0.62} {'loss': 0.6337, 'learning_rate': 1.5644284795318735e-05, 'epoch': 0.62} {'loss': 0.7023, 'learning_rate': 1.5644014569505275e-05, 'epoch': 0.62} {'loss': 0.9429, 'learning_rate': 1.5643744337643743e-05, 'epoch': 0.62} {'loss': 0.9673, 'learning_rate': 1.564347409973443e-05, 'epoch': 0.62} {'loss': 0.8827, 'learning_rate': 1.5643203855777625e-05, 'epoch': 0.62} {'loss': 0.9239, 'learning_rate': 1.564293360577362e-05, 'epoch': 0.62} {'loss': 0.6536, 'learning_rate': 1.5642663349722703e-05, 'epoch': 0.62} {'loss': 0.7614, 'learning_rate': 1.5642393087625164e-05, 'epoch': 0.62} {'loss': 0.6608, 'learning_rate': 1.5642122819481287e-05, 'epoch': 0.62} {'loss': 0.8491, 'learning_rate': 1.5641852545291367e-05, 'epoch': 0.62} {'loss': 0.7155, 'learning_rate': 1.5641582265055695e-05, 'epoch': 0.62} {'loss': 0.8563, 'learning_rate': 1.5641311978774555e-05, 'epoch': 0.62} {'loss': 0.969, 'learning_rate': 1.5641041686448244e-05, 'epoch': 0.62} {'loss': 0.788, 'learning_rate': 1.5640771388077047e-05, 'epoch': 0.62} {'loss': 0.8078, 'learning_rate': 1.564050108366125e-05, 'epoch': 0.62} {'loss': 0.8847, 'learning_rate': 1.5640230773201153e-05, 'epoch': 0.62} {'loss': 0.8577, 'learning_rate': 1.5639960456697038e-05, 'epoch': 0.62} {'loss': 0.6834, 'learning_rate': 1.5639690134149193e-05, 'epoch': 0.62} {'loss': 0.7553, 'learning_rate': 1.5639419805557915e-05, 'epoch': 0.62} {'loss': 0.9396, 'learning_rate': 1.5639149470923486e-05, 'epoch': 0.62} {'loss': 0.7174, 'learning_rate': 1.5638879130246203e-05, 'epoch': 0.62} {'loss': 0.6924, 'learning_rate': 1.5638608783526352e-05, 'epoch': 0.62} {'loss': 0.811, 'learning_rate': 1.563833843076422e-05, 'epoch': 0.62} {'loss': 0.8407, 'learning_rate': 1.56380680719601e-05, 'epoch': 0.62} {'loss': 0.6497, 'learning_rate': 1.563779770711428e-05, 'epoch': 0.62} {'loss': 0.8247, 'learning_rate': 1.5637527336227056e-05, 'epoch': 0.62} {'loss': 0.8999, 'learning_rate': 1.563725695929871e-05, 'epoch': 0.62} {'loss': 0.9372, 'learning_rate': 1.5636986576329533e-05, 'epoch': 0.62} {'loss': 0.9817, 'learning_rate': 1.5636716187319814e-05, 'epoch': 0.62} {'loss': 0.9059, 'learning_rate': 1.563644579226985e-05, 'epoch': 0.62} {'loss': 0.7838, 'learning_rate': 1.5636175391179923e-05, 'epoch': 0.62} {'loss': 0.8638, 'learning_rate': 1.5635904984050326e-05, 'epoch': 0.62} {'loss': 0.7148, 'learning_rate': 1.5635634570881348e-05, 'epoch': 0.62} {'loss': 0.7141, 'learning_rate': 1.5635364151673278e-05, 'epoch': 0.62} {'loss': 0.817, 'learning_rate': 1.563509372642641e-05, 'epoch': 0.62} {'loss': 0.8116, 'learning_rate': 1.563482329514103e-05, 'epoch': 0.62} {'loss': 0.802, 'learning_rate': 1.563455285781742e-05, 'epoch': 0.62} {'loss': 0.845, 'learning_rate': 1.563428241445589e-05, 'epoch': 0.62} {'loss': 0.7048, 'learning_rate': 1.563401196505671e-05, 'epoch': 0.62} {'loss': 0.7653, 'learning_rate': 1.5633741509620183e-05, 'epoch': 0.62} {'loss': 0.8376, 'learning_rate': 1.5633471048146585e-05, 'epoch': 0.62} {'loss': 0.936, 'learning_rate': 1.563320058063622e-05, 'epoch': 0.62} {'loss': 0.9476, 'learning_rate': 1.5632930107089372e-05, 'epoch': 0.62} {'loss': 0.6601, 'learning_rate': 1.5632659627506336e-05, 'epoch': 0.62} {'loss': 0.9658, 'learning_rate': 1.5632389141887386e-05, 'epoch': 0.62} {'loss': 0.7891, 'learning_rate': 1.563211865023283e-05, 'epoch': 0.62} {'loss': 0.7946, 'learning_rate': 1.563184815254295e-05, 'epoch': 0.62} {'loss': 0.7638, 'learning_rate': 1.5631577648818034e-05, 'epoch': 0.62} {'loss': 0.8021, 'learning_rate': 1.5631307139058374e-05, 'epoch': 0.62} {'loss': 0.8757, 'learning_rate': 1.5631036623264263e-05, 'epoch': 0.62} {'loss': 0.951, 'learning_rate': 1.563076610143599e-05, 'epoch': 0.62} {'loss': 0.9587, 'learning_rate': 1.5630495573573837e-05, 'epoch': 0.62} {'loss': 0.9893, 'learning_rate': 1.5630225039678103e-05, 'epoch': 0.62} {'loss': 0.8699, 'learning_rate': 1.5629954499749075e-05, 'epoch': 0.62} {'loss': 0.9249, 'learning_rate': 1.562968395378704e-05, 'epoch': 0.62} {'loss': 0.9291, 'learning_rate': 1.5629413401792293e-05, 'epoch': 0.62} {'loss': 0.6628, 'learning_rate': 1.5629142843765122e-05, 'epoch': 0.62} {'loss': 0.7247, 'learning_rate': 1.5628872279705816e-05, 'epoch': 0.62} {'loss': 0.8872, 'learning_rate': 1.5628601709614663e-05, 'epoch': 0.62} {'loss': 0.7548, 'learning_rate': 1.5628331133491958e-05, 'epoch': 0.62} {'loss': 0.6279, 'learning_rate': 1.5628060551337985e-05, 'epoch': 0.62} {'loss': 0.903, 'learning_rate': 1.562778996315304e-05, 'epoch': 0.62} {'loss': 0.9084, 'learning_rate': 1.562751936893741e-05, 'epoch': 0.62} {'loss': 0.8922, 'learning_rate': 1.5627248768691385e-05, 'epoch': 0.62} {'loss': 0.7974, 'learning_rate': 1.5626978162415252e-05, 'epoch': 0.62} {'loss': 0.8672, 'learning_rate': 1.5626707550109305e-05, 'epoch': 0.62} {'loss': 0.8534, 'learning_rate': 1.5626436931773835e-05, 'epoch': 0.62} {'loss': 0.7628, 'learning_rate': 1.562616630740913e-05, 'epoch': 0.62} {'loss': 0.8602, 'learning_rate': 1.562589567701548e-05, 'epoch': 0.62} {'loss': 0.8125, 'learning_rate': 1.5625625040593173e-05, 'epoch': 0.62} {'loss': 0.8803, 'learning_rate': 1.5625354398142506e-05, 'epoch': 0.62} {'loss': 0.9898, 'learning_rate': 1.562508374966376e-05, 'epoch': 0.62} {'loss': 0.8539, 'learning_rate': 1.562481309515723e-05, 'epoch': 0.62} {'loss': 0.7486, 'learning_rate': 1.56245424346232e-05, 'epoch': 0.62} {'loss': 0.7839, 'learning_rate': 1.562427176806197e-05, 'epoch': 0.62} {'loss': 0.81, 'learning_rate': 1.5624001095473828e-05, 'epoch': 0.62} {'loss': 0.8784, 'learning_rate': 1.562373041685906e-05, 'epoch': 0.62} {'loss': 0.8018, 'learning_rate': 1.5623459732217955e-05, 'epoch': 0.62} {'loss': 0.8284, 'learning_rate': 1.5623189041550804e-05, 'epoch': 0.62} {'loss': 0.8037, 'learning_rate': 1.56229183448579e-05, 'epoch': 0.62} {'loss': 0.7025, 'learning_rate': 1.562264764213953e-05, 'epoch': 0.62} {'loss': 0.8943, 'learning_rate': 1.562237693339599e-05, 'epoch': 0.62} {'loss': 0.7451, 'learning_rate': 1.5622106218627563e-05, 'epoch': 0.62} {'loss': 0.8659, 'learning_rate': 1.562183549783454e-05, 'epoch': 0.62} {'loss': 0.7728, 'learning_rate': 1.5621564771017217e-05, 'epoch': 0.62} {'loss': 0.8293, 'learning_rate': 1.5621294038175876e-05, 'epoch': 0.62} {'loss': 0.9371, 'learning_rate': 1.5621023299310813e-05, 'epoch': 0.62} {'loss': 0.9235, 'learning_rate': 1.5620752554422315e-05, 'epoch': 0.62} {'loss': 0.7486, 'learning_rate': 1.5620481803510675e-05, 'epoch': 0.62} {'loss': 0.9142, 'learning_rate': 1.562021104657618e-05, 'epoch': 0.62} {'loss': 0.7737, 'learning_rate': 1.561994028361912e-05, 'epoch': 0.62} {'loss': 0.784, 'learning_rate': 1.561966951463979e-05, 'epoch': 0.62} {'loss': 0.6566, 'learning_rate': 1.561939873963848e-05, 'epoch': 0.62} {'loss': 0.8933, 'learning_rate': 1.561912795861547e-05, 'epoch': 0.62} {'loss': 0.7306, 'learning_rate': 1.561885717157106e-05, 'epoch': 0.62} {'loss': 0.8654, 'learning_rate': 1.5618586378505537e-05, 'epoch': 0.62} {'loss': 0.9103, 'learning_rate': 1.5618315579419193e-05, 'epoch': 0.62} {'loss': 0.968, 'learning_rate': 1.5618044774312315e-05, 'epoch': 0.62} {'loss': 0.568, 'learning_rate': 1.5617773963185197e-05, 'epoch': 0.62} {'loss': 0.9182, 'learning_rate': 1.5617503146038125e-05, 'epoch': 0.62} {'loss': 0.7571, 'learning_rate': 1.5617232322871393e-05, 'epoch': 0.62} {'loss': 0.7886, 'learning_rate': 1.561696149368529e-05, 'epoch': 0.62} {'loss': 0.6674, 'learning_rate': 1.5616690658480105e-05, 'epoch': 0.62} {'loss': 0.8496, 'learning_rate': 1.5616419817256128e-05, 'epoch': 0.62} {'loss': 0.8811, 'learning_rate': 1.5616148970013653e-05, 'epoch': 0.62} {'loss': 0.9437, 'learning_rate': 1.5615878116752962e-05, 'epoch': 0.62} {'loss': 0.8333, 'learning_rate': 1.5615607257474356e-05, 'epoch': 0.62} {'loss': 0.9681, 'learning_rate': 1.561533639217812e-05, 'epoch': 0.62} {'loss': 1.0021, 'learning_rate': 1.5615065520864544e-05, 'epoch': 0.62} {'loss': 0.8742, 'learning_rate': 1.5614794643533914e-05, 'epoch': 0.62} {'loss': 0.8471, 'learning_rate': 1.5614523760186528e-05, 'epoch': 0.62} {'loss': 0.8579, 'learning_rate': 1.5614252870822673e-05, 'epoch': 0.62} {'loss': 0.9491, 'learning_rate': 1.561398197544264e-05, 'epoch': 0.62} {'loss': 0.9636, 'learning_rate': 1.561371107404672e-05, 'epoch': 0.62} {'loss': 0.9543, 'learning_rate': 1.5613440166635197e-05, 'epoch': 0.62} {'loss': 0.7629, 'learning_rate': 1.561316925320837e-05, 'epoch': 0.62} {'loss': 0.847, 'learning_rate': 1.5612898333766525e-05, 'epoch': 0.62} {'loss': 0.8505, 'learning_rate': 1.561262740830995e-05, 'epoch': 0.62} {'loss': 0.8329, 'learning_rate': 1.5612356476838942e-05, 'epoch': 0.62} {'loss': 0.8119, 'learning_rate': 1.5612085539353787e-05, 'epoch': 0.62} {'loss': 0.8944, 'learning_rate': 1.5611814595854773e-05, 'epoch': 0.62} {'loss': 0.836, 'learning_rate': 1.5611543646342194e-05, 'epoch': 0.63} {'loss': 0.7074, 'learning_rate': 1.5611272690816342e-05, 'epoch': 0.63} {'loss': 0.882, 'learning_rate': 1.56110017292775e-05, 'epoch': 0.63} {'loss': 0.965, 'learning_rate': 1.561073076172597e-05, 'epoch': 0.63} {'loss': 0.6941, 'learning_rate': 1.5610459788162033e-05, 'epoch': 0.63} {'loss': 0.9383, 'learning_rate': 1.561018880858598e-05, 'epoch': 0.63} {'loss': 0.7491, 'learning_rate': 1.5609917822998104e-05, 'epoch': 0.63} {'loss': 0.7737, 'learning_rate': 1.5609646831398694e-05, 'epoch': 0.63} {'loss': 0.7878, 'learning_rate': 1.5609375833788044e-05, 'epoch': 0.63} {'loss': 0.6989, 'learning_rate': 1.5609104830166438e-05, 'epoch': 0.63} {'loss': 0.768, 'learning_rate': 1.5608833820534174e-05, 'epoch': 0.63} {'loss': 0.7519, 'learning_rate': 1.5608562804891534e-05, 'epoch': 0.63} {'loss': 0.7927, 'learning_rate': 1.560829178323882e-05, 'epoch': 0.63} {'loss': 0.8532, 'learning_rate': 1.5608020755576308e-05, 'epoch': 0.63} {'loss': 0.8272, 'learning_rate': 1.5607749721904294e-05, 'epoch': 0.63} {'loss': 0.847, 'learning_rate': 1.5607478682223076e-05, 'epoch': 0.63} {'loss': 0.7807, 'learning_rate': 1.5607207636532935e-05, 'epoch': 0.63} {'loss': 1.024, 'learning_rate': 1.560693658483417e-05, 'epoch': 0.63} {'loss': 0.9158, 'learning_rate': 1.560666552712706e-05, 'epoch': 0.63} {'loss': 0.8918, 'learning_rate': 1.5606394463411905e-05, 'epoch': 0.63} {'loss': 0.6305, 'learning_rate': 1.5606123393688994e-05, 'epoch': 0.63} {'loss': 0.9274, 'learning_rate': 1.560585231795861e-05, 'epoch': 0.63} {'loss': 0.9332, 'learning_rate': 1.5605581236221053e-05, 'epoch': 0.63} {'loss': 0.914, 'learning_rate': 1.560531014847661e-05, 'epoch': 0.63} {'loss': 0.7557, 'learning_rate': 1.5605039054725573e-05, 'epoch': 0.63} {'loss': 0.7949, 'learning_rate': 1.5604767954968228e-05, 'epoch': 0.63} {'loss': 0.9358, 'learning_rate': 1.560449684920487e-05, 'epoch': 0.63} {'loss': 0.8881, 'learning_rate': 1.560422573743578e-05, 'epoch': 0.63} {'loss': 0.8373, 'learning_rate': 1.5603954619661267e-05, 'epoch': 0.63} {'loss': 0.782, 'learning_rate': 1.5603683495881606e-05, 'epoch': 0.63} {'loss': 0.8368, 'learning_rate': 1.5603412366097096e-05, 'epoch': 0.63} {'loss': 0.8941, 'learning_rate': 1.560314123030802e-05, 'epoch': 0.63} {'loss': 0.8145, 'learning_rate': 1.5602870088514673e-05, 'epoch': 0.63} {'loss': 1.0611, 'learning_rate': 1.5602598940717342e-05, 'epoch': 0.63} {'loss': 0.9242, 'learning_rate': 1.5602327786916327e-05, 'epoch': 0.63} {'loss': 0.6245, 'learning_rate': 1.560205662711191e-05, 'epoch': 0.63} {'loss': 0.9379, 'learning_rate': 1.5601785461304385e-05, 'epoch': 0.63} {'loss': 0.7823, 'learning_rate': 1.5601514289494036e-05, 'epoch': 0.63} {'loss': 0.84, 'learning_rate': 1.5601243111681162e-05, 'epoch': 0.63} {'loss': 0.8398, 'learning_rate': 1.560097192786605e-05, 'epoch': 0.63} {'loss': 0.7565, 'learning_rate': 1.5600700738048994e-05, 'epoch': 0.63} {'loss': 0.8892, 'learning_rate': 1.5600429542230276e-05, 'epoch': 0.63} {'loss': 0.6973, 'learning_rate': 1.5600158340410197e-05, 'epoch': 0.63} {'loss': 0.6765, 'learning_rate': 1.5599887132589043e-05, 'epoch': 0.63} {'loss': 0.7971, 'learning_rate': 1.55996159187671e-05, 'epoch': 0.63} {'loss': 0.8213, 'learning_rate': 1.5599344698944668e-05, 'epoch': 0.63} {'loss': 0.8937, 'learning_rate': 1.559907347312203e-05, 'epoch': 0.63} {'loss': 0.9241, 'learning_rate': 1.559880224129948e-05, 'epoch': 0.63} {'loss': 0.798, 'learning_rate': 1.5598531003477312e-05, 'epoch': 0.63} {'loss': 1.0236, 'learning_rate': 1.5598259759655804e-05, 'epoch': 0.63} {'loss': 0.8309, 'learning_rate': 1.5597988509835263e-05, 'epoch': 0.63} {'loss': 0.7335, 'learning_rate': 1.559771725401597e-05, 'epoch': 0.63} {'loss': 0.8187, 'learning_rate': 1.5597445992198217e-05, 'epoch': 0.63} {'loss': 0.8749, 'learning_rate': 1.5597174724382294e-05, 'epoch': 0.63} {'loss': 0.8096, 'learning_rate': 1.5596903450568498e-05, 'epoch': 0.63} {'loss': 0.771, 'learning_rate': 1.559663217075711e-05, 'epoch': 0.63} {'loss': 0.7957, 'learning_rate': 1.5596360884948428e-05, 'epoch': 0.63} {'loss': 0.8777, 'learning_rate': 1.5596089593142737e-05, 'epoch': 0.63} {'loss': 0.8161, 'learning_rate': 1.559581829534033e-05, 'epoch': 0.63} {'loss': 0.7865, 'learning_rate': 1.5595546991541507e-05, 'epoch': 0.63} {'loss': 0.9241, 'learning_rate': 1.5595275681746544e-05, 'epoch': 0.63} {'loss': 0.9658, 'learning_rate': 1.559500436595574e-05, 'epoch': 0.63} {'loss': 0.8077, 'learning_rate': 1.5594733044169382e-05, 'epoch': 0.63} {'loss': 0.9442, 'learning_rate': 1.5594461716387766e-05, 'epoch': 0.63} {'loss': 0.9347, 'learning_rate': 1.5594190382611176e-05, 'epoch': 0.63} {'loss': 0.8844, 'learning_rate': 1.5593919042839906e-05, 'epoch': 0.63} {'loss': 0.8855, 'learning_rate': 1.559364769707425e-05, 'epoch': 0.63} {'loss': 0.8519, 'learning_rate': 1.5593376345314495e-05, 'epoch': 0.63} {'loss': 0.9467, 'learning_rate': 1.559310498756093e-05, 'epoch': 0.63} {'loss': 0.7029, 'learning_rate': 1.5592833623813848e-05, 'epoch': 0.63} {'loss': 0.9381, 'learning_rate': 1.5592562254073543e-05, 'epoch': 0.63} {'loss': 0.8769, 'learning_rate': 1.55922908783403e-05, 'epoch': 0.63} {'loss': 0.8614, 'learning_rate': 1.5592019496614415e-05, 'epoch': 0.63} {'loss': 0.8384, 'learning_rate': 1.5591748108896175e-05, 'epoch': 0.63} {'loss': 0.9573, 'learning_rate': 1.5591476715185875e-05, 'epoch': 0.63} {'loss': 0.9109, 'learning_rate': 1.55912053154838e-05, 'epoch': 0.63} {'loss': 0.9485, 'learning_rate': 1.559093390979024e-05, 'epoch': 0.63} {'loss': 0.7833, 'learning_rate': 1.5590662498105493e-05, 'epoch': 0.63} {'loss': 0.7939, 'learning_rate': 1.559039108042985e-05, 'epoch': 0.63} {'loss': 1.0181, 'learning_rate': 1.5590119656763594e-05, 'epoch': 0.63} {'loss': 0.951, 'learning_rate': 1.5589848227107022e-05, 'epoch': 0.63} {'loss': 0.7703, 'learning_rate': 1.5589576791460425e-05, 'epoch': 0.63} {'loss': 0.9775, 'learning_rate': 1.558930534982409e-05, 'epoch': 0.63} {'loss': 0.7951, 'learning_rate': 1.558903390219831e-05, 'epoch': 0.63} {'loss': 0.7449, 'learning_rate': 1.5588762448583375e-05, 'epoch': 0.63} {'loss': 0.6256, 'learning_rate': 1.5588490988979576e-05, 'epoch': 0.63} {'loss': 0.8825, 'learning_rate': 1.5588219523387207e-05, 'epoch': 0.63} {'loss': 0.8102, 'learning_rate': 1.5587948051806556e-05, 'epoch': 0.63} {'loss': 0.9683, 'learning_rate': 1.5587676574237917e-05, 'epoch': 0.63} {'loss': 0.9021, 'learning_rate': 1.558740509068157e-05, 'epoch': 0.63} {'loss': 0.7857, 'learning_rate': 1.558713360113782e-05, 'epoch': 0.63} {'loss': 0.8241, 'learning_rate': 1.558686210560695e-05, 'epoch': 0.63} {'loss': 0.7662, 'learning_rate': 1.5586590604089255e-05, 'epoch': 0.63} {'loss': 0.8513, 'learning_rate': 1.5586319096585024e-05, 'epoch': 0.63} {'loss': 0.9698, 'learning_rate': 1.5586047583094548e-05, 'epoch': 0.63} {'loss': 0.8628, 'learning_rate': 1.5585776063618117e-05, 'epoch': 0.63} {'loss': 0.7656, 'learning_rate': 1.558550453815602e-05, 'epoch': 0.63} {'loss': 0.896, 'learning_rate': 1.5585233006708557e-05, 'epoch': 0.63} {'loss': 0.7733, 'learning_rate': 1.5584961469276006e-05, 'epoch': 0.63} {'loss': 0.7629, 'learning_rate': 1.558468992585867e-05, 'epoch': 0.63} {'loss': 0.8933, 'learning_rate': 1.5584418376456833e-05, 'epoch': 0.63} {'loss': 0.7265, 'learning_rate': 1.5584146821070786e-05, 'epoch': 0.63} {'loss': 0.8265, 'learning_rate': 1.558387525970082e-05, 'epoch': 0.63} {'loss': 0.8417, 'learning_rate': 1.5583603692347234e-05, 'epoch': 0.63} {'loss': 1.0299, 'learning_rate': 1.558333211901031e-05, 'epoch': 0.63} {'loss': 0.7191, 'learning_rate': 1.558306053969034e-05, 'epoch': 0.63} {'loss': 0.5515, 'learning_rate': 1.5582788954387614e-05, 'epoch': 0.63} {'loss': 0.8792, 'learning_rate': 1.5582517363102433e-05, 'epoch': 0.63} {'loss': 0.7202, 'learning_rate': 1.558224576583508e-05, 'epoch': 0.63} {'loss': 0.9765, 'learning_rate': 1.558197416258584e-05, 'epoch': 0.63} {'loss': 0.9159, 'learning_rate': 1.5581702553355012e-05, 'epoch': 0.63} {'loss': 0.7497, 'learning_rate': 1.5581430938142893e-05, 'epoch': 0.63} {'loss': 0.811, 'learning_rate': 1.5581159316949765e-05, 'epoch': 0.63} {'loss': 0.7602, 'learning_rate': 1.5580887689775917e-05, 'epoch': 0.63} {'loss': 0.7998, 'learning_rate': 1.5580616056621644e-05, 'epoch': 0.63} {'loss': 0.8312, 'learning_rate': 1.558034441748724e-05, 'epoch': 0.63} {'loss': 0.9274, 'learning_rate': 1.558007277237299e-05, 'epoch': 0.63} {'loss': 0.9082, 'learning_rate': 1.5579801121279196e-05, 'epoch': 0.63} {'loss': 1.0007, 'learning_rate': 1.5579529464206132e-05, 'epoch': 0.63} {'loss': 0.832, 'learning_rate': 1.5579257801154106e-05, 'epoch': 0.63} {'loss': 0.7808, 'learning_rate': 1.55789861321234e-05, 'epoch': 0.63} {'loss': 0.9398, 'learning_rate': 1.5578714457114302e-05, 'epoch': 0.63} {'loss': 0.6571, 'learning_rate': 1.5578442776127112e-05, 'epoch': 0.63} {'loss': 0.6954, 'learning_rate': 1.5578171089162117e-05, 'epoch': 0.63} {'loss': 0.8097, 'learning_rate': 1.557789939621961e-05, 'epoch': 0.63} {'loss': 0.917, 'learning_rate': 1.557762769729988e-05, 'epoch': 0.63} {'loss': 0.6721, 'learning_rate': 1.5577355992403213e-05, 'epoch': 0.63} {'loss': 0.8468, 'learning_rate': 1.557708428152991e-05, 'epoch': 0.63} {'loss': 0.8838, 'learning_rate': 1.5576812564680256e-05, 'epoch': 0.63} {'loss': 0.9468, 'learning_rate': 1.5576540841854545e-05, 'epoch': 0.63} {'loss': 0.8692, 'learning_rate': 1.5576269113053068e-05, 'epoch': 0.63} {'loss': 0.7885, 'learning_rate': 1.5575997378276115e-05, 'epoch': 0.63} {'loss': 0.8924, 'learning_rate': 1.557572563752398e-05, 'epoch': 0.63} {'loss': 0.7835, 'learning_rate': 1.5575453890796946e-05, 'epoch': 0.63} {'loss': 0.7607, 'learning_rate': 1.5575182138095312e-05, 'epoch': 0.63} {'loss': 0.8594, 'learning_rate': 1.557491037941937e-05, 'epoch': 0.63} {'loss': 0.8529, 'learning_rate': 1.5574638614769407e-05, 'epoch': 0.63} {'loss': 0.8192, 'learning_rate': 1.5574366844145715e-05, 'epoch': 0.63} {'loss': 0.7593, 'learning_rate': 1.5574095067548584e-05, 'epoch': 0.63} {'loss': 0.8401, 'learning_rate': 1.557382328497831e-05, 'epoch': 0.63} {'loss': 0.9877, 'learning_rate': 1.557355149643518e-05, 'epoch': 0.63} {'loss': 0.9705, 'learning_rate': 1.5573279701919484e-05, 'epoch': 0.63} {'loss': 0.8429, 'learning_rate': 1.557300790143152e-05, 'epoch': 0.63} {'loss': 0.8522, 'learning_rate': 1.5572736094971576e-05, 'epoch': 0.63} {'loss': 0.8202, 'learning_rate': 1.5572464282539937e-05, 'epoch': 0.63} {'loss': 0.7047, 'learning_rate': 1.5572192464136905e-05, 'epoch': 0.63} {'loss': 0.8678, 'learning_rate': 1.5571920639762762e-05, 'epoch': 0.63} {'loss': 0.7578, 'learning_rate': 1.5571648809417803e-05, 'epoch': 0.63} {'loss': 0.7595, 'learning_rate': 1.557137697310232e-05, 'epoch': 0.63} {'loss': 0.8712, 'learning_rate': 1.5571105130816606e-05, 'epoch': 0.63} {'loss': 0.6174, 'learning_rate': 1.557083328256095e-05, 'epoch': 0.63} {'loss': 0.832, 'learning_rate': 1.557056142833564e-05, 'epoch': 0.63} {'loss': 0.6972, 'learning_rate': 1.5570289568140972e-05, 'epoch': 0.63} {'loss': 0.9472, 'learning_rate': 1.557001770197724e-05, 'epoch': 0.63} {'loss': 0.7206, 'learning_rate': 1.556974582984473e-05, 'epoch': 0.63} {'loss': 0.8374, 'learning_rate': 1.556947395174373e-05, 'epoch': 0.63} {'loss': 0.7605, 'learning_rate': 1.556920206767454e-05, 'epoch': 0.63} {'loss': 0.8083, 'learning_rate': 1.5568930177637444e-05, 'epoch': 0.63} {'loss': 0.8689, 'learning_rate': 1.5568658281632736e-05, 'epoch': 0.63} {'loss': 0.7662, 'learning_rate': 1.5568386379660713e-05, 'epoch': 0.63} {'loss': 0.874, 'learning_rate': 1.5568114471721657e-05, 'epoch': 0.63} {'loss': 0.6706, 'learning_rate': 1.5567842557815867e-05, 'epoch': 0.63} {'loss': 0.7756, 'learning_rate': 1.556757063794363e-05, 'epoch': 0.63} {'loss': 0.854, 'learning_rate': 1.5567298712105237e-05, 'epoch': 0.63} {'loss': 0.8123, 'learning_rate': 1.5567026780300984e-05, 'epoch': 0.63} {'loss': 0.7468, 'learning_rate': 1.556675484253116e-05, 'epoch': 0.63} {'loss': 0.7181, 'learning_rate': 1.556648289879605e-05, 'epoch': 0.63} {'loss': 0.9147, 'learning_rate': 1.5566210949095956e-05, 'epoch': 0.63} {'loss': 0.846, 'learning_rate': 1.5565938993431164e-05, 'epoch': 0.63} {'loss': 0.9514, 'learning_rate': 1.5565667031801966e-05, 'epoch': 0.63} {'loss': 0.7749, 'learning_rate': 1.556539506420865e-05, 'epoch': 0.63} {'loss': 0.6335, 'learning_rate': 1.5565123090651517e-05, 'epoch': 0.63} {'loss': 0.8177, 'learning_rate': 1.5564851111130845e-05, 'epoch': 0.63} {'loss': 0.7312, 'learning_rate': 1.5564579125646935e-05, 'epoch': 0.63} {'loss': 0.857, 'learning_rate': 1.556430713420008e-05, 'epoch': 0.63} {'loss': 0.8049, 'learning_rate': 1.5564035136790567e-05, 'epoch': 0.63} {'loss': 0.8122, 'learning_rate': 1.5563763133418684e-05, 'epoch': 0.63} {'loss': 0.8878, 'learning_rate': 1.5563491124084733e-05, 'epoch': 0.63} {'loss': 0.7461, 'learning_rate': 1.5563219108788994e-05, 'epoch': 0.63} {'loss': 0.8103, 'learning_rate': 1.5562947087531766e-05, 'epoch': 0.63} {'loss': 0.9163, 'learning_rate': 1.5562675060313338e-05, 'epoch': 0.63} {'loss': 0.9975, 'learning_rate': 1.5562403027134003e-05, 'epoch': 0.63} {'loss': 0.7471, 'learning_rate': 1.5562130987994046e-05, 'epoch': 0.63} {'loss': 0.7091, 'learning_rate': 1.5561858942893766e-05, 'epoch': 0.63} {'loss': 0.7379, 'learning_rate': 1.5561586891833454e-05, 'epoch': 0.63} {'loss': 0.8948, 'learning_rate': 1.5561314834813397e-05, 'epoch': 0.63} {'loss': 0.8027, 'learning_rate': 1.556104277183389e-05, 'epoch': 0.63} {'loss': 0.7408, 'learning_rate': 1.5560770702895224e-05, 'epoch': 0.63} {'loss': 0.9017, 'learning_rate': 1.5560498627997694e-05, 'epoch': 0.63} {'loss': 0.7672, 'learning_rate': 1.5560226547141584e-05, 'epoch': 0.63} {'loss': 0.8929, 'learning_rate': 1.5559954460327188e-05, 'epoch': 0.63} {'loss': 0.8797, 'learning_rate': 1.5559682367554803e-05, 'epoch': 0.63} {'loss': 0.7038, 'learning_rate': 1.5559410268824713e-05, 'epoch': 0.63} {'loss': 0.7063, 'learning_rate': 1.5559138164137217e-05, 'epoch': 0.63} {'loss': 0.7658, 'learning_rate': 1.55588660534926e-05, 'epoch': 0.63} {'loss': 0.8143, 'learning_rate': 1.5558593936891157e-05, 'epoch': 0.63} {'loss': 0.8136, 'learning_rate': 1.5558321814333177e-05, 'epoch': 0.63} {'loss': 0.7394, 'learning_rate': 1.5558049685818955e-05, 'epoch': 0.63} {'loss': 0.7631, 'learning_rate': 1.5557777551348784e-05, 'epoch': 0.63} {'loss': 0.9834, 'learning_rate': 1.555750541092295e-05, 'epoch': 0.63} {'loss': 0.8001, 'learning_rate': 1.5557233264541743e-05, 'epoch': 0.63} {'loss': 0.9076, 'learning_rate': 1.5556961112205465e-05, 'epoch': 0.63} {'loss': 0.7683, 'learning_rate': 1.55566889539144e-05, 'epoch': 0.63} {'loss': 0.8306, 'learning_rate': 1.5556416789668843e-05, 'epoch': 0.63} {'loss': 0.7979, 'learning_rate': 1.5556144619469078e-05, 'epoch': 0.63} {'loss': 0.6834, 'learning_rate': 1.555587244331541e-05, 'epoch': 0.63} {'loss': 0.8932, 'learning_rate': 1.555560026120812e-05, 'epoch': 0.63} {'loss': 0.9804, 'learning_rate': 1.5555328073147502e-05, 'epoch': 0.63} {'loss': 0.6453, 'learning_rate': 1.555505587913385e-05, 'epoch': 0.63} {'loss': 0.8984, 'learning_rate': 1.5554783679167452e-05, 'epoch': 0.63} {'loss': 0.7649, 'learning_rate': 1.5554511473248602e-05, 'epoch': 0.63} {'loss': 0.8561, 'learning_rate': 1.5554239261377594e-05, 'epoch': 0.63} {'loss': 0.8804, 'learning_rate': 1.555396704355472e-05, 'epoch': 0.63} {'loss': 0.9592, 'learning_rate': 1.5553694819780262e-05, 'epoch': 0.63} {'loss': 0.9802, 'learning_rate': 1.5553422590054524e-05, 'epoch': 0.63} {'loss': 0.7728, 'learning_rate': 1.555315035437779e-05, 'epoch': 0.63} {'loss': 0.7686, 'learning_rate': 1.5552878112750356e-05, 'epoch': 0.63} {'loss': 0.8255, 'learning_rate': 1.555260586517251e-05, 'epoch': 0.63} {'loss': 0.8107, 'learning_rate': 1.5552333611644548e-05, 'epoch': 0.63} {'loss': 1.0501, 'learning_rate': 1.5552061352166758e-05, 'epoch': 0.63} {'loss': 0.8615, 'learning_rate': 1.5551789086739432e-05, 'epoch': 0.63} {'loss': 0.789, 'learning_rate': 1.5551516815362865e-05, 'epoch': 0.63} {'loss': 0.8226, 'learning_rate': 1.5551244538037346e-05, 'epoch': 0.63} {'loss': 0.9288, 'learning_rate': 1.5550972254763164e-05, 'epoch': 0.63} {'loss': 0.7241, 'learning_rate': 1.555069996554062e-05, 'epoch': 0.63} {'loss': 0.9015, 'learning_rate': 1.5550427670369996e-05, 'epoch': 0.63} {'loss': 0.9241, 'learning_rate': 1.555015536925159e-05, 'epoch': 0.63} {'loss': 0.8623, 'learning_rate': 1.554988306218569e-05, 'epoch': 0.63} {'loss': 0.8916, 'learning_rate': 1.554961074917259e-05, 'epoch': 0.63} {'loss': 0.8964, 'learning_rate': 1.5549338430212582e-05, 'epoch': 0.63} {'loss': 0.8744, 'learning_rate': 1.554906610530596e-05, 'epoch': 0.63} {'loss': 0.9031, 'learning_rate': 1.5548793774453005e-05, 'epoch': 0.63} {'loss': 0.9528, 'learning_rate': 1.5548521437654022e-05, 'epoch': 0.63} {'loss': 0.7569, 'learning_rate': 1.5548249094909295e-05, 'epoch': 0.63} {'loss': 0.9116, 'learning_rate': 1.554797674621912e-05, 'epoch': 0.63} {'loss': 0.6977, 'learning_rate': 1.5547704391583787e-05, 'epoch': 0.63} {'loss': 0.9329, 'learning_rate': 1.5547432031003585e-05, 'epoch': 0.63} {'loss': 0.73, 'learning_rate': 1.5547159664478818e-05, 'epoch': 0.63} {'loss': 0.7752, 'learning_rate': 1.554688729200976e-05, 'epoch': 0.63} {'loss': 0.953, 'learning_rate': 1.5546614913596712e-05, 'epoch': 0.63} {'loss': 0.9221, 'learning_rate': 1.554634252923997e-05, 'epoch': 0.63} {'loss': 0.7728, 'learning_rate': 1.554607013893982e-05, 'epoch': 0.63} {'loss': 0.9985, 'learning_rate': 1.554579774269655e-05, 'epoch': 0.63} {'loss': 0.7174, 'learning_rate': 1.5545525340510464e-05, 'epoch': 0.63} {'loss': 0.7106, 'learning_rate': 1.5545252932381844e-05, 'epoch': 0.63} {'loss': 1.0706, 'learning_rate': 1.5544980518310987e-05, 'epoch': 0.63} {'loss': 0.8377, 'learning_rate': 1.554470809829818e-05, 'epoch': 0.63} {'loss': 0.689, 'learning_rate': 1.554443567234372e-05, 'epoch': 0.63} {'loss': 0.8337, 'learning_rate': 1.5544163240447895e-05, 'epoch': 0.63} {'loss': 0.8618, 'learning_rate': 1.5543890802611e-05, 'epoch': 0.63} {'loss': 0.7826, 'learning_rate': 1.5543618358833325e-05, 'epoch': 0.63} {'loss': 0.8284, 'learning_rate': 1.5543345909115167e-05, 'epoch': 0.63} {'loss': 0.6649, 'learning_rate': 1.5543073453456808e-05, 'epoch': 0.63} {'loss': 0.797, 'learning_rate': 1.5542800991858545e-05, 'epoch': 0.63} {'loss': 0.8216, 'learning_rate': 1.554252852432067e-05, 'epoch': 0.63} {'loss': 0.7916, 'learning_rate': 1.554225605084348e-05, 'epoch': 0.63} {'loss': 0.9785, 'learning_rate': 1.5541983571427262e-05, 'epoch': 0.63} {'loss': 0.9536, 'learning_rate': 1.5541711086072307e-05, 'epoch': 0.63} {'loss': 0.7201, 'learning_rate': 1.554143859477891e-05, 'epoch': 0.63} {'loss': 0.8816, 'learning_rate': 1.5541166097547357e-05, 'epoch': 0.63} {'loss': 0.8967, 'learning_rate': 1.5540893594377947e-05, 'epoch': 0.63} {'loss': 0.6724, 'learning_rate': 1.554062108527097e-05, 'epoch': 0.63} {'loss': 0.9338, 'learning_rate': 1.554034857022672e-05, 'epoch': 0.63} {'loss': 0.6919, 'learning_rate': 1.554007604924548e-05, 'epoch': 0.63} {'loss': 0.9436, 'learning_rate': 1.553980352232755e-05, 'epoch': 0.63} {'loss': 0.8977, 'learning_rate': 1.5539530989473224e-05, 'epoch': 0.63} {'loss': 0.8245, 'learning_rate': 1.553925845068279e-05, 'epoch': 0.63} {'loss': 0.8274, 'learning_rate': 1.553898590595654e-05, 'epoch': 0.63} {'loss': 0.9366, 'learning_rate': 1.553871335529477e-05, 'epoch': 0.63} {'loss': 0.9415, 'learning_rate': 1.553844079869776e-05, 'epoch': 0.63} {'loss': 0.7187, 'learning_rate': 1.5538168236165815e-05, 'epoch': 0.63} {'loss': 0.7958, 'learning_rate': 1.5537895667699225e-05, 'epoch': 0.63} {'loss': 0.8408, 'learning_rate': 1.553762309329828e-05, 'epoch': 0.63} {'loss': 0.8794, 'learning_rate': 1.553735051296327e-05, 'epoch': 0.63} {'loss': 0.86, 'learning_rate': 1.553707792669449e-05, 'epoch': 0.63} {'loss': 0.677, 'learning_rate': 1.553680533449223e-05, 'epoch': 0.63} {'loss': 0.8201, 'learning_rate': 1.5536532736356783e-05, 'epoch': 0.63} {'loss': 0.8065, 'learning_rate': 1.5536260132288443e-05, 'epoch': 0.63} {'loss': 0.9012, 'learning_rate': 1.55359875222875e-05, 'epoch': 0.63} {'loss': 0.8317, 'learning_rate': 1.553571490635425e-05, 'epoch': 0.63} {'loss': 0.7066, 'learning_rate': 1.5535442284488977e-05, 'epoch': 0.63} {'loss': 0.8854, 'learning_rate': 1.553516965669198e-05, 'epoch': 0.63} {'loss': 0.8273, 'learning_rate': 1.5534897022963552e-05, 'epoch': 0.63} {'loss': 0.9598, 'learning_rate': 1.553462438330398e-05, 'epoch': 0.63} {'loss': 0.8639, 'learning_rate': 1.5534351737713555e-05, 'epoch': 0.63} {'loss': 1.0387, 'learning_rate': 1.553407908619258e-05, 'epoch': 0.63} {'loss': 0.8696, 'learning_rate': 1.553380642874133e-05, 'epoch': 0.63} {'loss': 0.7006, 'learning_rate': 1.5533533765360113e-05, 'epoch': 0.63} {'loss': 0.8394, 'learning_rate': 1.5533261096049215e-05, 'epoch': 0.63} {'loss': 0.8433, 'learning_rate': 1.553298842080893e-05, 'epoch': 0.63} {'loss': 0.8781, 'learning_rate': 1.5532715739639543e-05, 'epoch': 0.63} {'loss': 0.842, 'learning_rate': 1.5532443052541354e-05, 'epoch': 0.63} {'loss': 0.6809, 'learning_rate': 1.5532170359514655e-05, 'epoch': 0.63} {'loss': 0.9, 'learning_rate': 1.5531897660559736e-05, 'epoch': 0.63} {'loss': 0.9498, 'learning_rate': 1.5531624955676887e-05, 'epoch': 0.63} {'loss': 0.7026, 'learning_rate': 1.5531352244866404e-05, 'epoch': 0.63} {'loss': 0.8087, 'learning_rate': 1.553107952812858e-05, 'epoch': 0.63} {'loss': 0.9564, 'learning_rate': 1.55308068054637e-05, 'epoch': 0.63} {'loss': 1.0571, 'learning_rate': 1.5530534076872065e-05, 'epoch': 0.63} {'loss': 0.7738, 'learning_rate': 1.5530261342353962e-05, 'epoch': 0.63} {'loss': 0.8087, 'learning_rate': 1.552998860190969e-05, 'epoch': 0.63} {'loss': 0.8379, 'learning_rate': 1.552971585553953e-05, 'epoch': 0.63} {'loss': 0.8116, 'learning_rate': 1.552944310324378e-05, 'epoch': 0.63} {'loss': 0.8327, 'learning_rate': 1.5529170345022735e-05, 'epoch': 0.63} {'loss': 0.8842, 'learning_rate': 1.5528897580876684e-05, 'epoch': 0.63} {'loss': 0.9109, 'learning_rate': 1.5528624810805922e-05, 'epoch': 0.63} {'loss': 0.7268, 'learning_rate': 1.552835203481074e-05, 'epoch': 0.63} {'loss': 0.8745, 'learning_rate': 1.5528079252891428e-05, 'epoch': 0.63} {'loss': 0.7767, 'learning_rate': 1.5527806465048278e-05, 'epoch': 0.63} {'loss': 0.6716, 'learning_rate': 1.552753367128159e-05, 'epoch': 0.63} {'loss': 0.6936, 'learning_rate': 1.5527260871591648e-05, 'epoch': 0.63} {'loss': 0.9446, 'learning_rate': 1.5526988065978743e-05, 'epoch': 0.63} {'loss': 0.8392, 'learning_rate': 1.5526715254443177e-05, 'epoch': 0.63} {'loss': 0.8464, 'learning_rate': 1.5526442436985235e-05, 'epoch': 0.63} {'loss': 0.8185, 'learning_rate': 1.552616961360521e-05, 'epoch': 0.63} {'loss': 0.6753, 'learning_rate': 1.5525896784303397e-05, 'epoch': 0.63} {'loss': 0.7557, 'learning_rate': 1.5525623949080087e-05, 'epoch': 0.63} {'loss': 0.9351, 'learning_rate': 1.5525351107935574e-05, 'epoch': 0.63} {'loss': 0.7368, 'learning_rate': 1.5525078260870147e-05, 'epoch': 0.63} {'loss': 0.7629, 'learning_rate': 1.55248054078841e-05, 'epoch': 0.63} {'loss': 0.8903, 'learning_rate': 1.552453254897772e-05, 'epoch': 0.63} {'loss': 0.7096, 'learning_rate': 1.552425968415131e-05, 'epoch': 0.63} {'loss': 0.8343, 'learning_rate': 1.5523986813405157e-05, 'epoch': 0.63} {'loss': 0.7496, 'learning_rate': 1.5523713936739554e-05, 'epoch': 0.63} {'loss': 0.7702, 'learning_rate': 1.552344105415479e-05, 'epoch': 0.63} {'loss': 0.7494, 'learning_rate': 1.5523168165651164e-05, 'epoch': 0.63} {'loss': 0.916, 'learning_rate': 1.5522895271228965e-05, 'epoch': 0.63} {'loss': 0.7886, 'learning_rate': 1.5522622370888483e-05, 'epoch': 0.63} {'loss': 0.9258, 'learning_rate': 1.5522349464630012e-05, 'epoch': 0.63} {'loss': 0.9301, 'learning_rate': 1.5522076552453848e-05, 'epoch': 0.63} {'loss': 0.802, 'learning_rate': 1.5521803634360277e-05, 'epoch': 0.63} {'loss': 0.7677, 'learning_rate': 1.5521530710349598e-05, 'epoch': 0.63} {'loss': 0.6686, 'learning_rate': 1.5521257780422102e-05, 'epoch': 0.63} {'loss': 0.7161, 'learning_rate': 1.5520984844578072e-05, 'epoch': 0.63} {'loss': 0.9358, 'learning_rate': 1.5520711902817818e-05, 'epoch': 0.63} {'loss': 0.7469, 'learning_rate': 1.5520438955141618e-05, 'epoch': 0.63} {'loss': 0.792, 'learning_rate': 1.552016600154977e-05, 'epoch': 0.63} {'loss': 0.851, 'learning_rate': 1.5519893042042563e-05, 'epoch': 0.63} {'loss': 0.873, 'learning_rate': 1.5519620076620297e-05, 'epoch': 0.63} {'loss': 0.8768, 'learning_rate': 1.551934710528326e-05, 'epoch': 0.63} {'loss': 0.9085, 'learning_rate': 1.5519074128031745e-05, 'epoch': 0.63} {'loss': 0.8468, 'learning_rate': 1.551880114486604e-05, 'epoch': 0.63} {'loss': 0.8201, 'learning_rate': 1.5518528155786442e-05, 'epoch': 0.63} {'loss': 0.746, 'learning_rate': 1.5518255160793244e-05, 'epoch': 0.63} {'loss': 0.683, 'learning_rate': 1.551798215988674e-05, 'epoch': 0.63} {'loss': 0.8289, 'learning_rate': 1.5517709153067216e-05, 'epoch': 0.63} {'loss': 0.8384, 'learning_rate': 1.5517436140334972e-05, 'epoch': 0.63} {'loss': 0.9812, 'learning_rate': 1.5517163121690293e-05, 'epoch': 0.63} {'loss': 0.7742, 'learning_rate': 1.551689009713348e-05, 'epoch': 0.63} {'loss': 0.7581, 'learning_rate': 1.551661706666482e-05, 'epoch': 0.63} {'loss': 0.8357, 'learning_rate': 1.5516344030284605e-05, 'epoch': 0.63} {'loss': 0.752, 'learning_rate': 1.551607098799313e-05, 'epoch': 0.63} {'loss': 0.9695, 'learning_rate': 1.5515797939790692e-05, 'epoch': 0.63} {'loss': 0.7952, 'learning_rate': 1.551552488567757e-05, 'epoch': 0.63} {'loss': 0.7876, 'learning_rate': 1.5515251825654072e-05, 'epoch': 0.63} {'loss': 0.9198, 'learning_rate': 1.5514978759720482e-05, 'epoch': 0.63} {'loss': 0.6528, 'learning_rate': 1.5514705687877096e-05, 'epoch': 0.63} {'loss': 0.6291, 'learning_rate': 1.5514432610124204e-05, 'epoch': 0.63} {'loss': 0.7911, 'learning_rate': 1.55141595264621e-05, 'epoch': 0.63} {'loss': 0.84, 'learning_rate': 1.5513886436891075e-05, 'epoch': 0.63} {'loss': 1.0689, 'learning_rate': 1.5513613341411424e-05, 'epoch': 0.63} {'loss': 0.878, 'learning_rate': 1.551334024002344e-05, 'epoch': 0.63} {'loss': 0.6066, 'learning_rate': 1.5513067132727412e-05, 'epoch': 0.63} {'loss': 0.8101, 'learning_rate': 1.5512794019523637e-05, 'epoch': 0.63} {'loss': 0.8433, 'learning_rate': 1.5512520900412404e-05, 'epoch': 0.63} {'loss': 0.6255, 'learning_rate': 1.5512247775394006e-05, 'epoch': 0.63} {'loss': 0.9009, 'learning_rate': 1.551197464446874e-05, 'epoch': 0.63} {'loss': 0.8236, 'learning_rate': 1.5511701507636893e-05, 'epoch': 0.63} {'loss': 0.6546, 'learning_rate': 1.5511428364898763e-05, 'epoch': 0.63} {'loss': 0.8181, 'learning_rate': 1.5511155216254642e-05, 'epoch': 0.63} {'loss': 0.8671, 'learning_rate': 1.5510882061704814e-05, 'epoch': 0.63} {'loss': 0.981, 'learning_rate': 1.5510608901249584e-05, 'epoch': 0.63} {'loss': 0.9722, 'learning_rate': 1.5510335734889236e-05, 'epoch': 0.63} {'loss': 0.8636, 'learning_rate': 1.5510062562624066e-05, 'epoch': 0.63} {'loss': 0.7843, 'learning_rate': 1.550978938445437e-05, 'epoch': 0.63} {'loss': 0.8401, 'learning_rate': 1.5509516200380438e-05, 'epoch': 0.63} {'loss': 0.8616, 'learning_rate': 1.5509243010402555e-05, 'epoch': 0.63} {'loss': 0.769, 'learning_rate': 1.5508969814521026e-05, 'epoch': 0.63} {'loss': 0.9, 'learning_rate': 1.5508696612736138e-05, 'epoch': 0.63} {'loss': 0.8474, 'learning_rate': 1.5508423405048186e-05, 'epoch': 0.63} {'loss': 0.8094, 'learning_rate': 1.5508150191457457e-05, 'epoch': 0.63} {'loss': 0.9102, 'learning_rate': 1.5507876971964254e-05, 'epoch': 0.63} {'loss': 0.6941, 'learning_rate': 1.550760374656886e-05, 'epoch': 0.63} {'loss': 0.8092, 'learning_rate': 1.550733051527157e-05, 'epoch': 0.63} {'loss': 0.7178, 'learning_rate': 1.5507057278072682e-05, 'epoch': 0.63} {'loss': 0.739, 'learning_rate': 1.550678403497248e-05, 'epoch': 0.63} {'loss': 0.7105, 'learning_rate': 1.5506510785971266e-05, 'epoch': 0.63} {'loss': 0.661, 'learning_rate': 1.5506237531069328e-05, 'epoch': 0.63} {'loss': 0.8927, 'learning_rate': 1.550596427026696e-05, 'epoch': 0.63} {'loss': 0.7072, 'learning_rate': 1.5505691003564455e-05, 'epoch': 0.63} {'loss': 0.7701, 'learning_rate': 1.5505417730962104e-05, 'epoch': 0.63} {'loss': 0.8948, 'learning_rate': 1.5505144452460198e-05, 'epoch': 0.63} {'loss': 0.9202, 'learning_rate': 1.5504871168059033e-05, 'epoch': 0.63} {'loss': 1.0064, 'learning_rate': 1.5504597877758904e-05, 'epoch': 0.63} {'loss': 0.8217, 'learning_rate': 1.5504324581560105e-05, 'epoch': 0.63} {'loss': 0.8654, 'learning_rate': 1.550405127946292e-05, 'epoch': 0.63} {'loss': 0.8631, 'learning_rate': 1.550377797146765e-05, 'epoch': 0.63} {'loss': 0.8327, 'learning_rate': 1.5503504657574583e-05, 'epoch': 0.63} {'loss': 0.7086, 'learning_rate': 1.5503231337784016e-05, 'epoch': 0.63} {'loss': 0.7904, 'learning_rate': 1.550295801209624e-05, 'epoch': 0.63} {'loss': 0.8224, 'learning_rate': 1.5502684680511548e-05, 'epoch': 0.63} {'loss': 0.8869, 'learning_rate': 1.5502411343030233e-05, 'epoch': 0.63} {'loss': 0.8179, 'learning_rate': 1.5502137999652587e-05, 'epoch': 0.63} {'loss': 0.9946, 'learning_rate': 1.5501864650378903e-05, 'epoch': 0.63} {'loss': 0.9439, 'learning_rate': 1.5501591295209474e-05, 'epoch': 0.63} {'loss': 0.81, 'learning_rate': 1.5501317934144594e-05, 'epoch': 0.63} {'loss': 0.6543, 'learning_rate': 1.5501044567184554e-05, 'epoch': 0.63} {'loss': 0.9434, 'learning_rate': 1.5500771194329653e-05, 'epoch': 0.63} {'loss': 0.7938, 'learning_rate': 1.5500497815580175e-05, 'epoch': 0.63} {'loss': 0.8294, 'learning_rate': 1.5500224430936418e-05, 'epoch': 0.63} {'loss': 0.7897, 'learning_rate': 1.5499951040398674e-05, 'epoch': 0.63} {'loss': 0.817, 'learning_rate': 1.5499677643967234e-05, 'epoch': 0.63} {'loss': 0.9046, 'learning_rate': 1.5499404241642396e-05, 'epoch': 0.63} {'loss': 0.6696, 'learning_rate': 1.5499130833424452e-05, 'epoch': 0.63} {'loss': 0.7958, 'learning_rate': 1.549885741931369e-05, 'epoch': 0.63} {'loss': 0.7249, 'learning_rate': 1.5498583999310404e-05, 'epoch': 0.63} {'loss': 0.8769, 'learning_rate': 1.5498310573414892e-05, 'epoch': 0.63} {'loss': 0.7887, 'learning_rate': 1.5498037141627444e-05, 'epoch': 0.63} {'loss': 0.8577, 'learning_rate': 1.549776370394835e-05, 'epoch': 0.63} {'loss': 0.9064, 'learning_rate': 1.549749026037791e-05, 'epoch': 0.63} {'loss': 0.814, 'learning_rate': 1.549721681091641e-05, 'epoch': 0.63} {'loss': 0.8538, 'learning_rate': 1.5496943355564148e-05, 'epoch': 0.63} {'loss': 0.8757, 'learning_rate': 1.5496669894321413e-05, 'epoch': 0.63} {'loss': 0.7505, 'learning_rate': 1.54963964271885e-05, 'epoch': 0.63} {'loss': 0.8471, 'learning_rate': 1.54961229541657e-05, 'epoch': 0.63} {'loss': 0.745, 'learning_rate': 1.5495849475253316e-05, 'epoch': 0.63} {'loss': 0.6895, 'learning_rate': 1.549557599045163e-05, 'epoch': 0.63} {'loss': 0.8218, 'learning_rate': 1.5495302499760934e-05, 'epoch': 0.63} {'loss': 0.9235, 'learning_rate': 1.549502900318153e-05, 'epoch': 0.63} {'loss': 0.8722, 'learning_rate': 1.5494755500713704e-05, 'epoch': 0.63} {'loss': 0.9482, 'learning_rate': 1.5494481992357757e-05, 'epoch': 0.63} {'loss': 0.8294, 'learning_rate': 1.5494208478113968e-05, 'epoch': 0.63} {'loss': 0.8801, 'learning_rate': 1.5493934957982646e-05, 'epoch': 0.63} {'loss': 0.8968, 'learning_rate': 1.5493661431964073e-05, 'epoch': 0.63} {'loss': 0.9234, 'learning_rate': 1.5493387900058546e-05, 'epoch': 0.63} {'loss': 0.7647, 'learning_rate': 1.5493114362266356e-05, 'epoch': 0.63} {'loss': 0.8556, 'learning_rate': 1.5492840818587803e-05, 'epoch': 0.63} {'loss': 0.7863, 'learning_rate': 1.5492567269023174e-05, 'epoch': 0.63} {'loss': 0.8414, 'learning_rate': 1.549229371357276e-05, 'epoch': 0.63} {'loss': 0.7404, 'learning_rate': 1.549202015223686e-05, 'epoch': 0.63} {'loss': 0.8851, 'learning_rate': 1.549174658501577e-05, 'epoch': 0.63} {'loss': 0.7115, 'learning_rate': 1.549147301190977e-05, 'epoch': 0.63} {'loss': 0.8536, 'learning_rate': 1.5491199432919165e-05, 'epoch': 0.63} {'loss': 0.857, 'learning_rate': 1.549092584804424e-05, 'epoch': 0.63} {'loss': 0.7348, 'learning_rate': 1.5490652257285298e-05, 'epoch': 0.63} {'loss': 0.6585, 'learning_rate': 1.5490378660642625e-05, 'epoch': 0.63} {'loss': 0.7287, 'learning_rate': 1.5490105058116512e-05, 'epoch': 0.63} {'loss': 0.8306, 'learning_rate': 1.548983144970726e-05, 'epoch': 0.63} {'loss': 0.7102, 'learning_rate': 1.5489557835415156e-05, 'epoch': 0.63} {'loss': 0.861, 'learning_rate': 1.5489284215240498e-05, 'epoch': 0.63} {'loss': 0.9222, 'learning_rate': 1.5489010589183573e-05, 'epoch': 0.63} {'loss': 0.7912, 'learning_rate': 1.5488736957244678e-05, 'epoch': 0.63} {'loss': 1.0704, 'learning_rate': 1.5488463319424108e-05, 'epoch': 0.63} {'loss': 0.811, 'learning_rate': 1.5488189675722155e-05, 'epoch': 0.63} {'loss': 0.6856, 'learning_rate': 1.548791602613911e-05, 'epoch': 0.63} {'loss': 0.9909, 'learning_rate': 1.5487642370675267e-05, 'epoch': 0.63} {'loss': 1.0214, 'learning_rate': 1.548736870933092e-05, 'epoch': 0.63} {'loss': 0.762, 'learning_rate': 1.5487095042106363e-05, 'epoch': 0.63} {'loss': 0.8154, 'learning_rate': 1.548682136900189e-05, 'epoch': 0.63} {'loss': 0.8344, 'learning_rate': 1.548654769001779e-05, 'epoch': 0.63} {'loss': 0.8685, 'learning_rate': 1.5486274005154358e-05, 'epoch': 0.63} {'loss': 0.9207, 'learning_rate': 1.5486000314411888e-05, 'epoch': 0.63} {'loss': 0.8311, 'learning_rate': 1.5485726617790677e-05, 'epoch': 0.63} {'loss': 0.5693, 'learning_rate': 1.5485452915291014e-05, 'epoch': 0.63} {'loss': 0.8007, 'learning_rate': 1.5485179206913193e-05, 'epoch': 0.63} {'loss': 0.857, 'learning_rate': 1.5484905492657505e-05, 'epoch': 0.63} {'loss': 0.9084, 'learning_rate': 1.548463177252425e-05, 'epoch': 0.63} {'loss': 0.8812, 'learning_rate': 1.5484358046513712e-05, 'epoch': 0.63} {'loss': 0.856, 'learning_rate': 1.5484084314626193e-05, 'epoch': 0.63} {'loss': 0.8399, 'learning_rate': 1.5483810576861983e-05, 'epoch': 0.63} {'loss': 0.8732, 'learning_rate': 1.5483536833221374e-05, 'epoch': 0.63} {'loss': 0.6772, 'learning_rate': 1.5483263083704657e-05, 'epoch': 0.63} {'loss': 0.9036, 'learning_rate': 1.5482989328312133e-05, 'epoch': 0.63} {'loss': 0.917, 'learning_rate': 1.548271556704409e-05, 'epoch': 0.63} {'loss': 0.9747, 'learning_rate': 1.548244179990082e-05, 'epoch': 0.63} {'loss': 0.8725, 'learning_rate': 1.548216802688262e-05, 'epoch': 0.63} {'loss': 0.8757, 'learning_rate': 1.5481894247989785e-05, 'epoch': 0.63} {'loss': 0.7202, 'learning_rate': 1.5481620463222606e-05, 'epoch': 0.63} {'loss': 0.9842, 'learning_rate': 1.548134667258137e-05, 'epoch': 0.63} {'loss': 0.9789, 'learning_rate': 1.548107287606638e-05, 'epoch': 0.63} {'loss': 0.9519, 'learning_rate': 1.5480799073677924e-05, 'epoch': 0.63} {'loss': 0.7742, 'learning_rate': 1.54805252654163e-05, 'epoch': 0.64} {'loss': 1.0652, 'learning_rate': 1.5480251451281798e-05, 'epoch': 0.64} {'loss': 0.8974, 'learning_rate': 1.547997763127471e-05, 'epoch': 0.64} {'loss': 0.9937, 'learning_rate': 1.5479703805395337e-05, 'epoch': 0.64} {'loss': 0.8812, 'learning_rate': 1.547942997364396e-05, 'epoch': 0.64} {'loss': 0.946, 'learning_rate': 1.547915613602088e-05, 'epoch': 0.64} {'loss': 0.8182, 'learning_rate': 1.5478882292526392e-05, 'epoch': 0.64} {'loss': 0.7942, 'learning_rate': 1.547860844316079e-05, 'epoch': 0.64} {'loss': 0.9059, 'learning_rate': 1.547833458792436e-05, 'epoch': 0.64} {'loss': 0.7746, 'learning_rate': 1.54780607268174e-05, 'epoch': 0.64} {'loss': 0.819, 'learning_rate': 1.5477786859840205e-05, 'epoch': 0.64} {'loss': 0.9378, 'learning_rate': 1.5477512986993065e-05, 'epoch': 0.64} {'loss': 0.6671, 'learning_rate': 1.5477239108276277e-05, 'epoch': 0.64} {'loss': 0.7624, 'learning_rate': 1.547696522369013e-05, 'epoch': 0.64} {'loss': 0.7794, 'learning_rate': 1.5476691333234927e-05, 'epoch': 0.64} {'loss': 0.6729, 'learning_rate': 1.547641743691095e-05, 'epoch': 0.64} {'loss': 0.8326, 'learning_rate': 1.54761435347185e-05, 'epoch': 0.64} {'loss': 0.9193, 'learning_rate': 1.5475869626657865e-05, 'epoch': 0.64} {'loss': 0.6696, 'learning_rate': 1.5475595712729346e-05, 'epoch': 0.64} {'loss': 0.6628, 'learning_rate': 1.547532179293323e-05, 'epoch': 0.64} {'loss': 0.8067, 'learning_rate': 1.547504786726981e-05, 'epoch': 0.64} {'loss': 0.8531, 'learning_rate': 1.5474773935739383e-05, 'epoch': 0.64} {'loss': 0.7481, 'learning_rate': 1.5474499998342244e-05, 'epoch': 0.64} {'loss': 0.7758, 'learning_rate': 1.547422605507868e-05, 'epoch': 0.64} {'loss': 0.8697, 'learning_rate': 1.5473952105948992e-05, 'epoch': 0.64} {'loss': 0.8206, 'learning_rate': 1.547367815095347e-05, 'epoch': 0.64} {'loss': 0.9437, 'learning_rate': 1.547340419009241e-05, 'epoch': 0.64} {'loss': 0.8061, 'learning_rate': 1.54731302233661e-05, 'epoch': 0.64} {'loss': 0.8958, 'learning_rate': 1.5472856250774836e-05, 'epoch': 0.64} {'loss': 0.8056, 'learning_rate': 1.5472582272318913e-05, 'epoch': 0.64} {'loss': 0.9357, 'learning_rate': 1.5472308287998625e-05, 'epoch': 0.64} {'loss': 0.6479, 'learning_rate': 1.5472034297814263e-05, 'epoch': 0.64} {'loss': 0.8375, 'learning_rate': 1.5471760301766127e-05, 'epoch': 0.64} {'loss': 0.7474, 'learning_rate': 1.5471486299854506e-05, 'epoch': 0.64} {'loss': 0.8253, 'learning_rate': 1.547121229207969e-05, 'epoch': 0.64} {'loss': 0.8609, 'learning_rate': 1.5470938278441975e-05, 'epoch': 0.64} {'loss': 0.7374, 'learning_rate': 1.5470664258941657e-05, 'epoch': 0.64} {'loss': 0.669, 'learning_rate': 1.547039023357903e-05, 'epoch': 0.64} {'loss': 0.7534, 'learning_rate': 1.5470116202354385e-05, 'epoch': 0.64} {'loss': 0.8632, 'learning_rate': 1.546984216526802e-05, 'epoch': 0.64} {'loss': 0.836, 'learning_rate': 1.5469568122320225e-05, 'epoch': 0.64} {'loss': 0.7726, 'learning_rate': 1.546929407351129e-05, 'epoch': 0.64} {'loss': 0.8945, 'learning_rate': 1.5469020018841515e-05, 'epoch': 0.64} {'loss': 0.9825, 'learning_rate': 1.5468745958311192e-05, 'epoch': 0.64} {'loss': 0.8097, 'learning_rate': 1.5468471891920615e-05, 'epoch': 0.64} {'loss': 0.8639, 'learning_rate': 1.5468197819670074e-05, 'epoch': 0.64} {'loss': 0.8414, 'learning_rate': 1.5467923741559867e-05, 'epoch': 0.64} {'loss': 0.7971, 'learning_rate': 1.5467649657590286e-05, 'epoch': 0.64} {'loss': 0.968, 'learning_rate': 1.5467375567761626e-05, 'epoch': 0.64} {'loss': 0.8634, 'learning_rate': 1.5467101472074175e-05, 'epoch': 0.64} {'loss': 0.8113, 'learning_rate': 1.5466827370528233e-05, 'epoch': 0.64} {'loss': 0.7529, 'learning_rate': 1.5466553263124097e-05, 'epoch': 0.64} {'loss': 0.7173, 'learning_rate': 1.546627914986205e-05, 'epoch': 0.64} {'loss': 1.0677, 'learning_rate': 1.5466005030742398e-05, 'epoch': 0.64} {'loss': 0.6307, 'learning_rate': 1.5465730905765424e-05, 'epoch': 0.64} {'loss': 0.7821, 'learning_rate': 1.5465456774931425e-05, 'epoch': 0.64} {'loss': 0.6462, 'learning_rate': 1.5465182638240698e-05, 'epoch': 0.64} {'loss': 0.9433, 'learning_rate': 1.5464908495693534e-05, 'epoch': 0.64} {'loss': 0.9192, 'learning_rate': 1.5464634347290228e-05, 'epoch': 0.64} {'loss': 0.8372, 'learning_rate': 1.546436019303107e-05, 'epoch': 0.64} {'loss': 0.767, 'learning_rate': 1.546408603291636e-05, 'epoch': 0.64} {'loss': 0.7375, 'learning_rate': 1.5463811866946386e-05, 'epoch': 0.64} {'loss': 0.9143, 'learning_rate': 1.5463537695121447e-05, 'epoch': 0.64} {'loss': 0.8955, 'learning_rate': 1.5463263517441833e-05, 'epoch': 0.64} {'loss': 0.9388, 'learning_rate': 1.546298933390784e-05, 'epoch': 0.64} {'loss': 0.9743, 'learning_rate': 1.5462715144519763e-05, 'epoch': 0.64} {'loss': 0.8259, 'learning_rate': 1.546244094927789e-05, 'epoch': 0.64} {'loss': 0.8609, 'learning_rate': 1.5462166748182518e-05, 'epoch': 0.64} {'loss': 0.9072, 'learning_rate': 1.546189254123394e-05, 'epoch': 0.64} {'loss': 0.7283, 'learning_rate': 1.546161832843246e-05, 'epoch': 0.64} {'loss': 0.9322, 'learning_rate': 1.5461344109778354e-05, 'epoch': 0.64} {'loss': 0.7856, 'learning_rate': 1.546106988527193e-05, 'epoch': 0.64} {'loss': 0.7909, 'learning_rate': 1.5460795654913473e-05, 'epoch': 0.64} {'loss': 0.9171, 'learning_rate': 1.546052141870328e-05, 'epoch': 0.64} {'loss': 0.8388, 'learning_rate': 1.546024717664165e-05, 'epoch': 0.64} {'loss': 0.8573, 'learning_rate': 1.545997292872887e-05, 'epoch': 0.64} {'loss': 0.744, 'learning_rate': 1.5459698674965236e-05, 'epoch': 0.64} {'loss': 0.6809, 'learning_rate': 1.5459424415351044e-05, 'epoch': 0.64} {'loss': 0.8611, 'learning_rate': 1.5459150149886582e-05, 'epoch': 0.64} {'loss': 0.956, 'learning_rate': 1.545887587857215e-05, 'epoch': 0.64} {'loss': 0.8823, 'learning_rate': 1.545860160140804e-05, 'epoch': 0.64} {'loss': 0.8275, 'learning_rate': 1.5458327318394546e-05, 'epoch': 0.64} {'loss': 0.837, 'learning_rate': 1.545805302953196e-05, 'epoch': 0.64} {'loss': 0.7804, 'learning_rate': 1.545777873482058e-05, 'epoch': 0.64} {'loss': 0.8195, 'learning_rate': 1.5457504434260697e-05, 'epoch': 0.64} {'loss': 0.8854, 'learning_rate': 1.5457230127852604e-05, 'epoch': 0.64} {'loss': 0.8606, 'learning_rate': 1.5456955815596598e-05, 'epoch': 0.64} {'loss': 0.8293, 'learning_rate': 1.545668149749297e-05, 'epoch': 0.64} {'loss': 0.7874, 'learning_rate': 1.5456407173542017e-05, 'epoch': 0.64} {'loss': 0.9815, 'learning_rate': 1.545613284374403e-05, 'epoch': 0.64} {'loss': 0.9538, 'learning_rate': 1.5455858508099304e-05, 'epoch': 0.64} {'loss': 0.6242, 'learning_rate': 1.5455584166608133e-05, 'epoch': 0.64} {'loss': 0.7802, 'learning_rate': 1.545530981927081e-05, 'epoch': 0.64} {'loss': 0.9907, 'learning_rate': 1.5455035466087634e-05, 'epoch': 0.64} {'loss': 0.9255, 'learning_rate': 1.5454761107058893e-05, 'epoch': 0.64} {'loss': 0.9629, 'learning_rate': 1.5454486742184882e-05, 'epoch': 0.64} {'loss': 0.8702, 'learning_rate': 1.5454212371465897e-05, 'epoch': 0.64} {'loss': 0.7011, 'learning_rate': 1.5453937994902232e-05, 'epoch': 0.64} {'loss': 0.7243, 'learning_rate': 1.5453663612494182e-05, 'epoch': 0.64} {'loss': 0.8326, 'learning_rate': 1.5453389224242035e-05, 'epoch': 0.64} {'loss': 0.7473, 'learning_rate': 1.545311483014609e-05, 'epoch': 0.64} {'loss': 0.7733, 'learning_rate': 1.5452840430206643e-05, 'epoch': 0.64} {'loss': 0.8606, 'learning_rate': 1.5452566024423984e-05, 'epoch': 0.64} {'loss': 0.7406, 'learning_rate': 1.5452291612798406e-05, 'epoch': 0.64} {'loss': 0.9611, 'learning_rate': 1.545201719533021e-05, 'epoch': 0.64} {'loss': 0.7399, 'learning_rate': 1.545174277201968e-05, 'epoch': 0.64} {'loss': 0.7363, 'learning_rate': 1.5451468342867118e-05, 'epoch': 0.64} {'loss': 1.0017, 'learning_rate': 1.5451193907872816e-05, 'epoch': 0.64} {'loss': 0.9215, 'learning_rate': 1.5450919467037067e-05, 'epoch': 0.64} {'loss': 0.7763, 'learning_rate': 1.545064502036017e-05, 'epoch': 0.64} {'loss': 0.6886, 'learning_rate': 1.5450370567842412e-05, 'epoch': 0.64} {'loss': 0.8702, 'learning_rate': 1.5450096109484086e-05, 'epoch': 0.64} {'loss': 0.8279, 'learning_rate': 1.5449821645285498e-05, 'epoch': 0.64} {'loss': 0.8689, 'learning_rate': 1.544954717524693e-05, 'epoch': 0.64} {'loss': 0.763, 'learning_rate': 1.5449272699368682e-05, 'epoch': 0.64} {'loss': 0.8595, 'learning_rate': 1.544899821765104e-05, 'epoch': 0.64} {'loss': 0.8325, 'learning_rate': 1.5448723730094312e-05, 'epoch': 0.64} {'loss': 0.8124, 'learning_rate': 1.544844923669878e-05, 'epoch': 0.64} {'loss': 0.7438, 'learning_rate': 1.5448174737464744e-05, 'epoch': 0.64} {'loss': 0.8716, 'learning_rate': 1.54479002323925e-05, 'epoch': 0.64} {'loss': 0.9141, 'learning_rate': 1.544762572148234e-05, 'epoch': 0.64} {'loss': 0.7604, 'learning_rate': 1.5447351204734555e-05, 'epoch': 0.64} {'loss': 0.837, 'learning_rate': 1.5447076682149437e-05, 'epoch': 0.64} {'loss': 0.8341, 'learning_rate': 1.5446802153727293e-05, 'epoch': 0.64} {'loss': 0.722, 'learning_rate': 1.54465276194684e-05, 'epoch': 0.64} {'loss': 0.8276, 'learning_rate': 1.544625307937307e-05, 'epoch': 0.64} {'loss': 0.9486, 'learning_rate': 1.544597853344158e-05, 'epoch': 0.64} {'loss': 1.0513, 'learning_rate': 1.5445703981674237e-05, 'epoch': 0.64} {'loss': 0.8261, 'learning_rate': 1.5445429424071333e-05, 'epoch': 0.64} {'loss': 0.768, 'learning_rate': 1.5445154860633156e-05, 'epoch': 0.64} {'loss': 0.7214, 'learning_rate': 1.544488029136001e-05, 'epoch': 0.64} {'loss': 0.8998, 'learning_rate': 1.5444605716252173e-05, 'epoch': 0.64} {'loss': 0.7314, 'learning_rate': 1.5444331135309954e-05, 'epoch': 0.64} {'loss': 0.7882, 'learning_rate': 1.5444056548533647e-05, 'epoch': 0.64} {'loss': 0.7288, 'learning_rate': 1.544378195592354e-05, 'epoch': 0.64} {'loss': 0.711, 'learning_rate': 1.5443507357479926e-05, 'epoch': 0.64} {'loss': 0.8434, 'learning_rate': 1.5443232753203105e-05, 'epoch': 0.64} {'loss': 0.9138, 'learning_rate': 1.5442958143093368e-05, 'epoch': 0.64} {'loss': 0.7457, 'learning_rate': 1.544268352715101e-05, 'epoch': 0.64} {'loss': 0.6357, 'learning_rate': 1.544240890537633e-05, 'epoch': 0.64} {'loss': 0.9268, 'learning_rate': 1.544213427776961e-05, 'epoch': 0.64} {'loss': 0.8618, 'learning_rate': 1.544185964433116e-05, 'epoch': 0.64} {'loss': 0.8694, 'learning_rate': 1.544158500506126e-05, 'epoch': 0.64} {'loss': 0.871, 'learning_rate': 1.544131035996021e-05, 'epoch': 0.64} {'loss': 0.8662, 'learning_rate': 1.5441035709028308e-05, 'epoch': 0.64} {'loss': 0.8192, 'learning_rate': 1.5440761052265846e-05, 'epoch': 0.64} {'loss': 0.8021, 'learning_rate': 1.5440486389673117e-05, 'epoch': 0.64} {'loss': 0.7397, 'learning_rate': 1.5440211721250416e-05, 'epoch': 0.64} {'loss': 0.9222, 'learning_rate': 1.5439937046998035e-05, 'epoch': 0.64} {'loss': 0.7938, 'learning_rate': 1.5439662366916272e-05, 'epoch': 0.64} {'loss': 0.767, 'learning_rate': 1.5439387681005417e-05, 'epoch': 0.64} {'loss': 0.9438, 'learning_rate': 1.543911298926577e-05, 'epoch': 0.64} {'loss': 0.7102, 'learning_rate': 1.5438838291697624e-05, 'epoch': 0.64} {'loss': 0.8504, 'learning_rate': 1.543856358830127e-05, 'epoch': 0.64} {'loss': 0.8823, 'learning_rate': 1.5438288879077005e-05, 'epoch': 0.64} {'loss': 0.7667, 'learning_rate': 1.543801416402512e-05, 'epoch': 0.64} {'loss': 0.7376, 'learning_rate': 1.5437739443145913e-05, 'epoch': 0.64} {'loss': 0.8213, 'learning_rate': 1.5437464716439675e-05, 'epoch': 0.64} {'loss': 0.8475, 'learning_rate': 1.5437189983906707e-05, 'epoch': 0.64} {'loss': 0.955, 'learning_rate': 1.5436915245547298e-05, 'epoch': 0.64} {'loss': 0.6718, 'learning_rate': 1.5436640501361746e-05, 'epoch': 0.64} {'loss': 0.8133, 'learning_rate': 1.543636575135034e-05, 'epoch': 0.64} {'loss': 1.0033, 'learning_rate': 1.5436090995513376e-05, 'epoch': 0.64} {'loss': 1.0486, 'learning_rate': 1.5435816233851152e-05, 'epoch': 0.64} {'loss': 0.7881, 'learning_rate': 1.5435541466363964e-05, 'epoch': 0.64} {'loss': 0.893, 'learning_rate': 1.5435266693052096e-05, 'epoch': 0.64} {'loss': 0.9556, 'learning_rate': 1.5434991913915857e-05, 'epoch': 0.64} {'loss': 0.7833, 'learning_rate': 1.5434717128955524e-05, 'epoch': 0.64} {'loss': 0.7512, 'learning_rate': 1.5434442338171406e-05, 'epoch': 0.64} {'loss': 0.8972, 'learning_rate': 1.5434167541563795e-05, 'epoch': 0.64} {'loss': 0.8616, 'learning_rate': 1.5433892739132977e-05, 'epoch': 0.64} {'loss': 0.8016, 'learning_rate': 1.543361793087926e-05, 'epoch': 0.64} {'loss': 0.7673, 'learning_rate': 1.5433343116802927e-05, 'epoch': 0.64} {'loss': 0.8243, 'learning_rate': 1.5433068296904274e-05, 'epoch': 0.64} {'loss': 0.7931, 'learning_rate': 1.54327934711836e-05, 'epoch': 0.64} {'loss': 0.8949, 'learning_rate': 1.54325186396412e-05, 'epoch': 0.64} {'loss': 0.7792, 'learning_rate': 1.543224380227736e-05, 'epoch': 0.64} {'loss': 0.8393, 'learning_rate': 1.5431968959092387e-05, 'epoch': 0.64} {'loss': 0.9933, 'learning_rate': 1.543169411008657e-05, 'epoch': 0.64} {'loss': 0.8038, 'learning_rate': 1.5431419255260194e-05, 'epoch': 0.64} {'loss': 0.864, 'learning_rate': 1.5431144394613567e-05, 'epoch': 0.64} {'loss': 0.9945, 'learning_rate': 1.5430869528146978e-05, 'epoch': 0.64} {'loss': 0.8021, 'learning_rate': 1.5430594655860726e-05, 'epoch': 0.64} {'loss': 0.8371, 'learning_rate': 1.5430319777755097e-05, 'epoch': 0.64} {'loss': 0.7467, 'learning_rate': 1.543004489383039e-05, 'epoch': 0.64} {'loss': 0.8048, 'learning_rate': 1.54297700040869e-05, 'epoch': 0.64} {'loss': 0.8657, 'learning_rate': 1.5429495108524926e-05, 'epoch': 0.64} {'loss': 0.9276, 'learning_rate': 1.5429220207144753e-05, 'epoch': 0.64} {'loss': 0.8342, 'learning_rate': 1.5428945299946683e-05, 'epoch': 0.64} {'loss': 0.9398, 'learning_rate': 1.5428670386931005e-05, 'epoch': 0.64} {'loss': 0.8252, 'learning_rate': 1.542839546809802e-05, 'epoch': 0.64} {'loss': 0.7318, 'learning_rate': 1.5428120543448018e-05, 'epoch': 0.64} {'loss': 0.9081, 'learning_rate': 1.5427845612981296e-05, 'epoch': 0.64} {'loss': 0.7746, 'learning_rate': 1.5427570676698148e-05, 'epoch': 0.64} {'loss': 0.8829, 'learning_rate': 1.5427295734598865e-05, 'epoch': 0.64} {'loss': 0.8544, 'learning_rate': 1.5427020786683745e-05, 'epoch': 0.64} {'loss': 0.6836, 'learning_rate': 1.5426745832953083e-05, 'epoch': 0.64} {'loss': 0.8223, 'learning_rate': 1.5426470873407178e-05, 'epoch': 0.64} {'loss': 0.9417, 'learning_rate': 1.5426195908046314e-05, 'epoch': 0.64} {'loss': 0.9969, 'learning_rate': 1.5425920936870795e-05, 'epoch': 0.64} {'loss': 0.8944, 'learning_rate': 1.5425645959880907e-05, 'epoch': 0.64} {'loss': 0.6823, 'learning_rate': 1.542537097707695e-05, 'epoch': 0.64} {'loss': 0.8786, 'learning_rate': 1.5425095988459225e-05, 'epoch': 0.64} {'loss': 0.647, 'learning_rate': 1.5424820994028017e-05, 'epoch': 0.64} {'loss': 0.9464, 'learning_rate': 1.5424545993783625e-05, 'epoch': 0.64} {'loss': 0.8529, 'learning_rate': 1.5424270987726338e-05, 'epoch': 0.64} {'loss': 0.82, 'learning_rate': 1.5423995975856457e-05, 'epoch': 0.64} {'loss': 0.9435, 'learning_rate': 1.5423720958174272e-05, 'epoch': 0.64} {'loss': 0.7362, 'learning_rate': 1.5423445934680087e-05, 'epoch': 0.64} {'loss': 0.6363, 'learning_rate': 1.5423170905374188e-05, 'epoch': 0.64} {'loss': 0.8031, 'learning_rate': 1.542289587025687e-05, 'epoch': 0.64} {'loss': 0.8654, 'learning_rate': 1.542262082932843e-05, 'epoch': 0.64} {'loss': 0.9206, 'learning_rate': 1.5422345782589162e-05, 'epoch': 0.64} {'loss': 1.0003, 'learning_rate': 1.542207073003936e-05, 'epoch': 0.64} {'loss': 0.7364, 'learning_rate': 1.5421795671679324e-05, 'epoch': 0.64} {'loss': 1.0205, 'learning_rate': 1.5421520607509342e-05, 'epoch': 0.64} {'loss': 0.749, 'learning_rate': 1.542124553752971e-05, 'epoch': 0.64} {'loss': 0.8752, 'learning_rate': 1.5420970461740727e-05, 'epoch': 0.64} {'loss': 0.7397, 'learning_rate': 1.542069538014268e-05, 'epoch': 0.64} {'loss': 0.758, 'learning_rate': 1.5420420292735874e-05, 'epoch': 0.64} {'loss': 0.7478, 'learning_rate': 1.5420145199520598e-05, 'epoch': 0.64} {'loss': 1.0113, 'learning_rate': 1.5419870100497145e-05, 'epoch': 0.64} {'loss': 1.0145, 'learning_rate': 1.541959499566581e-05, 'epoch': 0.64} {'loss': 0.6891, 'learning_rate': 1.5419319885026897e-05, 'epoch': 0.64} {'loss': 0.8972, 'learning_rate': 1.5419044768580688e-05, 'epoch': 0.64} {'loss': 0.6921, 'learning_rate': 1.541876964632748e-05, 'epoch': 0.64} {'loss': 0.968, 'learning_rate': 1.541849451826758e-05, 'epoch': 0.64} {'loss': 0.8313, 'learning_rate': 1.541821938440127e-05, 'epoch': 0.64} {'loss': 0.8905, 'learning_rate': 1.541794424472885e-05, 'epoch': 0.64} {'loss': 0.8088, 'learning_rate': 1.5417669099250613e-05, 'epoch': 0.64} {'loss': 0.744, 'learning_rate': 1.5417393947966854e-05, 'epoch': 0.64} {'loss': 0.7562, 'learning_rate': 1.5417118790877866e-05, 'epoch': 0.64} {'loss': 0.8042, 'learning_rate': 1.5416843627983948e-05, 'epoch': 0.64} {'loss': 0.7707, 'learning_rate': 1.5416568459285394e-05, 'epoch': 0.64} {'loss': 0.7085, 'learning_rate': 1.54162932847825e-05, 'epoch': 0.64} {'loss': 0.6244, 'learning_rate': 1.5416018104475556e-05, 'epoch': 0.64} {'loss': 0.8924, 'learning_rate': 1.5415742918364858e-05, 'epoch': 0.64} {'loss': 0.8366, 'learning_rate': 1.5415467726450707e-05, 'epoch': 0.64} {'loss': 0.7467, 'learning_rate': 1.5415192528733394e-05, 'epoch': 0.64} {'loss': 0.9197, 'learning_rate': 1.5414917325213208e-05, 'epoch': 0.64} {'loss': 0.8696, 'learning_rate': 1.5414642115890456e-05, 'epoch': 0.64} {'loss': 0.8461, 'learning_rate': 1.5414366900765424e-05, 'epoch': 0.64} {'loss': 0.8382, 'learning_rate': 1.5414091679838405e-05, 'epoch': 0.64} {'loss': 1.0707, 'learning_rate': 1.5413816453109703e-05, 'epoch': 0.64} {'loss': 0.546, 'learning_rate': 1.5413541220579607e-05, 'epoch': 0.64} {'loss': 0.7746, 'learning_rate': 1.541326598224841e-05, 'epoch': 0.64} {'loss': 0.8733, 'learning_rate': 1.5412990738116415e-05, 'epoch': 0.64} {'loss': 0.9095, 'learning_rate': 1.541271548818391e-05, 'epoch': 0.64} {'loss': 0.8715, 'learning_rate': 1.541244023245119e-05, 'epoch': 0.64} {'loss': 0.7383, 'learning_rate': 1.5412164970918552e-05, 'epoch': 0.64} {'loss': 0.8686, 'learning_rate': 1.5411889703586292e-05, 'epoch': 0.64} {'loss': 0.8372, 'learning_rate': 1.54116144304547e-05, 'epoch': 0.64} {'loss': 0.754, 'learning_rate': 1.541133915152408e-05, 'epoch': 0.64} {'loss': 0.8164, 'learning_rate': 1.5411063866794718e-05, 'epoch': 0.64} {'loss': 0.8371, 'learning_rate': 1.5410788576266918e-05, 'epoch': 0.64} {'loss': 0.7169, 'learning_rate': 1.5410513279940963e-05, 'epoch': 0.64} {'loss': 0.8616, 'learning_rate': 1.541023797781716e-05, 'epoch': 0.64} {'loss': 0.8045, 'learning_rate': 1.5409962669895796e-05, 'epoch': 0.64} {'loss': 1.054, 'learning_rate': 1.5409687356177168e-05, 'epoch': 0.64} {'loss': 0.951, 'learning_rate': 1.5409412036661576e-05, 'epoch': 0.64} {'loss': 0.7967, 'learning_rate': 1.5409136711349307e-05, 'epoch': 0.64} {'loss': 0.8533, 'learning_rate': 1.540886138024066e-05, 'epoch': 0.64} {'loss': 0.7405, 'learning_rate': 1.540858604333593e-05, 'epoch': 0.64} {'loss': 0.7942, 'learning_rate': 1.5408310700635412e-05, 'epoch': 0.64} {'loss': 0.7082, 'learning_rate': 1.54080353521394e-05, 'epoch': 0.64} {'loss': 0.8457, 'learning_rate': 1.540775999784819e-05, 'epoch': 0.64} {'loss': 0.7442, 'learning_rate': 1.540748463776208e-05, 'epoch': 0.64} {'loss': 1.0772, 'learning_rate': 1.540720927188136e-05, 'epoch': 0.64} {'loss': 0.8076, 'learning_rate': 1.5406933900206328e-05, 'epoch': 0.64} {'loss': 0.8443, 'learning_rate': 1.5406658522737277e-05, 'epoch': 0.64} {'loss': 0.9004, 'learning_rate': 1.5406383139474504e-05, 'epoch': 0.64} {'loss': 0.7805, 'learning_rate': 1.5406107750418303e-05, 'epoch': 0.64} {'loss': 0.8814, 'learning_rate': 1.5405832355568973e-05, 'epoch': 0.64} {'loss': 1.0813, 'learning_rate': 1.5405556954926805e-05, 'epoch': 0.64} {'loss': 0.9811, 'learning_rate': 1.540528154849209e-05, 'epoch': 0.64} {'loss': 0.885, 'learning_rate': 1.540500613626513e-05, 'epoch': 0.64} {'loss': 0.7194, 'learning_rate': 1.540473071824622e-05, 'epoch': 0.64} {'loss': 0.8135, 'learning_rate': 1.540445529443565e-05, 'epoch': 0.64} {'loss': 0.7529, 'learning_rate': 1.5404179864833724e-05, 'epoch': 0.64} {'loss': 0.7712, 'learning_rate': 1.5403904429440728e-05, 'epoch': 0.64} {'loss': 0.8957, 'learning_rate': 1.540362898825696e-05, 'epoch': 0.64} {'loss': 0.7386, 'learning_rate': 1.5403353541282717e-05, 'epoch': 0.64} {'loss': 0.8868, 'learning_rate': 1.5403078088518292e-05, 'epoch': 0.64} {'loss': 0.8928, 'learning_rate': 1.5402802629963983e-05, 'epoch': 0.64} {'loss': 0.818, 'learning_rate': 1.5402527165620082e-05, 'epoch': 0.64} {'loss': 0.9078, 'learning_rate': 1.5402251695486884e-05, 'epoch': 0.64} {'loss': 0.8317, 'learning_rate': 1.540197621956469e-05, 'epoch': 0.64} {'loss': 1.0118, 'learning_rate': 1.5401700737853787e-05, 'epoch': 0.64} {'loss': 0.8324, 'learning_rate': 1.5401425250354475e-05, 'epoch': 0.64} {'loss': 0.7931, 'learning_rate': 1.540114975706705e-05, 'epoch': 0.64} {'loss': 0.9192, 'learning_rate': 1.5400874257991808e-05, 'epoch': 0.64} {'loss': 0.9926, 'learning_rate': 1.5400598753129036e-05, 'epoch': 0.64} {'loss': 0.8919, 'learning_rate': 1.5400323242479036e-05, 'epoch': 0.64} {'loss': 0.8961, 'learning_rate': 1.54000477260421e-05, 'epoch': 0.64} {'loss': 0.8798, 'learning_rate': 1.5399772203818534e-05, 'epoch': 0.64} {'loss': 0.7331, 'learning_rate': 1.5399496675808618e-05, 'epoch': 0.64} {'loss': 0.7229, 'learning_rate': 1.5399221142012657e-05, 'epoch': 0.64} {'loss': 0.7628, 'learning_rate': 1.5398945602430943e-05, 'epoch': 0.64} {'loss': 0.675, 'learning_rate': 1.539867005706377e-05, 'epoch': 0.64} {'loss': 0.8525, 'learning_rate': 1.5398394505911433e-05, 'epoch': 0.64} {'loss': 0.962, 'learning_rate': 1.5398118948974233e-05, 'epoch': 0.64} {'loss': 0.8644, 'learning_rate': 1.5397843386252456e-05, 'epoch': 0.64} {'loss': 0.9358, 'learning_rate': 1.539756781774641e-05, 'epoch': 0.64} {'loss': 0.8131, 'learning_rate': 1.539729224345638e-05, 'epoch': 0.64} {'loss': 0.8997, 'learning_rate': 1.539701666338266e-05, 'epoch': 0.64} {'loss': 0.8323, 'learning_rate': 1.539674107752555e-05, 'epoch': 0.64} {'loss': 0.8483, 'learning_rate': 1.539646548588535e-05, 'epoch': 0.64} {'loss': 0.8822, 'learning_rate': 1.539618988846235e-05, 'epoch': 0.64} {'loss': 0.837, 'learning_rate': 1.5395914285256842e-05, 'epoch': 0.64} {'loss': 0.703, 'learning_rate': 1.539563867626913e-05, 'epoch': 0.64} {'loss': 0.8651, 'learning_rate': 1.53953630614995e-05, 'epoch': 0.64} {'loss': 0.6539, 'learning_rate': 1.5395087440948248e-05, 'epoch': 0.64} {'loss': 0.977, 'learning_rate': 1.539481181461568e-05, 'epoch': 0.64} {'loss': 0.7194, 'learning_rate': 1.5394536182502076e-05, 'epoch': 0.64} {'loss': 0.81, 'learning_rate': 1.5394260544607748e-05, 'epoch': 0.64} {'loss': 0.7484, 'learning_rate': 1.539398490093298e-05, 'epoch': 0.64} {'loss': 0.6482, 'learning_rate': 1.5393709251478067e-05, 'epoch': 0.64} {'loss': 0.6709, 'learning_rate': 1.539343359624331e-05, 'epoch': 0.64} {'loss': 0.6703, 'learning_rate': 1.5393157935229005e-05, 'epoch': 0.64} {'loss': 0.8871, 'learning_rate': 1.539288226843544e-05, 'epoch': 0.64} {'loss': 0.8867, 'learning_rate': 1.5392606595862917e-05, 'epoch': 0.64} {'loss': 0.7177, 'learning_rate': 1.5392330917511733e-05, 'epoch': 0.64} {'loss': 0.9885, 'learning_rate': 1.5392055233382176e-05, 'epoch': 0.64} {'loss': 0.9377, 'learning_rate': 1.5391779543474547e-05, 'epoch': 0.64} {'loss': 0.814, 'learning_rate': 1.5391503847789136e-05, 'epoch': 0.64} {'loss': 0.7889, 'learning_rate': 1.5391228146326242e-05, 'epoch': 0.64} {'loss': 0.8256, 'learning_rate': 1.5390952439086163e-05, 'epoch': 0.64} {'loss': 0.8625, 'learning_rate': 1.5390676726069188e-05, 'epoch': 0.64} {'loss': 0.7813, 'learning_rate': 1.5390401007275624e-05, 'epoch': 0.64} {'loss': 0.858, 'learning_rate': 1.5390125282705756e-05, 'epoch': 0.64} {'loss': 0.8914, 'learning_rate': 1.538984955235988e-05, 'epoch': 0.64} {'loss': 0.761, 'learning_rate': 1.5389573816238294e-05, 'epoch': 0.64} {'loss': 0.8115, 'learning_rate': 1.5389298074341293e-05, 'epoch': 0.64} {'loss': 0.7011, 'learning_rate': 1.538902232666917e-05, 'epoch': 0.64} {'loss': 0.7496, 'learning_rate': 1.538874657322223e-05, 'epoch': 0.64} {'loss': 0.8178, 'learning_rate': 1.5388470814000758e-05, 'epoch': 0.64} {'loss': 0.7581, 'learning_rate': 1.5388195049005053e-05, 'epoch': 0.64} {'loss': 0.8152, 'learning_rate': 1.538791927823541e-05, 'epoch': 0.64} {'loss': 0.8354, 'learning_rate': 1.538764350169213e-05, 'epoch': 0.64} {'loss': 0.7593, 'learning_rate': 1.5387367719375498e-05, 'epoch': 0.64} {'loss': 0.7761, 'learning_rate': 1.538709193128582e-05, 'epoch': 0.64} {'loss': 0.8455, 'learning_rate': 1.538681613742338e-05, 'epoch': 0.64} {'loss': 0.8407, 'learning_rate': 1.5386540337788484e-05, 'epoch': 0.64} {'loss': 0.8175, 'learning_rate': 1.5386264532381424e-05, 'epoch': 0.64} {'loss': 0.866, 'learning_rate': 1.5385988721202498e-05, 'epoch': 0.64} {'loss': 0.8133, 'learning_rate': 1.5385712904252e-05, 'epoch': 0.64} {'loss': 0.6465, 'learning_rate': 1.5385437081530216e-05, 'epoch': 0.64} {'loss': 0.7405, 'learning_rate': 1.538516125303746e-05, 'epoch': 0.64} {'loss': 0.7908, 'learning_rate': 1.538488541877401e-05, 'epoch': 0.64} {'loss': 0.8445, 'learning_rate': 1.538460957874017e-05, 'epoch': 0.64} {'loss': 0.7708, 'learning_rate': 1.5384333732936242e-05, 'epoch': 0.64} {'loss': 0.6634, 'learning_rate': 1.5384057881362508e-05, 'epoch': 0.64} {'loss': 0.8655, 'learning_rate': 1.538378202401927e-05, 'epoch': 0.64} {'loss': 0.9548, 'learning_rate': 1.5383506160906826e-05, 'epoch': 0.64} {'loss': 0.81, 'learning_rate': 1.5383230292025468e-05, 'epoch': 0.64} {'loss': 0.8093, 'learning_rate': 1.538295441737549e-05, 'epoch': 0.64} {'loss': 0.7338, 'learning_rate': 1.5382678536957198e-05, 'epoch': 0.64} {'loss': 0.8557, 'learning_rate': 1.5382402650770876e-05, 'epoch': 0.64} {'loss': 0.8748, 'learning_rate': 1.538212675881682e-05, 'epoch': 0.64} {'loss': 1.0183, 'learning_rate': 1.5381850861095337e-05, 'epoch': 0.64} {'loss': 0.9166, 'learning_rate': 1.538157495760671e-05, 'epoch': 0.64} {'loss': 0.8571, 'learning_rate': 1.5381299048351238e-05, 'epoch': 0.64} {'loss': 0.7315, 'learning_rate': 1.5381023133329224e-05, 'epoch': 0.64} {'loss': 0.8002, 'learning_rate': 1.5380747212540955e-05, 'epoch': 0.64} {'loss': 0.8314, 'learning_rate': 1.538047128598673e-05, 'epoch': 0.64} {'loss': 0.9498, 'learning_rate': 1.5380195353666842e-05, 'epoch': 0.64} {'loss': 0.9325, 'learning_rate': 1.5379919415581595e-05, 'epoch': 0.64} {'loss': 0.9161, 'learning_rate': 1.5379643471731275e-05, 'epoch': 0.64} {'loss': 0.7183, 'learning_rate': 1.537936752211618e-05, 'epoch': 0.64} {'loss': 0.8076, 'learning_rate': 1.5379091566736608e-05, 'epoch': 0.64} {'loss': 0.9111, 'learning_rate': 1.5378815605592857e-05, 'epoch': 0.64} {'loss': 0.7715, 'learning_rate': 1.5378539638685216e-05, 'epoch': 0.64} {'loss': 0.8149, 'learning_rate': 1.5378263666013987e-05, 'epoch': 0.64} {'loss': 0.8895, 'learning_rate': 1.5377987687579464e-05, 'epoch': 0.64} {'loss': 0.5292, 'learning_rate': 1.5377711703381936e-05, 'epoch': 0.64} {'loss': 0.7971, 'learning_rate': 1.5377435713421708e-05, 'epoch': 0.64} {'loss': 0.974, 'learning_rate': 1.5377159717699073e-05, 'epoch': 0.64} {'loss': 0.7571, 'learning_rate': 1.5376883716214325e-05, 'epoch': 0.64} {'loss': 0.815, 'learning_rate': 1.5376607708967766e-05, 'epoch': 0.64} {'loss': 0.8242, 'learning_rate': 1.537633169595968e-05, 'epoch': 0.64} {'loss': 0.7372, 'learning_rate': 1.537605567719037e-05, 'epoch': 0.64} {'loss': 0.7829, 'learning_rate': 1.537577965266013e-05, 'epoch': 0.64} {'loss': 0.8802, 'learning_rate': 1.5375503622369263e-05, 'epoch': 0.64} {'loss': 0.8833, 'learning_rate': 1.537522758631805e-05, 'epoch': 0.64} {'loss': 0.846, 'learning_rate': 1.5374951544506806e-05, 'epoch': 0.64} {'loss': 0.8354, 'learning_rate': 1.5374675496935807e-05, 'epoch': 0.64} {'loss': 0.9992, 'learning_rate': 1.5374399443605365e-05, 'epoch': 0.64} {'loss': 0.7924, 'learning_rate': 1.5374123384515765e-05, 'epoch': 0.64} {'loss': 0.6945, 'learning_rate': 1.5373847319667307e-05, 'epoch': 0.64} {'loss': 0.9154, 'learning_rate': 1.5373571249060286e-05, 'epoch': 0.64} {'loss': 0.8207, 'learning_rate': 1.5373295172695e-05, 'epoch': 0.64} {'loss': 0.9068, 'learning_rate': 1.5373019090571744e-05, 'epoch': 0.64} {'loss': 0.9033, 'learning_rate': 1.5372743002690814e-05, 'epoch': 0.64} {'loss': 0.6995, 'learning_rate': 1.5372466909052502e-05, 'epoch': 0.64} {'loss': 0.5972, 'learning_rate': 1.5372190809657104e-05, 'epoch': 0.64} {'loss': 0.5985, 'learning_rate': 1.5371914704504925e-05, 'epoch': 0.64} {'loss': 1.0464, 'learning_rate': 1.537163859359625e-05, 'epoch': 0.64} {'loss': 0.7934, 'learning_rate': 1.5371362476931384e-05, 'epoch': 0.64} {'loss': 0.8815, 'learning_rate': 1.5371086354510615e-05, 'epoch': 0.64} {'loss': 0.8292, 'learning_rate': 1.5370810226334243e-05, 'epoch': 0.64} {'loss': 0.945, 'learning_rate': 1.537053409240256e-05, 'epoch': 0.64} {'loss': 0.8716, 'learning_rate': 1.537025795271587e-05, 'epoch': 0.64} {'loss': 0.7782, 'learning_rate': 1.5369981807274462e-05, 'epoch': 0.64} {'loss': 0.8766, 'learning_rate': 1.5369705656078636e-05, 'epoch': 0.64} {'loss': 0.9452, 'learning_rate': 1.536942949912868e-05, 'epoch': 0.64} {'loss': 0.8899, 'learning_rate': 1.53691533364249e-05, 'epoch': 0.64} {'loss': 0.601, 'learning_rate': 1.5368877167967587e-05, 'epoch': 0.64} {'loss': 0.8777, 'learning_rate': 1.536860099375704e-05, 'epoch': 0.64} {'loss': 0.8167, 'learning_rate': 1.5368324813793547e-05, 'epoch': 0.64} {'loss': 0.7504, 'learning_rate': 1.536804862807741e-05, 'epoch': 0.64} {'loss': 0.7811, 'learning_rate': 1.536777243660893e-05, 'epoch': 0.64} {'loss': 1.1028, 'learning_rate': 1.5367496239388395e-05, 'epoch': 0.64} {'loss': 0.8535, 'learning_rate': 1.53672200364161e-05, 'epoch': 0.64} {'loss': 0.9885, 'learning_rate': 1.5366943827692347e-05, 'epoch': 0.64} {'loss': 0.8835, 'learning_rate': 1.5366667613217426e-05, 'epoch': 0.64} {'loss': 0.7046, 'learning_rate': 1.536639139299164e-05, 'epoch': 0.64} {'loss': 0.906, 'learning_rate': 1.536611516701528e-05, 'epoch': 0.64} {'loss': 0.7597, 'learning_rate': 1.5365838935288646e-05, 'epoch': 0.64} {'loss': 0.9013, 'learning_rate': 1.5365562697812027e-05, 'epoch': 0.64} {'loss': 0.8686, 'learning_rate': 1.5365286454585725e-05, 'epoch': 0.64} {'loss': 0.8463, 'learning_rate': 1.5365010205610035e-05, 'epoch': 0.64} {'loss': 0.8283, 'learning_rate': 1.536473395088525e-05, 'epoch': 0.64} {'loss': 0.7401, 'learning_rate': 1.5364457690411674e-05, 'epoch': 0.64} {'loss': 0.8692, 'learning_rate': 1.5364181424189593e-05, 'epoch': 0.64} {'loss': 0.8282, 'learning_rate': 1.5363905152219306e-05, 'epoch': 0.64} {'loss': 0.8363, 'learning_rate': 1.5363628874501114e-05, 'epoch': 0.64} {'loss': 0.71, 'learning_rate': 1.536335259103531e-05, 'epoch': 0.64} {'loss': 1.0079, 'learning_rate': 1.5363076301822186e-05, 'epoch': 0.64} {'loss': 0.9496, 'learning_rate': 1.5362800006862046e-05, 'epoch': 0.64} {'loss': 0.8283, 'learning_rate': 1.5362523706155177e-05, 'epoch': 0.64} {'loss': 0.8677, 'learning_rate': 1.536224739970188e-05, 'epoch': 0.64} {'loss': 0.8418, 'learning_rate': 1.5361971087502454e-05, 'epoch': 0.64} {'loss': 0.6796, 'learning_rate': 1.5361694769557194e-05, 'epoch': 0.64} {'loss': 0.8632, 'learning_rate': 1.536141844586639e-05, 'epoch': 0.64} {'loss': 0.8102, 'learning_rate': 1.5361142116430343e-05, 'epoch': 0.64} {'loss': 0.7921, 'learning_rate': 1.536086578124935e-05, 'epoch': 0.64} {'loss': 0.7076, 'learning_rate': 1.5360589440323704e-05, 'epoch': 0.64} {'loss': 0.8229, 'learning_rate': 1.5360313093653704e-05, 'epoch': 0.64} {'loss': 0.6945, 'learning_rate': 1.536003674123964e-05, 'epoch': 0.64} {'loss': 0.834, 'learning_rate': 1.535976038308182e-05, 'epoch': 0.64} {'loss': 0.8443, 'learning_rate': 1.535948401918053e-05, 'epoch': 0.64} {'loss': 1.0239, 'learning_rate': 1.5359207649536068e-05, 'epoch': 0.64} {'loss': 0.7868, 'learning_rate': 1.5358931274148733e-05, 'epoch': 0.64} {'loss': 1.027, 'learning_rate': 1.5358654893018817e-05, 'epoch': 0.64} {'loss': 0.8567, 'learning_rate': 1.535837850614662e-05, 'epoch': 0.64} {'loss': 0.8752, 'learning_rate': 1.5358102113532437e-05, 'epoch': 0.64} {'loss': 0.793, 'learning_rate': 1.535782571517656e-05, 'epoch': 0.64} {'loss': 0.8872, 'learning_rate': 1.5357549311079298e-05, 'epoch': 0.64} {'loss': 0.5834, 'learning_rate': 1.5357272901240934e-05, 'epoch': 0.64} {'loss': 0.8891, 'learning_rate': 1.5356996485661764e-05, 'epoch': 0.64} {'loss': 0.7358, 'learning_rate': 1.5356720064342093e-05, 'epoch': 0.64} {'loss': 0.8799, 'learning_rate': 1.5356443637282214e-05, 'epoch': 0.64} {'loss': 0.8896, 'learning_rate': 1.535616720448242e-05, 'epoch': 0.64} {'loss': 0.8729, 'learning_rate': 1.5355890765943013e-05, 'epoch': 0.64} {'loss': 0.9193, 'learning_rate': 1.535561432166428e-05, 'epoch': 0.64} {'loss': 0.9599, 'learning_rate': 1.535533787164653e-05, 'epoch': 0.64} {'loss': 0.8544, 'learning_rate': 1.5355061415890044e-05, 'epoch': 0.64} {'loss': 0.8256, 'learning_rate': 1.535478495439513e-05, 'epoch': 0.64} {'loss': 0.803, 'learning_rate': 1.535450848716208e-05, 'epoch': 0.64} {'loss': 0.9164, 'learning_rate': 1.535423201419119e-05, 'epoch': 0.64} {'loss': 0.8871, 'learning_rate': 1.535395553548276e-05, 'epoch': 0.64} {'loss': 0.6504, 'learning_rate': 1.5353679051037084e-05, 'epoch': 0.64} {'loss': 0.579, 'learning_rate': 1.5353402560854457e-05, 'epoch': 0.64} {'loss': 0.7271, 'learning_rate': 1.5353126064935177e-05, 'epoch': 0.64} {'loss': 0.8055, 'learning_rate': 1.5352849563279536e-05, 'epoch': 0.64} {'loss': 0.8323, 'learning_rate': 1.5352573055887832e-05, 'epoch': 0.64} {'loss': 0.724, 'learning_rate': 1.5352296542760367e-05, 'epoch': 0.64} {'loss': 0.7768, 'learning_rate': 1.535202002389743e-05, 'epoch': 0.64} {'loss': 0.9062, 'learning_rate': 1.5351743499299327e-05, 'epoch': 0.64} {'loss': 0.8504, 'learning_rate': 1.5351466968966343e-05, 'epoch': 0.64} {'loss': 0.8097, 'learning_rate': 1.535119043289878e-05, 'epoch': 0.64} {'loss': 0.8827, 'learning_rate': 1.535091389109693e-05, 'epoch': 0.64} {'loss': 0.7493, 'learning_rate': 1.5350637343561096e-05, 'epoch': 0.64} {'loss': 0.8122, 'learning_rate': 1.535036079029157e-05, 'epoch': 0.64} {'loss': 0.9898, 'learning_rate': 1.5350084231288652e-05, 'epoch': 0.64} {'loss': 0.7223, 'learning_rate': 1.5349807666552634e-05, 'epoch': 0.64} {'loss': 0.7366, 'learning_rate': 1.5349531096083813e-05, 'epoch': 0.64} {'loss': 0.7771, 'learning_rate': 1.534925451988249e-05, 'epoch': 0.64} {'loss': 0.8922, 'learning_rate': 1.5348977937948953e-05, 'epoch': 0.64} {'loss': 0.8533, 'learning_rate': 1.534870135028351e-05, 'epoch': 0.64} {'loss': 0.8309, 'learning_rate': 1.5348424756886445e-05, 'epoch': 0.64} {'loss': 0.8366, 'learning_rate': 1.5348148157758065e-05, 'epoch': 0.64} {'loss': 0.8679, 'learning_rate': 1.5347871552898656e-05, 'epoch': 0.65} {'loss': 0.8418, 'learning_rate': 1.5347594942308527e-05, 'epoch': 0.65} {'loss': 0.7289, 'learning_rate': 1.5347318325987962e-05, 'epoch': 0.65} {'loss': 1.0062, 'learning_rate': 1.5347041703937264e-05, 'epoch': 0.65} {'loss': 0.7697, 'learning_rate': 1.5346765076156727e-05, 'epoch': 0.65} {'loss': 0.8621, 'learning_rate': 1.534648844264665e-05, 'epoch': 0.65} {'loss': 0.7761, 'learning_rate': 1.5346211803407327e-05, 'epoch': 0.65} {'loss': 0.8713, 'learning_rate': 1.5345935158439055e-05, 'epoch': 0.65} {'loss': 1.0492, 'learning_rate': 1.5345658507742133e-05, 'epoch': 0.65} {'loss': 0.8051, 'learning_rate': 1.5345381851316856e-05, 'epoch': 0.65} {'loss': 0.9084, 'learning_rate': 1.5345105189163518e-05, 'epoch': 0.65} {'loss': 0.8198, 'learning_rate': 1.534482852128242e-05, 'epoch': 0.65} {'loss': 0.7478, 'learning_rate': 1.534455184767385e-05, 'epoch': 0.65} {'loss': 0.9837, 'learning_rate': 1.5344275168338118e-05, 'epoch': 0.65} {'loss': 0.7902, 'learning_rate': 1.5343998483275507e-05, 'epoch': 0.65} {'loss': 0.89, 'learning_rate': 1.5343721792486324e-05, 'epoch': 0.65} {'loss': 0.7777, 'learning_rate': 1.5343445095970858e-05, 'epoch': 0.65} {'loss': 0.7974, 'learning_rate': 1.5343168393729406e-05, 'epoch': 0.65} {'loss': 0.8662, 'learning_rate': 1.5342891685762272e-05, 'epoch': 0.65} {'loss': 0.8513, 'learning_rate': 1.534261497206974e-05, 'epoch': 0.65} {'loss': 0.7984, 'learning_rate': 1.534233825265212e-05, 'epoch': 0.65} {'loss': 0.7725, 'learning_rate': 1.5342061527509704e-05, 'epoch': 0.65} {'loss': 0.8886, 'learning_rate': 1.5341784796642783e-05, 'epoch': 0.65} {'loss': 0.8885, 'learning_rate': 1.534150806005166e-05, 'epoch': 0.65} {'loss': 0.7971, 'learning_rate': 1.5341231317736624e-05, 'epoch': 0.65} {'loss': 0.965, 'learning_rate': 1.534095456969798e-05, 'epoch': 0.65} {'loss': 0.8812, 'learning_rate': 1.5340677815936024e-05, 'epoch': 0.65} {'loss': 0.9119, 'learning_rate': 1.5340401056451045e-05, 'epoch': 0.65} {'loss': 0.8905, 'learning_rate': 1.5340124291243346e-05, 'epoch': 0.65} {'loss': 0.8083, 'learning_rate': 1.5339847520313224e-05, 'epoch': 0.65} {'loss': 0.7505, 'learning_rate': 1.533957074366097e-05, 'epoch': 0.65} {'loss': 0.7801, 'learning_rate': 1.5339293961286882e-05, 'epoch': 0.65} {'loss': 0.7685, 'learning_rate': 1.533901717319126e-05, 'epoch': 0.65} {'loss': 0.9487, 'learning_rate': 1.5338740379374404e-05, 'epoch': 0.65} {'loss': 0.9711, 'learning_rate': 1.5338463579836605e-05, 'epoch': 0.65} {'loss': 0.8344, 'learning_rate': 1.533818677457816e-05, 'epoch': 0.65} {'loss': 0.9379, 'learning_rate': 1.5337909963599364e-05, 'epoch': 0.65} {'loss': 1.0044, 'learning_rate': 1.5337633146900515e-05, 'epoch': 0.65} {'loss': 0.7027, 'learning_rate': 1.533735632448191e-05, 'epoch': 0.65} {'loss': 0.7988, 'learning_rate': 1.5337079496343846e-05, 'epoch': 0.65} {'loss': 0.8311, 'learning_rate': 1.5336802662486624e-05, 'epoch': 0.65} {'loss': 0.8219, 'learning_rate': 1.5336525822910533e-05, 'epoch': 0.65} {'loss': 0.9032, 'learning_rate': 1.533624897761587e-05, 'epoch': 0.65} {'loss': 0.7631, 'learning_rate': 1.5335972126602942e-05, 'epoch': 0.65} {'loss': 0.9231, 'learning_rate': 1.533569526987203e-05, 'epoch': 0.65} {'loss': 0.7398, 'learning_rate': 1.5335418407423442e-05, 'epoch': 0.65} {'loss': 0.8357, 'learning_rate': 1.5335141539257475e-05, 'epoch': 0.65} {'loss': 0.868, 'learning_rate': 1.5334864665374422e-05, 'epoch': 0.65} {'loss': 0.7202, 'learning_rate': 1.5334587785774577e-05, 'epoch': 0.65} {'loss': 0.8987, 'learning_rate': 1.533431090045824e-05, 'epoch': 0.65} {'loss': 0.7294, 'learning_rate': 1.533403400942571e-05, 'epoch': 0.65} {'loss': 0.8492, 'learning_rate': 1.5333757112677277e-05, 'epoch': 0.65} {'loss': 0.7901, 'learning_rate': 1.5333480210213245e-05, 'epoch': 0.65} {'loss': 0.9528, 'learning_rate': 1.5333203302033906e-05, 'epoch': 0.65} {'loss': 0.8504, 'learning_rate': 1.533292638813956e-05, 'epoch': 0.65} {'loss': 0.7688, 'learning_rate': 1.53326494685305e-05, 'epoch': 0.65} {'loss': 0.863, 'learning_rate': 1.5332372543207026e-05, 'epoch': 0.65} {'loss': 0.9336, 'learning_rate': 1.5332095612169435e-05, 'epoch': 0.65} {'loss': 0.8834, 'learning_rate': 1.533181867541802e-05, 'epoch': 0.65} {'loss': 0.8825, 'learning_rate': 1.533154173295308e-05, 'epoch': 0.65} {'loss': 0.8134, 'learning_rate': 1.5331264784774913e-05, 'epoch': 0.65} {'loss': 0.6917, 'learning_rate': 1.533098783088381e-05, 'epoch': 0.65} {'loss': 0.71, 'learning_rate': 1.533071087128008e-05, 'epoch': 0.65} {'loss': 0.7649, 'learning_rate': 1.533043390596401e-05, 'epoch': 0.65} {'loss': 0.9795, 'learning_rate': 1.5330156934935896e-05, 'epoch': 0.65} {'loss': 0.6244, 'learning_rate': 1.532987995819604e-05, 'epoch': 0.65} {'loss': 0.9095, 'learning_rate': 1.532960297574474e-05, 'epoch': 0.65} {'loss': 1.0138, 'learning_rate': 1.532932598758228e-05, 'epoch': 0.65} {'loss': 0.6149, 'learning_rate': 1.5329048993708974e-05, 'epoch': 0.65} {'loss': 0.6429, 'learning_rate': 1.532877199412511e-05, 'epoch': 0.65} {'loss': 0.7076, 'learning_rate': 1.5328494988830983e-05, 'epoch': 0.65} {'loss': 0.8129, 'learning_rate': 1.5328217977826893e-05, 'epoch': 0.65} {'loss': 0.8226, 'learning_rate': 1.5327940961113142e-05, 'epoch': 0.65} {'loss': 0.8801, 'learning_rate': 1.5327663938690018e-05, 'epoch': 0.65} {'loss': 0.8335, 'learning_rate': 1.5327386910557816e-05, 'epoch': 0.65} {'loss': 0.8746, 'learning_rate': 1.5327109876716843e-05, 'epoch': 0.65} {'loss': 0.7275, 'learning_rate': 1.532683283716739e-05, 'epoch': 0.65} {'loss': 0.7923, 'learning_rate': 1.5326555791909754e-05, 'epoch': 0.65} {'loss': 0.6698, 'learning_rate': 1.5326278740944238e-05, 'epoch': 0.65} {'loss': 0.8794, 'learning_rate': 1.532600168427113e-05, 'epoch': 0.65} {'loss': 0.6806, 'learning_rate': 1.5325724621890726e-05, 'epoch': 0.65} {'loss': 0.6872, 'learning_rate': 1.5325447553803334e-05, 'epoch': 0.65} {'loss': 0.7282, 'learning_rate': 1.5325170480009243e-05, 'epoch': 0.65} {'loss': 0.7984, 'learning_rate': 1.532489340050875e-05, 'epoch': 0.65} {'loss': 0.9366, 'learning_rate': 1.532461631530215e-05, 'epoch': 0.65} {'loss': 0.9609, 'learning_rate': 1.532433922438975e-05, 'epoch': 0.65} {'loss': 0.7666, 'learning_rate': 1.5324062127771834e-05, 'epoch': 0.65} {'loss': 0.7676, 'learning_rate': 1.5323785025448708e-05, 'epoch': 0.65} {'loss': 0.859, 'learning_rate': 1.5323507917420663e-05, 'epoch': 0.65} {'loss': 0.9077, 'learning_rate': 1.5323230803688e-05, 'epoch': 0.65} {'loss': 0.9399, 'learning_rate': 1.5322953684251016e-05, 'epoch': 0.65} {'loss': 0.9483, 'learning_rate': 1.532267655911001e-05, 'epoch': 0.65} {'loss': 0.8751, 'learning_rate': 1.532239942826527e-05, 'epoch': 0.65} {'loss': 0.8523, 'learning_rate': 1.5322122291717097e-05, 'epoch': 0.65} {'loss': 0.9131, 'learning_rate': 1.5321845149465793e-05, 'epoch': 0.65} {'loss': 0.8361, 'learning_rate': 1.532156800151165e-05, 'epoch': 0.65} {'loss': 1.0143, 'learning_rate': 1.5321290847854974e-05, 'epoch': 0.65} {'loss': 0.8278, 'learning_rate': 1.5321013688496047e-05, 'epoch': 0.65} {'loss': 0.9127, 'learning_rate': 1.5320736523435176e-05, 'epoch': 0.65} {'loss': 0.7904, 'learning_rate': 1.5320459352672655e-05, 'epoch': 0.65} {'loss': 0.9443, 'learning_rate': 1.532018217620878e-05, 'epoch': 0.65} {'loss': 0.8725, 'learning_rate': 1.531990499404385e-05, 'epoch': 0.65} {'loss': 0.8887, 'learning_rate': 1.5319627806178165e-05, 'epoch': 0.65} {'loss': 0.8653, 'learning_rate': 1.5319350612612013e-05, 'epoch': 0.65} {'loss': 0.7477, 'learning_rate': 1.5319073413345705e-05, 'epoch': 0.65} {'loss': 0.7835, 'learning_rate': 1.5318796208379523e-05, 'epoch': 0.65} {'loss': 0.791, 'learning_rate': 1.531851899771377e-05, 'epoch': 0.65} {'loss': 0.801, 'learning_rate': 1.5318241781348748e-05, 'epoch': 0.65} {'loss': 0.6802, 'learning_rate': 1.531796455928475e-05, 'epoch': 0.65} {'loss': 0.8135, 'learning_rate': 1.531768733152207e-05, 'epoch': 0.65} {'loss': 0.6632, 'learning_rate': 1.5317410098061012e-05, 'epoch': 0.65} {'loss': 0.7702, 'learning_rate': 1.5317132858901868e-05, 'epoch': 0.65} {'loss': 0.8115, 'learning_rate': 1.5316855614044933e-05, 'epoch': 0.65} {'loss': 0.8963, 'learning_rate': 1.531657836349051e-05, 'epoch': 0.65} {'loss': 0.9126, 'learning_rate': 1.531630110723889e-05, 'epoch': 0.65} {'loss': 1.028, 'learning_rate': 1.5316023845290377e-05, 'epoch': 0.65} {'loss': 0.7884, 'learning_rate': 1.5315746577645264e-05, 'epoch': 0.65} {'loss': 0.817, 'learning_rate': 1.531546930430385e-05, 'epoch': 0.65} {'loss': 0.7249, 'learning_rate': 1.531519202526643e-05, 'epoch': 0.65} {'loss': 0.7342, 'learning_rate': 1.5314914740533302e-05, 'epoch': 0.65} {'loss': 0.8019, 'learning_rate': 1.5314637450104762e-05, 'epoch': 0.65} {'loss': 0.8115, 'learning_rate': 1.5314360153981107e-05, 'epoch': 0.65} {'loss': 0.81, 'learning_rate': 1.531408285216264e-05, 'epoch': 0.65} {'loss': 0.9626, 'learning_rate': 1.5313805544649652e-05, 'epoch': 0.65} {'loss': 0.8898, 'learning_rate': 1.531352823144244e-05, 'epoch': 0.65} {'loss': 0.735, 'learning_rate': 1.5313250912541304e-05, 'epoch': 0.65} {'loss': 0.7806, 'learning_rate': 1.531297358794654e-05, 'epoch': 0.65} {'loss': 0.9891, 'learning_rate': 1.5312696257658446e-05, 'epoch': 0.65} {'loss': 0.9078, 'learning_rate': 1.5312418921677314e-05, 'epoch': 0.65} {'loss': 0.9589, 'learning_rate': 1.5312141580003453e-05, 'epoch': 0.65} {'loss': 0.7913, 'learning_rate': 1.5311864232637148e-05, 'epoch': 0.65} {'loss': 0.9114, 'learning_rate': 1.5311586879578704e-05, 'epoch': 0.65} {'loss': 1.0285, 'learning_rate': 1.531130952082841e-05, 'epoch': 0.65} {'loss': 0.9423, 'learning_rate': 1.5311032156386575e-05, 'epoch': 0.65} {'loss': 0.889, 'learning_rate': 1.5310754786253485e-05, 'epoch': 0.65} {'loss': 0.757, 'learning_rate': 1.5310477410429444e-05, 'epoch': 0.65} {'loss': 0.8758, 'learning_rate': 1.5310200028914745e-05, 'epoch': 0.65} {'loss': 0.8422, 'learning_rate': 1.530992264170969e-05, 'epoch': 0.65} {'loss': 0.7229, 'learning_rate': 1.5309645248814576e-05, 'epoch': 0.65} {'loss': 0.9193, 'learning_rate': 1.5309367850229693e-05, 'epoch': 0.65} {'loss': 0.8732, 'learning_rate': 1.5309090445955344e-05, 'epoch': 0.65} {'loss': 0.9215, 'learning_rate': 1.5308813035991826e-05, 'epoch': 0.65} {'loss': 0.8612, 'learning_rate': 1.5308535620339436e-05, 'epoch': 0.65} {'loss': 0.7917, 'learning_rate': 1.530825819899847e-05, 'epoch': 0.65} {'loss': 0.9081, 'learning_rate': 1.5307980771969228e-05, 'epoch': 0.65} {'loss': 0.842, 'learning_rate': 1.5307703339252004e-05, 'epoch': 0.65} {'loss': 0.9176, 'learning_rate': 1.53074259008471e-05, 'epoch': 0.65} {'loss': 0.8115, 'learning_rate': 1.5307148456754805e-05, 'epoch': 0.65} {'loss': 0.8017, 'learning_rate': 1.5306871006975426e-05, 'epoch': 0.65} {'loss': 0.9505, 'learning_rate': 1.530659355150925e-05, 'epoch': 0.65} {'loss': 0.6136, 'learning_rate': 1.5306316090356586e-05, 'epoch': 0.65} {'loss': 0.7219, 'learning_rate': 1.5306038623517727e-05, 'epoch': 0.65} {'loss': 0.7106, 'learning_rate': 1.5305761150992962e-05, 'epoch': 0.65} {'loss': 0.7596, 'learning_rate': 1.5305483672782598e-05, 'epoch': 0.65} {'loss': 0.7816, 'learning_rate': 1.530520618888693e-05, 'epoch': 0.65} {'loss': 0.8182, 'learning_rate': 1.530492869930625e-05, 'epoch': 0.65} {'loss': 1.0583, 'learning_rate': 1.5304651204040867e-05, 'epoch': 0.65} {'loss': 0.8402, 'learning_rate': 1.5304373703091067e-05, 'epoch': 0.65} {'loss': 0.9226, 'learning_rate': 1.5304096196457153e-05, 'epoch': 0.65} {'loss': 0.7511, 'learning_rate': 1.5303818684139425e-05, 'epoch': 0.65} {'loss': 0.7386, 'learning_rate': 1.5303541166138173e-05, 'epoch': 0.65} {'loss': 0.8582, 'learning_rate': 1.53032636424537e-05, 'epoch': 0.65} {'loss': 0.7919, 'learning_rate': 1.53029861130863e-05, 'epoch': 0.65} {'loss': 0.7182, 'learning_rate': 1.5302708578036266e-05, 'epoch': 0.65} {'loss': 0.6055, 'learning_rate': 1.5302431037303906e-05, 'epoch': 0.65} {'loss': 0.8143, 'learning_rate': 1.5302153490889517e-05, 'epoch': 0.65} {'loss': 0.9228, 'learning_rate': 1.530187593879339e-05, 'epoch': 0.65} {'loss': 0.8106, 'learning_rate': 1.530159838101582e-05, 'epoch': 0.65} {'loss': 0.8511, 'learning_rate': 1.5301320817557112e-05, 'epoch': 0.65} {'loss': 0.8192, 'learning_rate': 1.530104324841756e-05, 'epoch': 0.65} {'loss': 0.8414, 'learning_rate': 1.5300765673597458e-05, 'epoch': 0.65} {'loss': 0.9756, 'learning_rate': 1.530048809309711e-05, 'epoch': 0.65} {'loss': 0.7382, 'learning_rate': 1.5300210506916812e-05, 'epoch': 0.65} {'loss': 0.6759, 'learning_rate': 1.5299932915056862e-05, 'epoch': 0.65} {'loss': 0.8653, 'learning_rate': 1.5299655317517553e-05, 'epoch': 0.65} {'loss': 0.8182, 'learning_rate': 1.5299377714299183e-05, 'epoch': 0.65} {'loss': 1.0856, 'learning_rate': 1.5299100105402053e-05, 'epoch': 0.65} {'loss': 0.9305, 'learning_rate': 1.529882249082646e-05, 'epoch': 0.65} {'loss': 0.7425, 'learning_rate': 1.5298544870572697e-05, 'epoch': 0.65} {'loss': 0.923, 'learning_rate': 1.529826724464107e-05, 'epoch': 0.65} {'loss': 0.8766, 'learning_rate': 1.529798961303187e-05, 'epoch': 0.65} {'loss': 1.0154, 'learning_rate': 1.529771197574539e-05, 'epoch': 0.65} {'loss': 0.9976, 'learning_rate': 1.5297434332781942e-05, 'epoch': 0.65} {'loss': 0.9031, 'learning_rate': 1.529715668414181e-05, 'epoch': 0.65} {'loss': 0.7803, 'learning_rate': 1.52968790298253e-05, 'epoch': 0.65} {'loss': 0.8174, 'learning_rate': 1.5296601369832702e-05, 'epoch': 0.65} {'loss': 0.7018, 'learning_rate': 1.5296323704164318e-05, 'epoch': 0.65} {'loss': 0.9259, 'learning_rate': 1.529604603282045e-05, 'epoch': 0.65} {'loss': 0.8813, 'learning_rate': 1.5295768355801386e-05, 'epoch': 0.65} {'loss': 0.8848, 'learning_rate': 1.529549067310743e-05, 'epoch': 0.65} {'loss': 0.9374, 'learning_rate': 1.5295212984738873e-05, 'epoch': 0.65} {'loss': 0.7391, 'learning_rate': 1.5294935290696026e-05, 'epoch': 0.65} {'loss': 0.7131, 'learning_rate': 1.529465759097917e-05, 'epoch': 0.65} {'loss': 0.8627, 'learning_rate': 1.5294379885588616e-05, 'epoch': 0.65} {'loss': 0.9721, 'learning_rate': 1.5294102174524656e-05, 'epoch': 0.65} {'loss': 0.7684, 'learning_rate': 1.5293824457787584e-05, 'epoch': 0.65} {'loss': 0.765, 'learning_rate': 1.5293546735377702e-05, 'epoch': 0.65} {'loss': 1.0395, 'learning_rate': 1.529326900729531e-05, 'epoch': 0.65} {'loss': 0.8325, 'learning_rate': 1.52929912735407e-05, 'epoch': 0.65} {'loss': 0.8811, 'learning_rate': 1.5292713534114174e-05, 'epoch': 0.65} {'loss': 0.8607, 'learning_rate': 1.529243578901603e-05, 'epoch': 0.65} {'loss': 0.8456, 'learning_rate': 1.5292158038246557e-05, 'epoch': 0.65} {'loss': 0.82, 'learning_rate': 1.529188028180606e-05, 'epoch': 0.65} {'loss': 0.9149, 'learning_rate': 1.529160251969484e-05, 'epoch': 0.65} {'loss': 0.79, 'learning_rate': 1.5291324751913186e-05, 'epoch': 0.65} {'loss': 0.9199, 'learning_rate': 1.5291046978461404e-05, 'epoch': 0.65} {'loss': 0.8777, 'learning_rate': 1.5290769199339783e-05, 'epoch': 0.65} {'loss': 0.7972, 'learning_rate': 1.5290491414548628e-05, 'epoch': 0.65} {'loss': 0.9401, 'learning_rate': 1.5290213624088235e-05, 'epoch': 0.65} {'loss': 0.8796, 'learning_rate': 1.5289935827958897e-05, 'epoch': 0.65} {'loss': 0.8938, 'learning_rate': 1.528965802616092e-05, 'epoch': 0.65} {'loss': 0.6738, 'learning_rate': 1.5289380218694595e-05, 'epoch': 0.65} {'loss': 0.7885, 'learning_rate': 1.528910240556022e-05, 'epoch': 0.65} {'loss': 0.7736, 'learning_rate': 1.5288824586758094e-05, 'epoch': 0.65} {'loss': 0.8259, 'learning_rate': 1.528854676228852e-05, 'epoch': 0.65} {'loss': 0.7041, 'learning_rate': 1.528826893215179e-05, 'epoch': 0.65} {'loss': 0.8724, 'learning_rate': 1.5287991096348197e-05, 'epoch': 0.65} {'loss': 0.8734, 'learning_rate': 1.5287713254878046e-05, 'epoch': 0.65} {'loss': 0.9195, 'learning_rate': 1.5287435407741638e-05, 'epoch': 0.65} {'loss': 0.8841, 'learning_rate': 1.528715755493926e-05, 'epoch': 0.65} {'loss': 0.8026, 'learning_rate': 1.5286879696471218e-05, 'epoch': 0.65} {'loss': 0.8763, 'learning_rate': 1.5286601832337806e-05, 'epoch': 0.65} {'loss': 0.8046, 'learning_rate': 1.5286323962539326e-05, 'epoch': 0.65} {'loss': 0.6349, 'learning_rate': 1.5286046087076073e-05, 'epoch': 0.65} {'loss': 0.6504, 'learning_rate': 1.528576820594834e-05, 'epoch': 0.65} {'loss': 0.8848, 'learning_rate': 1.528549031915643e-05, 'epoch': 0.65} {'loss': 0.7879, 'learning_rate': 1.5285212426700643e-05, 'epoch': 0.65} {'loss': 0.9391, 'learning_rate': 1.528493452858127e-05, 'epoch': 0.65} {'loss': 0.7302, 'learning_rate': 1.5284656624798616e-05, 'epoch': 0.65} {'loss': 0.9505, 'learning_rate': 1.5284378715352977e-05, 'epoch': 0.65} {'loss': 0.6247, 'learning_rate': 1.5284100800244645e-05, 'epoch': 0.65} {'loss': 0.8265, 'learning_rate': 1.5283822879473924e-05, 'epoch': 0.65} {'loss': 0.7334, 'learning_rate': 1.528354495304111e-05, 'epoch': 0.65} {'loss': 0.7574, 'learning_rate': 1.52832670209465e-05, 'epoch': 0.65} {'loss': 1.0491, 'learning_rate': 1.5282989083190395e-05, 'epoch': 0.65} {'loss': 0.7578, 'learning_rate': 1.5282711139773086e-05, 'epoch': 0.65} {'loss': 0.8969, 'learning_rate': 1.528243319069488e-05, 'epoch': 0.65} {'loss': 0.6323, 'learning_rate': 1.528215523595607e-05, 'epoch': 0.65} {'loss': 0.8746, 'learning_rate': 1.528187727555695e-05, 'epoch': 0.65} {'loss': 0.8502, 'learning_rate': 1.528159930949782e-05, 'epoch': 0.65} {'loss': 0.7181, 'learning_rate': 1.5281321337778985e-05, 'epoch': 0.65} {'loss': 0.7898, 'learning_rate': 1.5281043360400734e-05, 'epoch': 0.65} {'loss': 0.809, 'learning_rate': 1.5280765377363375e-05, 'epoch': 0.65} {'loss': 0.7471, 'learning_rate': 1.5280487388667192e-05, 'epoch': 0.65} {'loss': 0.9467, 'learning_rate': 1.528020939431249e-05, 'epoch': 0.65} {'loss': 0.7729, 'learning_rate': 1.527993139429957e-05, 'epoch': 0.65} {'loss': 1.0003, 'learning_rate': 1.5279653388628725e-05, 'epoch': 0.65} {'loss': 0.7307, 'learning_rate': 1.5279375377300255e-05, 'epoch': 0.65} {'loss': 0.9377, 'learning_rate': 1.5279097360314462e-05, 'epoch': 0.65} {'loss': 0.8289, 'learning_rate': 1.5278819337671638e-05, 'epoch': 0.65} {'loss': 0.5399, 'learning_rate': 1.527854130937208e-05, 'epoch': 0.65} {'loss': 0.8693, 'learning_rate': 1.527826327541609e-05, 'epoch': 0.65} {'loss': 0.825, 'learning_rate': 1.5277985235803965e-05, 'epoch': 0.65} {'loss': 0.7698, 'learning_rate': 1.5277707190536003e-05, 'epoch': 0.65} {'loss': 0.9316, 'learning_rate': 1.52774291396125e-05, 'epoch': 0.65} {'loss': 0.7885, 'learning_rate': 1.5277151083033755e-05, 'epoch': 0.65} {'loss': 0.8019, 'learning_rate': 1.527687302080007e-05, 'epoch': 0.65} {'loss': 0.6692, 'learning_rate': 1.5276594952911733e-05, 'epoch': 0.65} {'loss': 0.9408, 'learning_rate': 1.5276316879369052e-05, 'epoch': 0.65} {'loss': 0.8834, 'learning_rate': 1.527603880017232e-05, 'epoch': 0.65} {'loss': 0.7684, 'learning_rate': 1.5275760715321836e-05, 'epoch': 0.65} {'loss': 0.7453, 'learning_rate': 1.52754826248179e-05, 'epoch': 0.65} {'loss': 0.7138, 'learning_rate': 1.527520452866081e-05, 'epoch': 0.65} {'loss': 0.9727, 'learning_rate': 1.527492642685086e-05, 'epoch': 0.65} {'loss': 0.7338, 'learning_rate': 1.527464831938835e-05, 'epoch': 0.65} {'loss': 0.81, 'learning_rate': 1.5274370206273575e-05, 'epoch': 0.65} {'loss': 0.8806, 'learning_rate': 1.5274092087506843e-05, 'epoch': 0.65} {'loss': 0.8971, 'learning_rate': 1.5273813963088443e-05, 'epoch': 0.65} {'loss': 0.9833, 'learning_rate': 1.527353583301867e-05, 'epoch': 0.65} {'loss': 0.8782, 'learning_rate': 1.5273257697297835e-05, 'epoch': 0.65} {'loss': 0.6912, 'learning_rate': 1.5272979555926223e-05, 'epoch': 0.65} {'loss': 0.9082, 'learning_rate': 1.5272701408904142e-05, 'epoch': 0.65} {'loss': 0.6998, 'learning_rate': 1.5272423256231884e-05, 'epoch': 0.65} {'loss': 0.7484, 'learning_rate': 1.5272145097909747e-05, 'epoch': 0.65} {'loss': 0.6645, 'learning_rate': 1.5271866933938032e-05, 'epoch': 0.65} {'loss': 0.902, 'learning_rate': 1.5271588764317034e-05, 'epoch': 0.65} {'loss': 0.8416, 'learning_rate': 1.5271310589047055e-05, 'epoch': 0.65} {'loss': 0.8321, 'learning_rate': 1.527103240812839e-05, 'epoch': 0.65} {'loss': 0.8124, 'learning_rate': 1.5270754221561336e-05, 'epoch': 0.65} {'loss': 0.5382, 'learning_rate': 1.5270476029346195e-05, 'epoch': 0.65} {'loss': 0.8249, 'learning_rate': 1.5270197831483266e-05, 'epoch': 0.65} {'loss': 0.7716, 'learning_rate': 1.526991962797284e-05, 'epoch': 0.65} {'loss': 0.8015, 'learning_rate': 1.5269641418815223e-05, 'epoch': 0.65} {'loss': 0.7649, 'learning_rate': 1.5269363204010706e-05, 'epoch': 0.65} {'loss': 0.8016, 'learning_rate': 1.5269084983559593e-05, 'epoch': 0.65} {'loss': 0.6666, 'learning_rate': 1.526880675746218e-05, 'epoch': 0.65} {'loss': 0.6738, 'learning_rate': 1.5268528525718766e-05, 'epoch': 0.65} {'loss': 0.8094, 'learning_rate': 1.5268250288329643e-05, 'epoch': 0.65} {'loss': 0.842, 'learning_rate': 1.5267972045295118e-05, 'epoch': 0.65} {'loss': 0.7759, 'learning_rate': 1.5267693796615487e-05, 'epoch': 0.65} {'loss': 0.7401, 'learning_rate': 1.5267415542291045e-05, 'epoch': 0.65} {'loss': 0.8041, 'learning_rate': 1.526713728232209e-05, 'epoch': 0.65} {'loss': 0.8164, 'learning_rate': 1.5266859016708927e-05, 'epoch': 0.65} {'loss': 0.7979, 'learning_rate': 1.5266580745451846e-05, 'epoch': 0.65} {'loss': 0.843, 'learning_rate': 1.5266302468551147e-05, 'epoch': 0.65} {'loss': 0.8111, 'learning_rate': 1.5266024186007132e-05, 'epoch': 0.65} {'loss': 0.6484, 'learning_rate': 1.5265745897820096e-05, 'epoch': 0.65} {'loss': 0.9678, 'learning_rate': 1.526546760399034e-05, 'epoch': 0.65} {'loss': 0.857, 'learning_rate': 1.5265189304518154e-05, 'epoch': 0.65} {'loss': 0.9338, 'learning_rate': 1.526491099940385e-05, 'epoch': 0.65} {'loss': 0.907, 'learning_rate': 1.5264632688647714e-05, 'epoch': 0.65} {'loss': 0.8662, 'learning_rate': 1.526435437225005e-05, 'epoch': 0.65} {'loss': 0.9023, 'learning_rate': 1.5264076050211154e-05, 'epoch': 0.65} {'loss': 0.861, 'learning_rate': 1.5263797722531328e-05, 'epoch': 0.65} {'loss': 0.854, 'learning_rate': 1.5263519389210866e-05, 'epoch': 0.65} {'loss': 0.781, 'learning_rate': 1.526324105025007e-05, 'epoch': 0.65} {'loss': 0.7753, 'learning_rate': 1.5262962705649232e-05, 'epoch': 0.65} {'loss': 0.8953, 'learning_rate': 1.5262684355408657e-05, 'epoch': 0.65} {'loss': 0.8852, 'learning_rate': 1.526240599952864e-05, 'epoch': 0.65} {'loss': 0.9156, 'learning_rate': 1.526212763800948e-05, 'epoch': 0.65} {'loss': 0.8195, 'learning_rate': 1.5261849270851478e-05, 'epoch': 0.65} {'loss': 0.7314, 'learning_rate': 1.526157089805493e-05, 'epoch': 0.65} {'loss': 0.75, 'learning_rate': 1.526129251962013e-05, 'epoch': 0.65} {'loss': 0.8584, 'learning_rate': 1.5261014135547383e-05, 'epoch': 0.65} {'loss': 0.7537, 'learning_rate': 1.526073574583698e-05, 'epoch': 0.65} {'loss': 0.7785, 'learning_rate': 1.5260457350489226e-05, 'epoch': 0.65} {'loss': 0.8895, 'learning_rate': 1.5260178949504418e-05, 'epoch': 0.65} {'loss': 0.6682, 'learning_rate': 1.5259900542882856e-05, 'epoch': 0.65} {'loss': 0.7434, 'learning_rate': 1.5259622130624836e-05, 'epoch': 0.65} {'loss': 0.8218, 'learning_rate': 1.525934371273065e-05, 'epoch': 0.65} {'loss': 0.8942, 'learning_rate': 1.5259065289200608e-05, 'epoch': 0.65} {'loss': 0.8825, 'learning_rate': 1.5258786860035e-05, 'epoch': 0.65} {'loss': 0.9258, 'learning_rate': 1.525850842523413e-05, 'epoch': 0.65} {'loss': 0.9149, 'learning_rate': 1.5258229984798289e-05, 'epoch': 0.65} {'loss': 0.8614, 'learning_rate': 1.5257951538727784e-05, 'epoch': 0.65} {'loss': 0.9134, 'learning_rate': 1.525767308702291e-05, 'epoch': 0.65} {'loss': 0.8034, 'learning_rate': 1.5257394629683964e-05, 'epoch': 0.65} {'loss': 0.8596, 'learning_rate': 1.5257116166711243e-05, 'epoch': 0.65} {'loss': 0.8179, 'learning_rate': 1.5256837698105047e-05, 'epoch': 0.65} {'loss': 0.7617, 'learning_rate': 1.5256559223865677e-05, 'epoch': 0.65} {'loss': 0.8862, 'learning_rate': 1.525628074399343e-05, 'epoch': 0.65} {'loss': 0.6872, 'learning_rate': 1.5256002258488602e-05, 'epoch': 0.65} {'loss': 0.8762, 'learning_rate': 1.5255723767351496e-05, 'epoch': 0.65} {'loss': 0.7757, 'learning_rate': 1.5255445270582404e-05, 'epoch': 0.65} {'loss': 1.0431, 'learning_rate': 1.525516676818163e-05, 'epoch': 0.65} {'loss': 0.7551, 'learning_rate': 1.525488826014947e-05, 'epoch': 0.65} {'loss': 0.754, 'learning_rate': 1.5254609746486224e-05, 'epoch': 0.65} {'loss': 0.9515, 'learning_rate': 1.5254331227192189e-05, 'epoch': 0.65} {'loss': 0.9529, 'learning_rate': 1.5254052702267662e-05, 'epoch': 0.65} {'loss': 0.8644, 'learning_rate': 1.5253774171712947e-05, 'epoch': 0.65} {'loss': 0.7698, 'learning_rate': 1.5253495635528334e-05, 'epoch': 0.65} {'loss': 0.8348, 'learning_rate': 1.525321709371413e-05, 'epoch': 0.65} {'loss': 0.794, 'learning_rate': 1.525293854627063e-05, 'epoch': 0.65} {'loss': 0.7542, 'learning_rate': 1.5252659993198128e-05, 'epoch': 0.65} {'loss': 0.9233, 'learning_rate': 1.525238143449693e-05, 'epoch': 0.65} {'loss': 0.8303, 'learning_rate': 1.5252102870167331e-05, 'epoch': 0.65} {'loss': 0.744, 'learning_rate': 1.525182430020963e-05, 'epoch': 0.65} {'loss': 0.8121, 'learning_rate': 1.5251545724624124e-05, 'epoch': 0.65} {'loss': 0.9007, 'learning_rate': 1.5251267143411115e-05, 'epoch': 0.65} {'loss': 0.8967, 'learning_rate': 1.5250988556570898e-05, 'epoch': 0.65} {'loss': 0.8544, 'learning_rate': 1.5250709964103774e-05, 'epoch': 0.65} {'loss': 0.8033, 'learning_rate': 1.5250431366010037e-05, 'epoch': 0.65} {'loss': 0.6651, 'learning_rate': 1.5250152762289992e-05, 'epoch': 0.65} {'loss': 0.7768, 'learning_rate': 1.5249874152943933e-05, 'epoch': 0.65} {'loss': 0.7737, 'learning_rate': 1.524959553797216e-05, 'epoch': 0.65} {'loss': 0.9463, 'learning_rate': 1.5249316917374971e-05, 'epoch': 0.65} {'loss': 0.8241, 'learning_rate': 1.524903829115267e-05, 'epoch': 0.65} {'loss': 0.8544, 'learning_rate': 1.5248759659305545e-05, 'epoch': 0.65} {'loss': 0.8202, 'learning_rate': 1.52484810218339e-05, 'epoch': 0.65} {'loss': 0.7527, 'learning_rate': 1.5248202378738038e-05, 'epoch': 0.65} {'loss': 0.8734, 'learning_rate': 1.524792373001825e-05, 'epoch': 0.65} {'loss': 0.8839, 'learning_rate': 1.5247645075674841e-05, 'epoch': 0.65} {'loss': 0.8212, 'learning_rate': 1.5247366415708105e-05, 'epoch': 0.65} {'loss': 0.8576, 'learning_rate': 1.5247087750118344e-05, 'epoch': 0.65} {'loss': 0.755, 'learning_rate': 1.5246809078905851e-05, 'epoch': 0.65} {'loss': 0.8463, 'learning_rate': 1.5246530402070932e-05, 'epoch': 0.65} {'loss': 0.7189, 'learning_rate': 1.524625171961388e-05, 'epoch': 0.65} {'loss': 0.9039, 'learning_rate': 1.5245973031534998e-05, 'epoch': 0.65} {'loss': 0.8618, 'learning_rate': 1.5245694337834582e-05, 'epoch': 0.65} {'loss': 0.7281, 'learning_rate': 1.524541563851293e-05, 'epoch': 0.65} {'loss': 0.7932, 'learning_rate': 1.5245136933570342e-05, 'epoch': 0.65} {'loss': 0.8416, 'learning_rate': 1.5244858223007114e-05, 'epoch': 0.65} {'loss': 1.0836, 'learning_rate': 1.5244579506823552e-05, 'epoch': 0.65} {'loss': 0.8059, 'learning_rate': 1.5244300785019945e-05, 'epoch': 0.65} {'loss': 0.7447, 'learning_rate': 1.52440220575966e-05, 'epoch': 0.65} {'loss': 0.7172, 'learning_rate': 1.524374332455381e-05, 'epoch': 0.65} {'loss': 0.811, 'learning_rate': 1.5243464585891877e-05, 'epoch': 0.65} {'loss': 0.8295, 'learning_rate': 1.5243185841611098e-05, 'epoch': 0.65} {'loss': 0.7873, 'learning_rate': 1.5242907091711771e-05, 'epoch': 0.65} {'loss': 0.8495, 'learning_rate': 1.5242628336194196e-05, 'epoch': 0.65} {'loss': 0.8776, 'learning_rate': 1.5242349575058675e-05, 'epoch': 0.65} {'loss': 0.7289, 'learning_rate': 1.52420708083055e-05, 'epoch': 0.65} {'loss': 0.7424, 'learning_rate': 1.5241792035934975e-05, 'epoch': 0.65} {'loss': 0.733, 'learning_rate': 1.5241513257947393e-05, 'epoch': 0.65} {'loss': 0.9021, 'learning_rate': 1.5241234474343059e-05, 'epoch': 0.65} {'loss': 0.9019, 'learning_rate': 1.5240955685122268e-05, 'epoch': 0.65} {'loss': 0.8968, 'learning_rate': 1.5240676890285322e-05, 'epoch': 0.65} {'loss': 0.8631, 'learning_rate': 1.5240398089832518e-05, 'epoch': 0.65} {'loss': 0.8264, 'learning_rate': 1.5240119283764152e-05, 'epoch': 0.65} {'loss': 0.8591, 'learning_rate': 1.5239840472080527e-05, 'epoch': 0.65} {'loss': 0.9921, 'learning_rate': 1.523956165478194e-05, 'epoch': 0.65} {'loss': 0.7143, 'learning_rate': 1.523928283186869e-05, 'epoch': 0.65} {'loss': 1.0102, 'learning_rate': 1.5239004003341071e-05, 'epoch': 0.65} {'loss': 0.8599, 'learning_rate': 1.5238725169199394e-05, 'epoch': 0.65} {'loss': 0.7713, 'learning_rate': 1.5238446329443948e-05, 'epoch': 0.65} {'loss': 0.8848, 'learning_rate': 1.523816748407503e-05, 'epoch': 0.65} {'loss': 0.8962, 'learning_rate': 1.5237888633092946e-05, 'epoch': 0.65} {'loss': 0.7991, 'learning_rate': 1.5237609776497989e-05, 'epoch': 0.65} {'loss': 0.8749, 'learning_rate': 1.5237330914290463e-05, 'epoch': 0.65} {'loss': 0.7615, 'learning_rate': 1.5237052046470662e-05, 'epoch': 0.65} {'loss': 0.8039, 'learning_rate': 1.5236773173038888e-05, 'epoch': 0.65} {'loss': 0.7348, 'learning_rate': 1.523649429399544e-05, 'epoch': 0.65} {'loss': 0.7496, 'learning_rate': 1.5236215409340616e-05, 'epoch': 0.65} {'loss': 0.7391, 'learning_rate': 1.5235936519074712e-05, 'epoch': 0.65} {'loss': 1.022, 'learning_rate': 1.5235657623198031e-05, 'epoch': 0.65} {'loss': 0.8675, 'learning_rate': 1.5235378721710872e-05, 'epoch': 0.65} {'loss': 0.8653, 'learning_rate': 1.523509981461353e-05, 'epoch': 0.65} {'loss': 1.0053, 'learning_rate': 1.5234820901906306e-05, 'epoch': 0.65} {'loss': 0.7607, 'learning_rate': 1.5234541983589498e-05, 'epoch': 0.65} {'loss': 0.9339, 'learning_rate': 1.523426305966341e-05, 'epoch': 0.65} {'loss': 0.7513, 'learning_rate': 1.5233984130128331e-05, 'epoch': 0.65} {'loss': 0.8517, 'learning_rate': 1.5233705194984569e-05, 'epoch': 0.65} {'loss': 0.7532, 'learning_rate': 1.5233426254232421e-05, 'epoch': 0.65} {'loss': 0.7221, 'learning_rate': 1.523314730787218e-05, 'epoch': 0.65} {'loss': 0.7084, 'learning_rate': 1.5232868355904154e-05, 'epoch': 0.65} {'loss': 0.8811, 'learning_rate': 1.5232589398328635e-05, 'epoch': 0.65} {'loss': 0.7368, 'learning_rate': 1.5232310435145925e-05, 'epoch': 0.65} {'loss': 0.7523, 'learning_rate': 1.523203146635632e-05, 'epoch': 0.65} {'loss': 1.0505, 'learning_rate': 1.5231752491960123e-05, 'epoch': 0.65} {'loss': 0.6893, 'learning_rate': 1.523147351195763e-05, 'epoch': 0.65} {'loss': 0.7567, 'learning_rate': 1.5231194526349141e-05, 'epoch': 0.65} {'loss': 0.7366, 'learning_rate': 1.5230915535134956e-05, 'epoch': 0.65} {'loss': 0.7268, 'learning_rate': 1.5230636538315374e-05, 'epoch': 0.65} {'loss': 0.8196, 'learning_rate': 1.523035753589069e-05, 'epoch': 0.65} {'loss': 0.6878, 'learning_rate': 1.5230078527861207e-05, 'epoch': 0.65} {'loss': 0.754, 'learning_rate': 1.5229799514227224e-05, 'epoch': 0.65} {'loss': 0.8673, 'learning_rate': 1.5229520494989036e-05, 'epoch': 0.65} {'loss': 0.9591, 'learning_rate': 1.5229241470146946e-05, 'epoch': 0.65} {'loss': 0.8102, 'learning_rate': 1.5228962439701254e-05, 'epoch': 0.65} {'loss': 0.6989, 'learning_rate': 1.5228683403652254e-05, 'epoch': 0.65} {'loss': 0.7385, 'learning_rate': 1.522840436200025e-05, 'epoch': 0.65} {'loss': 0.7688, 'learning_rate': 1.5228125314745538e-05, 'epoch': 0.65} {'loss': 0.9623, 'learning_rate': 1.5227846261888414e-05, 'epoch': 0.65} {'loss': 0.8285, 'learning_rate': 1.5227567203429185e-05, 'epoch': 0.65} {'loss': 0.7502, 'learning_rate': 1.5227288139368146e-05, 'epoch': 0.65} {'loss': 0.7721, 'learning_rate': 1.5227009069705597e-05, 'epoch': 0.65} {'loss': 0.92, 'learning_rate': 1.5226729994441834e-05, 'epoch': 0.65} {'loss': 0.7232, 'learning_rate': 1.522645091357716e-05, 'epoch': 0.65} {'loss': 1.0181, 'learning_rate': 1.5226171827111868e-05, 'epoch': 0.65} {'loss': 0.7593, 'learning_rate': 1.5225892735046263e-05, 'epoch': 0.65} {'loss': 0.8859, 'learning_rate': 1.5225613637380644e-05, 'epoch': 0.65} {'loss': 0.8535, 'learning_rate': 1.5225334534115306e-05, 'epoch': 0.65} {'loss': 0.7701, 'learning_rate': 1.5225055425250555e-05, 'epoch': 0.65} {'loss': 0.8199, 'learning_rate': 1.5224776310786681e-05, 'epoch': 0.65} {'loss': 0.8818, 'learning_rate': 1.522449719072399e-05, 'epoch': 0.65} {'loss': 0.9096, 'learning_rate': 1.5224218065062774e-05, 'epoch': 0.65} {'loss': 0.8482, 'learning_rate': 1.5223938933803342e-05, 'epoch': 0.65} {'loss': 0.9662, 'learning_rate': 1.5223659796945986e-05, 'epoch': 0.65} {'loss': 0.7389, 'learning_rate': 1.5223380654491007e-05, 'epoch': 0.65} {'loss': 0.7579, 'learning_rate': 1.5223101506438705e-05, 'epoch': 0.65} {'loss': 0.7962, 'learning_rate': 1.522282235278938e-05, 'epoch': 0.65} {'loss': 0.9531, 'learning_rate': 1.5222543193543327e-05, 'epoch': 0.65} {'loss': 0.7308, 'learning_rate': 1.5222264028700849e-05, 'epoch': 0.65} {'loss': 0.7418, 'learning_rate': 1.522198485826224e-05, 'epoch': 0.65} {'loss': 0.8135, 'learning_rate': 1.5221705682227806e-05, 'epoch': 0.65} {'loss': 0.7488, 'learning_rate': 1.522142650059784e-05, 'epoch': 0.65} {'loss': 0.8098, 'learning_rate': 1.5221147313372649e-05, 'epoch': 0.65} {'loss': 0.8952, 'learning_rate': 1.5220868120552527e-05, 'epoch': 0.65} {'loss': 0.7733, 'learning_rate': 1.5220588922137771e-05, 'epoch': 0.65} {'loss': 0.787, 'learning_rate': 1.5220309718128685e-05, 'epoch': 0.65} {'loss': 0.7331, 'learning_rate': 1.5220030508525563e-05, 'epoch': 0.65} {'loss': 0.9858, 'learning_rate': 1.5219751293328708e-05, 'epoch': 0.65} {'loss': 0.7816, 'learning_rate': 1.5219472072538422e-05, 'epoch': 0.65} {'loss': 0.7672, 'learning_rate': 1.5219192846154997e-05, 'epoch': 0.65} {'loss': 1.0353, 'learning_rate': 1.5218913614178736e-05, 'epoch': 0.65} {'loss': 0.8662, 'learning_rate': 1.521863437660994e-05, 'epoch': 0.65} {'loss': 0.8675, 'learning_rate': 1.5218355133448906e-05, 'epoch': 0.65} {'loss': 0.8314, 'learning_rate': 1.5218075884695931e-05, 'epoch': 0.65} {'loss': 0.9932, 'learning_rate': 1.5217796630351319e-05, 'epoch': 0.65} {'loss': 0.752, 'learning_rate': 1.5217517370415364e-05, 'epoch': 0.65} {'loss': 0.6386, 'learning_rate': 1.5217238104888372e-05, 'epoch': 0.65} {'loss': 0.9436, 'learning_rate': 1.5216958833770636e-05, 'epoch': 0.65} {'loss': 0.842, 'learning_rate': 1.521667955706246e-05, 'epoch': 0.65} {'loss': 0.8698, 'learning_rate': 1.5216400274764138e-05, 'epoch': 0.65} {'loss': 0.8392, 'learning_rate': 1.5216120986875976e-05, 'epoch': 0.65} {'loss': 0.7004, 'learning_rate': 1.5215841693398265e-05, 'epoch': 0.65} {'loss': 0.7675, 'learning_rate': 1.5215562394331311e-05, 'epoch': 0.65} {'loss': 0.8645, 'learning_rate': 1.5215283089675414e-05, 'epoch': 0.65} {'loss': 0.9311, 'learning_rate': 1.5215003779430867e-05, 'epoch': 0.65} {'loss': 0.9523, 'learning_rate': 1.5214724463597974e-05, 'epoch': 0.65} {'loss': 0.8851, 'learning_rate': 1.5214445142177032e-05, 'epoch': 0.65} {'loss': 0.7868, 'learning_rate': 1.5214165815168342e-05, 'epoch': 0.66} {'loss': 0.6324, 'learning_rate': 1.5213886482572204e-05, 'epoch': 0.66} {'loss': 0.6908, 'learning_rate': 1.5213607144388913e-05, 'epoch': 0.66} {'loss': 0.8583, 'learning_rate': 1.5213327800618775e-05, 'epoch': 0.66} {'loss': 0.8553, 'learning_rate': 1.5213048451262084e-05, 'epoch': 0.66} {'loss': 0.6615, 'learning_rate': 1.5212769096319142e-05, 'epoch': 0.66} {'loss': 0.6576, 'learning_rate': 1.5212489735790245e-05, 'epoch': 0.66} {'loss': 0.8798, 'learning_rate': 1.5212210369675697e-05, 'epoch': 0.66} {'loss': 0.753, 'learning_rate': 1.5211930997975795e-05, 'epoch': 0.66} {'loss': 0.7619, 'learning_rate': 1.5211651620690839e-05, 'epoch': 0.66} {'loss': 0.7912, 'learning_rate': 1.5211372237821127e-05, 'epoch': 0.66} {'loss': 0.8354, 'learning_rate': 1.5211092849366957e-05, 'epoch': 0.66} {'loss': 0.9481, 'learning_rate': 1.5210813455328635e-05, 'epoch': 0.66} {'loss': 0.7827, 'learning_rate': 1.5210534055706454e-05, 'epoch': 0.66} {'loss': 0.6194, 'learning_rate': 1.5210254650500715e-05, 'epoch': 0.66} {'loss': 0.9544, 'learning_rate': 1.5209975239711718e-05, 'epoch': 0.66} {'loss': 0.6506, 'learning_rate': 1.5209695823339763e-05, 'epoch': 0.66} {'loss': 0.807, 'learning_rate': 1.5209416401385149e-05, 'epoch': 0.66} {'loss': 0.8676, 'learning_rate': 1.5209136973848174e-05, 'epoch': 0.66} {'loss': 0.7041, 'learning_rate': 1.5208857540729142e-05, 'epoch': 0.66} {'loss': 0.868, 'learning_rate': 1.5208578102028346e-05, 'epoch': 0.66} {'loss': 0.8935, 'learning_rate': 1.5208298657746086e-05, 'epoch': 0.66} {'loss': 1.025, 'learning_rate': 1.5208019207882667e-05, 'epoch': 0.66} {'loss': 0.6872, 'learning_rate': 1.5207739752438386e-05, 'epoch': 0.66} {'loss': 0.9308, 'learning_rate': 1.520746029141354e-05, 'epoch': 0.66} {'loss': 0.7399, 'learning_rate': 1.5207180824808432e-05, 'epoch': 0.66} {'loss': 0.7004, 'learning_rate': 1.5206901352623358e-05, 'epoch': 0.66} {'loss': 0.9641, 'learning_rate': 1.520662187485862e-05, 'epoch': 0.66} {'loss': 0.99, 'learning_rate': 1.5206342391514517e-05, 'epoch': 0.66} {'loss': 0.7495, 'learning_rate': 1.5206062902591347e-05, 'epoch': 0.66} {'loss': 0.7666, 'learning_rate': 1.5205783408089415e-05, 'epoch': 0.66} {'loss': 0.7746, 'learning_rate': 1.5205503908009011e-05, 'epoch': 0.66} {'loss': 0.9051, 'learning_rate': 1.5205224402350442e-05, 'epoch': 0.66} {'loss': 0.8292, 'learning_rate': 1.5204944891114007e-05, 'epoch': 0.66} {'loss': 0.7532, 'learning_rate': 1.52046653743e-05, 'epoch': 0.66} {'loss': 0.9113, 'learning_rate': 1.5204385851908725e-05, 'epoch': 0.66} {'loss': 0.8468, 'learning_rate': 1.5204106323940482e-05, 'epoch': 0.66} {'loss': 0.7342, 'learning_rate': 1.520382679039557e-05, 'epoch': 0.66} {'loss': 0.8506, 'learning_rate': 1.5203547251274289e-05, 'epoch': 0.66} {'loss': 0.8207, 'learning_rate': 1.5203267706576936e-05, 'epoch': 0.66} {'loss': 0.7797, 'learning_rate': 1.520298815630381e-05, 'epoch': 0.66} {'loss': 0.7624, 'learning_rate': 1.5202708600455213e-05, 'epoch': 0.66} {'loss': 0.7225, 'learning_rate': 1.5202429039031446e-05, 'epoch': 0.66} {'loss': 0.8825, 'learning_rate': 1.5202149472032805e-05, 'epoch': 0.66} {'loss': 0.7202, 'learning_rate': 1.5201869899459594e-05, 'epoch': 0.66} {'loss': 0.7044, 'learning_rate': 1.5201590321312109e-05, 'epoch': 0.66} {'loss': 0.7949, 'learning_rate': 1.520131073759065e-05, 'epoch': 0.66} {'loss': 0.7533, 'learning_rate': 1.5201031148295515e-05, 'epoch': 0.66} {'loss': 0.7911, 'learning_rate': 1.5200751553427009e-05, 'epoch': 0.66} {'loss': 0.8624, 'learning_rate': 1.5200471952985427e-05, 'epoch': 0.66} {'loss': 0.9023, 'learning_rate': 1.520019234697107e-05, 'epoch': 0.66} {'loss': 0.862, 'learning_rate': 1.5199912735384236e-05, 'epoch': 0.66} {'loss': 0.7499, 'learning_rate': 1.519963311822523e-05, 'epoch': 0.66} {'loss': 1.0312, 'learning_rate': 1.5199353495494347e-05, 'epoch': 0.66} {'loss': 0.9498, 'learning_rate': 1.5199073867191882e-05, 'epoch': 0.66} {'loss': 0.8486, 'learning_rate': 1.5198794233318145e-05, 'epoch': 0.66} {'loss': 0.9348, 'learning_rate': 1.5198514593873431e-05, 'epoch': 0.66} {'loss': 0.8255, 'learning_rate': 1.5198234948858036e-05, 'epoch': 0.66} {'loss': 0.8376, 'learning_rate': 1.5197955298272267e-05, 'epoch': 0.66} {'loss': 0.6461, 'learning_rate': 1.5197675642116418e-05, 'epoch': 0.66} {'loss': 0.9139, 'learning_rate': 1.5197395980390793e-05, 'epoch': 0.66} {'loss': 0.8866, 'learning_rate': 1.5197116313095684e-05, 'epoch': 0.66} {'loss': 0.813, 'learning_rate': 1.5196836640231398e-05, 'epoch': 0.66} {'loss': 0.9666, 'learning_rate': 1.5196556961798235e-05, 'epoch': 0.66} {'loss': 0.8613, 'learning_rate': 1.5196277277796489e-05, 'epoch': 0.66} {'loss': 0.8276, 'learning_rate': 1.5195997588226465e-05, 'epoch': 0.66} {'loss': 0.8287, 'learning_rate': 1.519571789308846e-05, 'epoch': 0.66} {'loss': 0.8192, 'learning_rate': 1.5195438192382772e-05, 'epoch': 0.66} {'loss': 0.918, 'learning_rate': 1.5195158486109705e-05, 'epoch': 0.66} {'loss': 0.8055, 'learning_rate': 1.5194878774269558e-05, 'epoch': 0.66} {'loss': 0.7092, 'learning_rate': 1.5194599056862629e-05, 'epoch': 0.66} {'loss': 0.8187, 'learning_rate': 1.5194319333889215e-05, 'epoch': 0.66} {'loss': 0.8709, 'learning_rate': 1.5194039605349625e-05, 'epoch': 0.66} {'loss': 1.098, 'learning_rate': 1.5193759871244149e-05, 'epoch': 0.66} {'loss': 0.8218, 'learning_rate': 1.519348013157309e-05, 'epoch': 0.66} {'loss': 0.9006, 'learning_rate': 1.519320038633675e-05, 'epoch': 0.66} {'loss': 0.8793, 'learning_rate': 1.5192920635535427e-05, 'epoch': 0.66} {'loss': 0.7698, 'learning_rate': 1.5192640879169418e-05, 'epoch': 0.66} {'loss': 0.8138, 'learning_rate': 1.5192361117239027e-05, 'epoch': 0.66} {'loss': 0.8346, 'learning_rate': 1.5192081349744557e-05, 'epoch': 0.66} {'loss': 0.7449, 'learning_rate': 1.5191801576686299e-05, 'epoch': 0.66} {'loss': 0.9827, 'learning_rate': 1.5191521798064554e-05, 'epoch': 0.66} {'loss': 0.7581, 'learning_rate': 1.519124201387963e-05, 'epoch': 0.66} {'loss': 0.9489, 'learning_rate': 1.519096222413182e-05, 'epoch': 0.66} {'loss': 0.8463, 'learning_rate': 1.5190682428821423e-05, 'epoch': 0.66} {'loss': 0.7651, 'learning_rate': 1.5190402627948744e-05, 'epoch': 0.66} {'loss': 0.7988, 'learning_rate': 1.5190122821514081e-05, 'epoch': 0.66} {'loss': 0.8397, 'learning_rate': 1.518984300951773e-05, 'epoch': 0.66} {'loss': 0.7297, 'learning_rate': 1.5189563191959997e-05, 'epoch': 0.66} {'loss': 0.7779, 'learning_rate': 1.5189283368841178e-05, 'epoch': 0.66} {'loss': 0.9948, 'learning_rate': 1.5189003540161574e-05, 'epoch': 0.66} {'loss': 0.8433, 'learning_rate': 1.5188723705921482e-05, 'epoch': 0.66} {'loss': 0.8181, 'learning_rate': 1.5188443866121203e-05, 'epoch': 0.66} {'loss': 0.754, 'learning_rate': 1.5188164020761043e-05, 'epoch': 0.66} {'loss': 0.857, 'learning_rate': 1.5187884169841294e-05, 'epoch': 0.66} {'loss': 1.0409, 'learning_rate': 1.5187604313362259e-05, 'epoch': 0.66} {'loss': 0.9568, 'learning_rate': 1.5187324451324238e-05, 'epoch': 0.66} {'loss': 0.6834, 'learning_rate': 1.518704458372753e-05, 'epoch': 0.66} {'loss': 0.7314, 'learning_rate': 1.5186764710572438e-05, 'epoch': 0.66} {'loss': 0.8374, 'learning_rate': 1.5186484831859259e-05, 'epoch': 0.66} {'loss': 0.9558, 'learning_rate': 1.518620494758829e-05, 'epoch': 0.66} {'loss': 1.0237, 'learning_rate': 1.5185925057759839e-05, 'epoch': 0.66} {'loss': 0.9377, 'learning_rate': 1.5185645162374195e-05, 'epoch': 0.66} {'loss': 0.8093, 'learning_rate': 1.518536526143167e-05, 'epoch': 0.66} {'loss': 0.8093, 'learning_rate': 1.5185085354932553e-05, 'epoch': 0.66} {'loss': 0.9453, 'learning_rate': 1.5184805442877153e-05, 'epoch': 0.66} {'loss': 0.6732, 'learning_rate': 1.5184525525265768e-05, 'epoch': 0.66} {'loss': 0.7594, 'learning_rate': 1.5184245602098692e-05, 'epoch': 0.66} {'loss': 0.5877, 'learning_rate': 1.5183965673376231e-05, 'epoch': 0.66} {'loss': 0.8242, 'learning_rate': 1.5183685739098682e-05, 'epoch': 0.66} {'loss': 0.782, 'learning_rate': 1.5183405799266345e-05, 'epoch': 0.66} {'loss': 0.7742, 'learning_rate': 1.5183125853879518e-05, 'epoch': 0.66} {'loss': 0.7012, 'learning_rate': 1.5182845902938507e-05, 'epoch': 0.66} {'loss': 0.9047, 'learning_rate': 1.5182565946443612e-05, 'epoch': 0.66} {'loss': 0.7899, 'learning_rate': 1.518228598439513e-05, 'epoch': 0.66} {'loss': 0.7367, 'learning_rate': 1.5182006016793356e-05, 'epoch': 0.66} {'loss': 0.77, 'learning_rate': 1.5181726043638599e-05, 'epoch': 0.66} {'loss': 0.9479, 'learning_rate': 1.518144606493115e-05, 'epoch': 0.66} {'loss': 0.8197, 'learning_rate': 1.5181166080671314e-05, 'epoch': 0.66} {'loss': 0.7455, 'learning_rate': 1.5180886090859397e-05, 'epoch': 0.66} {'loss': 0.9102, 'learning_rate': 1.5180606095495689e-05, 'epoch': 0.66} {'loss': 0.8969, 'learning_rate': 1.5180326094580496e-05, 'epoch': 0.66} {'loss': 0.7178, 'learning_rate': 1.5180046088114113e-05, 'epoch': 0.66} {'loss': 0.8379, 'learning_rate': 1.5179766076096844e-05, 'epoch': 0.66} {'loss': 0.9489, 'learning_rate': 1.5179486058528987e-05, 'epoch': 0.66} {'loss': 0.9549, 'learning_rate': 1.5179206035410844e-05, 'epoch': 0.66} {'loss': 0.8075, 'learning_rate': 1.5178926006742718e-05, 'epoch': 0.66} {'loss': 0.698, 'learning_rate': 1.51786459725249e-05, 'epoch': 0.66} {'loss': 0.8127, 'learning_rate': 1.5178365932757702e-05, 'epoch': 0.66} {'loss': 0.9218, 'learning_rate': 1.5178085887441411e-05, 'epoch': 0.66} {'loss': 0.5564, 'learning_rate': 1.5177805836576337e-05, 'epoch': 0.66} {'loss': 0.5986, 'learning_rate': 1.5177525780162774e-05, 'epoch': 0.66} {'loss': 0.7768, 'learning_rate': 1.5177245718201027e-05, 'epoch': 0.66} {'loss': 0.8077, 'learning_rate': 1.5176965650691396e-05, 'epoch': 0.66} {'loss': 0.7027, 'learning_rate': 1.5176685577634177e-05, 'epoch': 0.66} {'loss': 0.8303, 'learning_rate': 1.5176405499029672e-05, 'epoch': 0.66} {'loss': 0.8036, 'learning_rate': 1.517612541487818e-05, 'epoch': 0.66} {'loss': 0.8352, 'learning_rate': 1.5175845325180003e-05, 'epoch': 0.66} {'loss': 0.879, 'learning_rate': 1.5175565229935442e-05, 'epoch': 0.66} {'loss': 0.9179, 'learning_rate': 1.5175285129144795e-05, 'epoch': 0.66} {'loss': 0.7806, 'learning_rate': 1.5175005022808363e-05, 'epoch': 0.66} {'loss': 0.6232, 'learning_rate': 1.5174724910926446e-05, 'epoch': 0.66} {'loss': 0.7031, 'learning_rate': 1.5174444793499344e-05, 'epoch': 0.66} {'loss': 0.7589, 'learning_rate': 1.5174164670527355e-05, 'epoch': 0.66} {'loss': 0.6918, 'learning_rate': 1.5173884542010786e-05, 'epoch': 0.66} {'loss': 0.9529, 'learning_rate': 1.5173604407949932e-05, 'epoch': 0.66} {'loss': 0.7083, 'learning_rate': 1.5173324268345093e-05, 'epoch': 0.66} {'loss': 0.7943, 'learning_rate': 1.5173044123196567e-05, 'epoch': 0.66} {'loss': 0.8406, 'learning_rate': 1.5172763972504663e-05, 'epoch': 0.66} {'loss': 1.0328, 'learning_rate': 1.5172483816269672e-05, 'epoch': 0.66} {'loss': 0.9511, 'learning_rate': 1.5172203654491898e-05, 'epoch': 0.66} {'loss': 0.858, 'learning_rate': 1.5171923487171642e-05, 'epoch': 0.66} {'loss': 0.6524, 'learning_rate': 1.5171643314309203e-05, 'epoch': 0.66} {'loss': 0.8752, 'learning_rate': 1.517136313590488e-05, 'epoch': 0.66} {'loss': 0.7867, 'learning_rate': 1.5171082951958976e-05, 'epoch': 0.66} {'loss': 0.8116, 'learning_rate': 1.517080276247179e-05, 'epoch': 0.66} {'loss': 0.8882, 'learning_rate': 1.517052256744362e-05, 'epoch': 0.66} {'loss': 0.909, 'learning_rate': 1.5170242366874773e-05, 'epoch': 0.66} {'loss': 0.878, 'learning_rate': 1.5169962160765539e-05, 'epoch': 0.66} {'loss': 0.8453, 'learning_rate': 1.5169681949116228e-05, 'epoch': 0.66} {'loss': 0.8856, 'learning_rate': 1.5169401731927133e-05, 'epoch': 0.66} {'loss': 0.8687, 'learning_rate': 1.5169121509198558e-05, 'epoch': 0.66} {'loss': 0.7074, 'learning_rate': 1.5168841280930806e-05, 'epoch': 0.66} {'loss': 0.7786, 'learning_rate': 1.5168561047124172e-05, 'epoch': 0.66} {'loss': 1.0287, 'learning_rate': 1.5168280807778959e-05, 'epoch': 0.66} {'loss': 0.9149, 'learning_rate': 1.5168000562895467e-05, 'epoch': 0.66} {'loss': 1.0028, 'learning_rate': 1.5167720312473995e-05, 'epoch': 0.66} {'loss': 0.8357, 'learning_rate': 1.5167440056514844e-05, 'epoch': 0.66} {'loss': 0.8569, 'learning_rate': 1.5167159795018313e-05, 'epoch': 0.66} {'loss': 1.0495, 'learning_rate': 1.5166879527984706e-05, 'epoch': 0.66} {'loss': 0.9595, 'learning_rate': 1.5166599255414322e-05, 'epoch': 0.66} {'loss': 0.879, 'learning_rate': 1.5166318977307462e-05, 'epoch': 0.66} {'loss': 0.8925, 'learning_rate': 1.516603869366442e-05, 'epoch': 0.66} {'loss': 0.7519, 'learning_rate': 1.5165758404485505e-05, 'epoch': 0.66} {'loss': 0.9522, 'learning_rate': 1.5165478109771012e-05, 'epoch': 0.66} {'loss': 0.7728, 'learning_rate': 1.5165197809521243e-05, 'epoch': 0.66} {'loss': 0.7529, 'learning_rate': 1.5164917503736498e-05, 'epoch': 0.66} {'loss': 0.7805, 'learning_rate': 1.516463719241708e-05, 'epoch': 0.66} {'loss': 0.8065, 'learning_rate': 1.5164356875563287e-05, 'epoch': 0.66} {'loss': 0.7131, 'learning_rate': 1.5164076553175417e-05, 'epoch': 0.66} {'loss': 0.8094, 'learning_rate': 1.5163796225253773e-05, 'epoch': 0.66} {'loss': 0.8821, 'learning_rate': 1.5163515891798656e-05, 'epoch': 0.66} {'loss': 0.8296, 'learning_rate': 1.5163235552810368e-05, 'epoch': 0.66} {'loss': 0.8506, 'learning_rate': 1.5162955208289205e-05, 'epoch': 0.66} {'loss': 0.7487, 'learning_rate': 1.5162674858235468e-05, 'epoch': 0.66} {'loss': 0.8034, 'learning_rate': 1.5162394502649462e-05, 'epoch': 0.66} {'loss': 0.8226, 'learning_rate': 1.5162114141531484e-05, 'epoch': 0.66} {'loss': 0.941, 'learning_rate': 1.5161833774881833e-05, 'epoch': 0.66} {'loss': 0.7429, 'learning_rate': 1.5161553402700812e-05, 'epoch': 0.66} {'loss': 0.9434, 'learning_rate': 1.516127302498872e-05, 'epoch': 0.66} {'loss': 0.788, 'learning_rate': 1.516099264174586e-05, 'epoch': 0.66} {'loss': 0.7102, 'learning_rate': 1.5160712252972529e-05, 'epoch': 0.66} {'loss': 0.9555, 'learning_rate': 1.516043185866903e-05, 'epoch': 0.66} {'loss': 0.8186, 'learning_rate': 1.516015145883566e-05, 'epoch': 0.66} {'loss': 0.8776, 'learning_rate': 1.5159871053472723e-05, 'epoch': 0.66} {'loss': 0.8514, 'learning_rate': 1.5159590642580521e-05, 'epoch': 0.66} {'loss': 1.012, 'learning_rate': 1.515931022615935e-05, 'epoch': 0.66} {'loss': 0.8835, 'learning_rate': 1.5159029804209514e-05, 'epoch': 0.66} {'loss': 0.8332, 'learning_rate': 1.515874937673131e-05, 'epoch': 0.66} {'loss': 0.7888, 'learning_rate': 1.515846894372504e-05, 'epoch': 0.66} {'loss': 0.8281, 'learning_rate': 1.5158188505191004e-05, 'epoch': 0.66} {'loss': 1.0349, 'learning_rate': 1.5157908061129508e-05, 'epoch': 0.66} {'loss': 0.8432, 'learning_rate': 1.5157627611540846e-05, 'epoch': 0.66} {'loss': 0.7528, 'learning_rate': 1.515734715642532e-05, 'epoch': 0.66} {'loss': 0.9215, 'learning_rate': 1.5157066695783232e-05, 'epoch': 0.66} {'loss': 0.7657, 'learning_rate': 1.515678622961488e-05, 'epoch': 0.66} {'loss': 0.7974, 'learning_rate': 1.5156505757920565e-05, 'epoch': 0.66} {'loss': 0.7823, 'learning_rate': 1.5156225280700594e-05, 'epoch': 0.66} {'loss': 0.8666, 'learning_rate': 1.5155944797955257e-05, 'epoch': 0.66} {'loss': 0.7485, 'learning_rate': 1.515566430968486e-05, 'epoch': 0.66} {'loss': 0.9651, 'learning_rate': 1.5155383815889707e-05, 'epoch': 0.66} {'loss': 0.6809, 'learning_rate': 1.515510331657009e-05, 'epoch': 0.66} {'loss': 0.7893, 'learning_rate': 1.515482281172632e-05, 'epoch': 0.66} {'loss': 0.945, 'learning_rate': 1.5154542301358688e-05, 'epoch': 0.66} {'loss': 0.8191, 'learning_rate': 1.5154261785467501e-05, 'epoch': 0.66} {'loss': 0.6851, 'learning_rate': 1.5153981264053055e-05, 'epoch': 0.66} {'loss': 0.7143, 'learning_rate': 1.5153700737115654e-05, 'epoch': 0.66} {'loss': 0.8438, 'learning_rate': 1.5153420204655596e-05, 'epoch': 0.66} {'loss': 0.7119, 'learning_rate': 1.5153139666673187e-05, 'epoch': 0.66} {'loss': 0.8755, 'learning_rate': 1.5152859123168722e-05, 'epoch': 0.66} {'loss': 0.7054, 'learning_rate': 1.5152578574142504e-05, 'epoch': 0.66} {'loss': 0.8127, 'learning_rate': 1.5152298019594832e-05, 'epoch': 0.66} {'loss': 0.8532, 'learning_rate': 1.5152017459526006e-05, 'epoch': 0.66} {'loss': 0.9973, 'learning_rate': 1.5151736893936329e-05, 'epoch': 0.66} {'loss': 0.7442, 'learning_rate': 1.5151456322826103e-05, 'epoch': 0.66} {'loss': 0.7759, 'learning_rate': 1.5151175746195626e-05, 'epoch': 0.66} {'loss': 0.7605, 'learning_rate': 1.5150895164045198e-05, 'epoch': 0.66} {'loss': 0.6301, 'learning_rate': 1.5150614576375123e-05, 'epoch': 0.66} {'loss': 0.7892, 'learning_rate': 1.5150333983185697e-05, 'epoch': 0.66} {'loss': 0.7929, 'learning_rate': 1.5150053384477224e-05, 'epoch': 0.66} {'loss': 0.7909, 'learning_rate': 1.5149772780250005e-05, 'epoch': 0.66} {'loss': 0.7048, 'learning_rate': 1.514949217050434e-05, 'epoch': 0.66} {'loss': 0.7383, 'learning_rate': 1.5149211555240531e-05, 'epoch': 0.66} {'loss': 0.8003, 'learning_rate': 1.5148930934458874e-05, 'epoch': 0.66} {'loss': 0.7934, 'learning_rate': 1.5148650308159671e-05, 'epoch': 0.66} {'loss': 0.9293, 'learning_rate': 1.5148369676343229e-05, 'epoch': 0.66} {'loss': 0.7974, 'learning_rate': 1.514808903900984e-05, 'epoch': 0.66} {'loss': 0.7733, 'learning_rate': 1.5147808396159811e-05, 'epoch': 0.66} {'loss': 0.8234, 'learning_rate': 1.5147527747793443e-05, 'epoch': 0.66} {'loss': 0.7358, 'learning_rate': 1.5147247093911032e-05, 'epoch': 0.66} {'loss': 0.6666, 'learning_rate': 1.5146966434512882e-05, 'epoch': 0.66} {'loss': 0.894, 'learning_rate': 1.5146685769599292e-05, 'epoch': 0.66} {'loss': 0.8592, 'learning_rate': 1.5146405099170563e-05, 'epoch': 0.66} {'loss': 0.8747, 'learning_rate': 1.5146124423226996e-05, 'epoch': 0.66} {'loss': 0.5808, 'learning_rate': 1.5145843741768893e-05, 'epoch': 0.66} {'loss': 0.9335, 'learning_rate': 1.5145563054796557e-05, 'epoch': 0.66} {'loss': 0.6778, 'learning_rate': 1.5145282362310286e-05, 'epoch': 0.66} {'loss': 0.7249, 'learning_rate': 1.5145001664310374e-05, 'epoch': 0.66} {'loss': 0.9367, 'learning_rate': 1.5144720960797133e-05, 'epoch': 0.66} {'loss': 0.7759, 'learning_rate': 1.514444025177086e-05, 'epoch': 0.66} {'loss': 0.8533, 'learning_rate': 1.514415953723185e-05, 'epoch': 0.66} {'loss': 0.7472, 'learning_rate': 1.5143878817180415e-05, 'epoch': 0.66} {'loss': 0.9184, 'learning_rate': 1.5143598091616847e-05, 'epoch': 0.66} {'loss': 0.7486, 'learning_rate': 1.514331736054145e-05, 'epoch': 0.66} {'loss': 0.7096, 'learning_rate': 1.5143036623954524e-05, 'epoch': 0.66} {'loss': 0.8671, 'learning_rate': 1.5142755881856368e-05, 'epoch': 0.66} {'loss': 0.8262, 'learning_rate': 1.5142475134247285e-05, 'epoch': 0.66} {'loss': 0.744, 'learning_rate': 1.5142194381127578e-05, 'epoch': 0.66} {'loss': 0.8357, 'learning_rate': 1.5141913622497546e-05, 'epoch': 0.66} {'loss': 0.6987, 'learning_rate': 1.5141632858357486e-05, 'epoch': 0.66} {'loss': 0.8218, 'learning_rate': 1.5141352088707706e-05, 'epoch': 0.66} {'loss': 0.6792, 'learning_rate': 1.5141071313548504e-05, 'epoch': 0.66} {'loss': 0.6928, 'learning_rate': 1.5140790532880174e-05, 'epoch': 0.66} {'loss': 0.8619, 'learning_rate': 1.514050974670303e-05, 'epoch': 0.66} {'loss': 0.8878, 'learning_rate': 1.5140228955017362e-05, 'epoch': 0.66} {'loss': 0.8493, 'learning_rate': 1.5139948157823473e-05, 'epoch': 0.66} {'loss': 0.7585, 'learning_rate': 1.5139667355121672e-05, 'epoch': 0.66} {'loss': 0.72, 'learning_rate': 1.513938654691225e-05, 'epoch': 0.66} {'loss': 0.7676, 'learning_rate': 1.513910573319551e-05, 'epoch': 0.66} {'loss': 0.8677, 'learning_rate': 1.5138824913971752e-05, 'epoch': 0.66} {'loss': 0.8748, 'learning_rate': 1.5138544089241287e-05, 'epoch': 0.66} {'loss': 0.9489, 'learning_rate': 1.5138263259004402e-05, 'epoch': 0.66} {'loss': 0.8458, 'learning_rate': 1.5137982423261405e-05, 'epoch': 0.66} {'loss': 0.7541, 'learning_rate': 1.5137701582012598e-05, 'epoch': 0.66} {'loss': 0.9764, 'learning_rate': 1.513742073525828e-05, 'epoch': 0.66} {'loss': 0.8296, 'learning_rate': 1.513713988299875e-05, 'epoch': 0.66} {'loss': 0.7935, 'learning_rate': 1.5136859025234315e-05, 'epoch': 0.66} {'loss': 0.7407, 'learning_rate': 1.5136578161965268e-05, 'epoch': 0.66} {'loss': 0.6696, 'learning_rate': 1.5136297293191913e-05, 'epoch': 0.66} {'loss': 0.676, 'learning_rate': 1.5136016418914555e-05, 'epoch': 0.66} {'loss': 0.677, 'learning_rate': 1.5135735539133492e-05, 'epoch': 0.66} {'loss': 0.7648, 'learning_rate': 1.5135454653849025e-05, 'epoch': 0.66} {'loss': 0.7375, 'learning_rate': 1.513517376306145e-05, 'epoch': 0.66} {'loss': 0.6249, 'learning_rate': 1.5134892866771078e-05, 'epoch': 0.66} {'loss': 0.886, 'learning_rate': 1.5134611964978203e-05, 'epoch': 0.66} {'loss': 0.9603, 'learning_rate': 1.5134331057683127e-05, 'epoch': 0.66} {'loss': 0.7381, 'learning_rate': 1.5134050144886152e-05, 'epoch': 0.66} {'loss': 0.7727, 'learning_rate': 1.513376922658758e-05, 'epoch': 0.66} {'loss': 0.6785, 'learning_rate': 1.5133488302787713e-05, 'epoch': 0.66} {'loss': 0.9449, 'learning_rate': 1.5133207373486847e-05, 'epoch': 0.66} {'loss': 0.7941, 'learning_rate': 1.5132926438685287e-05, 'epoch': 0.66} {'loss': 0.894, 'learning_rate': 1.5132645498383332e-05, 'epoch': 0.66} {'loss': 0.7946, 'learning_rate': 1.5132364552581285e-05, 'epoch': 0.66} {'loss': 1.0265, 'learning_rate': 1.5132083601279445e-05, 'epoch': 0.66} {'loss': 0.9452, 'learning_rate': 1.5131802644478115e-05, 'epoch': 0.66} {'loss': 0.876, 'learning_rate': 1.5131521682177596e-05, 'epoch': 0.66} {'loss': 0.7766, 'learning_rate': 1.5131240714378189e-05, 'epoch': 0.66} {'loss': 0.9382, 'learning_rate': 1.513095974108019e-05, 'epoch': 0.66} {'loss': 0.8205, 'learning_rate': 1.513067876228391e-05, 'epoch': 0.66} {'loss': 1.0068, 'learning_rate': 1.513039777798964e-05, 'epoch': 0.66} {'loss': 0.7831, 'learning_rate': 1.5130116788197691e-05, 'epoch': 0.66} {'loss': 0.758, 'learning_rate': 1.5129835792908356e-05, 'epoch': 0.66} {'loss': 0.9604, 'learning_rate': 1.5129554792121938e-05, 'epoch': 0.66} {'loss': 0.7944, 'learning_rate': 1.512927378583874e-05, 'epoch': 0.66} {'loss': 0.9532, 'learning_rate': 1.5128992774059063e-05, 'epoch': 0.66} {'loss': 0.8435, 'learning_rate': 1.5128711756783206e-05, 'epoch': 0.66} {'loss': 0.8351, 'learning_rate': 1.5128430734011472e-05, 'epoch': 0.66} {'loss': 0.9314, 'learning_rate': 1.5128149705744161e-05, 'epoch': 0.66} {'loss': 0.6824, 'learning_rate': 1.5127868671981578e-05, 'epoch': 0.66} {'loss': 0.7303, 'learning_rate': 1.5127587632724016e-05, 'epoch': 0.66} {'loss': 0.976, 'learning_rate': 1.5127306587971784e-05, 'epoch': 0.66} {'loss': 0.6569, 'learning_rate': 1.512702553772518e-05, 'epoch': 0.66} {'loss': 0.8346, 'learning_rate': 1.5126744481984504e-05, 'epoch': 0.66} {'loss': 0.7029, 'learning_rate': 1.512646342075006e-05, 'epoch': 0.66} {'loss': 0.7705, 'learning_rate': 1.5126182354022147e-05, 'epoch': 0.66} {'loss': 0.7318, 'learning_rate': 1.512590128180107e-05, 'epoch': 0.66} {'loss': 1.0592, 'learning_rate': 1.5125620204087121e-05, 'epoch': 0.66} {'loss': 0.8334, 'learning_rate': 1.5125339120880611e-05, 'epoch': 0.66} {'loss': 0.9193, 'learning_rate': 1.5125058032181836e-05, 'epoch': 0.66} {'loss': 0.8509, 'learning_rate': 1.51247769379911e-05, 'epoch': 0.66} {'loss': 0.7709, 'learning_rate': 1.5124495838308706e-05, 'epoch': 0.66} {'loss': 0.7257, 'learning_rate': 1.5124214733134948e-05, 'epoch': 0.66} {'loss': 0.6052, 'learning_rate': 1.5123933622470133e-05, 'epoch': 0.66} {'loss': 0.7534, 'learning_rate': 1.5123652506314562e-05, 'epoch': 0.66} {'loss': 0.8611, 'learning_rate': 1.5123371384668531e-05, 'epoch': 0.66} {'loss': 0.8024, 'learning_rate': 1.5123090257532345e-05, 'epoch': 0.66} {'loss': 0.8177, 'learning_rate': 1.5122809124906307e-05, 'epoch': 0.66} {'loss': 0.8909, 'learning_rate': 1.512252798679072e-05, 'epoch': 0.66} {'loss': 0.908, 'learning_rate': 1.512224684318588e-05, 'epoch': 0.66} {'loss': 0.7414, 'learning_rate': 1.5121965694092088e-05, 'epoch': 0.66} {'loss': 0.8148, 'learning_rate': 1.5121684539509649e-05, 'epoch': 0.66} {'loss': 0.7766, 'learning_rate': 1.5121403379438863e-05, 'epoch': 0.66} {'loss': 0.9593, 'learning_rate': 1.5121122213880029e-05, 'epoch': 0.66} {'loss': 0.839, 'learning_rate': 1.5120841042833455e-05, 'epoch': 0.66} {'loss': 0.8912, 'learning_rate': 1.5120559866299433e-05, 'epoch': 0.66} {'loss': 0.74, 'learning_rate': 1.5120278684278268e-05, 'epoch': 0.66} {'loss': 0.9503, 'learning_rate': 1.511999749677027e-05, 'epoch': 0.66} {'loss': 0.9029, 'learning_rate': 1.5119716303775724e-05, 'epoch': 0.66} {'loss': 0.8706, 'learning_rate': 1.5119435105294944e-05, 'epoch': 0.66} {'loss': 0.7192, 'learning_rate': 1.5119153901328227e-05, 'epoch': 0.66} {'loss': 0.8221, 'learning_rate': 1.5118872691875875e-05, 'epoch': 0.66} {'loss': 1.02, 'learning_rate': 1.5118591476938188e-05, 'epoch': 0.66} {'loss': 0.744, 'learning_rate': 1.5118310256515468e-05, 'epoch': 0.66} {'loss': 0.886, 'learning_rate': 1.5118029030608018e-05, 'epoch': 0.66} {'loss': 0.885, 'learning_rate': 1.5117747799216136e-05, 'epoch': 0.66} {'loss': 0.8112, 'learning_rate': 1.5117466562340126e-05, 'epoch': 0.66} {'loss': 0.7331, 'learning_rate': 1.511718531998029e-05, 'epoch': 0.66} {'loss': 0.7358, 'learning_rate': 1.5116904072136924e-05, 'epoch': 0.66} {'loss': 0.8669, 'learning_rate': 1.5116622818810335e-05, 'epoch': 0.66} {'loss': 0.8364, 'learning_rate': 1.5116341560000827e-05, 'epoch': 0.66} {'loss': 0.7464, 'learning_rate': 1.5116060295708695e-05, 'epoch': 0.66} {'loss': 0.7737, 'learning_rate': 1.511577902593424e-05, 'epoch': 0.66} {'loss': 0.7685, 'learning_rate': 1.5115497750677772e-05, 'epoch': 0.66} {'loss': 0.8583, 'learning_rate': 1.5115216469939582e-05, 'epoch': 0.66} {'loss': 0.9822, 'learning_rate': 1.5114935183719976e-05, 'epoch': 0.66} {'loss': 0.8835, 'learning_rate': 1.5114653892019253e-05, 'epoch': 0.66} {'loss': 0.8462, 'learning_rate': 1.5114372594837722e-05, 'epoch': 0.66} {'loss': 0.7141, 'learning_rate': 1.5114091292175677e-05, 'epoch': 0.66} {'loss': 0.7653, 'learning_rate': 1.5113809984033424e-05, 'epoch': 0.66} {'loss': 0.6939, 'learning_rate': 1.5113528670411257e-05, 'epoch': 0.66} {'loss': 0.8601, 'learning_rate': 1.5113247351309483e-05, 'epoch': 0.66} {'loss': 1.0141, 'learning_rate': 1.5112966026728404e-05, 'epoch': 0.66} {'loss': 0.871, 'learning_rate': 1.511268469666832e-05, 'epoch': 0.66} {'loss': 0.919, 'learning_rate': 1.5112403361129537e-05, 'epoch': 0.66} {'loss': 0.8883, 'learning_rate': 1.5112122020112349e-05, 'epoch': 0.66} {'loss': 0.8866, 'learning_rate': 1.5111840673617062e-05, 'epoch': 0.66} {'loss': 0.6906, 'learning_rate': 1.5111559321643976e-05, 'epoch': 0.66} {'loss': 0.7863, 'learning_rate': 1.5111277964193392e-05, 'epoch': 0.66} {'loss': 1.001, 'learning_rate': 1.5110996601265613e-05, 'epoch': 0.66} {'loss': 0.6821, 'learning_rate': 1.511071523286094e-05, 'epoch': 0.66} {'loss': 0.8901, 'learning_rate': 1.5110433858979673e-05, 'epoch': 0.66} {'loss': 0.7169, 'learning_rate': 1.5110152479622118e-05, 'epoch': 0.66} {'loss': 0.9057, 'learning_rate': 1.5109871094788574e-05, 'epoch': 0.66} {'loss': 0.8483, 'learning_rate': 1.5109589704479337e-05, 'epoch': 0.66} {'loss': 0.8665, 'learning_rate': 1.5109308308694715e-05, 'epoch': 0.66} {'loss': 0.7657, 'learning_rate': 1.5109026907435009e-05, 'epoch': 0.66} {'loss': 0.761, 'learning_rate': 1.510874550070052e-05, 'epoch': 0.66} {'loss': 0.8832, 'learning_rate': 1.5108464088491547e-05, 'epoch': 0.66} {'loss': 0.8824, 'learning_rate': 1.5108182670808398e-05, 'epoch': 0.66} {'loss': 0.8133, 'learning_rate': 1.5107901247651367e-05, 'epoch': 0.66} {'loss': 0.8133, 'learning_rate': 1.5107619819020757e-05, 'epoch': 0.66} {'loss': 0.9014, 'learning_rate': 1.5107338384916875e-05, 'epoch': 0.66} {'loss': 1.0053, 'learning_rate': 1.5107056945340016e-05, 'epoch': 0.66} {'loss': 0.792, 'learning_rate': 1.5106775500290485e-05, 'epoch': 0.66} {'loss': 0.7148, 'learning_rate': 1.5106494049768587e-05, 'epoch': 0.66} {'loss': 0.5833, 'learning_rate': 1.5106212593774616e-05, 'epoch': 0.66} {'loss': 0.8427, 'learning_rate': 1.5105931132308878e-05, 'epoch': 0.66} {'loss': 0.8791, 'learning_rate': 1.5105649665371674e-05, 'epoch': 0.66} {'loss': 0.8094, 'learning_rate': 1.5105368192963306e-05, 'epoch': 0.66} {'loss': 0.9299, 'learning_rate': 1.5105086715084075e-05, 'epoch': 0.66} {'loss': 0.8173, 'learning_rate': 1.510480523173428e-05, 'epoch': 0.66} {'loss': 0.7933, 'learning_rate': 1.5104523742914231e-05, 'epoch': 0.66} {'loss': 0.8549, 'learning_rate': 1.5104242248624221e-05, 'epoch': 0.66} {'loss': 0.9705, 'learning_rate': 1.5103960748864555e-05, 'epoch': 0.66} {'loss': 0.6972, 'learning_rate': 1.5103679243635534e-05, 'epoch': 0.66} {'loss': 0.7896, 'learning_rate': 1.5103397732937459e-05, 'epoch': 0.66} {'loss': 0.8622, 'learning_rate': 1.5103116216770635e-05, 'epoch': 0.66} {'loss': 0.8893, 'learning_rate': 1.510283469513536e-05, 'epoch': 0.66} {'loss': 0.8043, 'learning_rate': 1.510255316803194e-05, 'epoch': 0.66} {'loss': 0.7519, 'learning_rate': 1.510227163546067e-05, 'epoch': 0.66} {'loss': 0.785, 'learning_rate': 1.5101990097421857e-05, 'epoch': 0.66} {'loss': 0.8874, 'learning_rate': 1.51017085539158e-05, 'epoch': 0.66} {'loss': 0.8824, 'learning_rate': 1.5101427004942806e-05, 'epoch': 0.66} {'loss': 0.8364, 'learning_rate': 1.5101145450503167e-05, 'epoch': 0.66} {'loss': 1.0092, 'learning_rate': 1.5100863890597192e-05, 'epoch': 0.66} {'loss': 0.9633, 'learning_rate': 1.5100582325225183e-05, 'epoch': 0.66} {'loss': 0.6859, 'learning_rate': 1.5100300754387438e-05, 'epoch': 0.66} {'loss': 0.9563, 'learning_rate': 1.510001917808426e-05, 'epoch': 0.66} {'loss': 0.7224, 'learning_rate': 1.5099737596315953e-05, 'epoch': 0.66} {'loss': 0.9381, 'learning_rate': 1.5099456009082815e-05, 'epoch': 0.66} {'loss': 0.8819, 'learning_rate': 1.5099174416385149e-05, 'epoch': 0.66} {'loss': 0.7343, 'learning_rate': 1.5098892818223258e-05, 'epoch': 0.66} {'loss': 0.7688, 'learning_rate': 1.5098611214597445e-05, 'epoch': 0.66} {'loss': 0.9096, 'learning_rate': 1.5098329605508011e-05, 'epoch': 0.66} {'loss': 0.8011, 'learning_rate': 1.5098047990955253e-05, 'epoch': 0.66} {'loss': 0.6148, 'learning_rate': 1.509776637093948e-05, 'epoch': 0.66} {'loss': 0.9622, 'learning_rate': 1.5097484745460987e-05, 'epoch': 0.66} {'loss': 0.8915, 'learning_rate': 1.5097203114520081e-05, 'epoch': 0.66} {'loss': 0.7676, 'learning_rate': 1.509692147811706e-05, 'epoch': 0.66} {'loss': 0.7557, 'learning_rate': 1.5096639836252229e-05, 'epoch': 0.66} {'loss': 0.9115, 'learning_rate': 1.5096358188925886e-05, 'epoch': 0.66} {'loss': 0.951, 'learning_rate': 1.5096076536138337e-05, 'epoch': 0.66} {'loss': 0.6447, 'learning_rate': 1.5095794877889884e-05, 'epoch': 0.66} {'loss': 0.7464, 'learning_rate': 1.5095513214180824e-05, 'epoch': 0.66} {'loss': 0.8204, 'learning_rate': 1.5095231545011462e-05, 'epoch': 0.66} {'loss': 0.7493, 'learning_rate': 1.50949498703821e-05, 'epoch': 0.66} {'loss': 0.9347, 'learning_rate': 1.5094668190293042e-05, 'epoch': 0.66} {'loss': 0.7897, 'learning_rate': 1.5094386504744584e-05, 'epoch': 0.66} {'loss': 0.7331, 'learning_rate': 1.5094104813737032e-05, 'epoch': 0.66} {'loss': 0.7817, 'learning_rate': 1.5093823117270687e-05, 'epoch': 0.66} {'loss': 0.8356, 'learning_rate': 1.5093541415345849e-05, 'epoch': 0.66} {'loss': 0.7943, 'learning_rate': 1.5093259707962824e-05, 'epoch': 0.66} {'loss': 0.7787, 'learning_rate': 1.5092977995121911e-05, 'epoch': 0.66} {'loss': 1.0261, 'learning_rate': 1.5092696276823411e-05, 'epoch': 0.66} {'loss': 0.877, 'learning_rate': 1.5092414553067632e-05, 'epoch': 0.66} {'loss': 0.756, 'learning_rate': 1.5092132823854866e-05, 'epoch': 0.66} {'loss': 0.8917, 'learning_rate': 1.5091851089185423e-05, 'epoch': 0.66} {'loss': 0.803, 'learning_rate': 1.5091569349059599e-05, 'epoch': 0.66} {'loss': 0.6133, 'learning_rate': 1.50912876034777e-05, 'epoch': 0.66} {'loss': 0.9075, 'learning_rate': 1.5091005852440028e-05, 'epoch': 0.66} {'loss': 0.8145, 'learning_rate': 1.5090724095946885e-05, 'epoch': 0.66} {'loss': 0.7986, 'learning_rate': 1.509044233399857e-05, 'epoch': 0.66} {'loss': 0.8672, 'learning_rate': 1.5090160566595384e-05, 'epoch': 0.66} {'loss': 0.9172, 'learning_rate': 1.5089878793737635e-05, 'epoch': 0.66} {'loss': 0.8587, 'learning_rate': 1.5089597015425619e-05, 'epoch': 0.66} {'loss': 0.7923, 'learning_rate': 1.5089315231659643e-05, 'epoch': 0.66} {'loss': 0.9439, 'learning_rate': 1.5089033442440007e-05, 'epoch': 0.66} {'loss': 0.786, 'learning_rate': 1.5088751647767011e-05, 'epoch': 0.66} {'loss': 0.6395, 'learning_rate': 1.508846984764096e-05, 'epoch': 0.66} {'loss': 0.925, 'learning_rate': 1.5088188042062148e-05, 'epoch': 0.66} {'loss': 0.8401, 'learning_rate': 1.5087906231030889e-05, 'epoch': 0.66} {'loss': 0.7668, 'learning_rate': 1.5087624414547477e-05, 'epoch': 0.66} {'loss': 0.8585, 'learning_rate': 1.508734259261222e-05, 'epoch': 0.66} {'loss': 0.8283, 'learning_rate': 1.508706076522541e-05, 'epoch': 0.66} {'loss': 0.7666, 'learning_rate': 1.508677893238736e-05, 'epoch': 0.66} {'loss': 0.9555, 'learning_rate': 1.5086497094098364e-05, 'epoch': 0.66} {'loss': 0.6146, 'learning_rate': 1.5086215250358732e-05, 'epoch': 0.66} {'loss': 0.8387, 'learning_rate': 1.5085933401168755e-05, 'epoch': 0.66} {'loss': 0.7938, 'learning_rate': 1.5085651546528746e-05, 'epoch': 0.66} {'loss': 0.9768, 'learning_rate': 1.5085369686439002e-05, 'epoch': 0.66} {'loss': 0.7985, 'learning_rate': 1.5085087820899826e-05, 'epoch': 0.66} {'loss': 0.7391, 'learning_rate': 1.5084805949911516e-05, 'epoch': 0.66} {'loss': 0.973, 'learning_rate': 1.508452407347438e-05, 'epoch': 0.66} {'loss': 0.8675, 'learning_rate': 1.5084242191588719e-05, 'epoch': 0.66} {'loss': 0.8287, 'learning_rate': 1.508396030425483e-05, 'epoch': 0.66} {'loss': 0.8049, 'learning_rate': 1.508367841147302e-05, 'epoch': 0.66} {'loss': 0.9339, 'learning_rate': 1.508339651324359e-05, 'epoch': 0.66} {'loss': 0.7994, 'learning_rate': 1.5083114609566845e-05, 'epoch': 0.66} {'loss': 0.8451, 'learning_rate': 1.5082832700443079e-05, 'epoch': 0.66} {'loss': 0.9527, 'learning_rate': 1.5082550785872601e-05, 'epoch': 0.66} {'loss': 0.7673, 'learning_rate': 1.5082268865855709e-05, 'epoch': 0.66} {'loss': 0.8138, 'learning_rate': 1.5081986940392713e-05, 'epoch': 0.66} {'loss': 0.737, 'learning_rate': 1.5081705009483903e-05, 'epoch': 0.66} {'loss': 0.6708, 'learning_rate': 1.5081423073129588e-05, 'epoch': 0.66} {'loss': 0.6321, 'learning_rate': 1.5081141131330074e-05, 'epoch': 0.66} {'loss': 0.835, 'learning_rate': 1.5080859184085656e-05, 'epoch': 0.66} {'loss': 0.7891, 'learning_rate': 1.5080577231396638e-05, 'epoch': 0.66} {'loss': 0.8989, 'learning_rate': 1.5080295273263322e-05, 'epoch': 0.66} {'loss': 0.9206, 'learning_rate': 1.5080013309686015e-05, 'epoch': 0.66} {'loss': 0.9015, 'learning_rate': 1.5079731340665014e-05, 'epoch': 0.66} {'loss': 0.8766, 'learning_rate': 1.5079449366200618e-05, 'epoch': 0.66} {'loss': 0.9845, 'learning_rate': 1.507916738629314e-05, 'epoch': 0.67} {'loss': 0.9652, 'learning_rate': 1.507888540094287e-05, 'epoch': 0.67} {'loss': 0.7611, 'learning_rate': 1.5078603410150119e-05, 'epoch': 0.67} {'loss': 0.693, 'learning_rate': 1.507832141391519e-05, 'epoch': 0.67} {'loss': 0.8092, 'learning_rate': 1.5078039412238376e-05, 'epoch': 0.67} {'loss': 0.689, 'learning_rate': 1.5077757405119984e-05, 'epoch': 0.67} {'loss': 0.9262, 'learning_rate': 1.5077475392560317e-05, 'epoch': 0.67} {'loss': 0.8222, 'learning_rate': 1.507719337455968e-05, 'epoch': 0.67} {'loss': 0.7333, 'learning_rate': 1.5076911351118368e-05, 'epoch': 0.67} {'loss': 0.8554, 'learning_rate': 1.5076629322236693e-05, 'epoch': 0.67} {'loss': 0.7043, 'learning_rate': 1.5076347287914947e-05, 'epoch': 0.67} {'loss': 0.7849, 'learning_rate': 1.5076065248153437e-05, 'epoch': 0.67} {'loss': 0.8211, 'learning_rate': 1.5075783202952466e-05, 'epoch': 0.67} {'loss': 0.8466, 'learning_rate': 1.5075501152312332e-05, 'epoch': 0.67} {'loss': 0.9793, 'learning_rate': 1.5075219096233344e-05, 'epoch': 0.67} {'loss': 0.9016, 'learning_rate': 1.5074937034715803e-05, 'epoch': 0.67} {'loss': 0.9101, 'learning_rate': 1.5074654967760003e-05, 'epoch': 0.67} {'loss': 0.9318, 'learning_rate': 1.5074372895366254e-05, 'epoch': 0.67} {'loss': 0.7369, 'learning_rate': 1.5074090817534858e-05, 'epoch': 0.67} {'loss': 0.7873, 'learning_rate': 1.5073808734266116e-05, 'epoch': 0.67} {'loss': 0.8429, 'learning_rate': 1.507352664556033e-05, 'epoch': 0.67} {'loss': 0.8013, 'learning_rate': 1.50732445514178e-05, 'epoch': 0.67} {'loss': 0.9195, 'learning_rate': 1.5072962451838833e-05, 'epoch': 0.67} {'loss': 0.8546, 'learning_rate': 1.5072680346823728e-05, 'epoch': 0.67} {'loss': 0.9532, 'learning_rate': 1.5072398236372787e-05, 'epoch': 0.67} {'loss': 0.7462, 'learning_rate': 1.5072116120486313e-05, 'epoch': 0.67} {'loss': 0.7995, 'learning_rate': 1.5071833999164609e-05, 'epoch': 0.67} {'loss': 0.8686, 'learning_rate': 1.5071551872407982e-05, 'epoch': 0.67} {'loss': 0.7056, 'learning_rate': 1.5071269740216727e-05, 'epoch': 0.67} {'loss': 0.6919, 'learning_rate': 1.5070987602591144e-05, 'epoch': 0.67} {'loss': 0.896, 'learning_rate': 1.5070705459531545e-05, 'epoch': 0.67} {'loss': 0.7301, 'learning_rate': 1.5070423311038225e-05, 'epoch': 0.67} {'loss': 0.6612, 'learning_rate': 1.5070141157111492e-05, 'epoch': 0.67} {'loss': 0.9013, 'learning_rate': 1.5069858997751642e-05, 'epoch': 0.67} {'loss': 0.924, 'learning_rate': 1.5069576832958981e-05, 'epoch': 0.67} {'loss': 0.8226, 'learning_rate': 1.5069294662733813e-05, 'epoch': 0.67} {'loss': 0.8008, 'learning_rate': 1.5069012487076436e-05, 'epoch': 0.67} {'loss': 0.7625, 'learning_rate': 1.5068730305987153e-05, 'epoch': 0.67} {'loss': 0.9006, 'learning_rate': 1.506844811946627e-05, 'epoch': 0.67} {'loss': 0.7194, 'learning_rate': 1.5068165927514086e-05, 'epoch': 0.67} {'loss': 0.8428, 'learning_rate': 1.5067883730130908e-05, 'epoch': 0.67} {'loss': 0.7806, 'learning_rate': 1.5067601527317033e-05, 'epoch': 0.67} {'loss': 0.8653, 'learning_rate': 1.5067319319072769e-05, 'epoch': 0.67} {'loss': 0.7296, 'learning_rate': 1.5067037105398411e-05, 'epoch': 0.67} {'loss': 0.8809, 'learning_rate': 1.5066754886294268e-05, 'epoch': 0.67} {'loss': 0.8119, 'learning_rate': 1.5066472661760637e-05, 'epoch': 0.67} {'loss': 0.8246, 'learning_rate': 1.5066190431797822e-05, 'epoch': 0.67} {'loss': 1.0277, 'learning_rate': 1.5065908196406132e-05, 'epoch': 0.67} {'loss': 0.8561, 'learning_rate': 1.5065625955585861e-05, 'epoch': 0.67} {'loss': 0.7855, 'learning_rate': 1.5065343709337317e-05, 'epoch': 0.67} {'loss': 0.868, 'learning_rate': 1.5065061457660796e-05, 'epoch': 0.67} {'loss': 0.9856, 'learning_rate': 1.5064779200556607e-05, 'epoch': 0.67} {'loss': 0.9058, 'learning_rate': 1.5064496938025049e-05, 'epoch': 0.67} {'loss': 0.8051, 'learning_rate': 1.5064214670066428e-05, 'epoch': 0.67} {'loss': 0.7704, 'learning_rate': 1.506393239668104e-05, 'epoch': 0.67} {'loss': 1.1279, 'learning_rate': 1.5063650117869193e-05, 'epoch': 0.67} {'loss': 0.8513, 'learning_rate': 1.506336783363119e-05, 'epoch': 0.67} {'loss': 0.934, 'learning_rate': 1.5063085543967329e-05, 'epoch': 0.67} {'loss': 0.8035, 'learning_rate': 1.5062803248877913e-05, 'epoch': 0.67} {'loss': 0.9165, 'learning_rate': 1.5062520948363251e-05, 'epoch': 0.67} {'loss': 0.8625, 'learning_rate': 1.5062238642423638e-05, 'epoch': 0.67} {'loss': 0.8714, 'learning_rate': 1.506195633105938e-05, 'epoch': 0.67} {'loss': 0.9041, 'learning_rate': 1.506167401427078e-05, 'epoch': 0.67} {'loss': 0.9246, 'learning_rate': 1.5061391692058139e-05, 'epoch': 0.67} {'loss': 0.9251, 'learning_rate': 1.5061109364421758e-05, 'epoch': 0.67} {'loss': 0.8399, 'learning_rate': 1.5060827031361942e-05, 'epoch': 0.67} {'loss': 0.7665, 'learning_rate': 1.5060544692878995e-05, 'epoch': 0.67} {'loss': 0.8842, 'learning_rate': 1.5060262348973215e-05, 'epoch': 0.67} {'loss': 0.7841, 'learning_rate': 1.5059979999644912e-05, 'epoch': 0.67} {'loss': 0.7176, 'learning_rate': 1.505969764489438e-05, 'epoch': 0.67} {'loss': 0.7149, 'learning_rate': 1.5059415284721925e-05, 'epoch': 0.67} {'loss': 0.6279, 'learning_rate': 1.505913291912785e-05, 'epoch': 0.67} {'loss': 0.6711, 'learning_rate': 1.5058850548112461e-05, 'epoch': 0.67} {'loss': 0.7215, 'learning_rate': 1.5058568171676054e-05, 'epoch': 0.67} {'loss': 0.8685, 'learning_rate': 1.5058285789818935e-05, 'epoch': 0.67} {'loss': 0.771, 'learning_rate': 1.5058003402541404e-05, 'epoch': 0.67} {'loss': 0.8948, 'learning_rate': 1.5057721009843769e-05, 'epoch': 0.67} {'loss': 0.732, 'learning_rate': 1.5057438611726327e-05, 'epoch': 0.67} {'loss': 0.6779, 'learning_rate': 1.5057156208189386e-05, 'epoch': 0.67} {'loss': 0.8322, 'learning_rate': 1.5056873799233244e-05, 'epoch': 0.67} {'loss': 0.669, 'learning_rate': 1.5056591384858203e-05, 'epoch': 0.67} {'loss': 1.0714, 'learning_rate': 1.5056308965064571e-05, 'epoch': 0.67} {'loss': 0.9775, 'learning_rate': 1.5056026539852648e-05, 'epoch': 0.67} {'loss': 0.7599, 'learning_rate': 1.5055744109222734e-05, 'epoch': 0.67} {'loss': 0.6857, 'learning_rate': 1.5055461673175135e-05, 'epoch': 0.67} {'loss': 0.7158, 'learning_rate': 1.5055179231710156e-05, 'epoch': 0.67} {'loss': 0.8689, 'learning_rate': 1.505489678482809e-05, 'epoch': 0.67} {'loss': 0.8503, 'learning_rate': 1.505461433252925e-05, 'epoch': 0.67} {'loss': 1.0552, 'learning_rate': 1.5054331874813933e-05, 'epoch': 0.67} {'loss': 0.813, 'learning_rate': 1.5054049411682443e-05, 'epoch': 0.67} {'loss': 0.8112, 'learning_rate': 1.5053766943135085e-05, 'epoch': 0.67} {'loss': 1.037, 'learning_rate': 1.505348446917216e-05, 'epoch': 0.67} {'loss': 0.6842, 'learning_rate': 1.5053201989793963e-05, 'epoch': 0.67} {'loss': 0.7276, 'learning_rate': 1.5052919505000811e-05, 'epoch': 0.67} {'loss': 0.6893, 'learning_rate': 1.5052637014792998e-05, 'epoch': 0.67} {'loss': 0.8001, 'learning_rate': 1.5052354519170828e-05, 'epoch': 0.67} {'loss': 0.6358, 'learning_rate': 1.5052072018134604e-05, 'epoch': 0.67} {'loss': 0.7364, 'learning_rate': 1.5051789511684632e-05, 'epoch': 0.67} {'loss': 0.7914, 'learning_rate': 1.5051506999821209e-05, 'epoch': 0.67} {'loss': 0.8697, 'learning_rate': 1.505122448254464e-05, 'epoch': 0.67} {'loss': 0.8794, 'learning_rate': 1.5050941959855228e-05, 'epoch': 0.67} {'loss': 0.6191, 'learning_rate': 1.5050659431753274e-05, 'epoch': 0.67} {'loss': 0.8711, 'learning_rate': 1.5050376898239086e-05, 'epoch': 0.67} {'loss': 0.8326, 'learning_rate': 1.505009435931296e-05, 'epoch': 0.67} {'loss': 0.7856, 'learning_rate': 1.5049811814975206e-05, 'epoch': 0.67} {'loss': 0.7341, 'learning_rate': 1.504952926522612e-05, 'epoch': 0.67} {'loss': 0.907, 'learning_rate': 1.504924671006601e-05, 'epoch': 0.67} {'loss': 0.7827, 'learning_rate': 1.5048964149495173e-05, 'epoch': 0.67} {'loss': 0.9523, 'learning_rate': 1.5048681583513918e-05, 'epoch': 0.67} {'loss': 0.8947, 'learning_rate': 1.5048399012122543e-05, 'epoch': 0.67} {'loss': 0.8568, 'learning_rate': 1.5048116435321355e-05, 'epoch': 0.67} {'loss': 0.8174, 'learning_rate': 1.5047833853110656e-05, 'epoch': 0.67} {'loss': 0.7821, 'learning_rate': 1.5047551265490743e-05, 'epoch': 0.67} {'loss': 0.861, 'learning_rate': 1.5047268672461925e-05, 'epoch': 0.67} {'loss': 0.9829, 'learning_rate': 1.5046986074024503e-05, 'epoch': 0.67} {'loss': 0.8548, 'learning_rate': 1.5046703470178781e-05, 'epoch': 0.67} {'loss': 0.9123, 'learning_rate': 1.5046420860925062e-05, 'epoch': 0.67} {'loss': 0.8236, 'learning_rate': 1.5046138246263644e-05, 'epoch': 0.67} {'loss': 0.7412, 'learning_rate': 1.5045855626194837e-05, 'epoch': 0.67} {'loss': 0.6517, 'learning_rate': 1.5045573000718938e-05, 'epoch': 0.67} {'loss': 0.8873, 'learning_rate': 1.504529036983625e-05, 'epoch': 0.67} {'loss': 0.8381, 'learning_rate': 1.5045007733547082e-05, 'epoch': 0.67} {'loss': 0.7718, 'learning_rate': 1.5044725091851731e-05, 'epoch': 0.67} {'loss': 0.825, 'learning_rate': 1.5044442444750501e-05, 'epoch': 0.67} {'loss': 0.8223, 'learning_rate': 1.5044159792243697e-05, 'epoch': 0.67} {'loss': 0.6622, 'learning_rate': 1.5043877134331621e-05, 'epoch': 0.67} {'loss': 1.0154, 'learning_rate': 1.5043594471014576e-05, 'epoch': 0.67} {'loss': 0.8292, 'learning_rate': 1.504331180229286e-05, 'epoch': 0.67} {'loss': 0.9992, 'learning_rate': 1.5043029128166784e-05, 'epoch': 0.67} {'loss': 1.04, 'learning_rate': 1.5042746448636649e-05, 'epoch': 0.67} {'loss': 0.8358, 'learning_rate': 1.5042463763702753e-05, 'epoch': 0.67} {'loss': 0.7575, 'learning_rate': 1.50421810733654e-05, 'epoch': 0.67} {'loss': 0.7795, 'learning_rate': 1.50418983776249e-05, 'epoch': 0.67} {'loss': 0.9105, 'learning_rate': 1.5041615676481547e-05, 'epoch': 0.67} {'loss': 0.8913, 'learning_rate': 1.504133296993565e-05, 'epoch': 0.67} {'loss': 0.9581, 'learning_rate': 1.5041050257987508e-05, 'epoch': 0.67} {'loss': 0.8305, 'learning_rate': 1.5040767540637427e-05, 'epoch': 0.67} {'loss': 0.8946, 'learning_rate': 1.5040484817885706e-05, 'epoch': 0.67} {'loss': 0.637, 'learning_rate': 1.5040202089732652e-05, 'epoch': 0.67} {'loss': 0.9187, 'learning_rate': 1.5039919356178567e-05, 'epoch': 0.67} {'loss': 0.8581, 'learning_rate': 1.5039636617223753e-05, 'epoch': 0.67} {'loss': 0.836, 'learning_rate': 1.5039353872868516e-05, 'epoch': 0.67} {'loss': 0.7797, 'learning_rate': 1.5039071123113154e-05, 'epoch': 0.67} {'loss': 0.6811, 'learning_rate': 1.5038788367957973e-05, 'epoch': 0.67} {'loss': 0.8627, 'learning_rate': 1.5038505607403275e-05, 'epoch': 0.67} {'loss': 0.8056, 'learning_rate': 1.5038222841449367e-05, 'epoch': 0.67} {'loss': 0.7806, 'learning_rate': 1.5037940070096543e-05, 'epoch': 0.67} {'loss': 0.7794, 'learning_rate': 1.5037657293345115e-05, 'epoch': 0.67} {'loss': 0.8445, 'learning_rate': 1.503737451119538e-05, 'epoch': 0.67} {'loss': 0.7727, 'learning_rate': 1.5037091723647646e-05, 'epoch': 0.67} {'loss': 0.7459, 'learning_rate': 1.5036808930702211e-05, 'epoch': 0.67} {'loss': 0.8124, 'learning_rate': 1.5036526132359383e-05, 'epoch': 0.67} {'loss': 0.9176, 'learning_rate': 1.5036243328619462e-05, 'epoch': 0.67} {'loss': 0.8332, 'learning_rate': 1.503596051948275e-05, 'epoch': 0.67} {'loss': 0.8607, 'learning_rate': 1.5035677704949556e-05, 'epoch': 0.67} {'loss': 0.8782, 'learning_rate': 1.5035394885020176e-05, 'epoch': 0.67} {'loss': 0.8748, 'learning_rate': 1.5035112059694914e-05, 'epoch': 0.67} {'loss': 0.8624, 'learning_rate': 1.503482922897408e-05, 'epoch': 0.67} {'loss': 0.7925, 'learning_rate': 1.5034546392857968e-05, 'epoch': 0.67} {'loss': 0.9173, 'learning_rate': 1.5034263551346886e-05, 'epoch': 0.67} {'loss': 0.7877, 'learning_rate': 1.503398070444114e-05, 'epoch': 0.67} {'loss': 1.0162, 'learning_rate': 1.5033697852141025e-05, 'epoch': 0.67} {'loss': 0.8291, 'learning_rate': 1.5033414994446847e-05, 'epoch': 0.67} {'loss': 0.7777, 'learning_rate': 1.5033132131358912e-05, 'epoch': 0.67} {'loss': 1.0063, 'learning_rate': 1.5032849262877522e-05, 'epoch': 0.67} {'loss': 0.7957, 'learning_rate': 1.503256638900298e-05, 'epoch': 0.67} {'loss': 0.8969, 'learning_rate': 1.5032283509735592e-05, 'epoch': 0.67} {'loss': 0.8023, 'learning_rate': 1.5032000625075656e-05, 'epoch': 0.67} {'loss': 0.8018, 'learning_rate': 1.5031717735023477e-05, 'epoch': 0.67} {'loss': 0.8909, 'learning_rate': 1.5031434839579357e-05, 'epoch': 0.67} {'loss': 0.8622, 'learning_rate': 1.50311519387436e-05, 'epoch': 0.67} {'loss': 0.8125, 'learning_rate': 1.5030869032516511e-05, 'epoch': 0.67} {'loss': 0.693, 'learning_rate': 1.5030586120898391e-05, 'epoch': 0.67} {'loss': 0.8964, 'learning_rate': 1.5030303203889545e-05, 'epoch': 0.67} {'loss': 0.7689, 'learning_rate': 1.5030020281490277e-05, 'epoch': 0.67} {'loss': 0.8642, 'learning_rate': 1.5029737353700885e-05, 'epoch': 0.67} {'loss': 0.7152, 'learning_rate': 1.5029454420521675e-05, 'epoch': 0.67} {'loss': 0.7728, 'learning_rate': 1.5029171481952954e-05, 'epoch': 0.67} {'loss': 0.9377, 'learning_rate': 1.502888853799502e-05, 'epoch': 0.67} {'loss': 0.9134, 'learning_rate': 1.5028605588648177e-05, 'epoch': 0.67} {'loss': 0.6609, 'learning_rate': 1.502832263391273e-05, 'epoch': 0.67} {'loss': 0.9293, 'learning_rate': 1.5028039673788981e-05, 'epoch': 0.67} {'loss': 0.7215, 'learning_rate': 1.5027756708277234e-05, 'epoch': 0.67} {'loss': 0.8413, 'learning_rate': 1.5027473737377794e-05, 'epoch': 0.67} {'loss': 0.7792, 'learning_rate': 1.502719076109096e-05, 'epoch': 0.67} {'loss': 0.9078, 'learning_rate': 1.5026907779417037e-05, 'epoch': 0.67} {'loss': 0.8411, 'learning_rate': 1.502662479235633e-05, 'epoch': 0.67} {'loss': 0.933, 'learning_rate': 1.5026341799909141e-05, 'epoch': 0.67} {'loss': 0.8107, 'learning_rate': 1.502605880207577e-05, 'epoch': 0.67} {'loss': 0.7712, 'learning_rate': 1.5025775798856526e-05, 'epoch': 0.67} {'loss': 0.7731, 'learning_rate': 1.5025492790251708e-05, 'epoch': 0.67} {'loss': 0.9797, 'learning_rate': 1.5025209776261624e-05, 'epoch': 0.67} {'loss': 0.6854, 'learning_rate': 1.5024926756886573e-05, 'epoch': 0.67} {'loss': 0.9389, 'learning_rate': 1.5024643732126858e-05, 'epoch': 0.67} {'loss': 0.5083, 'learning_rate': 1.5024360701982785e-05, 'epoch': 0.67} {'loss': 0.8261, 'learning_rate': 1.5024077666454655e-05, 'epoch': 0.67} {'loss': 0.7438, 'learning_rate': 1.5023794625542771e-05, 'epoch': 0.67} {'loss': 0.8092, 'learning_rate': 1.5023511579247441e-05, 'epoch': 0.67} {'loss': 0.7702, 'learning_rate': 1.5023228527568964e-05, 'epoch': 0.67} {'loss': 0.8468, 'learning_rate': 1.5022945470507644e-05, 'epoch': 0.67} {'loss': 0.6156, 'learning_rate': 1.5022662408063784e-05, 'epoch': 0.67} {'loss': 0.7998, 'learning_rate': 1.502237934023769e-05, 'epoch': 0.67} {'loss': 0.9303, 'learning_rate': 1.502209626702966e-05, 'epoch': 0.67} {'loss': 0.9553, 'learning_rate': 1.5021813188440002e-05, 'epoch': 0.67} {'loss': 1.0042, 'learning_rate': 1.5021530104469019e-05, 'epoch': 0.67} {'loss': 0.9317, 'learning_rate': 1.502124701511701e-05, 'epoch': 0.67} {'loss': 0.7294, 'learning_rate': 1.5020963920384284e-05, 'epoch': 0.67} {'loss': 0.817, 'learning_rate': 1.5020680820271142e-05, 'epoch': 0.67} {'loss': 0.8237, 'learning_rate': 1.5020397714777888e-05, 'epoch': 0.67} {'loss': 0.8171, 'learning_rate': 1.5020114603904824e-05, 'epoch': 0.67} {'loss': 0.8901, 'learning_rate': 1.5019831487652256e-05, 'epoch': 0.67} {'loss': 0.7207, 'learning_rate': 1.5019548366020482e-05, 'epoch': 0.67} {'loss': 0.791, 'learning_rate': 1.501926523900981e-05, 'epoch': 0.67} {'loss': 0.6727, 'learning_rate': 1.5018982106620544e-05, 'epoch': 0.67} {'loss': 0.8115, 'learning_rate': 1.5018698968852982e-05, 'epoch': 0.67} {'loss': 0.965, 'learning_rate': 1.5018415825707435e-05, 'epoch': 0.67} {'loss': 0.7606, 'learning_rate': 1.50181326771842e-05, 'epoch': 0.67} {'loss': 0.8354, 'learning_rate': 1.5017849523283585e-05, 'epoch': 0.67} {'loss': 0.8091, 'learning_rate': 1.501756636400589e-05, 'epoch': 0.67} {'loss': 0.7867, 'learning_rate': 1.501728319935142e-05, 'epoch': 0.67} {'loss': 0.7764, 'learning_rate': 1.5017000029320476e-05, 'epoch': 0.67} {'loss': 0.9486, 'learning_rate': 1.5016716853913369e-05, 'epoch': 0.67} {'loss': 0.8287, 'learning_rate': 1.5016433673130393e-05, 'epoch': 0.67} {'loss': 0.8697, 'learning_rate': 1.5016150486971857e-05, 'epoch': 0.67} {'loss': 0.7759, 'learning_rate': 1.5015867295438063e-05, 'epoch': 0.67} {'loss': 0.7439, 'learning_rate': 1.5015584098529314e-05, 'epoch': 0.67} {'loss': 0.8767, 'learning_rate': 1.5015300896245912e-05, 'epoch': 0.67} {'loss': 0.8092, 'learning_rate': 1.5015017688588164e-05, 'epoch': 0.67} {'loss': 0.825, 'learning_rate': 1.5014734475556374e-05, 'epoch': 0.67} {'loss': 0.8152, 'learning_rate': 1.5014451257150844e-05, 'epoch': 0.67} {'loss': 0.767, 'learning_rate': 1.5014168033371873e-05, 'epoch': 0.67} {'loss': 0.7183, 'learning_rate': 1.5013884804219769e-05, 'epoch': 0.67} {'loss': 0.6411, 'learning_rate': 1.5013601569694837e-05, 'epoch': 0.67} {'loss': 0.8376, 'learning_rate': 1.5013318329797377e-05, 'epoch': 0.67} {'loss': 0.857, 'learning_rate': 1.5013035084527694e-05, 'epoch': 0.67} {'loss': 0.9031, 'learning_rate': 1.5012751833886092e-05, 'epoch': 0.67} {'loss': 0.7287, 'learning_rate': 1.5012468577872876e-05, 'epoch': 0.67} {'loss': 0.6358, 'learning_rate': 1.5012185316488344e-05, 'epoch': 0.67} {'loss': 0.8714, 'learning_rate': 1.5011902049732804e-05, 'epoch': 0.67} {'loss': 0.7036, 'learning_rate': 1.5011618777606559e-05, 'epoch': 0.67} {'loss': 0.9001, 'learning_rate': 1.501133550010991e-05, 'epoch': 0.67} {'loss': 0.978, 'learning_rate': 1.5011052217243163e-05, 'epoch': 0.67} {'loss': 0.6661, 'learning_rate': 1.5010768929006627e-05, 'epoch': 0.67} {'loss': 0.5577, 'learning_rate': 1.5010485635400595e-05, 'epoch': 0.67} {'loss': 0.765, 'learning_rate': 1.5010202336425377e-05, 'epoch': 0.67} {'loss': 0.654, 'learning_rate': 1.5009919032081275e-05, 'epoch': 0.67} {'loss': 0.7387, 'learning_rate': 1.500963572236859e-05, 'epoch': 0.67} {'loss': 0.8973, 'learning_rate': 1.500935240728763e-05, 'epoch': 0.67} {'loss': 0.8049, 'learning_rate': 1.5009069086838697e-05, 'epoch': 0.67} {'loss': 0.8777, 'learning_rate': 1.5008785761022093e-05, 'epoch': 0.67} {'loss': 0.7537, 'learning_rate': 1.5008502429838125e-05, 'epoch': 0.67} {'loss': 0.915, 'learning_rate': 1.5008219093287094e-05, 'epoch': 0.67} {'loss': 0.8917, 'learning_rate': 1.5007935751369305e-05, 'epoch': 0.67} {'loss': 0.8497, 'learning_rate': 1.5007652404085057e-05, 'epoch': 0.67} {'loss': 0.7902, 'learning_rate': 1.5007369051434664e-05, 'epoch': 0.67} {'loss': 0.8167, 'learning_rate': 1.5007085693418418e-05, 'epoch': 0.67} {'loss': 0.7002, 'learning_rate': 1.5006802330036632e-05, 'epoch': 0.67} {'loss': 0.905, 'learning_rate': 1.50065189612896e-05, 'epoch': 0.67} {'loss': 0.6666, 'learning_rate': 1.5006235587177633e-05, 'epoch': 0.67} {'loss': 0.8813, 'learning_rate': 1.5005952207701034e-05, 'epoch': 0.67} {'loss': 0.6754, 'learning_rate': 1.5005668822860103e-05, 'epoch': 0.67} {'loss': 0.7746, 'learning_rate': 1.500538543265515e-05, 'epoch': 0.67} {'loss': 0.8863, 'learning_rate': 1.5005102037086472e-05, 'epoch': 0.67} {'loss': 0.7486, 'learning_rate': 1.5004818636154376e-05, 'epoch': 0.67} {'loss': 0.83, 'learning_rate': 1.5004535229859167e-05, 'epoch': 0.67} {'loss': 0.7133, 'learning_rate': 1.5004251818201142e-05, 'epoch': 0.67} {'loss': 0.8649, 'learning_rate': 1.5003968401180613e-05, 'epoch': 0.67} {'loss': 0.9302, 'learning_rate': 1.5003684978797882e-05, 'epoch': 0.67} {'loss': 0.7639, 'learning_rate': 1.5003401551053247e-05, 'epoch': 0.67} {'loss': 0.9403, 'learning_rate': 1.5003118117947018e-05, 'epoch': 0.67} {'loss': 0.6628, 'learning_rate': 1.5002834679479496e-05, 'epoch': 0.67} {'loss': 0.8775, 'learning_rate': 1.5002551235650983e-05, 'epoch': 0.67} {'loss': 0.7625, 'learning_rate': 1.5002267786461789e-05, 'epoch': 0.67} {'loss': 0.7095, 'learning_rate': 1.500198433191221e-05, 'epoch': 0.67} {'loss': 0.9087, 'learning_rate': 1.5001700872002554e-05, 'epoch': 0.67} {'loss': 0.7163, 'learning_rate': 1.5001417406733126e-05, 'epoch': 0.67} {'loss': 1.0289, 'learning_rate': 1.5001133936104225e-05, 'epoch': 0.67} {'loss': 0.8641, 'learning_rate': 1.5000850460116161e-05, 'epoch': 0.67} {'loss': 0.6935, 'learning_rate': 1.500056697876923e-05, 'epoch': 0.67} {'loss': 0.8021, 'learning_rate': 1.5000283492063746e-05, 'epoch': 0.67} {'loss': 0.8755, 'learning_rate': 1.5000000000000002e-05, 'epoch': 0.67} {'loss': 0.8388, 'learning_rate': 1.4999716502578307e-05, 'epoch': 0.67} {'loss': 0.8612, 'learning_rate': 1.4999432999798966e-05, 'epoch': 0.67} {'loss': 0.6496, 'learning_rate': 1.4999149491662279e-05, 'epoch': 0.67} {'loss': 0.8028, 'learning_rate': 1.4998865978168558e-05, 'epoch': 0.67} {'loss': 0.9656, 'learning_rate': 1.4998582459318096e-05, 'epoch': 0.67} {'loss': 0.845, 'learning_rate': 1.4998298935111204e-05, 'epoch': 0.67} {'loss': 0.8809, 'learning_rate': 1.4998015405548181e-05, 'epoch': 0.67} {'loss': 0.7295, 'learning_rate': 1.4997731870629336e-05, 'epoch': 0.67} {'loss': 0.6917, 'learning_rate': 1.4997448330354968e-05, 'epoch': 0.67} {'loss': 0.9857, 'learning_rate': 1.4997164784725384e-05, 'epoch': 0.67} {'loss': 0.9938, 'learning_rate': 1.4996881233740888e-05, 'epoch': 0.67} {'loss': 0.6753, 'learning_rate': 1.4996597677401784e-05, 'epoch': 0.67} {'loss': 0.7418, 'learning_rate': 1.499631411570837e-05, 'epoch': 0.67} {'loss': 0.7392, 'learning_rate': 1.4996030548660959e-05, 'epoch': 0.67} {'loss': 0.8299, 'learning_rate': 1.4995746976259846e-05, 'epoch': 0.67} {'loss': 0.8686, 'learning_rate': 1.4995463398505342e-05, 'epoch': 0.67} {'loss': 0.9413, 'learning_rate': 1.4995179815397747e-05, 'epoch': 0.67} {'loss': 0.8957, 'learning_rate': 1.4994896226937367e-05, 'epoch': 0.67} {'loss': 0.8204, 'learning_rate': 1.4994612633124505e-05, 'epoch': 0.67} {'loss': 0.7863, 'learning_rate': 1.4994329033959463e-05, 'epoch': 0.67} {'loss': 0.9001, 'learning_rate': 1.4994045429442547e-05, 'epoch': 0.67} {'loss': 0.7679, 'learning_rate': 1.4993761819574062e-05, 'epoch': 0.67} {'loss': 0.7549, 'learning_rate': 1.4993478204354311e-05, 'epoch': 0.67} {'loss': 0.8345, 'learning_rate': 1.4993194583783597e-05, 'epoch': 0.67} {'loss': 0.7871, 'learning_rate': 1.4992910957862225e-05, 'epoch': 0.67} {'loss': 0.7818, 'learning_rate': 1.4992627326590497e-05, 'epoch': 0.67} {'loss': 0.7796, 'learning_rate': 1.4992343689968715e-05, 'epoch': 0.67} {'loss': 0.7147, 'learning_rate': 1.499206004799719e-05, 'epoch': 0.67} {'loss': 0.9694, 'learning_rate': 1.499177640067622e-05, 'epoch': 0.67} {'loss': 0.6968, 'learning_rate': 1.4991492748006114e-05, 'epoch': 0.67} {'loss': 0.7874, 'learning_rate': 1.4991209089987174e-05, 'epoch': 0.67} {'loss': 0.8448, 'learning_rate': 1.49909254266197e-05, 'epoch': 0.67} {'loss': 0.9096, 'learning_rate': 1.4990641757903999e-05, 'epoch': 0.67} {'loss': 0.7544, 'learning_rate': 1.4990358083840375e-05, 'epoch': 0.67} {'loss': 0.6908, 'learning_rate': 1.4990074404429131e-05, 'epoch': 0.67} {'loss': 0.7332, 'learning_rate': 1.4989790719670572e-05, 'epoch': 0.67} {'loss': 0.7764, 'learning_rate': 1.4989507029565004e-05, 'epoch': 0.67} {'loss': 0.6584, 'learning_rate': 1.4989223334112729e-05, 'epoch': 0.67} {'loss': 0.7631, 'learning_rate': 1.4988939633314051e-05, 'epoch': 0.67} {'loss': 0.9319, 'learning_rate': 1.498865592716927e-05, 'epoch': 0.67} {'loss': 0.8902, 'learning_rate': 1.4988372215678697e-05, 'epoch': 0.67} {'loss': 0.875, 'learning_rate': 1.4988088498842633e-05, 'epoch': 0.67} {'loss': 0.7513, 'learning_rate': 1.4987804776661384e-05, 'epoch': 0.67} {'loss': 0.951, 'learning_rate': 1.4987521049135247e-05, 'epoch': 0.67} {'loss': 0.9223, 'learning_rate': 1.4987237316264534e-05, 'epoch': 0.67} {'loss': 0.7071, 'learning_rate': 1.4986953578049548e-05, 'epoch': 0.67} {'loss': 0.931, 'learning_rate': 1.4986669834490588e-05, 'epoch': 0.67} {'loss': 0.7553, 'learning_rate': 1.498638608558796e-05, 'epoch': 0.67} {'loss': 0.8302, 'learning_rate': 1.4986102331341971e-05, 'epoch': 0.67} {'loss': 0.7985, 'learning_rate': 1.4985818571752925e-05, 'epoch': 0.67} {'loss': 0.8592, 'learning_rate': 1.4985534806821122e-05, 'epoch': 0.67} {'loss': 0.7192, 'learning_rate': 1.4985251036546871e-05, 'epoch': 0.67} {'loss': 1.0055, 'learning_rate': 1.4984967260930472e-05, 'epoch': 0.67} {'loss': 0.8875, 'learning_rate': 1.498468347997223e-05, 'epoch': 0.67} {'loss': 0.7457, 'learning_rate': 1.498439969367245e-05, 'epoch': 0.67} {'loss': 0.7596, 'learning_rate': 1.4984115902031437e-05, 'epoch': 0.67} {'loss': 0.8243, 'learning_rate': 1.4983832105049493e-05, 'epoch': 0.67} {'loss': 0.8137, 'learning_rate': 1.4983548302726922e-05, 'epoch': 0.67} {'loss': 0.9208, 'learning_rate': 1.4983264495064033e-05, 'epoch': 0.67} {'loss': 0.8182, 'learning_rate': 1.4982980682061123e-05, 'epoch': 0.67} {'loss': 0.988, 'learning_rate': 1.49826968637185e-05, 'epoch': 0.67} {'loss': 0.7668, 'learning_rate': 1.498241304003647e-05, 'epoch': 0.67} {'loss': 0.8606, 'learning_rate': 1.498212921101533e-05, 'epoch': 0.67} {'loss': 0.9405, 'learning_rate': 1.4981845376655393e-05, 'epoch': 0.67} {'loss': 0.9358, 'learning_rate': 1.4981561536956956e-05, 'epoch': 0.67} {'loss': 0.8249, 'learning_rate': 1.498127769192033e-05, 'epoch': 0.67} {'loss': 0.8726, 'learning_rate': 1.4980993841545812e-05, 'epoch': 0.67} {'loss': 0.8311, 'learning_rate': 1.498070998583371e-05, 'epoch': 0.67} {'loss': 0.9697, 'learning_rate': 1.498042612478433e-05, 'epoch': 0.67} {'loss': 0.83, 'learning_rate': 1.4980142258397972e-05, 'epoch': 0.67} {'loss': 0.9148, 'learning_rate': 1.4979858386674942e-05, 'epoch': 0.67} {'loss': 1.0494, 'learning_rate': 1.4979574509615545e-05, 'epoch': 0.67} {'loss': 0.866, 'learning_rate': 1.4979290627220084e-05, 'epoch': 0.67} {'loss': 0.7939, 'learning_rate': 1.4979006739488863e-05, 'epoch': 0.67} {'loss': 0.9901, 'learning_rate': 1.4978722846422189e-05, 'epoch': 0.67} {'loss': 0.8377, 'learning_rate': 1.4978438948020363e-05, 'epoch': 0.67} {'loss': 0.875, 'learning_rate': 1.497815504428369e-05, 'epoch': 0.67} {'loss': 0.8768, 'learning_rate': 1.4977871135212474e-05, 'epoch': 0.67} {'loss': 0.75, 'learning_rate': 1.4977587220807022e-05, 'epoch': 0.67} {'loss': 0.8256, 'learning_rate': 1.4977303301067634e-05, 'epoch': 0.67} {'loss': 0.779, 'learning_rate': 1.497701937599462e-05, 'epoch': 0.67} {'loss': 0.9282, 'learning_rate': 1.4976735445588274e-05, 'epoch': 0.67} {'loss': 0.6674, 'learning_rate': 1.497645150984891e-05, 'epoch': 0.67} {'loss': 0.887, 'learning_rate': 1.4976167568776829e-05, 'epoch': 0.67} {'loss': 0.7848, 'learning_rate': 1.4975883622372335e-05, 'epoch': 0.67} {'loss': 0.9099, 'learning_rate': 1.4975599670635732e-05, 'epoch': 0.67} {'loss': 0.7726, 'learning_rate': 1.497531571356733e-05, 'epoch': 0.67} {'loss': 0.9243, 'learning_rate': 1.4975031751167423e-05, 'epoch': 0.67} {'loss': 0.7043, 'learning_rate': 1.4974747783436324e-05, 'epoch': 0.67} {'loss': 0.7625, 'learning_rate': 1.497446381037433e-05, 'epoch': 0.67} {'loss': 0.9055, 'learning_rate': 1.497417983198175e-05, 'epoch': 0.67} {'loss': 1.1229, 'learning_rate': 1.4973895848258886e-05, 'epoch': 0.67} {'loss': 0.9154, 'learning_rate': 1.4973611859206048e-05, 'epoch': 0.67} {'loss': 0.6654, 'learning_rate': 1.4973327864823533e-05, 'epoch': 0.67} {'loss': 0.8277, 'learning_rate': 1.4973043865111649e-05, 'epoch': 0.67} {'loss': 0.9764, 'learning_rate': 1.49727598600707e-05, 'epoch': 0.67} {'loss': 0.8183, 'learning_rate': 1.4972475849700989e-05, 'epoch': 0.67} {'loss': 0.8566, 'learning_rate': 1.497219183400282e-05, 'epoch': 0.67} {'loss': 0.8609, 'learning_rate': 1.49719078129765e-05, 'epoch': 0.67} {'loss': 0.8029, 'learning_rate': 1.4971623786622336e-05, 'epoch': 0.67} {'loss': 0.9606, 'learning_rate': 1.4971339754940623e-05, 'epoch': 0.67} {'loss': 0.7256, 'learning_rate': 1.4971055717931675e-05, 'epoch': 0.67} {'loss': 0.7109, 'learning_rate': 1.4970771675595787e-05, 'epoch': 0.67} {'loss': 0.9594, 'learning_rate': 1.4970487627933272e-05, 'epoch': 0.67} {'loss': 0.6048, 'learning_rate': 1.497020357494443e-05, 'epoch': 0.67} {'loss': 0.8121, 'learning_rate': 1.4969919516629568e-05, 'epoch': 0.67} {'loss': 0.8637, 'learning_rate': 1.4969635452988987e-05, 'epoch': 0.67} {'loss': 0.8699, 'learning_rate': 1.4969351384022994e-05, 'epoch': 0.67} {'loss': 0.7683, 'learning_rate': 1.496906730973189e-05, 'epoch': 0.67} {'loss': 0.8245, 'learning_rate': 1.4968783230115983e-05, 'epoch': 0.67} {'loss': 1.0236, 'learning_rate': 1.4968499145175577e-05, 'epoch': 0.67} {'loss': 0.7743, 'learning_rate': 1.4968215054910975e-05, 'epoch': 0.67} {'loss': 0.8216, 'learning_rate': 1.4967930959322485e-05, 'epoch': 0.67} {'loss': 0.8294, 'learning_rate': 1.4967646858410405e-05, 'epoch': 0.67} {'loss': 0.7551, 'learning_rate': 1.4967362752175048e-05, 'epoch': 0.67} {'loss': 0.921, 'learning_rate': 1.4967078640616708e-05, 'epoch': 0.67} {'loss': 0.8779, 'learning_rate': 1.4966794523735697e-05, 'epoch': 0.67} {'loss': 0.8509, 'learning_rate': 1.4966510401532315e-05, 'epoch': 0.67} {'loss': 0.6545, 'learning_rate': 1.4966226274006875e-05, 'epoch': 0.67} {'loss': 0.9299, 'learning_rate': 1.4965942141159669e-05, 'epoch': 0.67} {'loss': 0.9821, 'learning_rate': 1.4965658002991009e-05, 'epoch': 0.67} {'loss': 0.9709, 'learning_rate': 1.49653738595012e-05, 'epoch': 0.67} {'loss': 0.7805, 'learning_rate': 1.4965089710690546e-05, 'epoch': 0.67} {'loss': 1.0082, 'learning_rate': 1.4964805556559347e-05, 'epoch': 0.67} {'loss': 0.7665, 'learning_rate': 1.4964521397107914e-05, 'epoch': 0.67} {'loss': 0.6989, 'learning_rate': 1.4964237232336544e-05, 'epoch': 0.67} {'loss': 0.9623, 'learning_rate': 1.4963953062245548e-05, 'epoch': 0.67} {'loss': 0.8383, 'learning_rate': 1.496366888683523e-05, 'epoch': 0.67} {'loss': 0.8402, 'learning_rate': 1.4963384706105892e-05, 'epoch': 0.67} {'loss': 1.0127, 'learning_rate': 1.4963100520057839e-05, 'epoch': 0.67} {'loss': 0.8555, 'learning_rate': 1.4962816328691375e-05, 'epoch': 0.67} {'loss': 0.8706, 'learning_rate': 1.4962532132006805e-05, 'epoch': 0.67} {'loss': 0.9198, 'learning_rate': 1.4962247930004435e-05, 'epoch': 0.67} {'loss': 0.8283, 'learning_rate': 1.4961963722684567e-05, 'epoch': 0.67} {'loss': 0.7178, 'learning_rate': 1.4961679510047512e-05, 'epoch': 0.67} {'loss': 0.8265, 'learning_rate': 1.4961395292093564e-05, 'epoch': 0.67} {'loss': 0.8232, 'learning_rate': 1.4961111068823033e-05, 'epoch': 0.67} {'loss': 0.781, 'learning_rate': 1.4960826840236226e-05, 'epoch': 0.67} {'loss': 0.7237, 'learning_rate': 1.4960542606333446e-05, 'epoch': 0.67} {'loss': 1.0099, 'learning_rate': 1.4960258367114997e-05, 'epoch': 0.67} {'loss': 0.8578, 'learning_rate': 1.495997412258118e-05, 'epoch': 0.67} {'loss': 0.8992, 'learning_rate': 1.4959689872732308e-05, 'epoch': 0.67} {'loss': 0.7246, 'learning_rate': 1.4959405617568676e-05, 'epoch': 0.67} {'loss': 0.9854, 'learning_rate': 1.4959121357090598e-05, 'epoch': 0.67} {'loss': 0.8415, 'learning_rate': 1.495883709129837e-05, 'epoch': 0.67} {'loss': 0.8819, 'learning_rate': 1.49585528201923e-05, 'epoch': 0.67} {'loss': 0.8025, 'learning_rate': 1.4958268543772697e-05, 'epoch': 0.67} {'loss': 0.7317, 'learning_rate': 1.4957984262039857e-05, 'epoch': 0.67} {'loss': 0.695, 'learning_rate': 1.4957699974994094e-05, 'epoch': 0.67} {'loss': 0.9221, 'learning_rate': 1.4957415682635707e-05, 'epoch': 0.67} {'loss': 0.8368, 'learning_rate': 1.4957131384965e-05, 'epoch': 0.67} {'loss': 1.0241, 'learning_rate': 1.495684708198228e-05, 'epoch': 0.67} {'loss': 0.9294, 'learning_rate': 1.495656277368785e-05, 'epoch': 0.67} {'loss': 0.6612, 'learning_rate': 1.4956278460082016e-05, 'epoch': 0.67} {'loss': 0.9217, 'learning_rate': 1.4955994141165082e-05, 'epoch': 0.67} {'loss': 0.8877, 'learning_rate': 1.4955709816937356e-05, 'epoch': 0.67} {'loss': 0.6763, 'learning_rate': 1.4955425487399137e-05, 'epoch': 0.67} {'loss': 0.7759, 'learning_rate': 1.4955141152550734e-05, 'epoch': 0.67} {'loss': 0.9257, 'learning_rate': 1.4954856812392447e-05, 'epoch': 0.67} {'loss': 0.8489, 'learning_rate': 1.4954572466924585e-05, 'epoch': 0.67} {'loss': 0.9255, 'learning_rate': 1.4954288116147452e-05, 'epoch': 0.67} {'loss': 0.724, 'learning_rate': 1.4954003760061354e-05, 'epoch': 0.67} {'loss': 0.959, 'learning_rate': 1.4953719398666591e-05, 'epoch': 0.67} {'loss': 0.8054, 'learning_rate': 1.4953435031963473e-05, 'epoch': 0.67} {'loss': 0.7998, 'learning_rate': 1.49531506599523e-05, 'epoch': 0.67} {'loss': 0.8842, 'learning_rate': 1.495286628263338e-05, 'epoch': 0.67} {'loss': 0.9421, 'learning_rate': 1.4952581900007016e-05, 'epoch': 0.67} {'loss': 0.8119, 'learning_rate': 1.4952297512073512e-05, 'epoch': 0.67} {'loss': 0.7761, 'learning_rate': 1.4952013118833177e-05, 'epoch': 0.67} {'loss': 0.9745, 'learning_rate': 1.4951728720286314e-05, 'epoch': 0.67} {'loss': 0.8281, 'learning_rate': 1.4951444316433226e-05, 'epoch': 0.67} {'loss': 0.7971, 'learning_rate': 1.4951159907274218e-05, 'epoch': 0.67} {'loss': 1.0037, 'learning_rate': 1.4950875492809594e-05, 'epoch': 0.67} {'loss': 0.8673, 'learning_rate': 1.495059107303966e-05, 'epoch': 0.67} {'loss': 0.836, 'learning_rate': 1.4950306647964722e-05, 'epoch': 0.67} {'loss': 0.9467, 'learning_rate': 1.4950022217585083e-05, 'epoch': 0.67} {'loss': 0.7679, 'learning_rate': 1.494973778190105e-05, 'epoch': 0.67} {'loss': 0.8423, 'learning_rate': 1.4949453340912926e-05, 'epoch': 0.67} {'loss': 0.9668, 'learning_rate': 1.4949168894621013e-05, 'epoch': 0.67} {'loss': 0.8273, 'learning_rate': 1.4948884443025619e-05, 'epoch': 0.67} {'loss': 0.6743, 'learning_rate': 1.4948599986127053e-05, 'epoch': 0.67} {'loss': 0.7125, 'learning_rate': 1.4948315523925614e-05, 'epoch': 0.67} {'loss': 0.9268, 'learning_rate': 1.4948031056421606e-05, 'epoch': 0.67} {'loss': 0.8315, 'learning_rate': 1.4947746583615338e-05, 'epoch': 0.67} {'loss': 0.7661, 'learning_rate': 1.4947462105507113e-05, 'epoch': 0.67} {'loss': 0.8228, 'learning_rate': 1.4947177622097236e-05, 'epoch': 0.67} {'loss': 0.891, 'learning_rate': 1.4946893133386009e-05, 'epoch': 0.67} {'loss': 0.8922, 'learning_rate': 1.4946608639373744e-05, 'epoch': 0.67} {'loss': 0.6925, 'learning_rate': 1.4946324140060737e-05, 'epoch': 0.67} {'loss': 0.8025, 'learning_rate': 1.4946039635447297e-05, 'epoch': 0.67} {'loss': 0.9446, 'learning_rate': 1.4945755125533734e-05, 'epoch': 0.67} {'loss': 0.9177, 'learning_rate': 1.4945470610320345e-05, 'epoch': 0.67} {'loss': 0.9225, 'learning_rate': 1.4945186089807438e-05, 'epoch': 0.67} {'loss': 0.8513, 'learning_rate': 1.494490156399532e-05, 'epoch': 0.67} {'loss': 0.9596, 'learning_rate': 1.494461703288429e-05, 'epoch': 0.67} {'loss': 0.7993, 'learning_rate': 1.4944332496474658e-05, 'epoch': 0.67} {'loss': 0.8904, 'learning_rate': 1.4944047954766727e-05, 'epoch': 0.67} {'loss': 0.8549, 'learning_rate': 1.4943763407760803e-05, 'epoch': 0.67} {'loss': 0.896, 'learning_rate': 1.494347885545719e-05, 'epoch': 0.67} {'loss': 0.863, 'learning_rate': 1.4943194297856193e-05, 'epoch': 0.67} {'loss': 0.8562, 'learning_rate': 1.494290973495812e-05, 'epoch': 0.67} {'loss': 0.783, 'learning_rate': 1.4942625166763269e-05, 'epoch': 0.68} {'loss': 0.7215, 'learning_rate': 1.4942340593271951e-05, 'epoch': 0.68} {'loss': 0.9274, 'learning_rate': 1.4942056014484467e-05, 'epoch': 0.68} {'loss': 0.816, 'learning_rate': 1.4941771430401129e-05, 'epoch': 0.68} {'loss': 0.8816, 'learning_rate': 1.4941486841022233e-05, 'epoch': 0.68} {'loss': 0.7765, 'learning_rate': 1.494120224634809e-05, 'epoch': 0.68} {'loss': 0.8976, 'learning_rate': 1.4940917646379e-05, 'epoch': 0.68} {'loss': 0.7543, 'learning_rate': 1.4940633041115271e-05, 'epoch': 0.68} {'loss': 0.77, 'learning_rate': 1.494034843055721e-05, 'epoch': 0.68} {'loss': 0.9788, 'learning_rate': 1.494006381470512e-05, 'epoch': 0.68} {'loss': 0.8762, 'learning_rate': 1.4939779193559303e-05, 'epoch': 0.68} {'loss': 0.7941, 'learning_rate': 1.493949456712007e-05, 'epoch': 0.68} {'loss': 0.8145, 'learning_rate': 1.493920993538772e-05, 'epoch': 0.68} {'loss': 1.0105, 'learning_rate': 1.4938925298362562e-05, 'epoch': 0.68} {'loss': 0.8479, 'learning_rate': 1.4938640656044898e-05, 'epoch': 0.68} {'loss': 0.875, 'learning_rate': 1.4938356008435036e-05, 'epoch': 0.68} {'loss': 0.802, 'learning_rate': 1.4938071355533281e-05, 'epoch': 0.68} {'loss': 0.7288, 'learning_rate': 1.4937786697339938e-05, 'epoch': 0.68} {'loss': 0.839, 'learning_rate': 1.4937502033855307e-05, 'epoch': 0.68} {'loss': 0.6266, 'learning_rate': 1.4937217365079699e-05, 'epoch': 0.68} {'loss': 0.9145, 'learning_rate': 1.4936932691013416e-05, 'epoch': 0.68} {'loss': 0.7429, 'learning_rate': 1.4936648011656764e-05, 'epoch': 0.68} {'loss': 0.8086, 'learning_rate': 1.4936363327010048e-05, 'epoch': 0.68} {'loss': 0.8746, 'learning_rate': 1.4936078637073577e-05, 'epoch': 0.68} {'loss': 0.7993, 'learning_rate': 1.493579394184765e-05, 'epoch': 0.68} {'loss': 0.7631, 'learning_rate': 1.4935509241332571e-05, 'epoch': 0.68} {'loss': 0.7784, 'learning_rate': 1.4935224535528652e-05, 'epoch': 0.68} {'loss': 0.8031, 'learning_rate': 1.4934939824436192e-05, 'epoch': 0.68} {'loss': 0.7883, 'learning_rate': 1.49346551080555e-05, 'epoch': 0.68} {'loss': 0.7533, 'learning_rate': 1.4934370386386878e-05, 'epoch': 0.68} {'loss': 0.9336, 'learning_rate': 1.4934085659430637e-05, 'epoch': 0.68} {'loss': 0.9313, 'learning_rate': 1.4933800927187076e-05, 'epoch': 0.68} {'loss': 0.8186, 'learning_rate': 1.49335161896565e-05, 'epoch': 0.68} {'loss': 0.8662, 'learning_rate': 1.4933231446839219e-05, 'epoch': 0.68} {'loss': 0.9116, 'learning_rate': 1.4932946698735533e-05, 'epoch': 0.68} {'loss': 0.788, 'learning_rate': 1.493266194534575e-05, 'epoch': 0.68} {'loss': 0.982, 'learning_rate': 1.4932377186670175e-05, 'epoch': 0.68} {'loss': 0.9446, 'learning_rate': 1.4932092422709113e-05, 'epoch': 0.68} {'loss': 0.6941, 'learning_rate': 1.4931807653462868e-05, 'epoch': 0.68} {'loss': 0.6369, 'learning_rate': 1.4931522878931745e-05, 'epoch': 0.68} {'loss': 0.9803, 'learning_rate': 1.4931238099116053e-05, 'epoch': 0.68} {'loss': 0.7585, 'learning_rate': 1.493095331401609e-05, 'epoch': 0.68} {'loss': 0.764, 'learning_rate': 1.4930668523632168e-05, 'epoch': 0.68} {'loss': 0.7043, 'learning_rate': 1.493038372796459e-05, 'epoch': 0.68} {'loss': 0.7989, 'learning_rate': 1.4930098927013661e-05, 'epoch': 0.68} {'loss': 0.6907, 'learning_rate': 1.4929814120779687e-05, 'epoch': 0.68} {'loss': 0.7647, 'learning_rate': 1.4929529309262968e-05, 'epoch': 0.68} {'loss': 0.9029, 'learning_rate': 1.4929244492463817e-05, 'epoch': 0.68} {'loss': 0.7598, 'learning_rate': 1.4928959670382534e-05, 'epoch': 0.68} {'loss': 0.9399, 'learning_rate': 1.4928674843019428e-05, 'epoch': 0.68} {'loss': 0.9197, 'learning_rate': 1.49283900103748e-05, 'epoch': 0.68} {'loss': 0.8063, 'learning_rate': 1.492810517244896e-05, 'epoch': 0.68} {'loss': 0.7129, 'learning_rate': 1.4927820329242209e-05, 'epoch': 0.68} {'loss': 0.8967, 'learning_rate': 1.4927535480754852e-05, 'epoch': 0.68} {'loss': 0.8153, 'learning_rate': 1.4927250626987198e-05, 'epoch': 0.68} {'loss': 0.8124, 'learning_rate': 1.4926965767939549e-05, 'epoch': 0.68} {'loss': 0.8575, 'learning_rate': 1.4926680903612211e-05, 'epoch': 0.68} {'loss': 0.816, 'learning_rate': 1.492639603400549e-05, 'epoch': 0.68} {'loss': 0.8044, 'learning_rate': 1.4926111159119694e-05, 'epoch': 0.68} {'loss': 0.8308, 'learning_rate': 1.4925826278955122e-05, 'epoch': 0.68} {'loss': 0.7261, 'learning_rate': 1.4925541393512083e-05, 'epoch': 0.68} {'loss': 0.8205, 'learning_rate': 1.4925256502790886e-05, 'epoch': 0.68} {'loss': 0.7878, 'learning_rate': 1.4924971606791828e-05, 'epoch': 0.68} {'loss': 0.7462, 'learning_rate': 1.4924686705515217e-05, 'epoch': 0.68} {'loss': 0.6692, 'learning_rate': 1.4924401798961361e-05, 'epoch': 0.68} {'loss': 0.8002, 'learning_rate': 1.4924116887130566e-05, 'epoch': 0.68} {'loss': 0.9627, 'learning_rate': 1.4923831970023135e-05, 'epoch': 0.68} {'loss': 0.7773, 'learning_rate': 1.4923547047639371e-05, 'epoch': 0.68} {'loss': 0.925, 'learning_rate': 1.4923262119979585e-05, 'epoch': 0.68} {'loss': 0.896, 'learning_rate': 1.4922977187044078e-05, 'epoch': 0.68} {'loss': 0.6529, 'learning_rate': 1.4922692248833155e-05, 'epoch': 0.68} {'loss': 0.629, 'learning_rate': 1.4922407305347124e-05, 'epoch': 0.68} {'loss': 1.1845, 'learning_rate': 1.492212235658629e-05, 'epoch': 0.68} {'loss': 0.7985, 'learning_rate': 1.4921837402550958e-05, 'epoch': 0.68} {'loss': 1.0455, 'learning_rate': 1.4921552443241433e-05, 'epoch': 0.68} {'loss': 0.9191, 'learning_rate': 1.492126747865802e-05, 'epoch': 0.68} {'loss': 0.8281, 'learning_rate': 1.4920982508801025e-05, 'epoch': 0.68} {'loss': 0.8041, 'learning_rate': 1.4920697533670751e-05, 'epoch': 0.68} {'loss': 0.7978, 'learning_rate': 1.4920412553267508e-05, 'epoch': 0.68} {'loss': 0.8612, 'learning_rate': 1.4920127567591598e-05, 'epoch': 0.68} {'loss': 0.8891, 'learning_rate': 1.491984257664333e-05, 'epoch': 0.68} {'loss': 0.9264, 'learning_rate': 1.4919557580423002e-05, 'epoch': 0.68} {'loss': 1.0541, 'learning_rate': 1.4919272578930926e-05, 'epoch': 0.68} {'loss': 0.9219, 'learning_rate': 1.4918987572167405e-05, 'epoch': 0.68} {'loss': 0.8685, 'learning_rate': 1.4918702560132743e-05, 'epoch': 0.68} {'loss': 0.7003, 'learning_rate': 1.491841754282725e-05, 'epoch': 0.68} {'loss': 0.7933, 'learning_rate': 1.4918132520251229e-05, 'epoch': 0.68} {'loss': 0.8374, 'learning_rate': 1.4917847492404987e-05, 'epoch': 0.68} {'loss': 0.7113, 'learning_rate': 1.4917562459288823e-05, 'epoch': 0.68} {'loss': 0.8347, 'learning_rate': 1.4917277420903049e-05, 'epoch': 0.68} {'loss': 0.7012, 'learning_rate': 1.4916992377247967e-05, 'epoch': 0.68} {'loss': 0.7312, 'learning_rate': 1.4916707328323885e-05, 'epoch': 0.68} {'loss': 0.7615, 'learning_rate': 1.4916422274131109e-05, 'epoch': 0.68} {'loss': 0.9898, 'learning_rate': 1.4916137214669939e-05, 'epoch': 0.68} {'loss': 0.9318, 'learning_rate': 1.491585214994069e-05, 'epoch': 0.68} {'loss': 0.7978, 'learning_rate': 1.4915567079943655e-05, 'epoch': 0.68} {'loss': 0.8266, 'learning_rate': 1.491528200467915e-05, 'epoch': 0.68} {'loss': 0.8823, 'learning_rate': 1.4914996924147475e-05, 'epoch': 0.68} {'loss': 0.9899, 'learning_rate': 1.4914711838348938e-05, 'epoch': 0.68} {'loss': 0.673, 'learning_rate': 1.4914426747283845e-05, 'epoch': 0.68} {'loss': 0.842, 'learning_rate': 1.4914141650952503e-05, 'epoch': 0.68} {'loss': 0.8393, 'learning_rate': 1.491385654935521e-05, 'epoch': 0.68} {'loss': 0.5602, 'learning_rate': 1.4913571442492276e-05, 'epoch': 0.68} {'loss': 0.8847, 'learning_rate': 1.4913286330364007e-05, 'epoch': 0.68} {'loss': 0.8312, 'learning_rate': 1.491300121297071e-05, 'epoch': 0.68} {'loss': 0.8427, 'learning_rate': 1.4912716090312688e-05, 'epoch': 0.68} {'loss': 0.9002, 'learning_rate': 1.4912430962390248e-05, 'epoch': 0.68} {'loss': 0.7172, 'learning_rate': 1.4912145829203695e-05, 'epoch': 0.68} {'loss': 0.7788, 'learning_rate': 1.4911860690753333e-05, 'epoch': 0.68} {'loss': 0.7593, 'learning_rate': 1.4911575547039468e-05, 'epoch': 0.68} {'loss': 0.8429, 'learning_rate': 1.4911290398062405e-05, 'epoch': 0.68} {'loss': 0.7021, 'learning_rate': 1.4911005243822456e-05, 'epoch': 0.68} {'loss': 0.8708, 'learning_rate': 1.491072008431992e-05, 'epoch': 0.68} {'loss': 0.8259, 'learning_rate': 1.4910434919555104e-05, 'epoch': 0.68} {'loss': 0.8563, 'learning_rate': 1.4910149749528314e-05, 'epoch': 0.68} {'loss': 0.8707, 'learning_rate': 1.4909864574239853e-05, 'epoch': 0.68} {'loss': 0.7337, 'learning_rate': 1.4909579393690032e-05, 'epoch': 0.68} {'loss': 0.8343, 'learning_rate': 1.4909294207879153e-05, 'epoch': 0.68} {'loss': 0.7609, 'learning_rate': 1.4909009016807523e-05, 'epoch': 0.68} {'loss': 0.7954, 'learning_rate': 1.4908723820475443e-05, 'epoch': 0.68} {'loss': 0.7542, 'learning_rate': 1.4908438618883225e-05, 'epoch': 0.68} {'loss': 0.771, 'learning_rate': 1.4908153412031175e-05, 'epoch': 0.68} {'loss': 0.7705, 'learning_rate': 1.490786819991959e-05, 'epoch': 0.68} {'loss': 0.7132, 'learning_rate': 1.4907582982548783e-05, 'epoch': 0.68} {'loss': 0.7092, 'learning_rate': 1.490729775991906e-05, 'epoch': 0.68} {'loss': 0.8409, 'learning_rate': 1.4907012532030723e-05, 'epoch': 0.68} {'loss': 0.9235, 'learning_rate': 1.4906727298884078e-05, 'epoch': 0.68} {'loss': 0.84, 'learning_rate': 1.4906442060479433e-05, 'epoch': 0.68} {'loss': 0.5471, 'learning_rate': 1.4906156816817094e-05, 'epoch': 0.68} {'loss': 0.9207, 'learning_rate': 1.4905871567897363e-05, 'epoch': 0.68} {'loss': 0.8366, 'learning_rate': 1.4905586313720548e-05, 'epoch': 0.68} {'loss': 0.7333, 'learning_rate': 1.4905301054286959e-05, 'epoch': 0.68} {'loss': 0.8963, 'learning_rate': 1.490501578959689e-05, 'epoch': 0.68} {'loss': 0.8656, 'learning_rate': 1.490473051965066e-05, 'epoch': 0.68} {'loss': 0.8976, 'learning_rate': 1.4904445244448564e-05, 'epoch': 0.68} {'loss': 0.7058, 'learning_rate': 1.4904159963990914e-05, 'epoch': 0.68} {'loss': 0.8608, 'learning_rate': 1.4903874678278014e-05, 'epoch': 0.68} {'loss': 0.895, 'learning_rate': 1.4903589387310171e-05, 'epoch': 0.68} {'loss': 0.8439, 'learning_rate': 1.4903304091087686e-05, 'epoch': 0.68} {'loss': 0.8212, 'learning_rate': 1.490301878961087e-05, 'epoch': 0.68} {'loss': 0.8833, 'learning_rate': 1.4902733482880028e-05, 'epoch': 0.68} {'loss': 1.024, 'learning_rate': 1.4902448170895464e-05, 'epoch': 0.68} {'loss': 0.7868, 'learning_rate': 1.4902162853657482e-05, 'epoch': 0.68} {'loss': 1.0111, 'learning_rate': 1.4901877531166395e-05, 'epoch': 0.68} {'loss': 0.9335, 'learning_rate': 1.4901592203422502e-05, 'epoch': 0.68} {'loss': 0.7554, 'learning_rate': 1.4901306870426107e-05, 'epoch': 0.68} {'loss': 0.8817, 'learning_rate': 1.4901021532177522e-05, 'epoch': 0.68} {'loss': 0.841, 'learning_rate': 1.490073618867705e-05, 'epoch': 0.68} {'loss': 0.8621, 'learning_rate': 1.4900450839924996e-05, 'epoch': 0.68} {'loss': 0.8123, 'learning_rate': 1.490016548592167e-05, 'epoch': 0.68} {'loss': 0.8254, 'learning_rate': 1.489988012666737e-05, 'epoch': 0.68} {'loss': 0.8294, 'learning_rate': 1.4899594762162408e-05, 'epoch': 0.68} {'loss': 0.8945, 'learning_rate': 1.4899309392407086e-05, 'epoch': 0.68} {'loss': 0.7071, 'learning_rate': 1.4899024017401712e-05, 'epoch': 0.68} {'loss': 0.9792, 'learning_rate': 1.4898738637146595e-05, 'epoch': 0.68} {'loss': 0.7808, 'learning_rate': 1.4898453251642036e-05, 'epoch': 0.68} {'loss': 0.8089, 'learning_rate': 1.4898167860888343e-05, 'epoch': 0.68} {'loss': 0.9684, 'learning_rate': 1.489788246488582e-05, 'epoch': 0.68} {'loss': 0.7327, 'learning_rate': 1.4897597063634774e-05, 'epoch': 0.68} {'loss': 0.7434, 'learning_rate': 1.489731165713551e-05, 'epoch': 0.68} {'loss': 0.9706, 'learning_rate': 1.4897026245388336e-05, 'epoch': 0.68} {'loss': 0.8839, 'learning_rate': 1.4896740828393552e-05, 'epoch': 0.68} {'loss': 0.6331, 'learning_rate': 1.4896455406151474e-05, 'epoch': 0.68} {'loss': 0.6633, 'learning_rate': 1.4896169978662403e-05, 'epoch': 0.68} {'loss': 0.671, 'learning_rate': 1.4895884545926638e-05, 'epoch': 0.68} {'loss': 0.7725, 'learning_rate': 1.4895599107944494e-05, 'epoch': 0.68} {'loss': 0.7596, 'learning_rate': 1.4895313664716273e-05, 'epoch': 0.68} {'loss': 0.8949, 'learning_rate': 1.489502821624228e-05, 'epoch': 0.68} {'loss': 0.7861, 'learning_rate': 1.4894742762522827e-05, 'epoch': 0.68} {'loss': 0.7837, 'learning_rate': 1.4894457303558213e-05, 'epoch': 0.68} {'loss': 0.6896, 'learning_rate': 1.4894171839348745e-05, 'epoch': 0.68} {'loss': 0.7028, 'learning_rate': 1.4893886369894733e-05, 'epoch': 0.68} {'loss': 0.8529, 'learning_rate': 1.4893600895196476e-05, 'epoch': 0.68} {'loss': 0.7492, 'learning_rate': 1.4893315415254285e-05, 'epoch': 0.68} {'loss': 0.7594, 'learning_rate': 1.4893029930068465e-05, 'epoch': 0.68} {'loss': 0.9085, 'learning_rate': 1.4892744439639323e-05, 'epoch': 0.68} {'loss': 0.8804, 'learning_rate': 1.4892458943967168e-05, 'epoch': 0.68} {'loss': 0.8424, 'learning_rate': 1.4892173443052296e-05, 'epoch': 0.68} {'loss': 0.6725, 'learning_rate': 1.4891887936895018e-05, 'epoch': 0.68} {'loss': 0.8465, 'learning_rate': 1.4891602425495641e-05, 'epoch': 0.68} {'loss': 0.7345, 'learning_rate': 1.4891316908854472e-05, 'epoch': 0.68} {'loss': 0.8151, 'learning_rate': 1.4891031386971817e-05, 'epoch': 0.68} {'loss': 1.0132, 'learning_rate': 1.4890745859847979e-05, 'epoch': 0.68} {'loss': 0.8211, 'learning_rate': 1.4890460327483268e-05, 'epoch': 0.68} {'loss': 0.9945, 'learning_rate': 1.4890174789877982e-05, 'epoch': 0.68} {'loss': 0.798, 'learning_rate': 1.4889889247032434e-05, 'epoch': 0.68} {'loss': 0.6426, 'learning_rate': 1.4889603698946928e-05, 'epoch': 0.68} {'loss': 0.8247, 'learning_rate': 1.4889318145621775e-05, 'epoch': 0.68} {'loss': 0.7041, 'learning_rate': 1.4889032587057272e-05, 'epoch': 0.68} {'loss': 0.6348, 'learning_rate': 1.488874702325373e-05, 'epoch': 0.68} {'loss': 0.8048, 'learning_rate': 1.4888461454211457e-05, 'epoch': 0.68} {'loss': 0.7753, 'learning_rate': 1.488817587993075e-05, 'epoch': 0.68} {'loss': 0.7824, 'learning_rate': 1.4887890300411927e-05, 'epoch': 0.68} {'loss': 1.0503, 'learning_rate': 1.4887604715655287e-05, 'epoch': 0.68} {'loss': 0.7459, 'learning_rate': 1.4887319125661137e-05, 'epoch': 0.68} {'loss': 0.7994, 'learning_rate': 1.4887033530429782e-05, 'epoch': 0.68} {'loss': 0.8882, 'learning_rate': 1.4886747929961531e-05, 'epoch': 0.68} {'loss': 0.6394, 'learning_rate': 1.4886462324256689e-05, 'epoch': 0.68} {'loss': 0.832, 'learning_rate': 1.4886176713315562e-05, 'epoch': 0.68} {'loss': 0.818, 'learning_rate': 1.4885891097138455e-05, 'epoch': 0.68} {'loss': 0.7261, 'learning_rate': 1.4885605475725676e-05, 'epoch': 0.68} {'loss': 0.8216, 'learning_rate': 1.4885319849077527e-05, 'epoch': 0.68} {'loss': 0.7544, 'learning_rate': 1.4885034217194317e-05, 'epoch': 0.68} {'loss': 0.9982, 'learning_rate': 1.4884748580076351e-05, 'epoch': 0.68} {'loss': 0.9522, 'learning_rate': 1.488446293772394e-05, 'epoch': 0.68} {'loss': 0.8486, 'learning_rate': 1.4884177290137385e-05, 'epoch': 0.68} {'loss': 0.8196, 'learning_rate': 1.4883891637316992e-05, 'epoch': 0.68} {'loss': 0.7641, 'learning_rate': 1.4883605979263069e-05, 'epoch': 0.68} {'loss': 0.6437, 'learning_rate': 1.488332031597592e-05, 'epoch': 0.68} {'loss': 0.6218, 'learning_rate': 1.4883034647455853e-05, 'epoch': 0.68} {'loss': 0.8439, 'learning_rate': 1.4882748973703176e-05, 'epoch': 0.68} {'loss': 0.6044, 'learning_rate': 1.488246329471819e-05, 'epoch': 0.68} {'loss': 0.8934, 'learning_rate': 1.4882177610501206e-05, 'epoch': 0.68} {'loss': 0.8584, 'learning_rate': 1.4881891921052527e-05, 'epoch': 0.68} {'loss': 0.8447, 'learning_rate': 1.488160622637246e-05, 'epoch': 0.68} {'loss': 0.9745, 'learning_rate': 1.488132052646131e-05, 'epoch': 0.68} {'loss': 0.8806, 'learning_rate': 1.4881034821319387e-05, 'epoch': 0.68} {'loss': 0.8818, 'learning_rate': 1.4880749110946995e-05, 'epoch': 0.68} {'loss': 0.7841, 'learning_rate': 1.4880463395344435e-05, 'epoch': 0.68} {'loss': 0.901, 'learning_rate': 1.4880177674512023e-05, 'epoch': 0.68} {'loss': 0.7967, 'learning_rate': 1.487989194845006e-05, 'epoch': 0.68} {'loss': 0.9528, 'learning_rate': 1.4879606217158852e-05, 'epoch': 0.68} {'loss': 0.8499, 'learning_rate': 1.4879320480638702e-05, 'epoch': 0.68} {'loss': 0.795, 'learning_rate': 1.4879034738889922e-05, 'epoch': 0.68} {'loss': 0.8917, 'learning_rate': 1.4878748991912817e-05, 'epoch': 0.68} {'loss': 0.8775, 'learning_rate': 1.4878463239707692e-05, 'epoch': 0.68} {'loss': 0.8976, 'learning_rate': 1.487817748227485e-05, 'epoch': 0.68} {'loss': 0.6911, 'learning_rate': 1.4877891719614605e-05, 'epoch': 0.68} {'loss': 0.86, 'learning_rate': 1.4877605951727256e-05, 'epoch': 0.68} {'loss': 0.8735, 'learning_rate': 1.4877320178613113e-05, 'epoch': 0.68} {'loss': 0.8569, 'learning_rate': 1.4877034400272481e-05, 'epoch': 0.68} {'loss': 0.834, 'learning_rate': 1.4876748616705667e-05, 'epoch': 0.68} {'loss': 0.8852, 'learning_rate': 1.487646282791298e-05, 'epoch': 0.68} {'loss': 0.7089, 'learning_rate': 1.4876177033894717e-05, 'epoch': 0.68} {'loss': 0.7992, 'learning_rate': 1.4875891234651192e-05, 'epoch': 0.68} {'loss': 0.8694, 'learning_rate': 1.4875605430182708e-05, 'epoch': 0.68} {'loss': 0.8963, 'learning_rate': 1.4875319620489574e-05, 'epoch': 0.68} {'loss': 0.8314, 'learning_rate': 1.4875033805572097e-05, 'epoch': 0.68} {'loss': 0.7463, 'learning_rate': 1.487474798543058e-05, 'epoch': 0.68} {'loss': 0.8178, 'learning_rate': 1.4874462160065331e-05, 'epoch': 0.68} {'loss': 0.8811, 'learning_rate': 1.4874176329476655e-05, 'epoch': 0.68} {'loss': 0.9302, 'learning_rate': 1.487389049366486e-05, 'epoch': 0.68} {'loss': 0.8902, 'learning_rate': 1.487360465263025e-05, 'epoch': 0.68} {'loss': 0.8786, 'learning_rate': 1.4873318806373131e-05, 'epoch': 0.68} {'loss': 0.7302, 'learning_rate': 1.4873032954893818e-05, 'epoch': 0.68} {'loss': 0.6401, 'learning_rate': 1.4872747098192604e-05, 'epoch': 0.68} {'loss': 0.938, 'learning_rate': 1.4872461236269807e-05, 'epoch': 0.68} {'loss': 0.8745, 'learning_rate': 1.4872175369125723e-05, 'epoch': 0.68} {'loss': 0.8225, 'learning_rate': 1.4871889496760665e-05, 'epoch': 0.68} {'loss': 0.7421, 'learning_rate': 1.4871603619174937e-05, 'epoch': 0.68} {'loss': 0.82, 'learning_rate': 1.4871317736368846e-05, 'epoch': 0.68} {'loss': 0.7829, 'learning_rate': 1.4871031848342701e-05, 'epoch': 0.68} {'loss': 0.7349, 'learning_rate': 1.4870745955096804e-05, 'epoch': 0.68} {'loss': 0.7712, 'learning_rate': 1.4870460056631464e-05, 'epoch': 0.68} {'loss': 0.9073, 'learning_rate': 1.4870174152946983e-05, 'epoch': 0.68} {'loss': 0.8276, 'learning_rate': 1.4869888244043674e-05, 'epoch': 0.68} {'loss': 0.9745, 'learning_rate': 1.4869602329921841e-05, 'epoch': 0.68} {'loss': 0.6884, 'learning_rate': 1.4869316410581786e-05, 'epoch': 0.68} {'loss': 0.7891, 'learning_rate': 1.486903048602382e-05, 'epoch': 0.68} {'loss': 0.8628, 'learning_rate': 1.4868744556248253e-05, 'epoch': 0.68} {'loss': 0.8753, 'learning_rate': 1.4868458621255382e-05, 'epoch': 0.68} {'loss': 0.6554, 'learning_rate': 1.486817268104552e-05, 'epoch': 0.68} {'loss': 0.774, 'learning_rate': 1.486788673561897e-05, 'epoch': 0.68} {'loss': 0.7867, 'learning_rate': 1.4867600784976042e-05, 'epoch': 0.68} {'loss': 0.7824, 'learning_rate': 1.4867314829117039e-05, 'epoch': 0.68} {'loss': 0.7837, 'learning_rate': 1.4867028868042268e-05, 'epoch': 0.68} {'loss': 0.9741, 'learning_rate': 1.486674290175204e-05, 'epoch': 0.68} {'loss': 0.7076, 'learning_rate': 1.4866456930246655e-05, 'epoch': 0.68} {'loss': 0.8111, 'learning_rate': 1.4866170953526422e-05, 'epoch': 0.68} {'loss': 0.8528, 'learning_rate': 1.4865884971591648e-05, 'epoch': 0.68} {'loss': 0.9874, 'learning_rate': 1.486559898444264e-05, 'epoch': 0.68} {'loss': 0.892, 'learning_rate': 1.4865312992079702e-05, 'epoch': 0.68} {'loss': 0.77, 'learning_rate': 1.4865026994503142e-05, 'epoch': 0.68} {'loss': 0.8238, 'learning_rate': 1.4864740991713269e-05, 'epoch': 0.68} {'loss': 0.8316, 'learning_rate': 1.4864454983710386e-05, 'epoch': 0.68} {'loss': 0.8857, 'learning_rate': 1.48641689704948e-05, 'epoch': 0.68} {'loss': 0.8782, 'learning_rate': 1.4863882952066817e-05, 'epoch': 0.68} {'loss': 1.0159, 'learning_rate': 1.4863596928426744e-05, 'epoch': 0.68} {'loss': 0.9129, 'learning_rate': 1.486331089957489e-05, 'epoch': 0.68} {'loss': 0.8641, 'learning_rate': 1.4863024865511558e-05, 'epoch': 0.68} {'loss': 0.7655, 'learning_rate': 1.4862738826237055e-05, 'epoch': 0.68} {'loss': 0.8066, 'learning_rate': 1.486245278175169e-05, 'epoch': 0.68} {'loss': 0.7707, 'learning_rate': 1.486216673205577e-05, 'epoch': 0.68} {'loss': 0.7633, 'learning_rate': 1.4861880677149596e-05, 'epoch': 0.68} {'loss': 0.8442, 'learning_rate': 1.4861594617033479e-05, 'epoch': 0.68} {'loss': 0.6144, 'learning_rate': 1.4861308551707725e-05, 'epoch': 0.68} {'loss': 0.7561, 'learning_rate': 1.486102248117264e-05, 'epoch': 0.68} {'loss': 0.7593, 'learning_rate': 1.486073640542853e-05, 'epoch': 0.68} {'loss': 0.7803, 'learning_rate': 1.4860450324475704e-05, 'epoch': 0.68} {'loss': 0.8654, 'learning_rate': 1.4860164238314467e-05, 'epoch': 0.68} {'loss': 0.8028, 'learning_rate': 1.4859878146945122e-05, 'epoch': 0.68} {'loss': 0.7835, 'learning_rate': 1.4859592050367981e-05, 'epoch': 0.68} {'loss': 0.9864, 'learning_rate': 1.4859305948583348e-05, 'epoch': 0.68} {'loss': 0.8512, 'learning_rate': 1.4859019841591531e-05, 'epoch': 0.68} {'loss': 0.6898, 'learning_rate': 1.4858733729392838e-05, 'epoch': 0.68} {'loss': 1.0096, 'learning_rate': 1.485844761198757e-05, 'epoch': 0.68} {'loss': 0.9323, 'learning_rate': 1.4858161489376038e-05, 'epoch': 0.68} {'loss': 0.9078, 'learning_rate': 1.4857875361558545e-05, 'epoch': 0.68} {'loss': 0.921, 'learning_rate': 1.4857589228535401e-05, 'epoch': 0.68} {'loss': 0.676, 'learning_rate': 1.4857303090306913e-05, 'epoch': 0.68} {'loss': 0.8815, 'learning_rate': 1.4857016946873389e-05, 'epoch': 0.68} {'loss': 0.7454, 'learning_rate': 1.485673079823513e-05, 'epoch': 0.68} {'loss': 0.9045, 'learning_rate': 1.4856444644392445e-05, 'epoch': 0.68} {'loss': 0.6768, 'learning_rate': 1.4856158485345642e-05, 'epoch': 0.68} {'loss': 0.8251, 'learning_rate': 1.4855872321095026e-05, 'epoch': 0.68} {'loss': 0.8067, 'learning_rate': 1.4855586151640904e-05, 'epoch': 0.68} {'loss': 0.9537, 'learning_rate': 1.4855299976983584e-05, 'epoch': 0.68} {'loss': 0.748, 'learning_rate': 1.4855013797123374e-05, 'epoch': 0.68} {'loss': 0.8217, 'learning_rate': 1.485472761206058e-05, 'epoch': 0.68} {'loss': 0.8122, 'learning_rate': 1.4854441421795503e-05, 'epoch': 0.68} {'loss': 0.9246, 'learning_rate': 1.4854155226328453e-05, 'epoch': 0.68} {'loss': 0.7462, 'learning_rate': 1.485386902565974e-05, 'epoch': 0.68} {'loss': 0.8867, 'learning_rate': 1.4853582819789668e-05, 'epoch': 0.68} {'loss': 0.8192, 'learning_rate': 1.4853296608718543e-05, 'epoch': 0.68} {'loss': 0.7809, 'learning_rate': 1.4853010392446674e-05, 'epoch': 0.68} {'loss': 0.8462, 'learning_rate': 1.4852724170974366e-05, 'epoch': 0.68} {'loss': 0.9867, 'learning_rate': 1.4852437944301925e-05, 'epoch': 0.68} {'loss': 0.7252, 'learning_rate': 1.4852151712429662e-05, 'epoch': 0.68} {'loss': 0.7477, 'learning_rate': 1.4851865475357877e-05, 'epoch': 0.68} {'loss': 0.8569, 'learning_rate': 1.4851579233086882e-05, 'epoch': 0.68} {'loss': 0.9713, 'learning_rate': 1.4851292985616981e-05, 'epoch': 0.68} {'loss': 0.9415, 'learning_rate': 1.485100673294848e-05, 'epoch': 0.68} {'loss': 0.6515, 'learning_rate': 1.4850720475081693e-05, 'epoch': 0.68} {'loss': 0.9555, 'learning_rate': 1.4850434212016915e-05, 'epoch': 0.68} {'loss': 0.662, 'learning_rate': 1.4850147943754463e-05, 'epoch': 0.68} {'loss': 0.7475, 'learning_rate': 1.4849861670294637e-05, 'epoch': 0.68} {'loss': 1.0237, 'learning_rate': 1.484957539163775e-05, 'epoch': 0.68} {'loss': 0.687, 'learning_rate': 1.4849289107784102e-05, 'epoch': 0.68} {'loss': 1.0885, 'learning_rate': 1.4849002818734003e-05, 'epoch': 0.68} {'loss': 0.7577, 'learning_rate': 1.4848716524487762e-05, 'epoch': 0.68} {'loss': 0.8566, 'learning_rate': 1.4848430225045682e-05, 'epoch': 0.68} {'loss': 0.7975, 'learning_rate': 1.4848143920408071e-05, 'epoch': 0.68} {'loss': 0.9042, 'learning_rate': 1.484785761057524e-05, 'epoch': 0.68} {'loss': 0.7674, 'learning_rate': 1.4847571295547489e-05, 'epoch': 0.68} {'loss': 0.827, 'learning_rate': 1.4847284975325127e-05, 'epoch': 0.68} {'loss': 0.7146, 'learning_rate': 1.4846998649908463e-05, 'epoch': 0.68} {'loss': 0.802, 'learning_rate': 1.4846712319297803e-05, 'epoch': 0.68} {'loss': 0.8296, 'learning_rate': 1.4846425983493452e-05, 'epoch': 0.68} {'loss': 0.8731, 'learning_rate': 1.484613964249572e-05, 'epoch': 0.68} {'loss': 0.9112, 'learning_rate': 1.4845853296304911e-05, 'epoch': 0.68} {'loss': 0.7399, 'learning_rate': 1.4845566944921332e-05, 'epoch': 0.68} {'loss': 0.8516, 'learning_rate': 1.484528058834529e-05, 'epoch': 0.68} {'loss': 1.0173, 'learning_rate': 1.4844994226577095e-05, 'epoch': 0.68} {'loss': 0.8328, 'learning_rate': 1.484470785961705e-05, 'epoch': 0.68} {'loss': 0.8483, 'learning_rate': 1.4844421487465464e-05, 'epoch': 0.68} {'loss': 0.8094, 'learning_rate': 1.4844135110122641e-05, 'epoch': 0.68} {'loss': 0.7648, 'learning_rate': 1.4843848727588892e-05, 'epoch': 0.68} {'loss': 0.6258, 'learning_rate': 1.4843562339864522e-05, 'epoch': 0.68} {'loss': 0.753, 'learning_rate': 1.4843275946949835e-05, 'epoch': 0.68} {'loss': 0.7292, 'learning_rate': 1.4842989548845146e-05, 'epoch': 0.68} {'loss': 0.9307, 'learning_rate': 1.4842703145550753e-05, 'epoch': 0.68} {'loss': 0.8448, 'learning_rate': 1.4842416737066967e-05, 'epoch': 0.68} {'loss': 0.8447, 'learning_rate': 1.4842130323394095e-05, 'epoch': 0.68} {'loss': 0.7958, 'learning_rate': 1.4841843904532442e-05, 'epoch': 0.68} {'loss': 0.8706, 'learning_rate': 1.4841557480482315e-05, 'epoch': 0.68} {'loss': 0.9087, 'learning_rate': 1.4841271051244027e-05, 'epoch': 0.68} {'loss': 0.6315, 'learning_rate': 1.4840984616817878e-05, 'epoch': 0.68} {'loss': 0.9064, 'learning_rate': 1.4840698177204176e-05, 'epoch': 0.68} {'loss': 0.7546, 'learning_rate': 1.4840411732403231e-05, 'epoch': 0.68} {'loss': 0.8058, 'learning_rate': 1.4840125282415346e-05, 'epoch': 0.68} {'loss': 0.6591, 'learning_rate': 1.4839838827240827e-05, 'epoch': 0.68} {'loss': 0.7731, 'learning_rate': 1.4839552366879988e-05, 'epoch': 0.68} {'loss': 0.8478, 'learning_rate': 1.4839265901333129e-05, 'epoch': 0.68} {'loss': 0.7669, 'learning_rate': 1.4838979430600565e-05, 'epoch': 0.68} {'loss': 0.7408, 'learning_rate': 1.4838692954682594e-05, 'epoch': 0.68} {'loss': 0.9092, 'learning_rate': 1.4838406473579527e-05, 'epoch': 0.68} {'loss': 0.7553, 'learning_rate': 1.483811998729167e-05, 'epoch': 0.68} {'loss': 0.8611, 'learning_rate': 1.4837833495819332e-05, 'epoch': 0.68} {'loss': 0.8126, 'learning_rate': 1.4837546999162818e-05, 'epoch': 0.68} {'loss': 0.7559, 'learning_rate': 1.4837260497322439e-05, 'epoch': 0.68} {'loss': 0.7392, 'learning_rate': 1.4836973990298496e-05, 'epoch': 0.68} {'loss': 0.8408, 'learning_rate': 1.48366874780913e-05, 'epoch': 0.68} {'loss': 0.9139, 'learning_rate': 1.4836400960701154e-05, 'epoch': 0.68} {'loss': 0.6588, 'learning_rate': 1.4836114438128371e-05, 'epoch': 0.68} {'loss': 0.7969, 'learning_rate': 1.4835827910373253e-05, 'epoch': 0.68} {'loss': 0.7379, 'learning_rate': 1.4835541377436107e-05, 'epoch': 0.68} {'loss': 0.8368, 'learning_rate': 1.4835254839317247e-05, 'epoch': 0.68} {'loss': 0.5376, 'learning_rate': 1.4834968296016973e-05, 'epoch': 0.68} {'loss': 0.9336, 'learning_rate': 1.4834681747535595e-05, 'epoch': 0.68} {'loss': 0.9117, 'learning_rate': 1.4834395193873417e-05, 'epoch': 0.68} {'loss': 0.8417, 'learning_rate': 1.4834108635030749e-05, 'epoch': 0.68} {'loss': 0.7806, 'learning_rate': 1.4833822071007895e-05, 'epoch': 0.68} {'loss': 0.7787, 'learning_rate': 1.483353550180517e-05, 'epoch': 0.68} {'loss': 0.9617, 'learning_rate': 1.483324892742287e-05, 'epoch': 0.68} {'loss': 0.8135, 'learning_rate': 1.483296234786131e-05, 'epoch': 0.68} {'loss': 0.7634, 'learning_rate': 1.4832675763120794e-05, 'epoch': 0.68} {'loss': 0.8249, 'learning_rate': 1.4832389173201631e-05, 'epoch': 0.68} {'loss': 0.8898, 'learning_rate': 1.4832102578104124e-05, 'epoch': 0.68} {'loss': 0.752, 'learning_rate': 1.4831815977828587e-05, 'epoch': 0.68} {'loss': 0.837, 'learning_rate': 1.4831529372375322e-05, 'epoch': 0.68} {'loss': 0.9267, 'learning_rate': 1.4831242761744635e-05, 'epoch': 0.68} {'loss': 0.8823, 'learning_rate': 1.4830956145936837e-05, 'epoch': 0.68} {'loss': 0.8571, 'learning_rate': 1.4830669524952232e-05, 'epoch': 0.68} {'loss': 0.6751, 'learning_rate': 1.483038289879113e-05, 'epoch': 0.68} {'loss': 0.9919, 'learning_rate': 1.4830096267453836e-05, 'epoch': 0.68} {'loss': 0.7329, 'learning_rate': 1.482980963094066e-05, 'epoch': 0.68} {'loss': 0.8626, 'learning_rate': 1.4829522989251903e-05, 'epoch': 0.68} {'loss': 0.7449, 'learning_rate': 1.4829236342387879e-05, 'epoch': 0.68} {'loss': 0.9459, 'learning_rate': 1.4828949690348893e-05, 'epoch': 0.68} {'loss': 0.9185, 'learning_rate': 1.4828663033135251e-05, 'epoch': 0.68} {'loss': 0.796, 'learning_rate': 1.4828376370747259e-05, 'epoch': 0.68} {'loss': 0.7163, 'learning_rate': 1.4828089703185229e-05, 'epoch': 0.68} {'loss': 0.729, 'learning_rate': 1.4827803030449461e-05, 'epoch': 0.68} {'loss': 0.7242, 'learning_rate': 1.4827516352540268e-05, 'epoch': 0.68} {'loss': 0.6601, 'learning_rate': 1.4827229669457957e-05, 'epoch': 0.68} {'loss': 0.7515, 'learning_rate': 1.4826942981202832e-05, 'epoch': 0.68} {'loss': 0.7662, 'learning_rate': 1.4826656287775203e-05, 'epoch': 0.68} {'loss': 0.8014, 'learning_rate': 1.4826369589175377e-05, 'epoch': 0.68} {'loss': 0.8613, 'learning_rate': 1.482608288540366e-05, 'epoch': 0.68} {'loss': 0.7857, 'learning_rate': 1.4825796176460358e-05, 'epoch': 0.68} {'loss': 0.8906, 'learning_rate': 1.4825509462345779e-05, 'epoch': 0.68} {'loss': 0.8734, 'learning_rate': 1.4825222743060238e-05, 'epoch': 0.68} {'loss': 0.8867, 'learning_rate': 1.4824936018604028e-05, 'epoch': 0.68} {'loss': 0.8685, 'learning_rate': 1.4824649288977465e-05, 'epoch': 0.68} {'loss': 0.7361, 'learning_rate': 1.4824362554180856e-05, 'epoch': 0.68} {'loss': 0.6969, 'learning_rate': 1.4824075814214508e-05, 'epoch': 0.68} {'loss': 0.6863, 'learning_rate': 1.4823789069078725e-05, 'epoch': 0.68} {'loss': 1.005, 'learning_rate': 1.4823502318773818e-05, 'epoch': 0.68} {'loss': 0.8948, 'learning_rate': 1.4823215563300092e-05, 'epoch': 0.68} {'loss': 0.7014, 'learning_rate': 1.4822928802657855e-05, 'epoch': 0.68} {'loss': 0.7743, 'learning_rate': 1.4822642036847416e-05, 'epoch': 0.68} {'loss': 0.8354, 'learning_rate': 1.4822355265869082e-05, 'epoch': 0.68} {'loss': 0.9295, 'learning_rate': 1.4822068489723153e-05, 'epoch': 0.68} {'loss': 0.924, 'learning_rate': 1.4821781708409948e-05, 'epoch': 0.68} {'loss': 0.87, 'learning_rate': 1.4821494921929766e-05, 'epoch': 0.68} {'loss': 0.7892, 'learning_rate': 1.482120813028292e-05, 'epoch': 0.68} {'loss': 0.873, 'learning_rate': 1.4820921333469715e-05, 'epoch': 0.68} {'loss': 0.7468, 'learning_rate': 1.4820634531490455e-05, 'epoch': 0.68} {'loss': 0.8714, 'learning_rate': 1.4820347724345449e-05, 'epoch': 0.68} {'loss': 0.6827, 'learning_rate': 1.4820060912035006e-05, 'epoch': 0.68} {'loss': 0.7556, 'learning_rate': 1.4819774094559433e-05, 'epoch': 0.68} {'loss': 0.7375, 'learning_rate': 1.4819487271919037e-05, 'epoch': 0.68} {'loss': 1.0212, 'learning_rate': 1.4819200444114127e-05, 'epoch': 0.68} {'loss': 1.0128, 'learning_rate': 1.4818913611145009e-05, 'epoch': 0.68} {'loss': 0.7815, 'learning_rate': 1.4818626773011988e-05, 'epoch': 0.68} {'loss': 0.7666, 'learning_rate': 1.4818339929715376e-05, 'epoch': 0.68} {'loss': 0.796, 'learning_rate': 1.4818053081255475e-05, 'epoch': 0.68} {'loss': 0.7499, 'learning_rate': 1.4817766227632592e-05, 'epoch': 0.68} {'loss': 0.887, 'learning_rate': 1.4817479368847044e-05, 'epoch': 0.68} {'loss': 1.0092, 'learning_rate': 1.4817192504899132e-05, 'epoch': 0.68} {'loss': 0.805, 'learning_rate': 1.4816905635789163e-05, 'epoch': 0.68} {'loss': 0.8432, 'learning_rate': 1.481661876151744e-05, 'epoch': 0.68} {'loss': 0.8768, 'learning_rate': 1.481633188208428e-05, 'epoch': 0.68} {'loss': 0.9944, 'learning_rate': 1.4816044997489984e-05, 'epoch': 0.68} {'loss': 0.8938, 'learning_rate': 1.481575810773486e-05, 'epoch': 0.68} {'loss': 0.8442, 'learning_rate': 1.481547121281922e-05, 'epoch': 0.68} {'loss': 0.65, 'learning_rate': 1.4815184312743364e-05, 'epoch': 0.68} {'loss': 0.9502, 'learning_rate': 1.481489740750761e-05, 'epoch': 0.68} {'loss': 0.9386, 'learning_rate': 1.4814610497112252e-05, 'epoch': 0.68} {'loss': 0.8476, 'learning_rate': 1.4814323581557607e-05, 'epoch': 0.68} {'loss': 0.9314, 'learning_rate': 1.4814036660843978e-05, 'epoch': 0.68} {'loss': 0.8236, 'learning_rate': 1.4813749734971677e-05, 'epoch': 0.68} {'loss': 0.8139, 'learning_rate': 1.4813462803941006e-05, 'epoch': 0.68} {'loss': 0.7056, 'learning_rate': 1.4813175867752278e-05, 'epoch': 0.68} {'loss': 0.837, 'learning_rate': 1.4812888926405795e-05, 'epoch': 0.68} {'loss': 0.8488, 'learning_rate': 1.4812601979901868e-05, 'epoch': 0.68} {'loss': 0.8216, 'learning_rate': 1.4812315028240805e-05, 'epoch': 0.68} {'loss': 0.9284, 'learning_rate': 1.4812028071422909e-05, 'epoch': 0.68} {'loss': 0.803, 'learning_rate': 1.4811741109448495e-05, 'epoch': 0.68} {'loss': 0.852, 'learning_rate': 1.481145414231786e-05, 'epoch': 0.68} {'loss': 0.7654, 'learning_rate': 1.4811167170031325e-05, 'epoch': 0.68} {'loss': 0.8326, 'learning_rate': 1.4810880192589186e-05, 'epoch': 0.68} {'loss': 0.7878, 'learning_rate': 1.4810593209991756e-05, 'epoch': 0.68} {'loss': 0.8544, 'learning_rate': 1.4810306222239337e-05, 'epoch': 0.68} {'loss': 0.7532, 'learning_rate': 1.4810019229332247e-05, 'epoch': 0.68} {'loss': 0.7615, 'learning_rate': 1.4809732231270782e-05, 'epoch': 0.68} {'loss': 0.8408, 'learning_rate': 1.4809445228055256e-05, 'epoch': 0.68} {'loss': 0.7734, 'learning_rate': 1.4809158219685978e-05, 'epoch': 0.68} {'loss': 0.8479, 'learning_rate': 1.4808871206163251e-05, 'epoch': 0.68} {'loss': 0.8117, 'learning_rate': 1.4808584187487386e-05, 'epoch': 0.68} {'loss': 0.7675, 'learning_rate': 1.4808297163658687e-05, 'epoch': 0.68} {'loss': 0.8015, 'learning_rate': 1.4808010134677465e-05, 'epoch': 0.68} {'loss': 0.6817, 'learning_rate': 1.4807723100544024e-05, 'epoch': 0.68} {'loss': 0.7957, 'learning_rate': 1.4807436061258675e-05, 'epoch': 0.68} {'loss': 0.7472, 'learning_rate': 1.4807149016821727e-05, 'epoch': 0.68} {'loss': 0.9122, 'learning_rate': 1.480686196723348e-05, 'epoch': 0.68} {'loss': 0.7874, 'learning_rate': 1.480657491249425e-05, 'epoch': 0.68} {'loss': 0.8155, 'learning_rate': 1.4806287852604342e-05, 'epoch': 0.68} {'loss': 0.7312, 'learning_rate': 1.480600078756406e-05, 'epoch': 0.68} {'loss': 0.7804, 'learning_rate': 1.4805713717373716e-05, 'epoch': 0.68} {'loss': 0.7863, 'learning_rate': 1.4805426642033615e-05, 'epoch': 0.68} {'loss': 0.9461, 'learning_rate': 1.4805139561544067e-05, 'epoch': 0.69} {'loss': 0.979, 'learning_rate': 1.4804852475905378e-05, 'epoch': 0.69} {'loss': 0.732, 'learning_rate': 1.4804565385117858e-05, 'epoch': 0.69} {'loss': 0.8122, 'learning_rate': 1.4804278289181808e-05, 'epoch': 0.69} {'loss': 0.8511, 'learning_rate': 1.4803991188097542e-05, 'epoch': 0.69} {'loss': 0.7561, 'learning_rate': 1.4803704081865365e-05, 'epoch': 0.69} {'loss': 0.82, 'learning_rate': 1.4803416970485587e-05, 'epoch': 0.69} {'loss': 0.8276, 'learning_rate': 1.4803129853958514e-05, 'epoch': 0.69} {'loss': 0.8628, 'learning_rate': 1.4802842732284455e-05, 'epoch': 0.69} {'loss': 0.7542, 'learning_rate': 1.4802555605463713e-05, 'epoch': 0.69} {'loss': 0.7559, 'learning_rate': 1.4802268473496601e-05, 'epoch': 0.69} {'loss': 0.787, 'learning_rate': 1.4801981336383427e-05, 'epoch': 0.69} {'loss': 0.801, 'learning_rate': 1.4801694194124494e-05, 'epoch': 0.69} {'loss': 0.8609, 'learning_rate': 1.4801407046720112e-05, 'epoch': 0.69} {'loss': 0.7481, 'learning_rate': 1.4801119894170593e-05, 'epoch': 0.69} {'loss': 0.9287, 'learning_rate': 1.4800832736476238e-05, 'epoch': 0.69} {'loss': 0.8782, 'learning_rate': 1.4800545573637358e-05, 'epoch': 0.69} {'loss': 0.7706, 'learning_rate': 1.4800258405654258e-05, 'epoch': 0.69} {'loss': 0.7207, 'learning_rate': 1.4799971232527245e-05, 'epoch': 0.69} {'loss': 0.9423, 'learning_rate': 1.4799684054256636e-05, 'epoch': 0.69} {'loss': 0.7902, 'learning_rate': 1.479939687084273e-05, 'epoch': 0.69} {'loss': 0.8744, 'learning_rate': 1.4799109682285839e-05, 'epoch': 0.69} {'loss': 0.8058, 'learning_rate': 1.4798822488586266e-05, 'epoch': 0.69} {'loss': 0.8796, 'learning_rate': 1.4798535289744323e-05, 'epoch': 0.69} {'loss': 0.899, 'learning_rate': 1.4798248085760315e-05, 'epoch': 0.69} {'loss': 0.8775, 'learning_rate': 1.4797960876634552e-05, 'epoch': 0.69} {'loss': 0.8875, 'learning_rate': 1.479767366236734e-05, 'epoch': 0.69} {'loss': 0.9457, 'learning_rate': 1.4797386442958992e-05, 'epoch': 0.69} {'loss': 0.751, 'learning_rate': 1.4797099218409807e-05, 'epoch': 0.69} {'loss': 0.8837, 'learning_rate': 1.47968119887201e-05, 'epoch': 0.69} {'loss': 0.869, 'learning_rate': 1.4796524753890174e-05, 'epoch': 0.69} {'loss': 0.8045, 'learning_rate': 1.4796237513920338e-05, 'epoch': 0.69} {'loss': 0.85, 'learning_rate': 1.4795950268810902e-05, 'epoch': 0.69} {'loss': 0.7799, 'learning_rate': 1.4795663018562171e-05, 'epoch': 0.69} {'loss': 1.0252, 'learning_rate': 1.4795375763174455e-05, 'epoch': 0.69} {'loss': 0.7912, 'learning_rate': 1.4795088502648062e-05, 'epoch': 0.69} {'loss': 0.9166, 'learning_rate': 1.47948012369833e-05, 'epoch': 0.69} {'loss': 0.9015, 'learning_rate': 1.4794513966180472e-05, 'epoch': 0.69} {'loss': 0.7476, 'learning_rate': 1.4794226690239892e-05, 'epoch': 0.69} {'loss': 0.629, 'learning_rate': 1.4793939409161866e-05, 'epoch': 0.69} {'loss': 0.8589, 'learning_rate': 1.4793652122946701e-05, 'epoch': 0.69} {'loss': 0.7769, 'learning_rate': 1.4793364831594702e-05, 'epoch': 0.69} {'loss': 0.8927, 'learning_rate': 1.4793077535106184e-05, 'epoch': 0.69} {'loss': 0.7865, 'learning_rate': 1.4792790233481448e-05, 'epoch': 0.69} {'loss': 1.0443, 'learning_rate': 1.4792502926720806e-05, 'epoch': 0.69} {'loss': 0.7949, 'learning_rate': 1.4792215614824563e-05, 'epoch': 0.69} {'loss': 0.888, 'learning_rate': 1.4791928297793031e-05, 'epoch': 0.69} {'loss': 0.97, 'learning_rate': 1.4791640975626515e-05, 'epoch': 0.69} {'loss': 0.8663, 'learning_rate': 1.4791353648325323e-05, 'epoch': 0.69} {'loss': 0.8855, 'learning_rate': 1.4791066315889762e-05, 'epoch': 0.69} {'loss': 0.8442, 'learning_rate': 1.4790778978320141e-05, 'epoch': 0.69} {'loss': 0.8859, 'learning_rate': 1.4790491635616768e-05, 'epoch': 0.69} {'loss': 0.8165, 'learning_rate': 1.4790204287779952e-05, 'epoch': 0.69} {'loss': 0.9489, 'learning_rate': 1.478991693481e-05, 'epoch': 0.69} {'loss': 0.8329, 'learning_rate': 1.4789629576707218e-05, 'epoch': 0.69} {'loss': 0.8606, 'learning_rate': 1.4789342213471917e-05, 'epoch': 0.69} {'loss': 0.8873, 'learning_rate': 1.4789054845104402e-05, 'epoch': 0.69} {'loss': 0.7852, 'learning_rate': 1.4788767471604983e-05, 'epoch': 0.69} {'loss': 0.9367, 'learning_rate': 1.478848009297397e-05, 'epoch': 0.69} {'loss': 0.8333, 'learning_rate': 1.4788192709211666e-05, 'epoch': 0.69} {'loss': 0.8781, 'learning_rate': 1.478790532031838e-05, 'epoch': 0.69} {'loss': 0.6824, 'learning_rate': 1.4787617926294422e-05, 'epoch': 0.69} {'loss': 0.7057, 'learning_rate': 1.4787330527140103e-05, 'epoch': 0.69} {'loss': 0.9378, 'learning_rate': 1.4787043122855722e-05, 'epoch': 0.69} {'loss': 0.8941, 'learning_rate': 1.4786755713441597e-05, 'epoch': 0.69} {'loss': 0.9811, 'learning_rate': 1.478646829889803e-05, 'epoch': 0.69} {'loss': 0.8656, 'learning_rate': 1.4786180879225327e-05, 'epoch': 0.69} {'loss': 0.8873, 'learning_rate': 1.47858934544238e-05, 'epoch': 0.69} {'loss': 0.666, 'learning_rate': 1.4785606024493758e-05, 'epoch': 0.69} {'loss': 0.8424, 'learning_rate': 1.478531858943551e-05, 'epoch': 0.69} {'loss': 0.7678, 'learning_rate': 1.4785031149249356e-05, 'epoch': 0.69} {'loss': 0.7469, 'learning_rate': 1.4784743703935611e-05, 'epoch': 0.69} {'loss': 0.7558, 'learning_rate': 1.4784456253494583e-05, 'epoch': 0.69} {'loss': 0.8474, 'learning_rate': 1.4784168797926575e-05, 'epoch': 0.69} {'loss': 0.9177, 'learning_rate': 1.47838813372319e-05, 'epoch': 0.69} {'loss': 0.7266, 'learning_rate': 1.4783593871410863e-05, 'epoch': 0.69} {'loss': 0.9883, 'learning_rate': 1.4783306400463777e-05, 'epoch': 0.69} {'loss': 0.8764, 'learning_rate': 1.4783018924390947e-05, 'epoch': 0.69} {'loss': 0.6868, 'learning_rate': 1.4782731443192678e-05, 'epoch': 0.69} {'loss': 0.8141, 'learning_rate': 1.4782443956869278e-05, 'epoch': 0.69} {'loss': 0.8909, 'learning_rate': 1.478215646542106e-05, 'epoch': 0.69} {'loss': 0.7534, 'learning_rate': 1.4781868968848329e-05, 'epoch': 0.69} {'loss': 0.8106, 'learning_rate': 1.4781581467151395e-05, 'epoch': 0.69} {'loss': 1.0011, 'learning_rate': 1.4781293960330564e-05, 'epoch': 0.69} {'loss': 0.7748, 'learning_rate': 1.4781006448386148e-05, 'epoch': 0.69} {'loss': 0.6148, 'learning_rate': 1.478071893131845e-05, 'epoch': 0.69} {'loss': 0.79, 'learning_rate': 1.478043140912778e-05, 'epoch': 0.69} {'loss': 0.8468, 'learning_rate': 1.4780143881814445e-05, 'epoch': 0.69} {'loss': 0.6965, 'learning_rate': 1.4779856349378755e-05, 'epoch': 0.69} {'loss': 0.8908, 'learning_rate': 1.477956881182102e-05, 'epoch': 0.69} {'loss': 0.9769, 'learning_rate': 1.4779281269141543e-05, 'epoch': 0.69} {'loss': 0.9924, 'learning_rate': 1.4778993721340635e-05, 'epoch': 0.69} {'loss': 0.7241, 'learning_rate': 1.4778706168418605e-05, 'epoch': 0.69} {'loss': 0.8984, 'learning_rate': 1.4778418610375758e-05, 'epoch': 0.69} {'loss': 0.8182, 'learning_rate': 1.4778131047212405e-05, 'epoch': 0.69} {'loss': 0.924, 'learning_rate': 1.4777843478928854e-05, 'epoch': 0.69} {'loss': 1.0201, 'learning_rate': 1.4777555905525413e-05, 'epoch': 0.69} {'loss': 0.8784, 'learning_rate': 1.4777268327002393e-05, 'epoch': 0.69} {'loss': 0.7968, 'learning_rate': 1.4776980743360092e-05, 'epoch': 0.69} {'loss': 0.898, 'learning_rate': 1.4776693154598827e-05, 'epoch': 0.69} {'loss': 0.833, 'learning_rate': 1.4776405560718904e-05, 'epoch': 0.69} {'loss': 0.7097, 'learning_rate': 1.4776117961720633e-05, 'epoch': 0.69} {'loss': 0.8136, 'learning_rate': 1.4775830357604322e-05, 'epoch': 0.69} {'loss': 0.8142, 'learning_rate': 1.4775542748370274e-05, 'epoch': 0.69} {'loss': 0.7591, 'learning_rate': 1.4775255134018804e-05, 'epoch': 0.69} {'loss': 0.7897, 'learning_rate': 1.4774967514550213e-05, 'epoch': 0.69} {'loss': 0.8994, 'learning_rate': 1.4774679889964816e-05, 'epoch': 0.69} {'loss': 0.7077, 'learning_rate': 1.477439226026292e-05, 'epoch': 0.69} {'loss': 0.7003, 'learning_rate': 1.477410462544483e-05, 'epoch': 0.69} {'loss': 0.8618, 'learning_rate': 1.4773816985510857e-05, 'epoch': 0.69} {'loss': 0.8587, 'learning_rate': 1.4773529340461306e-05, 'epoch': 0.69} {'loss': 0.7648, 'learning_rate': 1.4773241690296492e-05, 'epoch': 0.69} {'loss': 0.8477, 'learning_rate': 1.4772954035016716e-05, 'epoch': 0.69} {'loss': 0.775, 'learning_rate': 1.4772666374622287e-05, 'epoch': 0.69} {'loss': 0.9332, 'learning_rate': 1.4772378709113516e-05, 'epoch': 0.69} {'loss': 0.6742, 'learning_rate': 1.4772091038490713e-05, 'epoch': 0.69} {'loss': 0.9175, 'learning_rate': 1.477180336275418e-05, 'epoch': 0.69} {'loss': 0.712, 'learning_rate': 1.4771515681904232e-05, 'epoch': 0.69} {'loss': 0.8436, 'learning_rate': 1.4771227995941176e-05, 'epoch': 0.69} {'loss': 0.7314, 'learning_rate': 1.4770940304865314e-05, 'epoch': 0.69} {'loss': 0.8061, 'learning_rate': 1.477065260867696e-05, 'epoch': 0.69} {'loss': 0.8214, 'learning_rate': 1.4770364907376425e-05, 'epoch': 0.69} {'loss': 0.9836, 'learning_rate': 1.4770077200964008e-05, 'epoch': 0.69} {'loss': 0.8472, 'learning_rate': 1.4769789489440025e-05, 'epoch': 0.69} {'loss': 0.7919, 'learning_rate': 1.4769501772804785e-05, 'epoch': 0.69} {'loss': 0.7032, 'learning_rate': 1.476921405105859e-05, 'epoch': 0.69} {'loss': 1.1005, 'learning_rate': 1.4768926324201752e-05, 'epoch': 0.69} {'loss': 0.8305, 'learning_rate': 1.4768638592234581e-05, 'epoch': 0.69} {'loss': 0.8328, 'learning_rate': 1.4768350855157381e-05, 'epoch': 0.69} {'loss': 0.8054, 'learning_rate': 1.476806311297046e-05, 'epoch': 0.69} {'loss': 0.6888, 'learning_rate': 1.4767775365674133e-05, 'epoch': 0.69} {'loss': 1.0072, 'learning_rate': 1.4767487613268705e-05, 'epoch': 0.69} {'loss': 0.7663, 'learning_rate': 1.4767199855754482e-05, 'epoch': 0.69} {'loss': 0.8437, 'learning_rate': 1.4766912093131776e-05, 'epoch': 0.69} {'loss': 0.8113, 'learning_rate': 1.4766624325400894e-05, 'epoch': 0.69} {'loss': 0.7879, 'learning_rate': 1.476633655256214e-05, 'epoch': 0.69} {'loss': 0.8345, 'learning_rate': 1.4766048774615827e-05, 'epoch': 0.69} {'loss': 0.9156, 'learning_rate': 1.4765760991562263e-05, 'epoch': 0.69} {'loss': 0.9861, 'learning_rate': 1.476547320340176e-05, 'epoch': 0.69} {'loss': 0.7049, 'learning_rate': 1.4765185410134616e-05, 'epoch': 0.69} {'loss': 0.7641, 'learning_rate': 1.476489761176115e-05, 'epoch': 0.69} {'loss': 0.8502, 'learning_rate': 1.4764609808281666e-05, 'epoch': 0.69} {'loss': 0.7823, 'learning_rate': 1.4764321999696471e-05, 'epoch': 0.69} {'loss': 0.6506, 'learning_rate': 1.4764034186005875e-05, 'epoch': 0.69} {'loss': 0.9636, 'learning_rate': 1.4763746367210185e-05, 'epoch': 0.69} {'loss': 0.7669, 'learning_rate': 1.4763458543309714e-05, 'epoch': 0.69} {'loss': 0.8341, 'learning_rate': 1.4763170714304769e-05, 'epoch': 0.69} {'loss': 0.8324, 'learning_rate': 1.4762882880195652e-05, 'epoch': 0.69} {'loss': 0.7257, 'learning_rate': 1.4762595040982677e-05, 'epoch': 0.69} {'loss': 0.6751, 'learning_rate': 1.4762307196666153e-05, 'epoch': 0.69} {'loss': 0.7739, 'learning_rate': 1.4762019347246384e-05, 'epoch': 0.69} {'loss': 0.7394, 'learning_rate': 1.4761731492723683e-05, 'epoch': 0.69} {'loss': 0.8188, 'learning_rate': 1.4761443633098361e-05, 'epoch': 0.69} {'loss': 1.0338, 'learning_rate': 1.4761155768370719e-05, 'epoch': 0.69} {'loss': 0.7137, 'learning_rate': 1.476086789854107e-05, 'epoch': 0.69} {'loss': 0.8398, 'learning_rate': 1.4760580023609718e-05, 'epoch': 0.69} {'loss': 0.7412, 'learning_rate': 1.4760292143576977e-05, 'epoch': 0.69} {'loss': 0.7291, 'learning_rate': 1.4760004258443153e-05, 'epoch': 0.69} {'loss': 0.9523, 'learning_rate': 1.4759716368208557e-05, 'epoch': 0.69} {'loss': 0.7127, 'learning_rate': 1.4759428472873491e-05, 'epoch': 0.69} {'loss': 0.6959, 'learning_rate': 1.4759140572438273e-05, 'epoch': 0.69} {'loss': 0.7783, 'learning_rate': 1.4758852666903203e-05, 'epoch': 0.69} {'loss': 0.7608, 'learning_rate': 1.4758564756268594e-05, 'epoch': 0.69} {'loss': 0.7988, 'learning_rate': 1.4758276840534751e-05, 'epoch': 0.69} {'loss': 0.6738, 'learning_rate': 1.4757988919701986e-05, 'epoch': 0.69} {'loss': 0.8273, 'learning_rate': 1.475770099377061e-05, 'epoch': 0.69} {'loss': 0.8497, 'learning_rate': 1.4757413062740924e-05, 'epoch': 0.69} {'loss': 0.7231, 'learning_rate': 1.4757125126613243e-05, 'epoch': 0.69} {'loss': 0.8039, 'learning_rate': 1.4756837185387874e-05, 'epoch': 0.69} {'loss': 0.8061, 'learning_rate': 1.475654923906512e-05, 'epoch': 0.69} {'loss': 0.8698, 'learning_rate': 1.4756261287645295e-05, 'epoch': 0.69} {'loss': 0.8934, 'learning_rate': 1.4755973331128712e-05, 'epoch': 0.69} {'loss': 0.9278, 'learning_rate': 1.475568536951567e-05, 'epoch': 0.69} {'loss': 0.9028, 'learning_rate': 1.4755397402806484e-05, 'epoch': 0.69} {'loss': 0.7433, 'learning_rate': 1.4755109431001458e-05, 'epoch': 0.69} {'loss': 0.8771, 'learning_rate': 1.4754821454100903e-05, 'epoch': 0.69} {'loss': 0.7497, 'learning_rate': 1.4754533472105129e-05, 'epoch': 0.69} {'loss': 0.7481, 'learning_rate': 1.4754245485014442e-05, 'epoch': 0.69} {'loss': 0.8176, 'learning_rate': 1.4753957492829155e-05, 'epoch': 0.69} {'loss': 0.6277, 'learning_rate': 1.4753669495549573e-05, 'epoch': 0.69} {'loss': 0.8309, 'learning_rate': 1.4753381493176002e-05, 'epoch': 0.69} {'loss': 0.8131, 'learning_rate': 1.4753093485708757e-05, 'epoch': 0.69} {'loss': 0.8347, 'learning_rate': 1.475280547314814e-05, 'epoch': 0.69} {'loss': 0.876, 'learning_rate': 1.4752517455494464e-05, 'epoch': 0.69} {'loss': 0.7144, 'learning_rate': 1.4752229432748037e-05, 'epoch': 0.69} {'loss': 0.8766, 'learning_rate': 1.475194140490917e-05, 'epoch': 0.69} {'loss': 0.7941, 'learning_rate': 1.4751653371978162e-05, 'epoch': 0.69} {'loss': 0.7451, 'learning_rate': 1.4751365333955337e-05, 'epoch': 0.69} {'loss': 0.7097, 'learning_rate': 1.4751077290840989e-05, 'epoch': 0.69} {'loss': 0.6733, 'learning_rate': 1.4750789242635435e-05, 'epoch': 0.69} {'loss': 0.8386, 'learning_rate': 1.4750501189338984e-05, 'epoch': 0.69} {'loss': 0.7144, 'learning_rate': 1.4750213130951938e-05, 'epoch': 0.69} {'loss': 0.801, 'learning_rate': 1.4749925067474612e-05, 'epoch': 0.69} {'loss': 0.8386, 'learning_rate': 1.474963699890731e-05, 'epoch': 0.69} {'loss': 0.7866, 'learning_rate': 1.4749348925250346e-05, 'epoch': 0.69} {'loss': 0.947, 'learning_rate': 1.4749060846504026e-05, 'epoch': 0.69} {'loss': 0.8289, 'learning_rate': 1.4748772762668657e-05, 'epoch': 0.69} {'loss': 0.7102, 'learning_rate': 1.4748484673744554e-05, 'epoch': 0.69} {'loss': 0.9174, 'learning_rate': 1.4748196579732015e-05, 'epoch': 0.69} {'loss': 0.645, 'learning_rate': 1.4747908480631358e-05, 'epoch': 0.69} {'loss': 0.9179, 'learning_rate': 1.4747620376442888e-05, 'epoch': 0.69} {'loss': 0.8948, 'learning_rate': 1.4747332267166913e-05, 'epoch': 0.69} {'loss': 0.8071, 'learning_rate': 1.4747044152803748e-05, 'epoch': 0.69} {'loss': 0.7876, 'learning_rate': 1.4746756033353693e-05, 'epoch': 0.69} {'loss': 0.8995, 'learning_rate': 1.474646790881706e-05, 'epoch': 0.69} {'loss': 0.7996, 'learning_rate': 1.4746179779194157e-05, 'epoch': 0.69} {'loss': 0.8618, 'learning_rate': 1.4745891644485295e-05, 'epoch': 0.69} {'loss': 0.8542, 'learning_rate': 1.4745603504690785e-05, 'epoch': 0.69} {'loss': 0.6222, 'learning_rate': 1.4745315359810928e-05, 'epoch': 0.69} {'loss': 0.7582, 'learning_rate': 1.474502720984604e-05, 'epoch': 0.69} {'loss': 0.7285, 'learning_rate': 1.4744739054796426e-05, 'epoch': 0.69} {'loss': 1.0029, 'learning_rate': 1.4744450894662397e-05, 'epoch': 0.69} {'loss': 0.7357, 'learning_rate': 1.4744162729444259e-05, 'epoch': 0.69} {'loss': 0.9896, 'learning_rate': 1.4743874559142322e-05, 'epoch': 0.69} {'loss': 0.7468, 'learning_rate': 1.4743586383756898e-05, 'epoch': 0.69} {'loss': 0.6896, 'learning_rate': 1.4743298203288295e-05, 'epoch': 0.69} {'loss': 0.8187, 'learning_rate': 1.4743010017736814e-05, 'epoch': 0.69} {'loss': 0.8476, 'learning_rate': 1.4742721827102773e-05, 'epoch': 0.69} {'loss': 0.8095, 'learning_rate': 1.4742433631386475e-05, 'epoch': 0.69} {'loss': 0.8575, 'learning_rate': 1.4742145430588234e-05, 'epoch': 0.69} {'loss': 0.812, 'learning_rate': 1.4741857224708353e-05, 'epoch': 0.69} {'loss': 0.7266, 'learning_rate': 1.4741569013747148e-05, 'epoch': 0.69} {'loss': 0.6711, 'learning_rate': 1.4741280797704924e-05, 'epoch': 0.69} {'loss': 0.845, 'learning_rate': 1.4740992576581988e-05, 'epoch': 0.69} {'loss': 0.9262, 'learning_rate': 1.4740704350378647e-05, 'epoch': 0.69} {'loss': 0.7193, 'learning_rate': 1.4740416119095218e-05, 'epoch': 0.69} {'loss': 0.8043, 'learning_rate': 1.4740127882732003e-05, 'epoch': 0.69} {'loss': 0.8293, 'learning_rate': 1.4739839641289313e-05, 'epoch': 0.69} {'loss': 0.9561, 'learning_rate': 1.473955139476746e-05, 'epoch': 0.69} {'loss': 0.7185, 'learning_rate': 1.4739263143166749e-05, 'epoch': 0.69} {'loss': 0.7285, 'learning_rate': 1.4738974886487487e-05, 'epoch': 0.69} {'loss': 0.9636, 'learning_rate': 1.4738686624729987e-05, 'epoch': 0.69} {'loss': 0.7531, 'learning_rate': 1.4738398357894558e-05, 'epoch': 0.69} {'loss': 0.7919, 'learning_rate': 1.4738110085981506e-05, 'epoch': 0.69} {'loss': 0.8315, 'learning_rate': 1.4737821808991145e-05, 'epoch': 0.69} {'loss': 0.707, 'learning_rate': 1.4737533526923775e-05, 'epoch': 0.69} {'loss': 0.9053, 'learning_rate': 1.4737245239779715e-05, 'epoch': 0.69} {'loss': 0.7333, 'learning_rate': 1.4736956947559264e-05, 'epoch': 0.69} {'loss': 0.9102, 'learning_rate': 1.473666865026274e-05, 'epoch': 0.69} {'loss': 0.8192, 'learning_rate': 1.4736380347890447e-05, 'epoch': 0.69} {'loss': 0.9828, 'learning_rate': 1.4736092040442693e-05, 'epoch': 0.69} {'loss': 0.7185, 'learning_rate': 1.4735803727919793e-05, 'epoch': 0.69} {'loss': 0.7936, 'learning_rate': 1.4735515410322047e-05, 'epoch': 0.69} {'loss': 0.8187, 'learning_rate': 1.4735227087649775e-05, 'epoch': 0.69} {'loss': 0.7455, 'learning_rate': 1.4734938759903275e-05, 'epoch': 0.69} {'loss': 0.8556, 'learning_rate': 1.4734650427082861e-05, 'epoch': 0.69} {'loss': 0.7779, 'learning_rate': 1.4734362089188843e-05, 'epoch': 0.69} {'loss': 0.9084, 'learning_rate': 1.4734073746221528e-05, 'epoch': 0.69} {'loss': 0.8641, 'learning_rate': 1.4733785398181227e-05, 'epoch': 0.69} {'loss': 0.8067, 'learning_rate': 1.4733497045068249e-05, 'epoch': 0.69} {'loss': 0.8373, 'learning_rate': 1.4733208686882898e-05, 'epoch': 0.69} {'loss': 0.8274, 'learning_rate': 1.4732920323625487e-05, 'epoch': 0.69} {'loss': 0.8863, 'learning_rate': 1.4732631955296326e-05, 'epoch': 0.69} {'loss': 0.7675, 'learning_rate': 1.4732343581895725e-05, 'epoch': 0.69} {'loss': 0.8758, 'learning_rate': 1.4732055203423988e-05, 'epoch': 0.69} {'loss': 0.858, 'learning_rate': 1.4731766819881425e-05, 'epoch': 0.69} {'loss': 0.6871, 'learning_rate': 1.473147843126835e-05, 'epoch': 0.69} {'loss': 0.9084, 'learning_rate': 1.4731190037585068e-05, 'epoch': 0.69} {'loss': 0.9036, 'learning_rate': 1.4730901638831889e-05, 'epoch': 0.69} {'loss': 0.7398, 'learning_rate': 1.4730613235009123e-05, 'epoch': 0.69} {'loss': 0.7794, 'learning_rate': 1.4730324826117075e-05, 'epoch': 0.69} {'loss': 0.6412, 'learning_rate': 1.4730036412156059e-05, 'epoch': 0.69} {'loss': 0.7723, 'learning_rate': 1.472974799312638e-05, 'epoch': 0.69} {'loss': 0.8834, 'learning_rate': 1.4729459569028353e-05, 'epoch': 0.69} {'loss': 0.8908, 'learning_rate': 1.4729171139862279e-05, 'epoch': 0.69} {'loss': 0.7861, 'learning_rate': 1.4728882705628474e-05, 'epoch': 0.69} {'loss': 0.7237, 'learning_rate': 1.4728594266327245e-05, 'epoch': 0.69} {'loss': 0.9878, 'learning_rate': 1.47283058219589e-05, 'epoch': 0.69} {'loss': 0.8774, 'learning_rate': 1.4728017372523744e-05, 'epoch': 0.69} {'loss': 0.92, 'learning_rate': 1.4727728918022095e-05, 'epoch': 0.69} {'loss': 0.9032, 'learning_rate': 1.4727440458454259e-05, 'epoch': 0.69} {'loss': 0.885, 'learning_rate': 1.4727151993820541e-05, 'epoch': 0.69} {'loss': 0.8979, 'learning_rate': 1.4726863524121255e-05, 'epoch': 0.69} {'loss': 0.8342, 'learning_rate': 1.4726575049356707e-05, 'epoch': 0.69} {'loss': 1.0685, 'learning_rate': 1.4726286569527207e-05, 'epoch': 0.69} {'loss': 0.8265, 'learning_rate': 1.4725998084633064e-05, 'epoch': 0.69} {'loss': 0.7961, 'learning_rate': 1.4725709594674587e-05, 'epoch': 0.69} {'loss': 0.8328, 'learning_rate': 1.4725421099652088e-05, 'epoch': 0.69} {'loss': 0.9589, 'learning_rate': 1.4725132599565873e-05, 'epoch': 0.69} {'loss': 0.6471, 'learning_rate': 1.472484409441625e-05, 'epoch': 0.69} {'loss': 0.7517, 'learning_rate': 1.4724555584203533e-05, 'epoch': 0.69} {'loss': 0.951, 'learning_rate': 1.4724267068928026e-05, 'epoch': 0.69} {'loss': 0.7189, 'learning_rate': 1.4723978548590041e-05, 'epoch': 0.69} {'loss': 0.8387, 'learning_rate': 1.4723690023189887e-05, 'epoch': 0.69} {'loss': 0.8057, 'learning_rate': 1.4723401492727873e-05, 'epoch': 0.69} {'loss': 0.9569, 'learning_rate': 1.4723112957204308e-05, 'epoch': 0.69} {'loss': 0.6651, 'learning_rate': 1.47228244166195e-05, 'epoch': 0.69} {'loss': 0.787, 'learning_rate': 1.472253587097376e-05, 'epoch': 0.69} {'loss': 0.7617, 'learning_rate': 1.4722247320267397e-05, 'epoch': 0.69} {'loss': 1.0245, 'learning_rate': 1.4721958764500719e-05, 'epoch': 0.69} {'loss': 0.8975, 'learning_rate': 1.4721670203674039e-05, 'epoch': 0.69} {'loss': 0.7576, 'learning_rate': 1.4721381637787661e-05, 'epoch': 0.69} {'loss': 0.9165, 'learning_rate': 1.4721093066841895e-05, 'epoch': 0.69} {'loss': 0.8903, 'learning_rate': 1.4720804490837055e-05, 'epoch': 0.69} {'loss': 0.8711, 'learning_rate': 1.4720515909773443e-05, 'epoch': 0.69} {'loss': 0.8363, 'learning_rate': 1.4720227323651374e-05, 'epoch': 0.69} {'loss': 0.9411, 'learning_rate': 1.4719938732471155e-05, 'epoch': 0.69} {'loss': 0.9353, 'learning_rate': 1.4719650136233097e-05, 'epoch': 0.69} {'loss': 0.7322, 'learning_rate': 1.4719361534937508e-05, 'epoch': 0.69} {'loss': 0.7572, 'learning_rate': 1.4719072928584694e-05, 'epoch': 0.69} {'loss': 0.7639, 'learning_rate': 1.471878431717497e-05, 'epoch': 0.69} {'loss': 0.6805, 'learning_rate': 1.4718495700708642e-05, 'epoch': 0.69} {'loss': 0.9106, 'learning_rate': 1.471820707918602e-05, 'epoch': 0.69} {'loss': 0.796, 'learning_rate': 1.4717918452607416e-05, 'epoch': 0.69} {'loss': 0.9675, 'learning_rate': 1.4717629820973134e-05, 'epoch': 0.69} {'loss': 0.7682, 'learning_rate': 1.4717341184283488e-05, 'epoch': 0.69} {'loss': 0.7687, 'learning_rate': 1.471705254253878e-05, 'epoch': 0.69} {'loss': 0.9803, 'learning_rate': 1.4716763895739327e-05, 'epoch': 0.69} {'loss': 0.6855, 'learning_rate': 1.4716475243885438e-05, 'epoch': 0.69} {'loss': 0.6806, 'learning_rate': 1.4716186586977417e-05, 'epoch': 0.69} {'loss': 0.5492, 'learning_rate': 1.4715897925015579e-05, 'epoch': 0.69} {'loss': 0.847, 'learning_rate': 1.4715609258000227e-05, 'epoch': 0.69} {'loss': 0.8728, 'learning_rate': 1.4715320585931681e-05, 'epoch': 0.69} {'loss': 0.7404, 'learning_rate': 1.4715031908810239e-05, 'epoch': 0.69} {'loss': 0.8006, 'learning_rate': 1.4714743226636212e-05, 'epoch': 0.69} {'loss': 0.7525, 'learning_rate': 1.4714454539409916e-05, 'epoch': 0.69} {'loss': 0.8588, 'learning_rate': 1.4714165847131657e-05, 'epoch': 0.69} {'loss': 0.8111, 'learning_rate': 1.4713877149801741e-05, 'epoch': 0.69} {'loss': 0.7887, 'learning_rate': 1.471358844742048e-05, 'epoch': 0.69} {'loss': 0.8456, 'learning_rate': 1.4713299739988185e-05, 'epoch': 0.69} {'loss': 0.9121, 'learning_rate': 1.4713011027505164e-05, 'epoch': 0.69} {'loss': 0.9306, 'learning_rate': 1.4712722309971725e-05, 'epoch': 0.69} {'loss': 0.8663, 'learning_rate': 1.4712433587388182e-05, 'epoch': 0.69} {'loss': 0.7679, 'learning_rate': 1.4712144859754838e-05, 'epoch': 0.69} {'loss': 0.938, 'learning_rate': 1.4711856127072007e-05, 'epoch': 0.69} {'loss': 0.9539, 'learning_rate': 1.4711567389339998e-05, 'epoch': 0.69} {'loss': 0.7756, 'learning_rate': 1.4711278646559114e-05, 'epoch': 0.69} {'loss': 0.8922, 'learning_rate': 1.4710989898729676e-05, 'epoch': 0.69} {'loss': 0.6796, 'learning_rate': 1.4710701145851983e-05, 'epoch': 0.69} {'loss': 0.9578, 'learning_rate': 1.4710412387926352e-05, 'epoch': 0.69} {'loss': 0.961, 'learning_rate': 1.4710123624953085e-05, 'epoch': 0.69} {'loss': 0.7411, 'learning_rate': 1.4709834856932496e-05, 'epoch': 0.69} {'loss': 0.7588, 'learning_rate': 1.4709546083864898e-05, 'epoch': 0.69} {'loss': 0.8299, 'learning_rate': 1.4709257305750594e-05, 'epoch': 0.69} {'loss': 1.0071, 'learning_rate': 1.4708968522589894e-05, 'epoch': 0.69} {'loss': 0.8683, 'learning_rate': 1.4708679734383111e-05, 'epoch': 0.69} {'loss': 0.6216, 'learning_rate': 1.4708390941130553e-05, 'epoch': 0.69} {'loss': 0.958, 'learning_rate': 1.4708102142832528e-05, 'epoch': 0.69} {'loss': 0.6447, 'learning_rate': 1.4707813339489346e-05, 'epoch': 0.69} {'loss': 0.8296, 'learning_rate': 1.4707524531101318e-05, 'epoch': 0.69} {'loss': 0.8526, 'learning_rate': 1.4707235717668752e-05, 'epoch': 0.69} {'loss': 0.803, 'learning_rate': 1.4706946899191961e-05, 'epoch': 0.69} {'loss': 0.9001, 'learning_rate': 1.470665807567125e-05, 'epoch': 0.69} {'loss': 0.7271, 'learning_rate': 1.4706369247106928e-05, 'epoch': 0.69} {'loss': 0.9345, 'learning_rate': 1.4706080413499306e-05, 'epoch': 0.69} {'loss': 0.9055, 'learning_rate': 1.4705791574848696e-05, 'epoch': 0.69} {'loss': 0.9202, 'learning_rate': 1.4705502731155408e-05, 'epoch': 0.69} {'loss': 0.6975, 'learning_rate': 1.470521388241975e-05, 'epoch': 0.69} {'loss': 1.0342, 'learning_rate': 1.4704925028642025e-05, 'epoch': 0.69} {'loss': 0.7905, 'learning_rate': 1.470463616982255e-05, 'epoch': 0.69} {'loss': 0.8873, 'learning_rate': 1.4704347305961632e-05, 'epoch': 0.69} {'loss': 0.8839, 'learning_rate': 1.4704058437059582e-05, 'epoch': 0.69} {'loss': 0.9057, 'learning_rate': 1.470376956311671e-05, 'epoch': 0.69} {'loss': 0.7507, 'learning_rate': 1.4703480684133325e-05, 'epoch': 0.69} {'loss': 0.8094, 'learning_rate': 1.4703191800109737e-05, 'epoch': 0.69} {'loss': 0.8352, 'learning_rate': 1.4702902911046251e-05, 'epoch': 0.69} {'loss': 0.8814, 'learning_rate': 1.4702614016943182e-05, 'epoch': 0.69} {'loss': 0.8461, 'learning_rate': 1.4702325117800836e-05, 'epoch': 0.69} {'loss': 0.6899, 'learning_rate': 1.4702036213619523e-05, 'epoch': 0.69} {'loss': 0.7649, 'learning_rate': 1.4701747304399559e-05, 'epoch': 0.69} {'loss': 1.0673, 'learning_rate': 1.4701458390141243e-05, 'epoch': 0.69} {'loss': 0.878, 'learning_rate': 1.4701169470844895e-05, 'epoch': 0.69} {'loss': 0.9129, 'learning_rate': 1.4700880546510816e-05, 'epoch': 0.69} {'loss': 0.8077, 'learning_rate': 1.470059161713932e-05, 'epoch': 0.69} {'loss': 0.917, 'learning_rate': 1.4700302682730713e-05, 'epoch': 0.69} {'loss': 0.6935, 'learning_rate': 1.4700013743285313e-05, 'epoch': 0.69} {'loss': 0.897, 'learning_rate': 1.4699724798803421e-05, 'epoch': 0.69} {'loss': 0.886, 'learning_rate': 1.4699435849285353e-05, 'epoch': 0.69} {'loss': 0.7068, 'learning_rate': 1.4699146894731411e-05, 'epoch': 0.69} {'loss': 0.8498, 'learning_rate': 1.469885793514191e-05, 'epoch': 0.69} {'loss': 0.7851, 'learning_rate': 1.469856897051716e-05, 'epoch': 0.69} {'loss': 0.8057, 'learning_rate': 1.4698280000857468e-05, 'epoch': 0.69} {'loss': 0.8467, 'learning_rate': 1.4697991026163143e-05, 'epoch': 0.69} {'loss': 0.8839, 'learning_rate': 1.46977020464345e-05, 'epoch': 0.69} {'loss': 0.8126, 'learning_rate': 1.4697413061671845e-05, 'epoch': 0.69} {'loss': 0.7711, 'learning_rate': 1.4697124071875488e-05, 'epoch': 0.69} {'loss': 0.9325, 'learning_rate': 1.469683507704574e-05, 'epoch': 0.69} {'loss': 0.9165, 'learning_rate': 1.4696546077182906e-05, 'epoch': 0.69} {'loss': 0.7592, 'learning_rate': 1.4696257072287299e-05, 'epoch': 0.69} {'loss': 0.8269, 'learning_rate': 1.469596806235923e-05, 'epoch': 0.69} {'loss': 0.8813, 'learning_rate': 1.4695679047399008e-05, 'epoch': 0.69} {'loss': 0.9308, 'learning_rate': 1.4695390027406941e-05, 'epoch': 0.69} {'loss': 0.7581, 'learning_rate': 1.4695101002383341e-05, 'epoch': 0.69} {'loss': 0.7548, 'learning_rate': 1.4694811972328513e-05, 'epoch': 0.69} {'loss': 0.7515, 'learning_rate': 1.4694522937242774e-05, 'epoch': 0.69} {'loss': 0.8782, 'learning_rate': 1.469423389712643e-05, 'epoch': 0.69} {'loss': 0.765, 'learning_rate': 1.469394485197979e-05, 'epoch': 0.69} {'loss': 0.9784, 'learning_rate': 1.4693655801803161e-05, 'epoch': 0.69} {'loss': 0.8651, 'learning_rate': 1.4693366746596862e-05, 'epoch': 0.69} {'loss': 0.9435, 'learning_rate': 1.4693077686361192e-05, 'epoch': 0.69} {'loss': 0.8728, 'learning_rate': 1.4692788621096468e-05, 'epoch': 0.69} {'loss': 0.7625, 'learning_rate': 1.4692499550802999e-05, 'epoch': 0.69} {'loss': 0.706, 'learning_rate': 1.469221047548109e-05, 'epoch': 0.69} {'loss': 0.6237, 'learning_rate': 1.4691921395131054e-05, 'epoch': 0.69} {'loss': 0.7968, 'learning_rate': 1.4691632309753204e-05, 'epoch': 0.69} {'loss': 0.9693, 'learning_rate': 1.4691343219347844e-05, 'epoch': 0.69} {'loss': 0.7401, 'learning_rate': 1.4691054123915287e-05, 'epoch': 0.69} {'loss': 0.7662, 'learning_rate': 1.4690765023455843e-05, 'epoch': 0.69} {'loss': 0.8532, 'learning_rate': 1.469047591796982e-05, 'epoch': 0.69} {'loss': 0.734, 'learning_rate': 1.4690186807457527e-05, 'epoch': 0.69} {'loss': 0.6889, 'learning_rate': 1.4689897691919276e-05, 'epoch': 0.69} {'loss': 0.9317, 'learning_rate': 1.4689608571355381e-05, 'epoch': 0.69} {'loss': 0.8894, 'learning_rate': 1.4689319445766144e-05, 'epoch': 0.69} {'loss': 0.8798, 'learning_rate': 1.4689030315151876e-05, 'epoch': 0.69} {'loss': 0.83, 'learning_rate': 1.4688741179512891e-05, 'epoch': 0.69} {'loss': 0.6899, 'learning_rate': 1.4688452038849495e-05, 'epoch': 0.69} {'loss': 0.8653, 'learning_rate': 1.4688162893162001e-05, 'epoch': 0.69} {'loss': 0.8048, 'learning_rate': 1.4687873742450716e-05, 'epoch': 0.69} {'loss': 0.6853, 'learning_rate': 1.4687584586715952e-05, 'epoch': 0.69} {'loss': 0.8639, 'learning_rate': 1.468729542595802e-05, 'epoch': 0.69} {'loss': 0.7907, 'learning_rate': 1.4687006260177229e-05, 'epoch': 0.69} {'loss': 0.7936, 'learning_rate': 1.4686717089373881e-05, 'epoch': 0.69} {'loss': 0.888, 'learning_rate': 1.4686427913548298e-05, 'epoch': 0.69} {'loss': 0.9126, 'learning_rate': 1.4686138732700781e-05, 'epoch': 0.69} {'loss': 0.961, 'learning_rate': 1.4685849546831645e-05, 'epoch': 0.69} {'loss': 1.0698, 'learning_rate': 1.46855603559412e-05, 'epoch': 0.69} {'loss': 0.8317, 'learning_rate': 1.4685271160029752e-05, 'epoch': 0.69} {'loss': 0.7481, 'learning_rate': 1.4684981959097616e-05, 'epoch': 0.69} {'loss': 0.8096, 'learning_rate': 1.4684692753145096e-05, 'epoch': 0.69} {'loss': 0.712, 'learning_rate': 1.4684403542172506e-05, 'epoch': 0.69} {'loss': 0.6488, 'learning_rate': 1.4684114326180152e-05, 'epoch': 0.69} {'loss': 0.7507, 'learning_rate': 1.468382510516835e-05, 'epoch': 0.69} {'loss': 0.8085, 'learning_rate': 1.4683535879137407e-05, 'epoch': 0.69} {'loss': 0.8287, 'learning_rate': 1.4683246648087632e-05, 'epoch': 0.69} {'loss': 0.7603, 'learning_rate': 1.4682957412019337e-05, 'epoch': 0.69} {'loss': 0.6949, 'learning_rate': 1.4682668170932826e-05, 'epoch': 0.69} {'loss': 0.7889, 'learning_rate': 1.4682378924828416e-05, 'epoch': 0.69} {'loss': 0.892, 'learning_rate': 1.4682089673706412e-05, 'epoch': 0.69} {'loss': 0.8068, 'learning_rate': 1.468180041756713e-05, 'epoch': 0.69} {'loss': 0.8393, 'learning_rate': 1.4681511156410876e-05, 'epoch': 0.69} {'loss': 0.8644, 'learning_rate': 1.468122189023796e-05, 'epoch': 0.69} {'loss': 0.927, 'learning_rate': 1.4680932619048691e-05, 'epoch': 0.69} {'loss': 0.7848, 'learning_rate': 1.4680643342843381e-05, 'epoch': 0.69} {'loss': 0.8189, 'learning_rate': 1.4680354061622336e-05, 'epoch': 0.69} {'loss': 0.9547, 'learning_rate': 1.4680064775385874e-05, 'epoch': 0.69} {'loss': 0.919, 'learning_rate': 1.46797754841343e-05, 'epoch': 0.69} {'loss': 0.7971, 'learning_rate': 1.4679486187867919e-05, 'epoch': 0.69} {'loss': 0.8279, 'learning_rate': 1.4679196886587052e-05, 'epoch': 0.69} {'loss': 0.8441, 'learning_rate': 1.4678907580292001e-05, 'epoch': 0.69} {'loss': 0.7669, 'learning_rate': 1.4678618268983078e-05, 'epoch': 0.69} {'loss': 0.8264, 'learning_rate': 1.4678328952660591e-05, 'epoch': 0.69} {'loss': 0.836, 'learning_rate': 1.4678039631324856e-05, 'epoch': 0.69} {'loss': 0.8712, 'learning_rate': 1.467775030497618e-05, 'epoch': 0.69} {'loss': 0.7977, 'learning_rate': 1.4677460973614869e-05, 'epoch': 0.69} {'loss': 0.8373, 'learning_rate': 1.467717163724124e-05, 'epoch': 0.69} {'loss': 0.8789, 'learning_rate': 1.4676882295855594e-05, 'epoch': 0.69} {'loss': 0.6793, 'learning_rate': 1.467659294945825e-05, 'epoch': 0.69} {'loss': 0.8317, 'learning_rate': 1.4676303598049515e-05, 'epoch': 0.69} {'loss': 0.8882, 'learning_rate': 1.4676014241629699e-05, 'epoch': 0.69} {'loss': 0.8557, 'learning_rate': 1.467572488019911e-05, 'epoch': 0.69} {'loss': 0.8734, 'learning_rate': 1.467543551375806e-05, 'epoch': 0.69} {'loss': 0.9151, 'learning_rate': 1.467514614230686e-05, 'epoch': 0.69} {'loss': 0.7684, 'learning_rate': 1.4674856765845817e-05, 'epoch': 0.69} {'loss': 0.9392, 'learning_rate': 1.4674567384375245e-05, 'epoch': 0.69} {'loss': 0.9007, 'learning_rate': 1.4674277997895453e-05, 'epoch': 0.69} {'loss': 0.8668, 'learning_rate': 1.4673988606406746e-05, 'epoch': 0.69} {'loss': 1.0336, 'learning_rate': 1.4673699209909442e-05, 'epoch': 0.69} {'loss': 0.7757, 'learning_rate': 1.4673409808403848e-05, 'epoch': 0.69} {'loss': 0.8866, 'learning_rate': 1.467312040189027e-05, 'epoch': 0.69} {'loss': 0.822, 'learning_rate': 1.4672830990369025e-05, 'epoch': 0.69} {'loss': 0.7982, 'learning_rate': 1.4672541573840415e-05, 'epoch': 0.69} {'loss': 0.8009, 'learning_rate': 1.4672252152304763e-05, 'epoch': 0.69} {'loss': 0.7773, 'learning_rate': 1.4671962725762365e-05, 'epoch': 0.69} {'loss': 0.927, 'learning_rate': 1.4671673294213538e-05, 'epoch': 0.69} {'loss': 0.8685, 'learning_rate': 1.4671383857658594e-05, 'epoch': 0.69} {'loss': 0.8107, 'learning_rate': 1.4671094416097837e-05, 'epoch': 0.69} {'loss': 0.6743, 'learning_rate': 1.4670804969531585e-05, 'epoch': 0.69} {'loss': 0.8712, 'learning_rate': 1.467051551796014e-05, 'epoch': 0.69} {'loss': 0.7068, 'learning_rate': 1.4670226061383819e-05, 'epoch': 0.69} {'loss': 0.8785, 'learning_rate': 1.4669936599802927e-05, 'epoch': 0.69} {'loss': 0.7954, 'learning_rate': 1.4669647133217777e-05, 'epoch': 0.69} {'loss': 0.9184, 'learning_rate': 1.466935766162868e-05, 'epoch': 0.69} {'loss': 0.9283, 'learning_rate': 1.4669068185035944e-05, 'epoch': 0.69} {'loss': 0.884, 'learning_rate': 1.466877870343988e-05, 'epoch': 0.69} {'loss': 0.8104, 'learning_rate': 1.4668489216840797e-05, 'epoch': 0.69} {'loss': 0.7109, 'learning_rate': 1.4668199725239007e-05, 'epoch': 0.69} {'loss': 0.889, 'learning_rate': 1.466791022863482e-05, 'epoch': 0.69} {'loss': 0.842, 'learning_rate': 1.4667620727028546e-05, 'epoch': 0.69} {'loss': 0.6033, 'learning_rate': 1.4667331220420495e-05, 'epoch': 0.69} {'loss': 0.7633, 'learning_rate': 1.4667041708810981e-05, 'epoch': 0.69} {'loss': 0.9938, 'learning_rate': 1.4666752192200306e-05, 'epoch': 0.69} {'loss': 0.8719, 'learning_rate': 1.4666462670588787e-05, 'epoch': 0.7} {'loss': 0.6061, 'learning_rate': 1.4666173143976729e-05, 'epoch': 0.7} {'loss': 0.666, 'learning_rate': 1.4665883612364446e-05, 'epoch': 0.7} {'loss': 0.9041, 'learning_rate': 1.4665594075752251e-05, 'epoch': 0.7} {'loss': 0.7178, 'learning_rate': 1.4665304534140448e-05, 'epoch': 0.7} {'loss': 0.8494, 'learning_rate': 1.4665014987529353e-05, 'epoch': 0.7} {'loss': 0.9021, 'learning_rate': 1.4664725435919271e-05, 'epoch': 0.7} {'loss': 0.8473, 'learning_rate': 1.4664435879310514e-05, 'epoch': 0.7} {'loss': 0.7226, 'learning_rate': 1.4664146317703393e-05, 'epoch': 0.7} {'loss': 0.6999, 'learning_rate': 1.4663856751098218e-05, 'epoch': 0.7} {'loss': 0.9804, 'learning_rate': 1.4663567179495304e-05, 'epoch': 0.7} {'loss': 0.6869, 'learning_rate': 1.4663277602894954e-05, 'epoch': 0.7} {'loss': 0.8031, 'learning_rate': 1.4662988021297482e-05, 'epoch': 0.7} {'loss': 1.0456, 'learning_rate': 1.4662698434703196e-05, 'epoch': 0.7} {'loss': 0.644, 'learning_rate': 1.4662408843112405e-05, 'epoch': 0.7} {'loss': 0.8018, 'learning_rate': 1.4662119246525426e-05, 'epoch': 0.7} {'loss': 0.9332, 'learning_rate': 1.4661829644942565e-05, 'epoch': 0.7} {'loss': 0.8056, 'learning_rate': 1.4661540038364133e-05, 'epoch': 0.7} {'loss': 0.774, 'learning_rate': 1.4661250426790439e-05, 'epoch': 0.7} {'loss': 0.6733, 'learning_rate': 1.4660960810221796e-05, 'epoch': 0.7} {'loss': 0.6628, 'learning_rate': 1.466067118865851e-05, 'epoch': 0.7} {'loss': 0.9963, 'learning_rate': 1.4660381562100895e-05, 'epoch': 0.7} {'loss': 0.7406, 'learning_rate': 1.466009193054926e-05, 'epoch': 0.7} {'loss': 0.791, 'learning_rate': 1.4659802294003918e-05, 'epoch': 0.7} {'loss': 0.933, 'learning_rate': 1.4659512652465178e-05, 'epoch': 0.7} {'loss': 0.7349, 'learning_rate': 1.4659223005933352e-05, 'epoch': 0.7} {'loss': 0.8663, 'learning_rate': 1.4658933354408743e-05, 'epoch': 0.7} {'loss': 0.7127, 'learning_rate': 1.4658643697891665e-05, 'epoch': 0.7} {'loss': 0.6966, 'learning_rate': 1.4658354036382434e-05, 'epoch': 0.7} {'loss': 0.9966, 'learning_rate': 1.4658064369881352e-05, 'epoch': 0.7} {'loss': 0.7613, 'learning_rate': 1.4657774698388737e-05, 'epoch': 0.7} {'loss': 0.9048, 'learning_rate': 1.4657485021904898e-05, 'epoch': 0.7} {'loss': 0.7788, 'learning_rate': 1.4657195340430142e-05, 'epoch': 0.7} {'loss': 0.8012, 'learning_rate': 1.465690565396478e-05, 'epoch': 0.7} {'loss': 0.6686, 'learning_rate': 1.4656615962509122e-05, 'epoch': 0.7} {'loss': 0.7788, 'learning_rate': 1.4656326266063479e-05, 'epoch': 0.7} {'loss': 0.8404, 'learning_rate': 1.4656036564628165e-05, 'epoch': 0.7} {'loss': 0.7329, 'learning_rate': 1.4655746858203486e-05, 'epoch': 0.7} {'loss': 0.9094, 'learning_rate': 1.4655457146789754e-05, 'epoch': 0.7} {'loss': 0.9413, 'learning_rate': 1.4655167430387281e-05, 'epoch': 0.7} {'loss': 0.7974, 'learning_rate': 1.4654877708996375e-05, 'epoch': 0.7} {'loss': 0.6782, 'learning_rate': 1.4654587982617345e-05, 'epoch': 0.7} {'loss': 0.7075, 'learning_rate': 1.465429825125051e-05, 'epoch': 0.7} {'loss': 0.5648, 'learning_rate': 1.465400851489617e-05, 'epoch': 0.7} {'loss': 0.9551, 'learning_rate': 1.4653718773554637e-05, 'epoch': 0.7} {'loss': 0.8206, 'learning_rate': 1.4653429027226231e-05, 'epoch': 0.7} {'loss': 0.7097, 'learning_rate': 1.465313927591125e-05, 'epoch': 0.7} {'loss': 0.786, 'learning_rate': 1.4652849519610012e-05, 'epoch': 0.7} {'loss': 0.8496, 'learning_rate': 1.4652559758322826e-05, 'epoch': 0.7} {'loss': 0.8655, 'learning_rate': 1.4652269992050006e-05, 'epoch': 0.7} {'loss': 0.8876, 'learning_rate': 1.4651980220791855e-05, 'epoch': 0.7} {'loss': 0.9049, 'learning_rate': 1.4651690444548688e-05, 'epoch': 0.7} {'loss': 0.7768, 'learning_rate': 1.4651400663320817e-05, 'epoch': 0.7} {'loss': 0.6498, 'learning_rate': 1.4651110877108544e-05, 'epoch': 0.7} {'loss': 0.8087, 'learning_rate': 1.465082108591219e-05, 'epoch': 0.7} {'loss': 0.7024, 'learning_rate': 1.4650531289732064e-05, 'epoch': 0.7} {'loss': 0.7661, 'learning_rate': 1.4650241488568471e-05, 'epoch': 0.7} {'loss': 0.6765, 'learning_rate': 1.4649951682421724e-05, 'epoch': 0.7} {'loss': 0.7439, 'learning_rate': 1.4649661871292135e-05, 'epoch': 0.7} {'loss': 0.7495, 'learning_rate': 1.4649372055180016e-05, 'epoch': 0.7} {'loss': 0.9024, 'learning_rate': 1.4649082234085672e-05, 'epoch': 0.7} {'loss': 0.8129, 'learning_rate': 1.4648792408009417e-05, 'epoch': 0.7} {'loss': 0.9566, 'learning_rate': 1.4648502576951565e-05, 'epoch': 0.7} {'loss': 0.9922, 'learning_rate': 1.4648212740912417e-05, 'epoch': 0.7} {'loss': 0.895, 'learning_rate': 1.4647922899892293e-05, 'epoch': 0.7} {'loss': 0.8078, 'learning_rate': 1.46476330538915e-05, 'epoch': 0.7} {'loss': 0.8949, 'learning_rate': 1.464734320291035e-05, 'epoch': 0.7} {'loss': 0.7891, 'learning_rate': 1.464705334694915e-05, 'epoch': 0.7} {'loss': 0.7299, 'learning_rate': 1.4646763486008215e-05, 'epoch': 0.7} {'loss': 0.8571, 'learning_rate': 1.464647362008785e-05, 'epoch': 0.7} {'loss': 0.6766, 'learning_rate': 1.4646183749188372e-05, 'epoch': 0.7} {'loss': 0.8654, 'learning_rate': 1.4645893873310087e-05, 'epoch': 0.7} {'loss': 0.9186, 'learning_rate': 1.4645603992453308e-05, 'epoch': 0.7} {'loss': 0.8325, 'learning_rate': 1.4645314106618346e-05, 'epoch': 0.7} {'loss': 1.0876, 'learning_rate': 1.4645024215805513e-05, 'epoch': 0.7} {'loss': 0.962, 'learning_rate': 1.4644734320015114e-05, 'epoch': 0.7} {'loss': 0.7907, 'learning_rate': 1.4644444419247462e-05, 'epoch': 0.7} {'loss': 0.9946, 'learning_rate': 1.464415451350287e-05, 'epoch': 0.7} {'loss': 0.898, 'learning_rate': 1.4643864602781648e-05, 'epoch': 0.7} {'loss': 0.8973, 'learning_rate': 1.4643574687084106e-05, 'epoch': 0.7} {'loss': 0.6629, 'learning_rate': 1.4643284766410553e-05, 'epoch': 0.7} {'loss': 0.8635, 'learning_rate': 1.4642994840761304e-05, 'epoch': 0.7} {'loss': 0.8586, 'learning_rate': 1.4642704910136662e-05, 'epoch': 0.7} {'loss': 0.9513, 'learning_rate': 1.4642414974536948e-05, 'epoch': 0.7} {'loss': 0.6453, 'learning_rate': 1.4642125033962464e-05, 'epoch': 0.7} {'loss': 0.7915, 'learning_rate': 1.4641835088413524e-05, 'epoch': 0.7} {'loss': 0.784, 'learning_rate': 1.464154513789044e-05, 'epoch': 0.7} {'loss': 0.7331, 'learning_rate': 1.4641255182393526e-05, 'epoch': 0.7} {'loss': 0.9331, 'learning_rate': 1.4640965221923083e-05, 'epoch': 0.7} {'loss': 0.7333, 'learning_rate': 1.4640675256479427e-05, 'epoch': 0.7} {'loss': 0.7252, 'learning_rate': 1.4640385286062867e-05, 'epoch': 0.7} {'loss': 0.8108, 'learning_rate': 1.4640095310673716e-05, 'epoch': 0.7} {'loss': 0.7433, 'learning_rate': 1.4639805330312287e-05, 'epoch': 0.7} {'loss': 0.9056, 'learning_rate': 1.4639515344978888e-05, 'epoch': 0.7} {'loss': 0.9935, 'learning_rate': 1.4639225354673827e-05, 'epoch': 0.7} {'loss': 0.7396, 'learning_rate': 1.463893535939742e-05, 'epoch': 0.7} {'loss': 0.8328, 'learning_rate': 1.463864535914997e-05, 'epoch': 0.7} {'loss': 0.8878, 'learning_rate': 1.4638355353931798e-05, 'epoch': 0.7} {'loss': 0.7953, 'learning_rate': 1.4638065343743206e-05, 'epoch': 0.7} {'loss': 0.8587, 'learning_rate': 1.4637775328584511e-05, 'epoch': 0.7} {'loss': 0.7305, 'learning_rate': 1.463748530845602e-05, 'epoch': 0.7} {'loss': 0.8488, 'learning_rate': 1.4637195283358048e-05, 'epoch': 0.7} {'loss': 0.7509, 'learning_rate': 1.4636905253290899e-05, 'epoch': 0.7} {'loss': 0.9076, 'learning_rate': 1.4636615218254889e-05, 'epoch': 0.7} {'loss': 0.7488, 'learning_rate': 1.4636325178250324e-05, 'epoch': 0.7} {'loss': 0.8748, 'learning_rate': 1.4636035133277521e-05, 'epoch': 0.7} {'loss': 0.8167, 'learning_rate': 1.4635745083336788e-05, 'epoch': 0.7} {'loss': 1.0235, 'learning_rate': 1.4635455028428436e-05, 'epoch': 0.7} {'loss': 0.83, 'learning_rate': 1.4635164968552778e-05, 'epoch': 0.7} {'loss': 0.6176, 'learning_rate': 1.4634874903710117e-05, 'epoch': 0.7} {'loss': 0.7278, 'learning_rate': 1.4634584833900772e-05, 'epoch': 0.7} {'loss': 0.6179, 'learning_rate': 1.4634294759125049e-05, 'epoch': 0.7} {'loss': 0.8175, 'learning_rate': 1.4634004679383265e-05, 'epoch': 0.7} {'loss': 0.7624, 'learning_rate': 1.4633714594675723e-05, 'epoch': 0.7} {'loss': 0.843, 'learning_rate': 1.463342450500274e-05, 'epoch': 0.7} {'loss': 0.8539, 'learning_rate': 1.4633134410364624e-05, 'epoch': 0.7} {'loss': 0.8554, 'learning_rate': 1.4632844310761684e-05, 'epoch': 0.7} {'loss': 0.7976, 'learning_rate': 1.4632554206194235e-05, 'epoch': 0.7} {'loss': 0.8496, 'learning_rate': 1.4632264096662587e-05, 'epoch': 0.7} {'loss': 0.7292, 'learning_rate': 1.463197398216705e-05, 'epoch': 0.7} {'loss': 0.8706, 'learning_rate': 1.4631683862707933e-05, 'epoch': 0.7} {'loss': 0.7421, 'learning_rate': 1.463139373828555e-05, 'epoch': 0.7} {'loss': 0.8845, 'learning_rate': 1.463110360890021e-05, 'epoch': 0.7} {'loss': 1.069, 'learning_rate': 1.4630813474552224e-05, 'epoch': 0.7} {'loss': 0.7616, 'learning_rate': 1.4630523335241905e-05, 'epoch': 0.7} {'loss': 0.6681, 'learning_rate': 1.4630233190969561e-05, 'epoch': 0.7} {'loss': 1.0047, 'learning_rate': 1.4629943041735503e-05, 'epoch': 0.7} {'loss': 0.6783, 'learning_rate': 1.4629652887540045e-05, 'epoch': 0.7} {'loss': 0.8463, 'learning_rate': 1.4629362728383496e-05, 'epoch': 0.7} {'loss': 0.8173, 'learning_rate': 1.4629072564266167e-05, 'epoch': 0.7} {'loss': 0.7176, 'learning_rate': 1.462878239518837e-05, 'epoch': 0.7} {'loss': 0.8367, 'learning_rate': 1.4628492221150411e-05, 'epoch': 0.7} {'loss': 0.7047, 'learning_rate': 1.4628202042152609e-05, 'epoch': 0.7} {'loss': 0.8994, 'learning_rate': 1.4627911858195267e-05, 'epoch': 0.7} {'loss': 0.9268, 'learning_rate': 1.4627621669278702e-05, 'epoch': 0.7} {'loss': 0.8042, 'learning_rate': 1.4627331475403223e-05, 'epoch': 0.7} {'loss': 0.8744, 'learning_rate': 1.462704127656914e-05, 'epoch': 0.7} {'loss': 0.9622, 'learning_rate': 1.4626751072776769e-05, 'epoch': 0.7} {'loss': 0.7421, 'learning_rate': 1.462646086402641e-05, 'epoch': 0.7} {'loss': 0.7608, 'learning_rate': 1.4626170650318383e-05, 'epoch': 0.7} {'loss': 0.7489, 'learning_rate': 1.4625880431652996e-05, 'epoch': 0.7} {'loss': 0.8493, 'learning_rate': 1.4625590208030562e-05, 'epoch': 0.7} {'loss': 0.7072, 'learning_rate': 1.4625299979451391e-05, 'epoch': 0.7} {'loss': 0.7766, 'learning_rate': 1.4625009745915795e-05, 'epoch': 0.7} {'loss': 0.7618, 'learning_rate': 1.4624719507424079e-05, 'epoch': 0.7} {'loss': 0.8634, 'learning_rate': 1.462442926397656e-05, 'epoch': 0.7} {'loss': 0.8064, 'learning_rate': 1.4624139015573549e-05, 'epoch': 0.7} {'loss': 0.7971, 'learning_rate': 1.4623848762215356e-05, 'epoch': 0.7} {'loss': 0.7718, 'learning_rate': 1.4623558503902289e-05, 'epoch': 0.7} {'loss': 0.9457, 'learning_rate': 1.4623268240634664e-05, 'epoch': 0.7} {'loss': 0.7811, 'learning_rate': 1.4622977972412793e-05, 'epoch': 0.7} {'loss': 0.8786, 'learning_rate': 1.462268769923698e-05, 'epoch': 0.7} {'loss': 0.8011, 'learning_rate': 1.462239742110754e-05, 'epoch': 0.7} {'loss': 0.8067, 'learning_rate': 1.4622107138024784e-05, 'epoch': 0.7} {'loss': 0.853, 'learning_rate': 1.4621816849989021e-05, 'epoch': 0.7} {'loss': 0.8605, 'learning_rate': 1.4621526557000569e-05, 'epoch': 0.7} {'loss': 0.7533, 'learning_rate': 1.462123625905973e-05, 'epoch': 0.7} {'loss': 0.7214, 'learning_rate': 1.4620945956166823e-05, 'epoch': 0.7} {'loss': 0.9662, 'learning_rate': 1.4620655648322153e-05, 'epoch': 0.7} {'loss': 0.9172, 'learning_rate': 1.4620365335526033e-05, 'epoch': 0.7} {'loss': 0.8061, 'learning_rate': 1.4620075017778773e-05, 'epoch': 0.7} {'loss': 0.7705, 'learning_rate': 1.4619784695080688e-05, 'epoch': 0.7} {'loss': 0.7743, 'learning_rate': 1.461949436743209e-05, 'epoch': 0.7} {'loss': 0.8246, 'learning_rate': 1.4619204034833283e-05, 'epoch': 0.7} {'loss': 0.7289, 'learning_rate': 1.4618913697284582e-05, 'epoch': 0.7} {'loss': 0.7614, 'learning_rate': 1.4618623354786298e-05, 'epoch': 0.7} {'loss': 0.7195, 'learning_rate': 1.4618333007338743e-05, 'epoch': 0.7} {'loss': 0.5678, 'learning_rate': 1.4618042654942225e-05, 'epoch': 0.7} {'loss': 0.8978, 'learning_rate': 1.4617752297597062e-05, 'epoch': 0.7} {'loss': 0.9981, 'learning_rate': 1.4617461935303557e-05, 'epoch': 0.7} {'loss': 0.9043, 'learning_rate': 1.4617171568062028e-05, 'epoch': 0.7} {'loss': 0.8471, 'learning_rate': 1.4616881195872781e-05, 'epoch': 0.7} {'loss': 0.8532, 'learning_rate': 1.4616590818736127e-05, 'epoch': 0.7} {'loss': 0.8743, 'learning_rate': 1.4616300436652382e-05, 'epoch': 0.7} {'loss': 0.8467, 'learning_rate': 1.4616010049621854e-05, 'epoch': 0.7} {'loss': 0.8067, 'learning_rate': 1.4615719657644854e-05, 'epoch': 0.7} {'loss': 0.8626, 'learning_rate': 1.4615429260721695e-05, 'epoch': 0.7} {'loss': 0.6736, 'learning_rate': 1.4615138858852685e-05, 'epoch': 0.7} {'loss': 0.808, 'learning_rate': 1.4614848452038137e-05, 'epoch': 0.7} {'loss': 0.9022, 'learning_rate': 1.4614558040278364e-05, 'epoch': 0.7} {'loss': 0.8843, 'learning_rate': 1.4614267623573675e-05, 'epoch': 0.7} {'loss': 0.7717, 'learning_rate': 1.4613977201924382e-05, 'epoch': 0.7} {'loss': 0.864, 'learning_rate': 1.4613686775330797e-05, 'epoch': 0.7} {'loss': 0.8032, 'learning_rate': 1.4613396343793227e-05, 'epoch': 0.7} {'loss': 0.9659, 'learning_rate': 1.461310590731199e-05, 'epoch': 0.7} {'loss': 0.758, 'learning_rate': 1.4612815465887394e-05, 'epoch': 0.7} {'loss': 0.8507, 'learning_rate': 1.4612525019519748e-05, 'epoch': 0.7} {'loss': 0.8738, 'learning_rate': 1.4612234568209364e-05, 'epoch': 0.7} {'loss': 0.8936, 'learning_rate': 1.4611944111956558e-05, 'epoch': 0.7} {'loss': 0.7424, 'learning_rate': 1.4611653650761633e-05, 'epoch': 0.7} {'loss': 1.0417, 'learning_rate': 1.4611363184624908e-05, 'epoch': 0.7} {'loss': 0.8216, 'learning_rate': 1.461107271354669e-05, 'epoch': 0.7} {'loss': 0.9546, 'learning_rate': 1.461078223752729e-05, 'epoch': 0.7} {'loss': 0.8973, 'learning_rate': 1.4610491756567025e-05, 'epoch': 0.7} {'loss': 0.748, 'learning_rate': 1.46102012706662e-05, 'epoch': 0.7} {'loss': 0.7657, 'learning_rate': 1.4609910779825124e-05, 'epoch': 0.7} {'loss': 0.8236, 'learning_rate': 1.4609620284044118e-05, 'epoch': 0.7} {'loss': 0.7982, 'learning_rate': 1.4609329783323486e-05, 'epoch': 0.7} {'loss': 0.8552, 'learning_rate': 1.4609039277663541e-05, 'epoch': 0.7} {'loss': 0.8306, 'learning_rate': 1.4608748767064595e-05, 'epoch': 0.7} {'loss': 1.0345, 'learning_rate': 1.460845825152696e-05, 'epoch': 0.7} {'loss': 0.7369, 'learning_rate': 1.4608167731050942e-05, 'epoch': 0.7} {'loss': 1.0955, 'learning_rate': 1.460787720563686e-05, 'epoch': 0.7} {'loss': 0.8138, 'learning_rate': 1.4607586675285019e-05, 'epoch': 0.7} {'loss': 0.7076, 'learning_rate': 1.4607296139995734e-05, 'epoch': 0.7} {'loss': 0.8242, 'learning_rate': 1.4607005599769317e-05, 'epoch': 0.7} {'loss': 0.7354, 'learning_rate': 1.4606715054606078e-05, 'epoch': 0.7} {'loss': 0.6706, 'learning_rate': 1.4606424504506325e-05, 'epoch': 0.7} {'loss': 0.769, 'learning_rate': 1.4606133949470374e-05, 'epoch': 0.7} {'loss': 0.7209, 'learning_rate': 1.4605843389498534e-05, 'epoch': 0.7} {'loss': 0.9235, 'learning_rate': 1.4605552824591116e-05, 'epoch': 0.7} {'loss': 0.6553, 'learning_rate': 1.4605262254748435e-05, 'epoch': 0.7} {'loss': 0.8022, 'learning_rate': 1.4604971679970802e-05, 'epoch': 0.7} {'loss': 0.8692, 'learning_rate': 1.4604681100258522e-05, 'epoch': 0.7} {'loss': 0.9968, 'learning_rate': 1.4604390515611911e-05, 'epoch': 0.7} {'loss': 0.7883, 'learning_rate': 1.460409992603128e-05, 'epoch': 0.7} {'loss': 0.6797, 'learning_rate': 1.460380933151694e-05, 'epoch': 0.7} {'loss': 0.8085, 'learning_rate': 1.4603518732069203e-05, 'epoch': 0.7} {'loss': 1.0289, 'learning_rate': 1.4603228127688385e-05, 'epoch': 0.7} {'loss': 0.6862, 'learning_rate': 1.4602937518374789e-05, 'epoch': 0.7} {'loss': 0.7785, 'learning_rate': 1.460264690412873e-05, 'epoch': 0.7} {'loss': 0.6816, 'learning_rate': 1.4602356284950519e-05, 'epoch': 0.7} {'loss': 0.765, 'learning_rate': 1.4602065660840468e-05, 'epoch': 0.7} {'loss': 0.8143, 'learning_rate': 1.4601775031798885e-05, 'epoch': 0.7} {'loss': 0.8028, 'learning_rate': 1.4601484397826088e-05, 'epoch': 0.7} {'loss': 0.7402, 'learning_rate': 1.4601193758922387e-05, 'epoch': 0.7} {'loss': 0.8409, 'learning_rate': 1.4600903115088092e-05, 'epoch': 0.7} {'loss': 0.8853, 'learning_rate': 1.4600612466323511e-05, 'epoch': 0.7} {'loss': 0.8757, 'learning_rate': 1.460032181262896e-05, 'epoch': 0.7} {'loss': 0.7829, 'learning_rate': 1.4600031154004746e-05, 'epoch': 0.7} {'loss': 0.8329, 'learning_rate': 1.4599740490451187e-05, 'epoch': 0.7} {'loss': 0.7892, 'learning_rate': 1.459944982196859e-05, 'epoch': 0.7} {'loss': 0.8519, 'learning_rate': 1.4599159148557265e-05, 'epoch': 0.7} {'loss': 0.7223, 'learning_rate': 1.4598868470217531e-05, 'epoch': 0.7} {'loss': 0.6984, 'learning_rate': 1.459857778694969e-05, 'epoch': 0.7} {'loss': 0.7553, 'learning_rate': 1.4598287098754058e-05, 'epoch': 0.7} {'loss': 1.0183, 'learning_rate': 1.4597996405630948e-05, 'epoch': 0.7} {'loss': 0.8465, 'learning_rate': 1.459770570758067e-05, 'epoch': 0.7} {'loss': 0.9337, 'learning_rate': 1.4597415004603534e-05, 'epoch': 0.7} {'loss': 0.7724, 'learning_rate': 1.4597124296699855e-05, 'epoch': 0.7} {'loss': 0.8298, 'learning_rate': 1.459683358386994e-05, 'epoch': 0.7} {'loss': 0.7713, 'learning_rate': 1.4596542866114106e-05, 'epoch': 0.7} {'loss': 0.7714, 'learning_rate': 1.4596252143432656e-05, 'epoch': 0.7} {'loss': 0.8907, 'learning_rate': 1.459596141582591e-05, 'epoch': 0.7} {'loss': 0.8518, 'learning_rate': 1.4595670683294178e-05, 'epoch': 0.7} {'loss': 0.884, 'learning_rate': 1.4595379945837769e-05, 'epoch': 0.7} {'loss': 0.7929, 'learning_rate': 1.4595089203456997e-05, 'epoch': 0.7} {'loss': 0.7382, 'learning_rate': 1.4594798456152171e-05, 'epoch': 0.7} {'loss': 0.7826, 'learning_rate': 1.4594507703923602e-05, 'epoch': 0.7} {'loss': 0.7559, 'learning_rate': 1.4594216946771607e-05, 'epoch': 0.7} {'loss': 0.6809, 'learning_rate': 1.4593926184696492e-05, 'epoch': 0.7} {'loss': 0.8746, 'learning_rate': 1.4593635417698568e-05, 'epoch': 0.7} {'loss': 0.9286, 'learning_rate': 1.4593344645778151e-05, 'epoch': 0.7} {'loss': 0.7919, 'learning_rate': 1.4593053868935555e-05, 'epoch': 0.7} {'loss': 1.0087, 'learning_rate': 1.459276308717108e-05, 'epoch': 0.7} {'loss': 0.7688, 'learning_rate': 1.4592472300485048e-05, 'epoch': 0.7} {'loss': 0.8546, 'learning_rate': 1.459218150887777e-05, 'epoch': 0.7} {'loss': 0.6931, 'learning_rate': 1.459189071234955e-05, 'epoch': 0.7} {'loss': 0.8032, 'learning_rate': 1.4591599910900707e-05, 'epoch': 0.7} {'loss': 0.8541, 'learning_rate': 1.459130910453155e-05, 'epoch': 0.7} {'loss': 0.9055, 'learning_rate': 1.4591018293242392e-05, 'epoch': 0.7} {'loss': 0.7591, 'learning_rate': 1.4590727477033545e-05, 'epoch': 0.7} {'loss': 0.9577, 'learning_rate': 1.4590436655905316e-05, 'epoch': 0.7} {'loss': 0.8709, 'learning_rate': 1.459014582985802e-05, 'epoch': 0.7} {'loss': 0.7874, 'learning_rate': 1.458985499889197e-05, 'epoch': 0.7} {'loss': 0.8566, 'learning_rate': 1.4589564163007474e-05, 'epoch': 0.7} {'loss': 0.7266, 'learning_rate': 1.4589273322204847e-05, 'epoch': 0.7} {'loss': 0.7632, 'learning_rate': 1.4588982476484401e-05, 'epoch': 0.7} {'loss': 0.9401, 'learning_rate': 1.4588691625846444e-05, 'epoch': 0.7} {'loss': 0.8614, 'learning_rate': 1.458840077029129e-05, 'epoch': 0.7} {'loss': 0.7401, 'learning_rate': 1.4588109909819252e-05, 'epoch': 0.7} {'loss': 0.7974, 'learning_rate': 1.4587819044430637e-05, 'epoch': 0.7} {'loss': 0.8275, 'learning_rate': 1.4587528174125763e-05, 'epoch': 0.7} {'loss': 0.8436, 'learning_rate': 1.4587237298904935e-05, 'epoch': 0.7} {'loss': 0.859, 'learning_rate': 1.4586946418768473e-05, 'epoch': 0.7} {'loss': 0.794, 'learning_rate': 1.4586655533716682e-05, 'epoch': 0.7} {'loss': 0.7123, 'learning_rate': 1.4586364643749874e-05, 'epoch': 0.7} {'loss': 0.7484, 'learning_rate': 1.4586073748868366e-05, 'epoch': 0.7} {'loss': 0.802, 'learning_rate': 1.4585782849072461e-05, 'epoch': 0.7} {'loss': 0.8803, 'learning_rate': 1.4585491944362478e-05, 'epoch': 0.7} {'loss': 0.7165, 'learning_rate': 1.4585201034738727e-05, 'epoch': 0.7} {'loss': 0.9672, 'learning_rate': 1.4584910120201521e-05, 'epoch': 0.7} {'loss': 0.7617, 'learning_rate': 1.4584619200751169e-05, 'epoch': 0.7} {'loss': 0.7857, 'learning_rate': 1.4584328276387983e-05, 'epoch': 0.7} {'loss': 0.9267, 'learning_rate': 1.4584037347112271e-05, 'epoch': 0.7} {'loss': 0.7958, 'learning_rate': 1.4583746412924354e-05, 'epoch': 0.7} {'loss': 0.9631, 'learning_rate': 1.4583455473824539e-05, 'epoch': 0.7} {'loss': 0.8987, 'learning_rate': 1.4583164529813138e-05, 'epoch': 0.7} {'loss': 0.735, 'learning_rate': 1.4582873580890464e-05, 'epoch': 0.7} {'loss': 0.8561, 'learning_rate': 1.4582582627056825e-05, 'epoch': 0.7} {'loss': 0.9093, 'learning_rate': 1.4582291668312534e-05, 'epoch': 0.7} {'loss': 0.9907, 'learning_rate': 1.4582000704657904e-05, 'epoch': 0.7} {'loss': 0.7234, 'learning_rate': 1.4581709736093248e-05, 'epoch': 0.7} {'loss': 0.8582, 'learning_rate': 1.4581418762618875e-05, 'epoch': 0.7} {'loss': 1.0682, 'learning_rate': 1.45811277842351e-05, 'epoch': 0.7} {'loss': 0.8059, 'learning_rate': 1.4580836800942235e-05, 'epoch': 0.7} {'loss': 0.742, 'learning_rate': 1.4580545812740588e-05, 'epoch': 0.7} {'loss': 0.8463, 'learning_rate': 1.458025481963047e-05, 'epoch': 0.7} {'loss': 0.7259, 'learning_rate': 1.4579963821612199e-05, 'epoch': 0.7} {'loss': 0.7985, 'learning_rate': 1.4579672818686082e-05, 'epoch': 0.7} {'loss': 0.6993, 'learning_rate': 1.4579381810852434e-05, 'epoch': 0.7} {'loss': 0.8909, 'learning_rate': 1.4579090798111563e-05, 'epoch': 0.7} {'loss': 0.9106, 'learning_rate': 1.4578799780463783e-05, 'epoch': 0.7} {'loss': 0.8154, 'learning_rate': 1.4578508757909409e-05, 'epoch': 0.7} {'loss': 0.6941, 'learning_rate': 1.4578217730448746e-05, 'epoch': 0.7} {'loss': 0.797, 'learning_rate': 1.457792669808211e-05, 'epoch': 0.7} {'loss': 0.8055, 'learning_rate': 1.4577635660809813e-05, 'epoch': 0.7} {'loss': 0.7615, 'learning_rate': 1.4577344618632165e-05, 'epoch': 0.7} {'loss': 0.7745, 'learning_rate': 1.457705357154948e-05, 'epoch': 0.7} {'loss': 0.8426, 'learning_rate': 1.4576762519562072e-05, 'epoch': 0.7} {'loss': 0.6741, 'learning_rate': 1.4576471462670245e-05, 'epoch': 0.7} {'loss': 0.8157, 'learning_rate': 1.4576180400874319e-05, 'epoch': 0.7} {'loss': 0.6615, 'learning_rate': 1.45758893341746e-05, 'epoch': 0.7} {'loss': 1.0445, 'learning_rate': 1.4575598262571404e-05, 'epoch': 0.7} {'loss': 0.8547, 'learning_rate': 1.4575307186065042e-05, 'epoch': 0.7} {'loss': 0.6464, 'learning_rate': 1.4575016104655826e-05, 'epoch': 0.7} {'loss': 0.9386, 'learning_rate': 1.4574725018344067e-05, 'epoch': 0.7} {'loss': 0.7641, 'learning_rate': 1.4574433927130076e-05, 'epoch': 0.7} {'loss': 0.7891, 'learning_rate': 1.4574142831014167e-05, 'epoch': 0.7} {'loss': 0.6865, 'learning_rate': 1.457385172999665e-05, 'epoch': 0.7} {'loss': 0.7409, 'learning_rate': 1.4573560624077839e-05, 'epoch': 0.7} {'loss': 0.5651, 'learning_rate': 1.4573269513258046e-05, 'epoch': 0.7} {'loss': 0.8035, 'learning_rate': 1.457297839753758e-05, 'epoch': 0.7} {'loss': 0.7586, 'learning_rate': 1.4572687276916758e-05, 'epoch': 0.7} {'loss': 0.823, 'learning_rate': 1.4572396151395884e-05, 'epoch': 0.7} {'loss': 0.8968, 'learning_rate': 1.457210502097528e-05, 'epoch': 0.7} {'loss': 0.9622, 'learning_rate': 1.457181388565525e-05, 'epoch': 0.7} {'loss': 0.9205, 'learning_rate': 1.4571522745436108e-05, 'epoch': 0.7} {'loss': 0.847, 'learning_rate': 1.4571231600318167e-05, 'epoch': 0.7} {'loss': 0.7947, 'learning_rate': 1.457094045030174e-05, 'epoch': 0.7} {'loss': 0.7753, 'learning_rate': 1.4570649295387138e-05, 'epoch': 0.7} {'loss': 0.6618, 'learning_rate': 1.4570358135574671e-05, 'epoch': 0.7} {'loss': 0.7694, 'learning_rate': 1.4570066970864656e-05, 'epoch': 0.7} {'loss': 0.6463, 'learning_rate': 1.4569775801257397e-05, 'epoch': 0.7} {'loss': 0.8434, 'learning_rate': 1.4569484626753215e-05, 'epoch': 0.7} {'loss': 0.839, 'learning_rate': 1.4569193447352415e-05, 'epoch': 0.7} {'loss': 0.9572, 'learning_rate': 1.4568902263055315e-05, 'epoch': 0.7} {'loss': 0.6692, 'learning_rate': 1.4568611073862222e-05, 'epoch': 0.7} {'loss': 0.8527, 'learning_rate': 1.4568319879773452e-05, 'epoch': 0.7} {'loss': 0.7645, 'learning_rate': 1.456802868078931e-05, 'epoch': 0.7} {'loss': 0.8285, 'learning_rate': 1.4567737476910116e-05, 'epoch': 0.7} {'loss': 0.7629, 'learning_rate': 1.4567446268136179e-05, 'epoch': 0.7} {'loss': 0.8999, 'learning_rate': 1.456715505446781e-05, 'epoch': 0.7} {'loss': 0.8406, 'learning_rate': 1.4566863835905323e-05, 'epoch': 0.7} {'loss': 0.8747, 'learning_rate': 1.456657261244903e-05, 'epoch': 0.7} {'loss': 0.6879, 'learning_rate': 1.4566281384099243e-05, 'epoch': 0.7} {'loss': 0.7403, 'learning_rate': 1.456599015085627e-05, 'epoch': 0.7} {'loss': 0.8676, 'learning_rate': 1.456569891272043e-05, 'epoch': 0.7} {'loss': 0.7139, 'learning_rate': 1.456540766969203e-05, 'epoch': 0.7} {'loss': 1.0634, 'learning_rate': 1.4565116421771382e-05, 'epoch': 0.7} {'loss': 0.8717, 'learning_rate': 1.45648251689588e-05, 'epoch': 0.7} {'loss': 0.8249, 'learning_rate': 1.4564533911254599e-05, 'epoch': 0.7} {'loss': 0.9109, 'learning_rate': 1.4564242648659086e-05, 'epoch': 0.7} {'loss': 0.733, 'learning_rate': 1.4563951381172574e-05, 'epoch': 0.7} {'loss': 0.7175, 'learning_rate': 1.4563660108795376e-05, 'epoch': 0.7} {'loss': 0.738, 'learning_rate': 1.4563368831527807e-05, 'epoch': 0.7} {'loss': 0.7862, 'learning_rate': 1.4563077549370176e-05, 'epoch': 0.7} {'loss': 0.7368, 'learning_rate': 1.4562786262322792e-05, 'epoch': 0.7} {'loss': 0.7652, 'learning_rate': 1.4562494970385976e-05, 'epoch': 0.7} {'loss': 0.8079, 'learning_rate': 1.4562203673560031e-05, 'epoch': 0.7} {'loss': 0.7299, 'learning_rate': 1.4561912371845273e-05, 'epoch': 0.7} {'loss': 0.8208, 'learning_rate': 1.4561621065242015e-05, 'epoch': 0.7} {'loss': 0.7665, 'learning_rate': 1.4561329753750567e-05, 'epoch': 0.7} {'loss': 0.9301, 'learning_rate': 1.4561038437371246e-05, 'epoch': 0.7} {'loss': 0.7829, 'learning_rate': 1.456074711610436e-05, 'epoch': 0.7} {'loss': 0.7599, 'learning_rate': 1.456045578995022e-05, 'epoch': 0.7} {'loss': 0.7813, 'learning_rate': 1.456016445890914e-05, 'epoch': 0.7} {'loss': 0.8479, 'learning_rate': 1.4559873122981434e-05, 'epoch': 0.7} {'loss': 0.8041, 'learning_rate': 1.455958178216741e-05, 'epoch': 0.7} {'loss': 0.8259, 'learning_rate': 1.4559290436467384e-05, 'epoch': 0.7} {'loss': 0.8725, 'learning_rate': 1.4558999085881666e-05, 'epoch': 0.7} {'loss': 0.7777, 'learning_rate': 1.455870773041057e-05, 'epoch': 0.7} {'loss': 0.7258, 'learning_rate': 1.4558416370054407e-05, 'epoch': 0.7} {'loss': 0.8193, 'learning_rate': 1.4558125004813489e-05, 'epoch': 0.7} {'loss': 0.9655, 'learning_rate': 1.4557833634688128e-05, 'epoch': 0.7} {'loss': 0.8021, 'learning_rate': 1.4557542259678637e-05, 'epoch': 0.7} {'loss': 0.7433, 'learning_rate': 1.455725087978533e-05, 'epoch': 0.7} {'loss': 0.6971, 'learning_rate': 1.4556959495008515e-05, 'epoch': 0.7} {'loss': 0.9782, 'learning_rate': 1.455666810534851e-05, 'epoch': 0.7} {'loss': 0.9249, 'learning_rate': 1.4556376710805622e-05, 'epoch': 0.7} {'loss': 0.8761, 'learning_rate': 1.4556085311380164e-05, 'epoch': 0.7} {'loss': 0.806, 'learning_rate': 1.4555793907072448e-05, 'epoch': 0.7} {'loss': 0.7473, 'learning_rate': 1.4555502497882792e-05, 'epoch': 0.7} {'loss': 0.73, 'learning_rate': 1.45552110838115e-05, 'epoch': 0.7} {'loss': 0.7046, 'learning_rate': 1.455491966485889e-05, 'epoch': 0.7} {'loss': 0.703, 'learning_rate': 1.4554628241025274e-05, 'epoch': 0.7} {'loss': 0.6666, 'learning_rate': 1.455433681231096e-05, 'epoch': 0.7} {'loss': 0.8229, 'learning_rate': 1.4554045378716264e-05, 'epoch': 0.7} {'loss': 0.7522, 'learning_rate': 1.4553753940241499e-05, 'epoch': 0.7} {'loss': 0.729, 'learning_rate': 1.4553462496886974e-05, 'epoch': 0.7} {'loss': 0.7565, 'learning_rate': 1.4553171048653004e-05, 'epoch': 0.7} {'loss': 0.7516, 'learning_rate': 1.4552879595539897e-05, 'epoch': 0.7} {'loss': 0.9698, 'learning_rate': 1.4552588137547972e-05, 'epoch': 0.7} {'loss': 0.7207, 'learning_rate': 1.4552296674677537e-05, 'epoch': 0.7} {'loss': 0.9575, 'learning_rate': 1.4552005206928905e-05, 'epoch': 0.7} {'loss': 0.8761, 'learning_rate': 1.455171373430239e-05, 'epoch': 0.7} {'loss': 0.937, 'learning_rate': 1.45514222567983e-05, 'epoch': 0.7} {'loss': 0.7774, 'learning_rate': 1.4551130774416952e-05, 'epoch': 0.7} {'loss': 0.9287, 'learning_rate': 1.4550839287158658e-05, 'epoch': 0.7} {'loss': 0.8765, 'learning_rate': 1.4550547795023726e-05, 'epoch': 0.7} {'loss': 0.6367, 'learning_rate': 1.4550256298012472e-05, 'epoch': 0.7} {'loss': 0.71, 'learning_rate': 1.4549964796125211e-05, 'epoch': 0.7} {'loss': 0.7742, 'learning_rate': 1.4549673289362249e-05, 'epoch': 0.7} {'loss': 0.9316, 'learning_rate': 1.4549381777723902e-05, 'epoch': 0.7} {'loss': 0.7783, 'learning_rate': 1.454909026121048e-05, 'epoch': 0.7} {'loss': 0.9171, 'learning_rate': 1.4548798739822301e-05, 'epoch': 0.7} {'loss': 0.9151, 'learning_rate': 1.454850721355967e-05, 'epoch': 0.7} {'loss': 0.7594, 'learning_rate': 1.4548215682422909e-05, 'epoch': 0.7} {'loss': 0.9376, 'learning_rate': 1.4547924146412317e-05, 'epoch': 0.7} {'loss': 0.6984, 'learning_rate': 1.4547632605528216e-05, 'epoch': 0.7} {'loss': 0.6407, 'learning_rate': 1.4547341059770918e-05, 'epoch': 0.7} {'loss': 0.9435, 'learning_rate': 1.4547049509140731e-05, 'epoch': 0.7} {'loss': 0.8162, 'learning_rate': 1.4546757953637973e-05, 'epoch': 0.7} {'loss': 1.0216, 'learning_rate': 1.4546466393262955e-05, 'epoch': 0.7} {'loss': 0.9029, 'learning_rate': 1.4546174828015984e-05, 'epoch': 0.7} {'loss': 0.7275, 'learning_rate': 1.4545883257897378e-05, 'epoch': 0.7} {'loss': 1.072, 'learning_rate': 1.4545591682907444e-05, 'epoch': 0.7} {'loss': 1.0189, 'learning_rate': 1.4545300103046502e-05, 'epoch': 0.7} {'loss': 0.6978, 'learning_rate': 1.454500851831486e-05, 'epoch': 0.7} {'loss': 0.8224, 'learning_rate': 1.4544716928712833e-05, 'epoch': 0.7} {'loss': 0.8422, 'learning_rate': 1.454442533424073e-05, 'epoch': 0.7} {'loss': 0.668, 'learning_rate': 1.4544133734898864e-05, 'epoch': 0.7} {'loss': 0.623, 'learning_rate': 1.454384213068755e-05, 'epoch': 0.7} {'loss': 0.8888, 'learning_rate': 1.45435505216071e-05, 'epoch': 0.7} {'loss': 0.8771, 'learning_rate': 1.4543258907657823e-05, 'epoch': 0.7} {'loss': 0.8934, 'learning_rate': 1.4542967288840033e-05, 'epoch': 0.7} {'loss': 0.8821, 'learning_rate': 1.4542675665154047e-05, 'epoch': 0.7} {'loss': 0.9018, 'learning_rate': 1.4542384036600176e-05, 'epoch': 0.7} {'loss': 0.7934, 'learning_rate': 1.4542092403178727e-05, 'epoch': 0.7} {'loss': 0.9639, 'learning_rate': 1.4541800764890015e-05, 'epoch': 0.7} {'loss': 0.8386, 'learning_rate': 1.4541509121734355e-05, 'epoch': 0.7} {'loss': 0.7928, 'learning_rate': 1.4541217473712057e-05, 'epoch': 0.7} {'loss': 1.0873, 'learning_rate': 1.4540925820823437e-05, 'epoch': 0.7} {'loss': 0.9941, 'learning_rate': 1.4540634163068803e-05, 'epoch': 0.7} {'loss': 0.9608, 'learning_rate': 1.4540342500448472e-05, 'epoch': 0.7} {'loss': 0.875, 'learning_rate': 1.454005083296275e-05, 'epoch': 0.7} {'loss': 0.9118, 'learning_rate': 1.4539759160611957e-05, 'epoch': 0.7} {'loss': 0.7782, 'learning_rate': 1.45394674833964e-05, 'epoch': 0.7} {'loss': 0.8175, 'learning_rate': 1.4539175801316397e-05, 'epoch': 0.7} {'loss': 0.6385, 'learning_rate': 1.4538884114372259e-05, 'epoch': 0.7} {'loss': 0.8067, 'learning_rate': 1.4538592422564293e-05, 'epoch': 0.7} {'loss': 0.8605, 'learning_rate': 1.4538300725892817e-05, 'epoch': 0.7} {'loss': 0.7425, 'learning_rate': 1.4538009024358142e-05, 'epoch': 0.7} {'loss': 1.0721, 'learning_rate': 1.4537717317960577e-05, 'epoch': 0.7} {'loss': 0.7721, 'learning_rate': 1.4537425606700444e-05, 'epoch': 0.7} {'loss': 0.8354, 'learning_rate': 1.4537133890578047e-05, 'epoch': 0.7} {'loss': 0.7697, 'learning_rate': 1.4536842169593703e-05, 'epoch': 0.7} {'loss': 0.7222, 'learning_rate': 1.4536550443747724e-05, 'epoch': 0.7} {'loss': 0.8253, 'learning_rate': 1.4536258713040421e-05, 'epoch': 0.7} {'loss': 1.0456, 'learning_rate': 1.4535966977472104e-05, 'epoch': 0.7} {'loss': 0.7686, 'learning_rate': 1.4535675237043092e-05, 'epoch': 0.7} {'loss': 0.8112, 'learning_rate': 1.4535383491753697e-05, 'epoch': 0.7} {'loss': 0.6392, 'learning_rate': 1.4535091741604226e-05, 'epoch': 0.7} {'loss': 0.8818, 'learning_rate': 1.4534799986594994e-05, 'epoch': 0.7} {'loss': 0.7952, 'learning_rate': 1.4534508226726317e-05, 'epoch': 0.7} {'loss': 0.6698, 'learning_rate': 1.4534216461998503e-05, 'epoch': 0.7} {'loss': 0.737, 'learning_rate': 1.4533924692411867e-05, 'epoch': 0.7} {'loss': 0.9845, 'learning_rate': 1.4533632917966725e-05, 'epoch': 0.7} {'loss': 0.8094, 'learning_rate': 1.4533341138663382e-05, 'epoch': 0.7} {'loss': 0.8889, 'learning_rate': 1.4533049354502156e-05, 'epoch': 0.7} {'loss': 0.836, 'learning_rate': 1.4532757565483358e-05, 'epoch': 0.7} {'loss': 0.8032, 'learning_rate': 1.4532465771607305e-05, 'epoch': 0.7} {'loss': 0.7647, 'learning_rate': 1.4532173972874302e-05, 'epoch': 0.7} {'loss': 0.8497, 'learning_rate': 1.4531882169284664e-05, 'epoch': 0.7} {'loss': 0.8336, 'learning_rate': 1.453159036083871e-05, 'epoch': 0.7} {'loss': 0.8705, 'learning_rate': 1.4531298547536744e-05, 'epoch': 0.7} {'loss': 0.7936, 'learning_rate': 1.4531006729379085e-05, 'epoch': 0.7} {'loss': 0.8185, 'learning_rate': 1.4530714906366041e-05, 'epoch': 0.7} {'loss': 0.7208, 'learning_rate': 1.453042307849793e-05, 'epoch': 0.7} {'loss': 0.9488, 'learning_rate': 1.4530131245775061e-05, 'epoch': 0.7} {'loss': 0.8383, 'learning_rate': 1.4529839408197748e-05, 'epoch': 0.7} {'loss': 0.7588, 'learning_rate': 1.45295475657663e-05, 'epoch': 0.7} {'loss': 0.8841, 'learning_rate': 1.4529255718481034e-05, 'epoch': 0.7} {'loss': 0.6571, 'learning_rate': 1.4528963866342262e-05, 'epoch': 0.7} {'loss': 0.7138, 'learning_rate': 1.45286720093503e-05, 'epoch': 0.7} {'loss': 0.7112, 'learning_rate': 1.4528380147505451e-05, 'epoch': 0.7} {'loss': 0.814, 'learning_rate': 1.4528088280808042e-05, 'epoch': 0.7} {'loss': 0.7882, 'learning_rate': 1.452779640925837e-05, 'epoch': 0.7} {'loss': 0.8184, 'learning_rate': 1.452750453285676e-05, 'epoch': 0.7} {'loss': 0.7636, 'learning_rate': 1.4527212651603517e-05, 'epoch': 0.7} {'loss': 0.8692, 'learning_rate': 1.4526920765498958e-05, 'epoch': 0.7} {'loss': 0.7787, 'learning_rate': 1.4526628874543397e-05, 'epoch': 0.7} {'loss': 0.9154, 'learning_rate': 1.4526336978737143e-05, 'epoch': 0.71} {'loss': 0.8902, 'learning_rate': 1.4526045078080513e-05, 'epoch': 0.71} {'loss': 0.8009, 'learning_rate': 1.4525753172573814e-05, 'epoch': 0.71} {'loss': 0.8641, 'learning_rate': 1.4525461262217362e-05, 'epoch': 0.71} {'loss': 0.6796, 'learning_rate': 1.452516934701147e-05, 'epoch': 0.71} {'loss': 0.6614, 'learning_rate': 1.4524877426956452e-05, 'epoch': 0.71} {'loss': 0.8733, 'learning_rate': 1.452458550205262e-05, 'epoch': 0.71} {'loss': 0.8693, 'learning_rate': 1.4524293572300286e-05, 'epoch': 0.71} {'loss': 0.7661, 'learning_rate': 1.452400163769976e-05, 'epoch': 0.71} {'loss': 0.8788, 'learning_rate': 1.452370969825136e-05, 'epoch': 0.71} {'loss': 0.7793, 'learning_rate': 1.4523417753955396e-05, 'epoch': 0.71} {'loss': 0.8653, 'learning_rate': 1.4523125804812183e-05, 'epoch': 0.71} {'loss': 0.7891, 'learning_rate': 1.4522833850822032e-05, 'epoch': 0.71} {'loss': 0.8223, 'learning_rate': 1.4522541891985256e-05, 'epoch': 0.71} {'loss': 0.7538, 'learning_rate': 1.4522249928302171e-05, 'epoch': 0.71} {'loss': 0.9067, 'learning_rate': 1.4521957959773083e-05, 'epoch': 0.71} {'loss': 0.7347, 'learning_rate': 1.452166598639831e-05, 'epoch': 0.71} {'loss': 0.8993, 'learning_rate': 1.4521374008178164e-05, 'epoch': 0.71} {'loss': 0.8003, 'learning_rate': 1.4521082025112956e-05, 'epoch': 0.71} {'loss': 0.9833, 'learning_rate': 1.4520790037203006e-05, 'epoch': 0.71} {'loss': 0.874, 'learning_rate': 1.4520498044448617e-05, 'epoch': 0.71} {'loss': 0.6838, 'learning_rate': 1.4520206046850107e-05, 'epoch': 0.71} {'loss': 0.8284, 'learning_rate': 1.4519914044407787e-05, 'epoch': 0.71} {'loss': 0.8388, 'learning_rate': 1.4519622037121972e-05, 'epoch': 0.71} {'loss': 0.8204, 'learning_rate': 1.4519330024992975e-05, 'epoch': 0.71} {'loss': 0.9249, 'learning_rate': 1.4519038008021107e-05, 'epoch': 0.71} {'loss': 0.8533, 'learning_rate': 1.4518745986206683e-05, 'epoch': 0.71} {'loss': 0.8322, 'learning_rate': 1.4518453959550014e-05, 'epoch': 0.71} {'loss': 0.6967, 'learning_rate': 1.4518161928051416e-05, 'epoch': 0.71} {'loss': 0.7841, 'learning_rate': 1.4517869891711196e-05, 'epoch': 0.71} {'loss': 0.725, 'learning_rate': 1.4517577850529674e-05, 'epoch': 0.71} {'loss': 0.8247, 'learning_rate': 1.4517285804507158e-05, 'epoch': 0.71} {'loss': 0.8352, 'learning_rate': 1.4516993753643962e-05, 'epoch': 0.71} {'loss': 0.9145, 'learning_rate': 1.4516701697940399e-05, 'epoch': 0.71} {'loss': 0.7736, 'learning_rate': 1.4516409637396787e-05, 'epoch': 0.71} {'loss': 0.9772, 'learning_rate': 1.4516117572013428e-05, 'epoch': 0.71} {'loss': 0.6498, 'learning_rate': 1.4515825501790643e-05, 'epoch': 0.71} {'loss': 0.8306, 'learning_rate': 1.4515533426728747e-05, 'epoch': 0.71} {'loss': 0.7496, 'learning_rate': 1.4515241346828049e-05, 'epoch': 0.71} {'loss': 1.0096, 'learning_rate': 1.451494926208886e-05, 'epoch': 0.71} {'loss': 0.7802, 'learning_rate': 1.4514657172511495e-05, 'epoch': 0.71} {'loss': 0.927, 'learning_rate': 1.4514365078096269e-05, 'epoch': 0.71} {'loss': 0.7383, 'learning_rate': 1.4514072978843492e-05, 'epoch': 0.71} {'loss': 0.7371, 'learning_rate': 1.4513780874753478e-05, 'epoch': 0.71} {'loss': 0.8466, 'learning_rate': 1.451348876582654e-05, 'epoch': 0.71} {'loss': 0.9983, 'learning_rate': 1.4513196652062996e-05, 'epoch': 0.71} {'loss': 0.8141, 'learning_rate': 1.451290453346315e-05, 'epoch': 0.71} {'loss': 0.7374, 'learning_rate': 1.451261241002732e-05, 'epoch': 0.71} {'loss': 0.8628, 'learning_rate': 1.4512320281755821e-05, 'epoch': 0.71} {'loss': 0.8491, 'learning_rate': 1.451202814864896e-05, 'epoch': 0.71} {'loss': 0.8356, 'learning_rate': 1.4511736010707056e-05, 'epoch': 0.71} {'loss': 0.8991, 'learning_rate': 1.4511443867930421e-05, 'epoch': 0.71} {'loss': 0.7875, 'learning_rate': 1.4511151720319365e-05, 'epoch': 0.71} {'loss': 0.9141, 'learning_rate': 1.45108595678742e-05, 'epoch': 0.71} {'loss': 0.8461, 'learning_rate': 1.4510567410595245e-05, 'epoch': 0.71} {'loss': 0.6698, 'learning_rate': 1.451027524848281e-05, 'epoch': 0.71} {'loss': 0.7104, 'learning_rate': 1.4509983081537206e-05, 'epoch': 0.71} {'loss': 0.7366, 'learning_rate': 1.4509690909758751e-05, 'epoch': 0.71} {'loss': 0.7431, 'learning_rate': 1.4509398733147755e-05, 'epoch': 0.71} {'loss': 0.9509, 'learning_rate': 1.4509106551704528e-05, 'epoch': 0.71} {'loss': 0.7486, 'learning_rate': 1.450881436542939e-05, 'epoch': 0.71} {'loss': 0.6299, 'learning_rate': 1.4508522174322645e-05, 'epoch': 0.71} {'loss': 0.7388, 'learning_rate': 1.4508229978384619e-05, 'epoch': 0.71} {'loss': 0.8543, 'learning_rate': 1.4507937777615616e-05, 'epoch': 0.71} {'loss': 0.7595, 'learning_rate': 1.4507645572015947e-05, 'epoch': 0.71} {'loss': 0.7908, 'learning_rate': 1.450735336158593e-05, 'epoch': 0.71} {'loss': 0.9068, 'learning_rate': 1.4507061146325879e-05, 'epoch': 0.71} {'loss': 0.9542, 'learning_rate': 1.4506768926236102e-05, 'epoch': 0.71} {'loss': 0.8249, 'learning_rate': 1.4506476701316916e-05, 'epoch': 0.71} {'loss': 0.9141, 'learning_rate': 1.4506184471568635e-05, 'epoch': 0.71} {'loss': 0.7554, 'learning_rate': 1.4505892236991573e-05, 'epoch': 0.71} {'loss': 0.9293, 'learning_rate': 1.4505599997586038e-05, 'epoch': 0.71} {'loss': 0.9182, 'learning_rate': 1.4505307753352344e-05, 'epoch': 0.71} {'loss': 0.847, 'learning_rate': 1.450501550429081e-05, 'epoch': 0.71} {'loss': 0.6584, 'learning_rate': 1.4504723250401741e-05, 'epoch': 0.71} {'loss': 0.9147, 'learning_rate': 1.4504430991685458e-05, 'epoch': 0.71} {'loss': 0.8764, 'learning_rate': 1.4504138728142269e-05, 'epoch': 0.71} {'loss': 0.8995, 'learning_rate': 1.4503846459772493e-05, 'epoch': 0.71} {'loss': 0.7148, 'learning_rate': 1.4503554186576434e-05, 'epoch': 0.71} {'loss': 0.9642, 'learning_rate': 1.4503261908554411e-05, 'epoch': 0.71} {'loss': 0.7003, 'learning_rate': 1.4502969625706735e-05, 'epoch': 0.71} {'loss': 0.8909, 'learning_rate': 1.4502677338033724e-05, 'epoch': 0.71} {'loss': 0.95, 'learning_rate': 1.4502385045535687e-05, 'epoch': 0.71} {'loss': 0.8737, 'learning_rate': 1.450209274821294e-05, 'epoch': 0.71} {'loss': 0.682, 'learning_rate': 1.450180044606579e-05, 'epoch': 0.71} {'loss': 0.7637, 'learning_rate': 1.4501508139094558e-05, 'epoch': 0.71} {'loss': 0.7733, 'learning_rate': 1.450121582729955e-05, 'epoch': 0.71} {'loss': 0.8572, 'learning_rate': 1.4500923510681083e-05, 'epoch': 0.71} {'loss': 0.7095, 'learning_rate': 1.4500631189239474e-05, 'epoch': 0.71} {'loss': 0.9038, 'learning_rate': 1.4500338862975032e-05, 'epoch': 0.71} {'loss': 0.6412, 'learning_rate': 1.450004653188807e-05, 'epoch': 0.71} {'loss': 0.8397, 'learning_rate': 1.4499754195978901e-05, 'epoch': 0.71} {'loss': 0.9736, 'learning_rate': 1.4499461855247841e-05, 'epoch': 0.71} {'loss': 0.8656, 'learning_rate': 1.4499169509695198e-05, 'epoch': 0.71} {'loss': 0.8856, 'learning_rate': 1.4498877159321292e-05, 'epoch': 0.71} {'loss': 0.8385, 'learning_rate': 1.4498584804126432e-05, 'epoch': 0.71} {'loss': 0.8188, 'learning_rate': 1.4498292444110932e-05, 'epoch': 0.71} {'loss': 0.9231, 'learning_rate': 1.4498000079275107e-05, 'epoch': 0.71} {'loss': 0.7646, 'learning_rate': 1.449770770961927e-05, 'epoch': 0.71} {'loss': 0.6813, 'learning_rate': 1.449741533514373e-05, 'epoch': 0.71} {'loss': 0.7857, 'learning_rate': 1.4497122955848804e-05, 'epoch': 0.71} {'loss': 0.8745, 'learning_rate': 1.4496830571734809e-05, 'epoch': 0.71} {'loss': 0.8037, 'learning_rate': 1.449653818280205e-05, 'epoch': 0.71} {'loss': 0.7997, 'learning_rate': 1.4496245789050845e-05, 'epoch': 0.71} {'loss': 0.7274, 'learning_rate': 1.4495953390481507e-05, 'epoch': 0.71} {'loss': 0.9343, 'learning_rate': 1.449566098709435e-05, 'epoch': 0.71} {'loss': 0.7515, 'learning_rate': 1.4495368578889686e-05, 'epoch': 0.71} {'loss': 0.9704, 'learning_rate': 1.4495076165867827e-05, 'epoch': 0.71} {'loss': 0.7221, 'learning_rate': 1.4494783748029091e-05, 'epoch': 0.71} {'loss': 0.9045, 'learning_rate': 1.4494491325373787e-05, 'epoch': 0.71} {'loss': 0.8073, 'learning_rate': 1.449419889790223e-05, 'epoch': 0.71} {'loss': 0.8751, 'learning_rate': 1.4493906465614736e-05, 'epoch': 0.71} {'loss': 1.0068, 'learning_rate': 1.4493614028511611e-05, 'epoch': 0.71} {'loss': 0.8513, 'learning_rate': 1.4493321586593174e-05, 'epoch': 0.71} {'loss': 0.9745, 'learning_rate': 1.449302913985974e-05, 'epoch': 0.71} {'loss': 0.8784, 'learning_rate': 1.4492736688311619e-05, 'epoch': 0.71} {'loss': 0.6856, 'learning_rate': 1.4492444231949123e-05, 'epoch': 0.71} {'loss': 0.7729, 'learning_rate': 1.4492151770772571e-05, 'epoch': 0.71} {'loss': 0.8505, 'learning_rate': 1.449185930478227e-05, 'epoch': 0.71} {'loss': 0.8848, 'learning_rate': 1.4491566833978539e-05, 'epoch': 0.71} {'loss': 0.7529, 'learning_rate': 1.4491274358361686e-05, 'epoch': 0.71} {'loss': 0.6959, 'learning_rate': 1.4490981877932029e-05, 'epoch': 0.71} {'loss': 0.6841, 'learning_rate': 1.4490689392689878e-05, 'epoch': 0.71} {'loss': 0.9362, 'learning_rate': 1.4490396902635548e-05, 'epoch': 0.71} {'loss': 0.7253, 'learning_rate': 1.4490104407769355e-05, 'epoch': 0.71} {'loss': 0.6739, 'learning_rate': 1.4489811908091608e-05, 'epoch': 0.71} {'loss': 0.8866, 'learning_rate': 1.4489519403602623e-05, 'epoch': 0.71} {'loss': 0.6575, 'learning_rate': 1.4489226894302713e-05, 'epoch': 0.71} {'loss': 0.7636, 'learning_rate': 1.448893438019219e-05, 'epoch': 0.71} {'loss': 0.8663, 'learning_rate': 1.4488641861271369e-05, 'epoch': 0.71} {'loss': 0.8886, 'learning_rate': 1.4488349337540562e-05, 'epoch': 0.71} {'loss': 0.8021, 'learning_rate': 1.4488056809000086e-05, 'epoch': 0.71} {'loss': 0.8988, 'learning_rate': 1.4487764275650249e-05, 'epoch': 0.71} {'loss': 0.8825, 'learning_rate': 1.4487471737491372e-05, 'epoch': 0.71} {'loss': 0.9076, 'learning_rate': 1.4487179194523759e-05, 'epoch': 0.71} {'loss': 0.6727, 'learning_rate': 1.4486886646747733e-05, 'epoch': 0.71} {'loss': 0.8696, 'learning_rate': 1.4486594094163599e-05, 'epoch': 0.71} {'loss': 0.8934, 'learning_rate': 1.4486301536771677e-05, 'epoch': 0.71} {'loss': 0.7967, 'learning_rate': 1.4486008974572277e-05, 'epoch': 0.71} {'loss': 0.6098, 'learning_rate': 1.4485716407565715e-05, 'epoch': 0.71} {'loss': 0.9217, 'learning_rate': 1.4485423835752301e-05, 'epoch': 0.71} {'loss': 0.8121, 'learning_rate': 1.4485131259132352e-05, 'epoch': 0.71} {'loss': 0.916, 'learning_rate': 1.4484838677706178e-05, 'epoch': 0.71} {'loss': 0.8539, 'learning_rate': 1.4484546091474096e-05, 'epoch': 0.71} {'loss': 0.9119, 'learning_rate': 1.4484253500436417e-05, 'epoch': 0.71} {'loss': 1.0036, 'learning_rate': 1.4483960904593459e-05, 'epoch': 0.71} {'loss': 0.7099, 'learning_rate': 1.4483668303945533e-05, 'epoch': 0.71} {'loss': 0.7948, 'learning_rate': 1.4483375698492946e-05, 'epoch': 0.71} {'loss': 0.846, 'learning_rate': 1.448308308823602e-05, 'epoch': 0.71} {'loss': 0.877, 'learning_rate': 1.4482790473175065e-05, 'epoch': 0.71} {'loss': 0.805, 'learning_rate': 1.4482497853310396e-05, 'epoch': 0.71} {'loss': 0.8331, 'learning_rate': 1.4482205228642328e-05, 'epoch': 0.71} {'loss': 0.8896, 'learning_rate': 1.4481912599171168e-05, 'epoch': 0.71} {'loss': 0.8133, 'learning_rate': 1.448161996489724e-05, 'epoch': 0.71} {'loss': 0.8798, 'learning_rate': 1.4481327325820849e-05, 'epoch': 0.71} {'loss': 0.757, 'learning_rate': 1.448103468194231e-05, 'epoch': 0.71} {'loss': 0.7672, 'learning_rate': 1.4480742033261939e-05, 'epoch': 0.71} {'loss': 0.8643, 'learning_rate': 1.4480449379780046e-05, 'epoch': 0.71} {'loss': 0.7368, 'learning_rate': 1.4480156721496952e-05, 'epoch': 0.71} {'loss': 0.7965, 'learning_rate': 1.4479864058412964e-05, 'epoch': 0.71} {'loss': 0.7444, 'learning_rate': 1.4479571390528394e-05, 'epoch': 0.71} {'loss': 0.6492, 'learning_rate': 1.4479278717843564e-05, 'epoch': 0.71} {'loss': 0.6571, 'learning_rate': 1.4478986040358779e-05, 'epoch': 0.71} {'loss': 0.7665, 'learning_rate': 1.4478693358074356e-05, 'epoch': 0.71} {'loss': 0.9853, 'learning_rate': 1.447840067099061e-05, 'epoch': 0.71} {'loss': 0.7703, 'learning_rate': 1.4478107979107854e-05, 'epoch': 0.71} {'loss': 0.7263, 'learning_rate': 1.4477815282426402e-05, 'epoch': 0.71} {'loss': 0.8182, 'learning_rate': 1.4477522580946563e-05, 'epoch': 0.71} {'loss': 0.6971, 'learning_rate': 1.447722987466866e-05, 'epoch': 0.71} {'loss': 0.6932, 'learning_rate': 1.4476937163592997e-05, 'epoch': 0.71} {'loss': 0.8272, 'learning_rate': 1.4476644447719891e-05, 'epoch': 0.71} {'loss': 0.8509, 'learning_rate': 1.447635172704966e-05, 'epoch': 0.71} {'loss': 0.8127, 'learning_rate': 1.4476059001582611e-05, 'epoch': 0.71} {'loss': 0.8951, 'learning_rate': 1.4475766271319063e-05, 'epoch': 0.71} {'loss': 0.8632, 'learning_rate': 1.4475473536259325e-05, 'epoch': 0.71} {'loss': 0.7281, 'learning_rate': 1.4475180796403716e-05, 'epoch': 0.71} {'loss': 0.8477, 'learning_rate': 1.4474888051752544e-05, 'epoch': 0.71} {'loss': 0.9356, 'learning_rate': 1.447459530230613e-05, 'epoch': 0.71} {'loss': 0.7251, 'learning_rate': 1.4474302548064778e-05, 'epoch': 0.71} {'loss': 0.8412, 'learning_rate': 1.4474009789028809e-05, 'epoch': 0.71} {'loss': 0.8318, 'learning_rate': 1.4473717025198537e-05, 'epoch': 0.71} {'loss': 0.8638, 'learning_rate': 1.447342425657427e-05, 'epoch': 0.71} {'loss': 0.8834, 'learning_rate': 1.4473131483156326e-05, 'epoch': 0.71} {'loss': 0.882, 'learning_rate': 1.447283870494502e-05, 'epoch': 0.71} {'loss': 0.7147, 'learning_rate': 1.4472545921940664e-05, 'epoch': 0.71} {'loss': 0.8814, 'learning_rate': 1.4472253134143568e-05, 'epoch': 0.71} {'loss': 0.865, 'learning_rate': 1.447196034155405e-05, 'epoch': 0.71} {'loss': 0.9076, 'learning_rate': 1.4471667544172424e-05, 'epoch': 0.71} {'loss': 0.92, 'learning_rate': 1.4471374741999002e-05, 'epoch': 0.71} {'loss': 0.89, 'learning_rate': 1.44710819350341e-05, 'epoch': 0.71} {'loss': 0.9795, 'learning_rate': 1.4470789123278028e-05, 'epoch': 0.71} {'loss': 0.9746, 'learning_rate': 1.4470496306731103e-05, 'epoch': 0.71} {'loss': 0.6224, 'learning_rate': 1.4470203485393637e-05, 'epoch': 0.71} {'loss': 0.9428, 'learning_rate': 1.4469910659265947e-05, 'epoch': 0.71} {'loss': 0.851, 'learning_rate': 1.4469617828348342e-05, 'epoch': 0.71} {'loss': 0.716, 'learning_rate': 1.4469324992641138e-05, 'epoch': 0.71} {'loss': 0.9434, 'learning_rate': 1.4469032152144648e-05, 'epoch': 0.71} {'loss': 0.801, 'learning_rate': 1.4468739306859187e-05, 'epoch': 0.71} {'loss': 0.7415, 'learning_rate': 1.4468446456785071e-05, 'epoch': 0.71} {'loss': 0.7433, 'learning_rate': 1.4468153601922608e-05, 'epoch': 0.71} {'loss': 0.8577, 'learning_rate': 1.4467860742272119e-05, 'epoch': 0.71} {'loss': 0.8292, 'learning_rate': 1.446756787783391e-05, 'epoch': 0.71} {'loss': 0.8865, 'learning_rate': 1.4467275008608304e-05, 'epoch': 0.71} {'loss': 0.7774, 'learning_rate': 1.4466982134595603e-05, 'epoch': 0.71} {'loss': 1.0018, 'learning_rate': 1.4466689255796132e-05, 'epoch': 0.71} {'loss': 0.7808, 'learning_rate': 1.4466396372210199e-05, 'epoch': 0.71} {'loss': 0.8508, 'learning_rate': 1.4466103483838118e-05, 'epoch': 0.71} {'loss': 0.9615, 'learning_rate': 1.4465810590680207e-05, 'epoch': 0.71} {'loss': 0.7899, 'learning_rate': 1.4465517692736777e-05, 'epoch': 0.71} {'loss': 0.8135, 'learning_rate': 1.4465224790008139e-05, 'epoch': 0.71} {'loss': 1.0428, 'learning_rate': 1.4464931882494608e-05, 'epoch': 0.71} {'loss': 0.84, 'learning_rate': 1.4464638970196502e-05, 'epoch': 0.71} {'loss': 0.7077, 'learning_rate': 1.4464346053114133e-05, 'epoch': 0.71} {'loss': 1.061, 'learning_rate': 1.4464053131247814e-05, 'epoch': 0.71} {'loss': 0.7416, 'learning_rate': 1.4463760204597858e-05, 'epoch': 0.71} {'loss': 0.7111, 'learning_rate': 1.4463467273164584e-05, 'epoch': 0.71} {'loss': 0.8788, 'learning_rate': 1.4463174336948298e-05, 'epoch': 0.71} {'loss': 0.8725, 'learning_rate': 1.4462881395949317e-05, 'epoch': 0.71} {'loss': 0.8665, 'learning_rate': 1.4462588450167959e-05, 'epoch': 0.71} {'loss': 0.8382, 'learning_rate': 1.446229549960453e-05, 'epoch': 0.71} {'loss': 0.9315, 'learning_rate': 1.4462002544259352e-05, 'epoch': 0.71} {'loss': 0.8524, 'learning_rate': 1.4461709584132737e-05, 'epoch': 0.71} {'loss': 0.8863, 'learning_rate': 1.4461416619224997e-05, 'epoch': 0.71} {'loss': 0.763, 'learning_rate': 1.4461123649536445e-05, 'epoch': 0.71} {'loss': 0.6334, 'learning_rate': 1.4460830675067396e-05, 'epoch': 0.71} {'loss': 0.7515, 'learning_rate': 1.4460537695818163e-05, 'epoch': 0.71} {'loss': 0.7919, 'learning_rate': 1.4460244711789065e-05, 'epoch': 0.71} {'loss': 0.6942, 'learning_rate': 1.4459951722980411e-05, 'epoch': 0.71} {'loss': 0.9112, 'learning_rate': 1.4459658729392515e-05, 'epoch': 0.71} {'loss': 0.8938, 'learning_rate': 1.4459365731025693e-05, 'epoch': 0.71} {'loss': 0.864, 'learning_rate': 1.4459072727880259e-05, 'epoch': 0.71} {'loss': 0.7572, 'learning_rate': 1.4458779719956523e-05, 'epoch': 0.71} {'loss': 0.9033, 'learning_rate': 1.4458486707254803e-05, 'epoch': 0.71} {'loss': 1.0015, 'learning_rate': 1.4458193689775417e-05, 'epoch': 0.71} {'loss': 0.8371, 'learning_rate': 1.4457900667518669e-05, 'epoch': 0.71} {'loss': 0.7252, 'learning_rate': 1.445760764048488e-05, 'epoch': 0.71} {'loss': 0.8739, 'learning_rate': 1.4457314608674362e-05, 'epoch': 0.71} {'loss': 0.8897, 'learning_rate': 1.4457021572087428e-05, 'epoch': 0.71} {'loss': 0.7659, 'learning_rate': 1.4456728530724394e-05, 'epoch': 0.71} {'loss': 0.8281, 'learning_rate': 1.4456435484585574e-05, 'epoch': 0.71} {'loss': 0.8338, 'learning_rate': 1.445614243367128e-05, 'epoch': 0.71} {'loss': 0.7102, 'learning_rate': 1.4455849377981826e-05, 'epoch': 0.71} {'loss': 0.8227, 'learning_rate': 1.445555631751753e-05, 'epoch': 0.71} {'loss': 0.9684, 'learning_rate': 1.4455263252278701e-05, 'epoch': 0.71} {'loss': 0.9028, 'learning_rate': 1.4454970182265655e-05, 'epoch': 0.71} {'loss': 0.8191, 'learning_rate': 1.4454677107478707e-05, 'epoch': 0.71} {'loss': 0.8115, 'learning_rate': 1.4454384027918173e-05, 'epoch': 0.71} {'loss': 0.745, 'learning_rate': 1.4454090943584363e-05, 'epoch': 0.71} {'loss': 0.9278, 'learning_rate': 1.445379785447759e-05, 'epoch': 0.71} {'loss': 0.8125, 'learning_rate': 1.4453504760598174e-05, 'epoch': 0.71} {'loss': 0.7494, 'learning_rate': 1.4453211661946425e-05, 'epoch': 0.71} {'loss': 0.8268, 'learning_rate': 1.4452918558522656e-05, 'epoch': 0.71} {'loss': 0.8765, 'learning_rate': 1.4452625450327185e-05, 'epoch': 0.71} {'loss': 0.8853, 'learning_rate': 1.4452332337360322e-05, 'epoch': 0.71} {'loss': 0.8272, 'learning_rate': 1.4452039219622382e-05, 'epoch': 0.71} {'loss': 0.9097, 'learning_rate': 1.4451746097113681e-05, 'epoch': 0.71} {'loss': 0.8905, 'learning_rate': 1.4451452969834536e-05, 'epoch': 0.71} {'loss': 0.7412, 'learning_rate': 1.4451159837785254e-05, 'epoch': 0.71} {'loss': 0.6917, 'learning_rate': 1.4450866700966155e-05, 'epoch': 0.71} {'loss': 0.8409, 'learning_rate': 1.4450573559377548e-05, 'epoch': 0.71} {'loss': 0.6891, 'learning_rate': 1.445028041301975e-05, 'epoch': 0.71} {'loss': 0.7894, 'learning_rate': 1.4449987261893075e-05, 'epoch': 0.71} {'loss': 0.8932, 'learning_rate': 1.4449694105997835e-05, 'epoch': 0.71} {'loss': 0.735, 'learning_rate': 1.444940094533435e-05, 'epoch': 0.71} {'loss': 0.7355, 'learning_rate': 1.444910777990293e-05, 'epoch': 0.71} {'loss': 0.844, 'learning_rate': 1.4448814609703886e-05, 'epoch': 0.71} {'loss': 0.7156, 'learning_rate': 1.4448521434737539e-05, 'epoch': 0.71} {'loss': 0.872, 'learning_rate': 1.44482282550042e-05, 'epoch': 0.71} {'loss': 0.9458, 'learning_rate': 1.444793507050418e-05, 'epoch': 0.71} {'loss': 1.025, 'learning_rate': 1.4447641881237799e-05, 'epoch': 0.71} {'loss': 0.8786, 'learning_rate': 1.4447348687205366e-05, 'epoch': 0.71} {'loss': 0.9048, 'learning_rate': 1.44470554884072e-05, 'epoch': 0.71} {'loss': 0.7148, 'learning_rate': 1.4446762284843612e-05, 'epoch': 0.71} {'loss': 0.8039, 'learning_rate': 1.4446469076514915e-05, 'epoch': 0.71} {'loss': 0.7594, 'learning_rate': 1.4446175863421426e-05, 'epoch': 0.71} {'loss': 0.8741, 'learning_rate': 1.4445882645563458e-05, 'epoch': 0.71} {'loss': 0.753, 'learning_rate': 1.4445589422941326e-05, 'epoch': 0.71} {'loss': 0.8426, 'learning_rate': 1.4445296195555345e-05, 'epoch': 0.71} {'loss': 0.7922, 'learning_rate': 1.4445002963405825e-05, 'epoch': 0.71} {'loss': 0.7475, 'learning_rate': 1.4444709726493085e-05, 'epoch': 0.71} {'loss': 0.7545, 'learning_rate': 1.4444416484817436e-05, 'epoch': 0.71} {'loss': 0.8834, 'learning_rate': 1.4444123238379196e-05, 'epoch': 0.71} {'loss': 0.8855, 'learning_rate': 1.4443829987178673e-05, 'epoch': 0.71} {'loss': 0.7179, 'learning_rate': 1.444353673121619e-05, 'epoch': 0.71} {'loss': 0.7609, 'learning_rate': 1.4443243470492054e-05, 'epoch': 0.71} {'loss': 0.6954, 'learning_rate': 1.444295020500658e-05, 'epoch': 0.71} {'loss': 0.8384, 'learning_rate': 1.4442656934760086e-05, 'epoch': 0.71} {'loss': 0.8338, 'learning_rate': 1.4442363659752883e-05, 'epoch': 0.71} {'loss': 0.57, 'learning_rate': 1.4442070379985287e-05, 'epoch': 0.71} {'loss': 0.7584, 'learning_rate': 1.444177709545761e-05, 'epoch': 0.71} {'loss': 0.7109, 'learning_rate': 1.4441483806170171e-05, 'epoch': 0.71} {'loss': 0.8678, 'learning_rate': 1.444119051212328e-05, 'epoch': 0.71} {'loss': 0.6382, 'learning_rate': 1.4440897213317253e-05, 'epoch': 0.71} {'loss': 0.7207, 'learning_rate': 1.4440603909752402e-05, 'epoch': 0.71} {'loss': 0.9399, 'learning_rate': 1.4440310601429044e-05, 'epoch': 0.71} {'loss': 0.7045, 'learning_rate': 1.4440017288347492e-05, 'epoch': 0.71} {'loss': 0.7506, 'learning_rate': 1.4439723970508062e-05, 'epoch': 0.71} {'loss': 0.9287, 'learning_rate': 1.4439430647911066e-05, 'epoch': 0.71} {'loss': 0.7305, 'learning_rate': 1.4439137320556822e-05, 'epoch': 0.71} {'loss': 0.7954, 'learning_rate': 1.4438843988445639e-05, 'epoch': 0.71} {'loss': 0.8518, 'learning_rate': 1.4438550651577834e-05, 'epoch': 0.71} {'loss': 0.8353, 'learning_rate': 1.443825730995372e-05, 'epoch': 0.71} {'loss': 0.9485, 'learning_rate': 1.4437963963573615e-05, 'epoch': 0.71} {'loss': 0.7653, 'learning_rate': 1.443767061243783e-05, 'epoch': 0.71} {'loss': 0.8909, 'learning_rate': 1.4437377256546682e-05, 'epoch': 0.71} {'loss': 0.8994, 'learning_rate': 1.4437083895900483e-05, 'epoch': 0.71} {'loss': 0.9198, 'learning_rate': 1.4436790530499547e-05, 'epoch': 0.71} {'loss': 0.6463, 'learning_rate': 1.4436497160344192e-05, 'epoch': 0.71} {'loss': 0.647, 'learning_rate': 1.4436203785434727e-05, 'epoch': 0.71} {'loss': 0.6564, 'learning_rate': 1.4435910405771471e-05, 'epoch': 0.71} {'loss': 0.8445, 'learning_rate': 1.4435617021354737e-05, 'epoch': 0.71} {'loss': 0.8672, 'learning_rate': 1.443532363218484e-05, 'epoch': 0.71} {'loss': 0.9682, 'learning_rate': 1.443503023826209e-05, 'epoch': 0.71} {'loss': 0.5806, 'learning_rate': 1.4434736839586805e-05, 'epoch': 0.71} {'loss': 0.8846, 'learning_rate': 1.44344434361593e-05, 'epoch': 0.71} {'loss': 0.7239, 'learning_rate': 1.4434150027979892e-05, 'epoch': 0.71} {'loss': 0.7668, 'learning_rate': 1.4433856615048889e-05, 'epoch': 0.71} {'loss': 0.7793, 'learning_rate': 1.4433563197366607e-05, 'epoch': 0.71} {'loss': 0.9403, 'learning_rate': 1.4433269774933365e-05, 'epoch': 0.71} {'loss': 0.6838, 'learning_rate': 1.4432976347749473e-05, 'epoch': 0.71} {'loss': 0.8079, 'learning_rate': 1.4432682915815245e-05, 'epoch': 0.71} {'loss': 0.9348, 'learning_rate': 1.4432389479131001e-05, 'epoch': 0.71} {'loss': 0.8184, 'learning_rate': 1.443209603769705e-05, 'epoch': 0.71} {'loss': 0.892, 'learning_rate': 1.4431802591513705e-05, 'epoch': 0.71} {'loss': 1.0279, 'learning_rate': 1.4431509140581286e-05, 'epoch': 0.71} {'loss': 1.075, 'learning_rate': 1.4431215684900109e-05, 'epoch': 0.71} {'loss': 0.8185, 'learning_rate': 1.4430922224470478e-05, 'epoch': 0.71} {'loss': 0.7351, 'learning_rate': 1.4430628759292718e-05, 'epoch': 0.71} {'loss': 0.7032, 'learning_rate': 1.4430335289367138e-05, 'epoch': 0.71} {'loss': 0.9743, 'learning_rate': 1.4430041814694054e-05, 'epoch': 0.71} {'loss': 0.654, 'learning_rate': 1.4429748335273779e-05, 'epoch': 0.71} {'loss': 0.8794, 'learning_rate': 1.4429454851106627e-05, 'epoch': 0.71} {'loss': 0.9207, 'learning_rate': 1.442916136219292e-05, 'epoch': 0.71} {'loss': 0.8189, 'learning_rate': 1.4428867868532966e-05, 'epoch': 0.71} {'loss': 0.8704, 'learning_rate': 1.4428574370127077e-05, 'epoch': 0.71} {'loss': 0.8373, 'learning_rate': 1.4428280866975573e-05, 'epoch': 0.71} {'loss': 0.9397, 'learning_rate': 1.4427987359078765e-05, 'epoch': 0.71} {'loss': 0.6976, 'learning_rate': 1.4427693846436968e-05, 'epoch': 0.71} {'loss': 0.8215, 'learning_rate': 1.4427400329050501e-05, 'epoch': 0.71} {'loss': 0.8906, 'learning_rate': 1.4427106806919673e-05, 'epoch': 0.71} {'loss': 0.6971, 'learning_rate': 1.44268132800448e-05, 'epoch': 0.71} {'loss': 0.7991, 'learning_rate': 1.4426519748426198e-05, 'epoch': 0.71} {'loss': 0.8148, 'learning_rate': 1.442622621206418e-05, 'epoch': 0.71} {'loss': 0.8459, 'learning_rate': 1.442593267095906e-05, 'epoch': 0.71} {'loss': 0.6545, 'learning_rate': 1.4425639125111155e-05, 'epoch': 0.71} {'loss': 0.7463, 'learning_rate': 1.4425345574520776e-05, 'epoch': 0.71} {'loss': 0.8873, 'learning_rate': 1.4425052019188246e-05, 'epoch': 0.71} {'loss': 0.8542, 'learning_rate': 1.442475845911387e-05, 'epoch': 0.71} {'loss': 0.8801, 'learning_rate': 1.4424464894297965e-05, 'epoch': 0.71} {'loss': 0.9379, 'learning_rate': 1.4424171324740845e-05, 'epoch': 0.71} {'loss': 0.7449, 'learning_rate': 1.4423877750442827e-05, 'epoch': 0.71} {'loss': 0.8624, 'learning_rate': 1.4423584171404225e-05, 'epoch': 0.71} {'loss': 0.9277, 'learning_rate': 1.4423290587625355e-05, 'epoch': 0.71} {'loss': 0.9439, 'learning_rate': 1.4422996999106528e-05, 'epoch': 0.71} {'loss': 0.8192, 'learning_rate': 1.4422703405848064e-05, 'epoch': 0.71} {'loss': 0.7756, 'learning_rate': 1.4422409807850271e-05, 'epoch': 0.71} {'loss': 0.8339, 'learning_rate': 1.4422116205113467e-05, 'epoch': 0.71} {'loss': 0.9073, 'learning_rate': 1.4421822597637967e-05, 'epoch': 0.71} {'loss': 0.8994, 'learning_rate': 1.4421528985424083e-05, 'epoch': 0.71} {'loss': 0.5665, 'learning_rate': 1.4421235368472135e-05, 'epoch': 0.71} {'loss': 0.824, 'learning_rate': 1.4420941746782434e-05, 'epoch': 0.71} {'loss': 0.8366, 'learning_rate': 1.4420648120355291e-05, 'epoch': 0.71} {'loss': 0.9472, 'learning_rate': 1.4420354489191027e-05, 'epoch': 0.71} {'loss': 0.8344, 'learning_rate': 1.4420060853289952e-05, 'epoch': 0.71} {'loss': 0.745, 'learning_rate': 1.4419767212652387e-05, 'epoch': 0.71} {'loss': 0.9358, 'learning_rate': 1.4419473567278642e-05, 'epoch': 0.71} {'loss': 0.8024, 'learning_rate': 1.4419179917169029e-05, 'epoch': 0.71} {'loss': 0.9074, 'learning_rate': 1.441888626232387e-05, 'epoch': 0.71} {'loss': 0.7556, 'learning_rate': 1.441859260274347e-05, 'epoch': 0.71} {'loss': 0.6696, 'learning_rate': 1.4418298938428153e-05, 'epoch': 0.71} {'loss': 0.6983, 'learning_rate': 1.4418005269378228e-05, 'epoch': 0.71} {'loss': 0.7012, 'learning_rate': 1.4417711595594015e-05, 'epoch': 0.71} {'loss': 1.0294, 'learning_rate': 1.4417417917075823e-05, 'epoch': 0.71} {'loss': 0.9379, 'learning_rate': 1.4417124233823967e-05, 'epoch': 0.71} {'loss': 0.8097, 'learning_rate': 1.441683054583877e-05, 'epoch': 0.71} {'loss': 0.8507, 'learning_rate': 1.4416536853120536e-05, 'epoch': 0.71} {'loss': 0.8581, 'learning_rate': 1.4416243155669582e-05, 'epoch': 0.71} {'loss': 0.75, 'learning_rate': 1.4415949453486227e-05, 'epoch': 0.71} {'loss': 0.8319, 'learning_rate': 1.4415655746570784e-05, 'epoch': 0.71} {'loss': 0.7722, 'learning_rate': 1.4415362034923569e-05, 'epoch': 0.71} {'loss': 0.8819, 'learning_rate': 1.4415068318544891e-05, 'epoch': 0.71} {'loss': 0.8129, 'learning_rate': 1.4414774597435072e-05, 'epoch': 0.71} {'loss': 0.8066, 'learning_rate': 1.4414480871594424e-05, 'epoch': 0.71} {'loss': 0.922, 'learning_rate': 1.4414187141023259e-05, 'epoch': 0.71} {'loss': 0.7561, 'learning_rate': 1.4413893405721896e-05, 'epoch': 0.71} {'loss': 0.799, 'learning_rate': 1.4413599665690645e-05, 'epoch': 0.71} {'loss': 0.7417, 'learning_rate': 1.4413305920929826e-05, 'epoch': 0.71} {'loss': 0.5102, 'learning_rate': 1.4413012171439752e-05, 'epoch': 0.71} {'loss': 0.7265, 'learning_rate': 1.4412718417220735e-05, 'epoch': 0.71} {'loss': 0.9168, 'learning_rate': 1.4412424658273092e-05, 'epoch': 0.71} {'loss': 0.7407, 'learning_rate': 1.4412130894597141e-05, 'epoch': 0.71} {'loss': 0.6313, 'learning_rate': 1.441183712619319e-05, 'epoch': 0.71} {'loss': 0.7411, 'learning_rate': 1.4411543353061559e-05, 'epoch': 0.71} {'loss': 0.9327, 'learning_rate': 1.4411249575202559e-05, 'epoch': 0.71} {'loss': 0.778, 'learning_rate': 1.441095579261651e-05, 'epoch': 0.71} {'loss': 0.9066, 'learning_rate': 1.4410662005303722e-05, 'epoch': 0.71} {'loss': 0.7676, 'learning_rate': 1.4410368213264511e-05, 'epoch': 0.71} {'loss': 0.7017, 'learning_rate': 1.4410074416499195e-05, 'epoch': 0.71} {'loss': 0.805, 'learning_rate': 1.4409780615008084e-05, 'epoch': 0.71} {'loss': 1.0157, 'learning_rate': 1.4409486808791495e-05, 'epoch': 0.71} {'loss': 0.7852, 'learning_rate': 1.4409192997849744e-05, 'epoch': 0.71} {'loss': 0.8735, 'learning_rate': 1.4408899182183145e-05, 'epoch': 0.71} {'loss': 0.7074, 'learning_rate': 1.4408605361792012e-05, 'epoch': 0.71} {'loss': 0.9635, 'learning_rate': 1.4408311536676663e-05, 'epoch': 0.71} {'loss': 0.8376, 'learning_rate': 1.4408017706837405e-05, 'epoch': 0.71} {'loss': 0.9947, 'learning_rate': 1.4407723872274562e-05, 'epoch': 0.71} {'loss': 0.832, 'learning_rate': 1.4407430032988443e-05, 'epoch': 0.71} {'loss': 0.7214, 'learning_rate': 1.4407136188979364e-05, 'epoch': 0.71} {'loss': 0.912, 'learning_rate': 1.4406842340247645e-05, 'epoch': 0.71} {'loss': 0.7291, 'learning_rate': 1.4406548486793595e-05, 'epoch': 0.71} {'loss': 0.7743, 'learning_rate': 1.4406254628617528e-05, 'epoch': 0.71} {'loss': 0.9899, 'learning_rate': 1.4405960765719764e-05, 'epoch': 0.71} {'loss': 0.9784, 'learning_rate': 1.4405666898100615e-05, 'epoch': 0.71} {'loss': 0.8789, 'learning_rate': 1.4405373025760393e-05, 'epoch': 0.71} {'loss': 0.8095, 'learning_rate': 1.4405079148699422e-05, 'epoch': 0.71} {'loss': 0.8463, 'learning_rate': 1.4404785266918009e-05, 'epoch': 0.71} {'loss': 0.71, 'learning_rate': 1.4404491380416472e-05, 'epoch': 0.71} {'loss': 0.7357, 'learning_rate': 1.4404197489195122e-05, 'epoch': 0.71} {'loss': 0.7185, 'learning_rate': 1.4403903593254278e-05, 'epoch': 0.71} {'loss': 0.7257, 'learning_rate': 1.4403609692594253e-05, 'epoch': 0.71} {'loss': 0.8423, 'learning_rate': 1.4403315787215361e-05, 'epoch': 0.71} {'loss': 0.8452, 'learning_rate': 1.4403021877117924e-05, 'epoch': 0.71} {'loss': 0.7865, 'learning_rate': 1.440272796230225e-05, 'epoch': 0.71} {'loss': 0.9385, 'learning_rate': 1.4402434042768656e-05, 'epoch': 0.71} {'loss': 0.9528, 'learning_rate': 1.4402140118517456e-05, 'epoch': 0.71} {'loss': 0.7535, 'learning_rate': 1.4401846189548963e-05, 'epoch': 0.71} {'loss': 0.8234, 'learning_rate': 1.4401552255863496e-05, 'epoch': 0.71} {'loss': 0.9376, 'learning_rate': 1.4401258317461368e-05, 'epoch': 0.71} {'loss': 0.8345, 'learning_rate': 1.4400964374342895e-05, 'epoch': 0.71} {'loss': 0.8884, 'learning_rate': 1.4400670426508394e-05, 'epoch': 0.71} {'loss': 0.8141, 'learning_rate': 1.4400376473958175e-05, 'epoch': 0.71} {'loss': 0.8648, 'learning_rate': 1.4400082516692555e-05, 'epoch': 0.71} {'loss': 0.8727, 'learning_rate': 1.4399788554711851e-05, 'epoch': 0.71} {'loss': 0.9193, 'learning_rate': 1.4399494588016374e-05, 'epoch': 0.71} {'loss': 0.8477, 'learning_rate': 1.4399200616606446e-05, 'epoch': 0.71} {'loss': 0.7051, 'learning_rate': 1.4398906640482372e-05, 'epoch': 0.71} {'loss': 0.944, 'learning_rate': 1.4398612659644478e-05, 'epoch': 0.71} {'loss': 0.7886, 'learning_rate': 1.439831867409307e-05, 'epoch': 0.71} {'loss': 0.648, 'learning_rate': 1.4398024683828466e-05, 'epoch': 0.71} {'loss': 0.7635, 'learning_rate': 1.4397730688850984e-05, 'epoch': 0.71} {'loss': 0.8077, 'learning_rate': 1.4397436689160933e-05, 'epoch': 0.71} {'loss': 0.9051, 'learning_rate': 1.4397142684758636e-05, 'epoch': 0.71} {'loss': 0.8206, 'learning_rate': 1.4396848675644401e-05, 'epoch': 0.71} {'loss': 0.845, 'learning_rate': 1.4396554661818549e-05, 'epoch': 0.71} {'loss': 0.807, 'learning_rate': 1.4396260643281388e-05, 'epoch': 0.71} {'loss': 0.9187, 'learning_rate': 1.439596662003324e-05, 'epoch': 0.71} {'loss': 0.8074, 'learning_rate': 1.4395672592074412e-05, 'epoch': 0.71} {'loss': 0.8615, 'learning_rate': 1.4395378559405232e-05, 'epoch': 0.71} {'loss': 0.8386, 'learning_rate': 1.4395084522025999e-05, 'epoch': 0.71} {'loss': 0.6732, 'learning_rate': 1.4394790479937043e-05, 'epoch': 0.71} {'loss': 0.8418, 'learning_rate': 1.439449643313867e-05, 'epoch': 0.71} {'loss': 0.7562, 'learning_rate': 1.4394202381631195e-05, 'epoch': 0.71} {'loss': 0.8412, 'learning_rate': 1.4393908325414935e-05, 'epoch': 0.71} {'loss': 0.8974, 'learning_rate': 1.4393614264490212e-05, 'epoch': 0.71} {'loss': 0.802, 'learning_rate': 1.439332019885733e-05, 'epoch': 0.71} {'loss': 0.7106, 'learning_rate': 1.439302612851661e-05, 'epoch': 0.71} {'loss': 0.9076, 'learning_rate': 1.4392732053468363e-05, 'epoch': 0.71} {'loss': 0.7269, 'learning_rate': 1.4392437973712912e-05, 'epoch': 0.71} {'loss': 0.8778, 'learning_rate': 1.4392143889250565e-05, 'epoch': 0.71} {'loss': 0.8834, 'learning_rate': 1.439184980008164e-05, 'epoch': 0.71} {'loss': 0.8406, 'learning_rate': 1.439155570620645e-05, 'epoch': 0.71} {'loss': 0.6119, 'learning_rate': 1.4391261607625313e-05, 'epoch': 0.71} {'loss': 0.827, 'learning_rate': 1.4390967504338543e-05, 'epoch': 0.71} {'loss': 0.8017, 'learning_rate': 1.4390673396346452e-05, 'epoch': 0.71} {'loss': 0.8783, 'learning_rate': 1.4390379283649363e-05, 'epoch': 0.71} {'loss': 0.6688, 'learning_rate': 1.4390085166247585e-05, 'epoch': 0.71} {'loss': 0.8584, 'learning_rate': 1.4389791044141434e-05, 'epoch': 0.71} {'loss': 0.7853, 'learning_rate': 1.4389496917331224e-05, 'epoch': 0.71} {'loss': 0.669, 'learning_rate': 1.4389202785817273e-05, 'epoch': 0.71} {'loss': 0.8645, 'learning_rate': 1.4388908649599895e-05, 'epoch': 0.71} {'loss': 0.7601, 'learning_rate': 1.4388614508679405e-05, 'epoch': 0.71} {'loss': 0.8143, 'learning_rate': 1.4388320363056121e-05, 'epoch': 0.71} {'loss': 0.8018, 'learning_rate': 1.4388026212730354e-05, 'epoch': 0.71} {'loss': 0.992, 'learning_rate': 1.438773205770242e-05, 'epoch': 0.71} {'loss': 0.9957, 'learning_rate': 1.4387437897972636e-05, 'epoch': 0.71} {'loss': 0.7429, 'learning_rate': 1.4387143733541313e-05, 'epoch': 0.71} {'loss': 1.0225, 'learning_rate': 1.4386849564408773e-05, 'epoch': 0.71} {'loss': 0.7697, 'learning_rate': 1.4386555390575329e-05, 'epoch': 0.71} {'loss': 0.7903, 'learning_rate': 1.4386261212041295e-05, 'epoch': 0.71} {'loss': 0.8933, 'learning_rate': 1.4385967028806985e-05, 'epoch': 0.71} {'loss': 0.9361, 'learning_rate': 1.4385672840872712e-05, 'epoch': 0.71} {'loss': 0.922, 'learning_rate': 1.4385378648238796e-05, 'epoch': 0.72} {'loss': 0.8392, 'learning_rate': 1.4385084450905553e-05, 'epoch': 0.72} {'loss': 0.776, 'learning_rate': 1.4384790248873297e-05, 'epoch': 0.72} {'loss': 0.8228, 'learning_rate': 1.4384496042142342e-05, 'epoch': 0.72} {'loss': 0.94, 'learning_rate': 1.4384201830713002e-05, 'epoch': 0.72} {'loss': 0.872, 'learning_rate': 1.4383907614585597e-05, 'epoch': 0.72} {'loss': 0.8986, 'learning_rate': 1.4383613393760436e-05, 'epoch': 0.72} {'loss': 0.8144, 'learning_rate': 1.4383319168237838e-05, 'epoch': 0.72} {'loss': 0.8754, 'learning_rate': 1.438302493801812e-05, 'epoch': 0.72} {'loss': 0.8138, 'learning_rate': 1.4382730703101593e-05, 'epoch': 0.72} {'loss': 0.7489, 'learning_rate': 1.4382436463488577e-05, 'epoch': 0.72} {'loss': 0.543, 'learning_rate': 1.4382142219179384e-05, 'epoch': 0.72} {'loss': 0.9494, 'learning_rate': 1.438184797017433e-05, 'epoch': 0.72} {'loss': 0.6154, 'learning_rate': 1.4381553716473728e-05, 'epoch': 0.72} {'loss': 0.7051, 'learning_rate': 1.4381259458077898e-05, 'epoch': 0.72} {'loss': 0.8182, 'learning_rate': 1.4380965194987151e-05, 'epoch': 0.72} {'loss': 0.8163, 'learning_rate': 1.4380670927201808e-05, 'epoch': 0.72} {'loss': 0.8366, 'learning_rate': 1.4380376654722178e-05, 'epoch': 0.72} {'loss': 0.7809, 'learning_rate': 1.438008237754858e-05, 'epoch': 0.72} {'loss': 0.9394, 'learning_rate': 1.437978809568133e-05, 'epoch': 0.72} {'loss': 0.8967, 'learning_rate': 1.437949380912074e-05, 'epoch': 0.72} {'loss': 0.8012, 'learning_rate': 1.4379199517867126e-05, 'epoch': 0.72} {'loss': 0.9195, 'learning_rate': 1.4378905221920807e-05, 'epoch': 0.72} {'loss': 0.9067, 'learning_rate': 1.4378610921282092e-05, 'epoch': 0.72} {'loss': 0.9504, 'learning_rate': 1.4378316615951305e-05, 'epoch': 0.72} {'loss': 0.7034, 'learning_rate': 1.4378022305928753e-05, 'epoch': 0.72} {'loss': 0.785, 'learning_rate': 1.4377727991214757e-05, 'epoch': 0.72} {'loss': 0.7985, 'learning_rate': 1.437743367180963e-05, 'epoch': 0.72} {'loss': 0.6991, 'learning_rate': 1.4377139347713684e-05, 'epoch': 0.72} {'loss': 0.8229, 'learning_rate': 1.4376845018927243e-05, 'epoch': 0.72} {'loss': 0.8965, 'learning_rate': 1.4376550685450617e-05, 'epoch': 0.72} {'loss': 0.8415, 'learning_rate': 1.4376256347284121e-05, 'epoch': 0.72} {'loss': 0.8702, 'learning_rate': 1.437596200442807e-05, 'epoch': 0.72} {'loss': 0.7463, 'learning_rate': 1.4375667656882782e-05, 'epoch': 0.72} {'loss': 0.7917, 'learning_rate': 1.437537330464857e-05, 'epoch': 0.72} {'loss': 0.8439, 'learning_rate': 1.4375078947725753e-05, 'epoch': 0.72} {'loss': 0.7804, 'learning_rate': 1.4374784586114642e-05, 'epoch': 0.72} {'loss': 0.8752, 'learning_rate': 1.4374490219815555e-05, 'epoch': 0.72} {'loss': 0.9153, 'learning_rate': 1.437419584882881e-05, 'epoch': 0.72} {'loss': 0.7306, 'learning_rate': 1.4373901473154714e-05, 'epoch': 0.72} {'loss': 0.849, 'learning_rate': 1.4373607092793591e-05, 'epoch': 0.72} {'loss': 0.7386, 'learning_rate': 1.4373312707745753e-05, 'epoch': 0.72} {'loss': 0.6912, 'learning_rate': 1.4373018318011515e-05, 'epoch': 0.72} {'loss': 0.9593, 'learning_rate': 1.4372723923591192e-05, 'epoch': 0.72} {'loss': 0.6825, 'learning_rate': 1.4372429524485102e-05, 'epoch': 0.72} {'loss': 0.7539, 'learning_rate': 1.4372135120693562e-05, 'epoch': 0.72} {'loss': 0.672, 'learning_rate': 1.437184071221688e-05, 'epoch': 0.72} {'loss': 0.889, 'learning_rate': 1.4371546299055377e-05, 'epoch': 0.72} {'loss': 0.8054, 'learning_rate': 1.4371251881209371e-05, 'epoch': 0.72} {'loss': 0.9962, 'learning_rate': 1.4370957458679172e-05, 'epoch': 0.72} {'loss': 0.7633, 'learning_rate': 1.4370663031465095e-05, 'epoch': 0.72} {'loss': 0.8798, 'learning_rate': 1.4370368599567459e-05, 'epoch': 0.72} {'loss': 0.757, 'learning_rate': 1.4370074162986583e-05, 'epoch': 0.72} {'loss': 0.9525, 'learning_rate': 1.4369779721722771e-05, 'epoch': 0.72} {'loss': 0.9122, 'learning_rate': 1.4369485275776354e-05, 'epoch': 0.72} {'loss': 0.904, 'learning_rate': 1.4369190825147632e-05, 'epoch': 0.72} {'loss': 0.8628, 'learning_rate': 1.4368896369836931e-05, 'epoch': 0.72} {'loss': 0.8993, 'learning_rate': 1.4368601909844561e-05, 'epoch': 0.72} {'loss': 0.8567, 'learning_rate': 1.4368307445170842e-05, 'epoch': 0.72} {'loss': 1.0249, 'learning_rate': 1.4368012975816089e-05, 'epoch': 0.72} {'loss': 0.8341, 'learning_rate': 1.4367718501780614e-05, 'epoch': 0.72} {'loss': 0.9809, 'learning_rate': 1.4367424023064734e-05, 'epoch': 0.72} {'loss': 0.615, 'learning_rate': 1.4367129539668763e-05, 'epoch': 0.72} {'loss': 1.0452, 'learning_rate': 1.436683505159302e-05, 'epoch': 0.72} {'loss': 0.7521, 'learning_rate': 1.436654055883782e-05, 'epoch': 0.72} {'loss': 0.8118, 'learning_rate': 1.4366246061403479e-05, 'epoch': 0.72} {'loss': 0.6848, 'learning_rate': 1.4365951559290307e-05, 'epoch': 0.72} {'loss': 0.6647, 'learning_rate': 1.4365657052498629e-05, 'epoch': 0.72} {'loss': 0.761, 'learning_rate': 1.4365362541028752e-05, 'epoch': 0.72} {'loss': 0.9016, 'learning_rate': 1.4365068024880995e-05, 'epoch': 0.72} {'loss': 0.8657, 'learning_rate': 1.4364773504055674e-05, 'epoch': 0.72} {'loss': 0.7038, 'learning_rate': 1.4364478978553104e-05, 'epoch': 0.72} {'loss': 0.7407, 'learning_rate': 1.4364184448373604e-05, 'epoch': 0.72} {'loss': 0.6645, 'learning_rate': 1.4363889913517486e-05, 'epoch': 0.72} {'loss': 0.7072, 'learning_rate': 1.4363595373985062e-05, 'epoch': 0.72} {'loss': 0.8708, 'learning_rate': 1.4363300829776654e-05, 'epoch': 0.72} {'loss': 0.8509, 'learning_rate': 1.4363006280892576e-05, 'epoch': 0.72} {'loss': 0.8398, 'learning_rate': 1.436271172733314e-05, 'epoch': 0.72} {'loss': 0.8821, 'learning_rate': 1.4362417169098666e-05, 'epoch': 0.72} {'loss': 0.8631, 'learning_rate': 1.4362122606189472e-05, 'epoch': 0.72} {'loss': 0.7653, 'learning_rate': 1.4361828038605868e-05, 'epoch': 0.72} {'loss': 0.8508, 'learning_rate': 1.436153346634817e-05, 'epoch': 0.72} {'loss': 0.649, 'learning_rate': 1.4361238889416695e-05, 'epoch': 0.72} {'loss': 0.7682, 'learning_rate': 1.436094430781176e-05, 'epoch': 0.72} {'loss': 0.8942, 'learning_rate': 1.4360649721533678e-05, 'epoch': 0.72} {'loss': 0.838, 'learning_rate': 1.4360355130582767e-05, 'epoch': 0.72} {'loss': 0.775, 'learning_rate': 1.4360060534959344e-05, 'epoch': 0.72} {'loss': 0.7432, 'learning_rate': 1.4359765934663724e-05, 'epoch': 0.72} {'loss': 0.8205, 'learning_rate': 1.4359471329696217e-05, 'epoch': 0.72} {'loss': 0.9772, 'learning_rate': 1.4359176720057144e-05, 'epoch': 0.72} {'loss': 0.7506, 'learning_rate': 1.4358882105746818e-05, 'epoch': 0.72} {'loss': 0.8482, 'learning_rate': 1.4358587486765558e-05, 'epoch': 0.72} {'loss': 0.8315, 'learning_rate': 1.435829286311368e-05, 'epoch': 0.72} {'loss': 0.7317, 'learning_rate': 1.4357998234791497e-05, 'epoch': 0.72} {'loss': 0.9391, 'learning_rate': 1.4357703601799326e-05, 'epoch': 0.72} {'loss': 0.8739, 'learning_rate': 1.4357408964137483e-05, 'epoch': 0.72} {'loss': 0.8084, 'learning_rate': 1.4357114321806279e-05, 'epoch': 0.72} {'loss': 0.7853, 'learning_rate': 1.4356819674806034e-05, 'epoch': 0.72} {'loss': 0.9418, 'learning_rate': 1.435652502313707e-05, 'epoch': 0.72} {'loss': 0.8537, 'learning_rate': 1.435623036679969e-05, 'epoch': 0.72} {'loss': 0.9644, 'learning_rate': 1.4355935705794217e-05, 'epoch': 0.72} {'loss': 0.8746, 'learning_rate': 1.4355641040120968e-05, 'epoch': 0.72} {'loss': 0.8411, 'learning_rate': 1.4355346369780255e-05, 'epoch': 0.72} {'loss': 0.8014, 'learning_rate': 1.4355051694772395e-05, 'epoch': 0.72} {'loss': 0.828, 'learning_rate': 1.4354757015097706e-05, 'epoch': 0.72} {'loss': 0.9292, 'learning_rate': 1.4354462330756499e-05, 'epoch': 0.72} {'loss': 0.6118, 'learning_rate': 1.4354167641749093e-05, 'epoch': 0.72} {'loss': 0.6495, 'learning_rate': 1.4353872948075807e-05, 'epoch': 0.72} {'loss': 0.8728, 'learning_rate': 1.4353578249736949e-05, 'epoch': 0.72} {'loss': 0.8051, 'learning_rate': 1.4353283546732839e-05, 'epoch': 0.72} {'loss': 0.7897, 'learning_rate': 1.4352988839063797e-05, 'epoch': 0.72} {'loss': 0.8687, 'learning_rate': 1.4352694126730131e-05, 'epoch': 0.72} {'loss': 0.8189, 'learning_rate': 1.435239940973216e-05, 'epoch': 0.72} {'loss': 0.8565, 'learning_rate': 1.4352104688070202e-05, 'epoch': 0.72} {'loss': 0.8015, 'learning_rate': 1.435180996174457e-05, 'epoch': 0.72} {'loss': 0.815, 'learning_rate': 1.4351515230755579e-05, 'epoch': 0.72} {'loss': 0.8022, 'learning_rate': 1.435122049510355e-05, 'epoch': 0.72} {'loss': 0.9025, 'learning_rate': 1.4350925754788796e-05, 'epoch': 0.72} {'loss': 0.8667, 'learning_rate': 1.435063100981163e-05, 'epoch': 0.72} {'loss': 0.6625, 'learning_rate': 1.435033626017237e-05, 'epoch': 0.72} {'loss': 0.9138, 'learning_rate': 1.4350041505871333e-05, 'epoch': 0.72} {'loss': 0.8418, 'learning_rate': 1.4349746746908835e-05, 'epoch': 0.72} {'loss': 0.9102, 'learning_rate': 1.434945198328519e-05, 'epoch': 0.72} {'loss': 0.8886, 'learning_rate': 1.4349157215000715e-05, 'epoch': 0.72} {'loss': 0.8613, 'learning_rate': 1.4348862442055724e-05, 'epoch': 0.72} {'loss': 0.6934, 'learning_rate': 1.4348567664450535e-05, 'epoch': 0.72} {'loss': 0.8384, 'learning_rate': 1.4348272882185463e-05, 'epoch': 0.72} {'loss': 0.9357, 'learning_rate': 1.4347978095260824e-05, 'epoch': 0.72} {'loss': 0.784, 'learning_rate': 1.4347683303676936e-05, 'epoch': 0.72} {'loss': 0.7385, 'learning_rate': 1.4347388507434113e-05, 'epoch': 0.72} {'loss': 0.7995, 'learning_rate': 1.434709370653267e-05, 'epoch': 0.72} {'loss': 0.8107, 'learning_rate': 1.4346798900972921e-05, 'epoch': 0.72} {'loss': 0.756, 'learning_rate': 1.4346504090755187e-05, 'epoch': 0.72} {'loss': 0.7751, 'learning_rate': 1.4346209275879779e-05, 'epoch': 0.72} {'loss': 0.7188, 'learning_rate': 1.434591445634702e-05, 'epoch': 0.72} {'loss': 0.7775, 'learning_rate': 1.434561963215722e-05, 'epoch': 0.72} {'loss': 0.7873, 'learning_rate': 1.4345324803310696e-05, 'epoch': 0.72} {'loss': 0.8729, 'learning_rate': 1.4345029969807764e-05, 'epoch': 0.72} {'loss': 0.7138, 'learning_rate': 1.434473513164874e-05, 'epoch': 0.72} {'loss': 0.7096, 'learning_rate': 1.4344440288833938e-05, 'epoch': 0.72} {'loss': 0.8348, 'learning_rate': 1.434414544136368e-05, 'epoch': 0.72} {'loss': 0.863, 'learning_rate': 1.4343850589238275e-05, 'epoch': 0.72} {'loss': 0.749, 'learning_rate': 1.4343555732458046e-05, 'epoch': 0.72} {'loss': 0.7677, 'learning_rate': 1.4343260871023303e-05, 'epoch': 0.72} {'loss': 0.8538, 'learning_rate': 1.4342966004934362e-05, 'epoch': 0.72} {'loss': 0.6979, 'learning_rate': 1.4342671134191543e-05, 'epoch': 0.72} {'loss': 0.8835, 'learning_rate': 1.4342376258795158e-05, 'epoch': 0.72} {'loss': 0.8046, 'learning_rate': 1.4342081378745527e-05, 'epoch': 0.72} {'loss': 0.863, 'learning_rate': 1.4341786494042965e-05, 'epoch': 0.72} {'loss': 0.8887, 'learning_rate': 1.4341491604687783e-05, 'epoch': 0.72} {'loss': 0.8715, 'learning_rate': 1.4341196710680306e-05, 'epoch': 0.72} {'loss': 0.9507, 'learning_rate': 1.434090181202084e-05, 'epoch': 0.72} {'loss': 0.7552, 'learning_rate': 1.4340606908709708e-05, 'epoch': 0.72} {'loss': 0.661, 'learning_rate': 1.4340312000747224e-05, 'epoch': 0.72} {'loss': 0.8042, 'learning_rate': 1.4340017088133703e-05, 'epoch': 0.72} {'loss': 0.8594, 'learning_rate': 1.4339722170869464e-05, 'epoch': 0.72} {'loss': 0.8393, 'learning_rate': 1.433942724895482e-05, 'epoch': 0.72} {'loss': 0.7592, 'learning_rate': 1.4339132322390088e-05, 'epoch': 0.72} {'loss': 0.8831, 'learning_rate': 1.4338837391175582e-05, 'epoch': 0.72} {'loss': 0.8546, 'learning_rate': 1.4338542455311622e-05, 'epoch': 0.72} {'loss': 1.0574, 'learning_rate': 1.4338247514798522e-05, 'epoch': 0.72} {'loss': 0.6515, 'learning_rate': 1.43379525696366e-05, 'epoch': 0.72} {'loss': 0.7251, 'learning_rate': 1.4337657619826168e-05, 'epoch': 0.72} {'loss': 0.8662, 'learning_rate': 1.4337362665367547e-05, 'epoch': 0.72} {'loss': 0.8328, 'learning_rate': 1.4337067706261047e-05, 'epoch': 0.72} {'loss': 0.977, 'learning_rate': 1.4336772742506987e-05, 'epoch': 0.72} {'loss': 0.8935, 'learning_rate': 1.4336477774105687e-05, 'epoch': 0.72} {'loss': 0.6785, 'learning_rate': 1.4336182801057458e-05, 'epoch': 0.72} {'loss': 0.7502, 'learning_rate': 1.433588782336262e-05, 'epoch': 0.72} {'loss': 0.8873, 'learning_rate': 1.4335592841021483e-05, 'epoch': 0.72} {'loss': 0.8988, 'learning_rate': 1.433529785403437e-05, 'epoch': 0.72} {'loss': 0.8496, 'learning_rate': 1.4335002862401592e-05, 'epoch': 0.72} {'loss': 0.8471, 'learning_rate': 1.4334707866123467e-05, 'epoch': 0.72} {'loss': 0.9921, 'learning_rate': 1.4334412865200316e-05, 'epoch': 0.72} {'loss': 0.8067, 'learning_rate': 1.4334117859632446e-05, 'epoch': 0.72} {'loss': 0.9308, 'learning_rate': 1.4333822849420176e-05, 'epoch': 0.72} {'loss': 0.8294, 'learning_rate': 1.4333527834563828e-05, 'epoch': 0.72} {'loss': 0.7845, 'learning_rate': 1.433323281506371e-05, 'epoch': 0.72} {'loss': 0.8341, 'learning_rate': 1.4332937790920144e-05, 'epoch': 0.72} {'loss': 0.8977, 'learning_rate': 1.4332642762133445e-05, 'epoch': 0.72} {'loss': 0.797, 'learning_rate': 1.4332347728703929e-05, 'epoch': 0.72} {'loss': 0.7799, 'learning_rate': 1.4332052690631908e-05, 'epoch': 0.72} {'loss': 0.7134, 'learning_rate': 1.4331757647917702e-05, 'epoch': 0.72} {'loss': 0.9625, 'learning_rate': 1.4331462600561628e-05, 'epoch': 0.72} {'loss': 0.8293, 'learning_rate': 1.4331167548564003e-05, 'epoch': 0.72} {'loss': 0.758, 'learning_rate': 1.4330872491925137e-05, 'epoch': 0.72} {'loss': 0.7784, 'learning_rate': 1.4330577430645352e-05, 'epoch': 0.72} {'loss': 0.8701, 'learning_rate': 1.4330282364724962e-05, 'epoch': 0.72} {'loss': 0.8498, 'learning_rate': 1.4329987294164283e-05, 'epoch': 0.72} {'loss': 0.578, 'learning_rate': 1.4329692218963634e-05, 'epoch': 0.72} {'loss': 0.823, 'learning_rate': 1.4329397139123329e-05, 'epoch': 0.72} {'loss': 0.7916, 'learning_rate': 1.4329102054643681e-05, 'epoch': 0.72} {'loss': 1.0336, 'learning_rate': 1.4328806965525014e-05, 'epoch': 0.72} {'loss': 0.9141, 'learning_rate': 1.4328511871767636e-05, 'epoch': 0.72} {'loss': 0.9032, 'learning_rate': 1.4328216773371865e-05, 'epoch': 0.72} {'loss': 0.7629, 'learning_rate': 1.4327921670338023e-05, 'epoch': 0.72} {'loss': 0.8632, 'learning_rate': 1.4327626562666422e-05, 'epoch': 0.72} {'loss': 0.8184, 'learning_rate': 1.4327331450357378e-05, 'epoch': 0.72} {'loss': 0.8551, 'learning_rate': 1.4327036333411211e-05, 'epoch': 0.72} {'loss': 0.9501, 'learning_rate': 1.4326741211828227e-05, 'epoch': 0.72} {'loss': 0.7959, 'learning_rate': 1.4326446085608754e-05, 'epoch': 0.72} {'loss': 0.6947, 'learning_rate': 1.4326150954753102e-05, 'epoch': 0.72} {'loss': 0.8095, 'learning_rate': 1.432585581926159e-05, 'epoch': 0.72} {'loss': 0.718, 'learning_rate': 1.4325560679134532e-05, 'epoch': 0.72} {'loss': 0.9088, 'learning_rate': 1.4325265534372245e-05, 'epoch': 0.72} {'loss': 0.8966, 'learning_rate': 1.4324970384975047e-05, 'epoch': 0.72} {'loss': 0.9208, 'learning_rate': 1.4324675230943252e-05, 'epoch': 0.72} {'loss': 0.955, 'learning_rate': 1.4324380072277177e-05, 'epoch': 0.72} {'loss': 1.0028, 'learning_rate': 1.4324084908977138e-05, 'epoch': 0.72} {'loss': 1.0612, 'learning_rate': 1.4323789741043452e-05, 'epoch': 0.72} {'loss': 0.7905, 'learning_rate': 1.4323494568476435e-05, 'epoch': 0.72} {'loss': 0.7096, 'learning_rate': 1.4323199391276405e-05, 'epoch': 0.72} {'loss': 0.7075, 'learning_rate': 1.4322904209443678e-05, 'epoch': 0.72} {'loss': 0.747, 'learning_rate': 1.4322609022978564e-05, 'epoch': 0.72} {'loss': 0.8946, 'learning_rate': 1.4322313831881387e-05, 'epoch': 0.72} {'loss': 0.818, 'learning_rate': 1.4322018636152462e-05, 'epoch': 0.72} {'loss': 0.8172, 'learning_rate': 1.43217234357921e-05, 'epoch': 0.72} {'loss': 0.8, 'learning_rate': 1.4321428230800625e-05, 'epoch': 0.72} {'loss': 0.7804, 'learning_rate': 1.4321133021178349e-05, 'epoch': 0.72} {'loss': 0.7142, 'learning_rate': 1.4320837806925588e-05, 'epoch': 0.72} {'loss': 0.8074, 'learning_rate': 1.4320542588042659e-05, 'epoch': 0.72} {'loss': 1.0097, 'learning_rate': 1.4320247364529878e-05, 'epoch': 0.72} {'loss': 0.7283, 'learning_rate': 1.4319952136387563e-05, 'epoch': 0.72} {'loss': 0.7928, 'learning_rate': 1.431965690361603e-05, 'epoch': 0.72} {'loss': 0.7571, 'learning_rate': 1.4319361666215596e-05, 'epoch': 0.72} {'loss': 0.8413, 'learning_rate': 1.4319066424186573e-05, 'epoch': 0.72} {'loss': 0.8894, 'learning_rate': 1.4318771177529285e-05, 'epoch': 0.72} {'loss': 0.7437, 'learning_rate': 1.4318475926244038e-05, 'epoch': 0.72} {'loss': 0.8001, 'learning_rate': 1.431818067033116e-05, 'epoch': 0.72} {'loss': 0.8401, 'learning_rate': 1.4317885409790955e-05, 'epoch': 0.72} {'loss': 0.7546, 'learning_rate': 1.4317590144623751e-05, 'epoch': 0.72} {'loss': 0.8954, 'learning_rate': 1.431729487482986e-05, 'epoch': 0.72} {'loss': 0.8743, 'learning_rate': 1.4316999600409595e-05, 'epoch': 0.72} {'loss': 0.8452, 'learning_rate': 1.4316704321363278e-05, 'epoch': 0.72} {'loss': 0.7216, 'learning_rate': 1.4316409037691222e-05, 'epoch': 0.72} {'loss': 0.829, 'learning_rate': 1.431611374939374e-05, 'epoch': 0.72} {'loss': 0.702, 'learning_rate': 1.4315818456471158e-05, 'epoch': 0.72} {'loss': 0.5941, 'learning_rate': 1.4315523158923786e-05, 'epoch': 0.72} {'loss': 1.0036, 'learning_rate': 1.4315227856751939e-05, 'epoch': 0.72} {'loss': 0.8233, 'learning_rate': 1.4314932549955938e-05, 'epoch': 0.72} {'loss': 0.8052, 'learning_rate': 1.4314637238536096e-05, 'epoch': 0.72} {'loss': 0.7068, 'learning_rate': 1.4314341922492732e-05, 'epoch': 0.72} {'loss': 0.9458, 'learning_rate': 1.4314046601826162e-05, 'epoch': 0.72} {'loss': 0.95, 'learning_rate': 1.4313751276536699e-05, 'epoch': 0.72} {'loss': 0.838, 'learning_rate': 1.4313455946624663e-05, 'epoch': 0.72} {'loss': 0.8148, 'learning_rate': 1.431316061209037e-05, 'epoch': 0.72} {'loss': 0.8266, 'learning_rate': 1.4312865272934135e-05, 'epoch': 0.72} {'loss': 0.8852, 'learning_rate': 1.4312569929156279e-05, 'epoch': 0.72} {'loss': 0.7737, 'learning_rate': 1.4312274580757111e-05, 'epoch': 0.72} {'loss': 0.8644, 'learning_rate': 1.4311979227736955e-05, 'epoch': 0.72} {'loss': 0.6556, 'learning_rate': 1.4311683870096122e-05, 'epoch': 0.72} {'loss': 0.9381, 'learning_rate': 1.4311388507834931e-05, 'epoch': 0.72} {'loss': 0.8566, 'learning_rate': 1.4311093140953697e-05, 'epoch': 0.72} {'loss': 0.4963, 'learning_rate': 1.431079776945274e-05, 'epoch': 0.72} {'loss': 0.7195, 'learning_rate': 1.4310502393332373e-05, 'epoch': 0.72} {'loss': 0.7476, 'learning_rate': 1.4310207012592917e-05, 'epoch': 0.72} {'loss': 0.5705, 'learning_rate': 1.4309911627234679e-05, 'epoch': 0.72} {'loss': 0.7282, 'learning_rate': 1.4309616237257984e-05, 'epoch': 0.72} {'loss': 0.6731, 'learning_rate': 1.4309320842663145e-05, 'epoch': 0.72} {'loss': 0.6755, 'learning_rate': 1.4309025443450482e-05, 'epoch': 0.72} {'loss': 1.0212, 'learning_rate': 1.4308730039620311e-05, 'epoch': 0.72} {'loss': 0.7704, 'learning_rate': 1.4308434631172945e-05, 'epoch': 0.72} {'loss': 0.8826, 'learning_rate': 1.4308139218108701e-05, 'epoch': 0.72} {'loss': 0.7366, 'learning_rate': 1.4307843800427898e-05, 'epoch': 0.72} {'loss': 0.8125, 'learning_rate': 1.430754837813085e-05, 'epoch': 0.72} {'loss': 0.6765, 'learning_rate': 1.4307252951217878e-05, 'epoch': 0.72} {'loss': 0.8905, 'learning_rate': 1.4306957519689295e-05, 'epoch': 0.72} {'loss': 0.7178, 'learning_rate': 1.4306662083545417e-05, 'epoch': 0.72} {'loss': 0.7722, 'learning_rate': 1.4306366642786564e-05, 'epoch': 0.72} {'loss': 0.8192, 'learning_rate': 1.430607119741305e-05, 'epoch': 0.72} {'loss': 0.817, 'learning_rate': 1.430577574742519e-05, 'epoch': 0.72} {'loss': 0.9131, 'learning_rate': 1.4305480292823304e-05, 'epoch': 0.72} {'loss': 0.8238, 'learning_rate': 1.4305184833607707e-05, 'epoch': 0.72} {'loss': 0.9299, 'learning_rate': 1.4304889369778715e-05, 'epoch': 0.72} {'loss': 0.8065, 'learning_rate': 1.4304593901336649e-05, 'epoch': 0.72} {'loss': 0.8328, 'learning_rate': 1.4304298428281819e-05, 'epoch': 0.72} {'loss': 0.8201, 'learning_rate': 1.4304002950614546e-05, 'epoch': 0.72} {'loss': 0.7164, 'learning_rate': 1.4303707468335144e-05, 'epoch': 0.72} {'loss': 0.8254, 'learning_rate': 1.4303411981443931e-05, 'epoch': 0.72} {'loss': 0.7551, 'learning_rate': 1.4303116489941225e-05, 'epoch': 0.72} {'loss': 0.9177, 'learning_rate': 1.4302820993827343e-05, 'epoch': 0.72} {'loss': 0.7971, 'learning_rate': 1.4302525493102598e-05, 'epoch': 0.72} {'loss': 0.7862, 'learning_rate': 1.4302229987767306e-05, 'epoch': 0.72} {'loss': 0.85, 'learning_rate': 1.4301934477821788e-05, 'epoch': 0.72} {'loss': 0.9025, 'learning_rate': 1.430163896326636e-05, 'epoch': 0.72} {'loss': 0.7849, 'learning_rate': 1.4301343444101337e-05, 'epoch': 0.72} {'loss': 0.7797, 'learning_rate': 1.4301047920327036e-05, 'epoch': 0.72} {'loss': 0.7861, 'learning_rate': 1.4300752391943775e-05, 'epoch': 0.72} {'loss': 0.9113, 'learning_rate': 1.430045685895187e-05, 'epoch': 0.72} {'loss': 0.7648, 'learning_rate': 1.4300161321351636e-05, 'epoch': 0.72} {'loss': 0.9482, 'learning_rate': 1.4299865779143391e-05, 'epoch': 0.72} {'loss': 0.8822, 'learning_rate': 1.4299570232327452e-05, 'epoch': 0.72} {'loss': 0.7073, 'learning_rate': 1.4299274680904134e-05, 'epoch': 0.72} {'loss': 0.9964, 'learning_rate': 1.4298979124873757e-05, 'epoch': 0.72} {'loss': 0.9522, 'learning_rate': 1.4298683564236635e-05, 'epoch': 0.72} {'loss': 0.8056, 'learning_rate': 1.4298387998993089e-05, 'epoch': 0.72} {'loss': 0.8477, 'learning_rate': 1.4298092429143428e-05, 'epoch': 0.72} {'loss': 0.7822, 'learning_rate': 1.4297796854687973e-05, 'epoch': 0.72} {'loss': 0.8513, 'learning_rate': 1.4297501275627044e-05, 'epoch': 0.72} {'loss': 0.8267, 'learning_rate': 1.4297205691960953e-05, 'epoch': 0.72} {'loss': 0.7049, 'learning_rate': 1.4296910103690019e-05, 'epoch': 0.72} {'loss': 0.7912, 'learning_rate': 1.4296614510814555e-05, 'epoch': 0.72} {'loss': 0.8865, 'learning_rate': 1.4296318913334883e-05, 'epoch': 0.72} {'loss': 0.7099, 'learning_rate': 1.429602331125132e-05, 'epoch': 0.72} {'loss': 0.8639, 'learning_rate': 1.4295727704564176e-05, 'epoch': 0.72} {'loss': 0.849, 'learning_rate': 1.4295432093273774e-05, 'epoch': 0.72} {'loss': 0.8479, 'learning_rate': 1.4295136477380427e-05, 'epoch': 0.72} {'loss': 0.8719, 'learning_rate': 1.4294840856884456e-05, 'epoch': 0.72} {'loss': 0.9197, 'learning_rate': 1.4294545231786175e-05, 'epoch': 0.72} {'loss': 0.875, 'learning_rate': 1.4294249602085901e-05, 'epoch': 0.72} {'loss': 0.7061, 'learning_rate': 1.4293953967783949e-05, 'epoch': 0.72} {'loss': 0.8856, 'learning_rate': 1.4293658328880637e-05, 'epoch': 0.72} {'loss': 0.9478, 'learning_rate': 1.4293362685376288e-05, 'epoch': 0.72} {'loss': 0.7958, 'learning_rate': 1.4293067037271208e-05, 'epoch': 0.72} {'loss': 0.8967, 'learning_rate': 1.4292771384565722e-05, 'epoch': 0.72} {'loss': 0.7875, 'learning_rate': 1.4292475727260145e-05, 'epoch': 0.72} {'loss': 0.7826, 'learning_rate': 1.4292180065354791e-05, 'epoch': 0.72} {'loss': 0.7601, 'learning_rate': 1.4291884398849977e-05, 'epoch': 0.72} {'loss': 0.7886, 'learning_rate': 1.4291588727746027e-05, 'epoch': 0.72} {'loss': 0.7441, 'learning_rate': 1.4291293052043247e-05, 'epoch': 0.72} {'loss': 0.8293, 'learning_rate': 1.4290997371741962e-05, 'epoch': 0.72} {'loss': 0.7722, 'learning_rate': 1.4290701686842482e-05, 'epoch': 0.72} {'loss': 0.8525, 'learning_rate': 1.4290405997345134e-05, 'epoch': 0.72} {'loss': 0.8711, 'learning_rate': 1.4290110303250226e-05, 'epoch': 0.72} {'loss': 0.7213, 'learning_rate': 1.4289814604558077e-05, 'epoch': 0.72} {'loss': 0.8113, 'learning_rate': 1.4289518901269004e-05, 'epoch': 0.72} {'loss': 0.7013, 'learning_rate': 1.4289223193383326e-05, 'epoch': 0.72} {'loss': 0.7979, 'learning_rate': 1.4288927480901355e-05, 'epoch': 0.72} {'loss': 0.8748, 'learning_rate': 1.4288631763823414e-05, 'epoch': 0.72} {'loss': 0.8308, 'learning_rate': 1.4288336042149817e-05, 'epoch': 0.72} {'loss': 0.7981, 'learning_rate': 1.4288040315880882e-05, 'epoch': 0.72} {'loss': 0.7113, 'learning_rate': 1.4287744585016923e-05, 'epoch': 0.72} {'loss': 0.841, 'learning_rate': 1.4287448849558259e-05, 'epoch': 0.72} {'loss': 0.8617, 'learning_rate': 1.4287153109505205e-05, 'epoch': 0.72} {'loss': 0.7649, 'learning_rate': 1.428685736485808e-05, 'epoch': 0.72} {'loss': 0.827, 'learning_rate': 1.42865616156172e-05, 'epoch': 0.72} {'loss': 0.8522, 'learning_rate': 1.4286265861782886e-05, 'epoch': 0.72} {'loss': 0.7589, 'learning_rate': 1.4285970103355451e-05, 'epoch': 0.72} {'loss': 0.6691, 'learning_rate': 1.4285674340335209e-05, 'epoch': 0.72} {'loss': 0.8, 'learning_rate': 1.4285378572722481e-05, 'epoch': 0.72} {'loss': 0.8274, 'learning_rate': 1.4285082800517583e-05, 'epoch': 0.72} {'loss': 0.8519, 'learning_rate': 1.4284787023720833e-05, 'epoch': 0.72} {'loss': 0.8073, 'learning_rate': 1.4284491242332546e-05, 'epoch': 0.72} {'loss': 0.8474, 'learning_rate': 1.428419545635304e-05, 'epoch': 0.72} {'loss': 0.9229, 'learning_rate': 1.4283899665782633e-05, 'epoch': 0.72} {'loss': 0.9249, 'learning_rate': 1.4283603870621639e-05, 'epoch': 0.72} {'loss': 0.7834, 'learning_rate': 1.4283308070870377e-05, 'epoch': 0.72} {'loss': 0.8762, 'learning_rate': 1.4283012266529164e-05, 'epoch': 0.72} {'loss': 0.9203, 'learning_rate': 1.4282716457598318e-05, 'epoch': 0.72} {'loss': 0.9739, 'learning_rate': 1.4282420644078156e-05, 'epoch': 0.72} {'loss': 0.7945, 'learning_rate': 1.4282124825968992e-05, 'epoch': 0.72} {'loss': 0.6643, 'learning_rate': 1.4281829003271143e-05, 'epoch': 0.72} {'loss': 0.7688, 'learning_rate': 1.428153317598493e-05, 'epoch': 0.72} {'loss': 0.7303, 'learning_rate': 1.4281237344110668e-05, 'epoch': 0.72} {'loss': 0.9467, 'learning_rate': 1.4280941507648671e-05, 'epoch': 0.72} {'loss': 0.6337, 'learning_rate': 1.4280645666599263e-05, 'epoch': 0.72} {'loss': 0.7066, 'learning_rate': 1.4280349820962754e-05, 'epoch': 0.72} {'loss': 0.7769, 'learning_rate': 1.4280053970739467e-05, 'epoch': 0.72} {'loss': 0.8444, 'learning_rate': 1.4279758115929712e-05, 'epoch': 0.72} {'loss': 0.9396, 'learning_rate': 1.4279462256533812e-05, 'epoch': 0.72} {'loss': 0.7422, 'learning_rate': 1.4279166392552079e-05, 'epoch': 0.72} {'loss': 0.8296, 'learning_rate': 1.4278870523984836e-05, 'epoch': 0.72} {'loss': 0.9898, 'learning_rate': 1.4278574650832398e-05, 'epoch': 0.72} {'loss': 0.7582, 'learning_rate': 1.4278278773095077e-05, 'epoch': 0.72} {'loss': 0.8305, 'learning_rate': 1.4277982890773199e-05, 'epoch': 0.72} {'loss': 0.8915, 'learning_rate': 1.4277687003867073e-05, 'epoch': 0.72} {'loss': 0.8471, 'learning_rate': 1.4277391112377018e-05, 'epoch': 0.72} {'loss': 0.8216, 'learning_rate': 1.4277095216303357e-05, 'epoch': 0.72} {'loss': 0.9148, 'learning_rate': 1.4276799315646398e-05, 'epoch': 0.72} {'loss': 0.8599, 'learning_rate': 1.4276503410406463e-05, 'epoch': 0.72} {'loss': 0.8709, 'learning_rate': 1.4276207500583871e-05, 'epoch': 0.72} {'loss': 0.5427, 'learning_rate': 1.4275911586178936e-05, 'epoch': 0.72} {'loss': 0.8641, 'learning_rate': 1.4275615667191978e-05, 'epoch': 0.72} {'loss': 0.9251, 'learning_rate': 1.4275319743623308e-05, 'epoch': 0.72} {'loss': 0.8669, 'learning_rate': 1.427502381547325e-05, 'epoch': 0.72} {'loss': 0.7923, 'learning_rate': 1.4274727882742116e-05, 'epoch': 0.72} {'loss': 0.8256, 'learning_rate': 1.4274431945430225e-05, 'epoch': 0.72} {'loss': 0.6237, 'learning_rate': 1.4274136003537895e-05, 'epoch': 0.72} {'loss': 0.8294, 'learning_rate': 1.4273840057065443e-05, 'epoch': 0.72} {'loss': 0.7954, 'learning_rate': 1.4273544106013187e-05, 'epoch': 0.72} {'loss': 0.7175, 'learning_rate': 1.4273248150381439e-05, 'epoch': 0.72} {'loss': 0.7996, 'learning_rate': 1.4272952190170524e-05, 'epoch': 0.72} {'loss': 0.7776, 'learning_rate': 1.4272656225380752e-05, 'epoch': 0.72} {'loss': 0.773, 'learning_rate': 1.4272360256012444e-05, 'epoch': 0.72} {'loss': 0.7893, 'learning_rate': 1.4272064282065919e-05, 'epoch': 0.72} {'loss': 0.6633, 'learning_rate': 1.4271768303541487e-05, 'epoch': 0.72} {'loss': 0.7845, 'learning_rate': 1.4271472320439473e-05, 'epoch': 0.72} {'loss': 0.808, 'learning_rate': 1.4271176332760191e-05, 'epoch': 0.72} {'loss': 0.9297, 'learning_rate': 1.4270880340503954e-05, 'epoch': 0.72} {'loss': 0.8273, 'learning_rate': 1.4270584343671087e-05, 'epoch': 0.72} {'loss': 0.6643, 'learning_rate': 1.4270288342261902e-05, 'epoch': 0.72} {'loss': 0.7984, 'learning_rate': 1.4269992336276719e-05, 'epoch': 0.72} {'loss': 0.8057, 'learning_rate': 1.4269696325715853e-05, 'epoch': 0.72} {'loss': 0.9105, 'learning_rate': 1.4269400310579624e-05, 'epoch': 0.72} {'loss': 0.6731, 'learning_rate': 1.4269104290868346e-05, 'epoch': 0.72} {'loss': 0.7265, 'learning_rate': 1.4268808266582334e-05, 'epoch': 0.72} {'loss': 0.7327, 'learning_rate': 1.4268512237721913e-05, 'epoch': 0.72} {'loss': 0.763, 'learning_rate': 1.4268216204287393e-05, 'epoch': 0.72} {'loss': 0.7536, 'learning_rate': 1.4267920166279097e-05, 'epoch': 0.72} {'loss': 0.7224, 'learning_rate': 1.4267624123697337e-05, 'epoch': 0.72} {'loss': 0.7291, 'learning_rate': 1.4267328076542435e-05, 'epoch': 0.72} {'loss': 0.7576, 'learning_rate': 1.4267032024814703e-05, 'epoch': 0.72} {'loss': 0.8767, 'learning_rate': 1.4266735968514463e-05, 'epoch': 0.72} {'loss': 0.8024, 'learning_rate': 1.4266439907642027e-05, 'epoch': 0.72} {'loss': 0.8628, 'learning_rate': 1.4266143842197717e-05, 'epoch': 0.72} {'loss': 0.8024, 'learning_rate': 1.4265847772181852e-05, 'epoch': 0.72} {'loss': 0.8893, 'learning_rate': 1.4265551697594747e-05, 'epoch': 0.72} {'loss': 0.8053, 'learning_rate': 1.4265255618436713e-05, 'epoch': 0.72} {'loss': 0.9646, 'learning_rate': 1.4264959534708074e-05, 'epoch': 0.72} {'loss': 0.6717, 'learning_rate': 1.4264663446409146e-05, 'epoch': 0.72} {'loss': 0.7849, 'learning_rate': 1.4264367353540248e-05, 'epoch': 0.72} {'loss': 0.85, 'learning_rate': 1.4264071256101693e-05, 'epoch': 0.72} {'loss': 0.7233, 'learning_rate': 1.4263775154093805e-05, 'epoch': 0.72} {'loss': 0.6963, 'learning_rate': 1.4263479047516896e-05, 'epoch': 0.72} {'loss': 0.6664, 'learning_rate': 1.4263182936371283e-05, 'epoch': 0.72} {'loss': 0.6194, 'learning_rate': 1.4262886820657282e-05, 'epoch': 0.72} {'loss': 0.8955, 'learning_rate': 1.4262590700375215e-05, 'epoch': 0.72} {'loss': 0.9473, 'learning_rate': 1.4262294575525397e-05, 'epoch': 0.72} {'loss': 1.0412, 'learning_rate': 1.426199844610815e-05, 'epoch': 0.72} {'loss': 0.7674, 'learning_rate': 1.4261702312123782e-05, 'epoch': 0.72} {'loss': 0.7162, 'learning_rate': 1.4261406173572618e-05, 'epoch': 0.72} {'loss': 0.8686, 'learning_rate': 1.4261110030454972e-05, 'epoch': 0.72} {'loss': 0.7556, 'learning_rate': 1.4260813882771161e-05, 'epoch': 0.72} {'loss': 0.5941, 'learning_rate': 1.4260517730521504e-05, 'epoch': 0.72} {'loss': 0.5832, 'learning_rate': 1.4260221573706317e-05, 'epoch': 0.72} {'loss': 0.7856, 'learning_rate': 1.4259925412325919e-05, 'epoch': 0.72} {'loss': 0.8965, 'learning_rate': 1.4259629246380626e-05, 'epoch': 0.72} {'loss': 0.7297, 'learning_rate': 1.4259333075870758e-05, 'epoch': 0.72} {'loss': 0.7853, 'learning_rate': 1.4259036900796628e-05, 'epoch': 0.72} {'loss': 0.7345, 'learning_rate': 1.4258740721158555e-05, 'epoch': 0.72} {'loss': 0.8483, 'learning_rate': 1.4258444536956856e-05, 'epoch': 0.72} {'loss': 0.73, 'learning_rate': 1.4258148348191854e-05, 'epoch': 0.72} {'loss': 0.7508, 'learning_rate': 1.4257852154863859e-05, 'epoch': 0.72} {'loss': 0.809, 'learning_rate': 1.425755595697319e-05, 'epoch': 0.72} {'loss': 0.7833, 'learning_rate': 1.4257259754520167e-05, 'epoch': 0.72} {'loss': 0.8138, 'learning_rate': 1.4256963547505105e-05, 'epoch': 0.72} {'loss': 0.7707, 'learning_rate': 1.4256667335928322e-05, 'epoch': 0.72} {'loss': 0.7842, 'learning_rate': 1.4256371119790137e-05, 'epoch': 0.72} {'loss': 0.8836, 'learning_rate': 1.4256074899090867e-05, 'epoch': 0.72} {'loss': 0.7423, 'learning_rate': 1.4255778673830825e-05, 'epoch': 0.72} {'loss': 0.7322, 'learning_rate': 1.4255482444010336e-05, 'epoch': 0.72} {'loss': 0.7546, 'learning_rate': 1.4255186209629713e-05, 'epoch': 0.72} {'loss': 0.8006, 'learning_rate': 1.4254889970689273e-05, 'epoch': 0.72} {'loss': 0.718, 'learning_rate': 1.4254593727189332e-05, 'epoch': 0.72} {'loss': 1.0578, 'learning_rate': 1.4254297479130213e-05, 'epoch': 0.72} {'loss': 0.7872, 'learning_rate': 1.4254001226512228e-05, 'epoch': 0.72} {'loss': 0.8982, 'learning_rate': 1.4253704969335697e-05, 'epoch': 0.72} {'loss': 0.9152, 'learning_rate': 1.425340870760094e-05, 'epoch': 0.72} {'loss': 0.8177, 'learning_rate': 1.425311244130827e-05, 'epoch': 0.72} {'loss': 0.8804, 'learning_rate': 1.4252816170458004e-05, 'epoch': 0.72} {'loss': 0.7676, 'learning_rate': 1.4252519895050466e-05, 'epoch': 0.72} {'loss': 0.7585, 'learning_rate': 1.4252223615085965e-05, 'epoch': 0.72} {'loss': 0.8367, 'learning_rate': 1.4251927330564823e-05, 'epoch': 0.72} {'loss': 0.7447, 'learning_rate': 1.425163104148736e-05, 'epoch': 0.72} {'loss': 0.9352, 'learning_rate': 1.4251334747853892e-05, 'epoch': 0.72} {'loss': 0.8591, 'learning_rate': 1.425103844966473e-05, 'epoch': 0.72} {'loss': 0.7058, 'learning_rate': 1.42507421469202e-05, 'epoch': 0.72} {'loss': 0.9234, 'learning_rate': 1.4250445839620614e-05, 'epoch': 0.72} {'loss': 0.7014, 'learning_rate': 1.4250149527766292e-05, 'epoch': 0.72} {'loss': 0.7694, 'learning_rate': 1.4249853211357552e-05, 'epoch': 0.72} {'loss': 0.877, 'learning_rate': 1.424955689039471e-05, 'epoch': 0.72} {'loss': 0.8874, 'learning_rate': 1.4249260564878085e-05, 'epoch': 0.72} {'loss': 0.8448, 'learning_rate': 1.4248964234807994e-05, 'epoch': 0.72} {'loss': 0.9194, 'learning_rate': 1.4248667900184754e-05, 'epoch': 0.72} {'loss': 1.0309, 'learning_rate': 1.4248371561008682e-05, 'epoch': 0.72} {'loss': 0.7784, 'learning_rate': 1.4248075217280097e-05, 'epoch': 0.72} {'loss': 0.6966, 'learning_rate': 1.4247778868999316e-05, 'epoch': 0.72} {'loss': 0.7556, 'learning_rate': 1.4247482516166658e-05, 'epoch': 0.72} {'loss': 0.7161, 'learning_rate': 1.4247186158782436e-05, 'epoch': 0.72} {'loss': 0.6855, 'learning_rate': 1.4246889796846974e-05, 'epoch': 0.72} {'loss': 0.8712, 'learning_rate': 1.4246593430360584e-05, 'epoch': 0.72} {'loss': 0.8525, 'learning_rate': 1.4246297059323587e-05, 'epoch': 0.72} {'loss': 0.7673, 'learning_rate': 1.4246000683736298e-05, 'epoch': 0.72} {'loss': 0.8899, 'learning_rate': 1.4245704303599037e-05, 'epoch': 0.72} {'loss': 0.6913, 'learning_rate': 1.4245407918912122e-05, 'epoch': 0.72} {'loss': 0.938, 'learning_rate': 1.424511152967587e-05, 'epoch': 0.72} {'loss': 0.7481, 'learning_rate': 1.4244815135890596e-05, 'epoch': 0.72} {'loss': 0.6956, 'learning_rate': 1.4244518737556617e-05, 'epoch': 0.72} {'loss': 0.7601, 'learning_rate': 1.4244222334674256e-05, 'epoch': 0.72} {'loss': 0.9362, 'learning_rate': 1.4243925927243828e-05, 'epoch': 0.72} {'loss': 0.6094, 'learning_rate': 1.4243629515265647e-05, 'epoch': 0.72} {'loss': 1.0039, 'learning_rate': 1.4243333098740038e-05, 'epoch': 0.73} {'loss': 0.7752, 'learning_rate': 1.4243036677667314e-05, 'epoch': 0.73} {'loss': 0.6621, 'learning_rate': 1.424274025204779e-05, 'epoch': 0.73} {'loss': 0.727, 'learning_rate': 1.424244382188179e-05, 'epoch': 0.73} {'loss': 0.83, 'learning_rate': 1.4242147387169626e-05, 'epoch': 0.73} {'loss': 0.9377, 'learning_rate': 1.424185094791162e-05, 'epoch': 0.73} {'loss': 0.85, 'learning_rate': 1.4241554504108088e-05, 'epoch': 0.73} {'loss': 0.8419, 'learning_rate': 1.4241258055759348e-05, 'epoch': 0.73} {'loss': 0.8664, 'learning_rate': 1.4240961602865717e-05, 'epoch': 0.73} {'loss': 0.8668, 'learning_rate': 1.4240665145427512e-05, 'epoch': 0.73} {'loss': 0.83, 'learning_rate': 1.4240368683445052e-05, 'epoch': 0.73} {'loss': 0.9581, 'learning_rate': 1.4240072216918654e-05, 'epoch': 0.73} {'loss': 0.8162, 'learning_rate': 1.4239775745848636e-05, 'epoch': 0.73} {'loss': 0.7947, 'learning_rate': 1.4239479270235317e-05, 'epoch': 0.73} {'loss': 0.9754, 'learning_rate': 1.423918279007901e-05, 'epoch': 0.73} {'loss': 0.8008, 'learning_rate': 1.423888630538004e-05, 'epoch': 0.73} {'loss': 0.8665, 'learning_rate': 1.4238589816138718e-05, 'epoch': 0.73} {'loss': 0.8712, 'learning_rate': 1.4238293322355366e-05, 'epoch': 0.73} {'loss': 0.9038, 'learning_rate': 1.4237996824030298e-05, 'epoch': 0.73} {'loss': 0.7945, 'learning_rate': 1.4237700321163837e-05, 'epoch': 0.73} {'loss': 0.872, 'learning_rate': 1.4237403813756294e-05, 'epoch': 0.73} {'loss': 0.644, 'learning_rate': 1.4237107301807994e-05, 'epoch': 0.73} {'loss': 0.9606, 'learning_rate': 1.4236810785319248e-05, 'epoch': 0.73} {'loss': 0.7891, 'learning_rate': 1.423651426429038e-05, 'epoch': 0.73} {'loss': 0.6594, 'learning_rate': 1.42362177387217e-05, 'epoch': 0.73} {'loss': 0.8616, 'learning_rate': 1.4235921208613535e-05, 'epoch': 0.73} {'loss': 0.9542, 'learning_rate': 1.4235624673966197e-05, 'epoch': 0.73} {'loss': 0.7632, 'learning_rate': 1.4235328134780004e-05, 'epoch': 0.73} {'loss': 0.7804, 'learning_rate': 1.4235031591055276e-05, 'epoch': 0.73} {'loss': 0.7336, 'learning_rate': 1.4234735042792327e-05, 'epoch': 0.73} {'loss': 0.9986, 'learning_rate': 1.4234438489991478e-05, 'epoch': 0.73} {'loss': 0.6642, 'learning_rate': 1.4234141932653045e-05, 'epoch': 0.73} {'loss': 0.8541, 'learning_rate': 1.423384537077735e-05, 'epoch': 0.73} {'loss': 0.8478, 'learning_rate': 1.4233548804364706e-05, 'epoch': 0.73} {'loss': 0.8634, 'learning_rate': 1.4233252233415431e-05, 'epoch': 0.73} {'loss': 0.8873, 'learning_rate': 1.4232955657929846e-05, 'epoch': 0.73} {'loss': 0.8166, 'learning_rate': 1.4232659077908266e-05, 'epoch': 0.73} {'loss': 0.728, 'learning_rate': 1.4232362493351008e-05, 'epoch': 0.73} {'loss': 0.7551, 'learning_rate': 1.4232065904258396e-05, 'epoch': 0.73} {'loss': 0.8358, 'learning_rate': 1.4231769310630741e-05, 'epoch': 0.73} {'loss': 0.8723, 'learning_rate': 1.4231472712468361e-05, 'epoch': 0.73} {'loss': 0.974, 'learning_rate': 1.4231176109771578e-05, 'epoch': 0.73} {'loss': 0.9154, 'learning_rate': 1.4230879502540711e-05, 'epoch': 0.73} {'loss': 0.7865, 'learning_rate': 1.423058289077607e-05, 'epoch': 0.73} {'loss': 0.7827, 'learning_rate': 1.4230286274477982e-05, 'epoch': 0.73} {'loss': 0.7006, 'learning_rate': 1.4229989653646756e-05, 'epoch': 0.73} {'loss': 0.8584, 'learning_rate': 1.4229693028282716e-05, 'epoch': 0.73} {'loss': 0.7995, 'learning_rate': 1.4229396398386179e-05, 'epoch': 0.73} {'loss': 0.6553, 'learning_rate': 1.4229099763957461e-05, 'epoch': 0.73} {'loss': 0.9576, 'learning_rate': 1.4228803124996882e-05, 'epoch': 0.73} {'loss': 0.6917, 'learning_rate': 1.4228506481504758e-05, 'epoch': 0.73} {'loss': 0.7067, 'learning_rate': 1.422820983348141e-05, 'epoch': 0.73} {'loss': 0.8896, 'learning_rate': 1.4227913180927151e-05, 'epoch': 0.73} {'loss': 0.8528, 'learning_rate': 1.42276165238423e-05, 'epoch': 0.73} {'loss': 0.5853, 'learning_rate': 1.4227319862227177e-05, 'epoch': 0.73} {'loss': 0.7949, 'learning_rate': 1.4227023196082102e-05, 'epoch': 0.73} {'loss': 0.8529, 'learning_rate': 1.4226726525407388e-05, 'epoch': 0.73} {'loss': 0.7416, 'learning_rate': 1.4226429850203359e-05, 'epoch': 0.73} {'loss': 0.8453, 'learning_rate': 1.4226133170470325e-05, 'epoch': 0.73} {'loss': 0.8279, 'learning_rate': 1.4225836486208606e-05, 'epoch': 0.73} {'loss': 0.7618, 'learning_rate': 1.4225539797418524e-05, 'epoch': 0.73} {'loss': 0.9027, 'learning_rate': 1.4225243104100395e-05, 'epoch': 0.73} {'loss': 0.7222, 'learning_rate': 1.4224946406254538e-05, 'epoch': 0.73} {'loss': 0.8373, 'learning_rate': 1.4224649703881269e-05, 'epoch': 0.73} {'loss': 0.7229, 'learning_rate': 1.4224352996980906e-05, 'epoch': 0.73} {'loss': 0.8246, 'learning_rate': 1.4224056285553766e-05, 'epoch': 0.73} {'loss': 0.789, 'learning_rate': 1.4223759569600169e-05, 'epoch': 0.73} {'loss': 0.7715, 'learning_rate': 1.4223462849120432e-05, 'epoch': 0.73} {'loss': 0.7746, 'learning_rate': 1.4223166124114874e-05, 'epoch': 0.73} {'loss': 1.0066, 'learning_rate': 1.4222869394583816e-05, 'epoch': 0.73} {'loss': 0.9064, 'learning_rate': 1.422257266052757e-05, 'epoch': 0.73} {'loss': 0.9265, 'learning_rate': 1.4222275921946453e-05, 'epoch': 0.73} {'loss': 1.0238, 'learning_rate': 1.4221979178840788e-05, 'epoch': 0.73} {'loss': 0.7845, 'learning_rate': 1.4221682431210893e-05, 'epoch': 0.73} {'loss': 0.6633, 'learning_rate': 1.4221385679057083e-05, 'epoch': 0.73} {'loss': 0.9527, 'learning_rate': 1.4221088922379676e-05, 'epoch': 0.73} {'loss': 0.7236, 'learning_rate': 1.4220792161178993e-05, 'epoch': 0.73} {'loss': 0.8529, 'learning_rate': 1.4220495395455351e-05, 'epoch': 0.73} {'loss': 0.9307, 'learning_rate': 1.4220198625209065e-05, 'epoch': 0.73} {'loss': 0.8132, 'learning_rate': 1.4219901850440456e-05, 'epoch': 0.73} {'loss': 0.8151, 'learning_rate': 1.4219605071149843e-05, 'epoch': 0.73} {'loss': 0.9488, 'learning_rate': 1.4219308287337538e-05, 'epoch': 0.73} {'loss': 0.882, 'learning_rate': 1.421901149900387e-05, 'epoch': 0.73} {'loss': 0.7508, 'learning_rate': 1.4218714706149145e-05, 'epoch': 0.73} {'loss': 0.8981, 'learning_rate': 1.421841790877369e-05, 'epoch': 0.73} {'loss': 0.8348, 'learning_rate': 1.4218121106877819e-05, 'epoch': 0.73} {'loss': 0.8251, 'learning_rate': 1.4217824300461847e-05, 'epoch': 0.73} {'loss': 0.7215, 'learning_rate': 1.4217527489526098e-05, 'epoch': 0.73} {'loss': 0.7288, 'learning_rate': 1.4217230674070888e-05, 'epoch': 0.73} {'loss': 0.8715, 'learning_rate': 1.4216933854096533e-05, 'epoch': 0.73} {'loss': 0.7705, 'learning_rate': 1.4216637029603356e-05, 'epoch': 0.73} {'loss': 0.8405, 'learning_rate': 1.421634020059167e-05, 'epoch': 0.73} {'loss': 0.8117, 'learning_rate': 1.4216043367061794e-05, 'epoch': 0.73} {'loss': 0.7449, 'learning_rate': 1.4215746529014047e-05, 'epoch': 0.73} {'loss': 0.8754, 'learning_rate': 1.4215449686448745e-05, 'epoch': 0.73} {'loss': 0.7358, 'learning_rate': 1.4215152839366213e-05, 'epoch': 0.73} {'loss': 0.7836, 'learning_rate': 1.4214855987766762e-05, 'epoch': 0.73} {'loss': 0.6607, 'learning_rate': 1.4214559131650711e-05, 'epoch': 0.73} {'loss': 0.853, 'learning_rate': 1.4214262271018384e-05, 'epoch': 0.73} {'loss': 0.8976, 'learning_rate': 1.4213965405870091e-05, 'epoch': 0.73} {'loss': 0.7455, 'learning_rate': 1.4213668536206154e-05, 'epoch': 0.73} {'loss': 0.8654, 'learning_rate': 1.4213371662026893e-05, 'epoch': 0.73} {'loss': 0.7664, 'learning_rate': 1.421307478333262e-05, 'epoch': 0.73} {'loss': 0.8629, 'learning_rate': 1.421277790012366e-05, 'epoch': 0.73} {'loss': 0.7712, 'learning_rate': 1.421248101240033e-05, 'epoch': 0.73} {'loss': 0.6558, 'learning_rate': 1.4212184120162942e-05, 'epoch': 0.73} {'loss': 0.7967, 'learning_rate': 1.4211887223411819e-05, 'epoch': 0.73} {'loss': 0.6918, 'learning_rate': 1.4211590322147284e-05, 'epoch': 0.73} {'loss': 0.8618, 'learning_rate': 1.4211293416369645e-05, 'epoch': 0.73} {'loss': 0.8474, 'learning_rate': 1.4210996506079227e-05, 'epoch': 0.73} {'loss': 0.8314, 'learning_rate': 1.4210699591276345e-05, 'epoch': 0.73} {'loss': 0.6264, 'learning_rate': 1.421040267196132e-05, 'epoch': 0.73} {'loss': 0.9983, 'learning_rate': 1.4210105748134466e-05, 'epoch': 0.73} {'loss': 0.9354, 'learning_rate': 1.4209808819796104e-05, 'epoch': 0.73} {'loss': 0.714, 'learning_rate': 1.4209511886946554e-05, 'epoch': 0.73} {'loss': 0.8552, 'learning_rate': 1.4209214949586133e-05, 'epoch': 0.73} {'loss': 0.9034, 'learning_rate': 1.4208918007715154e-05, 'epoch': 0.73} {'loss': 0.7849, 'learning_rate': 1.4208621061333941e-05, 'epoch': 0.73} {'loss': 0.9071, 'learning_rate': 1.4208324110442813e-05, 'epoch': 0.73} {'loss': 0.7236, 'learning_rate': 1.4208027155042084e-05, 'epoch': 0.73} {'loss': 0.7236, 'learning_rate': 1.4207730195132074e-05, 'epoch': 0.73} {'loss': 0.7706, 'learning_rate': 1.4207433230713102e-05, 'epoch': 0.73} {'loss': 0.8524, 'learning_rate': 1.4207136261785483e-05, 'epoch': 0.73} {'loss': 0.9794, 'learning_rate': 1.420683928834954e-05, 'epoch': 0.73} {'loss': 0.8591, 'learning_rate': 1.420654231040559e-05, 'epoch': 0.73} {'loss': 0.7951, 'learning_rate': 1.420624532795395e-05, 'epoch': 0.73} {'loss': 0.8878, 'learning_rate': 1.420594834099494e-05, 'epoch': 0.73} {'loss': 0.7726, 'learning_rate': 1.4205651349528874e-05, 'epoch': 0.73} {'loss': 0.9321, 'learning_rate': 1.420535435355607e-05, 'epoch': 0.73} {'loss': 0.7523, 'learning_rate': 1.4205057353076854e-05, 'epoch': 0.73} {'loss': 0.9039, 'learning_rate': 1.4204760348091538e-05, 'epoch': 0.73} {'loss': 0.7643, 'learning_rate': 1.4204463338600441e-05, 'epoch': 0.73} {'loss': 0.9784, 'learning_rate': 1.4204166324603885e-05, 'epoch': 0.73} {'loss': 0.879, 'learning_rate': 1.4203869306102184e-05, 'epoch': 0.73} {'loss': 0.6343, 'learning_rate': 1.4203572283095657e-05, 'epoch': 0.73} {'loss': 0.8173, 'learning_rate': 1.4203275255584623e-05, 'epoch': 0.73} {'loss': 0.8102, 'learning_rate': 1.4202978223569399e-05, 'epoch': 0.73} {'loss': 0.7658, 'learning_rate': 1.4202681187050304e-05, 'epoch': 0.73} {'loss': 0.6336, 'learning_rate': 1.4202384146027661e-05, 'epoch': 0.73} {'loss': 0.7711, 'learning_rate': 1.420208710050178e-05, 'epoch': 0.73} {'loss': 0.8327, 'learning_rate': 1.4201790050472989e-05, 'epoch': 0.73} {'loss': 0.8729, 'learning_rate': 1.4201492995941594e-05, 'epoch': 0.73} {'loss': 0.8217, 'learning_rate': 1.4201195936907924e-05, 'epoch': 0.73} {'loss': 0.904, 'learning_rate': 1.4200898873372292e-05, 'epoch': 0.73} {'loss': 0.7869, 'learning_rate': 1.4200601805335015e-05, 'epoch': 0.73} {'loss': 0.8542, 'learning_rate': 1.420030473279642e-05, 'epoch': 0.73} {'loss': 0.8909, 'learning_rate': 1.4200007655756816e-05, 'epoch': 0.73} {'loss': 0.9414, 'learning_rate': 1.4199710574216525e-05, 'epoch': 0.73} {'loss': 0.9209, 'learning_rate': 1.4199413488175864e-05, 'epoch': 0.73} {'loss': 0.8011, 'learning_rate': 1.4199116397635153e-05, 'epoch': 0.73} {'loss': 0.6915, 'learning_rate': 1.4198819302594711e-05, 'epoch': 0.73} {'loss': 0.6972, 'learning_rate': 1.4198522203054855e-05, 'epoch': 0.73} {'loss': 1.0524, 'learning_rate': 1.4198225099015901e-05, 'epoch': 0.73} {'loss': 0.702, 'learning_rate': 1.4197927990478172e-05, 'epoch': 0.73} {'loss': 0.8192, 'learning_rate': 1.4197630877441986e-05, 'epoch': 0.73} {'loss': 0.8443, 'learning_rate': 1.4197333759907657e-05, 'epoch': 0.73} {'loss': 0.9243, 'learning_rate': 1.4197036637875505e-05, 'epoch': 0.73} {'loss': 0.9207, 'learning_rate': 1.4196739511345851e-05, 'epoch': 0.73} {'loss': 0.8518, 'learning_rate': 1.4196442380319013e-05, 'epoch': 0.73} {'loss': 0.8092, 'learning_rate': 1.4196145244795308e-05, 'epoch': 0.73} {'loss': 0.7805, 'learning_rate': 1.4195848104775053e-05, 'epoch': 0.73} {'loss': 0.7729, 'learning_rate': 1.419555096025857e-05, 'epoch': 0.73} {'loss': 0.7176, 'learning_rate': 1.4195253811246175e-05, 'epoch': 0.73} {'loss': 0.723, 'learning_rate': 1.4194956657738184e-05, 'epoch': 0.73} {'loss': 0.8751, 'learning_rate': 1.4194659499734922e-05, 'epoch': 0.73} {'loss': 0.8613, 'learning_rate': 1.4194362337236702e-05, 'epoch': 0.73} {'loss': 0.7853, 'learning_rate': 1.4194065170243845e-05, 'epoch': 0.73} {'loss': 0.7519, 'learning_rate': 1.419376799875667e-05, 'epoch': 0.73} {'loss': 0.7424, 'learning_rate': 1.419347082277549e-05, 'epoch': 0.73} {'loss': 0.8931, 'learning_rate': 1.4193173642300631e-05, 'epoch': 0.73} {'loss': 0.7918, 'learning_rate': 1.4192876457332408e-05, 'epoch': 0.73} {'loss': 0.7755, 'learning_rate': 1.4192579267871138e-05, 'epoch': 0.73} {'loss': 0.7134, 'learning_rate': 1.419228207391714e-05, 'epoch': 0.73} {'loss': 0.904, 'learning_rate': 1.4191984875470732e-05, 'epoch': 0.73} {'loss': 0.9151, 'learning_rate': 1.419168767253224e-05, 'epoch': 0.73} {'loss': 0.9204, 'learning_rate': 1.4191390465101972e-05, 'epoch': 0.73} {'loss': 0.8951, 'learning_rate': 1.4191093253180253e-05, 'epoch': 0.73} {'loss': 0.831, 'learning_rate': 1.4190796036767398e-05, 'epoch': 0.73} {'loss': 0.7927, 'learning_rate': 1.4190498815863724e-05, 'epoch': 0.73} {'loss': 0.6666, 'learning_rate': 1.4190201590469554e-05, 'epoch': 0.73} {'loss': 0.6815, 'learning_rate': 1.4189904360585209e-05, 'epoch': 0.73} {'loss': 0.8531, 'learning_rate': 1.4189607126210999e-05, 'epoch': 0.73} {'loss': 0.7861, 'learning_rate': 1.4189309887347246e-05, 'epoch': 0.73} {'loss': 0.884, 'learning_rate': 1.4189012643994273e-05, 'epoch': 0.73} {'loss': 0.714, 'learning_rate': 1.4188715396152395e-05, 'epoch': 0.73} {'loss': 0.832, 'learning_rate': 1.4188418143821928e-05, 'epoch': 0.73} {'loss': 0.8476, 'learning_rate': 1.4188120887003192e-05, 'epoch': 0.73} {'loss': 0.7552, 'learning_rate': 1.4187823625696509e-05, 'epoch': 0.73} {'loss': 0.7841, 'learning_rate': 1.4187526359902192e-05, 'epoch': 0.73} {'loss': 0.7594, 'learning_rate': 1.4187229089620566e-05, 'epoch': 0.73} {'loss': 1.0378, 'learning_rate': 1.4186931814851946e-05, 'epoch': 0.73} {'loss': 0.6232, 'learning_rate': 1.4186634535596648e-05, 'epoch': 0.73} {'loss': 0.7326, 'learning_rate': 1.4186337251854994e-05, 'epoch': 0.73} {'loss': 0.727, 'learning_rate': 1.4186039963627303e-05, 'epoch': 0.73} {'loss': 0.8814, 'learning_rate': 1.4185742670913891e-05, 'epoch': 0.73} {'loss': 0.8884, 'learning_rate': 1.4185445373715081e-05, 'epoch': 0.73} {'loss': 0.6962, 'learning_rate': 1.4185148072031186e-05, 'epoch': 0.73} {'loss': 0.8033, 'learning_rate': 1.4184850765862526e-05, 'epoch': 0.73} {'loss': 0.8007, 'learning_rate': 1.4184553455209422e-05, 'epoch': 0.73} {'loss': 0.6894, 'learning_rate': 1.418425614007219e-05, 'epoch': 0.73} {'loss': 0.837, 'learning_rate': 1.4183958820451151e-05, 'epoch': 0.73} {'loss': 0.7476, 'learning_rate': 1.4183661496346624e-05, 'epoch': 0.73} {'loss': 0.8282, 'learning_rate': 1.4183364167758926e-05, 'epoch': 0.73} {'loss': 0.8143, 'learning_rate': 1.4183066834688376e-05, 'epoch': 0.73} {'loss': 0.7947, 'learning_rate': 1.418276949713529e-05, 'epoch': 0.73} {'loss': 0.8079, 'learning_rate': 1.4182472155099986e-05, 'epoch': 0.73} {'loss': 0.6909, 'learning_rate': 1.418217480858279e-05, 'epoch': 0.73} {'loss': 0.8186, 'learning_rate': 1.4181877457584014e-05, 'epoch': 0.73} {'loss': 0.671, 'learning_rate': 1.4181580102103983e-05, 'epoch': 0.73} {'loss': 0.6578, 'learning_rate': 1.418128274214301e-05, 'epoch': 0.73} {'loss': 0.7853, 'learning_rate': 1.4180985377701414e-05, 'epoch': 0.73} {'loss': 0.7572, 'learning_rate': 1.4180688008779515e-05, 'epoch': 0.73} {'loss': 0.7858, 'learning_rate': 1.418039063537763e-05, 'epoch': 0.73} {'loss': 0.9072, 'learning_rate': 1.4180093257496079e-05, 'epoch': 0.73} {'loss': 0.9407, 'learning_rate': 1.4179795875135185e-05, 'epoch': 0.73} {'loss': 0.9422, 'learning_rate': 1.417949848829526e-05, 'epoch': 0.73} {'loss': 0.7894, 'learning_rate': 1.4179201096976625e-05, 'epoch': 0.73} {'loss': 0.862, 'learning_rate': 1.4178903701179599e-05, 'epoch': 0.73} {'loss': 0.7902, 'learning_rate': 1.4178606300904499e-05, 'epoch': 0.73} {'loss': 0.7144, 'learning_rate': 1.4178308896151647e-05, 'epoch': 0.73} {'loss': 0.7198, 'learning_rate': 1.417801148692136e-05, 'epoch': 0.73} {'loss': 0.6553, 'learning_rate': 1.4177714073213955e-05, 'epoch': 0.73} {'loss': 0.6181, 'learning_rate': 1.4177416655029755e-05, 'epoch': 0.73} {'loss': 0.7607, 'learning_rate': 1.4177119232369075e-05, 'epoch': 0.73} {'loss': 0.5573, 'learning_rate': 1.4176821805232232e-05, 'epoch': 0.73} {'loss': 0.6946, 'learning_rate': 1.417652437361955e-05, 'epoch': 0.73} {'loss': 0.8363, 'learning_rate': 1.4176226937531343e-05, 'epoch': 0.73} {'loss': 0.7326, 'learning_rate': 1.4175929496967935e-05, 'epoch': 0.73} {'loss': 0.7273, 'learning_rate': 1.417563205192964e-05, 'epoch': 0.73} {'loss': 0.7937, 'learning_rate': 1.4175334602416779e-05, 'epoch': 0.73} {'loss': 0.7356, 'learning_rate': 1.4175037148429671e-05, 'epoch': 0.73} {'loss': 0.8743, 'learning_rate': 1.417473968996863e-05, 'epoch': 0.73} {'loss': 0.7769, 'learning_rate': 1.4174442227033982e-05, 'epoch': 0.73} {'loss': 0.902, 'learning_rate': 1.4174144759626043e-05, 'epoch': 0.73} {'loss': 0.6504, 'learning_rate': 1.417384728774513e-05, 'epoch': 0.73} {'loss': 0.8246, 'learning_rate': 1.4173549811391562e-05, 'epoch': 0.73} {'loss': 0.9208, 'learning_rate': 1.417325233056566e-05, 'epoch': 0.73} {'loss': 0.7427, 'learning_rate': 1.4172954845267741e-05, 'epoch': 0.73} {'loss': 0.9569, 'learning_rate': 1.4172657355498123e-05, 'epoch': 0.73} {'loss': 0.6855, 'learning_rate': 1.417235986125713e-05, 'epoch': 0.73} {'loss': 0.7185, 'learning_rate': 1.4172062362545072e-05, 'epoch': 0.73} {'loss': 0.848, 'learning_rate': 1.4171764859362274e-05, 'epoch': 0.73} {'loss': 0.6601, 'learning_rate': 1.4171467351709053e-05, 'epoch': 0.73} {'loss': 0.8246, 'learning_rate': 1.4171169839585733e-05, 'epoch': 0.73} {'loss': 0.7666, 'learning_rate': 1.4170872322992621e-05, 'epoch': 0.73} {'loss': 0.7933, 'learning_rate': 1.4170574801930049e-05, 'epoch': 0.73} {'loss': 0.9088, 'learning_rate': 1.4170277276398326e-05, 'epoch': 0.73} {'loss': 0.858, 'learning_rate': 1.4169979746397775e-05, 'epoch': 0.73} {'loss': 0.7282, 'learning_rate': 1.4169682211928714e-05, 'epoch': 0.73} {'loss': 0.8749, 'learning_rate': 1.4169384672991463e-05, 'epoch': 0.73} {'loss': 0.7886, 'learning_rate': 1.4169087129586341e-05, 'epoch': 0.73} {'loss': 0.8684, 'learning_rate': 1.4168789581713665e-05, 'epoch': 0.73} {'loss': 0.5958, 'learning_rate': 1.4168492029373756e-05, 'epoch': 0.73} {'loss': 0.9131, 'learning_rate': 1.416819447256693e-05, 'epoch': 0.73} {'loss': 0.7758, 'learning_rate': 1.4167896911293504e-05, 'epoch': 0.73} {'loss': 0.7356, 'learning_rate': 1.4167599345553805e-05, 'epoch': 0.73} {'loss': 0.7135, 'learning_rate': 1.4167301775348144e-05, 'epoch': 0.73} {'loss': 0.8906, 'learning_rate': 1.4167004200676848e-05, 'epoch': 0.73} {'loss': 0.9151, 'learning_rate': 1.4166706621540228e-05, 'epoch': 0.73} {'loss': 0.7605, 'learning_rate': 1.4166409037938604e-05, 'epoch': 0.73} {'loss': 0.8532, 'learning_rate': 1.41661114498723e-05, 'epoch': 0.73} {'loss': 0.962, 'learning_rate': 1.4165813857341628e-05, 'epoch': 0.73} {'loss': 0.7453, 'learning_rate': 1.4165516260346912e-05, 'epoch': 0.73} {'loss': 0.9093, 'learning_rate': 1.4165218658888472e-05, 'epoch': 0.73} {'loss': 1.0864, 'learning_rate': 1.416492105296662e-05, 'epoch': 0.73} {'loss': 0.7649, 'learning_rate': 1.4164623442581684e-05, 'epoch': 0.73} {'loss': 0.6641, 'learning_rate': 1.4164325827733973e-05, 'epoch': 0.73} {'loss': 0.8047, 'learning_rate': 1.4164028208423814e-05, 'epoch': 0.73} {'loss': 1.0062, 'learning_rate': 1.416373058465152e-05, 'epoch': 0.73} {'loss': 0.7808, 'learning_rate': 1.4163432956417415e-05, 'epoch': 0.73} {'loss': 0.8823, 'learning_rate': 1.4163135323721817e-05, 'epoch': 0.73} {'loss': 0.8272, 'learning_rate': 1.4162837686565045e-05, 'epoch': 0.73} {'loss': 0.8662, 'learning_rate': 1.4162540044947413e-05, 'epoch': 0.73} {'loss': 0.8876, 'learning_rate': 1.4162242398869244e-05, 'epoch': 0.73} {'loss': 0.9433, 'learning_rate': 1.4161944748330859e-05, 'epoch': 0.73} {'loss': 0.7371, 'learning_rate': 1.4161647093332572e-05, 'epoch': 0.73} {'loss': 0.853, 'learning_rate': 1.4161349433874704e-05, 'epoch': 0.73} {'loss': 0.8057, 'learning_rate': 1.4161051769957579e-05, 'epoch': 0.73} {'loss': 0.7621, 'learning_rate': 1.4160754101581508e-05, 'epoch': 0.73} {'loss': 0.8661, 'learning_rate': 1.4160456428746816e-05, 'epoch': 0.73} {'loss': 0.7226, 'learning_rate': 1.4160158751453816e-05, 'epoch': 0.73} {'loss': 0.6849, 'learning_rate': 1.4159861069702832e-05, 'epoch': 0.73} {'loss': 0.6972, 'learning_rate': 1.415956338349418e-05, 'epoch': 0.73} {'loss': 0.7939, 'learning_rate': 1.4159265692828183e-05, 'epoch': 0.73} {'loss': 0.7558, 'learning_rate': 1.4158967997705156e-05, 'epoch': 0.73} {'loss': 0.7173, 'learning_rate': 1.4158670298125421e-05, 'epoch': 0.73} {'loss': 0.8985, 'learning_rate': 1.4158372594089294e-05, 'epoch': 0.73} {'loss': 0.8628, 'learning_rate': 1.4158074885597093e-05, 'epoch': 0.73} {'loss': 0.9152, 'learning_rate': 1.4157777172649142e-05, 'epoch': 0.73} {'loss': 0.814, 'learning_rate': 1.4157479455245757e-05, 'epoch': 0.73} {'loss': 0.9832, 'learning_rate': 1.415718173338726e-05, 'epoch': 0.73} {'loss': 0.7737, 'learning_rate': 1.4156884007073965e-05, 'epoch': 0.73} {'loss': 0.9019, 'learning_rate': 1.4156586276306194e-05, 'epoch': 0.73} {'loss': 0.745, 'learning_rate': 1.4156288541084266e-05, 'epoch': 0.73} {'loss': 0.6336, 'learning_rate': 1.4155990801408499e-05, 'epoch': 0.73} {'loss': 0.9002, 'learning_rate': 1.4155693057279214e-05, 'epoch': 0.73} {'loss': 0.8791, 'learning_rate': 1.4155395308696729e-05, 'epoch': 0.73} {'loss': 0.7987, 'learning_rate': 1.4155097555661362e-05, 'epoch': 0.73} {'loss': 0.8173, 'learning_rate': 1.4154799798173432e-05, 'epoch': 0.73} {'loss': 0.7125, 'learning_rate': 1.4154502036233263e-05, 'epoch': 0.73} {'loss': 0.7214, 'learning_rate': 1.4154204269841163e-05, 'epoch': 0.73} {'loss': 0.6517, 'learning_rate': 1.4153906498997463e-05, 'epoch': 0.73} {'loss': 0.5658, 'learning_rate': 1.4153608723702478e-05, 'epoch': 0.73} {'loss': 0.7289, 'learning_rate': 1.4153310943956525e-05, 'epoch': 0.73} {'loss': 0.7047, 'learning_rate': 1.4153013159759923e-05, 'epoch': 0.73} {'loss': 0.7881, 'learning_rate': 1.4152715371112995e-05, 'epoch': 0.73} {'loss': 0.8556, 'learning_rate': 1.4152417578016056e-05, 'epoch': 0.73} {'loss': 0.8655, 'learning_rate': 1.4152119780469427e-05, 'epoch': 0.73} {'loss': 0.9019, 'learning_rate': 1.4151821978473428e-05, 'epoch': 0.73} {'loss': 0.8197, 'learning_rate': 1.4151524172028377e-05, 'epoch': 0.73} {'loss': 0.8508, 'learning_rate': 1.4151226361134591e-05, 'epoch': 0.73} {'loss': 0.743, 'learning_rate': 1.4150928545792393e-05, 'epoch': 0.73} {'loss': 0.9031, 'learning_rate': 1.4150630726002098e-05, 'epoch': 0.73} {'loss': 0.7833, 'learning_rate': 1.4150332901764032e-05, 'epoch': 0.73} {'loss': 0.7987, 'learning_rate': 1.4150035073078505e-05, 'epoch': 0.73} {'loss': 0.7688, 'learning_rate': 1.4149737239945847e-05, 'epoch': 0.73} {'loss': 0.9062, 'learning_rate': 1.4149439402366365e-05, 'epoch': 0.73} {'loss': 0.6539, 'learning_rate': 1.4149141560340388e-05, 'epoch': 0.73} {'loss': 0.7501, 'learning_rate': 1.4148843713868228e-05, 'epoch': 0.73} {'loss': 0.7211, 'learning_rate': 1.414854586295021e-05, 'epoch': 0.73} {'loss': 0.7863, 'learning_rate': 1.414824800758665e-05, 'epoch': 0.73} {'loss': 0.7761, 'learning_rate': 1.414795014777787e-05, 'epoch': 0.73} {'loss': 0.7781, 'learning_rate': 1.4147652283524183e-05, 'epoch': 0.73} {'loss': 0.77, 'learning_rate': 1.4147354414825914e-05, 'epoch': 0.73} {'loss': 0.7519, 'learning_rate': 1.4147056541683379e-05, 'epoch': 0.73} {'loss': 0.8271, 'learning_rate': 1.41467586640969e-05, 'epoch': 0.73} {'loss': 0.821, 'learning_rate': 1.4146460782066797e-05, 'epoch': 0.73} {'loss': 0.7235, 'learning_rate': 1.4146162895593385e-05, 'epoch': 0.73} {'loss': 0.8811, 'learning_rate': 1.4145865004676986e-05, 'epoch': 0.73} {'loss': 0.7805, 'learning_rate': 1.4145567109317917e-05, 'epoch': 0.73} {'loss': 0.7376, 'learning_rate': 1.4145269209516498e-05, 'epoch': 0.73} {'loss': 0.6907, 'learning_rate': 1.414497130527305e-05, 'epoch': 0.73} {'loss': 0.5491, 'learning_rate': 1.4144673396587892e-05, 'epoch': 0.73} {'loss': 0.8505, 'learning_rate': 1.4144375483461344e-05, 'epoch': 0.73} {'loss': 0.7713, 'learning_rate': 1.4144077565893721e-05, 'epoch': 0.73} {'loss': 0.568, 'learning_rate': 1.4143779643885345e-05, 'epoch': 0.73} {'loss': 0.9053, 'learning_rate': 1.4143481717436536e-05, 'epoch': 0.73} {'loss': 0.7954, 'learning_rate': 1.4143183786547609e-05, 'epoch': 0.73} {'loss': 0.7802, 'learning_rate': 1.4142885851218888e-05, 'epoch': 0.73} {'loss': 0.9813, 'learning_rate': 1.4142587911450694e-05, 'epoch': 0.73} {'loss': 0.7026, 'learning_rate': 1.4142289967243341e-05, 'epoch': 0.73} {'loss': 0.8554, 'learning_rate': 1.4141992018597153e-05, 'epoch': 0.73} {'loss': 0.8271, 'learning_rate': 1.4141694065512443e-05, 'epoch': 0.73} {'loss': 0.8758, 'learning_rate': 1.4141396107989535e-05, 'epoch': 0.73} {'loss': 0.7267, 'learning_rate': 1.4141098146028748e-05, 'epoch': 0.73} {'loss': 0.7945, 'learning_rate': 1.4140800179630401e-05, 'epoch': 0.73} {'loss': 0.758, 'learning_rate': 1.4140502208794812e-05, 'epoch': 0.73} {'loss': 0.8125, 'learning_rate': 1.4140204233522303e-05, 'epoch': 0.73} {'loss': 0.8528, 'learning_rate': 1.4139906253813189e-05, 'epoch': 0.73} {'loss': 0.81, 'learning_rate': 1.4139608269667794e-05, 'epoch': 0.73} {'loss': 0.8363, 'learning_rate': 1.4139310281086433e-05, 'epoch': 0.73} {'loss': 0.7591, 'learning_rate': 1.4139012288069426e-05, 'epoch': 0.73} {'loss': 0.7251, 'learning_rate': 1.41387142906171e-05, 'epoch': 0.73} {'loss': 0.9368, 'learning_rate': 1.4138416288729761e-05, 'epoch': 0.73} {'loss': 0.858, 'learning_rate': 1.4138118282407742e-05, 'epoch': 0.73} {'loss': 0.8004, 'learning_rate': 1.413782027165135e-05, 'epoch': 0.73} {'loss': 0.8592, 'learning_rate': 1.4137522256460914e-05, 'epoch': 0.73} {'loss': 0.5961, 'learning_rate': 1.4137224236836746e-05, 'epoch': 0.73} {'loss': 0.8552, 'learning_rate': 1.413692621277917e-05, 'epoch': 0.73} {'loss': 0.8047, 'learning_rate': 1.4136628184288507e-05, 'epoch': 0.73} {'loss': 0.8303, 'learning_rate': 1.4136330151365071e-05, 'epoch': 0.73} {'loss': 0.9027, 'learning_rate': 1.4136032114009185e-05, 'epoch': 0.73} {'loss': 0.7546, 'learning_rate': 1.4135734072221167e-05, 'epoch': 0.73} {'loss': 0.8795, 'learning_rate': 1.4135436026001337e-05, 'epoch': 0.73} {'loss': 0.6728, 'learning_rate': 1.4135137975350013e-05, 'epoch': 0.73} {'loss': 0.9416, 'learning_rate': 1.4134839920267516e-05, 'epoch': 0.73} {'loss': 0.8057, 'learning_rate': 1.4134541860754165e-05, 'epoch': 0.73} {'loss': 0.9545, 'learning_rate': 1.4134243796810277e-05, 'epoch': 0.73} {'loss': 1.0011, 'learning_rate': 1.4133945728436178e-05, 'epoch': 0.73} {'loss': 0.8234, 'learning_rate': 1.4133647655632178e-05, 'epoch': 0.73} {'loss': 0.9049, 'learning_rate': 1.4133349578398606e-05, 'epoch': 0.73} {'loss': 0.8197, 'learning_rate': 1.4133051496735775e-05, 'epoch': 0.73} {'loss': 0.8849, 'learning_rate': 1.4132753410644007e-05, 'epoch': 0.73} {'loss': 0.8375, 'learning_rate': 1.413245532012362e-05, 'epoch': 0.73} {'loss': 0.8415, 'learning_rate': 1.4132157225174931e-05, 'epoch': 0.73} {'loss': 0.817, 'learning_rate': 1.413185912579827e-05, 'epoch': 0.73} {'loss': 0.8389, 'learning_rate': 1.4131561021993943e-05, 'epoch': 0.73} {'loss': 0.772, 'learning_rate': 1.4131262913762276e-05, 'epoch': 0.73} {'loss': 0.7381, 'learning_rate': 1.4130964801103591e-05, 'epoch': 0.73} {'loss': 0.7078, 'learning_rate': 1.4130666684018201e-05, 'epoch': 0.73} {'loss': 0.8914, 'learning_rate': 1.4130368562506429e-05, 'epoch': 0.73} {'loss': 0.7342, 'learning_rate': 1.41300704365686e-05, 'epoch': 0.73} {'loss': 0.8573, 'learning_rate': 1.4129772306205021e-05, 'epoch': 0.73} {'loss': 1.0036, 'learning_rate': 1.412947417141602e-05, 'epoch': 0.73} {'loss': 0.8405, 'learning_rate': 1.4129176032201917e-05, 'epoch': 0.73} {'loss': 0.7476, 'learning_rate': 1.4128877888563027e-05, 'epoch': 0.73} {'loss': 0.8929, 'learning_rate': 1.412857974049967e-05, 'epoch': 0.73} {'loss': 0.8333, 'learning_rate': 1.4128281588012169e-05, 'epoch': 0.73} {'loss': 0.9233, 'learning_rate': 1.4127983431100845e-05, 'epoch': 0.73} {'loss': 0.8479, 'learning_rate': 1.412768526976601e-05, 'epoch': 0.73} {'loss': 0.967, 'learning_rate': 1.412738710400799e-05, 'epoch': 0.73} {'loss': 0.8858, 'learning_rate': 1.41270889338271e-05, 'epoch': 0.73} {'loss': 0.7407, 'learning_rate': 1.4126790759223663e-05, 'epoch': 0.73} {'loss': 0.8893, 'learning_rate': 1.4126492580197996e-05, 'epoch': 0.73} {'loss': 0.8739, 'learning_rate': 1.4126194396750421e-05, 'epoch': 0.73} {'loss': 0.693, 'learning_rate': 1.4125896208881258e-05, 'epoch': 0.73} {'loss': 0.83, 'learning_rate': 1.4125598016590824e-05, 'epoch': 0.73} {'loss': 0.9783, 'learning_rate': 1.4125299819879437e-05, 'epoch': 0.73} {'loss': 0.7621, 'learning_rate': 1.4125001618747421e-05, 'epoch': 0.73} {'loss': 0.8601, 'learning_rate': 1.4124703413195091e-05, 'epoch': 0.73} {'loss': 0.9105, 'learning_rate': 1.412440520322277e-05, 'epoch': 0.73} {'loss': 0.7428, 'learning_rate': 1.4124106988830776e-05, 'epoch': 0.73} {'loss': 0.7119, 'learning_rate': 1.4123808770019433e-05, 'epoch': 0.73} {'loss': 0.8746, 'learning_rate': 1.4123510546789056e-05, 'epoch': 0.73} {'loss': 0.8557, 'learning_rate': 1.4123212319139963e-05, 'epoch': 0.73} {'loss': 0.8418, 'learning_rate': 1.4122914087072475e-05, 'epoch': 0.73} {'loss': 0.9416, 'learning_rate': 1.4122615850586913e-05, 'epoch': 0.73} {'loss': 0.9231, 'learning_rate': 1.4122317609683596e-05, 'epoch': 0.73} {'loss': 0.7575, 'learning_rate': 1.4122019364362845e-05, 'epoch': 0.73} {'loss': 0.7972, 'learning_rate': 1.4121721114624977e-05, 'epoch': 0.73} {'loss': 0.6826, 'learning_rate': 1.4121422860470315e-05, 'epoch': 0.73} {'loss': 0.9085, 'learning_rate': 1.4121124601899175e-05, 'epoch': 0.73} {'loss': 0.9626, 'learning_rate': 1.4120826338911877e-05, 'epoch': 0.73} {'loss': 0.6976, 'learning_rate': 1.4120528071508744e-05, 'epoch': 0.73} {'loss': 0.7847, 'learning_rate': 1.412022979969009e-05, 'epoch': 0.73} {'loss': 0.8029, 'learning_rate': 1.4119931523456241e-05, 'epoch': 0.73} {'loss': 0.893, 'learning_rate': 1.4119633242807512e-05, 'epoch': 0.73} {'loss': 0.8078, 'learning_rate': 1.4119334957744224e-05, 'epoch': 0.73} {'loss': 0.7168, 'learning_rate': 1.4119036668266696e-05, 'epoch': 0.73} {'loss': 0.8023, 'learning_rate': 1.4118738374375252e-05, 'epoch': 0.73} {'loss': 0.8029, 'learning_rate': 1.4118440076070204e-05, 'epoch': 0.73} {'loss': 0.9531, 'learning_rate': 1.4118141773351877e-05, 'epoch': 0.73} {'loss': 0.9802, 'learning_rate': 1.4117843466220592e-05, 'epoch': 0.73} {'loss': 0.8099, 'learning_rate': 1.4117545154676664e-05, 'epoch': 0.73} {'loss': 0.864, 'learning_rate': 1.4117246838720413e-05, 'epoch': 0.73} {'loss': 0.7495, 'learning_rate': 1.4116948518352163e-05, 'epoch': 0.73} {'loss': 0.8167, 'learning_rate': 1.4116650193572227e-05, 'epoch': 0.73} {'loss': 0.8535, 'learning_rate': 1.4116351864380933e-05, 'epoch': 0.73} {'loss': 0.8466, 'learning_rate': 1.4116053530778597e-05, 'epoch': 0.73} {'loss': 0.777, 'learning_rate': 1.4115755192765537e-05, 'epoch': 0.73} {'loss': 0.7167, 'learning_rate': 1.4115456850342073e-05, 'epoch': 0.73} {'loss': 0.979, 'learning_rate': 1.4115158503508525e-05, 'epoch': 0.73} {'loss': 0.8411, 'learning_rate': 1.4114860152265216e-05, 'epoch': 0.73} {'loss': 0.8875, 'learning_rate': 1.4114561796612458e-05, 'epoch': 0.73} {'loss': 0.8174, 'learning_rate': 1.4114263436550581e-05, 'epoch': 0.73} {'loss': 0.6831, 'learning_rate': 1.4113965072079898e-05, 'epoch': 0.73} {'loss': 0.7668, 'learning_rate': 1.4113666703200727e-05, 'epoch': 0.73} {'loss': 0.9061, 'learning_rate': 1.4113368329913395e-05, 'epoch': 0.73} {'loss': 0.6941, 'learning_rate': 1.4113069952218214e-05, 'epoch': 0.73} {'loss': 0.7613, 'learning_rate': 1.4112771570115509e-05, 'epoch': 0.73} {'loss': 0.8066, 'learning_rate': 1.41124731836056e-05, 'epoch': 0.73} {'loss': 0.6647, 'learning_rate': 1.4112174792688801e-05, 'epoch': 0.73} {'loss': 0.9319, 'learning_rate': 1.4111876397365438e-05, 'epoch': 0.73} {'loss': 0.7049, 'learning_rate': 1.4111577997635828e-05, 'epoch': 0.73} {'loss': 0.9102, 'learning_rate': 1.4111279593500291e-05, 'epoch': 0.73} {'loss': 0.828, 'learning_rate': 1.4110981184959147e-05, 'epoch': 0.73} {'loss': 0.8339, 'learning_rate': 1.4110682772012714e-05, 'epoch': 0.73} {'loss': 0.7584, 'learning_rate': 1.4110384354661317e-05, 'epoch': 0.73} {'loss': 0.85, 'learning_rate': 1.4110085932905269e-05, 'epoch': 0.73} {'loss': 0.7225, 'learning_rate': 1.4109787506744894e-05, 'epoch': 0.73} {'loss': 0.9928, 'learning_rate': 1.410948907618051e-05, 'epoch': 0.73} {'loss': 0.784, 'learning_rate': 1.4109190641212438e-05, 'epoch': 0.73} {'loss': 0.8333, 'learning_rate': 1.4108892201840998e-05, 'epoch': 0.73} {'loss': 0.803, 'learning_rate': 1.4108593758066512e-05, 'epoch': 0.73} {'loss': 0.6732, 'learning_rate': 1.410829530988929e-05, 'epoch': 0.73} {'loss': 0.8588, 'learning_rate': 1.4107996857309663e-05, 'epoch': 0.73} {'loss': 0.7563, 'learning_rate': 1.4107698400327945e-05, 'epoch': 0.73} {'loss': 0.8164, 'learning_rate': 1.4107399938944459e-05, 'epoch': 0.73} {'loss': 0.743, 'learning_rate': 1.4107101473159523e-05, 'epoch': 0.73} {'loss': 0.8164, 'learning_rate': 1.410680300297346e-05, 'epoch': 0.73} {'loss': 0.8977, 'learning_rate': 1.4106504528386581e-05, 'epoch': 0.73} {'loss': 0.7916, 'learning_rate': 1.4106206049399214e-05, 'epoch': 0.73} {'loss': 0.595, 'learning_rate': 1.4105907566011677e-05, 'epoch': 0.73} {'loss': 0.7718, 'learning_rate': 1.4105609078224288e-05, 'epoch': 0.73} {'loss': 0.7736, 'learning_rate': 1.4105310586037372e-05, 'epoch': 0.73} {'loss': 0.7567, 'learning_rate': 1.4105012089451242e-05, 'epoch': 0.73} {'loss': 0.7952, 'learning_rate': 1.4104713588466223e-05, 'epoch': 0.73} {'loss': 0.7583, 'learning_rate': 1.4104415083082632e-05, 'epoch': 0.73} {'loss': 0.9036, 'learning_rate': 1.410411657330079e-05, 'epoch': 0.73} {'loss': 0.9194, 'learning_rate': 1.4103818059121016e-05, 'epoch': 0.73} {'loss': 0.8899, 'learning_rate': 1.4103519540543632e-05, 'epoch': 0.73} {'loss': 0.7763, 'learning_rate': 1.4103221017568954e-05, 'epoch': 0.73} {'loss': 0.7754, 'learning_rate': 1.4102922490197308e-05, 'epoch': 0.73} {'loss': 0.8173, 'learning_rate': 1.4102623958429007e-05, 'epoch': 0.73} {'loss': 0.8822, 'learning_rate': 1.4102325422264373e-05, 'epoch': 0.73} {'loss': 0.9322, 'learning_rate': 1.410202688170373e-05, 'epoch': 0.73} {'loss': 0.8465, 'learning_rate': 1.4101728336747393e-05, 'epoch': 0.73} {'loss': 0.9112, 'learning_rate': 1.4101429787395686e-05, 'epoch': 0.73} {'loss': 0.9403, 'learning_rate': 1.4101131233648925e-05, 'epoch': 0.73} {'loss': 0.7524, 'learning_rate': 1.4100832675507437e-05, 'epoch': 0.73} {'loss': 0.855, 'learning_rate': 1.4100534112971532e-05, 'epoch': 0.73} {'loss': 0.6848, 'learning_rate': 1.4100235546041533e-05, 'epoch': 0.73} {'loss': 0.9069, 'learning_rate': 1.4099936974717762e-05, 'epoch': 0.74} {'loss': 0.7557, 'learning_rate': 1.4099638399000538e-05, 'epoch': 0.74} {'loss': 0.907, 'learning_rate': 1.4099339818890187e-05, 'epoch': 0.74} {'loss': 0.6637, 'learning_rate': 1.4099041234387019e-05, 'epoch': 0.74} {'loss': 0.7502, 'learning_rate': 1.4098742645491359e-05, 'epoch': 0.74} {'loss': 0.7623, 'learning_rate': 1.4098444052203526e-05, 'epoch': 0.74} {'loss': 0.7013, 'learning_rate': 1.4098145454523842e-05, 'epoch': 0.74} {'loss': 0.8319, 'learning_rate': 1.4097846852452621e-05, 'epoch': 0.74} {'loss': 0.8013, 'learning_rate': 1.409754824599019e-05, 'epoch': 0.74} {'loss': 0.7597, 'learning_rate': 1.409724963513687e-05, 'epoch': 0.74} {'loss': 0.8359, 'learning_rate': 1.4096951019892972e-05, 'epoch': 0.74} {'loss': 0.7642, 'learning_rate': 1.4096652400258823e-05, 'epoch': 0.74} {'loss': 0.6801, 'learning_rate': 1.4096353776234741e-05, 'epoch': 0.74} {'loss': 0.9533, 'learning_rate': 1.4096055147821046e-05, 'epoch': 0.74} {'loss': 0.7794, 'learning_rate': 1.4095756515018058e-05, 'epoch': 0.74} {'loss': 0.8197, 'learning_rate': 1.40954578778261e-05, 'epoch': 0.74} {'loss': 0.7368, 'learning_rate': 1.4095159236245486e-05, 'epoch': 0.74} {'loss': 0.7504, 'learning_rate': 1.4094860590276541e-05, 'epoch': 0.74} {'loss': 0.764, 'learning_rate': 1.4094561939919582e-05, 'epoch': 0.74} {'loss': 0.7883, 'learning_rate': 1.4094263285174931e-05, 'epoch': 0.74} {'loss': 0.8073, 'learning_rate': 1.4093964626042906e-05, 'epoch': 0.74} {'loss': 0.8392, 'learning_rate': 1.4093665962523833e-05, 'epoch': 0.74} {'loss': 0.8077, 'learning_rate': 1.4093367294618023e-05, 'epoch': 0.74} {'loss': 0.8141, 'learning_rate': 1.40930686223258e-05, 'epoch': 0.74} {'loss': 0.7448, 'learning_rate': 1.4092769945647486e-05, 'epoch': 0.74} {'loss': 0.8365, 'learning_rate': 1.40924712645834e-05, 'epoch': 0.74} {'loss': 0.7678, 'learning_rate': 1.4092172579133862e-05, 'epoch': 0.74} {'loss': 0.818, 'learning_rate': 1.409187388929919e-05, 'epoch': 0.74} {'loss': 0.655, 'learning_rate': 1.409157519507971e-05, 'epoch': 0.74} {'loss': 0.6895, 'learning_rate': 1.4091276496475734e-05, 'epoch': 0.74} {'loss': 0.9628, 'learning_rate': 1.4090977793487587e-05, 'epoch': 0.74} {'loss': 0.8363, 'learning_rate': 1.4090679086115588e-05, 'epoch': 0.74} {'loss': 0.8303, 'learning_rate': 1.4090380374360055e-05, 'epoch': 0.74} {'loss': 0.6911, 'learning_rate': 1.4090081658221313e-05, 'epoch': 0.74} {'loss': 0.8174, 'learning_rate': 1.4089782937699678e-05, 'epoch': 0.74} {'loss': 0.8334, 'learning_rate': 1.4089484212795472e-05, 'epoch': 0.74} {'loss': 0.9404, 'learning_rate': 1.4089185483509017e-05, 'epoch': 0.74} {'loss': 0.8673, 'learning_rate': 1.4088886749840626e-05, 'epoch': 0.74} {'loss': 0.9168, 'learning_rate': 1.4088588011790627e-05, 'epoch': 0.74} {'loss': 0.7936, 'learning_rate': 1.4088289269359337e-05, 'epoch': 0.74} {'loss': 0.7709, 'learning_rate': 1.4087990522547075e-05, 'epoch': 0.74} {'loss': 0.7585, 'learning_rate': 1.4087691771354161e-05, 'epoch': 0.74} {'loss': 0.8658, 'learning_rate': 1.4087393015780918e-05, 'epoch': 0.74} {'loss': 0.7764, 'learning_rate': 1.4087094255827665e-05, 'epoch': 0.74} {'loss': 0.9677, 'learning_rate': 1.408679549149472e-05, 'epoch': 0.74} {'loss': 0.8461, 'learning_rate': 1.4086496722782406e-05, 'epoch': 0.74} {'loss': 0.9919, 'learning_rate': 1.4086197949691043e-05, 'epoch': 0.74} {'loss': 0.7035, 'learning_rate': 1.4085899172220947e-05, 'epoch': 0.74} {'loss': 0.7226, 'learning_rate': 1.4085600390372443e-05, 'epoch': 0.74} {'loss': 0.7986, 'learning_rate': 1.408530160414585e-05, 'epoch': 0.74} {'loss': 0.7967, 'learning_rate': 1.4085002813541483e-05, 'epoch': 0.74} {'loss': 0.7604, 'learning_rate': 1.4084704018559671e-05, 'epoch': 0.74} {'loss': 0.8073, 'learning_rate': 1.4084405219200731e-05, 'epoch': 0.74} {'loss': 0.7412, 'learning_rate': 1.4084106415464983e-05, 'epoch': 0.74} {'loss': 0.7761, 'learning_rate': 1.4083807607352743e-05, 'epoch': 0.74} {'loss': 0.9095, 'learning_rate': 1.4083508794864336e-05, 'epoch': 0.74} {'loss': 0.8593, 'learning_rate': 1.408320997800008e-05, 'epoch': 0.74} {'loss': 0.927, 'learning_rate': 1.4082911156760295e-05, 'epoch': 0.74} {'loss': 0.6989, 'learning_rate': 1.4082612331145304e-05, 'epoch': 0.74} {'loss': 1.0046, 'learning_rate': 1.4082313501155427e-05, 'epoch': 0.74} {'loss': 0.7602, 'learning_rate': 1.4082014666790982e-05, 'epoch': 0.74} {'loss': 0.7428, 'learning_rate': 1.4081715828052288e-05, 'epoch': 0.74} {'loss': 0.9263, 'learning_rate': 1.4081416984939666e-05, 'epoch': 0.74} {'loss': 0.6215, 'learning_rate': 1.4081118137453438e-05, 'epoch': 0.74} {'loss': 0.7147, 'learning_rate': 1.4080819285593924e-05, 'epoch': 0.74} {'loss': 0.7466, 'learning_rate': 1.4080520429361446e-05, 'epoch': 0.74} {'loss': 0.8072, 'learning_rate': 1.4080221568756322e-05, 'epoch': 0.74} {'loss': 0.825, 'learning_rate': 1.407992270377887e-05, 'epoch': 0.74} {'loss': 0.7903, 'learning_rate': 1.4079623834429412e-05, 'epoch': 0.74} {'loss': 0.748, 'learning_rate': 1.4079324960708269e-05, 'epoch': 0.74} {'loss': 0.9588, 'learning_rate': 1.4079026082615763e-05, 'epoch': 0.74} {'loss': 0.87, 'learning_rate': 1.4078727200152212e-05, 'epoch': 0.74} {'loss': 0.8672, 'learning_rate': 1.4078428313317938e-05, 'epoch': 0.74} {'loss': 0.7879, 'learning_rate': 1.4078129422113258e-05, 'epoch': 0.74} {'loss': 0.8218, 'learning_rate': 1.4077830526538497e-05, 'epoch': 0.74} {'loss': 0.6735, 'learning_rate': 1.4077531626593968e-05, 'epoch': 0.74} {'loss': 0.8896, 'learning_rate': 1.4077232722279997e-05, 'epoch': 0.74} {'loss': 0.6614, 'learning_rate': 1.4076933813596902e-05, 'epoch': 0.74} {'loss': 0.8759, 'learning_rate': 1.407663490054501e-05, 'epoch': 0.74} {'loss': 0.8181, 'learning_rate': 1.4076335983124632e-05, 'epoch': 0.74} {'loss': 0.9212, 'learning_rate': 1.4076037061336093e-05, 'epoch': 0.74} {'loss': 0.8085, 'learning_rate': 1.4075738135179711e-05, 'epoch': 0.74} {'loss': 0.8416, 'learning_rate': 1.4075439204655807e-05, 'epoch': 0.74} {'loss': 0.7209, 'learning_rate': 1.4075140269764704e-05, 'epoch': 0.74} {'loss': 0.7344, 'learning_rate': 1.4074841330506721e-05, 'epoch': 0.74} {'loss': 0.8543, 'learning_rate': 1.4074542386882177e-05, 'epoch': 0.74} {'loss': 1.0231, 'learning_rate': 1.4074243438891393e-05, 'epoch': 0.74} {'loss': 0.8874, 'learning_rate': 1.407394448653469e-05, 'epoch': 0.74} {'loss': 0.7663, 'learning_rate': 1.4073645529812385e-05, 'epoch': 0.74} {'loss': 0.9216, 'learning_rate': 1.4073346568724804e-05, 'epoch': 0.74} {'loss': 0.8721, 'learning_rate': 1.4073047603272265e-05, 'epoch': 0.74} {'loss': 0.8255, 'learning_rate': 1.4072748633455087e-05, 'epoch': 0.74} {'loss': 0.8636, 'learning_rate': 1.407244965927359e-05, 'epoch': 0.74} {'loss': 0.8737, 'learning_rate': 1.4072150680728096e-05, 'epoch': 0.74} {'loss': 0.7037, 'learning_rate': 1.4071851697818926e-05, 'epoch': 0.74} {'loss': 0.6655, 'learning_rate': 1.40715527105464e-05, 'epoch': 0.74} {'loss': 1.0356, 'learning_rate': 1.4071253718910835e-05, 'epoch': 0.74} {'loss': 0.7775, 'learning_rate': 1.4070954722912555e-05, 'epoch': 0.74} {'loss': 0.7565, 'learning_rate': 1.407065572255188e-05, 'epoch': 0.74} {'loss': 0.9422, 'learning_rate': 1.407035671782913e-05, 'epoch': 0.74} {'loss': 0.7337, 'learning_rate': 1.4070057708744629e-05, 'epoch': 0.74} {'loss': 0.7596, 'learning_rate': 1.406975869529869e-05, 'epoch': 0.74} {'loss': 0.8234, 'learning_rate': 1.4069459677491636e-05, 'epoch': 0.74} {'loss': 0.7241, 'learning_rate': 1.4069160655323792e-05, 'epoch': 0.74} {'loss': 0.9857, 'learning_rate': 1.4068861628795474e-05, 'epoch': 0.74} {'loss': 0.7875, 'learning_rate': 1.4068562597907002e-05, 'epoch': 0.74} {'loss': 0.9136, 'learning_rate': 1.4068263562658699e-05, 'epoch': 0.74} {'loss': 0.7934, 'learning_rate': 1.4067964523050885e-05, 'epoch': 0.74} {'loss': 0.7982, 'learning_rate': 1.4067665479083878e-05, 'epoch': 0.74} {'loss': 0.8674, 'learning_rate': 1.4067366430758004e-05, 'epoch': 0.74} {'loss': 0.8301, 'learning_rate': 1.4067067378073577e-05, 'epoch': 0.74} {'loss': 0.7822, 'learning_rate': 1.4066768321030921e-05, 'epoch': 0.74} {'loss': 0.8722, 'learning_rate': 1.4066469259630355e-05, 'epoch': 0.74} {'loss': 0.7526, 'learning_rate': 1.40661701938722e-05, 'epoch': 0.74} {'loss': 0.7661, 'learning_rate': 1.4065871123756778e-05, 'epoch': 0.74} {'loss': 0.5975, 'learning_rate': 1.4065572049284408e-05, 'epoch': 0.74} {'loss': 0.7464, 'learning_rate': 1.406527297045541e-05, 'epoch': 0.74} {'loss': 0.6846, 'learning_rate': 1.4064973887270105e-05, 'epoch': 0.74} {'loss': 0.7945, 'learning_rate': 1.4064674799728812e-05, 'epoch': 0.74} {'loss': 0.9703, 'learning_rate': 1.4064375707831856e-05, 'epoch': 0.74} {'loss': 0.8526, 'learning_rate': 1.406407661157955e-05, 'epoch': 0.74} {'loss': 0.8972, 'learning_rate': 1.4063777510972225e-05, 'epoch': 0.74} {'loss': 0.9438, 'learning_rate': 1.4063478406010197e-05, 'epoch': 0.74} {'loss': 0.9058, 'learning_rate': 1.4063179296693778e-05, 'epoch': 0.74} {'loss': 0.6201, 'learning_rate': 1.40628801830233e-05, 'epoch': 0.74} {'loss': 0.8209, 'learning_rate': 1.4062581064999077e-05, 'epoch': 0.74} {'loss': 0.9019, 'learning_rate': 1.4062281942621432e-05, 'epoch': 0.74} {'loss': 0.707, 'learning_rate': 1.4061982815890684e-05, 'epoch': 0.74} {'loss': 0.8209, 'learning_rate': 1.4061683684807159e-05, 'epoch': 0.74} {'loss': 0.8319, 'learning_rate': 1.4061384549371174e-05, 'epoch': 0.74} {'loss': 0.7677, 'learning_rate': 1.4061085409583045e-05, 'epoch': 0.74} {'loss': 0.858, 'learning_rate': 1.4060786265443096e-05, 'epoch': 0.74} {'loss': 0.8927, 'learning_rate': 1.4060487116951648e-05, 'epoch': 0.74} {'loss': 0.9168, 'learning_rate': 1.4060187964109024e-05, 'epoch': 0.74} {'loss': 0.6245, 'learning_rate': 1.4059888806915542e-05, 'epoch': 0.74} {'loss': 0.7724, 'learning_rate': 1.4059589645371521e-05, 'epoch': 0.74} {'loss': 0.8718, 'learning_rate': 1.4059290479477286e-05, 'epoch': 0.74} {'loss': 0.9369, 'learning_rate': 1.4058991309233153e-05, 'epoch': 0.74} {'loss': 0.8085, 'learning_rate': 1.4058692134639444e-05, 'epoch': 0.74} {'loss': 0.7937, 'learning_rate': 1.405839295569648e-05, 'epoch': 0.74} {'loss': 0.7673, 'learning_rate': 1.4058093772404582e-05, 'epoch': 0.74} {'loss': 0.7918, 'learning_rate': 1.405779458476407e-05, 'epoch': 0.74} {'loss': 0.6713, 'learning_rate': 1.405749539277527e-05, 'epoch': 0.74} {'loss': 0.8615, 'learning_rate': 1.4057196196438491e-05, 'epoch': 0.74} {'loss': 0.8061, 'learning_rate': 1.4056896995754062e-05, 'epoch': 0.74} {'loss': 0.6493, 'learning_rate': 1.4056597790722299e-05, 'epoch': 0.74} {'loss': 0.8111, 'learning_rate': 1.4056298581343529e-05, 'epoch': 0.74} {'loss': 1.1684, 'learning_rate': 1.405599936761807e-05, 'epoch': 0.74} {'loss': 0.7239, 'learning_rate': 1.4055700149546238e-05, 'epoch': 0.74} {'loss': 0.7845, 'learning_rate': 1.405540092712836e-05, 'epoch': 0.74} {'loss': 0.8497, 'learning_rate': 1.4055101700364752e-05, 'epoch': 0.74} {'loss': 0.9103, 'learning_rate': 1.4054802469255738e-05, 'epoch': 0.74} {'loss': 0.8114, 'learning_rate': 1.4054503233801635e-05, 'epoch': 0.74} {'loss': 0.897, 'learning_rate': 1.4054203994002769e-05, 'epoch': 0.74} {'loss': 0.8992, 'learning_rate': 1.4053904749859454e-05, 'epoch': 0.74} {'loss': 1.0382, 'learning_rate': 1.4053605501372016e-05, 'epoch': 0.74} {'loss': 0.7783, 'learning_rate': 1.4053306248540774e-05, 'epoch': 0.74} {'loss': 1.0207, 'learning_rate': 1.4053006991366049e-05, 'epoch': 0.74} {'loss': 0.7663, 'learning_rate': 1.4052707729848161e-05, 'epoch': 0.74} {'loss': 0.8076, 'learning_rate': 1.4052408463987428e-05, 'epoch': 0.74} {'loss': 0.7177, 'learning_rate': 1.4052109193784177e-05, 'epoch': 0.74} {'loss': 0.6687, 'learning_rate': 1.4051809919238726e-05, 'epoch': 0.74} {'loss': 0.7769, 'learning_rate': 1.405151064035139e-05, 'epoch': 0.74} {'loss': 0.8081, 'learning_rate': 1.4051211357122501e-05, 'epoch': 0.74} {'loss': 0.6279, 'learning_rate': 1.405091206955237e-05, 'epoch': 0.74} {'loss': 0.9113, 'learning_rate': 1.4050612777641322e-05, 'epoch': 0.74} {'loss': 0.7945, 'learning_rate': 1.4050313481389677e-05, 'epoch': 0.74} {'loss': 0.8336, 'learning_rate': 1.4050014180797754e-05, 'epoch': 0.74} {'loss': 0.8503, 'learning_rate': 1.4049714875865875e-05, 'epoch': 0.74} {'loss': 0.8337, 'learning_rate': 1.404941556659436e-05, 'epoch': 0.74} {'loss': 0.9204, 'learning_rate': 1.4049116252983535e-05, 'epoch': 0.74} {'loss': 0.7804, 'learning_rate': 1.4048816935033713e-05, 'epoch': 0.74} {'loss': 0.9035, 'learning_rate': 1.404851761274522e-05, 'epoch': 0.74} {'loss': 0.7339, 'learning_rate': 1.4048218286118376e-05, 'epoch': 0.74} {'loss': 0.719, 'learning_rate': 1.4047918955153499e-05, 'epoch': 0.74} {'loss': 0.9407, 'learning_rate': 1.4047619619850909e-05, 'epoch': 0.74} {'loss': 0.4879, 'learning_rate': 1.4047320280210935e-05, 'epoch': 0.74} {'loss': 0.6694, 'learning_rate': 1.4047020936233888e-05, 'epoch': 0.74} {'loss': 0.815, 'learning_rate': 1.4046721587920096e-05, 'epoch': 0.74} {'loss': 0.686, 'learning_rate': 1.4046422235269873e-05, 'epoch': 0.74} {'loss': 0.8906, 'learning_rate': 1.4046122878283543e-05, 'epoch': 0.74} {'loss': 0.9173, 'learning_rate': 1.404582351696143e-05, 'epoch': 0.74} {'loss': 0.7326, 'learning_rate': 1.4045524151303849e-05, 'epoch': 0.74} {'loss': 0.8312, 'learning_rate': 1.4045224781311127e-05, 'epoch': 0.74} {'loss': 0.9143, 'learning_rate': 1.404492540698358e-05, 'epoch': 0.74} {'loss': 0.7119, 'learning_rate': 1.4044626028321531e-05, 'epoch': 0.74} {'loss': 0.786, 'learning_rate': 1.4044326645325298e-05, 'epoch': 0.74} {'loss': 0.7609, 'learning_rate': 1.4044027257995208e-05, 'epoch': 0.74} {'loss': 0.9222, 'learning_rate': 1.4043727866331573e-05, 'epoch': 0.74} {'loss': 0.8444, 'learning_rate': 1.404342847033472e-05, 'epoch': 0.74} {'loss': 0.7158, 'learning_rate': 1.4043129070004971e-05, 'epoch': 0.74} {'loss': 0.6255, 'learning_rate': 1.4042829665342645e-05, 'epoch': 0.74} {'loss': 0.9069, 'learning_rate': 1.4042530256348059e-05, 'epoch': 0.74} {'loss': 0.7551, 'learning_rate': 1.4042230843021538e-05, 'epoch': 0.74} {'loss': 0.7911, 'learning_rate': 1.40419314253634e-05, 'epoch': 0.74} {'loss': 0.9599, 'learning_rate': 1.4041632003373968e-05, 'epoch': 0.74} {'loss': 0.8458, 'learning_rate': 1.4041332577053563e-05, 'epoch': 0.74} {'loss': 0.8607, 'learning_rate': 1.404103314640251e-05, 'epoch': 0.74} {'loss': 0.7613, 'learning_rate': 1.4040733711421122e-05, 'epoch': 0.74} {'loss': 0.8387, 'learning_rate': 1.4040434272109722e-05, 'epoch': 0.74} {'loss': 0.8647, 'learning_rate': 1.404013482846863e-05, 'epoch': 0.74} {'loss': 0.8567, 'learning_rate': 1.4039835380498172e-05, 'epoch': 0.74} {'loss': 0.8192, 'learning_rate': 1.4039535928198664e-05, 'epoch': 0.74} {'loss': 0.9638, 'learning_rate': 1.403923647157043e-05, 'epoch': 0.74} {'loss': 0.7444, 'learning_rate': 1.4038937010613792e-05, 'epoch': 0.74} {'loss': 0.9341, 'learning_rate': 1.4038637545329065e-05, 'epoch': 0.74} {'loss': 0.6444, 'learning_rate': 1.4038338075716575e-05, 'epoch': 0.74} {'loss': 0.6408, 'learning_rate': 1.403803860177664e-05, 'epoch': 0.74} {'loss': 0.8424, 'learning_rate': 1.4037739123509582e-05, 'epoch': 0.74} {'loss': 0.7345, 'learning_rate': 1.4037439640915722e-05, 'epoch': 0.74} {'loss': 0.8017, 'learning_rate': 1.4037140153995383e-05, 'epoch': 0.74} {'loss': 0.8487, 'learning_rate': 1.4036840662748883e-05, 'epoch': 0.74} {'loss': 0.7864, 'learning_rate': 1.4036541167176546e-05, 'epoch': 0.74} {'loss': 0.8216, 'learning_rate': 1.4036241667278687e-05, 'epoch': 0.74} {'loss': 0.9482, 'learning_rate': 1.4035942163055632e-05, 'epoch': 0.74} {'loss': 0.7877, 'learning_rate': 1.40356426545077e-05, 'epoch': 0.74} {'loss': 0.7018, 'learning_rate': 1.4035343141635215e-05, 'epoch': 0.74} {'loss': 0.8656, 'learning_rate': 1.4035043624438494e-05, 'epoch': 0.74} {'loss': 0.7669, 'learning_rate': 1.403474410291786e-05, 'epoch': 0.74} {'loss': 0.8152, 'learning_rate': 1.4034444577073634e-05, 'epoch': 0.74} {'loss': 0.872, 'learning_rate': 1.4034145046906137e-05, 'epoch': 0.74} {'loss': 0.67, 'learning_rate': 1.4033845512415687e-05, 'epoch': 0.74} {'loss': 0.877, 'learning_rate': 1.4033545973602609e-05, 'epoch': 0.74} {'loss': 0.7833, 'learning_rate': 1.4033246430467221e-05, 'epoch': 0.74} {'loss': 0.9531, 'learning_rate': 1.4032946883009847e-05, 'epoch': 0.74} {'loss': 0.8478, 'learning_rate': 1.4032647331230806e-05, 'epoch': 0.74} {'loss': 0.8097, 'learning_rate': 1.4032347775130419e-05, 'epoch': 0.74} {'loss': 0.7418, 'learning_rate': 1.4032048214709008e-05, 'epoch': 0.74} {'loss': 0.8083, 'learning_rate': 1.4031748649966894e-05, 'epoch': 0.74} {'loss': 0.7234, 'learning_rate': 1.4031449080904398e-05, 'epoch': 0.74} {'loss': 0.7852, 'learning_rate': 1.4031149507521838e-05, 'epoch': 0.74} {'loss': 0.9056, 'learning_rate': 1.4030849929819539e-05, 'epoch': 0.74} {'loss': 0.7996, 'learning_rate': 1.403055034779782e-05, 'epoch': 0.74} {'loss': 0.6297, 'learning_rate': 1.4030250761457002e-05, 'epoch': 0.74} {'loss': 0.8296, 'learning_rate': 1.402995117079741e-05, 'epoch': 0.74} {'loss': 0.8714, 'learning_rate': 1.4029651575819359e-05, 'epoch': 0.74} {'loss': 0.7182, 'learning_rate': 1.4029351976523171e-05, 'epoch': 0.74} {'loss': 0.7365, 'learning_rate': 1.4029052372909168e-05, 'epoch': 0.74} {'loss': 0.6488, 'learning_rate': 1.4028752764977676e-05, 'epoch': 0.74} {'loss': 0.783, 'learning_rate': 1.402845315272901e-05, 'epoch': 0.74} {'loss': 0.631, 'learning_rate': 1.402815353616349e-05, 'epoch': 0.74} {'loss': 0.7988, 'learning_rate': 1.4027853915281446e-05, 'epoch': 0.74} {'loss': 0.6649, 'learning_rate': 1.4027554290083189e-05, 'epoch': 0.74} {'loss': 0.8821, 'learning_rate': 1.4027254660569045e-05, 'epoch': 0.74} {'loss': 0.8966, 'learning_rate': 1.4026955026739333e-05, 'epoch': 0.74} {'loss': 0.7963, 'learning_rate': 1.4026655388594375e-05, 'epoch': 0.74} {'loss': 0.7066, 'learning_rate': 1.4026355746134495e-05, 'epoch': 0.74} {'loss': 0.8569, 'learning_rate': 1.4026056099360008e-05, 'epoch': 0.74} {'loss': 0.7645, 'learning_rate': 1.4025756448271242e-05, 'epoch': 0.74} {'loss': 0.8914, 'learning_rate': 1.4025456792868512e-05, 'epoch': 0.74} {'loss': 0.9428, 'learning_rate': 1.4025157133152143e-05, 'epoch': 0.74} {'loss': 0.7137, 'learning_rate': 1.4024857469122453e-05, 'epoch': 0.74} {'loss': 0.6922, 'learning_rate': 1.4024557800779768e-05, 'epoch': 0.74} {'loss': 0.8894, 'learning_rate': 1.4024258128124403e-05, 'epoch': 0.74} {'loss': 0.8879, 'learning_rate': 1.4023958451156685e-05, 'epoch': 0.74} {'loss': 0.8575, 'learning_rate': 1.402365876987693e-05, 'epoch': 0.74} {'loss': 0.6606, 'learning_rate': 1.4023359084285462e-05, 'epoch': 0.74} {'loss': 0.8159, 'learning_rate': 1.4023059394382603e-05, 'epoch': 0.74} {'loss': 0.9066, 'learning_rate': 1.4022759700168671e-05, 'epoch': 0.74} {'loss': 0.7879, 'learning_rate': 1.4022460001643992e-05, 'epoch': 0.74} {'loss': 0.8156, 'learning_rate': 1.4022160298808882e-05, 'epoch': 0.74} {'loss': 0.88, 'learning_rate': 1.4021860591663663e-05, 'epoch': 0.74} {'loss': 0.7244, 'learning_rate': 1.4021560880208658e-05, 'epoch': 0.74} {'loss': 0.7674, 'learning_rate': 1.4021261164444187e-05, 'epoch': 0.74} {'loss': 0.7458, 'learning_rate': 1.4020961444370574e-05, 'epoch': 0.74} {'loss': 0.9966, 'learning_rate': 1.4020661719988133e-05, 'epoch': 0.74} {'loss': 0.8035, 'learning_rate': 1.4020361991297195e-05, 'epoch': 0.74} {'loss': 0.9122, 'learning_rate': 1.4020062258298077e-05, 'epoch': 0.74} {'loss': 0.8099, 'learning_rate': 1.4019762520991096e-05, 'epoch': 0.74} {'loss': 0.8138, 'learning_rate': 1.4019462779376578e-05, 'epoch': 0.74} {'loss': 0.7546, 'learning_rate': 1.4019163033454844e-05, 'epoch': 0.74} {'loss': 0.8251, 'learning_rate': 1.4018863283226212e-05, 'epoch': 0.74} {'loss': 0.7646, 'learning_rate': 1.4018563528691005e-05, 'epoch': 0.74} {'loss': 0.7967, 'learning_rate': 1.4018263769849546e-05, 'epoch': 0.74} {'loss': 0.8304, 'learning_rate': 1.4017964006702157e-05, 'epoch': 0.74} {'loss': 0.7103, 'learning_rate': 1.4017664239249153e-05, 'epoch': 0.74} {'loss': 0.7615, 'learning_rate': 1.4017364467490859e-05, 'epoch': 0.74} {'loss': 0.7996, 'learning_rate': 1.4017064691427597e-05, 'epoch': 0.74} {'loss': 0.8658, 'learning_rate': 1.4016764911059688e-05, 'epoch': 0.74} {'loss': 0.9376, 'learning_rate': 1.4016465126387454e-05, 'epoch': 0.74} {'loss': 0.7966, 'learning_rate': 1.4016165337411216e-05, 'epoch': 0.74} {'loss': 0.833, 'learning_rate': 1.4015865544131294e-05, 'epoch': 0.74} {'loss': 0.6892, 'learning_rate': 1.4015565746548008e-05, 'epoch': 0.74} {'loss': 0.7119, 'learning_rate': 1.401526594466168e-05, 'epoch': 0.74} {'loss': 0.8521, 'learning_rate': 1.4014966138472632e-05, 'epoch': 0.74} {'loss': 0.7871, 'learning_rate': 1.401466632798119e-05, 'epoch': 0.74} {'loss': 0.768, 'learning_rate': 1.4014366513187665e-05, 'epoch': 0.74} {'loss': 0.7648, 'learning_rate': 1.4014066694092386e-05, 'epoch': 0.74} {'loss': 0.8469, 'learning_rate': 1.4013766870695675e-05, 'epoch': 0.74} {'loss': 0.9142, 'learning_rate': 1.4013467042997847e-05, 'epoch': 0.74} {'loss': 0.7534, 'learning_rate': 1.4013167210999227e-05, 'epoch': 0.74} {'loss': 0.883, 'learning_rate': 1.4012867374700136e-05, 'epoch': 0.74} {'loss': 0.8032, 'learning_rate': 1.40125675341009e-05, 'epoch': 0.74} {'loss': 0.5884, 'learning_rate': 1.401226768920183e-05, 'epoch': 0.74} {'loss': 0.8265, 'learning_rate': 1.4011967840003255e-05, 'epoch': 0.74} {'loss': 0.773, 'learning_rate': 1.4011667986505497e-05, 'epoch': 0.74} {'loss': 0.9436, 'learning_rate': 1.401136812870887e-05, 'epoch': 0.74} {'loss': 0.7854, 'learning_rate': 1.4011068266613703e-05, 'epoch': 0.74} {'loss': 0.7551, 'learning_rate': 1.4010768400220315e-05, 'epoch': 0.74} {'loss': 0.8577, 'learning_rate': 1.4010468529529027e-05, 'epoch': 0.74} {'loss': 0.7052, 'learning_rate': 1.4010168654540156e-05, 'epoch': 0.74} {'loss': 0.8453, 'learning_rate': 1.4009868775254032e-05, 'epoch': 0.74} {'loss': 0.7042, 'learning_rate': 1.4009568891670968e-05, 'epoch': 0.74} {'loss': 0.678, 'learning_rate': 1.400926900379129e-05, 'epoch': 0.74} {'loss': 0.7635, 'learning_rate': 1.400896911161532e-05, 'epoch': 0.74} {'loss': 0.9394, 'learning_rate': 1.4008669215143376e-05, 'epoch': 0.74} {'loss': 0.6934, 'learning_rate': 1.4008369314375782e-05, 'epoch': 0.74} {'loss': 0.8098, 'learning_rate': 1.4008069409312857e-05, 'epoch': 0.74} {'loss': 0.8394, 'learning_rate': 1.4007769499954926e-05, 'epoch': 0.74} {'loss': 0.4727, 'learning_rate': 1.4007469586302307e-05, 'epoch': 0.74} {'loss': 0.7888, 'learning_rate': 1.4007169668355325e-05, 'epoch': 0.74} {'loss': 0.7634, 'learning_rate': 1.4006869746114298e-05, 'epoch': 0.74} {'loss': 0.8986, 'learning_rate': 1.4006569819579545e-05, 'epoch': 0.74} {'loss': 0.8081, 'learning_rate': 1.4006269888751394e-05, 'epoch': 0.74} {'loss': 0.7657, 'learning_rate': 1.4005969953630161e-05, 'epoch': 0.74} {'loss': 0.9393, 'learning_rate': 1.4005670014216172e-05, 'epoch': 0.74} {'loss': 0.8509, 'learning_rate': 1.4005370070509744e-05, 'epoch': 0.74} {'loss': 0.957, 'learning_rate': 1.4005070122511204e-05, 'epoch': 0.74} {'loss': 0.8961, 'learning_rate': 1.4004770170220867e-05, 'epoch': 0.74} {'loss': 0.8408, 'learning_rate': 1.4004470213639059e-05, 'epoch': 0.74} {'loss': 0.7981, 'learning_rate': 1.4004170252766095e-05, 'epoch': 0.74} {'loss': 0.8341, 'learning_rate': 1.4003870287602305e-05, 'epoch': 0.74} {'loss': 0.8238, 'learning_rate': 1.4003570318148008e-05, 'epoch': 0.74} {'loss': 0.9523, 'learning_rate': 1.4003270344403525e-05, 'epoch': 0.74} {'loss': 0.8173, 'learning_rate': 1.4002970366369172e-05, 'epoch': 0.74} {'loss': 0.7916, 'learning_rate': 1.4002670384045279e-05, 'epoch': 0.74} {'loss': 0.7101, 'learning_rate': 1.400237039743216e-05, 'epoch': 0.74} {'loss': 0.7598, 'learning_rate': 1.400207040653014e-05, 'epoch': 0.74} {'loss': 0.7128, 'learning_rate': 1.4001770411339541e-05, 'epoch': 0.74} {'loss': 0.6968, 'learning_rate': 1.4001470411860685e-05, 'epoch': 0.74} {'loss': 0.8903, 'learning_rate': 1.4001170408093895e-05, 'epoch': 0.74} {'loss': 0.749, 'learning_rate': 1.4000870400039486e-05, 'epoch': 0.74} {'loss': 0.7895, 'learning_rate': 1.4000570387697782e-05, 'epoch': 0.74} {'loss': 0.8298, 'learning_rate': 1.4000270371069107e-05, 'epoch': 0.74} {'loss': 0.8031, 'learning_rate': 1.3999970350153782e-05, 'epoch': 0.74} {'loss': 0.8356, 'learning_rate': 1.3999670324952129e-05, 'epoch': 0.74} {'loss': 0.8196, 'learning_rate': 1.3999370295464465e-05, 'epoch': 0.74} {'loss': 0.8382, 'learning_rate': 1.399907026169112e-05, 'epoch': 0.74} {'loss': 0.7579, 'learning_rate': 1.3998770223632406e-05, 'epoch': 0.74} {'loss': 1.0451, 'learning_rate': 1.3998470181288649e-05, 'epoch': 0.74} {'loss': 0.663, 'learning_rate': 1.399817013466017e-05, 'epoch': 0.74} {'loss': 0.889, 'learning_rate': 1.399787008374729e-05, 'epoch': 0.74} {'loss': 0.7894, 'learning_rate': 1.3997570028550334e-05, 'epoch': 0.74} {'loss': 0.7517, 'learning_rate': 1.3997269969069623e-05, 'epoch': 0.74} {'loss': 0.7812, 'learning_rate': 1.399696990530547e-05, 'epoch': 0.74} {'loss': 0.7384, 'learning_rate': 1.3996669837258207e-05, 'epoch': 0.74} {'loss': 0.8501, 'learning_rate': 1.3996369764928152e-05, 'epoch': 0.74} {'loss': 0.7135, 'learning_rate': 1.3996069688315624e-05, 'epoch': 0.74} {'loss': 0.9866, 'learning_rate': 1.3995769607420951e-05, 'epoch': 0.74} {'loss': 0.8732, 'learning_rate': 1.3995469522244446e-05, 'epoch': 0.74} {'loss': 0.8341, 'learning_rate': 1.3995169432786436e-05, 'epoch': 0.74} {'loss': 0.7991, 'learning_rate': 1.3994869339047242e-05, 'epoch': 0.74} {'loss': 0.7417, 'learning_rate': 1.3994569241027182e-05, 'epoch': 0.74} {'loss': 0.8085, 'learning_rate': 1.3994269138726581e-05, 'epoch': 0.74} {'loss': 0.9401, 'learning_rate': 1.3993969032145765e-05, 'epoch': 0.74} {'loss': 0.6861, 'learning_rate': 1.3993668921285047e-05, 'epoch': 0.74} {'loss': 0.7332, 'learning_rate': 1.3993368806144752e-05, 'epoch': 0.74} {'loss': 0.8592, 'learning_rate': 1.3993068686725203e-05, 'epoch': 0.74} {'loss': 0.7587, 'learning_rate': 1.399276856302672e-05, 'epoch': 0.74} {'loss': 0.843, 'learning_rate': 1.3992468435049625e-05, 'epoch': 0.74} {'loss': 0.8084, 'learning_rate': 1.399216830279424e-05, 'epoch': 0.74} {'loss': 0.7459, 'learning_rate': 1.3991868166260887e-05, 'epoch': 0.74} {'loss': 0.7138, 'learning_rate': 1.3991568025449887e-05, 'epoch': 0.74} {'loss': 0.6984, 'learning_rate': 1.3991267880361558e-05, 'epoch': 0.74} {'loss': 0.9297, 'learning_rate': 1.3990967730996232e-05, 'epoch': 0.74} {'loss': 0.7599, 'learning_rate': 1.3990667577354217e-05, 'epoch': 0.74} {'loss': 0.8122, 'learning_rate': 1.3990367419435847e-05, 'epoch': 0.74} {'loss': 0.7289, 'learning_rate': 1.3990067257241436e-05, 'epoch': 0.74} {'loss': 0.7672, 'learning_rate': 1.3989767090771307e-05, 'epoch': 0.74} {'loss': 0.7217, 'learning_rate': 1.3989466920025782e-05, 'epoch': 0.74} {'loss': 0.8557, 'learning_rate': 1.3989166745005183e-05, 'epoch': 0.74} {'loss': 0.834, 'learning_rate': 1.3988866565709835e-05, 'epoch': 0.74} {'loss': 0.7142, 'learning_rate': 1.3988566382140055e-05, 'epoch': 0.74} {'loss': 0.7485, 'learning_rate': 1.3988266194296165e-05, 'epoch': 0.74} {'loss': 0.719, 'learning_rate': 1.3987966002178488e-05, 'epoch': 0.74} {'loss': 0.7672, 'learning_rate': 1.3987665805787345e-05, 'epoch': 0.74} {'loss': 0.834, 'learning_rate': 1.398736560512306e-05, 'epoch': 0.74} {'loss': 0.8684, 'learning_rate': 1.398706540018595e-05, 'epoch': 0.74} {'loss': 0.738, 'learning_rate': 1.3986765190976343e-05, 'epoch': 0.74} {'loss': 0.9205, 'learning_rate': 1.3986464977494553e-05, 'epoch': 0.74} {'loss': 0.7237, 'learning_rate': 1.3986164759740913e-05, 'epoch': 0.74} {'loss': 0.8123, 'learning_rate': 1.3985864537715732e-05, 'epoch': 0.74} {'loss': 0.7784, 'learning_rate': 1.3985564311419337e-05, 'epoch': 0.74} {'loss': 0.989, 'learning_rate': 1.3985264080852052e-05, 'epoch': 0.74} {'loss': 0.7723, 'learning_rate': 1.3984963846014198e-05, 'epoch': 0.74} {'loss': 0.8996, 'learning_rate': 1.3984663606906095e-05, 'epoch': 0.74} {'loss': 0.7179, 'learning_rate': 1.3984363363528064e-05, 'epoch': 0.74} {'loss': 0.9699, 'learning_rate': 1.3984063115880429e-05, 'epoch': 0.74} {'loss': 0.8104, 'learning_rate': 1.398376286396351e-05, 'epoch': 0.74} {'loss': 0.7423, 'learning_rate': 1.398346260777763e-05, 'epoch': 0.74} {'loss': 0.7972, 'learning_rate': 1.3983162347323108e-05, 'epoch': 0.74} {'loss': 0.9251, 'learning_rate': 1.3982862082600272e-05, 'epoch': 0.74} {'loss': 0.7913, 'learning_rate': 1.3982561813609441e-05, 'epoch': 0.74} {'loss': 0.8738, 'learning_rate': 1.3982261540350931e-05, 'epoch': 0.74} {'loss': 0.8125, 'learning_rate': 1.398196126282507e-05, 'epoch': 0.74} {'loss': 0.8104, 'learning_rate': 1.3981660981032176e-05, 'epoch': 0.74} {'loss': 0.7436, 'learning_rate': 1.3981360694972575e-05, 'epoch': 0.74} {'loss': 0.7815, 'learning_rate': 1.3981060404646587e-05, 'epoch': 0.74} {'loss': 0.991, 'learning_rate': 1.3980760110054534e-05, 'epoch': 0.74} {'loss': 0.9115, 'learning_rate': 1.3980459811196739e-05, 'epoch': 0.74} {'loss': 0.8273, 'learning_rate': 1.3980159508073518e-05, 'epoch': 0.74} {'loss': 0.8581, 'learning_rate': 1.3979859200685198e-05, 'epoch': 0.74} {'loss': 0.7555, 'learning_rate': 1.39795588890321e-05, 'epoch': 0.74} {'loss': 0.8511, 'learning_rate': 1.3979258573114544e-05, 'epoch': 0.74} {'loss': 0.7183, 'learning_rate': 1.3978958252932855e-05, 'epoch': 0.74} {'loss': 0.7438, 'learning_rate': 1.3978657928487353e-05, 'epoch': 0.74} {'loss': 0.8157, 'learning_rate': 1.397835759977836e-05, 'epoch': 0.74} {'loss': 0.7363, 'learning_rate': 1.3978057266806198e-05, 'epoch': 0.74} {'loss': 0.7607, 'learning_rate': 1.3977756929571187e-05, 'epoch': 0.74} {'loss': 0.801, 'learning_rate': 1.3977456588073653e-05, 'epoch': 0.74} {'loss': 0.7017, 'learning_rate': 1.3977156242313912e-05, 'epoch': 0.74} {'loss': 0.8134, 'learning_rate': 1.3976855892292291e-05, 'epoch': 0.74} {'loss': 0.856, 'learning_rate': 1.3976555538009112e-05, 'epoch': 0.74} {'loss': 0.8706, 'learning_rate': 1.3976255179464693e-05, 'epoch': 0.74} {'loss': 0.8203, 'learning_rate': 1.3975954816659356e-05, 'epoch': 0.74} {'loss': 0.7665, 'learning_rate': 1.3975654449593425e-05, 'epoch': 0.74} {'loss': 0.7473, 'learning_rate': 1.3975354078267223e-05, 'epoch': 0.74} {'loss': 0.8078, 'learning_rate': 1.3975053702681071e-05, 'epoch': 0.74} {'loss': 0.7609, 'learning_rate': 1.3974753322835288e-05, 'epoch': 0.74} {'loss': 0.9001, 'learning_rate': 1.3974452938730202e-05, 'epoch': 0.74} {'loss': 0.8256, 'learning_rate': 1.3974152550366127e-05, 'epoch': 0.74} {'loss': 0.7774, 'learning_rate': 1.3973852157743388e-05, 'epoch': 0.74} {'loss': 0.8926, 'learning_rate': 1.3973551760862309e-05, 'epoch': 0.74} {'loss': 0.8826, 'learning_rate': 1.3973251359723212e-05, 'epoch': 0.74} {'loss': 0.8188, 'learning_rate': 1.3972950954326419e-05, 'epoch': 0.74} {'loss': 0.8908, 'learning_rate': 1.3972650544672245e-05, 'epoch': 0.74} {'loss': 0.7232, 'learning_rate': 1.3972350130761023e-05, 'epoch': 0.74} {'loss': 0.9124, 'learning_rate': 1.3972049712593067e-05, 'epoch': 0.74} {'loss': 0.6876, 'learning_rate': 1.3971749290168701e-05, 'epoch': 0.74} {'loss': 0.7973, 'learning_rate': 1.3971448863488246e-05, 'epoch': 0.74} {'loss': 0.8344, 'learning_rate': 1.3971148432552029e-05, 'epoch': 0.74} {'loss': 0.7567, 'learning_rate': 1.3970847997360364e-05, 'epoch': 0.74} {'loss': 0.9735, 'learning_rate': 1.3970547557913578e-05, 'epoch': 0.74} {'loss': 0.8658, 'learning_rate': 1.3970247114211994e-05, 'epoch': 0.74} {'loss': 0.8488, 'learning_rate': 1.3969946666255929e-05, 'epoch': 0.74} {'loss': 0.7494, 'learning_rate': 1.3969646214045709e-05, 'epoch': 0.74} {'loss': 0.6865, 'learning_rate': 1.3969345757581657e-05, 'epoch': 0.74} {'loss': 0.7716, 'learning_rate': 1.396904529686409e-05, 'epoch': 0.74} {'loss': 0.5989, 'learning_rate': 1.3968744831893332e-05, 'epoch': 0.74} {'loss': 0.7907, 'learning_rate': 1.3968444362669708e-05, 'epoch': 0.74} {'loss': 0.8748, 'learning_rate': 1.3968143889193536e-05, 'epoch': 0.74} {'loss': 0.7449, 'learning_rate': 1.3967843411465141e-05, 'epoch': 0.74} {'loss': 0.637, 'learning_rate': 1.3967542929484845e-05, 'epoch': 0.74} {'loss': 0.8299, 'learning_rate': 1.3967242443252967e-05, 'epoch': 0.74} {'loss': 0.8838, 'learning_rate': 1.3966941952769827e-05, 'epoch': 0.74} {'loss': 1.0117, 'learning_rate': 1.3966641458035755e-05, 'epoch': 0.74} {'loss': 0.9095, 'learning_rate': 1.3966340959051067e-05, 'epoch': 0.74} {'loss': 0.9033, 'learning_rate': 1.396604045581609e-05, 'epoch': 0.74} {'loss': 0.8615, 'learning_rate': 1.3965739948331138e-05, 'epoch': 0.74} {'loss': 0.7915, 'learning_rate': 1.3965439436596545e-05, 'epoch': 0.74} {'loss': 0.8069, 'learning_rate': 1.3965138920612617e-05, 'epoch': 0.74} {'loss': 0.9154, 'learning_rate': 1.396483840037969e-05, 'epoch': 0.74} {'loss': 0.8107, 'learning_rate': 1.396453787589808e-05, 'epoch': 0.74} {'loss': 0.755, 'learning_rate': 1.3964237347168107e-05, 'epoch': 0.74} {'loss': 0.8807, 'learning_rate': 1.3963936814190097e-05, 'epoch': 0.74} {'loss': 0.6658, 'learning_rate': 1.3963636276964374e-05, 'epoch': 0.74} {'loss': 0.874, 'learning_rate': 1.3963335735491254e-05, 'epoch': 0.74} {'loss': 0.7106, 'learning_rate': 1.3963035189771063e-05, 'epoch': 0.74} {'loss': 0.8337, 'learning_rate': 1.3962734639804123e-05, 'epoch': 0.74} {'loss': 0.7113, 'learning_rate': 1.3962434085590753e-05, 'epoch': 0.74} {'loss': 0.8682, 'learning_rate': 1.3962133527131278e-05, 'epoch': 0.74} {'loss': 0.731, 'learning_rate': 1.3961832964426023e-05, 'epoch': 0.74} {'loss': 0.6614, 'learning_rate': 1.3961532397475302e-05, 'epoch': 0.74} {'loss': 0.5845, 'learning_rate': 1.3961231826279442e-05, 'epoch': 0.74} {'loss': 0.8707, 'learning_rate': 1.3960931250838765e-05, 'epoch': 0.74} {'loss': 0.7403, 'learning_rate': 1.3960630671153591e-05, 'epoch': 0.74} {'loss': 0.6799, 'learning_rate': 1.3960330087224246e-05, 'epoch': 0.74} {'loss': 0.8371, 'learning_rate': 1.3960029499051051e-05, 'epoch': 0.74} {'loss': 0.9468, 'learning_rate': 1.3959728906634327e-05, 'epoch': 0.74} {'loss': 0.773, 'learning_rate': 1.3959428309974394e-05, 'epoch': 0.74} {'loss': 0.9427, 'learning_rate': 1.3959127709071575e-05, 'epoch': 0.74} {'loss': 0.8718, 'learning_rate': 1.3958827103926196e-05, 'epoch': 0.74} {'loss': 0.8859, 'learning_rate': 1.3958526494538575e-05, 'epoch': 0.74} {'loss': 0.8535, 'learning_rate': 1.3958225880909035e-05, 'epoch': 0.74} {'loss': 0.8045, 'learning_rate': 1.3957925263037902e-05, 'epoch': 0.74} {'loss': 0.7552, 'learning_rate': 1.3957624640925493e-05, 'epoch': 0.74} {'loss': 1.0569, 'learning_rate': 1.3957324014572131e-05, 'epoch': 0.74} {'loss': 0.8591, 'learning_rate': 1.3957023383978141e-05, 'epoch': 0.74} {'loss': 0.8032, 'learning_rate': 1.3956722749143841e-05, 'epoch': 0.74} {'loss': 0.9444, 'learning_rate': 1.3956422110069556e-05, 'epoch': 0.74} {'loss': 1.0032, 'learning_rate': 1.395612146675561e-05, 'epoch': 0.74} {'loss': 0.7202, 'learning_rate': 1.3955820819202319e-05, 'epoch': 0.75} {'loss': 0.8492, 'learning_rate': 1.3955520167410013e-05, 'epoch': 0.75} {'loss': 0.7084, 'learning_rate': 1.3955219511379008e-05, 'epoch': 0.75} {'loss': 0.766, 'learning_rate': 1.3954918851109627e-05, 'epoch': 0.75} {'loss': 0.8157, 'learning_rate': 1.3954618186602196e-05, 'epoch': 0.75} {'loss': 0.8196, 'learning_rate': 1.3954317517857034e-05, 'epoch': 0.75} {'loss': 0.7161, 'learning_rate': 1.3954016844874463e-05, 'epoch': 0.75} {'loss': 0.8758, 'learning_rate': 1.3953716167654805e-05, 'epoch': 0.75} {'loss': 0.7679, 'learning_rate': 1.3953415486198388e-05, 'epoch': 0.75} {'loss': 0.9665, 'learning_rate': 1.3953114800505524e-05, 'epoch': 0.75} {'loss': 0.7871, 'learning_rate': 1.3952814110576544e-05, 'epoch': 0.75} {'loss': 0.8273, 'learning_rate': 1.3952513416411766e-05, 'epoch': 0.75} {'loss': 1.0057, 'learning_rate': 1.3952212718011513e-05, 'epoch': 0.75} {'loss': 0.7651, 'learning_rate': 1.3951912015376108e-05, 'epoch': 0.75} {'loss': 0.7832, 'learning_rate': 1.3951611308505873e-05, 'epoch': 0.75} {'loss': 0.7773, 'learning_rate': 1.3951310597401128e-05, 'epoch': 0.75} {'loss': 0.8098, 'learning_rate': 1.3951009882062198e-05, 'epoch': 0.75} {'loss': 0.6761, 'learning_rate': 1.3950709162489405e-05, 'epoch': 0.75} {'loss': 0.6629, 'learning_rate': 1.395040843868307e-05, 'epoch': 0.75} {'loss': 0.8225, 'learning_rate': 1.3950107710643515e-05, 'epoch': 0.75} {'loss': 0.6817, 'learning_rate': 1.3949806978371063e-05, 'epoch': 0.75} {'loss': 0.6555, 'learning_rate': 1.394950624186604e-05, 'epoch': 0.75} {'loss': 0.8234, 'learning_rate': 1.394920550112876e-05, 'epoch': 0.75} {'loss': 0.8051, 'learning_rate': 1.394890475615955e-05, 'epoch': 0.75} {'loss': 0.7011, 'learning_rate': 1.3948604006958735e-05, 'epoch': 0.75} {'loss': 0.7397, 'learning_rate': 1.3948303253526634e-05, 'epoch': 0.75} {'loss': 0.915, 'learning_rate': 1.3948002495863567e-05, 'epoch': 0.75} {'loss': 0.6918, 'learning_rate': 1.3947701733969861e-05, 'epoch': 0.75} {'loss': 0.7783, 'learning_rate': 1.3947400967845837e-05, 'epoch': 0.75} {'loss': 0.608, 'learning_rate': 1.3947100197491814e-05, 'epoch': 0.75} {'loss': 0.8104, 'learning_rate': 1.394679942290812e-05, 'epoch': 0.75} {'loss': 0.9623, 'learning_rate': 1.3946498644095075e-05, 'epoch': 0.75} {'loss': 0.8053, 'learning_rate': 1.3946197861052996e-05, 'epoch': 0.75} {'loss': 0.8586, 'learning_rate': 1.394589707378221e-05, 'epoch': 0.75} {'loss': 0.8296, 'learning_rate': 1.3945596282283043e-05, 'epoch': 0.75} {'loss': 0.7925, 'learning_rate': 1.3945295486555813e-05, 'epoch': 0.75} {'loss': 0.8185, 'learning_rate': 1.394499468660084e-05, 'epoch': 0.75} {'loss': 0.7766, 'learning_rate': 1.3944693882418451e-05, 'epoch': 0.75} {'loss': 0.8796, 'learning_rate': 1.3944393074008966e-05, 'epoch': 0.75} {'loss': 0.7206, 'learning_rate': 1.3944092261372708e-05, 'epoch': 0.75} {'loss': 0.7854, 'learning_rate': 1.394379144451e-05, 'epoch': 0.75} {'loss': 0.7646, 'learning_rate': 1.394349062342116e-05, 'epoch': 0.75} {'loss': 0.7356, 'learning_rate': 1.3943189798106517e-05, 'epoch': 0.75} {'loss': 0.843, 'learning_rate': 1.3942888968566392e-05, 'epoch': 0.75} {'loss': 0.8547, 'learning_rate': 1.3942588134801102e-05, 'epoch': 0.75} {'loss': 0.6894, 'learning_rate': 1.3942287296810975e-05, 'epoch': 0.75} {'loss': 0.8795, 'learning_rate': 1.394198645459633e-05, 'epoch': 0.75} {'loss': 0.7199, 'learning_rate': 1.394168560815749e-05, 'epoch': 0.75} {'loss': 0.821, 'learning_rate': 1.3941384757494783e-05, 'epoch': 0.75} {'loss': 0.8443, 'learning_rate': 1.3941083902608522e-05, 'epoch': 0.75} {'loss': 0.8665, 'learning_rate': 1.3940783043499035e-05, 'epoch': 0.75} {'loss': 0.7283, 'learning_rate': 1.3940482180166643e-05, 'epoch': 0.75} {'loss': 0.7643, 'learning_rate': 1.3940181312611669e-05, 'epoch': 0.75} {'loss': 0.7335, 'learning_rate': 1.3939880440834435e-05, 'epoch': 0.75} {'loss': 0.8416, 'learning_rate': 1.3939579564835261e-05, 'epoch': 0.75} {'loss': 0.8693, 'learning_rate': 1.3939278684614477e-05, 'epoch': 0.75} {'loss': 0.9738, 'learning_rate': 1.3938977800172398e-05, 'epoch': 0.75} {'loss': 0.8523, 'learning_rate': 1.3938676911509348e-05, 'epoch': 0.75} {'loss': 0.8253, 'learning_rate': 1.393837601862565e-05, 'epoch': 0.75} {'loss': 0.7747, 'learning_rate': 1.3938075121521628e-05, 'epoch': 0.75} {'loss': 0.824, 'learning_rate': 1.3937774220197602e-05, 'epoch': 0.75} {'loss': 0.8418, 'learning_rate': 1.3937473314653896e-05, 'epoch': 0.75} {'loss': 0.9536, 'learning_rate': 1.393717240489083e-05, 'epoch': 0.75} {'loss': 0.9179, 'learning_rate': 1.3936871490908735e-05, 'epoch': 0.75} {'loss': 0.8956, 'learning_rate': 1.393657057270792e-05, 'epoch': 0.75} {'loss': 0.7994, 'learning_rate': 1.3936269650288716e-05, 'epoch': 0.75} {'loss': 0.6152, 'learning_rate': 1.3935968723651442e-05, 'epoch': 0.75} {'loss': 0.9177, 'learning_rate': 1.3935667792796426e-05, 'epoch': 0.75} {'loss': 1.0393, 'learning_rate': 1.3935366857723986e-05, 'epoch': 0.75} {'loss': 0.8012, 'learning_rate': 1.3935065918434446e-05, 'epoch': 0.75} {'loss': 0.9594, 'learning_rate': 1.3934764974928125e-05, 'epoch': 0.75} {'loss': 0.7067, 'learning_rate': 1.393446402720535e-05, 'epoch': 0.75} {'loss': 0.8768, 'learning_rate': 1.393416307526644e-05, 'epoch': 0.75} {'loss': 0.7259, 'learning_rate': 1.3933862119111721e-05, 'epoch': 0.75} {'loss': 0.8532, 'learning_rate': 1.3933561158741513e-05, 'epoch': 0.75} {'loss': 0.6024, 'learning_rate': 1.393326019415614e-05, 'epoch': 0.75} {'loss': 0.8277, 'learning_rate': 1.3932959225355922e-05, 'epoch': 0.75} {'loss': 1.068, 'learning_rate': 1.3932658252341188e-05, 'epoch': 0.75} {'loss': 0.8524, 'learning_rate': 1.3932357275112249e-05, 'epoch': 0.75} {'loss': 0.8486, 'learning_rate': 1.3932056293669436e-05, 'epoch': 0.75} {'loss': 0.7065, 'learning_rate': 1.393175530801307e-05, 'epoch': 0.75} {'loss': 0.9088, 'learning_rate': 1.3931454318143476e-05, 'epoch': 0.75} {'loss': 0.8293, 'learning_rate': 1.3931153324060973e-05, 'epoch': 0.75} {'loss': 0.8771, 'learning_rate': 1.3930852325765883e-05, 'epoch': 0.75} {'loss': 0.7781, 'learning_rate': 1.3930551323258533e-05, 'epoch': 0.75} {'loss': 0.923, 'learning_rate': 1.3930250316539237e-05, 'epoch': 0.75} {'loss': 0.9832, 'learning_rate': 1.3929949305608326e-05, 'epoch': 0.75} {'loss': 0.6686, 'learning_rate': 1.392964829046612e-05, 'epoch': 0.75} {'loss': 0.708, 'learning_rate': 1.3929347271112943e-05, 'epoch': 0.75} {'loss': 0.8085, 'learning_rate': 1.3929046247549112e-05, 'epoch': 0.75} {'loss': 0.922, 'learning_rate': 1.3928745219774955e-05, 'epoch': 0.75} {'loss': 0.965, 'learning_rate': 1.3928444187790793e-05, 'epoch': 0.75} {'loss': 0.7923, 'learning_rate': 1.3928143151596948e-05, 'epoch': 0.75} {'loss': 0.7604, 'learning_rate': 1.3927842111193744e-05, 'epoch': 0.75} {'loss': 0.8768, 'learning_rate': 1.3927541066581503e-05, 'epoch': 0.75} {'loss': 0.905, 'learning_rate': 1.3927240017760543e-05, 'epoch': 0.75} {'loss': 0.9499, 'learning_rate': 1.3926938964731195e-05, 'epoch': 0.75} {'loss': 0.9057, 'learning_rate': 1.3926637907493779e-05, 'epoch': 0.75} {'loss': 0.8544, 'learning_rate': 1.3926336846048613e-05, 'epoch': 0.75} {'loss': 0.8787, 'learning_rate': 1.3926035780396023e-05, 'epoch': 0.75} {'loss': 0.9985, 'learning_rate': 1.3925734710536331e-05, 'epoch': 0.75} {'loss': 0.8248, 'learning_rate': 1.3925433636469863e-05, 'epoch': 0.75} {'loss': 0.7235, 'learning_rate': 1.3925132558196934e-05, 'epoch': 0.75} {'loss': 0.7825, 'learning_rate': 1.3924831475717873e-05, 'epoch': 0.75} {'loss': 1.0618, 'learning_rate': 1.3924530389033004e-05, 'epoch': 0.75} {'loss': 0.9819, 'learning_rate': 1.3924229298142642e-05, 'epoch': 0.75} {'loss': 0.8609, 'learning_rate': 1.3923928203047118e-05, 'epoch': 0.75} {'loss': 0.7525, 'learning_rate': 1.3923627103746749e-05, 'epoch': 0.75} {'loss': 0.8378, 'learning_rate': 1.3923326000241857e-05, 'epoch': 0.75} {'loss': 0.6066, 'learning_rate': 1.3923024892532768e-05, 'epoch': 0.75} {'loss': 0.7262, 'learning_rate': 1.3922723780619805e-05, 'epoch': 0.75} {'loss': 0.6424, 'learning_rate': 1.392242266450329e-05, 'epoch': 0.75} {'loss': 0.8403, 'learning_rate': 1.3922121544183546e-05, 'epoch': 0.75} {'loss': 0.8238, 'learning_rate': 1.3921820419660894e-05, 'epoch': 0.75} {'loss': 0.8639, 'learning_rate': 1.3921519290935654e-05, 'epoch': 0.75} {'loss': 0.6628, 'learning_rate': 1.3921218158008156e-05, 'epoch': 0.75} {'loss': 0.7224, 'learning_rate': 1.3920917020878717e-05, 'epoch': 0.75} {'loss': 0.8848, 'learning_rate': 1.3920615879547662e-05, 'epoch': 0.75} {'loss': 0.8511, 'learning_rate': 1.3920314734015314e-05, 'epoch': 0.75} {'loss': 0.7823, 'learning_rate': 1.3920013584281997e-05, 'epoch': 0.75} {'loss': 0.5971, 'learning_rate': 1.391971243034803e-05, 'epoch': 0.75} {'loss': 0.8382, 'learning_rate': 1.3919411272213734e-05, 'epoch': 0.75} {'loss': 0.8723, 'learning_rate': 1.3919110109879437e-05, 'epoch': 0.75} {'loss': 0.7975, 'learning_rate': 1.3918808943345459e-05, 'epoch': 0.75} {'loss': 0.8368, 'learning_rate': 1.3918507772612124e-05, 'epoch': 0.75} {'loss': 0.7268, 'learning_rate': 1.3918206597679756e-05, 'epoch': 0.75} {'loss': 1.0288, 'learning_rate': 1.3917905418548676e-05, 'epoch': 0.75} {'loss': 0.8403, 'learning_rate': 1.3917604235219206e-05, 'epoch': 0.75} {'loss': 0.7063, 'learning_rate': 1.3917303047691668e-05, 'epoch': 0.75} {'loss': 0.9125, 'learning_rate': 1.3917001855966387e-05, 'epoch': 0.75} {'loss': 0.7797, 'learning_rate': 1.3916700660043685e-05, 'epoch': 0.75} {'loss': 0.7902, 'learning_rate': 1.3916399459923886e-05, 'epoch': 0.75} {'loss': 0.8196, 'learning_rate': 1.3916098255607311e-05, 'epoch': 0.75} {'loss': 0.8821, 'learning_rate': 1.3915797047094283e-05, 'epoch': 0.75} {'loss': 0.9779, 'learning_rate': 1.3915495834385126e-05, 'epoch': 0.75} {'loss': 0.7618, 'learning_rate': 1.3915194617480161e-05, 'epoch': 0.75} {'loss': 0.6663, 'learning_rate': 1.391489339637971e-05, 'epoch': 0.75} {'loss': 0.7696, 'learning_rate': 1.39145921710841e-05, 'epoch': 0.75} {'loss': 0.9024, 'learning_rate': 1.3914290941593648e-05, 'epoch': 0.75} {'loss': 0.8141, 'learning_rate': 1.3913989707908684e-05, 'epoch': 0.75} {'loss': 0.6541, 'learning_rate': 1.3913688470029525e-05, 'epoch': 0.75} {'loss': 0.7909, 'learning_rate': 1.3913387227956494e-05, 'epoch': 0.75} {'loss': 0.8044, 'learning_rate': 1.3913085981689915e-05, 'epoch': 0.75} {'loss': 0.8805, 'learning_rate': 1.3912784731230114e-05, 'epoch': 0.75} {'loss': 0.772, 'learning_rate': 1.391248347657741e-05, 'epoch': 0.75} {'loss': 0.6282, 'learning_rate': 1.3912182217732126e-05, 'epoch': 0.75} {'loss': 0.9624, 'learning_rate': 1.3911880954694587e-05, 'epoch': 0.75} {'loss': 0.8757, 'learning_rate': 1.3911579687465113e-05, 'epoch': 0.75} {'loss': 0.939, 'learning_rate': 1.391127841604403e-05, 'epoch': 0.75} {'loss': 0.8667, 'learning_rate': 1.3910977140431659e-05, 'epoch': 0.75} {'loss': 0.755, 'learning_rate': 1.3910675860628323e-05, 'epoch': 0.75} {'loss': 0.7395, 'learning_rate': 1.3910374576634342e-05, 'epoch': 0.75} {'loss': 0.758, 'learning_rate': 1.3910073288450044e-05, 'epoch': 0.75} {'loss': 0.8981, 'learning_rate': 1.3909771996075751e-05, 'epoch': 0.75} {'loss': 0.7768, 'learning_rate': 1.3909470699511782e-05, 'epoch': 0.75} {'loss': 0.8879, 'learning_rate': 1.3909169398758464e-05, 'epoch': 0.75} {'loss': 0.8785, 'learning_rate': 1.3908868093816116e-05, 'epoch': 0.75} {'loss': 0.6704, 'learning_rate': 1.3908566784685064e-05, 'epoch': 0.75} {'loss': 0.9156, 'learning_rate': 1.3908265471365632e-05, 'epoch': 0.75} {'loss': 0.7444, 'learning_rate': 1.3907964153858137e-05, 'epoch': 0.75} {'loss': 0.9626, 'learning_rate': 1.390766283216291e-05, 'epoch': 0.75} {'loss': 0.9176, 'learning_rate': 1.3907361506280266e-05, 'epoch': 0.75} {'loss': 0.7223, 'learning_rate': 1.3907060176210534e-05, 'epoch': 0.75} {'loss': 0.8687, 'learning_rate': 1.3906758841954033e-05, 'epoch': 0.75} {'loss': 0.7955, 'learning_rate': 1.3906457503511086e-05, 'epoch': 0.75} {'loss': 0.8184, 'learning_rate': 1.3906156160882018e-05, 'epoch': 0.75} {'loss': 0.8137, 'learning_rate': 1.3905854814067153e-05, 'epoch': 0.75} {'loss': 0.8744, 'learning_rate': 1.3905553463066813e-05, 'epoch': 0.75} {'loss': 0.7625, 'learning_rate': 1.3905252107881317e-05, 'epoch': 0.75} {'loss': 0.7944, 'learning_rate': 1.3904950748510992e-05, 'epoch': 0.75} {'loss': 0.8505, 'learning_rate': 1.3904649384956159e-05, 'epoch': 0.75} {'loss': 0.9096, 'learning_rate': 1.3904348017217142e-05, 'epoch': 0.75} {'loss': 0.6953, 'learning_rate': 1.3904046645294265e-05, 'epoch': 0.75} {'loss': 0.8535, 'learning_rate': 1.390374526918785e-05, 'epoch': 0.75} {'loss': 0.7855, 'learning_rate': 1.3903443888898215e-05, 'epoch': 0.75} {'loss': 0.8046, 'learning_rate': 1.3903142504425693e-05, 'epoch': 0.75} {'loss': 0.9329, 'learning_rate': 1.39028411157706e-05, 'epoch': 0.75} {'loss': 0.8985, 'learning_rate': 1.3902539722933259e-05, 'epoch': 0.75} {'loss': 0.7179, 'learning_rate': 1.3902238325913995e-05, 'epoch': 0.75} {'loss': 0.9341, 'learning_rate': 1.390193692471313e-05, 'epoch': 0.75} {'loss': 0.8494, 'learning_rate': 1.3901635519330989e-05, 'epoch': 0.75} {'loss': 0.8026, 'learning_rate': 1.3901334109767892e-05, 'epoch': 0.75} {'loss': 0.7107, 'learning_rate': 1.3901032696024166e-05, 'epoch': 0.75} {'loss': 0.8975, 'learning_rate': 1.3900731278100128e-05, 'epoch': 0.75} {'loss': 0.9273, 'learning_rate': 1.3900429855996105e-05, 'epoch': 0.75} {'loss': 0.7064, 'learning_rate': 1.390012842971242e-05, 'epoch': 0.75} {'loss': 0.6837, 'learning_rate': 1.3899826999249396e-05, 'epoch': 0.75} {'loss': 0.5387, 'learning_rate': 1.3899525564607354e-05, 'epoch': 0.75} {'loss': 0.912, 'learning_rate': 1.3899224125786623e-05, 'epoch': 0.75} {'loss': 0.9205, 'learning_rate': 1.3898922682787516e-05, 'epoch': 0.75} {'loss': 0.7763, 'learning_rate': 1.3898621235610363e-05, 'epoch': 0.75} {'loss': 0.8424, 'learning_rate': 1.3898319784255486e-05, 'epoch': 0.75} {'loss': 0.9108, 'learning_rate': 1.3898018328723205e-05, 'epoch': 0.75} {'loss': 0.7769, 'learning_rate': 1.3897716869013848e-05, 'epoch': 0.75} {'loss': 0.5775, 'learning_rate': 1.3897415405127737e-05, 'epoch': 0.75} {'loss': 0.6596, 'learning_rate': 1.3897113937065192e-05, 'epoch': 0.75} {'loss': 0.8077, 'learning_rate': 1.3896812464826536e-05, 'epoch': 0.75} {'loss': 0.7326, 'learning_rate': 1.3896510988412095e-05, 'epoch': 0.75} {'loss': 0.6654, 'learning_rate': 1.3896209507822192e-05, 'epoch': 0.75} {'loss': 0.8528, 'learning_rate': 1.3895908023057147e-05, 'epoch': 0.75} {'loss': 0.8435, 'learning_rate': 1.3895606534117287e-05, 'epoch': 0.75} {'loss': 0.7806, 'learning_rate': 1.3895305041002931e-05, 'epoch': 0.75} {'loss': 0.7735, 'learning_rate': 1.3895003543714408e-05, 'epoch': 0.75} {'loss': 0.7374, 'learning_rate': 1.3894702042252033e-05, 'epoch': 0.75} {'loss': 0.7586, 'learning_rate': 1.3894400536616133e-05, 'epoch': 0.75} {'loss': 1.0118, 'learning_rate': 1.3894099026807033e-05, 'epoch': 0.75} {'loss': 0.7322, 'learning_rate': 1.3893797512825053e-05, 'epoch': 0.75} {'loss': 0.8912, 'learning_rate': 1.389349599467052e-05, 'epoch': 0.75} {'loss': 0.7575, 'learning_rate': 1.3893194472343752e-05, 'epoch': 0.75} {'loss': 0.7295, 'learning_rate': 1.3892892945845079e-05, 'epoch': 0.75} {'loss': 0.7434, 'learning_rate': 1.3892591415174814e-05, 'epoch': 0.75} {'loss': 0.8931, 'learning_rate': 1.389228988033329e-05, 'epoch': 0.75} {'loss': 0.7755, 'learning_rate': 1.3891988341320824e-05, 'epoch': 0.75} {'loss': 0.8796, 'learning_rate': 1.3891686798137745e-05, 'epoch': 0.75} {'loss': 0.7113, 'learning_rate': 1.3891385250784368e-05, 'epoch': 0.75} {'loss': 1.0107, 'learning_rate': 1.3891083699261023e-05, 'epoch': 0.75} {'loss': 0.6228, 'learning_rate': 1.3890782143568029e-05, 'epoch': 0.75} {'loss': 0.791, 'learning_rate': 1.389048058370571e-05, 'epoch': 0.75} {'loss': 0.779, 'learning_rate': 1.389017901967439e-05, 'epoch': 0.75} {'loss': 0.7649, 'learning_rate': 1.3889877451474396e-05, 'epoch': 0.75} {'loss': 1.0202, 'learning_rate': 1.3889575879106043e-05, 'epoch': 0.75} {'loss': 0.6179, 'learning_rate': 1.388927430256966e-05, 'epoch': 0.75} {'loss': 0.8659, 'learning_rate': 1.388897272186557e-05, 'epoch': 0.75} {'loss': 0.8093, 'learning_rate': 1.3888671136994095e-05, 'epoch': 0.75} {'loss': 0.7087, 'learning_rate': 1.3888369547955554e-05, 'epoch': 0.75} {'loss': 1.1302, 'learning_rate': 1.3888067954750274e-05, 'epoch': 0.75} {'loss': 0.89, 'learning_rate': 1.3887766357378582e-05, 'epoch': 0.75} {'loss': 0.8195, 'learning_rate': 1.3887464755840796e-05, 'epoch': 0.75} {'loss': 0.9082, 'learning_rate': 1.3887163150137242e-05, 'epoch': 0.75} {'loss': 0.7905, 'learning_rate': 1.3886861540268242e-05, 'epoch': 0.75} {'loss': 0.9503, 'learning_rate': 1.3886559926234116e-05, 'epoch': 0.75} {'loss': 0.6821, 'learning_rate': 1.388625830803519e-05, 'epoch': 0.75} {'loss': 0.8187, 'learning_rate': 1.388595668567179e-05, 'epoch': 0.75} {'loss': 0.7366, 'learning_rate': 1.3885655059144237e-05, 'epoch': 0.75} {'loss': 0.8827, 'learning_rate': 1.3885353428452852e-05, 'epoch': 0.75} {'loss': 0.8012, 'learning_rate': 1.388505179359796e-05, 'epoch': 0.75} {'loss': 0.788, 'learning_rate': 1.3884750154579887e-05, 'epoch': 0.75} {'loss': 0.8719, 'learning_rate': 1.388444851139895e-05, 'epoch': 0.75} {'loss': 0.7931, 'learning_rate': 1.3884146864055481e-05, 'epoch': 0.75} {'loss': 0.9524, 'learning_rate': 1.3883845212549793e-05, 'epoch': 0.75} {'loss': 0.8269, 'learning_rate': 1.3883543556882215e-05, 'epoch': 0.75} {'loss': 0.8, 'learning_rate': 1.388324189705307e-05, 'epoch': 0.75} {'loss': 0.858, 'learning_rate': 1.3882940233062682e-05, 'epoch': 0.75} {'loss': 0.7924, 'learning_rate': 1.3882638564911376e-05, 'epoch': 0.75} {'loss': 0.7738, 'learning_rate': 1.3882336892599469e-05, 'epoch': 0.75} {'loss': 0.7583, 'learning_rate': 1.3882035216127285e-05, 'epoch': 0.75} {'loss': 0.7897, 'learning_rate': 1.3881733535495152e-05, 'epoch': 0.75} {'loss': 0.8352, 'learning_rate': 1.388143185070339e-05, 'epoch': 0.75} {'loss': 0.7715, 'learning_rate': 1.3881130161752326e-05, 'epoch': 0.75} {'loss': 0.8089, 'learning_rate': 1.3880828468642282e-05, 'epoch': 0.75} {'loss': 0.7237, 'learning_rate': 1.3880526771373577e-05, 'epoch': 0.75} {'loss': 0.8205, 'learning_rate': 1.388022506994654e-05, 'epoch': 0.75} {'loss': 0.9114, 'learning_rate': 1.387992336436149e-05, 'epoch': 0.75} {'loss': 0.7461, 'learning_rate': 1.3879621654618748e-05, 'epoch': 0.75} {'loss': 0.8696, 'learning_rate': 1.3879319940718645e-05, 'epoch': 0.75} {'loss': 0.7842, 'learning_rate': 1.3879018222661502e-05, 'epoch': 0.75} {'loss': 0.9837, 'learning_rate': 1.387871650044764e-05, 'epoch': 0.75} {'loss': 0.7146, 'learning_rate': 1.3878414774077384e-05, 'epoch': 0.75} {'loss': 0.6857, 'learning_rate': 1.3878113043551054e-05, 'epoch': 0.75} {'loss': 0.8385, 'learning_rate': 1.3877811308868976e-05, 'epoch': 0.75} {'loss': 0.8768, 'learning_rate': 1.3877509570031473e-05, 'epoch': 0.75} {'loss': 0.8285, 'learning_rate': 1.387720782703887e-05, 'epoch': 0.75} {'loss': 0.7123, 'learning_rate': 1.3876906079891488e-05, 'epoch': 0.75} {'loss': 0.7534, 'learning_rate': 1.3876604328589653e-05, 'epoch': 0.75} {'loss': 0.9179, 'learning_rate': 1.3876302573133687e-05, 'epoch': 0.75} {'loss': 0.7612, 'learning_rate': 1.3876000813523911e-05, 'epoch': 0.75} {'loss': 0.8702, 'learning_rate': 1.3875699049760649e-05, 'epoch': 0.75} {'loss': 0.9254, 'learning_rate': 1.3875397281844228e-05, 'epoch': 0.75} {'loss': 0.7956, 'learning_rate': 1.3875095509774967e-05, 'epoch': 0.75} {'loss': 0.6801, 'learning_rate': 1.3874793733553191e-05, 'epoch': 0.75} {'loss': 0.949, 'learning_rate': 1.3874491953179228e-05, 'epoch': 0.75} {'loss': 1.0036, 'learning_rate': 1.3874190168653397e-05, 'epoch': 0.75} {'loss': 0.8916, 'learning_rate': 1.3873888379976017e-05, 'epoch': 0.75} {'loss': 0.8794, 'learning_rate': 1.3873586587147419e-05, 'epoch': 0.75} {'loss': 0.8319, 'learning_rate': 1.387328479016792e-05, 'epoch': 0.75} {'loss': 0.8934, 'learning_rate': 1.3872982989037848e-05, 'epoch': 0.75} {'loss': 0.8056, 'learning_rate': 1.387268118375753e-05, 'epoch': 0.75} {'loss': 0.9981, 'learning_rate': 1.387237937432728e-05, 'epoch': 0.75} {'loss': 0.8653, 'learning_rate': 1.3872077560747428e-05, 'epoch': 0.75} {'loss': 0.8647, 'learning_rate': 1.3871775743018294e-05, 'epoch': 0.75} {'loss': 0.856, 'learning_rate': 1.3871473921140202e-05, 'epoch': 0.75} {'loss': 0.676, 'learning_rate': 1.3871172095113479e-05, 'epoch': 0.75} {'loss': 0.848, 'learning_rate': 1.3870870264938446e-05, 'epoch': 0.75} {'loss': 0.9629, 'learning_rate': 1.3870568430615423e-05, 'epoch': 0.75} {'loss': 0.8352, 'learning_rate': 1.3870266592144737e-05, 'epoch': 0.75} {'loss': 0.8404, 'learning_rate': 1.3869964749526715e-05, 'epoch': 0.75} {'loss': 0.9166, 'learning_rate': 1.3869662902761672e-05, 'epoch': 0.75} {'loss': 1.0113, 'learning_rate': 1.3869361051849937e-05, 'epoch': 0.75} {'loss': 0.7804, 'learning_rate': 1.3869059196791832e-05, 'epoch': 0.75} {'loss': 1.0374, 'learning_rate': 1.3868757337587682e-05, 'epoch': 0.75} {'loss': 0.6889, 'learning_rate': 1.3868455474237807e-05, 'epoch': 0.75} {'loss': 0.8388, 'learning_rate': 1.3868153606742538e-05, 'epoch': 0.75} {'loss': 0.8277, 'learning_rate': 1.386785173510219e-05, 'epoch': 0.75} {'loss': 0.696, 'learning_rate': 1.3867549859317088e-05, 'epoch': 0.75} {'loss': 0.8963, 'learning_rate': 1.386724797938756e-05, 'epoch': 0.75} {'loss': 0.7312, 'learning_rate': 1.3866946095313928e-05, 'epoch': 0.75} {'loss': 0.8477, 'learning_rate': 1.3866644207096512e-05, 'epoch': 0.75} {'loss': 0.8817, 'learning_rate': 1.3866342314735635e-05, 'epoch': 0.75} {'loss': 0.9672, 'learning_rate': 1.3866040418231629e-05, 'epoch': 0.75} {'loss': 0.8569, 'learning_rate': 1.3865738517584808e-05, 'epoch': 0.75} {'loss': 0.7656, 'learning_rate': 1.3865436612795499e-05, 'epoch': 0.75} {'loss': 0.8744, 'learning_rate': 1.386513470386403e-05, 'epoch': 0.75} {'loss': 0.7056, 'learning_rate': 1.3864832790790716e-05, 'epoch': 0.75} {'loss': 0.7596, 'learning_rate': 1.3864530873575885e-05, 'epoch': 0.75} {'loss': 0.7912, 'learning_rate': 1.386422895221986e-05, 'epoch': 0.75} {'loss': 0.7758, 'learning_rate': 1.3863927026722968e-05, 'epoch': 0.75} {'loss': 0.9501, 'learning_rate': 1.386362509708553e-05, 'epoch': 0.75} {'loss': 0.8418, 'learning_rate': 1.3863323163307867e-05, 'epoch': 0.75} {'loss': 1.0062, 'learning_rate': 1.3863021225390302e-05, 'epoch': 0.75} {'loss': 0.9398, 'learning_rate': 1.3862719283333163e-05, 'epoch': 0.75} {'loss': 0.7531, 'learning_rate': 1.3862417337136773e-05, 'epoch': 0.75} {'loss': 0.7935, 'learning_rate': 1.3862115386801453e-05, 'epoch': 0.75} {'loss': 0.7983, 'learning_rate': 1.386181343232753e-05, 'epoch': 0.75} {'loss': 0.7222, 'learning_rate': 1.3861511473715323e-05, 'epoch': 0.75} {'loss': 0.934, 'learning_rate': 1.386120951096516e-05, 'epoch': 0.75} {'loss': 0.7441, 'learning_rate': 1.386090754407736e-05, 'epoch': 0.75} {'loss': 0.8501, 'learning_rate': 1.3860605573052249e-05, 'epoch': 0.75} {'loss': 0.7682, 'learning_rate': 1.386030359789015e-05, 'epoch': 0.75} {'loss': 1.0293, 'learning_rate': 1.3860001618591389e-05, 'epoch': 0.75} {'loss': 0.9312, 'learning_rate': 1.385969963515629e-05, 'epoch': 0.75} {'loss': 0.8774, 'learning_rate': 1.3859397647585174e-05, 'epoch': 0.75} {'loss': 0.9159, 'learning_rate': 1.3859095655878362e-05, 'epoch': 0.75} {'loss': 0.7432, 'learning_rate': 1.3858793660036183e-05, 'epoch': 0.75} {'loss': 0.7714, 'learning_rate': 1.3858491660058957e-05, 'epoch': 0.75} {'loss': 0.606, 'learning_rate': 1.3858189655947007e-05, 'epoch': 0.75} {'loss': 0.8722, 'learning_rate': 1.3857887647700663e-05, 'epoch': 0.75} {'loss': 0.6992, 'learning_rate': 1.3857585635320243e-05, 'epoch': 0.75} {'loss': 0.9798, 'learning_rate': 1.3857283618806073e-05, 'epoch': 0.75} {'loss': 0.9772, 'learning_rate': 1.3856981598158471e-05, 'epoch': 0.75} {'loss': 1.0022, 'learning_rate': 1.3856679573377768e-05, 'epoch': 0.75} {'loss': 0.8543, 'learning_rate': 1.3856377544464283e-05, 'epoch': 0.75} {'loss': 0.7716, 'learning_rate': 1.3856075511418344e-05, 'epoch': 0.75} {'loss': 0.8508, 'learning_rate': 1.385577347424027e-05, 'epoch': 0.75} {'loss': 0.8732, 'learning_rate': 1.385547143293039e-05, 'epoch': 0.75} {'loss': 0.6831, 'learning_rate': 1.3855169387489021e-05, 'epoch': 0.75} {'loss': 0.7563, 'learning_rate': 1.3854867337916491e-05, 'epoch': 0.75} {'loss': 0.8428, 'learning_rate': 1.3854565284213122e-05, 'epoch': 0.75} {'loss': 0.9319, 'learning_rate': 1.385426322637924e-05, 'epoch': 0.75} {'loss': 0.7558, 'learning_rate': 1.3853961164415165e-05, 'epoch': 0.75} {'loss': 0.8735, 'learning_rate': 1.3853659098321223e-05, 'epoch': 0.75} {'loss': 0.6895, 'learning_rate': 1.385335702809774e-05, 'epoch': 0.75} {'loss': 0.9677, 'learning_rate': 1.3853054953745035e-05, 'epoch': 0.75} {'loss': 0.6842, 'learning_rate': 1.3852752875263433e-05, 'epoch': 0.75} {'loss': 0.9595, 'learning_rate': 1.385245079265326e-05, 'epoch': 0.75} {'loss': 0.928, 'learning_rate': 1.3852148705914838e-05, 'epoch': 0.75} {'loss': 0.9799, 'learning_rate': 1.3851846615048491e-05, 'epoch': 0.75} {'loss': 0.5851, 'learning_rate': 1.3851544520054545e-05, 'epoch': 0.75} {'loss': 0.7467, 'learning_rate': 1.385124242093332e-05, 'epoch': 0.75} {'loss': 0.7894, 'learning_rate': 1.3850940317685139e-05, 'epoch': 0.75} {'loss': 0.8534, 'learning_rate': 1.385063821031033e-05, 'epoch': 0.75} {'loss': 0.7954, 'learning_rate': 1.3850336098809214e-05, 'epoch': 0.75} {'loss': 0.7397, 'learning_rate': 1.3850033983182116e-05, 'epoch': 0.75} {'loss': 0.8255, 'learning_rate': 1.3849731863429359e-05, 'epoch': 0.75} {'loss': 0.8741, 'learning_rate': 1.3849429739551265e-05, 'epoch': 0.75} {'loss': 1.1358, 'learning_rate': 1.384912761154816e-05, 'epoch': 0.75} {'loss': 0.7897, 'learning_rate': 1.3848825479420369e-05, 'epoch': 0.75} {'loss': 0.804, 'learning_rate': 1.3848523343168215e-05, 'epoch': 0.75} {'loss': 0.8141, 'learning_rate': 1.3848221202792017e-05, 'epoch': 0.75} {'loss': 0.94, 'learning_rate': 1.3847919058292105e-05, 'epoch': 0.75} {'loss': 0.8414, 'learning_rate': 1.3847616909668799e-05, 'epoch': 0.75} {'loss': 0.7325, 'learning_rate': 1.3847314756922428e-05, 'epoch': 0.75} {'loss': 0.843, 'learning_rate': 1.384701260005331e-05, 'epoch': 0.75} {'loss': 0.7662, 'learning_rate': 1.3846710439061771e-05, 'epoch': 0.75} {'loss': 0.8329, 'learning_rate': 1.3846408273948133e-05, 'epoch': 0.75} {'loss': 0.7575, 'learning_rate': 1.3846106104712723e-05, 'epoch': 0.75} {'loss': 0.8431, 'learning_rate': 1.3845803931355862e-05, 'epoch': 0.75} {'loss': 0.746, 'learning_rate': 1.3845501753877874e-05, 'epoch': 0.75} {'loss': 0.765, 'learning_rate': 1.3845199572279084e-05, 'epoch': 0.75} {'loss': 0.9163, 'learning_rate': 1.3844897386559818e-05, 'epoch': 0.75} {'loss': 0.6701, 'learning_rate': 1.3844595196720396e-05, 'epoch': 0.75} {'loss': 0.6571, 'learning_rate': 1.3844293002761146e-05, 'epoch': 0.75} {'loss': 1.0274, 'learning_rate': 1.3843990804682385e-05, 'epoch': 0.75} {'loss': 1.0449, 'learning_rate': 1.3843688602484444e-05, 'epoch': 0.75} {'loss': 0.8242, 'learning_rate': 1.3843386396167642e-05, 'epoch': 0.75} {'loss': 0.8368, 'learning_rate': 1.3843084185732305e-05, 'epoch': 0.75} {'loss': 0.7823, 'learning_rate': 1.3842781971178755e-05, 'epoch': 0.75} {'loss': 0.8913, 'learning_rate': 1.384247975250732e-05, 'epoch': 0.75} {'loss': 0.9548, 'learning_rate': 1.384217752971832e-05, 'epoch': 0.75} {'loss': 0.7644, 'learning_rate': 1.3841875302812078e-05, 'epoch': 0.75} {'loss': 0.8639, 'learning_rate': 1.3841573071788923e-05, 'epoch': 0.75} {'loss': 0.8176, 'learning_rate': 1.3841270836649172e-05, 'epoch': 0.75} {'loss': 0.8362, 'learning_rate': 1.3840968597393157e-05, 'epoch': 0.75} {'loss': 0.8934, 'learning_rate': 1.3840666354021194e-05, 'epoch': 0.75} {'loss': 0.7426, 'learning_rate': 1.3840364106533613e-05, 'epoch': 0.75} {'loss': 0.7762, 'learning_rate': 1.3840061854930733e-05, 'epoch': 0.75} {'loss': 0.8236, 'learning_rate': 1.3839759599212883e-05, 'epoch': 0.75} {'loss': 0.7953, 'learning_rate': 1.383945733938038e-05, 'epoch': 0.75} {'loss': 0.8016, 'learning_rate': 1.3839155075433554e-05, 'epoch': 0.75} {'loss': 0.8317, 'learning_rate': 1.383885280737273e-05, 'epoch': 0.75} {'loss': 0.8114, 'learning_rate': 1.3838550535198225e-05, 'epoch': 0.75} {'loss': 0.8443, 'learning_rate': 1.3838248258910368e-05, 'epoch': 0.75} {'loss': 0.8128, 'learning_rate': 1.3837945978509479e-05, 'epoch': 0.75} {'loss': 0.8839, 'learning_rate': 1.3837643693995887e-05, 'epoch': 0.75} {'loss': 0.8547, 'learning_rate': 1.383734140536991e-05, 'epoch': 0.75} {'loss': 0.8198, 'learning_rate': 1.3837039112631878e-05, 'epoch': 0.75} {'loss': 0.8697, 'learning_rate': 1.3836736815782115e-05, 'epoch': 0.75} {'loss': 0.8297, 'learning_rate': 1.383643451482094e-05, 'epoch': 0.75} {'loss': 0.942, 'learning_rate': 1.3836132209748679e-05, 'epoch': 0.75} {'loss': 0.9153, 'learning_rate': 1.3835829900565653e-05, 'epoch': 0.75} {'loss': 0.8607, 'learning_rate': 1.3835527587272193e-05, 'epoch': 0.75} {'loss': 0.9833, 'learning_rate': 1.3835225269868618e-05, 'epoch': 0.75} {'loss': 1.0139, 'learning_rate': 1.383492294835525e-05, 'epoch': 0.75} {'loss': 0.8988, 'learning_rate': 1.3834620622732422e-05, 'epoch': 0.75} {'loss': 0.7362, 'learning_rate': 1.383431829300045e-05, 'epoch': 0.75} {'loss': 0.8531, 'learning_rate': 1.383401595915966e-05, 'epoch': 0.75} {'loss': 0.7713, 'learning_rate': 1.3833713621210372e-05, 'epoch': 0.75} {'loss': 0.7778, 'learning_rate': 1.3833411279152915e-05, 'epoch': 0.75} {'loss': 0.8783, 'learning_rate': 1.3833108932987613e-05, 'epoch': 0.75} {'loss': 0.7451, 'learning_rate': 1.383280658271479e-05, 'epoch': 0.75} {'loss': 0.8711, 'learning_rate': 1.383250422833477e-05, 'epoch': 0.75} {'loss': 0.7419, 'learning_rate': 1.3832201869847875e-05, 'epoch': 0.75} {'loss': 0.8785, 'learning_rate': 1.3831899507254426e-05, 'epoch': 0.75} {'loss': 1.0017, 'learning_rate': 1.3831597140554753e-05, 'epoch': 0.75} {'loss': 0.7478, 'learning_rate': 1.3831294769749178e-05, 'epoch': 0.75} {'loss': 0.8984, 'learning_rate': 1.3830992394838025e-05, 'epoch': 0.75} {'loss': 0.9392, 'learning_rate': 1.3830690015821617e-05, 'epoch': 0.75} {'loss': 0.8198, 'learning_rate': 1.3830387632700281e-05, 'epoch': 0.75} {'loss': 0.8304, 'learning_rate': 1.3830085245474338e-05, 'epoch': 0.75} {'loss': 0.7195, 'learning_rate': 1.3829782854144114e-05, 'epoch': 0.75} {'loss': 0.9703, 'learning_rate': 1.3829480458709927e-05, 'epoch': 0.75} {'loss': 0.9692, 'learning_rate': 1.3829178059172112e-05, 'epoch': 0.75} {'loss': 0.7785, 'learning_rate': 1.3828875655530984e-05, 'epoch': 0.75} {'loss': 0.9313, 'learning_rate': 1.3828573247786873e-05, 'epoch': 0.75} {'loss': 0.7757, 'learning_rate': 1.3828270835940098e-05, 'epoch': 0.75} {'loss': 0.8523, 'learning_rate': 1.3827968419990985e-05, 'epoch': 0.75} {'loss': 0.5326, 'learning_rate': 1.3827665999939859e-05, 'epoch': 0.75} {'loss': 0.8058, 'learning_rate': 1.382736357578704e-05, 'epoch': 0.75} {'loss': 0.9139, 'learning_rate': 1.3827061147532863e-05, 'epoch': 0.75} {'loss': 0.7881, 'learning_rate': 1.3826758715177637e-05, 'epoch': 0.75} {'loss': 0.755, 'learning_rate': 1.3826456278721699e-05, 'epoch': 0.75} {'loss': 0.991, 'learning_rate': 1.3826153838165366e-05, 'epoch': 0.75} {'loss': 0.8705, 'learning_rate': 1.3825851393508963e-05, 'epoch': 0.75} {'loss': 0.8384, 'learning_rate': 1.3825548944752814e-05, 'epoch': 0.75} {'loss': 0.8334, 'learning_rate': 1.3825246491897249e-05, 'epoch': 0.75} {'loss': 0.7676, 'learning_rate': 1.3824944034942581e-05, 'epoch': 0.75} {'loss': 0.8368, 'learning_rate': 1.3824641573889142e-05, 'epoch': 0.75} {'loss': 0.7027, 'learning_rate': 1.3824339108737254e-05, 'epoch': 0.75} {'loss': 0.7131, 'learning_rate': 1.3824036639487246e-05, 'epoch': 0.75} {'loss': 0.8854, 'learning_rate': 1.3823734166139433e-05, 'epoch': 0.75} {'loss': 0.7357, 'learning_rate': 1.3823431688694146e-05, 'epoch': 0.75} {'loss': 0.8309, 'learning_rate': 1.3823129207151707e-05, 'epoch': 0.75} {'loss': 0.8086, 'learning_rate': 1.3822826721512436e-05, 'epoch': 0.75} {'loss': 1.0099, 'learning_rate': 1.3822524231776664e-05, 'epoch': 0.75} {'loss': 0.8867, 'learning_rate': 1.3822221737944713e-05, 'epoch': 0.75} {'loss': 0.7594, 'learning_rate': 1.3821919240016905e-05, 'epoch': 0.75} {'loss': 0.7156, 'learning_rate': 1.3821616737993568e-05, 'epoch': 0.75} {'loss': 0.8389, 'learning_rate': 1.3821314231875023e-05, 'epoch': 0.75} {'loss': 0.7834, 'learning_rate': 1.3821011721661592e-05, 'epoch': 0.75} {'loss': 0.7369, 'learning_rate': 1.3820709207353604e-05, 'epoch': 0.75} {'loss': 0.6914, 'learning_rate': 1.382040668895138e-05, 'epoch': 0.75} {'loss': 0.8581, 'learning_rate': 1.382010416645525e-05, 'epoch': 0.75} {'loss': 0.7994, 'learning_rate': 1.381980163986553e-05, 'epoch': 0.75} {'loss': 0.8727, 'learning_rate': 1.3819499109182548e-05, 'epoch': 0.75} {'loss': 0.6734, 'learning_rate': 1.3819196574406629e-05, 'epoch': 0.75} {'loss': 0.8732, 'learning_rate': 1.3818894035538093e-05, 'epoch': 0.75} {'loss': 0.9417, 'learning_rate': 1.381859149257727e-05, 'epoch': 0.75} {'loss': 0.6972, 'learning_rate': 1.3818288945524481e-05, 'epoch': 0.75} {'loss': 0.8786, 'learning_rate': 1.3817986394380052e-05, 'epoch': 0.75} {'loss': 0.8677, 'learning_rate': 1.3817683839144308e-05, 'epoch': 0.75} {'loss': 0.8322, 'learning_rate': 1.3817381279817565e-05, 'epoch': 0.75} {'loss': 0.8277, 'learning_rate': 1.3817078716400157e-05, 'epoch': 0.75} {'loss': 0.7656, 'learning_rate': 1.3816776148892404e-05, 'epoch': 0.75} {'loss': 0.7281, 'learning_rate': 1.381647357729463e-05, 'epoch': 0.75} {'loss': 0.8036, 'learning_rate': 1.381617100160716e-05, 'epoch': 0.75} {'loss': 0.7925, 'learning_rate': 1.381586842183032e-05, 'epoch': 0.75} {'loss': 0.8283, 'learning_rate': 1.3815565837964436e-05, 'epoch': 0.75} {'loss': 0.9357, 'learning_rate': 1.3815263250009823e-05, 'epoch': 0.75} {'loss': 0.8811, 'learning_rate': 1.381496065796681e-05, 'epoch': 0.75} {'loss': 0.8609, 'learning_rate': 1.3814658061835726e-05, 'epoch': 0.75} {'loss': 1.1106, 'learning_rate': 1.3814355461616891e-05, 'epoch': 0.75} {'loss': 0.7818, 'learning_rate': 1.3814052857310629e-05, 'epoch': 0.75} {'loss': 0.7917, 'learning_rate': 1.3813750248917269e-05, 'epoch': 0.75} {'loss': 0.8315, 'learning_rate': 1.3813447636437127e-05, 'epoch': 0.75} {'loss': 0.957, 'learning_rate': 1.3813145019870534e-05, 'epoch': 0.75} {'loss': 0.7603, 'learning_rate': 1.381284239921781e-05, 'epoch': 0.75} {'loss': 0.7977, 'learning_rate': 1.3812539774479282e-05, 'epoch': 0.75} {'loss': 0.9266, 'learning_rate': 1.3812237145655272e-05, 'epoch': 0.75} {'loss': 0.8248, 'learning_rate': 1.3811934512746108e-05, 'epoch': 0.75} {'loss': 0.9817, 'learning_rate': 1.3811631875752112e-05, 'epoch': 0.75} {'loss': 0.8773, 'learning_rate': 1.3811329234673609e-05, 'epoch': 0.75} {'loss': 0.8058, 'learning_rate': 1.3811026589510921e-05, 'epoch': 0.75} {'loss': 0.6369, 'learning_rate': 1.3810723940264374e-05, 'epoch': 0.76} {'loss': 0.8424, 'learning_rate': 1.3810421286934293e-05, 'epoch': 0.76} {'loss': 0.7391, 'learning_rate': 1.3810118629521003e-05, 'epoch': 0.76} {'loss': 0.8286, 'learning_rate': 1.3809815968024825e-05, 'epoch': 0.76} {'loss': 0.843, 'learning_rate': 1.3809513302446086e-05, 'epoch': 0.76} {'loss': 0.8859, 'learning_rate': 1.3809210632785113e-05, 'epoch': 0.76} {'loss': 0.8667, 'learning_rate': 1.3808907959042221e-05, 'epoch': 0.76} {'loss': 0.8866, 'learning_rate': 1.3808605281217744e-05, 'epoch': 0.76} {'loss': 0.8797, 'learning_rate': 1.3808302599312e-05, 'epoch': 0.76} {'loss': 0.7587, 'learning_rate': 1.3807999913325321e-05, 'epoch': 0.76} {'loss': 0.6941, 'learning_rate': 1.380769722325802e-05, 'epoch': 0.76} {'loss': 0.7096, 'learning_rate': 1.3807394529110435e-05, 'epoch': 0.76} {'loss': 0.6282, 'learning_rate': 1.3807091830882877e-05, 'epoch': 0.76} {'loss': 0.9786, 'learning_rate': 1.380678912857568e-05, 'epoch': 0.76} {'loss': 0.7517, 'learning_rate': 1.3806486422189162e-05, 'epoch': 0.76} {'loss': 0.8593, 'learning_rate': 1.3806183711723652e-05, 'epoch': 0.76} {'loss': 0.731, 'learning_rate': 1.3805880997179473e-05, 'epoch': 0.76} {'loss': 0.7965, 'learning_rate': 1.3805578278556948e-05, 'epoch': 0.76} {'loss': 0.7864, 'learning_rate': 1.3805275555856403e-05, 'epoch': 0.76} {'loss': 0.7008, 'learning_rate': 1.3804972829078162e-05, 'epoch': 0.76} {'loss': 0.8362, 'learning_rate': 1.3804670098222548e-05, 'epoch': 0.76} {'loss': 0.9791, 'learning_rate': 1.380436736328989e-05, 'epoch': 0.76} {'loss': 0.7832, 'learning_rate': 1.3804064624280504e-05, 'epoch': 0.76} {'loss': 0.721, 'learning_rate': 1.3803761881194721e-05, 'epoch': 0.76} {'loss': 0.8782, 'learning_rate': 1.3803459134032866e-05, 'epoch': 0.76} {'loss': 0.8076, 'learning_rate': 1.3803156382795261e-05, 'epoch': 0.76} {'loss': 0.7689, 'learning_rate': 1.3802853627482229e-05, 'epoch': 0.76} {'loss': 0.8665, 'learning_rate': 1.3802550868094098e-05, 'epoch': 0.76} {'loss': 0.7746, 'learning_rate': 1.380224810463119e-05, 'epoch': 0.76} {'loss': 0.6838, 'learning_rate': 1.3801945337093828e-05, 'epoch': 0.76} {'loss': 0.7901, 'learning_rate': 1.3801642565482338e-05, 'epoch': 0.76} {'loss': 0.8536, 'learning_rate': 1.3801339789797045e-05, 'epoch': 0.76} {'loss': 0.7319, 'learning_rate': 1.3801037010038276e-05, 'epoch': 0.76} {'loss': 0.9133, 'learning_rate': 1.3800734226206353e-05, 'epoch': 0.76} {'loss': 0.891, 'learning_rate': 1.38004314383016e-05, 'epoch': 0.76} {'loss': 0.9014, 'learning_rate': 1.380012864632434e-05, 'epoch': 0.76} {'loss': 0.9117, 'learning_rate': 1.37998258502749e-05, 'epoch': 0.76} {'loss': 0.6673, 'learning_rate': 1.3799523050153602e-05, 'epoch': 0.76} {'loss': 0.8181, 'learning_rate': 1.3799220245960773e-05, 'epoch': 0.76} {'loss': 0.9216, 'learning_rate': 1.3798917437696738e-05, 'epoch': 0.76} {'loss': 0.9389, 'learning_rate': 1.3798614625361821e-05, 'epoch': 0.76} {'loss': 0.7803, 'learning_rate': 1.3798311808956344e-05, 'epoch': 0.76} {'loss': 0.8438, 'learning_rate': 1.3798008988480632e-05, 'epoch': 0.76} {'loss': 0.7866, 'learning_rate': 1.3797706163935009e-05, 'epoch': 0.76} {'loss': 0.8816, 'learning_rate': 1.3797403335319803e-05, 'epoch': 0.76} {'loss': 0.8056, 'learning_rate': 1.3797100502635342e-05, 'epoch': 0.76} {'loss': 0.6714, 'learning_rate': 1.3796797665881938e-05, 'epoch': 0.76} {'loss': 0.8826, 'learning_rate': 1.3796494825059924e-05, 'epoch': 0.76} {'loss': 0.707, 'learning_rate': 1.3796191980169624e-05, 'epoch': 0.76} {'loss': 0.9342, 'learning_rate': 1.3795889131211363e-05, 'epoch': 0.76} {'loss': 0.7847, 'learning_rate': 1.3795586278185461e-05, 'epoch': 0.76} {'loss': 0.8124, 'learning_rate': 1.3795283421092247e-05, 'epoch': 0.76} {'loss': 0.7146, 'learning_rate': 1.3794980559932047e-05, 'epoch': 0.76} {'loss': 0.7692, 'learning_rate': 1.379467769470518e-05, 'epoch': 0.76} {'loss': 0.8848, 'learning_rate': 1.3794374825411976e-05, 'epoch': 0.76} {'loss': 0.8571, 'learning_rate': 1.3794071952052754e-05, 'epoch': 0.76} {'loss': 0.7113, 'learning_rate': 1.3793769074627841e-05, 'epoch': 0.76} {'loss': 0.8387, 'learning_rate': 1.3793466193137564e-05, 'epoch': 0.76} {'loss': 0.8188, 'learning_rate': 1.3793163307582243e-05, 'epoch': 0.76} {'loss': 0.8683, 'learning_rate': 1.3792860417962208e-05, 'epoch': 0.76} {'loss': 0.8888, 'learning_rate': 1.3792557524277783e-05, 'epoch': 0.76} {'loss': 0.8148, 'learning_rate': 1.3792254626529286e-05, 'epoch': 0.76} {'loss': 0.8573, 'learning_rate': 1.3791951724717048e-05, 'epoch': 0.76} {'loss': 0.939, 'learning_rate': 1.379164881884139e-05, 'epoch': 0.76} {'loss': 0.8016, 'learning_rate': 1.3791345908902635e-05, 'epoch': 0.76} {'loss': 0.9248, 'learning_rate': 1.3791042994901119e-05, 'epoch': 0.76} {'loss': 0.665, 'learning_rate': 1.3790740076837153e-05, 'epoch': 0.76} {'loss': 0.5863, 'learning_rate': 1.3790437154711066e-05, 'epoch': 0.76} {'loss': 0.8439, 'learning_rate': 1.3790134228523187e-05, 'epoch': 0.76} {'loss': 0.9756, 'learning_rate': 1.3789831298273834e-05, 'epoch': 0.76} {'loss': 0.6711, 'learning_rate': 1.3789528363963336e-05, 'epoch': 0.76} {'loss': 0.8104, 'learning_rate': 1.3789225425592016e-05, 'epoch': 0.76} {'loss': 0.7615, 'learning_rate': 1.3788922483160198e-05, 'epoch': 0.76} {'loss': 0.8601, 'learning_rate': 1.378861953666821e-05, 'epoch': 0.76} {'loss': 0.7861, 'learning_rate': 1.3788316586116373e-05, 'epoch': 0.76} {'loss': 0.6822, 'learning_rate': 1.3788013631505012e-05, 'epoch': 0.76} {'loss': 0.714, 'learning_rate': 1.3787710672834453e-05, 'epoch': 0.76} {'loss': 0.7185, 'learning_rate': 1.3787407710105018e-05, 'epoch': 0.76} {'loss': 0.732, 'learning_rate': 1.3787104743317039e-05, 'epoch': 0.76} {'loss': 0.9847, 'learning_rate': 1.3786801772470832e-05, 'epoch': 0.76} {'loss': 0.785, 'learning_rate': 1.3786498797566725e-05, 'epoch': 0.76} {'loss': 0.738, 'learning_rate': 1.3786195818605046e-05, 'epoch': 0.76} {'loss': 0.7314, 'learning_rate': 1.3785892835586113e-05, 'epoch': 0.76} {'loss': 0.6999, 'learning_rate': 1.3785589848510255e-05, 'epoch': 0.76} {'loss': 0.6881, 'learning_rate': 1.3785286857377798e-05, 'epoch': 0.76} {'loss': 0.7723, 'learning_rate': 1.3784983862189061e-05, 'epoch': 0.76} {'loss': 0.923, 'learning_rate': 1.3784680862944374e-05, 'epoch': 0.76} {'loss': 1.0672, 'learning_rate': 1.378437785964406e-05, 'epoch': 0.76} {'loss': 0.783, 'learning_rate': 1.3784074852288442e-05, 'epoch': 0.76} {'loss': 0.7755, 'learning_rate': 1.3783771840877846e-05, 'epoch': 0.76} {'loss': 0.8262, 'learning_rate': 1.3783468825412601e-05, 'epoch': 0.76} {'loss': 0.6198, 'learning_rate': 1.3783165805893024e-05, 'epoch': 0.76} {'loss': 1.0277, 'learning_rate': 1.3782862782319445e-05, 'epoch': 0.76} {'loss': 0.7492, 'learning_rate': 1.3782559754692184e-05, 'epoch': 0.76} {'loss': 0.8101, 'learning_rate': 1.3782256723011574e-05, 'epoch': 0.76} {'loss': 0.7157, 'learning_rate': 1.3781953687277932e-05, 'epoch': 0.76} {'loss': 0.7936, 'learning_rate': 1.3781650647491582e-05, 'epoch': 0.76} {'loss': 0.6973, 'learning_rate': 1.3781347603652856e-05, 'epoch': 0.76} {'loss': 0.7785, 'learning_rate': 1.3781044555762075e-05, 'epoch': 0.76} {'loss': 0.8594, 'learning_rate': 1.3780741503819561e-05, 'epoch': 0.76} {'loss': 0.7852, 'learning_rate': 1.3780438447825643e-05, 'epoch': 0.76} {'loss': 0.8192, 'learning_rate': 1.3780135387780644e-05, 'epoch': 0.76} {'loss': 0.8558, 'learning_rate': 1.377983232368489e-05, 'epoch': 0.76} {'loss': 0.7686, 'learning_rate': 1.3779529255538702e-05, 'epoch': 0.76} {'loss': 0.9455, 'learning_rate': 1.3779226183342409e-05, 'epoch': 0.76} {'loss': 0.7793, 'learning_rate': 1.3778923107096331e-05, 'epoch': 0.76} {'loss': 1.0163, 'learning_rate': 1.3778620026800797e-05, 'epoch': 0.76} {'loss': 0.8372, 'learning_rate': 1.3778316942456132e-05, 'epoch': 0.76} {'loss': 0.8029, 'learning_rate': 1.377801385406266e-05, 'epoch': 0.76} {'loss': 0.7335, 'learning_rate': 1.3777710761620706e-05, 'epoch': 0.76} {'loss': 0.9182, 'learning_rate': 1.3777407665130591e-05, 'epoch': 0.76} {'loss': 0.6775, 'learning_rate': 1.3777104564592645e-05, 'epoch': 0.76} {'loss': 0.7364, 'learning_rate': 1.3776801460007188e-05, 'epoch': 0.76} {'loss': 0.7814, 'learning_rate': 1.3776498351374548e-05, 'epoch': 0.76} {'loss': 0.8687, 'learning_rate': 1.377619523869505e-05, 'epoch': 0.76} {'loss': 0.7977, 'learning_rate': 1.3775892121969019e-05, 'epoch': 0.76} {'loss': 0.709, 'learning_rate': 1.3775589001196779e-05, 'epoch': 0.76} {'loss': 0.8278, 'learning_rate': 1.3775285876378652e-05, 'epoch': 0.76} {'loss': 0.8139, 'learning_rate': 1.3774982747514967e-05, 'epoch': 0.76} {'loss': 0.873, 'learning_rate': 1.3774679614606047e-05, 'epoch': 0.76} {'loss': 0.8608, 'learning_rate': 1.3774376477652215e-05, 'epoch': 0.76} {'loss': 0.6672, 'learning_rate': 1.37740733366538e-05, 'epoch': 0.76} {'loss': 0.7977, 'learning_rate': 1.3773770191611126e-05, 'epoch': 0.76} {'loss': 0.9049, 'learning_rate': 1.3773467042524518e-05, 'epoch': 0.76} {'loss': 0.7965, 'learning_rate': 1.3773163889394296e-05, 'epoch': 0.76} {'loss': 0.8693, 'learning_rate': 1.377286073222079e-05, 'epoch': 0.76} {'loss': 0.8671, 'learning_rate': 1.3772557571004322e-05, 'epoch': 0.76} {'loss': 0.6903, 'learning_rate': 1.3772254405745219e-05, 'epoch': 0.76} {'loss': 0.8329, 'learning_rate': 1.3771951236443806e-05, 'epoch': 0.76} {'loss': 0.8631, 'learning_rate': 1.3771648063100404e-05, 'epoch': 0.76} {'loss': 0.7491, 'learning_rate': 1.3771344885715343e-05, 'epoch': 0.76} {'loss': 0.7446, 'learning_rate': 1.3771041704288944e-05, 'epoch': 0.76} {'loss': 0.7953, 'learning_rate': 1.3770738518821533e-05, 'epoch': 0.76} {'loss': 0.7225, 'learning_rate': 1.3770435329313437e-05, 'epoch': 0.76} {'loss': 0.7108, 'learning_rate': 1.377013213576498e-05, 'epoch': 0.76} {'loss': 0.9869, 'learning_rate': 1.3769828938176484e-05, 'epoch': 0.76} {'loss': 0.8631, 'learning_rate': 1.376952573654828e-05, 'epoch': 0.76} {'loss': 0.6087, 'learning_rate': 1.3769222530880683e-05, 'epoch': 0.76} {'loss': 0.7749, 'learning_rate': 1.3768919321174026e-05, 'epoch': 0.76} {'loss': 0.6429, 'learning_rate': 1.3768616107428632e-05, 'epoch': 0.76} {'loss': 0.7196, 'learning_rate': 1.3768312889644826e-05, 'epoch': 0.76} {'loss': 0.654, 'learning_rate': 1.3768009667822935e-05, 'epoch': 0.76} {'loss': 0.8443, 'learning_rate': 1.3767706441963278e-05, 'epoch': 0.76} {'loss': 0.8804, 'learning_rate': 1.3767403212066185e-05, 'epoch': 0.76} {'loss': 0.8769, 'learning_rate': 1.376709997813198e-05, 'epoch': 0.76} {'loss': 0.8148, 'learning_rate': 1.3766796740160985e-05, 'epoch': 0.76} {'loss': 0.9542, 'learning_rate': 1.3766493498153527e-05, 'epoch': 0.76} {'loss': 0.7762, 'learning_rate': 1.3766190252109937e-05, 'epoch': 0.76} {'loss': 0.8676, 'learning_rate': 1.3765887002030529e-05, 'epoch': 0.76} {'loss': 0.7023, 'learning_rate': 1.3765583747915635e-05, 'epoch': 0.76} {'loss': 0.8222, 'learning_rate': 1.376528048976558e-05, 'epoch': 0.76} {'loss': 1.022, 'learning_rate': 1.3764977227580682e-05, 'epoch': 0.76} {'loss': 0.9959, 'learning_rate': 1.3764673961361275e-05, 'epoch': 0.76} {'loss': 0.8953, 'learning_rate': 1.376437069110768e-05, 'epoch': 0.76} {'loss': 0.7373, 'learning_rate': 1.3764067416820221e-05, 'epoch': 0.76} {'loss': 0.7569, 'learning_rate': 1.3763764138499225e-05, 'epoch': 0.76} {'loss': 0.9564, 'learning_rate': 1.3763460856145013e-05, 'epoch': 0.76} {'loss': 0.8482, 'learning_rate': 1.3763157569757916e-05, 'epoch': 0.76} {'loss': 0.9015, 'learning_rate': 1.3762854279338257e-05, 'epoch': 0.76} {'loss': 0.9408, 'learning_rate': 1.3762550984886358e-05, 'epoch': 0.76} {'loss': 0.994, 'learning_rate': 1.3762247686402546e-05, 'epoch': 0.76} {'loss': 0.8602, 'learning_rate': 1.3761944383887148e-05, 'epoch': 0.76} {'loss': 0.8655, 'learning_rate': 1.3761641077340482e-05, 'epoch': 0.76} {'loss': 0.6178, 'learning_rate': 1.3761337766762882e-05, 'epoch': 0.76} {'loss': 0.7391, 'learning_rate': 1.3761034452154668e-05, 'epoch': 0.76} {'loss': 0.7813, 'learning_rate': 1.3760731133516167e-05, 'epoch': 0.76} {'loss': 0.781, 'learning_rate': 1.3760427810847705e-05, 'epoch': 0.76} {'loss': 0.8376, 'learning_rate': 1.3760124484149602e-05, 'epoch': 0.76} {'loss': 0.8864, 'learning_rate': 1.3759821153422186e-05, 'epoch': 0.76} {'loss': 0.7945, 'learning_rate': 1.3759517818665784e-05, 'epoch': 0.76} {'loss': 0.7686, 'learning_rate': 1.3759214479880721e-05, 'epoch': 0.76} {'loss': 0.6517, 'learning_rate': 1.3758911137067317e-05, 'epoch': 0.76} {'loss': 0.9528, 'learning_rate': 1.3758607790225905e-05, 'epoch': 0.76} {'loss': 0.8997, 'learning_rate': 1.37583044393568e-05, 'epoch': 0.76} {'loss': 0.793, 'learning_rate': 1.3758001084460336e-05, 'epoch': 0.76} {'loss': 0.7187, 'learning_rate': 1.3757697725536832e-05, 'epoch': 0.76} {'loss': 0.9338, 'learning_rate': 1.3757394362586615e-05, 'epoch': 0.76} {'loss': 0.8525, 'learning_rate': 1.3757090995610014e-05, 'epoch': 0.76} {'loss': 0.9225, 'learning_rate': 1.3756787624607353e-05, 'epoch': 0.76} {'loss': 0.7022, 'learning_rate': 1.3756484249578952e-05, 'epoch': 0.76} {'loss': 0.7755, 'learning_rate': 1.3756180870525138e-05, 'epoch': 0.76} {'loss': 0.8109, 'learning_rate': 1.3755877487446236e-05, 'epoch': 0.76} {'loss': 0.7567, 'learning_rate': 1.3755574100342575e-05, 'epoch': 0.76} {'loss': 0.9092, 'learning_rate': 1.3755270709214476e-05, 'epoch': 0.76} {'loss': 0.8046, 'learning_rate': 1.3754967314062269e-05, 'epoch': 0.76} {'loss': 0.738, 'learning_rate': 1.3754663914886273e-05, 'epoch': 0.76} {'loss': 0.7892, 'learning_rate': 1.3754360511686815e-05, 'epoch': 0.76} {'loss': 0.6148, 'learning_rate': 1.3754057104464223e-05, 'epoch': 0.76} {'loss': 0.9192, 'learning_rate': 1.3753753693218817e-05, 'epoch': 0.76} {'loss': 0.6649, 'learning_rate': 1.3753450277950925e-05, 'epoch': 0.76} {'loss': 0.7106, 'learning_rate': 1.3753146858660875e-05, 'epoch': 0.76} {'loss': 0.7946, 'learning_rate': 1.3752843435348991e-05, 'epoch': 0.76} {'loss': 0.8094, 'learning_rate': 1.3752540008015593e-05, 'epoch': 0.76} {'loss': 0.7249, 'learning_rate': 1.3752236576661012e-05, 'epoch': 0.76} {'loss': 0.975, 'learning_rate': 1.3751933141285566e-05, 'epoch': 0.76} {'loss': 0.7775, 'learning_rate': 1.3751629701889591e-05, 'epoch': 0.76} {'loss': 0.7582, 'learning_rate': 1.3751326258473401e-05, 'epoch': 0.76} {'loss': 0.7819, 'learning_rate': 1.3751022811037331e-05, 'epoch': 0.76} {'loss': 0.7826, 'learning_rate': 1.3750719359581699e-05, 'epoch': 0.76} {'loss': 0.7688, 'learning_rate': 1.3750415904106836e-05, 'epoch': 0.76} {'loss': 0.7835, 'learning_rate': 1.3750112444613058e-05, 'epoch': 0.76} {'loss': 0.7778, 'learning_rate': 1.3749808981100699e-05, 'epoch': 0.76} {'loss': 0.8336, 'learning_rate': 1.374950551357008e-05, 'epoch': 0.76} {'loss': 0.9116, 'learning_rate': 1.374920204202153e-05, 'epoch': 0.76} {'loss': 0.7575, 'learning_rate': 1.3748898566455372e-05, 'epoch': 0.76} {'loss': 0.7073, 'learning_rate': 1.3748595086871928e-05, 'epoch': 0.76} {'loss': 0.8426, 'learning_rate': 1.374829160327153e-05, 'epoch': 0.76} {'loss': 0.849, 'learning_rate': 1.3747988115654494e-05, 'epoch': 0.76} {'loss': 0.7013, 'learning_rate': 1.3747684624021154e-05, 'epoch': 0.76} {'loss': 0.9418, 'learning_rate': 1.3747381128371829e-05, 'epoch': 0.76} {'loss': 0.8095, 'learning_rate': 1.3747077628706849e-05, 'epoch': 0.76} {'loss': 0.9268, 'learning_rate': 1.3746774125026536e-05, 'epoch': 0.76} {'loss': 1.0805, 'learning_rate': 1.3746470617331218e-05, 'epoch': 0.76} {'loss': 0.8692, 'learning_rate': 1.3746167105621218e-05, 'epoch': 0.76} {'loss': 0.6671, 'learning_rate': 1.3745863589896859e-05, 'epoch': 0.76} {'loss': 0.9719, 'learning_rate': 1.3745560070158472e-05, 'epoch': 0.76} {'loss': 0.8947, 'learning_rate': 1.374525654640638e-05, 'epoch': 0.76} {'loss': 0.8067, 'learning_rate': 1.3744953018640908e-05, 'epoch': 0.76} {'loss': 0.7995, 'learning_rate': 1.3744649486862378e-05, 'epoch': 0.76} {'loss': 0.7256, 'learning_rate': 1.374434595107112e-05, 'epoch': 0.76} {'loss': 0.5671, 'learning_rate': 1.3744042411267455e-05, 'epoch': 0.76} {'loss': 0.93, 'learning_rate': 1.3743738867451712e-05, 'epoch': 0.76} {'loss': 0.7888, 'learning_rate': 1.3743435319624219e-05, 'epoch': 0.76} {'loss': 0.9436, 'learning_rate': 1.3743131767785292e-05, 'epoch': 0.76} {'loss': 0.8132, 'learning_rate': 1.3742828211935261e-05, 'epoch': 0.76} {'loss': 0.7686, 'learning_rate': 1.3742524652074454e-05, 'epoch': 0.76} {'loss': 0.8348, 'learning_rate': 1.3742221088203195e-05, 'epoch': 0.76} {'loss': 0.7411, 'learning_rate': 1.3741917520321805e-05, 'epoch': 0.76} {'loss': 0.8926, 'learning_rate': 1.3741613948430614e-05, 'epoch': 0.76} {'loss': 0.7407, 'learning_rate': 1.374131037252995e-05, 'epoch': 0.76} {'loss': 0.7037, 'learning_rate': 1.374100679262013e-05, 'epoch': 0.76} {'loss': 0.7965, 'learning_rate': 1.3740703208701485e-05, 'epoch': 0.76} {'loss': 0.7343, 'learning_rate': 1.3740399620774337e-05, 'epoch': 0.76} {'loss': 0.786, 'learning_rate': 1.3740096028839017e-05, 'epoch': 0.76} {'loss': 0.8464, 'learning_rate': 1.3739792432895842e-05, 'epoch': 0.76} {'loss': 0.8858, 'learning_rate': 1.3739488832945144e-05, 'epoch': 0.76} {'loss': 0.796, 'learning_rate': 1.3739185228987246e-05, 'epoch': 0.76} {'loss': 0.8661, 'learning_rate': 1.3738881621022474e-05, 'epoch': 0.76} {'loss': 0.8329, 'learning_rate': 1.3738578009051153e-05, 'epoch': 0.76} {'loss': 0.7744, 'learning_rate': 1.3738274393073607e-05, 'epoch': 0.76} {'loss': 0.7601, 'learning_rate': 1.3737970773090163e-05, 'epoch': 0.76} {'loss': 0.824, 'learning_rate': 1.373766714910115e-05, 'epoch': 0.76} {'loss': 0.7988, 'learning_rate': 1.3737363521106884e-05, 'epoch': 0.76} {'loss': 0.7868, 'learning_rate': 1.3737059889107698e-05, 'epoch': 0.76} {'loss': 0.7879, 'learning_rate': 1.3736756253103914e-05, 'epoch': 0.76} {'loss': 0.8102, 'learning_rate': 1.373645261309586e-05, 'epoch': 0.76} {'loss': 0.8164, 'learning_rate': 1.3736148969083858e-05, 'epoch': 0.76} {'loss': 0.7736, 'learning_rate': 1.3735845321068235e-05, 'epoch': 0.76} {'loss': 0.6986, 'learning_rate': 1.3735541669049319e-05, 'epoch': 0.76} {'loss': 0.8755, 'learning_rate': 1.373523801302743e-05, 'epoch': 0.76} {'loss': 0.8189, 'learning_rate': 1.3734934353002898e-05, 'epoch': 0.76} {'loss': 0.6086, 'learning_rate': 1.3734630688976045e-05, 'epoch': 0.76} {'loss': 0.9256, 'learning_rate': 1.37343270209472e-05, 'epoch': 0.76} {'loss': 0.8207, 'learning_rate': 1.3734023348916687e-05, 'epoch': 0.76} {'loss': 0.6313, 'learning_rate': 1.373371967288483e-05, 'epoch': 0.76} {'loss': 0.7535, 'learning_rate': 1.3733415992851957e-05, 'epoch': 0.76} {'loss': 0.7765, 'learning_rate': 1.3733112308818389e-05, 'epoch': 0.76} {'loss': 0.6989, 'learning_rate': 1.3732808620784455e-05, 'epoch': 0.76} {'loss': 0.7256, 'learning_rate': 1.3732504928750478e-05, 'epoch': 0.76} {'loss': 0.8285, 'learning_rate': 1.3732201232716786e-05, 'epoch': 0.76} {'loss': 0.6779, 'learning_rate': 1.373189753268371e-05, 'epoch': 0.76} {'loss': 0.8415, 'learning_rate': 1.3731593828651563e-05, 'epoch': 0.76} {'loss': 0.7374, 'learning_rate': 1.3731290120620678e-05, 'epoch': 0.76} {'loss': 0.813, 'learning_rate': 1.3730986408591377e-05, 'epoch': 0.76} {'loss': 0.9345, 'learning_rate': 1.3730682692563985e-05, 'epoch': 0.76} {'loss': 0.7955, 'learning_rate': 1.3730378972538833e-05, 'epoch': 0.76} {'loss': 0.9541, 'learning_rate': 1.3730075248516245e-05, 'epoch': 0.76} {'loss': 0.7687, 'learning_rate': 1.3729771520496545e-05, 'epoch': 0.76} {'loss': 0.9514, 'learning_rate': 1.3729467788480056e-05, 'epoch': 0.76} {'loss': 0.9184, 'learning_rate': 1.3729164052467105e-05, 'epoch': 0.76} {'loss': 0.8045, 'learning_rate': 1.3728860312458019e-05, 'epoch': 0.76} {'loss': 0.783, 'learning_rate': 1.3728556568453122e-05, 'epoch': 0.76} {'loss': 0.8104, 'learning_rate': 1.372825282045274e-05, 'epoch': 0.76} {'loss': 0.9042, 'learning_rate': 1.37279490684572e-05, 'epoch': 0.76} {'loss': 0.8911, 'learning_rate': 1.3727645312466826e-05, 'epoch': 0.76} {'loss': 0.831, 'learning_rate': 1.3727341552481943e-05, 'epoch': 0.76} {'loss': 0.7117, 'learning_rate': 1.372703778850288e-05, 'epoch': 0.76} {'loss': 1.0016, 'learning_rate': 1.3726734020529954e-05, 'epoch': 0.76} {'loss': 0.7228, 'learning_rate': 1.3726430248563499e-05, 'epoch': 0.76} {'loss': 0.7745, 'learning_rate': 1.3726126472603837e-05, 'epoch': 0.76} {'loss': 0.8345, 'learning_rate': 1.3725822692651296e-05, 'epoch': 0.76} {'loss': 0.6878, 'learning_rate': 1.3725518908706197e-05, 'epoch': 0.76} {'loss': 0.764, 'learning_rate': 1.3725215120768871e-05, 'epoch': 0.76} {'loss': 0.8085, 'learning_rate': 1.372491132883964e-05, 'epoch': 0.76} {'loss': 0.7145, 'learning_rate': 1.372460753291883e-05, 'epoch': 0.76} {'loss': 0.8677, 'learning_rate': 1.3724303733006768e-05, 'epoch': 0.76} {'loss': 0.807, 'learning_rate': 1.3723999929103775e-05, 'epoch': 0.76} {'loss': 0.641, 'learning_rate': 1.3723696121210182e-05, 'epoch': 0.76} {'loss': 0.955, 'learning_rate': 1.3723392309326315e-05, 'epoch': 0.76} {'loss': 0.7511, 'learning_rate': 1.3723088493452492e-05, 'epoch': 0.76} {'loss': 0.8904, 'learning_rate': 1.3722784673589046e-05, 'epoch': 0.76} {'loss': 0.6975, 'learning_rate': 1.3722480849736304e-05, 'epoch': 0.76} {'loss': 0.8961, 'learning_rate': 1.3722177021894583e-05, 'epoch': 0.76} {'loss': 0.9349, 'learning_rate': 1.3721873190064215e-05, 'epoch': 0.76} {'loss': 0.6713, 'learning_rate': 1.372156935424552e-05, 'epoch': 0.76} {'loss': 0.7039, 'learning_rate': 1.3721265514438835e-05, 'epoch': 0.76} {'loss': 0.9294, 'learning_rate': 1.3720961670644473e-05, 'epoch': 0.76} {'loss': 0.7413, 'learning_rate': 1.3720657822862767e-05, 'epoch': 0.76} {'loss': 0.8468, 'learning_rate': 1.3720353971094041e-05, 'epoch': 0.76} {'loss': 0.6694, 'learning_rate': 1.3720050115338617e-05, 'epoch': 0.76} {'loss': 0.8218, 'learning_rate': 1.3719746255596824e-05, 'epoch': 0.76} {'loss': 0.929, 'learning_rate': 1.371944239186899e-05, 'epoch': 0.76} {'loss': 0.9304, 'learning_rate': 1.3719138524155436e-05, 'epoch': 0.76} {'loss': 0.8411, 'learning_rate': 1.3718834652456487e-05, 'epoch': 0.76} {'loss': 0.7389, 'learning_rate': 1.3718530776772477e-05, 'epoch': 0.76} {'loss': 0.7121, 'learning_rate': 1.3718226897103719e-05, 'epoch': 0.76} {'loss': 0.827, 'learning_rate': 1.3717923013450549e-05, 'epoch': 0.76} {'loss': 0.6818, 'learning_rate': 1.3717619125813286e-05, 'epoch': 0.76} {'loss': 0.8218, 'learning_rate': 1.3717315234192261e-05, 'epoch': 0.76} {'loss': 0.6724, 'learning_rate': 1.3717011338587798e-05, 'epoch': 0.76} {'loss': 0.7948, 'learning_rate': 1.3716707439000223e-05, 'epoch': 0.76} {'loss': 0.7736, 'learning_rate': 1.371640353542986e-05, 'epoch': 0.76} {'loss': 0.9279, 'learning_rate': 1.3716099627877031e-05, 'epoch': 0.76} {'loss': 0.882, 'learning_rate': 1.3715795716342067e-05, 'epoch': 0.76} {'loss': 0.7574, 'learning_rate': 1.3715491800825294e-05, 'epoch': 0.76} {'loss': 0.8354, 'learning_rate': 1.3715187881327034e-05, 'epoch': 0.76} {'loss': 0.9791, 'learning_rate': 1.3714883957847618e-05, 'epoch': 0.76} {'loss': 0.7127, 'learning_rate': 1.371458003038737e-05, 'epoch': 0.76} {'loss': 0.9084, 'learning_rate': 1.371427609894661e-05, 'epoch': 0.76} {'loss': 0.7544, 'learning_rate': 1.3713972163525671e-05, 'epoch': 0.76} {'loss': 0.6858, 'learning_rate': 1.3713668224124872e-05, 'epoch': 0.76} {'loss': 0.8384, 'learning_rate': 1.3713364280744545e-05, 'epoch': 0.76} {'loss': 0.8426, 'learning_rate': 1.3713060333385014e-05, 'epoch': 0.76} {'loss': 0.6081, 'learning_rate': 1.3712756382046601e-05, 'epoch': 0.76} {'loss': 1.0161, 'learning_rate': 1.3712452426729637e-05, 'epoch': 0.76} {'loss': 0.8877, 'learning_rate': 1.3712148467434446e-05, 'epoch': 0.76} {'loss': 0.857, 'learning_rate': 1.3711844504161349e-05, 'epoch': 0.76} {'loss': 0.7163, 'learning_rate': 1.3711540536910677e-05, 'epoch': 0.76} {'loss': 1.0433, 'learning_rate': 1.3711236565682753e-05, 'epoch': 0.76} {'loss': 0.6354, 'learning_rate': 1.3710932590477908e-05, 'epoch': 0.76} {'loss': 0.6591, 'learning_rate': 1.3710628611296462e-05, 'epoch': 0.76} {'loss': 0.7625, 'learning_rate': 1.3710324628138743e-05, 'epoch': 0.76} {'loss': 0.81, 'learning_rate': 1.3710020641005075e-05, 'epoch': 0.76} {'loss': 0.7951, 'learning_rate': 1.3709716649895784e-05, 'epoch': 0.76} {'loss': 0.7454, 'learning_rate': 1.3709412654811196e-05, 'epoch': 0.76} {'loss': 0.7209, 'learning_rate': 1.3709108655751645e-05, 'epoch': 0.76} {'loss': 0.9103, 'learning_rate': 1.370880465271744e-05, 'epoch': 0.76} {'loss': 0.7928, 'learning_rate': 1.3708500645708922e-05, 'epoch': 0.76} {'loss': 0.7834, 'learning_rate': 1.370819663472641e-05, 'epoch': 0.76} {'loss': 0.8384, 'learning_rate': 1.370789261977023e-05, 'epoch': 0.76} {'loss': 0.6096, 'learning_rate': 1.3707588600840706e-05, 'epoch': 0.76} {'loss': 0.8763, 'learning_rate': 1.3707284577938167e-05, 'epoch': 0.76} {'loss': 0.7107, 'learning_rate': 1.370698055106294e-05, 'epoch': 0.76} {'loss': 0.776, 'learning_rate': 1.3706676520215347e-05, 'epoch': 0.76} {'loss': 0.736, 'learning_rate': 1.370637248539572e-05, 'epoch': 0.76} {'loss': 0.6661, 'learning_rate': 1.3706068446604374e-05, 'epoch': 0.76} {'loss': 0.9236, 'learning_rate': 1.3705764403841647e-05, 'epoch': 0.76} {'loss': 0.8152, 'learning_rate': 1.3705460357107854e-05, 'epoch': 0.76} {'loss': 0.8384, 'learning_rate': 1.3705156306403328e-05, 'epoch': 0.76} {'loss': 0.792, 'learning_rate': 1.370485225172839e-05, 'epoch': 0.76} {'loss': 0.9236, 'learning_rate': 1.3704548193083373e-05, 'epoch': 0.76} {'loss': 0.8001, 'learning_rate': 1.3704244130468599e-05, 'epoch': 0.76} {'loss': 0.8942, 'learning_rate': 1.370394006388439e-05, 'epoch': 0.76} {'loss': 0.8523, 'learning_rate': 1.3703635993331073e-05, 'epoch': 0.76} {'loss': 0.8844, 'learning_rate': 1.370333191880898e-05, 'epoch': 0.76} {'loss': 0.9652, 'learning_rate': 1.3703027840318429e-05, 'epoch': 0.76} {'loss': 0.8996, 'learning_rate': 1.3702723757859748e-05, 'epoch': 0.76} {'loss': 0.8083, 'learning_rate': 1.370241967143327e-05, 'epoch': 0.76} {'loss': 0.8984, 'learning_rate': 1.3702115581039313e-05, 'epoch': 0.76} {'loss': 0.8625, 'learning_rate': 1.3701811486678203e-05, 'epoch': 0.76} {'loss': 0.788, 'learning_rate': 1.3701507388350268e-05, 'epoch': 0.76} {'loss': 0.7538, 'learning_rate': 1.3701203286055837e-05, 'epoch': 0.76} {'loss': 0.6474, 'learning_rate': 1.370089917979523e-05, 'epoch': 0.76} {'loss': 0.9925, 'learning_rate': 1.3700595069568776e-05, 'epoch': 0.76} {'loss': 0.7797, 'learning_rate': 1.3700290955376802e-05, 'epoch': 0.76} {'loss': 0.698, 'learning_rate': 1.369998683721963e-05, 'epoch': 0.76} {'loss': 0.8673, 'learning_rate': 1.3699682715097589e-05, 'epoch': 0.76} {'loss': 0.6224, 'learning_rate': 1.3699378589011004e-05, 'epoch': 0.76} {'loss': 0.8763, 'learning_rate': 1.3699074458960203e-05, 'epoch': 0.76} {'loss': 0.8288, 'learning_rate': 1.3698770324945504e-05, 'epoch': 0.76} {'loss': 0.8487, 'learning_rate': 1.3698466186967242e-05, 'epoch': 0.76} {'loss': 0.9246, 'learning_rate': 1.3698162045025742e-05, 'epoch': 0.76} {'loss': 0.8568, 'learning_rate': 1.3697857899121325e-05, 'epoch': 0.76} {'loss': 0.7622, 'learning_rate': 1.3697553749254322e-05, 'epoch': 0.76} {'loss': 0.8416, 'learning_rate': 1.3697249595425055e-05, 'epoch': 0.76} {'loss': 0.8348, 'learning_rate': 1.369694543763385e-05, 'epoch': 0.76} {'loss': 0.6896, 'learning_rate': 1.3696641275881036e-05, 'epoch': 0.76} {'loss': 0.7808, 'learning_rate': 1.3696337110166936e-05, 'epoch': 0.76} {'loss': 0.6582, 'learning_rate': 1.3696032940491879e-05, 'epoch': 0.76} {'loss': 0.782, 'learning_rate': 1.3695728766856188e-05, 'epoch': 0.76} {'loss': 0.7431, 'learning_rate': 1.3695424589260191e-05, 'epoch': 0.76} {'loss': 0.7067, 'learning_rate': 1.3695120407704212e-05, 'epoch': 0.76} {'loss': 0.9557, 'learning_rate': 1.3694816222188575e-05, 'epoch': 0.76} {'loss': 0.7961, 'learning_rate': 1.3694512032713614e-05, 'epoch': 0.76} {'loss': 0.7655, 'learning_rate': 1.3694207839279647e-05, 'epoch': 0.76} {'loss': 0.7854, 'learning_rate': 1.3693903641887003e-05, 'epoch': 0.76} {'loss': 0.671, 'learning_rate': 1.3693599440536011e-05, 'epoch': 0.76} {'loss': 0.9157, 'learning_rate': 1.3693295235226992e-05, 'epoch': 0.76} {'loss': 0.7464, 'learning_rate': 1.3692991025960272e-05, 'epoch': 0.76} {'loss': 0.8781, 'learning_rate': 1.369268681273618e-05, 'epoch': 0.76} {'loss': 0.7784, 'learning_rate': 1.369238259555504e-05, 'epoch': 0.76} {'loss': 0.9156, 'learning_rate': 1.369207837441718e-05, 'epoch': 0.76} {'loss': 0.7494, 'learning_rate': 1.3691774149322925e-05, 'epoch': 0.76} {'loss': 0.6805, 'learning_rate': 1.3691469920272603e-05, 'epoch': 0.76} {'loss': 0.8326, 'learning_rate': 1.3691165687266533e-05, 'epoch': 0.76} {'loss': 0.8694, 'learning_rate': 1.3690861450305046e-05, 'epoch': 0.76} {'loss': 0.8354, 'learning_rate': 1.3690557209388469e-05, 'epoch': 0.76} {'loss': 0.8329, 'learning_rate': 1.3690252964517127e-05, 'epoch': 0.76} {'loss': 0.8962, 'learning_rate': 1.3689948715691348e-05, 'epoch': 0.76} {'loss': 0.8084, 'learning_rate': 1.3689644462911455e-05, 'epoch': 0.76} {'loss': 0.7714, 'learning_rate': 1.3689340206177774e-05, 'epoch': 0.76} {'loss': 0.8432, 'learning_rate': 1.3689035945490632e-05, 'epoch': 0.76} {'loss': 0.7045, 'learning_rate': 1.3688731680850356e-05, 'epoch': 0.76} {'loss': 0.7871, 'learning_rate': 1.3688427412257271e-05, 'epoch': 0.76} {'loss': 0.8491, 'learning_rate': 1.36881231397117e-05, 'epoch': 0.76} {'loss': 0.6467, 'learning_rate': 1.3687818863213976e-05, 'epoch': 0.76} {'loss': 0.8332, 'learning_rate': 1.3687514582764421e-05, 'epoch': 0.76} {'loss': 0.6641, 'learning_rate': 1.368721029836336e-05, 'epoch': 0.76} {'loss': 0.6717, 'learning_rate': 1.368690601001112e-05, 'epoch': 0.76} {'loss': 0.8099, 'learning_rate': 1.3686601717708028e-05, 'epoch': 0.76} {'loss': 1.0049, 'learning_rate': 1.3686297421454409e-05, 'epoch': 0.76} {'loss': 0.897, 'learning_rate': 1.3685993121250591e-05, 'epoch': 0.76} {'loss': 0.8412, 'learning_rate': 1.3685688817096896e-05, 'epoch': 0.76} {'loss': 0.7749, 'learning_rate': 1.3685384508993657e-05, 'epoch': 0.76} {'loss': 0.6631, 'learning_rate': 1.3685080196941194e-05, 'epoch': 0.76} {'loss': 0.801, 'learning_rate': 1.3684775880939833e-05, 'epoch': 0.76} {'loss': 0.8252, 'learning_rate': 1.3684471560989902e-05, 'epoch': 0.76} {'loss': 0.6559, 'learning_rate': 1.368416723709173e-05, 'epoch': 0.76} {'loss': 0.8663, 'learning_rate': 1.3683862909245639e-05, 'epoch': 0.76} {'loss': 0.9057, 'learning_rate': 1.3683558577451956e-05, 'epoch': 0.76} {'loss': 0.7889, 'learning_rate': 1.368325424171101e-05, 'epoch': 0.76} {'loss': 0.8469, 'learning_rate': 1.3682949902023122e-05, 'epoch': 0.76} {'loss': 0.8414, 'learning_rate': 1.3682645558388622e-05, 'epoch': 0.76} {'loss': 0.7162, 'learning_rate': 1.3682341210807835e-05, 'epoch': 0.76} {'loss': 0.9272, 'learning_rate': 1.3682036859281085e-05, 'epoch': 0.76} {'loss': 0.7509, 'learning_rate': 1.36817325038087e-05, 'epoch': 0.76} {'loss': 0.9147, 'learning_rate': 1.3681428144391009e-05, 'epoch': 0.76} {'loss': 0.6779, 'learning_rate': 1.3681123781028337e-05, 'epoch': 0.76} {'loss': 0.9682, 'learning_rate': 1.3680819413721003e-05, 'epoch': 0.76} {'loss': 0.7303, 'learning_rate': 1.368051504246934e-05, 'epoch': 0.76} {'loss': 0.6984, 'learning_rate': 1.3680210667273676e-05, 'epoch': 0.76} {'loss': 0.9168, 'learning_rate': 1.3679906288134333e-05, 'epoch': 0.76} {'loss': 0.8189, 'learning_rate': 1.3679601905051638e-05, 'epoch': 0.76} {'loss': 0.7314, 'learning_rate': 1.3679297518025916e-05, 'epoch': 0.76} {'loss': 0.6773, 'learning_rate': 1.3678993127057498e-05, 'epoch': 0.76} {'loss': 0.7707, 'learning_rate': 1.3678688732146705e-05, 'epoch': 0.76} {'loss': 1.0659, 'learning_rate': 1.3678384333293865e-05, 'epoch': 0.76} {'loss': 0.7736, 'learning_rate': 1.3678079930499304e-05, 'epoch': 0.76} {'loss': 0.7246, 'learning_rate': 1.3677775523763348e-05, 'epoch': 0.76} {'loss': 0.7852, 'learning_rate': 1.3677471113086325e-05, 'epoch': 0.76} {'loss': 0.8826, 'learning_rate': 1.3677166698468556e-05, 'epoch': 0.76} {'loss': 0.7421, 'learning_rate': 1.3676862279910376e-05, 'epoch': 0.76} {'loss': 0.9589, 'learning_rate': 1.3676557857412106e-05, 'epoch': 0.76} {'loss': 0.7748, 'learning_rate': 1.367625343097407e-05, 'epoch': 0.76} {'loss': 0.7758, 'learning_rate': 1.3675949000596597e-05, 'epoch': 0.76} {'loss': 0.7148, 'learning_rate': 1.3675644566280011e-05, 'epoch': 0.76} {'loss': 0.9335, 'learning_rate': 1.3675340128024641e-05, 'epoch': 0.76} {'loss': 0.688, 'learning_rate': 1.3675035685830818e-05, 'epoch': 0.76} {'loss': 0.65, 'learning_rate': 1.3674731239698855e-05, 'epoch': 0.76} {'loss': 0.6008, 'learning_rate': 1.3674426789629091e-05, 'epoch': 0.76} {'loss': 0.7653, 'learning_rate': 1.3674122335621844e-05, 'epoch': 0.76} {'loss': 0.8399, 'learning_rate': 1.3673817877677445e-05, 'epoch': 0.76} {'loss': 0.6764, 'learning_rate': 1.3673513415796215e-05, 'epoch': 0.76} {'loss': 0.7289, 'learning_rate': 1.3673208949978487e-05, 'epoch': 0.76} {'loss': 0.8097, 'learning_rate': 1.3672904480224584e-05, 'epoch': 0.76} {'loss': 0.8539, 'learning_rate': 1.3672600006534836e-05, 'epoch': 0.76} {'loss': 0.7881, 'learning_rate': 1.367229552890956e-05, 'epoch': 0.76} {'loss': 0.7805, 'learning_rate': 1.3671991047349088e-05, 'epoch': 0.76} {'loss': 0.8727, 'learning_rate': 1.3671686561853747e-05, 'epoch': 0.76} {'loss': 0.8596, 'learning_rate': 1.3671382072423861e-05, 'epoch': 0.76} {'loss': 0.9383, 'learning_rate': 1.3671077579059762e-05, 'epoch': 0.76} {'loss': 0.8369, 'learning_rate': 1.3670773081761772e-05, 'epoch': 0.76} {'loss': 0.7726, 'learning_rate': 1.3670468580530217e-05, 'epoch': 0.76} {'loss': 0.8575, 'learning_rate': 1.367016407536542e-05, 'epoch': 0.76} {'loss': 0.8068, 'learning_rate': 1.3669859566267714e-05, 'epoch': 0.76} {'loss': 0.846, 'learning_rate': 1.366955505323742e-05, 'epoch': 0.76} {'loss': 0.8249, 'learning_rate': 1.3669250536274868e-05, 'epoch': 0.76} {'loss': 0.8586, 'learning_rate': 1.3668946015380382e-05, 'epoch': 0.76} {'loss': 0.9218, 'learning_rate': 1.366864149055429e-05, 'epoch': 0.76} {'loss': 0.9431, 'learning_rate': 1.3668336961796917e-05, 'epoch': 0.76} {'loss': 0.757, 'learning_rate': 1.3668032429108591e-05, 'epoch': 0.76} {'loss': 0.8874, 'learning_rate': 1.3667727892489635e-05, 'epoch': 0.76} {'loss': 0.7978, 'learning_rate': 1.3667423351940379e-05, 'epoch': 0.76} {'loss': 0.7228, 'learning_rate': 1.3667118807461146e-05, 'epoch': 0.76} {'loss': 0.8075, 'learning_rate': 1.3666814259052268e-05, 'epoch': 0.76} {'loss': 0.7759, 'learning_rate': 1.3666509706714064e-05, 'epoch': 0.76} {'loss': 0.7619, 'learning_rate': 1.3666205150446867e-05, 'epoch': 0.76} {'loss': 0.8534, 'learning_rate': 1.3665900590251e-05, 'epoch': 0.76} {'loss': 0.8744, 'learning_rate': 1.3665596026126786e-05, 'epoch': 0.76} {'loss': 0.8344, 'learning_rate': 1.3665291458074559e-05, 'epoch': 0.76} {'loss': 0.7991, 'learning_rate': 1.366498688609464e-05, 'epoch': 0.76} {'loss': 0.9773, 'learning_rate': 1.3664682310187355e-05, 'epoch': 0.76} {'loss': 0.9268, 'learning_rate': 1.3664377730353033e-05, 'epoch': 0.77} {'loss': 0.7848, 'learning_rate': 1.3664073146592002e-05, 'epoch': 0.77} {'loss': 0.8536, 'learning_rate': 1.3663768558904584e-05, 'epoch': 0.77} {'loss': 0.8179, 'learning_rate': 1.3663463967291107e-05, 'epoch': 0.77} {'loss': 0.6859, 'learning_rate': 1.36631593717519e-05, 'epoch': 0.77} {'loss': 0.8735, 'learning_rate': 1.3662854772287284e-05, 'epoch': 0.77} {'loss': 0.7021, 'learning_rate': 1.366255016889759e-05, 'epoch': 0.77} {'loss': 0.9244, 'learning_rate': 1.3662245561583145e-05, 'epoch': 0.77} {'loss': 1.0454, 'learning_rate': 1.366194095034427e-05, 'epoch': 0.77} {'loss': 0.7476, 'learning_rate': 1.3661636335181295e-05, 'epoch': 0.77} {'loss': 0.7953, 'learning_rate': 1.3661331716094546e-05, 'epoch': 0.77} {'loss': 0.8294, 'learning_rate': 1.3661027093084354e-05, 'epoch': 0.77} {'loss': 0.6863, 'learning_rate': 1.3660722466151035e-05, 'epoch': 0.77} {'loss': 0.825, 'learning_rate': 1.3660417835294924e-05, 'epoch': 0.77} {'loss': 0.715, 'learning_rate': 1.3660113200516347e-05, 'epoch': 0.77} {'loss': 0.7827, 'learning_rate': 1.3659808561815627e-05, 'epoch': 0.77} {'loss': 0.963, 'learning_rate': 1.3659503919193089e-05, 'epoch': 0.77} {'loss': 0.9133, 'learning_rate': 1.3659199272649066e-05, 'epoch': 0.77} {'loss': 0.6473, 'learning_rate': 1.3658894622183878e-05, 'epoch': 0.77} {'loss': 0.881, 'learning_rate': 1.3658589967797855e-05, 'epoch': 0.77} {'loss': 0.8367, 'learning_rate': 1.3658285309491324e-05, 'epoch': 0.77} {'loss': 0.6971, 'learning_rate': 1.365798064726461e-05, 'epoch': 0.77} {'loss': 0.8021, 'learning_rate': 1.3657675981118037e-05, 'epoch': 0.77} {'loss': 0.9165, 'learning_rate': 1.3657371311051936e-05, 'epoch': 0.77} {'loss': 0.8964, 'learning_rate': 1.3657066637066634e-05, 'epoch': 0.77} {'loss': 0.845, 'learning_rate': 1.365676195916245e-05, 'epoch': 0.77} {'loss': 0.9143, 'learning_rate': 1.3656457277339716e-05, 'epoch': 0.77} {'loss': 0.7857, 'learning_rate': 1.3656152591598761e-05, 'epoch': 0.77} {'loss': 0.8718, 'learning_rate': 1.3655847901939909e-05, 'epoch': 0.77} {'loss': 0.9085, 'learning_rate': 1.3655543208363487e-05, 'epoch': 0.77} {'loss': 0.6657, 'learning_rate': 1.3655238510869814e-05, 'epoch': 0.77} {'loss': 0.896, 'learning_rate': 1.3654933809459227e-05, 'epoch': 0.77} {'loss': 0.813, 'learning_rate': 1.365462910413205e-05, 'epoch': 0.77} {'loss': 0.7103, 'learning_rate': 1.3654324394888605e-05, 'epoch': 0.77} {'loss': 0.8863, 'learning_rate': 1.3654019681729223e-05, 'epoch': 0.77} {'loss': 0.8049, 'learning_rate': 1.365371496465423e-05, 'epoch': 0.77} {'loss': 0.9877, 'learning_rate': 1.3653410243663953e-05, 'epoch': 0.77} {'loss': 0.7283, 'learning_rate': 1.3653105518758713e-05, 'epoch': 0.77} {'loss': 0.8429, 'learning_rate': 1.3652800789938843e-05, 'epoch': 0.77} {'loss': 0.8223, 'learning_rate': 1.3652496057204667e-05, 'epoch': 0.77} {'loss': 0.924, 'learning_rate': 1.3652191320556512e-05, 'epoch': 0.77} {'loss': 0.8217, 'learning_rate': 1.3651886579994705e-05, 'epoch': 0.77} {'loss': 0.6786, 'learning_rate': 1.3651581835519572e-05, 'epoch': 0.77} {'loss': 0.8974, 'learning_rate': 1.365127708713144e-05, 'epoch': 0.77} {'loss': 0.9004, 'learning_rate': 1.3650972334830632e-05, 'epoch': 0.77} {'loss': 0.8694, 'learning_rate': 1.3650667578617477e-05, 'epoch': 0.77} {'loss': 0.7622, 'learning_rate': 1.3650362818492306e-05, 'epoch': 0.77} {'loss': 0.8398, 'learning_rate': 1.365005805445544e-05, 'epoch': 0.77} {'loss': 0.8474, 'learning_rate': 1.3649753286507208e-05, 'epoch': 0.77} {'loss': 0.8879, 'learning_rate': 1.3649448514647938e-05, 'epoch': 0.77} {'loss': 0.7723, 'learning_rate': 1.3649143738877952e-05, 'epoch': 0.77} {'loss': 0.7332, 'learning_rate': 1.3648838959197578e-05, 'epoch': 0.77} {'loss': 0.9922, 'learning_rate': 1.3648534175607145e-05, 'epoch': 0.77} {'loss': 0.6984, 'learning_rate': 1.3648229388106976e-05, 'epoch': 0.77} {'loss': 0.9776, 'learning_rate': 1.3647924596697404e-05, 'epoch': 0.77} {'loss': 0.8663, 'learning_rate': 1.364761980137875e-05, 'epoch': 0.77} {'loss': 0.8302, 'learning_rate': 1.3647315002151345e-05, 'epoch': 0.77} {'loss': 0.778, 'learning_rate': 1.364701019901551e-05, 'epoch': 0.77} {'loss': 0.8028, 'learning_rate': 1.364670539197157e-05, 'epoch': 0.77} {'loss': 0.7317, 'learning_rate': 1.364640058101986e-05, 'epoch': 0.77} {'loss': 0.7525, 'learning_rate': 1.3646095766160702e-05, 'epoch': 0.77} {'loss': 0.9359, 'learning_rate': 1.3645790947394425e-05, 'epoch': 0.77} {'loss': 0.5674, 'learning_rate': 1.3645486124721355e-05, 'epoch': 0.77} {'loss': 0.8356, 'learning_rate': 1.3645181298141817e-05, 'epoch': 0.77} {'loss': 0.8501, 'learning_rate': 1.3644876467656136e-05, 'epoch': 0.77} {'loss': 0.7178, 'learning_rate': 1.3644571633264642e-05, 'epoch': 0.77} {'loss': 0.8193, 'learning_rate': 1.364426679496766e-05, 'epoch': 0.77} {'loss': 0.871, 'learning_rate': 1.3643961952765519e-05, 'epoch': 0.77} {'loss': 0.8013, 'learning_rate': 1.3643657106658541e-05, 'epoch': 0.77} {'loss': 0.8617, 'learning_rate': 1.3643352256647057e-05, 'epoch': 0.77} {'loss': 0.7426, 'learning_rate': 1.3643047402731395e-05, 'epoch': 0.77} {'loss': 0.8436, 'learning_rate': 1.3642742544911874e-05, 'epoch': 0.77} {'loss': 0.9205, 'learning_rate': 1.3642437683188828e-05, 'epoch': 0.77} {'loss': 0.775, 'learning_rate': 1.3642132817562584e-05, 'epoch': 0.77} {'loss': 0.8296, 'learning_rate': 1.3641827948033462e-05, 'epoch': 0.77} {'loss': 0.6487, 'learning_rate': 1.3641523074601793e-05, 'epoch': 0.77} {'loss': 0.8325, 'learning_rate': 1.3641218197267902e-05, 'epoch': 0.77} {'loss': 0.9696, 'learning_rate': 1.364091331603212e-05, 'epoch': 0.77} {'loss': 0.8445, 'learning_rate': 1.364060843089477e-05, 'epoch': 0.77} {'loss': 0.8892, 'learning_rate': 1.3640303541856179e-05, 'epoch': 0.77} {'loss': 0.7795, 'learning_rate': 1.3639998648916675e-05, 'epoch': 0.77} {'loss': 0.6338, 'learning_rate': 1.3639693752076583e-05, 'epoch': 0.77} {'loss': 0.6808, 'learning_rate': 1.3639388851336231e-05, 'epoch': 0.77} {'loss': 0.7448, 'learning_rate': 1.3639083946695948e-05, 'epoch': 0.77} {'loss': 0.6993, 'learning_rate': 1.3638779038156054e-05, 'epoch': 0.77} {'loss': 0.8469, 'learning_rate': 1.3638474125716881e-05, 'epoch': 0.77} {'loss': 0.8938, 'learning_rate': 1.3638169209378758e-05, 'epoch': 0.77} {'loss': 0.6243, 'learning_rate': 1.3637864289142005e-05, 'epoch': 0.77} {'loss': 0.8205, 'learning_rate': 1.3637559365006952e-05, 'epoch': 0.77} {'loss': 0.7719, 'learning_rate': 1.3637254436973923e-05, 'epoch': 0.77} {'loss': 0.7337, 'learning_rate': 1.3636949505043253e-05, 'epoch': 0.77} {'loss': 0.8701, 'learning_rate': 1.3636644569215261e-05, 'epoch': 0.77} {'loss': 1.0198, 'learning_rate': 1.3636339629490279e-05, 'epoch': 0.77} {'loss': 1.0574, 'learning_rate': 1.3636034685868626e-05, 'epoch': 0.77} {'loss': 0.7208, 'learning_rate': 1.3635729738350636e-05, 'epoch': 0.77} {'loss': 0.6796, 'learning_rate': 1.3635424786936633e-05, 'epoch': 0.77} {'loss': 0.9608, 'learning_rate': 1.3635119831626944e-05, 'epoch': 0.77} {'loss': 0.8362, 'learning_rate': 1.3634814872421898e-05, 'epoch': 0.77} {'loss': 0.7296, 'learning_rate': 1.3634509909321817e-05, 'epoch': 0.77} {'loss': 0.7925, 'learning_rate': 1.3634204942327034e-05, 'epoch': 0.77} {'loss': 0.8221, 'learning_rate': 1.363389997143787e-05, 'epoch': 0.77} {'loss': 0.8503, 'learning_rate': 1.3633594996654653e-05, 'epoch': 0.77} {'loss': 0.7316, 'learning_rate': 1.3633290017977712e-05, 'epoch': 0.77} {'loss': 0.7912, 'learning_rate': 1.3632985035407372e-05, 'epoch': 0.77} {'loss': 0.9428, 'learning_rate': 1.3632680048943962e-05, 'epoch': 0.77} {'loss': 0.7553, 'learning_rate': 1.363237505858781e-05, 'epoch': 0.77} {'loss': 0.9411, 'learning_rate': 1.3632070064339238e-05, 'epoch': 0.77} {'loss': 0.9091, 'learning_rate': 1.3631765066198574e-05, 'epoch': 0.77} {'loss': 0.6761, 'learning_rate': 1.3631460064166146e-05, 'epoch': 0.77} {'loss': 0.828, 'learning_rate': 1.363115505824228e-05, 'epoch': 0.77} {'loss': 0.7496, 'learning_rate': 1.3630850048427306e-05, 'epoch': 0.77} {'loss': 0.742, 'learning_rate': 1.363054503472155e-05, 'epoch': 0.77} {'loss': 0.7861, 'learning_rate': 1.3630240017125336e-05, 'epoch': 0.77} {'loss': 0.7082, 'learning_rate': 1.3629934995638989e-05, 'epoch': 0.77} {'loss': 0.8099, 'learning_rate': 1.3629629970262841e-05, 'epoch': 0.77} {'loss': 0.8336, 'learning_rate': 1.3629324940997216e-05, 'epoch': 0.77} {'loss': 0.6583, 'learning_rate': 1.3629019907842445e-05, 'epoch': 0.77} {'loss': 0.9261, 'learning_rate': 1.3628714870798849e-05, 'epoch': 0.77} {'loss': 0.9233, 'learning_rate': 1.3628409829866758e-05, 'epoch': 0.77} {'loss': 0.8902, 'learning_rate': 1.3628104785046499e-05, 'epoch': 0.77} {'loss': 0.6651, 'learning_rate': 1.3627799736338397e-05, 'epoch': 0.77} {'loss': 0.6959, 'learning_rate': 1.362749468374278e-05, 'epoch': 0.77} {'loss': 0.9274, 'learning_rate': 1.3627189627259975e-05, 'epoch': 0.77} {'loss': 0.8058, 'learning_rate': 1.3626884566890311e-05, 'epoch': 0.77} {'loss': 0.9141, 'learning_rate': 1.3626579502634111e-05, 'epoch': 0.77} {'loss': 0.7631, 'learning_rate': 1.3626274434491706e-05, 'epoch': 0.77} {'loss': 0.7473, 'learning_rate': 1.3625969362463418e-05, 'epoch': 0.77} {'loss': 0.7667, 'learning_rate': 1.3625664286549578e-05, 'epoch': 0.77} {'loss': 0.788, 'learning_rate': 1.362535920675051e-05, 'epoch': 0.77} {'loss': 0.9621, 'learning_rate': 1.3625054123066544e-05, 'epoch': 0.77} {'loss': 0.802, 'learning_rate': 1.3624749035498007e-05, 'epoch': 0.77} {'loss': 0.7736, 'learning_rate': 1.362444394404522e-05, 'epoch': 0.77} {'loss': 0.6828, 'learning_rate': 1.3624138848708517e-05, 'epoch': 0.77} {'loss': 0.6562, 'learning_rate': 1.3623833749488222e-05, 'epoch': 0.77} {'loss': 0.8502, 'learning_rate': 1.362352864638466e-05, 'epoch': 0.77} {'loss': 0.8834, 'learning_rate': 1.362322353939816e-05, 'epoch': 0.77} {'loss': 0.7057, 'learning_rate': 1.3622918428529053e-05, 'epoch': 0.77} {'loss': 0.7052, 'learning_rate': 1.362261331377766e-05, 'epoch': 0.77} {'loss': 0.9038, 'learning_rate': 1.3622308195144307e-05, 'epoch': 0.77} {'loss': 0.9248, 'learning_rate': 1.3622003072629325e-05, 'epoch': 0.77} {'loss': 0.7521, 'learning_rate': 1.3621697946233044e-05, 'epoch': 0.77} {'loss': 0.9039, 'learning_rate': 1.362139281595578e-05, 'epoch': 0.77} {'loss': 0.9359, 'learning_rate': 1.3621087681797872e-05, 'epoch': 0.77} {'loss': 0.8806, 'learning_rate': 1.362078254375964e-05, 'epoch': 0.77} {'loss': 0.8193, 'learning_rate': 1.3620477401841412e-05, 'epoch': 0.77} {'loss': 0.7426, 'learning_rate': 1.3620172256043515e-05, 'epoch': 0.77} {'loss': 0.8899, 'learning_rate': 1.3619867106366282e-05, 'epoch': 0.77} {'loss': 0.8251, 'learning_rate': 1.361956195281003e-05, 'epoch': 0.77} {'loss': 0.7912, 'learning_rate': 1.3619256795375091e-05, 'epoch': 0.77} {'loss': 0.7214, 'learning_rate': 1.3618951634061794e-05, 'epoch': 0.77} {'loss': 0.7132, 'learning_rate': 1.361864646887046e-05, 'epoch': 0.77} {'loss': 0.6083, 'learning_rate': 1.3618341299801422e-05, 'epoch': 0.77} {'loss': 0.6736, 'learning_rate': 1.3618036126855003e-05, 'epoch': 0.77} {'loss': 0.8171, 'learning_rate': 1.3617730950031534e-05, 'epoch': 0.77} {'loss': 0.6826, 'learning_rate': 1.3617425769331338e-05, 'epoch': 0.77} {'loss': 0.7885, 'learning_rate': 1.3617120584754747e-05, 'epoch': 0.77} {'loss': 0.7635, 'learning_rate': 1.3616815396302082e-05, 'epoch': 0.77} {'loss': 0.5538, 'learning_rate': 1.3616510203973672e-05, 'epoch': 0.77} {'loss': 0.9491, 'learning_rate': 1.3616205007769847e-05, 'epoch': 0.77} {'loss': 0.9249, 'learning_rate': 1.3615899807690932e-05, 'epoch': 0.77} {'loss': 0.9958, 'learning_rate': 1.3615594603737252e-05, 'epoch': 0.77} {'loss': 0.8781, 'learning_rate': 1.3615289395909139e-05, 'epoch': 0.77} {'loss': 0.676, 'learning_rate': 1.3614984184206914e-05, 'epoch': 0.77} {'loss': 0.7898, 'learning_rate': 1.3614678968630908e-05, 'epoch': 0.77} {'loss': 0.8548, 'learning_rate': 1.3614373749181447e-05, 'epoch': 0.77} {'loss': 0.8033, 'learning_rate': 1.3614068525858858e-05, 'epoch': 0.77} {'loss': 0.9548, 'learning_rate': 1.3613763298663472e-05, 'epoch': 0.77} {'loss': 0.7256, 'learning_rate': 1.3613458067595609e-05, 'epoch': 0.77} {'loss': 0.6597, 'learning_rate': 1.3613152832655602e-05, 'epoch': 0.77} {'loss': 0.8282, 'learning_rate': 1.3612847593843774e-05, 'epoch': 0.77} {'loss': 0.8251, 'learning_rate': 1.3612542351160451e-05, 'epoch': 0.77} {'loss': 0.883, 'learning_rate': 1.3612237104605965e-05, 'epoch': 0.77} {'loss': 0.7657, 'learning_rate': 1.3611931854180642e-05, 'epoch': 0.77} {'loss': 0.9024, 'learning_rate': 1.3611626599884811e-05, 'epoch': 0.77} {'loss': 0.9135, 'learning_rate': 1.3611321341718792e-05, 'epoch': 0.77} {'loss': 0.6738, 'learning_rate': 1.3611016079682918e-05, 'epoch': 0.77} {'loss': 0.8177, 'learning_rate': 1.3610710813777513e-05, 'epoch': 0.77} {'loss': 0.7113, 'learning_rate': 1.3610405544002902e-05, 'epoch': 0.77} {'loss': 0.6832, 'learning_rate': 1.361010027035942e-05, 'epoch': 0.77} {'loss': 0.7341, 'learning_rate': 1.3609794992847389e-05, 'epoch': 0.77} {'loss': 0.6741, 'learning_rate': 1.3609489711467139e-05, 'epoch': 0.77} {'loss': 0.7541, 'learning_rate': 1.3609184426218993e-05, 'epoch': 0.77} {'loss': 0.9094, 'learning_rate': 1.3608879137103279e-05, 'epoch': 0.77} {'loss': 0.6891, 'learning_rate': 1.3608573844120328e-05, 'epoch': 0.77} {'loss': 0.8296, 'learning_rate': 1.360826854727046e-05, 'epoch': 0.77} {'loss': 0.7324, 'learning_rate': 1.360796324655401e-05, 'epoch': 0.77} {'loss': 0.875, 'learning_rate': 1.3607657941971301e-05, 'epoch': 0.77} {'loss': 0.7037, 'learning_rate': 1.3607352633522663e-05, 'epoch': 0.77} {'loss': 0.7548, 'learning_rate': 1.360704732120842e-05, 'epoch': 0.77} {'loss': 0.9267, 'learning_rate': 1.3606742005028899e-05, 'epoch': 0.77} {'loss': 0.7247, 'learning_rate': 1.3606436684984427e-05, 'epoch': 0.77} {'loss': 0.9466, 'learning_rate': 1.3606131361075334e-05, 'epoch': 0.77} {'loss': 0.8453, 'learning_rate': 1.3605826033301946e-05, 'epoch': 0.77} {'loss': 0.9051, 'learning_rate': 1.3605520701664592e-05, 'epoch': 0.77} {'loss': 0.8677, 'learning_rate': 1.3605215366163594e-05, 'epoch': 0.77} {'loss': 0.7837, 'learning_rate': 1.3604910026799285e-05, 'epoch': 0.77} {'loss': 0.7735, 'learning_rate': 1.3604604683571986e-05, 'epoch': 0.77} {'loss': 0.688, 'learning_rate': 1.3604299336482033e-05, 'epoch': 0.77} {'loss': 1.0343, 'learning_rate': 1.3603993985529742e-05, 'epoch': 0.77} {'loss': 1.0056, 'learning_rate': 1.3603688630715451e-05, 'epoch': 0.77} {'loss': 0.8453, 'learning_rate': 1.3603383272039479e-05, 'epoch': 0.77} {'loss': 0.8139, 'learning_rate': 1.360307790950216e-05, 'epoch': 0.77} {'loss': 0.7607, 'learning_rate': 1.3602772543103815e-05, 'epoch': 0.77} {'loss': 0.8522, 'learning_rate': 1.3602467172844773e-05, 'epoch': 0.77} {'loss': 0.7898, 'learning_rate': 1.3602161798725364e-05, 'epoch': 0.77} {'loss': 0.6253, 'learning_rate': 1.3601856420745916e-05, 'epoch': 0.77} {'loss': 0.7798, 'learning_rate': 1.360155103890675e-05, 'epoch': 0.77} {'loss': 0.8253, 'learning_rate': 1.36012456532082e-05, 'epoch': 0.77} {'loss': 0.7353, 'learning_rate': 1.3600940263650589e-05, 'epoch': 0.77} {'loss': 0.7895, 'learning_rate': 1.3600634870234243e-05, 'epoch': 0.77} {'loss': 0.7975, 'learning_rate': 1.3600329472959493e-05, 'epoch': 0.77} {'loss': 0.7017, 'learning_rate': 1.3600024071826665e-05, 'epoch': 0.77} {'loss': 0.775, 'learning_rate': 1.359971866683609e-05, 'epoch': 0.77} {'loss': 0.7848, 'learning_rate': 1.3599413257988088e-05, 'epoch': 0.77} {'loss': 0.8162, 'learning_rate': 1.359910784528299e-05, 'epoch': 0.77} {'loss': 0.9028, 'learning_rate': 1.3598802428721125e-05, 'epoch': 0.77} {'loss': 0.7279, 'learning_rate': 1.3598497008302816e-05, 'epoch': 0.77} {'loss': 0.7492, 'learning_rate': 1.3598191584028392e-05, 'epoch': 0.77} {'loss': 1.0392, 'learning_rate': 1.3597886155898185e-05, 'epoch': 0.77} {'loss': 0.9073, 'learning_rate': 1.3597580723912516e-05, 'epoch': 0.77} {'loss': 0.9341, 'learning_rate': 1.3597275288071714e-05, 'epoch': 0.77} {'loss': 0.9433, 'learning_rate': 1.3596969848376107e-05, 'epoch': 0.77} {'loss': 0.7708, 'learning_rate': 1.3596664404826024e-05, 'epoch': 0.77} {'loss': 0.842, 'learning_rate': 1.3596358957421787e-05, 'epoch': 0.77} {'loss': 0.8328, 'learning_rate': 1.3596053506163731e-05, 'epoch': 0.77} {'loss': 0.7279, 'learning_rate': 1.3595748051052176e-05, 'epoch': 0.77} {'loss': 0.746, 'learning_rate': 1.3595442592087453e-05, 'epoch': 0.77} {'loss': 0.8885, 'learning_rate': 1.3595137129269888e-05, 'epoch': 0.77} {'loss': 0.9299, 'learning_rate': 1.359483166259981e-05, 'epoch': 0.77} {'loss': 0.8914, 'learning_rate': 1.3594526192077546e-05, 'epoch': 0.77} {'loss': 0.7089, 'learning_rate': 1.3594220717703424e-05, 'epoch': 0.77} {'loss': 0.8592, 'learning_rate': 1.359391523947777e-05, 'epoch': 0.77} {'loss': 0.8097, 'learning_rate': 1.3593609757400908e-05, 'epoch': 0.77} {'loss': 0.665, 'learning_rate': 1.3593304271473172e-05, 'epoch': 0.77} {'loss': 0.8649, 'learning_rate': 1.3592998781694884e-05, 'epoch': 0.77} {'loss': 0.9299, 'learning_rate': 1.3592693288066375e-05, 'epoch': 0.77} {'loss': 0.7839, 'learning_rate': 1.359238779058797e-05, 'epoch': 0.77} {'loss': 0.7732, 'learning_rate': 1.3592082289259999e-05, 'epoch': 0.77} {'loss': 0.8016, 'learning_rate': 1.3591776784082784e-05, 'epoch': 0.77} {'loss': 0.9205, 'learning_rate': 1.3591471275056658e-05, 'epoch': 0.77} {'loss': 0.9323, 'learning_rate': 1.3591165762181946e-05, 'epoch': 0.77} {'loss': 0.8993, 'learning_rate': 1.3590860245458975e-05, 'epoch': 0.77} {'loss': 0.7866, 'learning_rate': 1.3590554724888076e-05, 'epoch': 0.77} {'loss': 0.7188, 'learning_rate': 1.3590249200469571e-05, 'epoch': 0.77} {'loss': 0.9268, 'learning_rate': 1.3589943672203793e-05, 'epoch': 0.77} {'loss': 0.9612, 'learning_rate': 1.3589638140091064e-05, 'epoch': 0.77} {'loss': 0.8918, 'learning_rate': 1.3589332604131713e-05, 'epoch': 0.77} {'loss': 0.826, 'learning_rate': 1.3589027064326068e-05, 'epoch': 0.77} {'loss': 0.7342, 'learning_rate': 1.3588721520674458e-05, 'epoch': 0.77} {'loss': 0.9259, 'learning_rate': 1.358841597317721e-05, 'epoch': 0.77} {'loss': 0.8295, 'learning_rate': 1.3588110421834651e-05, 'epoch': 0.77} {'loss': 0.8974, 'learning_rate': 1.3587804866647105e-05, 'epoch': 0.77} {'loss': 0.6825, 'learning_rate': 1.3587499307614903e-05, 'epoch': 0.77} {'loss': 0.8827, 'learning_rate': 1.3587193744738372e-05, 'epoch': 0.77} {'loss': 0.8146, 'learning_rate': 1.3586888178017836e-05, 'epoch': 0.77} {'loss': 0.6759, 'learning_rate': 1.3586582607453629e-05, 'epoch': 0.77} {'loss': 0.8359, 'learning_rate': 1.3586277033046075e-05, 'epoch': 0.77} {'loss': 0.7926, 'learning_rate': 1.3585971454795504e-05, 'epoch': 0.77} {'loss': 0.5981, 'learning_rate': 1.3585665872702239e-05, 'epoch': 0.77} {'loss': 0.8635, 'learning_rate': 1.3585360286766607e-05, 'epoch': 0.77} {'loss': 0.8917, 'learning_rate': 1.3585054696988937e-05, 'epoch': 0.77} {'loss': 0.6363, 'learning_rate': 1.358474910336956e-05, 'epoch': 0.77} {'loss': 0.8041, 'learning_rate': 1.3584443505908802e-05, 'epoch': 0.77} {'loss': 0.7296, 'learning_rate': 1.3584137904606987e-05, 'epoch': 0.77} {'loss': 0.8339, 'learning_rate': 1.3583832299464446e-05, 'epoch': 0.77} {'loss': 0.6878, 'learning_rate': 1.3583526690481503e-05, 'epoch': 0.77} {'loss': 0.7445, 'learning_rate': 1.3583221077658491e-05, 'epoch': 0.77} {'loss': 0.9133, 'learning_rate': 1.3582915460995731e-05, 'epoch': 0.77} {'loss': 0.8228, 'learning_rate': 1.3582609840493557e-05, 'epoch': 0.77} {'loss': 0.6893, 'learning_rate': 1.3582304216152291e-05, 'epoch': 0.77} {'loss': 0.8581, 'learning_rate': 1.3581998587972263e-05, 'epoch': 0.77} {'loss': 0.8729, 'learning_rate': 1.35816929559538e-05, 'epoch': 0.77} {'loss': 0.8161, 'learning_rate': 1.358138732009723e-05, 'epoch': 0.77} {'loss': 0.8251, 'learning_rate': 1.3581081680402882e-05, 'epoch': 0.77} {'loss': 1.0156, 'learning_rate': 1.3580776036871078e-05, 'epoch': 0.77} {'loss': 0.8153, 'learning_rate': 1.3580470389502154e-05, 'epoch': 0.77} {'loss': 0.7158, 'learning_rate': 1.3580164738296428e-05, 'epoch': 0.77} {'loss': 0.7556, 'learning_rate': 1.3579859083254235e-05, 'epoch': 0.77} {'loss': 0.852, 'learning_rate': 1.35795534243759e-05, 'epoch': 0.77} {'loss': 0.7016, 'learning_rate': 1.357924776166175e-05, 'epoch': 0.77} {'loss': 0.8609, 'learning_rate': 1.3578942095112113e-05, 'epoch': 0.77} {'loss': 0.7177, 'learning_rate': 1.3578636424727317e-05, 'epoch': 0.77} {'loss': 0.825, 'learning_rate': 1.3578330750507689e-05, 'epoch': 0.77} {'loss': 0.7129, 'learning_rate': 1.3578025072453556e-05, 'epoch': 0.77} {'loss': 0.7198, 'learning_rate': 1.3577719390565248e-05, 'epoch': 0.77} {'loss': 0.8271, 'learning_rate': 1.3577413704843087e-05, 'epoch': 0.77} {'loss': 0.7684, 'learning_rate': 1.3577108015287406e-05, 'epoch': 0.77} {'loss': 0.6788, 'learning_rate': 1.3576802321898533e-05, 'epoch': 0.77} {'loss': 0.8822, 'learning_rate': 1.3576496624676792e-05, 'epoch': 0.77} {'loss': 0.8701, 'learning_rate': 1.357619092362251e-05, 'epoch': 0.77} {'loss': 0.8401, 'learning_rate': 1.3575885218736019e-05, 'epoch': 0.77} {'loss': 0.8388, 'learning_rate': 1.3575579510017645e-05, 'epoch': 0.77} {'loss': 0.6561, 'learning_rate': 1.3575273797467711e-05, 'epoch': 0.77} {'loss': 0.786, 'learning_rate': 1.3574968081086554e-05, 'epoch': 0.77} {'loss': 0.8802, 'learning_rate': 1.3574662360874493e-05, 'epoch': 0.77} {'loss': 0.8055, 'learning_rate': 1.3574356636831858e-05, 'epoch': 0.77} {'loss': 0.6612, 'learning_rate': 1.3574050908958978e-05, 'epoch': 0.77} {'loss': 0.9114, 'learning_rate': 1.357374517725618e-05, 'epoch': 0.77} {'loss': 0.7695, 'learning_rate': 1.3573439441723792e-05, 'epoch': 0.77} {'loss': 0.7164, 'learning_rate': 1.357313370236214e-05, 'epoch': 0.77} {'loss': 0.8016, 'learning_rate': 1.3572827959171555e-05, 'epoch': 0.77} {'loss': 0.6965, 'learning_rate': 1.3572522212152359e-05, 'epoch': 0.77} {'loss': 0.7663, 'learning_rate': 1.3572216461304884e-05, 'epoch': 0.77} {'loss': 0.7728, 'learning_rate': 1.3571910706629456e-05, 'epoch': 0.77} {'loss': 0.8644, 'learning_rate': 1.3571604948126404e-05, 'epoch': 0.77} {'loss': 0.8673, 'learning_rate': 1.357129918579606e-05, 'epoch': 0.77} {'loss': 0.7283, 'learning_rate': 1.357099341963874e-05, 'epoch': 0.77} {'loss': 0.8093, 'learning_rate': 1.3570687649654782e-05, 'epoch': 0.77} {'loss': 0.793, 'learning_rate': 1.3570381875844506e-05, 'epoch': 0.77} {'loss': 0.8437, 'learning_rate': 1.3570076098208248e-05, 'epoch': 0.77} {'loss': 0.7955, 'learning_rate': 1.3569770316746327e-05, 'epoch': 0.77} {'loss': 0.7627, 'learning_rate': 1.3569464531459075e-05, 'epoch': 0.77} {'loss': 0.6477, 'learning_rate': 1.3569158742346825e-05, 'epoch': 0.77} {'loss': 0.9448, 'learning_rate': 1.3568852949409896e-05, 'epoch': 0.77} {'loss': 0.7837, 'learning_rate': 1.356854715264862e-05, 'epoch': 0.77} {'loss': 0.9546, 'learning_rate': 1.356824135206332e-05, 'epoch': 0.77} {'loss': 0.7155, 'learning_rate': 1.356793554765433e-05, 'epoch': 0.77} {'loss': 1.0011, 'learning_rate': 1.3567629739421975e-05, 'epoch': 0.77} {'loss': 0.7576, 'learning_rate': 1.3567323927366583e-05, 'epoch': 0.77} {'loss': 0.6752, 'learning_rate': 1.356701811148848e-05, 'epoch': 0.77} {'loss': 0.8805, 'learning_rate': 1.3566712291787998e-05, 'epoch': 0.77} {'loss': 0.938, 'learning_rate': 1.3566406468265459e-05, 'epoch': 0.77} {'loss': 0.839, 'learning_rate': 1.3566100640921195e-05, 'epoch': 0.77} {'loss': 0.8587, 'learning_rate': 1.356579480975553e-05, 'epoch': 0.77} {'loss': 0.7887, 'learning_rate': 1.3565488974768797e-05, 'epoch': 0.77} {'loss': 0.6769, 'learning_rate': 1.3565183135961321e-05, 'epoch': 0.77} {'loss': 0.7043, 'learning_rate': 1.3564877293333429e-05, 'epoch': 0.77} {'loss': 0.7308, 'learning_rate': 1.3564571446885448e-05, 'epoch': 0.77} {'loss': 0.8694, 'learning_rate': 1.3564265596617706e-05, 'epoch': 0.77} {'loss': 0.8624, 'learning_rate': 1.3563959742530532e-05, 'epoch': 0.77} {'loss': 0.8227, 'learning_rate': 1.3563653884624254e-05, 'epoch': 0.77} {'loss': 0.8586, 'learning_rate': 1.3563348022899203e-05, 'epoch': 0.77} {'loss': 0.7793, 'learning_rate': 1.35630421573557e-05, 'epoch': 0.77} {'loss': 0.8021, 'learning_rate': 1.3562736287994077e-05, 'epoch': 0.77} {'loss': 0.7772, 'learning_rate': 1.3562430414814658e-05, 'epoch': 0.77} {'loss': 0.8836, 'learning_rate': 1.3562124537817774e-05, 'epoch': 0.77} {'loss': 1.0116, 'learning_rate': 1.3561818657003752e-05, 'epoch': 0.77} {'loss': 0.8339, 'learning_rate': 1.3561512772372917e-05, 'epoch': 0.77} {'loss': 0.7568, 'learning_rate': 1.3561206883925606e-05, 'epoch': 0.77} {'loss': 0.7202, 'learning_rate': 1.3560900991662137e-05, 'epoch': 0.77} {'loss': 0.8567, 'learning_rate': 1.3560595095582843e-05, 'epoch': 0.77} {'loss': 0.8345, 'learning_rate': 1.3560289195688046e-05, 'epoch': 0.77} {'loss': 0.6862, 'learning_rate': 1.355998329197808e-05, 'epoch': 0.77} {'loss': 0.6311, 'learning_rate': 1.3559677384453271e-05, 'epoch': 0.77} {'loss': 0.7191, 'learning_rate': 1.3559371473113947e-05, 'epoch': 0.77} {'loss': 0.8383, 'learning_rate': 1.3559065557960434e-05, 'epoch': 0.77} {'loss': 0.7492, 'learning_rate': 1.355875963899306e-05, 'epoch': 0.77} {'loss': 0.82, 'learning_rate': 1.3558453716212156e-05, 'epoch': 0.77} {'loss': 0.824, 'learning_rate': 1.3558147789618047e-05, 'epoch': 0.77} {'loss': 0.9194, 'learning_rate': 1.3557841859211063e-05, 'epoch': 0.77} {'loss': 0.942, 'learning_rate': 1.355753592499153e-05, 'epoch': 0.77} {'loss': 0.693, 'learning_rate': 1.3557229986959772e-05, 'epoch': 0.77} {'loss': 0.8147, 'learning_rate': 1.3556924045116124e-05, 'epoch': 0.77} {'loss': 0.7246, 'learning_rate': 1.3556618099460912e-05, 'epoch': 0.77} {'loss': 0.7794, 'learning_rate': 1.3556312149994462e-05, 'epoch': 0.77} {'loss': 0.8451, 'learning_rate': 1.3556006196717102e-05, 'epoch': 0.77} {'loss': 0.736, 'learning_rate': 1.3555700239629161e-05, 'epoch': 0.77} {'loss': 0.7972, 'learning_rate': 1.3555394278730966e-05, 'epoch': 0.77} {'loss': 0.8565, 'learning_rate': 1.3555088314022844e-05, 'epoch': 0.77} {'loss': 0.6663, 'learning_rate': 1.3554782345505124e-05, 'epoch': 0.77} {'loss': 0.8228, 'learning_rate': 1.3554476373178135e-05, 'epoch': 0.77} {'loss': 0.895, 'learning_rate': 1.3554170397042206e-05, 'epoch': 0.77} {'loss': 0.8397, 'learning_rate': 1.355386441709766e-05, 'epoch': 0.77} {'loss': 0.7752, 'learning_rate': 1.3553558433344826e-05, 'epoch': 0.77} {'loss': 0.803, 'learning_rate': 1.3553252445784035e-05, 'epoch': 0.77} {'loss': 0.7915, 'learning_rate': 1.3552946454415615e-05, 'epoch': 0.77} {'loss': 0.6435, 'learning_rate': 1.3552640459239887e-05, 'epoch': 0.77} {'loss': 0.7801, 'learning_rate': 1.355233446025719e-05, 'epoch': 0.77} {'loss': 1.0158, 'learning_rate': 1.3552028457467844e-05, 'epoch': 0.77} {'loss': 0.8733, 'learning_rate': 1.355172245087218e-05, 'epoch': 0.77} {'loss': 0.7377, 'learning_rate': 1.3551416440470523e-05, 'epoch': 0.77} {'loss': 0.8195, 'learning_rate': 1.3551110426263204e-05, 'epoch': 0.77} {'loss': 0.9021, 'learning_rate': 1.3550804408250546e-05, 'epoch': 0.77} {'loss': 0.7315, 'learning_rate': 1.3550498386432885e-05, 'epoch': 0.77} {'loss': 0.8616, 'learning_rate': 1.3550192360810544e-05, 'epoch': 0.77} {'loss': 0.8164, 'learning_rate': 1.354988633138385e-05, 'epoch': 0.77} {'loss': 0.7765, 'learning_rate': 1.3549580298153133e-05, 'epoch': 0.77} {'loss': 0.9137, 'learning_rate': 1.354927426111872e-05, 'epoch': 0.77} {'loss': 0.8439, 'learning_rate': 1.3548968220280938e-05, 'epoch': 0.77} {'loss': 0.7406, 'learning_rate': 1.3548662175640117e-05, 'epoch': 0.77} {'loss': 0.8235, 'learning_rate': 1.3548356127196587e-05, 'epoch': 0.77} {'loss': 0.7601, 'learning_rate': 1.3548050074950672e-05, 'epoch': 0.77} {'loss': 0.8846, 'learning_rate': 1.35477440189027e-05, 'epoch': 0.77} {'loss': 0.7905, 'learning_rate': 1.3547437959053e-05, 'epoch': 0.77} {'loss': 0.7791, 'learning_rate': 1.3547131895401902e-05, 'epoch': 0.77} {'loss': 0.8185, 'learning_rate': 1.3546825827949727e-05, 'epoch': 0.77} {'loss': 0.9048, 'learning_rate': 1.3546519756696812e-05, 'epoch': 0.77} {'loss': 0.7196, 'learning_rate': 1.3546213681643479e-05, 'epoch': 0.77} {'loss': 0.6891, 'learning_rate': 1.3545907602790061e-05, 'epoch': 0.77} {'loss': 0.8066, 'learning_rate': 1.3545601520136882e-05, 'epoch': 0.77} {'loss': 0.8776, 'learning_rate': 1.3545295433684271e-05, 'epoch': 0.77} {'loss': 0.8405, 'learning_rate': 1.3544989343432553e-05, 'epoch': 0.77} {'loss': 0.8235, 'learning_rate': 1.3544683249382062e-05, 'epoch': 0.77} {'loss': 0.6838, 'learning_rate': 1.3544377151533121e-05, 'epoch': 0.77} {'loss': 0.7169, 'learning_rate': 1.3544071049886063e-05, 'epoch': 0.77} {'loss': 0.7341, 'learning_rate': 1.3543764944441212e-05, 'epoch': 0.77} {'loss': 0.8361, 'learning_rate': 1.3543458835198898e-05, 'epoch': 0.77} {'loss': 0.8659, 'learning_rate': 1.3543152722159443e-05, 'epoch': 0.77} {'loss': 0.8153, 'learning_rate': 1.3542846605323183e-05, 'epoch': 0.77} {'loss': 0.5989, 'learning_rate': 1.3542540484690442e-05, 'epoch': 0.77} {'loss': 0.9017, 'learning_rate': 1.3542234360261553e-05, 'epoch': 0.77} {'loss': 0.7628, 'learning_rate': 1.3541928232036839e-05, 'epoch': 0.77} {'loss': 0.8338, 'learning_rate': 1.3541622100016627e-05, 'epoch': 0.77} {'loss': 0.7732, 'learning_rate': 1.3541315964201248e-05, 'epoch': 0.77} {'loss': 0.7617, 'learning_rate': 1.3541009824591029e-05, 'epoch': 0.77} {'loss': 0.7066, 'learning_rate': 1.3540703681186297e-05, 'epoch': 0.77} {'loss': 0.9311, 'learning_rate': 1.3540397533987383e-05, 'epoch': 0.77} {'loss': 0.6234, 'learning_rate': 1.3540091382994615e-05, 'epoch': 0.77} {'loss': 0.6601, 'learning_rate': 1.3539785228208319e-05, 'epoch': 0.77} {'loss': 0.7946, 'learning_rate': 1.3539479069628824e-05, 'epoch': 0.77} {'loss': 0.7474, 'learning_rate': 1.3539172907256457e-05, 'epoch': 0.77} {'loss': 0.6077, 'learning_rate': 1.3538866741091545e-05, 'epoch': 0.77} {'loss': 0.8328, 'learning_rate': 1.353856057113442e-05, 'epoch': 0.77} {'loss': 0.9851, 'learning_rate': 1.3538254397385409e-05, 'epoch': 0.77} {'loss': 1.0494, 'learning_rate': 1.3537948219844836e-05, 'epoch': 0.77} {'loss': 0.9024, 'learning_rate': 1.3537642038513032e-05, 'epoch': 0.77} {'loss': 0.8277, 'learning_rate': 1.353733585339033e-05, 'epoch': 0.77} {'loss': 0.7297, 'learning_rate': 1.3537029664477047e-05, 'epoch': 0.77} {'loss': 0.764, 'learning_rate': 1.3536723471773523e-05, 'epoch': 0.77} {'loss': 0.7892, 'learning_rate': 1.3536417275280078e-05, 'epoch': 0.77} {'loss': 0.8308, 'learning_rate': 1.3536111074997043e-05, 'epoch': 0.77} {'loss': 0.6696, 'learning_rate': 1.3535804870924744e-05, 'epoch': 0.77} {'loss': 0.7304, 'learning_rate': 1.3535498663063512e-05, 'epoch': 0.77} {'loss': 0.7934, 'learning_rate': 1.3535192451413677e-05, 'epoch': 0.77} {'loss': 0.9899, 'learning_rate': 1.3534886235975563e-05, 'epoch': 0.77} {'loss': 0.8351, 'learning_rate': 1.3534580016749497e-05, 'epoch': 0.77} {'loss': 0.7235, 'learning_rate': 1.3534273793735813e-05, 'epoch': 0.77} {'loss': 0.7095, 'learning_rate': 1.3533967566934833e-05, 'epoch': 0.77} {'loss': 0.7726, 'learning_rate': 1.3533661336346889e-05, 'epoch': 0.77} {'loss': 0.7178, 'learning_rate': 1.3533355101972306e-05, 'epoch': 0.77} {'loss': 0.8842, 'learning_rate': 1.3533048863811415e-05, 'epoch': 0.77} {'loss': 0.8904, 'learning_rate': 1.3532742621864542e-05, 'epoch': 0.77} {'loss': 0.9086, 'learning_rate': 1.3532436376132024e-05, 'epoch': 0.77} {'loss': 0.798, 'learning_rate': 1.3532130126614174e-05, 'epoch': 0.77} {'loss': 0.76, 'learning_rate': 1.3531823873311327e-05, 'epoch': 0.77} {'loss': 0.7915, 'learning_rate': 1.3531517616223815e-05, 'epoch': 0.77} {'loss': 0.8425, 'learning_rate': 1.3531211355351963e-05, 'epoch': 0.77} {'loss': 0.7474, 'learning_rate': 1.35309050906961e-05, 'epoch': 0.77} {'loss': 1.0744, 'learning_rate': 1.3530598822256553e-05, 'epoch': 0.77} {'loss': 0.9033, 'learning_rate': 1.353029255003365e-05, 'epoch': 0.77} {'loss': 0.8695, 'learning_rate': 1.352998627402772e-05, 'epoch': 0.77} {'loss': 0.9032, 'learning_rate': 1.3529679994239089e-05, 'epoch': 0.77} {'loss': 0.8482, 'learning_rate': 1.352937371066809e-05, 'epoch': 0.77} {'loss': 0.8787, 'learning_rate': 1.3529067423315048e-05, 'epoch': 0.77} {'loss': 0.7718, 'learning_rate': 1.3528761132180294e-05, 'epoch': 0.77} {'loss': 0.9371, 'learning_rate': 1.352845483726415e-05, 'epoch': 0.77} {'loss': 0.6932, 'learning_rate': 1.352814853856695e-05, 'epoch': 0.77} {'loss': 0.7614, 'learning_rate': 1.3527842236089019e-05, 'epoch': 0.77} {'loss': 0.7952, 'learning_rate': 1.3527535929830688e-05, 'epoch': 0.77} {'loss': 0.7683, 'learning_rate': 1.3527229619792284e-05, 'epoch': 0.77} {'loss': 0.8819, 'learning_rate': 1.3526923305974136e-05, 'epoch': 0.77} {'loss': 0.8532, 'learning_rate': 1.352661698837657e-05, 'epoch': 0.77} {'loss': 0.858, 'learning_rate': 1.3526310666999916e-05, 'epoch': 0.77} {'loss': 0.8366, 'learning_rate': 1.3526004341844501e-05, 'epoch': 0.77} {'loss': 0.8028, 'learning_rate': 1.3525698012910655e-05, 'epoch': 0.77} {'loss': 0.9911, 'learning_rate': 1.3525391680198705e-05, 'epoch': 0.77} {'loss': 0.827, 'learning_rate': 1.352508534370898e-05, 'epoch': 0.77} {'loss': 0.9075, 'learning_rate': 1.3524779003441809e-05, 'epoch': 0.77} {'loss': 0.8143, 'learning_rate': 1.3524472659397518e-05, 'epoch': 0.77} {'loss': 0.6972, 'learning_rate': 1.3524166311576437e-05, 'epoch': 0.77} {'loss': 0.8063, 'learning_rate': 1.3523859959978891e-05, 'epoch': 0.77} {'loss': 0.74, 'learning_rate': 1.3523553604605213e-05, 'epoch': 0.77} {'loss': 0.9712, 'learning_rate': 1.3523247245455728e-05, 'epoch': 0.77} {'loss': 0.9333, 'learning_rate': 1.3522940882530768e-05, 'epoch': 0.77} {'loss': 0.9882, 'learning_rate': 1.3522634515830659e-05, 'epoch': 0.77} {'loss': 0.9079, 'learning_rate': 1.3522328145355727e-05, 'epoch': 0.77} {'loss': 0.6692, 'learning_rate': 1.3522021771106304e-05, 'epoch': 0.77} {'loss': 0.7997, 'learning_rate': 1.3521715393082718e-05, 'epoch': 0.77} {'loss': 0.7694, 'learning_rate': 1.3521409011285291e-05, 'epoch': 0.77} {'loss': 0.8365, 'learning_rate': 1.352110262571436e-05, 'epoch': 0.77} {'loss': 0.861, 'learning_rate': 1.3520796236370251e-05, 'epoch': 0.77} {'loss': 0.7856, 'learning_rate': 1.3520489843253288e-05, 'epoch': 0.77} {'loss': 0.721, 'learning_rate': 1.3520183446363807e-05, 'epoch': 0.77} {'loss': 0.8271, 'learning_rate': 1.3519877045702128e-05, 'epoch': 0.77} {'loss': 0.9244, 'learning_rate': 1.3519570641268583e-05, 'epoch': 0.77} {'loss': 0.9105, 'learning_rate': 1.3519264233063498e-05, 'epoch': 0.77} {'loss': 0.7419, 'learning_rate': 1.3518957821087208e-05, 'epoch': 0.77} {'loss': 0.7848, 'learning_rate': 1.3518651405340037e-05, 'epoch': 0.77} {'loss': 0.7898, 'learning_rate': 1.3518344985822314e-05, 'epoch': 0.77} {'loss': 0.6952, 'learning_rate': 1.3518038562534366e-05, 'epoch': 0.77} {'loss': 0.7884, 'learning_rate': 1.351773213547652e-05, 'epoch': 0.77} {'loss': 0.8467, 'learning_rate': 1.3517425704649108e-05, 'epoch': 0.78} {'loss': 0.7156, 'learning_rate': 1.3517119270052457e-05, 'epoch': 0.78} {'loss': 0.8147, 'learning_rate': 1.3516812831686894e-05, 'epoch': 0.78} {'loss': 0.8628, 'learning_rate': 1.3516506389552748e-05, 'epoch': 0.78} {'loss': 0.7821, 'learning_rate': 1.3516199943650352e-05, 'epoch': 0.78} {'loss': 0.9607, 'learning_rate': 1.3515893493980028e-05, 'epoch': 0.78} {'loss': 0.6773, 'learning_rate': 1.3515587040542106e-05, 'epoch': 0.78} {'loss': 0.9071, 'learning_rate': 1.3515280583336918e-05, 'epoch': 0.78} {'loss': 0.9311, 'learning_rate': 1.3514974122364786e-05, 'epoch': 0.78} {'loss': 0.8046, 'learning_rate': 1.3514667657626044e-05, 'epoch': 0.78} {'loss': 0.9893, 'learning_rate': 1.3514361189121018e-05, 'epoch': 0.78} {'loss': 0.8736, 'learning_rate': 1.3514054716850039e-05, 'epoch': 0.78} {'loss': 0.7239, 'learning_rate': 1.3513748240813429e-05, 'epoch': 0.78} {'loss': 0.8076, 'learning_rate': 1.351344176101152e-05, 'epoch': 0.78} {'loss': 0.7575, 'learning_rate': 1.3513135277444646e-05, 'epoch': 0.78} {'loss': 0.7179, 'learning_rate': 1.3512828790113128e-05, 'epoch': 0.78} {'loss': 0.7386, 'learning_rate': 1.3512522299017296e-05, 'epoch': 0.78} {'loss': 0.8182, 'learning_rate': 1.351221580415748e-05, 'epoch': 0.78} {'loss': 0.6692, 'learning_rate': 1.351190930553401e-05, 'epoch': 0.78} {'loss': 0.6922, 'learning_rate': 1.351160280314721e-05, 'epoch': 0.78} {'loss': 0.8849, 'learning_rate': 1.3511296296997412e-05, 'epoch': 0.78} {'loss': 0.6564, 'learning_rate': 1.3510989787084942e-05, 'epoch': 0.78} {'loss': 0.7372, 'learning_rate': 1.3510683273410127e-05, 'epoch': 0.78} {'loss': 0.8031, 'learning_rate': 1.3510376755973302e-05, 'epoch': 0.78} {'loss': 0.9104, 'learning_rate': 1.3510070234774788e-05, 'epoch': 0.78} {'loss': 0.714, 'learning_rate': 1.3509763709814922e-05, 'epoch': 0.78} {'loss': 0.8242, 'learning_rate': 1.3509457181094025e-05, 'epoch': 0.78} {'loss': 0.8469, 'learning_rate': 1.3509150648612428e-05, 'epoch': 0.78} {'loss': 0.8304, 'learning_rate': 1.3508844112370458e-05, 'epoch': 0.78} {'loss': 0.7648, 'learning_rate': 1.3508537572368446e-05, 'epoch': 0.78} {'loss': 0.7097, 'learning_rate': 1.3508231028606717e-05, 'epoch': 0.78} {'loss': 0.8787, 'learning_rate': 1.3507924481085605e-05, 'epoch': 0.78} {'loss': 0.9429, 'learning_rate': 1.3507617929805435e-05, 'epoch': 0.78} {'loss': 0.6824, 'learning_rate': 1.3507311374766535e-05, 'epoch': 0.78} {'loss': 0.7069, 'learning_rate': 1.3507004815969234e-05, 'epoch': 0.78} {'loss': 0.8056, 'learning_rate': 1.3506698253413859e-05, 'epoch': 0.78} {'loss': 0.6982, 'learning_rate': 1.3506391687100742e-05, 'epoch': 0.78} {'loss': 0.7725, 'learning_rate': 1.350608511703021e-05, 'epoch': 0.78} {'loss': 0.7851, 'learning_rate': 1.3505778543202592e-05, 'epoch': 0.78} {'loss': 0.8665, 'learning_rate': 1.3505471965618216e-05, 'epoch': 0.78} {'loss': 0.8838, 'learning_rate': 1.350516538427741e-05, 'epoch': 0.78} {'loss': 0.8212, 'learning_rate': 1.3504858799180502e-05, 'epoch': 0.78} {'loss': 0.8278, 'learning_rate': 1.3504552210327822e-05, 'epoch': 0.78} {'loss': 0.7579, 'learning_rate': 1.3504245617719698e-05, 'epoch': 0.78} {'loss': 0.6564, 'learning_rate': 1.3503939021356458e-05, 'epoch': 0.78} {'loss': 0.7329, 'learning_rate': 1.3503632421238433e-05, 'epoch': 0.78} {'loss': 0.8034, 'learning_rate': 1.350332581736595e-05, 'epoch': 0.78} {'loss': 0.8213, 'learning_rate': 1.3503019209739337e-05, 'epoch': 0.78} {'loss': 0.7186, 'learning_rate': 1.3502712598358919e-05, 'epoch': 0.78} {'loss': 0.727, 'learning_rate': 1.350240598322503e-05, 'epoch': 0.78} {'loss': 0.8028, 'learning_rate': 1.3502099364337998e-05, 'epoch': 0.78} {'loss': 0.7659, 'learning_rate': 1.3501792741698149e-05, 'epoch': 0.78} {'loss': 0.8463, 'learning_rate': 1.3501486115305815e-05, 'epoch': 0.78} {'loss': 0.9268, 'learning_rate': 1.3501179485161322e-05, 'epoch': 0.78} {'loss': 0.7313, 'learning_rate': 1.3500872851264998e-05, 'epoch': 0.78} {'loss': 0.7806, 'learning_rate': 1.3500566213617174e-05, 'epoch': 0.78} {'loss': 0.9412, 'learning_rate': 1.3500259572218176e-05, 'epoch': 0.78} {'loss': 0.8145, 'learning_rate': 1.3499952927068333e-05, 'epoch': 0.78} {'loss': 0.7824, 'learning_rate': 1.349964627816798e-05, 'epoch': 0.78} {'loss': 0.8929, 'learning_rate': 1.3499339625517436e-05, 'epoch': 0.78} {'loss': 0.6818, 'learning_rate': 1.3499032969117036e-05, 'epoch': 0.78} {'loss': 0.8743, 'learning_rate': 1.3498726308967103e-05, 'epoch': 0.78} {'loss': 0.7917, 'learning_rate': 1.3498419645067971e-05, 'epoch': 0.78} {'loss': 0.753, 'learning_rate': 1.3498112977419964e-05, 'epoch': 0.78} {'loss': 0.8651, 'learning_rate': 1.3497806306023418e-05, 'epoch': 0.78} {'loss': 0.7844, 'learning_rate': 1.3497499630878651e-05, 'epoch': 0.78} {'loss': 0.717, 'learning_rate': 1.3497192951986003e-05, 'epoch': 0.78} {'loss': 0.6419, 'learning_rate': 1.3496886269345794e-05, 'epoch': 0.78} {'loss': 0.6607, 'learning_rate': 1.3496579582958357e-05, 'epoch': 0.78} {'loss': 0.8719, 'learning_rate': 1.3496272892824021e-05, 'epoch': 0.78} {'loss': 0.6802, 'learning_rate': 1.349596619894311e-05, 'epoch': 0.78} {'loss': 0.7229, 'learning_rate': 1.3495659501315958e-05, 'epoch': 0.78} {'loss': 0.8291, 'learning_rate': 1.3495352799942889e-05, 'epoch': 0.78} {'loss': 0.7793, 'learning_rate': 1.3495046094824233e-05, 'epoch': 0.78} {'loss': 0.773, 'learning_rate': 1.3494739385960325e-05, 'epoch': 0.78} {'loss': 1.0323, 'learning_rate': 1.3494432673351482e-05, 'epoch': 0.78} {'loss': 0.7486, 'learning_rate': 1.3494125956998043e-05, 'epoch': 0.78} {'loss': 0.9287, 'learning_rate': 1.3493819236900334e-05, 'epoch': 0.78} {'loss': 0.8022, 'learning_rate': 1.349351251305868e-05, 'epoch': 0.78} {'loss': 0.7714, 'learning_rate': 1.3493205785473412e-05, 'epoch': 0.78} {'loss': 0.8393, 'learning_rate': 1.349289905414486e-05, 'epoch': 0.78} {'loss': 0.881, 'learning_rate': 1.3492592319073347e-05, 'epoch': 0.78} {'loss': 0.8353, 'learning_rate': 1.3492285580259211e-05, 'epoch': 0.78} {'loss': 0.8241, 'learning_rate': 1.3491978837702775e-05, 'epoch': 0.78} {'loss': 0.7134, 'learning_rate': 1.3491672091404367e-05, 'epoch': 0.78} {'loss': 0.6322, 'learning_rate': 1.3491365341364317e-05, 'epoch': 0.78} {'loss': 0.8105, 'learning_rate': 1.3491058587582954e-05, 'epoch': 0.78} {'loss': 0.884, 'learning_rate': 1.3490751830060612e-05, 'epoch': 0.78} {'loss': 0.8765, 'learning_rate': 1.3490445068797607e-05, 'epoch': 0.78} {'loss': 0.7899, 'learning_rate': 1.3490138303794281e-05, 'epoch': 0.78} {'loss': 0.8067, 'learning_rate': 1.348983153505095e-05, 'epoch': 0.78} {'loss': 0.8529, 'learning_rate': 1.3489524762567954e-05, 'epoch': 0.78} {'loss': 0.8603, 'learning_rate': 1.3489217986345616e-05, 'epoch': 0.78} {'loss': 0.8175, 'learning_rate': 1.3488911206384266e-05, 'epoch': 0.78} {'loss': 0.9922, 'learning_rate': 1.3488604422684236e-05, 'epoch': 0.78} {'loss': 0.8022, 'learning_rate': 1.3488297635245848e-05, 'epoch': 0.78} {'loss': 0.8533, 'learning_rate': 1.3487990844069434e-05, 'epoch': 0.78} {'loss': 0.7515, 'learning_rate': 1.3487684049155325e-05, 'epoch': 0.78} {'loss': 0.7696, 'learning_rate': 1.3487377250503846e-05, 'epoch': 0.78} {'loss': 0.937, 'learning_rate': 1.3487070448115326e-05, 'epoch': 0.78} {'loss': 0.8811, 'learning_rate': 1.34867636419901e-05, 'epoch': 0.78} {'loss': 0.741, 'learning_rate': 1.348645683212849e-05, 'epoch': 0.78} {'loss': 0.8852, 'learning_rate': 1.3486150018530827e-05, 'epoch': 0.78} {'loss': 0.8812, 'learning_rate': 1.348584320119744e-05, 'epoch': 0.78} {'loss': 0.9268, 'learning_rate': 1.3485536380128654e-05, 'epoch': 0.78} {'loss': 0.807, 'learning_rate': 1.3485229555324804e-05, 'epoch': 0.78} {'loss': 0.7366, 'learning_rate': 1.3484922726786214e-05, 'epoch': 0.78} {'loss': 0.7712, 'learning_rate': 1.3484615894513215e-05, 'epoch': 0.78} {'loss': 0.7199, 'learning_rate': 1.348430905850614e-05, 'epoch': 0.78} {'loss': 0.8722, 'learning_rate': 1.3484002218765312e-05, 'epoch': 0.78} {'loss': 0.8045, 'learning_rate': 1.348369537529106e-05, 'epoch': 0.78} {'loss': 0.8847, 'learning_rate': 1.3483388528083712e-05, 'epoch': 0.78} {'loss': 0.777, 'learning_rate': 1.34830816771436e-05, 'epoch': 0.78} {'loss': 0.8802, 'learning_rate': 1.348277482247105e-05, 'epoch': 0.78} {'loss': 0.982, 'learning_rate': 1.3482467964066395e-05, 'epoch': 0.78} {'loss': 0.8296, 'learning_rate': 1.348216110192996e-05, 'epoch': 0.78} {'loss': 0.9053, 'learning_rate': 1.3481854236062078e-05, 'epoch': 0.78} {'loss': 0.7392, 'learning_rate': 1.3481547366463072e-05, 'epoch': 0.78} {'loss': 0.884, 'learning_rate': 1.3481240493133275e-05, 'epoch': 0.78} {'loss': 0.7453, 'learning_rate': 1.348093361607301e-05, 'epoch': 0.78} {'loss': 0.7097, 'learning_rate': 1.3480626735282615e-05, 'epoch': 0.78} {'loss': 0.7105, 'learning_rate': 1.3480319850762415e-05, 'epoch': 0.78} {'loss': 0.7858, 'learning_rate': 1.3480012962512738e-05, 'epoch': 0.78} {'loss': 0.7053, 'learning_rate': 1.3479706070533913e-05, 'epoch': 0.78} {'loss': 0.7218, 'learning_rate': 1.3479399174826266e-05, 'epoch': 0.78} {'loss': 0.8242, 'learning_rate': 1.3479092275390131e-05, 'epoch': 0.78} {'loss': 0.7859, 'learning_rate': 1.3478785372225833e-05, 'epoch': 0.78} {'loss': 0.7074, 'learning_rate': 1.3478478465333707e-05, 'epoch': 0.78} {'loss': 0.8511, 'learning_rate': 1.3478171554714072e-05, 'epoch': 0.78} {'loss': 0.7311, 'learning_rate': 1.3477864640367266e-05, 'epoch': 0.78} {'loss': 0.8152, 'learning_rate': 1.3477557722293612e-05, 'epoch': 0.78} {'loss': 0.7274, 'learning_rate': 1.347725080049344e-05, 'epoch': 0.78} {'loss': 0.7616, 'learning_rate': 1.3476943874967081e-05, 'epoch': 0.78} {'loss': 0.8218, 'learning_rate': 1.3476636945714865e-05, 'epoch': 0.78} {'loss': 0.8252, 'learning_rate': 1.3476330012737116e-05, 'epoch': 0.78} {'loss': 0.8675, 'learning_rate': 1.3476023076034166e-05, 'epoch': 0.78} {'loss': 0.7946, 'learning_rate': 1.3475716135606347e-05, 'epoch': 0.78} {'loss': 0.9767, 'learning_rate': 1.347540919145398e-05, 'epoch': 0.78} {'loss': 0.7866, 'learning_rate': 1.3475102243577398e-05, 'epoch': 0.78} {'loss': 0.8662, 'learning_rate': 1.3474795291976934e-05, 'epoch': 0.78} {'loss': 0.8936, 'learning_rate': 1.3474488336652911e-05, 'epoch': 0.78} {'loss': 0.5356, 'learning_rate': 1.347418137760566e-05, 'epoch': 0.78} {'loss': 0.6249, 'learning_rate': 1.3473874414835511e-05, 'epoch': 0.78} {'loss': 0.8629, 'learning_rate': 1.3473567448342793e-05, 'epoch': 0.78} {'loss': 0.9658, 'learning_rate': 1.3473260478127833e-05, 'epoch': 0.78} {'loss': 0.7013, 'learning_rate': 1.347295350419096e-05, 'epoch': 0.78} {'loss': 0.8583, 'learning_rate': 1.3472646526532505e-05, 'epoch': 0.78} {'loss': 0.7269, 'learning_rate': 1.3472339545152795e-05, 'epoch': 0.78} {'loss': 0.8197, 'learning_rate': 1.3472032560052159e-05, 'epoch': 0.78} {'loss': 1.0152, 'learning_rate': 1.3471725571230927e-05, 'epoch': 0.78} {'loss': 0.6596, 'learning_rate': 1.347141857868943e-05, 'epoch': 0.78} {'loss': 0.7728, 'learning_rate': 1.3471111582427993e-05, 'epoch': 0.78} {'loss': 0.769, 'learning_rate': 1.3470804582446949e-05, 'epoch': 0.78} {'loss': 0.9314, 'learning_rate': 1.3470497578746623e-05, 'epoch': 0.78} {'loss': 0.7361, 'learning_rate': 1.3470190571327341e-05, 'epoch': 0.78} {'loss': 0.8026, 'learning_rate': 1.3469883560189442e-05, 'epoch': 0.78} {'loss': 0.8222, 'learning_rate': 1.3469576545333249e-05, 'epoch': 0.78} {'loss': 0.828, 'learning_rate': 1.3469269526759092e-05, 'epoch': 0.78} {'loss': 0.8284, 'learning_rate': 1.3468962504467298e-05, 'epoch': 0.78} {'loss': 0.8093, 'learning_rate': 1.3468655478458199e-05, 'epoch': 0.78} {'loss': 0.8002, 'learning_rate': 1.346834844873212e-05, 'epoch': 0.78} {'loss': 0.7723, 'learning_rate': 1.3468041415289394e-05, 'epoch': 0.78} {'loss': 0.7255, 'learning_rate': 1.3467734378130349e-05, 'epoch': 0.78} {'loss': 0.8564, 'learning_rate': 1.3467427337255314e-05, 'epoch': 0.78} {'loss': 0.8256, 'learning_rate': 1.3467120292664616e-05, 'epoch': 0.78} {'loss': 0.7742, 'learning_rate': 1.346681324435859e-05, 'epoch': 0.78} {'loss': 0.7286, 'learning_rate': 1.3466506192337556e-05, 'epoch': 0.78} {'loss': 0.8519, 'learning_rate': 1.346619913660185e-05, 'epoch': 0.78} {'loss': 0.8494, 'learning_rate': 1.3465892077151797e-05, 'epoch': 0.78} {'loss': 0.6169, 'learning_rate': 1.3465585013987727e-05, 'epoch': 0.78} {'loss': 0.7025, 'learning_rate': 1.3465277947109973e-05, 'epoch': 0.78} {'loss': 0.8482, 'learning_rate': 1.346497087651886e-05, 'epoch': 0.78} {'loss': 0.8787, 'learning_rate': 1.3464663802214718e-05, 'epoch': 0.78} {'loss': 0.9197, 'learning_rate': 1.3464356724197875e-05, 'epoch': 0.78} {'loss': 0.7351, 'learning_rate': 1.3464049642468662e-05, 'epoch': 0.78} {'loss': 0.735, 'learning_rate': 1.3463742557027405e-05, 'epoch': 0.78} {'loss': 0.8901, 'learning_rate': 1.3463435467874437e-05, 'epoch': 0.78} {'loss': 0.7864, 'learning_rate': 1.3463128375010088e-05, 'epoch': 0.78} {'loss': 0.8957, 'learning_rate': 1.3462821278434683e-05, 'epoch': 0.78} {'loss': 0.7486, 'learning_rate': 1.346251417814855e-05, 'epoch': 0.78} {'loss': 0.9708, 'learning_rate': 1.3462207074152023e-05, 'epoch': 0.78} {'loss': 0.8731, 'learning_rate': 1.3461899966445426e-05, 'epoch': 0.78} {'loss': 0.8019, 'learning_rate': 1.346159285502909e-05, 'epoch': 0.78} {'loss': 0.8185, 'learning_rate': 1.346128573990335e-05, 'epoch': 0.78} {'loss': 0.6248, 'learning_rate': 1.3460978621068525e-05, 'epoch': 0.78} {'loss': 0.8071, 'learning_rate': 1.3460671498524953e-05, 'epoch': 0.78} {'loss': 0.8539, 'learning_rate': 1.3460364372272956e-05, 'epoch': 0.78} {'loss': 0.6873, 'learning_rate': 1.346005724231287e-05, 'epoch': 0.78} {'loss': 0.8019, 'learning_rate': 1.3459750108645016e-05, 'epoch': 0.78} {'loss': 0.7632, 'learning_rate': 1.3459442971269728e-05, 'epoch': 0.78} {'loss': 0.789, 'learning_rate': 1.3459135830187338e-05, 'epoch': 0.78} {'loss': 0.9738, 'learning_rate': 1.3458828685398169e-05, 'epoch': 0.78} {'loss': 0.8306, 'learning_rate': 1.3458521536902556e-05, 'epoch': 0.78} {'loss': 0.941, 'learning_rate': 1.345821438470082e-05, 'epoch': 0.78} {'loss': 0.7422, 'learning_rate': 1.3457907228793297e-05, 'epoch': 0.78} {'loss': 0.7251, 'learning_rate': 1.3457600069180315e-05, 'epoch': 0.78} {'loss': 0.8597, 'learning_rate': 1.3457292905862205e-05, 'epoch': 0.78} {'loss': 0.762, 'learning_rate': 1.345698573883929e-05, 'epoch': 0.78} {'loss': 0.8526, 'learning_rate': 1.3456678568111905e-05, 'epoch': 0.78} {'loss': 0.8005, 'learning_rate': 1.3456371393680374e-05, 'epoch': 0.78} {'loss': 0.7564, 'learning_rate': 1.3456064215545031e-05, 'epoch': 0.78} {'loss': 0.8751, 'learning_rate': 1.3455757033706202e-05, 'epoch': 0.78} {'loss': 0.9426, 'learning_rate': 1.3455449848164221e-05, 'epoch': 0.78} {'loss': 0.8339, 'learning_rate': 1.345514265891941e-05, 'epoch': 0.78} {'loss': 0.8904, 'learning_rate': 1.3454835465972102e-05, 'epoch': 0.78} {'loss': 0.9144, 'learning_rate': 1.345452826932263e-05, 'epoch': 0.78} {'loss': 0.7063, 'learning_rate': 1.3454221068971314e-05, 'epoch': 0.78} {'loss': 0.7916, 'learning_rate': 1.345391386491849e-05, 'epoch': 0.78} {'loss': 0.6723, 'learning_rate': 1.3453606657164487e-05, 'epoch': 0.78} {'loss': 0.8861, 'learning_rate': 1.3453299445709634e-05, 'epoch': 0.78} {'loss': 0.8048, 'learning_rate': 1.3452992230554253e-05, 'epoch': 0.78} {'loss': 0.7185, 'learning_rate': 1.3452685011698684e-05, 'epoch': 0.78} {'loss': 0.8178, 'learning_rate': 1.3452377789143252e-05, 'epoch': 0.78} {'loss': 0.9088, 'learning_rate': 1.3452070562888282e-05, 'epoch': 0.78} {'loss': 0.9432, 'learning_rate': 1.3451763332934109e-05, 'epoch': 0.78} {'loss': 0.7586, 'learning_rate': 1.3451456099281062e-05, 'epoch': 0.78} {'loss': 0.6971, 'learning_rate': 1.3451148861929464e-05, 'epoch': 0.78} {'loss': 0.7844, 'learning_rate': 1.345084162087965e-05, 'epoch': 0.78} {'loss': 0.8436, 'learning_rate': 1.3450534376131947e-05, 'epoch': 0.78} {'loss': 0.897, 'learning_rate': 1.3450227127686687e-05, 'epoch': 0.78} {'loss': 0.7914, 'learning_rate': 1.34499198755442e-05, 'epoch': 0.78} {'loss': 0.7506, 'learning_rate': 1.3449612619704809e-05, 'epoch': 0.78} {'loss': 0.7915, 'learning_rate': 1.3449305360168845e-05, 'epoch': 0.78} {'loss': 0.7875, 'learning_rate': 1.344899809693664e-05, 'epoch': 0.78} {'loss': 0.8696, 'learning_rate': 1.3448690830008523e-05, 'epoch': 0.78} {'loss': 0.6901, 'learning_rate': 1.344838355938482e-05, 'epoch': 0.78} {'loss': 0.901, 'learning_rate': 1.3448076285065869e-05, 'epoch': 0.78} {'loss': 0.792, 'learning_rate': 1.3447769007051992e-05, 'epoch': 0.78} {'loss': 0.9143, 'learning_rate': 1.3447461725343516e-05, 'epoch': 0.78} {'loss': 0.7286, 'learning_rate': 1.3447154439940773e-05, 'epoch': 0.78} {'loss': 0.8754, 'learning_rate': 1.3446847150844093e-05, 'epoch': 0.78} {'loss': 1.0439, 'learning_rate': 1.3446539858053807e-05, 'epoch': 0.78} {'loss': 0.7804, 'learning_rate': 1.3446232561570243e-05, 'epoch': 0.78} {'loss': 0.8519, 'learning_rate': 1.3445925261393727e-05, 'epoch': 0.78} {'loss': 0.9118, 'learning_rate': 1.3445617957524594e-05, 'epoch': 0.78} {'loss': 0.8702, 'learning_rate': 1.3445310649963169e-05, 'epoch': 0.78} {'loss': 0.8549, 'learning_rate': 1.344500333870978e-05, 'epoch': 0.78} {'loss': 0.7323, 'learning_rate': 1.3444696023764762e-05, 'epoch': 0.78} {'loss': 0.9381, 'learning_rate': 1.3444388705128442e-05, 'epoch': 0.78} {'loss': 0.8755, 'learning_rate': 1.3444081382801149e-05, 'epoch': 0.78} {'loss': 0.7618, 'learning_rate': 1.3443774056783212e-05, 'epoch': 0.78} {'loss': 0.7829, 'learning_rate': 1.3443466727074958e-05, 'epoch': 0.78} {'loss': 0.7808, 'learning_rate': 1.3443159393676719e-05, 'epoch': 0.78} {'loss': 0.9032, 'learning_rate': 1.3442852056588824e-05, 'epoch': 0.78} {'loss': 0.8718, 'learning_rate': 1.3442544715811603e-05, 'epoch': 0.78} {'loss': 0.7926, 'learning_rate': 1.3442237371345383e-05, 'epoch': 0.78} {'loss': 0.7489, 'learning_rate': 1.3441930023190496e-05, 'epoch': 0.78} {'loss': 0.7566, 'learning_rate': 1.3441622671347274e-05, 'epoch': 0.78} {'loss': 0.8309, 'learning_rate': 1.3441315315816037e-05, 'epoch': 0.78} {'loss': 0.7909, 'learning_rate': 1.3441007956597123e-05, 'epoch': 0.78} {'loss': 0.8564, 'learning_rate': 1.3440700593690856e-05, 'epoch': 0.78} {'loss': 0.7918, 'learning_rate': 1.344039322709757e-05, 'epoch': 0.78} {'loss': 0.9571, 'learning_rate': 1.344008585681759e-05, 'epoch': 0.78} {'loss': 0.7189, 'learning_rate': 1.3439778482851251e-05, 'epoch': 0.78} {'loss': 0.7225, 'learning_rate': 1.343947110519888e-05, 'epoch': 0.78} {'loss': 0.7628, 'learning_rate': 1.3439163723860801e-05, 'epoch': 0.78} {'loss': 0.7412, 'learning_rate': 1.3438856338837349e-05, 'epoch': 0.78} {'loss': 0.7159, 'learning_rate': 1.343854895012885e-05, 'epoch': 0.78} {'loss': 0.6236, 'learning_rate': 1.3438241557735639e-05, 'epoch': 0.78} {'loss': 0.7536, 'learning_rate': 1.3437934161658042e-05, 'epoch': 0.78} {'loss': 0.6562, 'learning_rate': 1.3437626761896384e-05, 'epoch': 0.78} {'loss': 0.6823, 'learning_rate': 1.3437319358451004e-05, 'epoch': 0.78} {'loss': 0.7099, 'learning_rate': 1.3437011951322222e-05, 'epoch': 0.78} {'loss': 0.7384, 'learning_rate': 1.3436704540510372e-05, 'epoch': 0.78} {'loss': 0.8441, 'learning_rate': 1.3436397126015783e-05, 'epoch': 0.78} {'loss': 0.8248, 'learning_rate': 1.3436089707838788e-05, 'epoch': 0.78} {'loss': 0.6643, 'learning_rate': 1.3435782285979709e-05, 'epoch': 0.78} {'loss': 0.7497, 'learning_rate': 1.343547486043888e-05, 'epoch': 0.78} {'loss': 0.7869, 'learning_rate': 1.3435167431216631e-05, 'epoch': 0.78} {'loss': 0.8896, 'learning_rate': 1.3434859998313288e-05, 'epoch': 0.78} {'loss': 0.9091, 'learning_rate': 1.3434552561729181e-05, 'epoch': 0.78} {'loss': 0.9292, 'learning_rate': 1.3434245121464646e-05, 'epoch': 0.78} {'loss': 0.6697, 'learning_rate': 1.3433937677520004e-05, 'epoch': 0.78} {'loss': 0.9334, 'learning_rate': 1.3433630229895589e-05, 'epoch': 0.78} {'loss': 0.8928, 'learning_rate': 1.3433322778591729e-05, 'epoch': 0.78} {'loss': 0.7433, 'learning_rate': 1.3433015323608754e-05, 'epoch': 0.78} {'loss': 0.8873, 'learning_rate': 1.343270786494699e-05, 'epoch': 0.78} {'loss': 0.8252, 'learning_rate': 1.3432400402606773e-05, 'epoch': 0.78} {'loss': 0.6331, 'learning_rate': 1.343209293658843e-05, 'epoch': 0.78} {'loss': 0.7837, 'learning_rate': 1.3431785466892287e-05, 'epoch': 0.78} {'loss': 0.938, 'learning_rate': 1.3431477993518675e-05, 'epoch': 0.78} {'loss': 0.9345, 'learning_rate': 1.343117051646793e-05, 'epoch': 0.78} {'loss': 0.7583, 'learning_rate': 1.3430863035740373e-05, 'epoch': 0.78} {'loss': 0.8057, 'learning_rate': 1.3430555551336336e-05, 'epoch': 0.78} {'loss': 0.7214, 'learning_rate': 1.343024806325615e-05, 'epoch': 0.78} {'loss': 0.7605, 'learning_rate': 1.3429940571500144e-05, 'epoch': 0.78} {'loss': 0.5842, 'learning_rate': 1.3429633076068647e-05, 'epoch': 0.78} {'loss': 0.7306, 'learning_rate': 1.3429325576961986e-05, 'epoch': 0.78} {'loss': 0.6669, 'learning_rate': 1.3429018074180498e-05, 'epoch': 0.78} {'loss': 0.7274, 'learning_rate': 1.3428710567724503e-05, 'epoch': 0.78} {'loss': 0.5914, 'learning_rate': 1.3428403057594339e-05, 'epoch': 0.78} {'loss': 0.8122, 'learning_rate': 1.342809554379033e-05, 'epoch': 0.78} {'loss': 0.6668, 'learning_rate': 1.3427788026312805e-05, 'epoch': 0.78} {'loss': 0.8218, 'learning_rate': 1.3427480505162098e-05, 'epoch': 0.78} {'loss': 0.7819, 'learning_rate': 1.3427172980338534e-05, 'epoch': 0.78} {'loss': 0.8437, 'learning_rate': 1.342686545184245e-05, 'epoch': 0.78} {'loss': 0.6763, 'learning_rate': 1.3426557919674166e-05, 'epoch': 0.78} {'loss': 0.6261, 'learning_rate': 1.3426250383834019e-05, 'epoch': 0.78} {'loss': 1.0343, 'learning_rate': 1.3425942844322333e-05, 'epoch': 0.78} {'loss': 0.9555, 'learning_rate': 1.3425635301139438e-05, 'epoch': 0.78} {'loss': 0.7679, 'learning_rate': 1.342532775428567e-05, 'epoch': 0.78} {'loss': 0.7968, 'learning_rate': 1.3425020203761352e-05, 'epoch': 0.78} {'loss': 0.7778, 'learning_rate': 1.3424712649566816e-05, 'epoch': 0.78} {'loss': 0.636, 'learning_rate': 1.3424405091702392e-05, 'epoch': 0.78} {'loss': 0.813, 'learning_rate': 1.3424097530168409e-05, 'epoch': 0.78} {'loss': 0.8065, 'learning_rate': 1.3423789964965195e-05, 'epoch': 0.78} {'loss': 0.8121, 'learning_rate': 1.3423482396093081e-05, 'epoch': 0.78} {'loss': 0.734, 'learning_rate': 1.3423174823552395e-05, 'epoch': 0.78} {'loss': 0.8879, 'learning_rate': 1.3422867247343475e-05, 'epoch': 0.78} {'loss': 0.8581, 'learning_rate': 1.3422559667466637e-05, 'epoch': 0.78} {'loss': 0.9629, 'learning_rate': 1.3422252083922223e-05, 'epoch': 0.78} {'loss': 0.9896, 'learning_rate': 1.3421944496710552e-05, 'epoch': 0.78} {'loss': 0.6913, 'learning_rate': 1.342163690583196e-05, 'epoch': 0.78} {'loss': 0.6548, 'learning_rate': 1.3421329311286776e-05, 'epoch': 0.78} {'loss': 0.8928, 'learning_rate': 1.3421021713075329e-05, 'epoch': 0.78} {'loss': 0.8362, 'learning_rate': 1.3420714111197948e-05, 'epoch': 0.78} {'loss': 0.9042, 'learning_rate': 1.3420406505654962e-05, 'epoch': 0.78} {'loss': 0.8198, 'learning_rate': 1.3420098896446705e-05, 'epoch': 0.78} {'loss': 0.9775, 'learning_rate': 1.34197912835735e-05, 'epoch': 0.78} {'loss': 0.7675, 'learning_rate': 1.341948366703568e-05, 'epoch': 0.78} {'loss': 0.7782, 'learning_rate': 1.3419176046833576e-05, 'epoch': 0.78} {'loss': 0.8296, 'learning_rate': 1.3418868422967515e-05, 'epoch': 0.78} {'loss': 0.7307, 'learning_rate': 1.3418560795437832e-05, 'epoch': 0.78} {'loss': 0.6253, 'learning_rate': 1.341825316424485e-05, 'epoch': 0.78} {'loss': 0.776, 'learning_rate': 1.3417945529388901e-05, 'epoch': 0.78} {'loss': 0.7531, 'learning_rate': 1.3417637890870312e-05, 'epoch': 0.78} {'loss': 0.91, 'learning_rate': 1.3417330248689417e-05, 'epoch': 0.78} {'loss': 0.862, 'learning_rate': 1.3417022602846546e-05, 'epoch': 0.78} {'loss': 0.8898, 'learning_rate': 1.3416714953342028e-05, 'epoch': 0.78} {'loss': 0.7875, 'learning_rate': 1.3416407300176188e-05, 'epoch': 0.78} {'loss': 0.7204, 'learning_rate': 1.3416099643349363e-05, 'epoch': 0.78} {'loss': 0.8945, 'learning_rate': 1.3415791982861877e-05, 'epoch': 0.78} {'loss': 0.8317, 'learning_rate': 1.3415484318714061e-05, 'epoch': 0.78} {'loss': 0.8759, 'learning_rate': 1.3415176650906245e-05, 'epoch': 0.78} {'loss': 0.8605, 'learning_rate': 1.341486897943876e-05, 'epoch': 0.78} {'loss': 0.9054, 'learning_rate': 1.3414561304311935e-05, 'epoch': 0.78} {'loss': 0.832, 'learning_rate': 1.34142536255261e-05, 'epoch': 0.78} {'loss': 0.7037, 'learning_rate': 1.3413945943081583e-05, 'epoch': 0.78} {'loss': 0.797, 'learning_rate': 1.3413638256978714e-05, 'epoch': 0.78} {'loss': 0.7183, 'learning_rate': 1.3413330567217823e-05, 'epoch': 0.78} {'loss': 0.9428, 'learning_rate': 1.3413022873799241e-05, 'epoch': 0.78} {'loss': 0.8115, 'learning_rate': 1.34127151767233e-05, 'epoch': 0.78} {'loss': 0.8879, 'learning_rate': 1.3412407475990324e-05, 'epoch': 0.78} {'loss': 0.7411, 'learning_rate': 1.3412099771600644e-05, 'epoch': 0.78} {'loss': 0.917, 'learning_rate': 1.3411792063554594e-05, 'epoch': 0.78} {'loss': 0.7493, 'learning_rate': 1.3411484351852497e-05, 'epoch': 0.78} {'loss': 0.9225, 'learning_rate': 1.341117663649469e-05, 'epoch': 0.78} {'loss': 0.7503, 'learning_rate': 1.3410868917481499e-05, 'epoch': 0.78} {'loss': 0.7753, 'learning_rate': 1.3410561194813255e-05, 'epoch': 0.78} {'loss': 0.7339, 'learning_rate': 1.3410253468490283e-05, 'epoch': 0.78} {'loss': 0.9508, 'learning_rate': 1.3409945738512919e-05, 'epoch': 0.78} {'loss': 0.7306, 'learning_rate': 1.3409638004881492e-05, 'epoch': 0.78} {'loss': 0.7267, 'learning_rate': 1.3409330267596328e-05, 'epoch': 0.78} {'loss': 0.8897, 'learning_rate': 1.340902252665776e-05, 'epoch': 0.78} {'loss': 0.7481, 'learning_rate': 1.3408714782066117e-05, 'epoch': 0.78} {'loss': 0.8705, 'learning_rate': 1.3408407033821727e-05, 'epoch': 0.78} {'loss': 0.7525, 'learning_rate': 1.340809928192492e-05, 'epoch': 0.78} {'loss': 0.8231, 'learning_rate': 1.340779152637603e-05, 'epoch': 0.78} {'loss': 0.7903, 'learning_rate': 1.3407483767175382e-05, 'epoch': 0.78} {'loss': 0.8737, 'learning_rate': 1.340717600432331e-05, 'epoch': 0.78} {'loss': 1.0013, 'learning_rate': 1.3406868237820139e-05, 'epoch': 0.78} {'loss': 0.7403, 'learning_rate': 1.3406560467666201e-05, 'epoch': 0.78} {'loss': 0.7281, 'learning_rate': 1.3406252693861827e-05, 'epoch': 0.78} {'loss': 0.9376, 'learning_rate': 1.3405944916407345e-05, 'epoch': 0.78} {'loss': 0.8357, 'learning_rate': 1.3405637135303087e-05, 'epoch': 0.78} {'loss': 0.8576, 'learning_rate': 1.340532935054938e-05, 'epoch': 0.78} {'loss': 0.8796, 'learning_rate': 1.3405021562146558e-05, 'epoch': 0.78} {'loss': 0.9436, 'learning_rate': 1.3404713770094945e-05, 'epoch': 0.78} {'loss': 0.8214, 'learning_rate': 1.3404405974394875e-05, 'epoch': 0.78} {'loss': 0.8251, 'learning_rate': 1.3404098175046676e-05, 'epoch': 0.78} {'loss': 0.7159, 'learning_rate': 1.3403790372050679e-05, 'epoch': 0.78} {'loss': 0.7244, 'learning_rate': 1.3403482565407213e-05, 'epoch': 0.78} {'loss': 0.7627, 'learning_rate': 1.3403174755116613e-05, 'epoch': 0.78} {'loss': 0.7469, 'learning_rate': 1.3402866941179198e-05, 'epoch': 0.78} {'loss': 0.9288, 'learning_rate': 1.3402559123595304e-05, 'epoch': 0.78} {'loss': 0.8911, 'learning_rate': 1.3402251302365263e-05, 'epoch': 0.78} {'loss': 0.9155, 'learning_rate': 1.3401943477489403e-05, 'epoch': 0.78} {'loss': 0.7475, 'learning_rate': 1.3401635648968051e-05, 'epoch': 0.78} {'loss': 0.9138, 'learning_rate': 1.3401327816801544e-05, 'epoch': 0.78} {'loss': 0.8195, 'learning_rate': 1.3401019980990206e-05, 'epoch': 0.78} {'loss': 0.7883, 'learning_rate': 1.3400712141534364e-05, 'epoch': 0.78} {'loss': 0.7516, 'learning_rate': 1.3400404298434355e-05, 'epoch': 0.78} {'loss': 0.9097, 'learning_rate': 1.3400096451690505e-05, 'epoch': 0.78} {'loss': 0.8925, 'learning_rate': 1.3399788601303145e-05, 'epoch': 0.78} {'loss': 0.699, 'learning_rate': 1.3399480747272605e-05, 'epoch': 0.78} {'loss': 0.8554, 'learning_rate': 1.3399172889599215e-05, 'epoch': 0.78} {'loss': 0.6417, 'learning_rate': 1.3398865028283305e-05, 'epoch': 0.78} {'loss': 0.8904, 'learning_rate': 1.3398557163325203e-05, 'epoch': 0.78} {'loss': 0.8244, 'learning_rate': 1.339824929472524e-05, 'epoch': 0.78} {'loss': 0.8204, 'learning_rate': 1.3397941422483747e-05, 'epoch': 0.78} {'loss': 0.7522, 'learning_rate': 1.3397633546601053e-05, 'epoch': 0.78} {'loss': 0.8086, 'learning_rate': 1.3397325667077487e-05, 'epoch': 0.78} {'loss': 0.8328, 'learning_rate': 1.3397017783913382e-05, 'epoch': 0.78} {'loss': 0.8677, 'learning_rate': 1.3396709897109065e-05, 'epoch': 0.78} {'loss': 0.9346, 'learning_rate': 1.3396402006664867e-05, 'epoch': 0.78} {'loss': 0.8931, 'learning_rate': 1.3396094112581115e-05, 'epoch': 0.78} {'loss': 0.9679, 'learning_rate': 1.3395786214858143e-05, 'epoch': 0.78} {'loss': 0.809, 'learning_rate': 1.3395478313496281e-05, 'epoch': 0.78} {'loss': 0.8916, 'learning_rate': 1.3395170408495858e-05, 'epoch': 0.78} {'loss': 0.7959, 'learning_rate': 1.3394862499857204e-05, 'epoch': 0.78} {'loss': 0.8086, 'learning_rate': 1.3394554587580646e-05, 'epoch': 0.78} {'loss': 0.7531, 'learning_rate': 1.3394246671666516e-05, 'epoch': 0.78} {'loss': 0.8499, 'learning_rate': 1.3393938752115145e-05, 'epoch': 0.78} {'loss': 0.6975, 'learning_rate': 1.3393630828926865e-05, 'epoch': 0.78} {'loss': 0.6737, 'learning_rate': 1.3393322902102e-05, 'epoch': 0.78} {'loss': 0.7575, 'learning_rate': 1.3393014971640883e-05, 'epoch': 0.78} {'loss': 0.8601, 'learning_rate': 1.3392707037543847e-05, 'epoch': 0.78} {'loss': 0.9021, 'learning_rate': 1.3392399099811218e-05, 'epoch': 0.78} {'loss': 0.8245, 'learning_rate': 1.3392091158443326e-05, 'epoch': 0.78} {'loss': 0.7653, 'learning_rate': 1.3391783213440501e-05, 'epoch': 0.78} {'loss': 0.8625, 'learning_rate': 1.339147526480308e-05, 'epoch': 0.78} {'loss': 0.7714, 'learning_rate': 1.339116731253138e-05, 'epoch': 0.78} {'loss': 0.6369, 'learning_rate': 1.3390859356625743e-05, 'epoch': 0.78} {'loss': 0.8468, 'learning_rate': 1.3390551397086494e-05, 'epoch': 0.78} {'loss': 0.6852, 'learning_rate': 1.3390243433913961e-05, 'epoch': 0.78} {'loss': 0.954, 'learning_rate': 1.3389935467108476e-05, 'epoch': 0.78} {'loss': 0.7349, 'learning_rate': 1.3389627496670373e-05, 'epoch': 0.78} {'loss': 0.7353, 'learning_rate': 1.3389319522599973e-05, 'epoch': 0.78} {'loss': 0.8736, 'learning_rate': 1.3389011544897615e-05, 'epoch': 0.78} {'loss': 0.7267, 'learning_rate': 1.3388703563563623e-05, 'epoch': 0.78} {'loss': 0.9355, 'learning_rate': 1.3388395578598332e-05, 'epoch': 0.78} {'loss': 0.8257, 'learning_rate': 1.3388087590002066e-05, 'epoch': 0.78} {'loss': 0.8997, 'learning_rate': 1.3387779597775161e-05, 'epoch': 0.78} {'loss': 0.8882, 'learning_rate': 1.3387471601917942e-05, 'epoch': 0.78} {'loss': 0.7296, 'learning_rate': 1.3387163602430744e-05, 'epoch': 0.78} {'loss': 0.6219, 'learning_rate': 1.3386855599313892e-05, 'epoch': 0.78} {'loss': 0.8791, 'learning_rate': 1.3386547592567717e-05, 'epoch': 0.78} {'loss': 0.6875, 'learning_rate': 1.3386239582192557e-05, 'epoch': 0.78} {'loss': 0.7285, 'learning_rate': 1.338593156818873e-05, 'epoch': 0.78} {'loss': 0.8933, 'learning_rate': 1.3385623550556575e-05, 'epoch': 0.78} {'loss': 0.7782, 'learning_rate': 1.338531552929642e-05, 'epoch': 0.78} {'loss': 0.8684, 'learning_rate': 1.3385007504408587e-05, 'epoch': 0.78} {'loss': 0.8307, 'learning_rate': 1.3384699475893416e-05, 'epoch': 0.78} {'loss': 0.7133, 'learning_rate': 1.3384391443751239e-05, 'epoch': 0.78} {'loss': 0.6855, 'learning_rate': 1.3384083407982375e-05, 'epoch': 0.78} {'loss': 1.0065, 'learning_rate': 1.3383775368587167e-05, 'epoch': 0.78} {'loss': 0.7926, 'learning_rate': 1.3383467325565934e-05, 'epoch': 0.78} {'loss': 0.6522, 'learning_rate': 1.3383159278919009e-05, 'epoch': 0.78} {'loss': 0.6729, 'learning_rate': 1.3382851228646723e-05, 'epoch': 0.78} {'loss': 0.8997, 'learning_rate': 1.3382543174749408e-05, 'epoch': 0.78} {'loss': 0.7436, 'learning_rate': 1.3382235117227394e-05, 'epoch': 0.78} {'loss': 0.9485, 'learning_rate': 1.338192705608101e-05, 'epoch': 0.78} {'loss': 0.8478, 'learning_rate': 1.3381618991310585e-05, 'epoch': 0.78} {'loss': 0.8442, 'learning_rate': 1.3381310922916448e-05, 'epoch': 0.78} {'loss': 0.6992, 'learning_rate': 1.3381002850898934e-05, 'epoch': 0.78} {'loss': 0.7368, 'learning_rate': 1.3380694775258368e-05, 'epoch': 0.78} {'loss': 0.7487, 'learning_rate': 1.3380386695995082e-05, 'epoch': 0.78} {'loss': 0.7246, 'learning_rate': 1.338007861310941e-05, 'epoch': 0.78} {'loss': 0.7211, 'learning_rate': 1.3379770526601679e-05, 'epoch': 0.78} {'loss': 0.7856, 'learning_rate': 1.3379462436472218e-05, 'epoch': 0.78} {'loss': 0.9353, 'learning_rate': 1.3379154342721355e-05, 'epoch': 0.78} {'loss': 0.7474, 'learning_rate': 1.3378846245349424e-05, 'epoch': 0.78} {'loss': 0.7454, 'learning_rate': 1.3378538144356754e-05, 'epoch': 0.78} {'loss': 0.7684, 'learning_rate': 1.3378230039743676e-05, 'epoch': 0.78} {'loss': 0.8689, 'learning_rate': 1.3377921931510523e-05, 'epoch': 0.78} {'loss': 0.835, 'learning_rate': 1.337761381965762e-05, 'epoch': 0.78} {'loss': 0.8991, 'learning_rate': 1.3377305704185298e-05, 'epoch': 0.78} {'loss': 0.8932, 'learning_rate': 1.3376997585093888e-05, 'epoch': 0.78} {'loss': 0.9209, 'learning_rate': 1.3376689462383719e-05, 'epoch': 0.78} {'loss': 0.9806, 'learning_rate': 1.3376381336055122e-05, 'epoch': 0.78} {'loss': 0.8113, 'learning_rate': 1.337607320610843e-05, 'epoch': 0.78} {'loss': 0.645, 'learning_rate': 1.3375765072543972e-05, 'epoch': 0.78} {'loss': 0.8984, 'learning_rate': 1.3375456935362077e-05, 'epoch': 0.78} {'loss': 0.7772, 'learning_rate': 1.3375148794563071e-05, 'epoch': 0.78} {'loss': 0.9288, 'learning_rate': 1.3374840650147292e-05, 'epoch': 0.78} {'loss': 0.8719, 'learning_rate': 1.3374532502115064e-05, 'epoch': 0.78} {'loss': 0.7365, 'learning_rate': 1.3374224350466725e-05, 'epoch': 0.78} {'loss': 0.8326, 'learning_rate': 1.3373916195202595e-05, 'epoch': 0.78} {'loss': 0.7836, 'learning_rate': 1.3373608036323011e-05, 'epoch': 0.78} {'loss': 0.6556, 'learning_rate': 1.3373299873828303e-05, 'epoch': 0.78} {'loss': 0.6511, 'learning_rate': 1.3372991707718797e-05, 'epoch': 0.78} {'loss': 0.866, 'learning_rate': 1.3372683537994826e-05, 'epoch': 0.78} {'loss': 0.7843, 'learning_rate': 1.337237536465672e-05, 'epoch': 0.78} {'loss': 0.9788, 'learning_rate': 1.3372067187704813e-05, 'epoch': 0.78} {'loss': 0.7752, 'learning_rate': 1.3371759007139428e-05, 'epoch': 0.78} {'loss': 0.7617, 'learning_rate': 1.3371450822960903e-05, 'epoch': 0.78} {'loss': 0.6999, 'learning_rate': 1.3371142635169561e-05, 'epoch': 0.78} {'loss': 0.8924, 'learning_rate': 1.3370834443765735e-05, 'epoch': 0.78} {'loss': 0.8122, 'learning_rate': 1.3370526248749756e-05, 'epoch': 0.78} {'loss': 0.7847, 'learning_rate': 1.3370218050121955e-05, 'epoch': 0.78} {'loss': 0.7201, 'learning_rate': 1.336990984788266e-05, 'epoch': 0.78} {'loss': 0.7432, 'learning_rate': 1.3369601642032205e-05, 'epoch': 0.79} {'loss': 1.0123, 'learning_rate': 1.3369293432570915e-05, 'epoch': 0.79} {'loss': 0.8846, 'learning_rate': 1.3368985219499124e-05, 'epoch': 0.79} {'loss': 0.7043, 'learning_rate': 1.336867700281716e-05, 'epoch': 0.79} {'loss': 0.8322, 'learning_rate': 1.3368368782525355e-05, 'epoch': 0.79} {'loss': 0.7815, 'learning_rate': 1.3368060558624042e-05, 'epoch': 0.79} {'loss': 0.7452, 'learning_rate': 1.3367752331113544e-05, 'epoch': 0.79} {'loss': 0.6763, 'learning_rate': 1.3367444099994195e-05, 'epoch': 0.79} {'loss': 0.702, 'learning_rate': 1.336713586526633e-05, 'epoch': 0.79} {'loss': 0.9272, 'learning_rate': 1.3366827626930271e-05, 'epoch': 0.79} {'loss': 0.8407, 'learning_rate': 1.3366519384986356e-05, 'epoch': 0.79} {'loss': 0.8551, 'learning_rate': 1.3366211139434909e-05, 'epoch': 0.79} {'loss': 0.6544, 'learning_rate': 1.3365902890276264e-05, 'epoch': 0.79} {'loss': 0.7826, 'learning_rate': 1.3365594637510748e-05, 'epoch': 0.79} {'loss': 0.9325, 'learning_rate': 1.3365286381138696e-05, 'epoch': 0.79} {'loss': 0.8121, 'learning_rate': 1.3364978121160436e-05, 'epoch': 0.79} {'loss': 0.792, 'learning_rate': 1.3364669857576298e-05, 'epoch': 0.79} {'loss': 0.8013, 'learning_rate': 1.3364361590386611e-05, 'epoch': 0.79} {'loss': 0.9884, 'learning_rate': 1.336405331959171e-05, 'epoch': 0.79} {'loss': 0.9641, 'learning_rate': 1.3363745045191918e-05, 'epoch': 0.79} {'loss': 0.6768, 'learning_rate': 1.3363436767187573e-05, 'epoch': 0.79} {'loss': 0.7254, 'learning_rate': 1.3363128485579e-05, 'epoch': 0.79} {'loss': 0.7871, 'learning_rate': 1.3362820200366533e-05, 'epoch': 0.79} {'loss': 0.8134, 'learning_rate': 1.33625119115505e-05, 'epoch': 0.79} {'loss': 0.6855, 'learning_rate': 1.336220361913123e-05, 'epoch': 0.79} {'loss': 0.8694, 'learning_rate': 1.3361895323109057e-05, 'epoch': 0.79} {'loss': 0.8209, 'learning_rate': 1.336158702348431e-05, 'epoch': 0.79} {'loss': 0.7103, 'learning_rate': 1.336127872025732e-05, 'epoch': 0.79} {'loss': 0.6805, 'learning_rate': 1.3360970413428415e-05, 'epoch': 0.79} {'loss': 0.6754, 'learning_rate': 1.3360662102997927e-05, 'epoch': 0.79} {'loss': 0.8038, 'learning_rate': 1.3360353788966189e-05, 'epoch': 0.79} {'loss': 0.9336, 'learning_rate': 1.3360045471333525e-05, 'epoch': 0.79} {'loss': 0.7699, 'learning_rate': 1.3359737150100269e-05, 'epoch': 0.79} {'loss': 0.713, 'learning_rate': 1.3359428825266751e-05, 'epoch': 0.79} {'loss': 0.7621, 'learning_rate': 1.3359120496833305e-05, 'epoch': 0.79} {'loss': 0.8212, 'learning_rate': 1.3358812164800256e-05, 'epoch': 0.79} {'loss': 0.7579, 'learning_rate': 1.3358503829167939e-05, 'epoch': 0.79} {'loss': 0.844, 'learning_rate': 1.335819548993668e-05, 'epoch': 0.79} {'loss': 0.8519, 'learning_rate': 1.3357887147106811e-05, 'epoch': 0.79} {'loss': 0.7666, 'learning_rate': 1.3357578800678663e-05, 'epoch': 0.79} {'loss': 0.8313, 'learning_rate': 1.3357270450652566e-05, 'epoch': 0.79} {'loss': 0.7129, 'learning_rate': 1.3356962097028851e-05, 'epoch': 0.79} {'loss': 0.8382, 'learning_rate': 1.335665373980785e-05, 'epoch': 0.79} {'loss': 0.877, 'learning_rate': 1.3356345378989892e-05, 'epoch': 0.79} {'loss': 0.7849, 'learning_rate': 1.3356037014575304e-05, 'epoch': 0.79} {'loss': 0.7805, 'learning_rate': 1.3355728646564421e-05, 'epoch': 0.79} {'loss': 0.7037, 'learning_rate': 1.3355420274957571e-05, 'epoch': 0.79} {'loss': 0.872, 'learning_rate': 1.3355111899755084e-05, 'epoch': 0.79} {'loss': 0.7851, 'learning_rate': 1.3354803520957295e-05, 'epoch': 0.79} {'loss': 0.7155, 'learning_rate': 1.335449513856453e-05, 'epoch': 0.79} {'loss': 0.7809, 'learning_rate': 1.3354186752577124e-05, 'epoch': 0.79} {'loss': 0.8503, 'learning_rate': 1.3353878362995398e-05, 'epoch': 0.79} {'loss': 0.8643, 'learning_rate': 1.3353569969819691e-05, 'epoch': 0.79} {'loss': 0.7306, 'learning_rate': 1.3353261573050332e-05, 'epoch': 0.79} {'loss': 0.7429, 'learning_rate': 1.335295317268765e-05, 'epoch': 0.79} {'loss': 0.7577, 'learning_rate': 1.3352644768731975e-05, 'epoch': 0.79} {'loss': 0.9076, 'learning_rate': 1.335233636118364e-05, 'epoch': 0.79} {'loss': 0.7771, 'learning_rate': 1.3352027950042974e-05, 'epoch': 0.79} {'loss': 0.9594, 'learning_rate': 1.3351719535310306e-05, 'epoch': 0.79} {'loss': 0.7422, 'learning_rate': 1.3351411116985969e-05, 'epoch': 0.79} {'loss': 0.758, 'learning_rate': 1.3351102695070292e-05, 'epoch': 0.79} {'loss': 0.7837, 'learning_rate': 1.335079426956361e-05, 'epoch': 0.79} {'loss': 0.9183, 'learning_rate': 1.3350485840466246e-05, 'epoch': 0.79} {'loss': 0.8186, 'learning_rate': 1.335017740777853e-05, 'epoch': 0.79} {'loss': 0.8589, 'learning_rate': 1.3349868971500803e-05, 'epoch': 0.79} {'loss': 0.9096, 'learning_rate': 1.3349560531633388e-05, 'epoch': 0.79} {'loss': 0.8116, 'learning_rate': 1.3349252088176614e-05, 'epoch': 0.79} {'loss': 0.9012, 'learning_rate': 1.3348943641130816e-05, 'epoch': 0.79} {'loss': 0.7815, 'learning_rate': 1.3348635190496321e-05, 'epoch': 0.79} {'loss': 0.718, 'learning_rate': 1.3348326736273462e-05, 'epoch': 0.79} {'loss': 0.7796, 'learning_rate': 1.3348018278462572e-05, 'epoch': 0.79} {'loss': 0.6314, 'learning_rate': 1.3347709817063973e-05, 'epoch': 0.79} {'loss': 0.7666, 'learning_rate': 1.3347401352078003e-05, 'epoch': 0.79} {'loss': 0.8494, 'learning_rate': 1.3347092883504991e-05, 'epoch': 0.79} {'loss': 0.9332, 'learning_rate': 1.3346784411345266e-05, 'epoch': 0.79} {'loss': 0.6609, 'learning_rate': 1.334647593559916e-05, 'epoch': 0.79} {'loss': 0.7481, 'learning_rate': 1.3346167456267e-05, 'epoch': 0.79} {'loss': 0.7911, 'learning_rate': 1.3345858973349125e-05, 'epoch': 0.79} {'loss': 0.776, 'learning_rate': 1.3345550486845855e-05, 'epoch': 0.79} {'loss': 0.7468, 'learning_rate': 1.3345241996757528e-05, 'epoch': 0.79} {'loss': 0.7785, 'learning_rate': 1.3344933503084474e-05, 'epoch': 0.79} {'loss': 0.6006, 'learning_rate': 1.3344625005827018e-05, 'epoch': 0.79} {'loss': 0.6952, 'learning_rate': 1.3344316504985497e-05, 'epoch': 0.79} {'loss': 0.7087, 'learning_rate': 1.3344008000560238e-05, 'epoch': 0.79} {'loss': 0.7537, 'learning_rate': 1.3343699492551574e-05, 'epoch': 0.79} {'loss': 0.8746, 'learning_rate': 1.3343390980959833e-05, 'epoch': 0.79} {'loss': 0.728, 'learning_rate': 1.3343082465785349e-05, 'epoch': 0.79} {'loss': 0.9082, 'learning_rate': 1.334277394702845e-05, 'epoch': 0.79} {'loss': 0.7525, 'learning_rate': 1.3342465424689464e-05, 'epoch': 0.79} {'loss': 0.8251, 'learning_rate': 1.3342156898768726e-05, 'epoch': 0.79} {'loss': 0.7793, 'learning_rate': 1.3341848369266564e-05, 'epoch': 0.79} {'loss': 0.9368, 'learning_rate': 1.3341539836183313e-05, 'epoch': 0.79} {'loss': 0.8444, 'learning_rate': 1.33412312995193e-05, 'epoch': 0.79} {'loss': 0.8868, 'learning_rate': 1.3340922759274855e-05, 'epoch': 0.79} {'loss': 0.8173, 'learning_rate': 1.3340614215450307e-05, 'epoch': 0.79} {'loss': 0.9327, 'learning_rate': 1.3340305668045992e-05, 'epoch': 0.79} {'loss': 0.7168, 'learning_rate': 1.3339997117062238e-05, 'epoch': 0.79} {'loss': 0.7224, 'learning_rate': 1.3339688562499374e-05, 'epoch': 0.79} {'loss': 0.9731, 'learning_rate': 1.3339380004357735e-05, 'epoch': 0.79} {'loss': 0.7525, 'learning_rate': 1.333907144263765e-05, 'epoch': 0.79} {'loss': 0.8229, 'learning_rate': 1.3338762877339443e-05, 'epoch': 0.79} {'loss': 0.8362, 'learning_rate': 1.3338454308463455e-05, 'epoch': 0.79} {'loss': 0.7971, 'learning_rate': 1.3338145736010011e-05, 'epoch': 0.79} {'loss': 0.8743, 'learning_rate': 1.333783715997944e-05, 'epoch': 0.79} {'loss': 0.9638, 'learning_rate': 1.3337528580372078e-05, 'epoch': 0.79} {'loss': 0.6325, 'learning_rate': 1.3337219997188253e-05, 'epoch': 0.79} {'loss': 0.8787, 'learning_rate': 1.3336911410428294e-05, 'epoch': 0.79} {'loss': 0.7862, 'learning_rate': 1.3336602820092535e-05, 'epoch': 0.79} {'loss': 0.8402, 'learning_rate': 1.3336294226181304e-05, 'epoch': 0.79} {'loss': 0.7287, 'learning_rate': 1.3335985628694931e-05, 'epoch': 0.79} {'loss': 0.7434, 'learning_rate': 1.333567702763375e-05, 'epoch': 0.79} {'loss': 0.6202, 'learning_rate': 1.3335368422998091e-05, 'epoch': 0.79} {'loss': 0.7408, 'learning_rate': 1.3335059814788283e-05, 'epoch': 0.79} {'loss': 0.7096, 'learning_rate': 1.3334751203004657e-05, 'epoch': 0.79} {'loss': 0.7492, 'learning_rate': 1.3334442587647542e-05, 'epoch': 0.79} {'loss': 0.6833, 'learning_rate': 1.3334133968717274e-05, 'epoch': 0.79} {'loss': 0.9075, 'learning_rate': 1.3333825346214178e-05, 'epoch': 0.79} {'loss': 0.9636, 'learning_rate': 1.333351672013859e-05, 'epoch': 0.79} {'loss': 0.9515, 'learning_rate': 1.3333208090490837e-05, 'epoch': 0.79} {'loss': 0.7087, 'learning_rate': 1.3332899457271251e-05, 'epoch': 0.79} {'loss': 0.9244, 'learning_rate': 1.3332590820480163e-05, 'epoch': 0.79} {'loss': 0.753, 'learning_rate': 1.3332282180117899e-05, 'epoch': 0.79} {'loss': 0.7459, 'learning_rate': 1.3331973536184796e-05, 'epoch': 0.79} {'loss': 0.6905, 'learning_rate': 1.3331664888681184e-05, 'epoch': 0.79} {'loss': 0.8146, 'learning_rate': 1.3331356237607394e-05, 'epoch': 0.79} {'loss': 0.6387, 'learning_rate': 1.3331047582963751e-05, 'epoch': 0.79} {'loss': 0.8395, 'learning_rate': 1.3330738924750595e-05, 'epoch': 0.79} {'loss': 0.7294, 'learning_rate': 1.3330430262968245e-05, 'epoch': 0.79} {'loss': 0.8463, 'learning_rate': 1.3330121597617042e-05, 'epoch': 0.79} {'loss': 0.6716, 'learning_rate': 1.3329812928697312e-05, 'epoch': 0.79} {'loss': 0.9605, 'learning_rate': 1.3329504256209388e-05, 'epoch': 0.79} {'loss': 0.7803, 'learning_rate': 1.33291955801536e-05, 'epoch': 0.79} {'loss': 0.7238, 'learning_rate': 1.3328886900530278e-05, 'epoch': 0.79} {'loss': 0.92, 'learning_rate': 1.3328578217339753e-05, 'epoch': 0.79} {'loss': 0.7802, 'learning_rate': 1.3328269530582359e-05, 'epoch': 0.79} {'loss': 0.7718, 'learning_rate': 1.3327960840258417e-05, 'epoch': 0.79} {'loss': 0.8037, 'learning_rate': 1.3327652146368272e-05, 'epoch': 0.79} {'loss': 0.8747, 'learning_rate': 1.3327343448912242e-05, 'epoch': 0.79} {'loss': 0.7843, 'learning_rate': 1.3327034747890666e-05, 'epoch': 0.79} {'loss': 0.7266, 'learning_rate': 1.332672604330387e-05, 'epoch': 0.79} {'loss': 0.696, 'learning_rate': 1.3326417335152189e-05, 'epoch': 0.79} {'loss': 0.5335, 'learning_rate': 1.3326108623435949e-05, 'epoch': 0.79} {'loss': 0.7621, 'learning_rate': 1.3325799908155488e-05, 'epoch': 0.79} {'loss': 0.717, 'learning_rate': 1.3325491189311129e-05, 'epoch': 0.79} {'loss': 0.7297, 'learning_rate': 1.3325182466903205e-05, 'epoch': 0.79} {'loss': 0.9128, 'learning_rate': 1.332487374093205e-05, 'epoch': 0.79} {'loss': 0.7827, 'learning_rate': 1.3324565011397989e-05, 'epoch': 0.79} {'loss': 0.6909, 'learning_rate': 1.3324256278301362e-05, 'epoch': 0.79} {'loss': 0.8287, 'learning_rate': 1.332394754164249e-05, 'epoch': 0.79} {'loss': 0.865, 'learning_rate': 1.3323638801421712e-05, 'epoch': 0.79} {'loss': 0.7229, 'learning_rate': 1.3323330057639352e-05, 'epoch': 0.79} {'loss': 0.8354, 'learning_rate': 1.3323021310295743e-05, 'epoch': 0.79} {'loss': 0.874, 'learning_rate': 1.332271255939122e-05, 'epoch': 0.79} {'loss': 0.8909, 'learning_rate': 1.3322403804926109e-05, 'epoch': 0.79} {'loss': 0.8739, 'learning_rate': 1.3322095046900743e-05, 'epoch': 0.79} {'loss': 0.7735, 'learning_rate': 1.3321786285315452e-05, 'epoch': 0.79} {'loss': 0.8226, 'learning_rate': 1.3321477520170566e-05, 'epoch': 0.79} {'loss': 0.7253, 'learning_rate': 1.332116875146642e-05, 'epoch': 0.79} {'loss': 0.7538, 'learning_rate': 1.3320859979203337e-05, 'epoch': 0.79} {'loss': 0.7611, 'learning_rate': 1.3320551203381657e-05, 'epoch': 0.79} {'loss': 0.7546, 'learning_rate': 1.3320242424001708e-05, 'epoch': 0.79} {'loss': 0.9226, 'learning_rate': 1.3319933641063818e-05, 'epoch': 0.79} {'loss': 0.9398, 'learning_rate': 1.3319624854568316e-05, 'epoch': 0.79} {'loss': 0.9396, 'learning_rate': 1.331931606451554e-05, 'epoch': 0.79} {'loss': 0.8088, 'learning_rate': 1.3319007270905816e-05, 'epoch': 0.79} {'loss': 0.8068, 'learning_rate': 1.3318698473739476e-05, 'epoch': 0.79} {'loss': 0.617, 'learning_rate': 1.331838967301685e-05, 'epoch': 0.79} {'loss': 0.7456, 'learning_rate': 1.3318080868738272e-05, 'epoch': 0.79} {'loss': 0.8891, 'learning_rate': 1.3317772060904073e-05, 'epoch': 0.79} {'loss': 0.793, 'learning_rate': 1.3317463249514578e-05, 'epoch': 0.79} {'loss': 0.8842, 'learning_rate': 1.331715443457012e-05, 'epoch': 0.79} {'loss': 0.7416, 'learning_rate': 1.3316845616071038e-05, 'epoch': 0.79} {'loss': 0.8291, 'learning_rate': 1.3316536794017649e-05, 'epoch': 0.79} {'loss': 0.9374, 'learning_rate': 1.3316227968410295e-05, 'epoch': 0.79} {'loss': 0.8924, 'learning_rate': 1.3315919139249307e-05, 'epoch': 0.79} {'loss': 0.7957, 'learning_rate': 1.3315610306535009e-05, 'epoch': 0.79} {'loss': 0.7148, 'learning_rate': 1.3315301470267736e-05, 'epoch': 0.79} {'loss': 0.8354, 'learning_rate': 1.3314992630447815e-05, 'epoch': 0.79} {'loss': 0.8463, 'learning_rate': 1.3314683787075584e-05, 'epoch': 0.79} {'loss': 0.9124, 'learning_rate': 1.3314374940151368e-05, 'epoch': 0.79} {'loss': 0.8928, 'learning_rate': 1.3314066089675504e-05, 'epoch': 0.79} {'loss': 0.8543, 'learning_rate': 1.3313757235648315e-05, 'epoch': 0.79} {'loss': 0.7598, 'learning_rate': 1.3313448378070139e-05, 'epoch': 0.79} {'loss': 0.7635, 'learning_rate': 1.3313139516941302e-05, 'epoch': 0.79} {'loss': 0.8879, 'learning_rate': 1.3312830652262137e-05, 'epoch': 0.79} {'loss': 0.6585, 'learning_rate': 1.3312521784032975e-05, 'epoch': 0.79} {'loss': 0.7525, 'learning_rate': 1.3312212912254148e-05, 'epoch': 0.79} {'loss': 0.8671, 'learning_rate': 1.3311904036925984e-05, 'epoch': 0.79} {'loss': 0.9195, 'learning_rate': 1.3311595158048817e-05, 'epoch': 0.79} {'loss': 0.9351, 'learning_rate': 1.3311286275622979e-05, 'epoch': 0.79} {'loss': 0.745, 'learning_rate': 1.3310977389648795e-05, 'epoch': 0.79} {'loss': 0.889, 'learning_rate': 1.3310668500126603e-05, 'epoch': 0.79} {'loss': 0.9118, 'learning_rate': 1.331035960705673e-05, 'epoch': 0.79} {'loss': 0.7352, 'learning_rate': 1.3310050710439506e-05, 'epoch': 0.79} {'loss': 0.814, 'learning_rate': 1.3309741810275266e-05, 'epoch': 0.79} {'loss': 0.9303, 'learning_rate': 1.330943290656434e-05, 'epoch': 0.79} {'loss': 0.761, 'learning_rate': 1.3309123999307056e-05, 'epoch': 0.79} {'loss': 0.6105, 'learning_rate': 1.3308815088503747e-05, 'epoch': 0.79} {'loss': 0.6615, 'learning_rate': 1.3308506174154742e-05, 'epoch': 0.79} {'loss': 0.8888, 'learning_rate': 1.3308197256260378e-05, 'epoch': 0.79} {'loss': 0.8714, 'learning_rate': 1.330788833482098e-05, 'epoch': 0.79} {'loss': 0.8499, 'learning_rate': 1.3307579409836882e-05, 'epoch': 0.79} {'loss': 0.8209, 'learning_rate': 1.3307270481308414e-05, 'epoch': 0.79} {'loss': 1.0028, 'learning_rate': 1.3306961549235905e-05, 'epoch': 0.79} {'loss': 0.7637, 'learning_rate': 1.3306652613619691e-05, 'epoch': 0.79} {'loss': 0.7782, 'learning_rate': 1.33063436744601e-05, 'epoch': 0.79} {'loss': 0.8147, 'learning_rate': 1.3306034731757463e-05, 'epoch': 0.79} {'loss': 0.833, 'learning_rate': 1.330572578551211e-05, 'epoch': 0.79} {'loss': 0.9199, 'learning_rate': 1.3305416835724375e-05, 'epoch': 0.79} {'loss': 0.7702, 'learning_rate': 1.3305107882394587e-05, 'epoch': 0.79} {'loss': 0.6727, 'learning_rate': 1.3304798925523077e-05, 'epoch': 0.79} {'loss': 0.7117, 'learning_rate': 1.3304489965110176e-05, 'epoch': 0.79} {'loss': 0.7172, 'learning_rate': 1.330418100115622e-05, 'epoch': 0.79} {'loss': 0.7034, 'learning_rate': 1.3303872033661531e-05, 'epoch': 0.79} {'loss': 0.7662, 'learning_rate': 1.3303563062626448e-05, 'epoch': 0.79} {'loss': 0.874, 'learning_rate': 1.3303254088051297e-05, 'epoch': 0.79} {'loss': 0.8193, 'learning_rate': 1.3302945109936412e-05, 'epoch': 0.79} {'loss': 0.8754, 'learning_rate': 1.3302636128282122e-05, 'epoch': 0.79} {'loss': 0.8712, 'learning_rate': 1.3302327143088763e-05, 'epoch': 0.79} {'loss': 0.8717, 'learning_rate': 1.3302018154356659e-05, 'epoch': 0.79} {'loss': 0.8255, 'learning_rate': 1.3301709162086144e-05, 'epoch': 0.79} {'loss': 0.7782, 'learning_rate': 1.3301400166277551e-05, 'epoch': 0.79} {'loss': 0.9296, 'learning_rate': 1.3301091166931208e-05, 'epoch': 0.79} {'loss': 0.8233, 'learning_rate': 1.3300782164047452e-05, 'epoch': 0.79} {'loss': 0.7553, 'learning_rate': 1.330047315762661e-05, 'epoch': 0.79} {'loss': 0.6993, 'learning_rate': 1.330016414766901e-05, 'epoch': 0.79} {'loss': 0.6911, 'learning_rate': 1.3299855134174986e-05, 'epoch': 0.79} {'loss': 0.7342, 'learning_rate': 1.329954611714487e-05, 'epoch': 0.79} {'loss': 0.7657, 'learning_rate': 1.3299237096578992e-05, 'epoch': 0.79} {'loss': 0.8337, 'learning_rate': 1.3298928072477686e-05, 'epoch': 0.79} {'loss': 0.7288, 'learning_rate': 1.3298619044841279e-05, 'epoch': 0.79} {'loss': 0.6409, 'learning_rate': 1.3298310013670106e-05, 'epoch': 0.79} {'loss': 0.7086, 'learning_rate': 1.3298000978964494e-05, 'epoch': 0.79} {'loss': 0.6711, 'learning_rate': 1.3297691940724774e-05, 'epoch': 0.79} {'loss': 0.7519, 'learning_rate': 1.3297382898951283e-05, 'epoch': 0.79} {'loss': 0.9161, 'learning_rate': 1.3297073853644347e-05, 'epoch': 0.79} {'loss': 0.7175, 'learning_rate': 1.3296764804804304e-05, 'epoch': 0.79} {'loss': 0.7555, 'learning_rate': 1.3296455752431477e-05, 'epoch': 0.79} {'loss': 0.8053, 'learning_rate': 1.3296146696526196e-05, 'epoch': 0.79} {'loss': 0.9216, 'learning_rate': 1.3295837637088798e-05, 'epoch': 0.79} {'loss': 0.8032, 'learning_rate': 1.3295528574119614e-05, 'epoch': 0.79} {'loss': 0.9332, 'learning_rate': 1.3295219507618973e-05, 'epoch': 0.79} {'loss': 0.7498, 'learning_rate': 1.3294910437587205e-05, 'epoch': 0.79} {'loss': 0.7308, 'learning_rate': 1.3294601364024646e-05, 'epoch': 0.79} {'loss': 0.7195, 'learning_rate': 1.3294292286931627e-05, 'epoch': 0.79} {'loss': 0.7358, 'learning_rate': 1.3293983206308471e-05, 'epoch': 0.79} {'loss': 0.731, 'learning_rate': 1.3293674122155517e-05, 'epoch': 0.79} {'loss': 0.7761, 'learning_rate': 1.3293365034473094e-05, 'epoch': 0.79} {'loss': 0.7627, 'learning_rate': 1.329305594326153e-05, 'epoch': 0.79} {'loss': 0.8293, 'learning_rate': 1.3292746848521165e-05, 'epoch': 0.79} {'loss': 0.8622, 'learning_rate': 1.3292437750252321e-05, 'epoch': 0.79} {'loss': 0.6299, 'learning_rate': 1.3292128648455335e-05, 'epoch': 0.79} {'loss': 0.8607, 'learning_rate': 1.3291819543130534e-05, 'epoch': 0.79} {'loss': 0.8891, 'learning_rate': 1.329151043427825e-05, 'epoch': 0.79} {'loss': 0.861, 'learning_rate': 1.3291201321898817e-05, 'epoch': 0.79} {'loss': 0.7034, 'learning_rate': 1.3290892205992565e-05, 'epoch': 0.79} {'loss': 0.7893, 'learning_rate': 1.3290583086559825e-05, 'epoch': 0.79} {'loss': 0.8218, 'learning_rate': 1.3290273963600929e-05, 'epoch': 0.79} {'loss': 0.6801, 'learning_rate': 1.3289964837116207e-05, 'epoch': 0.79} {'loss': 0.7442, 'learning_rate': 1.328965570710599e-05, 'epoch': 0.79} {'loss': 0.7597, 'learning_rate': 1.3289346573570609e-05, 'epoch': 0.79} {'loss': 0.7853, 'learning_rate': 1.3289037436510398e-05, 'epoch': 0.79} {'loss': 0.8707, 'learning_rate': 1.3288728295925689e-05, 'epoch': 0.79} {'loss': 0.8328, 'learning_rate': 1.3288419151816805e-05, 'epoch': 0.79} {'loss': 0.7526, 'learning_rate': 1.3288110004184087e-05, 'epoch': 0.79} {'loss': 0.9321, 'learning_rate': 1.3287800853027864e-05, 'epoch': 0.79} {'loss': 0.7263, 'learning_rate': 1.328749169834846e-05, 'epoch': 0.79} {'loss': 0.8743, 'learning_rate': 1.3287182540146215e-05, 'epoch': 0.79} {'loss': 0.8642, 'learning_rate': 1.3286873378421459e-05, 'epoch': 0.79} {'loss': 0.9499, 'learning_rate': 1.3286564213174517e-05, 'epoch': 0.79} {'loss': 0.9856, 'learning_rate': 1.328625504440573e-05, 'epoch': 0.79} {'loss': 0.8252, 'learning_rate': 1.3285945872115421e-05, 'epoch': 0.79} {'loss': 0.7787, 'learning_rate': 1.3285636696303924e-05, 'epoch': 0.79} {'loss': 0.633, 'learning_rate': 1.3285327516971574e-05, 'epoch': 0.79} {'loss': 0.7764, 'learning_rate': 1.3285018334118695e-05, 'epoch': 0.79} {'loss': 0.752, 'learning_rate': 1.3284709147745624e-05, 'epoch': 0.79} {'loss': 0.8707, 'learning_rate': 1.3284399957852692e-05, 'epoch': 0.79} {'loss': 0.9435, 'learning_rate': 1.3284090764440228e-05, 'epoch': 0.79} {'loss': 0.8309, 'learning_rate': 1.3283781567508564e-05, 'epoch': 0.79} {'loss': 0.6819, 'learning_rate': 1.3283472367058032e-05, 'epoch': 0.79} {'loss': 0.7934, 'learning_rate': 1.3283163163088961e-05, 'epoch': 0.79} {'loss': 0.6531, 'learning_rate': 1.328285395560169e-05, 'epoch': 0.79} {'loss': 0.8251, 'learning_rate': 1.3282544744596539e-05, 'epoch': 0.79} {'loss': 0.8272, 'learning_rate': 1.3282235530073847e-05, 'epoch': 0.79} {'loss': 0.9923, 'learning_rate': 1.3281926312033941e-05, 'epoch': 0.79} {'loss': 0.8742, 'learning_rate': 1.3281617090477159e-05, 'epoch': 0.79} {'loss': 0.9561, 'learning_rate': 1.3281307865403827e-05, 'epoch': 0.79} {'loss': 0.9272, 'learning_rate': 1.3280998636814277e-05, 'epoch': 0.79} {'loss': 0.8726, 'learning_rate': 1.328068940470884e-05, 'epoch': 0.79} {'loss': 0.8317, 'learning_rate': 1.328038016908785e-05, 'epoch': 0.79} {'loss': 0.7186, 'learning_rate': 1.3280070929951635e-05, 'epoch': 0.79} {'loss': 0.7049, 'learning_rate': 1.3279761687300527e-05, 'epoch': 0.79} {'loss': 0.6778, 'learning_rate': 1.3279452441134861e-05, 'epoch': 0.79} {'loss': 0.7295, 'learning_rate': 1.3279143191454966e-05, 'epoch': 0.79} {'loss': 0.8768, 'learning_rate': 1.3278833938261171e-05, 'epoch': 0.79} {'loss': 0.8123, 'learning_rate': 1.3278524681553808e-05, 'epoch': 0.79} {'loss': 0.8674, 'learning_rate': 1.3278215421333211e-05, 'epoch': 0.79} {'loss': 0.9206, 'learning_rate': 1.3277906157599711e-05, 'epoch': 0.79} {'loss': 0.8091, 'learning_rate': 1.327759689035364e-05, 'epoch': 0.79} {'loss': 0.9067, 'learning_rate': 1.3277287619595328e-05, 'epoch': 0.79} {'loss': 0.8545, 'learning_rate': 1.3276978345325107e-05, 'epoch': 0.79} {'loss': 0.7321, 'learning_rate': 1.3276669067543305e-05, 'epoch': 0.79} {'loss': 0.8944, 'learning_rate': 1.3276359786250258e-05, 'epoch': 0.79} {'loss': 0.727, 'learning_rate': 1.3276050501446293e-05, 'epoch': 0.79} {'loss': 0.817, 'learning_rate': 1.3275741213131748e-05, 'epoch': 0.79} {'loss': 0.8009, 'learning_rate': 1.3275431921306949e-05, 'epoch': 0.79} {'loss': 0.7278, 'learning_rate': 1.327512262597223e-05, 'epoch': 0.79} {'loss': 0.8874, 'learning_rate': 1.3274813327127922e-05, 'epoch': 0.79} {'loss': 0.6853, 'learning_rate': 1.3274504024774356e-05, 'epoch': 0.79} {'loss': 0.8184, 'learning_rate': 1.327419471891186e-05, 'epoch': 0.79} {'loss': 0.8037, 'learning_rate': 1.327388540954077e-05, 'epoch': 0.79} {'loss': 0.7476, 'learning_rate': 1.3273576096661418e-05, 'epoch': 0.79} {'loss': 0.8242, 'learning_rate': 1.3273266780274134e-05, 'epoch': 0.79} {'loss': 0.8466, 'learning_rate': 1.327295746037925e-05, 'epoch': 0.79} {'loss': 0.7396, 'learning_rate': 1.3272648136977093e-05, 'epoch': 0.79} {'loss': 0.7694, 'learning_rate': 1.3272338810068001e-05, 'epoch': 0.79} {'loss': 0.8962, 'learning_rate': 1.3272029479652302e-05, 'epoch': 0.79} {'loss': 0.7225, 'learning_rate': 1.3271720145730326e-05, 'epoch': 0.79} {'loss': 0.8441, 'learning_rate': 1.327141080830241e-05, 'epoch': 0.79} {'loss': 0.8343, 'learning_rate': 1.327110146736888e-05, 'epoch': 0.79} {'loss': 0.6768, 'learning_rate': 1.3270792122930071e-05, 'epoch': 0.79} {'loss': 0.8573, 'learning_rate': 1.3270482774986314e-05, 'epoch': 0.79} {'loss': 0.72, 'learning_rate': 1.3270173423537936e-05, 'epoch': 0.79} {'loss': 0.7476, 'learning_rate': 1.3269864068585272e-05, 'epoch': 0.79} {'loss': 0.9339, 'learning_rate': 1.3269554710128655e-05, 'epoch': 0.79} {'loss': 0.7303, 'learning_rate': 1.3269245348168419e-05, 'epoch': 0.79} {'loss': 0.7716, 'learning_rate': 1.3268935982704884e-05, 'epoch': 0.79} {'loss': 0.7444, 'learning_rate': 1.3268626613738396e-05, 'epoch': 0.79} {'loss': 0.7993, 'learning_rate': 1.3268317241269276e-05, 'epoch': 0.79} {'loss': 0.7027, 'learning_rate': 1.3268007865297859e-05, 'epoch': 0.79} {'loss': 0.8419, 'learning_rate': 1.3267698485824476e-05, 'epoch': 0.79} {'loss': 0.7871, 'learning_rate': 1.3267389102849462e-05, 'epoch': 0.79} {'loss': 0.6856, 'learning_rate': 1.3267079716373143e-05, 'epoch': 0.79} {'loss': 0.7715, 'learning_rate': 1.3266770326395855e-05, 'epoch': 0.79} {'loss': 0.9808, 'learning_rate': 1.3266460932917929e-05, 'epoch': 0.79} {'loss': 0.9659, 'learning_rate': 1.326615153593969e-05, 'epoch': 0.79} {'loss': 0.7172, 'learning_rate': 1.3265842135461477e-05, 'epoch': 0.79} {'loss': 0.8369, 'learning_rate': 1.3265532731483624e-05, 'epoch': 0.79} {'loss': 0.7996, 'learning_rate': 1.3265223324006453e-05, 'epoch': 0.79} {'loss': 0.7354, 'learning_rate': 1.3264913913030302e-05, 'epoch': 0.79} {'loss': 0.7688, 'learning_rate': 1.32646044985555e-05, 'epoch': 0.79} {'loss': 0.7321, 'learning_rate': 1.3264295080582382e-05, 'epoch': 0.79} {'loss': 0.812, 'learning_rate': 1.3263985659111276e-05, 'epoch': 0.79} {'loss': 0.8673, 'learning_rate': 1.3263676234142513e-05, 'epoch': 0.79} {'loss': 0.8337, 'learning_rate': 1.326336680567643e-05, 'epoch': 0.79} {'loss': 0.8194, 'learning_rate': 1.3263057373713351e-05, 'epoch': 0.79} {'loss': 0.8677, 'learning_rate': 1.3262747938253613e-05, 'epoch': 0.79} {'loss': 0.8409, 'learning_rate': 1.3262438499297548e-05, 'epoch': 0.79} {'loss': 0.7997, 'learning_rate': 1.3262129056845483e-05, 'epoch': 0.79} {'loss': 0.7879, 'learning_rate': 1.3261819610897752e-05, 'epoch': 0.79} {'loss': 0.8969, 'learning_rate': 1.3261510161454692e-05, 'epoch': 0.79} {'loss': 0.8356, 'learning_rate': 1.3261200708516624e-05, 'epoch': 0.79} {'loss': 1.1022, 'learning_rate': 1.3260891252083887e-05, 'epoch': 0.79} {'loss': 0.7472, 'learning_rate': 1.3260581792156811e-05, 'epoch': 0.79} {'loss': 0.6964, 'learning_rate': 1.3260272328735729e-05, 'epoch': 0.79} {'loss': 0.7409, 'learning_rate': 1.3259962861820968e-05, 'epoch': 0.79} {'loss': 0.9637, 'learning_rate': 1.3259653391412864e-05, 'epoch': 0.79} {'loss': 0.9555, 'learning_rate': 1.3259343917511744e-05, 'epoch': 0.79} {'loss': 0.8007, 'learning_rate': 1.3259034440117946e-05, 'epoch': 0.79} {'loss': 0.7497, 'learning_rate': 1.3258724959231798e-05, 'epoch': 0.79} {'loss': 0.7744, 'learning_rate': 1.325841547485363e-05, 'epoch': 0.79} {'loss': 0.6938, 'learning_rate': 1.3258105986983781e-05, 'epoch': 0.79} {'loss': 0.7774, 'learning_rate': 1.3257796495622575e-05, 'epoch': 0.79} {'loss': 0.7198, 'learning_rate': 1.3257487000770343e-05, 'epoch': 0.79} {'loss': 0.7954, 'learning_rate': 1.3257177502427423e-05, 'epoch': 0.79} {'loss': 0.7453, 'learning_rate': 1.325686800059414e-05, 'epoch': 0.79} {'loss': 0.8297, 'learning_rate': 1.3256558495270833e-05, 'epoch': 0.79} {'loss': 0.8258, 'learning_rate': 1.3256248986457826e-05, 'epoch': 0.79} {'loss': 0.786, 'learning_rate': 1.3255939474155457e-05, 'epoch': 0.79} {'loss': 0.8194, 'learning_rate': 1.3255629958364056e-05, 'epoch': 0.79} {'loss': 0.8334, 'learning_rate': 1.3255320439083951e-05, 'epoch': 0.79} {'loss': 0.8629, 'learning_rate': 1.3255010916315477e-05, 'epoch': 0.79} {'loss': 0.7883, 'learning_rate': 1.3254701390058963e-05, 'epoch': 0.79} {'loss': 0.8404, 'learning_rate': 1.3254391860314746e-05, 'epoch': 0.79} {'loss': 0.7505, 'learning_rate': 1.3254082327083153e-05, 'epoch': 0.79} {'loss': 0.8602, 'learning_rate': 1.3253772790364519e-05, 'epoch': 0.79} {'loss': 0.8113, 'learning_rate': 1.3253463250159172e-05, 'epoch': 0.79} {'loss': 1.0075, 'learning_rate': 1.3253153706467445e-05, 'epoch': 0.79} {'loss': 0.9778, 'learning_rate': 1.325284415928967e-05, 'epoch': 0.79} {'loss': 0.7947, 'learning_rate': 1.325253460862618e-05, 'epoch': 0.79} {'loss': 0.687, 'learning_rate': 1.3252225054477303e-05, 'epoch': 0.79} {'loss': 0.9878, 'learning_rate': 1.3251915496843378e-05, 'epoch': 0.79} {'loss': 0.7837, 'learning_rate': 1.325160593572473e-05, 'epoch': 0.79} {'loss': 0.8779, 'learning_rate': 1.3251296371121694e-05, 'epoch': 0.79} {'loss': 0.8508, 'learning_rate': 1.3250986803034597e-05, 'epoch': 0.79} {'loss': 0.7079, 'learning_rate': 1.3250677231463776e-05, 'epoch': 0.79} {'loss': 0.8729, 'learning_rate': 1.3250367656409559e-05, 'epoch': 0.79} {'loss': 0.7495, 'learning_rate': 1.3250058077872283e-05, 'epoch': 0.79} {'loss': 0.8129, 'learning_rate': 1.3249748495852277e-05, 'epoch': 0.79} {'loss': 0.6797, 'learning_rate': 1.3249438910349869e-05, 'epoch': 0.79} {'loss': 0.8206, 'learning_rate': 1.3249129321365397e-05, 'epoch': 0.79} {'loss': 0.9232, 'learning_rate': 1.3248819728899188e-05, 'epoch': 0.79} {'loss': 0.9058, 'learning_rate': 1.3248510132951573e-05, 'epoch': 0.79} {'loss': 0.9219, 'learning_rate': 1.3248200533522888e-05, 'epoch': 0.79} {'loss': 0.9461, 'learning_rate': 1.3247890930613466e-05, 'epoch': 0.79} {'loss': 0.8017, 'learning_rate': 1.3247581324223632e-05, 'epoch': 0.79} {'loss': 0.9229, 'learning_rate': 1.3247271714353725e-05, 'epoch': 0.79} {'loss': 0.8479, 'learning_rate': 1.3246962101004071e-05, 'epoch': 0.79} {'loss': 0.7058, 'learning_rate': 1.3246652484175002e-05, 'epoch': 0.79} {'loss': 0.9643, 'learning_rate': 1.3246342863866852e-05, 'epoch': 0.79} {'loss': 0.8218, 'learning_rate': 1.324603324007996e-05, 'epoch': 0.79} {'loss': 0.841, 'learning_rate': 1.3245723612814643e-05, 'epoch': 0.79} {'loss': 0.8089, 'learning_rate': 1.324541398207124e-05, 'epoch': 0.79} {'loss': 0.7508, 'learning_rate': 1.3245104347850086e-05, 'epoch': 0.79} {'loss': 0.8115, 'learning_rate': 1.3244794710151509e-05, 'epoch': 0.79} {'loss': 0.695, 'learning_rate': 1.324448506897584e-05, 'epoch': 0.79} {'loss': 0.8083, 'learning_rate': 1.3244175424323417e-05, 'epoch': 0.79} {'loss': 0.9305, 'learning_rate': 1.3243865776194565e-05, 'epoch': 0.79} {'loss': 0.8009, 'learning_rate': 1.3243556124589616e-05, 'epoch': 0.79} {'loss': 0.7648, 'learning_rate': 1.3243246469508904e-05, 'epoch': 0.79} {'loss': 0.9196, 'learning_rate': 1.3242936810952762e-05, 'epoch': 0.79} {'loss': 0.8599, 'learning_rate': 1.3242627148921521e-05, 'epoch': 0.79} {'loss': 0.8221, 'learning_rate': 1.3242317483415511e-05, 'epoch': 0.79} {'loss': 0.846, 'learning_rate': 1.3242007814435068e-05, 'epoch': 0.79} {'loss': 0.6972, 'learning_rate': 1.3241698141980517e-05, 'epoch': 0.79} {'loss': 0.9136, 'learning_rate': 1.3241388466052197e-05, 'epoch': 0.79} {'loss': 0.7506, 'learning_rate': 1.3241078786650432e-05, 'epoch': 0.79} {'loss': 0.7187, 'learning_rate': 1.3240769103775563e-05, 'epoch': 0.79} {'loss': 0.6785, 'learning_rate': 1.3240459417427917e-05, 'epoch': 0.79} {'loss': 0.6672, 'learning_rate': 1.3240149727607827e-05, 'epoch': 0.79} {'loss': 0.9552, 'learning_rate': 1.3239840034315623e-05, 'epoch': 0.79} {'loss': 0.7362, 'learning_rate': 1.3239530337551636e-05, 'epoch': 0.79} {'loss': 0.715, 'learning_rate': 1.3239220637316202e-05, 'epoch': 0.79} {'loss': 1.0021, 'learning_rate': 1.323891093360965e-05, 'epoch': 0.79} {'loss': 0.7945, 'learning_rate': 1.3238601226432315e-05, 'epoch': 0.79} {'loss': 0.8789, 'learning_rate': 1.3238291515784525e-05, 'epoch': 0.79} {'loss': 0.9125, 'learning_rate': 1.3237981801666612e-05, 'epoch': 0.79} {'loss': 0.7944, 'learning_rate': 1.323767208407891e-05, 'epoch': 0.79} {'loss': 0.904, 'learning_rate': 1.323736236302175e-05, 'epoch': 0.79} {'loss': 0.7113, 'learning_rate': 1.3237052638495463e-05, 'epoch': 0.79} {'loss': 0.6779, 'learning_rate': 1.3236742910500384e-05, 'epoch': 0.79} {'loss': 0.8756, 'learning_rate': 1.3236433179036844e-05, 'epoch': 0.79} {'loss': 0.7532, 'learning_rate': 1.3236123444105171e-05, 'epoch': 0.79} {'loss': 0.7887, 'learning_rate': 1.32358137057057e-05, 'epoch': 0.79} {'loss': 0.7955, 'learning_rate': 1.3235503963838762e-05, 'epoch': 0.79} {'loss': 0.6313, 'learning_rate': 1.323519421850469e-05, 'epoch': 0.79} {'loss': 1.0722, 'learning_rate': 1.3234884469703815e-05, 'epoch': 0.79} {'loss': 0.6467, 'learning_rate': 1.3234574717436472e-05, 'epoch': 0.79} {'loss': 0.9542, 'learning_rate': 1.3234264961702992e-05, 'epoch': 0.79} {'loss': 0.8503, 'learning_rate': 1.3233955202503698e-05, 'epoch': 0.79} {'loss': 0.6632, 'learning_rate': 1.3233645439838934e-05, 'epoch': 0.79} {'loss': 0.6515, 'learning_rate': 1.3233335673709025e-05, 'epoch': 0.79} {'loss': 0.7899, 'learning_rate': 1.3233025904114305e-05, 'epoch': 0.79} {'loss': 0.8318, 'learning_rate': 1.3232716131055106e-05, 'epoch': 0.79} {'loss': 0.8392, 'learning_rate': 1.3232406354531761e-05, 'epoch': 0.79} {'loss': 0.8118, 'learning_rate': 1.3232096574544602e-05, 'epoch': 0.79} {'loss': 0.7571, 'learning_rate': 1.3231786791093959e-05, 'epoch': 0.79} {'loss': 0.7031, 'learning_rate': 1.3231477004180163e-05, 'epoch': 0.79} {'loss': 0.8239, 'learning_rate': 1.3231167213803548e-05, 'epoch': 0.79} {'loss': 0.9106, 'learning_rate': 1.3230857419964447e-05, 'epoch': 0.79} {'loss': 0.8485, 'learning_rate': 1.323054762266319e-05, 'epoch': 0.79} {'loss': 0.7877, 'learning_rate': 1.323023782190011e-05, 'epoch': 0.79} {'loss': 0.7647, 'learning_rate': 1.322992801767554e-05, 'epoch': 0.79} {'loss': 0.7641, 'learning_rate': 1.3229618209989807e-05, 'epoch': 0.79} {'loss': 0.8419, 'learning_rate': 1.322930839884325e-05, 'epoch': 0.79} {'loss': 0.8504, 'learning_rate': 1.3228998584236194e-05, 'epoch': 0.79} {'loss': 0.8426, 'learning_rate': 1.3228688766168978e-05, 'epoch': 0.79} {'loss': 0.8755, 'learning_rate': 1.322837894464193e-05, 'epoch': 0.79} {'loss': 0.7879, 'learning_rate': 1.3228069119655382e-05, 'epoch': 0.79} {'loss': 0.8352, 'learning_rate': 1.3227759291209668e-05, 'epoch': 0.79} {'loss': 0.8069, 'learning_rate': 1.3227449459305115e-05, 'epoch': 0.79} {'loss': 0.7939, 'learning_rate': 1.3227139623942061e-05, 'epoch': 0.79} {'loss': 0.8382, 'learning_rate': 1.3226829785120834e-05, 'epoch': 0.79} {'loss': 0.9505, 'learning_rate': 1.322651994284177e-05, 'epoch': 0.79} {'loss': 0.822, 'learning_rate': 1.3226210097105198e-05, 'epoch': 0.79} {'loss': 0.7501, 'learning_rate': 1.3225900247911451e-05, 'epoch': 0.79} {'loss': 0.8185, 'learning_rate': 1.322559039526086e-05, 'epoch': 0.79} {'loss': 0.9014, 'learning_rate': 1.3225280539153758e-05, 'epoch': 0.79} {'loss': 0.6883, 'learning_rate': 1.3224970679590476e-05, 'epoch': 0.79} {'loss': 0.9383, 'learning_rate': 1.3224660816571348e-05, 'epoch': 0.79} {'loss': 0.8628, 'learning_rate': 1.3224350950096704e-05, 'epoch': 0.79} {'loss': 0.8576, 'learning_rate': 1.3224041080166879e-05, 'epoch': 0.79} {'loss': 0.9324, 'learning_rate': 1.3223731206782203e-05, 'epoch': 0.79} {'loss': 0.689, 'learning_rate': 1.3223421329943004e-05, 'epoch': 0.79} {'loss': 0.7708, 'learning_rate': 1.322311144964962e-05, 'epoch': 0.79} {'loss': 0.8508, 'learning_rate': 1.3222801565902381e-05, 'epoch': 0.79} {'loss': 0.8555, 'learning_rate': 1.3222491678701622e-05, 'epoch': 0.79} {'loss': 0.8158, 'learning_rate': 1.322218178804767e-05, 'epoch': 0.79} {'loss': 0.6611, 'learning_rate': 1.3221871893940858e-05, 'epoch': 0.79} {'loss': 0.9647, 'learning_rate': 1.3221561996381524e-05, 'epoch': 0.79} {'loss': 0.9079, 'learning_rate': 1.3221252095369991e-05, 'epoch': 0.79} {'loss': 0.8273, 'learning_rate': 1.3220942190906599e-05, 'epoch': 0.79} {'loss': 0.695, 'learning_rate': 1.3220632282991674e-05, 'epoch': 0.8} {'loss': 0.8052, 'learning_rate': 1.3220322371625551e-05, 'epoch': 0.8} {'loss': 0.7574, 'learning_rate': 1.3220012456808565e-05, 'epoch': 0.8} {'loss': 0.958, 'learning_rate': 1.321970253854104e-05, 'epoch': 0.8} {'loss': 0.782, 'learning_rate': 1.3219392616823318e-05, 'epoch': 0.8} {'loss': 0.7926, 'learning_rate': 1.3219082691655723e-05, 'epoch': 0.8} {'loss': 0.6966, 'learning_rate': 1.3218772763038595e-05, 'epoch': 0.8} {'loss': 0.7575, 'learning_rate': 1.3218462830972256e-05, 'epoch': 0.8} {'loss': 0.8629, 'learning_rate': 1.3218152895457045e-05, 'epoch': 0.8} {'loss': 0.8531, 'learning_rate': 1.3217842956493293e-05, 'epoch': 0.8} {'loss': 0.7733, 'learning_rate': 1.3217533014081332e-05, 'epoch': 0.8} {'loss': 0.6614, 'learning_rate': 1.3217223068221495e-05, 'epoch': 0.8} {'loss': 0.6994, 'learning_rate': 1.3216913118914111e-05, 'epoch': 0.8} {'loss': 0.8892, 'learning_rate': 1.3216603166159519e-05, 'epoch': 0.8} {'loss': 0.8266, 'learning_rate': 1.3216293209958043e-05, 'epoch': 0.8} {'loss': 0.7753, 'learning_rate': 1.3215983250310017e-05, 'epoch': 0.8} {'loss': 0.7079, 'learning_rate': 1.3215673287215776e-05, 'epoch': 0.8} {'loss': 0.6918, 'learning_rate': 1.321536332067565e-05, 'epoch': 0.8} {'loss': 0.7356, 'learning_rate': 1.3215053350689973e-05, 'epoch': 0.8} {'loss': 0.7596, 'learning_rate': 1.3214743377259078e-05, 'epoch': 0.8} {'loss': 0.7784, 'learning_rate': 1.3214433400383293e-05, 'epoch': 0.8} {'loss': 0.8463, 'learning_rate': 1.3214123420062952e-05, 'epoch': 0.8} {'loss': 0.761, 'learning_rate': 1.3213813436298388e-05, 'epoch': 0.8} {'loss': 0.7429, 'learning_rate': 1.3213503449089933e-05, 'epoch': 0.8} {'loss': 0.8133, 'learning_rate': 1.3213193458437923e-05, 'epoch': 0.8} {'loss': 0.8228, 'learning_rate': 1.3212883464342681e-05, 'epoch': 0.8} {'loss': 0.6527, 'learning_rate': 1.3212573466804549e-05, 'epoch': 0.8} {'loss': 0.6705, 'learning_rate': 1.321226346582385e-05, 'epoch': 0.8} {'loss': 0.9396, 'learning_rate': 1.3211953461400921e-05, 'epoch': 0.8} {'loss': 0.9036, 'learning_rate': 1.3211643453536094e-05, 'epoch': 0.8} {'loss': 0.7754, 'learning_rate': 1.3211333442229703e-05, 'epoch': 0.8} {'loss': 0.7681, 'learning_rate': 1.321102342748208e-05, 'epoch': 0.8} {'loss': 0.6924, 'learning_rate': 1.3210713409293555e-05, 'epoch': 0.8} {'loss': 0.8559, 'learning_rate': 1.3210403387664457e-05, 'epoch': 0.8} {'loss': 0.8046, 'learning_rate': 1.3210093362595125e-05, 'epoch': 0.8} {'loss': 0.8254, 'learning_rate': 1.3209783334085887e-05, 'epoch': 0.8} {'loss': 0.8164, 'learning_rate': 1.3209473302137076e-05, 'epoch': 0.8} {'loss': 0.7086, 'learning_rate': 1.3209163266749026e-05, 'epoch': 0.8} {'loss': 0.6081, 'learning_rate': 1.320885322792207e-05, 'epoch': 0.8} {'loss': 0.8979, 'learning_rate': 1.3208543185656535e-05, 'epoch': 0.8} {'loss': 0.8786, 'learning_rate': 1.3208233139952757e-05, 'epoch': 0.8} {'loss': 0.7722, 'learning_rate': 1.3207923090811067e-05, 'epoch': 0.8} {'loss': 0.8883, 'learning_rate': 1.3207613038231799e-05, 'epoch': 0.8} {'loss': 0.836, 'learning_rate': 1.3207302982215282e-05, 'epoch': 0.8} {'loss': 1.0273, 'learning_rate': 1.3206992922761854e-05, 'epoch': 0.8} {'loss': 0.9792, 'learning_rate': 1.3206682859871842e-05, 'epoch': 0.8} {'loss': 0.9464, 'learning_rate': 1.3206372793545581e-05, 'epoch': 0.8} {'loss': 0.8518, 'learning_rate': 1.3206062723783399e-05, 'epoch': 0.8} {'loss': 0.8541, 'learning_rate': 1.3205752650585634e-05, 'epoch': 0.8} {'loss': 0.8104, 'learning_rate': 1.3205442573952614e-05, 'epoch': 0.8} {'loss': 0.7661, 'learning_rate': 1.3205132493884675e-05, 'epoch': 0.8} {'loss': 0.8113, 'learning_rate': 1.3204822410382145e-05, 'epoch': 0.8} {'loss': 0.7882, 'learning_rate': 1.320451232344536e-05, 'epoch': 0.8} {'loss': 0.8726, 'learning_rate': 1.3204202233074653e-05, 'epoch': 0.8} {'loss': 0.8208, 'learning_rate': 1.3203892139270349e-05, 'epoch': 0.8} {'loss': 0.7728, 'learning_rate': 1.320358204203279e-05, 'epoch': 0.8} {'loss': 1.0123, 'learning_rate': 1.32032719413623e-05, 'epoch': 0.8} {'loss': 0.7544, 'learning_rate': 1.3202961837259217e-05, 'epoch': 0.8} {'loss': 0.8767, 'learning_rate': 1.3202651729723872e-05, 'epoch': 0.8} {'loss': 0.7744, 'learning_rate': 1.3202341618756593e-05, 'epoch': 0.8} {'loss': 0.7668, 'learning_rate': 1.3202031504357721e-05, 'epoch': 0.8} {'loss': 0.8691, 'learning_rate': 1.3201721386527582e-05, 'epoch': 0.8} {'loss': 0.7094, 'learning_rate': 1.3201411265266506e-05, 'epoch': 0.8} {'loss': 0.7508, 'learning_rate': 1.3201101140574832e-05, 'epoch': 0.8} {'loss': 0.8374, 'learning_rate': 1.320079101245289e-05, 'epoch': 0.8} {'loss': 0.8646, 'learning_rate': 1.320048088090101e-05, 'epoch': 0.8} {'loss': 0.772, 'learning_rate': 1.3200170745919527e-05, 'epoch': 0.8} {'loss': 0.9518, 'learning_rate': 1.319986060750877e-05, 'epoch': 0.8} {'loss': 0.832, 'learning_rate': 1.3199550465669075e-05, 'epoch': 0.8} {'loss': 0.9379, 'learning_rate': 1.3199240320400773e-05, 'epoch': 0.8} {'loss': 0.7693, 'learning_rate': 1.3198930171704195e-05, 'epoch': 0.8} {'loss': 0.8557, 'learning_rate': 1.3198620019579675e-05, 'epoch': 0.8} {'loss': 0.6814, 'learning_rate': 1.3198309864027545e-05, 'epoch': 0.8} {'loss': 0.892, 'learning_rate': 1.3197999705048138e-05, 'epoch': 0.8} {'loss': 0.8368, 'learning_rate': 1.3197689542641787e-05, 'epoch': 0.8} {'loss': 0.8028, 'learning_rate': 1.3197379376808823e-05, 'epoch': 0.8} {'loss': 0.7248, 'learning_rate': 1.3197069207549575e-05, 'epoch': 0.8} {'loss': 0.8801, 'learning_rate': 1.319675903486438e-05, 'epoch': 0.8} {'loss': 0.8797, 'learning_rate': 1.319644885875357e-05, 'epoch': 0.8} {'loss': 0.5106, 'learning_rate': 1.3196138679217473e-05, 'epoch': 0.8} {'loss': 0.7293, 'learning_rate': 1.3195828496256432e-05, 'epoch': 0.8} {'loss': 0.6862, 'learning_rate': 1.3195518309870768e-05, 'epoch': 0.8} {'loss': 0.8612, 'learning_rate': 1.319520812006082e-05, 'epoch': 0.8} {'loss': 0.8598, 'learning_rate': 1.3194897926826915e-05, 'epoch': 0.8} {'loss': 0.7537, 'learning_rate': 1.319458773016939e-05, 'epoch': 0.8} {'loss': 0.8017, 'learning_rate': 1.3194277530088576e-05, 'epoch': 0.8} {'loss': 0.9253, 'learning_rate': 1.3193967326584804e-05, 'epoch': 0.8} {'loss': 0.7963, 'learning_rate': 1.319365711965841e-05, 'epoch': 0.8} {'loss': 0.7166, 'learning_rate': 1.3193346909309725e-05, 'epoch': 0.8} {'loss': 0.9492, 'learning_rate': 1.319303669553908e-05, 'epoch': 0.8} {'loss': 0.7674, 'learning_rate': 1.3192726478346805e-05, 'epoch': 0.8} {'loss': 0.942, 'learning_rate': 1.3192416257733237e-05, 'epoch': 0.8} {'loss': 0.7066, 'learning_rate': 1.3192106033698706e-05, 'epoch': 0.8} {'loss': 0.8185, 'learning_rate': 1.3191795806243546e-05, 'epoch': 0.8} {'loss': 0.7968, 'learning_rate': 1.319148557536809e-05, 'epoch': 0.8} {'loss': 0.8683, 'learning_rate': 1.3191175341072668e-05, 'epoch': 0.8} {'loss': 0.8361, 'learning_rate': 1.3190865103357613e-05, 'epoch': 0.8} {'loss': 0.9374, 'learning_rate': 1.319055486222326e-05, 'epoch': 0.8} {'loss': 0.6219, 'learning_rate': 1.3190244617669937e-05, 'epoch': 0.8} {'loss': 0.8098, 'learning_rate': 1.3189934369697979e-05, 'epoch': 0.8} {'loss': 0.753, 'learning_rate': 1.3189624118307721e-05, 'epoch': 0.8} {'loss': 0.6142, 'learning_rate': 1.3189313863499491e-05, 'epoch': 0.8} {'loss': 0.7867, 'learning_rate': 1.3189003605273625e-05, 'epoch': 0.8} {'loss': 0.7424, 'learning_rate': 1.3188693343630452e-05, 'epoch': 0.8} {'loss': 0.5988, 'learning_rate': 1.3188383078570306e-05, 'epoch': 0.8} {'loss': 0.7555, 'learning_rate': 1.318807281009352e-05, 'epoch': 0.8} {'loss': 0.7883, 'learning_rate': 1.3187762538200425e-05, 'epoch': 0.8} {'loss': 0.8578, 'learning_rate': 1.318745226289136e-05, 'epoch': 0.8} {'loss': 0.7533, 'learning_rate': 1.318714198416665e-05, 'epoch': 0.8} {'loss': 0.8812, 'learning_rate': 1.3186831702026628e-05, 'epoch': 0.8} {'loss': 0.8408, 'learning_rate': 1.318652141647163e-05, 'epoch': 0.8} {'loss': 0.8097, 'learning_rate': 1.3186211127501985e-05, 'epoch': 0.8} {'loss': 0.7844, 'learning_rate': 1.3185900835118026e-05, 'epoch': 0.8} {'loss': 0.7642, 'learning_rate': 1.318559053932009e-05, 'epoch': 0.8} {'loss': 0.8571, 'learning_rate': 1.3185280240108505e-05, 'epoch': 0.8} {'loss': 0.8399, 'learning_rate': 1.3184969937483605e-05, 'epoch': 0.8} {'loss': 0.7057, 'learning_rate': 1.318465963144572e-05, 'epoch': 0.8} {'loss': 0.6772, 'learning_rate': 1.3184349321995185e-05, 'epoch': 0.8} {'loss': 0.8304, 'learning_rate': 1.3184039009132334e-05, 'epoch': 0.8} {'loss': 0.7665, 'learning_rate': 1.3183728692857498e-05, 'epoch': 0.8} {'loss': 0.6855, 'learning_rate': 1.3183418373171008e-05, 'epoch': 0.8} {'loss': 0.8645, 'learning_rate': 1.3183108050073199e-05, 'epoch': 0.8} {'loss': 0.7954, 'learning_rate': 1.3182797723564404e-05, 'epoch': 0.8} {'loss': 0.7055, 'learning_rate': 1.3182487393644951e-05, 'epoch': 0.8} {'loss': 0.6661, 'learning_rate': 1.3182177060315176e-05, 'epoch': 0.8} {'loss': 0.8359, 'learning_rate': 1.3181866723575412e-05, 'epoch': 0.8} {'loss': 0.8829, 'learning_rate': 1.3181556383425991e-05, 'epoch': 0.8} {'loss': 0.8313, 'learning_rate': 1.3181246039867243e-05, 'epoch': 0.8} {'loss': 0.9939, 'learning_rate': 1.3180935692899506e-05, 'epoch': 0.8} {'loss': 0.7869, 'learning_rate': 1.3180625342523108e-05, 'epoch': 0.8} {'loss': 0.825, 'learning_rate': 1.3180314988738383e-05, 'epoch': 0.8} {'loss': 0.731, 'learning_rate': 1.3180004631545662e-05, 'epoch': 0.8} {'loss': 0.8181, 'learning_rate': 1.317969427094528e-05, 'epoch': 0.8} {'loss': 0.864, 'learning_rate': 1.3179383906937568e-05, 'epoch': 0.8} {'loss': 0.81, 'learning_rate': 1.317907353952286e-05, 'epoch': 0.8} {'loss': 0.8523, 'learning_rate': 1.3178763168701487e-05, 'epoch': 0.8} {'loss': 0.8989, 'learning_rate': 1.3178452794473783e-05, 'epoch': 0.8} {'loss': 0.7548, 'learning_rate': 1.317814241684008e-05, 'epoch': 0.8} {'loss': 0.7253, 'learning_rate': 1.317783203580071e-05, 'epoch': 0.8} {'loss': 0.7219, 'learning_rate': 1.3177521651356008e-05, 'epoch': 0.8} {'loss': 0.7641, 'learning_rate': 1.3177211263506302e-05, 'epoch': 0.8} {'loss': 0.8574, 'learning_rate': 1.3176900872251928e-05, 'epoch': 0.8} {'loss': 0.8512, 'learning_rate': 1.3176590477593221e-05, 'epoch': 0.8} {'loss': 0.88, 'learning_rate': 1.3176280079530508e-05, 'epoch': 0.8} {'loss': 0.7589, 'learning_rate': 1.3175969678064124e-05, 'epoch': 0.8} {'loss': 0.9093, 'learning_rate': 1.3175659273194403e-05, 'epoch': 0.8} {'loss': 0.8018, 'learning_rate': 1.3175348864921675e-05, 'epoch': 0.8} {'loss': 0.7552, 'learning_rate': 1.3175038453246274e-05, 'epoch': 0.8} {'loss': 0.7815, 'learning_rate': 1.3174728038168534e-05, 'epoch': 0.8} {'loss': 0.8357, 'learning_rate': 1.3174417619688786e-05, 'epoch': 0.8} {'loss': 0.8569, 'learning_rate': 1.3174107197807363e-05, 'epoch': 0.8} {'loss': 0.8141, 'learning_rate': 1.3173796772524599e-05, 'epoch': 0.8} {'loss': 0.833, 'learning_rate': 1.3173486343840823e-05, 'epoch': 0.8} {'loss': 0.7567, 'learning_rate': 1.317317591175637e-05, 'epoch': 0.8} {'loss': 0.7382, 'learning_rate': 1.3172865476271573e-05, 'epoch': 0.8} {'loss': 0.771, 'learning_rate': 1.3172555037386766e-05, 'epoch': 0.8} {'loss': 0.6493, 'learning_rate': 1.317224459510228e-05, 'epoch': 0.8} {'loss': 0.8016, 'learning_rate': 1.3171934149418446e-05, 'epoch': 0.8} {'loss': 0.674, 'learning_rate': 1.3171623700335598e-05, 'epoch': 0.8} {'loss': 0.7874, 'learning_rate': 1.3171313247854069e-05, 'epoch': 0.8} {'loss': 0.8038, 'learning_rate': 1.3171002791974191e-05, 'epoch': 0.8} {'loss': 0.9709, 'learning_rate': 1.31706923326963e-05, 'epoch': 0.8} {'loss': 0.8243, 'learning_rate': 1.3170381870020723e-05, 'epoch': 0.8} {'loss': 0.928, 'learning_rate': 1.31700714039478e-05, 'epoch': 0.8} {'loss': 0.695, 'learning_rate': 1.3169760934477858e-05, 'epoch': 0.8} {'loss': 0.7201, 'learning_rate': 1.3169450461611228e-05, 'epoch': 0.8} {'loss': 0.7657, 'learning_rate': 1.3169139985348248e-05, 'epoch': 0.8} {'loss': 0.5722, 'learning_rate': 1.3168829505689247e-05, 'epoch': 0.8} {'loss': 0.8897, 'learning_rate': 1.3168519022634558e-05, 'epoch': 0.8} {'loss': 0.8014, 'learning_rate': 1.3168208536184518e-05, 'epoch': 0.8} {'loss': 0.6843, 'learning_rate': 1.3167898046339456e-05, 'epoch': 0.8} {'loss': 0.7953, 'learning_rate': 1.3167587553099706e-05, 'epoch': 0.8} {'loss': 0.9309, 'learning_rate': 1.3167277056465597e-05, 'epoch': 0.8} {'loss': 0.8661, 'learning_rate': 1.3166966556437468e-05, 'epoch': 0.8} {'loss': 0.8406, 'learning_rate': 1.3166656053015645e-05, 'epoch': 0.8} {'loss': 0.8628, 'learning_rate': 1.3166345546200466e-05, 'epoch': 0.8} {'loss': 0.8878, 'learning_rate': 1.3166035035992264e-05, 'epoch': 0.8} {'loss': 1.0016, 'learning_rate': 1.3165724522391367e-05, 'epoch': 0.8} {'loss': 0.8058, 'learning_rate': 1.3165414005398113e-05, 'epoch': 0.8} {'loss': 0.8048, 'learning_rate': 1.3165103485012831e-05, 'epoch': 0.8} {'loss': 0.7584, 'learning_rate': 1.3164792961235855e-05, 'epoch': 0.8} {'loss': 0.8066, 'learning_rate': 1.3164482434067516e-05, 'epoch': 0.8} {'loss': 0.9425, 'learning_rate': 1.3164171903508152e-05, 'epoch': 0.8} {'loss': 0.7057, 'learning_rate': 1.3163861369558089e-05, 'epoch': 0.8} {'loss': 0.8729, 'learning_rate': 1.3163550832217664e-05, 'epoch': 0.8} {'loss': 0.7079, 'learning_rate': 1.316324029148721e-05, 'epoch': 0.8} {'loss': 0.798, 'learning_rate': 1.3162929747367054e-05, 'epoch': 0.8} {'loss': 0.8169, 'learning_rate': 1.3162619199857538e-05, 'epoch': 0.8} {'loss': 0.8923, 'learning_rate': 1.3162308648958988e-05, 'epoch': 0.8} {'loss': 0.8439, 'learning_rate': 1.3161998094671739e-05, 'epoch': 0.8} {'loss': 0.9094, 'learning_rate': 1.3161687536996126e-05, 'epoch': 0.8} {'loss': 0.6887, 'learning_rate': 1.3161376975932478e-05, 'epoch': 0.8} {'loss': 0.7435, 'learning_rate': 1.3161066411481129e-05, 'epoch': 0.8} {'loss': 0.7337, 'learning_rate': 1.3160755843642413e-05, 'epoch': 0.8} {'loss': 0.8686, 'learning_rate': 1.3160445272416658e-05, 'epoch': 0.8} {'loss': 0.8059, 'learning_rate': 1.3160134697804205e-05, 'epoch': 0.8} {'loss': 0.818, 'learning_rate': 1.315982411980538e-05, 'epoch': 0.8} {'loss': 0.6917, 'learning_rate': 1.3159513538420519e-05, 'epoch': 0.8} {'loss': 0.8119, 'learning_rate': 1.3159202953649955e-05, 'epoch': 0.8} {'loss': 0.8041, 'learning_rate': 1.3158892365494019e-05, 'epoch': 0.8} {'loss': 0.8769, 'learning_rate': 1.3158581773953043e-05, 'epoch': 0.8} {'loss': 0.7284, 'learning_rate': 1.3158271179027367e-05, 'epoch': 0.8} {'loss': 0.7918, 'learning_rate': 1.3157960580717312e-05, 'epoch': 0.8} {'loss': 0.842, 'learning_rate': 1.315764997902322e-05, 'epoch': 0.8} {'loss': 0.8908, 'learning_rate': 1.315733937394542e-05, 'epoch': 0.8} {'loss': 0.7387, 'learning_rate': 1.315702876548425e-05, 'epoch': 0.8} {'loss': 0.7888, 'learning_rate': 1.3156718153640035e-05, 'epoch': 0.8} {'loss': 0.771, 'learning_rate': 1.3156407538413114e-05, 'epoch': 0.8} {'loss': 0.74, 'learning_rate': 1.3156096919803813e-05, 'epoch': 0.8} {'loss': 0.8118, 'learning_rate': 1.3155786297812472e-05, 'epoch': 0.8} {'loss': 0.7653, 'learning_rate': 1.3155475672439422e-05, 'epoch': 0.8} {'loss': 0.8226, 'learning_rate': 1.3155165043684992e-05, 'epoch': 0.8} {'loss': 0.6477, 'learning_rate': 1.3154854411549522e-05, 'epoch': 0.8} {'loss': 0.8268, 'learning_rate': 1.315454377603334e-05, 'epoch': 0.8} {'loss': 0.6646, 'learning_rate': 1.3154233137136778e-05, 'epoch': 0.8} {'loss': 0.6202, 'learning_rate': 1.315392249486017e-05, 'epoch': 0.8} {'loss': 0.7464, 'learning_rate': 1.3153611849203851e-05, 'epoch': 0.8} {'loss': 0.8827, 'learning_rate': 1.3153301200168152e-05, 'epoch': 0.8} {'loss': 0.8194, 'learning_rate': 1.3152990547753403e-05, 'epoch': 0.8} {'loss': 0.6397, 'learning_rate': 1.3152679891959945e-05, 'epoch': 0.8} {'loss': 0.7965, 'learning_rate': 1.3152369232788105e-05, 'epoch': 0.8} {'loss': 0.7994, 'learning_rate': 1.3152058570238215e-05, 'epoch': 0.8} {'loss': 0.7918, 'learning_rate': 1.315174790431061e-05, 'epoch': 0.8} {'loss': 0.7531, 'learning_rate': 1.3151437235005622e-05, 'epoch': 0.8} {'loss': 0.822, 'learning_rate': 1.3151126562323584e-05, 'epoch': 0.8} {'loss': 0.7877, 'learning_rate': 1.3150815886264834e-05, 'epoch': 0.8} {'loss': 0.6559, 'learning_rate': 1.3150505206829695e-05, 'epoch': 0.8} {'loss': 0.8932, 'learning_rate': 1.3150194524018512e-05, 'epoch': 0.8} {'loss': 0.7169, 'learning_rate': 1.3149883837831606e-05, 'epoch': 0.8} {'loss': 0.6836, 'learning_rate': 1.3149573148269314e-05, 'epoch': 0.8} {'loss': 0.754, 'learning_rate': 1.3149262455331972e-05, 'epoch': 0.8} {'loss': 0.795, 'learning_rate': 1.314895175901991e-05, 'epoch': 0.8} {'loss': 0.7893, 'learning_rate': 1.3148641059333467e-05, 'epoch': 0.8} {'loss': 0.8423, 'learning_rate': 1.3148330356272967e-05, 'epoch': 0.8} {'loss': 0.5334, 'learning_rate': 1.3148019649838748e-05, 'epoch': 0.8} {'loss': 0.9285, 'learning_rate': 1.3147708940031139e-05, 'epoch': 0.8} {'loss': 0.737, 'learning_rate': 1.3147398226850477e-05, 'epoch': 0.8} {'loss': 0.664, 'learning_rate': 1.3147087510297094e-05, 'epoch': 0.8} {'loss': 0.6632, 'learning_rate': 1.3146776790371322e-05, 'epoch': 0.8} {'loss': 0.838, 'learning_rate': 1.3146466067073497e-05, 'epoch': 0.8} {'loss': 0.7815, 'learning_rate': 1.314615534040395e-05, 'epoch': 0.8} {'loss': 0.7582, 'learning_rate': 1.3145844610363011e-05, 'epoch': 0.8} {'loss': 0.9022, 'learning_rate': 1.3145533876951018e-05, 'epoch': 0.8} {'loss': 0.7324, 'learning_rate': 1.3145223140168297e-05, 'epoch': 0.8} {'loss': 0.7102, 'learning_rate': 1.314491240001519e-05, 'epoch': 0.8} {'loss': 0.8985, 'learning_rate': 1.3144601656492024e-05, 'epoch': 0.8} {'loss': 0.6982, 'learning_rate': 1.3144290909599136e-05, 'epoch': 0.8} {'loss': 0.8028, 'learning_rate': 1.3143980159336854e-05, 'epoch': 0.8} {'loss': 0.6359, 'learning_rate': 1.3143669405705513e-05, 'epoch': 0.8} {'loss': 0.8071, 'learning_rate': 1.3143358648705446e-05, 'epoch': 0.8} {'loss': 0.7591, 'learning_rate': 1.3143047888336989e-05, 'epoch': 0.8} {'loss': 0.8051, 'learning_rate': 1.3142737124600471e-05, 'epoch': 0.8} {'loss': 0.9403, 'learning_rate': 1.3142426357496224e-05, 'epoch': 0.8} {'loss': 0.6967, 'learning_rate': 1.3142115587024588e-05, 'epoch': 0.8} {'loss': 0.8803, 'learning_rate': 1.314180481318589e-05, 'epoch': 0.8} {'loss': 0.9625, 'learning_rate': 1.3141494035980465e-05, 'epoch': 0.8} {'loss': 0.7267, 'learning_rate': 1.3141183255408646e-05, 'epoch': 0.8} {'loss': 0.8238, 'learning_rate': 1.3140872471470763e-05, 'epoch': 0.8} {'loss': 0.9182, 'learning_rate': 1.3140561684167154e-05, 'epoch': 0.8} {'loss': 0.7608, 'learning_rate': 1.3140250893498148e-05, 'epoch': 0.8} {'loss': 0.8584, 'learning_rate': 1.313994009946408e-05, 'epoch': 0.8} {'loss': 0.8287, 'learning_rate': 1.3139629302065284e-05, 'epoch': 0.8} {'loss': 0.8526, 'learning_rate': 1.3139318501302092e-05, 'epoch': 0.8} {'loss': 0.9433, 'learning_rate': 1.3139007697174835e-05, 'epoch': 0.8} {'loss': 0.7974, 'learning_rate': 1.313869688968385e-05, 'epoch': 0.8} {'loss': 0.7174, 'learning_rate': 1.3138386078829468e-05, 'epoch': 0.8} {'loss': 0.8831, 'learning_rate': 1.313807526461202e-05, 'epoch': 0.8} {'loss': 0.9442, 'learning_rate': 1.3137764447031844e-05, 'epoch': 0.8} {'loss': 0.9295, 'learning_rate': 1.3137453626089269e-05, 'epoch': 0.8} {'loss': 0.7091, 'learning_rate': 1.3137142801784628e-05, 'epoch': 0.8} {'loss': 0.6534, 'learning_rate': 1.3136831974118258e-05, 'epoch': 0.8} {'loss': 0.7356, 'learning_rate': 1.3136521143090486e-05, 'epoch': 0.8} {'loss': 0.7836, 'learning_rate': 1.313621030870165e-05, 'epoch': 0.8} {'loss': 0.9132, 'learning_rate': 1.313589947095208e-05, 'epoch': 0.8} {'loss': 0.9116, 'learning_rate': 1.3135588629842113e-05, 'epoch': 0.8} {'loss': 0.7269, 'learning_rate': 1.3135277785372081e-05, 'epoch': 0.8} {'loss': 0.7136, 'learning_rate': 1.3134966937542313e-05, 'epoch': 0.8} {'loss': 1.072, 'learning_rate': 1.3134656086353147e-05, 'epoch': 0.8} {'loss': 0.8108, 'learning_rate': 1.3134345231804912e-05, 'epoch': 0.8} {'loss': 0.7222, 'learning_rate': 1.3134034373897944e-05, 'epoch': 0.8} {'loss': 0.8057, 'learning_rate': 1.3133723512632575e-05, 'epoch': 0.8} {'loss': 0.7472, 'learning_rate': 1.313341264800914e-05, 'epoch': 0.8} {'loss': 0.8119, 'learning_rate': 1.3133101780027968e-05, 'epoch': 0.8} {'loss': 0.8538, 'learning_rate': 1.3132790908689399e-05, 'epoch': 0.8} {'loss': 0.5958, 'learning_rate': 1.3132480033993757e-05, 'epoch': 0.8} {'loss': 0.7438, 'learning_rate': 1.313216915594138e-05, 'epoch': 0.8} {'loss': 0.6499, 'learning_rate': 1.3131858274532605e-05, 'epoch': 0.8} {'loss': 0.8779, 'learning_rate': 1.3131547389767759e-05, 'epoch': 0.8} {'loss': 0.8646, 'learning_rate': 1.3131236501647178e-05, 'epoch': 0.8} {'loss': 0.8348, 'learning_rate': 1.3130925610171195e-05, 'epoch': 0.8} {'loss': 0.8465, 'learning_rate': 1.3130614715340142e-05, 'epoch': 0.8} {'loss': 0.6714, 'learning_rate': 1.3130303817154351e-05, 'epoch': 0.8} {'loss': 0.8428, 'learning_rate': 1.3129992915614158e-05, 'epoch': 0.8} {'loss': 0.7389, 'learning_rate': 1.3129682010719895e-05, 'epoch': 0.8} {'loss': 0.6044, 'learning_rate': 1.3129371102471895e-05, 'epoch': 0.8} {'loss': 0.6919, 'learning_rate': 1.3129060190870492e-05, 'epoch': 0.8} {'loss': 0.8416, 'learning_rate': 1.3128749275916022e-05, 'epoch': 0.8} {'loss': 0.7711, 'learning_rate': 1.312843835760881e-05, 'epoch': 0.8} {'loss': 0.8376, 'learning_rate': 1.3128127435949194e-05, 'epoch': 0.8} {'loss': 0.7677, 'learning_rate': 1.3127816510937508e-05, 'epoch': 0.8} {'loss': 0.8012, 'learning_rate': 1.3127505582574085e-05, 'epoch': 0.8} {'loss': 0.8641, 'learning_rate': 1.3127194650859258e-05, 'epoch': 0.8} {'loss': 0.7268, 'learning_rate': 1.3126883715793359e-05, 'epoch': 0.8} {'loss': 0.844, 'learning_rate': 1.3126572777376723e-05, 'epoch': 0.8} {'loss': 0.7998, 'learning_rate': 1.3126261835609681e-05, 'epoch': 0.8} {'loss': 0.8202, 'learning_rate': 1.3125950890492565e-05, 'epoch': 0.8} {'loss': 0.7567, 'learning_rate': 1.3125639942025714e-05, 'epoch': 0.8} {'loss': 0.8764, 'learning_rate': 1.3125328990209453e-05, 'epoch': 0.8} {'loss': 0.792, 'learning_rate': 1.3125018035044126e-05, 'epoch': 0.8} {'loss': 0.7854, 'learning_rate': 1.312470707653006e-05, 'epoch': 0.8} {'loss': 0.573, 'learning_rate': 1.3124396114667583e-05, 'epoch': 0.8} {'loss': 0.8696, 'learning_rate': 1.3124085149457038e-05, 'epoch': 0.8} {'loss': 0.7181, 'learning_rate': 1.312377418089875e-05, 'epoch': 0.8} {'loss': 0.7783, 'learning_rate': 1.3123463208993057e-05, 'epoch': 0.8} {'loss': 0.9575, 'learning_rate': 1.3123152233740296e-05, 'epoch': 0.8} {'loss': 0.8383, 'learning_rate': 1.312284125514079e-05, 'epoch': 0.8} {'loss': 0.5383, 'learning_rate': 1.3122530273194882e-05, 'epoch': 0.8} {'loss': 0.9183, 'learning_rate': 1.3122219287902897e-05, 'epoch': 0.8} {'loss': 0.8678, 'learning_rate': 1.3121908299265174e-05, 'epoch': 0.8} {'loss': 0.9039, 'learning_rate': 1.3121597307282044e-05, 'epoch': 0.8} {'loss': 0.6189, 'learning_rate': 1.312128631195384e-05, 'epoch': 0.8} {'loss': 0.9172, 'learning_rate': 1.3120975313280897e-05, 'epoch': 0.8} {'loss': 0.7917, 'learning_rate': 1.3120664311263549e-05, 'epoch': 0.8} {'loss': 0.8755, 'learning_rate': 1.3120353305902127e-05, 'epoch': 0.8} {'loss': 0.982, 'learning_rate': 1.3120042297196962e-05, 'epoch': 0.8} {'loss': 0.8031, 'learning_rate': 1.3119731285148392e-05, 'epoch': 0.8} {'loss': 0.7419, 'learning_rate': 1.311942026975675e-05, 'epoch': 0.8} {'loss': 0.968, 'learning_rate': 1.3119109251022363e-05, 'epoch': 0.8} {'loss': 0.8884, 'learning_rate': 1.3118798228945572e-05, 'epoch': 0.8} {'loss': 0.6536, 'learning_rate': 1.3118487203526706e-05, 'epoch': 0.8} {'loss': 0.7604, 'learning_rate': 1.3118176174766104e-05, 'epoch': 0.8} {'loss': 0.8768, 'learning_rate': 1.3117865142664088e-05, 'epoch': 0.8} {'loss': 0.8105, 'learning_rate': 1.3117554107221002e-05, 'epoch': 0.8} {'loss': 0.9428, 'learning_rate': 1.3117243068437175e-05, 'epoch': 0.8} {'loss': 0.9585, 'learning_rate': 1.311693202631294e-05, 'epoch': 0.8} {'loss': 0.8914, 'learning_rate': 1.311662098084863e-05, 'epoch': 0.8} {'loss': 0.661, 'learning_rate': 1.3116309932044582e-05, 'epoch': 0.8} {'loss': 0.7782, 'learning_rate': 1.3115998879901126e-05, 'epoch': 0.8} {'loss': 0.7617, 'learning_rate': 1.3115687824418596e-05, 'epoch': 0.8} {'loss': 0.819, 'learning_rate': 1.3115376765597325e-05, 'epoch': 0.8} {'loss': 1.0344, 'learning_rate': 1.3115065703437646e-05, 'epoch': 0.8} {'loss': 0.8596, 'learning_rate': 1.3114754637939892e-05, 'epoch': 0.8} {'loss': 0.7885, 'learning_rate': 1.3114443569104399e-05, 'epoch': 0.8} {'loss': 0.8045, 'learning_rate': 1.31141324969315e-05, 'epoch': 0.8} {'loss': 0.894, 'learning_rate': 1.3113821421421524e-05, 'epoch': 0.8} {'loss': 0.7375, 'learning_rate': 1.3113510342574806e-05, 'epoch': 0.8} {'loss': 0.8636, 'learning_rate': 1.3113199260391686e-05, 'epoch': 0.8} {'loss': 0.8987, 'learning_rate': 1.311288817487249e-05, 'epoch': 0.8} {'loss': 0.8032, 'learning_rate': 1.311257708601755e-05, 'epoch': 0.8} {'loss': 0.796, 'learning_rate': 1.3112265993827205e-05, 'epoch': 0.8} {'loss': 0.8011, 'learning_rate': 1.3111954898301786e-05, 'epoch': 0.8} {'loss': 0.7977, 'learning_rate': 1.3111643799441626e-05, 'epoch': 0.8} {'loss': 0.7304, 'learning_rate': 1.3111332697247061e-05, 'epoch': 0.8} {'loss': 0.8046, 'learning_rate': 1.311102159171842e-05, 'epoch': 0.8} {'loss': 0.7046, 'learning_rate': 1.311071048285604e-05, 'epoch': 0.8} {'loss': 0.7997, 'learning_rate': 1.3110399370660252e-05, 'epoch': 0.8} {'loss': 0.8063, 'learning_rate': 1.311008825513139e-05, 'epoch': 0.8} {'loss': 0.7831, 'learning_rate': 1.3109777136269788e-05, 'epoch': 0.8} {'loss': 1.0189, 'learning_rate': 1.3109466014075783e-05, 'epoch': 0.8} {'loss': 0.7059, 'learning_rate': 1.31091548885497e-05, 'epoch': 0.8} {'loss': 0.6764, 'learning_rate': 1.3108843759691877e-05, 'epoch': 0.8} {'loss': 0.9724, 'learning_rate': 1.3108532627502645e-05, 'epoch': 0.8} {'loss': 0.7816, 'learning_rate': 1.3108221491982345e-05, 'epoch': 0.8} {'loss': 0.7792, 'learning_rate': 1.3107910353131301e-05, 'epoch': 0.8} {'loss': 0.7586, 'learning_rate': 1.3107599210949856e-05, 'epoch': 0.8} {'loss': 0.9639, 'learning_rate': 1.3107288065438335e-05, 'epoch': 0.8} {'loss': 0.7831, 'learning_rate': 1.3106976916597072e-05, 'epoch': 0.8} {'loss': 0.6887, 'learning_rate': 1.3106665764426405e-05, 'epoch': 0.8} {'loss': 0.8335, 'learning_rate': 1.3106354608926664e-05, 'epoch': 0.8} {'loss': 0.7781, 'learning_rate': 1.3106043450098184e-05, 'epoch': 0.8} {'loss': 0.7493, 'learning_rate': 1.3105732287941298e-05, 'epoch': 0.8} {'loss': 0.8936, 'learning_rate': 1.3105421122456343e-05, 'epoch': 0.8} {'loss': 0.8343, 'learning_rate': 1.3105109953643647e-05, 'epoch': 0.8} {'loss': 0.8931, 'learning_rate': 1.3104798781503544e-05, 'epoch': 0.8} {'loss': 0.8564, 'learning_rate': 1.3104487606036369e-05, 'epoch': 0.8} {'loss': 0.8345, 'learning_rate': 1.3104176427242456e-05, 'epoch': 0.8} {'loss': 0.7675, 'learning_rate': 1.3103865245122135e-05, 'epoch': 0.8} {'loss': 0.8206, 'learning_rate': 1.3103554059675746e-05, 'epoch': 0.8} {'loss': 0.7182, 'learning_rate': 1.3103242870903618e-05, 'epoch': 0.8} {'loss': 0.6964, 'learning_rate': 1.3102931678806088e-05, 'epoch': 0.8} {'loss': 0.8049, 'learning_rate': 1.3102620483383484e-05, 'epoch': 0.8} {'loss': 0.8371, 'learning_rate': 1.310230928463614e-05, 'epoch': 0.8} {'loss': 0.6882, 'learning_rate': 1.3101998082564391e-05, 'epoch': 0.8} {'loss': 0.7563, 'learning_rate': 1.3101686877168576e-05, 'epoch': 0.8} {'loss': 0.9371, 'learning_rate': 1.310137566844902e-05, 'epoch': 0.8} {'loss': 0.7128, 'learning_rate': 1.3101064456406062e-05, 'epoch': 0.8} {'loss': 0.7536, 'learning_rate': 1.3100753241040032e-05, 'epoch': 0.8} {'loss': 0.6553, 'learning_rate': 1.3100442022351266e-05, 'epoch': 0.8} {'loss': 0.9135, 'learning_rate': 1.3100130800340094e-05, 'epoch': 0.8} {'loss': 0.6437, 'learning_rate': 1.3099819575006856e-05, 'epoch': 0.8} {'loss': 0.7199, 'learning_rate': 1.309950834635188e-05, 'epoch': 0.8} {'loss': 0.7565, 'learning_rate': 1.30991971143755e-05, 'epoch': 0.8} {'loss': 0.985, 'learning_rate': 1.3098885879078052e-05, 'epoch': 0.8} {'loss': 0.8254, 'learning_rate': 1.3098574640459867e-05, 'epoch': 0.8} {'loss': 0.6493, 'learning_rate': 1.309826339852128e-05, 'epoch': 0.8} {'loss': 0.726, 'learning_rate': 1.3097952153262624e-05, 'epoch': 0.8} {'loss': 0.8463, 'learning_rate': 1.3097640904684235e-05, 'epoch': 0.8} {'loss': 0.9214, 'learning_rate': 1.3097329652786439e-05, 'epoch': 0.8} {'loss': 0.7762, 'learning_rate': 1.3097018397569579e-05, 'epoch': 0.8} {'loss': 0.7542, 'learning_rate': 1.3096707139033984e-05, 'epoch': 0.8} {'loss': 0.8227, 'learning_rate': 1.3096395877179987e-05, 'epoch': 0.8} {'loss': 0.8374, 'learning_rate': 1.309608461200792e-05, 'epoch': 0.8} {'loss': 0.7747, 'learning_rate': 1.309577334351812e-05, 'epoch': 0.8} {'loss': 0.8515, 'learning_rate': 1.3095462071710922e-05, 'epoch': 0.8} {'loss': 0.6536, 'learning_rate': 1.3095150796586656e-05, 'epoch': 0.8} {'loss': 0.8708, 'learning_rate': 1.3094839518145655e-05, 'epoch': 0.8} {'loss': 0.8053, 'learning_rate': 1.3094528236388255e-05, 'epoch': 0.8} {'loss': 0.7736, 'learning_rate': 1.3094216951314788e-05, 'epoch': 0.8} {'loss': 0.7175, 'learning_rate': 1.309390566292559e-05, 'epoch': 0.8} {'loss': 0.855, 'learning_rate': 1.3093594371220993e-05, 'epoch': 0.8} {'loss': 0.6666, 'learning_rate': 1.309328307620133e-05, 'epoch': 0.8} {'loss': 0.7762, 'learning_rate': 1.3092971777866934e-05, 'epoch': 0.8} {'loss': 0.7751, 'learning_rate': 1.3092660476218138e-05, 'epoch': 0.8} {'loss': 0.8509, 'learning_rate': 1.309234917125528e-05, 'epoch': 0.8} {'loss': 0.8686, 'learning_rate': 1.309203786297869e-05, 'epoch': 0.8} {'loss': 0.7607, 'learning_rate': 1.3091726551388704e-05, 'epoch': 0.8} {'loss': 0.7417, 'learning_rate': 1.3091415236485652e-05, 'epoch': 0.8} {'loss': 0.7408, 'learning_rate': 1.3091103918269869e-05, 'epoch': 0.8} {'loss': 1.0387, 'learning_rate': 1.309079259674169e-05, 'epoch': 0.8} {'loss': 0.856, 'learning_rate': 1.309048127190145e-05, 'epoch': 0.8} {'loss': 0.8272, 'learning_rate': 1.3090169943749475e-05, 'epoch': 0.8} {'loss': 0.7951, 'learning_rate': 1.308985861228611e-05, 'epoch': 0.8} {'loss': 0.6084, 'learning_rate': 1.3089547277511679e-05, 'epoch': 0.8} {'loss': 0.7934, 'learning_rate': 1.308923593942652e-05, 'epoch': 0.8} {'loss': 0.7675, 'learning_rate': 1.3088924598030963e-05, 'epoch': 0.8} {'loss': 0.6976, 'learning_rate': 1.3088613253325348e-05, 'epoch': 0.8} {'loss': 0.7989, 'learning_rate': 1.3088301905310006e-05, 'epoch': 0.8} {'loss': 0.8087, 'learning_rate': 1.3087990553985269e-05, 'epoch': 0.8} {'loss': 0.8683, 'learning_rate': 1.308767919935147e-05, 'epoch': 0.8} {'loss': 0.6935, 'learning_rate': 1.3087367841408944e-05, 'epoch': 0.8} {'loss': 0.7933, 'learning_rate': 1.3087056480158024e-05, 'epoch': 0.8} {'loss': 0.7012, 'learning_rate': 1.3086745115599046e-05, 'epoch': 0.8} {'loss': 0.7285, 'learning_rate': 1.3086433747732342e-05, 'epoch': 0.8} {'loss': 0.9163, 'learning_rate': 1.3086122376558246e-05, 'epoch': 0.8} {'loss': 0.9218, 'learning_rate': 1.3085811002077094e-05, 'epoch': 0.8} {'loss': 0.7582, 'learning_rate': 1.3085499624289212e-05, 'epoch': 0.8} {'loss': 0.7871, 'learning_rate': 1.308518824319494e-05, 'epoch': 0.8} {'loss': 0.8133, 'learning_rate': 1.3084876858794611e-05, 'epoch': 0.8} {'loss': 0.9001, 'learning_rate': 1.3084565471088557e-05, 'epoch': 0.8} {'loss': 0.9075, 'learning_rate': 1.3084254080077113e-05, 'epoch': 0.8} {'loss': 0.777, 'learning_rate': 1.3083942685760613e-05, 'epoch': 0.8} {'loss': 0.7673, 'learning_rate': 1.3083631288139392e-05, 'epoch': 0.8} {'loss': 0.7845, 'learning_rate': 1.3083319887213779e-05, 'epoch': 0.8} {'loss': 0.831, 'learning_rate': 1.3083008482984109e-05, 'epoch': 0.8} {'loss': 0.871, 'learning_rate': 1.3082697075450721e-05, 'epoch': 0.8} {'loss': 0.8326, 'learning_rate': 1.3082385664613942e-05, 'epoch': 0.8} {'loss': 0.7884, 'learning_rate': 1.308207425047411e-05, 'epoch': 0.8} {'loss': 0.7702, 'learning_rate': 1.3081762833031557e-05, 'epoch': 0.8} {'loss': 0.8529, 'learning_rate': 1.3081451412286619e-05, 'epoch': 0.8} {'loss': 0.7711, 'learning_rate': 1.3081139988239624e-05, 'epoch': 0.8} {'loss': 0.8093, 'learning_rate': 1.308082856089091e-05, 'epoch': 0.8} {'loss': 0.911, 'learning_rate': 1.308051713024081e-05, 'epoch': 0.8} {'loss': 0.5571, 'learning_rate': 1.308020569628966e-05, 'epoch': 0.8} {'loss': 0.6453, 'learning_rate': 1.3079894259037793e-05, 'epoch': 0.8} {'loss': 0.7677, 'learning_rate': 1.3079582818485536e-05, 'epoch': 0.8} {'loss': 0.7606, 'learning_rate': 1.3079271374633234e-05, 'epoch': 0.8} {'loss': 0.8137, 'learning_rate': 1.3078959927481212e-05, 'epoch': 0.8} {'loss': 0.782, 'learning_rate': 1.3078648477029805e-05, 'epoch': 0.8} {'loss': 0.8024, 'learning_rate': 1.307833702327935e-05, 'epoch': 0.8} {'loss': 0.6217, 'learning_rate': 1.307802556623018e-05, 'epoch': 0.8} {'loss': 0.6947, 'learning_rate': 1.3077714105882627e-05, 'epoch': 0.8} {'loss': 0.7207, 'learning_rate': 1.3077402642237025e-05, 'epoch': 0.8} {'loss': 0.8613, 'learning_rate': 1.3077091175293708e-05, 'epoch': 0.8} {'loss': 0.8652, 'learning_rate': 1.3076779705053011e-05, 'epoch': 0.8} {'loss': 0.824, 'learning_rate': 1.3076468231515265e-05, 'epoch': 0.8} {'loss': 0.6856, 'learning_rate': 1.307615675468081e-05, 'epoch': 0.8} {'loss': 0.7885, 'learning_rate': 1.3075845274549969e-05, 'epoch': 0.8} {'loss': 0.8529, 'learning_rate': 1.3075533791123085e-05, 'epoch': 0.8} {'loss': 0.7408, 'learning_rate': 1.3075222304400492e-05, 'epoch': 0.8} {'loss': 0.7973, 'learning_rate': 1.3074910814382517e-05, 'epoch': 0.8} {'loss': 0.8466, 'learning_rate': 1.30745993210695e-05, 'epoch': 0.8} {'loss': 0.7292, 'learning_rate': 1.3074287824461771e-05, 'epoch': 0.8} {'loss': 0.9197, 'learning_rate': 1.3073976324559666e-05, 'epoch': 0.8} {'loss': 0.8806, 'learning_rate': 1.3073664821363514e-05, 'epoch': 0.8} {'loss': 0.9006, 'learning_rate': 1.3073353314873655e-05, 'epoch': 0.8} {'loss': 0.775, 'learning_rate': 1.3073041805090426e-05, 'epoch': 0.8} {'loss': 0.7725, 'learning_rate': 1.307273029201415e-05, 'epoch': 0.8} {'loss': 0.7587, 'learning_rate': 1.3072418775645166e-05, 'epoch': 0.8} {'loss': 0.6652, 'learning_rate': 1.307210725598381e-05, 'epoch': 0.8} {'loss': 0.7433, 'learning_rate': 1.3071795733030412e-05, 'epoch': 0.8} {'loss': 0.9226, 'learning_rate': 1.3071484206785308e-05, 'epoch': 0.8} {'loss': 0.8972, 'learning_rate': 1.3071172677248831e-05, 'epoch': 0.81} {'loss': 0.9344, 'learning_rate': 1.3070861144421317e-05, 'epoch': 0.81} {'loss': 0.7776, 'learning_rate': 1.3070549608303096e-05, 'epoch': 0.81} {'loss': 0.8574, 'learning_rate': 1.3070238068894507e-05, 'epoch': 0.81} {'loss': 0.8674, 'learning_rate': 1.3069926526195877e-05, 'epoch': 0.81} {'loss': 0.9396, 'learning_rate': 1.3069614980207546e-05, 'epoch': 0.81} {'loss': 0.6809, 'learning_rate': 1.3069303430929845e-05, 'epoch': 0.81} {'loss': 0.7477, 'learning_rate': 1.3068991878363107e-05, 'epoch': 0.81} {'loss': 0.888, 'learning_rate': 1.306868032250767e-05, 'epoch': 0.81} {'loss': 0.7831, 'learning_rate': 1.3068368763363865e-05, 'epoch': 0.81} {'loss': 0.7022, 'learning_rate': 1.3068057200932024e-05, 'epoch': 0.81} {'loss': 0.8556, 'learning_rate': 1.3067745635212482e-05, 'epoch': 0.81} {'loss': 0.7928, 'learning_rate': 1.3067434066205575e-05, 'epoch': 0.81} {'loss': 0.9504, 'learning_rate': 1.3067122493911634e-05, 'epoch': 0.81} {'loss': 0.9152, 'learning_rate': 1.3066810918330996e-05, 'epoch': 0.81} {'loss': 0.7608, 'learning_rate': 1.3066499339463997e-05, 'epoch': 0.81} {'loss': 0.6531, 'learning_rate': 1.3066187757310963e-05, 'epoch': 0.81} {'loss': 0.7605, 'learning_rate': 1.3065876171872234e-05, 'epoch': 0.81} {'loss': 0.8492, 'learning_rate': 1.306556458314814e-05, 'epoch': 0.81} {'loss': 0.7826, 'learning_rate': 1.3065252991139017e-05, 'epoch': 0.81} {'loss': 0.825, 'learning_rate': 1.30649413958452e-05, 'epoch': 0.81} {'loss': 0.9359, 'learning_rate': 1.3064629797267022e-05, 'epoch': 0.81} {'loss': 0.7236, 'learning_rate': 1.3064318195404813e-05, 'epoch': 0.81} {'loss': 0.7869, 'learning_rate': 1.3064006590258914e-05, 'epoch': 0.81} {'loss': 0.8178, 'learning_rate': 1.3063694981829654e-05, 'epoch': 0.81} {'loss': 0.7969, 'learning_rate': 1.3063383370117368e-05, 'epoch': 0.81} {'loss': 0.8568, 'learning_rate': 1.3063071755122393e-05, 'epoch': 0.81} {'loss': 0.7482, 'learning_rate': 1.3062760136845056e-05, 'epoch': 0.81} {'loss': 0.6323, 'learning_rate': 1.3062448515285697e-05, 'epoch': 0.81} {'loss': 0.6864, 'learning_rate': 1.306213689044465e-05, 'epoch': 0.81} {'loss': 0.8236, 'learning_rate': 1.3061825262322246e-05, 'epoch': 0.81} {'loss': 0.7974, 'learning_rate': 1.3061513630918819e-05, 'epoch': 0.81} {'loss': 0.6624, 'learning_rate': 1.3061201996234703e-05, 'epoch': 0.81} {'loss': 0.8194, 'learning_rate': 1.3060890358270234e-05, 'epoch': 0.81} {'loss': 0.7133, 'learning_rate': 1.3060578717025743e-05, 'epoch': 0.81} {'loss': 0.7849, 'learning_rate': 1.3060267072501567e-05, 'epoch': 0.81} {'loss': 0.863, 'learning_rate': 1.3059955424698041e-05, 'epoch': 0.81} {'loss': 0.8238, 'learning_rate': 1.3059643773615491e-05, 'epoch': 0.81} {'loss': 0.7429, 'learning_rate': 1.305933211925426e-05, 'epoch': 0.81} {'loss': 0.7434, 'learning_rate': 1.3059020461614677e-05, 'epoch': 0.81} {'loss': 0.876, 'learning_rate': 1.305870880069708e-05, 'epoch': 0.81} {'loss': 0.6927, 'learning_rate': 1.3058397136501801e-05, 'epoch': 0.81} {'loss': 0.953, 'learning_rate': 1.3058085469029172e-05, 'epoch': 0.81} {'loss': 0.8845, 'learning_rate': 1.3057773798279527e-05, 'epoch': 0.81} {'loss': 0.8806, 'learning_rate': 1.3057462124253202e-05, 'epoch': 0.81} {'loss': 0.9042, 'learning_rate': 1.305715044695053e-05, 'epoch': 0.81} {'loss': 0.6395, 'learning_rate': 1.3056838766371847e-05, 'epoch': 0.81} {'loss': 0.7988, 'learning_rate': 1.3056527082517486e-05, 'epoch': 0.81} {'loss': 0.7178, 'learning_rate': 1.3056215395387776e-05, 'epoch': 0.81} {'loss': 0.5934, 'learning_rate': 1.305590370498306e-05, 'epoch': 0.81} {'loss': 0.6721, 'learning_rate': 1.3055592011303665e-05, 'epoch': 0.81} {'loss': 0.6078, 'learning_rate': 1.3055280314349928e-05, 'epoch': 0.81} {'loss': 0.892, 'learning_rate': 1.3054968614122184e-05, 'epoch': 0.81} {'loss': 0.7002, 'learning_rate': 1.3054656910620765e-05, 'epoch': 0.81} {'loss': 0.7159, 'learning_rate': 1.3054345203846002e-05, 'epoch': 0.81} {'loss': 0.7483, 'learning_rate': 1.3054033493798236e-05, 'epoch': 0.81} {'loss': 0.663, 'learning_rate': 1.3053721780477795e-05, 'epoch': 0.81} {'loss': 0.8598, 'learning_rate': 1.3053410063885017e-05, 'epoch': 0.81} {'loss': 0.8637, 'learning_rate': 1.3053098344020234e-05, 'epoch': 0.81} {'loss': 0.9169, 'learning_rate': 1.305278662088378e-05, 'epoch': 0.81} {'loss': 0.7693, 'learning_rate': 1.305247489447599e-05, 'epoch': 0.81} {'loss': 0.6702, 'learning_rate': 1.3052163164797198e-05, 'epoch': 0.81} {'loss': 0.8345, 'learning_rate': 1.3051851431847738e-05, 'epoch': 0.81} {'loss': 0.7156, 'learning_rate': 1.3051539695627944e-05, 'epoch': 0.81} {'loss': 0.6865, 'learning_rate': 1.3051227956138148e-05, 'epoch': 0.81} {'loss': 0.8259, 'learning_rate': 1.3050916213378688e-05, 'epoch': 0.81} {'loss': 0.8546, 'learning_rate': 1.3050604467349896e-05, 'epoch': 0.81} {'loss': 0.6249, 'learning_rate': 1.3050292718052104e-05, 'epoch': 0.81} {'loss': 0.8073, 'learning_rate': 1.3049980965485649e-05, 'epoch': 0.81} {'loss': 0.848, 'learning_rate': 1.3049669209650865e-05, 'epoch': 0.81} {'loss': 0.7507, 'learning_rate': 1.3049357450548083e-05, 'epoch': 0.81} {'loss': 0.7871, 'learning_rate': 1.3049045688177642e-05, 'epoch': 0.81} {'loss': 0.8464, 'learning_rate': 1.3048733922539873e-05, 'epoch': 0.81} {'loss': 0.9777, 'learning_rate': 1.304842215363511e-05, 'epoch': 0.81} {'loss': 0.5931, 'learning_rate': 1.3048110381463684e-05, 'epoch': 0.81} {'loss': 0.9043, 'learning_rate': 1.3047798606025936e-05, 'epoch': 0.81} {'loss': 0.8885, 'learning_rate': 1.3047486827322196e-05, 'epoch': 0.81} {'loss': 0.7, 'learning_rate': 1.30471750453528e-05, 'epoch': 0.81} {'loss': 1.0052, 'learning_rate': 1.3046863260118081e-05, 'epoch': 0.81} {'loss': 0.8125, 'learning_rate': 1.3046551471618371e-05, 'epoch': 0.81} {'loss': 0.6778, 'learning_rate': 1.3046239679854008e-05, 'epoch': 0.81} {'loss': 0.6611, 'learning_rate': 1.3045927884825322e-05, 'epoch': 0.81} {'loss': 0.8929, 'learning_rate': 1.3045616086532648e-05, 'epoch': 0.81} {'loss': 0.8331, 'learning_rate': 1.3045304284976325e-05, 'epoch': 0.81} {'loss': 0.6789, 'learning_rate': 1.3044992480156684e-05, 'epoch': 0.81} {'loss': 0.656, 'learning_rate': 1.304468067207406e-05, 'epoch': 0.81} {'loss': 0.7896, 'learning_rate': 1.3044368860728781e-05, 'epoch': 0.81} {'loss': 0.8389, 'learning_rate': 1.304405704612119e-05, 'epoch': 0.81} {'loss': 0.7055, 'learning_rate': 1.3043745228251615e-05, 'epoch': 0.81} {'loss': 0.7985, 'learning_rate': 1.3043433407120392e-05, 'epoch': 0.81} {'loss': 0.5972, 'learning_rate': 1.3043121582727856e-05, 'epoch': 0.81} {'loss': 0.8857, 'learning_rate': 1.3042809755074342e-05, 'epoch': 0.81} {'loss': 0.6757, 'learning_rate': 1.3042497924160182e-05, 'epoch': 0.81} {'loss': 0.7851, 'learning_rate': 1.304218608998571e-05, 'epoch': 0.81} {'loss': 0.7109, 'learning_rate': 1.304187425255126e-05, 'epoch': 0.81} {'loss': 0.8694, 'learning_rate': 1.3041562411857167e-05, 'epoch': 0.81} {'loss': 0.7257, 'learning_rate': 1.3041250567903766e-05, 'epoch': 0.81} {'loss': 0.7623, 'learning_rate': 1.3040938720691395e-05, 'epoch': 0.81} {'loss': 0.7596, 'learning_rate': 1.3040626870220379e-05, 'epoch': 0.81} {'loss': 0.8746, 'learning_rate': 1.3040315016491061e-05, 'epoch': 0.81} {'loss': 0.8408, 'learning_rate': 1.3040003159503767e-05, 'epoch': 0.81} {'loss': 0.8146, 'learning_rate': 1.3039691299258834e-05, 'epoch': 0.81} {'loss': 0.8151, 'learning_rate': 1.3039379435756601e-05, 'epoch': 0.81} {'loss': 0.8461, 'learning_rate': 1.3039067568997394e-05, 'epoch': 0.81} {'loss': 0.7903, 'learning_rate': 1.3038755698981557e-05, 'epoch': 0.81} {'loss': 0.8342, 'learning_rate': 1.303844382570942e-05, 'epoch': 0.81} {'loss': 0.8427, 'learning_rate': 1.3038131949181314e-05, 'epoch': 0.81} {'loss': 0.8446, 'learning_rate': 1.3037820069397572e-05, 'epoch': 0.81} {'loss': 0.8039, 'learning_rate': 1.3037508186358535e-05, 'epoch': 0.81} {'loss': 0.7755, 'learning_rate': 1.3037196300064532e-05, 'epoch': 0.81} {'loss': 0.7209, 'learning_rate': 1.3036884410515902e-05, 'epoch': 0.81} {'loss': 0.7867, 'learning_rate': 1.3036572517712973e-05, 'epoch': 0.81} {'loss': 0.7305, 'learning_rate': 1.3036260621656087e-05, 'epoch': 0.81} {'loss': 0.8014, 'learning_rate': 1.303594872234557e-05, 'epoch': 0.81} {'loss': 0.6641, 'learning_rate': 1.3035636819781759e-05, 'epoch': 0.81} {'loss': 0.8572, 'learning_rate': 1.303532491396499e-05, 'epoch': 0.81} {'loss': 0.6283, 'learning_rate': 1.3035013004895598e-05, 'epoch': 0.81} {'loss': 0.7944, 'learning_rate': 1.3034701092573917e-05, 'epoch': 0.81} {'loss': 0.9012, 'learning_rate': 1.3034389177000275e-05, 'epoch': 0.81} {'loss': 0.7458, 'learning_rate': 1.3034077258175015e-05, 'epoch': 0.81} {'loss': 0.7589, 'learning_rate': 1.3033765336098467e-05, 'epoch': 0.81} {'loss': 0.5365, 'learning_rate': 1.3033453410770963e-05, 'epoch': 0.81} {'loss': 0.7417, 'learning_rate': 1.3033141482192844e-05, 'epoch': 0.81} {'loss': 0.8402, 'learning_rate': 1.3032829550364436e-05, 'epoch': 0.81} {'loss': 0.7103, 'learning_rate': 1.303251761528608e-05, 'epoch': 0.81} {'loss': 0.7128, 'learning_rate': 1.3032205676958105e-05, 'epoch': 0.81} {'loss': 0.914, 'learning_rate': 1.3031893735380851e-05, 'epoch': 0.81} {'loss': 0.8504, 'learning_rate': 1.303158179055465e-05, 'epoch': 0.81} {'loss': 0.7616, 'learning_rate': 1.3031269842479832e-05, 'epoch': 0.81} {'loss': 0.8885, 'learning_rate': 1.3030957891156737e-05, 'epoch': 0.81} {'loss': 0.6833, 'learning_rate': 1.3030645936585697e-05, 'epoch': 0.81} {'loss': 0.8142, 'learning_rate': 1.3030333978767045e-05, 'epoch': 0.81} {'loss': 0.8676, 'learning_rate': 1.3030022017701116e-05, 'epoch': 0.81} {'loss': 0.9334, 'learning_rate': 1.3029710053388248e-05, 'epoch': 0.81} {'loss': 0.9157, 'learning_rate': 1.302939808582877e-05, 'epoch': 0.81} {'loss': 0.8633, 'learning_rate': 1.3029086115023022e-05, 'epoch': 0.81} {'loss': 0.7098, 'learning_rate': 1.3028774140971333e-05, 'epoch': 0.81} {'loss': 0.7997, 'learning_rate': 1.3028462163674033e-05, 'epoch': 0.81} {'loss': 0.7475, 'learning_rate': 1.3028150183131469e-05, 'epoch': 0.81} {'loss': 0.896, 'learning_rate': 1.302783819934397e-05, 'epoch': 0.81} {'loss': 0.8372, 'learning_rate': 1.3027526212311866e-05, 'epoch': 0.81} {'loss': 0.8241, 'learning_rate': 1.3027214222035495e-05, 'epoch': 0.81} {'loss': 0.7662, 'learning_rate': 1.302690222851519e-05, 'epoch': 0.81} {'loss': 0.796, 'learning_rate': 1.3026590231751287e-05, 'epoch': 0.81} {'loss': 1.0123, 'learning_rate': 1.3026278231744116e-05, 'epoch': 0.81} {'loss': 0.7019, 'learning_rate': 1.3025966228494018e-05, 'epoch': 0.81} {'loss': 0.8344, 'learning_rate': 1.3025654222001327e-05, 'epoch': 0.81} {'loss': 0.8333, 'learning_rate': 1.302534221226637e-05, 'epoch': 0.81} {'loss': 0.8406, 'learning_rate': 1.3025030199289489e-05, 'epoch': 0.81} {'loss': 0.9647, 'learning_rate': 1.3024718183071013e-05, 'epoch': 0.81} {'loss': 0.6976, 'learning_rate': 1.3024406163611276e-05, 'epoch': 0.81} {'loss': 0.8363, 'learning_rate': 1.3024094140910617e-05, 'epoch': 0.81} {'loss': 0.8837, 'learning_rate': 1.3023782114969367e-05, 'epoch': 0.81} {'loss': 0.846, 'learning_rate': 1.3023470085787866e-05, 'epoch': 0.81} {'loss': 0.966, 'learning_rate': 1.3023158053366443e-05, 'epoch': 0.81} {'loss': 0.9017, 'learning_rate': 1.302284601770543e-05, 'epoch': 0.81} {'loss': 0.737, 'learning_rate': 1.3022533978805165e-05, 'epoch': 0.81} {'loss': 0.9366, 'learning_rate': 1.3022221936665983e-05, 'epoch': 0.81} {'loss': 0.6655, 'learning_rate': 1.3021909891288218e-05, 'epoch': 0.81} {'loss': 0.8615, 'learning_rate': 1.3021597842672202e-05, 'epoch': 0.81} {'loss': 0.728, 'learning_rate': 1.3021285790818275e-05, 'epoch': 0.81} {'loss': 0.6999, 'learning_rate': 1.3020973735726766e-05, 'epoch': 0.81} {'loss': 0.7946, 'learning_rate': 1.3020661677398008e-05, 'epoch': 0.81} {'loss': 0.9837, 'learning_rate': 1.302034961583234e-05, 'epoch': 0.81} {'loss': 0.7622, 'learning_rate': 1.3020037551030096e-05, 'epoch': 0.81} {'loss': 0.8444, 'learning_rate': 1.3019725482991607e-05, 'epoch': 0.81} {'loss': 0.8374, 'learning_rate': 1.3019413411717211e-05, 'epoch': 0.81} {'loss': 0.9434, 'learning_rate': 1.3019101337207243e-05, 'epoch': 0.81} {'loss': 0.8255, 'learning_rate': 1.3018789259462034e-05, 'epoch': 0.81} {'loss': 0.9132, 'learning_rate': 1.3018477178481919e-05, 'epoch': 0.81} {'loss': 0.679, 'learning_rate': 1.3018165094267233e-05, 'epoch': 0.81} {'loss': 0.931, 'learning_rate': 1.3017853006818311e-05, 'epoch': 0.81} {'loss': 0.8231, 'learning_rate': 1.3017540916135487e-05, 'epoch': 0.81} {'loss': 0.7776, 'learning_rate': 1.3017228822219096e-05, 'epoch': 0.81} {'loss': 0.6696, 'learning_rate': 1.3016916725069472e-05, 'epoch': 0.81} {'loss': 0.8157, 'learning_rate': 1.301660462468695e-05, 'epoch': 0.81} {'loss': 0.8167, 'learning_rate': 1.3016292521071864e-05, 'epoch': 0.81} {'loss': 0.886, 'learning_rate': 1.3015980414224547e-05, 'epoch': 0.81} {'loss': 0.7687, 'learning_rate': 1.3015668304145334e-05, 'epoch': 0.81} {'loss': 0.7584, 'learning_rate': 1.3015356190834563e-05, 'epoch': 0.81} {'loss': 0.9233, 'learning_rate': 1.3015044074292564e-05, 'epoch': 0.81} {'loss': 0.7654, 'learning_rate': 1.3014731954519676e-05, 'epoch': 0.81} {'loss': 0.6931, 'learning_rate': 1.3014419831516228e-05, 'epoch': 0.81} {'loss': 0.7056, 'learning_rate': 1.3014107705282555e-05, 'epoch': 0.81} {'loss': 0.9392, 'learning_rate': 1.3013795575818995e-05, 'epoch': 0.81} {'loss': 0.8898, 'learning_rate': 1.3013483443125883e-05, 'epoch': 0.81} {'loss': 0.8282, 'learning_rate': 1.301317130720355e-05, 'epoch': 0.81} {'loss': 0.8348, 'learning_rate': 1.3012859168052333e-05, 'epoch': 0.81} {'loss': 0.8589, 'learning_rate': 1.3012547025672565e-05, 'epoch': 0.81} {'loss': 0.829, 'learning_rate': 1.3012234880064581e-05, 'epoch': 0.81} {'loss': 0.701, 'learning_rate': 1.3011922731228714e-05, 'epoch': 0.81} {'loss': 0.995, 'learning_rate': 1.30116105791653e-05, 'epoch': 0.81} {'loss': 0.7997, 'learning_rate': 1.3011298423874677e-05, 'epoch': 0.81} {'loss': 0.7348, 'learning_rate': 1.3010986265357174e-05, 'epoch': 0.81} {'loss': 0.884, 'learning_rate': 1.3010674103613124e-05, 'epoch': 0.81} {'loss': 0.718, 'learning_rate': 1.3010361938642867e-05, 'epoch': 0.81} {'loss': 0.758, 'learning_rate': 1.3010049770446737e-05, 'epoch': 0.81} {'loss': 0.7892, 'learning_rate': 1.3009737599025068e-05, 'epoch': 0.81} {'loss': 0.8252, 'learning_rate': 1.3009425424378192e-05, 'epoch': 0.81} {'loss': 0.7019, 'learning_rate': 1.3009113246506443e-05, 'epoch': 0.81} {'loss': 0.8274, 'learning_rate': 1.3008801065410159e-05, 'epoch': 0.81} {'loss': 0.7407, 'learning_rate': 1.3008488881089674e-05, 'epoch': 0.81} {'loss': 0.8103, 'learning_rate': 1.3008176693545322e-05, 'epoch': 0.81} {'loss': 0.8834, 'learning_rate': 1.3007864502777437e-05, 'epoch': 0.81} {'loss': 0.7653, 'learning_rate': 1.3007552308786355e-05, 'epoch': 0.81} {'loss': 0.9108, 'learning_rate': 1.3007240111572405e-05, 'epoch': 0.81} {'loss': 0.9235, 'learning_rate': 1.300692791113593e-05, 'epoch': 0.81} {'loss': 0.8505, 'learning_rate': 1.3006615707477257e-05, 'epoch': 0.81} {'loss': 0.8067, 'learning_rate': 1.3006303500596724e-05, 'epoch': 0.81} {'loss': 0.8411, 'learning_rate': 1.3005991290494668e-05, 'epoch': 0.81} {'loss': 0.9274, 'learning_rate': 1.3005679077171423e-05, 'epoch': 0.81} {'loss': 0.721, 'learning_rate': 1.3005366860627317e-05, 'epoch': 0.81} {'loss': 0.779, 'learning_rate': 1.300505464086269e-05, 'epoch': 0.81} {'loss': 0.7462, 'learning_rate': 1.3004742417877876e-05, 'epoch': 0.81} {'loss': 0.7807, 'learning_rate': 1.300443019167321e-05, 'epoch': 0.81} {'loss': 0.8895, 'learning_rate': 1.3004117962249026e-05, 'epoch': 0.81} {'loss': 0.752, 'learning_rate': 1.3003805729605659e-05, 'epoch': 0.81} {'loss': 0.9057, 'learning_rate': 1.3003493493743443e-05, 'epoch': 0.81} {'loss': 0.8875, 'learning_rate': 1.3003181254662711e-05, 'epoch': 0.81} {'loss': 0.7287, 'learning_rate': 1.3002869012363798e-05, 'epoch': 0.81} {'loss': 0.8452, 'learning_rate': 1.3002556766847041e-05, 'epoch': 0.81} {'loss': 0.6128, 'learning_rate': 1.3002244518112774e-05, 'epoch': 0.81} {'loss': 0.8324, 'learning_rate': 1.3001932266161333e-05, 'epoch': 0.81} {'loss': 0.8011, 'learning_rate': 1.300162001099305e-05, 'epoch': 0.81} {'loss': 0.6407, 'learning_rate': 1.3001307752608258e-05, 'epoch': 0.81} {'loss': 0.9086, 'learning_rate': 1.3000995491007296e-05, 'epoch': 0.81} {'loss': 0.8165, 'learning_rate': 1.3000683226190493e-05, 'epoch': 0.81} {'loss': 0.8541, 'learning_rate': 1.3000370958158191e-05, 'epoch': 0.81} {'loss': 0.7167, 'learning_rate': 1.3000058686910718e-05, 'epoch': 0.81} {'loss': 0.8109, 'learning_rate': 1.2999746412448414e-05, 'epoch': 0.81} {'loss': 0.7946, 'learning_rate': 1.299943413477161e-05, 'epoch': 0.81} {'loss': 0.8221, 'learning_rate': 1.299912185388064e-05, 'epoch': 0.81} {'loss': 0.8353, 'learning_rate': 1.2998809569775843e-05, 'epoch': 0.81} {'loss': 0.7811, 'learning_rate': 1.2998497282457547e-05, 'epoch': 0.81} {'loss': 0.7906, 'learning_rate': 1.2998184991926093e-05, 'epoch': 0.81} {'loss': 0.9481, 'learning_rate': 1.2997872698181813e-05, 'epoch': 0.81} {'loss': 0.9305, 'learning_rate': 1.2997560401225043e-05, 'epoch': 0.81} {'loss': 0.658, 'learning_rate': 1.2997248101056117e-05, 'epoch': 0.81} {'loss': 0.6788, 'learning_rate': 1.2996935797675367e-05, 'epoch': 0.81} {'loss': 0.8543, 'learning_rate': 1.299662349108313e-05, 'epoch': 0.81} {'loss': 0.9618, 'learning_rate': 1.299631118127974e-05, 'epoch': 0.81} {'loss': 0.7245, 'learning_rate': 1.299599886826553e-05, 'epoch': 0.81} {'loss': 0.687, 'learning_rate': 1.2995686552040843e-05, 'epoch': 0.81} {'loss': 0.7861, 'learning_rate': 1.2995374232606004e-05, 'epoch': 0.81} {'loss': 0.861, 'learning_rate': 1.2995061909961351e-05, 'epoch': 0.81} {'loss': 0.6872, 'learning_rate': 1.299474958410722e-05, 'epoch': 0.81} {'loss': 0.6931, 'learning_rate': 1.2994437255043941e-05, 'epoch': 0.81} {'loss': 0.7737, 'learning_rate': 1.2994124922771856e-05, 'epoch': 0.81} {'loss': 0.8753, 'learning_rate': 1.2993812587291297e-05, 'epoch': 0.81} {'loss': 0.8383, 'learning_rate': 1.2993500248602593e-05, 'epoch': 0.81} {'loss': 0.8052, 'learning_rate': 1.2993187906706087e-05, 'epoch': 0.81} {'loss': 0.8603, 'learning_rate': 1.299287556160211e-05, 'epoch': 0.81} {'loss': 0.6163, 'learning_rate': 1.2992563213290994e-05, 'epoch': 0.81} {'loss': 0.9117, 'learning_rate': 1.2992250861773076e-05, 'epoch': 0.81} {'loss': 0.7696, 'learning_rate': 1.2991938507048695e-05, 'epoch': 0.81} {'loss': 0.7889, 'learning_rate': 1.2991626149118179e-05, 'epoch': 0.81} {'loss': 0.8437, 'learning_rate': 1.2991313787981867e-05, 'epoch': 0.81} {'loss': 0.8381, 'learning_rate': 1.2991001423640092e-05, 'epoch': 0.81} {'loss': 0.8656, 'learning_rate': 1.2990689056093189e-05, 'epoch': 0.81} {'loss': 0.8247, 'learning_rate': 1.2990376685341493e-05, 'epoch': 0.81} {'loss': 0.7284, 'learning_rate': 1.2990064311385338e-05, 'epoch': 0.81} {'loss': 0.6784, 'learning_rate': 1.2989751934225058e-05, 'epoch': 0.81} {'loss': 0.7914, 'learning_rate': 1.2989439553860992e-05, 'epoch': 0.81} {'loss': 0.778, 'learning_rate': 1.2989127170293468e-05, 'epoch': 0.81} {'loss': 0.7825, 'learning_rate': 1.2988814783522827e-05, 'epoch': 0.81} {'loss': 0.7386, 'learning_rate': 1.29885023935494e-05, 'epoch': 0.81} {'loss': 0.6343, 'learning_rate': 1.2988190000373524e-05, 'epoch': 0.81} {'loss': 0.9767, 'learning_rate': 1.2987877603995534e-05, 'epoch': 0.81} {'loss': 0.7669, 'learning_rate': 1.2987565204415759e-05, 'epoch': 0.81} {'loss': 0.8402, 'learning_rate': 1.2987252801634542e-05, 'epoch': 0.81} {'loss': 1.0815, 'learning_rate': 1.2986940395652212e-05, 'epoch': 0.81} {'loss': 0.9509, 'learning_rate': 1.2986627986469106e-05, 'epoch': 0.81} {'loss': 0.8612, 'learning_rate': 1.2986315574085561e-05, 'epoch': 0.81} {'loss': 0.6398, 'learning_rate': 1.298600315850191e-05, 'epoch': 0.81} {'loss': 0.7584, 'learning_rate': 1.2985690739718483e-05, 'epoch': 0.81} {'loss': 0.8218, 'learning_rate': 1.298537831773562e-05, 'epoch': 0.81} {'loss': 0.8838, 'learning_rate': 1.2985065892553655e-05, 'epoch': 0.81} {'loss': 0.7118, 'learning_rate': 1.2984753464172921e-05, 'epoch': 0.81} {'loss': 0.7755, 'learning_rate': 1.2984441032593758e-05, 'epoch': 0.81} {'loss': 0.7733, 'learning_rate': 1.2984128597816494e-05, 'epoch': 0.81} {'loss': 0.8514, 'learning_rate': 1.298381615984147e-05, 'epoch': 0.81} {'loss': 0.8721, 'learning_rate': 1.2983503718669014e-05, 'epoch': 0.81} {'loss': 0.6543, 'learning_rate': 1.2983191274299467e-05, 'epoch': 0.81} {'loss': 0.9288, 'learning_rate': 1.2982878826733158e-05, 'epoch': 0.81} {'loss': 0.9105, 'learning_rate': 1.2982566375970428e-05, 'epoch': 0.81} {'loss': 0.6354, 'learning_rate': 1.298225392201161e-05, 'epoch': 0.81} {'loss': 0.8441, 'learning_rate': 1.2981941464857037e-05, 'epoch': 0.81} {'loss': 0.7666, 'learning_rate': 1.2981629004507044e-05, 'epoch': 0.81} {'loss': 0.7391, 'learning_rate': 1.2981316540961965e-05, 'epoch': 0.81} {'loss': 0.592, 'learning_rate': 1.2981004074222137e-05, 'epoch': 0.81} {'loss': 0.7618, 'learning_rate': 1.2980691604287893e-05, 'epoch': 0.81} {'loss': 0.8651, 'learning_rate': 1.298037913115957e-05, 'epoch': 0.81} {'loss': 0.7131, 'learning_rate': 1.2980066654837504e-05, 'epoch': 0.81} {'loss': 0.841, 'learning_rate': 1.2979754175322028e-05, 'epoch': 0.81} {'loss': 0.6978, 'learning_rate': 1.2979441692613474e-05, 'epoch': 0.81} {'loss': 0.9127, 'learning_rate': 1.297912920671218e-05, 'epoch': 0.81} {'loss': 0.8482, 'learning_rate': 1.2978816717618479e-05, 'epoch': 0.81} {'loss': 0.8233, 'learning_rate': 1.2978504225332706e-05, 'epoch': 0.81} {'loss': 0.643, 'learning_rate': 1.2978191729855201e-05, 'epoch': 0.81} {'loss': 0.8932, 'learning_rate': 1.2977879231186292e-05, 'epoch': 0.81} {'loss': 0.7466, 'learning_rate': 1.2977566729326318e-05, 'epoch': 0.81} {'loss': 0.9288, 'learning_rate': 1.2977254224275611e-05, 'epoch': 0.81} {'loss': 0.8342, 'learning_rate': 1.2976941716034508e-05, 'epoch': 0.81} {'loss': 0.8006, 'learning_rate': 1.297662920460334e-05, 'epoch': 0.81} {'loss': 0.7436, 'learning_rate': 1.297631668998245e-05, 'epoch': 0.81} {'loss': 0.916, 'learning_rate': 1.2976004172172167e-05, 'epoch': 0.81} {'loss': 0.7424, 'learning_rate': 1.2975691651172828e-05, 'epoch': 0.81} {'loss': 0.8344, 'learning_rate': 1.2975379126984766e-05, 'epoch': 0.81} {'loss': 0.7766, 'learning_rate': 1.2975066599608315e-05, 'epoch': 0.81} {'loss': 0.7952, 'learning_rate': 1.2974754069043811e-05, 'epoch': 0.81} {'loss': 0.7512, 'learning_rate': 1.2974441535291591e-05, 'epoch': 0.81} {'loss': 0.8708, 'learning_rate': 1.2974128998351988e-05, 'epoch': 0.81} {'loss': 0.6397, 'learning_rate': 1.2973816458225339e-05, 'epoch': 0.81} {'loss': 0.8996, 'learning_rate': 1.2973503914911977e-05, 'epoch': 0.81} {'loss': 0.7149, 'learning_rate': 1.2973191368412237e-05, 'epoch': 0.81} {'loss': 0.8097, 'learning_rate': 1.2972878818726454e-05, 'epoch': 0.81} {'loss': 0.7333, 'learning_rate': 1.297256626585496e-05, 'epoch': 0.81} {'loss': 0.8958, 'learning_rate': 1.2972253709798096e-05, 'epoch': 0.81} {'loss': 0.8524, 'learning_rate': 1.2971941150556196e-05, 'epoch': 0.81} {'loss': 0.7786, 'learning_rate': 1.2971628588129588e-05, 'epoch': 0.81} {'loss': 0.7511, 'learning_rate': 1.2971316022518616e-05, 'epoch': 0.81} {'loss': 0.8918, 'learning_rate': 1.2971003453723608e-05, 'epoch': 0.81} {'loss': 0.7727, 'learning_rate': 1.29706908817449e-05, 'epoch': 0.81} {'loss': 0.8088, 'learning_rate': 1.2970378306582832e-05, 'epoch': 0.81} {'loss': 0.8093, 'learning_rate': 1.2970065728237736e-05, 'epoch': 0.81} {'loss': 0.7379, 'learning_rate': 1.2969753146709942e-05, 'epoch': 0.81} {'loss': 0.6634, 'learning_rate': 1.2969440561999794e-05, 'epoch': 0.81} {'loss': 0.8441, 'learning_rate': 1.296912797410762e-05, 'epoch': 0.81} {'loss': 0.807, 'learning_rate': 1.2968815383033757e-05, 'epoch': 0.81} {'loss': 0.8382, 'learning_rate': 1.2968502788778543e-05, 'epoch': 0.81} {'loss': 0.8972, 'learning_rate': 1.2968190191342308e-05, 'epoch': 0.81} {'loss': 0.7314, 'learning_rate': 1.296787759072539e-05, 'epoch': 0.81} {'loss': 0.8991, 'learning_rate': 1.2967564986928124e-05, 'epoch': 0.81} {'loss': 1.0139, 'learning_rate': 1.2967252379950842e-05, 'epoch': 0.81} {'loss': 0.7887, 'learning_rate': 1.2966939769793884e-05, 'epoch': 0.81} {'loss': 0.7173, 'learning_rate': 1.2966627156457583e-05, 'epoch': 0.81} {'loss': 0.8063, 'learning_rate': 1.2966314539942274e-05, 'epoch': 0.81} {'loss': 0.7836, 'learning_rate': 1.2966001920248288e-05, 'epoch': 0.81} {'loss': 0.8016, 'learning_rate': 1.2965689297375961e-05, 'epoch': 0.81} {'loss': 0.8887, 'learning_rate': 1.2965376671325633e-05, 'epoch': 0.81} {'loss': 0.9673, 'learning_rate': 1.296506404209764e-05, 'epoch': 0.81} {'loss': 0.8039, 'learning_rate': 1.2964751409692307e-05, 'epoch': 0.81} {'loss': 0.7361, 'learning_rate': 1.296443877410998e-05, 'epoch': 0.81} {'loss': 0.9073, 'learning_rate': 1.2964126135350987e-05, 'epoch': 0.81} {'loss': 0.7058, 'learning_rate': 1.2963813493415665e-05, 'epoch': 0.81} {'loss': 0.8377, 'learning_rate': 1.296350084830435e-05, 'epoch': 0.81} {'loss': 0.7748, 'learning_rate': 1.2963188200017376e-05, 'epoch': 0.81} {'loss': 0.857, 'learning_rate': 1.2962875548555078e-05, 'epoch': 0.81} {'loss': 0.962, 'learning_rate': 1.2962562893917794e-05, 'epoch': 0.81} {'loss': 0.7851, 'learning_rate': 1.2962250236105856e-05, 'epoch': 0.81} {'loss': 0.7441, 'learning_rate': 1.2961937575119596e-05, 'epoch': 0.81} {'loss': 0.7011, 'learning_rate': 1.2961624910959354e-05, 'epoch': 0.81} {'loss': 0.7485, 'learning_rate': 1.2961312243625466e-05, 'epoch': 0.81} {'loss': 0.6863, 'learning_rate': 1.2960999573118263e-05, 'epoch': 0.81} {'loss': 0.7812, 'learning_rate': 1.2960686899438082e-05, 'epoch': 0.81} {'loss': 0.8057, 'learning_rate': 1.2960374222585259e-05, 'epoch': 0.81} {'loss': 0.8705, 'learning_rate': 1.2960061542560125e-05, 'epoch': 0.81} {'loss': 0.7955, 'learning_rate': 1.295974885936302e-05, 'epoch': 0.81} {'loss': 0.8437, 'learning_rate': 1.2959436172994276e-05, 'epoch': 0.81} {'loss': 0.8164, 'learning_rate': 1.2959123483454228e-05, 'epoch': 0.81} {'loss': 0.8719, 'learning_rate': 1.2958810790743211e-05, 'epoch': 0.81} {'loss': 0.8916, 'learning_rate': 1.2958498094861565e-05, 'epoch': 0.81} {'loss': 0.8766, 'learning_rate': 1.295818539580962e-05, 'epoch': 0.81} {'loss': 0.5706, 'learning_rate': 1.2957872693587715e-05, 'epoch': 0.81} {'loss': 0.7228, 'learning_rate': 1.2957559988196177e-05, 'epoch': 0.81} {'loss': 0.819, 'learning_rate': 1.2957247279635348e-05, 'epoch': 0.81} {'loss': 0.77, 'learning_rate': 1.2956934567905563e-05, 'epoch': 0.81} {'loss': 0.7858, 'learning_rate': 1.2956621853007153e-05, 'epoch': 0.81} {'loss': 0.9011, 'learning_rate': 1.2956309134940461e-05, 'epoch': 0.81} {'loss': 0.7888, 'learning_rate': 1.2955996413705816e-05, 'epoch': 0.81} {'loss': 0.7782, 'learning_rate': 1.2955683689303551e-05, 'epoch': 0.81} {'loss': 0.7227, 'learning_rate': 1.2955370961734006e-05, 'epoch': 0.81} {'loss': 0.8676, 'learning_rate': 1.2955058230997512e-05, 'epoch': 0.81} {'loss': 0.7995, 'learning_rate': 1.2954745497094407e-05, 'epoch': 0.81} {'loss': 0.7218, 'learning_rate': 1.2954432760025028e-05, 'epoch': 0.81} {'loss': 0.6836, 'learning_rate': 1.2954120019789707e-05, 'epoch': 0.81} {'loss': 0.7448, 'learning_rate': 1.295380727638878e-05, 'epoch': 0.81} {'loss': 0.9225, 'learning_rate': 1.295349452982258e-05, 'epoch': 0.81} {'loss': 0.7755, 'learning_rate': 1.2953181780091447e-05, 'epoch': 0.81} {'loss': 0.985, 'learning_rate': 1.2952869027195708e-05, 'epoch': 0.81} {'loss': 0.7006, 'learning_rate': 1.295255627113571e-05, 'epoch': 0.81} {'loss': 0.8876, 'learning_rate': 1.2952243511911777e-05, 'epoch': 0.81} {'loss': 0.7392, 'learning_rate': 1.295193074952425e-05, 'epoch': 0.81} {'loss': 0.7578, 'learning_rate': 1.2951617983973463e-05, 'epoch': 0.81} {'loss': 0.883, 'learning_rate': 1.2951305215259749e-05, 'epoch': 0.81} {'loss': 0.8053, 'learning_rate': 1.2950992443383445e-05, 'epoch': 0.81} {'loss': 0.7866, 'learning_rate': 1.295067966834489e-05, 'epoch': 0.81} {'loss': 0.7474, 'learning_rate': 1.2950366890144413e-05, 'epoch': 0.81} {'loss': 0.838, 'learning_rate': 1.295005410878235e-05, 'epoch': 0.81} {'loss': 0.9745, 'learning_rate': 1.2949741324259042e-05, 'epoch': 0.81} {'loss': 0.8084, 'learning_rate': 1.2949428536574818e-05, 'epoch': 0.81} {'loss': 0.6797, 'learning_rate': 1.2949115745730013e-05, 'epoch': 0.81} {'loss': 0.7099, 'learning_rate': 1.2948802951724963e-05, 'epoch': 0.81} {'loss': 0.5649, 'learning_rate': 1.2948490154560012e-05, 'epoch': 0.81} {'loss': 0.7307, 'learning_rate': 1.294817735423548e-05, 'epoch': 0.81} {'loss': 0.7691, 'learning_rate': 1.2947864550751712e-05, 'epoch': 0.81} {'loss': 0.8675, 'learning_rate': 1.2947551744109044e-05, 'epoch': 0.81} {'loss': 0.6026, 'learning_rate': 1.2947238934307806e-05, 'epoch': 0.81} {'loss': 0.8228, 'learning_rate': 1.2946926121348336e-05, 'epoch': 0.81} {'loss': 0.77, 'learning_rate': 1.2946613305230968e-05, 'epoch': 0.81} {'loss': 0.7971, 'learning_rate': 1.2946300485956038e-05, 'epoch': 0.81} {'loss': 0.6662, 'learning_rate': 1.294598766352388e-05, 'epoch': 0.81} {'loss': 0.7579, 'learning_rate': 1.2945674837934832e-05, 'epoch': 0.81} {'loss': 0.6299, 'learning_rate': 1.294536200918923e-05, 'epoch': 0.81} {'loss': 0.8826, 'learning_rate': 1.2945049177287404e-05, 'epoch': 0.81} {'loss': 0.8402, 'learning_rate': 1.2944736342229691e-05, 'epoch': 0.81} {'loss': 0.9791, 'learning_rate': 1.2944423504016427e-05, 'epoch': 0.81} {'loss': 0.8198, 'learning_rate': 1.2944110662647948e-05, 'epoch': 0.81} {'loss': 0.8223, 'learning_rate': 1.294379781812459e-05, 'epoch': 0.81} {'loss': 0.8601, 'learning_rate': 1.2943484970446686e-05, 'epoch': 0.81} {'loss': 0.8787, 'learning_rate': 1.2943172119614573e-05, 'epoch': 0.81} {'loss': 0.8477, 'learning_rate': 1.2942859265628584e-05, 'epoch': 0.81} {'loss': 0.7586, 'learning_rate': 1.294254640848906e-05, 'epoch': 0.81} {'loss': 0.9055, 'learning_rate': 1.2942233548196328e-05, 'epoch': 0.81} {'loss': 0.85, 'learning_rate': 1.2941920684750727e-05, 'epoch': 0.81} {'loss': 0.8186, 'learning_rate': 1.2941607818152592e-05, 'epoch': 0.81} {'loss': 0.8105, 'learning_rate': 1.294129494840226e-05, 'epoch': 0.81} {'loss': 0.7685, 'learning_rate': 1.2940982075500066e-05, 'epoch': 0.81} {'loss': 0.8147, 'learning_rate': 1.2940669199446345e-05, 'epoch': 0.81} {'loss': 0.8598, 'learning_rate': 1.294035632024143e-05, 'epoch': 0.81} {'loss': 0.7507, 'learning_rate': 1.2940043437885656e-05, 'epoch': 0.81} {'loss': 0.7933, 'learning_rate': 1.2939730552379361e-05, 'epoch': 0.81} {'loss': 0.7283, 'learning_rate': 1.293941766372288e-05, 'epoch': 0.81} {'loss': 0.9551, 'learning_rate': 1.2939104771916548e-05, 'epoch': 0.81} {'loss': 0.9662, 'learning_rate': 1.2938791876960704e-05, 'epoch': 0.81} {'loss': 0.9949, 'learning_rate': 1.2938478978855673e-05, 'epoch': 0.81} {'loss': 0.7684, 'learning_rate': 1.2938166077601797e-05, 'epoch': 0.81} {'loss': 0.8462, 'learning_rate': 1.2937853173199413e-05, 'epoch': 0.81} {'loss': 0.8134, 'learning_rate': 1.2937540265648854e-05, 'epoch': 0.81} {'loss': 0.9117, 'learning_rate': 1.2937227354950452e-05, 'epoch': 0.81} {'loss': 0.7726, 'learning_rate': 1.2936914441104552e-05, 'epoch': 0.81} {'loss': 0.8315, 'learning_rate': 1.293660152411148e-05, 'epoch': 0.81} {'loss': 0.7696, 'learning_rate': 1.2936288603971573e-05, 'epoch': 0.81} {'loss': 0.7742, 'learning_rate': 1.293597568068517e-05, 'epoch': 0.81} {'loss': 0.7792, 'learning_rate': 1.2935662754252602e-05, 'epoch': 0.81} {'loss': 0.6183, 'learning_rate': 1.2935349824674209e-05, 'epoch': 0.81} {'loss': 0.8293, 'learning_rate': 1.2935036891950321e-05, 'epoch': 0.81} {'loss': 0.811, 'learning_rate': 1.2934723956081278e-05, 'epoch': 0.81} {'loss': 0.7972, 'learning_rate': 1.2934411017067413e-05, 'epoch': 0.81} {'loss': 0.8949, 'learning_rate': 1.2934098074909063e-05, 'epoch': 0.81} {'loss': 0.6588, 'learning_rate': 1.293378512960656e-05, 'epoch': 0.81} {'loss': 0.8911, 'learning_rate': 1.293347218116024e-05, 'epoch': 0.81} {'loss': 0.6479, 'learning_rate': 1.2933159229570441e-05, 'epoch': 0.81} {'loss': 0.9275, 'learning_rate': 1.29328462748375e-05, 'epoch': 0.81} {'loss': 0.7296, 'learning_rate': 1.2932533316961745e-05, 'epoch': 0.81} {'loss': 0.795, 'learning_rate': 1.2932220355943522e-05, 'epoch': 0.81} {'loss': 0.7883, 'learning_rate': 1.2931907391783157e-05, 'epoch': 0.81} {'loss': 0.9069, 'learning_rate': 1.2931594424480987e-05, 'epoch': 0.81} {'loss': 0.722, 'learning_rate': 1.293128145403735e-05, 'epoch': 0.81} {'loss': 0.9285, 'learning_rate': 1.2930968480452581e-05, 'epoch': 0.81} {'loss': 0.7223, 'learning_rate': 1.2930655503727014e-05, 'epoch': 0.81} {'loss': 0.7335, 'learning_rate': 1.2930342523860986e-05, 'epoch': 0.81} {'loss': 0.8206, 'learning_rate': 1.2930029540854832e-05, 'epoch': 0.81} {'loss': 0.7946, 'learning_rate': 1.2929716554708885e-05, 'epoch': 0.81} {'loss': 0.7258, 'learning_rate': 1.2929403565423481e-05, 'epoch': 0.81} {'loss': 0.8388, 'learning_rate': 1.292909057299896e-05, 'epoch': 0.81} {'loss': 0.7461, 'learning_rate': 1.2928777577435655e-05, 'epoch': 0.81} {'loss': 0.8796, 'learning_rate': 1.2928464578733897e-05, 'epoch': 0.81} {'loss': 0.7476, 'learning_rate': 1.2928151576894029e-05, 'epoch': 0.81} {'loss': 0.8444, 'learning_rate': 1.2927838571916377e-05, 'epoch': 0.81} {'loss': 0.7039, 'learning_rate': 1.2927525563801284e-05, 'epoch': 0.81} {'loss': 0.8282, 'learning_rate': 1.2927212552549082e-05, 'epoch': 0.81} {'loss': 0.8604, 'learning_rate': 1.2926899538160112e-05, 'epoch': 0.81} {'loss': 0.8713, 'learning_rate': 1.29265865206347e-05, 'epoch': 0.81} {'loss': 0.8307, 'learning_rate': 1.2926273499973187e-05, 'epoch': 0.81} {'loss': 0.6375, 'learning_rate': 1.2925960476175912e-05, 'epoch': 0.81} {'loss': 0.7345, 'learning_rate': 1.2925647449243204e-05, 'epoch': 0.81} {'loss': 0.8275, 'learning_rate': 1.2925334419175399e-05, 'epoch': 0.81} {'loss': 0.7611, 'learning_rate': 1.2925021385972838e-05, 'epoch': 0.81} {'loss': 0.9325, 'learning_rate': 1.2924708349635848e-05, 'epoch': 0.81} {'loss': 0.7821, 'learning_rate': 1.292439531016477e-05, 'epoch': 0.81} {'loss': 0.744, 'learning_rate': 1.2924082267559939e-05, 'epoch': 0.81} {'loss': 0.8763, 'learning_rate': 1.2923769221821691e-05, 'epoch': 0.81} {'loss': 0.8785, 'learning_rate': 1.2923456172950359e-05, 'epoch': 0.81} {'loss': 0.853, 'learning_rate': 1.2923143120946282e-05, 'epoch': 0.81} {'loss': 0.971, 'learning_rate': 1.2922830065809793e-05, 'epoch': 0.81} {'loss': 0.915, 'learning_rate': 1.2922517007541226e-05, 'epoch': 0.81} {'loss': 0.8838, 'learning_rate': 1.2922203946140916e-05, 'epoch': 0.81} {'loss': 0.902, 'learning_rate': 1.2921890881609205e-05, 'epoch': 0.81} {'loss': 0.7141, 'learning_rate': 1.2921577813946425e-05, 'epoch': 0.81} {'loss': 0.7774, 'learning_rate': 1.2921264743152909e-05, 'epoch': 0.81} {'loss': 0.7327, 'learning_rate': 1.2920951669228993e-05, 'epoch': 0.81} {'loss': 0.7951, 'learning_rate': 1.2920638592175015e-05, 'epoch': 0.82} {'loss': 0.7289, 'learning_rate': 1.2920325511991307e-05, 'epoch': 0.82} {'loss': 0.7202, 'learning_rate': 1.2920012428678209e-05, 'epoch': 0.82} {'loss': 0.5803, 'learning_rate': 1.2919699342236053e-05, 'epoch': 0.82} {'loss': 0.7691, 'learning_rate': 1.2919386252665177e-05, 'epoch': 0.82} {'loss': 0.9794, 'learning_rate': 1.2919073159965913e-05, 'epoch': 0.82} {'loss': 0.801, 'learning_rate': 1.29187600641386e-05, 'epoch': 0.82} {'loss': 0.7618, 'learning_rate': 1.2918446965183571e-05, 'epoch': 0.82} {'loss': 0.75, 'learning_rate': 1.2918133863101163e-05, 'epoch': 0.82} {'loss': 0.945, 'learning_rate': 1.291782075789171e-05, 'epoch': 0.82} {'loss': 0.7303, 'learning_rate': 1.2917507649555554e-05, 'epoch': 0.82} {'loss': 0.6595, 'learning_rate': 1.291719453809302e-05, 'epoch': 0.82} {'loss': 0.6408, 'learning_rate': 1.2916881423504452e-05, 'epoch': 0.82} {'loss': 0.969, 'learning_rate': 1.291656830579018e-05, 'epoch': 0.82} {'loss': 0.7899, 'learning_rate': 1.2916255184950544e-05, 'epoch': 0.82} {'loss': 0.6768, 'learning_rate': 1.2915942060985873e-05, 'epoch': 0.82} {'loss': 0.8939, 'learning_rate': 1.2915628933896512e-05, 'epoch': 0.82} {'loss': 0.8016, 'learning_rate': 1.2915315803682788e-05, 'epoch': 0.82} {'loss': 0.6718, 'learning_rate': 1.2915002670345045e-05, 'epoch': 0.82} {'loss': 0.7224, 'learning_rate': 1.2914689533883608e-05, 'epoch': 0.82} {'loss': 0.7499, 'learning_rate': 1.2914376394298818e-05, 'epoch': 0.82} {'loss': 1.0119, 'learning_rate': 1.2914063251591014e-05, 'epoch': 0.82} {'loss': 0.6581, 'learning_rate': 1.2913750105760525e-05, 'epoch': 0.82} {'loss': 0.8439, 'learning_rate': 1.291343695680769e-05, 'epoch': 0.82} {'loss': 0.7746, 'learning_rate': 1.2913123804732848e-05, 'epoch': 0.82} {'loss': 0.8759, 'learning_rate': 1.2912810649536331e-05, 'epoch': 0.82} {'loss': 0.7949, 'learning_rate': 1.2912497491218473e-05, 'epoch': 0.82} {'loss': 0.8209, 'learning_rate': 1.2912184329779609e-05, 'epoch': 0.82} {'loss': 0.937, 'learning_rate': 1.2911871165220076e-05, 'epoch': 0.82} {'loss': 0.8394, 'learning_rate': 1.2911557997540212e-05, 'epoch': 0.82} {'loss': 0.8482, 'learning_rate': 1.2911244826740352e-05, 'epoch': 0.82} {'loss': 0.8405, 'learning_rate': 1.2910931652820829e-05, 'epoch': 0.82} {'loss': 0.8669, 'learning_rate': 1.2910618475781982e-05, 'epoch': 0.82} {'loss': 0.7064, 'learning_rate': 1.2910305295624144e-05, 'epoch': 0.82} {'loss': 0.751, 'learning_rate': 1.290999211234765e-05, 'epoch': 0.82} {'loss': 0.91, 'learning_rate': 1.2909678925952836e-05, 'epoch': 0.82} {'loss': 0.8358, 'learning_rate': 1.2909365736440041e-05, 'epoch': 0.82} {'loss': 0.8221, 'learning_rate': 1.2909052543809594e-05, 'epoch': 0.82} {'loss': 0.8321, 'learning_rate': 1.2908739348061839e-05, 'epoch': 0.82} {'loss': 0.8015, 'learning_rate': 1.2908426149197106e-05, 'epoch': 0.82} {'loss': 0.9708, 'learning_rate': 1.2908112947215729e-05, 'epoch': 0.82} {'loss': 0.8249, 'learning_rate': 1.290779974211805e-05, 'epoch': 0.82} {'loss': 0.7846, 'learning_rate': 1.2907486533904399e-05, 'epoch': 0.82} {'loss': 0.8172, 'learning_rate': 1.2907173322575117e-05, 'epoch': 0.82} {'loss': 0.8276, 'learning_rate': 1.2906860108130533e-05, 'epoch': 0.82} {'loss': 0.7205, 'learning_rate': 1.2906546890570986e-05, 'epoch': 0.82} {'loss': 0.8212, 'learning_rate': 1.2906233669896815e-05, 'epoch': 0.82} {'loss': 0.5726, 'learning_rate': 1.290592044610835e-05, 'epoch': 0.82} {'loss': 0.7112, 'learning_rate': 1.2905607219205926e-05, 'epoch': 0.82} {'loss': 0.8346, 'learning_rate': 1.290529398918989e-05, 'epoch': 0.82} {'loss': 0.7543, 'learning_rate': 1.2904980756060561e-05, 'epoch': 0.82} {'loss': 0.8501, 'learning_rate': 1.2904667519818285e-05, 'epoch': 0.82} {'loss': 0.8493, 'learning_rate': 1.2904354280463399e-05, 'epoch': 0.82} {'loss': 0.6352, 'learning_rate': 1.290404103799623e-05, 'epoch': 0.82} {'loss': 0.9388, 'learning_rate': 1.2903727792417122e-05, 'epoch': 0.82} {'loss': 0.8101, 'learning_rate': 1.290341454372641e-05, 'epoch': 0.82} {'loss': 0.6885, 'learning_rate': 1.2903101291924423e-05, 'epoch': 0.82} {'loss': 0.811, 'learning_rate': 1.2902788037011503e-05, 'epoch': 0.82} {'loss': 0.9031, 'learning_rate': 1.2902474778987981e-05, 'epoch': 0.82} {'loss': 0.8139, 'learning_rate': 1.2902161517854199e-05, 'epoch': 0.82} {'loss': 0.9496, 'learning_rate': 1.2901848253610487e-05, 'epoch': 0.82} {'loss': 0.9828, 'learning_rate': 1.2901534986257183e-05, 'epoch': 0.82} {'loss': 0.6465, 'learning_rate': 1.2901221715794625e-05, 'epoch': 0.82} {'loss': 0.7774, 'learning_rate': 1.2900908442223141e-05, 'epoch': 0.82} {'loss': 0.754, 'learning_rate': 1.2900595165543075e-05, 'epoch': 0.82} {'loss': 0.8479, 'learning_rate': 1.2900281885754757e-05, 'epoch': 0.82} {'loss': 0.7801, 'learning_rate': 1.2899968602858528e-05, 'epoch': 0.82} {'loss': 0.6142, 'learning_rate': 1.289965531685472e-05, 'epoch': 0.82} {'loss': 0.6415, 'learning_rate': 1.2899342027743673e-05, 'epoch': 0.82} {'loss': 0.6583, 'learning_rate': 1.2899028735525713e-05, 'epoch': 0.82} {'loss': 0.8253, 'learning_rate': 1.2898715440201186e-05, 'epoch': 0.82} {'loss': 1.0057, 'learning_rate': 1.289840214177042e-05, 'epoch': 0.82} {'loss': 0.8736, 'learning_rate': 1.2898088840233758e-05, 'epoch': 0.82} {'loss': 0.832, 'learning_rate': 1.2897775535591532e-05, 'epoch': 0.82} {'loss': 0.7777, 'learning_rate': 1.289746222784408e-05, 'epoch': 0.82} {'loss': 0.6686, 'learning_rate': 1.2897148916991733e-05, 'epoch': 0.82} {'loss': 0.7786, 'learning_rate': 1.289683560303483e-05, 'epoch': 0.82} {'loss': 0.7598, 'learning_rate': 1.2896522285973703e-05, 'epoch': 0.82} {'loss': 0.8515, 'learning_rate': 1.2896208965808693e-05, 'epoch': 0.82} {'loss': 0.7968, 'learning_rate': 1.2895895642540135e-05, 'epoch': 0.82} {'loss': 0.8145, 'learning_rate': 1.2895582316168364e-05, 'epoch': 0.82} {'loss': 0.8044, 'learning_rate': 1.2895268986693716e-05, 'epoch': 0.82} {'loss': 0.785, 'learning_rate': 1.2894955654116523e-05, 'epoch': 0.82} {'loss': 0.7346, 'learning_rate': 1.2894642318437125e-05, 'epoch': 0.82} {'loss': 0.8126, 'learning_rate': 1.2894328979655855e-05, 'epoch': 0.82} {'loss': 0.9017, 'learning_rate': 1.2894015637773053e-05, 'epoch': 0.82} {'loss': 0.8279, 'learning_rate': 1.2893702292789048e-05, 'epoch': 0.82} {'loss': 0.7543, 'learning_rate': 1.2893388944704184e-05, 'epoch': 0.82} {'loss': 0.8111, 'learning_rate': 1.2893075593518792e-05, 'epoch': 0.82} {'loss': 0.7801, 'learning_rate': 1.2892762239233208e-05, 'epoch': 0.82} {'loss': 0.8333, 'learning_rate': 1.2892448881847765e-05, 'epoch': 0.82} {'loss': 0.797, 'learning_rate': 1.2892135521362805e-05, 'epoch': 0.82} {'loss': 0.8553, 'learning_rate': 1.289182215777866e-05, 'epoch': 0.82} {'loss': 0.7771, 'learning_rate': 1.2891508791095668e-05, 'epoch': 0.82} {'loss': 0.6998, 'learning_rate': 1.2891195421314162e-05, 'epoch': 0.82} {'loss': 0.7801, 'learning_rate': 1.289088204843448e-05, 'epoch': 0.82} {'loss': 0.9239, 'learning_rate': 1.2890568672456955e-05, 'epoch': 0.82} {'loss': 0.8845, 'learning_rate': 1.2890255293381926e-05, 'epoch': 0.82} {'loss': 0.6946, 'learning_rate': 1.2889941911209727e-05, 'epoch': 0.82} {'loss': 0.7166, 'learning_rate': 1.2889628525940698e-05, 'epoch': 0.82} {'loss': 0.9602, 'learning_rate': 1.2889315137575167e-05, 'epoch': 0.82} {'loss': 0.8474, 'learning_rate': 1.2889001746113477e-05, 'epoch': 0.82} {'loss': 0.7141, 'learning_rate': 1.2888688351555957e-05, 'epoch': 0.82} {'loss': 0.9086, 'learning_rate': 1.2888374953902951e-05, 'epoch': 0.82} {'loss': 0.8743, 'learning_rate': 1.2888061553154788e-05, 'epoch': 0.82} {'loss': 0.6655, 'learning_rate': 1.2887748149311805e-05, 'epoch': 0.82} {'loss': 0.6586, 'learning_rate': 1.2887434742374343e-05, 'epoch': 0.82} {'loss': 0.7519, 'learning_rate': 1.2887121332342731e-05, 'epoch': 0.82} {'loss': 1.0317, 'learning_rate': 1.2886807919217313e-05, 'epoch': 0.82} {'loss': 0.9751, 'learning_rate': 1.2886494502998415e-05, 'epoch': 0.82} {'loss': 0.6878, 'learning_rate': 1.2886181083686378e-05, 'epoch': 0.82} {'loss': 0.8686, 'learning_rate': 1.2885867661281535e-05, 'epoch': 0.82} {'loss': 0.9565, 'learning_rate': 1.288555423578423e-05, 'epoch': 0.82} {'loss': 0.9426, 'learning_rate': 1.288524080719479e-05, 'epoch': 0.82} {'loss': 0.951, 'learning_rate': 1.2884927375513554e-05, 'epoch': 0.82} {'loss': 0.8229, 'learning_rate': 1.288461394074086e-05, 'epoch': 0.82} {'loss': 0.5342, 'learning_rate': 1.2884300502877038e-05, 'epoch': 0.82} {'loss': 0.9182, 'learning_rate': 1.2883987061922432e-05, 'epoch': 0.82} {'loss': 0.8088, 'learning_rate': 1.2883673617877373e-05, 'epoch': 0.82} {'loss': 0.8337, 'learning_rate': 1.2883360170742194e-05, 'epoch': 0.82} {'loss': 0.9259, 'learning_rate': 1.2883046720517236e-05, 'epoch': 0.82} {'loss': 0.7964, 'learning_rate': 1.2882733267202833e-05, 'epoch': 0.82} {'loss': 0.8358, 'learning_rate': 1.2882419810799323e-05, 'epoch': 0.82} {'loss': 0.7791, 'learning_rate': 1.2882106351307038e-05, 'epoch': 0.82} {'loss': 0.8017, 'learning_rate': 1.2881792888726319e-05, 'epoch': 0.82} {'loss': 0.6824, 'learning_rate': 1.2881479423057495e-05, 'epoch': 0.82} {'loss': 0.7847, 'learning_rate': 1.2881165954300907e-05, 'epoch': 0.82} {'loss': 0.7332, 'learning_rate': 1.288085248245689e-05, 'epoch': 0.82} {'loss': 0.7978, 'learning_rate': 1.2880539007525779e-05, 'epoch': 0.82} {'loss': 0.7036, 'learning_rate': 1.2880225529507913e-05, 'epoch': 0.82} {'loss': 0.8849, 'learning_rate': 1.287991204840362e-05, 'epoch': 0.82} {'loss': 0.7708, 'learning_rate': 1.2879598564213246e-05, 'epoch': 0.82} {'loss': 0.7078, 'learning_rate': 1.287928507693712e-05, 'epoch': 0.82} {'loss': 0.7933, 'learning_rate': 1.2878971586575582e-05, 'epoch': 0.82} {'loss': 0.7503, 'learning_rate': 1.2878658093128965e-05, 'epoch': 0.82} {'loss': 0.9329, 'learning_rate': 1.2878344596597608e-05, 'epoch': 0.82} {'loss': 0.7994, 'learning_rate': 1.2878031096981843e-05, 'epoch': 0.82} {'loss': 0.6788, 'learning_rate': 1.2877717594282006e-05, 'epoch': 0.82} {'loss': 0.9182, 'learning_rate': 1.2877404088498437e-05, 'epoch': 0.82} {'loss': 0.8837, 'learning_rate': 1.2877090579631471e-05, 'epoch': 0.82} {'loss': 1.0592, 'learning_rate': 1.2876777067681441e-05, 'epoch': 0.82} {'loss': 0.6455, 'learning_rate': 1.2876463552648684e-05, 'epoch': 0.82} {'loss': 0.7683, 'learning_rate': 1.2876150034533539e-05, 'epoch': 0.82} {'loss': 0.8298, 'learning_rate': 1.287583651333634e-05, 'epoch': 0.82} {'loss': 0.9143, 'learning_rate': 1.287552298905742e-05, 'epoch': 0.82} {'loss': 0.9014, 'learning_rate': 1.2875209461697119e-05, 'epoch': 0.82} {'loss': 0.8682, 'learning_rate': 1.2874895931255772e-05, 'epoch': 0.82} {'loss': 0.7508, 'learning_rate': 1.287458239773371e-05, 'epoch': 0.82} {'loss': 0.7188, 'learning_rate': 1.2874268861131278e-05, 'epoch': 0.82} {'loss': 0.6457, 'learning_rate': 1.2873955321448808e-05, 'epoch': 0.82} {'loss': 0.9029, 'learning_rate': 1.2873641778686637e-05, 'epoch': 0.82} {'loss': 0.8369, 'learning_rate': 1.2873328232845094e-05, 'epoch': 0.82} {'loss': 0.9509, 'learning_rate': 1.2873014683924522e-05, 'epoch': 0.82} {'loss': 0.9762, 'learning_rate': 1.2872701131925259e-05, 'epoch': 0.82} {'loss': 0.7602, 'learning_rate': 1.2872387576847633e-05, 'epoch': 0.82} {'loss': 0.8101, 'learning_rate': 1.2872074018691986e-05, 'epoch': 0.82} {'loss': 0.895, 'learning_rate': 1.2871760457458656e-05, 'epoch': 0.82} {'loss': 0.8892, 'learning_rate': 1.2871446893147975e-05, 'epoch': 0.82} {'loss': 0.8793, 'learning_rate': 1.2871133325760274e-05, 'epoch': 0.82} {'loss': 0.6739, 'learning_rate': 1.2870819755295899e-05, 'epoch': 0.82} {'loss': 0.8054, 'learning_rate': 1.2870506181755177e-05, 'epoch': 0.82} {'loss': 0.7764, 'learning_rate': 1.2870192605138451e-05, 'epoch': 0.82} {'loss': 0.9537, 'learning_rate': 1.2869879025446057e-05, 'epoch': 0.82} {'loss': 0.79, 'learning_rate': 1.2869565442678326e-05, 'epoch': 0.82} {'loss': 0.8793, 'learning_rate': 1.28692518568356e-05, 'epoch': 0.82} {'loss': 0.7913, 'learning_rate': 1.2868938267918209e-05, 'epoch': 0.82} {'loss': 0.5773, 'learning_rate': 1.2868624675926491e-05, 'epoch': 0.82} {'loss': 0.7326, 'learning_rate': 1.2868311080860782e-05, 'epoch': 0.82} {'loss': 0.896, 'learning_rate': 1.286799748272142e-05, 'epoch': 0.82} {'loss': 0.773, 'learning_rate': 1.286768388150874e-05, 'epoch': 0.82} {'loss': 0.9126, 'learning_rate': 1.2867370277223082e-05, 'epoch': 0.82} {'loss': 0.6232, 'learning_rate': 1.2867056669864772e-05, 'epoch': 0.82} {'loss': 0.7044, 'learning_rate': 1.2866743059434155e-05, 'epoch': 0.82} {'loss': 0.8711, 'learning_rate': 1.2866429445931563e-05, 'epoch': 0.82} {'loss': 0.866, 'learning_rate': 1.2866115829357333e-05, 'epoch': 0.82} {'loss': 0.7192, 'learning_rate': 1.2865802209711802e-05, 'epoch': 0.82} {'loss': 0.9396, 'learning_rate': 1.2865488586995306e-05, 'epoch': 0.82} {'loss': 0.6732, 'learning_rate': 1.2865174961208178e-05, 'epoch': 0.82} {'loss': 0.6932, 'learning_rate': 1.2864861332350757e-05, 'epoch': 0.82} {'loss': 0.9456, 'learning_rate': 1.286454770042338e-05, 'epoch': 0.82} {'loss': 1.0281, 'learning_rate': 1.286423406542638e-05, 'epoch': 0.82} {'loss': 0.6947, 'learning_rate': 1.2863920427360098e-05, 'epoch': 0.82} {'loss': 0.755, 'learning_rate': 1.2863606786224863e-05, 'epoch': 0.82} {'loss': 0.9489, 'learning_rate': 1.2863293142021013e-05, 'epoch': 0.82} {'loss': 0.8712, 'learning_rate': 1.2862979494748893e-05, 'epoch': 0.82} {'loss': 0.7997, 'learning_rate': 1.2862665844408826e-05, 'epoch': 0.82} {'loss': 0.8075, 'learning_rate': 1.2862352191001155e-05, 'epoch': 0.82} {'loss': 0.9503, 'learning_rate': 1.286203853452622e-05, 'epoch': 0.82} {'loss': 0.7217, 'learning_rate': 1.2861724874984347e-05, 'epoch': 0.82} {'loss': 0.8734, 'learning_rate': 1.2861411212375878e-05, 'epoch': 0.82} {'loss': 0.9993, 'learning_rate': 1.286109754670115e-05, 'epoch': 0.82} {'loss': 0.7526, 'learning_rate': 1.28607838779605e-05, 'epoch': 0.82} {'loss': 0.8561, 'learning_rate': 1.2860470206154258e-05, 'epoch': 0.82} {'loss': 0.8168, 'learning_rate': 1.2860156531282765e-05, 'epoch': 0.82} {'loss': 0.7258, 'learning_rate': 1.2859842853346358e-05, 'epoch': 0.82} {'loss': 0.7318, 'learning_rate': 1.285952917234537e-05, 'epoch': 0.82} {'loss': 0.8657, 'learning_rate': 1.2859215488280138e-05, 'epoch': 0.82} {'loss': 0.9509, 'learning_rate': 1.2858901801150998e-05, 'epoch': 0.82} {'loss': 0.8468, 'learning_rate': 1.285858811095829e-05, 'epoch': 0.82} {'loss': 0.8914, 'learning_rate': 1.2858274417702344e-05, 'epoch': 0.82} {'loss': 0.9978, 'learning_rate': 1.28579607213835e-05, 'epoch': 0.82} {'loss': 0.6887, 'learning_rate': 1.2857647022002093e-05, 'epoch': 0.82} {'loss': 1.101, 'learning_rate': 1.2857333319558458e-05, 'epoch': 0.82} {'loss': 0.5318, 'learning_rate': 1.2857019614052933e-05, 'epoch': 0.82} {'loss': 0.6627, 'learning_rate': 1.2856705905485853e-05, 'epoch': 0.82} {'loss': 0.7609, 'learning_rate': 1.2856392193857557e-05, 'epoch': 0.82} {'loss': 0.7149, 'learning_rate': 1.2856078479168378e-05, 'epoch': 0.82} {'loss': 0.8132, 'learning_rate': 1.2855764761418655e-05, 'epoch': 0.82} {'loss': 0.81, 'learning_rate': 1.285545104060872e-05, 'epoch': 0.82} {'loss': 0.6537, 'learning_rate': 1.285513731673891e-05, 'epoch': 0.82} {'loss': 0.8538, 'learning_rate': 1.2854823589809564e-05, 'epoch': 0.82} {'loss': 0.7658, 'learning_rate': 1.2854509859821019e-05, 'epoch': 0.82} {'loss': 0.7668, 'learning_rate': 1.2854196126773606e-05, 'epoch': 0.82} {'loss': 0.8028, 'learning_rate': 1.2853882390667667e-05, 'epoch': 0.82} {'loss': 0.9122, 'learning_rate': 1.2853568651503534e-05, 'epoch': 0.82} {'loss': 0.8194, 'learning_rate': 1.2853254909281543e-05, 'epoch': 0.82} {'loss': 1.1058, 'learning_rate': 1.2852941164002034e-05, 'epoch': 0.82} {'loss': 0.898, 'learning_rate': 1.2852627415665339e-05, 'epoch': 0.82} {'loss': 0.8177, 'learning_rate': 1.2852313664271799e-05, 'epoch': 0.82} {'loss': 0.9579, 'learning_rate': 1.2851999909821749e-05, 'epoch': 0.82} {'loss': 0.7488, 'learning_rate': 1.2851686152315519e-05, 'epoch': 0.82} {'loss': 0.8411, 'learning_rate': 1.2851372391753452e-05, 'epoch': 0.82} {'loss': 0.9114, 'learning_rate': 1.2851058628135881e-05, 'epoch': 0.82} {'loss': 0.7131, 'learning_rate': 1.2850744861463142e-05, 'epoch': 0.82} {'loss': 0.7633, 'learning_rate': 1.2850431091735575e-05, 'epoch': 0.82} {'loss': 0.8526, 'learning_rate': 1.2850117318953516e-05, 'epoch': 0.82} {'loss': 0.6684, 'learning_rate': 1.2849803543117299e-05, 'epoch': 0.82} {'loss': 0.7769, 'learning_rate': 1.2849489764227257e-05, 'epoch': 0.82} {'loss': 0.892, 'learning_rate': 1.284917598228373e-05, 'epoch': 0.82} {'loss': 0.8233, 'learning_rate': 1.2848862197287053e-05, 'epoch': 0.82} {'loss': 0.6855, 'learning_rate': 1.2848548409237565e-05, 'epoch': 0.82} {'loss': 0.6637, 'learning_rate': 1.28482346181356e-05, 'epoch': 0.82} {'loss': 0.7896, 'learning_rate': 1.2847920823981495e-05, 'epoch': 0.82} {'loss': 0.9186, 'learning_rate': 1.2847607026775585e-05, 'epoch': 0.82} {'loss': 0.8409, 'learning_rate': 1.2847293226518207e-05, 'epoch': 0.82} {'loss': 0.7783, 'learning_rate': 1.2846979423209699e-05, 'epoch': 0.82} {'loss': 0.7633, 'learning_rate': 1.2846665616850391e-05, 'epoch': 0.82} {'loss': 0.794, 'learning_rate': 1.2846351807440627e-05, 'epoch': 0.82} {'loss': 0.7377, 'learning_rate': 1.2846037994980743e-05, 'epoch': 0.82} {'loss': 0.8735, 'learning_rate': 1.2845724179471066e-05, 'epoch': 0.82} {'loss': 0.7223, 'learning_rate': 1.2845410360911945e-05, 'epoch': 0.82} {'loss': 0.7843, 'learning_rate': 1.2845096539303708e-05, 'epoch': 0.82} {'loss': 0.7052, 'learning_rate': 1.284478271464669e-05, 'epoch': 0.82} {'loss': 0.8342, 'learning_rate': 1.2844468886941233e-05, 'epoch': 0.82} {'loss': 0.7774, 'learning_rate': 1.284415505618767e-05, 'epoch': 0.82} {'loss': 0.8543, 'learning_rate': 1.284384122238634e-05, 'epoch': 0.82} {'loss': 0.8928, 'learning_rate': 1.2843527385537575e-05, 'epoch': 0.82} {'loss': 0.7406, 'learning_rate': 1.2843213545641718e-05, 'epoch': 0.82} {'loss': 0.8366, 'learning_rate': 1.2842899702699096e-05, 'epoch': 0.82} {'loss': 0.7308, 'learning_rate': 1.2842585856710053e-05, 'epoch': 0.82} {'loss': 0.6584, 'learning_rate': 1.2842272007674922e-05, 'epoch': 0.82} {'loss': 0.7921, 'learning_rate': 1.284195815559404e-05, 'epoch': 0.82} {'loss': 0.6982, 'learning_rate': 1.2841644300467744e-05, 'epoch': 0.82} {'loss': 0.7285, 'learning_rate': 1.2841330442296372e-05, 'epoch': 0.82} {'loss': 0.8884, 'learning_rate': 1.2841016581080255e-05, 'epoch': 0.82} {'loss': 0.809, 'learning_rate': 1.284070271681973e-05, 'epoch': 0.82} {'loss': 0.954, 'learning_rate': 1.2840388849515137e-05, 'epoch': 0.82} {'loss': 0.9966, 'learning_rate': 1.2840074979166817e-05, 'epoch': 0.82} {'loss': 0.8771, 'learning_rate': 1.2839761105775095e-05, 'epoch': 0.82} {'loss': 0.6384, 'learning_rate': 1.2839447229340311e-05, 'epoch': 0.82} {'loss': 0.8393, 'learning_rate': 1.2839133349862807e-05, 'epoch': 0.82} {'loss': 0.6619, 'learning_rate': 1.2838819467342914e-05, 'epoch': 0.82} {'loss': 0.9306, 'learning_rate': 1.283850558178097e-05, 'epoch': 0.82} {'loss': 0.88, 'learning_rate': 1.2838191693177309e-05, 'epoch': 0.82} {'loss': 0.8071, 'learning_rate': 1.283787780153227e-05, 'epoch': 0.82} {'loss': 0.7748, 'learning_rate': 1.2837563906846188e-05, 'epoch': 0.82} {'loss': 0.8134, 'learning_rate': 1.2837250009119404e-05, 'epoch': 0.82} {'loss': 0.8079, 'learning_rate': 1.2836936108352249e-05, 'epoch': 0.82} {'loss': 0.852, 'learning_rate': 1.2836622204545059e-05, 'epoch': 0.82} {'loss': 0.9378, 'learning_rate': 1.2836308297698174e-05, 'epoch': 0.82} {'loss': 0.8354, 'learning_rate': 1.283599438781193e-05, 'epoch': 0.82} {'loss': 0.7309, 'learning_rate': 1.2835680474886659e-05, 'epoch': 0.82} {'loss': 0.7721, 'learning_rate': 1.2835366558922701e-05, 'epoch': 0.82} {'loss': 0.7477, 'learning_rate': 1.2835052639920394e-05, 'epoch': 0.82} {'loss': 0.8568, 'learning_rate': 1.283473871788007e-05, 'epoch': 0.82} {'loss': 0.6428, 'learning_rate': 1.2834424792802072e-05, 'epoch': 0.82} {'loss': 0.8073, 'learning_rate': 1.2834110864686727e-05, 'epoch': 0.82} {'loss': 0.8036, 'learning_rate': 1.2833796933534377e-05, 'epoch': 0.82} {'loss': 0.8177, 'learning_rate': 1.2833482999345357e-05, 'epoch': 0.82} {'loss': 0.8169, 'learning_rate': 1.2833169062120005e-05, 'epoch': 0.82} {'loss': 0.7439, 'learning_rate': 1.2832855121858658e-05, 'epoch': 0.82} {'loss': 0.8722, 'learning_rate': 1.2832541178561652e-05, 'epoch': 0.82} {'loss': 0.8388, 'learning_rate': 1.2832227232229322e-05, 'epoch': 0.82} {'loss': 0.9037, 'learning_rate': 1.2831913282862003e-05, 'epoch': 0.82} {'loss': 0.6744, 'learning_rate': 1.2831599330460035e-05, 'epoch': 0.82} {'loss': 0.7077, 'learning_rate': 1.283128537502375e-05, 'epoch': 0.82} {'loss': 0.7225, 'learning_rate': 1.283097141655349e-05, 'epoch': 0.82} {'loss': 0.7365, 'learning_rate': 1.2830657455049589e-05, 'epoch': 0.82} {'loss': 0.8422, 'learning_rate': 1.2830343490512381e-05, 'epoch': 0.82} {'loss': 0.9184, 'learning_rate': 1.2830029522942207e-05, 'epoch': 0.82} {'loss': 0.9548, 'learning_rate': 1.2829715552339397e-05, 'epoch': 0.82} {'loss': 0.8587, 'learning_rate': 1.2829401578704294e-05, 'epoch': 0.82} {'loss': 0.7567, 'learning_rate': 1.282908760203723e-05, 'epoch': 0.82} {'loss': 0.9418, 'learning_rate': 1.2828773622338546e-05, 'epoch': 0.82} {'loss': 0.8303, 'learning_rate': 1.2828459639608575e-05, 'epoch': 0.82} {'loss': 0.844, 'learning_rate': 1.2828145653847654e-05, 'epoch': 0.82} {'loss': 0.7799, 'learning_rate': 1.282783166505612e-05, 'epoch': 0.82} {'loss': 0.7244, 'learning_rate': 1.282751767323431e-05, 'epoch': 0.82} {'loss': 0.6826, 'learning_rate': 1.2827203678382556e-05, 'epoch': 0.82} {'loss': 0.7642, 'learning_rate': 1.28268896805012e-05, 'epoch': 0.82} {'loss': 0.7752, 'learning_rate': 1.2826575679590576e-05, 'epoch': 0.82} {'loss': 0.7125, 'learning_rate': 1.2826261675651024e-05, 'epoch': 0.82} {'loss': 0.7115, 'learning_rate': 1.2825947668682876e-05, 'epoch': 0.82} {'loss': 0.6452, 'learning_rate': 1.2825633658686469e-05, 'epoch': 0.82} {'loss': 0.79, 'learning_rate': 1.2825319645662139e-05, 'epoch': 0.82} {'loss': 0.7527, 'learning_rate': 1.2825005629610227e-05, 'epoch': 0.82} {'loss': 0.8076, 'learning_rate': 1.2824691610531063e-05, 'epoch': 0.82} {'loss': 0.7969, 'learning_rate': 1.2824377588424992e-05, 'epoch': 0.82} {'loss': 0.8861, 'learning_rate': 1.2824063563292341e-05, 'epoch': 0.82} {'loss': 0.5393, 'learning_rate': 1.2823749535133455e-05, 'epoch': 0.82} {'loss': 0.8141, 'learning_rate': 1.2823435503948665e-05, 'epoch': 0.82} {'loss': 0.7542, 'learning_rate': 1.282312146973831e-05, 'epoch': 0.82} {'loss': 0.8756, 'learning_rate': 1.2822807432502722e-05, 'epoch': 0.82} {'loss': 0.7534, 'learning_rate': 1.2822493392242244e-05, 'epoch': 0.82} {'loss': 0.7639, 'learning_rate': 1.2822179348957208e-05, 'epoch': 0.82} {'loss': 0.8372, 'learning_rate': 1.2821865302647951e-05, 'epoch': 0.82} {'loss': 0.7497, 'learning_rate': 1.2821551253314815e-05, 'epoch': 0.82} {'loss': 0.7388, 'learning_rate': 1.282123720095813e-05, 'epoch': 0.82} {'loss': 0.647, 'learning_rate': 1.2820923145578232e-05, 'epoch': 0.82} {'loss': 0.9106, 'learning_rate': 1.2820609087175466e-05, 'epoch': 0.82} {'loss': 0.7719, 'learning_rate': 1.2820295025750159e-05, 'epoch': 0.82} {'loss': 0.6944, 'learning_rate': 1.281998096130265e-05, 'epoch': 0.82} {'loss': 0.8348, 'learning_rate': 1.2819666893833278e-05, 'epoch': 0.82} {'loss': 0.8637, 'learning_rate': 1.2819352823342381e-05, 'epoch': 0.82} {'loss': 0.9467, 'learning_rate': 1.281903874983029e-05, 'epoch': 0.82} {'loss': 0.6035, 'learning_rate': 1.2818724673297344e-05, 'epoch': 0.82} {'loss': 0.6811, 'learning_rate': 1.2818410593743884e-05, 'epoch': 0.82} {'loss': 0.8486, 'learning_rate': 1.2818096511170239e-05, 'epoch': 0.82} {'loss': 0.7662, 'learning_rate': 1.281778242557675e-05, 'epoch': 0.82} {'loss': 0.7694, 'learning_rate': 1.2817468336963755e-05, 'epoch': 0.82} {'loss': 0.5932, 'learning_rate': 1.2817154245331586e-05, 'epoch': 0.82} {'loss': 0.6423, 'learning_rate': 1.2816840150680583e-05, 'epoch': 0.82} {'loss': 0.8331, 'learning_rate': 1.2816526053011082e-05, 'epoch': 0.82} {'loss': 0.6391, 'learning_rate': 1.2816211952323418e-05, 'epoch': 0.82} {'loss': 0.6826, 'learning_rate': 1.281589784861793e-05, 'epoch': 0.82} {'loss': 0.7606, 'learning_rate': 1.281558374189495e-05, 'epoch': 0.82} {'loss': 0.685, 'learning_rate': 1.2815269632154821e-05, 'epoch': 0.82} {'loss': 0.8409, 'learning_rate': 1.2814955519397876e-05, 'epoch': 0.82} {'loss': 0.9846, 'learning_rate': 1.2814641403624453e-05, 'epoch': 0.82} {'loss': 0.819, 'learning_rate': 1.2814327284834887e-05, 'epoch': 0.82} {'loss': 0.744, 'learning_rate': 1.2814013163029512e-05, 'epoch': 0.82} {'loss': 0.6513, 'learning_rate': 1.2813699038208672e-05, 'epoch': 0.82} {'loss': 0.7237, 'learning_rate': 1.2813384910372697e-05, 'epoch': 0.82} {'loss': 0.729, 'learning_rate': 1.281307077952193e-05, 'epoch': 0.82} {'loss': 0.6755, 'learning_rate': 1.2812756645656702e-05, 'epoch': 0.82} {'loss': 0.7467, 'learning_rate': 1.281244250877735e-05, 'epoch': 0.82} {'loss': 0.863, 'learning_rate': 1.2812128368884211e-05, 'epoch': 0.82} {'loss': 0.7865, 'learning_rate': 1.2811814225977623e-05, 'epoch': 0.82} {'loss': 0.7408, 'learning_rate': 1.2811500080057923e-05, 'epoch': 0.82} {'loss': 0.8537, 'learning_rate': 1.2811185931125447e-05, 'epoch': 0.82} {'loss': 0.8102, 'learning_rate': 1.2810871779180536e-05, 'epoch': 0.82} {'loss': 0.7865, 'learning_rate': 1.2810557624223519e-05, 'epoch': 0.82} {'loss': 0.8853, 'learning_rate': 1.2810243466254733e-05, 'epoch': 0.82} {'loss': 0.8205, 'learning_rate': 1.280992930527452e-05, 'epoch': 0.82} {'loss': 0.7963, 'learning_rate': 1.2809615141283213e-05, 'epoch': 0.82} {'loss': 0.6925, 'learning_rate': 1.280930097428115e-05, 'epoch': 0.82} {'loss': 0.8634, 'learning_rate': 1.2808986804268667e-05, 'epoch': 0.82} {'loss': 0.8117, 'learning_rate': 1.2808672631246105e-05, 'epoch': 0.82} {'loss': 0.8715, 'learning_rate': 1.2808358455213794e-05, 'epoch': 0.82} {'loss': 0.7354, 'learning_rate': 1.2808044276172074e-05, 'epoch': 0.82} {'loss': 0.7184, 'learning_rate': 1.2807730094121278e-05, 'epoch': 0.82} {'loss': 0.9734, 'learning_rate': 1.2807415909061747e-05, 'epoch': 0.82} {'loss': 0.7204, 'learning_rate': 1.2807101720993817e-05, 'epoch': 0.82} {'loss': 0.8143, 'learning_rate': 1.2806787529917829e-05, 'epoch': 0.82} {'loss': 0.76, 'learning_rate': 1.280647333583411e-05, 'epoch': 0.82} {'loss': 0.7415, 'learning_rate': 1.2806159138743001e-05, 'epoch': 0.82} {'loss': 0.7147, 'learning_rate': 1.280584493864484e-05, 'epoch': 0.82} {'loss': 0.6651, 'learning_rate': 1.2805530735539962e-05, 'epoch': 0.82} {'loss': 0.8197, 'learning_rate': 1.2805216529428705e-05, 'epoch': 0.82} {'loss': 0.7965, 'learning_rate': 1.2804902320311405e-05, 'epoch': 0.82} {'loss': 0.7896, 'learning_rate': 1.2804588108188403e-05, 'epoch': 0.82} {'loss': 0.6515, 'learning_rate': 1.2804273893060028e-05, 'epoch': 0.82} {'loss': 0.7434, 'learning_rate': 1.2803959674926622e-05, 'epoch': 0.82} {'loss': 0.8434, 'learning_rate': 1.280364545378852e-05, 'epoch': 0.82} {'loss': 0.7466, 'learning_rate': 1.280333122964606e-05, 'epoch': 0.82} {'loss': 0.8526, 'learning_rate': 1.2803017002499573e-05, 'epoch': 0.82} {'loss': 0.571, 'learning_rate': 1.2802702772349404e-05, 'epoch': 0.82} {'loss': 0.7982, 'learning_rate': 1.2802388539195885e-05, 'epoch': 0.82} {'loss': 0.7098, 'learning_rate': 1.2802074303039355e-05, 'epoch': 0.82} {'loss': 0.8615, 'learning_rate': 1.2801760063880149e-05, 'epoch': 0.82} {'loss': 0.8717, 'learning_rate': 1.28014458217186e-05, 'epoch': 0.82} {'loss': 0.848, 'learning_rate': 1.2801131576555054e-05, 'epoch': 0.82} {'loss': 0.8374, 'learning_rate': 1.2800817328389843e-05, 'epoch': 0.82} {'loss': 0.8648, 'learning_rate': 1.2800503077223301e-05, 'epoch': 0.82} {'loss': 0.7795, 'learning_rate': 1.2800188823055767e-05, 'epoch': 0.82} {'loss': 0.9603, 'learning_rate': 1.279987456588758e-05, 'epoch': 0.82} {'loss': 0.7718, 'learning_rate': 1.2799560305719072e-05, 'epoch': 0.82} {'loss': 0.7938, 'learning_rate': 1.2799246042550583e-05, 'epoch': 0.82} {'loss': 0.8725, 'learning_rate': 1.2798931776382451e-05, 'epoch': 0.82} {'loss': 0.8272, 'learning_rate': 1.2798617507215012e-05, 'epoch': 0.82} {'loss': 0.7444, 'learning_rate': 1.27983032350486e-05, 'epoch': 0.82} {'loss': 0.9769, 'learning_rate': 1.2797988959883552e-05, 'epoch': 0.82} {'loss': 0.7943, 'learning_rate': 1.2797674681720209e-05, 'epoch': 0.82} {'loss': 0.8884, 'learning_rate': 1.2797360400558905e-05, 'epoch': 0.82} {'loss': 0.7986, 'learning_rate': 1.2797046116399975e-05, 'epoch': 0.82} {'loss': 0.7014, 'learning_rate': 1.2796731829243758e-05, 'epoch': 0.82} {'loss': 0.985, 'learning_rate': 1.279641753909059e-05, 'epoch': 0.82} {'loss': 0.8271, 'learning_rate': 1.279610324594081e-05, 'epoch': 0.82} {'loss': 0.7371, 'learning_rate': 1.279578894979475e-05, 'epoch': 0.82} {'loss': 0.7074, 'learning_rate': 1.2795474650652753e-05, 'epoch': 0.82} {'loss': 0.7509, 'learning_rate': 1.2795160348515152e-05, 'epoch': 0.82} {'loss': 0.955, 'learning_rate': 1.2794846043382286e-05, 'epoch': 0.82} {'loss': 0.9753, 'learning_rate': 1.2794531735254486e-05, 'epoch': 0.82} {'loss': 0.7353, 'learning_rate': 1.2794217424132094e-05, 'epoch': 0.82} {'loss': 0.8448, 'learning_rate': 1.2793903110015446e-05, 'epoch': 0.82} {'loss': 0.7858, 'learning_rate': 1.2793588792904878e-05, 'epoch': 0.82} {'loss': 0.8447, 'learning_rate': 1.2793274472800732e-05, 'epoch': 0.82} {'loss': 0.7753, 'learning_rate': 1.279296014970334e-05, 'epoch': 0.82} {'loss': 0.8492, 'learning_rate': 1.2792645823613035e-05, 'epoch': 0.82} {'loss': 0.871, 'learning_rate': 1.2792331494530158e-05, 'epoch': 0.82} {'loss': 0.9341, 'learning_rate': 1.2792017162455046e-05, 'epoch': 0.82} {'loss': 0.8534, 'learning_rate': 1.2791702827388038e-05, 'epoch': 0.82} {'loss': 0.8638, 'learning_rate': 1.2791388489329468e-05, 'epoch': 0.82} {'loss': 0.8868, 'learning_rate': 1.2791074148279673e-05, 'epoch': 0.82} {'loss': 0.6476, 'learning_rate': 1.2790759804238989e-05, 'epoch': 0.82} {'loss': 0.8102, 'learning_rate': 1.2790445457207755e-05, 'epoch': 0.82} {'loss': 0.6866, 'learning_rate': 1.2790131107186305e-05, 'epoch': 0.82} {'loss': 0.7706, 'learning_rate': 1.278981675417498e-05, 'epoch': 0.82} {'loss': 0.9127, 'learning_rate': 1.2789502398174112e-05, 'epoch': 0.82} {'loss': 0.7368, 'learning_rate': 1.2789188039184044e-05, 'epoch': 0.82} {'loss': 0.8102, 'learning_rate': 1.2788873677205106e-05, 'epoch': 0.82} {'loss': 0.8105, 'learning_rate': 1.278855931223764e-05, 'epoch': 0.82} {'loss': 0.6906, 'learning_rate': 1.2788244944281982e-05, 'epoch': 0.82} {'loss': 0.7986, 'learning_rate': 1.2787930573338466e-05, 'epoch': 0.82} {'loss': 0.9674, 'learning_rate': 1.2787616199407429e-05, 'epoch': 0.82} {'loss': 0.7235, 'learning_rate': 1.278730182248921e-05, 'epoch': 0.82} {'loss': 0.717, 'learning_rate': 1.2786987442584152e-05, 'epoch': 0.82} {'loss': 0.7819, 'learning_rate': 1.278667305969258e-05, 'epoch': 0.82} {'loss': 0.7707, 'learning_rate': 1.2786358673814837e-05, 'epoch': 0.82} {'loss': 0.6135, 'learning_rate': 1.2786044284951258e-05, 'epoch': 0.82} {'loss': 0.7939, 'learning_rate': 1.2785729893102183e-05, 'epoch': 0.82} {'loss': 0.8187, 'learning_rate': 1.2785415498267945e-05, 'epoch': 0.82} {'loss': 0.8514, 'learning_rate': 1.2785101100448885e-05, 'epoch': 0.82} {'loss': 0.7612, 'learning_rate': 1.2784786699645337e-05, 'epoch': 0.82} {'loss': 0.8027, 'learning_rate': 1.2784472295857642e-05, 'epoch': 0.82} {'loss': 0.9123, 'learning_rate': 1.2784157889086128e-05, 'epoch': 0.82} {'loss': 0.8262, 'learning_rate': 1.278384347933114e-05, 'epoch': 0.82} {'loss': 0.7104, 'learning_rate': 1.2783529066593012e-05, 'epoch': 0.82} {'loss': 0.8667, 'learning_rate': 1.278321465087208e-05, 'epoch': 0.82} {'loss': 0.5726, 'learning_rate': 1.2782900232168687e-05, 'epoch': 0.82} {'loss': 0.8257, 'learning_rate': 1.2782585810483161e-05, 'epoch': 0.82} {'loss': 0.7984, 'learning_rate': 1.2782271385815845e-05, 'epoch': 0.82} {'loss': 0.7493, 'learning_rate': 1.2781956958167074e-05, 'epoch': 0.82} {'loss': 0.7919, 'learning_rate': 1.2781642527537184e-05, 'epoch': 0.82} {'loss': 0.8346, 'learning_rate': 1.2781328093926514e-05, 'epoch': 0.82} {'loss': 0.7483, 'learning_rate': 1.27810136573354e-05, 'epoch': 0.82} {'loss': 0.6247, 'learning_rate': 1.2780699217764177e-05, 'epoch': 0.82} {'loss': 0.9412, 'learning_rate': 1.2780384775213186e-05, 'epoch': 0.82} {'loss': 0.9087, 'learning_rate': 1.2780070329682761e-05, 'epoch': 0.82} {'loss': 0.8357, 'learning_rate': 1.277975588117324e-05, 'epoch': 0.82} {'loss': 0.7769, 'learning_rate': 1.2779441429684958e-05, 'epoch': 0.82} {'loss': 0.7585, 'learning_rate': 1.2779126975218257e-05, 'epoch': 0.82} {'loss': 0.8165, 'learning_rate': 1.2778812517773466e-05, 'epoch': 0.82} {'loss': 0.7903, 'learning_rate': 1.277849805735093e-05, 'epoch': 0.82} {'loss': 0.7739, 'learning_rate': 1.2778183593950984e-05, 'epoch': 0.82} {'loss': 0.7297, 'learning_rate': 1.2777869127573958e-05, 'epoch': 0.82} {'loss': 0.6975, 'learning_rate': 1.27775546582202e-05, 'epoch': 0.82} {'loss': 0.6752, 'learning_rate': 1.2777240185890038e-05, 'epoch': 0.82} {'loss': 0.751, 'learning_rate': 1.2776925710583815e-05, 'epoch': 0.82} {'loss': 0.7768, 'learning_rate': 1.2776611232301863e-05, 'epoch': 0.82} {'loss': 0.8588, 'learning_rate': 1.2776296751044521e-05, 'epoch': 0.82} {'loss': 0.7543, 'learning_rate': 1.2775982266812131e-05, 'epoch': 0.82} {'loss': 0.6914, 'learning_rate': 1.2775667779605022e-05, 'epoch': 0.82} {'loss': 0.9233, 'learning_rate': 1.2775353289423533e-05, 'epoch': 0.82} {'loss': 0.7425, 'learning_rate': 1.2775038796268007e-05, 'epoch': 0.82} {'loss': 0.7508, 'learning_rate': 1.2774724300138775e-05, 'epoch': 0.82} {'loss': 0.7777, 'learning_rate': 1.2774409801036172e-05, 'epoch': 0.82} {'loss': 0.8053, 'learning_rate': 1.2774095298960541e-05, 'epoch': 0.82} {'loss': 0.6694, 'learning_rate': 1.2773780793912218e-05, 'epoch': 0.82} {'loss': 0.797, 'learning_rate': 1.2773466285891535e-05, 'epoch': 0.82} {'loss': 0.7559, 'learning_rate': 1.2773151774898838e-05, 'epoch': 0.82} {'loss': 0.8157, 'learning_rate': 1.2772837260934453e-05, 'epoch': 0.82} {'loss': 0.9834, 'learning_rate': 1.2772522743998725e-05, 'epoch': 0.82} {'loss': 0.7974, 'learning_rate': 1.2772208224091987e-05, 'epoch': 0.82} {'loss': 0.8667, 'learning_rate': 1.277189370121458e-05, 'epoch': 0.82} {'loss': 0.7257, 'learning_rate': 1.2771579175366837e-05, 'epoch': 0.82} {'loss': 0.773, 'learning_rate': 1.2771264646549097e-05, 'epoch': 0.82} {'loss': 0.8108, 'learning_rate': 1.27709501147617e-05, 'epoch': 0.82} {'loss': 0.8587, 'learning_rate': 1.2770635580004976e-05, 'epoch': 0.82} {'loss': 0.7214, 'learning_rate': 1.2770321042279266e-05, 'epoch': 0.82} {'loss': 0.8446, 'learning_rate': 1.2770006501584908e-05, 'epoch': 0.82} {'loss': 0.8171, 'learning_rate': 1.2769691957922236e-05, 'epoch': 0.83} {'loss': 0.9746, 'learning_rate': 1.2769377411291595e-05, 'epoch': 0.83} {'loss': 0.7052, 'learning_rate': 1.2769062861693313e-05, 'epoch': 0.83} {'loss': 0.6686, 'learning_rate': 1.2768748309127728e-05, 'epoch': 0.83} {'loss': 0.6704, 'learning_rate': 1.2768433753595182e-05, 'epoch': 0.83} {'loss': 0.767, 'learning_rate': 1.2768119195096007e-05, 'epoch': 0.83} {'loss': 0.6909, 'learning_rate': 1.2767804633630542e-05, 'epoch': 0.83} {'loss': 0.8205, 'learning_rate': 1.276749006919913e-05, 'epoch': 0.83} {'loss': 0.7718, 'learning_rate': 1.2767175501802096e-05, 'epoch': 0.83} {'loss': 0.7518, 'learning_rate': 1.276686093143979e-05, 'epoch': 0.83} {'loss': 0.774, 'learning_rate': 1.2766546358112536e-05, 'epoch': 0.83} {'loss': 0.8661, 'learning_rate': 1.2766231781820682e-05, 'epoch': 0.83} {'loss': 0.8039, 'learning_rate': 1.2765917202564559e-05, 'epoch': 0.83} {'loss': 0.9092, 'learning_rate': 1.2765602620344505e-05, 'epoch': 0.83} {'loss': 0.6331, 'learning_rate': 1.2765288035160863e-05, 'epoch': 0.83} {'loss': 0.9369, 'learning_rate': 1.2764973447013964e-05, 'epoch': 0.83} {'loss': 0.7801, 'learning_rate': 1.2764658855904144e-05, 'epoch': 0.83} {'loss': 0.7891, 'learning_rate': 1.2764344261831743e-05, 'epoch': 0.83} {'loss': 0.751, 'learning_rate': 1.2764029664797098e-05, 'epoch': 0.83} {'loss': 0.7142, 'learning_rate': 1.2763715064800545e-05, 'epoch': 0.83} {'loss': 0.7767, 'learning_rate': 1.2763400461842423e-05, 'epoch': 0.83} {'loss': 0.8257, 'learning_rate': 1.276308585592307e-05, 'epoch': 0.83} {'loss': 0.8813, 'learning_rate': 1.276277124704282e-05, 'epoch': 0.83} {'loss': 0.8253, 'learning_rate': 1.276245663520201e-05, 'epoch': 0.83} {'loss': 0.6496, 'learning_rate': 1.2762142020400976e-05, 'epoch': 0.83} {'loss': 0.7594, 'learning_rate': 1.2761827402640062e-05, 'epoch': 0.83} {'loss': 0.7428, 'learning_rate': 1.2761512781919596e-05, 'epoch': 0.83} {'loss': 0.8241, 'learning_rate': 1.2761198158239924e-05, 'epoch': 0.83} {'loss': 0.7478, 'learning_rate': 1.2760883531601378e-05, 'epoch': 0.83} {'loss': 0.6933, 'learning_rate': 1.2760568902004298e-05, 'epoch': 0.83} {'loss': 0.6664, 'learning_rate': 1.2760254269449015e-05, 'epoch': 0.83} {'loss': 0.7805, 'learning_rate': 1.2759939633935871e-05, 'epoch': 0.83} {'loss': 0.7509, 'learning_rate': 1.2759624995465205e-05, 'epoch': 0.83} {'loss': 0.87, 'learning_rate': 1.2759310354037352e-05, 'epoch': 0.83} {'loss': 0.878, 'learning_rate': 1.2758995709652645e-05, 'epoch': 0.83} {'loss': 0.6607, 'learning_rate': 1.2758681062311428e-05, 'epoch': 0.83} {'loss': 0.821, 'learning_rate': 1.2758366412014036e-05, 'epoch': 0.83} {'loss': 0.6479, 'learning_rate': 1.2758051758760806e-05, 'epoch': 0.83} {'loss': 0.8102, 'learning_rate': 1.275773710255207e-05, 'epoch': 0.83} {'loss': 0.6175, 'learning_rate': 1.2757422443388173e-05, 'epoch': 0.83} {'loss': 0.7695, 'learning_rate': 1.275710778126945e-05, 'epoch': 0.83} {'loss': 0.8499, 'learning_rate': 1.2756793116196236e-05, 'epoch': 0.83} {'loss': 0.7415, 'learning_rate': 1.2756478448168868e-05, 'epoch': 0.83} {'loss': 0.8068, 'learning_rate': 1.2756163777187687e-05, 'epoch': 0.83} {'loss': 0.7546, 'learning_rate': 1.2755849103253026e-05, 'epoch': 0.83} {'loss': 0.7565, 'learning_rate': 1.2755534426365223e-05, 'epoch': 0.83} {'loss': 0.8069, 'learning_rate': 1.275521974652462e-05, 'epoch': 0.83} {'loss': 0.9998, 'learning_rate': 1.275490506373155e-05, 'epoch': 0.83} {'loss': 0.8538, 'learning_rate': 1.2754590377986346e-05, 'epoch': 0.83} {'loss': 0.8997, 'learning_rate': 1.2754275689289353e-05, 'epoch': 0.83} {'loss': 0.7364, 'learning_rate': 1.2753960997640903e-05, 'epoch': 0.83} {'loss': 0.732, 'learning_rate': 1.2753646303041338e-05, 'epoch': 0.83} {'loss': 0.8151, 'learning_rate': 1.2753331605490993e-05, 'epoch': 0.83} {'loss': 0.8599, 'learning_rate': 1.2753016904990201e-05, 'epoch': 0.83} {'loss': 0.7931, 'learning_rate': 1.2752702201539304e-05, 'epoch': 0.83} {'loss': 0.6803, 'learning_rate': 1.2752387495138638e-05, 'epoch': 0.83} {'loss': 0.7778, 'learning_rate': 1.2752072785788543e-05, 'epoch': 0.83} {'loss': 0.8725, 'learning_rate': 1.2751758073489352e-05, 'epoch': 0.83} {'loss': 0.6821, 'learning_rate': 1.2751443358241405e-05, 'epoch': 0.83} {'loss': 0.7029, 'learning_rate': 1.2751128640045036e-05, 'epoch': 0.83} {'loss': 0.7236, 'learning_rate': 1.2750813918900585e-05, 'epoch': 0.83} {'loss': 0.7351, 'learning_rate': 1.2750499194808387e-05, 'epoch': 0.83} {'loss': 0.7766, 'learning_rate': 1.2750184467768783e-05, 'epoch': 0.83} {'loss': 0.8569, 'learning_rate': 1.2749869737782107e-05, 'epoch': 0.83} {'loss': 0.9587, 'learning_rate': 1.2749555004848699e-05, 'epoch': 0.83} {'loss': 0.7808, 'learning_rate': 1.2749240268968896e-05, 'epoch': 0.83} {'loss': 0.8391, 'learning_rate': 1.274892553014303e-05, 'epoch': 0.83} {'loss': 0.7036, 'learning_rate': 1.2748610788371444e-05, 'epoch': 0.83} {'loss': 0.8961, 'learning_rate': 1.2748296043654474e-05, 'epoch': 0.83} {'loss': 0.7185, 'learning_rate': 1.2747981295992453e-05, 'epoch': 0.83} {'loss': 0.7785, 'learning_rate': 1.2747666545385728e-05, 'epoch': 0.83} {'loss': 0.7847, 'learning_rate': 1.2747351791834631e-05, 'epoch': 0.83} {'loss': 0.7249, 'learning_rate': 1.2747037035339492e-05, 'epoch': 0.83} {'loss': 0.8681, 'learning_rate': 1.2746722275900658e-05, 'epoch': 0.83} {'loss': 0.7309, 'learning_rate': 1.2746407513518462e-05, 'epoch': 0.83} {'loss': 0.8091, 'learning_rate': 1.2746092748193241e-05, 'epoch': 0.83} {'loss': 0.8797, 'learning_rate': 1.2745777979925338e-05, 'epoch': 0.83} {'loss': 0.9152, 'learning_rate': 1.2745463208715085e-05, 'epoch': 0.83} {'loss': 0.7495, 'learning_rate': 1.2745148434562822e-05, 'epoch': 0.83} {'loss': 0.9112, 'learning_rate': 1.2744833657468882e-05, 'epoch': 0.83} {'loss': 0.7207, 'learning_rate': 1.2744518877433604e-05, 'epoch': 0.83} {'loss': 0.7748, 'learning_rate': 1.2744204094457326e-05, 'epoch': 0.83} {'loss': 0.809, 'learning_rate': 1.2743889308540389e-05, 'epoch': 0.83} {'loss': 0.8161, 'learning_rate': 1.2743574519683126e-05, 'epoch': 0.83} {'loss': 0.6962, 'learning_rate': 1.2743259727885874e-05, 'epoch': 0.83} {'loss': 0.8974, 'learning_rate': 1.2742944933148973e-05, 'epoch': 0.83} {'loss': 0.904, 'learning_rate': 1.2742630135472758e-05, 'epoch': 0.83} {'loss': 0.7482, 'learning_rate': 1.2742315334857567e-05, 'epoch': 0.83} {'loss': 0.5022, 'learning_rate': 1.2742000531303738e-05, 'epoch': 0.83} {'loss': 0.6646, 'learning_rate': 1.2741685724811608e-05, 'epoch': 0.83} {'loss': 0.7894, 'learning_rate': 1.2741370915381514e-05, 'epoch': 0.83} {'loss': 0.7981, 'learning_rate': 1.2741056103013798e-05, 'epoch': 0.83} {'loss': 0.7113, 'learning_rate': 1.2740741287708786e-05, 'epoch': 0.83} {'loss': 0.9341, 'learning_rate': 1.2740426469466827e-05, 'epoch': 0.83} {'loss': 0.8417, 'learning_rate': 1.2740111648288252e-05, 'epoch': 0.83} {'loss': 0.8488, 'learning_rate': 1.2739796824173399e-05, 'epoch': 0.83} {'loss': 0.9115, 'learning_rate': 1.2739481997122607e-05, 'epoch': 0.83} {'loss': 0.6597, 'learning_rate': 1.2739167167136212e-05, 'epoch': 0.83} {'loss': 0.835, 'learning_rate': 1.2738852334214555e-05, 'epoch': 0.83} {'loss': 0.7686, 'learning_rate': 1.273853749835797e-05, 'epoch': 0.83} {'loss': 0.8265, 'learning_rate': 1.2738222659566792e-05, 'epoch': 0.83} {'loss': 0.9244, 'learning_rate': 1.2737907817841362e-05, 'epoch': 0.83} {'loss': 0.8288, 'learning_rate': 1.2737592973182021e-05, 'epoch': 0.83} {'loss': 0.8037, 'learning_rate': 1.2737278125589096e-05, 'epoch': 0.83} {'loss': 1.0036, 'learning_rate': 1.2736963275062935e-05, 'epoch': 0.83} {'loss': 0.7051, 'learning_rate': 1.273664842160387e-05, 'epoch': 0.83} {'loss': 0.846, 'learning_rate': 1.2736333565212239e-05, 'epoch': 0.83} {'loss': 0.6939, 'learning_rate': 1.2736018705888378e-05, 'epoch': 0.83} {'loss': 0.8254, 'learning_rate': 1.2735703843632626e-05, 'epoch': 0.83} {'loss': 0.755, 'learning_rate': 1.2735388978445322e-05, 'epoch': 0.83} {'loss': 0.6567, 'learning_rate': 1.2735074110326799e-05, 'epoch': 0.83} {'loss': 0.8764, 'learning_rate': 1.27347592392774e-05, 'epoch': 0.83} {'loss': 0.6475, 'learning_rate': 1.273444436529746e-05, 'epoch': 0.83} {'loss': 0.8504, 'learning_rate': 1.2734129488387315e-05, 'epoch': 0.83} {'loss': 0.8773, 'learning_rate': 1.2733814608547304e-05, 'epoch': 0.83} {'loss': 0.7893, 'learning_rate': 1.2733499725777765e-05, 'epoch': 0.83} {'loss': 0.7396, 'learning_rate': 1.2733184840079032e-05, 'epoch': 0.83} {'loss': 0.8208, 'learning_rate': 1.2732869951451444e-05, 'epoch': 0.83} {'loss': 0.955, 'learning_rate': 1.2732555059895342e-05, 'epoch': 0.83} {'loss': 0.7582, 'learning_rate': 1.2732240165411058e-05, 'epoch': 0.83} {'loss': 0.8198, 'learning_rate': 1.2731925267998935e-05, 'epoch': 0.83} {'loss': 0.8057, 'learning_rate': 1.2731610367659307e-05, 'epoch': 0.83} {'loss': 0.6592, 'learning_rate': 1.2731295464392511e-05, 'epoch': 0.83} {'loss': 0.7701, 'learning_rate': 1.2730980558198884e-05, 'epoch': 0.83} {'loss': 0.7182, 'learning_rate': 1.2730665649078767e-05, 'epoch': 0.83} {'loss': 0.8236, 'learning_rate': 1.2730350737032496e-05, 'epoch': 0.83} {'loss': 0.8434, 'learning_rate': 1.2730035822060404e-05, 'epoch': 0.83} {'loss': 0.8072, 'learning_rate': 1.2729720904162835e-05, 'epoch': 0.83} {'loss': 0.7863, 'learning_rate': 1.2729405983340124e-05, 'epoch': 0.83} {'loss': 0.716, 'learning_rate': 1.2729091059592607e-05, 'epoch': 0.83} {'loss': 0.8013, 'learning_rate': 1.2728776132920622e-05, 'epoch': 0.83} {'loss': 0.8742, 'learning_rate': 1.2728461203324508e-05, 'epoch': 0.83} {'loss': 0.8053, 'learning_rate': 1.2728146270804602e-05, 'epoch': 0.83} {'loss': 0.7455, 'learning_rate': 1.272783133536124e-05, 'epoch': 0.83} {'loss': 0.7155, 'learning_rate': 1.2727516396994761e-05, 'epoch': 0.83} {'loss': 0.6227, 'learning_rate': 1.2727201455705503e-05, 'epoch': 0.83} {'loss': 0.8168, 'learning_rate': 1.2726886511493802e-05, 'epoch': 0.83} {'loss': 0.7662, 'learning_rate': 1.2726571564359992e-05, 'epoch': 0.83} {'loss': 0.8807, 'learning_rate': 1.272625661430442e-05, 'epoch': 0.83} {'loss': 0.9526, 'learning_rate': 1.2725941661327416e-05, 'epoch': 0.83} {'loss': 0.778, 'learning_rate': 1.2725626705429322e-05, 'epoch': 0.83} {'loss': 0.6698, 'learning_rate': 1.272531174661047e-05, 'epoch': 0.83} {'loss': 0.8532, 'learning_rate': 1.27249967848712e-05, 'epoch': 0.83} {'loss': 0.6929, 'learning_rate': 1.272468182021185e-05, 'epoch': 0.83} {'loss': 0.966, 'learning_rate': 1.2724366852632758e-05, 'epoch': 0.83} {'loss': 0.6591, 'learning_rate': 1.272405188213426e-05, 'epoch': 0.83} {'loss': 0.793, 'learning_rate': 1.2723736908716697e-05, 'epoch': 0.83} {'loss': 0.74, 'learning_rate': 1.2723421932380407e-05, 'epoch': 0.83} {'loss': 0.7968, 'learning_rate': 1.272310695312572e-05, 'epoch': 0.83} {'loss': 0.7666, 'learning_rate': 1.2722791970952976e-05, 'epoch': 0.83} {'loss': 0.6339, 'learning_rate': 1.2722476985862518e-05, 'epoch': 0.83} {'loss': 0.7513, 'learning_rate': 1.272216199785468e-05, 'epoch': 0.83} {'loss': 0.8232, 'learning_rate': 1.27218470069298e-05, 'epoch': 0.83} {'loss': 0.8514, 'learning_rate': 1.2721532013088215e-05, 'epoch': 0.83} {'loss': 0.765, 'learning_rate': 1.2721217016330263e-05, 'epoch': 0.83} {'loss': 0.7739, 'learning_rate': 1.272090201665628e-05, 'epoch': 0.83} {'loss': 0.8951, 'learning_rate': 1.2720587014066606e-05, 'epoch': 0.83} {'loss': 0.8135, 'learning_rate': 1.2720272008561576e-05, 'epoch': 0.83} {'loss': 0.8153, 'learning_rate': 1.271995700014153e-05, 'epoch': 0.83} {'loss': 0.9351, 'learning_rate': 1.2719641988806806e-05, 'epoch': 0.83} {'loss': 0.7415, 'learning_rate': 1.271932697455774e-05, 'epoch': 0.83} {'loss': 0.8014, 'learning_rate': 1.2719011957394669e-05, 'epoch': 0.83} {'loss': 0.7636, 'learning_rate': 1.2718696937317931e-05, 'epoch': 0.83} {'loss': 0.8519, 'learning_rate': 1.2718381914327865e-05, 'epoch': 0.83} {'loss': 0.772, 'learning_rate': 1.2718066888424803e-05, 'epoch': 0.83} {'loss': 0.8272, 'learning_rate': 1.2717751859609092e-05, 'epoch': 0.83} {'loss': 0.811, 'learning_rate': 1.2717436827881063e-05, 'epoch': 0.83} {'loss': 0.7604, 'learning_rate': 1.2717121793241054e-05, 'epoch': 0.83} {'loss': 0.6827, 'learning_rate': 1.2716806755689405e-05, 'epoch': 0.83} {'loss': 0.8811, 'learning_rate': 1.2716491715226453e-05, 'epoch': 0.83} {'loss': 0.8185, 'learning_rate': 1.2716176671852534e-05, 'epoch': 0.83} {'loss': 0.8907, 'learning_rate': 1.2715861625567985e-05, 'epoch': 0.83} {'loss': 0.8105, 'learning_rate': 1.271554657637315e-05, 'epoch': 0.83} {'loss': 0.8306, 'learning_rate': 1.2715231524268357e-05, 'epoch': 0.83} {'loss': 0.6684, 'learning_rate': 1.271491646925395e-05, 'epoch': 0.83} {'loss': 0.8585, 'learning_rate': 1.2714601411330264e-05, 'epoch': 0.83} {'loss': 0.7301, 'learning_rate': 1.271428635049764e-05, 'epoch': 0.83} {'loss': 0.7096, 'learning_rate': 1.271397128675641e-05, 'epoch': 0.83} {'loss': 0.7372, 'learning_rate': 1.2713656220106918e-05, 'epoch': 0.83} {'loss': 0.9633, 'learning_rate': 1.2713341150549496e-05, 'epoch': 0.83} {'loss': 0.8646, 'learning_rate': 1.2713026078084486e-05, 'epoch': 0.83} {'loss': 0.5963, 'learning_rate': 1.2712711002712224e-05, 'epoch': 0.83} {'loss': 0.8563, 'learning_rate': 1.2712395924433046e-05, 'epoch': 0.83} {'loss': 0.7088, 'learning_rate': 1.2712080843247288e-05, 'epoch': 0.83} {'loss': 0.8385, 'learning_rate': 1.2711765759155297e-05, 'epoch': 0.83} {'loss': 0.8791, 'learning_rate': 1.27114506721574e-05, 'epoch': 0.83} {'loss': 0.6727, 'learning_rate': 1.2711135582253938e-05, 'epoch': 0.83} {'loss': 0.6834, 'learning_rate': 1.2710820489445251e-05, 'epoch': 0.83} {'loss': 0.7636, 'learning_rate': 1.2710505393731676e-05, 'epoch': 0.83} {'loss': 0.6555, 'learning_rate': 1.271019029511355e-05, 'epoch': 0.83} {'loss': 0.7235, 'learning_rate': 1.270987519359121e-05, 'epoch': 0.83} {'loss': 1.0082, 'learning_rate': 1.2709560089164993e-05, 'epoch': 0.83} {'loss': 0.7951, 'learning_rate': 1.2709244981835238e-05, 'epoch': 0.83} {'loss': 0.848, 'learning_rate': 1.2708929871602282e-05, 'epoch': 0.83} {'loss': 0.7737, 'learning_rate': 1.2708614758466465e-05, 'epoch': 0.83} {'loss': 0.9275, 'learning_rate': 1.2708299642428123e-05, 'epoch': 0.83} {'loss': 0.8424, 'learning_rate': 1.2707984523487594e-05, 'epoch': 0.83} {'loss': 1.0092, 'learning_rate': 1.2707669401645213e-05, 'epoch': 0.83} {'loss': 0.8893, 'learning_rate': 1.270735427690132e-05, 'epoch': 0.83} {'loss': 0.6973, 'learning_rate': 1.2707039149256252e-05, 'epoch': 0.83} {'loss': 0.7311, 'learning_rate': 1.270672401871035e-05, 'epoch': 0.83} {'loss': 0.8306, 'learning_rate': 1.2706408885263945e-05, 'epoch': 0.83} {'loss': 0.7492, 'learning_rate': 1.2706093748917383e-05, 'epoch': 0.83} {'loss': 0.7951, 'learning_rate': 1.2705778609670998e-05, 'epoch': 0.83} {'loss': 0.8128, 'learning_rate': 1.2705463467525123e-05, 'epoch': 0.83} {'loss': 0.8641, 'learning_rate': 1.2705148322480101e-05, 'epoch': 0.83} {'loss': 0.7556, 'learning_rate': 1.2704833174536266e-05, 'epoch': 0.83} {'loss': 0.8309, 'learning_rate': 1.2704518023693959e-05, 'epoch': 0.83} {'loss': 0.7744, 'learning_rate': 1.2704202869953521e-05, 'epoch': 0.83} {'loss': 0.8164, 'learning_rate': 1.2703887713315281e-05, 'epoch': 0.83} {'loss': 0.7588, 'learning_rate': 1.2703572553779587e-05, 'epoch': 0.83} {'loss': 0.6498, 'learning_rate': 1.2703257391346765e-05, 'epoch': 0.83} {'loss': 0.8952, 'learning_rate': 1.270294222601716e-05, 'epoch': 0.83} {'loss': 0.6826, 'learning_rate': 1.270262705779111e-05, 'epoch': 0.83} {'loss': 0.9127, 'learning_rate': 1.270231188666895e-05, 'epoch': 0.83} {'loss': 0.7897, 'learning_rate': 1.2701996712651022e-05, 'epoch': 0.83} {'loss': 0.7763, 'learning_rate': 1.2701681535737658e-05, 'epoch': 0.83} {'loss': 0.7454, 'learning_rate': 1.2701366355929196e-05, 'epoch': 0.83} {'loss': 0.8076, 'learning_rate': 1.270105117322598e-05, 'epoch': 0.83} {'loss': 0.8544, 'learning_rate': 1.270073598762834e-05, 'epoch': 0.83} {'loss': 0.8689, 'learning_rate': 1.2700420799136621e-05, 'epoch': 0.83} {'loss': 0.8247, 'learning_rate': 1.2700105607751157e-05, 'epoch': 0.83} {'loss': 0.8141, 'learning_rate': 1.2699790413472287e-05, 'epoch': 0.83} {'loss': 0.7455, 'learning_rate': 1.2699475216300347e-05, 'epoch': 0.83} {'loss': 0.7471, 'learning_rate': 1.2699160016235674e-05, 'epoch': 0.83} {'loss': 0.7349, 'learning_rate': 1.2698844813278608e-05, 'epoch': 0.83} {'loss': 0.5879, 'learning_rate': 1.2698529607429486e-05, 'epoch': 0.83} {'loss': 0.8336, 'learning_rate': 1.2698214398688647e-05, 'epoch': 0.83} {'loss': 0.8973, 'learning_rate': 1.2697899187056428e-05, 'epoch': 0.83} {'loss': 0.7793, 'learning_rate': 1.2697583972533168e-05, 'epoch': 0.83} {'loss': 0.7891, 'learning_rate': 1.26972687551192e-05, 'epoch': 0.83} {'loss': 0.7117, 'learning_rate': 1.2696953534814867e-05, 'epoch': 0.83} {'loss': 0.8007, 'learning_rate': 1.2696638311620504e-05, 'epoch': 0.83} {'loss': 0.7208, 'learning_rate': 1.269632308553645e-05, 'epoch': 0.83} {'loss': 0.7126, 'learning_rate': 1.2696007856563045e-05, 'epoch': 0.83} {'loss': 0.8104, 'learning_rate': 1.269569262470062e-05, 'epoch': 0.83} {'loss': 0.9142, 'learning_rate': 1.2695377389949518e-05, 'epoch': 0.83} {'loss': 0.9445, 'learning_rate': 1.2695062152310077e-05, 'epoch': 0.83} {'loss': 0.6883, 'learning_rate': 1.2694746911782634e-05, 'epoch': 0.83} {'loss': 0.9868, 'learning_rate': 1.2694431668367523e-05, 'epoch': 0.83} {'loss': 0.7653, 'learning_rate': 1.2694116422065087e-05, 'epoch': 0.83} {'loss': 0.8771, 'learning_rate': 1.2693801172875667e-05, 'epoch': 0.83} {'loss': 0.9033, 'learning_rate': 1.269348592079959e-05, 'epoch': 0.83} {'loss': 0.8247, 'learning_rate': 1.2693170665837203e-05, 'epoch': 0.83} {'loss': 0.8547, 'learning_rate': 1.269285540798884e-05, 'epoch': 0.83} {'loss': 0.7072, 'learning_rate': 1.2692540147254837e-05, 'epoch': 0.83} {'loss': 0.9189, 'learning_rate': 1.2692224883635536e-05, 'epoch': 0.83} {'loss': 0.7946, 'learning_rate': 1.2691909617131276e-05, 'epoch': 0.83} {'loss': 0.6624, 'learning_rate': 1.2691594347742386e-05, 'epoch': 0.83} {'loss': 0.8989, 'learning_rate': 1.2691279075469212e-05, 'epoch': 0.83} {'loss': 0.6785, 'learning_rate': 1.2690963800312092e-05, 'epoch': 0.83} {'loss': 0.8959, 'learning_rate': 1.2690648522271359e-05, 'epoch': 0.83} {'loss': 0.6934, 'learning_rate': 1.2690333241347354e-05, 'epoch': 0.83} {'loss': 0.8154, 'learning_rate': 1.2690017957540415e-05, 'epoch': 0.83} {'loss': 0.9414, 'learning_rate': 1.2689702670850877e-05, 'epoch': 0.83} {'loss': 0.7584, 'learning_rate': 1.2689387381279081e-05, 'epoch': 0.83} {'loss': 0.8506, 'learning_rate': 1.2689072088825362e-05, 'epoch': 0.83} {'loss': 0.7201, 'learning_rate': 1.2688756793490063e-05, 'epoch': 0.83} {'loss': 0.6543, 'learning_rate': 1.2688441495273516e-05, 'epoch': 0.83} {'loss': 0.6595, 'learning_rate': 1.268812619417606e-05, 'epoch': 0.83} {'loss': 0.7728, 'learning_rate': 1.2687810890198037e-05, 'epoch': 0.83} {'loss': 0.7827, 'learning_rate': 1.268749558333978e-05, 'epoch': 0.83} {'loss': 0.8709, 'learning_rate': 1.268718027360163e-05, 'epoch': 0.83} {'loss': 1.0576, 'learning_rate': 1.2686864960983922e-05, 'epoch': 0.83} {'loss': 0.7883, 'learning_rate': 1.2686549645486999e-05, 'epoch': 0.83} {'loss': 0.8089, 'learning_rate': 1.2686234327111194e-05, 'epoch': 0.83} {'loss': 0.8911, 'learning_rate': 1.2685919005856849e-05, 'epoch': 0.83} {'loss': 0.7818, 'learning_rate': 1.2685603681724294e-05, 'epoch': 0.83} {'loss': 0.7042, 'learning_rate': 1.2685288354713875e-05, 'epoch': 0.83} {'loss': 0.7974, 'learning_rate': 1.2684973024825927e-05, 'epoch': 0.83} {'loss': 0.9553, 'learning_rate': 1.2684657692060787e-05, 'epoch': 0.83} {'loss': 0.6291, 'learning_rate': 1.2684342356418797e-05, 'epoch': 0.83} {'loss': 0.8997, 'learning_rate': 1.2684027017900291e-05, 'epoch': 0.83} {'loss': 0.7759, 'learning_rate': 1.2683711676505608e-05, 'epoch': 0.83} {'loss': 0.6986, 'learning_rate': 1.2683396332235082e-05, 'epoch': 0.83} {'loss': 0.7463, 'learning_rate': 1.2683080985089058e-05, 'epoch': 0.83} {'loss': 0.8981, 'learning_rate': 1.268276563506787e-05, 'epoch': 0.83} {'loss': 0.6684, 'learning_rate': 1.2682450282171854e-05, 'epoch': 0.83} {'loss': 0.6326, 'learning_rate': 1.2682134926401355e-05, 'epoch': 0.83} {'loss': 0.862, 'learning_rate': 1.2681819567756706e-05, 'epoch': 0.83} {'loss': 0.7598, 'learning_rate': 1.2681504206238241e-05, 'epoch': 0.83} {'loss': 0.9085, 'learning_rate': 1.2681188841846304e-05, 'epoch': 0.83} {'loss': 0.8497, 'learning_rate': 1.2680873474581232e-05, 'epoch': 0.83} {'loss': 0.7861, 'learning_rate': 1.268055810444336e-05, 'epoch': 0.83} {'loss': 0.4828, 'learning_rate': 1.2680242731433032e-05, 'epoch': 0.83} {'loss': 0.809, 'learning_rate': 1.2679927355550578e-05, 'epoch': 0.83} {'loss': 0.7927, 'learning_rate': 1.2679611976796345e-05, 'epoch': 0.83} {'loss': 0.7383, 'learning_rate': 1.2679296595170663e-05, 'epoch': 0.83} {'loss': 0.9573, 'learning_rate': 1.267898121067387e-05, 'epoch': 0.83} {'loss': 0.5984, 'learning_rate': 1.2678665823306311e-05, 'epoch': 0.83} {'loss': 0.7524, 'learning_rate': 1.2678350433068315e-05, 'epoch': 0.83} {'loss': 0.5685, 'learning_rate': 1.267803503996023e-05, 'epoch': 0.83} {'loss': 0.7292, 'learning_rate': 1.267771964398239e-05, 'epoch': 0.83} {'loss': 0.7715, 'learning_rate': 1.2677404245135127e-05, 'epoch': 0.83} {'loss': 0.7199, 'learning_rate': 1.2677088843418786e-05, 'epoch': 0.83} {'loss': 0.7382, 'learning_rate': 1.26767734388337e-05, 'epoch': 0.83} {'loss': 0.845, 'learning_rate': 1.267645803138021e-05, 'epoch': 0.83} {'loss': 0.7992, 'learning_rate': 1.2676142621058659e-05, 'epoch': 0.83} {'loss': 0.7727, 'learning_rate': 1.2675827207869373e-05, 'epoch': 0.83} {'loss': 0.8123, 'learning_rate': 1.2675511791812702e-05, 'epoch': 0.83} {'loss': 0.9049, 'learning_rate': 1.2675196372888977e-05, 'epoch': 0.83} {'loss': 0.7375, 'learning_rate': 1.2674880951098536e-05, 'epoch': 0.83} {'loss': 0.8049, 'learning_rate': 1.2674565526441719e-05, 'epoch': 0.83} {'loss': 0.8041, 'learning_rate': 1.267425009891886e-05, 'epoch': 0.83} {'loss': 0.6938, 'learning_rate': 1.2673934668530309e-05, 'epoch': 0.83} {'loss': 0.8142, 'learning_rate': 1.2673619235276392e-05, 'epoch': 0.83} {'loss': 0.7523, 'learning_rate': 1.267330379915745e-05, 'epoch': 0.83} {'loss': 0.67, 'learning_rate': 1.2672988360173821e-05, 'epoch': 0.83} {'loss': 0.8313, 'learning_rate': 1.2672672918325843e-05, 'epoch': 0.83} {'loss': 0.9482, 'learning_rate': 1.2672357473613856e-05, 'epoch': 0.83} {'loss': 0.6642, 'learning_rate': 1.2672042026038198e-05, 'epoch': 0.83} {'loss': 0.6785, 'learning_rate': 1.2671726575599203e-05, 'epoch': 0.83} {'loss': 0.7836, 'learning_rate': 1.2671411122297214e-05, 'epoch': 0.83} {'loss': 0.8269, 'learning_rate': 1.2671095666132569e-05, 'epoch': 0.83} {'loss': 0.7982, 'learning_rate': 1.2670780207105601e-05, 'epoch': 0.83} {'loss': 0.7804, 'learning_rate': 1.2670464745216651e-05, 'epoch': 0.83} {'loss': 0.7819, 'learning_rate': 1.2670149280466058e-05, 'epoch': 0.83} {'loss': 0.9301, 'learning_rate': 1.2669833812854157e-05, 'epoch': 0.83} {'loss': 0.7815, 'learning_rate': 1.266951834238129e-05, 'epoch': 0.83} {'loss': 0.9254, 'learning_rate': 1.2669202869047792e-05, 'epoch': 0.83} {'loss': 0.8754, 'learning_rate': 1.2668887392854004e-05, 'epoch': 0.83} {'loss': 0.8122, 'learning_rate': 1.266857191380026e-05, 'epoch': 0.83} {'loss': 0.786, 'learning_rate': 1.2668256431886902e-05, 'epoch': 0.83} {'loss': 0.8321, 'learning_rate': 1.2667940947114268e-05, 'epoch': 0.83} {'loss': 0.8323, 'learning_rate': 1.266762545948269e-05, 'epoch': 0.83} {'loss': 0.8218, 'learning_rate': 1.2667309968992515e-05, 'epoch': 0.83} {'loss': 0.8046, 'learning_rate': 1.2666994475644075e-05, 'epoch': 0.83} {'loss': 0.8775, 'learning_rate': 1.2666678979437707e-05, 'epoch': 0.83} {'loss': 0.8542, 'learning_rate': 1.2666363480373755e-05, 'epoch': 0.83} {'loss': 0.923, 'learning_rate': 1.2666047978452554e-05, 'epoch': 0.83} {'loss': 0.7352, 'learning_rate': 1.2665732473674442e-05, 'epoch': 0.83} {'loss': 0.9094, 'learning_rate': 1.2665416966039754e-05, 'epoch': 0.83} {'loss': 1.0033, 'learning_rate': 1.2665101455548832e-05, 'epoch': 0.83} {'loss': 0.7107, 'learning_rate': 1.2664785942202015e-05, 'epoch': 0.83} {'loss': 0.7496, 'learning_rate': 1.266447042599964e-05, 'epoch': 0.83} {'loss': 1.003, 'learning_rate': 1.2664154906942043e-05, 'epoch': 0.83} {'loss': 0.8491, 'learning_rate': 1.2663839385029564e-05, 'epoch': 0.83} {'loss': 1.0381, 'learning_rate': 1.2663523860262541e-05, 'epoch': 0.83} {'loss': 0.7512, 'learning_rate': 1.266320833264131e-05, 'epoch': 0.83} {'loss': 0.696, 'learning_rate': 1.2662892802166212e-05, 'epoch': 0.83} {'loss': 0.8045, 'learning_rate': 1.2662577268837587e-05, 'epoch': 0.83} {'loss': 0.8821, 'learning_rate': 1.2662261732655767e-05, 'epoch': 0.83} {'loss': 0.9437, 'learning_rate': 1.2661946193621094e-05, 'epoch': 0.83} {'loss': 0.7961, 'learning_rate': 1.2661630651733902e-05, 'epoch': 0.83} {'loss': 0.8236, 'learning_rate': 1.2661315106994537e-05, 'epoch': 0.83} {'loss': 0.7422, 'learning_rate': 1.2660999559403328e-05, 'epoch': 0.83} {'loss': 0.5408, 'learning_rate': 1.2660684008960623e-05, 'epoch': 0.83} {'loss': 0.8351, 'learning_rate': 1.2660368455666752e-05, 'epoch': 0.83} {'loss': 0.7092, 'learning_rate': 1.2660052899522059e-05, 'epoch': 0.83} {'loss': 0.9614, 'learning_rate': 1.2659737340526877e-05, 'epoch': 0.83} {'loss': 0.7275, 'learning_rate': 1.2659421778681544e-05, 'epoch': 0.83} {'loss': 0.821, 'learning_rate': 1.2659106213986405e-05, 'epoch': 0.83} {'loss': 0.8384, 'learning_rate': 1.265879064644179e-05, 'epoch': 0.83} {'loss': 0.7823, 'learning_rate': 1.2658475076048042e-05, 'epoch': 0.83} {'loss': 0.8136, 'learning_rate': 1.2658159502805501e-05, 'epoch': 0.83} {'loss': 0.6746, 'learning_rate': 1.26578439267145e-05, 'epoch': 0.83} {'loss': 0.7869, 'learning_rate': 1.2657528347775379e-05, 'epoch': 0.83} {'loss': 0.9796, 'learning_rate': 1.2657212765988477e-05, 'epoch': 0.83} {'loss': 0.8253, 'learning_rate': 1.265689718135413e-05, 'epoch': 0.83} {'loss': 0.9078, 'learning_rate': 1.2656581593872678e-05, 'epoch': 0.83} {'loss': 0.8645, 'learning_rate': 1.2656266003544463e-05, 'epoch': 0.83} {'loss': 0.8315, 'learning_rate': 1.2655950410369818e-05, 'epoch': 0.83} {'loss': 0.7667, 'learning_rate': 1.265563481434908e-05, 'epoch': 0.83} {'loss': 0.908, 'learning_rate': 1.265531921548259e-05, 'epoch': 0.83} {'loss': 0.8199, 'learning_rate': 1.2655003613770687e-05, 'epoch': 0.83} {'loss': 0.744, 'learning_rate': 1.2654688009213704e-05, 'epoch': 0.83} {'loss': 0.8463, 'learning_rate': 1.265437240181199e-05, 'epoch': 0.83} {'loss': 0.8294, 'learning_rate': 1.2654056791565872e-05, 'epoch': 0.83} {'loss': 0.8319, 'learning_rate': 1.2653741178475696e-05, 'epoch': 0.83} {'loss': 0.7399, 'learning_rate': 1.2653425562541792e-05, 'epoch': 0.83} {'loss': 0.8059, 'learning_rate': 1.2653109943764505e-05, 'epoch': 0.83} {'loss': 0.7027, 'learning_rate': 1.2652794322144172e-05, 'epoch': 0.83} {'loss': 0.6997, 'learning_rate': 1.265247869768113e-05, 'epoch': 0.83} {'loss': 0.6617, 'learning_rate': 1.265216307037572e-05, 'epoch': 0.83} {'loss': 0.8916, 'learning_rate': 1.2651847440228276e-05, 'epoch': 0.83} {'loss': 0.6181, 'learning_rate': 1.2651531807239137e-05, 'epoch': 0.83} {'loss': 0.9244, 'learning_rate': 1.2651216171408642e-05, 'epoch': 0.83} {'loss': 0.8218, 'learning_rate': 1.2650900532737131e-05, 'epoch': 0.83} {'loss': 0.6357, 'learning_rate': 1.265058489122494e-05, 'epoch': 0.83} {'loss': 0.7846, 'learning_rate': 1.2650269246872411e-05, 'epoch': 0.83} {'loss': 0.7615, 'learning_rate': 1.2649953599679876e-05, 'epoch': 0.83} {'loss': 0.9129, 'learning_rate': 1.2649637949647678e-05, 'epoch': 0.83} {'loss': 0.8959, 'learning_rate': 1.2649322296776151e-05, 'epoch': 0.83} {'loss': 0.816, 'learning_rate': 1.264900664106564e-05, 'epoch': 0.83} {'loss': 0.7893, 'learning_rate': 1.2648690982516478e-05, 'epoch': 0.83} {'loss': 0.7627, 'learning_rate': 1.2648375321129005e-05, 'epoch': 0.83} {'loss': 0.7755, 'learning_rate': 1.2648059656903557e-05, 'epoch': 0.83} {'loss': 0.9581, 'learning_rate': 1.2647743989840475e-05, 'epoch': 0.83} {'loss': 0.7157, 'learning_rate': 1.2647428319940096e-05, 'epoch': 0.83} {'loss': 0.8887, 'learning_rate': 1.264711264720276e-05, 'epoch': 0.83} {'loss': 0.8927, 'learning_rate': 1.2646796971628802e-05, 'epoch': 0.83} {'loss': 0.668, 'learning_rate': 1.2646481293218562e-05, 'epoch': 0.83} {'loss': 0.841, 'learning_rate': 1.264616561197238e-05, 'epoch': 0.83} {'loss': 0.7703, 'learning_rate': 1.2645849927890593e-05, 'epoch': 0.83} {'loss': 0.6941, 'learning_rate': 1.2645534240973539e-05, 'epoch': 0.83} {'loss': 0.8398, 'learning_rate': 1.2645218551221554e-05, 'epoch': 0.83} {'loss': 0.7748, 'learning_rate': 1.2644902858634981e-05, 'epoch': 0.83} {'loss': 0.7879, 'learning_rate': 1.2644587163214155e-05, 'epoch': 0.83} {'loss': 0.8117, 'learning_rate': 1.2644271464959416e-05, 'epoch': 0.83} {'loss': 0.6741, 'learning_rate': 1.2643955763871102e-05, 'epoch': 0.83} {'loss': 0.8631, 'learning_rate': 1.2643640059949546e-05, 'epoch': 0.83} {'loss': 0.6695, 'learning_rate': 1.2643324353195094e-05, 'epoch': 0.83} {'loss': 0.712, 'learning_rate': 1.2643008643608084e-05, 'epoch': 0.83} {'loss': 0.7079, 'learning_rate': 1.2642692931188849e-05, 'epoch': 0.83} {'loss': 0.9222, 'learning_rate': 1.2642377215937731e-05, 'epoch': 0.83} {'loss': 0.9058, 'learning_rate': 1.2642061497855067e-05, 'epoch': 0.83} {'loss': 0.726, 'learning_rate': 1.2641745776941194e-05, 'epoch': 0.83} {'loss': 0.6562, 'learning_rate': 1.2641430053196453e-05, 'epoch': 0.83} {'loss': 0.8941, 'learning_rate': 1.2641114326621181e-05, 'epoch': 0.83} {'loss': 0.8373, 'learning_rate': 1.264079859721572e-05, 'epoch': 0.83} {'loss': 0.766, 'learning_rate': 1.2640482864980404e-05, 'epoch': 0.83} {'loss': 0.6895, 'learning_rate': 1.2640167129915568e-05, 'epoch': 0.83} {'loss': 0.8154, 'learning_rate': 1.2639851392021558e-05, 'epoch': 0.83} {'loss': 0.8332, 'learning_rate': 1.2639535651298706e-05, 'epoch': 0.83} {'loss': 0.8736, 'learning_rate': 1.2639219907747355e-05, 'epoch': 0.83} {'loss': 0.6577, 'learning_rate': 1.2638904161367841e-05, 'epoch': 0.83} {'loss': 0.7014, 'learning_rate': 1.2638588412160506e-05, 'epoch': 0.83} {'loss': 0.7688, 'learning_rate': 1.2638272660125685e-05, 'epoch': 0.83} {'loss': 0.6163, 'learning_rate': 1.2637956905263718e-05, 'epoch': 0.83} {'loss': 0.7178, 'learning_rate': 1.2637641147574937e-05, 'epoch': 0.83} {'loss': 0.7275, 'learning_rate': 1.2637325387059686e-05, 'epoch': 0.83} {'loss': 0.7843, 'learning_rate': 1.2637009623718305e-05, 'epoch': 0.83} {'loss': 0.7846, 'learning_rate': 1.263669385755113e-05, 'epoch': 0.83} {'loss': 0.9113, 'learning_rate': 1.26363780885585e-05, 'epoch': 0.83} {'loss': 0.832, 'learning_rate': 1.2636062316740754e-05, 'epoch': 0.83} {'loss': 0.8671, 'learning_rate': 1.2635746542098226e-05, 'epoch': 0.83} {'loss': 0.8143, 'learning_rate': 1.2635430764631261e-05, 'epoch': 0.83} {'loss': 0.8364, 'learning_rate': 1.2635114984340192e-05, 'epoch': 0.83} {'loss': 0.8777, 'learning_rate': 1.2634799201225359e-05, 'epoch': 0.83} {'loss': 0.6152, 'learning_rate': 1.2634483415287102e-05, 'epoch': 0.83} {'loss': 0.806, 'learning_rate': 1.2634167626525758e-05, 'epoch': 0.83} {'loss': 0.977, 'learning_rate': 1.2633851834941666e-05, 'epoch': 0.83} {'loss': 0.6324, 'learning_rate': 1.2633536040535164e-05, 'epoch': 0.83} {'loss': 0.727, 'learning_rate': 1.263322024330659e-05, 'epoch': 0.83} {'loss': 0.7579, 'learning_rate': 1.263290444325628e-05, 'epoch': 0.83} {'loss': 0.8254, 'learning_rate': 1.2632588640384578e-05, 'epoch': 0.83} {'loss': 0.7568, 'learning_rate': 1.263227283469182e-05, 'epoch': 0.83} {'loss': 0.6118, 'learning_rate': 1.2631957026178345e-05, 'epoch': 0.83} {'loss': 0.7451, 'learning_rate': 1.263164121484449e-05, 'epoch': 0.83} {'loss': 0.7591, 'learning_rate': 1.2631325400690593e-05, 'epoch': 0.83} {'loss': 0.7462, 'learning_rate': 1.2631009583716993e-05, 'epoch': 0.83} {'loss': 0.9229, 'learning_rate': 1.263069376392403e-05, 'epoch': 0.83} {'loss': 0.7667, 'learning_rate': 1.2630377941312042e-05, 'epoch': 0.83} {'loss': 0.7922, 'learning_rate': 1.2630062115881364e-05, 'epoch': 0.83} {'loss': 0.8446, 'learning_rate': 1.262974628763234e-05, 'epoch': 0.83} {'loss': 0.9741, 'learning_rate': 1.2629430456565304e-05, 'epoch': 0.83} {'loss': 0.8024, 'learning_rate': 1.2629114622680593e-05, 'epoch': 0.83} {'loss': 0.7191, 'learning_rate': 1.2628798785978551e-05, 'epoch': 0.83} {'loss': 0.7778, 'learning_rate': 1.2628482946459516e-05, 'epoch': 0.83} {'loss': 0.7935, 'learning_rate': 1.2628167104123822e-05, 'epoch': 0.83} {'loss': 0.6874, 'learning_rate': 1.2627851258971808e-05, 'epoch': 0.83} {'loss': 0.8887, 'learning_rate': 1.262753541100382e-05, 'epoch': 0.83} {'loss': 0.6875, 'learning_rate': 1.2627219560220185e-05, 'epoch': 0.83} {'loss': 0.6896, 'learning_rate': 1.2626903706621247e-05, 'epoch': 0.83} {'loss': 0.8718, 'learning_rate': 1.262658785020735e-05, 'epoch': 0.83} {'loss': 0.7669, 'learning_rate': 1.2626271990978823e-05, 'epoch': 0.83} {'loss': 0.9178, 'learning_rate': 1.2625956128936008e-05, 'epoch': 0.83} {'loss': 0.9315, 'learning_rate': 1.2625640264079244e-05, 'epoch': 0.83} {'loss': 0.8837, 'learning_rate': 1.2625324396408873e-05, 'epoch': 0.83} {'loss': 0.9237, 'learning_rate': 1.2625008525925226e-05, 'epoch': 0.83} {'loss': 0.6872, 'learning_rate': 1.2624692652628648e-05, 'epoch': 0.83} {'loss': 0.6331, 'learning_rate': 1.2624376776519474e-05, 'epoch': 0.83} {'loss': 0.6611, 'learning_rate': 1.2624060897598043e-05, 'epoch': 0.83} {'loss': 0.7575, 'learning_rate': 1.2623745015864694e-05, 'epoch': 0.83} {'loss': 0.7821, 'learning_rate': 1.2623429131319766e-05, 'epoch': 0.83} {'loss': 0.748, 'learning_rate': 1.2623113243963597e-05, 'epoch': 0.83} {'loss': 0.8151, 'learning_rate': 1.2622797353796525e-05, 'epoch': 0.83} {'loss': 0.6526, 'learning_rate': 1.262248146081889e-05, 'epoch': 0.83} {'loss': 0.9202, 'learning_rate': 1.2622165565031029e-05, 'epoch': 0.83} {'loss': 0.7696, 'learning_rate': 1.2621849666433279e-05, 'epoch': 0.83} {'loss': 0.8821, 'learning_rate': 1.2621533765025982e-05, 'epoch': 0.83} {'loss': 0.7739, 'learning_rate': 1.262121786080947e-05, 'epoch': 0.83} {'loss': 0.8668, 'learning_rate': 1.2620901953784095e-05, 'epoch': 0.83} {'loss': 0.7024, 'learning_rate': 1.2620586043950184e-05, 'epoch': 0.83} {'loss': 0.9202, 'learning_rate': 1.2620270131308079e-05, 'epoch': 0.83} {'loss': 0.8419, 'learning_rate': 1.2619954215858114e-05, 'epoch': 0.83} {'loss': 0.7799, 'learning_rate': 1.2619638297600636e-05, 'epoch': 0.83} {'loss': 0.8558, 'learning_rate': 1.2619322376535976e-05, 'epoch': 0.83} {'loss': 0.8951, 'learning_rate': 1.2619006452664477e-05, 'epoch': 0.83} {'loss': 1.0918, 'learning_rate': 1.2618690525986477e-05, 'epoch': 0.83} {'loss': 0.789, 'learning_rate': 1.2618374596502316e-05, 'epoch': 0.83} {'loss': 0.7741, 'learning_rate': 1.2618058664212324e-05, 'epoch': 0.84} {'loss': 0.7286, 'learning_rate': 1.2617742729116851e-05, 'epoch': 0.84} {'loss': 0.7026, 'learning_rate': 1.2617426791216227e-05, 'epoch': 0.84} {'loss': 0.8195, 'learning_rate': 1.2617110850510796e-05, 'epoch': 0.84} {'loss': 0.8262, 'learning_rate': 1.2616794907000896e-05, 'epoch': 0.84} {'loss': 0.7138, 'learning_rate': 1.261647896068686e-05, 'epoch': 0.84} {'loss': 0.7851, 'learning_rate': 1.2616163011569035e-05, 'epoch': 0.84} {'loss': 0.8097, 'learning_rate': 1.2615847059647752e-05, 'epoch': 0.84} {'loss': 0.7587, 'learning_rate': 1.2615531104923353e-05, 'epoch': 0.84} {'loss': 1.0349, 'learning_rate': 1.2615215147396178e-05, 'epoch': 0.84} {'loss': 0.8364, 'learning_rate': 1.2614899187066563e-05, 'epoch': 0.84} {'loss': 0.8119, 'learning_rate': 1.2614583223934848e-05, 'epoch': 0.84} {'loss': 0.8961, 'learning_rate': 1.261426725800137e-05, 'epoch': 0.84} {'loss': 0.8055, 'learning_rate': 1.261395128926647e-05, 'epoch': 0.84} {'loss': 0.8736, 'learning_rate': 1.2613635317730486e-05, 'epoch': 0.84} {'loss': 0.9368, 'learning_rate': 1.2613319343393752e-05, 'epoch': 0.84} {'loss': 0.8919, 'learning_rate': 1.2613003366256614e-05, 'epoch': 0.84} {'loss': 0.8352, 'learning_rate': 1.2612687386319406e-05, 'epoch': 0.84} {'loss': 0.9451, 'learning_rate': 1.2612371403582468e-05, 'epoch': 0.84} {'loss': 0.8476, 'learning_rate': 1.2612055418046141e-05, 'epoch': 0.84} {'loss': 0.9746, 'learning_rate': 1.2611739429710754e-05, 'epoch': 0.84} {'loss': 0.9002, 'learning_rate': 1.2611423438576657e-05, 'epoch': 0.84} {'loss': 0.819, 'learning_rate': 1.2611107444644184e-05, 'epoch': 0.84} {'loss': 0.7848, 'learning_rate': 1.261079144791367e-05, 'epoch': 0.84} {'loss': 0.8036, 'learning_rate': 1.2610475448385465e-05, 'epoch': 0.84} {'loss': 0.7559, 'learning_rate': 1.2610159446059892e-05, 'epoch': 0.84} {'loss': 0.9389, 'learning_rate': 1.2609843440937304e-05, 'epoch': 0.84} {'loss': 0.8101, 'learning_rate': 1.2609527433018029e-05, 'epoch': 0.84} {'loss': 0.7864, 'learning_rate': 1.2609211422302409e-05, 'epoch': 0.84} {'loss': 0.7106, 'learning_rate': 1.2608895408790787e-05, 'epoch': 0.84} {'loss': 0.7789, 'learning_rate': 1.2608579392483498e-05, 'epoch': 0.84} {'loss': 0.674, 'learning_rate': 1.2608263373380878e-05, 'epoch': 0.84} {'loss': 0.7853, 'learning_rate': 1.2607947351483269e-05, 'epoch': 0.84} {'loss': 0.9394, 'learning_rate': 1.2607631326791012e-05, 'epoch': 0.84} {'loss': 0.6404, 'learning_rate': 1.2607315299304438e-05, 'epoch': 0.84} {'loss': 0.7995, 'learning_rate': 1.2606999269023893e-05, 'epoch': 0.84} {'loss': 0.8323, 'learning_rate': 1.2606683235949716e-05, 'epoch': 0.84} {'loss': 1.0479, 'learning_rate': 1.2606367200082236e-05, 'epoch': 0.84} {'loss': 0.9327, 'learning_rate': 1.2606051161421802e-05, 'epoch': 0.84} {'loss': 0.6896, 'learning_rate': 1.2605735119968747e-05, 'epoch': 0.84} {'loss': 0.6725, 'learning_rate': 1.2605419075723417e-05, 'epoch': 0.84} {'loss': 0.858, 'learning_rate': 1.2605103028686138e-05, 'epoch': 0.84} {'loss': 0.7698, 'learning_rate': 1.2604786978857263e-05, 'epoch': 0.84} {'loss': 0.7776, 'learning_rate': 1.260447092623712e-05, 'epoch': 0.84} {'loss': 0.7411, 'learning_rate': 1.2604154870826051e-05, 'epoch': 0.84} {'loss': 0.7504, 'learning_rate': 1.2603838812624394e-05, 'epoch': 0.84} {'loss': 0.7975, 'learning_rate': 1.2603522751632493e-05, 'epoch': 0.84} {'loss': 0.6558, 'learning_rate': 1.2603206687850677e-05, 'epoch': 0.84} {'loss': 0.7478, 'learning_rate': 1.2602890621279294e-05, 'epoch': 0.84} {'loss': 0.6988, 'learning_rate': 1.2602574551918678e-05, 'epoch': 0.84} {'loss': 0.8541, 'learning_rate': 1.2602258479769166e-05, 'epoch': 0.84} {'loss': 0.883, 'learning_rate': 1.2601942404831102e-05, 'epoch': 0.84} {'loss': 0.9475, 'learning_rate': 1.2601626327104821e-05, 'epoch': 0.84} {'loss': 0.6523, 'learning_rate': 1.2601310246590664e-05, 'epoch': 0.84} {'loss': 0.7426, 'learning_rate': 1.2600994163288967e-05, 'epoch': 0.84} {'loss': 0.7836, 'learning_rate': 1.260067807720007e-05, 'epoch': 0.84} {'loss': 0.8398, 'learning_rate': 1.260036198832431e-05, 'epoch': 0.84} {'loss': 0.6917, 'learning_rate': 1.260004589666203e-05, 'epoch': 0.84} {'loss': 0.7451, 'learning_rate': 1.2599729802213564e-05, 'epoch': 0.84} {'loss': 0.831, 'learning_rate': 1.2599413704979253e-05, 'epoch': 0.84} {'loss': 0.8419, 'learning_rate': 1.2599097604959438e-05, 'epoch': 0.84} {'loss': 0.8542, 'learning_rate': 1.2598781502154455e-05, 'epoch': 0.84} {'loss': 0.6035, 'learning_rate': 1.2598465396564643e-05, 'epoch': 0.84} {'loss': 0.7924, 'learning_rate': 1.2598149288190337e-05, 'epoch': 0.84} {'loss': 0.7051, 'learning_rate': 1.2597833177031883e-05, 'epoch': 0.84} {'loss': 0.8409, 'learning_rate': 1.2597517063089617e-05, 'epoch': 0.84} {'loss': 0.9018, 'learning_rate': 1.2597200946363874e-05, 'epoch': 0.84} {'loss': 0.9644, 'learning_rate': 1.2596884826854999e-05, 'epoch': 0.84} {'loss': 0.7347, 'learning_rate': 1.2596568704563328e-05, 'epoch': 0.84} {'loss': 0.6671, 'learning_rate': 1.2596252579489197e-05, 'epoch': 0.84} {'loss': 0.8491, 'learning_rate': 1.2595936451632946e-05, 'epoch': 0.84} {'loss': 0.8918, 'learning_rate': 1.2595620320994914e-05, 'epoch': 0.84} {'loss': 0.7554, 'learning_rate': 1.2595304187575443e-05, 'epoch': 0.84} {'loss': 0.7164, 'learning_rate': 1.2594988051374868e-05, 'epoch': 0.84} {'loss': 0.5918, 'learning_rate': 1.2594671912393532e-05, 'epoch': 0.84} {'loss': 0.8804, 'learning_rate': 1.2594355770631773e-05, 'epoch': 0.84} {'loss': 0.7584, 'learning_rate': 1.259403962608992e-05, 'epoch': 0.84} {'loss': 0.6418, 'learning_rate': 1.2593723478768323e-05, 'epoch': 0.84} {'loss': 0.7733, 'learning_rate': 1.2593407328667318e-05, 'epoch': 0.84} {'loss': 0.6842, 'learning_rate': 1.259309117578724e-05, 'epoch': 0.84} {'loss': 0.6845, 'learning_rate': 1.2592775020128434e-05, 'epoch': 0.84} {'loss': 0.6655, 'learning_rate': 1.2592458861691234e-05, 'epoch': 0.84} {'loss': 0.7438, 'learning_rate': 1.2592142700475982e-05, 'epoch': 0.84} {'loss': 0.8221, 'learning_rate': 1.2591826536483015e-05, 'epoch': 0.84} {'loss': 0.8391, 'learning_rate': 1.259151036971267e-05, 'epoch': 0.84} {'loss': 0.8592, 'learning_rate': 1.2591194200165289e-05, 'epoch': 0.84} {'loss': 0.6256, 'learning_rate': 1.2590878027841207e-05, 'epoch': 0.84} {'loss': 0.6991, 'learning_rate': 1.2590561852740768e-05, 'epoch': 0.84} {'loss': 0.6408, 'learning_rate': 1.259024567486431e-05, 'epoch': 0.84} {'loss': 0.9302, 'learning_rate': 1.2589929494212168e-05, 'epoch': 0.84} {'loss': 0.8529, 'learning_rate': 1.258961331078468e-05, 'epoch': 0.84} {'loss': 0.7257, 'learning_rate': 1.2589297124582192e-05, 'epoch': 0.84} {'loss': 0.7825, 'learning_rate': 1.2588980935605036e-05, 'epoch': 0.84} {'loss': 0.8187, 'learning_rate': 1.2588664743853553e-05, 'epoch': 0.84} {'loss': 0.8169, 'learning_rate': 1.2588348549328084e-05, 'epoch': 0.84} {'loss': 0.8489, 'learning_rate': 1.2588032352028964e-05, 'epoch': 0.84} {'loss': 0.9077, 'learning_rate': 1.2587716151956535e-05, 'epoch': 0.84} {'loss': 0.7291, 'learning_rate': 1.2587399949111134e-05, 'epoch': 0.84} {'loss': 0.9166, 'learning_rate': 1.25870837434931e-05, 'epoch': 0.84} {'loss': 0.5586, 'learning_rate': 1.2586767535102776e-05, 'epoch': 0.84} {'loss': 0.8623, 'learning_rate': 1.2586451323940491e-05, 'epoch': 0.84} {'loss': 0.7584, 'learning_rate': 1.2586135110006592e-05, 'epoch': 0.84} {'loss': 0.8253, 'learning_rate': 1.258581889330142e-05, 'epoch': 0.84} {'loss': 0.7333, 'learning_rate': 1.2585502673825305e-05, 'epoch': 0.84} {'loss': 0.7867, 'learning_rate': 1.258518645157859e-05, 'epoch': 0.84} {'loss': 0.8342, 'learning_rate': 1.2584870226561618e-05, 'epoch': 0.84} {'loss': 0.7391, 'learning_rate': 1.2584553998774722e-05, 'epoch': 0.84} {'loss': 0.676, 'learning_rate': 1.2584237768218244e-05, 'epoch': 0.84} {'loss': 0.8333, 'learning_rate': 1.258392153489252e-05, 'epoch': 0.84} {'loss': 0.836, 'learning_rate': 1.2583605298797897e-05, 'epoch': 0.84} {'loss': 0.9303, 'learning_rate': 1.25832890599347e-05, 'epoch': 0.84} {'loss': 0.8277, 'learning_rate': 1.2582972818303278e-05, 'epoch': 0.84} {'loss': 0.7056, 'learning_rate': 1.258265657390397e-05, 'epoch': 0.84} {'loss': 0.8599, 'learning_rate': 1.258234032673711e-05, 'epoch': 0.84} {'loss': 0.8212, 'learning_rate': 1.258202407680304e-05, 'epoch': 0.84} {'loss': 0.8079, 'learning_rate': 1.2581707824102098e-05, 'epoch': 0.84} {'loss': 0.9183, 'learning_rate': 1.2581391568634624e-05, 'epoch': 0.84} {'loss': 0.7833, 'learning_rate': 1.2581075310400955e-05, 'epoch': 0.84} {'loss': 0.8156, 'learning_rate': 1.2580759049401433e-05, 'epoch': 0.84} {'loss': 0.8805, 'learning_rate': 1.2580442785636393e-05, 'epoch': 0.84} {'loss': 0.7681, 'learning_rate': 1.2580126519106176e-05, 'epoch': 0.84} {'loss': 0.6288, 'learning_rate': 1.2579810249811118e-05, 'epoch': 0.84} {'loss': 0.9085, 'learning_rate': 1.2579493977751564e-05, 'epoch': 0.84} {'loss': 0.768, 'learning_rate': 1.2579177702927847e-05, 'epoch': 0.84} {'loss': 0.6941, 'learning_rate': 1.2578861425340309e-05, 'epoch': 0.84} {'loss': 0.8523, 'learning_rate': 1.2578545144989289e-05, 'epoch': 0.84} {'loss': 0.858, 'learning_rate': 1.2578228861875124e-05, 'epoch': 0.84} {'loss': 0.9022, 'learning_rate': 1.2577912575998155e-05, 'epoch': 0.84} {'loss': 0.6732, 'learning_rate': 1.2577596287358718e-05, 'epoch': 0.84} {'loss': 0.6341, 'learning_rate': 1.2577279995957157e-05, 'epoch': 0.84} {'loss': 0.8988, 'learning_rate': 1.2576963701793806e-05, 'epoch': 0.84} {'loss': 0.748, 'learning_rate': 1.2576647404869007e-05, 'epoch': 0.84} {'loss': 0.825, 'learning_rate': 1.2576331105183098e-05, 'epoch': 0.84} {'loss': 0.7151, 'learning_rate': 1.2576014802736415e-05, 'epoch': 0.84} {'loss': 0.6571, 'learning_rate': 1.2575698497529301e-05, 'epoch': 0.84} {'loss': 0.8083, 'learning_rate': 1.2575382189562093e-05, 'epoch': 0.84} {'loss': 0.7643, 'learning_rate': 1.2575065878835133e-05, 'epoch': 0.84} {'loss': 0.727, 'learning_rate': 1.2574749565348757e-05, 'epoch': 0.84} {'loss': 0.7561, 'learning_rate': 1.2574433249103304e-05, 'epoch': 0.84} {'loss': 0.8808, 'learning_rate': 1.2574116930099111e-05, 'epoch': 0.84} {'loss': 0.8256, 'learning_rate': 1.2573800608336521e-05, 'epoch': 0.84} {'loss': 0.6631, 'learning_rate': 1.257348428381587e-05, 'epoch': 0.84} {'loss': 0.9197, 'learning_rate': 1.25731679565375e-05, 'epoch': 0.84} {'loss': 0.832, 'learning_rate': 1.257285162650175e-05, 'epoch': 0.84} {'loss': 0.7791, 'learning_rate': 1.2572535293708957e-05, 'epoch': 0.84} {'loss': 0.8045, 'learning_rate': 1.2572218958159459e-05, 'epoch': 0.84} {'loss': 0.7639, 'learning_rate': 1.2571902619853593e-05, 'epoch': 0.84} {'loss': 0.7864, 'learning_rate': 1.2571586278791706e-05, 'epoch': 0.84} {'loss': 0.7538, 'learning_rate': 1.2571269934974128e-05, 'epoch': 0.84} {'loss': 0.7308, 'learning_rate': 1.2570953588401207e-05, 'epoch': 0.84} {'loss': 0.7452, 'learning_rate': 1.2570637239073273e-05, 'epoch': 0.84} {'loss': 0.683, 'learning_rate': 1.2570320886990673e-05, 'epoch': 0.84} {'loss': 0.7927, 'learning_rate': 1.2570004532153739e-05, 'epoch': 0.84} {'loss': 0.8838, 'learning_rate': 1.2569688174562816e-05, 'epoch': 0.84} {'loss': 0.7607, 'learning_rate': 1.2569371814218236e-05, 'epoch': 0.84} {'loss': 0.8077, 'learning_rate': 1.2569055451120344e-05, 'epoch': 0.84} {'loss': 0.6445, 'learning_rate': 1.2568739085269479e-05, 'epoch': 0.84} {'loss': 0.8213, 'learning_rate': 1.2568422716665976e-05, 'epoch': 0.84} {'loss': 0.9942, 'learning_rate': 1.256810634531018e-05, 'epoch': 0.84} {'loss': 0.8379, 'learning_rate': 1.2567789971202423e-05, 'epoch': 0.84} {'loss': 0.9728, 'learning_rate': 1.2567473594343047e-05, 'epoch': 0.84} {'loss': 0.8726, 'learning_rate': 1.2567157214732391e-05, 'epoch': 0.84} {'loss': 0.8141, 'learning_rate': 1.2566840832370798e-05, 'epoch': 0.84} {'loss': 0.7484, 'learning_rate': 1.2566524447258598e-05, 'epoch': 0.84} {'loss': 0.8184, 'learning_rate': 1.2566208059396141e-05, 'epoch': 0.84} {'loss': 0.8587, 'learning_rate': 1.2565891668783759e-05, 'epoch': 0.84} {'loss': 0.6508, 'learning_rate': 1.256557527542179e-05, 'epoch': 0.84} {'loss': 0.8897, 'learning_rate': 1.2565258879310576e-05, 'epoch': 0.84} {'loss': 0.7301, 'learning_rate': 1.2564942480450458e-05, 'epoch': 0.84} {'loss': 0.62, 'learning_rate': 1.256462607884177e-05, 'epoch': 0.84} {'loss': 0.8224, 'learning_rate': 1.2564309674484854e-05, 'epoch': 0.84} {'loss': 0.6999, 'learning_rate': 1.256399326738005e-05, 'epoch': 0.84} {'loss': 0.8341, 'learning_rate': 1.2563676857527696e-05, 'epoch': 0.84} {'loss': 0.9295, 'learning_rate': 1.256336044492813e-05, 'epoch': 0.84} {'loss': 0.7311, 'learning_rate': 1.256304402958169e-05, 'epoch': 0.84} {'loss': 0.6691, 'learning_rate': 1.256272761148872e-05, 'epoch': 0.84} {'loss': 0.7473, 'learning_rate': 1.2562411190649554e-05, 'epoch': 0.84} {'loss': 0.764, 'learning_rate': 1.2562094767064534e-05, 'epoch': 0.84} {'loss': 0.8385, 'learning_rate': 1.2561778340734001e-05, 'epoch': 0.84} {'loss': 0.8883, 'learning_rate': 1.2561461911658288e-05, 'epoch': 0.84} {'loss': 0.9018, 'learning_rate': 1.2561145479837738e-05, 'epoch': 0.84} {'loss': 0.6339, 'learning_rate': 1.256082904527269e-05, 'epoch': 0.84} {'loss': 0.767, 'learning_rate': 1.2560512607963482e-05, 'epoch': 0.84} {'loss': 0.8292, 'learning_rate': 1.2560196167910453e-05, 'epoch': 0.84} {'loss': 0.8858, 'learning_rate': 1.2559879725113944e-05, 'epoch': 0.84} {'loss': 0.8825, 'learning_rate': 1.2559563279574295e-05, 'epoch': 0.84} {'loss': 0.9067, 'learning_rate': 1.2559246831291839e-05, 'epoch': 0.84} {'loss': 0.87, 'learning_rate': 1.255893038026692e-05, 'epoch': 0.84} {'loss': 1.0317, 'learning_rate': 1.2558613926499877e-05, 'epoch': 0.84} {'loss': 0.9746, 'learning_rate': 1.2558297469991047e-05, 'epoch': 0.84} {'loss': 0.6833, 'learning_rate': 1.255798101074077e-05, 'epoch': 0.84} {'loss': 0.6921, 'learning_rate': 1.2557664548749387e-05, 'epoch': 0.84} {'loss': 0.9358, 'learning_rate': 1.2557348084017236e-05, 'epoch': 0.84} {'loss': 0.7732, 'learning_rate': 1.2557031616544655e-05, 'epoch': 0.84} {'loss': 0.8826, 'learning_rate': 1.2556715146331983e-05, 'epoch': 0.84} {'loss': 0.7746, 'learning_rate': 1.2556398673379562e-05, 'epoch': 0.84} {'loss': 0.8063, 'learning_rate': 1.2556082197687726e-05, 'epoch': 0.84} {'loss': 0.9227, 'learning_rate': 1.2555765719256818e-05, 'epoch': 0.84} {'loss': 0.7797, 'learning_rate': 1.2555449238087178e-05, 'epoch': 0.84} {'loss': 0.7593, 'learning_rate': 1.2555132754179143e-05, 'epoch': 0.84} {'loss': 0.7349, 'learning_rate': 1.2554816267533055e-05, 'epoch': 0.84} {'loss': 0.7466, 'learning_rate': 1.2554499778149247e-05, 'epoch': 0.84} {'loss': 0.6933, 'learning_rate': 1.255418328602806e-05, 'epoch': 0.84} {'loss': 0.8125, 'learning_rate': 1.2553866791169839e-05, 'epoch': 0.84} {'loss': 0.7198, 'learning_rate': 1.2553550293574919e-05, 'epoch': 0.84} {'loss': 0.9887, 'learning_rate': 1.255323379324364e-05, 'epoch': 0.84} {'loss': 0.8213, 'learning_rate': 1.255291729017634e-05, 'epoch': 0.84} {'loss': 0.7192, 'learning_rate': 1.2552600784373359e-05, 'epoch': 0.84} {'loss': 0.8569, 'learning_rate': 1.2552284275835034e-05, 'epoch': 0.84} {'loss': 0.747, 'learning_rate': 1.2551967764561705e-05, 'epoch': 0.84} {'loss': 0.8364, 'learning_rate': 1.2551651250553714e-05, 'epoch': 0.84} {'loss': 0.8352, 'learning_rate': 1.25513347338114e-05, 'epoch': 0.84} {'loss': 0.7843, 'learning_rate': 1.25510182143351e-05, 'epoch': 0.84} {'loss': 0.8612, 'learning_rate': 1.2550701692125154e-05, 'epoch': 0.84} {'loss': 0.7972, 'learning_rate': 1.25503851671819e-05, 'epoch': 0.84} {'loss': 0.7946, 'learning_rate': 1.2550068639505677e-05, 'epoch': 0.84} {'loss': 0.6587, 'learning_rate': 1.2549752109096824e-05, 'epoch': 0.84} {'loss': 0.7677, 'learning_rate': 1.2549435575955685e-05, 'epoch': 0.84} {'loss': 0.7403, 'learning_rate': 1.2549119040082594e-05, 'epoch': 0.84} {'loss': 0.7927, 'learning_rate': 1.2548802501477892e-05, 'epoch': 0.84} {'loss': 0.8306, 'learning_rate': 1.2548485960141921e-05, 'epoch': 0.84} {'loss': 0.8532, 'learning_rate': 1.2548169416075013e-05, 'epoch': 0.84} {'loss': 0.7744, 'learning_rate': 1.2547852869277512e-05, 'epoch': 0.84} {'loss': 0.9109, 'learning_rate': 1.2547536319749759e-05, 'epoch': 0.84} {'loss': 0.7302, 'learning_rate': 1.2547219767492087e-05, 'epoch': 0.84} {'loss': 0.8595, 'learning_rate': 1.2546903212504844e-05, 'epoch': 0.84} {'loss': 0.7407, 'learning_rate': 1.2546586654788362e-05, 'epoch': 0.84} {'loss': 0.8283, 'learning_rate': 1.2546270094342985e-05, 'epoch': 0.84} {'loss': 0.6944, 'learning_rate': 1.2545953531169047e-05, 'epoch': 0.84} {'loss': 0.5869, 'learning_rate': 1.2545636965266889e-05, 'epoch': 0.84} {'loss': 0.9657, 'learning_rate': 1.2545320396636853e-05, 'epoch': 0.84} {'loss': 0.7673, 'learning_rate': 1.2545003825279279e-05, 'epoch': 0.84} {'loss': 0.8201, 'learning_rate': 1.2544687251194498e-05, 'epoch': 0.84} {'loss': 0.9269, 'learning_rate': 1.2544370674382858e-05, 'epoch': 0.84} {'loss': 0.9796, 'learning_rate': 1.2544054094844695e-05, 'epoch': 0.84} {'loss': 0.7589, 'learning_rate': 1.254373751258035e-05, 'epoch': 0.84} {'loss': 0.8101, 'learning_rate': 1.2543420927590157e-05, 'epoch': 0.84} {'loss': 0.8235, 'learning_rate': 1.2543104339874463e-05, 'epoch': 0.84} {'loss': 0.7186, 'learning_rate': 1.25427877494336e-05, 'epoch': 0.84} {'loss': 0.6089, 'learning_rate': 1.2542471156267912e-05, 'epoch': 0.84} {'loss': 0.8069, 'learning_rate': 1.2542154560377735e-05, 'epoch': 0.84} {'loss': 0.7128, 'learning_rate': 1.2541837961763413e-05, 'epoch': 0.84} {'loss': 0.8987, 'learning_rate': 1.254152136042528e-05, 'epoch': 0.84} {'loss': 0.7909, 'learning_rate': 1.2541204756363676e-05, 'epoch': 0.84} {'loss': 0.5876, 'learning_rate': 1.2540888149578947e-05, 'epoch': 0.84} {'loss': 1.0031, 'learning_rate': 1.2540571540071423e-05, 'epoch': 0.84} {'loss': 0.587, 'learning_rate': 1.2540254927841447e-05, 'epoch': 0.84} {'loss': 0.8126, 'learning_rate': 1.2539938312889362e-05, 'epoch': 0.84} {'loss': 0.9385, 'learning_rate': 1.25396216952155e-05, 'epoch': 0.84} {'loss': 0.8658, 'learning_rate': 1.2539305074820205e-05, 'epoch': 0.84} {'loss': 0.897, 'learning_rate': 1.2538988451703818e-05, 'epoch': 0.84} {'loss': 0.6598, 'learning_rate': 1.2538671825866673e-05, 'epoch': 0.84} {'loss': 0.8938, 'learning_rate': 1.253835519730911e-05, 'epoch': 0.84} {'loss': 0.7582, 'learning_rate': 1.2538038566031474e-05, 'epoch': 0.84} {'loss': 0.8205, 'learning_rate': 1.2537721932034102e-05, 'epoch': 0.84} {'loss': 0.6672, 'learning_rate': 1.2537405295317329e-05, 'epoch': 0.84} {'loss': 0.8861, 'learning_rate': 1.2537088655881497e-05, 'epoch': 0.84} {'loss': 1.1069, 'learning_rate': 1.2536772013726948e-05, 'epoch': 0.84} {'loss': 0.8147, 'learning_rate': 1.2536455368854015e-05, 'epoch': 0.84} {'loss': 0.8302, 'learning_rate': 1.2536138721263043e-05, 'epoch': 0.84} {'loss': 0.7196, 'learning_rate': 1.2535822070954369e-05, 'epoch': 0.84} {'loss': 0.8362, 'learning_rate': 1.2535505417928336e-05, 'epoch': 0.84} {'loss': 0.6701, 'learning_rate': 1.2535188762185274e-05, 'epoch': 0.84} {'loss': 0.7854, 'learning_rate': 1.2534872103725535e-05, 'epoch': 0.84} {'loss': 0.7843, 'learning_rate': 1.2534555442549447e-05, 'epoch': 0.84} {'loss': 0.6388, 'learning_rate': 1.2534238778657358e-05, 'epoch': 0.84} {'loss': 0.776, 'learning_rate': 1.25339221120496e-05, 'epoch': 0.84} {'loss': 0.7376, 'learning_rate': 1.2533605442726515e-05, 'epoch': 0.84} {'loss': 0.831, 'learning_rate': 1.2533288770688448e-05, 'epoch': 0.84} {'loss': 0.83, 'learning_rate': 1.2532972095935731e-05, 'epoch': 0.84} {'loss': 0.9551, 'learning_rate': 1.2532655418468704e-05, 'epoch': 0.84} {'loss': 0.6975, 'learning_rate': 1.253233873828771e-05, 'epoch': 0.84} {'loss': 0.7713, 'learning_rate': 1.2532022055393085e-05, 'epoch': 0.84} {'loss': 0.6045, 'learning_rate': 1.253170536978517e-05, 'epoch': 0.84} {'loss': 1.1045, 'learning_rate': 1.2531388681464305e-05, 'epoch': 0.84} {'loss': 0.8066, 'learning_rate': 1.253107199043083e-05, 'epoch': 0.84} {'loss': 0.8666, 'learning_rate': 1.2530755296685083e-05, 'epoch': 0.84} {'loss': 0.9037, 'learning_rate': 1.2530438600227401e-05, 'epoch': 0.84} {'loss': 0.9144, 'learning_rate': 1.2530121901058126e-05, 'epoch': 0.84} {'loss': 0.7752, 'learning_rate': 1.2529805199177595e-05, 'epoch': 0.84} {'loss': 0.7232, 'learning_rate': 1.2529488494586153e-05, 'epoch': 0.84} {'loss': 0.9203, 'learning_rate': 1.2529171787284135e-05, 'epoch': 0.84} {'loss': 0.9251, 'learning_rate': 1.252885507727188e-05, 'epoch': 0.84} {'loss': 0.8254, 'learning_rate': 1.2528538364549732e-05, 'epoch': 0.84} {'loss': 0.8104, 'learning_rate': 1.2528221649118021e-05, 'epoch': 0.84} {'loss': 0.8832, 'learning_rate': 1.2527904930977097e-05, 'epoch': 0.84} {'loss': 0.7245, 'learning_rate': 1.2527588210127292e-05, 'epoch': 0.84} {'loss': 0.9564, 'learning_rate': 1.252727148656895e-05, 'epoch': 0.84} {'loss': 0.6828, 'learning_rate': 1.2526954760302408e-05, 'epoch': 0.84} {'loss': 0.7582, 'learning_rate': 1.2526638031328008e-05, 'epoch': 0.84} {'loss': 0.6304, 'learning_rate': 1.2526321299646086e-05, 'epoch': 0.84} {'loss': 0.8699, 'learning_rate': 1.252600456525698e-05, 'epoch': 0.84} {'loss': 0.6643, 'learning_rate': 1.2525687828161033e-05, 'epoch': 0.84} {'loss': 0.8363, 'learning_rate': 1.2525371088358585e-05, 'epoch': 0.84} {'loss': 0.707, 'learning_rate': 1.2525054345849973e-05, 'epoch': 0.84} {'loss': 0.7816, 'learning_rate': 1.2524737600635537e-05, 'epoch': 0.84} {'loss': 0.8572, 'learning_rate': 1.252442085271562e-05, 'epoch': 0.84} {'loss': 0.6897, 'learning_rate': 1.2524104102090555e-05, 'epoch': 0.84} {'loss': 0.7235, 'learning_rate': 1.2523787348760686e-05, 'epoch': 0.84} {'loss': 0.7759, 'learning_rate': 1.2523470592726347e-05, 'epoch': 0.84} {'loss': 0.9242, 'learning_rate': 1.2523153833987888e-05, 'epoch': 0.84} {'loss': 0.9094, 'learning_rate': 1.2522837072545637e-05, 'epoch': 0.84} {'loss': 0.6976, 'learning_rate': 1.2522520308399941e-05, 'epoch': 0.84} {'loss': 0.8756, 'learning_rate': 1.2522203541551137e-05, 'epoch': 0.84} {'loss': 0.7269, 'learning_rate': 1.2521886771999563e-05, 'epoch': 0.84} {'loss': 0.7955, 'learning_rate': 1.252156999974556e-05, 'epoch': 0.84} {'loss': 0.7307, 'learning_rate': 1.2521253224789467e-05, 'epoch': 0.84} {'loss': 0.7834, 'learning_rate': 1.2520936447131624e-05, 'epoch': 0.84} {'loss': 0.8525, 'learning_rate': 1.252061966677237e-05, 'epoch': 0.84} {'loss': 0.88, 'learning_rate': 1.2520302883712044e-05, 'epoch': 0.84} {'loss': 0.7048, 'learning_rate': 1.2519986097950989e-05, 'epoch': 0.84} {'loss': 0.6774, 'learning_rate': 1.2519669309489537e-05, 'epoch': 0.84} {'loss': 0.9339, 'learning_rate': 1.2519352518328034e-05, 'epoch': 0.84} {'loss': 0.8476, 'learning_rate': 1.2519035724466816e-05, 'epoch': 0.84} {'loss': 0.8292, 'learning_rate': 1.2518718927906227e-05, 'epoch': 0.84} {'loss': 0.941, 'learning_rate': 1.25184021286466e-05, 'epoch': 0.84} {'loss': 0.7381, 'learning_rate': 1.2518085326688279e-05, 'epoch': 0.84} {'loss': 0.8491, 'learning_rate': 1.2517768522031604e-05, 'epoch': 0.84} {'loss': 0.7418, 'learning_rate': 1.251745171467691e-05, 'epoch': 0.84} {'loss': 0.8084, 'learning_rate': 1.2517134904624544e-05, 'epoch': 0.84} {'loss': 0.8115, 'learning_rate': 1.2516818091874836e-05, 'epoch': 0.84} {'loss': 0.7536, 'learning_rate': 1.251650127642813e-05, 'epoch': 0.84} {'loss': 0.7777, 'learning_rate': 1.2516184458284766e-05, 'epoch': 0.84} {'loss': 0.6941, 'learning_rate': 1.2515867637445088e-05, 'epoch': 0.84} {'loss': 0.8003, 'learning_rate': 1.2515550813909425e-05, 'epoch': 0.84} {'loss': 0.7378, 'learning_rate': 1.2515233987678123e-05, 'epoch': 0.84} {'loss': 0.848, 'learning_rate': 1.2514917158751526e-05, 'epoch': 0.84} {'loss': 0.9174, 'learning_rate': 1.2514600327129964e-05, 'epoch': 0.84} {'loss': 0.8294, 'learning_rate': 1.251428349281378e-05, 'epoch': 0.84} {'loss': 0.9086, 'learning_rate': 1.2513966655803316e-05, 'epoch': 0.84} {'loss': 0.7345, 'learning_rate': 1.2513649816098912e-05, 'epoch': 0.84} {'loss': 0.5802, 'learning_rate': 1.2513332973700902e-05, 'epoch': 0.84} {'loss': 0.7862, 'learning_rate': 1.2513016128609631e-05, 'epoch': 0.84} {'loss': 0.8266, 'learning_rate': 1.2512699280825436e-05, 'epoch': 0.84} {'loss': 0.8099, 'learning_rate': 1.2512382430348653e-05, 'epoch': 0.84} {'loss': 0.7797, 'learning_rate': 1.2512065577179629e-05, 'epoch': 0.84} {'loss': 0.8104, 'learning_rate': 1.25117487213187e-05, 'epoch': 0.84} {'loss': 0.838, 'learning_rate': 1.2511431862766206e-05, 'epoch': 0.84} {'loss': 0.7052, 'learning_rate': 1.2511115001522486e-05, 'epoch': 0.84} {'loss': 0.7052, 'learning_rate': 1.2510798137587878e-05, 'epoch': 0.84} {'loss': 0.8256, 'learning_rate': 1.2510481270962724e-05, 'epoch': 0.84} {'loss': 0.8814, 'learning_rate': 1.2510164401647363e-05, 'epoch': 0.84} {'loss': 0.8809, 'learning_rate': 1.2509847529642131e-05, 'epoch': 0.84} {'loss': 0.838, 'learning_rate': 1.2509530654947376e-05, 'epoch': 0.84} {'loss': 0.7646, 'learning_rate': 1.2509213777563431e-05, 'epoch': 0.84} {'loss': 0.746, 'learning_rate': 1.2508896897490636e-05, 'epoch': 0.84} {'loss': 0.6571, 'learning_rate': 1.2508580014729333e-05, 'epoch': 0.84} {'loss': 0.6193, 'learning_rate': 1.2508263129279858e-05, 'epoch': 0.84} {'loss': 0.6916, 'learning_rate': 1.2507946241142555e-05, 'epoch': 0.84} {'loss': 0.8136, 'learning_rate': 1.2507629350317758e-05, 'epoch': 0.84} {'loss': 0.6815, 'learning_rate': 1.2507312456805811e-05, 'epoch': 0.84} {'loss': 0.914, 'learning_rate': 1.2506995560607054e-05, 'epoch': 0.84} {'loss': 0.6815, 'learning_rate': 1.2506678661721825e-05, 'epoch': 0.84} {'loss': 0.7215, 'learning_rate': 1.2506361760150463e-05, 'epoch': 0.84} {'loss': 0.7927, 'learning_rate': 1.2506044855893307e-05, 'epoch': 0.84} {'loss': 0.8295, 'learning_rate': 1.25057279489507e-05, 'epoch': 0.84} {'loss': 0.7969, 'learning_rate': 1.2505411039322977e-05, 'epoch': 0.84} {'loss': 0.8165, 'learning_rate': 1.2505094127010482e-05, 'epoch': 0.84} {'loss': 0.8685, 'learning_rate': 1.2504777212013551e-05, 'epoch': 0.84} {'loss': 0.6028, 'learning_rate': 1.2504460294332525e-05, 'epoch': 0.84} {'loss': 0.7301, 'learning_rate': 1.2504143373967744e-05, 'epoch': 0.84} {'loss': 0.7601, 'learning_rate': 1.2503826450919548e-05, 'epoch': 0.84} {'loss': 0.6964, 'learning_rate': 1.2503509525188275e-05, 'epoch': 0.84} {'loss': 0.7136, 'learning_rate': 1.2503192596774267e-05, 'epoch': 0.84} {'loss': 0.792, 'learning_rate': 1.250287566567786e-05, 'epoch': 0.84} {'loss': 0.7978, 'learning_rate': 1.2502558731899399e-05, 'epoch': 0.84} {'loss': 0.6951, 'learning_rate': 1.2502241795439218e-05, 'epoch': 0.84} {'loss': 0.9315, 'learning_rate': 1.250192485629766e-05, 'epoch': 0.84} {'loss': 0.9042, 'learning_rate': 1.2501607914475062e-05, 'epoch': 0.84} {'loss': 0.8341, 'learning_rate': 1.2501290969971766e-05, 'epoch': 0.84} {'loss': 0.7164, 'learning_rate': 1.2500974022788115e-05, 'epoch': 0.84} {'loss': 0.7771, 'learning_rate': 1.250065707292444e-05, 'epoch': 0.84} {'loss': 0.9208, 'learning_rate': 1.2500340120381087e-05, 'epoch': 0.84} {'loss': 0.8898, 'learning_rate': 1.2500023165158394e-05, 'epoch': 0.84} {'loss': 0.5671, 'learning_rate': 1.2499706207256699e-05, 'epoch': 0.84} {'loss': 0.9225, 'learning_rate': 1.2499389246676343e-05, 'epoch': 0.84} {'loss': 0.6561, 'learning_rate': 1.249907228341767e-05, 'epoch': 0.84} {'loss': 0.4928, 'learning_rate': 1.2498755317481013e-05, 'epoch': 0.84} {'loss': 0.7143, 'learning_rate': 1.2498438348866712e-05, 'epoch': 0.84} {'loss': 0.8756, 'learning_rate': 1.2498121377575111e-05, 'epoch': 0.84} {'loss': 0.7238, 'learning_rate': 1.2497804403606548e-05, 'epoch': 0.84} {'loss': 0.9856, 'learning_rate': 1.2497487426961361e-05, 'epoch': 0.84} {'loss': 0.7001, 'learning_rate': 1.2497170447639893e-05, 'epoch': 0.84} {'loss': 0.9399, 'learning_rate': 1.2496853465642479e-05, 'epoch': 0.84} {'loss': 0.9224, 'learning_rate': 1.249653648096946e-05, 'epoch': 0.84} {'loss': 0.8261, 'learning_rate': 1.2496219493621179e-05, 'epoch': 0.84} {'loss': 0.8425, 'learning_rate': 1.2495902503597973e-05, 'epoch': 0.84} {'loss': 0.8697, 'learning_rate': 1.249558551090018e-05, 'epoch': 0.84} {'loss': 0.5545, 'learning_rate': 1.2495268515528148e-05, 'epoch': 0.84} {'loss': 0.7255, 'learning_rate': 1.2494951517482205e-05, 'epoch': 0.84} {'loss': 0.8284, 'learning_rate': 1.2494634516762697e-05, 'epoch': 0.84} {'loss': 0.6999, 'learning_rate': 1.2494317513369962e-05, 'epoch': 0.84} {'loss': 0.868, 'learning_rate': 1.2494000507304342e-05, 'epoch': 0.84} {'loss': 0.8515, 'learning_rate': 1.2493683498566178e-05, 'epoch': 0.84} {'loss': 0.7375, 'learning_rate': 1.2493366487155804e-05, 'epoch': 0.84} {'loss': 0.7474, 'learning_rate': 1.2493049473073566e-05, 'epoch': 0.84} {'loss': 0.9557, 'learning_rate': 1.2492732456319799e-05, 'epoch': 0.84} {'loss': 0.6401, 'learning_rate': 1.2492415436894843e-05, 'epoch': 0.84} {'loss': 0.7393, 'learning_rate': 1.2492098414799037e-05, 'epoch': 0.84} {'loss': 0.9362, 'learning_rate': 1.2491781390032727e-05, 'epoch': 0.84} {'loss': 0.9209, 'learning_rate': 1.2491464362596247e-05, 'epoch': 0.84} {'loss': 0.7717, 'learning_rate': 1.2491147332489937e-05, 'epoch': 0.84} {'loss': 0.7822, 'learning_rate': 1.249083029971414e-05, 'epoch': 0.84} {'loss': 0.7712, 'learning_rate': 1.2490513264269188e-05, 'epoch': 0.84} {'loss': 0.9291, 'learning_rate': 1.2490196226155429e-05, 'epoch': 0.84} {'loss': 0.8036, 'learning_rate': 1.2489879185373201e-05, 'epoch': 0.84} {'loss': 0.7318, 'learning_rate': 1.2489562141922845e-05, 'epoch': 0.84} {'loss': 0.9604, 'learning_rate': 1.2489245095804697e-05, 'epoch': 0.84} {'loss': 0.7396, 'learning_rate': 1.2488928047019097e-05, 'epoch': 0.84} {'loss': 0.6866, 'learning_rate': 1.2488610995566387e-05, 'epoch': 0.84} {'loss': 0.8572, 'learning_rate': 1.2488293941446903e-05, 'epoch': 0.84} {'loss': 0.7877, 'learning_rate': 1.2487976884660989e-05, 'epoch': 0.84} {'loss': 0.7568, 'learning_rate': 1.2487659825208983e-05, 'epoch': 0.84} {'loss': 0.9139, 'learning_rate': 1.2487342763091226e-05, 'epoch': 0.84} {'loss': 0.8155, 'learning_rate': 1.2487025698308057e-05, 'epoch': 0.84} {'loss': 0.7784, 'learning_rate': 1.2486708630859816e-05, 'epoch': 0.84} {'loss': 0.7794, 'learning_rate': 1.248639156074684e-05, 'epoch': 0.84} {'loss': 0.8168, 'learning_rate': 1.248607448796947e-05, 'epoch': 0.84} {'loss': 0.8828, 'learning_rate': 1.248575741252805e-05, 'epoch': 0.84} {'loss': 0.7646, 'learning_rate': 1.2485440334422914e-05, 'epoch': 0.84} {'loss': 0.7987, 'learning_rate': 1.2485123253654407e-05, 'epoch': 0.84} {'loss': 0.9548, 'learning_rate': 1.2484806170222868e-05, 'epoch': 0.84} {'loss': 0.9982, 'learning_rate': 1.248448908412863e-05, 'epoch': 0.84} {'loss': 0.9237, 'learning_rate': 1.248417199537204e-05, 'epoch': 0.84} {'loss': 0.6636, 'learning_rate': 1.2483854903953434e-05, 'epoch': 0.84} {'loss': 0.8864, 'learning_rate': 1.2483537809873154e-05, 'epoch': 0.84} {'loss': 0.7271, 'learning_rate': 1.248322071313154e-05, 'epoch': 0.84} {'loss': 0.8163, 'learning_rate': 1.248290361372893e-05, 'epoch': 0.84} {'loss': 0.6288, 'learning_rate': 1.2482586511665666e-05, 'epoch': 0.84} {'loss': 0.7781, 'learning_rate': 1.2482269406942086e-05, 'epoch': 0.84} {'loss': 0.6745, 'learning_rate': 1.2481952299558528e-05, 'epoch': 0.84} {'loss': 0.8329, 'learning_rate': 1.2481635189515338e-05, 'epoch': 0.84} {'loss': 0.8131, 'learning_rate': 1.248131807681285e-05, 'epoch': 0.84} {'loss': 0.7225, 'learning_rate': 1.2481000961451404e-05, 'epoch': 0.84} {'loss': 0.7226, 'learning_rate': 1.2480683843431342e-05, 'epoch': 0.84} {'loss': 0.9075, 'learning_rate': 1.2480366722753007e-05, 'epoch': 0.84} {'loss': 0.7723, 'learning_rate': 1.2480049599416733e-05, 'epoch': 0.84} {'loss': 0.7019, 'learning_rate': 1.2479732473422861e-05, 'epoch': 0.84} {'loss': 0.8413, 'learning_rate': 1.2479415344771733e-05, 'epoch': 0.84} {'loss': 0.8333, 'learning_rate': 1.2479098213463687e-05, 'epoch': 0.84} {'loss': 0.8285, 'learning_rate': 1.2478781079499063e-05, 'epoch': 0.84} {'loss': 0.8264, 'learning_rate': 1.2478463942878203e-05, 'epoch': 0.84} {'loss': 0.9183, 'learning_rate': 1.2478146803601446e-05, 'epoch': 0.84} {'loss': 0.8215, 'learning_rate': 1.2477829661669128e-05, 'epoch': 0.84} {'loss': 0.9588, 'learning_rate': 1.2477512517081591e-05, 'epoch': 0.84} {'loss': 0.6474, 'learning_rate': 1.2477195369839179e-05, 'epoch': 0.84} {'loss': 0.7479, 'learning_rate': 1.2476878219942227e-05, 'epoch': 0.84} {'loss': 0.8008, 'learning_rate': 1.2476561067391078e-05, 'epoch': 0.84} {'loss': 0.661, 'learning_rate': 1.247624391218607e-05, 'epoch': 0.84} {'loss': 0.6232, 'learning_rate': 1.247592675432754e-05, 'epoch': 0.84} {'loss': 1.0143, 'learning_rate': 1.2475609593815833e-05, 'epoch': 0.84} {'loss': 0.7407, 'learning_rate': 1.2475292430651292e-05, 'epoch': 0.84} {'loss': 0.9423, 'learning_rate': 1.2474975264834244e-05, 'epoch': 0.84} {'loss': 0.8486, 'learning_rate': 1.247465809636504e-05, 'epoch': 0.84} {'loss': 0.6613, 'learning_rate': 1.2474340925244015e-05, 'epoch': 0.84} {'loss': 0.7382, 'learning_rate': 1.2474023751471514e-05, 'epoch': 0.84} {'loss': 0.7695, 'learning_rate': 1.2473706575047868e-05, 'epoch': 0.84} {'loss': 0.8608, 'learning_rate': 1.2473389395973425e-05, 'epoch': 0.84} {'loss': 0.9352, 'learning_rate': 1.2473072214248525e-05, 'epoch': 0.84} {'loss': 0.8928, 'learning_rate': 1.24727550298735e-05, 'epoch': 0.84} {'loss': 0.8781, 'learning_rate': 1.2472437842848697e-05, 'epoch': 0.84} {'loss': 0.7286, 'learning_rate': 1.2472120653174451e-05, 'epoch': 0.84} {'loss': 0.8432, 'learning_rate': 1.247180346085111e-05, 'epoch': 0.84} {'loss': 0.8658, 'learning_rate': 1.2471486265879005e-05, 'epoch': 0.84} {'loss': 0.7277, 'learning_rate': 1.2471169068258479e-05, 'epoch': 0.84} {'loss': 0.8043, 'learning_rate': 1.2470851867989874e-05, 'epoch': 0.84} {'loss': 0.8589, 'learning_rate': 1.2470534665073526e-05, 'epoch': 0.84} {'loss': 0.8624, 'learning_rate': 1.247021745950978e-05, 'epoch': 0.84} {'loss': 0.9349, 'learning_rate': 1.246990025129897e-05, 'epoch': 0.84} {'loss': 0.8145, 'learning_rate': 1.2469583040441443e-05, 'epoch': 0.84} {'loss': 0.8024, 'learning_rate': 1.2469265826937533e-05, 'epoch': 0.84} {'loss': 0.6982, 'learning_rate': 1.2468948610787579e-05, 'epoch': 0.84} {'loss': 0.6312, 'learning_rate': 1.2468631391991926e-05, 'epoch': 0.84} {'loss': 0.6848, 'learning_rate': 1.2468314170550913e-05, 'epoch': 0.84} {'loss': 0.6367, 'learning_rate': 1.2467996946464875e-05, 'epoch': 0.84} {'loss': 0.8261, 'learning_rate': 1.2467679719734158e-05, 'epoch': 0.84} {'loss': 0.9044, 'learning_rate': 1.24673624903591e-05, 'epoch': 0.84} {'loss': 0.9287, 'learning_rate': 1.246704525834004e-05, 'epoch': 0.84} {'loss': 0.6797, 'learning_rate': 1.2466728023677317e-05, 'epoch': 0.84} {'loss': 0.6701, 'learning_rate': 1.2466410786371272e-05, 'epoch': 0.84} {'loss': 0.7838, 'learning_rate': 1.2466093546422247e-05, 'epoch': 0.84} {'loss': 0.6781, 'learning_rate': 1.2465776303830579e-05, 'epoch': 0.84} {'loss': 0.6841, 'learning_rate': 1.2465459058596612e-05, 'epoch': 0.85} {'loss': 0.7744, 'learning_rate': 1.2465141810720683e-05, 'epoch': 0.85} {'loss': 0.7839, 'learning_rate': 1.2464824560203128e-05, 'epoch': 0.85} {'loss': 0.7729, 'learning_rate': 1.2464507307044292e-05, 'epoch': 0.85} {'loss': 0.7465, 'learning_rate': 1.2464190051244513e-05, 'epoch': 0.85} {'loss': 0.8534, 'learning_rate': 1.2463872792804136e-05, 'epoch': 0.85} {'loss': 0.9342, 'learning_rate': 1.2463555531723492e-05, 'epoch': 0.85} {'loss': 0.8784, 'learning_rate': 1.246323826800293e-05, 'epoch': 0.85} {'loss': 0.8256, 'learning_rate': 1.2462921001642788e-05, 'epoch': 0.85} {'loss': 0.7968, 'learning_rate': 1.2462603732643399e-05, 'epoch': 0.85} {'loss': 0.9172, 'learning_rate': 1.246228646100511e-05, 'epoch': 0.85} {'loss': 0.8327, 'learning_rate': 1.2461969186728256e-05, 'epoch': 0.85} {'loss': 0.7616, 'learning_rate': 1.2461651909813182e-05, 'epoch': 0.85} {'loss': 0.7571, 'learning_rate': 1.2461334630260226e-05, 'epoch': 0.85} {'loss': 0.618, 'learning_rate': 1.2461017348069726e-05, 'epoch': 0.85} {'loss': 0.7408, 'learning_rate': 1.2460700063242029e-05, 'epoch': 0.85} {'loss': 0.8492, 'learning_rate': 1.2460382775777464e-05, 'epoch': 0.85} {'loss': 0.8062, 'learning_rate': 1.2460065485676378e-05, 'epoch': 0.85} {'loss': 0.6952, 'learning_rate': 1.245974819293911e-05, 'epoch': 0.85} {'loss': 0.8838, 'learning_rate': 1.2459430897566001e-05, 'epoch': 0.85} {'loss': 0.9893, 'learning_rate': 1.2459113599557389e-05, 'epoch': 0.85} {'loss': 0.8355, 'learning_rate': 1.2458796298913616e-05, 'epoch': 0.85} {'loss': 0.7145, 'learning_rate': 1.245847899563502e-05, 'epoch': 0.85} {'loss': 0.6547, 'learning_rate': 1.2458161689721941e-05, 'epoch': 0.85} {'loss': 0.7918, 'learning_rate': 1.2457844381174721e-05, 'epoch': 0.85} {'loss': 0.7925, 'learning_rate': 1.2457527069993698e-05, 'epoch': 0.85} {'loss': 0.8648, 'learning_rate': 1.2457209756179214e-05, 'epoch': 0.85} {'loss': 0.7857, 'learning_rate': 1.2456892439731607e-05, 'epoch': 0.85} {'loss': 0.84, 'learning_rate': 1.2456575120651217e-05, 'epoch': 0.85} {'loss': 0.9177, 'learning_rate': 1.245625779893839e-05, 'epoch': 0.85} {'loss': 0.8655, 'learning_rate': 1.2455940474593455e-05, 'epoch': 0.85} {'loss': 0.8802, 'learning_rate': 1.2455623147616763e-05, 'epoch': 0.85} {'loss': 0.7824, 'learning_rate': 1.2455305818008648e-05, 'epoch': 0.85} {'loss': 0.8904, 'learning_rate': 1.2454988485769449e-05, 'epoch': 0.85} {'loss': 0.9331, 'learning_rate': 1.245467115089951e-05, 'epoch': 0.85} {'loss': 0.8163, 'learning_rate': 1.2454353813399167e-05, 'epoch': 0.85} {'loss': 0.7165, 'learning_rate': 1.2454036473268765e-05, 'epoch': 0.85} {'loss': 0.8367, 'learning_rate': 1.2453719130508639e-05, 'epoch': 0.85} {'loss': 0.7692, 'learning_rate': 1.2453401785119134e-05, 'epoch': 0.85} {'loss': 0.9546, 'learning_rate': 1.2453084437100587e-05, 'epoch': 0.85} {'loss': 0.7085, 'learning_rate': 1.2452767086453336e-05, 'epoch': 0.85} {'loss': 0.8328, 'learning_rate': 1.2452449733177726e-05, 'epoch': 0.85} {'loss': 0.666, 'learning_rate': 1.2452132377274095e-05, 'epoch': 0.85} {'loss': 0.8938, 'learning_rate': 1.2451815018742784e-05, 'epoch': 0.85} {'loss': 0.6204, 'learning_rate': 1.2451497657584128e-05, 'epoch': 0.85} {'loss': 0.79, 'learning_rate': 1.2451180293798474e-05, 'epoch': 0.85} {'loss': 0.7569, 'learning_rate': 1.2450862927386161e-05, 'epoch': 0.85} {'loss': 0.5784, 'learning_rate': 1.2450545558347522e-05, 'epoch': 0.85} {'loss': 0.8646, 'learning_rate': 1.2450228186682905e-05, 'epoch': 0.85} {'loss': 0.74, 'learning_rate': 1.2449910812392649e-05, 'epoch': 0.85} {'loss': 0.9209, 'learning_rate': 1.244959343547709e-05, 'epoch': 0.85} {'loss': 0.6848, 'learning_rate': 1.2449276055936572e-05, 'epoch': 0.85} {'loss': 0.8141, 'learning_rate': 1.2448958673771432e-05, 'epoch': 0.85} {'loss': 0.6749, 'learning_rate': 1.2448641288982012e-05, 'epoch': 0.85} {'loss': 0.934, 'learning_rate': 1.2448323901568652e-05, 'epoch': 0.85} {'loss': 0.9021, 'learning_rate': 1.2448006511531692e-05, 'epoch': 0.85} {'loss': 0.7163, 'learning_rate': 1.2447689118871473e-05, 'epoch': 0.85} {'loss': 0.7032, 'learning_rate': 1.2447371723588337e-05, 'epoch': 0.85} {'loss': 0.8745, 'learning_rate': 1.2447054325682617e-05, 'epoch': 0.85} {'loss': 0.7692, 'learning_rate': 1.2446736925154656e-05, 'epoch': 0.85} {'loss': 0.8467, 'learning_rate': 1.2446419522004798e-05, 'epoch': 0.85} {'loss': 0.83, 'learning_rate': 1.2446102116233381e-05, 'epoch': 0.85} {'loss': 0.7927, 'learning_rate': 1.2445784707840743e-05, 'epoch': 0.85} {'loss': 0.8436, 'learning_rate': 1.2445467296827229e-05, 'epoch': 0.85} {'loss': 0.7825, 'learning_rate': 1.2445149883193178e-05, 'epoch': 0.85} {'loss': 0.7146, 'learning_rate': 1.2444832466938924e-05, 'epoch': 0.85} {'loss': 0.7261, 'learning_rate': 1.2444515048064809e-05, 'epoch': 0.85} {'loss': 0.6303, 'learning_rate': 1.244419762657118e-05, 'epoch': 0.85} {'loss': 0.7298, 'learning_rate': 1.2443880202458369e-05, 'epoch': 0.85} {'loss': 0.8565, 'learning_rate': 1.244356277572672e-05, 'epoch': 0.85} {'loss': 0.7147, 'learning_rate': 1.2443245346376578e-05, 'epoch': 0.85} {'loss': 0.8676, 'learning_rate': 1.2442927914408275e-05, 'epoch': 0.85} {'loss': 0.6131, 'learning_rate': 1.2442610479822154e-05, 'epoch': 0.85} {'loss': 0.7824, 'learning_rate': 1.2442293042618556e-05, 'epoch': 0.85} {'loss': 0.9495, 'learning_rate': 1.244197560279782e-05, 'epoch': 0.85} {'loss': 1.0057, 'learning_rate': 1.2441658160360286e-05, 'epoch': 0.85} {'loss': 0.6735, 'learning_rate': 1.2441340715306298e-05, 'epoch': 0.85} {'loss': 0.7417, 'learning_rate': 1.244102326763619e-05, 'epoch': 0.85} {'loss': 0.8289, 'learning_rate': 1.2440705817350307e-05, 'epoch': 0.85} {'loss': 0.8065, 'learning_rate': 1.2440388364448986e-05, 'epoch': 0.85} {'loss': 0.9177, 'learning_rate': 1.244007090893257e-05, 'epoch': 0.85} {'loss': 0.663, 'learning_rate': 1.2439753450801396e-05, 'epoch': 0.85} {'loss': 0.705, 'learning_rate': 1.2439435990055808e-05, 'epoch': 0.85} {'loss': 0.8436, 'learning_rate': 1.2439118526696144e-05, 'epoch': 0.85} {'loss': 0.6952, 'learning_rate': 1.2438801060722743e-05, 'epoch': 0.85} {'loss': 0.8569, 'learning_rate': 1.2438483592135947e-05, 'epoch': 0.85} {'loss': 0.6879, 'learning_rate': 1.2438166120936096e-05, 'epoch': 0.85} {'loss': 0.6957, 'learning_rate': 1.2437848647123527e-05, 'epoch': 0.85} {'loss': 0.8032, 'learning_rate': 1.2437531170698586e-05, 'epoch': 0.85} {'loss': 0.7803, 'learning_rate': 1.2437213691661611e-05, 'epoch': 0.85} {'loss': 0.9095, 'learning_rate': 1.2436896210012941e-05, 'epoch': 0.85} {'loss': 0.7254, 'learning_rate': 1.2436578725752919e-05, 'epoch': 0.85} {'loss': 0.8815, 'learning_rate': 1.243626123888188e-05, 'epoch': 0.85} {'loss': 0.7676, 'learning_rate': 1.2435943749400167e-05, 'epoch': 0.85} {'loss': 0.716, 'learning_rate': 1.2435626257308119e-05, 'epoch': 0.85} {'loss': 0.9957, 'learning_rate': 1.2435308762606081e-05, 'epoch': 0.85} {'loss': 0.7475, 'learning_rate': 1.243499126529439e-05, 'epoch': 0.85} {'loss': 0.5969, 'learning_rate': 1.2434673765373383e-05, 'epoch': 0.85} {'loss': 0.9016, 'learning_rate': 1.2434356262843407e-05, 'epoch': 0.85} {'loss': 0.8566, 'learning_rate': 1.2434038757704796e-05, 'epoch': 0.85} {'loss': 0.8482, 'learning_rate': 1.2433721249957893e-05, 'epoch': 0.85} {'loss': 0.6791, 'learning_rate': 1.243340373960304e-05, 'epoch': 0.85} {'loss': 0.828, 'learning_rate': 1.2433086226640573e-05, 'epoch': 0.85} {'loss': 0.7428, 'learning_rate': 1.2432768711070835e-05, 'epoch': 0.85} {'loss': 0.7864, 'learning_rate': 1.2432451192894165e-05, 'epoch': 0.85} {'loss': 0.7488, 'learning_rate': 1.2432133672110907e-05, 'epoch': 0.85} {'loss': 0.5735, 'learning_rate': 1.2431816148721393e-05, 'epoch': 0.85} {'loss': 0.861, 'learning_rate': 1.2431498622725972e-05, 'epoch': 0.85} {'loss': 0.8544, 'learning_rate': 1.2431181094124983e-05, 'epoch': 0.85} {'loss': 0.6336, 'learning_rate': 1.2430863562918761e-05, 'epoch': 0.85} {'loss': 0.7392, 'learning_rate': 1.2430546029107648e-05, 'epoch': 0.85} {'loss': 0.8794, 'learning_rate': 1.2430228492691989e-05, 'epoch': 0.85} {'loss': 0.8925, 'learning_rate': 1.242991095367212e-05, 'epoch': 0.85} {'loss': 0.8058, 'learning_rate': 1.2429593412048379e-05, 'epoch': 0.85} {'loss': 0.8551, 'learning_rate': 1.2429275867821116e-05, 'epoch': 0.85} {'loss': 0.7159, 'learning_rate': 1.2428958320990658e-05, 'epoch': 0.85} {'loss': 0.8026, 'learning_rate': 1.2428640771557354e-05, 'epoch': 0.85} {'loss': 0.7751, 'learning_rate': 1.2428323219521543e-05, 'epoch': 0.85} {'loss': 0.7983, 'learning_rate': 1.2428005664883564e-05, 'epoch': 0.85} {'loss': 0.7935, 'learning_rate': 1.2427688107643758e-05, 'epoch': 0.85} {'loss': 0.8082, 'learning_rate': 1.2427370547802467e-05, 'epoch': 0.85} {'loss': 0.8175, 'learning_rate': 1.2427052985360026e-05, 'epoch': 0.85} {'loss': 0.6455, 'learning_rate': 1.2426735420316778e-05, 'epoch': 0.85} {'loss': 0.6967, 'learning_rate': 1.2426417852673067e-05, 'epoch': 0.85} {'loss': 0.7379, 'learning_rate': 1.2426100282429227e-05, 'epoch': 0.85} {'loss': 0.6803, 'learning_rate': 1.2425782709585605e-05, 'epoch': 0.85} {'loss': 0.6444, 'learning_rate': 1.2425465134142539e-05, 'epoch': 0.85} {'loss': 0.7812, 'learning_rate': 1.2425147556100365e-05, 'epoch': 0.85} {'loss': 1.0352, 'learning_rate': 1.2424829975459426e-05, 'epoch': 0.85} {'loss': 0.7929, 'learning_rate': 1.2424512392220065e-05, 'epoch': 0.85} {'loss': 0.8156, 'learning_rate': 1.2424194806382619e-05, 'epoch': 0.85} {'loss': 0.8592, 'learning_rate': 1.2423877217947429e-05, 'epoch': 0.85} {'loss': 0.6118, 'learning_rate': 1.2423559626914838e-05, 'epoch': 0.85} {'loss': 0.9533, 'learning_rate': 1.2423242033285183e-05, 'epoch': 0.85} {'loss': 0.7485, 'learning_rate': 1.2422924437058806e-05, 'epoch': 0.85} {'loss': 0.95, 'learning_rate': 1.2422606838236044e-05, 'epoch': 0.85} {'loss': 0.7715, 'learning_rate': 1.2422289236817242e-05, 'epoch': 0.85} {'loss': 0.8209, 'learning_rate': 1.2421971632802738e-05, 'epoch': 0.85} {'loss': 0.8888, 'learning_rate': 1.2421654026192874e-05, 'epoch': 0.85} {'loss': 0.7051, 'learning_rate': 1.2421336416987988e-05, 'epoch': 0.85} {'loss': 0.7807, 'learning_rate': 1.2421018805188423e-05, 'epoch': 0.85} {'loss': 0.7092, 'learning_rate': 1.2420701190794518e-05, 'epoch': 0.85} {'loss': 0.8455, 'learning_rate': 1.242038357380661e-05, 'epoch': 0.85} {'loss': 0.8732, 'learning_rate': 1.2420065954225044e-05, 'epoch': 0.85} {'loss': 0.7071, 'learning_rate': 1.2419748332050158e-05, 'epoch': 0.85} {'loss': 0.9175, 'learning_rate': 1.2419430707282296e-05, 'epoch': 0.85} {'loss': 0.6924, 'learning_rate': 1.2419113079921794e-05, 'epoch': 0.85} {'loss': 0.7372, 'learning_rate': 1.2418795449968996e-05, 'epoch': 0.85} {'loss': 0.8138, 'learning_rate': 1.2418477817424237e-05, 'epoch': 0.85} {'loss': 0.6233, 'learning_rate': 1.2418160182287865e-05, 'epoch': 0.85} {'loss': 0.8338, 'learning_rate': 1.241784254456021e-05, 'epoch': 0.85} {'loss': 0.8099, 'learning_rate': 1.2417524904241622e-05, 'epoch': 0.85} {'loss': 0.8173, 'learning_rate': 1.241720726133244e-05, 'epoch': 0.85} {'loss': 0.967, 'learning_rate': 1.2416889615832998e-05, 'epoch': 0.85} {'loss': 0.7734, 'learning_rate': 1.2416571967743644e-05, 'epoch': 0.85} {'loss': 0.7836, 'learning_rate': 1.2416254317064716e-05, 'epoch': 0.85} {'loss': 0.7007, 'learning_rate': 1.2415936663796549e-05, 'epoch': 0.85} {'loss': 0.6771, 'learning_rate': 1.241561900793949e-05, 'epoch': 0.85} {'loss': 0.7955, 'learning_rate': 1.2415301349493877e-05, 'epoch': 0.85} {'loss': 0.7605, 'learning_rate': 1.2414983688460052e-05, 'epoch': 0.85} {'loss': 0.6617, 'learning_rate': 1.2414666024838354e-05, 'epoch': 0.85} {'loss': 0.6788, 'learning_rate': 1.2414348358629122e-05, 'epoch': 0.85} {'loss': 0.7875, 'learning_rate': 1.2414030689832696e-05, 'epoch': 0.85} {'loss': 0.6695, 'learning_rate': 1.2413713018449421e-05, 'epoch': 0.85} {'loss': 0.811, 'learning_rate': 1.2413395344479635e-05, 'epoch': 0.85} {'loss': 0.7383, 'learning_rate': 1.2413077667923677e-05, 'epoch': 0.85} {'loss': 0.9122, 'learning_rate': 1.2412759988781889e-05, 'epoch': 0.85} {'loss': 0.6851, 'learning_rate': 1.241244230705461e-05, 'epoch': 0.85} {'loss': 0.7942, 'learning_rate': 1.241212462274218e-05, 'epoch': 0.85} {'loss': 0.82, 'learning_rate': 1.2411806935844943e-05, 'epoch': 0.85} {'loss': 0.8429, 'learning_rate': 1.2411489246363239e-05, 'epoch': 0.85} {'loss': 0.9121, 'learning_rate': 1.2411171554297403e-05, 'epoch': 0.85} {'loss': 0.8059, 'learning_rate': 1.241085385964778e-05, 'epoch': 0.85} {'loss': 0.7993, 'learning_rate': 1.241053616241471e-05, 'epoch': 0.85} {'loss': 0.7904, 'learning_rate': 1.2410218462598533e-05, 'epoch': 0.85} {'loss': 0.7614, 'learning_rate': 1.240990076019959e-05, 'epoch': 0.85} {'loss': 0.8203, 'learning_rate': 1.240958305521822e-05, 'epoch': 0.85} {'loss': 0.7091, 'learning_rate': 1.2409265347654764e-05, 'epoch': 0.85} {'loss': 0.6597, 'learning_rate': 1.2408947637509564e-05, 'epoch': 0.85} {'loss': 0.7798, 'learning_rate': 1.2408629924782956e-05, 'epoch': 0.85} {'loss': 0.749, 'learning_rate': 1.2408312209475285e-05, 'epoch': 0.85} {'loss': 0.8218, 'learning_rate': 1.2407994491586895e-05, 'epoch': 0.85} {'loss': 0.894, 'learning_rate': 1.2407676771118115e-05, 'epoch': 0.85} {'loss': 0.7919, 'learning_rate': 1.2407359048069296e-05, 'epoch': 0.85} {'loss': 0.7853, 'learning_rate': 1.2407041322440774e-05, 'epoch': 0.85} {'loss': 0.7576, 'learning_rate': 1.2406723594232888e-05, 'epoch': 0.85} {'loss': 0.8234, 'learning_rate': 1.240640586344598e-05, 'epoch': 0.85} {'loss': 0.7989, 'learning_rate': 1.2406088130080392e-05, 'epoch': 0.85} {'loss': 0.8976, 'learning_rate': 1.2405770394136465e-05, 'epoch': 0.85} {'loss': 0.7607, 'learning_rate': 1.2405452655614538e-05, 'epoch': 0.85} {'loss': 0.7351, 'learning_rate': 1.240513491451495e-05, 'epoch': 0.85} {'loss': 0.8236, 'learning_rate': 1.2404817170838041e-05, 'epoch': 0.85} {'loss': 0.8212, 'learning_rate': 1.2404499424584155e-05, 'epoch': 0.85} {'loss': 0.7491, 'learning_rate': 1.2404181675753631e-05, 'epoch': 0.85} {'loss': 0.7464, 'learning_rate': 1.2403863924346813e-05, 'epoch': 0.85} {'loss': 0.6866, 'learning_rate': 1.2403546170364031e-05, 'epoch': 0.85} {'loss': 0.6934, 'learning_rate': 1.2403228413805639e-05, 'epoch': 0.85} {'loss': 0.7517, 'learning_rate': 1.2402910654671967e-05, 'epoch': 0.85} {'loss': 0.8315, 'learning_rate': 1.2402592892963358e-05, 'epoch': 0.85} {'loss': 0.7958, 'learning_rate': 1.2402275128680158e-05, 'epoch': 0.85} {'loss': 0.7645, 'learning_rate': 1.2401957361822698e-05, 'epoch': 0.85} {'loss': 0.9239, 'learning_rate': 1.240163959239133e-05, 'epoch': 0.85} {'loss': 0.835, 'learning_rate': 1.2401321820386385e-05, 'epoch': 0.85} {'loss': 0.841, 'learning_rate': 1.2401004045808207e-05, 'epoch': 0.85} {'loss': 0.8492, 'learning_rate': 1.2400686268657136e-05, 'epoch': 0.85} {'loss': 0.7425, 'learning_rate': 1.2400368488933514e-05, 'epoch': 0.85} {'loss': 0.6495, 'learning_rate': 1.240005070663768e-05, 'epoch': 0.85} {'loss': 0.931, 'learning_rate': 1.2399732921769973e-05, 'epoch': 0.85} {'loss': 0.7512, 'learning_rate': 1.2399415134330741e-05, 'epoch': 0.85} {'loss': 0.7724, 'learning_rate': 1.2399097344320317e-05, 'epoch': 0.85} {'loss': 0.8539, 'learning_rate': 1.2398779551739044e-05, 'epoch': 0.85} {'loss': 0.7159, 'learning_rate': 1.2398461756587259e-05, 'epoch': 0.85} {'loss': 0.8825, 'learning_rate': 1.2398143958865308e-05, 'epoch': 0.85} {'loss': 0.8052, 'learning_rate': 1.2397826158573527e-05, 'epoch': 0.85} {'loss': 0.8327, 'learning_rate': 1.2397508355712265e-05, 'epoch': 0.85} {'loss': 0.9372, 'learning_rate': 1.239719055028185e-05, 'epoch': 0.85} {'loss': 0.9129, 'learning_rate': 1.2396872742282632e-05, 'epoch': 0.85} {'loss': 0.8027, 'learning_rate': 1.2396554931714948e-05, 'epoch': 0.85} {'loss': 0.7996, 'learning_rate': 1.2396237118579137e-05, 'epoch': 0.85} {'loss': 0.9634, 'learning_rate': 1.2395919302875542e-05, 'epoch': 0.85} {'loss': 0.8607, 'learning_rate': 1.2395601484604506e-05, 'epoch': 0.85} {'loss': 0.9669, 'learning_rate': 1.2395283663766366e-05, 'epoch': 0.85} {'loss': 0.8988, 'learning_rate': 1.2394965840361463e-05, 'epoch': 0.85} {'loss': 0.6651, 'learning_rate': 1.239464801439014e-05, 'epoch': 0.85} {'loss': 0.8376, 'learning_rate': 1.2394330185852732e-05, 'epoch': 0.85} {'loss': 0.8484, 'learning_rate': 1.2394012354749585e-05, 'epoch': 0.85} {'loss': 0.8391, 'learning_rate': 1.2393694521081037e-05, 'epoch': 0.85} {'loss': 0.7163, 'learning_rate': 1.239337668484743e-05, 'epoch': 0.85} {'loss': 0.7752, 'learning_rate': 1.2393058846049102e-05, 'epoch': 0.85} {'loss': 0.8094, 'learning_rate': 1.2392741004686397e-05, 'epoch': 0.85} {'loss': 0.8696, 'learning_rate': 1.2392423160759655e-05, 'epoch': 0.85} {'loss': 0.8753, 'learning_rate': 1.2392105314269213e-05, 'epoch': 0.85} {'loss': 0.8982, 'learning_rate': 1.2391787465215418e-05, 'epoch': 0.85} {'loss': 0.8392, 'learning_rate': 1.2391469613598605e-05, 'epoch': 0.85} {'loss': 0.6163, 'learning_rate': 1.2391151759419115e-05, 'epoch': 0.85} {'loss': 0.7887, 'learning_rate': 1.2390833902677291e-05, 'epoch': 0.85} {'loss': 0.6938, 'learning_rate': 1.2390516043373472e-05, 'epoch': 0.85} {'loss': 0.7638, 'learning_rate': 1.2390198181508002e-05, 'epoch': 0.85} {'loss': 0.7563, 'learning_rate': 1.2389880317081215e-05, 'epoch': 0.85} {'loss': 0.6896, 'learning_rate': 1.2389562450093457e-05, 'epoch': 0.85} {'loss': 0.8575, 'learning_rate': 1.238924458054507e-05, 'epoch': 0.85} {'loss': 0.8473, 'learning_rate': 1.2388926708436389e-05, 'epoch': 0.85} {'loss': 0.8988, 'learning_rate': 1.2388608833767756e-05, 'epoch': 0.85} {'loss': 0.8703, 'learning_rate': 1.2388290956539517e-05, 'epoch': 0.85} {'loss': 0.9157, 'learning_rate': 1.2387973076752007e-05, 'epoch': 0.85} {'loss': 0.8252, 'learning_rate': 1.2387655194405568e-05, 'epoch': 0.85} {'loss': 0.8006, 'learning_rate': 1.2387337309500542e-05, 'epoch': 0.85} {'loss': 0.5973, 'learning_rate': 1.2387019422037268e-05, 'epoch': 0.85} {'loss': 0.8409, 'learning_rate': 1.2386701532016086e-05, 'epoch': 0.85} {'loss': 0.7266, 'learning_rate': 1.2386383639437336e-05, 'epoch': 0.85} {'loss': 0.7441, 'learning_rate': 1.2386065744301365e-05, 'epoch': 0.85} {'loss': 0.6489, 'learning_rate': 1.2385747846608507e-05, 'epoch': 0.85} {'loss': 0.769, 'learning_rate': 1.2385429946359106e-05, 'epoch': 0.85} {'loss': 0.8081, 'learning_rate': 1.2385112043553503e-05, 'epoch': 0.85} {'loss': 0.6829, 'learning_rate': 1.2384794138192033e-05, 'epoch': 0.85} {'loss': 0.7874, 'learning_rate': 1.2384476230275042e-05, 'epoch': 0.85} {'loss': 0.7807, 'learning_rate': 1.238415831980287e-05, 'epoch': 0.85} {'loss': 0.7428, 'learning_rate': 1.2383840406775858e-05, 'epoch': 0.85} {'loss': 0.7678, 'learning_rate': 1.2383522491194348e-05, 'epoch': 0.85} {'loss': 0.8327, 'learning_rate': 1.2383204573058676e-05, 'epoch': 0.85} {'loss': 0.6789, 'learning_rate': 1.2382886652369183e-05, 'epoch': 0.85} {'loss': 0.7461, 'learning_rate': 1.2382568729126215e-05, 'epoch': 0.85} {'loss': 0.7794, 'learning_rate': 1.2382250803330108e-05, 'epoch': 0.85} {'loss': 0.7183, 'learning_rate': 1.2381932874981204e-05, 'epoch': 0.85} {'loss': 0.9087, 'learning_rate': 1.2381614944079845e-05, 'epoch': 0.85} {'loss': 0.9148, 'learning_rate': 1.2381297010626372e-05, 'epoch': 0.85} {'loss': 0.6671, 'learning_rate': 1.2380979074621122e-05, 'epoch': 0.85} {'loss': 0.7757, 'learning_rate': 1.2380661136064438e-05, 'epoch': 0.85} {'loss': 0.7453, 'learning_rate': 1.238034319495666e-05, 'epoch': 0.85} {'loss': 0.8365, 'learning_rate': 1.2380025251298131e-05, 'epoch': 0.85} {'loss': 0.8442, 'learning_rate': 1.2379707305089193e-05, 'epoch': 0.85} {'loss': 0.8357, 'learning_rate': 1.237938935633018e-05, 'epoch': 0.85} {'loss': 0.7149, 'learning_rate': 1.2379071405021439e-05, 'epoch': 0.85} {'loss': 1.0131, 'learning_rate': 1.2378753451163306e-05, 'epoch': 0.85} {'loss': 0.8806, 'learning_rate': 1.2378435494756123e-05, 'epoch': 0.85} {'loss': 0.7931, 'learning_rate': 1.2378117535800234e-05, 'epoch': 0.85} {'loss': 0.8073, 'learning_rate': 1.2377799574295974e-05, 'epoch': 0.85} {'loss': 0.6891, 'learning_rate': 1.2377481610243694e-05, 'epoch': 0.85} {'loss': 0.9269, 'learning_rate': 1.2377163643643724e-05, 'epoch': 0.85} {'loss': 0.7006, 'learning_rate': 1.2376845674496408e-05, 'epoch': 0.85} {'loss': 0.8217, 'learning_rate': 1.2376527702802088e-05, 'epoch': 0.85} {'loss': 0.9345, 'learning_rate': 1.2376209728561102e-05, 'epoch': 0.85} {'loss': 0.7756, 'learning_rate': 1.2375891751773794e-05, 'epoch': 0.85} {'loss': 0.8068, 'learning_rate': 1.2375573772440504e-05, 'epoch': 0.85} {'loss': 0.9067, 'learning_rate': 1.2375255790561573e-05, 'epoch': 0.85} {'loss': 0.7806, 'learning_rate': 1.2374937806137343e-05, 'epoch': 0.85} {'loss': 0.8964, 'learning_rate': 1.237461981916815e-05, 'epoch': 0.85} {'loss': 0.7597, 'learning_rate': 1.2374301829654336e-05, 'epoch': 0.85} {'loss': 0.9058, 'learning_rate': 1.2373983837596244e-05, 'epoch': 0.85} {'loss': 0.7747, 'learning_rate': 1.2373665842994215e-05, 'epoch': 0.85} {'loss': 0.7585, 'learning_rate': 1.2373347845848591e-05, 'epoch': 0.85} {'loss': 0.9698, 'learning_rate': 1.2373029846159708e-05, 'epoch': 0.85} {'loss': 0.907, 'learning_rate': 1.2372711843927912e-05, 'epoch': 0.85} {'loss': 0.9497, 'learning_rate': 1.2372393839153538e-05, 'epoch': 0.85} {'loss': 0.7193, 'learning_rate': 1.237207583183693e-05, 'epoch': 0.85} {'loss': 0.8363, 'learning_rate': 1.2371757821978429e-05, 'epoch': 0.85} {'loss': 0.7825, 'learning_rate': 1.2371439809578378e-05, 'epoch': 0.85} {'loss': 0.8855, 'learning_rate': 1.2371121794637114e-05, 'epoch': 0.85} {'loss': 0.6969, 'learning_rate': 1.2370803777154976e-05, 'epoch': 0.85} {'loss': 0.8397, 'learning_rate': 1.2370485757132311e-05, 'epoch': 0.85} {'loss': 0.8328, 'learning_rate': 1.2370167734569456e-05, 'epoch': 0.85} {'loss': 0.8252, 'learning_rate': 1.236984970946675e-05, 'epoch': 0.85} {'loss': 0.8074, 'learning_rate': 1.236953168182454e-05, 'epoch': 0.85} {'loss': 0.6639, 'learning_rate': 1.2369213651643159e-05, 'epoch': 0.85} {'loss': 0.9302, 'learning_rate': 1.2368895618922954e-05, 'epoch': 0.85} {'loss': 0.6679, 'learning_rate': 1.2368577583664264e-05, 'epoch': 0.85} {'loss': 0.6761, 'learning_rate': 1.236825954586743e-05, 'epoch': 0.85} {'loss': 0.8295, 'learning_rate': 1.236794150553279e-05, 'epoch': 0.85} {'loss': 0.7848, 'learning_rate': 1.2367623462660688e-05, 'epoch': 0.85} {'loss': 0.6533, 'learning_rate': 1.2367305417251464e-05, 'epoch': 0.85} {'loss': 0.7007, 'learning_rate': 1.2366987369305457e-05, 'epoch': 0.85} {'loss': 0.7329, 'learning_rate': 1.236666931882301e-05, 'epoch': 0.85} {'loss': 0.7912, 'learning_rate': 1.2366351265804463e-05, 'epoch': 0.85} {'loss': 0.745, 'learning_rate': 1.2366033210250159e-05, 'epoch': 0.85} {'loss': 0.8863, 'learning_rate': 1.2365715152160433e-05, 'epoch': 0.85} {'loss': 0.7576, 'learning_rate': 1.2365397091535636e-05, 'epoch': 0.85} {'loss': 0.9409, 'learning_rate': 1.2365079028376097e-05, 'epoch': 0.85} {'loss': 0.763, 'learning_rate': 1.2364760962682163e-05, 'epoch': 0.85} {'loss': 0.9476, 'learning_rate': 1.2364442894454176e-05, 'epoch': 0.85} {'loss': 0.9126, 'learning_rate': 1.2364124823692476e-05, 'epoch': 0.85} {'loss': 0.8298, 'learning_rate': 1.2363806750397401e-05, 'epoch': 0.85} {'loss': 0.8675, 'learning_rate': 1.2363488674569296e-05, 'epoch': 0.85} {'loss': 0.8762, 'learning_rate': 1.2363170596208496e-05, 'epoch': 0.85} {'loss': 0.9269, 'learning_rate': 1.2362852515315347e-05, 'epoch': 0.85} {'loss': 0.7446, 'learning_rate': 1.2362534431890187e-05, 'epoch': 0.85} {'loss': 0.882, 'learning_rate': 1.2362216345933357e-05, 'epoch': 0.85} {'loss': 0.7298, 'learning_rate': 1.2361898257445204e-05, 'epoch': 0.85} {'loss': 0.7755, 'learning_rate': 1.236158016642606e-05, 'epoch': 0.85} {'loss': 0.6366, 'learning_rate': 1.2361262072876273e-05, 'epoch': 0.85} {'loss': 0.8016, 'learning_rate': 1.2360943976796179e-05, 'epoch': 0.85} {'loss': 1.0086, 'learning_rate': 1.236062587818612e-05, 'epoch': 0.85} {'loss': 0.7467, 'learning_rate': 1.2360307777046435e-05, 'epoch': 0.85} {'loss': 0.7969, 'learning_rate': 1.2359989673377468e-05, 'epoch': 0.85} {'loss': 0.831, 'learning_rate': 1.2359671567179564e-05, 'epoch': 0.85} {'loss': 0.8163, 'learning_rate': 1.2359353458453056e-05, 'epoch': 0.85} {'loss': 0.6867, 'learning_rate': 1.2359035347198286e-05, 'epoch': 0.85} {'loss': 0.8408, 'learning_rate': 1.2358717233415598e-05, 'epoch': 0.85} {'loss': 0.9264, 'learning_rate': 1.2358399117105331e-05, 'epoch': 0.85} {'loss': 0.775, 'learning_rate': 1.2358080998267825e-05, 'epoch': 0.85} {'loss': 0.8728, 'learning_rate': 1.2357762876903425e-05, 'epoch': 0.85} {'loss': 0.7216, 'learning_rate': 1.2357444753012468e-05, 'epoch': 0.85} {'loss': 0.6741, 'learning_rate': 1.23571266265953e-05, 'epoch': 0.85} {'loss': 0.8422, 'learning_rate': 1.2356808497652255e-05, 'epoch': 0.85} {'loss': 0.7135, 'learning_rate': 1.2356490366183675e-05, 'epoch': 0.85} {'loss': 0.7599, 'learning_rate': 1.2356172232189905e-05, 'epoch': 0.85} {'loss': 1.0472, 'learning_rate': 1.2355854095671283e-05, 'epoch': 0.85} {'loss': 0.7722, 'learning_rate': 1.2355535956628153e-05, 'epoch': 0.85} {'loss': 0.8367, 'learning_rate': 1.2355217815060852e-05, 'epoch': 0.85} {'loss': 0.8329, 'learning_rate': 1.2354899670969722e-05, 'epoch': 0.85} {'loss': 0.6048, 'learning_rate': 1.2354581524355106e-05, 'epoch': 0.85} {'loss': 0.7978, 'learning_rate': 1.2354263375217342e-05, 'epoch': 0.85} {'loss': 0.7322, 'learning_rate': 1.235394522355677e-05, 'epoch': 0.85} {'loss': 0.8621, 'learning_rate': 1.2353627069373735e-05, 'epoch': 0.85} {'loss': 0.8301, 'learning_rate': 1.235330891266858e-05, 'epoch': 0.85} {'loss': 0.84, 'learning_rate': 1.2352990753441639e-05, 'epoch': 0.85} {'loss': 0.8012, 'learning_rate': 1.2352672591693256e-05, 'epoch': 0.85} {'loss': 0.6892, 'learning_rate': 1.2352354427423772e-05, 'epoch': 0.85} {'loss': 0.7457, 'learning_rate': 1.2352036260633527e-05, 'epoch': 0.85} {'loss': 0.8536, 'learning_rate': 1.2351718091322864e-05, 'epoch': 0.85} {'loss': 0.9105, 'learning_rate': 1.2351399919492124e-05, 'epoch': 0.85} {'loss': 0.7769, 'learning_rate': 1.2351081745141644e-05, 'epoch': 0.85} {'loss': 0.9533, 'learning_rate': 1.2350763568271771e-05, 'epoch': 0.85} {'loss': 0.8786, 'learning_rate': 1.235044538888284e-05, 'epoch': 0.85} {'loss': 0.7297, 'learning_rate': 1.2350127206975195e-05, 'epoch': 0.85} {'loss': 0.7554, 'learning_rate': 1.2349809022549177e-05, 'epoch': 0.85} {'loss': 0.7034, 'learning_rate': 1.2349490835605126e-05, 'epoch': 0.85} {'loss': 0.7473, 'learning_rate': 1.2349172646143385e-05, 'epoch': 0.85} {'loss': 0.6779, 'learning_rate': 1.2348854454164291e-05, 'epoch': 0.85} {'loss': 0.8367, 'learning_rate': 1.2348536259668191e-05, 'epoch': 0.85} {'loss': 0.8147, 'learning_rate': 1.234821806265542e-05, 'epoch': 0.85} {'loss': 0.809, 'learning_rate': 1.2347899863126322e-05, 'epoch': 0.85} {'loss': 0.7783, 'learning_rate': 1.2347581661081236e-05, 'epoch': 0.85} {'loss': 0.8037, 'learning_rate': 1.234726345652051e-05, 'epoch': 0.85} {'loss': 0.6921, 'learning_rate': 1.2346945249444473e-05, 'epoch': 0.85} {'loss': 0.7404, 'learning_rate': 1.2346627039853473e-05, 'epoch': 0.85} {'loss': 0.8167, 'learning_rate': 1.2346308827747853e-05, 'epoch': 0.85} {'loss': 0.6974, 'learning_rate': 1.234599061312795e-05, 'epoch': 0.85} {'loss': 0.8767, 'learning_rate': 1.2345672395994106e-05, 'epoch': 0.85} {'loss': 0.9689, 'learning_rate': 1.2345354176346662e-05, 'epoch': 0.85} {'loss': 0.7522, 'learning_rate': 1.234503595418596e-05, 'epoch': 0.85} {'loss': 0.7876, 'learning_rate': 1.234471772951234e-05, 'epoch': 0.85} {'loss': 0.8017, 'learning_rate': 1.2344399502326142e-05, 'epoch': 0.85} {'loss': 0.9877, 'learning_rate': 1.2344081272627712e-05, 'epoch': 0.85} {'loss': 0.7975, 'learning_rate': 1.2343763040417384e-05, 'epoch': 0.85} {'loss': 0.7668, 'learning_rate': 1.2343444805695506e-05, 'epoch': 0.85} {'loss': 0.7234, 'learning_rate': 1.2343126568462413e-05, 'epoch': 0.85} {'loss': 0.6515, 'learning_rate': 1.2342808328718447e-05, 'epoch': 0.85} {'loss': 0.7938, 'learning_rate': 1.2342490086463951e-05, 'epoch': 0.85} {'loss': 0.7039, 'learning_rate': 1.2342171841699266e-05, 'epoch': 0.85} {'loss': 0.8889, 'learning_rate': 1.2341853594424735e-05, 'epoch': 0.85} {'loss': 0.6876, 'learning_rate': 1.2341535344640696e-05, 'epoch': 0.85} {'loss': 0.804, 'learning_rate': 1.2341217092347489e-05, 'epoch': 0.85} {'loss': 0.717, 'learning_rate': 1.2340898837545453e-05, 'epoch': 0.85} {'loss': 0.9414, 'learning_rate': 1.2340580580234938e-05, 'epoch': 0.85} {'loss': 0.7468, 'learning_rate': 1.2340262320416276e-05, 'epoch': 0.85} {'loss': 0.9402, 'learning_rate': 1.2339944058089815e-05, 'epoch': 0.85} {'loss': 0.8123, 'learning_rate': 1.2339625793255889e-05, 'epoch': 0.85} {'loss': 0.7207, 'learning_rate': 1.2339307525914847e-05, 'epoch': 0.85} {'loss': 0.7572, 'learning_rate': 1.2338989256067025e-05, 'epoch': 0.85} {'loss': 0.9122, 'learning_rate': 1.2338670983712761e-05, 'epoch': 0.85} {'loss': 0.7468, 'learning_rate': 1.2338352708852404e-05, 'epoch': 0.85} {'loss': 0.819, 'learning_rate': 1.2338034431486287e-05, 'epoch': 0.85} {'loss': 0.7355, 'learning_rate': 1.233771615161476e-05, 'epoch': 0.85} {'loss': 0.7638, 'learning_rate': 1.233739786923816e-05, 'epoch': 0.85} {'loss': 0.8441, 'learning_rate': 1.2337079584356824e-05, 'epoch': 0.85} {'loss': 0.7, 'learning_rate': 1.2336761296971093e-05, 'epoch': 0.85} {'loss': 0.6693, 'learning_rate': 1.2336443007081316e-05, 'epoch': 0.85} {'loss': 0.8152, 'learning_rate': 1.2336124714687826e-05, 'epoch': 0.85} {'loss': 0.8437, 'learning_rate': 1.233580641979097e-05, 'epoch': 0.85} {'loss': 0.8097, 'learning_rate': 1.2335488122391088e-05, 'epoch': 0.85} {'loss': 0.9002, 'learning_rate': 1.233516982248852e-05, 'epoch': 0.85} {'loss': 0.7129, 'learning_rate': 1.2334851520083604e-05, 'epoch': 0.85} {'loss': 0.8947, 'learning_rate': 1.2334533215176684e-05, 'epoch': 0.85} {'loss': 0.8674, 'learning_rate': 1.2334214907768101e-05, 'epoch': 0.85} {'loss': 0.8066, 'learning_rate': 1.2333896597858197e-05, 'epoch': 0.85} {'loss': 0.634, 'learning_rate': 1.233357828544731e-05, 'epoch': 0.85} {'loss': 0.7594, 'learning_rate': 1.2333259970535788e-05, 'epoch': 0.85} {'loss': 0.7405, 'learning_rate': 1.2332941653123964e-05, 'epoch': 0.85} {'loss': 0.6777, 'learning_rate': 1.2332623333212184e-05, 'epoch': 0.85} {'loss': 0.6349, 'learning_rate': 1.2332305010800784e-05, 'epoch': 0.85} {'loss': 0.6779, 'learning_rate': 1.2331986685890111e-05, 'epoch': 0.85} {'loss': 0.956, 'learning_rate': 1.2331668358480505e-05, 'epoch': 0.85} {'loss': 0.8552, 'learning_rate': 1.2331350028572304e-05, 'epoch': 0.85} {'loss': 0.6741, 'learning_rate': 1.2331031696165852e-05, 'epoch': 0.85} {'loss': 0.9518, 'learning_rate': 1.2330713361261491e-05, 'epoch': 0.85} {'loss': 0.8072, 'learning_rate': 1.2330395023859559e-05, 'epoch': 0.85} {'loss': 0.7405, 'learning_rate': 1.2330076683960394e-05, 'epoch': 0.85} {'loss': 0.8168, 'learning_rate': 1.2329758341564346e-05, 'epoch': 0.85} {'loss': 0.8366, 'learning_rate': 1.2329439996671752e-05, 'epoch': 0.85} {'loss': 0.705, 'learning_rate': 1.232912164928295e-05, 'epoch': 0.85} {'loss': 0.9659, 'learning_rate': 1.2328803299398286e-05, 'epoch': 0.85} {'loss': 0.7899, 'learning_rate': 1.23284849470181e-05, 'epoch': 0.85} {'loss': 0.8344, 'learning_rate': 1.2328166592142733e-05, 'epoch': 0.85} {'loss': 0.7086, 'learning_rate': 1.2327848234772519e-05, 'epoch': 0.85} {'loss': 0.7361, 'learning_rate': 1.2327529874907813e-05, 'epoch': 0.85} {'loss': 0.697, 'learning_rate': 1.2327211512548945e-05, 'epoch': 0.85} {'loss': 0.7901, 'learning_rate': 1.2326893147696259e-05, 'epoch': 0.85} {'loss': 0.9703, 'learning_rate': 1.23265747803501e-05, 'epoch': 0.85} {'loss': 0.8783, 'learning_rate': 1.2326256410510803e-05, 'epoch': 0.85} {'loss': 0.8274, 'learning_rate': 1.2325938038178713e-05, 'epoch': 0.85} {'loss': 0.7843, 'learning_rate': 1.232561966335417e-05, 'epoch': 0.85} {'loss': 0.6953, 'learning_rate': 1.2325301286037519e-05, 'epoch': 0.85} {'loss': 0.7851, 'learning_rate': 1.2324982906229096e-05, 'epoch': 0.85} {'loss': 0.7431, 'learning_rate': 1.2324664523929242e-05, 'epoch': 0.85} {'loss': 0.77, 'learning_rate': 1.2324346139138303e-05, 'epoch': 0.85} {'loss': 0.6802, 'learning_rate': 1.2324027751856615e-05, 'epoch': 0.85} {'loss': 0.9142, 'learning_rate': 1.2323709362084523e-05, 'epoch': 0.85} {'loss': 0.8506, 'learning_rate': 1.232339096982237e-05, 'epoch': 0.85} {'loss': 0.7849, 'learning_rate': 1.2323072575070487e-05, 'epoch': 0.85} {'loss': 0.5082, 'learning_rate': 1.2322754177829223e-05, 'epoch': 0.85} {'loss': 0.8498, 'learning_rate': 1.2322435778098922e-05, 'epoch': 0.85} {'loss': 0.8174, 'learning_rate': 1.232211737587992e-05, 'epoch': 0.85} {'loss': 0.8725, 'learning_rate': 1.232179897117256e-05, 'epoch': 0.85} {'loss': 0.793, 'learning_rate': 1.2321480563977183e-05, 'epoch': 0.85} {'loss': 0.7828, 'learning_rate': 1.2321162154294128e-05, 'epoch': 0.85} {'loss': 0.986, 'learning_rate': 1.232084374212374e-05, 'epoch': 0.85} {'loss': 0.8309, 'learning_rate': 1.2320525327466358e-05, 'epoch': 0.85} {'loss': 0.7723, 'learning_rate': 1.2320206910322323e-05, 'epoch': 0.85} {'loss': 0.7239, 'learning_rate': 1.2319888490691981e-05, 'epoch': 0.85} {'loss': 0.9369, 'learning_rate': 1.2319570068575663e-05, 'epoch': 0.85} {'loss': 0.767, 'learning_rate': 1.2319251643973722e-05, 'epoch': 0.85} {'loss': 0.7877, 'learning_rate': 1.2318933216886488e-05, 'epoch': 0.85} {'loss': 0.7335, 'learning_rate': 1.2318614787314312e-05, 'epoch': 0.85} {'loss': 0.7444, 'learning_rate': 1.2318296355257528e-05, 'epoch': 0.85} {'loss': 0.8265, 'learning_rate': 1.2317977920716482e-05, 'epoch': 0.85} {'loss': 0.8126, 'learning_rate': 1.2317659483691514e-05, 'epoch': 0.85} {'loss': 0.7313, 'learning_rate': 1.2317341044182965e-05, 'epoch': 0.85} {'loss': 0.5798, 'learning_rate': 1.2317022602191173e-05, 'epoch': 0.85} {'loss': 0.8751, 'learning_rate': 1.2316704157716484e-05, 'epoch': 0.85} {'loss': 0.6918, 'learning_rate': 1.2316385710759236e-05, 'epoch': 0.85} {'loss': 0.6936, 'learning_rate': 1.2316067261319773e-05, 'epoch': 0.85} {'loss': 0.657, 'learning_rate': 1.2315748809398436e-05, 'epoch': 0.85} {'loss': 1.0233, 'learning_rate': 1.2315430354995563e-05, 'epoch': 0.85} {'loss': 0.8622, 'learning_rate': 1.23151118981115e-05, 'epoch': 0.85} {'loss': 0.8228, 'learning_rate': 1.2314793438746584e-05, 'epoch': 0.85} {'loss': 0.7464, 'learning_rate': 1.2314474976901156e-05, 'epoch': 0.85} {'loss': 0.8664, 'learning_rate': 1.2314156512575562e-05, 'epoch': 0.85} {'loss': 0.921, 'learning_rate': 1.2313838045770136e-05, 'epoch': 0.85} {'loss': 0.8059, 'learning_rate': 1.2313519576485232e-05, 'epoch': 0.85} {'loss': 0.8023, 'learning_rate': 1.2313201104721177e-05, 'epoch': 0.85} {'loss': 0.8319, 'learning_rate': 1.231288263047832e-05, 'epoch': 0.85} {'loss': 0.7624, 'learning_rate': 1.2312564153756998e-05, 'epoch': 0.86} {'loss': 0.6636, 'learning_rate': 1.2312245674557558e-05, 'epoch': 0.86} {'loss': 0.9216, 'learning_rate': 1.2311927192880336e-05, 'epoch': 0.86} {'loss': 0.9035, 'learning_rate': 1.2311608708725675e-05, 'epoch': 0.86} {'loss': 0.833, 'learning_rate': 1.2311290222093919e-05, 'epoch': 0.86} {'loss': 0.7735, 'learning_rate': 1.2310971732985406e-05, 'epoch': 0.86} {'loss': 0.8018, 'learning_rate': 1.2310653241400479e-05, 'epoch': 0.86} {'loss': 0.8638, 'learning_rate': 1.2310334747339476e-05, 'epoch': 0.86} {'loss': 0.8377, 'learning_rate': 1.2310016250802742e-05, 'epoch': 0.86} {'loss': 0.767, 'learning_rate': 1.2309697751790615e-05, 'epoch': 0.86} {'loss': 0.6254, 'learning_rate': 1.2309379250303444e-05, 'epoch': 0.86} {'loss': 0.9521, 'learning_rate': 1.230906074634156e-05, 'epoch': 0.86} {'loss': 0.8707, 'learning_rate': 1.2308742239905312e-05, 'epoch': 0.86} {'loss': 0.76, 'learning_rate': 1.2308423730995036e-05, 'epoch': 0.86} {'loss': 0.7432, 'learning_rate': 1.2308105219611074e-05, 'epoch': 0.86} {'loss': 0.8682, 'learning_rate': 1.230778670575377e-05, 'epoch': 0.86} {'loss': 0.669, 'learning_rate': 1.2307468189423468e-05, 'epoch': 0.86} {'loss': 0.7715, 'learning_rate': 1.2307149670620501e-05, 'epoch': 0.86} {'loss': 0.6959, 'learning_rate': 1.2306831149345217e-05, 'epoch': 0.86} {'loss': 0.7156, 'learning_rate': 1.2306512625597958e-05, 'epoch': 0.86} {'loss': 0.7003, 'learning_rate': 1.2306194099379058e-05, 'epoch': 0.86} {'loss': 0.8569, 'learning_rate': 1.2305875570688865e-05, 'epoch': 0.86} {'loss': 0.8786, 'learning_rate': 1.2305557039527716e-05, 'epoch': 0.86} {'loss': 0.8909, 'learning_rate': 1.2305238505895958e-05, 'epoch': 0.86} {'loss': 0.7749, 'learning_rate': 1.2304919969793927e-05, 'epoch': 0.86} {'loss': 0.6572, 'learning_rate': 1.2304601431221965e-05, 'epoch': 0.86} {'loss': 0.6634, 'learning_rate': 1.2304282890180419e-05, 'epoch': 0.86} {'loss': 0.7176, 'learning_rate': 1.230396434666962e-05, 'epoch': 0.86} {'loss': 0.9194, 'learning_rate': 1.2303645800689918e-05, 'epoch': 0.86} {'loss': 0.7424, 'learning_rate': 1.2303327252241655e-05, 'epoch': 0.86} {'loss': 0.7075, 'learning_rate': 1.2303008701325165e-05, 'epoch': 0.86} {'loss': 0.8246, 'learning_rate': 1.2302690147940792e-05, 'epoch': 0.86} {'loss': 0.709, 'learning_rate': 1.2302371592088881e-05, 'epoch': 0.86} {'loss': 0.8616, 'learning_rate': 1.2302053033769772e-05, 'epoch': 0.86} {'loss': 0.66, 'learning_rate': 1.2301734472983803e-05, 'epoch': 0.86} {'loss': 0.8303, 'learning_rate': 1.230141590973132e-05, 'epoch': 0.86} {'loss': 0.8223, 'learning_rate': 1.2301097344012662e-05, 'epoch': 0.86} {'loss': 0.5822, 'learning_rate': 1.2300778775828168e-05, 'epoch': 0.86} {'loss': 0.5582, 'learning_rate': 1.2300460205178184e-05, 'epoch': 0.86} {'loss': 0.7929, 'learning_rate': 1.230014163206305e-05, 'epoch': 0.86} {'loss': 0.652, 'learning_rate': 1.2299823056483105e-05, 'epoch': 0.86} {'loss': 0.6885, 'learning_rate': 1.2299504478438694e-05, 'epoch': 0.86} {'loss': 0.7382, 'learning_rate': 1.2299185897930152e-05, 'epoch': 0.86} {'loss': 0.7111, 'learning_rate': 1.2298867314957827e-05, 'epoch': 0.86} {'loss': 0.6557, 'learning_rate': 1.229854872952206e-05, 'epoch': 0.86} {'loss': 0.7274, 'learning_rate': 1.2298230141623186e-05, 'epoch': 0.86} {'loss': 0.6407, 'learning_rate': 1.2297911551261556e-05, 'epoch': 0.86} {'loss': 0.9335, 'learning_rate': 1.2297592958437506e-05, 'epoch': 0.86} {'loss': 0.838, 'learning_rate': 1.2297274363151377e-05, 'epoch': 0.86} {'loss': 0.9984, 'learning_rate': 1.2296955765403511e-05, 'epoch': 0.86} {'loss': 1.0155, 'learning_rate': 1.2296637165194247e-05, 'epoch': 0.86} {'loss': 0.8783, 'learning_rate': 1.2296318562523932e-05, 'epoch': 0.86} {'loss': 0.7582, 'learning_rate': 1.2295999957392903e-05, 'epoch': 0.86} {'loss': 0.684, 'learning_rate': 1.2295681349801505e-05, 'epoch': 0.86} {'loss': 1.0458, 'learning_rate': 1.2295362739750077e-05, 'epoch': 0.86} {'loss': 0.9111, 'learning_rate': 1.2295044127238957e-05, 'epoch': 0.86} {'loss': 0.7409, 'learning_rate': 1.2294725512268492e-05, 'epoch': 0.86} {'loss': 0.7871, 'learning_rate': 1.2294406894839021e-05, 'epoch': 0.86} {'loss': 0.7469, 'learning_rate': 1.2294088274950888e-05, 'epoch': 0.86} {'loss': 0.8559, 'learning_rate': 1.229376965260443e-05, 'epoch': 0.86} {'loss': 0.701, 'learning_rate': 1.2293451027799993e-05, 'epoch': 0.86} {'loss': 0.8186, 'learning_rate': 1.2293132400537917e-05, 'epoch': 0.86} {'loss': 0.784, 'learning_rate': 1.2292813770818541e-05, 'epoch': 0.86} {'loss': 0.6937, 'learning_rate': 1.2292495138642206e-05, 'epoch': 0.86} {'loss': 0.9254, 'learning_rate': 1.2292176504009259e-05, 'epoch': 0.86} {'loss': 0.8889, 'learning_rate': 1.2291857866920035e-05, 'epoch': 0.86} {'loss': 0.8654, 'learning_rate': 1.229153922737488e-05, 'epoch': 0.86} {'loss': 0.8392, 'learning_rate': 1.2291220585374136e-05, 'epoch': 0.86} {'loss': 0.857, 'learning_rate': 1.229090194091814e-05, 'epoch': 0.86} {'loss': 0.5896, 'learning_rate': 1.2290583294007234e-05, 'epoch': 0.86} {'loss': 0.762, 'learning_rate': 1.2290264644641763e-05, 'epoch': 0.86} {'loss': 0.8484, 'learning_rate': 1.2289945992822068e-05, 'epoch': 0.86} {'loss': 0.7086, 'learning_rate': 1.2289627338548487e-05, 'epoch': 0.86} {'loss': 0.9801, 'learning_rate': 1.2289308681821366e-05, 'epoch': 0.86} {'loss': 0.8873, 'learning_rate': 1.2288990022641045e-05, 'epoch': 0.86} {'loss': 0.748, 'learning_rate': 1.2288671361007862e-05, 'epoch': 0.86} {'loss': 0.7363, 'learning_rate': 1.228835269692216e-05, 'epoch': 0.86} {'loss': 0.6528, 'learning_rate': 1.2288034030384284e-05, 'epoch': 0.86} {'loss': 0.9662, 'learning_rate': 1.228771536139457e-05, 'epoch': 0.86} {'loss': 0.8762, 'learning_rate': 1.2287396689953367e-05, 'epoch': 0.86} {'loss': 0.8167, 'learning_rate': 1.228707801606101e-05, 'epoch': 0.86} {'loss': 0.7776, 'learning_rate': 1.2286759339717842e-05, 'epoch': 0.86} {'loss': 0.8731, 'learning_rate': 1.2286440660924206e-05, 'epoch': 0.86} {'loss': 0.832, 'learning_rate': 1.2286121979680441e-05, 'epoch': 0.86} {'loss': 0.8067, 'learning_rate': 1.2285803295986888e-05, 'epoch': 0.86} {'loss': 0.7625, 'learning_rate': 1.2285484609843895e-05, 'epoch': 0.86} {'loss': 0.8723, 'learning_rate': 1.2285165921251797e-05, 'epoch': 0.86} {'loss': 0.7898, 'learning_rate': 1.2284847230210936e-05, 'epoch': 0.86} {'loss': 0.9699, 'learning_rate': 1.2284528536721659e-05, 'epoch': 0.86} {'loss': 0.8473, 'learning_rate': 1.22842098407843e-05, 'epoch': 0.86} {'loss': 0.7293, 'learning_rate': 1.2283891142399205e-05, 'epoch': 0.86} {'loss': 0.9191, 'learning_rate': 1.2283572441566714e-05, 'epoch': 0.86} {'loss': 0.7677, 'learning_rate': 1.228325373828717e-05, 'epoch': 0.86} {'loss': 0.9714, 'learning_rate': 1.2282935032560912e-05, 'epoch': 0.86} {'loss': 0.7385, 'learning_rate': 1.2282616324388283e-05, 'epoch': 0.86} {'loss': 0.8794, 'learning_rate': 1.228229761376963e-05, 'epoch': 0.86} {'loss': 0.9912, 'learning_rate': 1.2281978900705283e-05, 'epoch': 0.86} {'loss': 0.6536, 'learning_rate': 1.228166018519559e-05, 'epoch': 0.86} {'loss': 0.8681, 'learning_rate': 1.2281341467240895e-05, 'epoch': 0.86} {'loss': 0.7905, 'learning_rate': 1.2281022746841535e-05, 'epoch': 0.86} {'loss': 0.6378, 'learning_rate': 1.2280704023997853e-05, 'epoch': 0.86} {'loss': 0.7751, 'learning_rate': 1.2280385298710191e-05, 'epoch': 0.86} {'loss': 0.7998, 'learning_rate': 1.2280066570978892e-05, 'epoch': 0.86} {'loss': 0.8418, 'learning_rate': 1.2279747840804294e-05, 'epoch': 0.86} {'loss': 0.6904, 'learning_rate': 1.2279429108186742e-05, 'epoch': 0.86} {'loss': 0.7909, 'learning_rate': 1.2279110373126575e-05, 'epoch': 0.86} {'loss': 0.6061, 'learning_rate': 1.2278791635624134e-05, 'epoch': 0.86} {'loss': 0.7777, 'learning_rate': 1.2278472895679763e-05, 'epoch': 0.86} {'loss': 0.7772, 'learning_rate': 1.2278154153293805e-05, 'epoch': 0.86} {'loss': 0.7483, 'learning_rate': 1.2277835408466596e-05, 'epoch': 0.86} {'loss': 0.8502, 'learning_rate': 1.2277516661198483e-05, 'epoch': 0.86} {'loss': 0.7921, 'learning_rate': 1.2277197911489807e-05, 'epoch': 0.86} {'loss': 0.6963, 'learning_rate': 1.2276879159340904e-05, 'epoch': 0.86} {'loss': 0.6519, 'learning_rate': 1.227656040475212e-05, 'epoch': 0.86} {'loss': 1.0248, 'learning_rate': 1.2276241647723796e-05, 'epoch': 0.86} {'loss': 0.7191, 'learning_rate': 1.2275922888256278e-05, 'epoch': 0.86} {'loss': 0.7712, 'learning_rate': 1.2275604126349898e-05, 'epoch': 0.86} {'loss': 0.9127, 'learning_rate': 1.2275285362005005e-05, 'epoch': 0.86} {'loss': 0.7645, 'learning_rate': 1.2274966595221938e-05, 'epoch': 0.86} {'loss': 0.7302, 'learning_rate': 1.2274647826001037e-05, 'epoch': 0.86} {'loss': 0.8611, 'learning_rate': 1.2274329054342649e-05, 'epoch': 0.86} {'loss': 0.8503, 'learning_rate': 1.227401028024711e-05, 'epoch': 0.86} {'loss': 0.6561, 'learning_rate': 1.2273691503714767e-05, 'epoch': 0.86} {'loss': 0.7975, 'learning_rate': 1.2273372724745955e-05, 'epoch': 0.86} {'loss': 0.7948, 'learning_rate': 1.227305394334102e-05, 'epoch': 0.86} {'loss': 0.7839, 'learning_rate': 1.2272735159500301e-05, 'epoch': 0.86} {'loss': 0.6201, 'learning_rate': 1.2272416373224143e-05, 'epoch': 0.86} {'loss': 0.8695, 'learning_rate': 1.2272097584512884e-05, 'epoch': 0.86} {'loss': 0.8028, 'learning_rate': 1.2271778793366869e-05, 'epoch': 0.86} {'loss': 0.7518, 'learning_rate': 1.2271459999786437e-05, 'epoch': 0.86} {'loss': 0.7895, 'learning_rate': 1.2271141203771935e-05, 'epoch': 0.86} {'loss': 0.7237, 'learning_rate': 1.2270822405323695e-05, 'epoch': 0.86} {'loss': 0.947, 'learning_rate': 1.2270503604442063e-05, 'epoch': 0.86} {'loss': 0.7609, 'learning_rate': 1.2270184801127383e-05, 'epoch': 0.86} {'loss': 1.0341, 'learning_rate': 1.2269865995379996e-05, 'epoch': 0.86} {'loss': 0.8645, 'learning_rate': 1.2269547187200241e-05, 'epoch': 0.86} {'loss': 0.8975, 'learning_rate': 1.2269228376588464e-05, 'epoch': 0.86} {'loss': 0.8388, 'learning_rate': 1.2268909563545006e-05, 'epoch': 0.86} {'loss': 0.7011, 'learning_rate': 1.2268590748070201e-05, 'epoch': 0.86} {'loss': 0.6848, 'learning_rate': 1.22682719301644e-05, 'epoch': 0.86} {'loss': 0.8261, 'learning_rate': 1.2267953109827938e-05, 'epoch': 0.86} {'loss': 0.6072, 'learning_rate': 1.226763428706116e-05, 'epoch': 0.86} {'loss': 0.8154, 'learning_rate': 1.2267315461864411e-05, 'epoch': 0.86} {'loss': 0.769, 'learning_rate': 1.2266996634238024e-05, 'epoch': 0.86} {'loss': 0.9081, 'learning_rate': 1.226667780418235e-05, 'epoch': 0.86} {'loss': 0.8832, 'learning_rate': 1.2266358971697723e-05, 'epoch': 0.86} {'loss': 0.7121, 'learning_rate': 1.2266040136784488e-05, 'epoch': 0.86} {'loss': 0.7944, 'learning_rate': 1.2265721299442987e-05, 'epoch': 0.86} {'loss': 0.8473, 'learning_rate': 1.2265402459673564e-05, 'epoch': 0.86} {'loss': 0.7867, 'learning_rate': 1.2265083617476552e-05, 'epoch': 0.86} {'loss': 0.8335, 'learning_rate': 1.2264764772852302e-05, 'epoch': 0.86} {'loss': 0.8253, 'learning_rate': 1.2264445925801152e-05, 'epoch': 0.86} {'loss': 0.794, 'learning_rate': 1.2264127076323444e-05, 'epoch': 0.86} {'loss': 0.7991, 'learning_rate': 1.2263808224419517e-05, 'epoch': 0.86} {'loss': 0.8179, 'learning_rate': 1.2263489370089717e-05, 'epoch': 0.86} {'loss': 0.9192, 'learning_rate': 1.2263170513334386e-05, 'epoch': 0.86} {'loss': 0.5981, 'learning_rate': 1.226285165415386e-05, 'epoch': 0.86} {'loss': 0.6716, 'learning_rate': 1.2262532792548487e-05, 'epoch': 0.86} {'loss': 0.9018, 'learning_rate': 1.2262213928518604e-05, 'epoch': 0.86} {'loss': 0.8015, 'learning_rate': 1.2261895062064555e-05, 'epoch': 0.86} {'loss': 0.7955, 'learning_rate': 1.2261576193186681e-05, 'epoch': 0.86} {'loss': 0.7472, 'learning_rate': 1.2261257321885327e-05, 'epoch': 0.86} {'loss': 0.6011, 'learning_rate': 1.2260938448160828e-05, 'epoch': 0.86} {'loss': 0.8627, 'learning_rate': 1.226061957201353e-05, 'epoch': 0.86} {'loss': 0.787, 'learning_rate': 1.2260300693443777e-05, 'epoch': 0.86} {'loss': 0.67, 'learning_rate': 1.2259981812451905e-05, 'epoch': 0.86} {'loss': 0.848, 'learning_rate': 1.2259662929038256e-05, 'epoch': 0.86} {'loss': 0.688, 'learning_rate': 1.2259344043203178e-05, 'epoch': 0.86} {'loss': 0.7797, 'learning_rate': 1.225902515494701e-05, 'epoch': 0.86} {'loss': 0.7612, 'learning_rate': 1.2258706264270088e-05, 'epoch': 0.86} {'loss': 0.6713, 'learning_rate': 1.2258387371172762e-05, 'epoch': 0.86} {'loss': 0.7898, 'learning_rate': 1.225806847565537e-05, 'epoch': 0.86} {'loss': 0.7379, 'learning_rate': 1.2257749577718253e-05, 'epoch': 0.86} {'loss': 0.8424, 'learning_rate': 1.2257430677361754e-05, 'epoch': 0.86} {'loss': 0.8114, 'learning_rate': 1.2257111774586214e-05, 'epoch': 0.86} {'loss': 0.7856, 'learning_rate': 1.2256792869391973e-05, 'epoch': 0.86} {'loss': 0.7448, 'learning_rate': 1.2256473961779379e-05, 'epoch': 0.86} {'loss': 0.8784, 'learning_rate': 1.2256155051748766e-05, 'epoch': 0.86} {'loss': 0.9315, 'learning_rate': 1.2255836139300481e-05, 'epoch': 0.86} {'loss': 0.86, 'learning_rate': 1.2255517224434864e-05, 'epoch': 0.86} {'loss': 0.7989, 'learning_rate': 1.2255198307152257e-05, 'epoch': 0.86} {'loss': 0.7631, 'learning_rate': 1.2254879387453e-05, 'epoch': 0.86} {'loss': 0.87, 'learning_rate': 1.2254560465337435e-05, 'epoch': 0.86} {'loss': 0.7076, 'learning_rate': 1.2254241540805906e-05, 'epoch': 0.86} {'loss': 0.6825, 'learning_rate': 1.2253922613858754e-05, 'epoch': 0.86} {'loss': 0.7542, 'learning_rate': 1.2253603684496322e-05, 'epoch': 0.86} {'loss': 0.8474, 'learning_rate': 1.2253284752718952e-05, 'epoch': 0.86} {'loss': 0.9252, 'learning_rate': 1.225296581852698e-05, 'epoch': 0.86} {'loss': 0.8763, 'learning_rate': 1.2252646881920753e-05, 'epoch': 0.86} {'loss': 0.7322, 'learning_rate': 1.225232794290061e-05, 'epoch': 0.86} {'loss': 0.7268, 'learning_rate': 1.2252009001466895e-05, 'epoch': 0.86} {'loss': 0.7746, 'learning_rate': 1.225169005761995e-05, 'epoch': 0.86} {'loss': 0.7883, 'learning_rate': 1.2251371111360118e-05, 'epoch': 0.86} {'loss': 0.8934, 'learning_rate': 1.2251052162687738e-05, 'epoch': 0.86} {'loss': 0.895, 'learning_rate': 1.225073321160315e-05, 'epoch': 0.86} {'loss': 0.8972, 'learning_rate': 1.2250414258106698e-05, 'epoch': 0.86} {'loss': 0.7028, 'learning_rate': 1.2250095302198726e-05, 'epoch': 0.86} {'loss': 0.6924, 'learning_rate': 1.2249776343879571e-05, 'epoch': 0.86} {'loss': 0.8873, 'learning_rate': 1.2249457383149581e-05, 'epoch': 0.86} {'loss': 0.6887, 'learning_rate': 1.2249138420009095e-05, 'epoch': 0.86} {'loss': 0.7119, 'learning_rate': 1.2248819454458452e-05, 'epoch': 0.86} {'loss': 0.8257, 'learning_rate': 1.2248500486497994e-05, 'epoch': 0.86} {'loss': 0.8152, 'learning_rate': 1.2248181516128068e-05, 'epoch': 0.86} {'loss': 0.9228, 'learning_rate': 1.224786254334901e-05, 'epoch': 0.86} {'loss': 0.8735, 'learning_rate': 1.2247543568161166e-05, 'epoch': 0.86} {'loss': 0.8182, 'learning_rate': 1.2247224590564877e-05, 'epoch': 0.86} {'loss': 0.863, 'learning_rate': 1.2246905610560484e-05, 'epoch': 0.86} {'loss': 0.9136, 'learning_rate': 1.224658662814833e-05, 'epoch': 0.86} {'loss': 0.5872, 'learning_rate': 1.224626764332875e-05, 'epoch': 0.86} {'loss': 0.8831, 'learning_rate': 1.2245948656102096e-05, 'epoch': 0.86} {'loss': 0.7778, 'learning_rate': 1.2245629666468704e-05, 'epoch': 0.86} {'loss': 0.8376, 'learning_rate': 1.2245310674428919e-05, 'epoch': 0.86} {'loss': 0.8848, 'learning_rate': 1.2244991679983079e-05, 'epoch': 0.86} {'loss': 0.786, 'learning_rate': 1.2244672683131528e-05, 'epoch': 0.86} {'loss': 0.7277, 'learning_rate': 1.2244353683874609e-05, 'epoch': 0.86} {'loss': 0.76, 'learning_rate': 1.224403468221266e-05, 'epoch': 0.86} {'loss': 0.8284, 'learning_rate': 1.2243715678146026e-05, 'epoch': 0.86} {'loss': 0.823, 'learning_rate': 1.2243396671675051e-05, 'epoch': 0.86} {'loss': 0.6939, 'learning_rate': 1.2243077662800071e-05, 'epoch': 0.86} {'loss': 0.8662, 'learning_rate': 1.2242758651521432e-05, 'epoch': 0.86} {'loss': 0.7481, 'learning_rate': 1.2242439637839475e-05, 'epoch': 0.86} {'loss': 0.8391, 'learning_rate': 1.224212062175454e-05, 'epoch': 0.86} {'loss': 0.851, 'learning_rate': 1.2241801603266971e-05, 'epoch': 0.86} {'loss': 0.7179, 'learning_rate': 1.2241482582377109e-05, 'epoch': 0.86} {'loss': 0.8047, 'learning_rate': 1.2241163559085299e-05, 'epoch': 0.86} {'loss': 0.7436, 'learning_rate': 1.2240844533391875e-05, 'epoch': 0.86} {'loss': 0.979, 'learning_rate': 1.2240525505297187e-05, 'epoch': 0.86} {'loss': 0.6581, 'learning_rate': 1.2240206474801574e-05, 'epoch': 0.86} {'loss': 0.7988, 'learning_rate': 1.2239887441905378e-05, 'epoch': 0.86} {'loss': 0.9472, 'learning_rate': 1.2239568406608937e-05, 'epoch': 0.86} {'loss': 0.7284, 'learning_rate': 1.22392493689126e-05, 'epoch': 0.86} {'loss': 0.8049, 'learning_rate': 1.2238930328816706e-05, 'epoch': 0.86} {'loss': 0.6115, 'learning_rate': 1.2238611286321592e-05, 'epoch': 0.86} {'loss': 0.6809, 'learning_rate': 1.2238292241427608e-05, 'epoch': 0.86} {'loss': 0.9715, 'learning_rate': 1.2237973194135086e-05, 'epoch': 0.86} {'loss': 0.6177, 'learning_rate': 1.2237654144444378e-05, 'epoch': 0.86} {'loss': 0.8157, 'learning_rate': 1.2237335092355822e-05, 'epoch': 0.86} {'loss': 0.7348, 'learning_rate': 1.2237016037869758e-05, 'epoch': 0.86} {'loss': 0.611, 'learning_rate': 1.2236696980986529e-05, 'epoch': 0.86} {'loss': 1.0644, 'learning_rate': 1.223637792170648e-05, 'epoch': 0.86} {'loss': 0.8462, 'learning_rate': 1.223605886002995e-05, 'epoch': 0.86} {'loss': 0.6744, 'learning_rate': 1.2235739795957278e-05, 'epoch': 0.86} {'loss': 0.7144, 'learning_rate': 1.2235420729488809e-05, 'epoch': 0.86} {'loss': 0.7434, 'learning_rate': 1.2235101660624889e-05, 'epoch': 0.86} {'loss': 0.8771, 'learning_rate': 1.2234782589365853e-05, 'epoch': 0.86} {'loss': 0.9254, 'learning_rate': 1.2234463515712042e-05, 'epoch': 0.86} {'loss': 0.6857, 'learning_rate': 1.2234144439663807e-05, 'epoch': 0.86} {'loss': 0.7014, 'learning_rate': 1.2233825361221486e-05, 'epoch': 0.86} {'loss': 0.6341, 'learning_rate': 1.2233506280385414e-05, 'epoch': 0.86} {'loss': 0.8199, 'learning_rate': 1.2233187197155944e-05, 'epoch': 0.86} {'loss': 0.6511, 'learning_rate': 1.2232868111533409e-05, 'epoch': 0.86} {'loss': 1.0337, 'learning_rate': 1.2232549023518154e-05, 'epoch': 0.86} {'loss': 0.8281, 'learning_rate': 1.2232229933110521e-05, 'epoch': 0.86} {'loss': 0.7587, 'learning_rate': 1.2231910840310853e-05, 'epoch': 0.86} {'loss': 0.7718, 'learning_rate': 1.2231591745119493e-05, 'epoch': 0.86} {'loss': 0.8127, 'learning_rate': 1.223127264753678e-05, 'epoch': 0.86} {'loss': 0.6252, 'learning_rate': 1.2230953547563056e-05, 'epoch': 0.86} {'loss': 0.5524, 'learning_rate': 1.2230634445198663e-05, 'epoch': 0.86} {'loss': 0.7067, 'learning_rate': 1.2230315340443946e-05, 'epoch': 0.86} {'loss': 0.8227, 'learning_rate': 1.2229996233299244e-05, 'epoch': 0.86} {'loss': 0.6431, 'learning_rate': 1.2229677123764898e-05, 'epoch': 0.86} {'loss': 0.7283, 'learning_rate': 1.2229358011841255e-05, 'epoch': 0.86} {'loss': 0.7014, 'learning_rate': 1.2229038897528654e-05, 'epoch': 0.86} {'loss': 0.885, 'learning_rate': 1.2228719780827433e-05, 'epoch': 0.86} {'loss': 0.764, 'learning_rate': 1.222840066173794e-05, 'epoch': 0.86} {'loss': 0.8188, 'learning_rate': 1.2228081540260513e-05, 'epoch': 0.86} {'loss': 0.805, 'learning_rate': 1.2227762416395496e-05, 'epoch': 0.86} {'loss': 0.7745, 'learning_rate': 1.2227443290143233e-05, 'epoch': 0.86} {'loss': 0.8475, 'learning_rate': 1.2227124161504061e-05, 'epoch': 0.86} {'loss': 0.6593, 'learning_rate': 1.2226805030478326e-05, 'epoch': 0.86} {'loss': 0.7299, 'learning_rate': 1.2226485897066366e-05, 'epoch': 0.86} {'loss': 0.8018, 'learning_rate': 1.2226166761268527e-05, 'epoch': 0.86} {'loss': 0.8171, 'learning_rate': 1.2225847623085147e-05, 'epoch': 0.86} {'loss': 0.715, 'learning_rate': 1.2225528482516574e-05, 'epoch': 0.86} {'loss': 0.7801, 'learning_rate': 1.2225209339563144e-05, 'epoch': 0.86} {'loss': 0.9564, 'learning_rate': 1.2224890194225205e-05, 'epoch': 0.86} {'loss': 0.8629, 'learning_rate': 1.2224571046503094e-05, 'epoch': 0.86} {'loss': 0.9167, 'learning_rate': 1.222425189639715e-05, 'epoch': 0.86} {'loss': 0.7033, 'learning_rate': 1.2223932743907722e-05, 'epoch': 0.86} {'loss': 0.8991, 'learning_rate': 1.2223613589035148e-05, 'epoch': 0.86} {'loss': 0.8365, 'learning_rate': 1.2223294431779775e-05, 'epoch': 0.86} {'loss': 0.7971, 'learning_rate': 1.222297527214194e-05, 'epoch': 0.86} {'loss': 0.7434, 'learning_rate': 1.2222656110121986e-05, 'epoch': 0.86} {'loss': 0.785, 'learning_rate': 1.2222336945720254e-05, 'epoch': 0.86} {'loss': 0.6757, 'learning_rate': 1.2222017778937088e-05, 'epoch': 0.86} {'loss': 0.8205, 'learning_rate': 1.222169860977283e-05, 'epoch': 0.86} {'loss': 0.7693, 'learning_rate': 1.222137943822782e-05, 'epoch': 0.86} {'loss': 0.8108, 'learning_rate': 1.2221060264302404e-05, 'epoch': 0.86} {'loss': 0.6815, 'learning_rate': 1.2220741087996922e-05, 'epoch': 0.86} {'loss': 0.6563, 'learning_rate': 1.2220421909311712e-05, 'epoch': 0.86} {'loss': 0.8871, 'learning_rate': 1.2220102728247123e-05, 'epoch': 0.86} {'loss': 0.7212, 'learning_rate': 1.221978354480349e-05, 'epoch': 0.86} {'loss': 0.697, 'learning_rate': 1.2219464358981159e-05, 'epoch': 0.86} {'loss': 0.7918, 'learning_rate': 1.2219145170780475e-05, 'epoch': 0.86} {'loss': 0.7809, 'learning_rate': 1.2218825980201774e-05, 'epoch': 0.86} {'loss': 0.7494, 'learning_rate': 1.22185067872454e-05, 'epoch': 0.86} {'loss': 0.7942, 'learning_rate': 1.22181875919117e-05, 'epoch': 0.86} {'loss': 0.81, 'learning_rate': 1.2217868394201007e-05, 'epoch': 0.86} {'loss': 0.7656, 'learning_rate': 1.221754919411367e-05, 'epoch': 0.86} {'loss': 0.7897, 'learning_rate': 1.221722999165003e-05, 'epoch': 0.86} {'loss': 0.895, 'learning_rate': 1.2216910786810425e-05, 'epoch': 0.86} {'loss': 0.6394, 'learning_rate': 1.22165915795952e-05, 'epoch': 0.86} {'loss': 0.7029, 'learning_rate': 1.2216272370004698e-05, 'epoch': 0.86} {'loss': 0.8967, 'learning_rate': 1.2215953158039264e-05, 'epoch': 0.86} {'loss': 0.8403, 'learning_rate': 1.2215633943699233e-05, 'epoch': 0.86} {'loss': 0.8257, 'learning_rate': 1.2215314726984951e-05, 'epoch': 0.86} {'loss': 0.8138, 'learning_rate': 1.2214995507896756e-05, 'epoch': 0.86} {'loss': 0.7388, 'learning_rate': 1.2214676286434997e-05, 'epoch': 0.86} {'loss': 0.9051, 'learning_rate': 1.2214357062600009e-05, 'epoch': 0.86} {'loss': 0.695, 'learning_rate': 1.2214037836392141e-05, 'epoch': 0.86} {'loss': 0.6974, 'learning_rate': 1.2213718607811731e-05, 'epoch': 0.86} {'loss': 0.8198, 'learning_rate': 1.221339937685912e-05, 'epoch': 0.86} {'loss': 0.5264, 'learning_rate': 1.2213080143534654e-05, 'epoch': 0.86} {'loss': 0.73, 'learning_rate': 1.2212760907838673e-05, 'epoch': 0.86} {'loss': 0.8304, 'learning_rate': 1.2212441669771517e-05, 'epoch': 0.86} {'loss': 0.8049, 'learning_rate': 1.2212122429333531e-05, 'epoch': 0.86} {'loss': 0.7683, 'learning_rate': 1.2211803186525058e-05, 'epoch': 0.86} {'loss': 0.8795, 'learning_rate': 1.2211483941346434e-05, 'epoch': 0.86} {'loss': 0.9053, 'learning_rate': 1.221116469379801e-05, 'epoch': 0.86} {'loss': 0.6926, 'learning_rate': 1.221084544388012e-05, 'epoch': 0.86} {'loss': 0.6415, 'learning_rate': 1.221052619159311e-05, 'epoch': 0.86} {'loss': 0.8084, 'learning_rate': 1.2210206936937321e-05, 'epoch': 0.86} {'loss': 0.8653, 'learning_rate': 1.2209887679913097e-05, 'epoch': 0.86} {'loss': 0.753, 'learning_rate': 1.220956842052078e-05, 'epoch': 0.86} {'loss': 0.8405, 'learning_rate': 1.2209249158760712e-05, 'epoch': 0.86} {'loss': 0.81, 'learning_rate': 1.2208929894633233e-05, 'epoch': 0.86} {'loss': 0.8292, 'learning_rate': 1.2208610628138684e-05, 'epoch': 0.86} {'loss': 0.8275, 'learning_rate': 1.2208291359277409e-05, 'epoch': 0.86} {'loss': 0.8772, 'learning_rate': 1.2207972088049753e-05, 'epoch': 0.86} {'loss': 0.9075, 'learning_rate': 1.2207652814456055e-05, 'epoch': 0.86} {'loss': 0.8511, 'learning_rate': 1.2207333538496657e-05, 'epoch': 0.86} {'loss': 0.8154, 'learning_rate': 1.2207014260171906e-05, 'epoch': 0.86} {'loss': 0.7137, 'learning_rate': 1.2206694979482134e-05, 'epoch': 0.86} {'loss': 0.9303, 'learning_rate': 1.2206375696427693e-05, 'epoch': 0.86} {'loss': 0.8778, 'learning_rate': 1.220605641100892e-05, 'epoch': 0.86} {'loss': 0.7994, 'learning_rate': 1.2205737123226155e-05, 'epoch': 0.86} {'loss': 0.658, 'learning_rate': 1.220541783307975e-05, 'epoch': 0.86} {'loss': 0.7652, 'learning_rate': 1.2205098540570038e-05, 'epoch': 0.86} {'loss': 0.9005, 'learning_rate': 1.2204779245697364e-05, 'epoch': 0.86} {'loss': 0.8848, 'learning_rate': 1.220445994846207e-05, 'epoch': 0.86} {'loss': 0.8546, 'learning_rate': 1.2204140648864497e-05, 'epoch': 0.86} {'loss': 0.8183, 'learning_rate': 1.2203821346904989e-05, 'epoch': 0.86} {'loss': 0.7647, 'learning_rate': 1.2203502042583888e-05, 'epoch': 0.86} {'loss': 0.8122, 'learning_rate': 1.2203182735901538e-05, 'epoch': 0.86} {'loss': 0.8412, 'learning_rate': 1.2202863426858276e-05, 'epoch': 0.86} {'loss': 0.9173, 'learning_rate': 1.2202544115454447e-05, 'epoch': 0.86} {'loss': 0.8485, 'learning_rate': 1.2202224801690395e-05, 'epoch': 0.86} {'loss': 0.7203, 'learning_rate': 1.2201905485566456e-05, 'epoch': 0.86} {'loss': 0.7962, 'learning_rate': 1.220158616708298e-05, 'epoch': 0.86} {'loss': 0.7986, 'learning_rate': 1.2201266846240307e-05, 'epoch': 0.86} {'loss': 0.8562, 'learning_rate': 1.2200947523038775e-05, 'epoch': 0.86} {'loss': 0.8406, 'learning_rate': 1.2200628197478731e-05, 'epoch': 0.86} {'loss': 0.7968, 'learning_rate': 1.2200308869560516e-05, 'epoch': 0.86} {'loss': 0.8181, 'learning_rate': 1.219998953928447e-05, 'epoch': 0.86} {'loss': 0.8483, 'learning_rate': 1.2199670206650934e-05, 'epoch': 0.86} {'loss': 0.7763, 'learning_rate': 1.2199350871660254e-05, 'epoch': 0.86} {'loss': 0.9658, 'learning_rate': 1.2199031534312775e-05, 'epoch': 0.86} {'loss': 0.8014, 'learning_rate': 1.2198712194608833e-05, 'epoch': 0.86} {'loss': 0.8576, 'learning_rate': 1.2198392852548773e-05, 'epoch': 0.86} {'loss': 0.8869, 'learning_rate': 1.2198073508132934e-05, 'epoch': 0.86} {'loss': 0.7837, 'learning_rate': 1.2197754161361663e-05, 'epoch': 0.86} {'loss': 0.7904, 'learning_rate': 1.2197434812235298e-05, 'epoch': 0.86} {'loss': 0.9046, 'learning_rate': 1.2197115460754188e-05, 'epoch': 0.86} {'loss': 0.8314, 'learning_rate': 1.2196796106918667e-05, 'epoch': 0.86} {'loss': 0.5794, 'learning_rate': 1.219647675072908e-05, 'epoch': 0.86} {'loss': 0.8107, 'learning_rate': 1.2196157392185773e-05, 'epoch': 0.86} {'loss': 0.702, 'learning_rate': 1.2195838031289082e-05, 'epoch': 0.86} {'loss': 0.9761, 'learning_rate': 1.2195518668039352e-05, 'epoch': 0.86} {'loss': 0.8502, 'learning_rate': 1.219519930243693e-05, 'epoch': 0.86} {'loss': 0.8032, 'learning_rate': 1.2194879934482148e-05, 'epoch': 0.86} {'loss': 0.8701, 'learning_rate': 1.2194560564175357e-05, 'epoch': 0.86} {'loss': 0.6653, 'learning_rate': 1.2194241191516895e-05, 'epoch': 0.86} {'loss': 0.7672, 'learning_rate': 1.219392181650711e-05, 'epoch': 0.86} {'loss': 0.8093, 'learning_rate': 1.2193602439146336e-05, 'epoch': 0.86} {'loss': 0.751, 'learning_rate': 1.2193283059434919e-05, 'epoch': 0.86} {'loss': 0.8619, 'learning_rate': 1.2192963677373204e-05, 'epoch': 0.86} {'loss': 0.695, 'learning_rate': 1.2192644292961526e-05, 'epoch': 0.86} {'loss': 0.7116, 'learning_rate': 1.2192324906200234e-05, 'epoch': 0.86} {'loss': 0.668, 'learning_rate': 1.2192005517089667e-05, 'epoch': 0.86} {'loss': 0.792, 'learning_rate': 1.219168612563017e-05, 'epoch': 0.86} {'loss': 0.7607, 'learning_rate': 1.2191366731822082e-05, 'epoch': 0.86} {'loss': 0.9224, 'learning_rate': 1.2191047335665751e-05, 'epoch': 0.86} {'loss': 0.6949, 'learning_rate': 1.219072793716151e-05, 'epoch': 0.86} {'loss': 0.7261, 'learning_rate': 1.2190408536309708e-05, 'epoch': 0.86} {'loss': 0.7111, 'learning_rate': 1.2190089133110686e-05, 'epoch': 0.86} {'loss': 0.8284, 'learning_rate': 1.2189769727564786e-05, 'epoch': 0.86} {'loss': 0.7713, 'learning_rate': 1.218945031967235e-05, 'epoch': 0.86} {'loss': 0.7286, 'learning_rate': 1.2189130909433719e-05, 'epoch': 0.86} {'loss': 0.6254, 'learning_rate': 1.2188811496849238e-05, 'epoch': 0.86} {'loss': 0.7447, 'learning_rate': 1.2188492081919245e-05, 'epoch': 0.86} {'loss': 0.8976, 'learning_rate': 1.2188172664644088e-05, 'epoch': 0.86} {'loss': 0.6982, 'learning_rate': 1.2187853245024106e-05, 'epoch': 0.86} {'loss': 0.8277, 'learning_rate': 1.2187533823059643e-05, 'epoch': 0.86} {'loss': 0.8886, 'learning_rate': 1.2187214398751039e-05, 'epoch': 0.86} {'loss': 0.8971, 'learning_rate': 1.2186894972098638e-05, 'epoch': 0.86} {'loss': 0.8038, 'learning_rate': 1.2186575543102782e-05, 'epoch': 0.86} {'loss': 0.7441, 'learning_rate': 1.218625611176381e-05, 'epoch': 0.86} {'loss': 0.9198, 'learning_rate': 1.2185936678082068e-05, 'epoch': 0.86} {'loss': 0.7884, 'learning_rate': 1.2185617242057898e-05, 'epoch': 0.86} {'loss': 0.8716, 'learning_rate': 1.2185297803691642e-05, 'epoch': 0.86} {'loss': 0.5778, 'learning_rate': 1.2184978362983646e-05, 'epoch': 0.86} {'loss': 0.6679, 'learning_rate': 1.2184658919934244e-05, 'epoch': 0.86} {'loss': 0.9755, 'learning_rate': 1.2184339474543783e-05, 'epoch': 0.86} {'loss': 0.6281, 'learning_rate': 1.2184020026812606e-05, 'epoch': 0.86} {'loss': 0.8498, 'learning_rate': 1.2183700576741052e-05, 'epoch': 0.86} {'loss': 0.7609, 'learning_rate': 1.218338112432947e-05, 'epoch': 0.86} {'loss': 0.6406, 'learning_rate': 1.2183061669578198e-05, 'epoch': 0.86} {'loss': 0.7669, 'learning_rate': 1.2182742212487577e-05, 'epoch': 0.86} {'loss': 0.8171, 'learning_rate': 1.218242275305795e-05, 'epoch': 0.86} {'loss': 0.8246, 'learning_rate': 1.218210329128966e-05, 'epoch': 0.86} {'loss': 0.8681, 'learning_rate': 1.218178382718305e-05, 'epoch': 0.86} {'loss': 0.6927, 'learning_rate': 1.2181464360738459e-05, 'epoch': 0.86} {'loss': 0.9007, 'learning_rate': 1.2181144891956239e-05, 'epoch': 0.86} {'loss': 0.7354, 'learning_rate': 1.218082542083672e-05, 'epoch': 0.86} {'loss': 0.7659, 'learning_rate': 1.218050594738025e-05, 'epoch': 0.86} {'loss': 0.8853, 'learning_rate': 1.2180186471587171e-05, 'epoch': 0.86} {'loss': 0.9736, 'learning_rate': 1.2179866993457827e-05, 'epoch': 0.86} {'loss': 0.8892, 'learning_rate': 1.2179547512992558e-05, 'epoch': 0.86} {'loss': 0.8009, 'learning_rate': 1.2179228030191705e-05, 'epoch': 0.86} {'loss': 0.8293, 'learning_rate': 1.2178908545055617e-05, 'epoch': 0.86} {'loss': 0.7641, 'learning_rate': 1.2178589057584629e-05, 'epoch': 0.86} {'loss': 0.7514, 'learning_rate': 1.2178269567779087e-05, 'epoch': 0.86} {'loss': 1.0073, 'learning_rate': 1.2177950075639332e-05, 'epoch': 0.86} {'loss': 0.9611, 'learning_rate': 1.2177630581165708e-05, 'epoch': 0.86} {'loss': 0.8381, 'learning_rate': 1.2177311084358552e-05, 'epoch': 0.86} {'loss': 0.6399, 'learning_rate': 1.2176991585218217e-05, 'epoch': 0.86} {'loss': 0.813, 'learning_rate': 1.2176672083745036e-05, 'epoch': 0.86} {'loss': 0.7509, 'learning_rate': 1.2176352579939352e-05, 'epoch': 0.86} {'loss': 0.8751, 'learning_rate': 1.2176033073801513e-05, 'epoch': 0.86} {'loss': 0.9027, 'learning_rate': 1.2175713565331857e-05, 'epoch': 0.86} {'loss': 0.7747, 'learning_rate': 1.217539405453073e-05, 'epoch': 0.86} {'loss': 0.6798, 'learning_rate': 1.2175074541398471e-05, 'epoch': 0.86} {'loss': 0.8252, 'learning_rate': 1.2174755025935421e-05, 'epoch': 0.86} {'loss': 0.7296, 'learning_rate': 1.2174435508141925e-05, 'epoch': 0.86} {'loss': 0.8775, 'learning_rate': 1.2174115988018327e-05, 'epoch': 0.86} {'loss': 0.573, 'learning_rate': 1.2173796465564967e-05, 'epoch': 0.86} {'loss': 0.7846, 'learning_rate': 1.2173476940782185e-05, 'epoch': 0.86} {'loss': 0.7392, 'learning_rate': 1.2173157413670329e-05, 'epoch': 0.86} {'loss': 0.7097, 'learning_rate': 1.217283788422974e-05, 'epoch': 0.86} {'loss': 0.753, 'learning_rate': 1.2172518352460757e-05, 'epoch': 0.86} {'loss': 0.8175, 'learning_rate': 1.2172198818363723e-05, 'epoch': 0.86} {'loss': 0.8256, 'learning_rate': 1.2171879281938988e-05, 'epoch': 0.86} {'loss': 0.9617, 'learning_rate': 1.2171559743186882e-05, 'epoch': 0.86} {'loss': 0.7328, 'learning_rate': 1.2171240202107754e-05, 'epoch': 0.86} {'loss': 0.9157, 'learning_rate': 1.217092065870195e-05, 'epoch': 0.86} {'loss': 0.5556, 'learning_rate': 1.2170601112969807e-05, 'epoch': 0.86} {'loss': 0.7611, 'learning_rate': 1.2170281564911667e-05, 'epoch': 0.86} {'loss': 0.7954, 'learning_rate': 1.2169962014527877e-05, 'epoch': 0.86} {'loss': 0.7765, 'learning_rate': 1.2169642461818776e-05, 'epoch': 0.86} {'loss': 0.6517, 'learning_rate': 1.2169322906784707e-05, 'epoch': 0.86} {'loss': 0.8559, 'learning_rate': 1.2169003349426014e-05, 'epoch': 0.86} {'loss': 0.6769, 'learning_rate': 1.2168683789743036e-05, 'epoch': 0.86} {'loss': 0.8457, 'learning_rate': 1.2168364227736121e-05, 'epoch': 0.86} {'loss': 0.6876, 'learning_rate': 1.2168044663405603e-05, 'epoch': 0.86} {'loss': 0.7642, 'learning_rate': 1.2167725096751832e-05, 'epoch': 0.86} {'loss': 0.6666, 'learning_rate': 1.2167405527775149e-05, 'epoch': 0.86} {'loss': 0.7813, 'learning_rate': 1.2167085956475897e-05, 'epoch': 0.86} {'loss': 0.7319, 'learning_rate': 1.2166766382854414e-05, 'epoch': 0.86} {'loss': 0.5021, 'learning_rate': 1.2166446806911043e-05, 'epoch': 0.86} {'loss': 0.7817, 'learning_rate': 1.2166127228646132e-05, 'epoch': 0.86} {'loss': 0.7947, 'learning_rate': 1.2165807648060018e-05, 'epoch': 0.86} {'loss': 0.7059, 'learning_rate': 1.2165488065153045e-05, 'epoch': 0.86} {'loss': 0.8067, 'learning_rate': 1.2165168479925562e-05, 'epoch': 0.86} {'loss': 0.5906, 'learning_rate': 1.2164848892377903e-05, 'epoch': 0.86} {'loss': 0.7063, 'learning_rate': 1.216452930251041e-05, 'epoch': 0.86} {'loss': 0.7766, 'learning_rate': 1.216420971032343e-05, 'epoch': 0.86} {'loss': 0.76, 'learning_rate': 1.2163890115817303e-05, 'epoch': 0.86} {'loss': 0.8185, 'learning_rate': 1.2163570518992374e-05, 'epoch': 0.86} {'loss': 0.8254, 'learning_rate': 1.2163250919848984e-05, 'epoch': 0.86} {'loss': 0.675, 'learning_rate': 1.2162931318387474e-05, 'epoch': 0.86} {'loss': 0.9035, 'learning_rate': 1.216261171460819e-05, 'epoch': 0.86} {'loss': 0.7774, 'learning_rate': 1.2162292108511472e-05, 'epoch': 0.86} {'loss': 0.7694, 'learning_rate': 1.216197250009766e-05, 'epoch': 0.86} {'loss': 0.7358, 'learning_rate': 1.2161652889367101e-05, 'epoch': 0.86} {'loss': 0.7813, 'learning_rate': 1.2161333276320135e-05, 'epoch': 0.86} {'loss': 0.7787, 'learning_rate': 1.2161013660957108e-05, 'epoch': 0.86} {'loss': 0.6106, 'learning_rate': 1.2160694043278361e-05, 'epoch': 0.86} {'loss': 0.6219, 'learning_rate': 1.2160374423284231e-05, 'epoch': 0.86} {'loss': 0.7834, 'learning_rate': 1.2160054800975065e-05, 'epoch': 0.86} {'loss': 0.6894, 'learning_rate': 1.2159735176351206e-05, 'epoch': 0.86} {'loss': 0.7366, 'learning_rate': 1.2159415549412997e-05, 'epoch': 0.86} {'loss': 0.7375, 'learning_rate': 1.2159095920160778e-05, 'epoch': 0.87} {'loss': 0.9786, 'learning_rate': 1.2158776288594895e-05, 'epoch': 0.87} {'loss': 0.7551, 'learning_rate': 1.2158456654715689e-05, 'epoch': 0.87} {'loss': 0.7505, 'learning_rate': 1.2158137018523498e-05, 'epoch': 0.87} {'loss': 0.8849, 'learning_rate': 1.2157817380018671e-05, 'epoch': 0.87} {'loss': 0.7939, 'learning_rate': 1.2157497739201547e-05, 'epoch': 0.87} {'loss': 0.9185, 'learning_rate': 1.2157178096072468e-05, 'epoch': 0.87} {'loss': 0.665, 'learning_rate': 1.2156858450631781e-05, 'epoch': 0.87} {'loss': 0.832, 'learning_rate': 1.2156538802879825e-05, 'epoch': 0.87} {'loss': 0.8184, 'learning_rate': 1.2156219152816944e-05, 'epoch': 0.87} {'loss': 0.5272, 'learning_rate': 1.2155899500443476e-05, 'epoch': 0.87} {'loss': 0.861, 'learning_rate': 1.2155579845759769e-05, 'epoch': 0.87} {'loss': 0.8823, 'learning_rate': 1.2155260188766162e-05, 'epoch': 0.87} {'loss': 0.7665, 'learning_rate': 1.2154940529463001e-05, 'epoch': 0.87} {'loss': 0.9651, 'learning_rate': 1.2154620867850629e-05, 'epoch': 0.87} {'loss': 0.7464, 'learning_rate': 1.2154301203929382e-05, 'epoch': 0.87} {'loss': 0.7423, 'learning_rate': 1.215398153769961e-05, 'epoch': 0.87} {'loss': 0.7402, 'learning_rate': 1.2153661869161651e-05, 'epoch': 0.87} {'loss': 0.8744, 'learning_rate': 1.2153342198315847e-05, 'epoch': 0.87} {'loss': 0.7084, 'learning_rate': 1.2153022525162545e-05, 'epoch': 0.87} {'loss': 0.8463, 'learning_rate': 1.2152702849702085e-05, 'epoch': 0.87} {'loss': 0.6856, 'learning_rate': 1.2152383171934808e-05, 'epoch': 0.87} {'loss': 0.7007, 'learning_rate': 1.2152063491861059e-05, 'epoch': 0.87} {'loss': 0.8053, 'learning_rate': 1.2151743809481182e-05, 'epoch': 0.87} {'loss': 0.885, 'learning_rate': 1.2151424124795515e-05, 'epoch': 0.87} {'loss': 0.852, 'learning_rate': 1.2151104437804402e-05, 'epoch': 0.87} {'loss': 0.8046, 'learning_rate': 1.215078474850819e-05, 'epoch': 0.87} {'loss': 0.7869, 'learning_rate': 1.2150465056907213e-05, 'epoch': 0.87} {'loss': 0.7201, 'learning_rate': 1.2150145363001821e-05, 'epoch': 0.87} {'loss': 0.8443, 'learning_rate': 1.2149825666792356e-05, 'epoch': 0.87} {'loss': 0.895, 'learning_rate': 1.2149505968279156e-05, 'epoch': 0.87} {'loss': 0.6909, 'learning_rate': 1.2149186267462566e-05, 'epoch': 0.87} {'loss': 0.8502, 'learning_rate': 1.2148866564342932e-05, 'epoch': 0.87} {'loss': 0.6517, 'learning_rate': 1.2148546858920592e-05, 'epoch': 0.87} {'loss': 0.728, 'learning_rate': 1.2148227151195888e-05, 'epoch': 0.87} {'loss': 0.8767, 'learning_rate': 1.2147907441169167e-05, 'epoch': 0.87} {'loss': 0.6785, 'learning_rate': 1.214758772884077e-05, 'epoch': 0.87} {'loss': 0.7906, 'learning_rate': 1.2147268014211038e-05, 'epoch': 0.87} {'loss': 0.8996, 'learning_rate': 1.2146948297280316e-05, 'epoch': 0.87} {'loss': 0.8654, 'learning_rate': 1.2146628578048942e-05, 'epoch': 0.87} {'loss': 0.8619, 'learning_rate': 1.2146308856517264e-05, 'epoch': 0.87} {'loss': 0.823, 'learning_rate': 1.2145989132685621e-05, 'epoch': 0.87} {'loss': 0.6385, 'learning_rate': 1.2145669406554357e-05, 'epoch': 0.87} {'loss': 0.8699, 'learning_rate': 1.2145349678123816e-05, 'epoch': 0.87} {'loss': 0.8812, 'learning_rate': 1.2145029947394338e-05, 'epoch': 0.87} {'loss': 0.9535, 'learning_rate': 1.2144710214366268e-05, 'epoch': 0.87} {'loss': 0.7487, 'learning_rate': 1.2144390479039947e-05, 'epoch': 0.87} {'loss': 0.8387, 'learning_rate': 1.2144070741415717e-05, 'epoch': 0.87} {'loss': 0.6956, 'learning_rate': 1.2143751001493922e-05, 'epoch': 0.87} {'loss': 0.9128, 'learning_rate': 1.2143431259274904e-05, 'epoch': 0.87} {'loss': 0.7666, 'learning_rate': 1.2143111514759007e-05, 'epoch': 0.87} {'loss': 0.7469, 'learning_rate': 1.2142791767946576e-05, 'epoch': 0.87} {'loss': 0.7052, 'learning_rate': 1.2142472018837944e-05, 'epoch': 0.87} {'loss': 0.9228, 'learning_rate': 1.2142152267433462e-05, 'epoch': 0.87} {'loss': 0.7336, 'learning_rate': 1.2141832513733472e-05, 'epoch': 0.87} {'loss': 0.9425, 'learning_rate': 1.2141512757738312e-05, 'epoch': 0.87} {'loss': 0.7674, 'learning_rate': 1.214119299944833e-05, 'epoch': 0.87} {'loss': 0.5688, 'learning_rate': 1.214087323886387e-05, 'epoch': 0.87} {'loss': 0.7245, 'learning_rate': 1.2140553475985266e-05, 'epoch': 0.87} {'loss': 0.7599, 'learning_rate': 1.2140233710812868e-05, 'epoch': 0.87} {'loss': 0.901, 'learning_rate': 1.2139913943347013e-05, 'epoch': 0.87} {'loss': 0.7337, 'learning_rate': 1.2139594173588049e-05, 'epoch': 0.87} {'loss': 0.893, 'learning_rate': 1.2139274401536316e-05, 'epoch': 0.87} {'loss': 0.7439, 'learning_rate': 1.213895462719216e-05, 'epoch': 0.87} {'loss': 0.7386, 'learning_rate': 1.2138634850555919e-05, 'epoch': 0.87} {'loss': 0.6826, 'learning_rate': 1.2138315071627942e-05, 'epoch': 0.87} {'loss': 0.8078, 'learning_rate': 1.2137995290408562e-05, 'epoch': 0.87} {'loss': 0.7884, 'learning_rate': 1.2137675506898128e-05, 'epoch': 0.87} {'loss': 0.86, 'learning_rate': 1.2137355721096982e-05, 'epoch': 0.87} {'loss': 0.8345, 'learning_rate': 1.2137035933005468e-05, 'epoch': 0.87} {'loss': 0.7582, 'learning_rate': 1.2136716142623928e-05, 'epoch': 0.87} {'loss': 1.028, 'learning_rate': 1.2136396349952704e-05, 'epoch': 0.87} {'loss': 0.8136, 'learning_rate': 1.2136076554992135e-05, 'epoch': 0.87} {'loss': 0.76, 'learning_rate': 1.2135756757742567e-05, 'epoch': 0.87} {'loss': 0.807, 'learning_rate': 1.2135436958204345e-05, 'epoch': 0.87} {'loss': 0.7329, 'learning_rate': 1.213511715637781e-05, 'epoch': 0.87} {'loss': 0.8516, 'learning_rate': 1.2134797352263303e-05, 'epoch': 0.87} {'loss': 0.9141, 'learning_rate': 1.2134477545861168e-05, 'epoch': 0.87} {'loss': 0.6698, 'learning_rate': 1.213415773717175e-05, 'epoch': 0.87} {'loss': 0.6118, 'learning_rate': 1.2133837926195386e-05, 'epoch': 0.87} {'loss': 0.8121, 'learning_rate': 1.2133518112932424e-05, 'epoch': 0.87} {'loss': 0.7319, 'learning_rate': 1.2133198297383204e-05, 'epoch': 0.87} {'loss': 0.8596, 'learning_rate': 1.2132878479548071e-05, 'epoch': 0.87} {'loss': 0.9128, 'learning_rate': 1.2132558659427365e-05, 'epoch': 0.87} {'loss': 0.7885, 'learning_rate': 1.2132238837021429e-05, 'epoch': 0.87} {'loss': 0.8066, 'learning_rate': 1.2131919012330608e-05, 'epoch': 0.87} {'loss': 0.9503, 'learning_rate': 1.2131599185355242e-05, 'epoch': 0.87} {'loss': 0.8102, 'learning_rate': 1.2131279356095676e-05, 'epoch': 0.87} {'loss': 0.7126, 'learning_rate': 1.213095952455225e-05, 'epoch': 0.87} {'loss': 0.6752, 'learning_rate': 1.2130639690725313e-05, 'epoch': 0.87} {'loss': 0.6331, 'learning_rate': 1.21303198546152e-05, 'epoch': 0.87} {'loss': 0.903, 'learning_rate': 1.2130000016222257e-05, 'epoch': 0.87} {'loss': 0.6635, 'learning_rate': 1.2129680175546828e-05, 'epoch': 0.87} {'loss': 0.6133, 'learning_rate': 1.2129360332589255e-05, 'epoch': 0.87} {'loss': 0.8796, 'learning_rate': 1.2129040487349877e-05, 'epoch': 0.87} {'loss': 0.79, 'learning_rate': 1.2128720639829043e-05, 'epoch': 0.87} {'loss': 0.833, 'learning_rate': 1.2128400790027094e-05, 'epoch': 0.87} {'loss': 0.8958, 'learning_rate': 1.2128080937944367e-05, 'epoch': 0.87} {'loss': 0.9642, 'learning_rate': 1.212776108358121e-05, 'epoch': 0.87} {'loss': 0.7528, 'learning_rate': 1.2127441226937967e-05, 'epoch': 0.87} {'loss': 0.5906, 'learning_rate': 1.2127121368014977e-05, 'epoch': 0.87} {'loss': 0.723, 'learning_rate': 1.2126801506812589e-05, 'epoch': 0.87} {'loss': 0.6479, 'learning_rate': 1.2126481643331137e-05, 'epoch': 0.87} {'loss': 0.7241, 'learning_rate': 1.2126161777570968e-05, 'epoch': 0.87} {'loss': 0.6694, 'learning_rate': 1.2125841909532422e-05, 'epoch': 0.87} {'loss': 0.8212, 'learning_rate': 1.2125522039215851e-05, 'epoch': 0.87} {'loss': 0.5881, 'learning_rate': 1.2125202166621588e-05, 'epoch': 0.87} {'loss': 0.6844, 'learning_rate': 1.2124882291749982e-05, 'epoch': 0.87} {'loss': 0.7967, 'learning_rate': 1.2124562414601369e-05, 'epoch': 0.87} {'loss': 0.7509, 'learning_rate': 1.2124242535176097e-05, 'epoch': 0.87} {'loss': 0.8266, 'learning_rate': 1.2123922653474507e-05, 'epoch': 0.87} {'loss': 0.7492, 'learning_rate': 1.2123602769496941e-05, 'epoch': 0.87} {'loss': 0.7603, 'learning_rate': 1.2123282883243745e-05, 'epoch': 0.87} {'loss': 0.8443, 'learning_rate': 1.212296299471526e-05, 'epoch': 0.87} {'loss': 0.7659, 'learning_rate': 1.212264310391183e-05, 'epoch': 0.87} {'loss': 0.7131, 'learning_rate': 1.212232321083379e-05, 'epoch': 0.87} {'loss': 0.6498, 'learning_rate': 1.2122003315481494e-05, 'epoch': 0.87} {'loss': 0.8236, 'learning_rate': 1.212168341785528e-05, 'epoch': 0.87} {'loss': 0.7931, 'learning_rate': 1.2121363517955486e-05, 'epoch': 0.87} {'loss': 0.8258, 'learning_rate': 1.2121043615782467e-05, 'epoch': 0.87} {'loss': 0.6881, 'learning_rate': 1.2120723711336555e-05, 'epoch': 0.87} {'loss': 0.8155, 'learning_rate': 1.2120403804618094e-05, 'epoch': 0.87} {'loss': 0.7528, 'learning_rate': 1.2120083895627432e-05, 'epoch': 0.87} {'loss': 0.81, 'learning_rate': 1.2119763984364907e-05, 'epoch': 0.87} {'loss': 0.7503, 'learning_rate': 1.2119444070830863e-05, 'epoch': 0.87} {'loss': 0.7901, 'learning_rate': 1.2119124155025643e-05, 'epoch': 0.87} {'loss': 0.621, 'learning_rate': 1.2118804236949596e-05, 'epoch': 0.87} {'loss': 0.7952, 'learning_rate': 1.2118484316603054e-05, 'epoch': 0.87} {'loss': 0.9083, 'learning_rate': 1.2118164393986364e-05, 'epoch': 0.87} {'loss': 0.8241, 'learning_rate': 1.2117844469099872e-05, 'epoch': 0.87} {'loss': 0.8961, 'learning_rate': 1.2117524541943917e-05, 'epoch': 0.87} {'loss': 0.7016, 'learning_rate': 1.2117204612518842e-05, 'epoch': 0.87} {'loss': 0.7735, 'learning_rate': 1.2116884680824993e-05, 'epoch': 0.87} {'loss': 0.7069, 'learning_rate': 1.2116564746862714e-05, 'epoch': 0.87} {'loss': 0.9313, 'learning_rate': 1.2116244810632343e-05, 'epoch': 0.87} {'loss': 0.9746, 'learning_rate': 1.2115924872134224e-05, 'epoch': 0.87} {'loss': 0.8623, 'learning_rate': 1.2115604931368698e-05, 'epoch': 0.87} {'loss': 0.7882, 'learning_rate': 1.2115284988336114e-05, 'epoch': 0.87} {'loss': 0.7612, 'learning_rate': 1.2114965043036808e-05, 'epoch': 0.87} {'loss': 0.9214, 'learning_rate': 1.2114645095471129e-05, 'epoch': 0.87} {'loss': 0.8927, 'learning_rate': 1.2114325145639416e-05, 'epoch': 0.87} {'loss': 0.7444, 'learning_rate': 1.2114005193542014e-05, 'epoch': 0.87} {'loss': 0.7379, 'learning_rate': 1.2113685239179263e-05, 'epoch': 0.87} {'loss': 0.7362, 'learning_rate': 1.2113365282551507e-05, 'epoch': 0.87} {'loss': 0.7513, 'learning_rate': 1.2113045323659089e-05, 'epoch': 0.87} {'loss': 0.9637, 'learning_rate': 1.2112725362502356e-05, 'epoch': 0.87} {'loss': 0.9583, 'learning_rate': 1.2112405399081641e-05, 'epoch': 0.87} {'loss': 0.8352, 'learning_rate': 1.2112085433397299e-05, 'epoch': 0.87} {'loss': 0.9232, 'learning_rate': 1.2111765465449664e-05, 'epoch': 0.87} {'loss': 0.6958, 'learning_rate': 1.211144549523908e-05, 'epoch': 0.87} {'loss': 0.6267, 'learning_rate': 1.2111125522765894e-05, 'epoch': 0.87} {'loss': 0.7997, 'learning_rate': 1.2110805548030447e-05, 'epoch': 0.87} {'loss': 0.6769, 'learning_rate': 1.211048557103308e-05, 'epoch': 0.87} {'loss': 0.8437, 'learning_rate': 1.2110165591774136e-05, 'epoch': 0.87} {'loss': 0.7877, 'learning_rate': 1.2109845610253962e-05, 'epoch': 0.87} {'loss': 0.7996, 'learning_rate': 1.2109525626472898e-05, 'epoch': 0.87} {'loss': 0.7344, 'learning_rate': 1.2109205640431282e-05, 'epoch': 0.87} {'loss': 0.7402, 'learning_rate': 1.2108885652129468e-05, 'epoch': 0.87} {'loss': 0.8116, 'learning_rate': 1.2108565661567791e-05, 'epoch': 0.87} {'loss': 0.8631, 'learning_rate': 1.2108245668746591e-05, 'epoch': 0.87} {'loss': 0.6811, 'learning_rate': 1.2107925673666221e-05, 'epoch': 0.87} {'loss': 0.7776, 'learning_rate': 1.2107605676327017e-05, 'epoch': 0.87} {'loss': 0.9127, 'learning_rate': 1.2107285676729324e-05, 'epoch': 0.87} {'loss': 0.8613, 'learning_rate': 1.210696567487348e-05, 'epoch': 0.87} {'loss': 0.8196, 'learning_rate': 1.2106645670759838e-05, 'epoch': 0.87} {'loss': 0.8384, 'learning_rate': 1.2106325664388732e-05, 'epoch': 0.87} {'loss': 0.6726, 'learning_rate': 1.2106005655760507e-05, 'epoch': 0.87} {'loss': 0.8631, 'learning_rate': 1.2105685644875506e-05, 'epoch': 0.87} {'loss': 0.786, 'learning_rate': 1.2105365631734076e-05, 'epoch': 0.87} {'loss': 0.7594, 'learning_rate': 1.2105045616336555e-05, 'epoch': 0.87} {'loss': 0.7853, 'learning_rate': 1.210472559868329e-05, 'epoch': 0.87} {'loss': 0.6499, 'learning_rate': 1.2104405578774619e-05, 'epoch': 0.87} {'loss': 0.849, 'learning_rate': 1.2104085556610887e-05, 'epoch': 0.87} {'loss': 0.8859, 'learning_rate': 1.2103765532192437e-05, 'epoch': 0.87} {'loss': 0.9273, 'learning_rate': 1.2103445505519615e-05, 'epoch': 0.87} {'loss': 0.623, 'learning_rate': 1.210312547659276e-05, 'epoch': 0.87} {'loss': 0.7653, 'learning_rate': 1.2102805445412215e-05, 'epoch': 0.87} {'loss': 0.9158, 'learning_rate': 1.2102485411978328e-05, 'epoch': 0.87} {'loss': 0.7808, 'learning_rate': 1.2102165376291434e-05, 'epoch': 0.87} {'loss': 0.8163, 'learning_rate': 1.2101845338351883e-05, 'epoch': 0.87} {'loss': 0.6879, 'learning_rate': 1.2101525298160013e-05, 'epoch': 0.87} {'loss': 0.7678, 'learning_rate': 1.2101205255716171e-05, 'epoch': 0.87} {'loss': 0.7989, 'learning_rate': 1.2100885211020697e-05, 'epoch': 0.87} {'loss': 0.7244, 'learning_rate': 1.2100565164073936e-05, 'epoch': 0.87} {'loss': 0.9002, 'learning_rate': 1.2100245114876227e-05, 'epoch': 0.87} {'loss': 0.869, 'learning_rate': 1.2099925063427915e-05, 'epoch': 0.87} {'loss': 0.9011, 'learning_rate': 1.2099605009729348e-05, 'epoch': 0.87} {'loss': 0.7916, 'learning_rate': 1.2099284953780861e-05, 'epoch': 0.87} {'loss': 0.6121, 'learning_rate': 1.2098964895582803e-05, 'epoch': 0.87} {'loss': 0.6471, 'learning_rate': 1.2098644835135516e-05, 'epoch': 0.87} {'loss': 0.8056, 'learning_rate': 1.2098324772439338e-05, 'epoch': 0.87} {'loss': 0.6706, 'learning_rate': 1.2098004707494618e-05, 'epoch': 0.87} {'loss': 0.8151, 'learning_rate': 1.2097684640301694e-05, 'epoch': 0.87} {'loss': 0.8611, 'learning_rate': 1.2097364570860915e-05, 'epoch': 0.87} {'loss': 0.7884, 'learning_rate': 1.2097044499172616e-05, 'epoch': 0.87} {'loss': 0.745, 'learning_rate': 1.209672442523715e-05, 'epoch': 0.87} {'loss': 0.7163, 'learning_rate': 1.2096404349054853e-05, 'epoch': 0.87} {'loss': 0.775, 'learning_rate': 1.209608427062607e-05, 'epoch': 0.87} {'loss': 0.7302, 'learning_rate': 1.209576418995114e-05, 'epoch': 0.87} {'loss': 0.9256, 'learning_rate': 1.2095444107030412e-05, 'epoch': 0.87} {'loss': 0.6504, 'learning_rate': 1.2095124021864224e-05, 'epoch': 0.87} {'loss': 0.8456, 'learning_rate': 1.2094803934452924e-05, 'epoch': 0.87} {'loss': 0.7918, 'learning_rate': 1.2094483844796854e-05, 'epoch': 0.87} {'loss': 0.8273, 'learning_rate': 1.2094163752896356e-05, 'epoch': 0.87} {'loss': 0.7906, 'learning_rate': 1.2093843658751769e-05, 'epoch': 0.87} {'loss': 0.7374, 'learning_rate': 1.209352356236344e-05, 'epoch': 0.87} {'loss': 0.6708, 'learning_rate': 1.209320346373171e-05, 'epoch': 0.87} {'loss': 0.7764, 'learning_rate': 1.2092883362856927e-05, 'epoch': 0.87} {'loss': 0.7085, 'learning_rate': 1.2092563259739432e-05, 'epoch': 0.87} {'loss': 0.8904, 'learning_rate': 1.2092243154379561e-05, 'epoch': 0.87} {'loss': 0.6567, 'learning_rate': 1.2091923046777669e-05, 'epoch': 0.87} {'loss': 0.7667, 'learning_rate': 1.2091602936934089e-05, 'epoch': 0.87} {'loss': 0.8239, 'learning_rate': 1.2091282824849166e-05, 'epoch': 0.87} {'loss': 0.7993, 'learning_rate': 1.2090962710523247e-05, 'epoch': 0.87} {'loss': 0.9786, 'learning_rate': 1.2090642593956674e-05, 'epoch': 0.87} {'loss': 0.9026, 'learning_rate': 1.2090322475149788e-05, 'epoch': 0.87} {'loss': 0.8595, 'learning_rate': 1.209000235410293e-05, 'epoch': 0.87} {'loss': 0.799, 'learning_rate': 1.2089682230816449e-05, 'epoch': 0.87} {'loss': 0.7601, 'learning_rate': 1.2089362105290682e-05, 'epoch': 0.87} {'loss': 0.8432, 'learning_rate': 1.2089041977525977e-05, 'epoch': 0.87} {'loss': 0.7856, 'learning_rate': 1.2088721847522675e-05, 'epoch': 0.87} {'loss': 0.7854, 'learning_rate': 1.208840171528112e-05, 'epoch': 0.87} {'loss': 0.8203, 'learning_rate': 1.2088081580801652e-05, 'epoch': 0.87} {'loss': 0.6549, 'learning_rate': 1.2087761444084615e-05, 'epoch': 0.87} {'loss': 0.7866, 'learning_rate': 1.2087441305130359e-05, 'epoch': 0.87} {'loss': 0.9592, 'learning_rate': 1.2087121163939214e-05, 'epoch': 0.87} {'loss': 0.7417, 'learning_rate': 1.2086801020511533e-05, 'epoch': 0.87} {'loss': 0.8554, 'learning_rate': 1.208648087484766e-05, 'epoch': 0.87} {'loss': 0.9092, 'learning_rate': 1.2086160726947931e-05, 'epoch': 0.87} {'loss': 0.6581, 'learning_rate': 1.2085840576812693e-05, 'epoch': 0.87} {'loss': 0.777, 'learning_rate': 1.208552042444229e-05, 'epoch': 0.87} {'loss': 0.8246, 'learning_rate': 1.208520026983706e-05, 'epoch': 0.87} {'loss': 0.8076, 'learning_rate': 1.2084880112997353e-05, 'epoch': 0.87} {'loss': 0.73, 'learning_rate': 1.2084559953923507e-05, 'epoch': 0.87} {'loss': 0.7704, 'learning_rate': 1.2084239792615868e-05, 'epoch': 0.87} {'loss': 0.7246, 'learning_rate': 1.2083919629074776e-05, 'epoch': 0.87} {'loss': 0.7299, 'learning_rate': 1.2083599463300577e-05, 'epoch': 0.87} {'loss': 0.6677, 'learning_rate': 1.2083279295293615e-05, 'epoch': 0.87} {'loss': 0.7737, 'learning_rate': 1.208295912505423e-05, 'epoch': 0.87} {'loss': 0.6366, 'learning_rate': 1.2082638952582769e-05, 'epoch': 0.87} {'loss': 0.6994, 'learning_rate': 1.2082318777879567e-05, 'epoch': 0.87} {'loss': 0.7414, 'learning_rate': 1.2081998600944975e-05, 'epoch': 0.87} {'loss': 0.8778, 'learning_rate': 1.2081678421779332e-05, 'epoch': 0.87} {'loss': 0.7755, 'learning_rate': 1.2081358240382983e-05, 'epoch': 0.87} {'loss': 0.6733, 'learning_rate': 1.2081038056756273e-05, 'epoch': 0.87} {'loss': 0.6211, 'learning_rate': 1.2080717870899543e-05, 'epoch': 0.87} {'loss': 0.5655, 'learning_rate': 1.2080397682813136e-05, 'epoch': 0.87} {'loss': 0.8809, 'learning_rate': 1.2080077492497394e-05, 'epoch': 0.87} {'loss': 0.7475, 'learning_rate': 1.2079757299952659e-05, 'epoch': 0.87} {'loss': 0.6663, 'learning_rate': 1.2079437105179279e-05, 'epoch': 0.87} {'loss': 0.9228, 'learning_rate': 1.2079116908177592e-05, 'epoch': 0.87} {'loss': 0.663, 'learning_rate': 1.2078796708947948e-05, 'epoch': 0.87} {'loss': 0.6475, 'learning_rate': 1.2078476507490685e-05, 'epoch': 0.87} {'loss': 0.7191, 'learning_rate': 1.2078156303806146e-05, 'epoch': 0.87} {'loss': 0.9284, 'learning_rate': 1.2077836097894672e-05, 'epoch': 0.87} {'loss': 0.7682, 'learning_rate': 1.207751588975661e-05, 'epoch': 0.87} {'loss': 0.8917, 'learning_rate': 1.2077195679392304e-05, 'epoch': 0.87} {'loss': 0.6791, 'learning_rate': 1.2076875466802095e-05, 'epoch': 0.87} {'loss': 0.7815, 'learning_rate': 1.2076555251986326e-05, 'epoch': 0.87} {'loss': 0.8085, 'learning_rate': 1.2076235034945342e-05, 'epoch': 0.87} {'loss': 0.7066, 'learning_rate': 1.2075914815679483e-05, 'epoch': 0.87} {'loss': 0.8227, 'learning_rate': 1.2075594594189095e-05, 'epoch': 0.87} {'loss': 0.6631, 'learning_rate': 1.2075274370474518e-05, 'epoch': 0.87} {'loss': 0.9176, 'learning_rate': 1.2074954144536099e-05, 'epoch': 0.87} {'loss': 0.7492, 'learning_rate': 1.2074633916374181e-05, 'epoch': 0.87} {'loss': 0.7363, 'learning_rate': 1.2074313685989103e-05, 'epoch': 0.87} {'loss': 0.8309, 'learning_rate': 1.2073993453381215e-05, 'epoch': 0.87} {'loss': 0.917, 'learning_rate': 1.207367321855085e-05, 'epoch': 0.87} {'loss': 0.6086, 'learning_rate': 1.207335298149836e-05, 'epoch': 0.87} {'loss': 0.8437, 'learning_rate': 1.2073032742224082e-05, 'epoch': 0.87} {'loss': 0.7699, 'learning_rate': 1.2072712500728363e-05, 'epoch': 0.87} {'loss': 0.7807, 'learning_rate': 1.207239225701155e-05, 'epoch': 0.87} {'loss': 0.7524, 'learning_rate': 1.2072072011073981e-05, 'epoch': 0.87} {'loss': 0.9338, 'learning_rate': 1.2071751762915995e-05, 'epoch': 0.87} {'loss': 0.8079, 'learning_rate': 1.2071431512537943e-05, 'epoch': 0.87} {'loss': 0.6688, 'learning_rate': 1.2071111259940165e-05, 'epoch': 0.87} {'loss': 0.7776, 'learning_rate': 1.2070791005123001e-05, 'epoch': 0.87} {'loss': 0.8147, 'learning_rate': 1.2070470748086804e-05, 'epoch': 0.87} {'loss': 0.8529, 'learning_rate': 1.2070150488831906e-05, 'epoch': 0.87} {'loss': 0.8585, 'learning_rate': 1.2069830227358659e-05, 'epoch': 0.87} {'loss': 0.9373, 'learning_rate': 1.2069509963667398e-05, 'epoch': 0.87} {'loss': 0.6295, 'learning_rate': 1.2069189697758472e-05, 'epoch': 0.87} {'loss': 0.718, 'learning_rate': 1.2068869429632222e-05, 'epoch': 0.87} {'loss': 0.8387, 'learning_rate': 1.2068549159288991e-05, 'epoch': 0.87} {'loss': 0.5897, 'learning_rate': 1.2068228886729125e-05, 'epoch': 0.87} {'loss': 0.8311, 'learning_rate': 1.2067908611952963e-05, 'epoch': 0.87} {'loss': 0.7786, 'learning_rate': 1.2067588334960851e-05, 'epoch': 0.87} {'loss': 0.7609, 'learning_rate': 1.2067268055753131e-05, 'epoch': 0.87} {'loss': 0.6909, 'learning_rate': 1.2066947774330146e-05, 'epoch': 0.87} {'loss': 0.7155, 'learning_rate': 1.2066627490692242e-05, 'epoch': 0.87} {'loss': 0.8904, 'learning_rate': 1.2066307204839762e-05, 'epoch': 0.87} {'loss': 0.7597, 'learning_rate': 1.2065986916773042e-05, 'epoch': 0.87} {'loss': 0.839, 'learning_rate': 1.2065666626492433e-05, 'epoch': 0.87} {'loss': 0.7865, 'learning_rate': 1.2065346333998278e-05, 'epoch': 0.87} {'loss': 0.8094, 'learning_rate': 1.2065026039290914e-05, 'epoch': 0.87} {'loss': 0.7889, 'learning_rate': 1.206470574237069e-05, 'epoch': 0.87} {'loss': 0.5878, 'learning_rate': 1.206438544323795e-05, 'epoch': 0.87} {'loss': 0.8146, 'learning_rate': 1.2064065141893031e-05, 'epoch': 0.87} {'loss': 0.7992, 'learning_rate': 1.2063744838336282e-05, 'epoch': 0.87} {'loss': 0.7823, 'learning_rate': 1.2063424532568042e-05, 'epoch': 0.87} {'loss': 0.7037, 'learning_rate': 1.206310422458866e-05, 'epoch': 0.87} {'loss': 0.7268, 'learning_rate': 1.2062783914398473e-05, 'epoch': 0.87} {'loss': 1.0273, 'learning_rate': 1.2062463601997827e-05, 'epoch': 0.87} {'loss': 0.6822, 'learning_rate': 1.2062143287387065e-05, 'epoch': 0.87} {'loss': 0.7206, 'learning_rate': 1.206182297056653e-05, 'epoch': 0.87} {'loss': 0.6355, 'learning_rate': 1.2061502651536566e-05, 'epoch': 0.87} {'loss': 0.7587, 'learning_rate': 1.2061182330297518e-05, 'epoch': 0.87} {'loss': 0.7014, 'learning_rate': 1.2060862006849724e-05, 'epoch': 0.87} {'loss': 0.8354, 'learning_rate': 1.2060541681193532e-05, 'epoch': 0.87} {'loss': 0.6657, 'learning_rate': 1.2060221353329285e-05, 'epoch': 0.87} {'loss': 0.8234, 'learning_rate': 1.2059901023257321e-05, 'epoch': 0.87} {'loss': 0.8059, 'learning_rate': 1.205958069097799e-05, 'epoch': 0.87} {'loss': 0.857, 'learning_rate': 1.205926035649163e-05, 'epoch': 0.87} {'loss': 0.7872, 'learning_rate': 1.2058940019798589e-05, 'epoch': 0.87} {'loss': 0.8322, 'learning_rate': 1.2058619680899205e-05, 'epoch': 0.87} {'loss': 0.9153, 'learning_rate': 1.2058299339793831e-05, 'epoch': 0.87} {'loss': 0.6577, 'learning_rate': 1.2057978996482797e-05, 'epoch': 0.87} {'loss': 0.8587, 'learning_rate': 1.2057658650966455e-05, 'epoch': 0.87} {'loss': 0.7466, 'learning_rate': 1.2057338303245145e-05, 'epoch': 0.87} {'loss': 0.8325, 'learning_rate': 1.205701795331921e-05, 'epoch': 0.87} {'loss': 1.029, 'learning_rate': 1.2056697601188998e-05, 'epoch': 0.87} {'loss': 0.8067, 'learning_rate': 1.205637724685485e-05, 'epoch': 0.87} {'loss': 0.9754, 'learning_rate': 1.2056056890317104e-05, 'epoch': 0.87} {'loss': 0.8579, 'learning_rate': 1.205573653157611e-05, 'epoch': 0.87} {'loss': 0.7931, 'learning_rate': 1.2055416170632206e-05, 'epoch': 0.87} {'loss': 0.8067, 'learning_rate': 1.205509580748574e-05, 'epoch': 0.87} {'loss': 0.7446, 'learning_rate': 1.2054775442137051e-05, 'epoch': 0.87} {'loss': 0.7141, 'learning_rate': 1.205445507458649e-05, 'epoch': 0.87} {'loss': 0.5659, 'learning_rate': 1.2054134704834393e-05, 'epoch': 0.87} {'loss': 0.6813, 'learning_rate': 1.2053814332881104e-05, 'epoch': 0.87} {'loss': 0.8999, 'learning_rate': 1.2053493958726967e-05, 'epoch': 0.87} {'loss': 0.7306, 'learning_rate': 1.2053173582372325e-05, 'epoch': 0.87} {'loss': 0.7093, 'learning_rate': 1.2052853203817526e-05, 'epoch': 0.87} {'loss': 0.804, 'learning_rate': 1.2052532823062905e-05, 'epoch': 0.87} {'loss': 0.8669, 'learning_rate': 1.2052212440108815e-05, 'epoch': 0.87} {'loss': 0.8094, 'learning_rate': 1.2051892054955591e-05, 'epoch': 0.87} {'loss': 0.7162, 'learning_rate': 1.2051571667603579e-05, 'epoch': 0.87} {'loss': 0.7931, 'learning_rate': 1.2051251278053124e-05, 'epoch': 0.87} {'loss': 0.7473, 'learning_rate': 1.2050930886304566e-05, 'epoch': 0.87} {'loss': 0.8138, 'learning_rate': 1.2050610492358252e-05, 'epoch': 0.87} {'loss': 0.7683, 'learning_rate': 1.2050290096214525e-05, 'epoch': 0.87} {'loss': 0.799, 'learning_rate': 1.2049969697873727e-05, 'epoch': 0.87} {'loss': 0.8144, 'learning_rate': 1.2049649297336201e-05, 'epoch': 0.87} {'loss': 1.0027, 'learning_rate': 1.204932889460229e-05, 'epoch': 0.87} {'loss': 0.9088, 'learning_rate': 1.2049008489672338e-05, 'epoch': 0.87} {'loss': 0.8043, 'learning_rate': 1.2048688082546689e-05, 'epoch': 0.87} {'loss': 0.769, 'learning_rate': 1.2048367673225687e-05, 'epoch': 0.87} {'loss': 0.7578, 'learning_rate': 1.2048047261709673e-05, 'epoch': 0.87} {'loss': 0.698, 'learning_rate': 1.2047726847998993e-05, 'epoch': 0.87} {'loss': 0.7457, 'learning_rate': 1.2047406432093984e-05, 'epoch': 0.87} {'loss': 0.7441, 'learning_rate': 1.2047086013994997e-05, 'epoch': 0.87} {'loss': 0.7679, 'learning_rate': 1.2046765593702375e-05, 'epoch': 0.87} {'loss': 0.6319, 'learning_rate': 1.2046445171216455e-05, 'epoch': 0.87} {'loss': 0.7029, 'learning_rate': 1.204612474653759e-05, 'epoch': 0.87} {'loss': 0.7383, 'learning_rate': 1.204580431966611e-05, 'epoch': 0.87} {'loss': 0.8315, 'learning_rate': 1.2045483890602372e-05, 'epoch': 0.87} {'loss': 0.7474, 'learning_rate': 1.2045163459346711e-05, 'epoch': 0.87} {'loss': 0.7708, 'learning_rate': 1.2044843025899474e-05, 'epoch': 0.87} {'loss': 0.8326, 'learning_rate': 1.2044522590261001e-05, 'epoch': 0.87} {'loss': 0.7692, 'learning_rate': 1.2044202152431639e-05, 'epoch': 0.87} {'loss': 0.8385, 'learning_rate': 1.2043881712411729e-05, 'epoch': 0.87} {'loss': 0.5418, 'learning_rate': 1.2043561270201616e-05, 'epoch': 0.87} {'loss': 0.6923, 'learning_rate': 1.2043240825801642e-05, 'epoch': 0.87} {'loss': 0.8317, 'learning_rate': 1.2042920379212154e-05, 'epoch': 0.87} {'loss': 0.7621, 'learning_rate': 1.204259993043349e-05, 'epoch': 0.87} {'loss': 0.6204, 'learning_rate': 1.2042279479465994e-05, 'epoch': 0.87} {'loss': 0.8733, 'learning_rate': 1.2041959026310014e-05, 'epoch': 0.87} {'loss': 0.6728, 'learning_rate': 1.204163857096589e-05, 'epoch': 0.87} {'loss': 0.7099, 'learning_rate': 1.2041318113433965e-05, 'epoch': 0.87} {'loss': 0.8722, 'learning_rate': 1.2040997653714586e-05, 'epoch': 0.87} {'loss': 0.6842, 'learning_rate': 1.204067719180809e-05, 'epoch': 0.87} {'loss': 0.888, 'learning_rate': 1.2040356727714828e-05, 'epoch': 0.87} {'loss': 0.7146, 'learning_rate': 1.2040036261435137e-05, 'epoch': 0.87} {'loss': 0.7763, 'learning_rate': 1.2039715792969364e-05, 'epoch': 0.87} {'loss': 0.8579, 'learning_rate': 1.2039395322317851e-05, 'epoch': 0.87} {'loss': 0.6778, 'learning_rate': 1.203907484948094e-05, 'epoch': 0.87} {'loss': 0.7968, 'learning_rate': 1.2038754374458981e-05, 'epoch': 0.87} {'loss': 0.811, 'learning_rate': 1.2038433897252308e-05, 'epoch': 0.87} {'loss': 0.7521, 'learning_rate': 1.2038113417861273e-05, 'epoch': 0.87} {'loss': 0.8855, 'learning_rate': 1.2037792936286212e-05, 'epoch': 0.87} {'loss': 0.7018, 'learning_rate': 1.2037472452527474e-05, 'epoch': 0.87} {'loss': 0.6943, 'learning_rate': 1.2037151966585398e-05, 'epoch': 0.87} {'loss': 0.9294, 'learning_rate': 1.2036831478460334e-05, 'epoch': 0.87} {'loss': 0.672, 'learning_rate': 1.2036510988152619e-05, 'epoch': 0.87} {'loss': 0.7596, 'learning_rate': 1.2036190495662599e-05, 'epoch': 0.87} {'loss': 0.6984, 'learning_rate': 1.2035870000990618e-05, 'epoch': 0.87} {'loss': 0.7531, 'learning_rate': 1.2035549504137016e-05, 'epoch': 0.87} {'loss': 0.796, 'learning_rate': 1.2035229005102137e-05, 'epoch': 0.87} {'loss': 0.6756, 'learning_rate': 1.2034908503886332e-05, 'epoch': 0.87} {'loss': 0.731, 'learning_rate': 1.2034588000489938e-05, 'epoch': 0.87} {'loss': 0.7664, 'learning_rate': 1.2034267494913298e-05, 'epoch': 0.87} {'loss': 0.8261, 'learning_rate': 1.2033946987156757e-05, 'epoch': 0.87} {'loss': 0.7702, 'learning_rate': 1.2033626477220657e-05, 'epoch': 0.87} {'loss': 0.789, 'learning_rate': 1.2033305965105341e-05, 'epoch': 0.87} {'loss': 0.6839, 'learning_rate': 1.2032985450811157e-05, 'epoch': 0.87} {'loss': 0.6622, 'learning_rate': 1.2032664934338445e-05, 'epoch': 0.87} {'loss': 0.7595, 'learning_rate': 1.2032344415687552e-05, 'epoch': 0.87} {'loss': 0.954, 'learning_rate': 1.2032023894858817e-05, 'epoch': 0.87} {'loss': 0.8537, 'learning_rate': 1.2031703371852584e-05, 'epoch': 0.87} {'loss': 0.7212, 'learning_rate': 1.2031382846669195e-05, 'epoch': 0.87} {'loss': 0.8509, 'learning_rate': 1.2031062319308999e-05, 'epoch': 0.87} {'loss': 0.8875, 'learning_rate': 1.2030741789772336e-05, 'epoch': 0.87} {'loss': 0.9009, 'learning_rate': 1.2030421258059548e-05, 'epoch': 0.87} {'loss': 0.9185, 'learning_rate': 1.2030100724170983e-05, 'epoch': 0.87} {'loss': 0.6732, 'learning_rate': 1.2029780188106983e-05, 'epoch': 0.87} {'loss': 0.7925, 'learning_rate': 1.2029459649867887e-05, 'epoch': 0.87} {'loss': 0.6704, 'learning_rate': 1.2029139109454043e-05, 'epoch': 0.87} {'loss': 0.7312, 'learning_rate': 1.2028818566865792e-05, 'epoch': 0.87} {'loss': 0.8173, 'learning_rate': 1.2028498022103479e-05, 'epoch': 0.87} {'loss': 0.7027, 'learning_rate': 1.202817747516745e-05, 'epoch': 0.87} {'loss': 0.8715, 'learning_rate': 1.2027856926058043e-05, 'epoch': 0.87} {'loss': 0.8798, 'learning_rate': 1.2027536374775607e-05, 'epoch': 0.87} {'loss': 0.7158, 'learning_rate': 1.2027215821320481e-05, 'epoch': 0.87} {'loss': 0.8401, 'learning_rate': 1.202689526569301e-05, 'epoch': 0.87} {'loss': 1.0127, 'learning_rate': 1.2026574707893537e-05, 'epoch': 0.87} {'loss': 0.9476, 'learning_rate': 1.202625414792241e-05, 'epoch': 0.87} {'loss': 0.711, 'learning_rate': 1.2025933585779965e-05, 'epoch': 0.87} {'loss': 0.6857, 'learning_rate': 1.2025613021466549e-05, 'epoch': 0.87} {'loss': 0.8141, 'learning_rate': 1.2025292454982509e-05, 'epoch': 0.87} {'loss': 0.913, 'learning_rate': 1.2024971886328185e-05, 'epoch': 0.87} {'loss': 0.8775, 'learning_rate': 1.2024651315503918e-05, 'epoch': 0.87} {'loss': 0.8366, 'learning_rate': 1.2024330742510055e-05, 'epoch': 0.87} {'loss': 0.9458, 'learning_rate': 1.2024010167346942e-05, 'epoch': 0.87} {'loss': 0.9195, 'learning_rate': 1.2023689590014916e-05, 'epoch': 0.87} {'loss': 0.8912, 'learning_rate': 1.2023369010514328e-05, 'epoch': 0.87} {'loss': 0.8142, 'learning_rate': 1.2023048428845513e-05, 'epoch': 0.87} {'loss': 0.8945, 'learning_rate': 1.2022727845008821e-05, 'epoch': 0.87} {'loss': 0.6475, 'learning_rate': 1.2022407259004592e-05, 'epoch': 0.87} {'loss': 0.7168, 'learning_rate': 1.2022086670833175e-05, 'epoch': 0.87} {'loss': 0.7885, 'learning_rate': 1.2021766080494906e-05, 'epoch': 0.87} {'loss': 0.7243, 'learning_rate': 1.2021445487990133e-05, 'epoch': 0.87} {'loss': 0.8151, 'learning_rate': 1.20211248933192e-05, 'epoch': 0.87} {'loss': 0.7278, 'learning_rate': 1.2020804296482446e-05, 'epoch': 0.87} {'loss': 0.8991, 'learning_rate': 1.202048369748022e-05, 'epoch': 0.87} {'loss': 0.895, 'learning_rate': 1.2020163096312867e-05, 'epoch': 0.87} {'loss': 0.8753, 'learning_rate': 1.2019842492980722e-05, 'epoch': 0.87} {'loss': 0.7589, 'learning_rate': 1.2019521887484134e-05, 'epoch': 0.87} {'loss': 0.8507, 'learning_rate': 1.2019201279823447e-05, 'epoch': 0.87} {'loss': 0.7493, 'learning_rate': 1.2018880669999005e-05, 'epoch': 0.87} {'loss': 0.717, 'learning_rate': 1.2018560058011146e-05, 'epoch': 0.87} {'loss': 0.7241, 'learning_rate': 1.201823944386022e-05, 'epoch': 0.87} {'loss': 0.7841, 'learning_rate': 1.2017918827546571e-05, 'epoch': 0.87} {'loss': 0.7818, 'learning_rate': 1.2017598209070536e-05, 'epoch': 0.87} {'loss': 0.823, 'learning_rate': 1.2017277588432463e-05, 'epoch': 0.87} {'loss': 0.9449, 'learning_rate': 1.2016956965632696e-05, 'epoch': 0.87} {'loss': 0.7626, 'learning_rate': 1.2016636340671579e-05, 'epoch': 0.87} {'loss': 0.8108, 'learning_rate': 1.2016315713549452e-05, 'epoch': 0.87} {'loss': 0.8373, 'learning_rate': 1.2015995084266662e-05, 'epoch': 0.87} {'loss': 0.7387, 'learning_rate': 1.2015674452823549e-05, 'epoch': 0.87} {'loss': 0.9393, 'learning_rate': 1.2015353819220461e-05, 'epoch': 0.87} {'loss': 0.8206, 'learning_rate': 1.2015033183457739e-05, 'epoch': 0.87} {'loss': 0.7362, 'learning_rate': 1.2014712545535725e-05, 'epoch': 0.87} {'loss': 0.8667, 'learning_rate': 1.2014391905454768e-05, 'epoch': 0.87} {'loss': 0.7474, 'learning_rate': 1.201407126321521e-05, 'epoch': 0.87} {'loss': 0.9988, 'learning_rate': 1.2013750618817389e-05, 'epoch': 0.87} {'loss': 0.6696, 'learning_rate': 1.2013429972261653e-05, 'epoch': 0.87} {'loss': 0.8032, 'learning_rate': 1.2013109323548344e-05, 'epoch': 0.87} {'loss': 0.9597, 'learning_rate': 1.2012788672677807e-05, 'epoch': 0.87} {'loss': 0.8319, 'learning_rate': 1.2012468019650387e-05, 'epoch': 0.87} {'loss': 0.7883, 'learning_rate': 1.2012147364466424e-05, 'epoch': 0.87} {'loss': 0.7787, 'learning_rate': 1.2011826707126266e-05, 'epoch': 0.87} {'loss': 0.7079, 'learning_rate': 1.2011506047630253e-05, 'epoch': 0.87} {'loss': 0.6916, 'learning_rate': 1.201118538597873e-05, 'epoch': 0.87} {'loss': 0.7974, 'learning_rate': 1.2010864722172038e-05, 'epoch': 0.87} {'loss': 0.7578, 'learning_rate': 1.2010544056210524e-05, 'epoch': 0.87} {'loss': 0.4956, 'learning_rate': 1.2010223388094533e-05, 'epoch': 0.87} {'loss': 0.7673, 'learning_rate': 1.2009902717824406e-05, 'epoch': 0.87} {'loss': 0.8732, 'learning_rate': 1.2009582045400485e-05, 'epoch': 0.87} {'loss': 0.8529, 'learning_rate': 1.2009261370823115e-05, 'epoch': 0.87} {'loss': 0.9544, 'learning_rate': 1.2008940694092642e-05, 'epoch': 0.87} {'loss': 0.7343, 'learning_rate': 1.2008620015209405e-05, 'epoch': 0.87} {'loss': 0.7881, 'learning_rate': 1.200829933417375e-05, 'epoch': 0.87} {'loss': 0.699, 'learning_rate': 1.2007978650986025e-05, 'epoch': 0.87} {'loss': 0.7366, 'learning_rate': 1.2007657965646568e-05, 'epoch': 0.87} {'loss': 0.921, 'learning_rate': 1.2007337278155724e-05, 'epoch': 0.87} {'loss': 0.9097, 'learning_rate': 1.2007016588513837e-05, 'epoch': 0.87} {'loss': 0.9475, 'learning_rate': 1.200669589672125e-05, 'epoch': 0.87} {'loss': 0.6639, 'learning_rate': 1.2006375202778306e-05, 'epoch': 0.87} {'loss': 0.7956, 'learning_rate': 1.2006054506685354e-05, 'epoch': 0.87} {'loss': 0.8245, 'learning_rate': 1.200573380844273e-05, 'epoch': 0.87} {'loss': 0.6866, 'learning_rate': 1.2005413108050785e-05, 'epoch': 0.87} {'loss': 0.7814, 'learning_rate': 1.2005092405509855e-05, 'epoch': 0.87} {'loss': 0.9647, 'learning_rate': 1.2004771700820288e-05, 'epoch': 0.88} {'loss': 0.6892, 'learning_rate': 1.2004450993982427e-05, 'epoch': 0.88} {'loss': 0.7044, 'learning_rate': 1.2004130284996615e-05, 'epoch': 0.88} {'loss': 0.8687, 'learning_rate': 1.20038095738632e-05, 'epoch': 0.88} {'loss': 0.9057, 'learning_rate': 1.2003488860582522e-05, 'epoch': 0.88} {'loss': 0.5688, 'learning_rate': 1.2003168145154925e-05, 'epoch': 0.88} {'loss': 0.6489, 'learning_rate': 1.2002847427580748e-05, 'epoch': 0.88} {'loss': 0.66, 'learning_rate': 1.2002526707860342e-05, 'epoch': 0.88} {'loss': 0.8629, 'learning_rate': 1.2002205985994046e-05, 'epoch': 0.88} {'loss': 0.7169, 'learning_rate': 1.2001885261982208e-05, 'epoch': 0.88} {'loss': 0.6555, 'learning_rate': 1.200156453582517e-05, 'epoch': 0.88} {'loss': 0.7578, 'learning_rate': 1.2001243807523272e-05, 'epoch': 0.88} {'loss': 0.8773, 'learning_rate': 1.2000923077076864e-05, 'epoch': 0.88} {'loss': 0.8232, 'learning_rate': 1.2000602344486286e-05, 'epoch': 0.88} {'loss': 0.868, 'learning_rate': 1.200028160975188e-05, 'epoch': 0.88} {'loss': 0.7443, 'learning_rate': 1.1999960872873992e-05, 'epoch': 0.88} {'loss': 0.7916, 'learning_rate': 1.1999640133852965e-05, 'epoch': 0.88} {'loss': 0.6773, 'learning_rate': 1.1999319392689144e-05, 'epoch': 0.88} {'loss': 0.9185, 'learning_rate': 1.1998998649382872e-05, 'epoch': 0.88} {'loss': 0.6186, 'learning_rate': 1.1998677903934492e-05, 'epoch': 0.88} {'loss': 0.9456, 'learning_rate': 1.199835715634435e-05, 'epoch': 0.88} {'loss': 0.7518, 'learning_rate': 1.1998036406612787e-05, 'epoch': 0.88} {'loss': 0.9436, 'learning_rate': 1.1997715654740147e-05, 'epoch': 0.88} {'loss': 0.7238, 'learning_rate': 1.1997394900726774e-05, 'epoch': 0.88} {'loss': 0.7814, 'learning_rate': 1.1997074144573011e-05, 'epoch': 0.88} {'loss': 0.764, 'learning_rate': 1.1996753386279208e-05, 'epoch': 0.88} {'loss': 0.7284, 'learning_rate': 1.1996432625845697e-05, 'epoch': 0.88} {'loss': 0.8802, 'learning_rate': 1.1996111863272832e-05, 'epoch': 0.88} {'loss': 0.7406, 'learning_rate': 1.1995791098560954e-05, 'epoch': 0.88} {'loss': 0.7136, 'learning_rate': 1.1995470331710401e-05, 'epoch': 0.88} {'loss': 0.7531, 'learning_rate': 1.1995149562721524e-05, 'epoch': 0.88} {'loss': 0.7662, 'learning_rate': 1.1994828791594664e-05, 'epoch': 0.88} {'loss': 0.6103, 'learning_rate': 1.1994508018330166e-05, 'epoch': 0.88} {'loss': 0.7391, 'learning_rate': 1.1994187242928372e-05, 'epoch': 0.88} {'loss': 0.7924, 'learning_rate': 1.199386646538963e-05, 'epoch': 0.88} {'loss': 0.834, 'learning_rate': 1.1993545685714273e-05, 'epoch': 0.88} {'loss': 0.7711, 'learning_rate': 1.1993224903902656e-05, 'epoch': 0.88} {'loss': 0.6646, 'learning_rate': 1.1992904119955118e-05, 'epoch': 0.88} {'loss': 0.9162, 'learning_rate': 1.1992583333872003e-05, 'epoch': 0.88} {'loss': 0.9623, 'learning_rate': 1.1992262545653657e-05, 'epoch': 0.88} {'loss': 0.7537, 'learning_rate': 1.1991941755300423e-05, 'epoch': 0.88} {'loss': 0.7684, 'learning_rate': 1.1991620962812638e-05, 'epoch': 0.88} {'loss': 0.7212, 'learning_rate': 1.1991300168190653e-05, 'epoch': 0.88} {'loss': 0.6075, 'learning_rate': 1.1990979371434812e-05, 'epoch': 0.88} {'loss': 0.7973, 'learning_rate': 1.1990658572545456e-05, 'epoch': 0.88} {'loss': 0.8011, 'learning_rate': 1.1990337771522929e-05, 'epoch': 0.88} {'loss': 0.8434, 'learning_rate': 1.1990016968367579e-05, 'epoch': 0.88} {'loss': 0.8409, 'learning_rate': 1.1989696163079745e-05, 'epoch': 0.88} {'loss': 0.6301, 'learning_rate': 1.1989375355659769e-05, 'epoch': 0.88} {'loss': 0.7972, 'learning_rate': 1.1989054546108e-05, 'epoch': 0.88} {'loss': 0.9722, 'learning_rate': 1.1988733734424778e-05, 'epoch': 0.88} {'loss': 0.8184, 'learning_rate': 1.1988412920610449e-05, 'epoch': 0.88} {'loss': 0.6854, 'learning_rate': 1.1988092104665357e-05, 'epoch': 0.88} {'loss': 0.9029, 'learning_rate': 1.1987771286589845e-05, 'epoch': 0.88} {'loss': 0.883, 'learning_rate': 1.1987450466384255e-05, 'epoch': 0.88} {'loss': 0.7741, 'learning_rate': 1.1987129644048933e-05, 'epoch': 0.88} {'loss': 0.877, 'learning_rate': 1.1986808819584223e-05, 'epoch': 0.88} {'loss': 0.6893, 'learning_rate': 1.1986487992990467e-05, 'epoch': 0.88} {'loss': 0.8325, 'learning_rate': 1.198616716426801e-05, 'epoch': 0.88} {'loss': 0.8058, 'learning_rate': 1.1985846333417197e-05, 'epoch': 0.88} {'loss': 0.7347, 'learning_rate': 1.198552550043837e-05, 'epoch': 0.88} {'loss': 0.7441, 'learning_rate': 1.1985204665331874e-05, 'epoch': 0.88} {'loss': 0.73, 'learning_rate': 1.198488382809805e-05, 'epoch': 0.88} {'loss': 0.7686, 'learning_rate': 1.1984562988737244e-05, 'epoch': 0.88} {'loss': 0.8289, 'learning_rate': 1.1984242147249801e-05, 'epoch': 0.88} {'loss': 0.6084, 'learning_rate': 1.1983921303636063e-05, 'epoch': 0.88} {'loss': 0.7775, 'learning_rate': 1.1983600457896374e-05, 'epoch': 0.88} {'loss': 0.7068, 'learning_rate': 1.1983279610031077e-05, 'epoch': 0.88} {'loss': 0.6814, 'learning_rate': 1.198295876004052e-05, 'epoch': 0.88} {'loss': 0.762, 'learning_rate': 1.1982637907925039e-05, 'epoch': 0.88} {'loss': 0.7281, 'learning_rate': 1.1982317053684986e-05, 'epoch': 0.88} {'loss': 0.8152, 'learning_rate': 1.19819961973207e-05, 'epoch': 0.88} {'loss': 0.7237, 'learning_rate': 1.1981675338832528e-05, 'epoch': 0.88} {'loss': 0.8409, 'learning_rate': 1.198135447822081e-05, 'epoch': 0.88} {'loss': 0.8041, 'learning_rate': 1.1981033615485893e-05, 'epoch': 0.88} {'loss': 0.93, 'learning_rate': 1.198071275062812e-05, 'epoch': 0.88} {'loss': 0.7334, 'learning_rate': 1.1980391883647832e-05, 'epoch': 0.88} {'loss': 0.7694, 'learning_rate': 1.1980071014545378e-05, 'epoch': 0.88} {'loss': 0.7815, 'learning_rate': 1.1979750143321098e-05, 'epoch': 0.88} {'loss': 0.7893, 'learning_rate': 1.1979429269975338e-05, 'epoch': 0.88} {'loss': 0.8596, 'learning_rate': 1.1979108394508438e-05, 'epoch': 0.88} {'loss': 0.7141, 'learning_rate': 1.1978787516920749e-05, 'epoch': 0.88} {'loss': 0.7294, 'learning_rate': 1.197846663721261e-05, 'epoch': 0.88} {'loss': 0.7973, 'learning_rate': 1.1978145755384363e-05, 'epoch': 0.88} {'loss': 0.642, 'learning_rate': 1.1977824871436356e-05, 'epoch': 0.88} {'loss': 0.7819, 'learning_rate': 1.197750398536893e-05, 'epoch': 0.88} {'loss': 0.6654, 'learning_rate': 1.1977183097182429e-05, 'epoch': 0.88} {'loss': 0.6992, 'learning_rate': 1.1976862206877197e-05, 'epoch': 0.88} {'loss': 0.7451, 'learning_rate': 1.1976541314453585e-05, 'epoch': 0.88} {'loss': 0.8778, 'learning_rate': 1.1976220419911925e-05, 'epoch': 0.88} {'loss': 0.9283, 'learning_rate': 1.1975899523252567e-05, 'epoch': 0.88} {'loss': 0.9774, 'learning_rate': 1.1975578624475856e-05, 'epoch': 0.88} {'loss': 0.7713, 'learning_rate': 1.1975257723582135e-05, 'epoch': 0.88} {'loss': 0.8294, 'learning_rate': 1.1974936820571746e-05, 'epoch': 0.88} {'loss': 0.7064, 'learning_rate': 1.1974615915445032e-05, 'epoch': 0.88} {'loss': 1.0503, 'learning_rate': 1.1974295008202341e-05, 'epoch': 0.88} {'loss': 0.8025, 'learning_rate': 1.1973974098844015e-05, 'epoch': 0.88} {'loss': 0.9521, 'learning_rate': 1.1973653187370398e-05, 'epoch': 0.88} {'loss': 0.777, 'learning_rate': 1.197333227378183e-05, 'epoch': 0.88} {'loss': 0.8725, 'learning_rate': 1.1973011358078661e-05, 'epoch': 0.88} {'loss': 0.9601, 'learning_rate': 1.197269044026123e-05, 'epoch': 0.88} {'loss': 0.7273, 'learning_rate': 1.1972369520329887e-05, 'epoch': 0.88} {'loss': 0.773, 'learning_rate': 1.197204859828497e-05, 'epoch': 0.88} {'loss': 0.7086, 'learning_rate': 1.1971727674126826e-05, 'epoch': 0.88} {'loss': 0.7221, 'learning_rate': 1.1971406747855796e-05, 'epoch': 0.88} {'loss': 0.7747, 'learning_rate': 1.1971085819472225e-05, 'epoch': 0.88} {'loss': 0.7326, 'learning_rate': 1.197076488897646e-05, 'epoch': 0.88} {'loss': 0.7364, 'learning_rate': 1.197044395636884e-05, 'epoch': 0.88} {'loss': 0.9644, 'learning_rate': 1.1970123021649715e-05, 'epoch': 0.88} {'loss': 0.7806, 'learning_rate': 1.1969802084819424e-05, 'epoch': 0.88} {'loss': 0.8303, 'learning_rate': 1.1969481145878312e-05, 'epoch': 0.88} {'loss': 0.8096, 'learning_rate': 1.1969160204826722e-05, 'epoch': 0.88} {'loss': 0.662, 'learning_rate': 1.1968839261665e-05, 'epoch': 0.88} {'loss': 0.8827, 'learning_rate': 1.1968518316393489e-05, 'epoch': 0.88} {'loss': 0.7988, 'learning_rate': 1.1968197369012531e-05, 'epoch': 0.88} {'loss': 0.8028, 'learning_rate': 1.1967876419522477e-05, 'epoch': 0.88} {'loss': 0.7712, 'learning_rate': 1.1967555467923664e-05, 'epoch': 0.88} {'loss': 0.8455, 'learning_rate': 1.1967234514216436e-05, 'epoch': 0.88} {'loss': 0.9217, 'learning_rate': 1.1966913558401139e-05, 'epoch': 0.88} {'loss': 0.8411, 'learning_rate': 1.1966592600478116e-05, 'epoch': 0.88} {'loss': 0.7186, 'learning_rate': 1.196627164044771e-05, 'epoch': 0.88} {'loss': 0.754, 'learning_rate': 1.196595067831027e-05, 'epoch': 0.88} {'loss': 0.7924, 'learning_rate': 1.1965629714066136e-05, 'epoch': 0.88} {'loss': 0.7627, 'learning_rate': 1.1965308747715653e-05, 'epoch': 0.88} {'loss': 0.911, 'learning_rate': 1.1964987779259162e-05, 'epoch': 0.88} {'loss': 0.9233, 'learning_rate': 1.196466680869701e-05, 'epoch': 0.88} {'loss': 0.8544, 'learning_rate': 1.1964345836029538e-05, 'epoch': 0.88} {'loss': 0.8656, 'learning_rate': 1.1964024861257095e-05, 'epoch': 0.88} {'loss': 0.7598, 'learning_rate': 1.1963703884380023e-05, 'epoch': 0.88} {'loss': 0.9892, 'learning_rate': 1.1963382905398664e-05, 'epoch': 0.88} {'loss': 0.9215, 'learning_rate': 1.1963061924313361e-05, 'epoch': 0.88} {'loss': 0.8567, 'learning_rate': 1.1962740941124461e-05, 'epoch': 0.88} {'loss': 0.7834, 'learning_rate': 1.1962419955832308e-05, 'epoch': 0.88} {'loss': 0.8035, 'learning_rate': 1.1962098968437244e-05, 'epoch': 0.88} {'loss': 0.6755, 'learning_rate': 1.1961777978939613e-05, 'epoch': 0.88} {'loss': 0.7291, 'learning_rate': 1.1961456987339764e-05, 'epoch': 0.88} {'loss': 0.6868, 'learning_rate': 1.1961135993638034e-05, 'epoch': 0.88} {'loss': 0.9131, 'learning_rate': 1.1960814997834769e-05, 'epoch': 0.88} {'loss': 0.9056, 'learning_rate': 1.1960493999930313e-05, 'epoch': 0.88} {'loss': 0.7123, 'learning_rate': 1.1960172999925013e-05, 'epoch': 0.88} {'loss': 0.5828, 'learning_rate': 1.195985199781921e-05, 'epoch': 0.88} {'loss': 0.7958, 'learning_rate': 1.1959530993613249e-05, 'epoch': 0.88} {'loss': 0.8713, 'learning_rate': 1.1959209987307472e-05, 'epoch': 0.88} {'loss': 0.6679, 'learning_rate': 1.1958888978902229e-05, 'epoch': 0.88} {'loss': 0.8151, 'learning_rate': 1.1958567968397856e-05, 'epoch': 0.88} {'loss': 0.7552, 'learning_rate': 1.19582469557947e-05, 'epoch': 0.88} {'loss': 0.7613, 'learning_rate': 1.1957925941093108e-05, 'epoch': 0.88} {'loss': 0.8505, 'learning_rate': 1.195760492429342e-05, 'epoch': 0.88} {'loss': 0.6761, 'learning_rate': 1.1957283905395982e-05, 'epoch': 0.88} {'loss': 0.9248, 'learning_rate': 1.1956962884401138e-05, 'epoch': 0.88} {'loss': 0.8855, 'learning_rate': 1.195664186130923e-05, 'epoch': 0.88} {'loss': 0.9644, 'learning_rate': 1.1956320836120607e-05, 'epoch': 0.88} {'loss': 0.773, 'learning_rate': 1.1955999808835606e-05, 'epoch': 0.88} {'loss': 0.7968, 'learning_rate': 1.1955678779454578e-05, 'epoch': 0.88} {'loss': 0.6171, 'learning_rate': 1.195535774797786e-05, 'epoch': 0.88} {'loss': 0.8352, 'learning_rate': 1.1955036714405804e-05, 'epoch': 0.88} {'loss': 0.8301, 'learning_rate': 1.1954715678738746e-05, 'epoch': 0.88} {'loss': 0.9012, 'learning_rate': 1.1954394640977037e-05, 'epoch': 0.88} {'loss': 0.9183, 'learning_rate': 1.1954073601121015e-05, 'epoch': 0.88} {'loss': 0.795, 'learning_rate': 1.1953752559171025e-05, 'epoch': 0.88} {'loss': 0.7592, 'learning_rate': 1.1953431515127418e-05, 'epoch': 0.88} {'loss': 0.96, 'learning_rate': 1.195311046899053e-05, 'epoch': 0.88} {'loss': 0.5393, 'learning_rate': 1.1952789420760708e-05, 'epoch': 0.88} {'loss': 0.8826, 'learning_rate': 1.1952468370438294e-05, 'epoch': 0.88} {'loss': 0.7305, 'learning_rate': 1.1952147318023638e-05, 'epoch': 0.88} {'loss': 0.7322, 'learning_rate': 1.1951826263517079e-05, 'epoch': 0.88} {'loss': 0.7103, 'learning_rate': 1.195150520691896e-05, 'epoch': 0.88} {'loss': 0.6571, 'learning_rate': 1.1951184148229629e-05, 'epoch': 0.88} {'loss': 0.823, 'learning_rate': 1.1950863087449426e-05, 'epoch': 0.88} {'loss': 0.6845, 'learning_rate': 1.1950542024578697e-05, 'epoch': 0.88} {'loss': 0.6955, 'learning_rate': 1.1950220959617786e-05, 'epoch': 0.88} {'loss': 0.7135, 'learning_rate': 1.1949899892567041e-05, 'epoch': 0.88} {'loss': 0.8454, 'learning_rate': 1.1949578823426801e-05, 'epoch': 0.88} {'loss': 0.7685, 'learning_rate': 1.1949257752197409e-05, 'epoch': 0.88} {'loss': 0.7664, 'learning_rate': 1.1948936678879213e-05, 'epoch': 0.88} {'loss': 0.6565, 'learning_rate': 1.1948615603472556e-05, 'epoch': 0.88} {'loss': 0.8312, 'learning_rate': 1.194829452597778e-05, 'epoch': 0.88} {'loss': 0.8404, 'learning_rate': 1.1947973446395231e-05, 'epoch': 0.88} {'loss': 0.9115, 'learning_rate': 1.1947652364725253e-05, 'epoch': 0.88} {'loss': 0.8715, 'learning_rate': 1.194733128096819e-05, 'epoch': 0.88} {'loss': 0.6727, 'learning_rate': 1.1947010195124385e-05, 'epoch': 0.88} {'loss': 0.8125, 'learning_rate': 1.1946689107194183e-05, 'epoch': 0.88} {'loss': 0.8525, 'learning_rate': 1.1946368017177927e-05, 'epoch': 0.88} {'loss': 0.9405, 'learning_rate': 1.1946046925075962e-05, 'epoch': 0.88} {'loss': 0.7545, 'learning_rate': 1.1945725830888635e-05, 'epoch': 0.88} {'loss': 0.7169, 'learning_rate': 1.1945404734616286e-05, 'epoch': 0.88} {'loss': 0.6698, 'learning_rate': 1.1945083636259258e-05, 'epoch': 0.88} {'loss': 0.8109, 'learning_rate': 1.19447625358179e-05, 'epoch': 0.88} {'loss': 0.8718, 'learning_rate': 1.1944441433292551e-05, 'epoch': 0.88} {'loss': 0.7079, 'learning_rate': 1.1944120328683557e-05, 'epoch': 0.88} {'loss': 0.745, 'learning_rate': 1.1943799221991264e-05, 'epoch': 0.88} {'loss': 0.952, 'learning_rate': 1.1943478113216016e-05, 'epoch': 0.88} {'loss': 0.9437, 'learning_rate': 1.1943157002358157e-05, 'epoch': 0.88} {'loss': 0.885, 'learning_rate': 1.1942835889418028e-05, 'epoch': 0.88} {'loss': 0.8554, 'learning_rate': 1.1942514774395972e-05, 'epoch': 0.88} {'loss': 0.7412, 'learning_rate': 1.194219365729234e-05, 'epoch': 0.88} {'loss': 0.8442, 'learning_rate': 1.194187253810747e-05, 'epoch': 0.88} {'loss': 0.8154, 'learning_rate': 1.194155141684171e-05, 'epoch': 0.88} {'loss': 0.6896, 'learning_rate': 1.19412302934954e-05, 'epoch': 0.88} {'loss': 0.7318, 'learning_rate': 1.1940909168068893e-05, 'epoch': 0.88} {'loss': 0.7053, 'learning_rate': 1.194058804056252e-05, 'epoch': 0.88} {'loss': 0.8663, 'learning_rate': 1.1940266910976632e-05, 'epoch': 0.88} {'loss': 0.7948, 'learning_rate': 1.1939945779311574e-05, 'epoch': 0.88} {'loss': 0.7567, 'learning_rate': 1.193962464556769e-05, 'epoch': 0.88} {'loss': 0.832, 'learning_rate': 1.1939303509745323e-05, 'epoch': 0.88} {'loss': 0.8128, 'learning_rate': 1.1938982371844815e-05, 'epoch': 0.88} {'loss': 0.9806, 'learning_rate': 1.1938661231866517e-05, 'epoch': 0.88} {'loss': 0.959, 'learning_rate': 1.1938340089810768e-05, 'epoch': 0.88} {'loss': 0.9385, 'learning_rate': 1.1938018945677907e-05, 'epoch': 0.88} {'loss': 0.7711, 'learning_rate': 1.1937697799468286e-05, 'epoch': 0.88} {'loss': 0.8447, 'learning_rate': 1.1937376651182251e-05, 'epoch': 0.88} {'loss': 0.901, 'learning_rate': 1.1937055500820137e-05, 'epoch': 0.88} {'loss': 0.7194, 'learning_rate': 1.1936734348382297e-05, 'epoch': 0.88} {'loss': 0.8116, 'learning_rate': 1.1936413193869072e-05, 'epoch': 0.88} {'loss': 0.7315, 'learning_rate': 1.1936092037280802e-05, 'epoch': 0.88} {'loss': 0.759, 'learning_rate': 1.1935770878617833e-05, 'epoch': 0.88} {'loss': 0.7137, 'learning_rate': 1.1935449717880516e-05, 'epoch': 0.88} {'loss': 0.6776, 'learning_rate': 1.1935128555069188e-05, 'epoch': 0.88} {'loss': 0.791, 'learning_rate': 1.1934807390184193e-05, 'epoch': 0.88} {'loss': 0.8988, 'learning_rate': 1.1934486223225883e-05, 'epoch': 0.88} {'loss': 0.7072, 'learning_rate': 1.193416505419459e-05, 'epoch': 0.88} {'loss': 0.9041, 'learning_rate': 1.1933843883090667e-05, 'epoch': 0.88} {'loss': 0.8605, 'learning_rate': 1.1933522709914456e-05, 'epoch': 0.88} {'loss': 0.838, 'learning_rate': 1.1933201534666301e-05, 'epoch': 0.88} {'loss': 0.7756, 'learning_rate': 1.1932880357346545e-05, 'epoch': 0.88} {'loss': 0.7702, 'learning_rate': 1.1932559177955533e-05, 'epoch': 0.88} {'loss': 0.8026, 'learning_rate': 1.1932237996493612e-05, 'epoch': 0.88} {'loss': 0.6654, 'learning_rate': 1.1931916812961122e-05, 'epoch': 0.88} {'loss': 0.7323, 'learning_rate': 1.1931595627358407e-05, 'epoch': 0.88} {'loss': 0.7917, 'learning_rate': 1.1931274439685815e-05, 'epoch': 0.88} {'loss': 0.85, 'learning_rate': 1.193095324994369e-05, 'epoch': 0.88} {'loss': 0.8629, 'learning_rate': 1.1930632058132369e-05, 'epoch': 0.88} {'loss': 0.8065, 'learning_rate': 1.1930310864252206e-05, 'epoch': 0.88} {'loss': 0.8358, 'learning_rate': 1.1929989668303541e-05, 'epoch': 0.88} {'loss': 0.749, 'learning_rate': 1.1929668470286715e-05, 'epoch': 0.88} {'loss': 0.853, 'learning_rate': 1.1929347270202078e-05, 'epoch': 0.88} {'loss': 0.8022, 'learning_rate': 1.192902606804997e-05, 'epoch': 0.88} {'loss': 0.77, 'learning_rate': 1.1928704863830733e-05, 'epoch': 0.88} {'loss': 0.7459, 'learning_rate': 1.1928383657544717e-05, 'epoch': 0.88} {'loss': 0.7633, 'learning_rate': 1.1928062449192264e-05, 'epoch': 0.88} {'loss': 0.7546, 'learning_rate': 1.192774123877372e-05, 'epoch': 0.88} {'loss': 0.8558, 'learning_rate': 1.192742002628943e-05, 'epoch': 0.88} {'loss': 0.7878, 'learning_rate': 1.1927098811739728e-05, 'epoch': 0.88} {'loss': 0.8203, 'learning_rate': 1.192677759512497e-05, 'epoch': 0.88} {'loss': 0.8978, 'learning_rate': 1.1926456376445494e-05, 'epoch': 0.88} {'loss': 0.9247, 'learning_rate': 1.1926135155701645e-05, 'epoch': 0.88} {'loss': 0.9222, 'learning_rate': 1.1925813932893771e-05, 'epoch': 0.88} {'loss': 0.8323, 'learning_rate': 1.1925492708022214e-05, 'epoch': 0.88} {'loss': 0.7763, 'learning_rate': 1.1925171481087319e-05, 'epoch': 0.88} {'loss': 0.7516, 'learning_rate': 1.1924850252089426e-05, 'epoch': 0.88} {'loss': 0.8048, 'learning_rate': 1.192452902102888e-05, 'epoch': 0.88} {'loss': 0.8174, 'learning_rate': 1.1924207787906032e-05, 'epoch': 0.88} {'loss': 0.9031, 'learning_rate': 1.1923886552721217e-05, 'epoch': 0.88} {'loss': 0.8407, 'learning_rate': 1.192356531547479e-05, 'epoch': 0.88} {'loss': 0.8288, 'learning_rate': 1.1923244076167086e-05, 'epoch': 0.88} {'loss': 0.8997, 'learning_rate': 1.1922922834798453e-05, 'epoch': 0.88} {'loss': 0.6927, 'learning_rate': 1.1922601591369235e-05, 'epoch': 0.88} {'loss': 0.8708, 'learning_rate': 1.1922280345879773e-05, 'epoch': 0.88} {'loss': 0.8043, 'learning_rate': 1.1921959098330415e-05, 'epoch': 0.88} {'loss': 0.8047, 'learning_rate': 1.1921637848721506e-05, 'epoch': 0.88} {'loss': 0.7704, 'learning_rate': 1.192131659705339e-05, 'epoch': 0.88} {'loss': 0.7104, 'learning_rate': 1.1920995343326409e-05, 'epoch': 0.88} {'loss': 0.891, 'learning_rate': 1.1920674087540907e-05, 'epoch': 0.88} {'loss': 0.7814, 'learning_rate': 1.1920352829697228e-05, 'epoch': 0.88} {'loss': 0.6545, 'learning_rate': 1.1920031569795719e-05, 'epoch': 0.88} {'loss': 0.8437, 'learning_rate': 1.1919710307836723e-05, 'epoch': 0.88} {'loss': 0.6837, 'learning_rate': 1.1919389043820582e-05, 'epoch': 0.88} {'loss': 0.8441, 'learning_rate': 1.1919067777747647e-05, 'epoch': 0.88} {'loss': 0.7645, 'learning_rate': 1.1918746509618258e-05, 'epoch': 0.88} {'loss': 0.7184, 'learning_rate': 1.1918425239432754e-05, 'epoch': 0.88} {'loss': 0.7548, 'learning_rate': 1.1918103967191486e-05, 'epoch': 0.88} {'loss': 0.8016, 'learning_rate': 1.1917782692894795e-05, 'epoch': 0.88} {'loss': 0.6017, 'learning_rate': 1.1917461416543028e-05, 'epoch': 0.88} {'loss': 0.6123, 'learning_rate': 1.1917140138136531e-05, 'epoch': 0.88} {'loss': 0.8203, 'learning_rate': 1.1916818857675644e-05, 'epoch': 0.88} {'loss': 0.7412, 'learning_rate': 1.191649757516071e-05, 'epoch': 0.88} {'loss': 0.7605, 'learning_rate': 1.1916176290592078e-05, 'epoch': 0.88} {'loss': 0.8237, 'learning_rate': 1.191585500397009e-05, 'epoch': 0.88} {'loss': 0.9382, 'learning_rate': 1.1915533715295089e-05, 'epoch': 0.88} {'loss': 0.776, 'learning_rate': 1.1915212424567421e-05, 'epoch': 0.88} {'loss': 0.7748, 'learning_rate': 1.191489113178743e-05, 'epoch': 0.88} {'loss': 0.9218, 'learning_rate': 1.191456983695546e-05, 'epoch': 0.88} {'loss': 0.6987, 'learning_rate': 1.191424854007186e-05, 'epoch': 0.88} {'loss': 0.6101, 'learning_rate': 1.1913927241136967e-05, 'epoch': 0.88} {'loss': 0.9362, 'learning_rate': 1.1913605940151126e-05, 'epoch': 0.88} {'loss': 0.7642, 'learning_rate': 1.1913284637114686e-05, 'epoch': 0.88} {'loss': 0.6953, 'learning_rate': 1.1912963332027987e-05, 'epoch': 0.88} {'loss': 0.832, 'learning_rate': 1.1912642024891376e-05, 'epoch': 0.88} {'loss': 0.8262, 'learning_rate': 1.1912320715705197e-05, 'epoch': 0.88} {'loss': 0.8638, 'learning_rate': 1.1911999404469794e-05, 'epoch': 0.88} {'loss': 0.8818, 'learning_rate': 1.191167809118551e-05, 'epoch': 0.88} {'loss': 0.8191, 'learning_rate': 1.1911356775852692e-05, 'epoch': 0.88} {'loss': 0.7339, 'learning_rate': 1.1911035458471683e-05, 'epoch': 0.88} {'loss': 0.724, 'learning_rate': 1.1910714139042824e-05, 'epoch': 0.88} {'loss': 0.7969, 'learning_rate': 1.1910392817566463e-05, 'epoch': 0.88} {'loss': 0.8181, 'learning_rate': 1.1910071494042944e-05, 'epoch': 0.88} {'loss': 0.8444, 'learning_rate': 1.1909750168472614e-05, 'epoch': 0.88} {'loss': 0.7277, 'learning_rate': 1.190942884085581e-05, 'epoch': 0.88} {'loss': 0.898, 'learning_rate': 1.1909107511192886e-05, 'epoch': 0.88} {'loss': 0.9145, 'learning_rate': 1.1908786179484176e-05, 'epoch': 0.88} {'loss': 0.7811, 'learning_rate': 1.190846484573003e-05, 'epoch': 0.88} {'loss': 0.8488, 'learning_rate': 1.1908143509930792e-05, 'epoch': 0.88} {'loss': 0.811, 'learning_rate': 1.190782217208681e-05, 'epoch': 0.88} {'loss': 0.7271, 'learning_rate': 1.190750083219842e-05, 'epoch': 0.88} {'loss': 0.9432, 'learning_rate': 1.1907179490265973e-05, 'epoch': 0.88} {'loss': 0.8676, 'learning_rate': 1.1906858146289808e-05, 'epoch': 0.88} {'loss': 0.7528, 'learning_rate': 1.1906536800270275e-05, 'epoch': 0.88} {'loss': 0.6888, 'learning_rate': 1.1906215452207713e-05, 'epoch': 0.88} {'loss': 0.7902, 'learning_rate': 1.190589410210247e-05, 'epoch': 0.88} {'loss': 0.8114, 'learning_rate': 1.1905572749954893e-05, 'epoch': 0.88} {'loss': 0.7942, 'learning_rate': 1.1905251395765318e-05, 'epoch': 0.88} {'loss': 0.8706, 'learning_rate': 1.19049300395341e-05, 'epoch': 0.88} {'loss': 0.8684, 'learning_rate': 1.190460868126157e-05, 'epoch': 0.88} {'loss': 0.8368, 'learning_rate': 1.1904287320948085e-05, 'epoch': 0.88} {'loss': 0.76, 'learning_rate': 1.1903965958593984e-05, 'epoch': 0.88} {'loss': 0.9371, 'learning_rate': 1.1903644594199609e-05, 'epoch': 0.88} {'loss': 0.6863, 'learning_rate': 1.1903323227765311e-05, 'epoch': 0.88} {'loss': 0.9357, 'learning_rate': 1.190300185929143e-05, 'epoch': 0.88} {'loss': 0.6782, 'learning_rate': 1.1902680488778306e-05, 'epoch': 0.88} {'loss': 0.7506, 'learning_rate': 1.1902359116226293e-05, 'epoch': 0.88} {'loss': 0.6863, 'learning_rate': 1.1902037741635726e-05, 'epoch': 0.88} {'loss': 0.7674, 'learning_rate': 1.1901716365006957e-05, 'epoch': 0.88} {'loss': 0.796, 'learning_rate': 1.1901394986340324e-05, 'epoch': 0.88} {'loss': 0.7133, 'learning_rate': 1.190107360563618e-05, 'epoch': 0.88} {'loss': 0.7406, 'learning_rate': 1.1900752222894862e-05, 'epoch': 0.88} {'loss': 0.8497, 'learning_rate': 1.1900430838116717e-05, 'epoch': 0.88} {'loss': 0.6574, 'learning_rate': 1.1900109451302086e-05, 'epoch': 0.88} {'loss': 0.7837, 'learning_rate': 1.1899788062451317e-05, 'epoch': 0.88} {'loss': 0.8582, 'learning_rate': 1.1899466671564755e-05, 'epoch': 0.88} {'loss': 0.835, 'learning_rate': 1.1899145278642742e-05, 'epoch': 0.88} {'loss': 0.7499, 'learning_rate': 1.1898823883685625e-05, 'epoch': 0.88} {'loss': 0.7784, 'learning_rate': 1.1898502486693746e-05, 'epoch': 0.88} {'loss': 0.6499, 'learning_rate': 1.1898181087667451e-05, 'epoch': 0.88} {'loss': 0.6696, 'learning_rate': 1.189785968660708e-05, 'epoch': 0.88} {'loss': 0.9074, 'learning_rate': 1.1897538283512984e-05, 'epoch': 0.88} {'loss': 0.7555, 'learning_rate': 1.1897216878385505e-05, 'epoch': 0.88} {'loss': 0.8099, 'learning_rate': 1.1896895471224987e-05, 'epoch': 0.88} {'loss': 0.9109, 'learning_rate': 1.1896574062031771e-05, 'epoch': 0.88} {'loss': 0.5982, 'learning_rate': 1.189625265080621e-05, 'epoch': 0.88} {'loss': 0.8135, 'learning_rate': 1.1895931237548639e-05, 'epoch': 0.88} {'loss': 0.6395, 'learning_rate': 1.1895609822259408e-05, 'epoch': 0.88} {'loss': 0.8188, 'learning_rate': 1.1895288404938859e-05, 'epoch': 0.88} {'loss': 0.7641, 'learning_rate': 1.189496698558734e-05, 'epoch': 0.88} {'loss': 0.9801, 'learning_rate': 1.189464556420519e-05, 'epoch': 0.88} {'loss': 0.7845, 'learning_rate': 1.1894324140792759e-05, 'epoch': 0.88} {'loss': 0.8211, 'learning_rate': 1.1894002715350385e-05, 'epoch': 0.88} {'loss': 0.8159, 'learning_rate': 1.1893681287878419e-05, 'epoch': 0.88} {'loss': 0.8118, 'learning_rate': 1.18933598583772e-05, 'epoch': 0.88} {'loss': 0.6021, 'learning_rate': 1.1893038426847078e-05, 'epoch': 0.88} {'loss': 0.5644, 'learning_rate': 1.1892716993288394e-05, 'epoch': 0.88} {'loss': 0.6329, 'learning_rate': 1.1892395557701491e-05, 'epoch': 0.88} {'loss': 0.8149, 'learning_rate': 1.1892074120086719e-05, 'epoch': 0.88} {'loss': 0.6092, 'learning_rate': 1.1891752680444415e-05, 'epoch': 0.88} {'loss': 0.8929, 'learning_rate': 1.1891431238774926e-05, 'epoch': 0.88} {'loss': 0.7805, 'learning_rate': 1.1891109795078601e-05, 'epoch': 0.88} {'loss': 0.6074, 'learning_rate': 1.1890788349355781e-05, 'epoch': 0.88} {'loss': 0.9081, 'learning_rate': 1.189046690160681e-05, 'epoch': 0.88} {'loss': 0.8041, 'learning_rate': 1.1890145451832034e-05, 'epoch': 0.88} {'loss': 0.6524, 'learning_rate': 1.1889824000031796e-05, 'epoch': 0.88} {'loss': 0.66, 'learning_rate': 1.1889502546206439e-05, 'epoch': 0.88} {'loss': 0.8529, 'learning_rate': 1.1889181090356312e-05, 'epoch': 0.88} {'loss': 0.7149, 'learning_rate': 1.1888859632481757e-05, 'epoch': 0.88} {'loss': 0.765, 'learning_rate': 1.1888538172583118e-05, 'epoch': 0.88} {'loss': 0.9152, 'learning_rate': 1.1888216710660739e-05, 'epoch': 0.88} {'loss': 0.8153, 'learning_rate': 1.1887895246714964e-05, 'epoch': 0.88} {'loss': 0.9012, 'learning_rate': 1.1887573780746142e-05, 'epoch': 0.88} {'loss': 0.8665, 'learning_rate': 1.1887252312754614e-05, 'epoch': 0.88} {'loss': 0.8876, 'learning_rate': 1.1886930842740725e-05, 'epoch': 0.88} {'loss': 0.9452, 'learning_rate': 1.1886609370704818e-05, 'epoch': 0.88} {'loss': 0.7476, 'learning_rate': 1.1886287896647238e-05, 'epoch': 0.88} {'loss': 0.9218, 'learning_rate': 1.188596642056833e-05, 'epoch': 0.88} {'loss': 0.7417, 'learning_rate': 1.188564494246844e-05, 'epoch': 0.88} {'loss': 0.7555, 'learning_rate': 1.188532346234791e-05, 'epoch': 0.88} {'loss': 0.9358, 'learning_rate': 1.188500198020709e-05, 'epoch': 0.88} {'loss': 0.7281, 'learning_rate': 1.1884680496046316e-05, 'epoch': 0.88} {'loss': 0.8192, 'learning_rate': 1.1884359009865939e-05, 'epoch': 0.88} {'loss': 0.7427, 'learning_rate': 1.1884037521666299e-05, 'epoch': 0.88} {'loss': 0.8156, 'learning_rate': 1.1883716031447743e-05, 'epoch': 0.88} {'loss': 0.6575, 'learning_rate': 1.1883394539210617e-05, 'epoch': 0.88} {'loss': 0.7389, 'learning_rate': 1.1883073044955262e-05, 'epoch': 0.88} {'loss': 0.8404, 'learning_rate': 1.1882751548682028e-05, 'epoch': 0.88} {'loss': 0.6842, 'learning_rate': 1.188243005039125e-05, 'epoch': 0.88} {'loss': 0.9102, 'learning_rate': 1.1882108550083284e-05, 'epoch': 0.88} {'loss': 0.8409, 'learning_rate': 1.1881787047758463e-05, 'epoch': 0.88} {'loss': 0.7504, 'learning_rate': 1.188146554341714e-05, 'epoch': 0.88} {'loss': 0.9614, 'learning_rate': 1.1881144037059659e-05, 'epoch': 0.88} {'loss': 0.7246, 'learning_rate': 1.1880822528686365e-05, 'epoch': 0.88} {'loss': 0.712, 'learning_rate': 1.1880501018297594e-05, 'epoch': 0.88} {'loss': 0.8483, 'learning_rate': 1.1880179505893697e-05, 'epoch': 0.88} {'loss': 0.9011, 'learning_rate': 1.187985799147502e-05, 'epoch': 0.88} {'loss': 0.7072, 'learning_rate': 1.1879536475041902e-05, 'epoch': 0.88} {'loss': 0.8798, 'learning_rate': 1.1879214956594694e-05, 'epoch': 0.88} {'loss': 0.8158, 'learning_rate': 1.1878893436133737e-05, 'epoch': 0.88} {'loss': 0.9133, 'learning_rate': 1.1878571913659377e-05, 'epoch': 0.88} {'loss': 0.8701, 'learning_rate': 1.1878250389171958e-05, 'epoch': 0.88} {'loss': 0.6824, 'learning_rate': 1.1877928862671823e-05, 'epoch': 0.88} {'loss': 0.7042, 'learning_rate': 1.1877607334159316e-05, 'epoch': 0.88} {'loss': 0.9912, 'learning_rate': 1.1877285803634785e-05, 'epoch': 0.88} {'loss': 0.8362, 'learning_rate': 1.1876964271098571e-05, 'epoch': 0.88} {'loss': 0.6614, 'learning_rate': 1.1876642736551025e-05, 'epoch': 0.88} {'loss': 0.8892, 'learning_rate': 1.1876321199992486e-05, 'epoch': 0.88} {'loss': 0.7879, 'learning_rate': 1.1875999661423297e-05, 'epoch': 0.88} {'loss': 0.5961, 'learning_rate': 1.1875678120843806e-05, 'epoch': 0.88} {'loss': 0.8416, 'learning_rate': 1.1875356578254356e-05, 'epoch': 0.88} {'loss': 0.784, 'learning_rate': 1.187503503365529e-05, 'epoch': 0.88} {'loss': 0.8484, 'learning_rate': 1.1874713487046959e-05, 'epoch': 0.88} {'loss': 0.6555, 'learning_rate': 1.1874391938429701e-05, 'epoch': 0.88} {'loss': 0.7245, 'learning_rate': 1.1874070387803864e-05, 'epoch': 0.88} {'loss': 0.8593, 'learning_rate': 1.1873748835169791e-05, 'epoch': 0.88} {'loss': 0.8193, 'learning_rate': 1.1873427280527826e-05, 'epoch': 0.88} {'loss': 0.8741, 'learning_rate': 1.1873105723878316e-05, 'epoch': 0.88} {'loss': 0.7984, 'learning_rate': 1.1872784165221605e-05, 'epoch': 0.88} {'loss': 0.8183, 'learning_rate': 1.1872462604558033e-05, 'epoch': 0.88} {'loss': 0.8465, 'learning_rate': 1.1872141041887951e-05, 'epoch': 0.88} {'loss': 0.849, 'learning_rate': 1.18718194772117e-05, 'epoch': 0.88} {'loss': 0.807, 'learning_rate': 1.1871497910529629e-05, 'epoch': 0.88} {'loss': 0.7409, 'learning_rate': 1.1871176341842074e-05, 'epoch': 0.88} {'loss': 0.742, 'learning_rate': 1.1870854771149387e-05, 'epoch': 0.88} {'loss': 0.6945, 'learning_rate': 1.187053319845191e-05, 'epoch': 0.88} {'loss': 0.8092, 'learning_rate': 1.1870211623749987e-05, 'epoch': 0.88} {'loss': 0.8621, 'learning_rate': 1.1869890047043967e-05, 'epoch': 0.88} {'loss': 0.8256, 'learning_rate': 1.1869568468334188e-05, 'epoch': 0.88} {'loss': 0.7392, 'learning_rate': 1.1869246887620998e-05, 'epoch': 0.88} {'loss': 0.8696, 'learning_rate': 1.186892530490474e-05, 'epoch': 0.88} {'loss': 0.8272, 'learning_rate': 1.1868603720185762e-05, 'epoch': 0.88} {'loss': 0.8765, 'learning_rate': 1.1868282133464403e-05, 'epoch': 0.88} {'loss': 0.7673, 'learning_rate': 1.1867960544741015e-05, 'epoch': 0.88} {'loss': 0.9053, 'learning_rate': 1.1867638954015938e-05, 'epoch': 0.88} {'loss': 0.7481, 'learning_rate': 1.1867317361289517e-05, 'epoch': 0.88} {'loss': 0.8131, 'learning_rate': 1.1866995766562095e-05, 'epoch': 0.88} {'loss': 0.7438, 'learning_rate': 1.1866674169834023e-05, 'epoch': 0.88} {'loss': 0.8562, 'learning_rate': 1.1866352571105636e-05, 'epoch': 0.88} {'loss': 0.7641, 'learning_rate': 1.1866030970377285e-05, 'epoch': 0.88} {'loss': 0.8251, 'learning_rate': 1.1865709367649315e-05, 'epoch': 0.88} {'loss': 0.6712, 'learning_rate': 1.186538776292207e-05, 'epoch': 0.88} {'loss': 0.7892, 'learning_rate': 1.186506615619589e-05, 'epoch': 0.88} {'loss': 0.7512, 'learning_rate': 1.1864744547471128e-05, 'epoch': 0.88} {'loss': 0.7711, 'learning_rate': 1.1864422936748122e-05, 'epoch': 0.88} {'loss': 0.7046, 'learning_rate': 1.1864101324027216e-05, 'epoch': 0.88} {'loss': 0.7194, 'learning_rate': 1.1863779709308759e-05, 'epoch': 0.88} {'loss': 0.6513, 'learning_rate': 1.1863458092593092e-05, 'epoch': 0.88} {'loss': 0.8521, 'learning_rate': 1.1863136473880565e-05, 'epoch': 0.88} {'loss': 0.7948, 'learning_rate': 1.1862814853171516e-05, 'epoch': 0.88} {'loss': 0.7218, 'learning_rate': 1.1862493230466297e-05, 'epoch': 0.88} {'loss': 0.8463, 'learning_rate': 1.1862171605765245e-05, 'epoch': 0.88} {'loss': 0.7543, 'learning_rate': 1.1861849979068707e-05, 'epoch': 0.88} {'loss': 0.9084, 'learning_rate': 1.186152835037703e-05, 'epoch': 0.88} {'loss': 0.7331, 'learning_rate': 1.1861206719690557e-05, 'epoch': 0.88} {'loss': 0.6946, 'learning_rate': 1.1860885087009634e-05, 'epoch': 0.88} {'loss': 0.7595, 'learning_rate': 1.1860563452334606e-05, 'epoch': 0.88} {'loss': 0.7609, 'learning_rate': 1.1860241815665814e-05, 'epoch': 0.88} {'loss': 0.7795, 'learning_rate': 1.1859920177003605e-05, 'epoch': 0.88} {'loss': 0.768, 'learning_rate': 1.1859598536348325e-05, 'epoch': 0.88} {'loss': 0.8409, 'learning_rate': 1.1859276893700315e-05, 'epoch': 0.88} {'loss': 0.7616, 'learning_rate': 1.1858955249059924e-05, 'epoch': 0.88} {'loss': 0.6825, 'learning_rate': 1.1858633602427497e-05, 'epoch': 0.88} {'loss': 0.6703, 'learning_rate': 1.1858311953803374e-05, 'epoch': 0.88} {'loss': 0.8123, 'learning_rate': 1.1857990303187901e-05, 'epoch': 0.88} {'loss': 0.805, 'learning_rate': 1.1857668650581425e-05, 'epoch': 0.88} {'loss': 0.8679, 'learning_rate': 1.1857346995984287e-05, 'epoch': 0.88} {'loss': 0.7504, 'learning_rate': 1.1857025339396836e-05, 'epoch': 0.88} {'loss': 0.9013, 'learning_rate': 1.1856703680819414e-05, 'epoch': 0.88} {'loss': 0.9922, 'learning_rate': 1.1856382020252371e-05, 'epoch': 0.88} {'loss': 0.6212, 'learning_rate': 1.1856060357696043e-05, 'epoch': 0.88} {'loss': 0.7359, 'learning_rate': 1.1855738693150776e-05, 'epoch': 0.88} {'loss': 0.704, 'learning_rate': 1.185541702661692e-05, 'epoch': 0.88} {'loss': 0.6932, 'learning_rate': 1.1855095358094817e-05, 'epoch': 0.88} {'loss': 0.697, 'learning_rate': 1.185477368758481e-05, 'epoch': 0.88} {'loss': 0.9784, 'learning_rate': 1.1854452015087253e-05, 'epoch': 0.88} {'loss': 0.7904, 'learning_rate': 1.185413034060248e-05, 'epoch': 0.88} {'loss': 0.6349, 'learning_rate': 1.1853808664130834e-05, 'epoch': 0.88} {'loss': 0.9333, 'learning_rate': 1.1853486985672668e-05, 'epoch': 0.88} {'loss': 0.7486, 'learning_rate': 1.1853165305228322e-05, 'epoch': 0.88} {'loss': 0.9584, 'learning_rate': 1.1852843622798144e-05, 'epoch': 0.88} {'loss': 0.9764, 'learning_rate': 1.1852521938382477e-05, 'epoch': 0.88} {'loss': 0.7627, 'learning_rate': 1.1852200251981665e-05, 'epoch': 0.88} {'loss': 0.8369, 'learning_rate': 1.1851878563596056e-05, 'epoch': 0.88} {'loss': 0.632, 'learning_rate': 1.1851556873225989e-05, 'epoch': 0.88} {'loss': 0.4987, 'learning_rate': 1.1851235180871809e-05, 'epoch': 0.88} {'loss': 0.7839, 'learning_rate': 1.1850913486533866e-05, 'epoch': 0.88} {'loss': 0.7456, 'learning_rate': 1.1850591790212505e-05, 'epoch': 0.88} {'loss': 0.6727, 'learning_rate': 1.1850270091908064e-05, 'epoch': 0.89} {'loss': 0.8129, 'learning_rate': 1.1849948391620893e-05, 'epoch': 0.89} {'loss': 0.7471, 'learning_rate': 1.1849626689351337e-05, 'epoch': 0.89} {'loss': 0.6913, 'learning_rate': 1.1849304985099737e-05, 'epoch': 0.89} {'loss': 0.7535, 'learning_rate': 1.184898327886644e-05, 'epoch': 0.89} {'loss': 1.1067, 'learning_rate': 1.184866157065179e-05, 'epoch': 0.89} {'loss': 0.7828, 'learning_rate': 1.1848339860456132e-05, 'epoch': 0.89} {'loss': 0.8217, 'learning_rate': 1.1848018148279812e-05, 'epoch': 0.89} {'loss': 0.6736, 'learning_rate': 1.1847696434123172e-05, 'epoch': 0.89} {'loss': 0.7207, 'learning_rate': 1.1847374717986565e-05, 'epoch': 0.89} {'loss': 0.9932, 'learning_rate': 1.1847052999870323e-05, 'epoch': 0.89} {'loss': 0.794, 'learning_rate': 1.1846731279774797e-05, 'epoch': 0.89} {'loss': 0.7991, 'learning_rate': 1.1846409557700333e-05, 'epoch': 0.89} {'loss': 0.5365, 'learning_rate': 1.1846087833647275e-05, 'epoch': 0.89} {'loss': 0.9401, 'learning_rate': 1.1845766107615968e-05, 'epoch': 0.89} {'loss': 0.7763, 'learning_rate': 1.1845444379606757e-05, 'epoch': 0.89} {'loss': 0.6767, 'learning_rate': 1.1845122649619982e-05, 'epoch': 0.89} {'loss': 0.6661, 'learning_rate': 1.1844800917655992e-05, 'epoch': 0.89} {'loss': 0.7558, 'learning_rate': 1.1844479183715133e-05, 'epoch': 0.89} {'loss': 0.6712, 'learning_rate': 1.1844157447797749e-05, 'epoch': 0.89} {'loss': 0.7998, 'learning_rate': 1.184383570990418e-05, 'epoch': 0.89} {'loss': 0.8228, 'learning_rate': 1.1843513970034779e-05, 'epoch': 0.89} {'loss': 0.7824, 'learning_rate': 1.1843192228189887e-05, 'epoch': 0.89} {'loss': 0.8235, 'learning_rate': 1.1842870484369844e-05, 'epoch': 0.89} {'loss': 0.9112, 'learning_rate': 1.1842548738575002e-05, 'epoch': 0.89} {'loss': 0.8029, 'learning_rate': 1.18422269908057e-05, 'epoch': 0.89} {'loss': 0.7001, 'learning_rate': 1.1841905241062288e-05, 'epoch': 0.89} {'loss': 0.8545, 'learning_rate': 1.1841583489345105e-05, 'epoch': 0.89} {'loss': 0.7655, 'learning_rate': 1.1841261735654501e-05, 'epoch': 0.89} {'loss': 0.9285, 'learning_rate': 1.1840939979990822e-05, 'epoch': 0.89} {'loss': 0.7298, 'learning_rate': 1.1840618222354405e-05, 'epoch': 0.89} {'loss': 0.7786, 'learning_rate': 1.1840296462745603e-05, 'epoch': 0.89} {'loss': 0.8807, 'learning_rate': 1.1839974701164755e-05, 'epoch': 0.89} {'loss': 0.7404, 'learning_rate': 1.183965293761221e-05, 'epoch': 0.89} {'loss': 0.8442, 'learning_rate': 1.1839331172088306e-05, 'epoch': 0.89} {'loss': 0.7482, 'learning_rate': 1.1839009404593396e-05, 'epoch': 0.89} {'loss': 0.6201, 'learning_rate': 1.1838687635127823e-05, 'epoch': 0.89} {'loss': 0.9203, 'learning_rate': 1.1838365863691931e-05, 'epoch': 0.89} {'loss': 0.7356, 'learning_rate': 1.1838044090286061e-05, 'epoch': 0.89} {'loss': 0.7199, 'learning_rate': 1.183772231491056e-05, 'epoch': 0.89} {'loss': 0.7568, 'learning_rate': 1.1837400537565775e-05, 'epoch': 0.89} {'loss': 0.8361, 'learning_rate': 1.183707875825205e-05, 'epoch': 0.89} {'loss': 0.7839, 'learning_rate': 1.1836756976969727e-05, 'epoch': 0.89} {'loss': 0.8053, 'learning_rate': 1.1836435193719157e-05, 'epoch': 0.89} {'loss': 0.8838, 'learning_rate': 1.1836113408500682e-05, 'epoch': 0.89} {'loss': 0.7014, 'learning_rate': 1.1835791621314643e-05, 'epoch': 0.89} {'loss': 0.7384, 'learning_rate': 1.1835469832161385e-05, 'epoch': 0.89} {'loss': 0.7557, 'learning_rate': 1.1835148041041258e-05, 'epoch': 0.89} {'loss': 0.7886, 'learning_rate': 1.1834826247954604e-05, 'epoch': 0.89} {'loss': 0.7474, 'learning_rate': 1.1834504452901769e-05, 'epoch': 0.89} {'loss': 0.7374, 'learning_rate': 1.1834182655883097e-05, 'epoch': 0.89} {'loss': 0.9388, 'learning_rate': 1.1833860856898934e-05, 'epoch': 0.89} {'loss': 0.6963, 'learning_rate': 1.183353905594962e-05, 'epoch': 0.89} {'loss': 0.9472, 'learning_rate': 1.1833217253035505e-05, 'epoch': 0.89} {'loss': 0.706, 'learning_rate': 1.1832895448156931e-05, 'epoch': 0.89} {'loss': 0.6631, 'learning_rate': 1.1832573641314244e-05, 'epoch': 0.89} {'loss': 0.8504, 'learning_rate': 1.1832251832507794e-05, 'epoch': 0.89} {'loss': 1.0182, 'learning_rate': 1.1831930021737916e-05, 'epoch': 0.89} {'loss': 0.8373, 'learning_rate': 1.1831608209004962e-05, 'epoch': 0.89} {'loss': 0.9246, 'learning_rate': 1.1831286394309271e-05, 'epoch': 0.89} {'loss': 0.6318, 'learning_rate': 1.1830964577651193e-05, 'epoch': 0.89} {'loss': 0.713, 'learning_rate': 1.183064275903107e-05, 'epoch': 0.89} {'loss': 0.7934, 'learning_rate': 1.1830320938449251e-05, 'epoch': 0.89} {'loss': 0.8219, 'learning_rate': 1.1829999115906077e-05, 'epoch': 0.89} {'loss': 0.6979, 'learning_rate': 1.1829677291401895e-05, 'epoch': 0.89} {'loss': 0.5984, 'learning_rate': 1.1829355464937046e-05, 'epoch': 0.89} {'loss': 0.7961, 'learning_rate': 1.182903363651188e-05, 'epoch': 0.89} {'loss': 0.7727, 'learning_rate': 1.1828711806126735e-05, 'epoch': 0.89} {'loss': 0.7693, 'learning_rate': 1.1828389973781966e-05, 'epoch': 0.89} {'loss': 0.9473, 'learning_rate': 1.1828068139477909e-05, 'epoch': 0.89} {'loss': 0.7732, 'learning_rate': 1.1827746303214911e-05, 'epoch': 0.89} {'loss': 0.7263, 'learning_rate': 1.1827424464993321e-05, 'epoch': 0.89} {'loss': 0.7666, 'learning_rate': 1.1827102624813479e-05, 'epoch': 0.89} {'loss': 0.8761, 'learning_rate': 1.1826780782675731e-05, 'epoch': 0.89} {'loss': 0.5612, 'learning_rate': 1.1826458938580423e-05, 'epoch': 0.89} {'loss': 0.7905, 'learning_rate': 1.18261370925279e-05, 'epoch': 0.89} {'loss': 0.8206, 'learning_rate': 1.1825815244518505e-05, 'epoch': 0.89} {'loss': 0.6467, 'learning_rate': 1.1825493394552585e-05, 'epoch': 0.89} {'loss': 0.6488, 'learning_rate': 1.1825171542630484e-05, 'epoch': 0.89} {'loss': 0.7956, 'learning_rate': 1.1824849688752547e-05, 'epoch': 0.89} {'loss': 0.7433, 'learning_rate': 1.1824527832919119e-05, 'epoch': 0.89} {'loss': 0.7298, 'learning_rate': 1.1824205975130544e-05, 'epoch': 0.89} {'loss': 0.9003, 'learning_rate': 1.182388411538717e-05, 'epoch': 0.89} {'loss': 0.63, 'learning_rate': 1.1823562253689337e-05, 'epoch': 0.89} {'loss': 0.7469, 'learning_rate': 1.1823240390037391e-05, 'epoch': 0.89} {'loss': 0.863, 'learning_rate': 1.1822918524431683e-05, 'epoch': 0.89} {'loss': 0.7468, 'learning_rate': 1.182259665687255e-05, 'epoch': 0.89} {'loss': 0.6638, 'learning_rate': 1.1822274787360344e-05, 'epoch': 0.89} {'loss': 0.7671, 'learning_rate': 1.1821952915895403e-05, 'epoch': 0.89} {'loss': 0.7675, 'learning_rate': 1.1821631042478072e-05, 'epoch': 0.89} {'loss': 0.795, 'learning_rate': 1.1821309167108704e-05, 'epoch': 0.89} {'loss': 0.6799, 'learning_rate': 1.1820987289787636e-05, 'epoch': 0.89} {'loss': 0.6414, 'learning_rate': 1.1820665410515217e-05, 'epoch': 0.89} {'loss': 0.8163, 'learning_rate': 1.1820343529291792e-05, 'epoch': 0.89} {'loss': 1.0546, 'learning_rate': 1.1820021646117702e-05, 'epoch': 0.89} {'loss': 0.6829, 'learning_rate': 1.1819699760993296e-05, 'epoch': 0.89} {'loss': 0.8231, 'learning_rate': 1.1819377873918916e-05, 'epoch': 0.89} {'loss': 0.6263, 'learning_rate': 1.1819055984894909e-05, 'epoch': 0.89} {'loss': 0.8223, 'learning_rate': 1.181873409392162e-05, 'epoch': 0.89} {'loss': 0.6265, 'learning_rate': 1.1818412200999393e-05, 'epoch': 0.89} {'loss': 0.774, 'learning_rate': 1.1818090306128575e-05, 'epoch': 0.89} {'loss': 0.7914, 'learning_rate': 1.1817768409309507e-05, 'epoch': 0.89} {'loss': 0.6229, 'learning_rate': 1.1817446510542537e-05, 'epoch': 0.89} {'loss': 0.8039, 'learning_rate': 1.1817124609828006e-05, 'epoch': 0.89} {'loss': 0.8971, 'learning_rate': 1.1816802707166263e-05, 'epoch': 0.89} {'loss': 0.7648, 'learning_rate': 1.1816480802557658e-05, 'epoch': 0.89} {'loss': 0.7471, 'learning_rate': 1.1816158896002525e-05, 'epoch': 0.89} {'loss': 0.8609, 'learning_rate': 1.1815836987501213e-05, 'epoch': 0.89} {'loss': 0.6025, 'learning_rate': 1.1815515077054069e-05, 'epoch': 0.89} {'loss': 0.8459, 'learning_rate': 1.1815193164661435e-05, 'epoch': 0.89} {'loss': 0.9331, 'learning_rate': 1.1814871250323659e-05, 'epoch': 0.89} {'loss': 0.849, 'learning_rate': 1.1814549334041086e-05, 'epoch': 0.89} {'loss': 0.7169, 'learning_rate': 1.1814227415814059e-05, 'epoch': 0.89} {'loss': 0.8217, 'learning_rate': 1.1813905495642924e-05, 'epoch': 0.89} {'loss': 0.831, 'learning_rate': 1.1813583573528025e-05, 'epoch': 0.89} {'loss': 1.0582, 'learning_rate': 1.1813261649469708e-05, 'epoch': 0.89} {'loss': 0.7478, 'learning_rate': 1.1812939723468313e-05, 'epoch': 0.89} {'loss': 0.847, 'learning_rate': 1.1812617795524192e-05, 'epoch': 0.89} {'loss': 0.5632, 'learning_rate': 1.1812295865637689e-05, 'epoch': 0.89} {'loss': 0.7876, 'learning_rate': 1.181197393380915e-05, 'epoch': 0.89} {'loss': 0.7112, 'learning_rate': 1.1811652000038916e-05, 'epoch': 0.89} {'loss': 0.8081, 'learning_rate': 1.1811330064327331e-05, 'epoch': 0.89} {'loss': 0.8025, 'learning_rate': 1.181100812667474e-05, 'epoch': 0.89} {'loss': 0.7346, 'learning_rate': 1.1810686187081494e-05, 'epoch': 0.89} {'loss': 0.9288, 'learning_rate': 1.1810364245547934e-05, 'epoch': 0.89} {'loss': 0.9365, 'learning_rate': 1.1810042302074404e-05, 'epoch': 0.89} {'loss': 0.7957, 'learning_rate': 1.1809720356661254e-05, 'epoch': 0.89} {'loss': 0.8488, 'learning_rate': 1.1809398409308823e-05, 'epoch': 0.89} {'loss': 0.817, 'learning_rate': 1.1809076460017457e-05, 'epoch': 0.89} {'loss': 0.6193, 'learning_rate': 1.1808754508787503e-05, 'epoch': 0.89} {'loss': 0.834, 'learning_rate': 1.1808432555619305e-05, 'epoch': 0.89} {'loss': 0.6257, 'learning_rate': 1.1808110600513209e-05, 'epoch': 0.89} {'loss': 0.7449, 'learning_rate': 1.180778864346956e-05, 'epoch': 0.89} {'loss': 0.8874, 'learning_rate': 1.18074666844887e-05, 'epoch': 0.89} {'loss': 0.6686, 'learning_rate': 1.180714472357098e-05, 'epoch': 0.89} {'loss': 0.8855, 'learning_rate': 1.1806822760716738e-05, 'epoch': 0.89} {'loss': 0.9218, 'learning_rate': 1.1806500795926323e-05, 'epoch': 0.89} {'loss': 0.7291, 'learning_rate': 1.1806178829200078e-05, 'epoch': 0.89} {'loss': 0.7985, 'learning_rate': 1.1805856860538354e-05, 'epoch': 0.89} {'loss': 0.8333, 'learning_rate': 1.1805534889941489e-05, 'epoch': 0.89} {'loss': 0.7564, 'learning_rate': 1.1805212917409831e-05, 'epoch': 0.89} {'loss': 0.784, 'learning_rate': 1.1804890942943723e-05, 'epoch': 0.89} {'loss': 0.6992, 'learning_rate': 1.180456896654351e-05, 'epoch': 0.89} {'loss': 0.6473, 'learning_rate': 1.180424698820954e-05, 'epoch': 0.89} {'loss': 0.8221, 'learning_rate': 1.180392500794216e-05, 'epoch': 0.89} {'loss': 0.9716, 'learning_rate': 1.1803603025741705e-05, 'epoch': 0.89} {'loss': 0.8309, 'learning_rate': 1.1803281041608529e-05, 'epoch': 0.89} {'loss': 0.9876, 'learning_rate': 1.180295905554298e-05, 'epoch': 0.89} {'loss': 0.9657, 'learning_rate': 1.1802637067545391e-05, 'epoch': 0.89} {'loss': 0.6331, 'learning_rate': 1.1802315077616116e-05, 'epoch': 0.89} {'loss': 0.6344, 'learning_rate': 1.1801993085755498e-05, 'epoch': 0.89} {'loss': 0.7864, 'learning_rate': 1.1801671091963881e-05, 'epoch': 0.89} {'loss': 0.8429, 'learning_rate': 1.180134909624161e-05, 'epoch': 0.89} {'loss': 0.7241, 'learning_rate': 1.1801027098589033e-05, 'epoch': 0.89} {'loss': 0.8531, 'learning_rate': 1.1800705099006494e-05, 'epoch': 0.89} {'loss': 1.0701, 'learning_rate': 1.1800383097494332e-05, 'epoch': 0.89} {'loss': 0.7657, 'learning_rate': 1.18000610940529e-05, 'epoch': 0.89} {'loss': 0.8579, 'learning_rate': 1.1799739088682542e-05, 'epoch': 0.89} {'loss': 0.629, 'learning_rate': 1.1799417081383599e-05, 'epoch': 0.89} {'loss': 0.7507, 'learning_rate': 1.1799095072156417e-05, 'epoch': 0.89} {'loss': 0.7509, 'learning_rate': 1.1798773061001343e-05, 'epoch': 0.89} {'loss': 0.7398, 'learning_rate': 1.1798451047918724e-05, 'epoch': 0.89} {'loss': 0.7561, 'learning_rate': 1.1798129032908898e-05, 'epoch': 0.89} {'loss': 0.7133, 'learning_rate': 1.179780701597222e-05, 'epoch': 0.89} {'loss': 0.8976, 'learning_rate': 1.1797484997109025e-05, 'epoch': 0.89} {'loss': 0.8381, 'learning_rate': 1.1797162976319662e-05, 'epoch': 0.89} {'loss': 0.7641, 'learning_rate': 1.1796840953604478e-05, 'epoch': 0.89} {'loss': 0.7453, 'learning_rate': 1.1796518928963819e-05, 'epoch': 0.89} {'loss': 0.71, 'learning_rate': 1.1796196902398026e-05, 'epoch': 0.89} {'loss': 0.7976, 'learning_rate': 1.1795874873907447e-05, 'epoch': 0.89} {'loss': 0.6715, 'learning_rate': 1.1795552843492425e-05, 'epoch': 0.89} {'loss': 0.7616, 'learning_rate': 1.1795230811153306e-05, 'epoch': 0.89} {'loss': 0.7443, 'learning_rate': 1.1794908776890435e-05, 'epoch': 0.89} {'loss': 0.7703, 'learning_rate': 1.1794586740704155e-05, 'epoch': 0.89} {'loss': 0.8501, 'learning_rate': 1.1794264702594817e-05, 'epoch': 0.89} {'loss': 0.6569, 'learning_rate': 1.179394266256276e-05, 'epoch': 0.89} {'loss': 0.8387, 'learning_rate': 1.1793620620608336e-05, 'epoch': 0.89} {'loss': 0.6965, 'learning_rate': 1.1793298576731882e-05, 'epoch': 0.89} {'loss': 0.7257, 'learning_rate': 1.1792976530933746e-05, 'epoch': 0.89} {'loss': 0.7767, 'learning_rate': 1.1792654483214274e-05, 'epoch': 0.89} {'loss': 0.8859, 'learning_rate': 1.1792332433573812e-05, 'epoch': 0.89} {'loss': 0.8957, 'learning_rate': 1.1792010382012703e-05, 'epoch': 0.89} {'loss': 0.6122, 'learning_rate': 1.1791688328531296e-05, 'epoch': 0.89} {'loss': 0.8686, 'learning_rate': 1.1791366273129932e-05, 'epoch': 0.89} {'loss': 0.7574, 'learning_rate': 1.1791044215808955e-05, 'epoch': 0.89} {'loss': 0.6692, 'learning_rate': 1.1790722156568715e-05, 'epoch': 0.89} {'loss': 0.8927, 'learning_rate': 1.1790400095409554e-05, 'epoch': 0.89} {'loss': 0.794, 'learning_rate': 1.1790078032331816e-05, 'epoch': 0.89} {'loss': 0.7656, 'learning_rate': 1.178975596733585e-05, 'epoch': 0.89} {'loss': 0.7113, 'learning_rate': 1.1789433900421998e-05, 'epoch': 0.89} {'loss': 0.8248, 'learning_rate': 1.1789111831590607e-05, 'epoch': 0.89} {'loss': 0.7169, 'learning_rate': 1.1788789760842018e-05, 'epoch': 0.89} {'loss': 0.8008, 'learning_rate': 1.1788467688176582e-05, 'epoch': 0.89} {'loss': 0.5965, 'learning_rate': 1.1788145613594641e-05, 'epoch': 0.89} {'loss': 0.6104, 'learning_rate': 1.1787823537096542e-05, 'epoch': 0.89} {'loss': 0.9115, 'learning_rate': 1.1787501458682627e-05, 'epoch': 0.89} {'loss': 0.7386, 'learning_rate': 1.1787179378353243e-05, 'epoch': 0.89} {'loss': 0.8819, 'learning_rate': 1.1786857296108735e-05, 'epoch': 0.89} {'loss': 0.6771, 'learning_rate': 1.1786535211949448e-05, 'epoch': 0.89} {'loss': 0.849, 'learning_rate': 1.1786213125875728e-05, 'epoch': 0.89} {'loss': 0.8117, 'learning_rate': 1.178589103788792e-05, 'epoch': 0.89} {'loss': 0.7416, 'learning_rate': 1.1785568947986368e-05, 'epoch': 0.89} {'loss': 0.5584, 'learning_rate': 1.1785246856171417e-05, 'epoch': 0.89} {'loss': 0.8803, 'learning_rate': 1.1784924762443414e-05, 'epoch': 0.89} {'loss': 0.7672, 'learning_rate': 1.1784602666802703e-05, 'epoch': 0.89} {'loss': 0.8614, 'learning_rate': 1.1784280569249626e-05, 'epoch': 0.89} {'loss': 0.8712, 'learning_rate': 1.1783958469784533e-05, 'epoch': 0.89} {'loss': 0.8322, 'learning_rate': 1.1783636368407772e-05, 'epoch': 0.89} {'loss': 0.8294, 'learning_rate': 1.1783314265119679e-05, 'epoch': 0.89} {'loss': 0.697, 'learning_rate': 1.1782992159920603e-05, 'epoch': 0.89} {'loss': 0.7925, 'learning_rate': 1.1782670052810894e-05, 'epoch': 0.89} {'loss': 0.6184, 'learning_rate': 1.178234794379089e-05, 'epoch': 0.89} {'loss': 0.6848, 'learning_rate': 1.178202583286094e-05, 'epoch': 0.89} {'loss': 0.6345, 'learning_rate': 1.178170372002139e-05, 'epoch': 0.89} {'loss': 0.6245, 'learning_rate': 1.1781381605272582e-05, 'epoch': 0.89} {'loss': 0.8063, 'learning_rate': 1.1781059488614861e-05, 'epoch': 0.89} {'loss': 0.8532, 'learning_rate': 1.1780737370048578e-05, 'epoch': 0.89} {'loss': 0.8604, 'learning_rate': 1.1780415249574073e-05, 'epoch': 0.89} {'loss': 0.6655, 'learning_rate': 1.1780093127191689e-05, 'epoch': 0.89} {'loss': 0.6673, 'learning_rate': 1.1779771002901778e-05, 'epoch': 0.89} {'loss': 0.7238, 'learning_rate': 1.1779448876704682e-05, 'epoch': 0.89} {'loss': 0.8634, 'learning_rate': 1.1779126748600744e-05, 'epoch': 0.89} {'loss': 0.8127, 'learning_rate': 1.1778804618590312e-05, 'epoch': 0.89} {'loss': 0.7086, 'learning_rate': 1.1778482486673732e-05, 'epoch': 0.89} {'loss': 0.6881, 'learning_rate': 1.1778160352851345e-05, 'epoch': 0.89} {'loss': 0.8142, 'learning_rate': 1.1777838217123498e-05, 'epoch': 0.89} {'loss': 0.676, 'learning_rate': 1.1777516079490541e-05, 'epoch': 0.89} {'loss': 0.8538, 'learning_rate': 1.1777193939952811e-05, 'epoch': 0.89} {'loss': 0.8259, 'learning_rate': 1.1776871798510658e-05, 'epoch': 0.89} {'loss': 0.9352, 'learning_rate': 1.1776549655164427e-05, 'epoch': 0.89} {'loss': 0.8605, 'learning_rate': 1.1776227509914464e-05, 'epoch': 0.89} {'loss': 0.8017, 'learning_rate': 1.1775905362761112e-05, 'epoch': 0.89} {'loss': 0.705, 'learning_rate': 1.1775583213704718e-05, 'epoch': 0.89} {'loss': 0.6559, 'learning_rate': 1.1775261062745625e-05, 'epoch': 0.89} {'loss': 0.6905, 'learning_rate': 1.177493890988418e-05, 'epoch': 0.89} {'loss': 0.8753, 'learning_rate': 1.1774616755120727e-05, 'epoch': 0.89} {'loss': 0.8043, 'learning_rate': 1.1774294598455612e-05, 'epoch': 0.89} {'loss': 0.8008, 'learning_rate': 1.1773972439889181e-05, 'epoch': 0.89} {'loss': 0.819, 'learning_rate': 1.177365027942178e-05, 'epoch': 0.89} {'loss': 0.73, 'learning_rate': 1.177332811705375e-05, 'epoch': 0.89} {'loss': 0.681, 'learning_rate': 1.1773005952785439e-05, 'epoch': 0.89} {'loss': 0.7799, 'learning_rate': 1.1772683786617194e-05, 'epoch': 0.89} {'loss': 0.8523, 'learning_rate': 1.1772361618549355e-05, 'epoch': 0.89} {'loss': 0.7177, 'learning_rate': 1.1772039448582273e-05, 'epoch': 0.89} {'loss': 0.7647, 'learning_rate': 1.1771717276716292e-05, 'epoch': 0.89} {'loss': 0.8848, 'learning_rate': 1.1771395102951754e-05, 'epoch': 0.89} {'loss': 0.8811, 'learning_rate': 1.1771072927289009e-05, 'epoch': 0.89} {'loss': 0.6536, 'learning_rate': 1.1770750749728395e-05, 'epoch': 0.89} {'loss': 1.1084, 'learning_rate': 1.1770428570270265e-05, 'epoch': 0.89} {'loss': 0.7238, 'learning_rate': 1.177010638891496e-05, 'epoch': 0.89} {'loss': 0.8729, 'learning_rate': 1.1769784205662827e-05, 'epoch': 0.89} {'loss': 0.7677, 'learning_rate': 1.1769462020514209e-05, 'epoch': 0.89} {'loss': 0.7681, 'learning_rate': 1.1769139833469453e-05, 'epoch': 0.89} {'loss': 0.7393, 'learning_rate': 1.1768817644528904e-05, 'epoch': 0.89} {'loss': 0.8871, 'learning_rate': 1.1768495453692909e-05, 'epoch': 0.89} {'loss': 0.8089, 'learning_rate': 1.1768173260961811e-05, 'epoch': 0.89} {'loss': 0.7872, 'learning_rate': 1.1767851066335953e-05, 'epoch': 0.89} {'loss': 0.8028, 'learning_rate': 1.1767528869815688e-05, 'epoch': 0.89} {'loss': 0.6994, 'learning_rate': 1.1767206671401355e-05, 'epoch': 0.89} {'loss': 0.8399, 'learning_rate': 1.1766884471093296e-05, 'epoch': 0.89} {'loss': 0.6988, 'learning_rate': 1.1766562268891864e-05, 'epoch': 0.89} {'loss': 0.7811, 'learning_rate': 1.17662400647974e-05, 'epoch': 0.89} {'loss': 0.7387, 'learning_rate': 1.176591785881025e-05, 'epoch': 0.89} {'loss': 0.6622, 'learning_rate': 1.1765595650930764e-05, 'epoch': 0.89} {'loss': 0.7724, 'learning_rate': 1.1765273441159277e-05, 'epoch': 0.89} {'loss': 0.5794, 'learning_rate': 1.1764951229496146e-05, 'epoch': 0.89} {'loss': 0.7534, 'learning_rate': 1.1764629015941706e-05, 'epoch': 0.89} {'loss': 0.8479, 'learning_rate': 1.1764306800496308e-05, 'epoch': 0.89} {'loss': 0.9369, 'learning_rate': 1.1763984583160294e-05, 'epoch': 0.89} {'loss': 0.7626, 'learning_rate': 1.1763662363934014e-05, 'epoch': 0.89} {'loss': 0.9525, 'learning_rate': 1.1763340142817811e-05, 'epoch': 0.89} {'loss': 0.7804, 'learning_rate': 1.176301791981203e-05, 'epoch': 0.89} {'loss': 0.8489, 'learning_rate': 1.1762695694917014e-05, 'epoch': 0.89} {'loss': 0.849, 'learning_rate': 1.1762373468133113e-05, 'epoch': 0.89} {'loss': 0.8105, 'learning_rate': 1.1762051239460668e-05, 'epoch': 0.89} {'loss': 0.9936, 'learning_rate': 1.1761729008900025e-05, 'epoch': 0.89} {'loss': 0.809, 'learning_rate': 1.1761406776451534e-05, 'epoch': 0.89} {'loss': 0.6899, 'learning_rate': 1.1761084542115533e-05, 'epoch': 0.89} {'loss': 0.6897, 'learning_rate': 1.1760762305892373e-05, 'epoch': 0.89} {'loss': 0.6861, 'learning_rate': 1.1760440067782397e-05, 'epoch': 0.89} {'loss': 0.8151, 'learning_rate': 1.1760117827785949e-05, 'epoch': 0.89} {'loss': 0.6476, 'learning_rate': 1.1759795585903378e-05, 'epoch': 0.89} {'loss': 0.9776, 'learning_rate': 1.1759473342135026e-05, 'epoch': 0.89} {'loss': 0.8221, 'learning_rate': 1.175915109648124e-05, 'epoch': 0.89} {'loss': 0.7697, 'learning_rate': 1.1758828848942363e-05, 'epoch': 0.89} {'loss': 0.8064, 'learning_rate': 1.1758506599518743e-05, 'epoch': 0.89} {'loss': 0.7089, 'learning_rate': 1.1758184348210728e-05, 'epoch': 0.89} {'loss': 0.7923, 'learning_rate': 1.1757862095018658e-05, 'epoch': 0.89} {'loss': 0.8657, 'learning_rate': 1.1757539839942877e-05, 'epoch': 0.89} {'loss': 0.6083, 'learning_rate': 1.1757217582983738e-05, 'epoch': 0.89} {'loss': 0.8184, 'learning_rate': 1.1756895324141578e-05, 'epoch': 0.89} {'loss': 0.8369, 'learning_rate': 1.1756573063416747e-05, 'epoch': 0.89} {'loss': 0.8862, 'learning_rate': 1.175625080080959e-05, 'epoch': 0.89} {'loss': 0.7911, 'learning_rate': 1.1755928536320451e-05, 'epoch': 0.89} {'loss': 0.8569, 'learning_rate': 1.1755606269949678e-05, 'epoch': 0.89} {'loss': 0.6756, 'learning_rate': 1.1755284001697614e-05, 'epoch': 0.89} {'loss': 0.6123, 'learning_rate': 1.1754961731564603e-05, 'epoch': 0.89} {'loss': 0.6979, 'learning_rate': 1.1754639459550991e-05, 'epoch': 0.89} {'loss': 0.7095, 'learning_rate': 1.1754317185657127e-05, 'epoch': 0.89} {'loss': 0.8112, 'learning_rate': 1.1753994909883354e-05, 'epoch': 0.89} {'loss': 0.7451, 'learning_rate': 1.1753672632230017e-05, 'epoch': 0.89} {'loss': 0.6802, 'learning_rate': 1.1753350352697463e-05, 'epoch': 0.89} {'loss': 0.828, 'learning_rate': 1.1753028071286033e-05, 'epoch': 0.89} {'loss': 0.7369, 'learning_rate': 1.1752705787996074e-05, 'epoch': 0.89} {'loss': 0.6322, 'learning_rate': 1.1752383502827936e-05, 'epoch': 0.89} {'loss': 0.9191, 'learning_rate': 1.1752061215781957e-05, 'epoch': 0.89} {'loss': 0.7434, 'learning_rate': 1.1751738926858491e-05, 'epoch': 0.89} {'loss': 0.8, 'learning_rate': 1.1751416636057878e-05, 'epoch': 0.89} {'loss': 0.8632, 'learning_rate': 1.175109434338046e-05, 'epoch': 0.89} {'loss': 0.7807, 'learning_rate': 1.1750772048826589e-05, 'epoch': 0.89} {'loss': 0.8957, 'learning_rate': 1.1750449752396606e-05, 'epoch': 0.89} {'loss': 0.7915, 'learning_rate': 1.175012745409086e-05, 'epoch': 0.89} {'loss': 0.8711, 'learning_rate': 1.1749805153909692e-05, 'epoch': 0.89} {'loss': 0.714, 'learning_rate': 1.1749482851853455e-05, 'epoch': 0.89} {'loss': 0.7712, 'learning_rate': 1.1749160547922486e-05, 'epoch': 0.89} {'loss': 0.7006, 'learning_rate': 1.1748838242117135e-05, 'epoch': 0.89} {'loss': 0.7311, 'learning_rate': 1.1748515934437744e-05, 'epoch': 0.89} {'loss': 0.7814, 'learning_rate': 1.174819362488466e-05, 'epoch': 0.89} {'loss': 0.7215, 'learning_rate': 1.174787131345823e-05, 'epoch': 0.89} {'loss': 0.7373, 'learning_rate': 1.1747549000158796e-05, 'epoch': 0.89} {'loss': 0.8646, 'learning_rate': 1.174722668498671e-05, 'epoch': 0.89} {'loss': 0.7431, 'learning_rate': 1.1746904367942312e-05, 'epoch': 0.89} {'loss': 0.7799, 'learning_rate': 1.1746582049025945e-05, 'epoch': 0.89} {'loss': 0.7842, 'learning_rate': 1.1746259728237958e-05, 'epoch': 0.89} {'loss': 0.8709, 'learning_rate': 1.1745937405578698e-05, 'epoch': 0.89} {'loss': 0.7532, 'learning_rate': 1.1745615081048508e-05, 'epoch': 0.89} {'loss': 0.7232, 'learning_rate': 1.1745292754647735e-05, 'epoch': 0.89} {'loss': 0.8325, 'learning_rate': 1.174497042637672e-05, 'epoch': 0.89} {'loss': 0.7275, 'learning_rate': 1.1744648096235815e-05, 'epoch': 0.89} {'loss': 0.8472, 'learning_rate': 1.1744325764225362e-05, 'epoch': 0.89} {'loss': 0.8198, 'learning_rate': 1.1744003430345705e-05, 'epoch': 0.89} {'loss': 0.8123, 'learning_rate': 1.174368109459719e-05, 'epoch': 0.89} {'loss': 0.7108, 'learning_rate': 1.1743358756980164e-05, 'epoch': 0.89} {'loss': 0.6288, 'learning_rate': 1.1743036417494973e-05, 'epoch': 0.89} {'loss': 0.7494, 'learning_rate': 1.1742714076141964e-05, 'epoch': 0.89} {'loss': 0.7916, 'learning_rate': 1.1742391732921475e-05, 'epoch': 0.89} {'loss': 0.8184, 'learning_rate': 1.1742069387833856e-05, 'epoch': 0.89} {'loss': 1.0364, 'learning_rate': 1.1741747040879452e-05, 'epoch': 0.89} {'loss': 0.6228, 'learning_rate': 1.1741424692058611e-05, 'epoch': 0.89} {'loss': 0.8714, 'learning_rate': 1.1741102341371678e-05, 'epoch': 0.89} {'loss': 0.8668, 'learning_rate': 1.1740779988818994e-05, 'epoch': 0.89} {'loss': 0.6718, 'learning_rate': 1.1740457634400907e-05, 'epoch': 0.89} {'loss': 0.9135, 'learning_rate': 1.1740135278117763e-05, 'epoch': 0.89} {'loss': 0.8396, 'learning_rate': 1.1739812919969906e-05, 'epoch': 0.89} {'loss': 0.9812, 'learning_rate': 1.1739490559957682e-05, 'epoch': 0.89} {'loss': 0.9665, 'learning_rate': 1.1739168198081442e-05, 'epoch': 0.89} {'loss': 0.7647, 'learning_rate': 1.173884583434152e-05, 'epoch': 0.89} {'loss': 0.7195, 'learning_rate': 1.173852346873827e-05, 'epoch': 0.89} {'loss': 0.8355, 'learning_rate': 1.1738201101272038e-05, 'epoch': 0.89} {'loss': 0.76, 'learning_rate': 1.1737878731943163e-05, 'epoch': 0.89} {'loss': 0.5869, 'learning_rate': 1.1737556360751995e-05, 'epoch': 0.89} {'loss': 0.7929, 'learning_rate': 1.1737233987698882e-05, 'epoch': 0.89} {'loss': 0.8482, 'learning_rate': 1.173691161278416e-05, 'epoch': 0.89} {'loss': 0.8343, 'learning_rate': 1.1736589236008182e-05, 'epoch': 0.89} {'loss': 0.6689, 'learning_rate': 1.1736266857371294e-05, 'epoch': 0.89} {'loss': 0.7903, 'learning_rate': 1.173594447687384e-05, 'epoch': 0.89} {'loss': 0.8588, 'learning_rate': 1.1735622094516161e-05, 'epoch': 0.89} {'loss': 0.6809, 'learning_rate': 1.1735299710298609e-05, 'epoch': 0.89} {'loss': 0.8302, 'learning_rate': 1.1734977324221528e-05, 'epoch': 0.89} {'loss': 0.7006, 'learning_rate': 1.1734654936285262e-05, 'epoch': 0.89} {'loss': 0.7445, 'learning_rate': 1.1734332546490153e-05, 'epoch': 0.89} {'loss': 0.8046, 'learning_rate': 1.1734010154836553e-05, 'epoch': 0.89} {'loss': 0.7601, 'learning_rate': 1.1733687761324804e-05, 'epoch': 0.89} {'loss': 0.7276, 'learning_rate': 1.1733365365955251e-05, 'epoch': 0.89} {'loss': 0.8286, 'learning_rate': 1.1733042968728244e-05, 'epoch': 0.89} {'loss': 0.7254, 'learning_rate': 1.1732720569644123e-05, 'epoch': 0.89} {'loss': 0.6038, 'learning_rate': 1.1732398168703235e-05, 'epoch': 0.89} {'loss': 0.8106, 'learning_rate': 1.1732075765905923e-05, 'epoch': 0.89} {'loss': 1.0254, 'learning_rate': 1.173175336125254e-05, 'epoch': 0.89} {'loss': 0.9495, 'learning_rate': 1.1731430954743425e-05, 'epoch': 0.89} {'loss': 0.6306, 'learning_rate': 1.1731108546378928e-05, 'epoch': 0.89} {'loss': 0.8519, 'learning_rate': 1.173078613615939e-05, 'epoch': 0.89} {'loss': 0.9039, 'learning_rate': 1.1730463724085159e-05, 'epoch': 0.89} {'loss': 0.8056, 'learning_rate': 1.1730141310156577e-05, 'epoch': 0.89} {'loss': 0.7987, 'learning_rate': 1.1729818894373995e-05, 'epoch': 0.89} {'loss': 0.8662, 'learning_rate': 1.1729496476737759e-05, 'epoch': 0.89} {'loss': 1.04, 'learning_rate': 1.1729174057248207e-05, 'epoch': 0.89} {'loss': 0.8659, 'learning_rate': 1.1728851635905692e-05, 'epoch': 0.89} {'loss': 0.7705, 'learning_rate': 1.1728529212710553e-05, 'epoch': 0.89} {'loss': 0.7859, 'learning_rate': 1.1728206787663141e-05, 'epoch': 0.89} {'loss': 0.7511, 'learning_rate': 1.1727884360763797e-05, 'epoch': 0.89} {'loss': 0.7462, 'learning_rate': 1.172756193201287e-05, 'epoch': 0.89} {'loss': 0.6256, 'learning_rate': 1.1727239501410708e-05, 'epoch': 0.89} {'loss': 0.8681, 'learning_rate': 1.1726917068957651e-05, 'epoch': 0.89} {'loss': 0.7306, 'learning_rate': 1.1726594634654044e-05, 'epoch': 0.89} {'loss': 0.6891, 'learning_rate': 1.1726272198500236e-05, 'epoch': 0.89} {'loss': 0.9095, 'learning_rate': 1.1725949760496573e-05, 'epoch': 0.89} {'loss': 0.7657, 'learning_rate': 1.1725627320643398e-05, 'epoch': 0.89} {'loss': 0.6796, 'learning_rate': 1.1725304878941056e-05, 'epoch': 0.89} {'loss': 0.8553, 'learning_rate': 1.17249824353899e-05, 'epoch': 0.89} {'loss': 0.6741, 'learning_rate': 1.1724659989990268e-05, 'epoch': 0.89} {'loss': 0.7135, 'learning_rate': 1.1724337542742504e-05, 'epoch': 0.89} {'loss': 0.8092, 'learning_rate': 1.1724015093646957e-05, 'epoch': 0.89} {'loss': 0.7819, 'learning_rate': 1.1723692642703973e-05, 'epoch': 0.89} {'loss': 0.8103, 'learning_rate': 1.1723370189913894e-05, 'epoch': 0.89} {'loss': 0.9908, 'learning_rate': 1.1723047735277073e-05, 'epoch': 0.89} {'loss': 0.6595, 'learning_rate': 1.1722725278793848e-05, 'epoch': 0.89} {'loss': 0.7495, 'learning_rate': 1.1722402820464568e-05, 'epoch': 0.89} {'loss': 0.7256, 'learning_rate': 1.172208036028958e-05, 'epoch': 0.89} {'loss': 0.9024, 'learning_rate': 1.1721757898269224e-05, 'epoch': 0.89} {'loss': 0.8125, 'learning_rate': 1.1721435434403849e-05, 'epoch': 0.89} {'loss': 0.6931, 'learning_rate': 1.1721112968693802e-05, 'epoch': 0.89} {'loss': 0.6424, 'learning_rate': 1.1720790501139429e-05, 'epoch': 0.89} {'loss': 0.7007, 'learning_rate': 1.1720468031741072e-05, 'epoch': 0.89} {'loss': 0.7849, 'learning_rate': 1.1720145560499079e-05, 'epoch': 0.89} {'loss': 0.7199, 'learning_rate': 1.1719823087413794e-05, 'epoch': 0.89} {'loss': 0.767, 'learning_rate': 1.1719500612485562e-05, 'epoch': 0.89} {'loss': 0.8368, 'learning_rate': 1.171917813571473e-05, 'epoch': 0.89} {'loss': 0.7001, 'learning_rate': 1.1718855657101646e-05, 'epoch': 0.89} {'loss': 0.7972, 'learning_rate': 1.1718533176646651e-05, 'epoch': 0.89} {'loss': 0.7155, 'learning_rate': 1.1718210694350095e-05, 'epoch': 0.89} {'loss': 0.7526, 'learning_rate': 1.1717888210212321e-05, 'epoch': 0.89} {'loss': 0.8429, 'learning_rate': 1.171756572423367e-05, 'epoch': 0.89} {'loss': 0.7838, 'learning_rate': 1.1717243236414495e-05, 'epoch': 0.89} {'loss': 0.817, 'learning_rate': 1.1716920746755144e-05, 'epoch': 0.89} {'loss': 0.7784, 'learning_rate': 1.171659825525595e-05, 'epoch': 0.89} {'loss': 0.7692, 'learning_rate': 1.1716275761917268e-05, 'epoch': 0.89} {'loss': 0.6876, 'learning_rate': 1.1715953266739444e-05, 'epoch': 0.89} {'loss': 0.7554, 'learning_rate': 1.171563076972282e-05, 'epoch': 0.89} {'loss': 0.8052, 'learning_rate': 1.171530827086774e-05, 'epoch': 0.89} {'loss': 0.9644, 'learning_rate': 1.1714985770174554e-05, 'epoch': 0.89} {'loss': 0.7642, 'learning_rate': 1.171466326764361e-05, 'epoch': 0.89} {'loss': 0.7967, 'learning_rate': 1.1714340763275245e-05, 'epoch': 0.89} {'loss': 0.7333, 'learning_rate': 1.171401825706981e-05, 'epoch': 0.89} {'loss': 0.7899, 'learning_rate': 1.1713695749027651e-05, 'epoch': 0.89} {'loss': 0.7235, 'learning_rate': 1.171337323914911e-05, 'epoch': 0.89} {'loss': 0.7006, 'learning_rate': 1.1713050727434536e-05, 'epoch': 0.89} {'loss': 0.8741, 'learning_rate': 1.1712728213884276e-05, 'epoch': 0.89} {'loss': 0.7971, 'learning_rate': 1.171240569849867e-05, 'epoch': 0.89} {'loss': 0.6537, 'learning_rate': 1.1712083181278069e-05, 'epoch': 0.89} {'loss': 0.7673, 'learning_rate': 1.1711760662222814e-05, 'epoch': 0.89} {'loss': 0.8272, 'learning_rate': 1.1711438141333256e-05, 'epoch': 0.89} {'loss': 0.7606, 'learning_rate': 1.1711115618609733e-05, 'epoch': 0.89} {'loss': 0.7728, 'learning_rate': 1.1710793094052601e-05, 'epoch': 0.89} {'loss': 0.8553, 'learning_rate': 1.1710470567662195e-05, 'epoch': 0.89} {'loss': 0.7299, 'learning_rate': 1.1710148039438867e-05, 'epoch': 0.89} {'loss': 0.7772, 'learning_rate': 1.1709825509382962e-05, 'epoch': 0.89} {'loss': 0.7813, 'learning_rate': 1.1709502977494823e-05, 'epoch': 0.89} {'loss': 0.8098, 'learning_rate': 1.17091804437748e-05, 'epoch': 0.89} {'loss': 0.6837, 'learning_rate': 1.1708857908223234e-05, 'epoch': 0.89} {'loss': 0.8899, 'learning_rate': 1.1708535370840473e-05, 'epoch': 0.89} {'loss': 0.765, 'learning_rate': 1.170821283162686e-05, 'epoch': 0.89} {'loss': 0.7349, 'learning_rate': 1.1707890290582745e-05, 'epoch': 0.89} {'loss': 0.8798, 'learning_rate': 1.1707567747708469e-05, 'epoch': 0.89} {'loss': 0.8671, 'learning_rate': 1.170724520300438e-05, 'epoch': 0.89} {'loss': 0.8045, 'learning_rate': 1.1706922656470827e-05, 'epoch': 0.89} {'loss': 0.8003, 'learning_rate': 1.1706600108108152e-05, 'epoch': 0.89} {'loss': 0.7281, 'learning_rate': 1.1706277557916701e-05, 'epoch': 0.89} {'loss': 0.8884, 'learning_rate': 1.1705955005896816e-05, 'epoch': 0.89} {'loss': 0.685, 'learning_rate': 1.1705632452048849e-05, 'epoch': 0.89} {'loss': 0.8011, 'learning_rate': 1.1705309896373142e-05, 'epoch': 0.89} {'loss': 0.7401, 'learning_rate': 1.1704987338870044e-05, 'epoch': 0.89} {'loss': 0.8069, 'learning_rate': 1.1704664779539896e-05, 'epoch': 0.89} {'loss': 0.7234, 'learning_rate': 1.1704342218383046e-05, 'epoch': 0.89} {'loss': 0.8177, 'learning_rate': 1.170401965539984e-05, 'epoch': 0.89} {'loss': 0.7374, 'learning_rate': 1.1703697090590622e-05, 'epoch': 0.89} {'loss': 0.7437, 'learning_rate': 1.1703374523955737e-05, 'epoch': 0.89} {'loss': 0.7283, 'learning_rate': 1.1703051955495534e-05, 'epoch': 0.89} {'loss': 0.8191, 'learning_rate': 1.170272938521036e-05, 'epoch': 0.89} {'loss': 0.7803, 'learning_rate': 1.1702406813100558e-05, 'epoch': 0.89} {'loss': 0.9061, 'learning_rate': 1.1702084239166472e-05, 'epoch': 0.89} {'loss': 0.7804, 'learning_rate': 1.1701761663408446e-05, 'epoch': 0.89} {'loss': 0.8628, 'learning_rate': 1.1701439085826831e-05, 'epoch': 0.89} {'loss': 0.9073, 'learning_rate': 1.170111650642197e-05, 'epoch': 0.89} {'loss': 0.6996, 'learning_rate': 1.1700793925194209e-05, 'epoch': 0.89} {'loss': 0.8624, 'learning_rate': 1.1700471342143895e-05, 'epoch': 0.89} {'loss': 0.4877, 'learning_rate': 1.1700148757271375e-05, 'epoch': 0.89} {'loss': 0.7185, 'learning_rate': 1.169982617057699e-05, 'epoch': 0.89} {'loss': 0.7125, 'learning_rate': 1.1699503582061086e-05, 'epoch': 0.89} {'loss': 0.7693, 'learning_rate': 1.1699180991724011e-05, 'epoch': 0.89} {'loss': 0.7454, 'learning_rate': 1.1698858399566108e-05, 'epoch': 0.89} {'loss': 0.8212, 'learning_rate': 1.1698535805587729e-05, 'epoch': 0.89} {'loss': 0.6804, 'learning_rate': 1.1698213209789215e-05, 'epoch': 0.89} {'loss': 0.6687, 'learning_rate': 1.1697890612170912e-05, 'epoch': 0.89} {'loss': 0.8995, 'learning_rate': 1.1697568012733165e-05, 'epoch': 0.89} {'loss': 0.8791, 'learning_rate': 1.169724541147632e-05, 'epoch': 0.89} {'loss': 0.8147, 'learning_rate': 1.1696922808400727e-05, 'epoch': 0.89} {'loss': 0.7616, 'learning_rate': 1.1696600203506726e-05, 'epoch': 0.89} {'loss': 0.8266, 'learning_rate': 1.1696277596794663e-05, 'epoch': 0.89} {'loss': 0.9323, 'learning_rate': 1.1695954988264887e-05, 'epoch': 0.89} {'loss': 0.7571, 'learning_rate': 1.1695632377917744e-05, 'epoch': 0.89} {'loss': 0.7245, 'learning_rate': 1.1695309765753572e-05, 'epoch': 0.9} {'loss': 0.7813, 'learning_rate': 1.1694987151772727e-05, 'epoch': 0.9} {'loss': 0.7933, 'learning_rate': 1.169466453597555e-05, 'epoch': 0.9} {'loss': 0.7827, 'learning_rate': 1.1694341918362386e-05, 'epoch': 0.9} {'loss': 0.9631, 'learning_rate': 1.1694019298933582e-05, 'epoch': 0.9} {'loss': 0.8828, 'learning_rate': 1.1693696677689484e-05, 'epoch': 0.9} {'loss': 0.7433, 'learning_rate': 1.1693374054630438e-05, 'epoch': 0.9} {'loss': 0.7775, 'learning_rate': 1.1693051429756788e-05, 'epoch': 0.9} {'loss': 0.6152, 'learning_rate': 1.1692728803068878e-05, 'epoch': 0.9} {'loss': 0.721, 'learning_rate': 1.1692406174567061e-05, 'epoch': 0.9} {'loss': 0.6328, 'learning_rate': 1.1692083544251675e-05, 'epoch': 0.9} {'loss': 0.8508, 'learning_rate': 1.169176091212307e-05, 'epoch': 0.9} {'loss': 0.849, 'learning_rate': 1.169143827818159e-05, 'epoch': 0.9} {'loss': 0.742, 'learning_rate': 1.1691115642427582e-05, 'epoch': 0.9} {'loss': 0.8401, 'learning_rate': 1.1690793004861389e-05, 'epoch': 0.9} {'loss': 0.8429, 'learning_rate': 1.1690470365483362e-05, 'epoch': 0.9} {'loss': 0.7315, 'learning_rate': 1.1690147724293838e-05, 'epoch': 0.9} {'loss': 0.8036, 'learning_rate': 1.1689825081293172e-05, 'epoch': 0.9} {'loss': 0.7366, 'learning_rate': 1.1689502436481706e-05, 'epoch': 0.9} {'loss': 0.6924, 'learning_rate': 1.1689179789859786e-05, 'epoch': 0.9} {'loss': 0.8284, 'learning_rate': 1.1688857141427756e-05, 'epoch': 0.9} {'loss': 0.8262, 'learning_rate': 1.1688534491185966e-05, 'epoch': 0.9} {'loss': 0.7141, 'learning_rate': 1.1688211839134752e-05, 'epoch': 0.9} {'loss': 0.7516, 'learning_rate': 1.1687889185274473e-05, 'epoch': 0.9} {'loss': 0.6759, 'learning_rate': 1.1687566529605465e-05, 'epoch': 0.9} {'loss': 0.7304, 'learning_rate': 1.1687243872128079e-05, 'epoch': 0.9} {'loss': 0.7762, 'learning_rate': 1.1686921212842658e-05, 'epoch': 0.9} {'loss': 0.8952, 'learning_rate': 1.1686598551749551e-05, 'epoch': 0.9} {'loss': 0.7893, 'learning_rate': 1.1686275888849099e-05, 'epoch': 0.9} {'loss': 0.7079, 'learning_rate': 1.1685953224141651e-05, 'epoch': 0.9} {'loss': 0.8225, 'learning_rate': 1.1685630557627552e-05, 'epoch': 0.9} {'loss': 0.6374, 'learning_rate': 1.1685307889307148e-05, 'epoch': 0.9} {'loss': 0.819, 'learning_rate': 1.1684985219180783e-05, 'epoch': 0.9} {'loss': 0.8098, 'learning_rate': 1.1684662547248805e-05, 'epoch': 0.9} {'loss': 0.7735, 'learning_rate': 1.168433987351156e-05, 'epoch': 0.9} {'loss': 0.8382, 'learning_rate': 1.1684017197969393e-05, 'epoch': 0.9} {'loss': 0.8843, 'learning_rate': 1.1683694520622648e-05, 'epoch': 0.9} {'loss': 0.7682, 'learning_rate': 1.168337184147167e-05, 'epoch': 0.9} {'loss': 0.7887, 'learning_rate': 1.168304916051681e-05, 'epoch': 0.9} {'loss': 0.7785, 'learning_rate': 1.168272647775841e-05, 'epoch': 0.9} {'loss': 0.6534, 'learning_rate': 1.1682403793196822e-05, 'epoch': 0.9} {'loss': 0.7831, 'learning_rate': 1.1682081106832384e-05, 'epoch': 0.9} {'loss': 0.6589, 'learning_rate': 1.168175841866544e-05, 'epoch': 0.9} {'loss': 0.7642, 'learning_rate': 1.1681435728696341e-05, 'epoch': 0.9} {'loss': 0.7763, 'learning_rate': 1.1681113036925434e-05, 'epoch': 0.9} {'loss': 0.6826, 'learning_rate': 1.1680790343353061e-05, 'epoch': 0.9} {'loss': 0.6904, 'learning_rate': 1.1680467647979572e-05, 'epoch': 0.9} {'loss': 0.7221, 'learning_rate': 1.1680144950805307e-05, 'epoch': 0.9} {'loss': 0.6844, 'learning_rate': 1.167982225183062e-05, 'epoch': 0.9} {'loss': 0.6391, 'learning_rate': 1.1679499551055849e-05, 'epoch': 0.9} {'loss': 0.6338, 'learning_rate': 1.1679176848481342e-05, 'epoch': 0.9} {'loss': 0.7092, 'learning_rate': 1.1678854144107443e-05, 'epoch': 0.9} {'loss': 0.6399, 'learning_rate': 1.1678531437934504e-05, 'epoch': 0.9} {'loss': 0.6966, 'learning_rate': 1.1678208729962868e-05, 'epoch': 0.9} {'loss': 0.7796, 'learning_rate': 1.167788602019288e-05, 'epoch': 0.9} {'loss': 0.8582, 'learning_rate': 1.1677563308624883e-05, 'epoch': 0.9} {'loss': 0.9035, 'learning_rate': 1.1677240595259226e-05, 'epoch': 0.9} {'loss': 0.782, 'learning_rate': 1.1676917880096253e-05, 'epoch': 0.9} {'loss': 0.7515, 'learning_rate': 1.167659516313631e-05, 'epoch': 0.9} {'loss': 0.74, 'learning_rate': 1.1676272444379748e-05, 'epoch': 0.9} {'loss': 0.916, 'learning_rate': 1.1675949723826908e-05, 'epoch': 0.9} {'loss': 0.8007, 'learning_rate': 1.1675627001478138e-05, 'epoch': 0.9} {'loss': 0.8711, 'learning_rate': 1.1675304277333778e-05, 'epoch': 0.9} {'loss': 0.726, 'learning_rate': 1.1674981551394182e-05, 'epoch': 0.9} {'loss': 0.6477, 'learning_rate': 1.167465882365969e-05, 'epoch': 0.9} {'loss': 0.7128, 'learning_rate': 1.1674336094130652e-05, 'epoch': 0.9} {'loss': 0.758, 'learning_rate': 1.167401336280741e-05, 'epoch': 0.9} {'loss': 0.9571, 'learning_rate': 1.1673690629690311e-05, 'epoch': 0.9} {'loss': 0.7163, 'learning_rate': 1.1673367894779704e-05, 'epoch': 0.9} {'loss': 0.8633, 'learning_rate': 1.1673045158075931e-05, 'epoch': 0.9} {'loss': 0.9498, 'learning_rate': 1.1672722419579337e-05, 'epoch': 0.9} {'loss': 0.8016, 'learning_rate': 1.1672399679290272e-05, 'epoch': 0.9} {'loss': 0.8703, 'learning_rate': 1.167207693720908e-05, 'epoch': 0.9} {'loss': 0.7257, 'learning_rate': 1.1671754193336107e-05, 'epoch': 0.9} {'loss': 0.9446, 'learning_rate': 1.1671431447671698e-05, 'epoch': 0.9} {'loss': 0.5854, 'learning_rate': 1.1671108700216199e-05, 'epoch': 0.9} {'loss': 0.7738, 'learning_rate': 1.1670785950969955e-05, 'epoch': 0.9} {'loss': 0.7839, 'learning_rate': 1.1670463199933315e-05, 'epoch': 0.9} {'loss': 0.7455, 'learning_rate': 1.1670140447106624e-05, 'epoch': 0.9} {'loss': 0.7222, 'learning_rate': 1.1669817692490224e-05, 'epoch': 0.9} {'loss': 0.9269, 'learning_rate': 1.1669494936084465e-05, 'epoch': 0.9} {'loss': 0.9108, 'learning_rate': 1.1669172177889689e-05, 'epoch': 0.9} {'loss': 0.7666, 'learning_rate': 1.1668849417906247e-05, 'epoch': 0.9} {'loss': 0.8875, 'learning_rate': 1.1668526656134482e-05, 'epoch': 0.9} {'loss': 0.8219, 'learning_rate': 1.166820389257474e-05, 'epoch': 0.9} {'loss': 0.7701, 'learning_rate': 1.1667881127227368e-05, 'epoch': 0.9} {'loss': 0.7783, 'learning_rate': 1.1667558360092708e-05, 'epoch': 0.9} {'loss': 0.7193, 'learning_rate': 1.166723559117111e-05, 'epoch': 0.9} {'loss': 0.7302, 'learning_rate': 1.166691282046292e-05, 'epoch': 0.9} {'loss': 0.8734, 'learning_rate': 1.1666590047968482e-05, 'epoch': 0.9} {'loss': 0.6953, 'learning_rate': 1.1666267273688143e-05, 'epoch': 0.9} {'loss': 0.7384, 'learning_rate': 1.1665944497622246e-05, 'epoch': 0.9} {'loss': 0.6728, 'learning_rate': 1.1665621719771139e-05, 'epoch': 0.9} {'loss': 0.7421, 'learning_rate': 1.1665298940135168e-05, 'epoch': 0.9} {'loss': 0.7373, 'learning_rate': 1.1664976158714681e-05, 'epoch': 0.9} {'loss': 0.7842, 'learning_rate': 1.1664653375510023e-05, 'epoch': 0.9} {'loss': 0.716, 'learning_rate': 1.1664330590521535e-05, 'epoch': 0.9} {'loss': 0.8073, 'learning_rate': 1.1664007803749568e-05, 'epoch': 0.9} {'loss': 0.5944, 'learning_rate': 1.1663685015194465e-05, 'epoch': 0.9} {'loss': 0.8688, 'learning_rate': 1.1663362224856577e-05, 'epoch': 0.9} {'loss': 0.7968, 'learning_rate': 1.1663039432736243e-05, 'epoch': 0.9} {'loss': 0.6688, 'learning_rate': 1.166271663883381e-05, 'epoch': 0.9} {'loss': 0.8443, 'learning_rate': 1.1662393843149633e-05, 'epoch': 0.9} {'loss': 0.689, 'learning_rate': 1.166207104568405e-05, 'epoch': 0.9} {'loss': 0.8127, 'learning_rate': 1.1661748246437404e-05, 'epoch': 0.9} {'loss': 0.8191, 'learning_rate': 1.1661425445410044e-05, 'epoch': 0.9} {'loss': 0.8137, 'learning_rate': 1.1661102642602318e-05, 'epoch': 0.9} {'loss': 0.7296, 'learning_rate': 1.1660779838014572e-05, 'epoch': 0.9} {'loss': 0.7979, 'learning_rate': 1.1660457031647149e-05, 'epoch': 0.9} {'loss': 0.778, 'learning_rate': 1.1660134223500397e-05, 'epoch': 0.9} {'loss': 0.6193, 'learning_rate': 1.1659811413574661e-05, 'epoch': 0.9} {'loss': 0.6863, 'learning_rate': 1.1659488601870289e-05, 'epoch': 0.9} {'loss': 0.8336, 'learning_rate': 1.1659165788387623e-05, 'epoch': 0.9} {'loss': 0.7984, 'learning_rate': 1.1658842973127011e-05, 'epoch': 0.9} {'loss': 0.7177, 'learning_rate': 1.1658520156088799e-05, 'epoch': 0.9} {'loss': 0.8871, 'learning_rate': 1.1658197337273334e-05, 'epoch': 0.9} {'loss': 0.9928, 'learning_rate': 1.1657874516680963e-05, 'epoch': 0.9} {'loss': 0.8241, 'learning_rate': 1.1657551694312029e-05, 'epoch': 0.9} {'loss': 0.7756, 'learning_rate': 1.1657228870166875e-05, 'epoch': 0.9} {'loss': 0.7263, 'learning_rate': 1.1656906044245852e-05, 'epoch': 0.9} {'loss': 0.8594, 'learning_rate': 1.1656583216549307e-05, 'epoch': 0.9} {'loss': 0.8058, 'learning_rate': 1.165626038707758e-05, 'epoch': 0.9} {'loss': 0.7081, 'learning_rate': 1.1655937555831025e-05, 'epoch': 0.9} {'loss': 0.6001, 'learning_rate': 1.1655614722809981e-05, 'epoch': 0.9} {'loss': 0.8367, 'learning_rate': 1.1655291888014797e-05, 'epoch': 0.9} {'loss': 0.9264, 'learning_rate': 1.165496905144582e-05, 'epoch': 0.9} {'loss': 0.8529, 'learning_rate': 1.1654646213103389e-05, 'epoch': 0.9} {'loss': 0.8472, 'learning_rate': 1.1654323372987859e-05, 'epoch': 0.9} {'loss': 0.8856, 'learning_rate': 1.1654000531099574e-05, 'epoch': 0.9} {'loss': 0.8687, 'learning_rate': 1.1653677687438874e-05, 'epoch': 0.9} {'loss': 0.7509, 'learning_rate': 1.1653354842006113e-05, 'epoch': 0.9} {'loss': 0.6622, 'learning_rate': 1.165303199480163e-05, 'epoch': 0.9} {'loss': 0.8626, 'learning_rate': 1.1652709145825774e-05, 'epoch': 0.9} {'loss': 0.5923, 'learning_rate': 1.1652386295078893e-05, 'epoch': 0.9} {'loss': 0.7742, 'learning_rate': 1.165206344256133e-05, 'epoch': 0.9} {'loss': 0.8131, 'learning_rate': 1.165174058827343e-05, 'epoch': 0.9} {'loss': 0.719, 'learning_rate': 1.1651417732215544e-05, 'epoch': 0.9} {'loss': 0.6833, 'learning_rate': 1.1651094874388016e-05, 'epoch': 0.9} {'loss': 0.7224, 'learning_rate': 1.1650772014791188e-05, 'epoch': 0.9} {'loss': 0.7664, 'learning_rate': 1.1650449153425407e-05, 'epoch': 0.9} {'loss': 0.6488, 'learning_rate': 1.1650126290291022e-05, 'epoch': 0.9} {'loss': 0.7518, 'learning_rate': 1.1649803425388382e-05, 'epoch': 0.9} {'loss': 0.8402, 'learning_rate': 1.1649480558717822e-05, 'epoch': 0.9} {'loss': 0.8114, 'learning_rate': 1.16491576902797e-05, 'epoch': 0.9} {'loss': 0.6341, 'learning_rate': 1.1648834820074356e-05, 'epoch': 0.9} {'loss': 0.8525, 'learning_rate': 1.1648511948102135e-05, 'epoch': 0.9} {'loss': 0.6921, 'learning_rate': 1.1648189074363384e-05, 'epoch': 0.9} {'loss': 0.8891, 'learning_rate': 1.1647866198858453e-05, 'epoch': 0.9} {'loss': 0.6804, 'learning_rate': 1.1647543321587682e-05, 'epoch': 0.9} {'loss': 0.7235, 'learning_rate': 1.1647220442551419e-05, 'epoch': 0.9} {'loss': 0.7605, 'learning_rate': 1.164689756175001e-05, 'epoch': 0.9} {'loss': 0.8453, 'learning_rate': 1.1646574679183806e-05, 'epoch': 0.9} {'loss': 0.7148, 'learning_rate': 1.1646251794853144e-05, 'epoch': 0.9} {'loss': 0.7208, 'learning_rate': 1.1645928908758379e-05, 'epoch': 0.9} {'loss': 0.7389, 'learning_rate': 1.1645606020899849e-05, 'epoch': 0.9} {'loss': 0.7919, 'learning_rate': 1.1645283131277905e-05, 'epoch': 0.9} {'loss': 0.6957, 'learning_rate': 1.164496023989289e-05, 'epoch': 0.9} {'loss': 0.6021, 'learning_rate': 1.1644637346745153e-05, 'epoch': 0.9} {'loss': 0.7779, 'learning_rate': 1.164431445183504e-05, 'epoch': 0.9} {'loss': 0.7723, 'learning_rate': 1.1643991555162894e-05, 'epoch': 0.9} {'loss': 0.8773, 'learning_rate': 1.1643668656729066e-05, 'epoch': 0.9} {'loss': 0.8963, 'learning_rate': 1.1643345756533895e-05, 'epoch': 0.9} {'loss': 0.7288, 'learning_rate': 1.1643022854577731e-05, 'epoch': 0.9} {'loss': 0.6629, 'learning_rate': 1.1642699950860918e-05, 'epoch': 0.9} {'loss': 0.7614, 'learning_rate': 1.1642377045383806e-05, 'epoch': 0.9} {'loss': 0.7643, 'learning_rate': 1.164205413814674e-05, 'epoch': 0.9} {'loss': 0.8794, 'learning_rate': 1.1641731229150063e-05, 'epoch': 0.9} {'loss': 0.5571, 'learning_rate': 1.1641408318394125e-05, 'epoch': 0.9} {'loss': 0.6851, 'learning_rate': 1.1641085405879267e-05, 'epoch': 0.9} {'loss': 0.8049, 'learning_rate': 1.1640762491605839e-05, 'epoch': 0.9} {'loss': 0.7019, 'learning_rate': 1.1640439575574185e-05, 'epoch': 0.9} {'loss': 0.9118, 'learning_rate': 1.1640116657784654e-05, 'epoch': 0.9} {'loss': 0.791, 'learning_rate': 1.1639793738237588e-05, 'epoch': 0.9} {'loss': 0.8256, 'learning_rate': 1.1639470816933339e-05, 'epoch': 0.9} {'loss': 0.6602, 'learning_rate': 1.1639147893872243e-05, 'epoch': 0.9} {'loss': 0.7526, 'learning_rate': 1.1638824969054654e-05, 'epoch': 0.9} {'loss': 0.8618, 'learning_rate': 1.1638502042480917e-05, 'epoch': 0.9} {'loss': 0.7352, 'learning_rate': 1.1638179114151378e-05, 'epoch': 0.9} {'loss': 0.8899, 'learning_rate': 1.1637856184066382e-05, 'epoch': 0.9} {'loss': 0.7945, 'learning_rate': 1.1637533252226276e-05, 'epoch': 0.9} {'loss': 0.8605, 'learning_rate': 1.1637210318631404e-05, 'epoch': 0.9} {'loss': 0.6832, 'learning_rate': 1.1636887383282112e-05, 'epoch': 0.9} {'loss': 0.739, 'learning_rate': 1.1636564446178748e-05, 'epoch': 0.9} {'loss': 0.78, 'learning_rate': 1.163624150732166e-05, 'epoch': 0.9} {'loss': 0.6879, 'learning_rate': 1.1635918566711189e-05, 'epoch': 0.9} {'loss': 0.7107, 'learning_rate': 1.1635595624347684e-05, 'epoch': 0.9} {'loss': 0.9266, 'learning_rate': 1.1635272680231493e-05, 'epoch': 0.9} {'loss': 0.7567, 'learning_rate': 1.1634949734362957e-05, 'epoch': 0.9} {'loss': 0.7736, 'learning_rate': 1.1634626786742426e-05, 'epoch': 0.9} {'loss': 0.8207, 'learning_rate': 1.1634303837370244e-05, 'epoch': 0.9} {'loss': 0.7523, 'learning_rate': 1.1633980886246759e-05, 'epoch': 0.9} {'loss': 0.6613, 'learning_rate': 1.1633657933372316e-05, 'epoch': 0.9} {'loss': 0.7697, 'learning_rate': 1.1633334978747259e-05, 'epoch': 0.9} {'loss': 0.8092, 'learning_rate': 1.1633012022371939e-05, 'epoch': 0.9} {'loss': 0.704, 'learning_rate': 1.1632689064246698e-05, 'epoch': 0.9} {'loss': 0.7516, 'learning_rate': 1.1632366104371884e-05, 'epoch': 0.9} {'loss': 0.7887, 'learning_rate': 1.163204314274784e-05, 'epoch': 0.9} {'loss': 0.7988, 'learning_rate': 1.1631720179374918e-05, 'epoch': 0.9} {'loss': 0.8457, 'learning_rate': 1.1631397214253457e-05, 'epoch': 0.9} {'loss': 0.7803, 'learning_rate': 1.1631074247383809e-05, 'epoch': 0.9} {'loss': 0.8384, 'learning_rate': 1.1630751278766319e-05, 'epoch': 0.9} {'loss': 0.8175, 'learning_rate': 1.163042830840133e-05, 'epoch': 0.9} {'loss': 0.7672, 'learning_rate': 1.1630105336289188e-05, 'epoch': 0.9} {'loss': 0.7776, 'learning_rate': 1.1629782362430242e-05, 'epoch': 0.9} {'loss': 0.6968, 'learning_rate': 1.162945938682484e-05, 'epoch': 0.9} {'loss': 0.7386, 'learning_rate': 1.1629136409473323e-05, 'epoch': 0.9} {'loss': 0.8669, 'learning_rate': 1.1628813430376038e-05, 'epoch': 0.9} {'loss': 0.9351, 'learning_rate': 1.1628490449533334e-05, 'epoch': 0.9} {'loss': 0.8591, 'learning_rate': 1.1628167466945555e-05, 'epoch': 0.9} {'loss': 0.6025, 'learning_rate': 1.1627844482613049e-05, 'epoch': 0.9} {'loss': 0.837, 'learning_rate': 1.1627521496536161e-05, 'epoch': 0.9} {'loss': 0.7721, 'learning_rate': 1.1627198508715234e-05, 'epoch': 0.9} {'loss': 0.6519, 'learning_rate': 1.1626875519150617e-05, 'epoch': 0.9} {'loss': 0.9574, 'learning_rate': 1.162655252784266e-05, 'epoch': 0.9} {'loss': 0.6348, 'learning_rate': 1.1626229534791702e-05, 'epoch': 0.9} {'loss': 0.8437, 'learning_rate': 1.1625906539998091e-05, 'epoch': 0.9} {'loss': 0.7731, 'learning_rate': 1.1625583543462178e-05, 'epoch': 0.9} {'loss': 0.6986, 'learning_rate': 1.1625260545184302e-05, 'epoch': 0.9} {'loss': 0.6893, 'learning_rate': 1.1624937545164815e-05, 'epoch': 0.9} {'loss': 0.7998, 'learning_rate': 1.162461454340406e-05, 'epoch': 0.9} {'loss': 0.8998, 'learning_rate': 1.1624291539902385e-05, 'epoch': 0.9} {'loss': 0.6638, 'learning_rate': 1.1623968534660132e-05, 'epoch': 0.9} {'loss': 0.9267, 'learning_rate': 1.1623645527677656e-05, 'epoch': 0.9} {'loss': 0.6814, 'learning_rate': 1.1623322518955294e-05, 'epoch': 0.9} {'loss': 0.7873, 'learning_rate': 1.1622999508493393e-05, 'epoch': 0.9} {'loss': 0.9296, 'learning_rate': 1.1622676496292302e-05, 'epoch': 0.9} {'loss': 0.766, 'learning_rate': 1.1622353482352369e-05, 'epoch': 0.9} {'loss': 0.9022, 'learning_rate': 1.1622030466673938e-05, 'epoch': 0.9} {'loss': 0.7991, 'learning_rate': 1.1621707449257353e-05, 'epoch': 0.9} {'loss': 1.114, 'learning_rate': 1.1621384430102964e-05, 'epoch': 0.9} {'loss': 0.7908, 'learning_rate': 1.1621061409211113e-05, 'epoch': 0.9} {'loss': 0.9358, 'learning_rate': 1.1620738386582148e-05, 'epoch': 0.9} {'loss': 0.9922, 'learning_rate': 1.1620415362216419e-05, 'epoch': 0.9} {'loss': 0.8185, 'learning_rate': 1.1620092336114267e-05, 'epoch': 0.9} {'loss': 0.6834, 'learning_rate': 1.161976930827604e-05, 'epoch': 0.9} {'loss': 0.9316, 'learning_rate': 1.1619446278702085e-05, 'epoch': 0.9} {'loss': 0.9623, 'learning_rate': 1.1619123247392745e-05, 'epoch': 0.9} {'loss': 0.8544, 'learning_rate': 1.1618800214348368e-05, 'epoch': 0.9} {'loss': 0.8221, 'learning_rate': 1.1618477179569304e-05, 'epoch': 0.9} {'loss': 0.8268, 'learning_rate': 1.1618154143055892e-05, 'epoch': 0.9} {'loss': 0.858, 'learning_rate': 1.1617831104808481e-05, 'epoch': 0.9} {'loss': 0.7701, 'learning_rate': 1.1617508064827421e-05, 'epoch': 0.9} {'loss': 0.7992, 'learning_rate': 1.1617185023113056e-05, 'epoch': 0.9} {'loss': 0.6852, 'learning_rate': 1.161686197966573e-05, 'epoch': 0.9} {'loss': 0.7892, 'learning_rate': 1.1616538934485787e-05, 'epoch': 0.9} {'loss': 0.7274, 'learning_rate': 1.161621588757358e-05, 'epoch': 0.9} {'loss': 0.8402, 'learning_rate': 1.161589283892945e-05, 'epoch': 0.9} {'loss': 0.8134, 'learning_rate': 1.1615569788553748e-05, 'epoch': 0.9} {'loss': 0.7725, 'learning_rate': 1.1615246736446815e-05, 'epoch': 0.9} {'loss': 0.7435, 'learning_rate': 1.1614923682609001e-05, 'epoch': 0.9} {'loss': 0.8533, 'learning_rate': 1.1614600627040648e-05, 'epoch': 0.9} {'loss': 0.8474, 'learning_rate': 1.1614277569742108e-05, 'epoch': 0.9} {'loss': 0.6245, 'learning_rate': 1.1613954510713721e-05, 'epoch': 0.9} {'loss': 0.8796, 'learning_rate': 1.1613631449955836e-05, 'epoch': 0.9} {'loss': 0.733, 'learning_rate': 1.1613308387468801e-05, 'epoch': 0.9} {'loss': 0.7828, 'learning_rate': 1.1612985323252961e-05, 'epoch': 0.9} {'loss': 0.7179, 'learning_rate': 1.161266225730866e-05, 'epoch': 0.9} {'loss': 0.7457, 'learning_rate': 1.1612339189636246e-05, 'epoch': 0.9} {'loss': 0.9042, 'learning_rate': 1.1612016120236063e-05, 'epoch': 0.9} {'loss': 0.5737, 'learning_rate': 1.1611693049108462e-05, 'epoch': 0.9} {'loss': 0.8082, 'learning_rate': 1.1611369976253785e-05, 'epoch': 0.9} {'loss': 0.7865, 'learning_rate': 1.161104690167238e-05, 'epoch': 0.9} {'loss': 0.792, 'learning_rate': 1.1610723825364596e-05, 'epoch': 0.9} {'loss': 0.8633, 'learning_rate': 1.1610400747330772e-05, 'epoch': 0.9} {'loss': 0.8448, 'learning_rate': 1.161007766757126e-05, 'epoch': 0.9} {'loss': 0.8303, 'learning_rate': 1.1609754586086404e-05, 'epoch': 0.9} {'loss': 0.8254, 'learning_rate': 1.1609431502876552e-05, 'epoch': 0.9} {'loss': 0.7949, 'learning_rate': 1.1609108417942045e-05, 'epoch': 0.9} {'loss': 1.0614, 'learning_rate': 1.1608785331283236e-05, 'epoch': 0.9} {'loss': 0.8297, 'learning_rate': 1.160846224290047e-05, 'epoch': 0.9} {'loss': 0.7241, 'learning_rate': 1.160813915279409e-05, 'epoch': 0.9} {'loss': 0.6049, 'learning_rate': 1.1607816060964444e-05, 'epoch': 0.9} {'loss': 0.7964, 'learning_rate': 1.1607492967411876e-05, 'epoch': 0.9} {'loss': 0.9028, 'learning_rate': 1.1607169872136737e-05, 'epoch': 0.9} {'loss': 0.769, 'learning_rate': 1.1606846775139367e-05, 'epoch': 0.9} {'loss': 0.8255, 'learning_rate': 1.1606523676420116e-05, 'epoch': 0.9} {'loss': 0.7162, 'learning_rate': 1.1606200575979334e-05, 'epoch': 0.9} {'loss': 0.6897, 'learning_rate': 1.160587747381736e-05, 'epoch': 0.9} {'loss': 0.8234, 'learning_rate': 1.1605554369934544e-05, 'epoch': 0.9} {'loss': 0.7898, 'learning_rate': 1.160523126433123e-05, 'epoch': 0.9} {'loss': 0.6765, 'learning_rate': 1.1604908157007768e-05, 'epoch': 0.9} {'loss': 0.7976, 'learning_rate': 1.1604585047964502e-05, 'epoch': 0.9} {'loss': 0.7113, 'learning_rate': 1.1604261937201778e-05, 'epoch': 0.9} {'loss': 0.8133, 'learning_rate': 1.1603938824719943e-05, 'epoch': 0.9} {'loss': 0.7934, 'learning_rate': 1.160361571051934e-05, 'epoch': 0.9} {'loss': 0.6669, 'learning_rate': 1.1603292594600321e-05, 'epoch': 0.9} {'loss': 0.8008, 'learning_rate': 1.1602969476963228e-05, 'epoch': 0.9} {'loss': 0.6325, 'learning_rate': 1.1602646357608409e-05, 'epoch': 0.9} {'loss': 0.9911, 'learning_rate': 1.160232323653621e-05, 'epoch': 0.9} {'loss': 0.552, 'learning_rate': 1.1602000113746979e-05, 'epoch': 0.9} {'loss': 0.8202, 'learning_rate': 1.1601676989241055e-05, 'epoch': 0.9} {'loss': 0.6608, 'learning_rate': 1.1601353863018794e-05, 'epoch': 0.9} {'loss': 0.638, 'learning_rate': 1.1601030735080537e-05, 'epoch': 0.9} {'loss': 0.5318, 'learning_rate': 1.160070760542663e-05, 'epoch': 0.9} {'loss': 0.7377, 'learning_rate': 1.160038447405742e-05, 'epoch': 0.9} {'loss': 0.9621, 'learning_rate': 1.1600061340973253e-05, 'epoch': 0.9} {'loss': 0.8269, 'learning_rate': 1.1599738206174478e-05, 'epoch': 0.9} {'loss': 0.8696, 'learning_rate': 1.1599415069661437e-05, 'epoch': 0.9} {'loss': 0.8511, 'learning_rate': 1.1599091931434482e-05, 'epoch': 0.9} {'loss': 0.8357, 'learning_rate': 1.1598768791493953e-05, 'epoch': 0.9} {'loss': 0.7971, 'learning_rate': 1.1598445649840198e-05, 'epoch': 0.9} {'loss': 0.765, 'learning_rate': 1.1598122506473566e-05, 'epoch': 0.9} {'loss': 0.7607, 'learning_rate': 1.15977993613944e-05, 'epoch': 0.9} {'loss': 0.719, 'learning_rate': 1.159747621460305e-05, 'epoch': 0.9} {'loss': 0.8182, 'learning_rate': 1.159715306609986e-05, 'epoch': 0.9} {'loss': 0.581, 'learning_rate': 1.1596829915885176e-05, 'epoch': 0.9} {'loss': 0.6131, 'learning_rate': 1.1596506763959344e-05, 'epoch': 0.9} {'loss': 0.901, 'learning_rate': 1.1596183610322708e-05, 'epoch': 0.9} {'loss': 0.6422, 'learning_rate': 1.159586045497562e-05, 'epoch': 0.9} {'loss': 0.5431, 'learning_rate': 1.1595537297918422e-05, 'epoch': 0.9} {'loss': 0.8181, 'learning_rate': 1.1595214139151466e-05, 'epoch': 0.9} {'loss': 0.7726, 'learning_rate': 1.159489097867509e-05, 'epoch': 0.9} {'loss': 0.6534, 'learning_rate': 1.1594567816489646e-05, 'epoch': 0.9} {'loss': 0.6276, 'learning_rate': 1.1594244652595479e-05, 'epoch': 0.9} {'loss': 0.7039, 'learning_rate': 1.1593921486992935e-05, 'epoch': 0.9} {'loss': 0.5783, 'learning_rate': 1.1593598319682357e-05, 'epoch': 0.9} {'loss': 0.774, 'learning_rate': 1.1593275150664096e-05, 'epoch': 0.9} {'loss': 0.6672, 'learning_rate': 1.15929519799385e-05, 'epoch': 0.9} {'loss': 0.8006, 'learning_rate': 1.1592628807505912e-05, 'epoch': 0.9} {'loss': 0.9625, 'learning_rate': 1.1592305633366677e-05, 'epoch': 0.9} {'loss': 0.6646, 'learning_rate': 1.159198245752114e-05, 'epoch': 0.9} {'loss': 0.7205, 'learning_rate': 1.1591659279969652e-05, 'epoch': 0.9} {'loss': 0.8727, 'learning_rate': 1.1591336100712558e-05, 'epoch': 0.9} {'loss': 0.7688, 'learning_rate': 1.1591012919750205e-05, 'epoch': 0.9} {'loss': 0.9843, 'learning_rate': 1.1590689737082937e-05, 'epoch': 0.9} {'loss': 0.7124, 'learning_rate': 1.1590366552711101e-05, 'epoch': 0.9} {'loss': 0.6766, 'learning_rate': 1.1590043366635043e-05, 'epoch': 0.9} {'loss': 0.8677, 'learning_rate': 1.1589720178855111e-05, 'epoch': 0.9} {'loss': 0.717, 'learning_rate': 1.1589396989371649e-05, 'epoch': 0.9} {'loss': 0.7574, 'learning_rate': 1.1589073798185006e-05, 'epoch': 0.9} {'loss': 0.7938, 'learning_rate': 1.1588750605295527e-05, 'epoch': 0.9} {'loss': 0.8049, 'learning_rate': 1.158842741070356e-05, 'epoch': 0.9} {'loss': 0.819, 'learning_rate': 1.1588104214409448e-05, 'epoch': 0.9} {'loss': 0.7748, 'learning_rate': 1.1587781016413538e-05, 'epoch': 0.9} {'loss': 0.8114, 'learning_rate': 1.1587457816716177e-05, 'epoch': 0.9} {'loss': 0.9089, 'learning_rate': 1.1587134615317712e-05, 'epoch': 0.9} {'loss': 0.7117, 'learning_rate': 1.1586811412218493e-05, 'epoch': 0.9} {'loss': 0.6229, 'learning_rate': 1.1586488207418857e-05, 'epoch': 0.9} {'loss': 0.8088, 'learning_rate': 1.1586165000919161e-05, 'epoch': 0.9} {'loss': 0.7438, 'learning_rate': 1.158584179271974e-05, 'epoch': 0.9} {'loss': 0.7613, 'learning_rate': 1.1585518582820949e-05, 'epoch': 0.9} {'loss': 0.8333, 'learning_rate': 1.1585195371223133e-05, 'epoch': 0.9} {'loss': 0.6575, 'learning_rate': 1.1584872157926637e-05, 'epoch': 0.9} {'loss': 0.7916, 'learning_rate': 1.1584548942931805e-05, 'epoch': 0.9} {'loss': 0.7333, 'learning_rate': 1.158422572623899e-05, 'epoch': 0.9} {'loss': 0.8304, 'learning_rate': 1.1583902507848532e-05, 'epoch': 0.9} {'loss': 0.7491, 'learning_rate': 1.1583579287760778e-05, 'epoch': 0.9} {'loss': 0.7062, 'learning_rate': 1.1583256065976077e-05, 'epoch': 0.9} {'loss': 0.9744, 'learning_rate': 1.1582932842494775e-05, 'epoch': 0.9} {'loss': 0.8516, 'learning_rate': 1.1582609617317215e-05, 'epoch': 0.9} {'loss': 0.7642, 'learning_rate': 1.1582286390443746e-05, 'epoch': 0.9} {'loss': 0.8567, 'learning_rate': 1.1581963161874716e-05, 'epoch': 0.9} {'loss': 0.8651, 'learning_rate': 1.1581639931610474e-05, 'epoch': 0.9} {'loss': 0.8586, 'learning_rate': 1.1581316699651355e-05, 'epoch': 0.9} {'loss': 0.7561, 'learning_rate': 1.1580993465997716e-05, 'epoch': 0.9} {'loss': 0.6493, 'learning_rate': 1.15806702306499e-05, 'epoch': 0.9} {'loss': 0.8337, 'learning_rate': 1.158034699360825e-05, 'epoch': 0.9} {'loss': 0.8434, 'learning_rate': 1.1580023754873117e-05, 'epoch': 0.9} {'loss': 0.7771, 'learning_rate': 1.1579700514444848e-05, 'epoch': 0.9} {'loss': 0.7708, 'learning_rate': 1.1579377272323786e-05, 'epoch': 0.9} {'loss': 1.0309, 'learning_rate': 1.157905402851028e-05, 'epoch': 0.9} {'loss': 0.7712, 'learning_rate': 1.1578730783004675e-05, 'epoch': 0.9} {'loss': 0.857, 'learning_rate': 1.1578407535807315e-05, 'epoch': 0.9} {'loss': 0.7107, 'learning_rate': 1.157808428691855e-05, 'epoch': 0.9} {'loss': 0.6574, 'learning_rate': 1.1577761036338724e-05, 'epoch': 0.9} {'loss': 0.8078, 'learning_rate': 1.1577437784068189e-05, 'epoch': 0.9} {'loss': 0.688, 'learning_rate': 1.1577114530107282e-05, 'epoch': 0.9} {'loss': 0.6848, 'learning_rate': 1.1576791274456359e-05, 'epoch': 0.9} {'loss': 0.7894, 'learning_rate': 1.1576468017115758e-05, 'epoch': 0.9} {'loss': 1.004, 'learning_rate': 1.157614475808583e-05, 'epoch': 0.9} {'loss': 0.8517, 'learning_rate': 1.157582149736692e-05, 'epoch': 0.9} {'loss': 0.8126, 'learning_rate': 1.1575498234959376e-05, 'epoch': 0.9} {'loss': 0.7836, 'learning_rate': 1.1575174970863546e-05, 'epoch': 0.9} {'loss': 0.6808, 'learning_rate': 1.1574851705079772e-05, 'epoch': 0.9} {'loss': 0.851, 'learning_rate': 1.1574528437608404e-05, 'epoch': 0.9} {'loss': 0.9547, 'learning_rate': 1.1574205168449781e-05, 'epoch': 0.9} {'loss': 0.7708, 'learning_rate': 1.157388189760426e-05, 'epoch': 0.9} {'loss': 0.7389, 'learning_rate': 1.1573558625072179e-05, 'epoch': 0.9} {'loss': 0.6082, 'learning_rate': 1.1573235350853891e-05, 'epoch': 0.9} {'loss': 0.7785, 'learning_rate': 1.1572912074949738e-05, 'epoch': 0.9} {'loss': 0.8638, 'learning_rate': 1.157258879736007e-05, 'epoch': 0.9} {'loss': 0.8229, 'learning_rate': 1.1572265518085229e-05, 'epoch': 0.9} {'loss': 0.6642, 'learning_rate': 1.1571942237125564e-05, 'epoch': 0.9} {'loss': 0.7224, 'learning_rate': 1.1571618954481418e-05, 'epoch': 0.9} {'loss': 0.8458, 'learning_rate': 1.1571295670153144e-05, 'epoch': 0.9} {'loss': 0.8187, 'learning_rate': 1.1570972384141083e-05, 'epoch': 0.9} {'loss': 0.7908, 'learning_rate': 1.1570649096445587e-05, 'epoch': 0.9} {'loss': 0.8534, 'learning_rate': 1.1570325807066997e-05, 'epoch': 0.9} {'loss': 0.7151, 'learning_rate': 1.1570002516005661e-05, 'epoch': 0.9} {'loss': 0.5983, 'learning_rate': 1.1569679223261923e-05, 'epoch': 0.9} {'loss': 0.6121, 'learning_rate': 1.1569355928836135e-05, 'epoch': 0.9} {'loss': 0.9094, 'learning_rate': 1.156903263272864e-05, 'epoch': 0.9} {'loss': 0.7563, 'learning_rate': 1.1568709334939783e-05, 'epoch': 0.9} {'loss': 0.6698, 'learning_rate': 1.1568386035469914e-05, 'epoch': 0.9} {'loss': 0.6703, 'learning_rate': 1.1568062734319379e-05, 'epoch': 0.9} {'loss': 0.8148, 'learning_rate': 1.156773943148852e-05, 'epoch': 0.9} {'loss': 0.8611, 'learning_rate': 1.1567416126977688e-05, 'epoch': 0.9} {'loss': 0.7241, 'learning_rate': 1.156709282078723e-05, 'epoch': 0.9} {'loss': 0.7299, 'learning_rate': 1.156676951291749e-05, 'epoch': 0.9} {'loss': 0.7739, 'learning_rate': 1.1566446203368813e-05, 'epoch': 0.9} {'loss': 0.6863, 'learning_rate': 1.1566122892141549e-05, 'epoch': 0.9} {'loss': 0.9452, 'learning_rate': 1.1565799579236043e-05, 'epoch': 0.9} {'loss': 0.8312, 'learning_rate': 1.1565476264652641e-05, 'epoch': 0.9} {'loss': 0.8581, 'learning_rate': 1.156515294839169e-05, 'epoch': 0.9} {'loss': 0.764, 'learning_rate': 1.1564829630453535e-05, 'epoch': 0.9} {'loss': 0.7502, 'learning_rate': 1.1564506310838527e-05, 'epoch': 0.9} {'loss': 0.6935, 'learning_rate': 1.1564182989547007e-05, 'epoch': 0.9} {'loss': 0.7514, 'learning_rate': 1.1563859666579326e-05, 'epoch': 0.9} {'loss': 0.7443, 'learning_rate': 1.1563536341935826e-05, 'epoch': 0.9} {'loss': 0.7813, 'learning_rate': 1.1563213015616857e-05, 'epoch': 0.9} {'loss': 0.7321, 'learning_rate': 1.1562889687622762e-05, 'epoch': 0.9} {'loss': 0.6382, 'learning_rate': 1.1562566357953893e-05, 'epoch': 0.9} {'loss': 0.8185, 'learning_rate': 1.156224302661059e-05, 'epoch': 0.9} {'loss': 0.6841, 'learning_rate': 1.1561919693593204e-05, 'epoch': 0.9} {'loss': 0.6438, 'learning_rate': 1.156159635890208e-05, 'epoch': 0.9} {'loss': 0.7254, 'learning_rate': 1.1561273022537565e-05, 'epoch': 0.9} {'loss': 0.657, 'learning_rate': 1.1560949684500002e-05, 'epoch': 0.9} {'loss': 0.763, 'learning_rate': 1.1560626344789747e-05, 'epoch': 0.9} {'loss': 0.848, 'learning_rate': 1.1560303003407134e-05, 'epoch': 0.9} {'loss': 0.5765, 'learning_rate': 1.1559979660352519e-05, 'epoch': 0.9} {'loss': 0.6537, 'learning_rate': 1.1559656315626242e-05, 'epoch': 0.9} {'loss': 0.7288, 'learning_rate': 1.1559332969228657e-05, 'epoch': 0.9} {'loss': 0.7778, 'learning_rate': 1.15590096211601e-05, 'epoch': 0.9} {'loss': 0.7105, 'learning_rate': 1.1558686271420927e-05, 'epoch': 0.9} {'loss': 0.7594, 'learning_rate': 1.1558362920011482e-05, 'epoch': 0.9} {'loss': 0.6726, 'learning_rate': 1.1558039566932106e-05, 'epoch': 0.9} {'loss': 1.0066, 'learning_rate': 1.1557716212183154e-05, 'epoch': 0.9} {'loss': 0.9226, 'learning_rate': 1.1557392855764966e-05, 'epoch': 0.9} {'loss': 0.7533, 'learning_rate': 1.1557069497677893e-05, 'epoch': 0.9} {'loss': 0.6132, 'learning_rate': 1.155674613792228e-05, 'epoch': 0.9} {'loss': 0.815, 'learning_rate': 1.1556422776498473e-05, 'epoch': 0.9} {'loss': 0.8823, 'learning_rate': 1.1556099413406817e-05, 'epoch': 0.9} {'loss': 0.7519, 'learning_rate': 1.155577604864766e-05, 'epoch': 0.9} {'loss': 0.7177, 'learning_rate': 1.1555452682221349e-05, 'epoch': 0.9} {'loss': 0.7011, 'learning_rate': 1.1555129314128228e-05, 'epoch': 0.9} {'loss': 0.6922, 'learning_rate': 1.155480594436865e-05, 'epoch': 0.9} {'loss': 0.7016, 'learning_rate': 1.1554482572942955e-05, 'epoch': 0.9} {'loss': 0.7468, 'learning_rate': 1.1554159199851491e-05, 'epoch': 0.9} {'loss': 0.9077, 'learning_rate': 1.1553835825094606e-05, 'epoch': 0.9} {'loss': 0.7233, 'learning_rate': 1.1553512448672644e-05, 'epoch': 0.9} {'loss': 0.6839, 'learning_rate': 1.1553189070585952e-05, 'epoch': 0.9} {'loss': 0.8343, 'learning_rate': 1.155286569083488e-05, 'epoch': 0.9} {'loss': 0.7327, 'learning_rate': 1.1552542309419773e-05, 'epoch': 0.9} {'loss': 0.6788, 'learning_rate': 1.155221892634098e-05, 'epoch': 0.9} {'loss': 0.7577, 'learning_rate': 1.1551895541598838e-05, 'epoch': 0.9} {'loss': 0.8229, 'learning_rate': 1.1551572155193705e-05, 'epoch': 0.9} {'loss': 0.7767, 'learning_rate': 1.1551248767125917e-05, 'epoch': 0.9} {'loss': 0.7573, 'learning_rate': 1.1550925377395828e-05, 'epoch': 0.9} {'loss': 0.7545, 'learning_rate': 1.1550601986003785e-05, 'epoch': 0.9} {'loss': 0.8906, 'learning_rate': 1.1550278592950131e-05, 'epoch': 0.9} {'loss': 0.8096, 'learning_rate': 1.1549955198235212e-05, 'epoch': 0.9} {'loss': 0.6633, 'learning_rate': 1.1549631801859378e-05, 'epoch': 0.9} {'loss': 0.6405, 'learning_rate': 1.154930840382297e-05, 'epoch': 0.9} {'loss': 0.7595, 'learning_rate': 1.1548985004126341e-05, 'epoch': 0.9} {'loss': 0.6884, 'learning_rate': 1.1548661602769833e-05, 'epoch': 0.9} {'loss': 0.7601, 'learning_rate': 1.1548338199753798e-05, 'epoch': 0.9} {'loss': 0.6355, 'learning_rate': 1.1548014795078579e-05, 'epoch': 0.9} {'loss': 0.7274, 'learning_rate': 1.154769138874452e-05, 'epoch': 0.9} {'loss': 0.7571, 'learning_rate': 1.1547367980751969e-05, 'epoch': 0.9} {'loss': 0.7062, 'learning_rate': 1.1547044571101274e-05, 'epoch': 0.9} {'loss': 0.6971, 'learning_rate': 1.1546721159792779e-05, 'epoch': 0.9} {'loss': 0.7744, 'learning_rate': 1.1546397746826839e-05, 'epoch': 0.9} {'loss': 0.8191, 'learning_rate': 1.154607433220379e-05, 'epoch': 0.9} {'loss': 0.8424, 'learning_rate': 1.1545750915923984e-05, 'epoch': 0.9} {'loss': 0.8906, 'learning_rate': 1.1545427497987766e-05, 'epoch': 0.9} {'loss': 0.8088, 'learning_rate': 1.1545104078395481e-05, 'epoch': 0.9} {'loss': 0.7322, 'learning_rate': 1.1544780657147478e-05, 'epoch': 0.9} {'loss': 0.7034, 'learning_rate': 1.1544457234244107e-05, 'epoch': 0.9} {'loss': 0.8954, 'learning_rate': 1.1544133809685706e-05, 'epoch': 0.9} {'loss': 0.6978, 'learning_rate': 1.1543810383472629e-05, 'epoch': 0.9} {'loss': 0.901, 'learning_rate': 1.1543486955605221e-05, 'epoch': 0.9} {'loss': 0.7659, 'learning_rate': 1.1543163526083826e-05, 'epoch': 0.9} {'loss': 0.6516, 'learning_rate': 1.154284009490879e-05, 'epoch': 0.9} {'loss': 0.6766, 'learning_rate': 1.1542516662080463e-05, 'epoch': 0.9} {'loss': 1.0184, 'learning_rate': 1.1542193227599191e-05, 'epoch': 0.9} {'loss': 0.7904, 'learning_rate': 1.1541869791465318e-05, 'epoch': 0.9} {'loss': 0.8884, 'learning_rate': 1.1541546353679194e-05, 'epoch': 0.9} {'loss': 0.8329, 'learning_rate': 1.1541222914241165e-05, 'epoch': 0.9} {'loss': 0.8855, 'learning_rate': 1.1540899473151575e-05, 'epoch': 0.9} {'loss': 0.7338, 'learning_rate': 1.154057603041077e-05, 'epoch': 0.9} {'loss': 0.6711, 'learning_rate': 1.1540252586019103e-05, 'epoch': 0.9} {'loss': 0.7726, 'learning_rate': 1.1539929139976915e-05, 'epoch': 0.9} {'loss': 0.8065, 'learning_rate': 1.1539605692284552e-05, 'epoch': 0.91} {'loss': 0.7468, 'learning_rate': 1.1539282242942362e-05, 'epoch': 0.91} {'loss': 0.6531, 'learning_rate': 1.1538958791950695e-05, 'epoch': 0.91} {'loss': 0.6377, 'learning_rate': 1.1538635339309893e-05, 'epoch': 0.91} {'loss': 0.6342, 'learning_rate': 1.1538311885020308e-05, 'epoch': 0.91} {'loss': 0.9089, 'learning_rate': 1.1537988429082279e-05, 'epoch': 0.91} {'loss': 0.7404, 'learning_rate': 1.1537664971496156e-05, 'epoch': 0.91} {'loss': 0.8434, 'learning_rate': 1.1537341512262288e-05, 'epoch': 0.91} {'loss': 0.8654, 'learning_rate': 1.1537018051381021e-05, 'epoch': 0.91} {'loss': 0.7491, 'learning_rate': 1.15366945888527e-05, 'epoch': 0.91} {'loss': 0.7237, 'learning_rate': 1.153637112467767e-05, 'epoch': 0.91} {'loss': 0.7048, 'learning_rate': 1.1536047658856282e-05, 'epoch': 0.91} {'loss': 0.9305, 'learning_rate': 1.1535724191388878e-05, 'epoch': 0.91} {'loss': 0.6937, 'learning_rate': 1.1535400722275807e-05, 'epoch': 0.91} {'loss': 0.7643, 'learning_rate': 1.1535077251517414e-05, 'epoch': 0.91} {'loss': 0.7524, 'learning_rate': 1.1534753779114052e-05, 'epoch': 0.91} {'loss': 0.7383, 'learning_rate': 1.153443030506606e-05, 'epoch': 0.91} {'loss': 0.799, 'learning_rate': 1.1534106829373791e-05, 'epoch': 0.91} {'loss': 0.7671, 'learning_rate': 1.1533783352037584e-05, 'epoch': 0.91} {'loss': 0.7608, 'learning_rate': 1.1533459873057789e-05, 'epoch': 0.91} {'loss': 0.9082, 'learning_rate': 1.1533136392434754e-05, 'epoch': 0.91} {'loss': 0.9649, 'learning_rate': 1.1532812910168827e-05, 'epoch': 0.91} {'loss': 0.8589, 'learning_rate': 1.1532489426260352e-05, 'epoch': 0.91} {'loss': 0.8426, 'learning_rate': 1.1532165940709679e-05, 'epoch': 0.91} {'loss': 0.778, 'learning_rate': 1.1531842453517146e-05, 'epoch': 0.91} {'loss': 0.7427, 'learning_rate': 1.1531518964683109e-05, 'epoch': 0.91} {'loss': 0.7842, 'learning_rate': 1.153119547420791e-05, 'epoch': 0.91} {'loss': 0.7803, 'learning_rate': 1.1530871982091896e-05, 'epoch': 0.91} {'loss': 0.781, 'learning_rate': 1.1530548488335416e-05, 'epoch': 0.91} {'loss': 0.6903, 'learning_rate': 1.1530224992938817e-05, 'epoch': 0.91} {'loss': 0.845, 'learning_rate': 1.1529901495902443e-05, 'epoch': 0.91} {'loss': 0.7344, 'learning_rate': 1.152957799722664e-05, 'epoch': 0.91} {'loss': 0.8078, 'learning_rate': 1.1529254496911756e-05, 'epoch': 0.91} {'loss': 0.8242, 'learning_rate': 1.1528930994958137e-05, 'epoch': 0.91} {'loss': 0.6741, 'learning_rate': 1.1528607491366131e-05, 'epoch': 0.91} {'loss': 0.598, 'learning_rate': 1.1528283986136084e-05, 'epoch': 0.91} {'loss': 0.9773, 'learning_rate': 1.1527960479268346e-05, 'epoch': 0.91} {'loss': 0.7165, 'learning_rate': 1.152763697076326e-05, 'epoch': 0.91} {'loss': 0.8564, 'learning_rate': 1.1527313460621168e-05, 'epoch': 0.91} {'loss': 0.8108, 'learning_rate': 1.1526989948842425e-05, 'epoch': 0.91} {'loss': 0.807, 'learning_rate': 1.1526666435427374e-05, 'epoch': 0.91} {'loss': 0.7337, 'learning_rate': 1.1526342920376361e-05, 'epoch': 0.91} {'loss': 0.7856, 'learning_rate': 1.1526019403689736e-05, 'epoch': 0.91} {'loss': 0.8256, 'learning_rate': 1.1525695885367843e-05, 'epoch': 0.91} {'loss': 0.7366, 'learning_rate': 1.1525372365411031e-05, 'epoch': 0.91} {'loss': 0.9098, 'learning_rate': 1.1525048843819642e-05, 'epoch': 0.91} {'loss': 0.831, 'learning_rate': 1.1524725320594025e-05, 'epoch': 0.91} {'loss': 0.7155, 'learning_rate': 1.1524401795734528e-05, 'epoch': 0.91} {'loss': 0.7492, 'learning_rate': 1.15240782692415e-05, 'epoch': 0.91} {'loss': 0.7402, 'learning_rate': 1.1523754741115281e-05, 'epoch': 0.91} {'loss': 0.6054, 'learning_rate': 1.1523431211356223e-05, 'epoch': 0.91} {'loss': 0.8111, 'learning_rate': 1.152310767996467e-05, 'epoch': 0.91} {'loss': 0.6351, 'learning_rate': 1.1522784146940969e-05, 'epoch': 0.91} {'loss': 0.7646, 'learning_rate': 1.1522460612285466e-05, 'epoch': 0.91} {'loss': 0.717, 'learning_rate': 1.1522137075998512e-05, 'epoch': 0.91} {'loss': 0.7046, 'learning_rate': 1.152181353808045e-05, 'epoch': 0.91} {'loss': 0.7624, 'learning_rate': 1.1521489998531627e-05, 'epoch': 0.91} {'loss': 0.7479, 'learning_rate': 1.1521166457352393e-05, 'epoch': 0.91} {'loss': 0.7565, 'learning_rate': 1.1520842914543089e-05, 'epoch': 0.91} {'loss': 0.8209, 'learning_rate': 1.1520519370104065e-05, 'epoch': 0.91} {'loss': 0.8066, 'learning_rate': 1.1520195824035666e-05, 'epoch': 0.91} {'loss': 0.8941, 'learning_rate': 1.1519872276338243e-05, 'epoch': 0.91} {'loss': 0.8087, 'learning_rate': 1.1519548727012136e-05, 'epoch': 0.91} {'loss': 0.7409, 'learning_rate': 1.1519225176057699e-05, 'epoch': 0.91} {'loss': 0.77, 'learning_rate': 1.1518901623475274e-05, 'epoch': 0.91} {'loss': 0.8616, 'learning_rate': 1.1518578069265208e-05, 'epoch': 0.91} {'loss': 0.6971, 'learning_rate': 1.1518254513427847e-05, 'epoch': 0.91} {'loss': 0.818, 'learning_rate': 1.1517930955963542e-05, 'epoch': 0.91} {'loss': 0.8062, 'learning_rate': 1.1517607396872634e-05, 'epoch': 0.91} {'loss': 0.7723, 'learning_rate': 1.1517283836155475e-05, 'epoch': 0.91} {'loss': 0.7509, 'learning_rate': 1.1516960273812408e-05, 'epoch': 0.91} {'loss': 0.7554, 'learning_rate': 1.1516636709843785e-05, 'epoch': 0.91} {'loss': 0.7926, 'learning_rate': 1.1516313144249944e-05, 'epoch': 0.91} {'loss': 0.6056, 'learning_rate': 1.1515989577031239e-05, 'epoch': 0.91} {'loss': 0.6684, 'learning_rate': 1.1515666008188016e-05, 'epoch': 0.91} {'loss': 0.6859, 'learning_rate': 1.1515342437720616e-05, 'epoch': 0.91} {'loss': 0.8455, 'learning_rate': 1.1515018865629393e-05, 'epoch': 0.91} {'loss': 0.8132, 'learning_rate': 1.1514695291914689e-05, 'epoch': 0.91} {'loss': 0.7199, 'learning_rate': 1.1514371716576853e-05, 'epoch': 0.91} {'loss': 0.7225, 'learning_rate': 1.1514048139616229e-05, 'epoch': 0.91} {'loss': 0.8112, 'learning_rate': 1.151372456103317e-05, 'epoch': 0.91} {'loss': 0.7628, 'learning_rate': 1.1513400980828016e-05, 'epoch': 0.91} {'loss': 0.6748, 'learning_rate': 1.1513077399001116e-05, 'epoch': 0.91} {'loss': 0.747, 'learning_rate': 1.1512753815552818e-05, 'epoch': 0.91} {'loss': 0.8232, 'learning_rate': 1.1512430230483466e-05, 'epoch': 0.91} {'loss': 0.7993, 'learning_rate': 1.151210664379341e-05, 'epoch': 0.91} {'loss': 0.8253, 'learning_rate': 1.1511783055482996e-05, 'epoch': 0.91} {'loss': 0.6882, 'learning_rate': 1.1511459465552568e-05, 'epoch': 0.91} {'loss': 0.774, 'learning_rate': 1.1511135874002474e-05, 'epoch': 0.91} {'loss': 0.7804, 'learning_rate': 1.1510812280833063e-05, 'epoch': 0.91} {'loss': 0.6991, 'learning_rate': 1.1510488686044681e-05, 'epoch': 0.91} {'loss': 0.7591, 'learning_rate': 1.1510165089637675e-05, 'epoch': 0.91} {'loss': 0.7677, 'learning_rate': 1.150984149161239e-05, 'epoch': 0.91} {'loss': 0.7671, 'learning_rate': 1.1509517891969174e-05, 'epoch': 0.91} {'loss': 0.7973, 'learning_rate': 1.150919429070837e-05, 'epoch': 0.91} {'loss': 0.7685, 'learning_rate': 1.1508870687830329e-05, 'epoch': 0.91} {'loss': 0.9367, 'learning_rate': 1.1508547083335398e-05, 'epoch': 0.91} {'loss': 0.9127, 'learning_rate': 1.1508223477223921e-05, 'epoch': 0.91} {'loss': 0.764, 'learning_rate': 1.150789986949625e-05, 'epoch': 0.91} {'loss': 0.5564, 'learning_rate': 1.1507576260152728e-05, 'epoch': 0.91} {'loss': 0.7463, 'learning_rate': 1.15072526491937e-05, 'epoch': 0.91} {'loss': 0.8671, 'learning_rate': 1.1506929036619514e-05, 'epoch': 0.91} {'loss': 0.6536, 'learning_rate': 1.150660542243052e-05, 'epoch': 0.91} {'loss': 0.8528, 'learning_rate': 1.150628180662706e-05, 'epoch': 0.91} {'loss': 0.7501, 'learning_rate': 1.1505958189209483e-05, 'epoch': 0.91} {'loss': 0.7646, 'learning_rate': 1.150563457017814e-05, 'epoch': 0.91} {'loss': 0.837, 'learning_rate': 1.150531094953337e-05, 'epoch': 0.91} {'loss': 0.7772, 'learning_rate': 1.1504987327275523e-05, 'epoch': 0.91} {'loss': 1.0319, 'learning_rate': 1.1504663703404947e-05, 'epoch': 0.91} {'loss': 0.764, 'learning_rate': 1.1504340077921987e-05, 'epoch': 0.91} {'loss': 0.756, 'learning_rate': 1.1504016450826992e-05, 'epoch': 0.91} {'loss': 0.7727, 'learning_rate': 1.1503692822120308e-05, 'epoch': 0.91} {'loss': 0.7999, 'learning_rate': 1.1503369191802282e-05, 'epoch': 0.91} {'loss': 0.7753, 'learning_rate': 1.150304555987326e-05, 'epoch': 0.91} {'loss': 0.7402, 'learning_rate': 1.1502721926333588e-05, 'epoch': 0.91} {'loss': 0.7998, 'learning_rate': 1.1502398291183615e-05, 'epoch': 0.91} {'loss': 0.5829, 'learning_rate': 1.1502074654423684e-05, 'epoch': 0.91} {'loss': 0.7671, 'learning_rate': 1.1501751016054146e-05, 'epoch': 0.91} {'loss': 0.6241, 'learning_rate': 1.150142737607535e-05, 'epoch': 0.91} {'loss': 1.031, 'learning_rate': 1.1501103734487633e-05, 'epoch': 0.91} {'loss': 0.913, 'learning_rate': 1.1500780091291353e-05, 'epoch': 0.91} {'loss': 0.6954, 'learning_rate': 1.1500456446486847e-05, 'epoch': 0.91} {'loss': 0.7274, 'learning_rate': 1.150013280007447e-05, 'epoch': 0.91} {'loss': 0.6747, 'learning_rate': 1.1499809152054561e-05, 'epoch': 0.91} {'loss': 0.9306, 'learning_rate': 1.1499485502427477e-05, 'epoch': 0.91} {'loss': 0.7452, 'learning_rate': 1.1499161851193556e-05, 'epoch': 0.91} {'loss': 0.7497, 'learning_rate': 1.1498838198353149e-05, 'epoch': 0.91} {'loss': 0.9238, 'learning_rate': 1.14985145439066e-05, 'epoch': 0.91} {'loss': 0.8806, 'learning_rate': 1.1498190887854257e-05, 'epoch': 0.91} {'loss': 0.7866, 'learning_rate': 1.1497867230196467e-05, 'epoch': 0.91} {'loss': 0.8275, 'learning_rate': 1.149754357093358e-05, 'epoch': 0.91} {'loss': 0.8316, 'learning_rate': 1.1497219910065938e-05, 'epoch': 0.91} {'loss': 0.8798, 'learning_rate': 1.1496896247593889e-05, 'epoch': 0.91} {'loss': 0.5639, 'learning_rate': 1.1496572583517781e-05, 'epoch': 0.91} {'loss': 0.8384, 'learning_rate': 1.1496248917837963e-05, 'epoch': 0.91} {'loss': 0.845, 'learning_rate': 1.1495925250554776e-05, 'epoch': 0.91} {'loss': 0.8513, 'learning_rate': 1.1495601581668572e-05, 'epoch': 0.91} {'loss': 0.6742, 'learning_rate': 1.1495277911179695e-05, 'epoch': 0.91} {'loss': 0.6738, 'learning_rate': 1.1494954239088492e-05, 'epoch': 0.91} {'loss': 0.7264, 'learning_rate': 1.1494630565395311e-05, 'epoch': 0.91} {'loss': 0.8934, 'learning_rate': 1.14943068901005e-05, 'epoch': 0.91} {'loss': 0.7098, 'learning_rate': 1.1493983213204402e-05, 'epoch': 0.91} {'loss': 0.8494, 'learning_rate': 1.1493659534707367e-05, 'epoch': 0.91} {'loss': 0.6875, 'learning_rate': 1.1493335854609741e-05, 'epoch': 0.91} {'loss': 0.7492, 'learning_rate': 1.1493012172911872e-05, 'epoch': 0.91} {'loss': 0.7574, 'learning_rate': 1.1492688489614103e-05, 'epoch': 0.91} {'loss': 0.7772, 'learning_rate': 1.1492364804716784e-05, 'epoch': 0.91} {'loss': 0.7811, 'learning_rate': 1.1492041118220265e-05, 'epoch': 0.91} {'loss': 0.7159, 'learning_rate': 1.1491717430124886e-05, 'epoch': 0.91} {'loss': 0.8378, 'learning_rate': 1.1491393740431e-05, 'epoch': 0.91} {'loss': 0.6655, 'learning_rate': 1.149107004913895e-05, 'epoch': 0.91} {'loss': 0.6097, 'learning_rate': 1.1490746356249084e-05, 'epoch': 0.91} {'loss': 0.9445, 'learning_rate': 1.1490422661761744e-05, 'epoch': 0.91} {'loss': 0.8187, 'learning_rate': 1.1490098965677286e-05, 'epoch': 0.91} {'loss': 0.742, 'learning_rate': 1.1489775267996052e-05, 'epoch': 0.91} {'loss': 0.8521, 'learning_rate': 1.1489451568718394e-05, 'epoch': 0.91} {'loss': 0.8445, 'learning_rate': 1.1489127867844647e-05, 'epoch': 0.91} {'loss': 0.8224, 'learning_rate': 1.1488804165375167e-05, 'epoch': 0.91} {'loss': 0.826, 'learning_rate': 1.1488480461310298e-05, 'epoch': 0.91} {'loss': 0.8684, 'learning_rate': 1.148815675565039e-05, 'epoch': 0.91} {'loss': 0.7733, 'learning_rate': 1.1487833048395789e-05, 'epoch': 0.91} {'loss': 0.8374, 'learning_rate': 1.1487509339546836e-05, 'epoch': 0.91} {'loss': 0.6919, 'learning_rate': 1.1487185629103887e-05, 'epoch': 0.91} {'loss': 0.803, 'learning_rate': 1.1486861917067283e-05, 'epoch': 0.91} {'loss': 0.8966, 'learning_rate': 1.148653820343737e-05, 'epoch': 0.91} {'loss': 0.8842, 'learning_rate': 1.1486214488214497e-05, 'epoch': 0.91} {'loss': 0.8433, 'learning_rate': 1.1485890771399013e-05, 'epoch': 0.91} {'loss': 0.8512, 'learning_rate': 1.1485567052991264e-05, 'epoch': 0.91} {'loss': 0.6585, 'learning_rate': 1.1485243332991598e-05, 'epoch': 0.91} {'loss': 0.658, 'learning_rate': 1.1484919611400356e-05, 'epoch': 0.91} {'loss': 0.94, 'learning_rate': 1.148459588821789e-05, 'epoch': 0.91} {'loss': 0.6813, 'learning_rate': 1.1484272163444541e-05, 'epoch': 0.91} {'loss': 0.6478, 'learning_rate': 1.1483948437080663e-05, 'epoch': 0.91} {'loss': 0.6868, 'learning_rate': 1.1483624709126602e-05, 'epoch': 0.91} {'loss': 0.5714, 'learning_rate': 1.1483300979582703e-05, 'epoch': 0.91} {'loss': 0.8923, 'learning_rate': 1.1482977248449314e-05, 'epoch': 0.91} {'loss': 0.865, 'learning_rate': 1.148265351572678e-05, 'epoch': 0.91} {'loss': 0.8179, 'learning_rate': 1.1482329781415449e-05, 'epoch': 0.91} {'loss': 0.8368, 'learning_rate': 1.1482006045515665e-05, 'epoch': 0.91} {'loss': 0.7012, 'learning_rate': 1.148168230802778e-05, 'epoch': 0.91} {'loss': 0.9052, 'learning_rate': 1.148135856895214e-05, 'epoch': 0.91} {'loss': 0.6062, 'learning_rate': 1.1481034828289088e-05, 'epoch': 0.91} {'loss': 0.7047, 'learning_rate': 1.1480711086038978e-05, 'epoch': 0.91} {'loss': 0.8968, 'learning_rate': 1.1480387342202148e-05, 'epoch': 0.91} {'loss': 0.8726, 'learning_rate': 1.148006359677895e-05, 'epoch': 0.91} {'loss': 0.6745, 'learning_rate': 1.147973984976973e-05, 'epoch': 0.91} {'loss': 0.6319, 'learning_rate': 1.1479416101174836e-05, 'epoch': 0.91} {'loss': 0.7371, 'learning_rate': 1.1479092350994617e-05, 'epoch': 0.91} {'loss': 0.7888, 'learning_rate': 1.1478768599229413e-05, 'epoch': 0.91} {'loss': 0.7139, 'learning_rate': 1.1478444845879577e-05, 'epoch': 0.91} {'loss': 0.8476, 'learning_rate': 1.1478121090945453e-05, 'epoch': 0.91} {'loss': 0.8737, 'learning_rate': 1.147779733442739e-05, 'epoch': 0.91} {'loss': 0.6892, 'learning_rate': 1.1477473576325731e-05, 'epoch': 0.91} {'loss': 0.8256, 'learning_rate': 1.1477149816640829e-05, 'epoch': 0.91} {'loss': 0.8546, 'learning_rate': 1.1476826055373027e-05, 'epoch': 0.91} {'loss': 0.8415, 'learning_rate': 1.147650229252267e-05, 'epoch': 0.91} {'loss': 0.8274, 'learning_rate': 1.1476178528090111e-05, 'epoch': 0.91} {'loss': 0.796, 'learning_rate': 1.147585476207569e-05, 'epoch': 0.91} {'loss': 0.9541, 'learning_rate': 1.147553099447976e-05, 'epoch': 0.91} {'loss': 0.733, 'learning_rate': 1.1475207225302667e-05, 'epoch': 0.91} {'loss': 0.5446, 'learning_rate': 1.1474883454544752e-05, 'epoch': 0.91} {'loss': 0.8025, 'learning_rate': 1.1474559682206368e-05, 'epoch': 0.91} {'loss': 0.8618, 'learning_rate': 1.1474235908287863e-05, 'epoch': 0.91} {'loss': 0.8529, 'learning_rate': 1.1473912132789577e-05, 'epoch': 0.91} {'loss': 0.9087, 'learning_rate': 1.1473588355711863e-05, 'epoch': 0.91} {'loss': 0.8096, 'learning_rate': 1.1473264577055065e-05, 'epoch': 0.91} {'loss': 0.7369, 'learning_rate': 1.1472940796819532e-05, 'epoch': 0.91} {'loss': 0.8185, 'learning_rate': 1.147261701500561e-05, 'epoch': 0.91} {'loss': 0.9243, 'learning_rate': 1.1472293231613646e-05, 'epoch': 0.91} {'loss': 0.904, 'learning_rate': 1.1471969446643986e-05, 'epoch': 0.91} {'loss': 0.9359, 'learning_rate': 1.1471645660096979e-05, 'epoch': 0.91} {'loss': 0.7171, 'learning_rate': 1.1471321871972969e-05, 'epoch': 0.91} {'loss': 0.8138, 'learning_rate': 1.1470998082272309e-05, 'epoch': 0.91} {'loss': 0.7743, 'learning_rate': 1.1470674290995339e-05, 'epoch': 0.91} {'loss': 0.8975, 'learning_rate': 1.1470350498142407e-05, 'epoch': 0.91} {'loss': 0.5415, 'learning_rate': 1.1470026703713863e-05, 'epoch': 0.91} {'loss': 0.6648, 'learning_rate': 1.1469702907710054e-05, 'epoch': 0.91} {'loss': 0.7726, 'learning_rate': 1.1469379110131325e-05, 'epoch': 0.91} {'loss': 0.7367, 'learning_rate': 1.1469055310978025e-05, 'epoch': 0.91} {'loss': 0.8824, 'learning_rate': 1.1468731510250497e-05, 'epoch': 0.91} {'loss': 0.623, 'learning_rate': 1.1468407707949091e-05, 'epoch': 0.91} {'loss': 0.7423, 'learning_rate': 1.1468083904074155e-05, 'epoch': 0.91} {'loss': 0.8136, 'learning_rate': 1.1467760098626032e-05, 'epoch': 0.91} {'loss': 0.7278, 'learning_rate': 1.1467436291605076e-05, 'epoch': 0.91} {'loss': 0.6661, 'learning_rate': 1.146711248301163e-05, 'epoch': 0.91} {'loss': 0.9377, 'learning_rate': 1.1466788672846036e-05, 'epoch': 0.91} {'loss': 0.8639, 'learning_rate': 1.1466464861108645e-05, 'epoch': 0.91} {'loss': 0.8001, 'learning_rate': 1.1466141047799808e-05, 'epoch': 0.91} {'loss': 0.8377, 'learning_rate': 1.1465817232919867e-05, 'epoch': 0.91} {'loss': 0.7725, 'learning_rate': 1.1465493416469171e-05, 'epoch': 0.91} {'loss': 0.8577, 'learning_rate': 1.1465169598448068e-05, 'epoch': 0.91} {'loss': 0.65, 'learning_rate': 1.1464845778856904e-05, 'epoch': 0.91} {'loss': 0.8381, 'learning_rate': 1.1464521957696022e-05, 'epoch': 0.91} {'loss': 0.8062, 'learning_rate': 1.1464198134965773e-05, 'epoch': 0.91} {'loss': 0.6614, 'learning_rate': 1.1463874310666505e-05, 'epoch': 0.91} {'loss': 0.7572, 'learning_rate': 1.1463550484798562e-05, 'epoch': 0.91} {'loss': 0.8291, 'learning_rate': 1.1463226657362294e-05, 'epoch': 0.91} {'loss': 0.7464, 'learning_rate': 1.1462902828358046e-05, 'epoch': 0.91} {'loss': 0.7768, 'learning_rate': 1.146257899778617e-05, 'epoch': 0.91} {'loss': 0.9131, 'learning_rate': 1.1462255165647002e-05, 'epoch': 0.91} {'loss': 0.8572, 'learning_rate': 1.1461931331940898e-05, 'epoch': 0.91} {'loss': 0.8038, 'learning_rate': 1.14616074966682e-05, 'epoch': 0.91} {'loss': 0.8362, 'learning_rate': 1.146128365982926e-05, 'epoch': 0.91} {'loss': 0.7858, 'learning_rate': 1.1460959821424426e-05, 'epoch': 0.91} {'loss': 0.8239, 'learning_rate': 1.1460635981454038e-05, 'epoch': 0.91} {'loss': 0.8294, 'learning_rate': 1.146031213991845e-05, 'epoch': 0.91} {'loss': 0.6628, 'learning_rate': 1.1459988296818001e-05, 'epoch': 0.91} {'loss': 0.8618, 'learning_rate': 1.1459664452153046e-05, 'epoch': 0.91} {'loss': 0.8327, 'learning_rate': 1.1459340605923926e-05, 'epoch': 0.91} {'loss': 0.7207, 'learning_rate': 1.1459016758130992e-05, 'epoch': 0.91} {'loss': 0.7079, 'learning_rate': 1.145869290877459e-05, 'epoch': 0.91} {'loss': 0.8726, 'learning_rate': 1.1458369057855071e-05, 'epoch': 0.91} {'loss': 0.6158, 'learning_rate': 1.1458045205372775e-05, 'epoch': 0.91} {'loss': 0.7018, 'learning_rate': 1.1457721351328051e-05, 'epoch': 0.91} {'loss': 1.0241, 'learning_rate': 1.1457397495721245e-05, 'epoch': 0.91} {'loss': 0.9717, 'learning_rate': 1.1457073638552706e-05, 'epoch': 0.91} {'loss': 0.7756, 'learning_rate': 1.1456749779822786e-05, 'epoch': 0.91} {'loss': 0.8418, 'learning_rate': 1.1456425919531825e-05, 'epoch': 0.91} {'loss': 0.7805, 'learning_rate': 1.1456102057680171e-05, 'epoch': 0.91} {'loss': 0.9222, 'learning_rate': 1.1455778194268175e-05, 'epoch': 0.91} {'loss': 0.7616, 'learning_rate': 1.1455454329296179e-05, 'epoch': 0.91} {'loss': 0.8992, 'learning_rate': 1.145513046276453e-05, 'epoch': 0.91} {'loss': 0.835, 'learning_rate': 1.1454806594673583e-05, 'epoch': 0.91} {'loss': 0.7406, 'learning_rate': 1.1454482725023675e-05, 'epoch': 0.91} {'loss': 0.7034, 'learning_rate': 1.1454158853815158e-05, 'epoch': 0.91} {'loss': 0.8331, 'learning_rate': 1.1453834981048383e-05, 'epoch': 0.91} {'loss': 0.7361, 'learning_rate': 1.1453511106723685e-05, 'epoch': 0.91} {'loss': 0.6655, 'learning_rate': 1.1453187230841423e-05, 'epoch': 0.91} {'loss': 0.6704, 'learning_rate': 1.145286335340194e-05, 'epoch': 0.91} {'loss': 0.9025, 'learning_rate': 1.1452539474405582e-05, 'epoch': 0.91} {'loss': 0.9701, 'learning_rate': 1.1452215593852697e-05, 'epoch': 0.91} {'loss': 0.7455, 'learning_rate': 1.145189171174363e-05, 'epoch': 0.91} {'loss': 0.7227, 'learning_rate': 1.1451567828078734e-05, 'epoch': 0.91} {'loss': 0.807, 'learning_rate': 1.145124394285835e-05, 'epoch': 0.91} {'loss': 0.8271, 'learning_rate': 1.1450920056082826e-05, 'epoch': 0.91} {'loss': 0.9566, 'learning_rate': 1.1450596167752513e-05, 'epoch': 0.91} {'loss': 0.7695, 'learning_rate': 1.1450272277867753e-05, 'epoch': 0.91} {'loss': 0.7588, 'learning_rate': 1.1449948386428895e-05, 'epoch': 0.91} {'loss': 0.8353, 'learning_rate': 1.1449624493436286e-05, 'epoch': 0.91} {'loss': 0.7318, 'learning_rate': 1.1449300598890275e-05, 'epoch': 0.91} {'loss': 0.8302, 'learning_rate': 1.144897670279121e-05, 'epoch': 0.91} {'loss': 0.739, 'learning_rate': 1.1448652805139433e-05, 'epoch': 0.91} {'loss': 0.8693, 'learning_rate': 1.1448328905935293e-05, 'epoch': 0.91} {'loss': 0.8378, 'learning_rate': 1.1448005005179139e-05, 'epoch': 0.91} {'loss': 0.807, 'learning_rate': 1.1447681102871315e-05, 'epoch': 0.91} {'loss': 0.764, 'learning_rate': 1.1447357199012175e-05, 'epoch': 0.91} {'loss': 0.7796, 'learning_rate': 1.1447033293602056e-05, 'epoch': 0.91} {'loss': 0.5718, 'learning_rate': 1.1446709386641314e-05, 'epoch': 0.91} {'loss': 0.7661, 'learning_rate': 1.144638547813029e-05, 'epoch': 0.91} {'loss': 0.7904, 'learning_rate': 1.1446061568069333e-05, 'epoch': 0.91} {'loss': 0.6776, 'learning_rate': 1.144573765645879e-05, 'epoch': 0.91} {'loss': 0.894, 'learning_rate': 1.144541374329901e-05, 'epoch': 0.91} {'loss': 0.8057, 'learning_rate': 1.1445089828590341e-05, 'epoch': 0.91} {'loss': 0.7701, 'learning_rate': 1.1444765912333125e-05, 'epoch': 0.91} {'loss': 0.8363, 'learning_rate': 1.1444441994527713e-05, 'epoch': 0.91} {'loss': 0.6713, 'learning_rate': 1.144411807517445e-05, 'epoch': 0.91} {'loss': 0.8487, 'learning_rate': 1.1443794154273684e-05, 'epoch': 0.91} {'loss': 0.7136, 'learning_rate': 1.1443470231825761e-05, 'epoch': 0.91} {'loss': 0.7989, 'learning_rate': 1.1443146307831033e-05, 'epoch': 0.91} {'loss': 0.7312, 'learning_rate': 1.1442822382289842e-05, 'epoch': 0.91} {'loss': 0.6552, 'learning_rate': 1.1442498455202537e-05, 'epoch': 0.91} {'loss': 0.714, 'learning_rate': 1.1442174526569466e-05, 'epoch': 0.91} {'loss': 0.8159, 'learning_rate': 1.1441850596390971e-05, 'epoch': 0.91} {'loss': 0.6587, 'learning_rate': 1.1441526664667404e-05, 'epoch': 0.91} {'loss': 0.7512, 'learning_rate': 1.1441202731399113e-05, 'epoch': 0.91} {'loss': 0.6811, 'learning_rate': 1.144087879658644e-05, 'epoch': 0.91} {'loss': 0.6678, 'learning_rate': 1.144055486022974e-05, 'epoch': 0.91} {'loss': 0.8683, 'learning_rate': 1.1440230922329355e-05, 'epoch': 0.91} {'loss': 0.7076, 'learning_rate': 1.143990698288563e-05, 'epoch': 0.91} {'loss': 0.7043, 'learning_rate': 1.1439583041898912e-05, 'epoch': 0.91} {'loss': 0.8077, 'learning_rate': 1.1439259099369555e-05, 'epoch': 0.91} {'loss': 0.7709, 'learning_rate': 1.14389351552979e-05, 'epoch': 0.91} {'loss': 0.7658, 'learning_rate': 1.1438611209684296e-05, 'epoch': 0.91} {'loss': 0.684, 'learning_rate': 1.1438287262529093e-05, 'epoch': 0.91} {'loss': 0.7715, 'learning_rate': 1.1437963313832636e-05, 'epoch': 0.91} {'loss': 0.6323, 'learning_rate': 1.1437639363595268e-05, 'epoch': 0.91} {'loss': 0.7416, 'learning_rate': 1.143731541181734e-05, 'epoch': 0.91} {'loss': 0.8427, 'learning_rate': 1.1436991458499198e-05, 'epoch': 0.91} {'loss': 0.803, 'learning_rate': 1.1436667503641193e-05, 'epoch': 0.91} {'loss': 0.9618, 'learning_rate': 1.1436343547243669e-05, 'epoch': 0.91} {'loss': 0.8795, 'learning_rate': 1.143601958930697e-05, 'epoch': 0.91} {'loss': 0.7124, 'learning_rate': 1.143569562983145e-05, 'epoch': 0.91} {'loss': 0.7263, 'learning_rate': 1.1435371668817452e-05, 'epoch': 0.91} {'loss': 0.7437, 'learning_rate': 1.1435047706265321e-05, 'epoch': 0.91} {'loss': 0.8344, 'learning_rate': 1.1434723742175409e-05, 'epoch': 0.91} {'loss': 0.8021, 'learning_rate': 1.1434399776548062e-05, 'epoch': 0.91} {'loss': 0.8256, 'learning_rate': 1.1434075809383623e-05, 'epoch': 0.91} {'loss': 0.7453, 'learning_rate': 1.1433751840682446e-05, 'epoch': 0.91} {'loss': 0.737, 'learning_rate': 1.143342787044487e-05, 'epoch': 0.91} {'loss': 0.7175, 'learning_rate': 1.143310389867125e-05, 'epoch': 0.91} {'loss': 0.8265, 'learning_rate': 1.1432779925361927e-05, 'epoch': 0.91} {'loss': 0.7218, 'learning_rate': 1.1432455950517256e-05, 'epoch': 0.91} {'loss': 0.7824, 'learning_rate': 1.1432131974137576e-05, 'epoch': 0.91} {'loss': 0.8365, 'learning_rate': 1.1431807996223236e-05, 'epoch': 0.91} {'loss': 0.5422, 'learning_rate': 1.1431484016774588e-05, 'epoch': 0.91} {'loss': 0.9262, 'learning_rate': 1.1431160035791972e-05, 'epoch': 0.91} {'loss': 0.7959, 'learning_rate': 1.1430836053275742e-05, 'epoch': 0.91} {'loss': 0.8223, 'learning_rate': 1.1430512069226239e-05, 'epoch': 0.91} {'loss': 0.8181, 'learning_rate': 1.1430188083643816e-05, 'epoch': 0.91} {'loss': 0.8326, 'learning_rate': 1.1429864096528815e-05, 'epoch': 0.91} {'loss': 0.5555, 'learning_rate': 1.1429540107881586e-05, 'epoch': 0.91} {'loss': 0.768, 'learning_rate': 1.142921611770248e-05, 'epoch': 0.91} {'loss': 0.8376, 'learning_rate': 1.1428892125991836e-05, 'epoch': 0.91} {'loss': 0.8982, 'learning_rate': 1.1428568132750004e-05, 'epoch': 0.91} {'loss': 0.5923, 'learning_rate': 1.1428244137977336e-05, 'epoch': 0.91} {'loss': 0.7711, 'learning_rate': 1.1427920141674171e-05, 'epoch': 0.91} {'loss': 0.7794, 'learning_rate': 1.1427596143840865e-05, 'epoch': 0.91} {'loss': 0.863, 'learning_rate': 1.1427272144477758e-05, 'epoch': 0.91} {'loss': 0.7625, 'learning_rate': 1.1426948143585202e-05, 'epoch': 0.91} {'loss': 0.7291, 'learning_rate': 1.142662414116354e-05, 'epoch': 0.91} {'loss': 0.923, 'learning_rate': 1.1426300137213125e-05, 'epoch': 0.91} {'loss': 0.7888, 'learning_rate': 1.1425976131734297e-05, 'epoch': 0.91} {'loss': 0.751, 'learning_rate': 1.1425652124727409e-05, 'epoch': 0.91} {'loss': 0.7694, 'learning_rate': 1.1425328116192804e-05, 'epoch': 0.91} {'loss': 0.8327, 'learning_rate': 1.1425004106130832e-05, 'epoch': 0.91} {'loss': 0.9329, 'learning_rate': 1.1424680094541843e-05, 'epoch': 0.91} {'loss': 0.9761, 'learning_rate': 1.1424356081426175e-05, 'epoch': 0.91} {'loss': 0.818, 'learning_rate': 1.1424032066784186e-05, 'epoch': 0.91} {'loss': 0.7968, 'learning_rate': 1.1423708050616216e-05, 'epoch': 0.91} {'loss': 0.8204, 'learning_rate': 1.1423384032922613e-05, 'epoch': 0.91} {'loss': 0.9134, 'learning_rate': 1.1423060013703726e-05, 'epoch': 0.91} {'loss': 0.83, 'learning_rate': 1.1422735992959904e-05, 'epoch': 0.91} {'loss': 0.8297, 'learning_rate': 1.142241197069149e-05, 'epoch': 0.91} {'loss': 0.7019, 'learning_rate': 1.1422087946898834e-05, 'epoch': 0.91} {'loss': 0.8325, 'learning_rate': 1.1421763921582282e-05, 'epoch': 0.91} {'loss': 0.8242, 'learning_rate': 1.1421439894742182e-05, 'epoch': 0.91} {'loss': 0.8103, 'learning_rate': 1.142111586637888e-05, 'epoch': 0.91} {'loss': 0.7831, 'learning_rate': 1.1420791836492725e-05, 'epoch': 0.91} {'loss': 0.7575, 'learning_rate': 1.1420467805084064e-05, 'epoch': 0.91} {'loss': 0.9176, 'learning_rate': 1.1420143772153243e-05, 'epoch': 0.91} {'loss': 0.6562, 'learning_rate': 1.1419819737700608e-05, 'epoch': 0.91} {'loss': 0.8478, 'learning_rate': 1.1419495701726508e-05, 'epoch': 0.91} {'loss': 0.9625, 'learning_rate': 1.1419171664231292e-05, 'epoch': 0.91} {'loss': 0.9244, 'learning_rate': 1.1418847625215303e-05, 'epoch': 0.91} {'loss': 0.75, 'learning_rate': 1.1418523584678894e-05, 'epoch': 0.91} {'loss': 0.7864, 'learning_rate': 1.1418199542622409e-05, 'epoch': 0.91} {'loss': 1.0208, 'learning_rate': 1.1417875499046196e-05, 'epoch': 0.91} {'loss': 0.823, 'learning_rate': 1.1417551453950598e-05, 'epoch': 0.91} {'loss': 1.0097, 'learning_rate': 1.1417227407335966e-05, 'epoch': 0.91} {'loss': 0.7826, 'learning_rate': 1.1416903359202647e-05, 'epoch': 0.91} {'loss': 0.6494, 'learning_rate': 1.1416579309550988e-05, 'epoch': 0.91} {'loss': 0.7647, 'learning_rate': 1.1416255258381337e-05, 'epoch': 0.91} {'loss': 0.8639, 'learning_rate': 1.1415931205694042e-05, 'epoch': 0.91} {'loss': 0.6865, 'learning_rate': 1.1415607151489451e-05, 'epoch': 0.91} {'loss': 0.7645, 'learning_rate': 1.1415283095767906e-05, 'epoch': 0.91} {'loss': 0.8421, 'learning_rate': 1.1414959038529756e-05, 'epoch': 0.91} {'loss': 0.6653, 'learning_rate': 1.1414634979775352e-05, 'epoch': 0.91} {'loss': 0.8902, 'learning_rate': 1.1414310919505036e-05, 'epoch': 0.91} {'loss': 0.8761, 'learning_rate': 1.1413986857719164e-05, 'epoch': 0.91} {'loss': 0.8822, 'learning_rate': 1.1413662794418073e-05, 'epoch': 0.91} {'loss': 0.7161, 'learning_rate': 1.1413338729602117e-05, 'epoch': 0.91} {'loss': 0.7563, 'learning_rate': 1.1413014663271637e-05, 'epoch': 0.91} {'loss': 0.6988, 'learning_rate': 1.1412690595426987e-05, 'epoch': 0.91} {'loss': 0.7576, 'learning_rate': 1.141236652606851e-05, 'epoch': 0.91} {'loss': 0.5567, 'learning_rate': 1.141204245519656e-05, 'epoch': 0.91} {'loss': 0.6901, 'learning_rate': 1.1411718382811474e-05, 'epoch': 0.91} {'loss': 0.7836, 'learning_rate': 1.1411394308913604e-05, 'epoch': 0.91} {'loss': 0.9025, 'learning_rate': 1.14110702335033e-05, 'epoch': 0.91} {'loss': 0.8042, 'learning_rate': 1.1410746156580908e-05, 'epoch': 0.91} {'loss': 0.7336, 'learning_rate': 1.141042207814677e-05, 'epoch': 0.91} {'loss': 0.8075, 'learning_rate': 1.141009799820124e-05, 'epoch': 0.91} {'loss': 0.7397, 'learning_rate': 1.1409773916744663e-05, 'epoch': 0.91} {'loss': 0.7833, 'learning_rate': 1.1409449833777387e-05, 'epoch': 0.91} {'loss': 0.7873, 'learning_rate': 1.1409125749299757e-05, 'epoch': 0.91} {'loss': 0.7246, 'learning_rate': 1.1408801663312122e-05, 'epoch': 0.91} {'loss': 0.8579, 'learning_rate': 1.1408477575814825e-05, 'epoch': 0.91} {'loss': 0.7328, 'learning_rate': 1.140815348680822e-05, 'epoch': 0.91} {'loss': 0.7086, 'learning_rate': 1.1407829396292654e-05, 'epoch': 0.91} {'loss': 0.7982, 'learning_rate': 1.1407505304268469e-05, 'epoch': 0.91} {'loss': 0.7095, 'learning_rate': 1.1407181210736013e-05, 'epoch': 0.91} {'loss': 0.7788, 'learning_rate': 1.1406857115695642e-05, 'epoch': 0.91} {'loss': 0.7427, 'learning_rate': 1.140653301914769e-05, 'epoch': 0.91} {'loss': 0.8279, 'learning_rate': 1.1406208921092514e-05, 'epoch': 0.91} {'loss': 0.7267, 'learning_rate': 1.1405884821530459e-05, 'epoch': 0.91} {'loss': 0.9162, 'learning_rate': 1.140556072046187e-05, 'epoch': 0.91} {'loss': 0.6894, 'learning_rate': 1.1405236617887095e-05, 'epoch': 0.91} {'loss': 0.8635, 'learning_rate': 1.1404912513806484e-05, 'epoch': 0.91} {'loss': 0.8319, 'learning_rate': 1.1404588408220381e-05, 'epoch': 0.91} {'loss': 0.9051, 'learning_rate': 1.1404264301129135e-05, 'epoch': 0.91} {'loss': 0.7538, 'learning_rate': 1.1403940192533093e-05, 'epoch': 0.91} {'loss': 0.7784, 'learning_rate': 1.1403616082432605e-05, 'epoch': 0.91} {'loss': 0.7335, 'learning_rate': 1.1403291970828012e-05, 'epoch': 0.91} {'loss': 0.7963, 'learning_rate': 1.1402967857719664e-05, 'epoch': 0.91} {'loss': 0.8947, 'learning_rate': 1.1402643743107913e-05, 'epoch': 0.91} {'loss': 0.6635, 'learning_rate': 1.1402319626993101e-05, 'epoch': 0.91} {'loss': 0.6421, 'learning_rate': 1.1401995509375579e-05, 'epoch': 0.91} {'loss': 0.8601, 'learning_rate': 1.140167139025569e-05, 'epoch': 0.91} {'loss': 0.7871, 'learning_rate': 1.1401347269633785e-05, 'epoch': 0.91} {'loss': 0.8343, 'learning_rate': 1.1401023147510208e-05, 'epoch': 0.91} {'loss': 0.6546, 'learning_rate': 1.1400699023885309e-05, 'epoch': 0.91} {'loss': 0.8244, 'learning_rate': 1.1400374898759434e-05, 'epoch': 0.91} {'loss': 0.8212, 'learning_rate': 1.1400050772132933e-05, 'epoch': 0.91} {'loss': 0.836, 'learning_rate': 1.1399726644006153e-05, 'epoch': 0.91} {'loss': 0.7136, 'learning_rate': 1.1399402514379436e-05, 'epoch': 0.91} {'loss': 0.6848, 'learning_rate': 1.1399078383253132e-05, 'epoch': 0.91} {'loss': 0.7301, 'learning_rate': 1.139875425062759e-05, 'epoch': 0.91} {'loss': 0.8927, 'learning_rate': 1.1398430116503159e-05, 'epoch': 0.91} {'loss': 0.7489, 'learning_rate': 1.1398105980880183e-05, 'epoch': 0.91} {'loss': 0.9376, 'learning_rate': 1.1397781843759008e-05, 'epoch': 0.91} {'loss': 0.7757, 'learning_rate': 1.1397457705139987e-05, 'epoch': 0.91} {'loss': 0.7585, 'learning_rate': 1.1397133565023461e-05, 'epoch': 0.91} {'loss': 0.7443, 'learning_rate': 1.139680942340978e-05, 'epoch': 0.91} {'loss': 0.6847, 'learning_rate': 1.1396485280299295e-05, 'epoch': 0.91} {'loss': 0.8034, 'learning_rate': 1.1396161135692345e-05, 'epoch': 0.91} {'loss': 0.7225, 'learning_rate': 1.1395836989589289e-05, 'epoch': 0.91} {'loss': 0.7834, 'learning_rate': 1.1395512841990464e-05, 'epoch': 0.91} {'loss': 0.6769, 'learning_rate': 1.139518869289622e-05, 'epoch': 0.91} {'loss': 0.8111, 'learning_rate': 1.1394864542306907e-05, 'epoch': 0.91} {'loss': 0.6654, 'learning_rate': 1.1394540390222868e-05, 'epoch': 0.91} {'loss': 0.6594, 'learning_rate': 1.1394216236644455e-05, 'epoch': 0.91} {'loss': 0.9249, 'learning_rate': 1.1393892081572013e-05, 'epoch': 0.91} {'loss': 0.8188, 'learning_rate': 1.1393567925005893e-05, 'epoch': 0.91} {'loss': 0.8598, 'learning_rate': 1.1393243766946438e-05, 'epoch': 0.91} {'loss': 0.8562, 'learning_rate': 1.1392919607393995e-05, 'epoch': 0.91} {'loss': 0.8134, 'learning_rate': 1.1392595446348914e-05, 'epoch': 0.91} {'loss': 0.7548, 'learning_rate': 1.1392271283811538e-05, 'epoch': 0.91} {'loss': 0.7165, 'learning_rate': 1.1391947119782221e-05, 'epoch': 0.91} {'loss': 0.7341, 'learning_rate': 1.1391622954261306e-05, 'epoch': 0.91} {'loss': 0.6801, 'learning_rate': 1.1391298787249142e-05, 'epoch': 0.91} {'loss': 0.5454, 'learning_rate': 1.1390974618746076e-05, 'epoch': 0.91} {'loss': 0.7258, 'learning_rate': 1.1390650448752454e-05, 'epoch': 0.91} {'loss': 0.6703, 'learning_rate': 1.1390326277268623e-05, 'epoch': 0.91} {'loss': 0.7859, 'learning_rate': 1.1390002104294935e-05, 'epoch': 0.91} {'loss': 0.7679, 'learning_rate': 1.1389677929831735e-05, 'epoch': 0.91} {'loss': 0.6975, 'learning_rate': 1.1389353753879367e-05, 'epoch': 0.91} {'loss': 0.6826, 'learning_rate': 1.1389029576438182e-05, 'epoch': 0.91} {'loss': 0.6849, 'learning_rate': 1.1388705397508529e-05, 'epoch': 0.91} {'loss': 0.9197, 'learning_rate': 1.1388381217090747e-05, 'epoch': 0.91} {'loss': 0.7862, 'learning_rate': 1.1388057035185194e-05, 'epoch': 0.91} {'loss': 0.6745, 'learning_rate': 1.138773285179221e-05, 'epoch': 0.91} {'loss': 0.676, 'learning_rate': 1.1387408666912147e-05, 'epoch': 0.91} {'loss': 0.978, 'learning_rate': 1.138708448054535e-05, 'epoch': 0.91} {'loss': 0.6373, 'learning_rate': 1.1386760292692165e-05, 'epoch': 0.91} {'loss': 0.7014, 'learning_rate': 1.1386436103352944e-05, 'epoch': 0.91} {'loss': 0.715, 'learning_rate': 1.1386111912528028e-05, 'epoch': 0.91} {'loss': 0.7872, 'learning_rate': 1.1385787720217771e-05, 'epoch': 0.91} {'loss': 0.813, 'learning_rate': 1.1385463526422518e-05, 'epoch': 0.91} {'loss': 0.8972, 'learning_rate': 1.1385139331142612e-05, 'epoch': 0.91} {'loss': 0.8661, 'learning_rate': 1.1384815134378407e-05, 'epoch': 0.91} {'loss': 0.6176, 'learning_rate': 1.1384490936130248e-05, 'epoch': 0.91} {'loss': 0.9081, 'learning_rate': 1.1384166736398481e-05, 'epoch': 0.91} {'loss': 0.8303, 'learning_rate': 1.1383842535183454e-05, 'epoch': 0.92} {'loss': 0.9845, 'learning_rate': 1.1383518332485517e-05, 'epoch': 0.92} {'loss': 0.6853, 'learning_rate': 1.138319412830501e-05, 'epoch': 0.92} {'loss': 0.8969, 'learning_rate': 1.138286992264229e-05, 'epoch': 0.92} {'loss': 0.6524, 'learning_rate': 1.1382545715497699e-05, 'epoch': 0.92} {'loss': 0.6788, 'learning_rate': 1.1382221506871587e-05, 'epoch': 0.92} {'loss': 0.8072, 'learning_rate': 1.1381897296764297e-05, 'epoch': 0.92} {'loss': 0.7298, 'learning_rate': 1.138157308517618e-05, 'epoch': 0.92} {'loss': 0.7866, 'learning_rate': 1.1381248872107586e-05, 'epoch': 0.92} {'loss': 0.6574, 'learning_rate': 1.1380924657558857e-05, 'epoch': 0.92} {'loss': 0.8408, 'learning_rate': 1.1380600441530341e-05, 'epoch': 0.92} {'loss': 0.6453, 'learning_rate': 1.1380276224022389e-05, 'epoch': 0.92} {'loss': 0.6588, 'learning_rate': 1.1379952005035346e-05, 'epoch': 0.92} {'loss': 0.8476, 'learning_rate': 1.137962778456956e-05, 'epoch': 0.92} {'loss': 0.8586, 'learning_rate': 1.1379303562625378e-05, 'epoch': 0.92} {'loss': 0.8679, 'learning_rate': 1.137897933920315e-05, 'epoch': 0.92} {'loss': 0.8707, 'learning_rate': 1.1378655114303217e-05, 'epoch': 0.92} {'loss': 0.8309, 'learning_rate': 1.1378330887925932e-05, 'epoch': 0.92} {'loss': 0.9403, 'learning_rate': 1.137800666007164e-05, 'epoch': 0.92} {'loss': 0.836, 'learning_rate': 1.1377682430740693e-05, 'epoch': 0.92} {'loss': 0.8768, 'learning_rate': 1.1377358199933436e-05, 'epoch': 0.92} {'loss': 0.7085, 'learning_rate': 1.137703396765021e-05, 'epoch': 0.92} {'loss': 0.7788, 'learning_rate': 1.1376709733891369e-05, 'epoch': 0.92} {'loss': 0.6351, 'learning_rate': 1.137638549865726e-05, 'epoch': 0.92} {'loss': 0.7843, 'learning_rate': 1.137606126194823e-05, 'epoch': 0.92} {'loss': 0.7135, 'learning_rate': 1.1375737023764625e-05, 'epoch': 0.92} {'loss': 0.7286, 'learning_rate': 1.13754127841068e-05, 'epoch': 0.92} {'loss': 0.7373, 'learning_rate': 1.137508854297509e-05, 'epoch': 0.92} {'loss': 0.9148, 'learning_rate': 1.137476430036985e-05, 'epoch': 0.92} {'loss': 0.7137, 'learning_rate': 1.1374440056291425e-05, 'epoch': 0.92} {'loss': 0.6573, 'learning_rate': 1.1374115810740163e-05, 'epoch': 0.92} {'loss': 0.8778, 'learning_rate': 1.1373791563716411e-05, 'epoch': 0.92} {'loss': 0.7892, 'learning_rate': 1.1373467315220521e-05, 'epoch': 0.92} {'loss': 0.8404, 'learning_rate': 1.1373143065252834e-05, 'epoch': 0.92} {'loss': 0.629, 'learning_rate': 1.1372818813813704e-05, 'epoch': 0.92} {'loss': 0.728, 'learning_rate': 1.1372494560903471e-05, 'epoch': 0.92} {'loss': 0.8772, 'learning_rate': 1.1372170306522488e-05, 'epoch': 0.92} {'loss': 0.9537, 'learning_rate': 1.1371846050671098e-05, 'epoch': 0.92} {'loss': 0.9013, 'learning_rate': 1.1371521793349651e-05, 'epoch': 0.92} {'loss': 0.715, 'learning_rate': 1.13711975345585e-05, 'epoch': 0.92} {'loss': 0.8642, 'learning_rate': 1.1370873274297982e-05, 'epoch': 0.92} {'loss': 0.6902, 'learning_rate': 1.1370549012568452e-05, 'epoch': 0.92} {'loss': 0.6402, 'learning_rate': 1.1370224749370256e-05, 'epoch': 0.92} {'loss': 0.8225, 'learning_rate': 1.1369900484703738e-05, 'epoch': 0.92} {'loss': 0.7996, 'learning_rate': 1.1369576218569247e-05, 'epoch': 0.92} {'loss': 0.606, 'learning_rate': 1.1369251950967135e-05, 'epoch': 0.92} {'loss': 0.9792, 'learning_rate': 1.1368927681897743e-05, 'epoch': 0.92} {'loss': 0.7536, 'learning_rate': 1.1368603411361425e-05, 'epoch': 0.92} {'loss': 0.8253, 'learning_rate': 1.1368279139358523e-05, 'epoch': 0.92} {'loss': 0.6763, 'learning_rate': 1.1367954865889386e-05, 'epoch': 0.92} {'loss': 0.9248, 'learning_rate': 1.136763059095436e-05, 'epoch': 0.92} {'loss': 0.8545, 'learning_rate': 1.1367306314553796e-05, 'epoch': 0.92} {'loss': 0.749, 'learning_rate': 1.1366982036688042e-05, 'epoch': 0.92} {'loss': 0.7159, 'learning_rate': 1.136665775735744e-05, 'epoch': 0.92} {'loss': 0.8705, 'learning_rate': 1.1366333476562344e-05, 'epoch': 0.92} {'loss': 0.8798, 'learning_rate': 1.1366009194303096e-05, 'epoch': 0.92} {'loss': 0.8057, 'learning_rate': 1.1365684910580046e-05, 'epoch': 0.92} {'loss': 0.7929, 'learning_rate': 1.1365360625393543e-05, 'epoch': 0.92} {'loss': 0.8592, 'learning_rate': 1.1365036338743931e-05, 'epoch': 0.92} {'loss': 0.6728, 'learning_rate': 1.1364712050631561e-05, 'epoch': 0.92} {'loss': 0.8556, 'learning_rate': 1.1364387761056776e-05, 'epoch': 0.92} {'loss': 0.6941, 'learning_rate': 1.136406347001993e-05, 'epoch': 0.92} {'loss': 0.8009, 'learning_rate': 1.1363739177521364e-05, 'epoch': 0.92} {'loss': 0.8734, 'learning_rate': 1.136341488356143e-05, 'epoch': 0.92} {'loss': 0.8266, 'learning_rate': 1.1363090588140475e-05, 'epoch': 0.92} {'loss': 0.6923, 'learning_rate': 1.1362766291258844e-05, 'epoch': 0.92} {'loss': 0.7206, 'learning_rate': 1.1362441992916887e-05, 'epoch': 0.92} {'loss': 0.8836, 'learning_rate': 1.1362117693114947e-05, 'epoch': 0.92} {'loss': 0.7691, 'learning_rate': 1.136179339185338e-05, 'epoch': 0.92} {'loss': 0.745, 'learning_rate': 1.1361469089132525e-05, 'epoch': 0.92} {'loss': 0.8857, 'learning_rate': 1.1361144784952733e-05, 'epoch': 0.92} {'loss': 0.8232, 'learning_rate': 1.1360820479314353e-05, 'epoch': 0.92} {'loss': 0.6801, 'learning_rate': 1.136049617221773e-05, 'epoch': 0.92} {'loss': 0.6593, 'learning_rate': 1.1360171863663212e-05, 'epoch': 0.92} {'loss': 1.0138, 'learning_rate': 1.1359847553651147e-05, 'epoch': 0.92} {'loss': 0.6749, 'learning_rate': 1.1359523242181885e-05, 'epoch': 0.92} {'loss': 0.6942, 'learning_rate': 1.135919892925577e-05, 'epoch': 0.92} {'loss': 0.9166, 'learning_rate': 1.1358874614873152e-05, 'epoch': 0.92} {'loss': 0.9424, 'learning_rate': 1.1358550299034374e-05, 'epoch': 0.92} {'loss': 0.762, 'learning_rate': 1.1358225981739788e-05, 'epoch': 0.92} {'loss': 0.6633, 'learning_rate': 1.1357901662989742e-05, 'epoch': 0.92} {'loss': 0.671, 'learning_rate': 1.1357577342784581e-05, 'epoch': 0.92} {'loss': 0.8204, 'learning_rate': 1.1357253021124653e-05, 'epoch': 0.92} {'loss': 0.834, 'learning_rate': 1.1356928698010305e-05, 'epoch': 0.92} {'loss': 0.8537, 'learning_rate': 1.1356604373441886e-05, 'epoch': 0.92} {'loss': 0.9055, 'learning_rate': 1.1356280047419744e-05, 'epoch': 0.92} {'loss': 0.7307, 'learning_rate': 1.1355955719944223e-05, 'epoch': 0.92} {'loss': 0.7537, 'learning_rate': 1.1355631391015674e-05, 'epoch': 0.92} {'loss': 0.7404, 'learning_rate': 1.1355307060634444e-05, 'epoch': 0.92} {'loss': 0.6655, 'learning_rate': 1.1354982728800883e-05, 'epoch': 0.92} {'loss': 0.8129, 'learning_rate': 1.1354658395515333e-05, 'epoch': 0.92} {'loss': 0.8309, 'learning_rate': 1.1354334060778143e-05, 'epoch': 0.92} {'loss': 0.8106, 'learning_rate': 1.1354009724589662e-05, 'epoch': 0.92} {'loss': 0.7086, 'learning_rate': 1.135368538695024e-05, 'epoch': 0.92} {'loss': 0.7572, 'learning_rate': 1.1353361047860218e-05, 'epoch': 0.92} {'loss': 0.7376, 'learning_rate': 1.1353036707319953e-05, 'epoch': 0.92} {'loss': 0.6514, 'learning_rate': 1.1352712365329786e-05, 'epoch': 0.92} {'loss': 0.7203, 'learning_rate': 1.1352388021890061e-05, 'epoch': 0.92} {'loss': 0.7944, 'learning_rate': 1.1352063677001132e-05, 'epoch': 0.92} {'loss': 0.801, 'learning_rate': 1.1351739330663345e-05, 'epoch': 0.92} {'loss': 0.7343, 'learning_rate': 1.135141498287705e-05, 'epoch': 0.92} {'loss': 0.8816, 'learning_rate': 1.1351090633642588e-05, 'epoch': 0.92} {'loss': 0.6811, 'learning_rate': 1.1350766282960313e-05, 'epoch': 0.92} {'loss': 0.8421, 'learning_rate': 1.1350441930830572e-05, 'epoch': 0.92} {'loss': 0.8013, 'learning_rate': 1.1350117577253706e-05, 'epoch': 0.92} {'loss': 0.6142, 'learning_rate': 1.1349793222230068e-05, 'epoch': 0.92} {'loss': 0.6944, 'learning_rate': 1.1349468865760005e-05, 'epoch': 0.92} {'loss': 0.971, 'learning_rate': 1.1349144507843865e-05, 'epoch': 0.92} {'loss': 0.9803, 'learning_rate': 1.1348820148481996e-05, 'epoch': 0.92} {'loss': 0.6717, 'learning_rate': 1.1348495787674743e-05, 'epoch': 0.92} {'loss': 0.7848, 'learning_rate': 1.1348171425422457e-05, 'epoch': 0.92} {'loss': 0.7658, 'learning_rate': 1.1347847061725482e-05, 'epoch': 0.92} {'loss': 0.857, 'learning_rate': 1.1347522696584166e-05, 'epoch': 0.92} {'loss': 0.6654, 'learning_rate': 1.1347198329998859e-05, 'epoch': 0.92} {'loss': 0.808, 'learning_rate': 1.1346873961969908e-05, 'epoch': 0.92} {'loss': 0.6509, 'learning_rate': 1.1346549592497657e-05, 'epoch': 0.92} {'loss': 0.5575, 'learning_rate': 1.134622522158246e-05, 'epoch': 0.92} {'loss': 0.9718, 'learning_rate': 1.1345900849224663e-05, 'epoch': 0.92} {'loss': 0.7927, 'learning_rate': 1.1345576475424607e-05, 'epoch': 0.92} {'loss': 0.8154, 'learning_rate': 1.1345252100182647e-05, 'epoch': 0.92} {'loss': 0.6807, 'learning_rate': 1.1344927723499125e-05, 'epoch': 0.92} {'loss': 0.7388, 'learning_rate': 1.1344603345374396e-05, 'epoch': 0.92} {'loss': 0.6878, 'learning_rate': 1.1344278965808799e-05, 'epoch': 0.92} {'loss': 0.8405, 'learning_rate': 1.134395458480269e-05, 'epoch': 0.92} {'loss': 0.7987, 'learning_rate': 1.134363020235641e-05, 'epoch': 0.92} {'loss': 0.7957, 'learning_rate': 1.1343305818470309e-05, 'epoch': 0.92} {'loss': 0.6349, 'learning_rate': 1.1342981433144734e-05, 'epoch': 0.92} {'loss': 0.7739, 'learning_rate': 1.1342657046380034e-05, 'epoch': 0.92} {'loss': 0.8106, 'learning_rate': 1.1342332658176556e-05, 'epoch': 0.92} {'loss': 0.7883, 'learning_rate': 1.1342008268534648e-05, 'epoch': 0.92} {'loss': 0.8227, 'learning_rate': 1.1341683877454656e-05, 'epoch': 0.92} {'loss': 0.7562, 'learning_rate': 1.1341359484936929e-05, 'epoch': 0.92} {'loss': 0.9737, 'learning_rate': 1.1341035090981814e-05, 'epoch': 0.92} {'loss': 0.9308, 'learning_rate': 1.1340710695589659e-05, 'epoch': 0.92} {'loss': 0.8882, 'learning_rate': 1.134038629876081e-05, 'epoch': 0.92} {'loss': 0.8106, 'learning_rate': 1.1340061900495619e-05, 'epoch': 0.92} {'loss': 0.752, 'learning_rate': 1.1339737500794427e-05, 'epoch': 0.92} {'loss': 0.9998, 'learning_rate': 1.133941309965759e-05, 'epoch': 0.92} {'loss': 0.8227, 'learning_rate': 1.1339088697085447e-05, 'epoch': 0.92} {'loss': 0.6257, 'learning_rate': 1.133876429307835e-05, 'epoch': 0.92} {'loss': 0.6438, 'learning_rate': 1.133843988763665e-05, 'epoch': 0.92} {'loss': 0.7462, 'learning_rate': 1.1338115480760688e-05, 'epoch': 0.92} {'loss': 0.7309, 'learning_rate': 1.1337791072450813e-05, 'epoch': 0.92} {'loss': 0.9057, 'learning_rate': 1.1337466662707375e-05, 'epoch': 0.92} {'loss': 0.8762, 'learning_rate': 1.1337142251530722e-05, 'epoch': 0.92} {'loss': 0.6739, 'learning_rate': 1.1336817838921198e-05, 'epoch': 0.92} {'loss': 0.8162, 'learning_rate': 1.1336493424879158e-05, 'epoch': 0.92} {'loss': 0.6429, 'learning_rate': 1.1336169009404942e-05, 'epoch': 0.92} {'loss': 0.8002, 'learning_rate': 1.1335844592498899e-05, 'epoch': 0.92} {'loss': 0.733, 'learning_rate': 1.1335520174161378e-05, 'epoch': 0.92} {'loss': 0.8192, 'learning_rate': 1.1335195754392728e-05, 'epoch': 0.92} {'loss': 0.8124, 'learning_rate': 1.1334871333193296e-05, 'epoch': 0.92} {'loss': 0.7514, 'learning_rate': 1.1334546910563429e-05, 'epoch': 0.92} {'loss': 0.9952, 'learning_rate': 1.1334222486503472e-05, 'epoch': 0.92} {'loss': 0.8037, 'learning_rate': 1.1333898061013775e-05, 'epoch': 0.92} {'loss': 0.6909, 'learning_rate': 1.1333573634094686e-05, 'epoch': 0.92} {'loss': 0.8335, 'learning_rate': 1.1333249205746552e-05, 'epoch': 0.92} {'loss': 0.4848, 'learning_rate': 1.1332924775969728e-05, 'epoch': 0.92} {'loss': 0.8704, 'learning_rate': 1.1332600344764546e-05, 'epoch': 0.92} {'loss': 0.7035, 'learning_rate': 1.133227591213137e-05, 'epoch': 0.92} {'loss': 0.8535, 'learning_rate': 1.1331951478070534e-05, 'epoch': 0.92} {'loss': 0.6563, 'learning_rate': 1.1331627042582393e-05, 'epoch': 0.92} {'loss': 0.7638, 'learning_rate': 1.1331302605667294e-05, 'epoch': 0.92} {'loss': 0.7529, 'learning_rate': 1.1330978167325584e-05, 'epoch': 0.92} {'loss': 0.7695, 'learning_rate': 1.1330653727557613e-05, 'epoch': 0.92} {'loss': 0.8908, 'learning_rate': 1.1330329286363726e-05, 'epoch': 0.92} {'loss': 0.8548, 'learning_rate': 1.1330004843744268e-05, 'epoch': 0.92} {'loss': 0.6583, 'learning_rate': 1.1329680399699592e-05, 'epoch': 0.92} {'loss': 0.8035, 'learning_rate': 1.1329355954230041e-05, 'epoch': 0.92} {'loss': 0.7399, 'learning_rate': 1.1329031507335968e-05, 'epoch': 0.92} {'loss': 0.819, 'learning_rate': 1.1328707059017716e-05, 'epoch': 0.92} {'loss': 0.8075, 'learning_rate': 1.1328382609275636e-05, 'epoch': 0.92} {'loss': 0.9284, 'learning_rate': 1.1328058158110076e-05, 'epoch': 0.92} {'loss': 0.8655, 'learning_rate': 1.1327733705521377e-05, 'epoch': 0.92} {'loss': 0.9341, 'learning_rate': 1.1327409251509893e-05, 'epoch': 0.92} {'loss': 0.8491, 'learning_rate': 1.1327084796075972e-05, 'epoch': 0.92} {'loss': 0.8002, 'learning_rate': 1.1326760339219958e-05, 'epoch': 0.92} {'loss': 0.8241, 'learning_rate': 1.1326435880942203e-05, 'epoch': 0.92} {'loss': 0.8472, 'learning_rate': 1.1326111421243049e-05, 'epoch': 0.92} {'loss': 0.7445, 'learning_rate': 1.1325786960122851e-05, 'epoch': 0.92} {'loss': 0.7113, 'learning_rate': 1.1325462497581949e-05, 'epoch': 0.92} {'loss': 0.8348, 'learning_rate': 1.1325138033620694e-05, 'epoch': 0.92} {'loss': 0.867, 'learning_rate': 1.1324813568239436e-05, 'epoch': 0.92} {'loss': 0.7909, 'learning_rate': 1.132448910143852e-05, 'epoch': 0.92} {'loss': 0.8025, 'learning_rate': 1.1324164633218295e-05, 'epoch': 0.92} {'loss': 0.7093, 'learning_rate': 1.1323840163579107e-05, 'epoch': 0.92} {'loss': 0.5815, 'learning_rate': 1.1323515692521307e-05, 'epoch': 0.92} {'loss': 0.7034, 'learning_rate': 1.1323191220045237e-05, 'epoch': 0.92} {'loss': 0.7095, 'learning_rate': 1.132286674615125e-05, 'epoch': 0.92} {'loss': 0.6719, 'learning_rate': 1.1322542270839692e-05, 'epoch': 0.92} {'loss': 0.5807, 'learning_rate': 1.1322217794110913e-05, 'epoch': 0.92} {'loss': 0.754, 'learning_rate': 1.1321893315965256e-05, 'epoch': 0.92} {'loss': 0.7174, 'learning_rate': 1.132156883640307e-05, 'epoch': 0.92} {'loss': 0.916, 'learning_rate': 1.1321244355424706e-05, 'epoch': 0.92} {'loss': 0.8791, 'learning_rate': 1.1320919873030507e-05, 'epoch': 0.92} {'loss': 0.9876, 'learning_rate': 1.1320595389220824e-05, 'epoch': 0.92} {'loss': 0.8112, 'learning_rate': 1.1320270903996005e-05, 'epoch': 0.92} {'loss': 0.7555, 'learning_rate': 1.1319946417356393e-05, 'epoch': 0.92} {'loss': 0.9592, 'learning_rate': 1.1319621929302342e-05, 'epoch': 0.92} {'loss': 0.6703, 'learning_rate': 1.1319297439834198e-05, 'epoch': 0.92} {'loss': 0.716, 'learning_rate': 1.1318972948952307e-05, 'epoch': 0.92} {'loss': 0.9127, 'learning_rate': 1.1318648456657015e-05, 'epoch': 0.92} {'loss': 0.8148, 'learning_rate': 1.1318323962948677e-05, 'epoch': 0.92} {'loss': 0.8032, 'learning_rate': 1.1317999467827631e-05, 'epoch': 0.92} {'loss': 0.8283, 'learning_rate': 1.1317674971294233e-05, 'epoch': 0.92} {'loss': 0.5354, 'learning_rate': 1.1317350473348826e-05, 'epoch': 0.92} {'loss': 0.8495, 'learning_rate': 1.1317025973991758e-05, 'epoch': 0.92} {'loss': 0.6981, 'learning_rate': 1.131670147322338e-05, 'epoch': 0.92} {'loss': 0.7424, 'learning_rate': 1.1316376971044034e-05, 'epoch': 0.92} {'loss': 0.7158, 'learning_rate': 1.1316052467454075e-05, 'epoch': 0.92} {'loss': 0.771, 'learning_rate': 1.1315727962453846e-05, 'epoch': 0.92} {'loss': 0.6965, 'learning_rate': 1.1315403456043694e-05, 'epoch': 0.92} {'loss': 0.8849, 'learning_rate': 1.131507894822397e-05, 'epoch': 0.92} {'loss': 0.7509, 'learning_rate': 1.1314754438995021e-05, 'epoch': 0.92} {'loss': 0.6122, 'learning_rate': 1.1314429928357193e-05, 'epoch': 0.92} {'loss': 0.8376, 'learning_rate': 1.1314105416310836e-05, 'epoch': 0.92} {'loss': 0.5797, 'learning_rate': 1.1313780902856295e-05, 'epoch': 0.92} {'loss': 0.6811, 'learning_rate': 1.1313456387993918e-05, 'epoch': 0.92} {'loss': 0.7948, 'learning_rate': 1.1313131871724054e-05, 'epoch': 0.92} {'loss': 0.8026, 'learning_rate': 1.131280735404705e-05, 'epoch': 0.92} {'loss': 0.883, 'learning_rate': 1.131248283496326e-05, 'epoch': 0.92} {'loss': 0.7863, 'learning_rate': 1.1312158314473023e-05, 'epoch': 0.92} {'loss': 0.8285, 'learning_rate': 1.131183379257669e-05, 'epoch': 0.92} {'loss': 0.7336, 'learning_rate': 1.1311509269274608e-05, 'epoch': 0.92} {'loss': 0.789, 'learning_rate': 1.1311184744567125e-05, 'epoch': 0.92} {'loss': 0.7702, 'learning_rate': 1.1310860218454589e-05, 'epoch': 0.92} {'loss': 0.7519, 'learning_rate': 1.1310535690937347e-05, 'epoch': 0.92} {'loss': 0.6074, 'learning_rate': 1.1310211162015752e-05, 'epoch': 0.92} {'loss': 0.7824, 'learning_rate': 1.1309886631690145e-05, 'epoch': 0.92} {'loss': 0.724, 'learning_rate': 1.1309562099960876e-05, 'epoch': 0.92} {'loss': 0.7857, 'learning_rate': 1.1309237566828293e-05, 'epoch': 0.92} {'loss': 0.7603, 'learning_rate': 1.1308913032292743e-05, 'epoch': 0.92} {'loss': 0.7069, 'learning_rate': 1.1308588496354576e-05, 'epoch': 0.92} {'loss': 0.7202, 'learning_rate': 1.1308263959014139e-05, 'epoch': 0.92} {'loss': 0.8103, 'learning_rate': 1.1307939420271779e-05, 'epoch': 0.92} {'loss': 0.7054, 'learning_rate': 1.1307614880127842e-05, 'epoch': 0.92} {'loss': 0.8839, 'learning_rate': 1.130729033858268e-05, 'epoch': 0.92} {'loss': 0.6282, 'learning_rate': 1.1306965795636636e-05, 'epoch': 0.92} {'loss': 0.4786, 'learning_rate': 1.130664125129006e-05, 'epoch': 0.92} {'loss': 0.7599, 'learning_rate': 1.1306316705543301e-05, 'epoch': 0.92} {'loss': 0.7235, 'learning_rate': 1.1305992158396706e-05, 'epoch': 0.92} {'loss': 0.9836, 'learning_rate': 1.1305667609850624e-05, 'epoch': 0.92} {'loss': 0.6163, 'learning_rate': 1.13053430599054e-05, 'epoch': 0.92} {'loss': 0.8187, 'learning_rate': 1.130501850856138e-05, 'epoch': 0.92} {'loss': 0.6815, 'learning_rate': 1.130469395581892e-05, 'epoch': 0.92} {'loss': 0.6989, 'learning_rate': 1.1304369401678358e-05, 'epoch': 0.92} {'loss': 0.7771, 'learning_rate': 1.130404484614005e-05, 'epoch': 0.92} {'loss': 0.7542, 'learning_rate': 1.130372028920434e-05, 'epoch': 0.92} {'loss': 0.8518, 'learning_rate': 1.1303395730871576e-05, 'epoch': 0.92} {'loss': 0.699, 'learning_rate': 1.1303071171142103e-05, 'epoch': 0.92} {'loss': 0.672, 'learning_rate': 1.1302746610016273e-05, 'epoch': 0.92} {'loss': 0.8366, 'learning_rate': 1.1302422047494432e-05, 'epoch': 0.92} {'loss': 0.7882, 'learning_rate': 1.130209748357693e-05, 'epoch': 0.92} {'loss': 0.727, 'learning_rate': 1.1301772918264113e-05, 'epoch': 0.92} {'loss': 0.8734, 'learning_rate': 1.1301448351556328e-05, 'epoch': 0.92} {'loss': 0.8548, 'learning_rate': 1.1301123783453925e-05, 'epoch': 0.92} {'loss': 0.8624, 'learning_rate': 1.1300799213957247e-05, 'epoch': 0.92} {'loss': 0.6104, 'learning_rate': 1.1300474643066648e-05, 'epoch': 0.92} {'loss': 0.562, 'learning_rate': 1.1300150070782471e-05, 'epoch': 0.92} {'loss': 0.8121, 'learning_rate': 1.129982549710507e-05, 'epoch': 0.92} {'loss': 0.845, 'learning_rate': 1.1299500922034785e-05, 'epoch': 0.92} {'loss': 0.8357, 'learning_rate': 1.1299176345571968e-05, 'epoch': 0.92} {'loss': 0.955, 'learning_rate': 1.1298851767716967e-05, 'epoch': 0.92} {'loss': 0.7059, 'learning_rate': 1.1298527188470129e-05, 'epoch': 0.92} {'loss': 0.7004, 'learning_rate': 1.12982026078318e-05, 'epoch': 0.92} {'loss': 0.9005, 'learning_rate': 1.1297878025802333e-05, 'epoch': 0.92} {'loss': 0.7585, 'learning_rate': 1.1297553442382072e-05, 'epoch': 0.92} {'loss': 0.7903, 'learning_rate': 1.1297228857571363e-05, 'epoch': 0.92} {'loss': 0.6057, 'learning_rate': 1.1296904271370557e-05, 'epoch': 0.92} {'loss': 0.5976, 'learning_rate': 1.1296579683780002e-05, 'epoch': 0.92} {'loss': 0.9638, 'learning_rate': 1.1296255094800043e-05, 'epoch': 0.92} {'loss': 0.8225, 'learning_rate': 1.1295930504431032e-05, 'epoch': 0.92} {'loss': 0.81, 'learning_rate': 1.1295605912673316e-05, 'epoch': 0.92} {'loss': 0.6226, 'learning_rate': 1.1295281319527238e-05, 'epoch': 0.92} {'loss': 0.7656, 'learning_rate': 1.1294956724993149e-05, 'epoch': 0.92} {'loss': 0.716, 'learning_rate': 1.1294632129071398e-05, 'epoch': 0.92} {'loss': 0.7479, 'learning_rate': 1.1294307531762331e-05, 'epoch': 0.92} {'loss': 0.7621, 'learning_rate': 1.1293982933066299e-05, 'epoch': 0.92} {'loss': 0.735, 'learning_rate': 1.1293658332983648e-05, 'epoch': 0.92} {'loss': 0.7445, 'learning_rate': 1.1293333731514722e-05, 'epoch': 0.92} {'loss': 0.7105, 'learning_rate': 1.1293009128659873e-05, 'epoch': 0.92} {'loss': 0.7362, 'learning_rate': 1.1292684524419449e-05, 'epoch': 0.92} {'loss': 0.8596, 'learning_rate': 1.1292359918793795e-05, 'epoch': 0.92} {'loss': 0.8239, 'learning_rate': 1.1292035311783262e-05, 'epoch': 0.92} {'loss': 0.6541, 'learning_rate': 1.1291710703388199e-05, 'epoch': 0.92} {'loss': 0.7389, 'learning_rate': 1.129138609360895e-05, 'epoch': 0.92} {'loss': 0.8326, 'learning_rate': 1.1291061482445861e-05, 'epoch': 0.92} {'loss': 0.7898, 'learning_rate': 1.1290736869899286e-05, 'epoch': 0.92} {'loss': 0.7663, 'learning_rate': 1.1290412255969568e-05, 'epoch': 0.92} {'loss': 0.8494, 'learning_rate': 1.129008764065706e-05, 'epoch': 0.92} {'loss': 0.8825, 'learning_rate': 1.1289763023962107e-05, 'epoch': 0.92} {'loss': 0.7198, 'learning_rate': 1.1289438405885054e-05, 'epoch': 0.92} {'loss': 0.8585, 'learning_rate': 1.128911378642625e-05, 'epoch': 0.92} {'loss': 0.884, 'learning_rate': 1.1288789165586045e-05, 'epoch': 0.92} {'loss': 0.9689, 'learning_rate': 1.1288464543364789e-05, 'epoch': 0.92} {'loss': 0.7867, 'learning_rate': 1.1288139919762821e-05, 'epoch': 0.92} {'loss': 0.6418, 'learning_rate': 1.1287815294780501e-05, 'epoch': 0.92} {'loss': 0.8323, 'learning_rate': 1.128749066841817e-05, 'epoch': 0.92} {'loss': 0.7987, 'learning_rate': 1.1287166040676173e-05, 'epoch': 0.92} {'loss': 0.7321, 'learning_rate': 1.1286841411554865e-05, 'epoch': 0.92} {'loss': 0.8676, 'learning_rate': 1.1286516781054588e-05, 'epoch': 0.92} {'loss': 0.7495, 'learning_rate': 1.1286192149175692e-05, 'epoch': 0.92} {'loss': 0.76, 'learning_rate': 1.1285867515918525e-05, 'epoch': 0.92} {'loss': 0.7614, 'learning_rate': 1.1285542881283438e-05, 'epoch': 0.92} {'loss': 0.7486, 'learning_rate': 1.1285218245270774e-05, 'epoch': 0.92} {'loss': 0.7499, 'learning_rate': 1.1284893607880882e-05, 'epoch': 0.92} {'loss': 0.7143, 'learning_rate': 1.128456896911411e-05, 'epoch': 0.92} {'loss': 0.7788, 'learning_rate': 1.1284244328970807e-05, 'epoch': 0.92} {'loss': 0.9318, 'learning_rate': 1.1283919687451319e-05, 'epoch': 0.92} {'loss': 0.7278, 'learning_rate': 1.1283595044556e-05, 'epoch': 0.92} {'loss': 0.7723, 'learning_rate': 1.128327040028519e-05, 'epoch': 0.92} {'loss': 0.9693, 'learning_rate': 1.1282945754639239e-05, 'epoch': 0.92} {'loss': 0.8718, 'learning_rate': 1.1282621107618497e-05, 'epoch': 0.92} {'loss': 0.7505, 'learning_rate': 1.1282296459223308e-05, 'epoch': 0.92} {'loss': 1.0433, 'learning_rate': 1.1281971809454024e-05, 'epoch': 0.92} {'loss': 0.9491, 'learning_rate': 1.1281647158310994e-05, 'epoch': 0.92} {'loss': 0.661, 'learning_rate': 1.128132250579456e-05, 'epoch': 0.92} {'loss': 0.8349, 'learning_rate': 1.1280997851905075e-05, 'epoch': 0.92} {'loss': 0.6546, 'learning_rate': 1.1280673196642888e-05, 'epoch': 0.92} {'loss': 0.9713, 'learning_rate': 1.1280348540008341e-05, 'epoch': 0.92} {'loss': 0.7474, 'learning_rate': 1.1280023882001783e-05, 'epoch': 0.92} {'loss': 0.736, 'learning_rate': 1.1279699222623566e-05, 'epoch': 0.92} {'loss': 0.7373, 'learning_rate': 1.1279374561874037e-05, 'epoch': 0.92} {'loss': 0.8581, 'learning_rate': 1.1279049899753542e-05, 'epoch': 0.92} {'loss': 0.7503, 'learning_rate': 1.1278725236262432e-05, 'epoch': 0.92} {'loss': 0.7663, 'learning_rate': 1.1278400571401047e-05, 'epoch': 0.92} {'loss': 0.6056, 'learning_rate': 1.1278075905169743e-05, 'epoch': 0.92} {'loss': 0.8637, 'learning_rate': 1.1277751237568864e-05, 'epoch': 0.92} {'loss': 0.7895, 'learning_rate': 1.1277426568598761e-05, 'epoch': 0.92} {'loss': 0.8224, 'learning_rate': 1.127710189825978e-05, 'epoch': 0.92} {'loss': 0.6576, 'learning_rate': 1.127677722655227e-05, 'epoch': 0.92} {'loss': 0.8025, 'learning_rate': 1.1276452553476578e-05, 'epoch': 0.92} {'loss': 0.7133, 'learning_rate': 1.127612787903305e-05, 'epoch': 0.92} {'loss': 0.7832, 'learning_rate': 1.1275803203222035e-05, 'epoch': 0.92} {'loss': 0.6946, 'learning_rate': 1.1275478526043883e-05, 'epoch': 0.92} {'loss': 0.787, 'learning_rate': 1.127515384749894e-05, 'epoch': 0.92} {'loss': 0.7377, 'learning_rate': 1.1274829167587558e-05, 'epoch': 0.92} {'loss': 0.7101, 'learning_rate': 1.1274504486310077e-05, 'epoch': 0.92} {'loss': 0.7547, 'learning_rate': 1.1274179803666851e-05, 'epoch': 0.92} {'loss': 0.7577, 'learning_rate': 1.1273855119658228e-05, 'epoch': 0.92} {'loss': 0.7, 'learning_rate': 1.1273530434284551e-05, 'epoch': 0.92} {'loss': 0.6766, 'learning_rate': 1.1273205747546174e-05, 'epoch': 0.92} {'loss': 0.7304, 'learning_rate': 1.127288105944344e-05, 'epoch': 0.92} {'loss': 0.8102, 'learning_rate': 1.1272556369976701e-05, 'epoch': 0.92} {'loss': 0.8459, 'learning_rate': 1.1272231679146301e-05, 'epoch': 0.92} {'loss': 0.7749, 'learning_rate': 1.1271906986952595e-05, 'epoch': 0.92} {'loss': 0.7174, 'learning_rate': 1.1271582293395919e-05, 'epoch': 0.92} {'loss': 0.8656, 'learning_rate': 1.1271257598476632e-05, 'epoch': 0.92} {'loss': 0.9309, 'learning_rate': 1.1270932902195077e-05, 'epoch': 0.92} {'loss': 0.7843, 'learning_rate': 1.1270608204551603e-05, 'epoch': 0.92} {'loss': 0.6289, 'learning_rate': 1.1270283505546556e-05, 'epoch': 0.92} {'loss': 0.7846, 'learning_rate': 1.1269958805180286e-05, 'epoch': 0.92} {'loss': 0.631, 'learning_rate': 1.1269634103453143e-05, 'epoch': 0.92} {'loss': 0.6937, 'learning_rate': 1.1269309400365471e-05, 'epoch': 0.92} {'loss': 0.8551, 'learning_rate': 1.1268984695917617e-05, 'epoch': 0.92} {'loss': 0.6661, 'learning_rate': 1.1268659990109933e-05, 'epoch': 0.92} {'loss': 0.9058, 'learning_rate': 1.1268335282942766e-05, 'epoch': 0.92} {'loss': 0.7182, 'learning_rate': 1.126801057441646e-05, 'epoch': 0.92} {'loss': 0.8239, 'learning_rate': 1.1267685864531372e-05, 'epoch': 0.92} {'loss': 0.815, 'learning_rate': 1.1267361153287842e-05, 'epoch': 0.92} {'loss': 0.8637, 'learning_rate': 1.126703644068622e-05, 'epoch': 0.92} {'loss': 0.8052, 'learning_rate': 1.1266711726726854e-05, 'epoch': 0.92} {'loss': 0.6825, 'learning_rate': 1.126638701141009e-05, 'epoch': 0.92} {'loss': 0.6495, 'learning_rate': 1.1266062294736278e-05, 'epoch': 0.92} {'loss': 0.649, 'learning_rate': 1.1265737576705766e-05, 'epoch': 0.92} {'loss': 0.7893, 'learning_rate': 1.1265412857318907e-05, 'epoch': 0.92} {'loss': 0.7004, 'learning_rate': 1.1265088136576042e-05, 'epoch': 0.92} {'loss': 0.8614, 'learning_rate': 1.1264763414477517e-05, 'epoch': 0.92} {'loss': 0.7872, 'learning_rate': 1.1264438691023687e-05, 'epoch': 0.92} {'loss': 0.7052, 'learning_rate': 1.1264113966214896e-05, 'epoch': 0.92} {'loss': 0.8332, 'learning_rate': 1.126378924005149e-05, 'epoch': 0.92} {'loss': 0.7305, 'learning_rate': 1.1263464512533822e-05, 'epoch': 0.92} {'loss': 0.8536, 'learning_rate': 1.126313978366224e-05, 'epoch': 0.92} {'loss': 0.7827, 'learning_rate': 1.126281505343709e-05, 'epoch': 0.92} {'loss': 0.8457, 'learning_rate': 1.1262490321858717e-05, 'epoch': 0.92} {'loss': 0.7839, 'learning_rate': 1.1262165588927471e-05, 'epoch': 0.92} {'loss': 0.7267, 'learning_rate': 1.1261840854643701e-05, 'epoch': 0.92} {'loss': 0.9212, 'learning_rate': 1.1261516119007756e-05, 'epoch': 0.92} {'loss': 0.8737, 'learning_rate': 1.1261191382019984e-05, 'epoch': 0.92} {'loss': 0.8325, 'learning_rate': 1.1260866643680728e-05, 'epoch': 0.92} {'loss': 0.6712, 'learning_rate': 1.1260541903990343e-05, 'epoch': 0.92} {'loss': 0.9974, 'learning_rate': 1.1260217162949172e-05, 'epoch': 0.92} {'loss': 0.9962, 'learning_rate': 1.1259892420557564e-05, 'epoch': 0.92} {'loss': 0.9672, 'learning_rate': 1.1259567676815869e-05, 'epoch': 0.92} {'loss': 0.689, 'learning_rate': 1.125924293172443e-05, 'epoch': 0.92} {'loss': 0.8312, 'learning_rate': 1.1258918185283603e-05, 'epoch': 0.92} {'loss': 0.7639, 'learning_rate': 1.125859343749373e-05, 'epoch': 0.92} {'loss': 0.7828, 'learning_rate': 1.1258268688355161e-05, 'epoch': 0.92} {'loss': 0.7514, 'learning_rate': 1.1257943937868243e-05, 'epoch': 0.92} {'loss': 0.8148, 'learning_rate': 1.1257619186033323e-05, 'epoch': 0.92} {'loss': 0.7059, 'learning_rate': 1.1257294432850751e-05, 'epoch': 0.92} {'loss': 0.8251, 'learning_rate': 1.1256969678320877e-05, 'epoch': 0.92} {'loss': 0.7235, 'learning_rate': 1.1256644922444045e-05, 'epoch': 0.92} {'loss': 0.8099, 'learning_rate': 1.1256320165220604e-05, 'epoch': 0.92} {'loss': 0.7424, 'learning_rate': 1.1255995406650904e-05, 'epoch': 0.92} {'loss': 0.8584, 'learning_rate': 1.125567064673529e-05, 'epoch': 0.92} {'loss': 0.6761, 'learning_rate': 1.1255345885474111e-05, 'epoch': 0.92} {'loss': 0.8196, 'learning_rate': 1.125502112286772e-05, 'epoch': 0.92} {'loss': 0.7709, 'learning_rate': 1.1254696358916455e-05, 'epoch': 0.92} {'loss': 0.7685, 'learning_rate': 1.1254371593620672e-05, 'epoch': 0.92} {'loss': 1.0304, 'learning_rate': 1.1254046826980718e-05, 'epoch': 0.92} {'loss': 0.6457, 'learning_rate': 1.1253722058996938e-05, 'epoch': 0.92} {'loss': 0.8517, 'learning_rate': 1.125339728966968e-05, 'epoch': 0.92} {'loss': 0.7951, 'learning_rate': 1.1253072518999297e-05, 'epoch': 0.92} {'loss': 0.7637, 'learning_rate': 1.1252747746986132e-05, 'epoch': 0.92} {'loss': 0.8224, 'learning_rate': 1.1252422973630535e-05, 'epoch': 0.92} {'loss': 0.8861, 'learning_rate': 1.1252098198932853e-05, 'epoch': 0.92} {'loss': 0.6986, 'learning_rate': 1.1251773422893438e-05, 'epoch': 0.92} {'loss': 0.807, 'learning_rate': 1.1251448645512633e-05, 'epoch': 0.92} {'loss': 0.9551, 'learning_rate': 1.1251123866790785e-05, 'epoch': 0.92} {'loss': 0.6473, 'learning_rate': 1.1250799086728249e-05, 'epoch': 0.92} {'loss': 0.6801, 'learning_rate': 1.1250474305325364e-05, 'epoch': 0.92} {'loss': 0.7845, 'learning_rate': 1.1250149522582488e-05, 'epoch': 0.92} {'loss': 0.721, 'learning_rate': 1.1249824738499959e-05, 'epoch': 0.92} {'loss': 0.7976, 'learning_rate': 1.1249499953078135e-05, 'epoch': 0.92} {'loss': 0.7716, 'learning_rate': 1.1249175166317356e-05, 'epoch': 0.92} {'loss': 0.8075, 'learning_rate': 1.1248850378217976e-05, 'epoch': 0.92} {'loss': 0.771, 'learning_rate': 1.1248525588780338e-05, 'epoch': 0.92} {'loss': 0.9592, 'learning_rate': 1.1248200798004792e-05, 'epoch': 0.92} {'loss': 0.8116, 'learning_rate': 1.1247876005891684e-05, 'epoch': 0.92} {'loss': 0.8369, 'learning_rate': 1.1247551212441365e-05, 'epoch': 0.92} {'loss': 0.5431, 'learning_rate': 1.1247226417654186e-05, 'epoch': 0.92} {'loss': 0.8563, 'learning_rate': 1.124690162153049e-05, 'epoch': 0.92} {'loss': 0.8449, 'learning_rate': 1.1246576824070625e-05, 'epoch': 0.92} {'loss': 0.7137, 'learning_rate': 1.1246252025274941e-05, 'epoch': 0.92} {'loss': 0.8954, 'learning_rate': 1.1245927225143784e-05, 'epoch': 0.92} {'loss': 0.8197, 'learning_rate': 1.1245602423677506e-05, 'epoch': 0.92} {'loss': 0.6339, 'learning_rate': 1.124527762087645e-05, 'epoch': 0.92} {'loss': 0.7097, 'learning_rate': 1.124495281674097e-05, 'epoch': 0.92} {'loss': 0.7831, 'learning_rate': 1.124462801127141e-05, 'epoch': 0.92} {'loss': 0.7781, 'learning_rate': 1.1244303204468117e-05, 'epoch': 0.92} {'loss': 0.6446, 'learning_rate': 1.124397839633144e-05, 'epoch': 0.92} {'loss': 0.6606, 'learning_rate': 1.124365358686173e-05, 'epoch': 0.92} {'loss': 0.778, 'learning_rate': 1.1243328776059333e-05, 'epoch': 0.92} {'loss': 0.7016, 'learning_rate': 1.1243003963924597e-05, 'epoch': 0.92} {'loss': 0.7875, 'learning_rate': 1.1242679150457867e-05, 'epoch': 0.92} {'loss': 0.8319, 'learning_rate': 1.1242354335659498e-05, 'epoch': 0.92} {'loss': 0.7179, 'learning_rate': 1.1242029519529833e-05, 'epoch': 0.92} {'loss': 0.679, 'learning_rate': 1.124170470206922e-05, 'epoch': 0.92} {'loss': 0.6768, 'learning_rate': 1.1241379883278007e-05, 'epoch': 0.92} {'loss': 1.0084, 'learning_rate': 1.1241055063156545e-05, 'epoch': 0.92} {'loss': 0.7722, 'learning_rate': 1.1240730241705184e-05, 'epoch': 0.92} {'loss': 0.8364, 'learning_rate': 1.1240405418924268e-05, 'epoch': 0.92} {'loss': 0.7676, 'learning_rate': 1.1240080594814142e-05, 'epoch': 0.92} {'loss': 0.8163, 'learning_rate': 1.1239755769375158e-05, 'epoch': 0.92} {'loss': 0.8078, 'learning_rate': 1.1239430942607666e-05, 'epoch': 0.92} {'loss': 0.7182, 'learning_rate': 1.1239106114512009e-05, 'epoch': 0.92} {'loss': 0.806, 'learning_rate': 1.1238781285088538e-05, 'epoch': 0.92} {'loss': 0.7814, 'learning_rate': 1.1238456454337604e-05, 'epoch': 0.92} {'loss': 0.9573, 'learning_rate': 1.1238131622259554e-05, 'epoch': 0.92} {'loss': 0.88, 'learning_rate': 1.123780678885473e-05, 'epoch': 0.92} {'loss': 0.7698, 'learning_rate': 1.1237481954123484e-05, 'epoch': 0.92} {'loss': 0.7436, 'learning_rate': 1.1237157118066166e-05, 'epoch': 0.92} {'loss': 0.8355, 'learning_rate': 1.123683228068312e-05, 'epoch': 0.92} {'loss': 0.6801, 'learning_rate': 1.1236507441974703e-05, 'epoch': 0.92} {'loss': 0.852, 'learning_rate': 1.123618260194125e-05, 'epoch': 0.92} {'loss': 0.8921, 'learning_rate': 1.1235857760583119e-05, 'epoch': 0.92} {'loss': 0.9196, 'learning_rate': 1.1235532917900655e-05, 'epoch': 0.92} {'loss': 0.8351, 'learning_rate': 1.1235208073894203e-05, 'epoch': 0.92} {'loss': 0.7572, 'learning_rate': 1.1234883228564118e-05, 'epoch': 0.92} {'loss': 0.7323, 'learning_rate': 1.1234558381910743e-05, 'epoch': 0.92} {'loss': 0.9396, 'learning_rate': 1.1234233533934425e-05, 'epoch': 0.92} {'loss': 0.757, 'learning_rate': 1.1233908684635514e-05, 'epoch': 0.92} {'loss': 0.7568, 'learning_rate': 1.1233583834014363e-05, 'epoch': 0.92} {'loss': 0.7112, 'learning_rate': 1.1233258982071314e-05, 'epoch': 0.92} {'loss': 0.7953, 'learning_rate': 1.1232934128806715e-05, 'epoch': 0.92} {'loss': 0.8977, 'learning_rate': 1.1232609274220917e-05, 'epoch': 0.92} {'loss': 0.7854, 'learning_rate': 1.1232284418314265e-05, 'epoch': 0.92} {'loss': 0.9326, 'learning_rate': 1.1231959561087111e-05, 'epoch': 0.92} {'loss': 0.9359, 'learning_rate': 1.12316347025398e-05, 'epoch': 0.92} {'loss': 0.7627, 'learning_rate': 1.1231309842672684e-05, 'epoch': 0.92} {'loss': 0.7859, 'learning_rate': 1.1230984981486106e-05, 'epoch': 0.92} {'loss': 0.7079, 'learning_rate': 1.1230660118980414e-05, 'epoch': 0.92} {'loss': 0.7885, 'learning_rate': 1.1230335255155964e-05, 'epoch': 0.92} {'loss': 0.8543, 'learning_rate': 1.1230010390013095e-05, 'epoch': 0.92} {'loss': 0.6206, 'learning_rate': 1.122968552355216e-05, 'epoch': 0.92} {'loss': 0.683, 'learning_rate': 1.1229360655773508e-05, 'epoch': 0.92} {'loss': 0.797, 'learning_rate': 1.1229035786677482e-05, 'epoch': 0.92} {'loss': 0.7559, 'learning_rate': 1.1228710916264433e-05, 'epoch': 0.92} {'loss': 0.6443, 'learning_rate': 1.1228386044534711e-05, 'epoch': 0.92} {'loss': 0.7562, 'learning_rate': 1.1228061171488663e-05, 'epoch': 0.92} {'loss': 0.7175, 'learning_rate': 1.1227736297126635e-05, 'epoch': 0.93} {'loss': 0.6314, 'learning_rate': 1.1227411421448977e-05, 'epoch': 0.93} {'loss': 0.847, 'learning_rate': 1.1227086544456039e-05, 'epoch': 0.93} {'loss': 0.7747, 'learning_rate': 1.1226761666148164e-05, 'epoch': 0.93} {'loss': 0.6434, 'learning_rate': 1.1226436786525706e-05, 'epoch': 0.93} {'loss': 0.8162, 'learning_rate': 1.1226111905589008e-05, 'epoch': 0.93} {'loss': 1.025, 'learning_rate': 1.1225787023338422e-05, 'epoch': 0.93} {'loss': 0.7217, 'learning_rate': 1.1225462139774293e-05, 'epoch': 0.93} {'loss': 0.8314, 'learning_rate': 1.1225137254896969e-05, 'epoch': 0.93} {'loss': 0.6816, 'learning_rate': 1.1224812368706804e-05, 'epoch': 0.93} {'loss': 0.8583, 'learning_rate': 1.122448748120414e-05, 'epoch': 0.93} {'loss': 0.7917, 'learning_rate': 1.122416259238933e-05, 'epoch': 0.93} {'loss': 0.8523, 'learning_rate': 1.1223837702262715e-05, 'epoch': 0.93} {'loss': 0.8016, 'learning_rate': 1.1223512810824648e-05, 'epoch': 0.93} {'loss': 0.7978, 'learning_rate': 1.1223187918075478e-05, 'epoch': 0.93} {'loss': 0.6642, 'learning_rate': 1.1222863024015552e-05, 'epoch': 0.93} {'loss': 0.8438, 'learning_rate': 1.1222538128645218e-05, 'epoch': 0.93} {'loss': 0.9182, 'learning_rate': 1.1222213231964824e-05, 'epoch': 0.93} {'loss': 0.7374, 'learning_rate': 1.1221888333974717e-05, 'epoch': 0.93} {'loss': 0.741, 'learning_rate': 1.1221563434675247e-05, 'epoch': 0.93} {'loss': 0.7174, 'learning_rate': 1.1221238534066761e-05, 'epoch': 0.93} {'loss': 0.8258, 'learning_rate': 1.1220913632149608e-05, 'epoch': 0.93} {'loss': 0.732, 'learning_rate': 1.1220588728924136e-05, 'epoch': 0.93} {'loss': 0.7605, 'learning_rate': 1.1220263824390693e-05, 'epoch': 0.93} {'loss': 0.7931, 'learning_rate': 1.1219938918549631e-05, 'epoch': 0.93} {'loss': 0.9241, 'learning_rate': 1.1219614011401289e-05, 'epoch': 0.93} {'loss': 0.7714, 'learning_rate': 1.1219289102946022e-05, 'epoch': 0.93} {'loss': 0.5642, 'learning_rate': 1.1218964193184177e-05, 'epoch': 0.93} {'loss': 0.8779, 'learning_rate': 1.12186392821161e-05, 'epoch': 0.93} {'loss': 0.6525, 'learning_rate': 1.1218314369742145e-05, 'epoch': 0.93} {'loss': 0.7491, 'learning_rate': 1.1217989456062652e-05, 'epoch': 0.93} {'loss': 0.8901, 'learning_rate': 1.1217664541077976e-05, 'epoch': 0.93} {'loss': 0.7217, 'learning_rate': 1.1217339624788463e-05, 'epoch': 0.93} {'loss': 0.8293, 'learning_rate': 1.1217014707194458e-05, 'epoch': 0.93} {'loss': 0.7605, 'learning_rate': 1.1216689788296314e-05, 'epoch': 0.93} {'loss': 0.8405, 'learning_rate': 1.1216364868094375e-05, 'epoch': 0.93} {'loss': 0.8207, 'learning_rate': 1.1216039946588994e-05, 'epoch': 0.93} {'loss': 0.8204, 'learning_rate': 1.1215715023780517e-05, 'epoch': 0.93} {'loss': 0.895, 'learning_rate': 1.121539009966929e-05, 'epoch': 0.93} {'loss': 0.9512, 'learning_rate': 1.1215065174255661e-05, 'epoch': 0.93} {'loss': 0.8339, 'learning_rate': 1.1214740247539982e-05, 'epoch': 0.93} {'loss': 0.7864, 'learning_rate': 1.1214415319522598e-05, 'epoch': 0.93} {'loss': 0.7894, 'learning_rate': 1.121409039020386e-05, 'epoch': 0.93} {'loss': 0.6898, 'learning_rate': 1.1213765459584114e-05, 'epoch': 0.93} {'loss': 0.7284, 'learning_rate': 1.121344052766371e-05, 'epoch': 0.93} {'loss': 0.8914, 'learning_rate': 1.1213115594442993e-05, 'epoch': 0.93} {'loss': 0.7087, 'learning_rate': 1.1212790659922312e-05, 'epoch': 0.93} {'loss': 0.7901, 'learning_rate': 1.1212465724102018e-05, 'epoch': 0.93} {'loss': 0.9059, 'learning_rate': 1.121214078698246e-05, 'epoch': 0.93} {'loss': 0.7571, 'learning_rate': 1.121181584856398e-05, 'epoch': 0.93} {'loss': 0.646, 'learning_rate': 1.1211490908846932e-05, 'epoch': 0.93} {'loss': 0.7773, 'learning_rate': 1.1211165967831661e-05, 'epoch': 0.93} {'loss': 0.9528, 'learning_rate': 1.1210841025518518e-05, 'epoch': 0.93} {'loss': 0.8716, 'learning_rate': 1.1210516081907848e-05, 'epoch': 0.93} {'loss': 0.6471, 'learning_rate': 1.1210191137e-05, 'epoch': 0.93} {'loss': 0.8697, 'learning_rate': 1.1209866190795325e-05, 'epoch': 0.93} {'loss': 0.8808, 'learning_rate': 1.1209541243294167e-05, 'epoch': 0.93} {'loss': 0.791, 'learning_rate': 1.1209216294496876e-05, 'epoch': 0.93} {'loss': 0.6565, 'learning_rate': 1.1208891344403805e-05, 'epoch': 0.93} {'loss': 0.7648, 'learning_rate': 1.1208566393015295e-05, 'epoch': 0.93} {'loss': 0.7592, 'learning_rate': 1.1208241440331695e-05, 'epoch': 0.93} {'loss': 0.7577, 'learning_rate': 1.120791648635336e-05, 'epoch': 0.93} {'loss': 0.7481, 'learning_rate': 1.120759153108063e-05, 'epoch': 0.93} {'loss': 0.6567, 'learning_rate': 1.1207266574513858e-05, 'epoch': 0.93} {'loss': 0.6976, 'learning_rate': 1.1206941616653389e-05, 'epoch': 0.93} {'loss': 0.8273, 'learning_rate': 1.1206616657499577e-05, 'epoch': 0.93} {'loss': 0.8821, 'learning_rate': 1.1206291697052762e-05, 'epoch': 0.93} {'loss': 0.7688, 'learning_rate': 1.1205966735313299e-05, 'epoch': 0.93} {'loss': 0.8053, 'learning_rate': 1.1205641772281533e-05, 'epoch': 0.93} {'loss': 0.8618, 'learning_rate': 1.1205316807957813e-05, 'epoch': 0.93} {'loss': 0.6991, 'learning_rate': 1.1204991842342488e-05, 'epoch': 0.93} {'loss': 0.9701, 'learning_rate': 1.1204666875435905e-05, 'epoch': 0.93} {'loss': 0.6196, 'learning_rate': 1.1204341907238412e-05, 'epoch': 0.93} {'loss': 0.9307, 'learning_rate': 1.1204016937750359e-05, 'epoch': 0.93} {'loss': 0.8414, 'learning_rate': 1.1203691966972094e-05, 'epoch': 0.93} {'loss': 0.9048, 'learning_rate': 1.1203366994903962e-05, 'epoch': 0.93} {'loss': 0.841, 'learning_rate': 1.1203042021546313e-05, 'epoch': 0.93} {'loss': 0.799, 'learning_rate': 1.1202717046899498e-05, 'epoch': 0.93} {'loss': 0.8392, 'learning_rate': 1.1202392070963866e-05, 'epoch': 0.93} {'loss': 0.8638, 'learning_rate': 1.1202067093739756e-05, 'epoch': 0.93} {'loss': 0.7345, 'learning_rate': 1.120174211522753e-05, 'epoch': 0.93} {'loss': 0.7262, 'learning_rate': 1.1201417135427523e-05, 'epoch': 0.93} {'loss': 0.8739, 'learning_rate': 1.1201092154340089e-05, 'epoch': 0.93} {'loss': 1.0313, 'learning_rate': 1.1200767171965579e-05, 'epoch': 0.93} {'loss': 0.8652, 'learning_rate': 1.1200442188304337e-05, 'epoch': 0.93} {'loss': 0.7299, 'learning_rate': 1.1200117203356715e-05, 'epoch': 0.93} {'loss': 0.7181, 'learning_rate': 1.119979221712306e-05, 'epoch': 0.93} {'loss': 0.7362, 'learning_rate': 1.1199467229603715e-05, 'epoch': 0.93} {'loss': 0.9509, 'learning_rate': 1.1199142240799035e-05, 'epoch': 0.93} {'loss': 0.9263, 'learning_rate': 1.1198817250709364e-05, 'epoch': 0.93} {'loss': 0.7489, 'learning_rate': 1.1198492259335054e-05, 'epoch': 0.93} {'loss': 0.854, 'learning_rate': 1.119816726667645e-05, 'epoch': 0.93} {'loss': 0.7767, 'learning_rate': 1.1197842272733906e-05, 'epoch': 0.93} {'loss': 0.6693, 'learning_rate': 1.1197517277507764e-05, 'epoch': 0.93} {'loss': 0.9054, 'learning_rate': 1.119719228099837e-05, 'epoch': 0.93} {'loss': 0.7969, 'learning_rate': 1.1196867283206078e-05, 'epoch': 0.93} {'loss': 0.7808, 'learning_rate': 1.1196542284131238e-05, 'epoch': 0.93} {'loss': 0.7161, 'learning_rate': 1.119621728377419e-05, 'epoch': 0.93} {'loss': 0.6698, 'learning_rate': 1.119589228213529e-05, 'epoch': 0.93} {'loss': 0.8055, 'learning_rate': 1.1195567279214885e-05, 'epoch': 0.93} {'loss': 0.7089, 'learning_rate': 1.1195242275013323e-05, 'epoch': 0.93} {'loss': 0.8141, 'learning_rate': 1.1194917269530947e-05, 'epoch': 0.93} {'loss': 0.6743, 'learning_rate': 1.1194592262768109e-05, 'epoch': 0.93} {'loss': 0.6797, 'learning_rate': 1.1194267254725159e-05, 'epoch': 0.93} {'loss': 0.7127, 'learning_rate': 1.1193942245402443e-05, 'epoch': 0.93} {'loss': 0.8785, 'learning_rate': 1.1193617234800313e-05, 'epoch': 0.93} {'loss': 0.6751, 'learning_rate': 1.1193292222919112e-05, 'epoch': 0.93} {'loss': 0.8823, 'learning_rate': 1.1192967209759194e-05, 'epoch': 0.93} {'loss': 0.807, 'learning_rate': 1.11926421953209e-05, 'epoch': 0.93} {'loss': 0.7729, 'learning_rate': 1.1192317179604581e-05, 'epoch': 0.93} {'loss': 0.7357, 'learning_rate': 1.119199216261059e-05, 'epoch': 0.93} {'loss': 0.7097, 'learning_rate': 1.119166714433927e-05, 'epoch': 0.93} {'loss': 0.6558, 'learning_rate': 1.1191342124790974e-05, 'epoch': 0.93} {'loss': 0.7412, 'learning_rate': 1.1191017103966044e-05, 'epoch': 0.93} {'loss': 0.8318, 'learning_rate': 1.1190692081864834e-05, 'epoch': 0.93} {'loss': 0.7746, 'learning_rate': 1.1190367058487688e-05, 'epoch': 0.93} {'loss': 0.7052, 'learning_rate': 1.1190042033834956e-05, 'epoch': 0.93} {'loss': 0.7247, 'learning_rate': 1.118971700790699e-05, 'epoch': 0.93} {'loss': 0.665, 'learning_rate': 1.1189391980704132e-05, 'epoch': 0.93} {'loss': 0.8141, 'learning_rate': 1.1189066952226733e-05, 'epoch': 0.93} {'loss': 0.797, 'learning_rate': 1.1188741922475143e-05, 'epoch': 0.93} {'loss': 0.8311, 'learning_rate': 1.1188416891449707e-05, 'epoch': 0.93} {'loss': 0.8353, 'learning_rate': 1.1188091859150776e-05, 'epoch': 0.93} {'loss': 0.7666, 'learning_rate': 1.1187766825578697e-05, 'epoch': 0.93} {'loss': 0.5623, 'learning_rate': 1.118744179073382e-05, 'epoch': 0.93} {'loss': 0.8765, 'learning_rate': 1.118711675461649e-05, 'epoch': 0.93} {'loss': 0.7853, 'learning_rate': 1.1186791717227057e-05, 'epoch': 0.93} {'loss': 0.818, 'learning_rate': 1.1186466678565872e-05, 'epoch': 0.93} {'loss': 0.7694, 'learning_rate': 1.1186141638633279e-05, 'epoch': 0.93} {'loss': 0.8575, 'learning_rate': 1.1185816597429628e-05, 'epoch': 0.93} {'loss': 0.7068, 'learning_rate': 1.118549155495527e-05, 'epoch': 0.93} {'loss': 0.7526, 'learning_rate': 1.1185166511210548e-05, 'epoch': 0.93} {'loss': 0.8856, 'learning_rate': 1.1184841466195815e-05, 'epoch': 0.93} {'loss': 0.8482, 'learning_rate': 1.1184516419911415e-05, 'epoch': 0.93} {'loss': 0.8371, 'learning_rate': 1.1184191372357702e-05, 'epoch': 0.93} {'loss': 0.7451, 'learning_rate': 1.1183866323535017e-05, 'epoch': 0.93} {'loss': 0.8097, 'learning_rate': 1.1183541273443719e-05, 'epoch': 0.93} {'loss': 0.9195, 'learning_rate': 1.1183216222084143e-05, 'epoch': 0.93} {'loss': 0.8033, 'learning_rate': 1.1182891169456647e-05, 'epoch': 0.93} {'loss': 0.8174, 'learning_rate': 1.1182566115561575e-05, 'epoch': 0.93} {'loss': 0.912, 'learning_rate': 1.1182241060399277e-05, 'epoch': 0.93} {'loss': 0.8058, 'learning_rate': 1.1181916003970104e-05, 'epoch': 0.93} {'loss': 0.8084, 'learning_rate': 1.1181590946274396e-05, 'epoch': 0.93} {'loss': 0.8415, 'learning_rate': 1.1181265887312512e-05, 'epoch': 0.93} {'loss': 0.8652, 'learning_rate': 1.1180940827084792e-05, 'epoch': 0.93} {'loss': 0.6948, 'learning_rate': 1.1180615765591587e-05, 'epoch': 0.93} {'loss': 0.7392, 'learning_rate': 1.1180290702833245e-05, 'epoch': 0.93} {'loss': 0.8388, 'learning_rate': 1.1179965638810115e-05, 'epoch': 0.93} {'loss': 0.6553, 'learning_rate': 1.117964057352255e-05, 'epoch': 0.93} {'loss': 0.7665, 'learning_rate': 1.1179315506970892e-05, 'epoch': 0.93} {'loss': 0.7625, 'learning_rate': 1.1178990439155489e-05, 'epoch': 0.93} {'loss': 0.9517, 'learning_rate': 1.1178665370076688e-05, 'epoch': 0.93} {'loss': 0.8793, 'learning_rate': 1.1178340299734847e-05, 'epoch': 0.93} {'loss': 0.8977, 'learning_rate': 1.1178015228130303e-05, 'epoch': 0.93} {'loss': 0.8823, 'learning_rate': 1.1177690155263415e-05, 'epoch': 0.93} {'loss': 0.8044, 'learning_rate': 1.1177365081134521e-05, 'epoch': 0.93} {'loss': 0.7646, 'learning_rate': 1.1177040005743977e-05, 'epoch': 0.93} {'loss': 0.7488, 'learning_rate': 1.1176714929092124e-05, 'epoch': 0.93} {'loss': 0.7293, 'learning_rate': 1.117638985117932e-05, 'epoch': 0.93} {'loss': 0.7956, 'learning_rate': 1.1176064772005904e-05, 'epoch': 0.93} {'loss': 0.8539, 'learning_rate': 1.1175739691572229e-05, 'epoch': 0.93} {'loss': 0.9344, 'learning_rate': 1.1175414609878645e-05, 'epoch': 0.93} {'loss': 0.748, 'learning_rate': 1.11750895269255e-05, 'epoch': 0.93} {'loss': 0.7757, 'learning_rate': 1.1174764442713137e-05, 'epoch': 0.93} {'loss': 0.7691, 'learning_rate': 1.1174439357241908e-05, 'epoch': 0.93} {'loss': 0.8056, 'learning_rate': 1.1174114270512162e-05, 'epoch': 0.93} {'loss': 0.9026, 'learning_rate': 1.1173789182524244e-05, 'epoch': 0.93} {'loss': 0.6177, 'learning_rate': 1.1173464093278508e-05, 'epoch': 0.93} {'loss': 0.8137, 'learning_rate': 1.11731390027753e-05, 'epoch': 0.93} {'loss': 0.835, 'learning_rate': 1.1172813911014968e-05, 'epoch': 0.93} {'loss': 0.7871, 'learning_rate': 1.1172488817997858e-05, 'epoch': 0.93} {'loss': 0.77, 'learning_rate': 1.1172163723724318e-05, 'epoch': 0.93} {'loss': 0.7723, 'learning_rate': 1.1171838628194702e-05, 'epoch': 0.93} {'loss': 0.8999, 'learning_rate': 1.1171513531409356e-05, 'epoch': 0.93} {'loss': 0.7423, 'learning_rate': 1.1171188433368627e-05, 'epoch': 0.93} {'loss': 0.8169, 'learning_rate': 1.1170863334072861e-05, 'epoch': 0.93} {'loss': 0.7682, 'learning_rate': 1.1170538233522414e-05, 'epoch': 0.93} {'loss': 0.8937, 'learning_rate': 1.1170213131717627e-05, 'epoch': 0.93} {'loss': 0.6286, 'learning_rate': 1.1169888028658848e-05, 'epoch': 0.93} {'loss': 0.7373, 'learning_rate': 1.1169562924346432e-05, 'epoch': 0.93} {'loss': 0.6889, 'learning_rate': 1.1169237818780725e-05, 'epoch': 0.93} {'loss': 0.8243, 'learning_rate': 1.1168912711962072e-05, 'epoch': 0.93} {'loss': 0.7112, 'learning_rate': 1.1168587603890821e-05, 'epoch': 0.93} {'loss': 0.7867, 'learning_rate': 1.1168262494567327e-05, 'epoch': 0.93} {'loss': 0.7841, 'learning_rate': 1.1167937383991934e-05, 'epoch': 0.93} {'loss': 0.802, 'learning_rate': 1.1167612272164989e-05, 'epoch': 0.93} {'loss': 0.7542, 'learning_rate': 1.1167287159086842e-05, 'epoch': 0.93} {'loss': 0.7598, 'learning_rate': 1.1166962044757844e-05, 'epoch': 0.93} {'loss': 0.7414, 'learning_rate': 1.1166636929178339e-05, 'epoch': 0.93} {'loss': 0.8038, 'learning_rate': 1.1166311812348676e-05, 'epoch': 0.93} {'loss': 0.7666, 'learning_rate': 1.1165986694269208e-05, 'epoch': 0.93} {'loss': 0.6861, 'learning_rate': 1.1165661574940276e-05, 'epoch': 0.93} {'loss': 0.8955, 'learning_rate': 1.1165336454362235e-05, 'epoch': 0.93} {'loss': 0.6464, 'learning_rate': 1.1165011332535432e-05, 'epoch': 0.93} {'loss': 0.8267, 'learning_rate': 1.1164686209460211e-05, 'epoch': 0.93} {'loss': 0.678, 'learning_rate': 1.1164361085136926e-05, 'epoch': 0.93} {'loss': 0.6933, 'learning_rate': 1.1164035959565922e-05, 'epoch': 0.93} {'loss': 0.7627, 'learning_rate': 1.1163710832747547e-05, 'epoch': 0.93} {'loss': 0.8144, 'learning_rate': 1.1163385704682153e-05, 'epoch': 0.93} {'loss': 0.6814, 'learning_rate': 1.1163060575370086e-05, 'epoch': 0.93} {'loss': 0.8193, 'learning_rate': 1.1162735444811695e-05, 'epoch': 0.93} {'loss': 0.8626, 'learning_rate': 1.1162410313007327e-05, 'epoch': 0.93} {'loss': 0.9335, 'learning_rate': 1.116208517995733e-05, 'epoch': 0.93} {'loss': 0.8735, 'learning_rate': 1.1161760045662056e-05, 'epoch': 0.93} {'loss': 0.8845, 'learning_rate': 1.116143491012185e-05, 'epoch': 0.93} {'loss': 0.8947, 'learning_rate': 1.1161109773337064e-05, 'epoch': 0.93} {'loss': 0.8863, 'learning_rate': 1.1160784635308042e-05, 'epoch': 0.93} {'loss': 0.7959, 'learning_rate': 1.1160459496035134e-05, 'epoch': 0.93} {'loss': 0.7608, 'learning_rate': 1.1160134355518688e-05, 'epoch': 0.93} {'loss': 0.6003, 'learning_rate': 1.1159809213759056e-05, 'epoch': 0.93} {'loss': 0.8641, 'learning_rate': 1.1159484070756584e-05, 'epoch': 0.93} {'loss': 0.8213, 'learning_rate': 1.1159158926511617e-05, 'epoch': 0.93} {'loss': 0.7594, 'learning_rate': 1.1158833781024513e-05, 'epoch': 0.93} {'loss': 0.7572, 'learning_rate': 1.1158508634295608e-05, 'epoch': 0.93} {'loss': 0.8846, 'learning_rate': 1.1158183486325255e-05, 'epoch': 0.93} {'loss': 0.7573, 'learning_rate': 1.1157858337113808e-05, 'epoch': 0.93} {'loss': 0.586, 'learning_rate': 1.115753318666161e-05, 'epoch': 0.93} {'loss': 0.8757, 'learning_rate': 1.1157208034969012e-05, 'epoch': 0.93} {'loss': 0.8163, 'learning_rate': 1.1156882882036363e-05, 'epoch': 0.93} {'loss': 0.6235, 'learning_rate': 1.1156557727864005e-05, 'epoch': 0.93} {'loss': 0.805, 'learning_rate': 1.1156232572452292e-05, 'epoch': 0.93} {'loss': 0.7365, 'learning_rate': 1.115590741580157e-05, 'epoch': 0.93} {'loss': 0.8013, 'learning_rate': 1.1155582257912193e-05, 'epoch': 0.93} {'loss': 0.9599, 'learning_rate': 1.1155257098784501e-05, 'epoch': 0.93} {'loss': 0.5932, 'learning_rate': 1.1154931938418851e-05, 'epoch': 0.93} {'loss': 0.7599, 'learning_rate': 1.1154606776815586e-05, 'epoch': 0.93} {'loss': 0.7701, 'learning_rate': 1.1154281613975055e-05, 'epoch': 0.93} {'loss': 0.7283, 'learning_rate': 1.1153956449897608e-05, 'epoch': 0.93} {'loss': 0.7272, 'learning_rate': 1.1153631284583588e-05, 'epoch': 0.93} {'loss': 0.6318, 'learning_rate': 1.1153306118033352e-05, 'epoch': 0.93} {'loss': 0.649, 'learning_rate': 1.1152980950247246e-05, 'epoch': 0.93} {'loss': 0.7951, 'learning_rate': 1.1152655781225612e-05, 'epoch': 0.93} {'loss': 0.7253, 'learning_rate': 1.1152330610968809e-05, 'epoch': 0.93} {'loss': 0.8026, 'learning_rate': 1.1152005439477176e-05, 'epoch': 0.93} {'loss': 0.7767, 'learning_rate': 1.1151680266751064e-05, 'epoch': 0.93} {'loss': 0.5962, 'learning_rate': 1.1151355092790826e-05, 'epoch': 0.93} {'loss': 0.8008, 'learning_rate': 1.1151029917596802e-05, 'epoch': 0.93} {'loss': 0.7212, 'learning_rate': 1.115070474116935e-05, 'epoch': 0.93} {'loss': 0.701, 'learning_rate': 1.1150379563508817e-05, 'epoch': 0.93} {'loss': 0.8077, 'learning_rate': 1.1150054384615545e-05, 'epoch': 0.93} {'loss': 0.8806, 'learning_rate': 1.1149729204489885e-05, 'epoch': 0.93} {'loss': 0.7842, 'learning_rate': 1.1149404023132186e-05, 'epoch': 0.93} {'loss': 0.7024, 'learning_rate': 1.1149078840542797e-05, 'epoch': 0.93} {'loss': 0.8544, 'learning_rate': 1.114875365672207e-05, 'epoch': 0.93} {'loss': 0.8986, 'learning_rate': 1.1148428471670346e-05, 'epoch': 0.93} {'loss': 0.6786, 'learning_rate': 1.114810328538798e-05, 'epoch': 0.93} {'loss': 0.6208, 'learning_rate': 1.1147778097875314e-05, 'epoch': 0.93} {'loss': 0.8183, 'learning_rate': 1.1147452909132702e-05, 'epoch': 0.93} {'loss': 0.7843, 'learning_rate': 1.1147127719160489e-05, 'epoch': 0.93} {'loss': 0.7403, 'learning_rate': 1.114680252795903e-05, 'epoch': 0.93} {'loss': 0.7881, 'learning_rate': 1.1146477335528662e-05, 'epoch': 0.93} {'loss': 0.8146, 'learning_rate': 1.1146152141869744e-05, 'epoch': 0.93} {'loss': 0.6908, 'learning_rate': 1.114582694698262e-05, 'epoch': 0.93} {'loss': 0.8357, 'learning_rate': 1.114550175086764e-05, 'epoch': 0.93} {'loss': 0.7591, 'learning_rate': 1.114517655352515e-05, 'epoch': 0.93} {'loss': 0.6238, 'learning_rate': 1.1144851354955499e-05, 'epoch': 0.93} {'loss': 0.5506, 'learning_rate': 1.114452615515904e-05, 'epoch': 0.93} {'loss': 0.5597, 'learning_rate': 1.1144200954136115e-05, 'epoch': 0.93} {'loss': 0.851, 'learning_rate': 1.1143875751887076e-05, 'epoch': 0.93} {'loss': 0.9195, 'learning_rate': 1.1143550548412272e-05, 'epoch': 0.93} {'loss': 0.8357, 'learning_rate': 1.114322534371205e-05, 'epoch': 0.93} {'loss': 0.7427, 'learning_rate': 1.1142900137786756e-05, 'epoch': 0.93} {'loss': 0.6586, 'learning_rate': 1.1142574930636747e-05, 'epoch': 0.93} {'loss': 0.8059, 'learning_rate': 1.1142249722262362e-05, 'epoch': 0.93} {'loss': 0.7721, 'learning_rate': 1.1141924512663954e-05, 'epoch': 0.93} {'loss': 0.8614, 'learning_rate': 1.1141599301841867e-05, 'epoch': 0.93} {'loss': 0.9049, 'learning_rate': 1.1141274089796462e-05, 'epoch': 0.93} {'loss': 0.7006, 'learning_rate': 1.1140948876528071e-05, 'epoch': 0.93} {'loss': 0.8669, 'learning_rate': 1.1140623662037056e-05, 'epoch': 0.93} {'loss': 0.7746, 'learning_rate': 1.1140298446323756e-05, 'epoch': 0.93} {'loss': 0.7972, 'learning_rate': 1.1139973229388522e-05, 'epoch': 0.93} {'loss': 0.808, 'learning_rate': 1.1139648011231705e-05, 'epoch': 0.93} {'loss': 0.7807, 'learning_rate': 1.1139322791853655e-05, 'epoch': 0.93} {'loss': 0.8426, 'learning_rate': 1.1138997571254717e-05, 'epoch': 0.93} {'loss': 0.8638, 'learning_rate': 1.1138672349435237e-05, 'epoch': 0.93} {'loss': 0.5795, 'learning_rate': 1.1138347126395573e-05, 'epoch': 0.93} {'loss': 0.8996, 'learning_rate': 1.1138021902136062e-05, 'epoch': 0.93} {'loss': 0.718, 'learning_rate': 1.113769667665706e-05, 'epoch': 0.93} {'loss': 0.725, 'learning_rate': 1.1137371449958911e-05, 'epoch': 0.93} {'loss': 0.7337, 'learning_rate': 1.113704622204197e-05, 'epoch': 0.93} {'loss': 0.7184, 'learning_rate': 1.1136720992906577e-05, 'epoch': 0.93} {'loss': 0.6467, 'learning_rate': 1.1136395762553087e-05, 'epoch': 0.93} {'loss': 0.6844, 'learning_rate': 1.1136070530981845e-05, 'epoch': 0.93} {'loss': 0.7625, 'learning_rate': 1.1135745298193203e-05, 'epoch': 0.93} {'loss': 0.9073, 'learning_rate': 1.1135420064187506e-05, 'epoch': 0.93} {'loss': 0.8594, 'learning_rate': 1.1135094828965102e-05, 'epoch': 0.93} {'loss': 0.8327, 'learning_rate': 1.1134769592526346e-05, 'epoch': 0.93} {'loss': 0.8635, 'learning_rate': 1.113444435487158e-05, 'epoch': 0.93} {'loss': 0.7867, 'learning_rate': 1.1134119116001156e-05, 'epoch': 0.93} {'loss': 0.901, 'learning_rate': 1.1133793875915418e-05, 'epoch': 0.93} {'loss': 0.8867, 'learning_rate': 1.1133468634614716e-05, 'epoch': 0.93} {'loss': 0.786, 'learning_rate': 1.1133143392099404e-05, 'epoch': 0.93} {'loss': 0.8059, 'learning_rate': 1.1132818148369824e-05, 'epoch': 0.93} {'loss': 0.6325, 'learning_rate': 1.1132492903426331e-05, 'epoch': 0.93} {'loss': 0.805, 'learning_rate': 1.1132167657269269e-05, 'epoch': 0.93} {'loss': 0.9434, 'learning_rate': 1.1131842409898983e-05, 'epoch': 0.93} {'loss': 0.7224, 'learning_rate': 1.1131517161315827e-05, 'epoch': 0.93} {'loss': 0.8235, 'learning_rate': 1.1131191911520149e-05, 'epoch': 0.93} {'loss': 0.8326, 'learning_rate': 1.1130866660512298e-05, 'epoch': 0.93} {'loss': 0.6439, 'learning_rate': 1.1130541408292618e-05, 'epoch': 0.93} {'loss': 0.7891, 'learning_rate': 1.1130216154861466e-05, 'epoch': 0.93} {'loss': 0.899, 'learning_rate': 1.1129890900219185e-05, 'epoch': 0.93} {'loss': 0.7369, 'learning_rate': 1.112956564436612e-05, 'epoch': 0.93} {'loss': 0.7184, 'learning_rate': 1.1129240387302625e-05, 'epoch': 0.93} {'loss': 0.7673, 'learning_rate': 1.1128915129029046e-05, 'epoch': 0.93} {'loss': 0.6876, 'learning_rate': 1.1128589869545732e-05, 'epoch': 0.93} {'loss': 0.747, 'learning_rate': 1.1128264608853035e-05, 'epoch': 0.93} {'loss': 0.6914, 'learning_rate': 1.1127939346951298e-05, 'epoch': 0.93} {'loss': 0.8584, 'learning_rate': 1.1127614083840876e-05, 'epoch': 0.93} {'loss': 1.0116, 'learning_rate': 1.1127288819522111e-05, 'epoch': 0.93} {'loss': 0.7457, 'learning_rate': 1.1126963553995354e-05, 'epoch': 0.93} {'loss': 0.6077, 'learning_rate': 1.1126638287260953e-05, 'epoch': 0.93} {'loss': 0.7172, 'learning_rate': 1.1126313019319259e-05, 'epoch': 0.93} {'loss': 0.7603, 'learning_rate': 1.112598775017062e-05, 'epoch': 0.93} {'loss': 0.8838, 'learning_rate': 1.1125662479815383e-05, 'epoch': 0.93} {'loss': 0.7139, 'learning_rate': 1.1125337208253895e-05, 'epoch': 0.93} {'loss': 0.8067, 'learning_rate': 1.1125011935486507e-05, 'epoch': 0.93} {'loss': 0.9288, 'learning_rate': 1.1124686661513566e-05, 'epoch': 0.93} {'loss': 0.798, 'learning_rate': 1.1124361386335425e-05, 'epoch': 0.93} {'loss': 0.7732, 'learning_rate': 1.112403610995243e-05, 'epoch': 0.93} {'loss': 0.7571, 'learning_rate': 1.1123710832364924e-05, 'epoch': 0.93} {'loss': 0.6804, 'learning_rate': 1.1123385553573265e-05, 'epoch': 0.93} {'loss': 0.7585, 'learning_rate': 1.1123060273577796e-05, 'epoch': 0.93} {'loss': 0.8113, 'learning_rate': 1.1122734992378864e-05, 'epoch': 0.93} {'loss': 0.7418, 'learning_rate': 1.1122409709976823e-05, 'epoch': 0.93} {'loss': 0.9299, 'learning_rate': 1.1122084426372018e-05, 'epoch': 0.93} {'loss': 0.8628, 'learning_rate': 1.1121759141564796e-05, 'epoch': 0.93} {'loss': 0.8246, 'learning_rate': 1.112143385555551e-05, 'epoch': 0.93} {'loss': 0.626, 'learning_rate': 1.1121108568344508e-05, 'epoch': 0.93} {'loss': 0.6771, 'learning_rate': 1.1120783279932135e-05, 'epoch': 0.93} {'loss': 1.0032, 'learning_rate': 1.112045799031874e-05, 'epoch': 0.93} {'loss': 0.7688, 'learning_rate': 1.1120132699504675e-05, 'epoch': 0.93} {'loss': 0.7449, 'learning_rate': 1.1119807407490286e-05, 'epoch': 0.93} {'loss': 0.6364, 'learning_rate': 1.1119482114275924e-05, 'epoch': 0.93} {'loss': 0.877, 'learning_rate': 1.1119156819861934e-05, 'epoch': 0.93} {'loss': 0.8999, 'learning_rate': 1.1118831524248668e-05, 'epoch': 0.93} {'loss': 0.72, 'learning_rate': 1.1118506227436471e-05, 'epoch': 0.93} {'loss': 0.7248, 'learning_rate': 1.1118180929425697e-05, 'epoch': 0.93} {'loss': 0.6668, 'learning_rate': 1.1117855630216688e-05, 'epoch': 0.93} {'loss': 0.9766, 'learning_rate': 1.1117530329809797e-05, 'epoch': 0.93} {'loss': 1.0012, 'learning_rate': 1.1117205028205368e-05, 'epoch': 0.93} {'loss': 0.7636, 'learning_rate': 1.1116879725403757e-05, 'epoch': 0.93} {'loss': 0.7429, 'learning_rate': 1.111655442140531e-05, 'epoch': 0.93} {'loss': 0.7588, 'learning_rate': 1.111622911621037e-05, 'epoch': 0.93} {'loss': 0.802, 'learning_rate': 1.1115903809819293e-05, 'epoch': 0.93} {'loss': 0.8499, 'learning_rate': 1.1115578502232422e-05, 'epoch': 0.93} {'loss': 0.6476, 'learning_rate': 1.1115253193450109e-05, 'epoch': 0.93} {'loss': 0.6872, 'learning_rate': 1.11149278834727e-05, 'epoch': 0.93} {'loss': 0.7708, 'learning_rate': 1.1114602572300551e-05, 'epoch': 0.93} {'loss': 0.7952, 'learning_rate': 1.1114277259933998e-05, 'epoch': 0.93} {'loss': 0.8574, 'learning_rate': 1.11139519463734e-05, 'epoch': 0.93} {'loss': 0.7857, 'learning_rate': 1.1113626631619102e-05, 'epoch': 0.93} {'loss': 0.5992, 'learning_rate': 1.111330131567145e-05, 'epoch': 0.93} {'loss': 0.68, 'learning_rate': 1.1112975998530795e-05, 'epoch': 0.93} {'loss': 0.9943, 'learning_rate': 1.1112650680197485e-05, 'epoch': 0.93} {'loss': 0.7865, 'learning_rate': 1.1112325360671874e-05, 'epoch': 0.93} {'loss': 0.7756, 'learning_rate': 1.1112000039954305e-05, 'epoch': 0.93} {'loss': 0.8413, 'learning_rate': 1.1111674718045126e-05, 'epoch': 0.93} {'loss': 0.6436, 'learning_rate': 1.1111349394944686e-05, 'epoch': 0.93} {'loss': 0.6114, 'learning_rate': 1.1111024070653335e-05, 'epoch': 0.93} {'loss': 0.8751, 'learning_rate': 1.1110698745171423e-05, 'epoch': 0.93} {'loss': 0.717, 'learning_rate': 1.1110373418499297e-05, 'epoch': 0.93} {'loss': 0.6938, 'learning_rate': 1.1110048090637306e-05, 'epoch': 0.93} {'loss': 0.8345, 'learning_rate': 1.11097227615858e-05, 'epoch': 0.93} {'loss': 0.8037, 'learning_rate': 1.110939743134512e-05, 'epoch': 0.93} {'loss': 0.7055, 'learning_rate': 1.1109072099915625e-05, 'epoch': 0.93} {'loss': 0.7091, 'learning_rate': 1.1108746767297658e-05, 'epoch': 0.93} {'loss': 0.7747, 'learning_rate': 1.1108421433491567e-05, 'epoch': 0.93} {'loss': 0.8784, 'learning_rate': 1.1108096098497704e-05, 'epoch': 0.93} {'loss': 0.7868, 'learning_rate': 1.1107770762316419e-05, 'epoch': 0.93} {'loss': 0.8185, 'learning_rate': 1.1107445424948055e-05, 'epoch': 0.93} {'loss': 0.6101, 'learning_rate': 1.1107120086392963e-05, 'epoch': 0.93} {'loss': 0.7738, 'learning_rate': 1.1106794746651493e-05, 'epoch': 0.93} {'loss': 0.8584, 'learning_rate': 1.1106469405723989e-05, 'epoch': 0.93} {'loss': 0.7787, 'learning_rate': 1.1106144063610806e-05, 'epoch': 0.93} {'loss': 0.8865, 'learning_rate': 1.110581872031229e-05, 'epoch': 0.93} {'loss': 0.7681, 'learning_rate': 1.1105493375828788e-05, 'epoch': 0.93} {'loss': 0.7704, 'learning_rate': 1.1105168030160654e-05, 'epoch': 0.93} {'loss': 0.6925, 'learning_rate': 1.110484268330823e-05, 'epoch': 0.93} {'loss': 0.7154, 'learning_rate': 1.1104517335271865e-05, 'epoch': 0.93} {'loss': 0.7854, 'learning_rate': 1.1104191986051913e-05, 'epoch': 0.93} {'loss': 0.787, 'learning_rate': 1.1103866635648719e-05, 'epoch': 0.93} {'loss': 0.9275, 'learning_rate': 1.1103541284062631e-05, 'epoch': 0.93} {'loss': 0.7608, 'learning_rate': 1.1103215931294001e-05, 'epoch': 0.93} {'loss': 0.8247, 'learning_rate': 1.1102890577343175e-05, 'epoch': 0.93} {'loss': 0.6516, 'learning_rate': 1.1102565222210502e-05, 'epoch': 0.93} {'loss': 0.7723, 'learning_rate': 1.1102239865896329e-05, 'epoch': 0.93} {'loss': 0.7152, 'learning_rate': 1.1101914508401007e-05, 'epoch': 0.93} {'loss': 0.7399, 'learning_rate': 1.1101589149724887e-05, 'epoch': 0.93} {'loss': 0.6474, 'learning_rate': 1.1101263789868314e-05, 'epoch': 0.93} {'loss': 0.6818, 'learning_rate': 1.1100938428831637e-05, 'epoch': 0.93} {'loss': 0.7537, 'learning_rate': 1.1100613066615205e-05, 'epoch': 0.93} {'loss': 0.7556, 'learning_rate': 1.1100287703219364e-05, 'epoch': 0.93} {'loss': 0.7129, 'learning_rate': 1.1099962338644468e-05, 'epoch': 0.93} {'loss': 0.6182, 'learning_rate': 1.1099636972890864e-05, 'epoch': 0.93} {'loss': 0.887, 'learning_rate': 1.1099311605958897e-05, 'epoch': 0.93} {'loss': 0.938, 'learning_rate': 1.1098986237848922e-05, 'epoch': 0.93} {'loss': 0.6213, 'learning_rate': 1.1098660868561282e-05, 'epoch': 0.93} {'loss': 0.6133, 'learning_rate': 1.1098335498096326e-05, 'epoch': 0.93} {'loss': 0.653, 'learning_rate': 1.1098010126454406e-05, 'epoch': 0.93} {'loss': 0.6749, 'learning_rate': 1.109768475363587e-05, 'epoch': 0.93} {'loss': 0.6295, 'learning_rate': 1.1097359379641066e-05, 'epoch': 0.93} {'loss': 0.8029, 'learning_rate': 1.109703400447034e-05, 'epoch': 0.93} {'loss': 0.778, 'learning_rate': 1.1096708628124045e-05, 'epoch': 0.93} {'loss': 0.795, 'learning_rate': 1.1096383250602527e-05, 'epoch': 0.93} {'loss': 0.7235, 'learning_rate': 1.1096057871906137e-05, 'epoch': 0.93} {'loss': 0.834, 'learning_rate': 1.1095732492035219e-05, 'epoch': 0.93} {'loss': 0.8717, 'learning_rate': 1.1095407110990127e-05, 'epoch': 0.93} {'loss': 0.8416, 'learning_rate': 1.1095081728771206e-05, 'epoch': 0.93} {'loss': 0.7915, 'learning_rate': 1.1094756345378806e-05, 'epoch': 0.93} {'loss': 0.9092, 'learning_rate': 1.1094430960813276e-05, 'epoch': 0.93} {'loss': 0.7779, 'learning_rate': 1.1094105575074967e-05, 'epoch': 0.93} {'loss': 0.6032, 'learning_rate': 1.1093780188164223e-05, 'epoch': 0.93} {'loss': 0.8042, 'learning_rate': 1.1093454800081397e-05, 'epoch': 0.93} {'loss': 0.7723, 'learning_rate': 1.109312941082683e-05, 'epoch': 0.93} {'loss': 0.855, 'learning_rate': 1.1092804020400881e-05, 'epoch': 0.93} {'loss': 0.8276, 'learning_rate': 1.1092478628803891e-05, 'epoch': 0.93} {'loss': 0.906, 'learning_rate': 1.1092153236036212e-05, 'epoch': 0.93} {'loss': 0.6992, 'learning_rate': 1.1091827842098194e-05, 'epoch': 0.93} {'loss': 0.7863, 'learning_rate': 1.1091502446990185e-05, 'epoch': 0.93} {'loss': 0.8465, 'learning_rate': 1.1091177050712532e-05, 'epoch': 0.93} {'loss': 0.7778, 'learning_rate': 1.1090851653265582e-05, 'epoch': 0.93} {'loss': 0.8353, 'learning_rate': 1.1090526254649686e-05, 'epoch': 0.93} {'loss': 0.8208, 'learning_rate': 1.1090200854865194e-05, 'epoch': 0.93} {'loss': 0.6537, 'learning_rate': 1.1089875453912451e-05, 'epoch': 0.93} {'loss': 0.7482, 'learning_rate': 1.1089550051791814e-05, 'epoch': 0.93} {'loss': 0.8083, 'learning_rate': 1.1089224648503623e-05, 'epoch': 0.93} {'loss': 0.9119, 'learning_rate': 1.1088899244048226e-05, 'epoch': 0.93} {'loss': 0.9285, 'learning_rate': 1.1088573838425978e-05, 'epoch': 0.93} {'loss': 0.9249, 'learning_rate': 1.1088248431637224e-05, 'epoch': 0.93} {'loss': 0.6774, 'learning_rate': 1.1087923023682312e-05, 'epoch': 0.93} {'loss': 0.8204, 'learning_rate': 1.1087597614561596e-05, 'epoch': 0.93} {'loss': 0.7682, 'learning_rate': 1.1087272204275419e-05, 'epoch': 0.93} {'loss': 0.8815, 'learning_rate': 1.1086946792824134e-05, 'epoch': 0.93} {'loss': 0.9248, 'learning_rate': 1.1086621380208085e-05, 'epoch': 0.93} {'loss': 0.6558, 'learning_rate': 1.1086295966427622e-05, 'epoch': 0.93} {'loss': 0.6532, 'learning_rate': 1.1085970551483096e-05, 'epoch': 0.93} {'loss': 0.8061, 'learning_rate': 1.1085645135374856e-05, 'epoch': 0.93} {'loss': 0.8276, 'learning_rate': 1.108531971810325e-05, 'epoch': 0.93} {'loss': 0.8463, 'learning_rate': 1.1084994299668625e-05, 'epoch': 0.93} {'loss': 0.8103, 'learning_rate': 1.108466888007133e-05, 'epoch': 0.93} {'loss': 0.8132, 'learning_rate': 1.1084343459311712e-05, 'epoch': 0.93} {'loss': 0.7431, 'learning_rate': 1.1084018037390125e-05, 'epoch': 0.93} {'loss': 0.8836, 'learning_rate': 1.1083692614306913e-05, 'epoch': 0.93} {'loss': 0.9051, 'learning_rate': 1.108336719006243e-05, 'epoch': 0.93} {'loss': 0.7627, 'learning_rate': 1.1083041764657019e-05, 'epoch': 0.93} {'loss': 0.7717, 'learning_rate': 1.1082716338091033e-05, 'epoch': 0.93} {'loss': 0.7388, 'learning_rate': 1.1082390910364815e-05, 'epoch': 0.93} {'loss': 0.7792, 'learning_rate': 1.1082065481478719e-05, 'epoch': 0.93} {'loss': 0.7275, 'learning_rate': 1.1081740051433091e-05, 'epoch': 0.93} {'loss': 0.8005, 'learning_rate': 1.1081414620228282e-05, 'epoch': 0.93} {'loss': 0.8862, 'learning_rate': 1.1081089187864641e-05, 'epoch': 0.93} {'loss': 0.7074, 'learning_rate': 1.1080763754342514e-05, 'epoch': 0.93} {'loss': 0.852, 'learning_rate': 1.1080438319662252e-05, 'epoch': 0.93} {'loss': 0.7546, 'learning_rate': 1.1080112883824203e-05, 'epoch': 0.93} {'loss': 0.9795, 'learning_rate': 1.1079787446828714e-05, 'epoch': 0.93} {'loss': 0.758, 'learning_rate': 1.1079462008676135e-05, 'epoch': 0.93} {'loss': 0.7799, 'learning_rate': 1.1079136569366818e-05, 'epoch': 0.93} {'loss': 0.8321, 'learning_rate': 1.1078811128901106e-05, 'epoch': 0.93} {'loss': 0.6739, 'learning_rate': 1.1078485687279352e-05, 'epoch': 0.93} {'loss': 0.632, 'learning_rate': 1.1078160244501904e-05, 'epoch': 0.93} {'loss': 0.9145, 'learning_rate': 1.1077834800569108e-05, 'epoch': 0.93} {'loss': 0.8309, 'learning_rate': 1.1077509355481315e-05, 'epoch': 0.93} {'loss': 0.6399, 'learning_rate': 1.1077183909238876e-05, 'epoch': 0.93} {'loss': 0.8846, 'learning_rate': 1.1076858461842133e-05, 'epoch': 0.93} {'loss': 0.7578, 'learning_rate': 1.107653301329144e-05, 'epoch': 0.93} {'loss': 0.7812, 'learning_rate': 1.1076207563587144e-05, 'epoch': 0.93} {'loss': 0.8507, 'learning_rate': 1.1075882112729598e-05, 'epoch': 0.93} {'loss': 0.6073, 'learning_rate': 1.1075556660719147e-05, 'epoch': 0.93} {'loss': 0.8187, 'learning_rate': 1.1075231207556137e-05, 'epoch': 0.93} {'loss': 0.7329, 'learning_rate': 1.1074905753240923e-05, 'epoch': 0.93} {'loss': 0.6155, 'learning_rate': 1.1074580297773847e-05, 'epoch': 0.93} {'loss': 0.7794, 'learning_rate': 1.1074254841155263e-05, 'epoch': 0.93} {'loss': 0.81, 'learning_rate': 1.1073929383385518e-05, 'epoch': 0.93} {'loss': 0.7223, 'learning_rate': 1.1073603924464959e-05, 'epoch': 0.93} {'loss': 0.8288, 'learning_rate': 1.1073278464393939e-05, 'epoch': 0.93} {'loss': 0.6776, 'learning_rate': 1.1072953003172804e-05, 'epoch': 0.93} {'loss': 0.6955, 'learning_rate': 1.10726275408019e-05, 'epoch': 0.93} {'loss': 0.7255, 'learning_rate': 1.1072302077281583e-05, 'epoch': 0.93} {'loss': 0.8524, 'learning_rate': 1.1071976612612194e-05, 'epoch': 0.93} {'loss': 0.6038, 'learning_rate': 1.107165114679409e-05, 'epoch': 0.93} {'loss': 0.77, 'learning_rate': 1.1071325679827612e-05, 'epoch': 0.93} {'loss': 0.677, 'learning_rate': 1.1071000211713112e-05, 'epoch': 0.94} {'loss': 0.6882, 'learning_rate': 1.1070674742450937e-05, 'epoch': 0.94} {'loss': 0.5736, 'learning_rate': 1.1070349272041438e-05, 'epoch': 0.94} {'loss': 0.7784, 'learning_rate': 1.1070023800484963e-05, 'epoch': 0.94} {'loss': 0.5998, 'learning_rate': 1.1069698327781862e-05, 'epoch': 0.94} {'loss': 0.635, 'learning_rate': 1.1069372853932486e-05, 'epoch': 0.94} {'loss': 0.7595, 'learning_rate': 1.1069047378937176e-05, 'epoch': 0.94} {'loss': 0.7367, 'learning_rate': 1.1068721902796286e-05, 'epoch': 0.94} {'loss': 0.7294, 'learning_rate': 1.1068396425510164e-05, 'epoch': 0.94} {'loss': 0.8108, 'learning_rate': 1.106807094707916e-05, 'epoch': 0.94} {'loss': 0.9383, 'learning_rate': 1.1067745467503618e-05, 'epoch': 0.94} {'loss': 0.7726, 'learning_rate': 1.1067419986783894e-05, 'epoch': 0.94} {'loss': 0.9939, 'learning_rate': 1.1067094504920332e-05, 'epoch': 0.94} {'loss': 0.8575, 'learning_rate': 1.1066769021913283e-05, 'epoch': 0.94} {'loss': 0.8417, 'learning_rate': 1.1066443537763094e-05, 'epoch': 0.94} {'loss': 0.7672, 'learning_rate': 1.1066118052470115e-05, 'epoch': 0.94} {'loss': 0.7191, 'learning_rate': 1.1065792566034691e-05, 'epoch': 0.94} {'loss': 0.6451, 'learning_rate': 1.1065467078457178e-05, 'epoch': 0.94} {'loss': 0.7184, 'learning_rate': 1.1065141589737918e-05, 'epoch': 0.94} {'loss': 0.5796, 'learning_rate': 1.1064816099877267e-05, 'epoch': 0.94} {'loss': 0.6389, 'learning_rate': 1.1064490608875566e-05, 'epoch': 0.94} {'loss': 0.7637, 'learning_rate': 1.1064165116733167e-05, 'epoch': 0.94} {'loss': 0.9663, 'learning_rate': 1.1063839623450421e-05, 'epoch': 0.94} {'loss': 0.7614, 'learning_rate': 1.1063514129027673e-05, 'epoch': 0.94} {'loss': 0.6248, 'learning_rate': 1.1063188633465273e-05, 'epoch': 0.94} {'loss': 0.6989, 'learning_rate': 1.1062863136763574e-05, 'epoch': 0.94} {'loss': 0.798, 'learning_rate': 1.106253763892292e-05, 'epoch': 0.94} {'loss': 0.7937, 'learning_rate': 1.106221213994366e-05, 'epoch': 0.94} {'loss': 0.9977, 'learning_rate': 1.1061886639826142e-05, 'epoch': 0.94} {'loss': 0.8615, 'learning_rate': 1.1061561138570718e-05, 'epoch': 0.94} {'loss': 0.7907, 'learning_rate': 1.1061235636177736e-05, 'epoch': 0.94} {'loss': 0.9818, 'learning_rate': 1.1060910132647545e-05, 'epoch': 0.94} {'loss': 0.7884, 'learning_rate': 1.1060584627980493e-05, 'epoch': 0.94} {'loss': 0.8604, 'learning_rate': 1.1060259122176928e-05, 'epoch': 0.94} {'loss': 0.7518, 'learning_rate': 1.10599336152372e-05, 'epoch': 0.94} {'loss': 0.7595, 'learning_rate': 1.1059608107161657e-05, 'epoch': 0.94} {'loss': 0.8818, 'learning_rate': 1.1059282597950648e-05, 'epoch': 0.94} {'loss': 0.7562, 'learning_rate': 1.105895708760452e-05, 'epoch': 0.94} {'loss': 0.7896, 'learning_rate': 1.105863157612363e-05, 'epoch': 0.94} {'loss': 0.8961, 'learning_rate': 1.1058306063508315e-05, 'epoch': 0.94} {'loss': 0.8846, 'learning_rate': 1.1057980549758933e-05, 'epoch': 0.94} {'loss': 0.7514, 'learning_rate': 1.1057655034875827e-05, 'epoch': 0.94} {'loss': 0.9603, 'learning_rate': 1.105732951885935e-05, 'epoch': 0.94} {'loss': 0.6967, 'learning_rate': 1.1057004001709848e-05, 'epoch': 0.94} {'loss': 0.7771, 'learning_rate': 1.1056678483427672e-05, 'epoch': 0.94} {'loss': 0.7466, 'learning_rate': 1.1056352964013168e-05, 'epoch': 0.94} {'loss': 0.8135, 'learning_rate': 1.1056027443466686e-05, 'epoch': 0.94} {'loss': 0.7956, 'learning_rate': 1.1055701921788578e-05, 'epoch': 0.94} {'loss': 0.7683, 'learning_rate': 1.1055376398979188e-05, 'epoch': 0.94} {'loss': 0.7646, 'learning_rate': 1.1055050875038867e-05, 'epoch': 0.94} {'loss': 0.9434, 'learning_rate': 1.1054725349967965e-05, 'epoch': 0.94} {'loss': 0.6834, 'learning_rate': 1.1054399823766829e-05, 'epoch': 0.94} {'loss': 0.7432, 'learning_rate': 1.1054074296435806e-05, 'epoch': 0.94} {'loss': 0.9474, 'learning_rate': 1.105374876797525e-05, 'epoch': 0.94} {'loss': 0.7841, 'learning_rate': 1.1053423238385508e-05, 'epoch': 0.94} {'loss': 0.8305, 'learning_rate': 1.1053097707666926e-05, 'epoch': 0.94} {'loss': 0.8568, 'learning_rate': 1.1052772175819854e-05, 'epoch': 0.94} {'loss': 0.714, 'learning_rate': 1.1052446642844646e-05, 'epoch': 0.94} {'loss': 0.8464, 'learning_rate': 1.105212110874164e-05, 'epoch': 0.94} {'loss': 0.741, 'learning_rate': 1.1051795573511195e-05, 'epoch': 0.94} {'loss': 0.685, 'learning_rate': 1.1051470037153656e-05, 'epoch': 0.94} {'loss': 0.7855, 'learning_rate': 1.1051144499669373e-05, 'epoch': 0.94} {'loss': 0.7181, 'learning_rate': 1.1050818961058692e-05, 'epoch': 0.94} {'loss': 0.6011, 'learning_rate': 1.1050493421321963e-05, 'epoch': 0.94} {'loss': 0.906, 'learning_rate': 1.1050167880459537e-05, 'epoch': 0.94} {'loss': 0.6478, 'learning_rate': 1.104984233847176e-05, 'epoch': 0.94} {'loss': 0.7646, 'learning_rate': 1.1049516795358983e-05, 'epoch': 0.94} {'loss': 0.888, 'learning_rate': 1.1049191251121557e-05, 'epoch': 0.94} {'loss': 0.8021, 'learning_rate': 1.1048865705759821e-05, 'epoch': 0.94} {'loss': 0.8117, 'learning_rate': 1.1048540159274138e-05, 'epoch': 0.94} {'loss': 0.7619, 'learning_rate': 1.1048214611664845e-05, 'epoch': 0.94} {'loss': 0.7255, 'learning_rate': 1.1047889062932296e-05, 'epoch': 0.94} {'loss': 0.7027, 'learning_rate': 1.104756351307684e-05, 'epoch': 0.94} {'loss': 0.8901, 'learning_rate': 1.1047237962098825e-05, 'epoch': 0.94} {'loss': 0.8523, 'learning_rate': 1.10469124099986e-05, 'epoch': 0.94} {'loss': 0.8398, 'learning_rate': 1.1046586856776513e-05, 'epoch': 0.94} {'loss': 0.7715, 'learning_rate': 1.1046261302432917e-05, 'epoch': 0.94} {'loss': 0.7527, 'learning_rate': 1.1045935746968156e-05, 'epoch': 0.94} {'loss': 0.6762, 'learning_rate': 1.1045610190382578e-05, 'epoch': 0.94} {'loss': 0.7377, 'learning_rate': 1.1045284632676535e-05, 'epoch': 0.94} {'loss': 0.957, 'learning_rate': 1.1044959073850376e-05, 'epoch': 0.94} {'loss': 0.7713, 'learning_rate': 1.104463351390445e-05, 'epoch': 0.94} {'loss': 0.6287, 'learning_rate': 1.1044307952839107e-05, 'epoch': 0.94} {'loss': 0.7957, 'learning_rate': 1.104398239065469e-05, 'epoch': 0.94} {'loss': 0.7501, 'learning_rate': 1.1043656827351553e-05, 'epoch': 0.94} {'loss': 0.9865, 'learning_rate': 1.1043331262930041e-05, 'epoch': 0.94} {'loss': 0.8374, 'learning_rate': 1.1043005697390507e-05, 'epoch': 0.94} {'loss': 0.8969, 'learning_rate': 1.1042680130733298e-05, 'epoch': 0.94} {'loss': 1.0131, 'learning_rate': 1.1042354562958766e-05, 'epoch': 0.94} {'loss': 0.892, 'learning_rate': 1.1042028994067256e-05, 'epoch': 0.94} {'loss': 0.7614, 'learning_rate': 1.1041703424059116e-05, 'epoch': 0.94} {'loss': 0.7187, 'learning_rate': 1.1041377852934696e-05, 'epoch': 0.94} {'loss': 0.7707, 'learning_rate': 1.1041052280694347e-05, 'epoch': 0.94} {'loss': 0.7663, 'learning_rate': 1.1040726707338416e-05, 'epoch': 0.94} {'loss': 0.8129, 'learning_rate': 1.1040401132867256e-05, 'epoch': 0.94} {'loss': 0.7582, 'learning_rate': 1.1040075557281207e-05, 'epoch': 0.94} {'loss': 0.713, 'learning_rate': 1.1039749980580627e-05, 'epoch': 0.94} {'loss': 0.7294, 'learning_rate': 1.103942440276586e-05, 'epoch': 0.94} {'loss': 0.8675, 'learning_rate': 1.1039098823837255e-05, 'epoch': 0.94} {'loss': 0.8317, 'learning_rate': 1.1038773243795162e-05, 'epoch': 0.94} {'loss': 0.942, 'learning_rate': 1.1038447662639929e-05, 'epoch': 0.94} {'loss': 0.7174, 'learning_rate': 1.1038122080371907e-05, 'epoch': 0.94} {'loss': 0.5962, 'learning_rate': 1.1037796496991444e-05, 'epoch': 0.94} {'loss': 0.8688, 'learning_rate': 1.1037470912498889e-05, 'epoch': 0.94} {'loss': 0.7643, 'learning_rate': 1.1037145326894588e-05, 'epoch': 0.94} {'loss': 0.804, 'learning_rate': 1.1036819740178892e-05, 'epoch': 0.94} {'loss': 0.7321, 'learning_rate': 1.103649415235215e-05, 'epoch': 0.94} {'loss': 0.8242, 'learning_rate': 1.1036168563414712e-05, 'epoch': 0.94} {'loss': 0.7377, 'learning_rate': 1.1035842973366929e-05, 'epoch': 0.94} {'loss': 0.9368, 'learning_rate': 1.1035517382209145e-05, 'epoch': 0.94} {'loss': 0.6196, 'learning_rate': 1.1035191789941706e-05, 'epoch': 0.94} {'loss': 0.6701, 'learning_rate': 1.1034866196564968e-05, 'epoch': 0.94} {'loss': 0.7964, 'learning_rate': 1.103454060207928e-05, 'epoch': 0.94} {'loss': 0.7169, 'learning_rate': 1.1034215006484987e-05, 'epoch': 0.94} {'loss': 0.7754, 'learning_rate': 1.1033889409782439e-05, 'epoch': 0.94} {'loss': 0.6305, 'learning_rate': 1.1033563811971983e-05, 'epoch': 0.94} {'loss': 0.7752, 'learning_rate': 1.1033238213053976e-05, 'epoch': 0.94} {'loss': 0.8262, 'learning_rate': 1.1032912613028757e-05, 'epoch': 0.94} {'loss': 0.8069, 'learning_rate': 1.1032587011896679e-05, 'epoch': 0.94} {'loss': 0.7881, 'learning_rate': 1.1032261409658089e-05, 'epoch': 0.94} {'loss': 0.8038, 'learning_rate': 1.103193580631334e-05, 'epoch': 0.94} {'loss': 0.7089, 'learning_rate': 1.103161020186278e-05, 'epoch': 0.94} {'loss': 0.8548, 'learning_rate': 1.1031284596306753e-05, 'epoch': 0.94} {'loss': 0.8054, 'learning_rate': 1.1030958989645615e-05, 'epoch': 0.94} {'loss': 0.8538, 'learning_rate': 1.103063338187971e-05, 'epoch': 0.94} {'loss': 0.7032, 'learning_rate': 1.1030307773009387e-05, 'epoch': 0.94} {'loss': 0.7701, 'learning_rate': 1.1029982163034998e-05, 'epoch': 0.94} {'loss': 0.6568, 'learning_rate': 1.1029656551956889e-05, 'epoch': 0.94} {'loss': 0.8573, 'learning_rate': 1.1029330939775411e-05, 'epoch': 0.94} {'loss': 0.7769, 'learning_rate': 1.1029005326490909e-05, 'epoch': 0.94} {'loss': 0.6382, 'learning_rate': 1.102867971210374e-05, 'epoch': 0.94} {'loss': 0.9302, 'learning_rate': 1.1028354096614245e-05, 'epoch': 0.94} {'loss': 0.7369, 'learning_rate': 1.1028028480022777e-05, 'epoch': 0.94} {'loss': 0.9683, 'learning_rate': 1.1027702862329683e-05, 'epoch': 0.94} {'loss': 0.8452, 'learning_rate': 1.102737724353531e-05, 'epoch': 0.94} {'loss': 0.9323, 'learning_rate': 1.1027051623640012e-05, 'epoch': 0.94} {'loss': 0.8549, 'learning_rate': 1.1026726002644135e-05, 'epoch': 0.94} {'loss': 0.569, 'learning_rate': 1.102640038054803e-05, 'epoch': 0.94} {'loss': 0.916, 'learning_rate': 1.1026074757352045e-05, 'epoch': 0.94} {'loss': 0.9273, 'learning_rate': 1.1025749133056527e-05, 'epoch': 0.94} {'loss': 0.6872, 'learning_rate': 1.1025423507661825e-05, 'epoch': 0.94} {'loss': 0.7402, 'learning_rate': 1.102509788116829e-05, 'epoch': 0.94} {'loss': 0.8231, 'learning_rate': 1.1024772253576269e-05, 'epoch': 0.94} {'loss': 0.8343, 'learning_rate': 1.1024446624886114e-05, 'epoch': 0.94} {'loss': 0.7854, 'learning_rate': 1.102412099509817e-05, 'epoch': 0.94} {'loss': 0.6187, 'learning_rate': 1.102379536421279e-05, 'epoch': 0.94} {'loss': 0.7206, 'learning_rate': 1.102346973223032e-05, 'epoch': 0.94} {'loss': 0.8782, 'learning_rate': 1.1023144099151109e-05, 'epoch': 0.94} {'loss': 0.7819, 'learning_rate': 1.1022818464975507e-05, 'epoch': 0.94} {'loss': 0.7428, 'learning_rate': 1.1022492829703864e-05, 'epoch': 0.94} {'loss': 0.6486, 'learning_rate': 1.1022167193336526e-05, 'epoch': 0.94} {'loss': 0.7212, 'learning_rate': 1.1021841555873846e-05, 'epoch': 0.94} {'loss': 0.567, 'learning_rate': 1.1021515917316167e-05, 'epoch': 0.94} {'loss': 0.765, 'learning_rate': 1.1021190277663844e-05, 'epoch': 0.94} {'loss': 0.6414, 'learning_rate': 1.1020864636917224e-05, 'epoch': 0.94} {'loss': 0.9447, 'learning_rate': 1.1020538995076652e-05, 'epoch': 0.94} {'loss': 0.7754, 'learning_rate': 1.1020213352142481e-05, 'epoch': 0.94} {'loss': 0.7421, 'learning_rate': 1.1019887708115065e-05, 'epoch': 0.94} {'loss': 0.9667, 'learning_rate': 1.1019562062994745e-05, 'epoch': 0.94} {'loss': 0.789, 'learning_rate': 1.1019236416781868e-05, 'epoch': 0.94} {'loss': 0.7761, 'learning_rate': 1.1018910769476789e-05, 'epoch': 0.94} {'loss': 0.711, 'learning_rate': 1.1018585121079855e-05, 'epoch': 0.94} {'loss': 0.6639, 'learning_rate': 1.1018259471591415e-05, 'epoch': 0.94} {'loss': 0.7124, 'learning_rate': 1.101793382101182e-05, 'epoch': 0.94} {'loss': 0.7616, 'learning_rate': 1.1017608169341417e-05, 'epoch': 0.94} {'loss': 0.6571, 'learning_rate': 1.1017282516580554e-05, 'epoch': 0.94} {'loss': 0.7591, 'learning_rate': 1.101695686272958e-05, 'epoch': 0.94} {'loss': 0.797, 'learning_rate': 1.1016631207788846e-05, 'epoch': 0.94} {'loss': 0.7337, 'learning_rate': 1.1016305551758699e-05, 'epoch': 0.94} {'loss': 0.7132, 'learning_rate': 1.101597989463949e-05, 'epoch': 0.94} {'loss': 0.8052, 'learning_rate': 1.1015654236431567e-05, 'epoch': 0.94} {'loss': 0.7631, 'learning_rate': 1.1015328577135278e-05, 'epoch': 0.94} {'loss': 0.6927, 'learning_rate': 1.1015002916750975e-05, 'epoch': 0.94} {'loss': 0.7973, 'learning_rate': 1.1014677255279003e-05, 'epoch': 0.94} {'loss': 0.8206, 'learning_rate': 1.101435159271971e-05, 'epoch': 0.94} {'loss': 0.715, 'learning_rate': 1.1014025929073452e-05, 'epoch': 0.94} {'loss': 0.7188, 'learning_rate': 1.1013700264340573e-05, 'epoch': 0.94} {'loss': 0.8592, 'learning_rate': 1.101337459852142e-05, 'epoch': 0.94} {'loss': 0.6909, 'learning_rate': 1.1013048931616345e-05, 'epoch': 0.94} {'loss': 0.6613, 'learning_rate': 1.10127232636257e-05, 'epoch': 0.94} {'loss': 0.7527, 'learning_rate': 1.1012397594549829e-05, 'epoch': 0.94} {'loss': 0.8181, 'learning_rate': 1.1012071924389081e-05, 'epoch': 0.94} {'loss': 0.8042, 'learning_rate': 1.1011746253143808e-05, 'epoch': 0.94} {'loss': 0.6518, 'learning_rate': 1.1011420580814358e-05, 'epoch': 0.94} {'loss': 0.794, 'learning_rate': 1.101109490740108e-05, 'epoch': 0.94} {'loss': 0.7933, 'learning_rate': 1.1010769232904321e-05, 'epoch': 0.94} {'loss': 0.6417, 'learning_rate': 1.1010443557324431e-05, 'epoch': 0.94} {'loss': 0.8907, 'learning_rate': 1.101011788066176e-05, 'epoch': 0.94} {'loss': 0.8612, 'learning_rate': 1.1009792202916655e-05, 'epoch': 0.94} {'loss': 0.7228, 'learning_rate': 1.1009466524089472e-05, 'epoch': 0.94} {'loss': 0.7422, 'learning_rate': 1.100914084418055e-05, 'epoch': 0.94} {'loss': 0.812, 'learning_rate': 1.1008815163190243e-05, 'epoch': 0.94} {'loss': 0.7546, 'learning_rate': 1.1008489481118903e-05, 'epoch': 0.94} {'loss': 0.8692, 'learning_rate': 1.1008163797966871e-05, 'epoch': 0.94} {'loss': 0.9364, 'learning_rate': 1.10078381137345e-05, 'epoch': 0.94} {'loss': 0.7202, 'learning_rate': 1.1007512428422145e-05, 'epoch': 0.94} {'loss': 0.6976, 'learning_rate': 1.1007186742030144e-05, 'epoch': 0.94} {'loss': 0.5769, 'learning_rate': 1.1006861054558852e-05, 'epoch': 0.94} {'loss': 0.8268, 'learning_rate': 1.100653536600862e-05, 'epoch': 0.94} {'loss': 0.5406, 'learning_rate': 1.1006209676379796e-05, 'epoch': 0.94} {'loss': 0.7939, 'learning_rate': 1.1005883985672723e-05, 'epoch': 0.94} {'loss': 0.9098, 'learning_rate': 1.100555829388776e-05, 'epoch': 0.94} {'loss': 0.9169, 'learning_rate': 1.1005232601025247e-05, 'epoch': 0.94} {'loss': 0.8036, 'learning_rate': 1.1004906907085535e-05, 'epoch': 0.94} {'loss': 0.8063, 'learning_rate': 1.1004581212068974e-05, 'epoch': 0.94} {'loss': 0.8464, 'learning_rate': 1.1004255515975916e-05, 'epoch': 0.94} {'loss': 0.8303, 'learning_rate': 1.1003929818806708e-05, 'epoch': 0.94} {'loss': 0.8203, 'learning_rate': 1.10036041205617e-05, 'epoch': 0.94} {'loss': 0.705, 'learning_rate': 1.1003278421241236e-05, 'epoch': 0.94} {'loss': 0.7217, 'learning_rate': 1.1002952720845672e-05, 'epoch': 0.94} {'loss': 0.7135, 'learning_rate': 1.1002627019375351e-05, 'epoch': 0.94} {'loss': 0.8143, 'learning_rate': 1.1002301316830623e-05, 'epoch': 0.94} {'loss': 0.7368, 'learning_rate': 1.1001975613211842e-05, 'epoch': 0.94} {'loss': 0.8806, 'learning_rate': 1.1001649908519354e-05, 'epoch': 0.94} {'loss': 0.6866, 'learning_rate': 1.1001324202753509e-05, 'epoch': 0.94} {'loss': 0.6706, 'learning_rate': 1.1000998495914653e-05, 'epoch': 0.94} {'loss': 0.6924, 'learning_rate': 1.1000672788003133e-05, 'epoch': 0.94} {'loss': 0.6917, 'learning_rate': 1.1000347079019304e-05, 'epoch': 0.94} {'loss': 0.5874, 'learning_rate': 1.1000021368963514e-05, 'epoch': 0.94} {'loss': 0.7067, 'learning_rate': 1.099969565783611e-05, 'epoch': 0.94} {'loss': 0.7872, 'learning_rate': 1.0999369945637444e-05, 'epoch': 0.94} {'loss': 0.8508, 'learning_rate': 1.0999044232367864e-05, 'epoch': 0.94} {'loss': 0.8093, 'learning_rate': 1.0998718518027713e-05, 'epoch': 0.94} {'loss': 0.7877, 'learning_rate': 1.0998392802617346e-05, 'epoch': 0.94} {'loss': 0.8096, 'learning_rate': 1.0998067086137112e-05, 'epoch': 0.94} {'loss': 0.7837, 'learning_rate': 1.099774136858736e-05, 'epoch': 0.94} {'loss': 0.8464, 'learning_rate': 1.0997415649968437e-05, 'epoch': 0.94} {'loss': 0.6222, 'learning_rate': 1.0997089930280694e-05, 'epoch': 0.94} {'loss': 0.6748, 'learning_rate': 1.099676420952448e-05, 'epoch': 0.94} {'loss': 0.778, 'learning_rate': 1.099643848770014e-05, 'epoch': 0.94} {'loss': 0.6643, 'learning_rate': 1.099611276480803e-05, 'epoch': 0.94} {'loss': 0.7244, 'learning_rate': 1.0995787040848491e-05, 'epoch': 0.94} {'loss': 0.8747, 'learning_rate': 1.0995461315821877e-05, 'epoch': 0.94} {'loss': 0.7003, 'learning_rate': 1.0995135589728541e-05, 'epoch': 0.94} {'loss': 0.7322, 'learning_rate': 1.0994809862568826e-05, 'epoch': 0.94} {'loss': 0.687, 'learning_rate': 1.099448413434308e-05, 'epoch': 0.94} {'loss': 0.8905, 'learning_rate': 1.0994158405051654e-05, 'epoch': 0.94} {'loss': 0.7807, 'learning_rate': 1.0993832674694898e-05, 'epoch': 0.94} {'loss': 0.6963, 'learning_rate': 1.099350694327316e-05, 'epoch': 0.94} {'loss': 0.8311, 'learning_rate': 1.0993181210786795e-05, 'epoch': 0.94} {'loss': 0.8889, 'learning_rate': 1.0992855477236141e-05, 'epoch': 0.94} {'loss': 0.736, 'learning_rate': 1.0992529742621555e-05, 'epoch': 0.94} {'loss': 0.7441, 'learning_rate': 1.0992204006943384e-05, 'epoch': 0.94} {'loss': 0.7923, 'learning_rate': 1.0991878270201974e-05, 'epoch': 0.94} {'loss': 0.6904, 'learning_rate': 1.099155253239768e-05, 'epoch': 0.94} {'loss': 0.7156, 'learning_rate': 1.099122679353085e-05, 'epoch': 0.94} {'loss': 0.9814, 'learning_rate': 1.0990901053601825e-05, 'epoch': 0.94} {'loss': 0.8112, 'learning_rate': 1.0990575312610963e-05, 'epoch': 0.94} {'loss': 0.8035, 'learning_rate': 1.0990249570558611e-05, 'epoch': 0.94} {'loss': 0.8053, 'learning_rate': 1.0989923827445116e-05, 'epoch': 0.94} {'loss': 0.7285, 'learning_rate': 1.098959808327083e-05, 'epoch': 0.94} {'loss': 0.7497, 'learning_rate': 1.0989272338036097e-05, 'epoch': 0.94} {'loss': 0.8843, 'learning_rate': 1.0988946591741274e-05, 'epoch': 0.94} {'loss': 0.8759, 'learning_rate': 1.0988620844386701e-05, 'epoch': 0.94} {'loss': 0.7044, 'learning_rate': 1.0988295095972733e-05, 'epoch': 0.94} {'loss': 0.9869, 'learning_rate': 1.098796934649972e-05, 'epoch': 0.94} {'loss': 0.7847, 'learning_rate': 1.0987643595968007e-05, 'epoch': 0.94} {'loss': 0.6507, 'learning_rate': 1.0987317844377943e-05, 'epoch': 0.94} {'loss': 0.614, 'learning_rate': 1.0986992091729882e-05, 'epoch': 0.94} {'loss': 1.0916, 'learning_rate': 1.0986666338024167e-05, 'epoch': 0.94} {'loss': 0.8894, 'learning_rate': 1.0986340583261153e-05, 'epoch': 0.94} {'loss': 0.9334, 'learning_rate': 1.0986014827441183e-05, 'epoch': 0.94} {'loss': 0.7574, 'learning_rate': 1.0985689070564611e-05, 'epoch': 0.94} {'loss': 0.7433, 'learning_rate': 1.0985363312631782e-05, 'epoch': 0.94} {'loss': 0.6173, 'learning_rate': 1.0985037553643052e-05, 'epoch': 0.94} {'loss': 0.8083, 'learning_rate': 1.0984711793598762e-05, 'epoch': 0.94} {'loss': 0.6865, 'learning_rate': 1.0984386032499263e-05, 'epoch': 0.94} {'loss': 0.8614, 'learning_rate': 1.0984060270344908e-05, 'epoch': 0.94} {'loss': 0.724, 'learning_rate': 1.0983734507136043e-05, 'epoch': 0.94} {'loss': 0.7555, 'learning_rate': 1.0983408742873017e-05, 'epoch': 0.94} {'loss': 0.8409, 'learning_rate': 1.0983082977556182e-05, 'epoch': 0.94} {'loss': 0.8016, 'learning_rate': 1.0982757211185881e-05, 'epoch': 0.94} {'loss': 0.8988, 'learning_rate': 1.0982431443762468e-05, 'epoch': 0.94} {'loss': 0.5656, 'learning_rate': 1.0982105675286292e-05, 'epoch': 0.94} {'loss': 0.6297, 'learning_rate': 1.09817799057577e-05, 'epoch': 0.94} {'loss': 0.7584, 'learning_rate': 1.0981454135177045e-05, 'epoch': 0.94} {'loss': 0.785, 'learning_rate': 1.0981128363544673e-05, 'epoch': 0.94} {'loss': 0.7327, 'learning_rate': 1.0980802590860933e-05, 'epoch': 0.94} {'loss': 0.9124, 'learning_rate': 1.0980476817126173e-05, 'epoch': 0.94} {'loss': 0.6852, 'learning_rate': 1.0980151042340744e-05, 'epoch': 0.94} {'loss': 0.686, 'learning_rate': 1.0979825266504993e-05, 'epoch': 0.94} {'loss': 0.8035, 'learning_rate': 1.0979499489619272e-05, 'epoch': 0.94} {'loss': 0.8826, 'learning_rate': 1.0979173711683932e-05, 'epoch': 0.94} {'loss': 0.7281, 'learning_rate': 1.097884793269932e-05, 'epoch': 0.94} {'loss': 0.6837, 'learning_rate': 1.0978522152665778e-05, 'epoch': 0.94} {'loss': 0.8294, 'learning_rate': 1.0978196371583662e-05, 'epoch': 0.94} {'loss': 0.7186, 'learning_rate': 1.0977870589453323e-05, 'epoch': 0.94} {'loss': 0.8387, 'learning_rate': 1.0977544806275107e-05, 'epoch': 0.94} {'loss': 0.8763, 'learning_rate': 1.0977219022049361e-05, 'epoch': 0.94} {'loss': 0.8211, 'learning_rate': 1.097689323677644e-05, 'epoch': 0.94} {'loss': 0.9595, 'learning_rate': 1.097656745045669e-05, 'epoch': 0.94} {'loss': 0.7599, 'learning_rate': 1.0976241663090458e-05, 'epoch': 0.94} {'loss': 0.7073, 'learning_rate': 1.0975915874678096e-05, 'epoch': 0.94} {'loss': 0.7121, 'learning_rate': 1.0975590085219949e-05, 'epoch': 0.94} {'loss': 0.8197, 'learning_rate': 1.0975264294716372e-05, 'epoch': 0.94} {'loss': 0.6122, 'learning_rate': 1.097493850316771e-05, 'epoch': 0.94} {'loss': 0.8592, 'learning_rate': 1.0974612710574314e-05, 'epoch': 0.94} {'loss': 0.7943, 'learning_rate': 1.0974286916936536e-05, 'epoch': 0.94} {'loss': 0.6605, 'learning_rate': 1.0973961122254717e-05, 'epoch': 0.94} {'loss': 0.9097, 'learning_rate': 1.097363532652921e-05, 'epoch': 0.94} {'loss': 0.6504, 'learning_rate': 1.0973309529760367e-05, 'epoch': 0.94} {'loss': 0.7863, 'learning_rate': 1.0972983731948534e-05, 'epoch': 0.94} {'loss': 0.6927, 'learning_rate': 1.0972657933094064e-05, 'epoch': 0.94} {'loss': 0.8845, 'learning_rate': 1.09723321331973e-05, 'epoch': 0.94} {'loss': 0.7545, 'learning_rate': 1.0972006332258598e-05, 'epoch': 0.94} {'loss': 0.8868, 'learning_rate': 1.0971680530278301e-05, 'epoch': 0.94} {'loss': 0.7387, 'learning_rate': 1.097135472725676e-05, 'epoch': 0.94} {'loss': 0.741, 'learning_rate': 1.0971028923194325e-05, 'epoch': 0.94} {'loss': 0.7611, 'learning_rate': 1.0970703118091346e-05, 'epoch': 0.94} {'loss': 0.8695, 'learning_rate': 1.097037731194817e-05, 'epoch': 0.94} {'loss': 0.6871, 'learning_rate': 1.0970051504765149e-05, 'epoch': 0.94} {'loss': 0.6911, 'learning_rate': 1.0969725696542627e-05, 'epoch': 0.94} {'loss': 0.8959, 'learning_rate': 1.0969399887280959e-05, 'epoch': 0.94} {'loss': 0.8534, 'learning_rate': 1.096907407698049e-05, 'epoch': 0.94} {'loss': 0.795, 'learning_rate': 1.0968748265641574e-05, 'epoch': 0.94} {'loss': 0.8906, 'learning_rate': 1.0968422453264554e-05, 'epoch': 0.94} {'loss': 0.7341, 'learning_rate': 1.096809663984978e-05, 'epoch': 0.94} {'loss': 1.0143, 'learning_rate': 1.0967770825397608e-05, 'epoch': 0.94} {'loss': 0.9468, 'learning_rate': 1.0967445009908377e-05, 'epoch': 0.94} {'loss': 0.7721, 'learning_rate': 1.0967119193382442e-05, 'epoch': 0.94} {'loss': 0.6564, 'learning_rate': 1.0966793375820152e-05, 'epoch': 0.94} {'loss': 0.8526, 'learning_rate': 1.096646755722186e-05, 'epoch': 0.94} {'loss': 0.6417, 'learning_rate': 1.0966141737587907e-05, 'epoch': 0.94} {'loss': 0.7505, 'learning_rate': 1.0965815916918644e-05, 'epoch': 0.94} {'loss': 0.7554, 'learning_rate': 1.0965490095214428e-05, 'epoch': 0.94} {'loss': 0.8515, 'learning_rate': 1.09651642724756e-05, 'epoch': 0.94} {'loss': 0.6359, 'learning_rate': 1.0964838448702508e-05, 'epoch': 0.94} {'loss': 0.7794, 'learning_rate': 1.096451262389551e-05, 'epoch': 0.94} {'loss': 1.045, 'learning_rate': 1.0964186798054943e-05, 'epoch': 0.94} {'loss': 0.9365, 'learning_rate': 1.0963860971181166e-05, 'epoch': 0.94} {'loss': 0.8174, 'learning_rate': 1.0963535143274527e-05, 'epoch': 0.94} {'loss': 0.8557, 'learning_rate': 1.096320931433537e-05, 'epoch': 0.94} {'loss': 0.612, 'learning_rate': 1.096288348436405e-05, 'epoch': 0.94} {'loss': 0.806, 'learning_rate': 1.0962557653360912e-05, 'epoch': 0.94} {'loss': 0.8009, 'learning_rate': 1.0962231821326305e-05, 'epoch': 0.94} {'loss': 0.733, 'learning_rate': 1.0961905988260581e-05, 'epoch': 0.94} {'loss': 0.7651, 'learning_rate': 1.0961580154164088e-05, 'epoch': 0.94} {'loss': 0.7553, 'learning_rate': 1.0961254319037176e-05, 'epoch': 0.94} {'loss': 0.9341, 'learning_rate': 1.0960928482880194e-05, 'epoch': 0.94} {'loss': 0.8375, 'learning_rate': 1.0960602645693487e-05, 'epoch': 0.94} {'loss': 0.7513, 'learning_rate': 1.0960276807477412e-05, 'epoch': 0.94} {'loss': 0.6883, 'learning_rate': 1.0959950968232312e-05, 'epoch': 0.94} {'loss': 0.622, 'learning_rate': 1.0959625127958536e-05, 'epoch': 0.94} {'loss': 0.8766, 'learning_rate': 1.0959299286656435e-05, 'epoch': 0.94} {'loss': 0.7841, 'learning_rate': 1.0958973444326361e-05, 'epoch': 0.94} {'loss': 0.6778, 'learning_rate': 1.0958647600968659e-05, 'epoch': 0.94} {'loss': 0.7521, 'learning_rate': 1.0958321756583681e-05, 'epoch': 0.94} {'loss': 0.7871, 'learning_rate': 1.0957995911171773e-05, 'epoch': 0.94} {'loss': 0.6799, 'learning_rate': 1.0957670064733285e-05, 'epoch': 0.94} {'loss': 0.6739, 'learning_rate': 1.0957344217268569e-05, 'epoch': 0.94} {'loss': 0.8661, 'learning_rate': 1.095701836877797e-05, 'epoch': 0.94} {'loss': 0.6769, 'learning_rate': 1.0956692519261842e-05, 'epoch': 0.94} {'loss': 0.7242, 'learning_rate': 1.0956366668720532e-05, 'epoch': 0.94} {'loss': 0.8612, 'learning_rate': 1.0956040817154388e-05, 'epoch': 0.94} {'loss': 0.8326, 'learning_rate': 1.0955714964563757e-05, 'epoch': 0.94} {'loss': 0.7868, 'learning_rate': 1.0955389110948994e-05, 'epoch': 0.94} {'loss': 0.7527, 'learning_rate': 1.0955063256310444e-05, 'epoch': 0.94} {'loss': 0.7732, 'learning_rate': 1.0954737400648456e-05, 'epoch': 0.94} {'loss': 0.9552, 'learning_rate': 1.0954411543963386e-05, 'epoch': 0.94} {'loss': 0.7495, 'learning_rate': 1.0954085686255578e-05, 'epoch': 0.94} {'loss': 0.6923, 'learning_rate': 1.0953759827525377e-05, 'epoch': 0.94} {'loss': 0.7133, 'learning_rate': 1.0953433967773135e-05, 'epoch': 0.94} {'loss': 0.7631, 'learning_rate': 1.0953108106999205e-05, 'epoch': 0.94} {'loss': 0.6598, 'learning_rate': 1.0952782245203933e-05, 'epoch': 0.94} {'loss': 0.7302, 'learning_rate': 1.0952456382387668e-05, 'epoch': 0.94} {'loss': 0.8937, 'learning_rate': 1.0952130518550763e-05, 'epoch': 0.94} {'loss': 0.7094, 'learning_rate': 1.0951804653693562e-05, 'epoch': 0.94} {'loss': 0.6721, 'learning_rate': 1.0951478787816418e-05, 'epoch': 0.94} {'loss': 0.8778, 'learning_rate': 1.0951152920919677e-05, 'epoch': 0.94} {'loss': 0.7096, 'learning_rate': 1.095082705300369e-05, 'epoch': 0.94} {'loss': 0.9096, 'learning_rate': 1.0950501184068805e-05, 'epoch': 0.94} {'loss': 0.648, 'learning_rate': 1.0950175314115374e-05, 'epoch': 0.94} {'loss': 0.7922, 'learning_rate': 1.0949849443143745e-05, 'epoch': 0.94} {'loss': 0.7107, 'learning_rate': 1.0949523571154266e-05, 'epoch': 0.94} {'loss': 0.755, 'learning_rate': 1.0949197698147286e-05, 'epoch': 0.94} {'loss': 0.8165, 'learning_rate': 1.0948871824123156e-05, 'epoch': 0.94} {'loss': 0.8406, 'learning_rate': 1.0948545949082221e-05, 'epoch': 0.94} {'loss': 0.8694, 'learning_rate': 1.0948220073024837e-05, 'epoch': 0.94} {'loss': 0.7166, 'learning_rate': 1.0947894195951348e-05, 'epoch': 0.94} {'loss': 0.7984, 'learning_rate': 1.0947568317862104e-05, 'epoch': 0.94} {'loss': 0.8072, 'learning_rate': 1.094724243875746e-05, 'epoch': 0.94} {'loss': 0.7818, 'learning_rate': 1.0946916558637755e-05, 'epoch': 0.94} {'loss': 0.9052, 'learning_rate': 1.0946590677503344e-05, 'epoch': 0.94} {'loss': 0.7132, 'learning_rate': 1.0946264795354575e-05, 'epoch': 0.94} {'loss': 0.7664, 'learning_rate': 1.0945938912191802e-05, 'epoch': 0.94} {'loss': 0.8292, 'learning_rate': 1.0945613028015367e-05, 'epoch': 0.94} {'loss': 0.741, 'learning_rate': 1.0945287142825624e-05, 'epoch': 0.94} {'loss': 0.741, 'learning_rate': 1.0944961256622918e-05, 'epoch': 0.94} {'loss': 0.9246, 'learning_rate': 1.0944635369407603e-05, 'epoch': 0.94} {'loss': 0.7317, 'learning_rate': 1.0944309481180025e-05, 'epoch': 0.94} {'loss': 0.6702, 'learning_rate': 1.0943983591940534e-05, 'epoch': 0.94} {'loss': 0.753, 'learning_rate': 1.094365770168948e-05, 'epoch': 0.94} {'loss': 0.6608, 'learning_rate': 1.0943331810427211e-05, 'epoch': 0.94} {'loss': 0.9367, 'learning_rate': 1.0943005918154078e-05, 'epoch': 0.94} {'loss': 0.8221, 'learning_rate': 1.0942680024870427e-05, 'epoch': 0.94} {'loss': 0.8932, 'learning_rate': 1.0942354130576608e-05, 'epoch': 0.94} {'loss': 0.8007, 'learning_rate': 1.0942028235272977e-05, 'epoch': 0.94} {'loss': 0.8402, 'learning_rate': 1.0941702338959874e-05, 'epoch': 0.94} {'loss': 0.832, 'learning_rate': 1.0941376441637652e-05, 'epoch': 0.94} {'loss': 0.6555, 'learning_rate': 1.0941050543306659e-05, 'epoch': 0.94} {'loss': 0.8646, 'learning_rate': 1.0940724643967248e-05, 'epoch': 0.94} {'loss': 0.7404, 'learning_rate': 1.0940398743619766e-05, 'epoch': 0.94} {'loss': 0.7056, 'learning_rate': 1.0940072842264562e-05, 'epoch': 0.94} {'loss': 0.8928, 'learning_rate': 1.0939746939901982e-05, 'epoch': 0.94} {'loss': 0.9032, 'learning_rate': 1.093942103653238e-05, 'epoch': 0.94} {'loss': 0.714, 'learning_rate': 1.0939095132156103e-05, 'epoch': 0.94} {'loss': 0.9427, 'learning_rate': 1.09387692267735e-05, 'epoch': 0.94} {'loss': 0.5895, 'learning_rate': 1.0938443320384925e-05, 'epoch': 0.94} {'loss': 0.92, 'learning_rate': 1.0938117412990721e-05, 'epoch': 0.94} {'loss': 0.8873, 'learning_rate': 1.093779150459124e-05, 'epoch': 0.94} {'loss': 0.7491, 'learning_rate': 1.0937465595186829e-05, 'epoch': 0.94} {'loss': 0.9467, 'learning_rate': 1.093713968477784e-05, 'epoch': 0.94} {'loss': 0.6645, 'learning_rate': 1.093681377336462e-05, 'epoch': 0.94} {'loss': 0.8001, 'learning_rate': 1.093648786094752e-05, 'epoch': 0.94} {'loss': 0.814, 'learning_rate': 1.0936161947526891e-05, 'epoch': 0.94} {'loss': 0.8605, 'learning_rate': 1.093583603310308e-05, 'epoch': 0.94} {'loss': 0.8419, 'learning_rate': 1.0935510117676434e-05, 'epoch': 0.94} {'loss': 0.7138, 'learning_rate': 1.0935184201247305e-05, 'epoch': 0.94} {'loss': 0.7066, 'learning_rate': 1.093485828381604e-05, 'epoch': 0.94} {'loss': 0.6228, 'learning_rate': 1.0934532365382992e-05, 'epoch': 0.94} {'loss': 0.6232, 'learning_rate': 1.0934206445948509e-05, 'epoch': 0.94} {'loss': 0.5631, 'learning_rate': 1.093388052551294e-05, 'epoch': 0.94} {'loss': 0.7356, 'learning_rate': 1.0933554604076633e-05, 'epoch': 0.94} {'loss': 0.6263, 'learning_rate': 1.0933228681639936e-05, 'epoch': 0.94} {'loss': 0.7381, 'learning_rate': 1.0932902758203202e-05, 'epoch': 0.94} {'loss': 0.9358, 'learning_rate': 1.0932576833766777e-05, 'epoch': 0.94} {'loss': 0.7562, 'learning_rate': 1.0932250908331013e-05, 'epoch': 0.94} {'loss': 0.9148, 'learning_rate': 1.0931924981896258e-05, 'epoch': 0.94} {'loss': 0.7583, 'learning_rate': 1.0931599054462863e-05, 'epoch': 0.94} {'loss': 0.7714, 'learning_rate': 1.0931273126031172e-05, 'epoch': 0.94} {'loss': 0.9793, 'learning_rate': 1.093094719660154e-05, 'epoch': 0.94} {'loss': 0.7014, 'learning_rate': 1.0930621266174312e-05, 'epoch': 0.94} {'loss': 0.804, 'learning_rate': 1.093029533474984e-05, 'epoch': 0.94} {'loss': 0.7823, 'learning_rate': 1.0929969402328474e-05, 'epoch': 0.94} {'loss': 0.8167, 'learning_rate': 1.0929643468910562e-05, 'epoch': 0.94} {'loss': 0.743, 'learning_rate': 1.0929317534496454e-05, 'epoch': 0.94} {'loss': 0.9091, 'learning_rate': 1.0928991599086495e-05, 'epoch': 0.94} {'loss': 0.8289, 'learning_rate': 1.092866566268104e-05, 'epoch': 0.94} {'loss': 0.6708, 'learning_rate': 1.0928339725280433e-05, 'epoch': 0.94} {'loss': 0.888, 'learning_rate': 1.0928013786885028e-05, 'epoch': 0.94} {'loss': 0.7721, 'learning_rate': 1.0927687847495175e-05, 'epoch': 0.94} {'loss': 0.6971, 'learning_rate': 1.0927361907111219e-05, 'epoch': 0.94} {'loss': 0.7402, 'learning_rate': 1.092703596573351e-05, 'epoch': 0.94} {'loss': 0.8293, 'learning_rate': 1.09267100233624e-05, 'epoch': 0.94} {'loss': 0.7423, 'learning_rate': 1.0926384079998234e-05, 'epoch': 0.94} {'loss': 0.6122, 'learning_rate': 1.0926058135641365e-05, 'epoch': 0.94} {'loss': 0.8419, 'learning_rate': 1.0925732190292142e-05, 'epoch': 0.94} {'loss': 0.7401, 'learning_rate': 1.0925406243950913e-05, 'epoch': 0.94} {'loss': 0.7941, 'learning_rate': 1.0925080296618028e-05, 'epoch': 0.94} {'loss': 0.8111, 'learning_rate': 1.0924754348293836e-05, 'epoch': 0.94} {'loss': 0.7754, 'learning_rate': 1.0924428398978686e-05, 'epoch': 0.94} {'loss': 0.8213, 'learning_rate': 1.0924102448672927e-05, 'epoch': 0.94} {'loss': 0.7147, 'learning_rate': 1.0923776497376908e-05, 'epoch': 0.94} {'loss': 0.7118, 'learning_rate': 1.0923450545090982e-05, 'epoch': 0.94} {'loss': 0.9535, 'learning_rate': 1.0923124591815492e-05, 'epoch': 0.94} {'loss': 0.921, 'learning_rate': 1.0922798637550794e-05, 'epoch': 0.94} {'loss': 0.7953, 'learning_rate': 1.0922472682297232e-05, 'epoch': 0.94} {'loss': 0.7009, 'learning_rate': 1.0922146726055156e-05, 'epoch': 0.94} {'loss': 0.7338, 'learning_rate': 1.0921820768824917e-05, 'epoch': 0.94} {'loss': 0.8108, 'learning_rate': 1.0921494810606867e-05, 'epoch': 0.94} {'loss': 0.757, 'learning_rate': 1.092116885140135e-05, 'epoch': 0.94} {'loss': 0.7998, 'learning_rate': 1.0920842891208718e-05, 'epoch': 0.94} {'loss': 0.8619, 'learning_rate': 1.0920516930029322e-05, 'epoch': 0.94} {'loss': 0.7391, 'learning_rate': 1.0920190967863504e-05, 'epoch': 0.94} {'loss': 0.5765, 'learning_rate': 1.091986500471162e-05, 'epoch': 0.94} {'loss': 0.7581, 'learning_rate': 1.0919539040574021e-05, 'epoch': 0.94} {'loss': 0.8193, 'learning_rate': 1.091921307545105e-05, 'epoch': 0.94} {'loss': 0.7279, 'learning_rate': 1.0918887109343057e-05, 'epoch': 0.94} {'loss': 0.8179, 'learning_rate': 1.0918561142250397e-05, 'epoch': 0.94} {'loss': 0.723, 'learning_rate': 1.0918235174173415e-05, 'epoch': 0.94} {'loss': 0.8159, 'learning_rate': 1.0917909205112461e-05, 'epoch': 0.94} {'loss': 0.6409, 'learning_rate': 1.0917583235067883e-05, 'epoch': 0.94} {'loss': 0.8899, 'learning_rate': 1.0917257264040035e-05, 'epoch': 0.94} {'loss': 0.8551, 'learning_rate': 1.091693129202926e-05, 'epoch': 0.94} {'loss': 0.7052, 'learning_rate': 1.0916605319035912e-05, 'epoch': 0.94} {'loss': 0.7464, 'learning_rate': 1.0916279345060337e-05, 'epoch': 0.94} {'loss': 0.6987, 'learning_rate': 1.0915953370102888e-05, 'epoch': 0.94} {'loss': 0.6733, 'learning_rate': 1.091562739416391e-05, 'epoch': 0.94} {'loss': 0.8468, 'learning_rate': 1.091530141724376e-05, 'epoch': 0.94} {'loss': 0.6747, 'learning_rate': 1.0914975439342776e-05, 'epoch': 0.94} {'loss': 0.7058, 'learning_rate': 1.0914649460461314e-05, 'epoch': 0.94} {'loss': 0.8459, 'learning_rate': 1.0914323480599724e-05, 'epoch': 0.95} {'loss': 0.6833, 'learning_rate': 1.0913997499758352e-05, 'epoch': 0.95} {'loss': 0.763, 'learning_rate': 1.0913671517937555e-05, 'epoch': 0.95} {'loss': 0.8767, 'learning_rate': 1.0913345535137672e-05, 'epoch': 0.95} {'loss': 0.559, 'learning_rate': 1.0913019551359057e-05, 'epoch': 0.95} {'loss': 0.7433, 'learning_rate': 1.091269356660206e-05, 'epoch': 0.95} {'loss': 0.8838, 'learning_rate': 1.0912367580867027e-05, 'epoch': 0.95} {'loss': 0.8436, 'learning_rate': 1.091204159415431e-05, 'epoch': 0.95} {'loss': 0.9228, 'learning_rate': 1.0911715606464259e-05, 'epoch': 0.95} {'loss': 0.7529, 'learning_rate': 1.0911389617797226e-05, 'epoch': 0.95} {'loss': 0.7106, 'learning_rate': 1.0911063628153555e-05, 'epoch': 0.95} {'loss': 0.8191, 'learning_rate': 1.0910737637533595e-05, 'epoch': 0.95} {'loss': 0.7045, 'learning_rate': 1.0910411645937698e-05, 'epoch': 0.95} {'loss': 0.7787, 'learning_rate': 1.091008565336621e-05, 'epoch': 0.95} {'loss': 0.742, 'learning_rate': 1.0909759659819487e-05, 'epoch': 0.95} {'loss': 0.7047, 'learning_rate': 1.0909433665297872e-05, 'epoch': 0.95} {'loss': 0.7166, 'learning_rate': 1.0909107669801721e-05, 'epoch': 0.95} {'loss': 0.8616, 'learning_rate': 1.0908781673331378e-05, 'epoch': 0.95} {'loss': 0.6943, 'learning_rate': 1.0908455675887193e-05, 'epoch': 0.95} {'loss': 0.6844, 'learning_rate': 1.0908129677469512e-05, 'epoch': 0.95} {'loss': 0.6793, 'learning_rate': 1.0907803678078693e-05, 'epoch': 0.95} {'loss': 0.8177, 'learning_rate': 1.0907477677715075e-05, 'epoch': 0.95} {'loss': 0.7637, 'learning_rate': 1.0907151676379018e-05, 'epoch': 0.95} {'loss': 0.6526, 'learning_rate': 1.0906825674070865e-05, 'epoch': 0.95} {'loss': 0.77, 'learning_rate': 1.0906499670790967e-05, 'epoch': 0.95} {'loss': 0.9105, 'learning_rate': 1.090617366653967e-05, 'epoch': 0.95} {'loss': 0.878, 'learning_rate': 1.0905847661317326e-05, 'epoch': 0.95} {'loss': 0.7579, 'learning_rate': 1.0905521655124285e-05, 'epoch': 0.95} {'loss': 0.7569, 'learning_rate': 1.0905195647960897e-05, 'epoch': 0.95} {'loss': 0.6301, 'learning_rate': 1.090486963982751e-05, 'epoch': 0.95} {'loss': 0.7887, 'learning_rate': 1.0904543630724476e-05, 'epoch': 0.95} {'loss': 0.7032, 'learning_rate': 1.0904217620652138e-05, 'epoch': 0.95} {'loss': 0.7818, 'learning_rate': 1.090389160961085e-05, 'epoch': 0.95} {'loss': 0.8368, 'learning_rate': 1.090356559760096e-05, 'epoch': 0.95} {'loss': 0.818, 'learning_rate': 1.0903239584622817e-05, 'epoch': 0.95} {'loss': 0.7558, 'learning_rate': 1.0902913570676777e-05, 'epoch': 0.95} {'loss': 0.6338, 'learning_rate': 1.0902587555763178e-05, 'epoch': 0.95} {'loss': 0.7564, 'learning_rate': 1.0902261539882379e-05, 'epoch': 0.95} {'loss': 0.7952, 'learning_rate': 1.090193552303472e-05, 'epoch': 0.95} {'loss': 0.6393, 'learning_rate': 1.090160950522056e-05, 'epoch': 0.95} {'loss': 0.7038, 'learning_rate': 1.0901283486440241e-05, 'epoch': 0.95} {'loss': 0.7798, 'learning_rate': 1.090095746669412e-05, 'epoch': 0.95} {'loss': 0.7888, 'learning_rate': 1.0900631445982539e-05, 'epoch': 0.95} {'loss': 0.7319, 'learning_rate': 1.0900305424305847e-05, 'epoch': 0.95} {'loss': 0.8991, 'learning_rate': 1.0899979401664402e-05, 'epoch': 0.95} {'loss': 0.9073, 'learning_rate': 1.0899653378058546e-05, 'epoch': 0.95} {'loss': 0.6043, 'learning_rate': 1.089932735348863e-05, 'epoch': 0.95} {'loss': 0.7943, 'learning_rate': 1.0899001327955004e-05, 'epoch': 0.95} {'loss': 0.6924, 'learning_rate': 1.0898675301458016e-05, 'epoch': 0.95} {'loss': 0.7524, 'learning_rate': 1.0898349273998014e-05, 'epoch': 0.95} {'loss': 0.7051, 'learning_rate': 1.089802324557535e-05, 'epoch': 0.95} {'loss': 0.841, 'learning_rate': 1.089769721619038e-05, 'epoch': 0.95} {'loss': 0.8306, 'learning_rate': 1.0897371185843439e-05, 'epoch': 0.95} {'loss': 0.72, 'learning_rate': 1.0897045154534889e-05, 'epoch': 0.95} {'loss': 0.7624, 'learning_rate': 1.089671912226507e-05, 'epoch': 0.95} {'loss': 0.7508, 'learning_rate': 1.0896393089034336e-05, 'epoch': 0.95} {'loss': 0.6946, 'learning_rate': 1.0896067054843036e-05, 'epoch': 0.95} {'loss': 0.7125, 'learning_rate': 1.0895741019691519e-05, 'epoch': 0.95} {'loss': 0.8004, 'learning_rate': 1.089541498358014e-05, 'epoch': 0.95} {'loss': 0.8887, 'learning_rate': 1.0895088946509236e-05, 'epoch': 0.95} {'loss': 0.8322, 'learning_rate': 1.0894762908479169e-05, 'epoch': 0.95} {'loss': 0.5421, 'learning_rate': 1.089443686949028e-05, 'epoch': 0.95} {'loss': 0.7414, 'learning_rate': 1.0894110829542918e-05, 'epoch': 0.95} {'loss': 0.6921, 'learning_rate': 1.089378478863744e-05, 'epoch': 0.95} {'loss': 0.7797, 'learning_rate': 1.089345874677419e-05, 'epoch': 0.95} {'loss': 0.8263, 'learning_rate': 1.0893132703953517e-05, 'epoch': 0.95} {'loss': 0.721, 'learning_rate': 1.0892806660175776e-05, 'epoch': 0.95} {'loss': 0.7192, 'learning_rate': 1.0892480615441308e-05, 'epoch': 0.95} {'loss': 0.739, 'learning_rate': 1.0892154569750466e-05, 'epoch': 0.95} {'loss': 0.8405, 'learning_rate': 1.08918285231036e-05, 'epoch': 0.95} {'loss': 0.8969, 'learning_rate': 1.0891502475501062e-05, 'epoch': 0.95} {'loss': 0.8453, 'learning_rate': 1.0891176426943197e-05, 'epoch': 0.95} {'loss': 0.946, 'learning_rate': 1.0890850377430357e-05, 'epoch': 0.95} {'loss': 0.7611, 'learning_rate': 1.089052432696289e-05, 'epoch': 0.95} {'loss': 0.745, 'learning_rate': 1.0890198275541143e-05, 'epoch': 0.95} {'loss': 0.8173, 'learning_rate': 1.0889872223165469e-05, 'epoch': 0.95} {'loss': 0.8471, 'learning_rate': 1.0889546169836219e-05, 'epoch': 0.95} {'loss': 0.715, 'learning_rate': 1.0889220115553738e-05, 'epoch': 0.95} {'loss': 0.7576, 'learning_rate': 1.088889406031838e-05, 'epoch': 0.95} {'loss': 0.7633, 'learning_rate': 1.0888568004130494e-05, 'epoch': 0.95} {'loss': 0.8059, 'learning_rate': 1.0888241946990422e-05, 'epoch': 0.95} {'loss': 0.9593, 'learning_rate': 1.0887915888898519e-05, 'epoch': 0.95} {'loss': 0.6553, 'learning_rate': 1.0887589829855135e-05, 'epoch': 0.95} {'loss': 0.9497, 'learning_rate': 1.0887263769860616e-05, 'epoch': 0.95} {'loss': 0.7929, 'learning_rate': 1.0886937708915315e-05, 'epoch': 0.95} {'loss': 0.7645, 'learning_rate': 1.0886611647019583e-05, 'epoch': 0.95} {'loss': 0.7629, 'learning_rate': 1.0886285584173768e-05, 'epoch': 0.95} {'loss': 0.9321, 'learning_rate': 1.0885959520378213e-05, 'epoch': 0.95} {'loss': 0.9908, 'learning_rate': 1.0885633455633273e-05, 'epoch': 0.95} {'loss': 0.8662, 'learning_rate': 1.08853073899393e-05, 'epoch': 0.95} {'loss': 0.8467, 'learning_rate': 1.0884981323296638e-05, 'epoch': 0.95} {'loss': 0.7403, 'learning_rate': 1.0884655255705638e-05, 'epoch': 0.95} {'loss': 0.7936, 'learning_rate': 1.088432918716665e-05, 'epoch': 0.95} {'loss': 0.8346, 'learning_rate': 1.0884003117680027e-05, 'epoch': 0.95} {'loss': 0.7548, 'learning_rate': 1.0883677047246113e-05, 'epoch': 0.95} {'loss': 0.809, 'learning_rate': 1.0883350975865257e-05, 'epoch': 0.95} {'loss': 0.8539, 'learning_rate': 1.0883024903537812e-05, 'epoch': 0.95} {'loss': 0.9088, 'learning_rate': 1.0882698830264129e-05, 'epoch': 0.95} {'loss': 0.8195, 'learning_rate': 1.088237275604455e-05, 'epoch': 0.95} {'loss': 0.6268, 'learning_rate': 1.088204668087943e-05, 'epoch': 0.95} {'loss': 0.6747, 'learning_rate': 1.0881720604769121e-05, 'epoch': 0.95} {'loss': 0.8014, 'learning_rate': 1.0881394527713965e-05, 'epoch': 0.95} {'loss': 0.6745, 'learning_rate': 1.0881068449714316e-05, 'epoch': 0.95} {'loss': 0.7254, 'learning_rate': 1.0880742370770523e-05, 'epoch': 0.95} {'loss': 0.8928, 'learning_rate': 1.0880416290882936e-05, 'epoch': 0.95} {'loss': 0.8812, 'learning_rate': 1.0880090210051901e-05, 'epoch': 0.95} {'loss': 0.651, 'learning_rate': 1.0879764128277775e-05, 'epoch': 0.95} {'loss': 0.6574, 'learning_rate': 1.0879438045560898e-05, 'epoch': 0.95} {'loss': 0.7076, 'learning_rate': 1.0879111961901624e-05, 'epoch': 0.95} {'loss': 0.8967, 'learning_rate': 1.0878785877300301e-05, 'epoch': 0.95} {'loss': 0.7145, 'learning_rate': 1.0878459791757284e-05, 'epoch': 0.95} {'loss': 0.7426, 'learning_rate': 1.0878133705272912e-05, 'epoch': 0.95} {'loss': 0.9846, 'learning_rate': 1.0877807617847545e-05, 'epoch': 0.95} {'loss': 0.8191, 'learning_rate': 1.0877481529481529e-05, 'epoch': 0.95} {'loss': 0.7371, 'learning_rate': 1.087715544017521e-05, 'epoch': 0.95} {'loss': 0.865, 'learning_rate': 1.087682934992894e-05, 'epoch': 0.95} {'loss': 0.8051, 'learning_rate': 1.0876503258743068e-05, 'epoch': 0.95} {'loss': 0.7217, 'learning_rate': 1.0876177166617943e-05, 'epoch': 0.95} {'loss': 0.6822, 'learning_rate': 1.0875851073553917e-05, 'epoch': 0.95} {'loss': 0.8433, 'learning_rate': 1.0875524979551333e-05, 'epoch': 0.95} {'loss': 0.6675, 'learning_rate': 1.0875198884610551e-05, 'epoch': 0.95} {'loss': 0.7312, 'learning_rate': 1.0874872788731912e-05, 'epoch': 0.95} {'loss': 0.9173, 'learning_rate': 1.0874546691915766e-05, 'epoch': 0.95} {'loss': 0.8764, 'learning_rate': 1.0874220594162469e-05, 'epoch': 0.95} {'loss': 0.7386, 'learning_rate': 1.0873894495472361e-05, 'epoch': 0.95} {'loss': 0.6543, 'learning_rate': 1.0873568395845797e-05, 'epoch': 0.95} {'loss': 0.8375, 'learning_rate': 1.0873242295283127e-05, 'epoch': 0.95} {'loss': 0.9713, 'learning_rate': 1.08729161937847e-05, 'epoch': 0.95} {'loss': 0.8437, 'learning_rate': 1.0872590091350861e-05, 'epoch': 0.95} {'loss': 0.8811, 'learning_rate': 1.0872263987981965e-05, 'epoch': 0.95} {'loss': 0.8037, 'learning_rate': 1.087193788367836e-05, 'epoch': 0.95} {'loss': 0.7195, 'learning_rate': 1.0871611778440395e-05, 'epoch': 0.95} {'loss': 0.7304, 'learning_rate': 1.0871285672268416e-05, 'epoch': 0.95} {'loss': 0.7729, 'learning_rate': 1.0870959565162777e-05, 'epoch': 0.95} {'loss': 0.8684, 'learning_rate': 1.087063345712383e-05, 'epoch': 0.95} {'loss': 0.6845, 'learning_rate': 1.0870307348151921e-05, 'epoch': 0.95} {'loss': 0.8302, 'learning_rate': 1.0869981238247394e-05, 'epoch': 0.95} {'loss': 0.8891, 'learning_rate': 1.0869655127410605e-05, 'epoch': 0.95} {'loss': 0.6439, 'learning_rate': 1.0869329015641902e-05, 'epoch': 0.95} {'loss': 0.8603, 'learning_rate': 1.0869002902941637e-05, 'epoch': 0.95} {'loss': 0.9066, 'learning_rate': 1.0868676789310155e-05, 'epoch': 0.95} {'loss': 0.9005, 'learning_rate': 1.0868350674747807e-05, 'epoch': 0.95} {'loss': 0.7386, 'learning_rate': 1.0868024559254946e-05, 'epoch': 0.95} {'loss': 0.7367, 'learning_rate': 1.0867698442831915e-05, 'epoch': 0.95} {'loss': 0.7248, 'learning_rate': 1.0867372325479068e-05, 'epoch': 0.95} {'loss': 0.7643, 'learning_rate': 1.0867046207196751e-05, 'epoch': 0.95} {'loss': 0.6465, 'learning_rate': 1.0866720087985319e-05, 'epoch': 0.95} {'loss': 0.7001, 'learning_rate': 1.0866393967845117e-05, 'epoch': 0.95} {'loss': 0.7422, 'learning_rate': 1.0866067846776498e-05, 'epoch': 0.95} {'loss': 0.6202, 'learning_rate': 1.0865741724779807e-05, 'epoch': 0.95} {'loss': 1.0052, 'learning_rate': 1.0865415601855394e-05, 'epoch': 0.95} {'loss': 0.8207, 'learning_rate': 1.0865089478003611e-05, 'epoch': 0.95} {'loss': 0.7054, 'learning_rate': 1.0864763353224806e-05, 'epoch': 0.95} {'loss': 0.6942, 'learning_rate': 1.086443722751933e-05, 'epoch': 0.95} {'loss': 0.6026, 'learning_rate': 1.0864111100887533e-05, 'epoch': 0.95} {'loss': 0.8229, 'learning_rate': 1.0863784973329763e-05, 'epoch': 0.95} {'loss': 0.8216, 'learning_rate': 1.0863458844846366e-05, 'epoch': 0.95} {'loss': 0.5961, 'learning_rate': 1.0863132715437699e-05, 'epoch': 0.95} {'loss': 0.8516, 'learning_rate': 1.0862806585104102e-05, 'epoch': 0.95} {'loss': 0.8692, 'learning_rate': 1.0862480453845933e-05, 'epoch': 0.95} {'loss': 0.7061, 'learning_rate': 1.086215432166354e-05, 'epoch': 0.95} {'loss': 0.7731, 'learning_rate': 1.0861828188557269e-05, 'epoch': 0.95} {'loss': 0.8615, 'learning_rate': 1.0861502054527473e-05, 'epoch': 0.95} {'loss': 0.6564, 'learning_rate': 1.0861175919574497e-05, 'epoch': 0.95} {'loss': 0.7375, 'learning_rate': 1.0860849783698695e-05, 'epoch': 0.95} {'loss': 0.7362, 'learning_rate': 1.0860523646900414e-05, 'epoch': 0.95} {'loss': 0.8618, 'learning_rate': 1.0860197509180004e-05, 'epoch': 0.95} {'loss': 0.7776, 'learning_rate': 1.0859871370537819e-05, 'epoch': 0.95} {'loss': 0.839, 'learning_rate': 1.0859545230974197e-05, 'epoch': 0.95} {'loss': 0.8588, 'learning_rate': 1.0859219090489502e-05, 'epoch': 0.95} {'loss': 0.7287, 'learning_rate': 1.085889294908407e-05, 'epoch': 0.95} {'loss': 0.724, 'learning_rate': 1.085856680675826e-05, 'epoch': 0.95} {'loss': 0.7822, 'learning_rate': 1.0858240663512415e-05, 'epoch': 0.95} {'loss': 0.7157, 'learning_rate': 1.0857914519346893e-05, 'epoch': 0.95} {'loss': 0.9062, 'learning_rate': 1.0857588374262034e-05, 'epoch': 0.95} {'loss': 0.6991, 'learning_rate': 1.0857262228258194e-05, 'epoch': 0.95} {'loss': 0.5631, 'learning_rate': 1.085693608133572e-05, 'epoch': 0.95} {'loss': 0.7843, 'learning_rate': 1.0856609933494958e-05, 'epoch': 0.95} {'loss': 0.7577, 'learning_rate': 1.0856283784736266e-05, 'epoch': 0.95} {'loss': 0.745, 'learning_rate': 1.0855957635059986e-05, 'epoch': 0.95} {'loss': 0.8162, 'learning_rate': 1.085563148446647e-05, 'epoch': 0.95} {'loss': 0.8339, 'learning_rate': 1.0855305332956068e-05, 'epoch': 0.95} {'loss': 0.8985, 'learning_rate': 1.0854979180529131e-05, 'epoch': 0.95} {'loss': 0.7362, 'learning_rate': 1.0854653027186005e-05, 'epoch': 0.95} {'loss': 0.607, 'learning_rate': 1.085432687292704e-05, 'epoch': 0.95} {'loss': 0.8707, 'learning_rate': 1.085400071775259e-05, 'epoch': 0.95} {'loss': 0.6601, 'learning_rate': 1.0853674561662998e-05, 'epoch': 0.95} {'loss': 0.7311, 'learning_rate': 1.0853348404658616e-05, 'epoch': 0.95} {'loss': 0.8391, 'learning_rate': 1.0853022246739797e-05, 'epoch': 0.95} {'loss': 0.6852, 'learning_rate': 1.0852696087906886e-05, 'epoch': 0.95} {'loss': 0.7605, 'learning_rate': 1.0852369928160236e-05, 'epoch': 0.95} {'loss': 0.7257, 'learning_rate': 1.085204376750019e-05, 'epoch': 0.95} {'loss': 0.7723, 'learning_rate': 1.085171760592711e-05, 'epoch': 0.95} {'loss': 0.7458, 'learning_rate': 1.0851391443441333e-05, 'epoch': 0.95} {'loss': 0.9598, 'learning_rate': 1.0851065280043212e-05, 'epoch': 0.95} {'loss': 0.828, 'learning_rate': 1.0850739115733098e-05, 'epoch': 0.95} {'loss': 0.7626, 'learning_rate': 1.0850412950511344e-05, 'epoch': 0.95} {'loss': 0.9075, 'learning_rate': 1.0850086784378291e-05, 'epoch': 0.95} {'loss': 0.7949, 'learning_rate': 1.0849760617334298e-05, 'epoch': 0.95} {'loss': 0.6704, 'learning_rate': 1.0849434449379708e-05, 'epoch': 0.95} {'loss': 0.9603, 'learning_rate': 1.084910828051487e-05, 'epoch': 0.95} {'loss': 0.7424, 'learning_rate': 1.0848782110740136e-05, 'epoch': 0.95} {'loss': 0.6985, 'learning_rate': 1.0848455940055857e-05, 'epoch': 0.95} {'loss': 0.834, 'learning_rate': 1.084812976846238e-05, 'epoch': 0.95} {'loss': 0.7585, 'learning_rate': 1.084780359596006e-05, 'epoch': 0.95} {'loss': 0.6983, 'learning_rate': 1.0847477422549238e-05, 'epoch': 0.95} {'loss': 0.7997, 'learning_rate': 1.0847151248230265e-05, 'epoch': 0.95} {'loss': 0.7028, 'learning_rate': 1.0846825073003496e-05, 'epoch': 0.95} {'loss': 0.8649, 'learning_rate': 1.0846498896869276e-05, 'epoch': 0.95} {'loss': 0.7872, 'learning_rate': 1.0846172719827956e-05, 'epoch': 0.95} {'loss': 0.8018, 'learning_rate': 1.084584654187989e-05, 'epoch': 0.95} {'loss': 0.7459, 'learning_rate': 1.0845520363025419e-05, 'epoch': 0.95} {'loss': 0.7235, 'learning_rate': 1.0845194183264898e-05, 'epoch': 0.95} {'loss': 0.8522, 'learning_rate': 1.0844868002598674e-05, 'epoch': 0.95} {'loss': 0.7838, 'learning_rate': 1.0844541821027098e-05, 'epoch': 0.95} {'loss': 0.7383, 'learning_rate': 1.0844215638550517e-05, 'epoch': 0.95} {'loss': 0.7131, 'learning_rate': 1.0843889455169288e-05, 'epoch': 0.95} {'loss': 0.7638, 'learning_rate': 1.0843563270883752e-05, 'epoch': 0.95} {'loss': 0.8099, 'learning_rate': 1.0843237085694263e-05, 'epoch': 0.95} {'loss': 0.8004, 'learning_rate': 1.0842910899601169e-05, 'epoch': 0.95} {'loss': 0.6823, 'learning_rate': 1.0842584712604819e-05, 'epoch': 0.95} {'loss': 0.8073, 'learning_rate': 1.0842258524705562e-05, 'epoch': 0.95} {'loss': 0.7417, 'learning_rate': 1.084193233590375e-05, 'epoch': 0.95} {'loss': 0.817, 'learning_rate': 1.0841606146199734e-05, 'epoch': 0.95} {'loss': 0.7667, 'learning_rate': 1.0841279955593862e-05, 'epoch': 0.95} {'loss': 0.8025, 'learning_rate': 1.084095376408648e-05, 'epoch': 0.95} {'loss': 0.8155, 'learning_rate': 1.0840627571677938e-05, 'epoch': 0.95} {'loss': 0.6748, 'learning_rate': 1.0840301378368589e-05, 'epoch': 0.95} {'loss': 0.6192, 'learning_rate': 1.0839975184158782e-05, 'epoch': 0.95} {'loss': 0.7741, 'learning_rate': 1.0839648989048868e-05, 'epoch': 0.95} {'loss': 0.7716, 'learning_rate': 1.0839322793039191e-05, 'epoch': 0.95} {'loss': 0.9498, 'learning_rate': 1.0838996596130107e-05, 'epoch': 0.95} {'loss': 0.7747, 'learning_rate': 1.083867039832196e-05, 'epoch': 0.95} {'loss': 0.8061, 'learning_rate': 1.0838344199615101e-05, 'epoch': 0.95} {'loss': 0.8422, 'learning_rate': 1.0838018000009883e-05, 'epoch': 0.95} {'loss': 0.8339, 'learning_rate': 1.0837691799506649e-05, 'epoch': 0.95} {'loss': 0.7829, 'learning_rate': 1.0837365598105758e-05, 'epoch': 0.95} {'loss': 0.6204, 'learning_rate': 1.083703939580755e-05, 'epoch': 0.95} {'loss': 0.6813, 'learning_rate': 1.0836713192612383e-05, 'epoch': 0.95} {'loss': 0.7565, 'learning_rate': 1.0836386988520599e-05, 'epoch': 0.95} {'loss': 0.9048, 'learning_rate': 1.083606078353255e-05, 'epoch': 0.95} {'loss': 0.7788, 'learning_rate': 1.0835734577648589e-05, 'epoch': 0.95} {'loss': 0.6766, 'learning_rate': 1.0835408370869063e-05, 'epoch': 0.95} {'loss': 0.8362, 'learning_rate': 1.083508216319432e-05, 'epoch': 0.95} {'loss': 0.7491, 'learning_rate': 1.0834755954624712e-05, 'epoch': 0.95} {'loss': 0.7207, 'learning_rate': 1.0834429745160588e-05, 'epoch': 0.95} {'loss': 0.754, 'learning_rate': 1.0834103534802297e-05, 'epoch': 0.95} {'loss': 0.8945, 'learning_rate': 1.0833777323550187e-05, 'epoch': 0.95} {'loss': 0.6736, 'learning_rate': 1.0833451111404614e-05, 'epoch': 0.95} {'loss': 0.7008, 'learning_rate': 1.0833124898365919e-05, 'epoch': 0.95} {'loss': 0.9429, 'learning_rate': 1.0832798684434453e-05, 'epoch': 0.95} {'loss': 0.7997, 'learning_rate': 1.083247246961057e-05, 'epoch': 0.95} {'loss': 0.7591, 'learning_rate': 1.0832146253894623e-05, 'epoch': 0.95} {'loss': 0.8246, 'learning_rate': 1.0831820037286951e-05, 'epoch': 0.95} {'loss': 0.812, 'learning_rate': 1.0831493819787908e-05, 'epoch': 0.95} {'loss': 0.8144, 'learning_rate': 1.083116760139785e-05, 'epoch': 0.95} {'loss': 0.7846, 'learning_rate': 1.0830841382117115e-05, 'epoch': 0.95} {'loss': 0.7735, 'learning_rate': 1.083051516194606e-05, 'epoch': 0.95} {'loss': 0.7429, 'learning_rate': 1.0830188940885034e-05, 'epoch': 0.95} {'loss': 0.713, 'learning_rate': 1.0829862718934385e-05, 'epoch': 0.95} {'loss': 0.7337, 'learning_rate': 1.0829536496094463e-05, 'epoch': 0.95} {'loss': 0.7232, 'learning_rate': 1.082921027236562e-05, 'epoch': 0.95} {'loss': 0.8284, 'learning_rate': 1.0828884047748201e-05, 'epoch': 0.95} {'loss': 0.6446, 'learning_rate': 1.0828557822242555e-05, 'epoch': 0.95} {'loss': 0.7855, 'learning_rate': 1.0828231595849039e-05, 'epoch': 0.95} {'loss': 0.8246, 'learning_rate': 1.0827905368567998e-05, 'epoch': 0.95} {'loss': 0.7602, 'learning_rate': 1.082757914039978e-05, 'epoch': 0.95} {'loss': 0.6799, 'learning_rate': 1.082725291134474e-05, 'epoch': 0.95} {'loss': 0.7532, 'learning_rate': 1.0826926681403221e-05, 'epoch': 0.95} {'loss': 0.7961, 'learning_rate': 1.0826600450575574e-05, 'epoch': 0.95} {'loss': 0.7612, 'learning_rate': 1.082627421886215e-05, 'epoch': 0.95} {'loss': 0.7104, 'learning_rate': 1.08259479862633e-05, 'epoch': 0.95} {'loss': 0.7431, 'learning_rate': 1.0825621752779372e-05, 'epoch': 0.95} {'loss': 0.8586, 'learning_rate': 1.0825295518410717e-05, 'epoch': 0.95} {'loss': 0.8441, 'learning_rate': 1.0824969283157682e-05, 'epoch': 0.95} {'loss': 0.9003, 'learning_rate': 1.0824643047020617e-05, 'epoch': 0.95} {'loss': 0.8188, 'learning_rate': 1.0824316809999873e-05, 'epoch': 0.95} {'loss': 0.7495, 'learning_rate': 1.08239905720958e-05, 'epoch': 0.95} {'loss': 0.7714, 'learning_rate': 1.0823664333308745e-05, 'epoch': 0.95} {'loss': 0.7829, 'learning_rate': 1.0823338093639061e-05, 'epoch': 0.95} {'loss': 0.8273, 'learning_rate': 1.0823011853087098e-05, 'epoch': 0.95} {'loss': 0.7777, 'learning_rate': 1.08226856116532e-05, 'epoch': 0.95} {'loss': 0.7466, 'learning_rate': 1.0822359369337723e-05, 'epoch': 0.95} {'loss': 0.7081, 'learning_rate': 1.082203312614101e-05, 'epoch': 0.95} {'loss': 0.8631, 'learning_rate': 1.0821706882063416e-05, 'epoch': 0.95} {'loss': 0.689, 'learning_rate': 1.0821380637105287e-05, 'epoch': 0.95} {'loss': 0.7522, 'learning_rate': 1.0821054391266981e-05, 'epoch': 0.95} {'loss': 0.8925, 'learning_rate': 1.0820728144548838e-05, 'epoch': 0.95} {'loss': 0.7106, 'learning_rate': 1.082040189695121e-05, 'epoch': 0.95} {'loss': 0.769, 'learning_rate': 1.0820075648474443e-05, 'epoch': 0.95} {'loss': 0.6789, 'learning_rate': 1.0819749399118896e-05, 'epoch': 0.95} {'loss': 0.7376, 'learning_rate': 1.081942314888491e-05, 'epoch': 0.95} {'loss': 0.6865, 'learning_rate': 1.0819096897772843e-05, 'epoch': 0.95} {'loss': 0.8839, 'learning_rate': 1.0818770645783037e-05, 'epoch': 0.95} {'loss': 0.7233, 'learning_rate': 1.0818444392915848e-05, 'epoch': 0.95} {'loss': 0.7967, 'learning_rate': 1.0818118139171616e-05, 'epoch': 0.95} {'loss': 0.7431, 'learning_rate': 1.0817791884550698e-05, 'epoch': 0.95} {'loss': 0.7988, 'learning_rate': 1.0817465629053443e-05, 'epoch': 0.95} {'loss': 0.6401, 'learning_rate': 1.08171393726802e-05, 'epoch': 0.95} {'loss': 0.5686, 'learning_rate': 1.081681311543132e-05, 'epoch': 0.95} {'loss': 0.7123, 'learning_rate': 1.081648685730715e-05, 'epoch': 0.95} {'loss': 0.7901, 'learning_rate': 1.0816160598308042e-05, 'epoch': 0.95} {'loss': 0.9234, 'learning_rate': 1.081583433843434e-05, 'epoch': 0.95} {'loss': 0.8322, 'learning_rate': 1.0815508077686401e-05, 'epoch': 0.95} {'loss': 0.8282, 'learning_rate': 1.0815181816064571e-05, 'epoch': 0.95} {'loss': 0.9564, 'learning_rate': 1.0814855553569201e-05, 'epoch': 0.95} {'loss': 0.9722, 'learning_rate': 1.0814529290200637e-05, 'epoch': 0.95} {'loss': 0.662, 'learning_rate': 1.0814203025959236e-05, 'epoch': 0.95} {'loss': 0.6689, 'learning_rate': 1.0813876760845338e-05, 'epoch': 0.95} {'loss': 0.617, 'learning_rate': 1.08135504948593e-05, 'epoch': 0.95} {'loss': 0.9649, 'learning_rate': 1.0813224228001468e-05, 'epoch': 0.95} {'loss': 0.9484, 'learning_rate': 1.0812897960272195e-05, 'epoch': 0.95} {'loss': 0.7369, 'learning_rate': 1.0812571691671827e-05, 'epoch': 0.95} {'loss': 0.8251, 'learning_rate': 1.0812245422200714e-05, 'epoch': 0.95} {'loss': 0.7572, 'learning_rate': 1.0811919151859209e-05, 'epoch': 0.95} {'loss': 0.7238, 'learning_rate': 1.081159288064766e-05, 'epoch': 0.95} {'loss': 0.8059, 'learning_rate': 1.0811266608566413e-05, 'epoch': 0.95} {'loss': 0.6986, 'learning_rate': 1.0810940335615822e-05, 'epoch': 0.95} {'loss': 0.8045, 'learning_rate': 1.0810614061796233e-05, 'epoch': 0.95} {'loss': 0.7958, 'learning_rate': 1.0810287787108002e-05, 'epoch': 0.95} {'loss': 0.6627, 'learning_rate': 1.0809961511551472e-05, 'epoch': 0.95} {'loss': 0.8684, 'learning_rate': 1.0809635235126996e-05, 'epoch': 0.95} {'loss': 0.9675, 'learning_rate': 1.0809308957834923e-05, 'epoch': 0.95} {'loss': 0.7817, 'learning_rate': 1.0808982679675602e-05, 'epoch': 0.95} {'loss': 0.8327, 'learning_rate': 1.0808656400649383e-05, 'epoch': 0.95} {'loss': 0.6955, 'learning_rate': 1.0808330120756613e-05, 'epoch': 0.95} {'loss': 0.8096, 'learning_rate': 1.0808003839997648e-05, 'epoch': 0.95} {'loss': 0.8301, 'learning_rate': 1.0807677558372832e-05, 'epoch': 0.95} {'loss': 0.7063, 'learning_rate': 1.0807351275882519e-05, 'epoch': 0.95} {'loss': 0.833, 'learning_rate': 1.0807024992527054e-05, 'epoch': 0.95} {'loss': 0.8868, 'learning_rate': 1.0806698708306791e-05, 'epoch': 0.95} {'loss': 0.5841, 'learning_rate': 1.0806372423222076e-05, 'epoch': 0.95} {'loss': 0.76, 'learning_rate': 1.0806046137273258e-05, 'epoch': 0.95} {'loss': 0.7304, 'learning_rate': 1.0805719850460692e-05, 'epoch': 0.95} {'loss': 0.8246, 'learning_rate': 1.0805393562784724e-05, 'epoch': 0.95} {'loss': 0.72, 'learning_rate': 1.0805067274245705e-05, 'epoch': 0.95} {'loss': 0.902, 'learning_rate': 1.0804740984843982e-05, 'epoch': 0.95} {'loss': 0.71, 'learning_rate': 1.0804414694579908e-05, 'epoch': 0.95} {'loss': 0.777, 'learning_rate': 1.0804088403453827e-05, 'epoch': 0.95} {'loss': 0.9294, 'learning_rate': 1.0803762111466096e-05, 'epoch': 0.95} {'loss': 0.9056, 'learning_rate': 1.080343581861706e-05, 'epoch': 0.95} {'loss': 0.8364, 'learning_rate': 1.080310952490707e-05, 'epoch': 0.95} {'loss': 0.8601, 'learning_rate': 1.0802783230336478e-05, 'epoch': 0.95} {'loss': 0.6954, 'learning_rate': 1.0802456934905633e-05, 'epoch': 0.95} {'loss': 0.8476, 'learning_rate': 1.0802130638614878e-05, 'epoch': 0.95} {'loss': 0.7346, 'learning_rate': 1.0801804341464568e-05, 'epoch': 0.95} {'loss': 0.7642, 'learning_rate': 1.0801478043455053e-05, 'epoch': 0.95} {'loss': 0.828, 'learning_rate': 1.0801151744586682e-05, 'epoch': 0.95} {'loss': 0.8788, 'learning_rate': 1.0800825444859808e-05, 'epoch': 0.95} {'loss': 0.7173, 'learning_rate': 1.0800499144274776e-05, 'epoch': 0.95} {'loss': 0.7544, 'learning_rate': 1.0800172842831935e-05, 'epoch': 0.95} {'loss': 0.8804, 'learning_rate': 1.0799846540531636e-05, 'epoch': 0.95} {'loss': 0.7397, 'learning_rate': 1.079952023737423e-05, 'epoch': 0.95} {'loss': 0.8077, 'learning_rate': 1.0799193933360066e-05, 'epoch': 0.95} {'loss': 0.5307, 'learning_rate': 1.0798867628489491e-05, 'epoch': 0.95} {'loss': 0.8171, 'learning_rate': 1.0798541322762864e-05, 'epoch': 0.95} {'loss': 0.9582, 'learning_rate': 1.0798215016180524e-05, 'epoch': 0.95} {'loss': 0.7604, 'learning_rate': 1.0797888708742824e-05, 'epoch': 0.95} {'loss': 0.7374, 'learning_rate': 1.0797562400450114e-05, 'epoch': 0.95} {'loss': 0.7923, 'learning_rate': 1.0797236091302743e-05, 'epoch': 0.95} {'loss': 0.7821, 'learning_rate': 1.0796909781301064e-05, 'epoch': 0.95} {'loss': 0.5561, 'learning_rate': 1.0796583470445425e-05, 'epoch': 0.95} {'loss': 0.652, 'learning_rate': 1.0796257158736173e-05, 'epoch': 0.95} {'loss': 0.8381, 'learning_rate': 1.0795930846173661e-05, 'epoch': 0.95} {'loss': 0.6131, 'learning_rate': 1.0795604532758235e-05, 'epoch': 0.95} {'loss': 0.7546, 'learning_rate': 1.0795278218490248e-05, 'epoch': 0.95} {'loss': 1.0015, 'learning_rate': 1.0794951903370047e-05, 'epoch': 0.95} {'loss': 0.7311, 'learning_rate': 1.0794625587397984e-05, 'epoch': 0.95} {'loss': 0.7743, 'learning_rate': 1.079429927057441e-05, 'epoch': 0.95} {'loss': 0.731, 'learning_rate': 1.0793972952899672e-05, 'epoch': 0.95} {'loss': 0.865, 'learning_rate': 1.0793646634374122e-05, 'epoch': 0.95} {'loss': 0.7473, 'learning_rate': 1.0793320314998106e-05, 'epoch': 0.95} {'loss': 0.8004, 'learning_rate': 1.0792993994771974e-05, 'epoch': 0.95} {'loss': 0.7147, 'learning_rate': 1.0792667673696078e-05, 'epoch': 0.95} {'loss': 0.5994, 'learning_rate': 1.079234135177077e-05, 'epoch': 0.95} {'loss': 0.7651, 'learning_rate': 1.0792015028996395e-05, 'epoch': 0.95} {'loss': 0.8049, 'learning_rate': 1.0791688705373301e-05, 'epoch': 0.95} {'loss': 0.7727, 'learning_rate': 1.0791362380901847e-05, 'epoch': 0.95} {'loss': 0.885, 'learning_rate': 1.0791036055582374e-05, 'epoch': 0.95} {'loss': 0.8015, 'learning_rate': 1.0790709729415234e-05, 'epoch': 0.95} {'loss': 0.7264, 'learning_rate': 1.0790383402400779e-05, 'epoch': 0.95} {'loss': 0.664, 'learning_rate': 1.0790057074539354e-05, 'epoch': 0.95} {'loss': 0.7758, 'learning_rate': 1.0789730745831312e-05, 'epoch': 0.95} {'loss': 0.7175, 'learning_rate': 1.0789404416277005e-05, 'epoch': 0.95} {'loss': 0.6295, 'learning_rate': 1.0789078085876779e-05, 'epoch': 0.95} {'loss': 0.713, 'learning_rate': 1.0788751754630982e-05, 'epoch': 0.95} {'loss': 0.7195, 'learning_rate': 1.0788425422539968e-05, 'epoch': 0.95} {'loss': 0.9266, 'learning_rate': 1.0788099089604087e-05, 'epoch': 0.95} {'loss': 0.8485, 'learning_rate': 1.0787772755823684e-05, 'epoch': 0.95} {'loss': 0.7851, 'learning_rate': 1.078744642119911e-05, 'epoch': 0.95} {'loss': 0.8068, 'learning_rate': 1.078712008573072e-05, 'epoch': 0.95} {'loss': 0.7129, 'learning_rate': 1.0786793749418859e-05, 'epoch': 0.95} {'loss': 0.7813, 'learning_rate': 1.0786467412263875e-05, 'epoch': 0.95} {'loss': 0.7301, 'learning_rate': 1.0786141074266123e-05, 'epoch': 0.95} {'loss': 0.8693, 'learning_rate': 1.0785814735425947e-05, 'epoch': 0.95} {'loss': 0.8858, 'learning_rate': 1.0785488395743702e-05, 'epoch': 0.95} {'loss': 0.832, 'learning_rate': 1.0785162055219734e-05, 'epoch': 0.95} {'loss': 0.8046, 'learning_rate': 1.0784835713854395e-05, 'epoch': 0.95} {'loss': 0.807, 'learning_rate': 1.0784509371648033e-05, 'epoch': 0.95} {'loss': 0.8935, 'learning_rate': 1.0784183028601e-05, 'epoch': 0.95} {'loss': 0.6895, 'learning_rate': 1.0783856684713643e-05, 'epoch': 0.95} {'loss': 0.704, 'learning_rate': 1.0783530339986312e-05, 'epoch': 0.95} {'loss': 0.796, 'learning_rate': 1.0783203994419359e-05, 'epoch': 0.95} {'loss': 0.8202, 'learning_rate': 1.0782877648013127e-05, 'epoch': 0.95} {'loss': 0.7049, 'learning_rate': 1.0782551300767978e-05, 'epoch': 0.95} {'loss': 1.0172, 'learning_rate': 1.0782224952684255e-05, 'epoch': 0.95} {'loss': 0.8651, 'learning_rate': 1.0781898603762302e-05, 'epoch': 0.95} {'loss': 0.7811, 'learning_rate': 1.0781572254002477e-05, 'epoch': 0.95} {'loss': 0.6471, 'learning_rate': 1.0781245903405124e-05, 'epoch': 0.95} {'loss': 0.8093, 'learning_rate': 1.0780919551970596e-05, 'epoch': 0.95} {'loss': 0.9309, 'learning_rate': 1.0780593199699245e-05, 'epoch': 0.95} {'loss': 0.6899, 'learning_rate': 1.0780266846591419e-05, 'epoch': 0.95} {'loss': 0.7402, 'learning_rate': 1.0779940492647465e-05, 'epoch': 0.95} {'loss': 0.9318, 'learning_rate': 1.0779614137867734e-05, 'epoch': 0.95} {'loss': 0.6668, 'learning_rate': 1.0779287782252574e-05, 'epoch': 0.95} {'loss': 0.6509, 'learning_rate': 1.0778961425802339e-05, 'epoch': 0.95} {'loss': 0.7563, 'learning_rate': 1.0778635068517374e-05, 'epoch': 0.95} {'loss': 0.7681, 'learning_rate': 1.0778308710398035e-05, 'epoch': 0.95} {'loss': 0.727, 'learning_rate': 1.0777982351444666e-05, 'epoch': 0.95} {'loss': 0.8145, 'learning_rate': 1.0777655991657621e-05, 'epoch': 0.95} {'loss': 0.8664, 'learning_rate': 1.0777329631037245e-05, 'epoch': 0.95} {'loss': 0.7589, 'learning_rate': 1.077700326958389e-05, 'epoch': 0.95} {'loss': 0.911, 'learning_rate': 1.0776676907297906e-05, 'epoch': 0.95} {'loss': 0.7778, 'learning_rate': 1.0776350544179641e-05, 'epoch': 0.95} {'loss': 0.6983, 'learning_rate': 1.0776024180229452e-05, 'epoch': 0.95} {'loss': 0.7609, 'learning_rate': 1.0775697815447681e-05, 'epoch': 0.95} {'loss': 0.7948, 'learning_rate': 1.0775371449834678e-05, 'epoch': 0.95} {'loss': 0.7842, 'learning_rate': 1.0775045083390794e-05, 'epoch': 0.95} {'loss': 0.7264, 'learning_rate': 1.077471871611638e-05, 'epoch': 0.95} {'loss': 0.9485, 'learning_rate': 1.0774392348011782e-05, 'epoch': 0.95} {'loss': 0.7254, 'learning_rate': 1.0774065979077356e-05, 'epoch': 0.95} {'loss': 0.8525, 'learning_rate': 1.0773739609313449e-05, 'epoch': 0.95} {'loss': 0.5986, 'learning_rate': 1.0773413238720412e-05, 'epoch': 0.95} {'loss': 0.8784, 'learning_rate': 1.0773086867298589e-05, 'epoch': 0.95} {'loss': 0.7191, 'learning_rate': 1.0772760495048333e-05, 'epoch': 0.95} {'loss': 0.7377, 'learning_rate': 1.0772434121969997e-05, 'epoch': 0.95} {'loss': 0.7113, 'learning_rate': 1.0772107748063928e-05, 'epoch': 0.95} {'loss': 0.8273, 'learning_rate': 1.0771781373330475e-05, 'epoch': 0.95} {'loss': 0.7426, 'learning_rate': 1.0771454997769988e-05, 'epoch': 0.95} {'loss': 0.7055, 'learning_rate': 1.077112862138282e-05, 'epoch': 0.95} {'loss': 0.6836, 'learning_rate': 1.0770802244169316e-05, 'epoch': 0.95} {'loss': 0.7265, 'learning_rate': 1.0770475866129828e-05, 'epoch': 0.95} {'loss': 0.6628, 'learning_rate': 1.0770149487264705e-05, 'epoch': 0.95} {'loss': 0.8491, 'learning_rate': 1.0769823107574298e-05, 'epoch': 0.95} {'loss': 0.7934, 'learning_rate': 1.0769496727058957e-05, 'epoch': 0.95} {'loss': 0.76, 'learning_rate': 1.0769170345719028e-05, 'epoch': 0.95} {'loss': 0.7053, 'learning_rate': 1.0768843963554867e-05, 'epoch': 0.95} {'loss': 0.5835, 'learning_rate': 1.0768517580566818e-05, 'epoch': 0.95} {'loss': 0.8182, 'learning_rate': 1.0768191196755234e-05, 'epoch': 0.95} {'loss': 0.7341, 'learning_rate': 1.0767864812120466e-05, 'epoch': 0.95} {'loss': 0.7972, 'learning_rate': 1.0767538426662856e-05, 'epoch': 0.95} {'loss': 0.873, 'learning_rate': 1.0767212040382762e-05, 'epoch': 0.95} {'loss': 0.6903, 'learning_rate': 1.0766885653280533e-05, 'epoch': 0.95} {'loss': 0.821, 'learning_rate': 1.0766559265356516e-05, 'epoch': 0.95} {'loss': 0.9164, 'learning_rate': 1.076623287661106e-05, 'epoch': 0.95} {'loss': 0.6484, 'learning_rate': 1.0765906487044515e-05, 'epoch': 0.95} {'loss': 0.776, 'learning_rate': 1.0765580096657236e-05, 'epoch': 0.95} {'loss': 0.8499, 'learning_rate': 1.0765253705449567e-05, 'epoch': 0.95} {'loss': 0.6038, 'learning_rate': 1.0764927313421858e-05, 'epoch': 0.95} {'loss': 0.7354, 'learning_rate': 1.0764600920574464e-05, 'epoch': 0.95} {'loss': 0.8458, 'learning_rate': 1.0764274526907728e-05, 'epoch': 0.95} {'loss': 0.7781, 'learning_rate': 1.0763948132422004e-05, 'epoch': 0.95} {'loss': 0.7239, 'learning_rate': 1.0763621737117643e-05, 'epoch': 0.95} {'loss': 0.692, 'learning_rate': 1.0763295340994989e-05, 'epoch': 0.95} {'loss': 0.7537, 'learning_rate': 1.0762968944054396e-05, 'epoch': 0.95} {'loss': 0.738, 'learning_rate': 1.0762642546296211e-05, 'epoch': 0.95} {'loss': 0.8416, 'learning_rate': 1.076231614772079e-05, 'epoch': 0.95} {'loss': 0.9226, 'learning_rate': 1.0761989748328474e-05, 'epoch': 0.95} {'loss': 0.7264, 'learning_rate': 1.0761663348119622e-05, 'epoch': 0.95} {'loss': 0.7719, 'learning_rate': 1.0761336947094576e-05, 'epoch': 0.95} {'loss': 0.7909, 'learning_rate': 1.0761010545253687e-05, 'epoch': 0.95} {'loss': 0.8312, 'learning_rate': 1.0760684142597309e-05, 'epoch': 0.95} {'loss': 0.6669, 'learning_rate': 1.0760357739125788e-05, 'epoch': 0.95} {'loss': 0.8437, 'learning_rate': 1.0760031334839478e-05, 'epoch': 0.95} {'loss': 0.8896, 'learning_rate': 1.0759704929738724e-05, 'epoch': 0.95} {'loss': 0.7967, 'learning_rate': 1.0759378523823878e-05, 'epoch': 0.95} {'loss': 0.8795, 'learning_rate': 1.0759052117095289e-05, 'epoch': 0.95} {'loss': 0.9646, 'learning_rate': 1.0758725709553304e-05, 'epoch': 0.95} {'loss': 0.8279, 'learning_rate': 1.075839930119828e-05, 'epoch': 0.95} {'loss': 0.7838, 'learning_rate': 1.0758072892030559e-05, 'epoch': 0.95} {'loss': 0.911, 'learning_rate': 1.07577464820505e-05, 'epoch': 0.95} {'loss': 0.9122, 'learning_rate': 1.0757420071258443e-05, 'epoch': 0.96} {'loss': 0.736, 'learning_rate': 1.0757093659654744e-05, 'epoch': 0.96} {'loss': 0.8027, 'learning_rate': 1.075676724723975e-05, 'epoch': 0.96} {'loss': 0.6454, 'learning_rate': 1.075644083401381e-05, 'epoch': 0.96} {'loss': 0.7703, 'learning_rate': 1.0756114419977277e-05, 'epoch': 0.96} {'loss': 0.8256, 'learning_rate': 1.0755788005130499e-05, 'epoch': 0.96} {'loss': 0.7556, 'learning_rate': 1.0755461589473829e-05, 'epoch': 0.96} {'loss': 0.635, 'learning_rate': 1.0755135173007612e-05, 'epoch': 0.96} {'loss': 0.8813, 'learning_rate': 1.0754808755732195e-05, 'epoch': 0.96} {'loss': 0.741, 'learning_rate': 1.0754482337647935e-05, 'epoch': 0.96} {'loss': 0.7911, 'learning_rate': 1.075415591875518e-05, 'epoch': 0.96} {'loss': 0.9015, 'learning_rate': 1.0753829499054279e-05, 'epoch': 0.96} {'loss': 0.7645, 'learning_rate': 1.0753503078545582e-05, 'epoch': 0.96} {'loss': 0.769, 'learning_rate': 1.0753176657229439e-05, 'epoch': 0.96} {'loss': 0.7892, 'learning_rate': 1.0752850235106198e-05, 'epoch': 0.96} {'loss': 0.8367, 'learning_rate': 1.075252381217621e-05, 'epoch': 0.96} {'loss': 1.0244, 'learning_rate': 1.0752197388439823e-05, 'epoch': 0.96} {'loss': 0.7801, 'learning_rate': 1.0751870963897391e-05, 'epoch': 0.96} {'loss': 1.0095, 'learning_rate': 1.075154453854926e-05, 'epoch': 0.96} {'loss': 0.6673, 'learning_rate': 1.0751218112395782e-05, 'epoch': 0.96} {'loss': 0.8516, 'learning_rate': 1.0750891685437309e-05, 'epoch': 0.96} {'loss': 0.8137, 'learning_rate': 1.0750565257674183e-05, 'epoch': 0.96} {'loss': 0.7231, 'learning_rate': 1.075023882910676e-05, 'epoch': 0.96} {'loss': 0.7441, 'learning_rate': 1.0749912399735386e-05, 'epoch': 0.96} {'loss': 0.965, 'learning_rate': 1.0749585969560417e-05, 'epoch': 0.96} {'loss': 0.8342, 'learning_rate': 1.07492595385822e-05, 'epoch': 0.96} {'loss': 0.6589, 'learning_rate': 1.074893310680108e-05, 'epoch': 0.96} {'loss': 0.7542, 'learning_rate': 1.0748606674217415e-05, 'epoch': 0.96} {'loss': 0.7283, 'learning_rate': 1.0748280240831545e-05, 'epoch': 0.96} {'loss': 0.8594, 'learning_rate': 1.0747953806643829e-05, 'epoch': 0.96} {'loss': 0.6822, 'learning_rate': 1.074762737165461e-05, 'epoch': 0.96} {'loss': 0.8158, 'learning_rate': 1.0747300935864245e-05, 'epoch': 0.96} {'loss': 0.7015, 'learning_rate': 1.0746974499273075e-05, 'epoch': 0.96} {'loss': 0.7856, 'learning_rate': 1.0746648061881457e-05, 'epoch': 0.96} {'loss': 0.901, 'learning_rate': 1.0746321623689739e-05, 'epoch': 0.96} {'loss': 0.7765, 'learning_rate': 1.0745995184698268e-05, 'epoch': 0.96} {'loss': 0.927, 'learning_rate': 1.0745668744907396e-05, 'epoch': 0.96} {'loss': 0.8661, 'learning_rate': 1.0745342304317474e-05, 'epoch': 0.96} {'loss': 0.7964, 'learning_rate': 1.0745015862928851e-05, 'epoch': 0.96} {'loss': 0.8104, 'learning_rate': 1.0744689420741874e-05, 'epoch': 0.96} {'loss': 0.7968, 'learning_rate': 1.0744362977756895e-05, 'epoch': 0.96} {'loss': 0.9692, 'learning_rate': 1.0744036533974267e-05, 'epoch': 0.96} {'loss': 0.7244, 'learning_rate': 1.0743710089394335e-05, 'epoch': 0.96} {'loss': 0.7679, 'learning_rate': 1.0743383644017449e-05, 'epoch': 0.96} {'loss': 0.7273, 'learning_rate': 1.0743057197843962e-05, 'epoch': 0.96} {'loss': 0.8419, 'learning_rate': 1.0742730750874221e-05, 'epoch': 0.96} {'loss': 0.8562, 'learning_rate': 1.0742404303108578e-05, 'epoch': 0.96} {'loss': 0.7723, 'learning_rate': 1.0742077854547378e-05, 'epoch': 0.96} {'loss': 0.8211, 'learning_rate': 1.074175140519098e-05, 'epoch': 0.96} {'loss': 0.846, 'learning_rate': 1.0741424955039727e-05, 'epoch': 0.96} {'loss': 0.6485, 'learning_rate': 1.0741098504093972e-05, 'epoch': 0.96} {'loss': 0.8067, 'learning_rate': 1.074077205235406e-05, 'epoch': 0.96} {'loss': 0.6949, 'learning_rate': 1.0740445599820343e-05, 'epoch': 0.96} {'loss': 0.8405, 'learning_rate': 1.0740119146493174e-05, 'epoch': 0.96} {'loss': 0.7695, 'learning_rate': 1.0739792692372901e-05, 'epoch': 0.96} {'loss': 0.7687, 'learning_rate': 1.0739466237459872e-05, 'epoch': 0.96} {'loss': 0.8447, 'learning_rate': 1.0739139781754439e-05, 'epoch': 0.96} {'loss': 0.8358, 'learning_rate': 1.0738813325256949e-05, 'epoch': 0.96} {'loss': 0.7659, 'learning_rate': 1.0738486867967755e-05, 'epoch': 0.96} {'loss': 0.6625, 'learning_rate': 1.0738160409887206e-05, 'epoch': 0.96} {'loss': 0.8512, 'learning_rate': 1.073783395101565e-05, 'epoch': 0.96} {'loss': 0.6466, 'learning_rate': 1.0737507491353443e-05, 'epoch': 0.96} {'loss': 0.8299, 'learning_rate': 1.0737181030900925e-05, 'epoch': 0.96} {'loss': 0.6392, 'learning_rate': 1.0736854569658454e-05, 'epoch': 0.96} {'loss': 0.6383, 'learning_rate': 1.0736528107626376e-05, 'epoch': 0.96} {'loss': 0.6609, 'learning_rate': 1.073620164480504e-05, 'epoch': 0.96} {'loss': 0.7831, 'learning_rate': 1.07358751811948e-05, 'epoch': 0.96} {'loss': 0.6219, 'learning_rate': 1.0735548716796001e-05, 'epoch': 0.96} {'loss': 0.7174, 'learning_rate': 1.0735222251608996e-05, 'epoch': 0.96} {'loss': 0.7367, 'learning_rate': 1.0734895785634137e-05, 'epoch': 0.96} {'loss': 0.7029, 'learning_rate': 1.0734569318871768e-05, 'epoch': 0.96} {'loss': 0.7993, 'learning_rate': 1.073424285132224e-05, 'epoch': 0.96} {'loss': 0.6844, 'learning_rate': 1.0733916382985908e-05, 'epoch': 0.96} {'loss': 0.8667, 'learning_rate': 1.0733589913863113e-05, 'epoch': 0.96} {'loss': 0.7055, 'learning_rate': 1.0733263443954215e-05, 'epoch': 0.96} {'loss': 0.6833, 'learning_rate': 1.0732936973259561e-05, 'epoch': 0.96} {'loss': 0.8721, 'learning_rate': 1.0732610501779498e-05, 'epoch': 0.96} {'loss': 0.6665, 'learning_rate': 1.0732284029514372e-05, 'epoch': 0.96} {'loss': 0.8283, 'learning_rate': 1.0731957556464538e-05, 'epoch': 0.96} {'loss': 0.7945, 'learning_rate': 1.0731631082630346e-05, 'epoch': 0.96} {'loss': 0.6145, 'learning_rate': 1.0731304608012148e-05, 'epoch': 0.96} {'loss': 0.8655, 'learning_rate': 1.073097813261029e-05, 'epoch': 0.96} {'loss': 0.7791, 'learning_rate': 1.0730651656425125e-05, 'epoch': 0.96} {'loss': 0.7276, 'learning_rate': 1.0730325179457e-05, 'epoch': 0.96} {'loss': 0.6525, 'learning_rate': 1.0729998701706263e-05, 'epoch': 0.96} {'loss': 0.7939, 'learning_rate': 1.0729672223173266e-05, 'epoch': 0.96} {'loss': 0.7858, 'learning_rate': 1.0729345743858362e-05, 'epoch': 0.96} {'loss': 0.8895, 'learning_rate': 1.0729019263761898e-05, 'epoch': 0.96} {'loss': 0.7197, 'learning_rate': 1.0728692782884224e-05, 'epoch': 0.96} {'loss': 0.881, 'learning_rate': 1.0728366301225688e-05, 'epoch': 0.96} {'loss': 0.8547, 'learning_rate': 1.0728039818786646e-05, 'epoch': 0.96} {'loss': 0.7908, 'learning_rate': 1.072771333556744e-05, 'epoch': 0.96} {'loss': 0.796, 'learning_rate': 1.0727386851568422e-05, 'epoch': 0.96} {'loss': 0.6323, 'learning_rate': 1.0727060366789945e-05, 'epoch': 0.96} {'loss': 0.7563, 'learning_rate': 1.072673388123236e-05, 'epoch': 0.96} {'loss': 0.8202, 'learning_rate': 1.0726407394896012e-05, 'epoch': 0.96} {'loss': 0.7474, 'learning_rate': 1.0726080907781252e-05, 'epoch': 0.96} {'loss': 0.6607, 'learning_rate': 1.0725754419888432e-05, 'epoch': 0.96} {'loss': 0.669, 'learning_rate': 1.07254279312179e-05, 'epoch': 0.96} {'loss': 0.8376, 'learning_rate': 1.0725101441770008e-05, 'epoch': 0.96} {'loss': 0.6767, 'learning_rate': 1.07247749515451e-05, 'epoch': 0.96} {'loss': 0.7305, 'learning_rate': 1.0724448460543534e-05, 'epoch': 0.96} {'loss': 0.6964, 'learning_rate': 1.0724121968765658e-05, 'epoch': 0.96} {'loss': 0.9352, 'learning_rate': 1.0723795476211818e-05, 'epoch': 0.96} {'loss': 0.6446, 'learning_rate': 1.0723468982882364e-05, 'epoch': 0.96} {'loss': 0.982, 'learning_rate': 1.0723142488777647e-05, 'epoch': 0.96} {'loss': 0.8334, 'learning_rate': 1.072281599389802e-05, 'epoch': 0.96} {'loss': 0.7127, 'learning_rate': 1.072248949824383e-05, 'epoch': 0.96} {'loss': 0.9517, 'learning_rate': 1.0722163001815426e-05, 'epoch': 0.96} {'loss': 0.4813, 'learning_rate': 1.0721836504613161e-05, 'epoch': 0.96} {'loss': 0.8712, 'learning_rate': 1.0721510006637384e-05, 'epoch': 0.96} {'loss': 0.6722, 'learning_rate': 1.0721183507888441e-05, 'epoch': 0.96} {'loss': 0.8876, 'learning_rate': 1.0720857008366685e-05, 'epoch': 0.96} {'loss': 0.8949, 'learning_rate': 1.0720530508072468e-05, 'epoch': 0.96} {'loss': 0.8678, 'learning_rate': 1.0720204007006137e-05, 'epoch': 0.96} {'loss': 0.8331, 'learning_rate': 1.071987750516804e-05, 'epoch': 0.96} {'loss': 0.7281, 'learning_rate': 1.071955100255853e-05, 'epoch': 0.96} {'loss': 0.6856, 'learning_rate': 1.0719224499177959e-05, 'epoch': 0.96} {'loss': 0.8403, 'learning_rate': 1.0718897995026671e-05, 'epoch': 0.96} {'loss': 0.8877, 'learning_rate': 1.071857149010502e-05, 'epoch': 0.96} {'loss': 0.7691, 'learning_rate': 1.0718244984413355e-05, 'epoch': 0.96} {'loss': 0.8257, 'learning_rate': 1.0717918477952026e-05, 'epoch': 0.96} {'loss': 0.8618, 'learning_rate': 1.0717591970721382e-05, 'epoch': 0.96} {'loss': 0.8049, 'learning_rate': 1.071726546272177e-05, 'epoch': 0.96} {'loss': 0.9352, 'learning_rate': 1.071693895395355e-05, 'epoch': 0.96} {'loss': 0.6897, 'learning_rate': 1.071661244441706e-05, 'epoch': 0.96} {'loss': 0.7572, 'learning_rate': 1.071628593411266e-05, 'epoch': 0.96} {'loss': 0.6415, 'learning_rate': 1.0715959423040692e-05, 'epoch': 0.96} {'loss': 0.6717, 'learning_rate': 1.0715632911201507e-05, 'epoch': 0.96} {'loss': 0.8158, 'learning_rate': 1.0715306398595457e-05, 'epoch': 0.96} {'loss': 0.976, 'learning_rate': 1.0714979885222894e-05, 'epoch': 0.96} {'loss': 0.7881, 'learning_rate': 1.0714653371084168e-05, 'epoch': 0.96} {'loss': 0.8484, 'learning_rate': 1.0714326856179622e-05, 'epoch': 0.96} {'loss': 0.6329, 'learning_rate': 1.071400034050961e-05, 'epoch': 0.96} {'loss': 0.6497, 'learning_rate': 1.0713673824074485e-05, 'epoch': 0.96} {'loss': 0.7629, 'learning_rate': 1.0713347306874594e-05, 'epoch': 0.96} {'loss': 0.7514, 'learning_rate': 1.0713020788910282e-05, 'epoch': 0.96} {'loss': 0.7237, 'learning_rate': 1.071269427018191e-05, 'epoch': 0.96} {'loss': 0.6577, 'learning_rate': 1.0712367750689818e-05, 'epoch': 0.96} {'loss': 0.6252, 'learning_rate': 1.0712041230434362e-05, 'epoch': 0.96} {'loss': 0.7391, 'learning_rate': 1.071171470941589e-05, 'epoch': 0.96} {'loss': 0.74, 'learning_rate': 1.0711388187634748e-05, 'epoch': 0.96} {'loss': 0.7538, 'learning_rate': 1.0711061665091292e-05, 'epoch': 0.96} {'loss': 0.7108, 'learning_rate': 1.0710735141785866e-05, 'epoch': 0.96} {'loss': 0.6576, 'learning_rate': 1.0710408617718828e-05, 'epoch': 0.96} {'loss': 0.725, 'learning_rate': 1.0710082092890524e-05, 'epoch': 0.96} {'loss': 0.9114, 'learning_rate': 1.0709755567301298e-05, 'epoch': 0.96} {'loss': 0.7365, 'learning_rate': 1.0709429040951507e-05, 'epoch': 0.96} {'loss': 0.8491, 'learning_rate': 1.0709102513841497e-05, 'epoch': 0.96} {'loss': 0.7215, 'learning_rate': 1.070877598597162e-05, 'epoch': 0.96} {'loss': 0.9484, 'learning_rate': 1.0708449457342228e-05, 'epoch': 0.96} {'loss': 0.814, 'learning_rate': 1.0708122927953666e-05, 'epoch': 0.96} {'loss': 0.7478, 'learning_rate': 1.070779639780629e-05, 'epoch': 0.96} {'loss': 0.7056, 'learning_rate': 1.0707469866900441e-05, 'epoch': 0.96} {'loss': 0.8375, 'learning_rate': 1.0707143335236478e-05, 'epoch': 0.96} {'loss': 0.7504, 'learning_rate': 1.0706816802814745e-05, 'epoch': 0.96} {'loss': 0.7991, 'learning_rate': 1.0706490269635594e-05, 'epoch': 0.96} {'loss': 0.7405, 'learning_rate': 1.0706163735699377e-05, 'epoch': 0.96} {'loss': 0.654, 'learning_rate': 1.0705837201006442e-05, 'epoch': 0.96} {'loss': 0.6504, 'learning_rate': 1.0705510665557138e-05, 'epoch': 0.96} {'loss': 0.7936, 'learning_rate': 1.0705184129351816e-05, 'epoch': 0.96} {'loss': 0.6065, 'learning_rate': 1.0704857592390822e-05, 'epoch': 0.96} {'loss': 0.7009, 'learning_rate': 1.0704531054674512e-05, 'epoch': 0.96} {'loss': 0.6595, 'learning_rate': 1.0704204516203236e-05, 'epoch': 0.96} {'loss': 0.908, 'learning_rate': 1.0703877976977337e-05, 'epoch': 0.96} {'loss': 0.6225, 'learning_rate': 1.070355143699717e-05, 'epoch': 0.96} {'loss': 0.6543, 'learning_rate': 1.0703224896263087e-05, 'epoch': 0.96} {'loss': 0.6686, 'learning_rate': 1.0702898354775433e-05, 'epoch': 0.96} {'loss': 0.8116, 'learning_rate': 1.070257181253456e-05, 'epoch': 0.96} {'loss': 0.787, 'learning_rate': 1.0702245269540816e-05, 'epoch': 0.96} {'loss': 0.616, 'learning_rate': 1.0701918725794558e-05, 'epoch': 0.96} {'loss': 0.9213, 'learning_rate': 1.0701592181296126e-05, 'epoch': 0.96} {'loss': 0.799, 'learning_rate': 1.0701265636045876e-05, 'epoch': 0.96} {'loss': 0.7356, 'learning_rate': 1.0700939090044157e-05, 'epoch': 0.96} {'loss': 0.7908, 'learning_rate': 1.070061254329132e-05, 'epoch': 0.96} {'loss': 0.7496, 'learning_rate': 1.0700285995787708e-05, 'epoch': 0.96} {'loss': 0.7674, 'learning_rate': 1.0699959447533683e-05, 'epoch': 0.96} {'loss': 0.7353, 'learning_rate': 1.0699632898529587e-05, 'epoch': 0.96} {'loss': 0.7942, 'learning_rate': 1.069930634877577e-05, 'epoch': 0.96} {'loss': 0.7427, 'learning_rate': 1.0698979798272582e-05, 'epoch': 0.96} {'loss': 0.8175, 'learning_rate': 1.0698653247020374e-05, 'epoch': 0.96} {'loss': 0.7491, 'learning_rate': 1.0698326695019497e-05, 'epoch': 0.96} {'loss': 0.7083, 'learning_rate': 1.0698000142270302e-05, 'epoch': 0.96} {'loss': 0.8635, 'learning_rate': 1.0697673588773132e-05, 'epoch': 0.96} {'loss': 0.6722, 'learning_rate': 1.0697347034528345e-05, 'epoch': 0.96} {'loss': 0.7862, 'learning_rate': 1.0697020479536286e-05, 'epoch': 0.96} {'loss': 0.8066, 'learning_rate': 1.0696693923797308e-05, 'epoch': 0.96} {'loss': 0.8793, 'learning_rate': 1.069636736731176e-05, 'epoch': 0.96} {'loss': 0.6374, 'learning_rate': 1.0696040810079991e-05, 'epoch': 0.96} {'loss': 0.8155, 'learning_rate': 1.0695714252102352e-05, 'epoch': 0.96} {'loss': 0.7541, 'learning_rate': 1.069538769337919e-05, 'epoch': 0.96} {'loss': 0.8139, 'learning_rate': 1.0695061133910858e-05, 'epoch': 0.96} {'loss': 0.9336, 'learning_rate': 1.0694734573697706e-05, 'epoch': 0.96} {'loss': 0.8954, 'learning_rate': 1.0694408012740084e-05, 'epoch': 0.96} {'loss': 0.8111, 'learning_rate': 1.069408145103834e-05, 'epoch': 0.96} {'loss': 0.8739, 'learning_rate': 1.0693754888592829e-05, 'epoch': 0.96} {'loss': 0.8189, 'learning_rate': 1.0693428325403892e-05, 'epoch': 0.96} {'loss': 0.9344, 'learning_rate': 1.0693101761471885e-05, 'epoch': 0.96} {'loss': 0.8621, 'learning_rate': 1.0692775196797159e-05, 'epoch': 0.96} {'loss': 1.0519, 'learning_rate': 1.0692448631380059e-05, 'epoch': 0.96} {'loss': 0.8137, 'learning_rate': 1.069212206522094e-05, 'epoch': 0.96} {'loss': 0.7976, 'learning_rate': 1.069179549832015e-05, 'epoch': 0.96} {'loss': 0.7721, 'learning_rate': 1.0691468930678037e-05, 'epoch': 0.96} {'loss': 0.9512, 'learning_rate': 1.0691142362294953e-05, 'epoch': 0.96} {'loss': 0.8229, 'learning_rate': 1.0690815793171247e-05, 'epoch': 0.96} {'loss': 0.8606, 'learning_rate': 1.069048922330727e-05, 'epoch': 0.96} {'loss': 0.7236, 'learning_rate': 1.0690162652703371e-05, 'epoch': 0.96} {'loss': 0.737, 'learning_rate': 1.0689836081359904e-05, 'epoch': 0.96} {'loss': 0.7003, 'learning_rate': 1.0689509509277212e-05, 'epoch': 0.96} {'loss': 0.8832, 'learning_rate': 1.0689182936455649e-05, 'epoch': 0.96} {'loss': 0.8219, 'learning_rate': 1.0688856362895564e-05, 'epoch': 0.96} {'loss': 0.7119, 'learning_rate': 1.0688529788597307e-05, 'epoch': 0.96} {'loss': 0.6445, 'learning_rate': 1.0688203213561228e-05, 'epoch': 0.96} {'loss': 0.7535, 'learning_rate': 1.068787663778768e-05, 'epoch': 0.96} {'loss': 0.7166, 'learning_rate': 1.0687550061277005e-05, 'epoch': 0.96} {'loss': 0.7938, 'learning_rate': 1.0687223484029562e-05, 'epoch': 0.96} {'loss': 0.7999, 'learning_rate': 1.0686896906045695e-05, 'epoch': 0.96} {'loss': 0.6512, 'learning_rate': 1.0686570327325759e-05, 'epoch': 0.96} {'loss': 0.7766, 'learning_rate': 1.0686243747870097e-05, 'epoch': 0.96} {'loss': 0.8777, 'learning_rate': 1.0685917167679064e-05, 'epoch': 0.96} {'loss': 0.8548, 'learning_rate': 1.0685590586753012e-05, 'epoch': 0.96} {'loss': 0.6733, 'learning_rate': 1.0685264005092287e-05, 'epoch': 0.96} {'loss': 0.8922, 'learning_rate': 1.0684937422697236e-05, 'epoch': 0.96} {'loss': 0.8542, 'learning_rate': 1.0684610839568215e-05, 'epoch': 0.96} {'loss': 0.5997, 'learning_rate': 1.068428425570557e-05, 'epoch': 0.96} {'loss': 0.7337, 'learning_rate': 1.0683957671109654e-05, 'epoch': 0.96} {'loss': 0.757, 'learning_rate': 1.068363108578082e-05, 'epoch': 0.96} {'loss': 0.7047, 'learning_rate': 1.0683304499719407e-05, 'epoch': 0.96} {'loss': 0.9096, 'learning_rate': 1.0682977912925776e-05, 'epoch': 0.96} {'loss': 0.97, 'learning_rate': 1.0682651325400271e-05, 'epoch': 0.96} {'loss': 0.7597, 'learning_rate': 1.0682324737143241e-05, 'epoch': 0.96} {'loss': 0.9475, 'learning_rate': 1.068199814815504e-05, 'epoch': 0.96} {'loss': 0.9438, 'learning_rate': 1.0681671558436015e-05, 'epoch': 0.96} {'loss': 0.6903, 'learning_rate': 1.0681344967986522e-05, 'epoch': 0.96} {'loss': 0.6451, 'learning_rate': 1.0681018376806902e-05, 'epoch': 0.96} {'loss': 0.883, 'learning_rate': 1.0680691784897515e-05, 'epoch': 0.96} {'loss': 0.7635, 'learning_rate': 1.06803651922587e-05, 'epoch': 0.96} {'loss': 0.7144, 'learning_rate': 1.0680038598890812e-05, 'epoch': 0.96} {'loss': 0.7342, 'learning_rate': 1.0679712004794203e-05, 'epoch': 0.96} {'loss': 0.979, 'learning_rate': 1.0679385409969222e-05, 'epoch': 0.96} {'loss': 0.8013, 'learning_rate': 1.0679058814416217e-05, 'epoch': 0.96} {'loss': 0.7178, 'learning_rate': 1.0678732218135539e-05, 'epoch': 0.96} {'loss': 0.8492, 'learning_rate': 1.067840562112754e-05, 'epoch': 0.96} {'loss': 0.7575, 'learning_rate': 1.0678079023392566e-05, 'epoch': 0.96} {'loss': 0.985, 'learning_rate': 1.067775242493097e-05, 'epoch': 0.96} {'loss': 0.7223, 'learning_rate': 1.0677425825743102e-05, 'epoch': 0.96} {'loss': 0.7521, 'learning_rate': 1.0677099225829311e-05, 'epoch': 0.96} {'loss': 0.8445, 'learning_rate': 1.0676772625189944e-05, 'epoch': 0.96} {'loss': 0.8175, 'learning_rate': 1.0676446023825355e-05, 'epoch': 0.96} {'loss': 0.6974, 'learning_rate': 1.0676119421735898e-05, 'epoch': 0.96} {'loss': 0.777, 'learning_rate': 1.0675792818921913e-05, 'epoch': 0.96} {'loss': 0.9165, 'learning_rate': 1.0675466215383758e-05, 'epoch': 0.96} {'loss': 0.5933, 'learning_rate': 1.0675139611121778e-05, 'epoch': 0.96} {'loss': 0.7703, 'learning_rate': 1.0674813006136324e-05, 'epoch': 0.96} {'loss': 0.7594, 'learning_rate': 1.0674486400427749e-05, 'epoch': 0.96} {'loss': 0.6966, 'learning_rate': 1.06741597939964e-05, 'epoch': 0.96} {'loss': 0.8385, 'learning_rate': 1.0673833186842628e-05, 'epoch': 0.96} {'loss': 0.8066, 'learning_rate': 1.0673506578966784e-05, 'epoch': 0.96} {'loss': 0.6753, 'learning_rate': 1.0673179970369215e-05, 'epoch': 0.96} {'loss': 0.7394, 'learning_rate': 1.0672853361050274e-05, 'epoch': 0.96} {'loss': 0.7169, 'learning_rate': 1.067252675101031e-05, 'epoch': 0.96} {'loss': 0.7671, 'learning_rate': 1.0672200140249672e-05, 'epoch': 0.96} {'loss': 0.7177, 'learning_rate': 1.0671873528768713e-05, 'epoch': 0.96} {'loss': 0.8026, 'learning_rate': 1.067154691656778e-05, 'epoch': 0.96} {'loss': 0.569, 'learning_rate': 1.0671220303647222e-05, 'epoch': 0.96} {'loss': 0.8643, 'learning_rate': 1.0670893690007393e-05, 'epoch': 0.96} {'loss': 0.7639, 'learning_rate': 1.0670567075648638e-05, 'epoch': 0.96} {'loss': 0.8493, 'learning_rate': 1.0670240460571313e-05, 'epoch': 0.96} {'loss': 0.7667, 'learning_rate': 1.0669913844775764e-05, 'epoch': 0.96} {'loss': 0.7844, 'learning_rate': 1.0669587228262341e-05, 'epoch': 0.96} {'loss': 0.9363, 'learning_rate': 1.0669260611031398e-05, 'epoch': 0.96} {'loss': 0.7054, 'learning_rate': 1.066893399308328e-05, 'epoch': 0.96} {'loss': 0.6694, 'learning_rate': 1.0668607374418337e-05, 'epoch': 0.96} {'loss': 0.7727, 'learning_rate': 1.066828075503692e-05, 'epoch': 0.96} {'loss': 0.7966, 'learning_rate': 1.0667954134939382e-05, 'epoch': 0.96} {'loss': 0.7549, 'learning_rate': 1.0667627514126068e-05, 'epoch': 0.96} {'loss': 0.8091, 'learning_rate': 1.0667300892597337e-05, 'epoch': 0.96} {'loss': 0.9946, 'learning_rate': 1.066697427035353e-05, 'epoch': 0.96} {'loss': 0.8085, 'learning_rate': 1.0666647647394999e-05, 'epoch': 0.96} {'loss': 0.7905, 'learning_rate': 1.0666321023722095e-05, 'epoch': 0.96} {'loss': 0.9453, 'learning_rate': 1.0665994399335166e-05, 'epoch': 0.96} {'loss': 0.7492, 'learning_rate': 1.0665667774234567e-05, 'epoch': 0.96} {'loss': 0.607, 'learning_rate': 1.0665341148420643e-05, 'epoch': 0.96} {'loss': 0.7977, 'learning_rate': 1.0665014521893749e-05, 'epoch': 0.96} {'loss': 0.7292, 'learning_rate': 1.0664687894654231e-05, 'epoch': 0.96} {'loss': 0.8097, 'learning_rate': 1.0664361266702436e-05, 'epoch': 0.96} {'loss': 0.731, 'learning_rate': 1.066403463803872e-05, 'epoch': 0.96} {'loss': 0.6023, 'learning_rate': 1.0663708008663432e-05, 'epoch': 0.96} {'loss': 0.8825, 'learning_rate': 1.066338137857692e-05, 'epoch': 0.96} {'loss': 0.7015, 'learning_rate': 1.0663054747779538e-05, 'epoch': 0.96} {'loss': 0.8198, 'learning_rate': 1.0662728116271629e-05, 'epoch': 0.96} {'loss': 0.8475, 'learning_rate': 1.0662401484053548e-05, 'epoch': 0.96} {'loss': 0.6701, 'learning_rate': 1.0662074851125646e-05, 'epoch': 0.96} {'loss': 0.8747, 'learning_rate': 1.0661748217488269e-05, 'epoch': 0.96} {'loss': 0.6987, 'learning_rate': 1.0661421583141769e-05, 'epoch': 0.96} {'loss': 0.7083, 'learning_rate': 1.0661094948086497e-05, 'epoch': 0.96} {'loss': 0.7827, 'learning_rate': 1.0660768312322802e-05, 'epoch': 0.96} {'loss': 0.8016, 'learning_rate': 1.0660441675851034e-05, 'epoch': 0.96} {'loss': 0.7629, 'learning_rate': 1.0660115038671544e-05, 'epoch': 0.96} {'loss': 0.6487, 'learning_rate': 1.0659788400784679e-05, 'epoch': 0.96} {'loss': 0.8231, 'learning_rate': 1.065946176219079e-05, 'epoch': 0.96} {'loss': 0.8402, 'learning_rate': 1.0659135122890232e-05, 'epoch': 0.96} {'loss': 0.7123, 'learning_rate': 1.0658808482883352e-05, 'epoch': 0.96} {'loss': 0.6721, 'learning_rate': 1.0658481842170495e-05, 'epoch': 0.96} {'loss': 0.7161, 'learning_rate': 1.0658155200752019e-05, 'epoch': 0.96} {'loss': 0.8515, 'learning_rate': 1.0657828558628268e-05, 'epoch': 0.96} {'loss': 0.7173, 'learning_rate': 1.0657501915799593e-05, 'epoch': 0.96} {'loss': 0.8331, 'learning_rate': 1.0657175272266347e-05, 'epoch': 0.96} {'loss': 0.85, 'learning_rate': 1.065684862802888e-05, 'epoch': 0.96} {'loss': 0.6628, 'learning_rate': 1.065652198308754e-05, 'epoch': 0.96} {'loss': 0.9913, 'learning_rate': 1.0656195337442674e-05, 'epoch': 0.96} {'loss': 0.7047, 'learning_rate': 1.0655868691094639e-05, 'epoch': 0.96} {'loss': 0.8451, 'learning_rate': 1.065554204404378e-05, 'epoch': 0.96} {'loss': 0.783, 'learning_rate': 1.065521539629045e-05, 'epoch': 0.96} {'loss': 0.7382, 'learning_rate': 1.0654888747834997e-05, 'epoch': 0.96} {'loss': 0.5766, 'learning_rate': 1.0654562098677772e-05, 'epoch': 0.96} {'loss': 0.7506, 'learning_rate': 1.0654235448819121e-05, 'epoch': 0.96} {'loss': 0.9252, 'learning_rate': 1.0653908798259401e-05, 'epoch': 0.96} {'loss': 0.7266, 'learning_rate': 1.065358214699896e-05, 'epoch': 0.96} {'loss': 0.7061, 'learning_rate': 1.0653255495038144e-05, 'epoch': 0.96} {'loss': 0.7858, 'learning_rate': 1.0652928842377306e-05, 'epoch': 0.96} {'loss': 0.6191, 'learning_rate': 1.0652602189016799e-05, 'epoch': 0.96} {'loss': 0.9252, 'learning_rate': 1.0652275534956966e-05, 'epoch': 0.96} {'loss': 0.7097, 'learning_rate': 1.0651948880198162e-05, 'epoch': 0.96} {'loss': 0.7081, 'learning_rate': 1.0651622224740734e-05, 'epoch': 0.96} {'loss': 0.7695, 'learning_rate': 1.0651295568585039e-05, 'epoch': 0.96} {'loss': 0.824, 'learning_rate': 1.0650968911731419e-05, 'epoch': 0.96} {'loss': 0.7752, 'learning_rate': 1.0650642254180228e-05, 'epoch': 0.96} {'loss': 0.9515, 'learning_rate': 1.0650315595931815e-05, 'epoch': 0.96} {'loss': 0.8115, 'learning_rate': 1.0649988936986528e-05, 'epoch': 0.96} {'loss': 0.7746, 'learning_rate': 1.064966227734472e-05, 'epoch': 0.96} {'loss': 0.8271, 'learning_rate': 1.0649335617006741e-05, 'epoch': 0.96} {'loss': 0.8497, 'learning_rate': 1.0649008955972942e-05, 'epoch': 0.96} {'loss': 0.7705, 'learning_rate': 1.064868229424367e-05, 'epoch': 0.96} {'loss': 0.7633, 'learning_rate': 1.0648355631819277e-05, 'epoch': 0.96} {'loss': 0.655, 'learning_rate': 1.0648028968700108e-05, 'epoch': 0.96} {'loss': 0.7057, 'learning_rate': 1.064770230488652e-05, 'epoch': 0.96} {'loss': 0.6706, 'learning_rate': 1.064737564037886e-05, 'epoch': 0.96} {'loss': 0.6055, 'learning_rate': 1.0647048975177483e-05, 'epoch': 0.96} {'loss': 0.9188, 'learning_rate': 1.0646722309282733e-05, 'epoch': 0.96} {'loss': 0.6452, 'learning_rate': 1.064639564269496e-05, 'epoch': 0.96} {'loss': 0.7951, 'learning_rate': 1.0646068975414514e-05, 'epoch': 0.96} {'loss': 0.6846, 'learning_rate': 1.0645742307441749e-05, 'epoch': 0.96} {'loss': 0.6758, 'learning_rate': 1.0645415638777013e-05, 'epoch': 0.96} {'loss': 0.7316, 'learning_rate': 1.0645088969420654e-05, 'epoch': 0.96} {'loss': 0.8547, 'learning_rate': 1.0644762299373026e-05, 'epoch': 0.96} {'loss': 0.7616, 'learning_rate': 1.0644435628634477e-05, 'epoch': 0.96} {'loss': 0.9165, 'learning_rate': 1.0644108957205358e-05, 'epoch': 0.96} {'loss': 0.7302, 'learning_rate': 1.0643782285086015e-05, 'epoch': 0.96} {'loss': 0.8479, 'learning_rate': 1.0643455612276803e-05, 'epoch': 0.96} {'loss': 0.7049, 'learning_rate': 1.0643128938778069e-05, 'epoch': 0.96} {'loss': 0.8584, 'learning_rate': 1.0642802264590165e-05, 'epoch': 0.96} {'loss': 0.9095, 'learning_rate': 1.0642475589713442e-05, 'epoch': 0.96} {'loss': 0.8593, 'learning_rate': 1.0642148914148247e-05, 'epoch': 0.96} {'loss': 0.8868, 'learning_rate': 1.0641822237894931e-05, 'epoch': 0.96} {'loss': 0.667, 'learning_rate': 1.0641495560953845e-05, 'epoch': 0.96} {'loss': 0.6955, 'learning_rate': 1.0641168883325337e-05, 'epoch': 0.96} {'loss': 0.8558, 'learning_rate': 1.064084220500976e-05, 'epoch': 0.96} {'loss': 0.7743, 'learning_rate': 1.0640515526007464e-05, 'epoch': 0.96} {'loss': 0.5782, 'learning_rate': 1.0640188846318798e-05, 'epoch': 0.96} {'loss': 0.8132, 'learning_rate': 1.0639862165944113e-05, 'epoch': 0.96} {'loss': 0.7386, 'learning_rate': 1.0639535484883754e-05, 'epoch': 0.96} {'loss': 0.5839, 'learning_rate': 1.0639208803138075e-05, 'epoch': 0.96} {'loss': 0.8209, 'learning_rate': 1.0638882120707428e-05, 'epoch': 0.96} {'loss': 0.7771, 'learning_rate': 1.063855543759216e-05, 'epoch': 0.96} {'loss': 0.7532, 'learning_rate': 1.0638228753792625e-05, 'epoch': 0.96} {'loss': 0.887, 'learning_rate': 1.0637902069309168e-05, 'epoch': 0.96} {'loss': 0.843, 'learning_rate': 1.0637575384142143e-05, 'epoch': 0.96} {'loss': 0.8091, 'learning_rate': 1.0637248698291895e-05, 'epoch': 0.96} {'loss': 0.7081, 'learning_rate': 1.0636922011758779e-05, 'epoch': 0.96} {'loss': 0.7497, 'learning_rate': 1.0636595324543144e-05, 'epoch': 0.96} {'loss': 0.8664, 'learning_rate': 1.0636268636645341e-05, 'epoch': 0.96} {'loss': 0.8016, 'learning_rate': 1.0635941948065717e-05, 'epoch': 0.96} {'loss': 0.8304, 'learning_rate': 1.0635615258804625e-05, 'epoch': 0.96} {'loss': 0.8056, 'learning_rate': 1.0635288568862415e-05, 'epoch': 0.96} {'loss': 0.8391, 'learning_rate': 1.0634961878239434e-05, 'epoch': 0.96} {'loss': 0.714, 'learning_rate': 1.0634635186936033e-05, 'epoch': 0.96} {'loss': 0.7958, 'learning_rate': 1.0634308494952565e-05, 'epoch': 0.96} {'loss': 0.8069, 'learning_rate': 1.0633981802289379e-05, 'epoch': 0.96} {'loss': 0.666, 'learning_rate': 1.063365510894682e-05, 'epoch': 0.96} {'loss': 0.7702, 'learning_rate': 1.0633328414925247e-05, 'epoch': 0.96} {'loss': 0.6222, 'learning_rate': 1.0633001720225004e-05, 'epoch': 0.96} {'loss': 0.7462, 'learning_rate': 1.0632675024846442e-05, 'epoch': 0.96} {'loss': 0.7678, 'learning_rate': 1.0632348328789914e-05, 'epoch': 0.96} {'loss': 0.855, 'learning_rate': 1.0632021632055765e-05, 'epoch': 0.96} {'loss': 0.6525, 'learning_rate': 1.0631694934644347e-05, 'epoch': 0.96} {'loss': 0.8851, 'learning_rate': 1.0631368236556013e-05, 'epoch': 0.96} {'loss': 0.8371, 'learning_rate': 1.063104153779111e-05, 'epoch': 0.96} {'loss': 0.8562, 'learning_rate': 1.0630714838349988e-05, 'epoch': 0.96} {'loss': 0.8018, 'learning_rate': 1.0630388138232998e-05, 'epoch': 0.96} {'loss': 0.7528, 'learning_rate': 1.0630061437440496e-05, 'epoch': 0.96} {'loss': 0.7127, 'learning_rate': 1.0629734735972819e-05, 'epoch': 0.96} {'loss': 0.7894, 'learning_rate': 1.0629408033830329e-05, 'epoch': 0.96} {'loss': 0.6524, 'learning_rate': 1.0629081331013367e-05, 'epoch': 0.96} {'loss': 0.8934, 'learning_rate': 1.0628754627522294e-05, 'epoch': 0.96} {'loss': 0.8501, 'learning_rate': 1.0628427923357447e-05, 'epoch': 0.96} {'loss': 0.901, 'learning_rate': 1.0628101218519186e-05, 'epoch': 0.96} {'loss': 0.8018, 'learning_rate': 1.0627774513007858e-05, 'epoch': 0.96} {'loss': 0.7158, 'learning_rate': 1.0627447806823812e-05, 'epoch': 0.96} {'loss': 0.7685, 'learning_rate': 1.0627121099967399e-05, 'epoch': 0.96} {'loss': 0.7698, 'learning_rate': 1.062679439243897e-05, 'epoch': 0.96} {'loss': 0.6627, 'learning_rate': 1.0626467684238875e-05, 'epoch': 0.96} {'loss': 0.6489, 'learning_rate': 1.0626140975367466e-05, 'epoch': 0.96} {'loss': 0.7087, 'learning_rate': 1.0625814265825082e-05, 'epoch': 0.96} {'loss': 0.8716, 'learning_rate': 1.0625487555612088e-05, 'epoch': 0.96} {'loss': 0.7315, 'learning_rate': 1.0625160844728826e-05, 'epoch': 0.96} {'loss': 0.8625, 'learning_rate': 1.0624834133175646e-05, 'epoch': 0.96} {'loss': 0.8612, 'learning_rate': 1.06245074209529e-05, 'epoch': 0.96} {'loss': 0.7066, 'learning_rate': 1.062418070806094e-05, 'epoch': 0.96} {'loss': 0.7172, 'learning_rate': 1.0623853994500118e-05, 'epoch': 0.96} {'loss': 0.7799, 'learning_rate': 1.0623527280270773e-05, 'epoch': 0.96} {'loss': 0.7692, 'learning_rate': 1.0623200565373264e-05, 'epoch': 0.96} {'loss': 0.7783, 'learning_rate': 1.062287384980794e-05, 'epoch': 0.96} {'loss': 0.7087, 'learning_rate': 1.062254713357515e-05, 'epoch': 0.96} {'loss': 0.8642, 'learning_rate': 1.0622220416675247e-05, 'epoch': 0.96} {'loss': 0.6232, 'learning_rate': 1.0621893699108577e-05, 'epoch': 0.96} {'loss': 0.649, 'learning_rate': 1.0621566980875493e-05, 'epoch': 0.96} {'loss': 0.7887, 'learning_rate': 1.062124026197634e-05, 'epoch': 0.96} {'loss': 0.8306, 'learning_rate': 1.0620913542411476e-05, 'epoch': 0.96} {'loss': 0.7782, 'learning_rate': 1.0620586822181242e-05, 'epoch': 0.96} {'loss': 0.6052, 'learning_rate': 1.0620260101285997e-05, 'epoch': 0.96} {'loss': 0.8407, 'learning_rate': 1.0619933379726088e-05, 'epoch': 0.96} {'loss': 0.8394, 'learning_rate': 1.0619606657501867e-05, 'epoch': 0.96} {'loss': 0.7269, 'learning_rate': 1.0619279934613675e-05, 'epoch': 0.96} {'loss': 0.6484, 'learning_rate': 1.0618953211061873e-05, 'epoch': 0.96} {'loss': 0.8509, 'learning_rate': 1.0618626486846804e-05, 'epoch': 0.96} {'loss': 0.9568, 'learning_rate': 1.0618299761968822e-05, 'epoch': 0.96} {'loss': 1.0511, 'learning_rate': 1.0617973036428277e-05, 'epoch': 0.96} {'loss': 0.8478, 'learning_rate': 1.0617646310225518e-05, 'epoch': 0.96} {'loss': 0.6719, 'learning_rate': 1.0617319583360897e-05, 'epoch': 0.96} {'loss': 0.7491, 'learning_rate': 1.0616992855834758e-05, 'epoch': 0.96} {'loss': 0.8191, 'learning_rate': 1.0616666127647457e-05, 'epoch': 0.96} {'loss': 0.7471, 'learning_rate': 1.0616339398799343e-05, 'epoch': 0.96} {'loss': 0.8188, 'learning_rate': 1.0616012669290765e-05, 'epoch': 0.96} {'loss': 0.8001, 'learning_rate': 1.0615685939122076e-05, 'epoch': 0.96} {'loss': 0.8399, 'learning_rate': 1.0615359208293623e-05, 'epoch': 0.96} {'loss': 0.7915, 'learning_rate': 1.0615032476805758e-05, 'epoch': 0.96} {'loss': 0.821, 'learning_rate': 1.0614705744658826e-05, 'epoch': 0.96} {'loss': 0.8488, 'learning_rate': 1.0614379011853185e-05, 'epoch': 0.96} {'loss': 0.6898, 'learning_rate': 1.061405227838918e-05, 'epoch': 0.96} {'loss': 0.7531, 'learning_rate': 1.0613725544267164e-05, 'epoch': 0.96} {'loss': 0.6606, 'learning_rate': 1.0613398809487485e-05, 'epoch': 0.96} {'loss': 0.8105, 'learning_rate': 1.0613072074050492e-05, 'epoch': 0.96} {'loss': 0.7818, 'learning_rate': 1.061274533795654e-05, 'epoch': 0.96} {'loss': 0.8687, 'learning_rate': 1.0612418601205976e-05, 'epoch': 0.96} {'loss': 0.9188, 'learning_rate': 1.0612091863799148e-05, 'epoch': 0.96} {'loss': 0.6349, 'learning_rate': 1.0611765125736412e-05, 'epoch': 0.96} {'loss': 0.6262, 'learning_rate': 1.0611438387018109e-05, 'epoch': 0.96} {'loss': 0.9963, 'learning_rate': 1.0611111647644596e-05, 'epoch': 0.96} {'loss': 0.7999, 'learning_rate': 1.0610784907616223e-05, 'epoch': 0.96} {'loss': 0.6789, 'learning_rate': 1.061045816693334e-05, 'epoch': 0.96} {'loss': 0.712, 'learning_rate': 1.0610131425596295e-05, 'epoch': 0.96} {'loss': 0.791, 'learning_rate': 1.0609804683605439e-05, 'epoch': 0.96} {'loss': 0.7314, 'learning_rate': 1.0609477940961121e-05, 'epoch': 0.96} {'loss': 0.7621, 'learning_rate': 1.0609151197663694e-05, 'epoch': 0.96} {'loss': 0.7558, 'learning_rate': 1.0608824453713505e-05, 'epoch': 0.96} {'loss': 0.7092, 'learning_rate': 1.0608497709110908e-05, 'epoch': 0.96} {'loss': 0.5994, 'learning_rate': 1.060817096385625e-05, 'epoch': 0.96} {'loss': 0.7412, 'learning_rate': 1.060784421794988e-05, 'epoch': 0.96} {'loss': 0.8941, 'learning_rate': 1.0607517471392153e-05, 'epoch': 0.96} {'loss': 0.6749, 'learning_rate': 1.0607190724183414e-05, 'epoch': 0.96} {'loss': 0.73, 'learning_rate': 1.0606863976324016e-05, 'epoch': 0.96} {'loss': 0.6274, 'learning_rate': 1.0606537227814306e-05, 'epoch': 0.96} {'loss': 0.8948, 'learning_rate': 1.0606210478654642e-05, 'epoch': 0.96} {'loss': 0.6669, 'learning_rate': 1.0605883728845366e-05, 'epoch': 0.96} {'loss': 0.9179, 'learning_rate': 1.060555697838683e-05, 'epoch': 0.96} {'loss': 0.6545, 'learning_rate': 1.0605230227279386e-05, 'epoch': 0.96} {'loss': 0.8316, 'learning_rate': 1.0604903475523382e-05, 'epoch': 0.96} {'loss': 0.5428, 'learning_rate': 1.0604576723119169e-05, 'epoch': 0.96} {'loss': 0.7371, 'learning_rate': 1.06042499700671e-05, 'epoch': 0.96} {'loss': 0.8493, 'learning_rate': 1.0603923216367522e-05, 'epoch': 0.96} {'loss': 0.6144, 'learning_rate': 1.0603596462020786e-05, 'epoch': 0.96} {'loss': 0.8754, 'learning_rate': 1.0603269707027242e-05, 'epoch': 0.96} {'loss': 0.8791, 'learning_rate': 1.0602942951387238e-05, 'epoch': 0.96} {'loss': 0.8813, 'learning_rate': 1.0602616195101125e-05, 'epoch': 0.96} {'loss': 0.8653, 'learning_rate': 1.0602289438169258e-05, 'epoch': 0.96} {'loss': 0.7832, 'learning_rate': 1.060196268059198e-05, 'epoch': 0.96} {'loss': 0.8629, 'learning_rate': 1.060163592236965e-05, 'epoch': 0.96} {'loss': 0.8073, 'learning_rate': 1.0601309163502611e-05, 'epoch': 0.96} {'loss': 0.7196, 'learning_rate': 1.0600982403991212e-05, 'epoch': 0.96} {'loss': 0.9498, 'learning_rate': 1.0600655643835807e-05, 'epoch': 0.96} {'loss': 0.8242, 'learning_rate': 1.0600328883036746e-05, 'epoch': 0.96} {'loss': 0.6875, 'learning_rate': 1.0600002121594377e-05, 'epoch': 0.97} {'loss': 0.6746, 'learning_rate': 1.0599675359509051e-05, 'epoch': 0.97} {'loss': 0.6845, 'learning_rate': 1.0599348596781122e-05, 'epoch': 0.97} {'loss': 0.6838, 'learning_rate': 1.0599021833410938e-05, 'epoch': 0.97} {'loss': 0.7677, 'learning_rate': 1.0598695069398846e-05, 'epoch': 0.97} {'loss': 0.6585, 'learning_rate': 1.0598368304745196e-05, 'epoch': 0.97} {'loss': 0.6237, 'learning_rate': 1.0598041539450344e-05, 'epoch': 0.97} {'loss': 0.7217, 'learning_rate': 1.0597714773514633e-05, 'epoch': 0.97} {'loss': 0.9021, 'learning_rate': 1.0597388006938418e-05, 'epoch': 0.97} {'loss': 0.7348, 'learning_rate': 1.059706123972205e-05, 'epoch': 0.97} {'loss': 0.7002, 'learning_rate': 1.0596734471865874e-05, 'epoch': 0.97} {'loss': 0.7921, 'learning_rate': 1.0596407703370247e-05, 'epoch': 0.97} {'loss': 0.861, 'learning_rate': 1.0596080934235511e-05, 'epoch': 0.97} {'loss': 0.7381, 'learning_rate': 1.059575416446202e-05, 'epoch': 0.97} {'loss': 0.9043, 'learning_rate': 1.0595427394050126e-05, 'epoch': 0.97} {'loss': 0.6799, 'learning_rate': 1.0595100623000181e-05, 'epoch': 0.97} {'loss': 0.7538, 'learning_rate': 1.0594773851312532e-05, 'epoch': 0.97} {'loss': 0.9258, 'learning_rate': 1.0594447078987525e-05, 'epoch': 0.97} {'loss': 0.777, 'learning_rate': 1.0594120306025515e-05, 'epoch': 0.97} {'loss': 0.7889, 'learning_rate': 1.0593793532426853e-05, 'epoch': 0.97} {'loss': 0.8393, 'learning_rate': 1.0593466758191886e-05, 'epoch': 0.97} {'loss': 0.7867, 'learning_rate': 1.0593139983320969e-05, 'epoch': 0.97} {'loss': 0.8148, 'learning_rate': 1.0592813207814445e-05, 'epoch': 0.97} {'loss': 0.701, 'learning_rate': 1.0592486431672673e-05, 'epoch': 0.97} {'loss': 0.8895, 'learning_rate': 1.0592159654895993e-05, 'epoch': 0.97} {'loss': 0.8362, 'learning_rate': 1.0591832877484763e-05, 'epoch': 0.97} {'loss': 0.6136, 'learning_rate': 1.059150609943933e-05, 'epoch': 0.97} {'loss': 0.5696, 'learning_rate': 1.0591179320760046e-05, 'epoch': 0.97} {'loss': 0.8142, 'learning_rate': 1.0590852541447259e-05, 'epoch': 0.97} {'loss': 0.815, 'learning_rate': 1.059052576150132e-05, 'epoch': 0.97} {'loss': 0.8798, 'learning_rate': 1.0590198980922581e-05, 'epoch': 0.97} {'loss': 0.7316, 'learning_rate': 1.0589872199711389e-05, 'epoch': 0.97} {'loss': 0.8781, 'learning_rate': 1.0589545417868094e-05, 'epoch': 0.97} {'loss': 0.7692, 'learning_rate': 1.0589218635393052e-05, 'epoch': 0.97} {'loss': 0.7164, 'learning_rate': 1.0588891852286606e-05, 'epoch': 0.97} {'loss': 0.8973, 'learning_rate': 1.058856506854911e-05, 'epoch': 0.97} {'loss': 0.6887, 'learning_rate': 1.0588238284180914e-05, 'epoch': 0.97} {'loss': 0.7046, 'learning_rate': 1.0587911499182368e-05, 'epoch': 0.97} {'loss': 0.6926, 'learning_rate': 1.058758471355382e-05, 'epoch': 0.97} {'loss': 0.6207, 'learning_rate': 1.0587257927295623e-05, 'epoch': 0.97} {'loss': 0.7541, 'learning_rate': 1.0586931140408127e-05, 'epoch': 0.97} {'loss': 0.5702, 'learning_rate': 1.058660435289168e-05, 'epoch': 0.97} {'loss': 0.7142, 'learning_rate': 1.0586277564746635e-05, 'epoch': 0.97} {'loss': 1.0202, 'learning_rate': 1.0585950775973337e-05, 'epoch': 0.97} {'loss': 0.7491, 'learning_rate': 1.0585623986572144e-05, 'epoch': 0.97} {'loss': 0.7779, 'learning_rate': 1.0585297196543401e-05, 'epoch': 0.97} {'loss': 0.7508, 'learning_rate': 1.0584970405887459e-05, 'epoch': 0.97} {'loss': 0.7684, 'learning_rate': 1.0584643614604668e-05, 'epoch': 0.97} {'loss': 0.705, 'learning_rate': 1.0584316822695377e-05, 'epoch': 0.97} {'loss': 0.6827, 'learning_rate': 1.0583990030159938e-05, 'epoch': 0.97} {'loss': 0.8212, 'learning_rate': 1.0583663236998704e-05, 'epoch': 0.97} {'loss': 0.966, 'learning_rate': 1.0583336443212022e-05, 'epoch': 0.97} {'loss': 0.6634, 'learning_rate': 1.0583009648800242e-05, 'epoch': 0.97} {'loss': 0.7068, 'learning_rate': 1.0582682853763714e-05, 'epoch': 0.97} {'loss': 0.6992, 'learning_rate': 1.0582356058102786e-05, 'epoch': 0.97} {'loss': 0.8468, 'learning_rate': 1.0582029261817812e-05, 'epoch': 0.97} {'loss': 0.6303, 'learning_rate': 1.0581702464909142e-05, 'epoch': 0.97} {'loss': 0.8756, 'learning_rate': 1.0581375667377127e-05, 'epoch': 0.97} {'loss': 0.8131, 'learning_rate': 1.0581048869222114e-05, 'epoch': 0.97} {'loss': 0.7071, 'learning_rate': 1.0580722070444456e-05, 'epoch': 0.97} {'loss': 0.744, 'learning_rate': 1.05803952710445e-05, 'epoch': 0.97} {'loss': 0.7014, 'learning_rate': 1.0580068471022597e-05, 'epoch': 0.97} {'loss': 0.799, 'learning_rate': 1.05797416703791e-05, 'epoch': 0.97} {'loss': 0.6602, 'learning_rate': 1.0579414869114357e-05, 'epoch': 0.97} {'loss': 0.6854, 'learning_rate': 1.057908806722872e-05, 'epoch': 0.97} {'loss': 0.8725, 'learning_rate': 1.0578761264722539e-05, 'epoch': 0.97} {'loss': 0.6829, 'learning_rate': 1.0578434461596161e-05, 'epoch': 0.97} {'loss': 0.6991, 'learning_rate': 1.0578107657849936e-05, 'epoch': 0.97} {'loss': 0.765, 'learning_rate': 1.0577780853484219e-05, 'epoch': 0.97} {'loss': 0.9772, 'learning_rate': 1.0577454048499357e-05, 'epoch': 0.97} {'loss': 0.6381, 'learning_rate': 1.0577127242895701e-05, 'epoch': 0.97} {'loss': 0.8735, 'learning_rate': 1.0576800436673603e-05, 'epoch': 0.97} {'loss': 0.7196, 'learning_rate': 1.057647362983341e-05, 'epoch': 0.97} {'loss': 0.6885, 'learning_rate': 1.0576146822375475e-05, 'epoch': 0.97} {'loss': 0.6511, 'learning_rate': 1.0575820014300141e-05, 'epoch': 0.97} {'loss': 1.0035, 'learning_rate': 1.057549320560777e-05, 'epoch': 0.97} {'loss': 0.9041, 'learning_rate': 1.0575166396298702e-05, 'epoch': 0.97} {'loss': 0.9153, 'learning_rate': 1.0574839586373295e-05, 'epoch': 0.97} {'loss': 0.8086, 'learning_rate': 1.0574512775831893e-05, 'epoch': 0.97} {'loss': 0.8641, 'learning_rate': 1.057418596467485e-05, 'epoch': 0.97} {'loss': 0.744, 'learning_rate': 1.0573859152902515e-05, 'epoch': 0.97} {'loss': 0.7575, 'learning_rate': 1.0573532340515236e-05, 'epoch': 0.97} {'loss': 0.7373, 'learning_rate': 1.0573205527513366e-05, 'epoch': 0.97} {'loss': 0.7065, 'learning_rate': 1.0572878713897254e-05, 'epoch': 0.97} {'loss': 0.909, 'learning_rate': 1.0572551899667253e-05, 'epoch': 0.97} {'loss': 0.8406, 'learning_rate': 1.0572225084823711e-05, 'epoch': 0.97} {'loss': 0.7878, 'learning_rate': 1.0571898269366978e-05, 'epoch': 0.97} {'loss': 0.8065, 'learning_rate': 1.0571571453297403e-05, 'epoch': 0.97} {'loss': 0.6989, 'learning_rate': 1.0571244636615337e-05, 'epoch': 0.97} {'loss': 0.7511, 'learning_rate': 1.0570917819321132e-05, 'epoch': 0.97} {'loss': 0.6817, 'learning_rate': 1.0570591001415138e-05, 'epoch': 0.97} {'loss': 0.6836, 'learning_rate': 1.0570264182897703e-05, 'epoch': 0.97} {'loss': 0.848, 'learning_rate': 1.056993736376918e-05, 'epoch': 0.97} {'loss': 0.8073, 'learning_rate': 1.0569610544029916e-05, 'epoch': 0.97} {'loss': 0.7799, 'learning_rate': 1.0569283723680262e-05, 'epoch': 0.97} {'loss': 0.6474, 'learning_rate': 1.056895690272057e-05, 'epoch': 0.97} {'loss': 0.7123, 'learning_rate': 1.0568630081151192e-05, 'epoch': 0.97} {'loss': 0.6527, 'learning_rate': 1.0568303258972472e-05, 'epoch': 0.97} {'loss': 0.7613, 'learning_rate': 1.0567976436184763e-05, 'epoch': 0.97} {'loss': 0.8432, 'learning_rate': 1.056764961278842e-05, 'epoch': 0.97} {'loss': 0.5786, 'learning_rate': 1.0567322788783787e-05, 'epoch': 0.97} {'loss': 0.6852, 'learning_rate': 1.0566995964171216e-05, 'epoch': 0.97} {'loss': 0.7205, 'learning_rate': 1.0566669138951058e-05, 'epoch': 0.97} {'loss': 0.701, 'learning_rate': 1.0566342313123663e-05, 'epoch': 0.97} {'loss': 0.7474, 'learning_rate': 1.0566015486689381e-05, 'epoch': 0.97} {'loss': 0.8814, 'learning_rate': 1.0565688659648563e-05, 'epoch': 0.97} {'loss': 0.8086, 'learning_rate': 1.0565361832001559e-05, 'epoch': 0.97} {'loss': 0.7593, 'learning_rate': 1.0565035003748718e-05, 'epoch': 0.97} {'loss': 0.804, 'learning_rate': 1.056470817489039e-05, 'epoch': 0.97} {'loss': 0.7796, 'learning_rate': 1.0564381345426929e-05, 'epoch': 0.97} {'loss': 0.8308, 'learning_rate': 1.0564054515358679e-05, 'epoch': 0.97} {'loss': 0.6917, 'learning_rate': 1.0563727684685994e-05, 'epoch': 0.97} {'loss': 0.7499, 'learning_rate': 1.0563400853409224e-05, 'epoch': 0.97} {'loss': 0.5381, 'learning_rate': 1.0563074021528722e-05, 'epoch': 0.97} {'loss': 0.6812, 'learning_rate': 1.0562747189044833e-05, 'epoch': 0.97} {'loss': 0.7328, 'learning_rate': 1.0562420355957912e-05, 'epoch': 0.97} {'loss': 0.6841, 'learning_rate': 1.0562093522268304e-05, 'epoch': 0.97} {'loss': 0.7832, 'learning_rate': 1.0561766687976363e-05, 'epoch': 0.97} {'loss': 0.7463, 'learning_rate': 1.0561439853082438e-05, 'epoch': 0.97} {'loss': 0.7342, 'learning_rate': 1.0561113017586879e-05, 'epoch': 0.97} {'loss': 0.7217, 'learning_rate': 1.0560786181490039e-05, 'epoch': 0.97} {'loss': 0.7533, 'learning_rate': 1.0560459344792267e-05, 'epoch': 0.97} {'loss': 0.8608, 'learning_rate': 1.0560132507493907e-05, 'epoch': 0.97} {'loss': 0.8343, 'learning_rate': 1.0559805669595317e-05, 'epoch': 0.97} {'loss': 0.814, 'learning_rate': 1.0559478831096845e-05, 'epoch': 0.97} {'loss': 0.6209, 'learning_rate': 1.0559151991998841e-05, 'epoch': 0.97} {'loss': 0.8873, 'learning_rate': 1.0558825152301657e-05, 'epoch': 0.97} {'loss': 0.7908, 'learning_rate': 1.0558498312005638e-05, 'epoch': 0.97} {'loss': 1.0148, 'learning_rate': 1.055817147111114e-05, 'epoch': 0.97} {'loss': 0.8051, 'learning_rate': 1.055784462961851e-05, 'epoch': 0.97} {'loss': 0.7843, 'learning_rate': 1.05575177875281e-05, 'epoch': 0.97} {'loss': 0.8419, 'learning_rate': 1.0557190944840257e-05, 'epoch': 0.97} {'loss': 0.7248, 'learning_rate': 1.0556864101555336e-05, 'epoch': 0.97} {'loss': 0.8189, 'learning_rate': 1.0556537257673685e-05, 'epoch': 0.97} {'loss': 0.6937, 'learning_rate': 1.0556210413195653e-05, 'epoch': 0.97} {'loss': 0.7642, 'learning_rate': 1.0555883568121591e-05, 'epoch': 0.97} {'loss': 0.9118, 'learning_rate': 1.055555672245185e-05, 'epoch': 0.97} {'loss': 0.7731, 'learning_rate': 1.0555229876186779e-05, 'epoch': 0.97} {'loss': 0.748, 'learning_rate': 1.0554903029326731e-05, 'epoch': 0.97} {'loss': 0.8488, 'learning_rate': 1.0554576181872051e-05, 'epoch': 0.97} {'loss': 0.7421, 'learning_rate': 1.0554249333823096e-05, 'epoch': 0.97} {'loss': 0.7873, 'learning_rate': 1.0553922485180214e-05, 'epoch': 0.97} {'loss': 0.7261, 'learning_rate': 1.0553595635943753e-05, 'epoch': 0.97} {'loss': 0.7346, 'learning_rate': 1.0553268786114062e-05, 'epoch': 0.97} {'loss': 0.7337, 'learning_rate': 1.0552941935691492e-05, 'epoch': 0.97} {'loss': 0.7239, 'learning_rate': 1.0552615084676399e-05, 'epoch': 0.97} {'loss': 0.7117, 'learning_rate': 1.0552288233069126e-05, 'epoch': 0.97} {'loss': 0.9459, 'learning_rate': 1.0551961380870028e-05, 'epoch': 0.97} {'loss': 0.6944, 'learning_rate': 1.0551634528079456e-05, 'epoch': 0.97} {'loss': 0.7349, 'learning_rate': 1.0551307674697754e-05, 'epoch': 0.97} {'loss': 0.7024, 'learning_rate': 1.0550980820725276e-05, 'epoch': 0.97} {'loss': 0.7312, 'learning_rate': 1.0550653966162373e-05, 'epoch': 0.97} {'loss': 0.7067, 'learning_rate': 1.0550327111009396e-05, 'epoch': 0.97} {'loss': 0.7075, 'learning_rate': 1.0550000255266695e-05, 'epoch': 0.97} {'loss': 0.8313, 'learning_rate': 1.0549673398934615e-05, 'epoch': 0.97} {'loss': 0.9268, 'learning_rate': 1.0549346542013515e-05, 'epoch': 0.97} {'loss': 0.7732, 'learning_rate': 1.0549019684503736e-05, 'epoch': 0.97} {'loss': 0.7841, 'learning_rate': 1.0548692826405636e-05, 'epoch': 0.97} {'loss': 0.7999, 'learning_rate': 1.0548365967719558e-05, 'epoch': 0.97} {'loss': 0.7474, 'learning_rate': 1.0548039108445862e-05, 'epoch': 0.97} {'loss': 0.8632, 'learning_rate': 1.054771224858489e-05, 'epoch': 0.97} {'loss': 0.9037, 'learning_rate': 1.0547385388136994e-05, 'epoch': 0.97} {'loss': 0.7338, 'learning_rate': 1.0547058527102528e-05, 'epoch': 0.97} {'loss': 0.759, 'learning_rate': 1.0546731665481835e-05, 'epoch': 0.97} {'loss': 0.8083, 'learning_rate': 1.0546404803275271e-05, 'epoch': 0.97} {'loss': 0.6546, 'learning_rate': 1.054607794048319e-05, 'epoch': 0.97} {'loss': 0.7895, 'learning_rate': 1.0545751077105932e-05, 'epoch': 0.97} {'loss': 0.9016, 'learning_rate': 1.0545424213143854e-05, 'epoch': 0.97} {'loss': 0.7206, 'learning_rate': 1.0545097348597302e-05, 'epoch': 0.97} {'loss': 0.6202, 'learning_rate': 1.0544770483466634e-05, 'epoch': 0.97} {'loss': 0.7865, 'learning_rate': 1.0544443617752192e-05, 'epoch': 0.97} {'loss': 0.8029, 'learning_rate': 1.0544116751454329e-05, 'epoch': 0.97} {'loss': 0.6419, 'learning_rate': 1.0543789884573399e-05, 'epoch': 0.97} {'loss': 0.8966, 'learning_rate': 1.0543463017109746e-05, 'epoch': 0.97} {'loss': 0.8005, 'learning_rate': 1.0543136149063724e-05, 'epoch': 0.97} {'loss': 0.5824, 'learning_rate': 1.0542809280435685e-05, 'epoch': 0.97} {'loss': 0.7009, 'learning_rate': 1.0542482411225973e-05, 'epoch': 0.97} {'loss': 0.87, 'learning_rate': 1.0542155541434945e-05, 'epoch': 0.97} {'loss': 0.704, 'learning_rate': 1.0541828671062948e-05, 'epoch': 0.97} {'loss': 0.7285, 'learning_rate': 1.0541501800110332e-05, 'epoch': 0.97} {'loss': 0.8662, 'learning_rate': 1.0541174928577447e-05, 'epoch': 0.97} {'loss': 0.7732, 'learning_rate': 1.0540848056464645e-05, 'epoch': 0.97} {'loss': 0.8161, 'learning_rate': 1.0540521183772276e-05, 'epoch': 0.97} {'loss': 0.8636, 'learning_rate': 1.0540194310500689e-05, 'epoch': 0.97} {'loss': 0.7353, 'learning_rate': 1.0539867436650238e-05, 'epoch': 0.97} {'loss': 0.6967, 'learning_rate': 1.0539540562221267e-05, 'epoch': 0.97} {'loss': 0.7199, 'learning_rate': 1.053921368721413e-05, 'epoch': 0.97} {'loss': 0.7992, 'learning_rate': 1.0538886811629176e-05, 'epoch': 0.97} {'loss': 0.8166, 'learning_rate': 1.0538559935466757e-05, 'epoch': 0.97} {'loss': 0.8082, 'learning_rate': 1.0538233058727226e-05, 'epoch': 0.97} {'loss': 0.8767, 'learning_rate': 1.0537906181410924e-05, 'epoch': 0.97} {'loss': 0.6086, 'learning_rate': 1.053757930351821e-05, 'epoch': 0.97} {'loss': 0.6909, 'learning_rate': 1.053725242504943e-05, 'epoch': 0.97} {'loss': 0.6907, 'learning_rate': 1.0536925546004936e-05, 'epoch': 0.97} {'loss': 0.8458, 'learning_rate': 1.0536598666385078e-05, 'epoch': 0.97} {'loss': 0.633, 'learning_rate': 1.0536271786190207e-05, 'epoch': 0.97} {'loss': 0.7659, 'learning_rate': 1.0535944905420672e-05, 'epoch': 0.97} {'loss': 0.7456, 'learning_rate': 1.0535618024076826e-05, 'epoch': 0.97} {'loss': 0.7819, 'learning_rate': 1.0535291142159014e-05, 'epoch': 0.97} {'loss': 0.7802, 'learning_rate': 1.0534964259667589e-05, 'epoch': 0.97} {'loss': 0.6784, 'learning_rate': 1.05346373766029e-05, 'epoch': 0.97} {'loss': 0.9085, 'learning_rate': 1.05343104929653e-05, 'epoch': 0.97} {'loss': 0.6589, 'learning_rate': 1.0533983608755138e-05, 'epoch': 0.97} {'loss': 0.6499, 'learning_rate': 1.0533656723972767e-05, 'epoch': 0.97} {'loss': 0.8449, 'learning_rate': 1.0533329838618536e-05, 'epoch': 0.97} {'loss': 0.6699, 'learning_rate': 1.053300295269279e-05, 'epoch': 0.97} {'loss': 0.6063, 'learning_rate': 1.0532676066195882e-05, 'epoch': 0.97} {'loss': 0.7163, 'learning_rate': 1.0532349179128166e-05, 'epoch': 0.97} {'loss': 0.9051, 'learning_rate': 1.0532022291489987e-05, 'epoch': 0.97} {'loss': 0.6418, 'learning_rate': 1.0531695403281703e-05, 'epoch': 0.97} {'loss': 0.8592, 'learning_rate': 1.0531368514503656e-05, 'epoch': 0.97} {'loss': 0.6355, 'learning_rate': 1.0531041625156202e-05, 'epoch': 0.97} {'loss': 0.7907, 'learning_rate': 1.0530714735239686e-05, 'epoch': 0.97} {'loss': 0.8548, 'learning_rate': 1.0530387844754464e-05, 'epoch': 0.97} {'loss': 0.8149, 'learning_rate': 1.053006095370088e-05, 'epoch': 0.97} {'loss': 0.6971, 'learning_rate': 1.052973406207929e-05, 'epoch': 0.97} {'loss': 0.7118, 'learning_rate': 1.0529407169890044e-05, 'epoch': 0.97} {'loss': 0.6937, 'learning_rate': 1.052908027713349e-05, 'epoch': 0.97} {'loss': 0.5299, 'learning_rate': 1.0528753383809978e-05, 'epoch': 0.97} {'loss': 0.9289, 'learning_rate': 1.0528426489919859e-05, 'epoch': 0.97} {'loss': 0.8875, 'learning_rate': 1.0528099595463482e-05, 'epoch': 0.97} {'loss': 0.7333, 'learning_rate': 1.0527772700441196e-05, 'epoch': 0.97} {'loss': 1.0188, 'learning_rate': 1.052744580485336e-05, 'epoch': 0.97} {'loss': 0.6471, 'learning_rate': 1.0527118908700316e-05, 'epoch': 0.97} {'loss': 0.7185, 'learning_rate': 1.0526792011982416e-05, 'epoch': 0.97} {'loss': 0.6353, 'learning_rate': 1.052646511470001e-05, 'epoch': 0.97} {'loss': 0.8808, 'learning_rate': 1.052613821685345e-05, 'epoch': 0.97} {'loss': 0.6364, 'learning_rate': 1.0525811318443087e-05, 'epoch': 0.97} {'loss': 0.7824, 'learning_rate': 1.0525484419469268e-05, 'epoch': 0.97} {'loss': 0.7396, 'learning_rate': 1.0525157519932345e-05, 'epoch': 0.97} {'loss': 0.9125, 'learning_rate': 1.0524830619832666e-05, 'epoch': 0.97} {'loss': 0.6592, 'learning_rate': 1.0524503719170588e-05, 'epoch': 0.97} {'loss': 0.8575, 'learning_rate': 1.0524176817946457e-05, 'epoch': 0.97} {'loss': 0.7302, 'learning_rate': 1.052384991616062e-05, 'epoch': 0.97} {'loss': 0.7908, 'learning_rate': 1.052352301381343e-05, 'epoch': 0.97} {'loss': 0.8544, 'learning_rate': 1.0523196110905243e-05, 'epoch': 0.97} {'loss': 0.7239, 'learning_rate': 1.05228692074364e-05, 'epoch': 0.97} {'loss': 0.8034, 'learning_rate': 1.0522542303407255e-05, 'epoch': 0.97} {'loss': 0.8555, 'learning_rate': 1.052221539881816e-05, 'epoch': 0.97} {'loss': 0.8887, 'learning_rate': 1.0521888493669464e-05, 'epoch': 0.97} {'loss': 0.9498, 'learning_rate': 1.0521561587961518e-05, 'epoch': 0.97} {'loss': 0.6779, 'learning_rate': 1.0521234681694672e-05, 'epoch': 0.97} {'loss': 0.8879, 'learning_rate': 1.0520907774869273e-05, 'epoch': 0.97} {'loss': 0.705, 'learning_rate': 1.0520580867485677e-05, 'epoch': 0.97} {'loss': 0.6744, 'learning_rate': 1.0520253959544232e-05, 'epoch': 0.97} {'loss': 0.8949, 'learning_rate': 1.0519927051045286e-05, 'epoch': 0.97} {'loss': 0.8213, 'learning_rate': 1.0519600141989192e-05, 'epoch': 0.97} {'loss': 0.7826, 'learning_rate': 1.0519273232376302e-05, 'epoch': 0.97} {'loss': 0.8926, 'learning_rate': 1.051894632220696e-05, 'epoch': 0.97} {'loss': 0.7485, 'learning_rate': 1.0518619411481521e-05, 'epoch': 0.97} {'loss': 0.7146, 'learning_rate': 1.0518292500200335e-05, 'epoch': 0.97} {'loss': 0.7414, 'learning_rate': 1.0517965588363755e-05, 'epoch': 0.97} {'loss': 0.8353, 'learning_rate': 1.0517638675972124e-05, 'epoch': 0.97} {'loss': 0.8657, 'learning_rate': 1.0517311763025799e-05, 'epoch': 0.97} {'loss': 0.6712, 'learning_rate': 1.0516984849525126e-05, 'epoch': 0.97} {'loss': 0.5843, 'learning_rate': 1.0516657935470456e-05, 'epoch': 0.97} {'loss': 0.8889, 'learning_rate': 1.0516331020862143e-05, 'epoch': 0.97} {'loss': 0.6661, 'learning_rate': 1.0516004105700533e-05, 'epoch': 0.97} {'loss': 0.8482, 'learning_rate': 1.051567718998598e-05, 'epoch': 0.97} {'loss': 0.7812, 'learning_rate': 1.051535027371883e-05, 'epoch': 0.97} {'loss': 0.8135, 'learning_rate': 1.0515023356899436e-05, 'epoch': 0.97} {'loss': 0.8367, 'learning_rate': 1.051469643952815e-05, 'epoch': 0.97} {'loss': 0.9011, 'learning_rate': 1.0514369521605319e-05, 'epoch': 0.97} {'loss': 0.6273, 'learning_rate': 1.0514042603131294e-05, 'epoch': 0.97} {'loss': 0.6492, 'learning_rate': 1.0513715684106424e-05, 'epoch': 0.97} {'loss': 0.7377, 'learning_rate': 1.0513388764531065e-05, 'epoch': 0.97} {'loss': 0.8042, 'learning_rate': 1.0513061844405566e-05, 'epoch': 0.97} {'loss': 0.7928, 'learning_rate': 1.051273492373027e-05, 'epoch': 0.97} {'loss': 0.6588, 'learning_rate': 1.0512408002505532e-05, 'epoch': 0.97} {'loss': 0.7535, 'learning_rate': 1.0512081080731705e-05, 'epoch': 0.97} {'loss': 0.7615, 'learning_rate': 1.0511754158409136e-05, 'epoch': 0.97} {'loss': 0.8894, 'learning_rate': 1.0511427235538175e-05, 'epoch': 0.97} {'loss': 0.8265, 'learning_rate': 1.0511100312119176e-05, 'epoch': 0.97} {'loss': 0.7183, 'learning_rate': 1.0510773388152486e-05, 'epoch': 0.97} {'loss': 0.8229, 'learning_rate': 1.0510446463638455e-05, 'epoch': 0.97} {'loss': 0.8319, 'learning_rate': 1.0510119538577438e-05, 'epoch': 0.97} {'loss': 0.6111, 'learning_rate': 1.0509792612969775e-05, 'epoch': 0.97} {'loss': 0.6804, 'learning_rate': 1.050946568681583e-05, 'epoch': 0.97} {'loss': 0.6769, 'learning_rate': 1.0509138760115942e-05, 'epoch': 0.97} {'loss': 0.7809, 'learning_rate': 1.0508811832870468e-05, 'epoch': 0.97} {'loss': 0.9364, 'learning_rate': 1.0508484905079758e-05, 'epoch': 0.97} {'loss': 0.7495, 'learning_rate': 1.050815797674416e-05, 'epoch': 0.97} {'loss': 0.8667, 'learning_rate': 1.0507831047864024e-05, 'epoch': 0.97} {'loss': 0.7222, 'learning_rate': 1.0507504118439697e-05, 'epoch': 0.97} {'loss': 0.7148, 'learning_rate': 1.0507177188471538e-05, 'epoch': 0.97} {'loss': 0.6289, 'learning_rate': 1.0506850257959894e-05, 'epoch': 0.97} {'loss': 0.6356, 'learning_rate': 1.0506523326905112e-05, 'epoch': 0.97} {'loss': 0.8643, 'learning_rate': 1.0506196395307546e-05, 'epoch': 0.97} {'loss': 0.7811, 'learning_rate': 1.0505869463167543e-05, 'epoch': 0.97} {'loss': 0.9026, 'learning_rate': 1.0505542530485455e-05, 'epoch': 0.97} {'loss': 0.9163, 'learning_rate': 1.0505215597261634e-05, 'epoch': 0.97} {'loss': 0.8915, 'learning_rate': 1.0504888663496429e-05, 'epoch': 0.97} {'loss': 0.8424, 'learning_rate': 1.050456172919019e-05, 'epoch': 0.97} {'loss': 0.8046, 'learning_rate': 1.050423479434327e-05, 'epoch': 0.97} {'loss': 0.9041, 'learning_rate': 1.050390785895601e-05, 'epoch': 0.97} {'loss': 0.5845, 'learning_rate': 1.0503580923028773e-05, 'epoch': 0.97} {'loss': 0.6416, 'learning_rate': 1.0503253986561901e-05, 'epoch': 0.97} {'loss': 0.8146, 'learning_rate': 1.0502927049555749e-05, 'epoch': 0.97} {'loss': 0.8885, 'learning_rate': 1.0502600112010663e-05, 'epoch': 0.97} {'loss': 0.7648, 'learning_rate': 1.0502273173926996e-05, 'epoch': 0.97} {'loss': 0.9549, 'learning_rate': 1.05019462353051e-05, 'epoch': 0.97} {'loss': 0.7458, 'learning_rate': 1.0501619296145322e-05, 'epoch': 0.97} {'loss': 0.7082, 'learning_rate': 1.0501292356448014e-05, 'epoch': 0.97} {'loss': 0.8145, 'learning_rate': 1.0500965416213524e-05, 'epoch': 0.97} {'loss': 0.71, 'learning_rate': 1.0500638475442209e-05, 'epoch': 0.97} {'loss': 0.639, 'learning_rate': 1.0500311534134411e-05, 'epoch': 0.97} {'loss': 0.6921, 'learning_rate': 1.0499984592290484e-05, 'epoch': 0.97} {'loss': 0.6735, 'learning_rate': 1.0499657649910779e-05, 'epoch': 0.97} {'loss': 0.9461, 'learning_rate': 1.0499330706995648e-05, 'epoch': 0.97} {'loss': 0.9583, 'learning_rate': 1.0499003763545435e-05, 'epoch': 0.97} {'loss': 0.919, 'learning_rate': 1.0498676819560498e-05, 'epoch': 0.97} {'loss': 0.7621, 'learning_rate': 1.049834987504118e-05, 'epoch': 0.97} {'loss': 0.7709, 'learning_rate': 1.0498022929987836e-05, 'epoch': 0.97} {'loss': 0.6454, 'learning_rate': 1.0497695984400818e-05, 'epoch': 0.97} {'loss': 0.8587, 'learning_rate': 1.0497369038280474e-05, 'epoch': 0.97} {'loss': 0.8956, 'learning_rate': 1.0497042091627152e-05, 'epoch': 0.97} {'loss': 0.7459, 'learning_rate': 1.0496715144441208e-05, 'epoch': 0.97} {'loss': 0.6038, 'learning_rate': 1.0496388196722984e-05, 'epoch': 0.97} {'loss': 0.781, 'learning_rate': 1.0496061248472837e-05, 'epoch': 0.97} {'loss': 0.7862, 'learning_rate': 1.0495734299691116e-05, 'epoch': 0.97} {'loss': 0.8725, 'learning_rate': 1.049540735037817e-05, 'epoch': 0.97} {'loss': 0.7283, 'learning_rate': 1.0495080400534355e-05, 'epoch': 0.97} {'loss': 0.6252, 'learning_rate': 1.0494753450160012e-05, 'epoch': 0.97} {'loss': 0.7924, 'learning_rate': 1.0494426499255497e-05, 'epoch': 0.97} {'loss': 0.7315, 'learning_rate': 1.049409954782116e-05, 'epoch': 0.97} {'loss': 0.9718, 'learning_rate': 1.0493772595857347e-05, 'epoch': 0.97} {'loss': 0.8685, 'learning_rate': 1.0493445643364417e-05, 'epoch': 0.97} {'loss': 0.8263, 'learning_rate': 1.0493118690342715e-05, 'epoch': 0.97} {'loss': 0.7642, 'learning_rate': 1.049279173679259e-05, 'epoch': 0.97} {'loss': 0.8697, 'learning_rate': 1.0492464782714396e-05, 'epoch': 0.97} {'loss': 0.7758, 'learning_rate': 1.049213782810848e-05, 'epoch': 0.97} {'loss': 0.7765, 'learning_rate': 1.0491810872975192e-05, 'epoch': 0.97} {'loss': 0.8536, 'learning_rate': 1.0491483917314886e-05, 'epoch': 0.97} {'loss': 0.7114, 'learning_rate': 1.0491156961127911e-05, 'epoch': 0.97} {'loss': 0.7161, 'learning_rate': 1.0490830004414619e-05, 'epoch': 0.97} {'loss': 0.7892, 'learning_rate': 1.0490503047175358e-05, 'epoch': 0.97} {'loss': 0.8397, 'learning_rate': 1.0490176089410475e-05, 'epoch': 0.97} {'loss': 0.8741, 'learning_rate': 1.0489849131120327e-05, 'epoch': 0.97} {'loss': 0.7734, 'learning_rate': 1.048952217230526e-05, 'epoch': 0.97} {'loss': 0.7453, 'learning_rate': 1.0489195212965625e-05, 'epoch': 0.97} {'loss': 0.949, 'learning_rate': 1.0488868253101774e-05, 'epoch': 0.97} {'loss': 0.8319, 'learning_rate': 1.0488541292714058e-05, 'epoch': 0.97} {'loss': 0.7443, 'learning_rate': 1.0488214331802827e-05, 'epoch': 0.97} {'loss': 0.6523, 'learning_rate': 1.0487887370368429e-05, 'epoch': 0.97} {'loss': 0.7283, 'learning_rate': 1.0487560408411213e-05, 'epoch': 0.97} {'loss': 0.6842, 'learning_rate': 1.0487233445931532e-05, 'epoch': 0.97} {'loss': 0.6859, 'learning_rate': 1.0486906482929739e-05, 'epoch': 0.97} {'loss': 0.6895, 'learning_rate': 1.0486579519406182e-05, 'epoch': 0.97} {'loss': 0.8132, 'learning_rate': 1.0486252555361211e-05, 'epoch': 0.97} {'loss': 0.8369, 'learning_rate': 1.0485925590795176e-05, 'epoch': 0.97} {'loss': 0.5618, 'learning_rate': 1.0485598625708428e-05, 'epoch': 0.97} {'loss': 0.7084, 'learning_rate': 1.0485271660101316e-05, 'epoch': 0.97} {'loss': 0.888, 'learning_rate': 1.0484944693974192e-05, 'epoch': 0.97} {'loss': 0.8157, 'learning_rate': 1.0484617727327406e-05, 'epoch': 0.97} {'loss': 0.8268, 'learning_rate': 1.048429076016131e-05, 'epoch': 0.97} {'loss': 0.8183, 'learning_rate': 1.048396379247625e-05, 'epoch': 0.97} {'loss': 0.6084, 'learning_rate': 1.0483636824272583e-05, 'epoch': 0.97} {'loss': 0.8186, 'learning_rate': 1.0483309855550653e-05, 'epoch': 0.97} {'loss': 0.6872, 'learning_rate': 1.0482982886310812e-05, 'epoch': 0.97} {'loss': 0.7138, 'learning_rate': 1.0482655916553413e-05, 'epoch': 0.97} {'loss': 0.7205, 'learning_rate': 1.0482328946278803e-05, 'epoch': 0.97} {'loss': 0.6505, 'learning_rate': 1.0482001975487335e-05, 'epoch': 0.97} {'loss': 0.8063, 'learning_rate': 1.0481675004179359e-05, 'epoch': 0.97} {'loss': 0.7773, 'learning_rate': 1.0481348032355226e-05, 'epoch': 0.97} {'loss': 0.8781, 'learning_rate': 1.0481021060015282e-05, 'epoch': 0.97} {'loss': 0.7873, 'learning_rate': 1.0480694087159881e-05, 'epoch': 0.97} {'loss': 0.7349, 'learning_rate': 1.0480367113789373e-05, 'epoch': 0.97} {'loss': 0.556, 'learning_rate': 1.048004013990411e-05, 'epoch': 0.97} {'loss': 0.7546, 'learning_rate': 1.0479713165504439e-05, 'epoch': 0.97} {'loss': 0.7996, 'learning_rate': 1.0479386190590714e-05, 'epoch': 0.97} {'loss': 0.9127, 'learning_rate': 1.0479059215163281e-05, 'epoch': 0.97} {'loss': 0.9406, 'learning_rate': 1.0478732239222493e-05, 'epoch': 0.97} {'loss': 0.676, 'learning_rate': 1.04784052627687e-05, 'epoch': 0.97} {'loss': 0.864, 'learning_rate': 1.0478078285802256e-05, 'epoch': 0.97} {'loss': 0.7593, 'learning_rate': 1.0477751308323505e-05, 'epoch': 0.97} {'loss': 0.8047, 'learning_rate': 1.0477424330332802e-05, 'epoch': 0.97} {'loss': 1.0149, 'learning_rate': 1.0477097351830495e-05, 'epoch': 0.97} {'loss': 0.6938, 'learning_rate': 1.0476770372816933e-05, 'epoch': 0.97} {'loss': 0.5712, 'learning_rate': 1.047644339329247e-05, 'epoch': 0.97} {'loss': 0.7872, 'learning_rate': 1.0476116413257458e-05, 'epoch': 0.97} {'loss': 0.6286, 'learning_rate': 1.047578943271224e-05, 'epoch': 0.97} {'loss': 0.7811, 'learning_rate': 1.0475462451657172e-05, 'epoch': 0.97} {'loss': 0.8009, 'learning_rate': 1.0475135470092603e-05, 'epoch': 0.97} {'loss': 0.8247, 'learning_rate': 1.0474808488018887e-05, 'epoch': 0.97} {'loss': 0.7704, 'learning_rate': 1.0474481505436365e-05, 'epoch': 0.97} {'loss': 0.6922, 'learning_rate': 1.0474154522345396e-05, 'epoch': 0.97} {'loss': 0.8188, 'learning_rate': 1.0473827538746328e-05, 'epoch': 0.97} {'loss': 0.7414, 'learning_rate': 1.047350055463951e-05, 'epoch': 0.97} {'loss': 0.7088, 'learning_rate': 1.0473173570025295e-05, 'epoch': 0.97} {'loss': 0.7371, 'learning_rate': 1.0472846584904028e-05, 'epoch': 0.97} {'loss': 0.9907, 'learning_rate': 1.0472519599276068e-05, 'epoch': 0.97} {'loss': 0.6386, 'learning_rate': 1.0472192613141759e-05, 'epoch': 0.97} {'loss': 0.812, 'learning_rate': 1.0471865626501455e-05, 'epoch': 0.97} {'loss': 0.8216, 'learning_rate': 1.0471538639355499e-05, 'epoch': 0.97} {'loss': 0.7369, 'learning_rate': 1.047121165170425e-05, 'epoch': 0.97} {'loss': 0.7285, 'learning_rate': 1.0470884663548053e-05, 'epoch': 0.97} {'loss': 0.7917, 'learning_rate': 1.0470557674887263e-05, 'epoch': 0.97} {'loss': 0.7716, 'learning_rate': 1.047023068572223e-05, 'epoch': 0.97} {'loss': 0.648, 'learning_rate': 1.0469903696053301e-05, 'epoch': 0.97} {'loss': 0.7711, 'learning_rate': 1.0469576705880826e-05, 'epoch': 0.97} {'loss': 0.5894, 'learning_rate': 1.0469249715205156e-05, 'epoch': 0.97} {'loss': 0.6564, 'learning_rate': 1.0468922724026644e-05, 'epoch': 0.97} {'loss': 0.6616, 'learning_rate': 1.046859573234564e-05, 'epoch': 0.97} {'loss': 0.7152, 'learning_rate': 1.0468268740162492e-05, 'epoch': 0.97} {'loss': 0.8352, 'learning_rate': 1.0467941747477552e-05, 'epoch': 0.97} {'loss': 0.8111, 'learning_rate': 1.0467614754291174e-05, 'epoch': 0.97} {'loss': 0.7954, 'learning_rate': 1.04672877606037e-05, 'epoch': 0.97} {'loss': 0.7758, 'learning_rate': 1.0466960766415486e-05, 'epoch': 0.97} {'loss': 0.7598, 'learning_rate': 1.046663377172688e-05, 'epoch': 0.97} {'loss': 0.8169, 'learning_rate': 1.0466306776538235e-05, 'epoch': 0.97} {'loss': 0.8141, 'learning_rate': 1.0465979780849901e-05, 'epoch': 0.97} {'loss': 0.7153, 'learning_rate': 1.0465652784662231e-05, 'epoch': 0.97} {'loss': 0.8179, 'learning_rate': 1.0465325787975567e-05, 'epoch': 0.97} {'loss': 0.8431, 'learning_rate': 1.0464998790790266e-05, 'epoch': 0.97} {'loss': 0.6297, 'learning_rate': 1.0464671793106675e-05, 'epoch': 0.97} {'loss': 0.7718, 'learning_rate': 1.0464344794925147e-05, 'epoch': 0.97} {'loss': 0.6809, 'learning_rate': 1.046401779624603e-05, 'epoch': 0.97} {'loss': 0.667, 'learning_rate': 1.0463690797069681e-05, 'epoch': 0.97} {'loss': 0.7517, 'learning_rate': 1.0463363797396446e-05, 'epoch': 0.97} {'loss': 0.8895, 'learning_rate': 1.0463036797226671e-05, 'epoch': 0.97} {'loss': 0.7607, 'learning_rate': 1.046270979656071e-05, 'epoch': 0.97} {'loss': 0.8568, 'learning_rate': 1.0462382795398916e-05, 'epoch': 0.97} {'loss': 0.7709, 'learning_rate': 1.0462055793741635e-05, 'epoch': 0.97} {'loss': 0.8388, 'learning_rate': 1.046172879158922e-05, 'epoch': 0.97} {'loss': 0.8684, 'learning_rate': 1.046140178894202e-05, 'epoch': 0.97} {'loss': 0.8394, 'learning_rate': 1.0461074785800391e-05, 'epoch': 0.97} {'loss': 0.647, 'learning_rate': 1.0460747782164675e-05, 'epoch': 0.97} {'loss': 0.5775, 'learning_rate': 1.0460420778035224e-05, 'epoch': 0.97} {'loss': 0.7732, 'learning_rate': 1.0460093773412393e-05, 'epoch': 0.97} {'loss': 0.7083, 'learning_rate': 1.0459766768296533e-05, 'epoch': 0.97} {'loss': 0.738, 'learning_rate': 1.0459439762687987e-05, 'epoch': 0.97} {'loss': 0.9304, 'learning_rate': 1.045911275658711e-05, 'epoch': 0.97} {'loss': 0.7297, 'learning_rate': 1.0458785749994255e-05, 'epoch': 0.97} {'loss': 0.6052, 'learning_rate': 1.0458458742909769e-05, 'epoch': 0.97} {'loss': 0.7772, 'learning_rate': 1.0458131735334e-05, 'epoch': 0.97} {'loss': 0.6729, 'learning_rate': 1.0457804727267304e-05, 'epoch': 0.97} {'loss': 0.6065, 'learning_rate': 1.0457477718710032e-05, 'epoch': 0.97} {'loss': 0.7906, 'learning_rate': 1.0457150709662527e-05, 'epoch': 0.97} {'loss': 0.8734, 'learning_rate': 1.0456823700125143e-05, 'epoch': 0.97} {'loss': 0.7414, 'learning_rate': 1.0456496690098235e-05, 'epoch': 0.97} {'loss': 0.6866, 'learning_rate': 1.0456169679582147e-05, 'epoch': 0.97} {'loss': 0.9307, 'learning_rate': 1.0455842668577231e-05, 'epoch': 0.97} {'loss': 0.7468, 'learning_rate': 1.0455515657083843e-05, 'epoch': 0.97} {'loss': 0.5612, 'learning_rate': 1.0455188645102325e-05, 'epoch': 0.97} {'loss': 0.7785, 'learning_rate': 1.045486163263303e-05, 'epoch': 0.97} {'loss': 0.7946, 'learning_rate': 1.0454534619676313e-05, 'epoch': 0.97} {'loss': 0.8134, 'learning_rate': 1.0454207606232522e-05, 'epoch': 0.97} {'loss': 0.8143, 'learning_rate': 1.0453880592302004e-05, 'epoch': 0.97} {'loss': 0.8527, 'learning_rate': 1.0453553577885114e-05, 'epoch': 0.97} {'loss': 0.7989, 'learning_rate': 1.04532265629822e-05, 'epoch': 0.97} {'loss': 0.7139, 'learning_rate': 1.0452899547593609e-05, 'epoch': 0.97} {'loss': 0.8804, 'learning_rate': 1.0452572531719699e-05, 'epoch': 0.97} {'loss': 0.5805, 'learning_rate': 1.0452245515360818e-05, 'epoch': 0.97} {'loss': 0.745, 'learning_rate': 1.045191849851731e-05, 'epoch': 0.97} {'loss': 0.7942, 'learning_rate': 1.0451591481189533e-05, 'epoch': 0.97} {'loss': 0.9249, 'learning_rate': 1.0451264463377837e-05, 'epoch': 0.97} {'loss': 0.6942, 'learning_rate': 1.0450937445082569e-05, 'epoch': 0.97} {'loss': 0.7633, 'learning_rate': 1.045061042630408e-05, 'epoch': 0.97} {'loss': 0.7743, 'learning_rate': 1.045028340704272e-05, 'epoch': 0.97} {'loss': 0.6508, 'learning_rate': 1.0449956387298845e-05, 'epoch': 0.97} {'loss': 0.7004, 'learning_rate': 1.0449629367072798e-05, 'epoch': 0.97} {'loss': 0.8319, 'learning_rate': 1.0449302346364936e-05, 'epoch': 0.97} {'loss': 0.9233, 'learning_rate': 1.04489753251756e-05, 'epoch': 0.97} {'loss': 0.8285, 'learning_rate': 1.044864830350515e-05, 'epoch': 0.97} {'loss': 0.8155, 'learning_rate': 1.0448321281353932e-05, 'epoch': 0.97} {'loss': 0.8582, 'learning_rate': 1.0447994258722298e-05, 'epoch': 0.97} {'loss': 0.6851, 'learning_rate': 1.04476672356106e-05, 'epoch': 0.97} {'loss': 0.8457, 'learning_rate': 1.0447340212019184e-05, 'epoch': 0.97} {'loss': 0.7502, 'learning_rate': 1.0447013187948402e-05, 'epoch': 0.97} {'loss': 0.707, 'learning_rate': 1.0446686163398605e-05, 'epoch': 0.97} {'loss': 0.8139, 'learning_rate': 1.0446359138370142e-05, 'epoch': 0.97} {'loss': 0.7159, 'learning_rate': 1.0446032112863366e-05, 'epoch': 0.97} {'loss': 0.8422, 'learning_rate': 1.0445705086878625e-05, 'epoch': 0.97} {'loss': 0.9044, 'learning_rate': 1.0445378060416276e-05, 'epoch': 0.97} {'loss': 0.8577, 'learning_rate': 1.0445051033476663e-05, 'epoch': 0.97} {'loss': 0.8824, 'learning_rate': 1.0444724006060134e-05, 'epoch': 0.97} {'loss': 0.6842, 'learning_rate': 1.0444396978167044e-05, 'epoch': 0.97} {'loss': 0.7909, 'learning_rate': 1.0444069949797743e-05, 'epoch': 0.97} {'loss': 0.9963, 'learning_rate': 1.044374292095258e-05, 'epoch': 0.97} {'loss': 0.8652, 'learning_rate': 1.0443415891631907e-05, 'epoch': 0.97} {'loss': 0.8175, 'learning_rate': 1.0443088861836077e-05, 'epoch': 0.97} {'loss': 0.7741, 'learning_rate': 1.0442761831565435e-05, 'epoch': 0.98} {'loss': 0.8821, 'learning_rate': 1.0442434800820334e-05, 'epoch': 0.98} {'loss': 0.8606, 'learning_rate': 1.0442107769601122e-05, 'epoch': 0.98} {'loss': 0.7891, 'learning_rate': 1.0441780737908154e-05, 'epoch': 0.98} {'loss': 0.747, 'learning_rate': 1.0441453705741775e-05, 'epoch': 0.98} {'loss': 0.7594, 'learning_rate': 1.0441126673102345e-05, 'epoch': 0.98} {'loss': 0.6005, 'learning_rate': 1.0440799639990203e-05, 'epoch': 0.98} {'loss': 0.8397, 'learning_rate': 1.0440472606405704e-05, 'epoch': 0.98} {'loss': 0.6945, 'learning_rate': 1.04401455723492e-05, 'epoch': 0.98} {'loss': 0.6793, 'learning_rate': 1.0439818537821041e-05, 'epoch': 0.98} {'loss': 0.652, 'learning_rate': 1.0439491502821574e-05, 'epoch': 0.98} {'loss': 0.6394, 'learning_rate': 1.0439164467351157e-05, 'epoch': 0.98} {'loss': 0.7718, 'learning_rate': 1.0438837431410132e-05, 'epoch': 0.98} {'loss': 0.6417, 'learning_rate': 1.0438510394998855e-05, 'epoch': 0.98} {'loss': 0.8797, 'learning_rate': 1.0438183358117673e-05, 'epoch': 0.98} {'loss': 0.8107, 'learning_rate': 1.0437856320766939e-05, 'epoch': 0.98} {'loss': 0.8211, 'learning_rate': 1.0437529282947001e-05, 'epoch': 0.98} {'loss': 0.659, 'learning_rate': 1.043720224465821e-05, 'epoch': 0.98} {'loss': 0.8027, 'learning_rate': 1.0436875205900923e-05, 'epoch': 0.98} {'loss': 0.8055, 'learning_rate': 1.043654816667548e-05, 'epoch': 0.98} {'loss': 0.8024, 'learning_rate': 1.0436221126982237e-05, 'epoch': 0.98} {'loss': 0.8329, 'learning_rate': 1.0435894086821543e-05, 'epoch': 0.98} {'loss': 0.6771, 'learning_rate': 1.043556704619375e-05, 'epoch': 0.98} {'loss': 0.6291, 'learning_rate': 1.0435240005099207e-05, 'epoch': 0.98} {'loss': 0.7164, 'learning_rate': 1.0434912963538269e-05, 'epoch': 0.98} {'loss': 0.7521, 'learning_rate': 1.0434585921511278e-05, 'epoch': 0.98} {'loss': 0.7068, 'learning_rate': 1.0434258879018588e-05, 'epoch': 0.98} {'loss': 0.7903, 'learning_rate': 1.0433931836060555e-05, 'epoch': 0.98} {'loss': 0.6423, 'learning_rate': 1.0433604792637522e-05, 'epoch': 0.98} {'loss': 0.8656, 'learning_rate': 1.0433277748749842e-05, 'epoch': 0.98} {'loss': 0.8591, 'learning_rate': 1.0432950704397869e-05, 'epoch': 0.98} {'loss': 0.6757, 'learning_rate': 1.0432623659581946e-05, 'epoch': 0.98} {'loss': 0.7657, 'learning_rate': 1.0432296614302428e-05, 'epoch': 0.98} {'loss': 0.7561, 'learning_rate': 1.0431969568559668e-05, 'epoch': 0.98} {'loss': 0.7302, 'learning_rate': 1.0431642522354012e-05, 'epoch': 0.98} {'loss': 0.8033, 'learning_rate': 1.0431315475685813e-05, 'epoch': 0.98} {'loss': 0.6861, 'learning_rate': 1.043098842855542e-05, 'epoch': 0.98} {'loss': 0.8836, 'learning_rate': 1.0430661380963185e-05, 'epoch': 0.98} {'loss': 0.6478, 'learning_rate': 1.0430334332909455e-05, 'epoch': 0.98} {'loss': 0.8386, 'learning_rate': 1.0430007284394583e-05, 'epoch': 0.98} {'loss': 0.7025, 'learning_rate': 1.042968023541892e-05, 'epoch': 0.98} {'loss': 0.7508, 'learning_rate': 1.0429353185982818e-05, 'epoch': 0.98} {'loss': 0.7843, 'learning_rate': 1.0429026136086625e-05, 'epoch': 0.98} {'loss': 0.8913, 'learning_rate': 1.0428699085730691e-05, 'epoch': 0.98} {'loss': 0.8779, 'learning_rate': 1.0428372034915366e-05, 'epoch': 0.98} {'loss': 0.9132, 'learning_rate': 1.0428044983641e-05, 'epoch': 0.98} {'loss': 0.8047, 'learning_rate': 1.0427717931907947e-05, 'epoch': 0.98} {'loss': 0.8521, 'learning_rate': 1.042739087971656e-05, 'epoch': 0.98} {'loss': 0.7944, 'learning_rate': 1.042706382706718e-05, 'epoch': 0.98} {'loss': 0.8458, 'learning_rate': 1.0426736773960167e-05, 'epoch': 0.98} {'loss': 0.7291, 'learning_rate': 1.0426409720395862e-05, 'epoch': 0.98} {'loss': 0.7099, 'learning_rate': 1.0426082666374622e-05, 'epoch': 0.98} {'loss': 0.6836, 'learning_rate': 1.0425755611896797e-05, 'epoch': 0.98} {'loss': 0.8035, 'learning_rate': 1.0425428556962735e-05, 'epoch': 0.98} {'loss': 0.7055, 'learning_rate': 1.042510150157279e-05, 'epoch': 0.98} {'loss': 0.8561, 'learning_rate': 1.042477444572731e-05, 'epoch': 0.98} {'loss': 0.67, 'learning_rate': 1.0424447389426647e-05, 'epoch': 0.98} {'loss': 0.8265, 'learning_rate': 1.0424120332671145e-05, 'epoch': 0.98} {'loss': 0.7537, 'learning_rate': 1.0423793275461163e-05, 'epoch': 0.98} {'loss': 0.6852, 'learning_rate': 1.042346621779705e-05, 'epoch': 0.98} {'loss': 0.6154, 'learning_rate': 1.042313915967915e-05, 'epoch': 0.98} {'loss': 0.7478, 'learning_rate': 1.0422812101107825e-05, 'epoch': 0.98} {'loss': 0.7895, 'learning_rate': 1.0422485042083415e-05, 'epoch': 0.98} {'loss': 0.6538, 'learning_rate': 1.0422157982606273e-05, 'epoch': 0.98} {'loss': 0.8874, 'learning_rate': 1.0421830922676751e-05, 'epoch': 0.98} {'loss': 0.9166, 'learning_rate': 1.0421503862295199e-05, 'epoch': 0.98} {'loss': 0.8703, 'learning_rate': 1.042117680146197e-05, 'epoch': 0.98} {'loss': 0.6674, 'learning_rate': 1.0420849740177407e-05, 'epoch': 0.98} {'loss': 0.6871, 'learning_rate': 1.042052267844187e-05, 'epoch': 0.98} {'loss': 0.7597, 'learning_rate': 1.0420195616255709e-05, 'epoch': 0.98} {'loss': 0.6896, 'learning_rate': 1.0419868553619263e-05, 'epoch': 0.98} {'loss': 0.6348, 'learning_rate': 1.0419541490532892e-05, 'epoch': 0.98} {'loss': 0.6754, 'learning_rate': 1.0419214426996944e-05, 'epoch': 0.98} {'loss': 0.65, 'learning_rate': 1.041888736301177e-05, 'epoch': 0.98} {'loss': 0.8933, 'learning_rate': 1.0418560298577722e-05, 'epoch': 0.98} {'loss': 0.7293, 'learning_rate': 1.0418233233695148e-05, 'epoch': 0.98} {'loss': 0.7139, 'learning_rate': 1.0417906168364402e-05, 'epoch': 0.98} {'loss': 0.7575, 'learning_rate': 1.0417579102585828e-05, 'epoch': 0.98} {'loss': 0.7146, 'learning_rate': 1.0417252036359782e-05, 'epoch': 0.98} {'loss': 0.6638, 'learning_rate': 1.041692496968661e-05, 'epoch': 0.98} {'loss': 0.7965, 'learning_rate': 1.041659790256667e-05, 'epoch': 0.98} {'loss': 0.778, 'learning_rate': 1.0416270835000304e-05, 'epoch': 0.98} {'loss': 0.707, 'learning_rate': 1.0415943766987867e-05, 'epoch': 0.98} {'loss': 0.7507, 'learning_rate': 1.041561669852971e-05, 'epoch': 0.98} {'loss': 0.8365, 'learning_rate': 1.0415289629626181e-05, 'epoch': 0.98} {'loss': 0.8476, 'learning_rate': 1.0414962560277633e-05, 'epoch': 0.98} {'loss': 0.8631, 'learning_rate': 1.0414635490484412e-05, 'epoch': 0.98} {'loss': 0.7674, 'learning_rate': 1.0414308420246875e-05, 'epoch': 0.98} {'loss': 0.8146, 'learning_rate': 1.0413981349565368e-05, 'epoch': 0.98} {'loss': 0.6781, 'learning_rate': 1.0413654278440244e-05, 'epoch': 0.98} {'loss': 0.8591, 'learning_rate': 1.041332720687185e-05, 'epoch': 0.98} {'loss': 0.7812, 'learning_rate': 1.0413000134860539e-05, 'epoch': 0.98} {'loss': 0.6952, 'learning_rate': 1.0412673062406662e-05, 'epoch': 0.98} {'loss': 0.7759, 'learning_rate': 1.0412345989510569e-05, 'epoch': 0.98} {'loss': 0.5995, 'learning_rate': 1.0412018916172608e-05, 'epoch': 0.98} {'loss': 0.7567, 'learning_rate': 1.0411691842393132e-05, 'epoch': 0.98} {'loss': 0.9671, 'learning_rate': 1.0411364768172494e-05, 'epoch': 0.98} {'loss': 0.7333, 'learning_rate': 1.0411037693511036e-05, 'epoch': 0.98} {'loss': 0.9826, 'learning_rate': 1.0410710618409118e-05, 'epoch': 0.98} {'loss': 0.7294, 'learning_rate': 1.0410383542867087e-05, 'epoch': 0.98} {'loss': 0.6587, 'learning_rate': 1.0410056466885292e-05, 'epoch': 0.98} {'loss': 0.8066, 'learning_rate': 1.0409729390464083e-05, 'epoch': 0.98} {'loss': 0.6025, 'learning_rate': 1.0409402313603811e-05, 'epoch': 0.98} {'loss': 0.7058, 'learning_rate': 1.0409075236304833e-05, 'epoch': 0.98} {'loss': 0.7409, 'learning_rate': 1.040874815856749e-05, 'epoch': 0.98} {'loss': 0.9378, 'learning_rate': 1.0408421080392135e-05, 'epoch': 0.98} {'loss': 0.4895, 'learning_rate': 1.0408094001779123e-05, 'epoch': 0.98} {'loss': 0.71, 'learning_rate': 1.0407766922728801e-05, 'epoch': 0.98} {'loss': 0.9882, 'learning_rate': 1.0407439843241517e-05, 'epoch': 0.98} {'loss': 0.7622, 'learning_rate': 1.0407112763317629e-05, 'epoch': 0.98} {'loss': 0.7278, 'learning_rate': 1.040678568295748e-05, 'epoch': 0.98} {'loss': 0.8852, 'learning_rate': 1.0406458602161424e-05, 'epoch': 0.98} {'loss': 0.7509, 'learning_rate': 1.0406131520929811e-05, 'epoch': 0.98} {'loss': 0.8315, 'learning_rate': 1.0405804439262993e-05, 'epoch': 0.98} {'loss': 0.7507, 'learning_rate': 1.0405477357161316e-05, 'epoch': 0.98} {'loss': 0.6521, 'learning_rate': 1.0405150274625135e-05, 'epoch': 0.98} {'loss': 0.8393, 'learning_rate': 1.0404823191654798e-05, 'epoch': 0.98} {'loss': 0.7452, 'learning_rate': 1.0404496108250659e-05, 'epoch': 0.98} {'loss': 0.7843, 'learning_rate': 1.0404169024413065e-05, 'epoch': 0.98} {'loss': 0.7908, 'learning_rate': 1.0403841940142365e-05, 'epoch': 0.98} {'loss': 0.8538, 'learning_rate': 1.0403514855438914e-05, 'epoch': 0.98} {'loss': 0.6577, 'learning_rate': 1.0403187770303058e-05, 'epoch': 0.98} {'loss': 0.729, 'learning_rate': 1.0402860684735152e-05, 'epoch': 0.98} {'loss': 0.6642, 'learning_rate': 1.0402533598735545e-05, 'epoch': 0.98} {'loss': 0.8208, 'learning_rate': 1.0402206512304585e-05, 'epoch': 0.98} {'loss': 0.8074, 'learning_rate': 1.0401879425442627e-05, 'epoch': 0.98} {'loss': 0.9594, 'learning_rate': 1.0401552338150019e-05, 'epoch': 0.98} {'loss': 0.813, 'learning_rate': 1.0401225250427107e-05, 'epoch': 0.98} {'loss': 0.9866, 'learning_rate': 1.0400898162274249e-05, 'epoch': 0.98} {'loss': 0.6817, 'learning_rate': 1.0400571073691793e-05, 'epoch': 0.98} {'loss': 0.7808, 'learning_rate': 1.0400243984680087e-05, 'epoch': 0.98} {'loss': 0.7738, 'learning_rate': 1.0399916895239489e-05, 'epoch': 0.98} {'loss': 0.8319, 'learning_rate': 1.0399589805370335e-05, 'epoch': 0.98} {'loss': 0.8435, 'learning_rate': 1.0399262715072991e-05, 'epoch': 0.98} {'loss': 0.6721, 'learning_rate': 1.0398935624347796e-05, 'epoch': 0.98} {'loss': 0.9093, 'learning_rate': 1.039860853319511e-05, 'epoch': 0.98} {'loss': 0.6625, 'learning_rate': 1.0398281441615277e-05, 'epoch': 0.98} {'loss': 0.798, 'learning_rate': 1.039795434960865e-05, 'epoch': 0.98} {'loss': 0.7693, 'learning_rate': 1.039762725717558e-05, 'epoch': 0.98} {'loss': 0.6517, 'learning_rate': 1.0397300164316416e-05, 'epoch': 0.98} {'loss': 0.8369, 'learning_rate': 1.0396973071031507e-05, 'epoch': 0.98} {'loss': 0.7798, 'learning_rate': 1.0396645977321207e-05, 'epoch': 0.98} {'loss': 0.7557, 'learning_rate': 1.0396318883185863e-05, 'epoch': 0.98} {'loss': 0.8072, 'learning_rate': 1.0395991788625831e-05, 'epoch': 0.98} {'loss': 0.7126, 'learning_rate': 1.0395664693641456e-05, 'epoch': 0.98} {'loss': 0.722, 'learning_rate': 1.0395337598233092e-05, 'epoch': 0.98} {'loss': 0.7762, 'learning_rate': 1.0395010502401088e-05, 'epoch': 0.98} {'loss': 0.8409, 'learning_rate': 1.0394683406145794e-05, 'epoch': 0.98} {'loss': 0.5909, 'learning_rate': 1.039435630946756e-05, 'epoch': 0.98} {'loss': 0.6095, 'learning_rate': 1.0394029212366737e-05, 'epoch': 0.98} {'loss': 0.7256, 'learning_rate': 1.039370211484368e-05, 'epoch': 0.98} {'loss': 0.7181, 'learning_rate': 1.0393375016898732e-05, 'epoch': 0.98} {'loss': 0.848, 'learning_rate': 1.039304791853225e-05, 'epoch': 0.98} {'loss': 0.7124, 'learning_rate': 1.0392720819744579e-05, 'epoch': 0.98} {'loss': 0.8265, 'learning_rate': 1.0392393720536074e-05, 'epoch': 0.98} {'loss': 0.7114, 'learning_rate': 1.0392066620907082e-05, 'epoch': 0.98} {'loss': 0.7599, 'learning_rate': 1.0391739520857958e-05, 'epoch': 0.98} {'loss': 0.592, 'learning_rate': 1.0391412420389046e-05, 'epoch': 0.98} {'loss': 0.7769, 'learning_rate': 1.0391085319500702e-05, 'epoch': 0.98} {'loss': 0.8957, 'learning_rate': 1.0390758218193277e-05, 'epoch': 0.98} {'loss': 0.7824, 'learning_rate': 1.0390431116467116e-05, 'epoch': 0.98} {'loss': 0.7816, 'learning_rate': 1.0390104014322575e-05, 'epoch': 0.98} {'loss': 0.5446, 'learning_rate': 1.0389776911760003e-05, 'epoch': 0.98} {'loss': 0.7811, 'learning_rate': 1.0389449808779748e-05, 'epoch': 0.98} {'loss': 0.7322, 'learning_rate': 1.0389122705382162e-05, 'epoch': 0.98} {'loss': 0.7221, 'learning_rate': 1.0388795601567598e-05, 'epoch': 0.98} {'loss': 0.8297, 'learning_rate': 1.0388468497336401e-05, 'epoch': 0.98} {'loss': 0.7588, 'learning_rate': 1.0388141392688928e-05, 'epoch': 0.98} {'loss': 0.8031, 'learning_rate': 1.0387814287625527e-05, 'epoch': 0.98} {'loss': 0.6571, 'learning_rate': 1.0387487182146546e-05, 'epoch': 0.98} {'loss': 0.7617, 'learning_rate': 1.0387160076252337e-05, 'epoch': 0.98} {'loss': 0.9979, 'learning_rate': 1.0386832969943253e-05, 'epoch': 0.98} {'loss': 0.7527, 'learning_rate': 1.0386505863219642e-05, 'epoch': 0.98} {'loss': 0.8957, 'learning_rate': 1.0386178756081853e-05, 'epoch': 0.98} {'loss': 0.7155, 'learning_rate': 1.038585164853024e-05, 'epoch': 0.98} {'loss': 0.7911, 'learning_rate': 1.0385524540565154e-05, 'epoch': 0.98} {'loss': 0.7618, 'learning_rate': 1.0385197432186942e-05, 'epoch': 0.98} {'loss': 0.7674, 'learning_rate': 1.0384870323395955e-05, 'epoch': 0.98} {'loss': 0.7883, 'learning_rate': 1.0384543214192546e-05, 'epoch': 0.98} {'loss': 0.7943, 'learning_rate': 1.0384216104577064e-05, 'epoch': 0.98} {'loss': 0.8028, 'learning_rate': 1.038388899454986e-05, 'epoch': 0.98} {'loss': 0.6275, 'learning_rate': 1.0383561884111286e-05, 'epoch': 0.98} {'loss': 0.6056, 'learning_rate': 1.038323477326169e-05, 'epoch': 0.98} {'loss': 0.8084, 'learning_rate': 1.038290766200142e-05, 'epoch': 0.98} {'loss': 0.8891, 'learning_rate': 1.0382580550330833e-05, 'epoch': 0.98} {'loss': 0.7976, 'learning_rate': 1.0382253438250273e-05, 'epoch': 0.98} {'loss': 0.7086, 'learning_rate': 1.03819263257601e-05, 'epoch': 0.98} {'loss': 0.6738, 'learning_rate': 1.0381599212860657e-05, 'epoch': 0.98} {'loss': 0.7569, 'learning_rate': 1.0381272099552292e-05, 'epoch': 0.98} {'loss': 0.8348, 'learning_rate': 1.0380944985835362e-05, 'epoch': 0.98} {'loss': 0.8168, 'learning_rate': 1.0380617871710215e-05, 'epoch': 0.98} {'loss': 0.852, 'learning_rate': 1.03802907571772e-05, 'epoch': 0.98} {'loss': 0.7613, 'learning_rate': 1.037996364223667e-05, 'epoch': 0.98} {'loss': 0.6637, 'learning_rate': 1.0379636526888976e-05, 'epoch': 0.98} {'loss': 0.8893, 'learning_rate': 1.0379309411134468e-05, 'epoch': 0.98} {'loss': 0.7943, 'learning_rate': 1.0378982294973494e-05, 'epoch': 0.98} {'loss': 0.7233, 'learning_rate': 1.0378655178406406e-05, 'epoch': 0.98} {'loss': 0.8036, 'learning_rate': 1.0378328061433553e-05, 'epoch': 0.98} {'loss': 0.8008, 'learning_rate': 1.037800094405529e-05, 'epoch': 0.98} {'loss': 0.7758, 'learning_rate': 1.0377673826271965e-05, 'epoch': 0.98} {'loss': 0.7441, 'learning_rate': 1.0377346708083928e-05, 'epoch': 0.98} {'loss': 0.8738, 'learning_rate': 1.037701958949153e-05, 'epoch': 0.98} {'loss': 0.9025, 'learning_rate': 1.0376692470495121e-05, 'epoch': 0.98} {'loss': 0.72, 'learning_rate': 1.0376365351095052e-05, 'epoch': 0.98} {'loss': 0.5813, 'learning_rate': 1.0376038231291675e-05, 'epoch': 0.98} {'loss': 0.7849, 'learning_rate': 1.0375711111085337e-05, 'epoch': 0.98} {'loss': 0.7692, 'learning_rate': 1.0375383990476394e-05, 'epoch': 0.98} {'loss': 0.6681, 'learning_rate': 1.037505686946519e-05, 'epoch': 0.98} {'loss': 0.7654, 'learning_rate': 1.0374729748052079e-05, 'epoch': 0.98} {'loss': 0.7257, 'learning_rate': 1.0374402626237412e-05, 'epoch': 0.98} {'loss': 0.7962, 'learning_rate': 1.0374075504021537e-05, 'epoch': 0.98} {'loss': 0.8068, 'learning_rate': 1.0373748381404808e-05, 'epoch': 0.98} {'loss': 0.9392, 'learning_rate': 1.0373421258387575e-05, 'epoch': 0.98} {'loss': 0.7209, 'learning_rate': 1.0373094134970185e-05, 'epoch': 0.98} {'loss': 0.6854, 'learning_rate': 1.0372767011152993e-05, 'epoch': 0.98} {'loss': 0.7066, 'learning_rate': 1.0372439886936345e-05, 'epoch': 0.98} {'loss': 0.8787, 'learning_rate': 1.0372112762320596e-05, 'epoch': 0.98} {'loss': 0.7932, 'learning_rate': 1.0371785637306094e-05, 'epoch': 0.98} {'loss': 0.6734, 'learning_rate': 1.0371458511893188e-05, 'epoch': 0.98} {'loss': 0.8305, 'learning_rate': 1.0371131386082237e-05, 'epoch': 0.98} {'loss': 0.72, 'learning_rate': 1.0370804259873579e-05, 'epoch': 0.98} {'loss': 0.6908, 'learning_rate': 1.0370477133267575e-05, 'epoch': 0.98} {'loss': 0.7305, 'learning_rate': 1.0370150006264567e-05, 'epoch': 0.98} {'loss': 0.8003, 'learning_rate': 1.0369822878864912e-05, 'epoch': 0.98} {'loss': 0.8345, 'learning_rate': 1.0369495751068959e-05, 'epoch': 0.98} {'loss': 0.6769, 'learning_rate': 1.036916862287706e-05, 'epoch': 0.98} {'loss': 0.7875, 'learning_rate': 1.036884149428956e-05, 'epoch': 0.98} {'loss': 0.9474, 'learning_rate': 1.0368514365306812e-05, 'epoch': 0.98} {'loss': 0.8918, 'learning_rate': 1.0368187235929172e-05, 'epoch': 0.98} {'loss': 0.7193, 'learning_rate': 1.0367860106156984e-05, 'epoch': 0.98} {'loss': 0.5511, 'learning_rate': 1.03675329759906e-05, 'epoch': 0.98} {'loss': 0.6673, 'learning_rate': 1.0367205845430373e-05, 'epoch': 0.98} {'loss': 0.8677, 'learning_rate': 1.0366878714476649e-05, 'epoch': 0.98} {'loss': 0.7925, 'learning_rate': 1.0366551583129783e-05, 'epoch': 0.98} {'loss': 0.7177, 'learning_rate': 1.0366224451390124e-05, 'epoch': 0.98} {'loss': 0.7613, 'learning_rate': 1.0365897319258023e-05, 'epoch': 0.98} {'loss': 0.9122, 'learning_rate': 1.0365570186733828e-05, 'epoch': 0.98} {'loss': 0.7394, 'learning_rate': 1.0365243053817893e-05, 'epoch': 0.98} {'loss': 0.6892, 'learning_rate': 1.0364915920510568e-05, 'epoch': 0.98} {'loss': 0.8104, 'learning_rate': 1.03645887868122e-05, 'epoch': 0.98} {'loss': 0.7267, 'learning_rate': 1.0364261652723144e-05, 'epoch': 0.98} {'loss': 0.8305, 'learning_rate': 1.0363934518243748e-05, 'epoch': 0.98} {'loss': 0.8151, 'learning_rate': 1.0363607383374365e-05, 'epoch': 0.98} {'loss': 0.755, 'learning_rate': 1.0363280248115342e-05, 'epoch': 0.98} {'loss': 0.9269, 'learning_rate': 1.0362953112467033e-05, 'epoch': 0.98} {'loss': 0.7795, 'learning_rate': 1.0362625976429786e-05, 'epoch': 0.98} {'loss': 0.8118, 'learning_rate': 1.0362298840003953e-05, 'epoch': 0.98} {'loss': 0.6996, 'learning_rate': 1.036197170318988e-05, 'epoch': 0.98} {'loss': 0.709, 'learning_rate': 1.036164456598793e-05, 'epoch': 0.98} {'loss': 0.7777, 'learning_rate': 1.0361317428398438e-05, 'epoch': 0.98} {'loss': 0.8188, 'learning_rate': 1.0360990290421767e-05, 'epoch': 0.98} {'loss': 0.712, 'learning_rate': 1.036066315205826e-05, 'epoch': 0.98} {'loss': 0.6351, 'learning_rate': 1.0360336013308268e-05, 'epoch': 0.98} {'loss': 0.7465, 'learning_rate': 1.0360008874172143e-05, 'epoch': 0.98} {'loss': 0.7535, 'learning_rate': 1.0359681734650237e-05, 'epoch': 0.98} {'loss': 0.9664, 'learning_rate': 1.0359354594742903e-05, 'epoch': 0.98} {'loss': 0.7438, 'learning_rate': 1.0359027454450485e-05, 'epoch': 0.98} {'loss': 0.7208, 'learning_rate': 1.035870031377334e-05, 'epoch': 0.98} {'loss': 0.8292, 'learning_rate': 1.035837317271181e-05, 'epoch': 0.98} {'loss': 0.7956, 'learning_rate': 1.0358046031266253e-05, 'epoch': 0.98} {'loss': 0.6249, 'learning_rate': 1.035771888943702e-05, 'epoch': 0.98} {'loss': 0.9216, 'learning_rate': 1.0357391747224455e-05, 'epoch': 0.98} {'loss': 0.7346, 'learning_rate': 1.0357064604628915e-05, 'epoch': 0.98} {'loss': 0.7113, 'learning_rate': 1.0356737461650747e-05, 'epoch': 0.98} {'loss': 0.7086, 'learning_rate': 1.0356410318290304e-05, 'epoch': 0.98} {'loss': 0.6967, 'learning_rate': 1.0356083174547933e-05, 'epoch': 0.98} {'loss': 0.7281, 'learning_rate': 1.0355756030423987e-05, 'epoch': 0.98} {'loss': 0.7853, 'learning_rate': 1.0355428885918816e-05, 'epoch': 0.98} {'loss': 0.7697, 'learning_rate': 1.0355101741032772e-05, 'epoch': 0.98} {'loss': 0.7908, 'learning_rate': 1.0354774595766205e-05, 'epoch': 0.98} {'loss': 0.7047, 'learning_rate': 1.0354447450119467e-05, 'epoch': 0.98} {'loss': 0.858, 'learning_rate': 1.0354120304092903e-05, 'epoch': 0.98} {'loss': 0.8477, 'learning_rate': 1.0353793157686867e-05, 'epoch': 0.98} {'loss': 0.7898, 'learning_rate': 1.0353466010901709e-05, 'epoch': 0.98} {'loss': 0.6763, 'learning_rate': 1.0353138863737782e-05, 'epoch': 0.98} {'loss': 0.6535, 'learning_rate': 1.0352811716195436e-05, 'epoch': 0.98} {'loss': 0.7866, 'learning_rate': 1.0352484568275018e-05, 'epoch': 0.98} {'loss': 0.7604, 'learning_rate': 1.0352157419976885e-05, 'epoch': 0.98} {'loss': 0.6941, 'learning_rate': 1.035183027130138e-05, 'epoch': 0.98} {'loss': 0.8024, 'learning_rate': 1.0351503122248857e-05, 'epoch': 0.98} {'loss': 0.7177, 'learning_rate': 1.0351175972819668e-05, 'epoch': 0.98} {'loss': 0.7255, 'learning_rate': 1.0350848823014161e-05, 'epoch': 0.98} {'loss': 0.7299, 'learning_rate': 1.035052167283269e-05, 'epoch': 0.98} {'loss': 0.8991, 'learning_rate': 1.03501945222756e-05, 'epoch': 0.98} {'loss': 0.7452, 'learning_rate': 1.034986737134325e-05, 'epoch': 0.98} {'loss': 0.7143, 'learning_rate': 1.034954022003598e-05, 'epoch': 0.98} {'loss': 0.7432, 'learning_rate': 1.0349213068354149e-05, 'epoch': 0.98} {'loss': 0.7861, 'learning_rate': 1.0348885916298103e-05, 'epoch': 0.98} {'loss': 0.743, 'learning_rate': 1.0348558763868198e-05, 'epoch': 0.98} {'loss': 0.7732, 'learning_rate': 1.034823161106478e-05, 'epoch': 0.98} {'loss': 0.9335, 'learning_rate': 1.0347904457888199e-05, 'epoch': 0.98} {'loss': 0.6252, 'learning_rate': 1.0347577304338805e-05, 'epoch': 0.98} {'loss': 0.8184, 'learning_rate': 1.0347250150416953e-05, 'epoch': 0.98} {'loss': 0.7762, 'learning_rate': 1.0346922996122988e-05, 'epoch': 0.98} {'loss': 0.7698, 'learning_rate': 1.0346595841457268e-05, 'epoch': 0.98} {'loss': 0.8875, 'learning_rate': 1.0346268686420137e-05, 'epoch': 0.98} {'loss': 0.7805, 'learning_rate': 1.0345941531011947e-05, 'epoch': 0.98} {'loss': 0.8958, 'learning_rate': 1.0345614375233052e-05, 'epoch': 0.98} {'loss': 0.9735, 'learning_rate': 1.03452872190838e-05, 'epoch': 0.98} {'loss': 0.7972, 'learning_rate': 1.0344960062564538e-05, 'epoch': 0.98} {'loss': 0.8419, 'learning_rate': 1.0344632905675622e-05, 'epoch': 0.98} {'loss': 0.8294, 'learning_rate': 1.0344305748417403e-05, 'epoch': 0.98} {'loss': 0.7575, 'learning_rate': 1.0343978590790227e-05, 'epoch': 0.98} {'loss': 0.7337, 'learning_rate': 1.0343651432794446e-05, 'epoch': 0.98} {'loss': 0.8091, 'learning_rate': 1.0343324274430415e-05, 'epoch': 0.98} {'loss': 0.8233, 'learning_rate': 1.034299711569848e-05, 'epoch': 0.98} {'loss': 0.7853, 'learning_rate': 1.034266995659899e-05, 'epoch': 0.98} {'loss': 0.6567, 'learning_rate': 1.03423427971323e-05, 'epoch': 0.98} {'loss': 0.7185, 'learning_rate': 1.034201563729876e-05, 'epoch': 0.98} {'loss': 0.8397, 'learning_rate': 1.0341688477098714e-05, 'epoch': 0.98} {'loss': 0.7086, 'learning_rate': 1.0341361316532523e-05, 'epoch': 0.98} {'loss': 0.7028, 'learning_rate': 1.0341034155600533e-05, 'epoch': 0.98} {'loss': 0.8077, 'learning_rate': 1.0340706994303092e-05, 'epoch': 0.98} {'loss': 0.6297, 'learning_rate': 1.0340379832640554e-05, 'epoch': 0.98} {'loss': 0.7527, 'learning_rate': 1.0340052670613267e-05, 'epoch': 0.98} {'loss': 0.6421, 'learning_rate': 1.0339725508221583e-05, 'epoch': 0.98} {'loss': 0.7047, 'learning_rate': 1.0339398345465853e-05, 'epoch': 0.98} {'loss': 0.7571, 'learning_rate': 1.0339071182346425e-05, 'epoch': 0.98} {'loss': 0.6358, 'learning_rate': 1.0338744018863656e-05, 'epoch': 0.98} {'loss': 0.8616, 'learning_rate': 1.033841685501789e-05, 'epoch': 0.98} {'loss': 0.7095, 'learning_rate': 1.0338089690809479e-05, 'epoch': 0.98} {'loss': 0.6969, 'learning_rate': 1.0337762526238775e-05, 'epoch': 0.98} {'loss': 0.7854, 'learning_rate': 1.0337435361306128e-05, 'epoch': 0.98} {'loss': 0.8337, 'learning_rate': 1.0337108196011887e-05, 'epoch': 0.98} {'loss': 0.7656, 'learning_rate': 1.0336781030356406e-05, 'epoch': 0.98} {'loss': 0.8445, 'learning_rate': 1.0336453864340032e-05, 'epoch': 0.98} {'loss': 0.7608, 'learning_rate': 1.0336126697963121e-05, 'epoch': 0.98} {'loss': 0.8266, 'learning_rate': 1.0335799531226016e-05, 'epoch': 0.98} {'loss': 0.8788, 'learning_rate': 1.0335472364129074e-05, 'epoch': 0.98} {'loss': 0.8129, 'learning_rate': 1.033514519667264e-05, 'epoch': 0.98} {'loss': 0.8179, 'learning_rate': 1.033481802885707e-05, 'epoch': 0.98} {'loss': 0.8239, 'learning_rate': 1.0334490860682714e-05, 'epoch': 0.98} {'loss': 0.7305, 'learning_rate': 1.0334163692149919e-05, 'epoch': 0.98} {'loss': 0.8022, 'learning_rate': 1.0333836523259038e-05, 'epoch': 0.98} {'loss': 0.6856, 'learning_rate': 1.0333509354010419e-05, 'epoch': 0.98} {'loss': 0.6601, 'learning_rate': 1.0333182184404416e-05, 'epoch': 0.98} {'loss': 0.9175, 'learning_rate': 1.0332855014441376e-05, 'epoch': 0.98} {'loss': 0.7986, 'learning_rate': 1.0332527844121653e-05, 'epoch': 0.98} {'loss': 0.8087, 'learning_rate': 1.03322006734456e-05, 'epoch': 0.98} {'loss': 0.8114, 'learning_rate': 1.0331873502413564e-05, 'epoch': 0.98} {'loss': 0.8344, 'learning_rate': 1.0331546331025892e-05, 'epoch': 0.98} {'loss': 0.5596, 'learning_rate': 1.0331219159282937e-05, 'epoch': 0.98} {'loss': 0.7619, 'learning_rate': 1.0330891987185055e-05, 'epoch': 0.98} {'loss': 0.6529, 'learning_rate': 1.0330564814732588e-05, 'epoch': 0.98} {'loss': 0.557, 'learning_rate': 1.0330237641925894e-05, 'epoch': 0.98} {'loss': 0.739, 'learning_rate': 1.032991046876532e-05, 'epoch': 0.98} {'loss': 0.6939, 'learning_rate': 1.0329583295251218e-05, 'epoch': 0.98} {'loss': 0.7609, 'learning_rate': 1.0329256121383937e-05, 'epoch': 0.98} {'loss': 0.6747, 'learning_rate': 1.0328928947163828e-05, 'epoch': 0.98} {'loss': 0.949, 'learning_rate': 1.032860177259124e-05, 'epoch': 0.98} {'loss': 0.9309, 'learning_rate': 1.0328274597666528e-05, 'epoch': 0.98} {'loss': 0.675, 'learning_rate': 1.0327947422390042e-05, 'epoch': 0.98} {'loss': 0.7642, 'learning_rate': 1.0327620246762126e-05, 'epoch': 0.98} {'loss': 0.6621, 'learning_rate': 1.032729307078314e-05, 'epoch': 0.98} {'loss': 0.8137, 'learning_rate': 1.0326965894453427e-05, 'epoch': 0.98} {'loss': 0.7103, 'learning_rate': 1.032663871777334e-05, 'epoch': 0.98} {'loss': 0.6828, 'learning_rate': 1.0326311540743233e-05, 'epoch': 0.98} {'loss': 0.6576, 'learning_rate': 1.0325984363363453e-05, 'epoch': 0.98} {'loss': 0.8283, 'learning_rate': 1.0325657185634347e-05, 'epoch': 0.98} {'loss': 0.6345, 'learning_rate': 1.0325330007556276e-05, 'epoch': 0.98} {'loss': 0.7489, 'learning_rate': 1.0325002829129582e-05, 'epoch': 0.98} {'loss': 0.8024, 'learning_rate': 1.0324675650354617e-05, 'epoch': 0.98} {'loss': 0.8343, 'learning_rate': 1.0324348471231734e-05, 'epoch': 0.98} {'loss': 0.788, 'learning_rate': 1.0324021291761284e-05, 'epoch': 0.98} {'loss': 0.8707, 'learning_rate': 1.0323694111943611e-05, 'epoch': 0.98} {'loss': 0.8657, 'learning_rate': 1.0323366931779075e-05, 'epoch': 0.98} {'loss': 0.8836, 'learning_rate': 1.0323039751268023e-05, 'epoch': 0.98} {'loss': 0.9135, 'learning_rate': 1.03227125704108e-05, 'epoch': 0.98} {'loss': 0.7066, 'learning_rate': 1.0322385389207765e-05, 'epoch': 0.98} {'loss': 0.6206, 'learning_rate': 1.0322058207659262e-05, 'epoch': 0.98} {'loss': 0.8922, 'learning_rate': 1.032173102576565e-05, 'epoch': 0.98} {'loss': 0.9259, 'learning_rate': 1.0321403843527268e-05, 'epoch': 0.98} {'loss': 0.9042, 'learning_rate': 1.0321076660944475e-05, 'epoch': 0.98} {'loss': 0.6799, 'learning_rate': 1.0320749478017623e-05, 'epoch': 0.98} {'loss': 0.7706, 'learning_rate': 1.0320422294747053e-05, 'epoch': 0.98} {'loss': 0.7484, 'learning_rate': 1.0320095111133124e-05, 'epoch': 0.98} {'loss': 0.7337, 'learning_rate': 1.0319767927176185e-05, 'epoch': 0.98} {'loss': 0.8602, 'learning_rate': 1.0319440742876585e-05, 'epoch': 0.98} {'loss': 0.8122, 'learning_rate': 1.0319113558234675e-05, 'epoch': 0.98} {'loss': 0.699, 'learning_rate': 1.0318786373250806e-05, 'epoch': 0.98} {'loss': 0.8043, 'learning_rate': 1.031845918792533e-05, 'epoch': 0.98} {'loss': 0.7769, 'learning_rate': 1.0318132002258596e-05, 'epoch': 0.98} {'loss': 0.7303, 'learning_rate': 1.0317804816250956e-05, 'epoch': 0.98} {'loss': 0.7907, 'learning_rate': 1.0317477629902758e-05, 'epoch': 0.98} {'loss': 0.7155, 'learning_rate': 1.0317150443214352e-05, 'epoch': 0.98} {'loss': 0.8594, 'learning_rate': 1.0316823256186093e-05, 'epoch': 0.98} {'loss': 0.6306, 'learning_rate': 1.031649606881833e-05, 'epoch': 0.98} {'loss': 0.6134, 'learning_rate': 1.0316168881111412e-05, 'epoch': 0.98} {'loss': 0.8126, 'learning_rate': 1.0315841693065689e-05, 'epoch': 0.98} {'loss': 0.7354, 'learning_rate': 1.0315514504681517e-05, 'epoch': 0.98} {'loss': 0.7176, 'learning_rate': 1.031518731595924e-05, 'epoch': 0.98} {'loss': 0.8045, 'learning_rate': 1.031486012689921e-05, 'epoch': 0.98} {'loss': 0.7653, 'learning_rate': 1.031453293750178e-05, 'epoch': 0.98} {'loss': 0.763, 'learning_rate': 1.0314205747767298e-05, 'epoch': 0.98} {'loss': 0.9479, 'learning_rate': 1.0313878557696123e-05, 'epoch': 0.98} {'loss': 0.6706, 'learning_rate': 1.0313551367288595e-05, 'epoch': 0.98} {'loss': 0.8917, 'learning_rate': 1.0313224176545065e-05, 'epoch': 0.98} {'loss': 0.6236, 'learning_rate': 1.031289698546589e-05, 'epoch': 0.98} {'loss': 0.8926, 'learning_rate': 1.0312569794051415e-05, 'epoch': 0.98} {'loss': 0.8135, 'learning_rate': 1.0312242602301995e-05, 'epoch': 0.98} {'loss': 0.6486, 'learning_rate': 1.0311915410217981e-05, 'epoch': 0.98} {'loss': 0.935, 'learning_rate': 1.031158821779972e-05, 'epoch': 0.98} {'loss': 0.9345, 'learning_rate': 1.0311261025047565e-05, 'epoch': 0.98} {'loss': 0.7102, 'learning_rate': 1.0310933831961863e-05, 'epoch': 0.98} {'loss': 0.7691, 'learning_rate': 1.0310606638542967e-05, 'epoch': 0.98} {'loss': 0.6888, 'learning_rate': 1.0310279444791232e-05, 'epoch': 0.98} {'loss': 0.7561, 'learning_rate': 1.0309952250707e-05, 'epoch': 0.98} {'loss': 0.705, 'learning_rate': 1.030962505629063e-05, 'epoch': 0.98} {'loss': 0.5459, 'learning_rate': 1.0309297861542469e-05, 'epoch': 0.98} {'loss': 0.7551, 'learning_rate': 1.0308970666462865e-05, 'epoch': 0.98} {'loss': 0.763, 'learning_rate': 1.0308643471052172e-05, 'epoch': 0.98} {'loss': 0.8945, 'learning_rate': 1.0308316275310739e-05, 'epoch': 0.98} {'loss': 0.7393, 'learning_rate': 1.0307989079238918e-05, 'epoch': 0.98} {'loss': 0.5902, 'learning_rate': 1.0307661882837057e-05, 'epoch': 0.98} {'loss': 0.6057, 'learning_rate': 1.0307334686105512e-05, 'epoch': 0.98} {'loss': 0.7707, 'learning_rate': 1.0307007489044629e-05, 'epoch': 0.98} {'loss': 0.7607, 'learning_rate': 1.030668029165476e-05, 'epoch': 0.98} {'loss': 0.7486, 'learning_rate': 1.0306353093936252e-05, 'epoch': 0.98} {'loss': 0.7036, 'learning_rate': 1.0306025895889461e-05, 'epoch': 0.98} {'loss': 0.9007, 'learning_rate': 1.0305698697514737e-05, 'epoch': 0.98} {'loss': 0.8228, 'learning_rate': 1.030537149881243e-05, 'epoch': 0.98} {'loss': 0.709, 'learning_rate': 1.0305044299782887e-05, 'epoch': 0.98} {'loss': 0.9104, 'learning_rate': 1.0304717100426465e-05, 'epoch': 0.98} {'loss': 0.8763, 'learning_rate': 1.0304389900743507e-05, 'epoch': 0.98} {'loss': 0.613, 'learning_rate': 1.030406270073437e-05, 'epoch': 0.98} {'loss': 0.7062, 'learning_rate': 1.0303735500399401e-05, 'epoch': 0.98} {'loss': 0.7832, 'learning_rate': 1.0303408299738955e-05, 'epoch': 0.98} {'loss': 0.6615, 'learning_rate': 1.0303081098753379e-05, 'epoch': 0.98} {'loss': 0.8522, 'learning_rate': 1.0302753897443021e-05, 'epoch': 0.98} {'loss': 0.7467, 'learning_rate': 1.030242669580824e-05, 'epoch': 0.98} {'loss': 0.8934, 'learning_rate': 1.0302099493849376e-05, 'epoch': 0.98} {'loss': 0.8759, 'learning_rate': 1.0301772291566784e-05, 'epoch': 0.98} {'loss': 0.7656, 'learning_rate': 1.030144508896082e-05, 'epoch': 0.98} {'loss': 0.6474, 'learning_rate': 1.0301117886031833e-05, 'epoch': 0.98} {'loss': 0.6974, 'learning_rate': 1.0300790682780166e-05, 'epoch': 0.98} {'loss': 0.7347, 'learning_rate': 1.0300463479206176e-05, 'epoch': 0.98} {'loss': 0.7998, 'learning_rate': 1.0300136275310213e-05, 'epoch': 0.98} {'loss': 0.7315, 'learning_rate': 1.0299809071092626e-05, 'epoch': 0.98} {'loss': 0.8564, 'learning_rate': 1.0299481866553767e-05, 'epoch': 0.98} {'loss': 0.7831, 'learning_rate': 1.0299154661693987e-05, 'epoch': 0.98} {'loss': 0.5806, 'learning_rate': 1.0298827456513634e-05, 'epoch': 0.98} {'loss': 0.6073, 'learning_rate': 1.0298500251013059e-05, 'epoch': 0.98} {'loss': 0.7616, 'learning_rate': 1.0298173045192618e-05, 'epoch': 0.98} {'loss': 0.5553, 'learning_rate': 1.0297845839052656e-05, 'epoch': 0.98} {'loss': 0.838, 'learning_rate': 1.0297518632593526e-05, 'epoch': 0.98} {'loss': 0.8261, 'learning_rate': 1.0297191425815578e-05, 'epoch': 0.98} {'loss': 0.7633, 'learning_rate': 1.029686421871916e-05, 'epoch': 0.98} {'loss': 0.7053, 'learning_rate': 1.0296537011304629e-05, 'epoch': 0.98} {'loss': 0.711, 'learning_rate': 1.0296209803572328e-05, 'epoch': 0.98} {'loss': 0.8489, 'learning_rate': 1.0295882595522616e-05, 'epoch': 0.98} {'loss': 0.8079, 'learning_rate': 1.0295555387155833e-05, 'epoch': 0.98} {'loss': 0.59, 'learning_rate': 1.029522817847234e-05, 'epoch': 0.98} {'loss': 0.7019, 'learning_rate': 1.0294900969472483e-05, 'epoch': 0.98} {'loss': 0.7374, 'learning_rate': 1.0294573760156612e-05, 'epoch': 0.98} {'loss': 0.6637, 'learning_rate': 1.0294246550525078e-05, 'epoch': 0.98} {'loss': 0.6449, 'learning_rate': 1.0293919340578233e-05, 'epoch': 0.98} {'loss': 0.8327, 'learning_rate': 1.0293592130316428e-05, 'epoch': 0.98} {'loss': 0.7991, 'learning_rate': 1.0293264919740011e-05, 'epoch': 0.98} {'loss': 0.7112, 'learning_rate': 1.0292937708849338e-05, 'epoch': 0.98} {'loss': 0.7624, 'learning_rate': 1.0292610497644751e-05, 'epoch': 0.98} {'loss': 0.8198, 'learning_rate': 1.0292283286126605e-05, 'epoch': 0.98} {'loss': 0.8022, 'learning_rate': 1.0291956074295256e-05, 'epoch': 0.98} {'loss': 0.6673, 'learning_rate': 1.0291628862151043e-05, 'epoch': 0.98} {'loss': 0.6607, 'learning_rate': 1.029130164969433e-05, 'epoch': 0.98} {'loss': 0.5841, 'learning_rate': 1.029097443692546e-05, 'epoch': 0.98} {'loss': 0.6311, 'learning_rate': 1.0290647223844783e-05, 'epoch': 0.98} {'loss': 0.859, 'learning_rate': 1.0290320010452651e-05, 'epoch': 0.98} {'loss': 0.7388, 'learning_rate': 1.0289992796749414e-05, 'epoch': 0.98} {'loss': 0.7236, 'learning_rate': 1.0289665582735422e-05, 'epoch': 0.98} {'loss': 0.634, 'learning_rate': 1.028933836841103e-05, 'epoch': 0.98} {'loss': 0.6744, 'learning_rate': 1.0289011153776586e-05, 'epoch': 0.98} {'loss': 0.8987, 'learning_rate': 1.0288683938832442e-05, 'epoch': 0.98} {'loss': 0.7597, 'learning_rate': 1.0288356723578945e-05, 'epoch': 0.98} {'loss': 0.6911, 'learning_rate': 1.0288029508016448e-05, 'epoch': 0.98} {'loss': 0.7467, 'learning_rate': 1.0287702292145301e-05, 'epoch': 0.98} {'loss': 0.6158, 'learning_rate': 1.0287375075965856e-05, 'epoch': 0.98} {'loss': 0.7411, 'learning_rate': 1.0287047859478464e-05, 'epoch': 0.98} {'loss': 0.8009, 'learning_rate': 1.028672064268347e-05, 'epoch': 0.98} {'loss': 0.8481, 'learning_rate': 1.0286393425581231e-05, 'epoch': 0.98} {'loss': 0.764, 'learning_rate': 1.0286066208172096e-05, 'epoch': 0.98} {'loss': 0.7423, 'learning_rate': 1.0285738990456416e-05, 'epoch': 0.98} {'loss': 0.8436, 'learning_rate': 1.0285411772434539e-05, 'epoch': 0.99} {'loss': 0.7896, 'learning_rate': 1.0285084554106816e-05, 'epoch': 0.99} {'loss': 0.9528, 'learning_rate': 1.0284757335473605e-05, 'epoch': 0.99} {'loss': 0.5065, 'learning_rate': 1.0284430116535248e-05, 'epoch': 0.99} {'loss': 0.9024, 'learning_rate': 1.0284102897292099e-05, 'epoch': 0.99} {'loss': 0.7314, 'learning_rate': 1.0283775677744505e-05, 'epoch': 0.99} {'loss': 0.6762, 'learning_rate': 1.0283448457892821e-05, 'epoch': 0.99} {'loss': 0.8359, 'learning_rate': 1.0283121237737397e-05, 'epoch': 0.99} {'loss': 0.7395, 'learning_rate': 1.0282794017278586e-05, 'epoch': 0.99} {'loss': 0.7707, 'learning_rate': 1.028246679651673e-05, 'epoch': 0.99} {'loss': 0.6466, 'learning_rate': 1.028213957545219e-05, 'epoch': 0.99} {'loss': 0.6146, 'learning_rate': 1.028181235408531e-05, 'epoch': 0.99} {'loss': 0.8668, 'learning_rate': 1.0281485132416442e-05, 'epoch': 0.99} {'loss': 0.8826, 'learning_rate': 1.0281157910445938e-05, 'epoch': 0.99} {'loss': 0.895, 'learning_rate': 1.0280830688174151e-05, 'epoch': 0.99} {'loss': 0.633, 'learning_rate': 1.0280503465601423e-05, 'epoch': 0.99} {'loss': 0.603, 'learning_rate': 1.0280176242728112e-05, 'epoch': 0.99} {'loss': 0.779, 'learning_rate': 1.027984901955457e-05, 'epoch': 0.99} {'loss': 0.9115, 'learning_rate': 1.0279521796081142e-05, 'epoch': 0.99} {'loss': 0.7791, 'learning_rate': 1.027919457230818e-05, 'epoch': 0.99} {'loss': 0.897, 'learning_rate': 1.0278867348236036e-05, 'epoch': 0.99} {'loss': 0.7452, 'learning_rate': 1.0278540123865064e-05, 'epoch': 0.99} {'loss': 0.6981, 'learning_rate': 1.027821289919561e-05, 'epoch': 0.99} {'loss': 0.8153, 'learning_rate': 1.0277885674228024e-05, 'epoch': 0.99} {'loss': 0.7259, 'learning_rate': 1.027755844896266e-05, 'epoch': 0.99} {'loss': 0.8931, 'learning_rate': 1.0277231223399865e-05, 'epoch': 0.99} {'loss': 0.5828, 'learning_rate': 1.027690399753999e-05, 'epoch': 0.99} {'loss': 0.6134, 'learning_rate': 1.0276576771383393e-05, 'epoch': 0.99} {'loss': 0.6938, 'learning_rate': 1.0276249544930418e-05, 'epoch': 0.99} {'loss': 0.6225, 'learning_rate': 1.0275922318181412e-05, 'epoch': 0.99} {'loss': 0.7411, 'learning_rate': 1.0275595091136732e-05, 'epoch': 0.99} {'loss': 0.7012, 'learning_rate': 1.027526786379673e-05, 'epoch': 0.99} {'loss': 0.6704, 'learning_rate': 1.0274940636161752e-05, 'epoch': 0.99} {'loss': 0.7331, 'learning_rate': 1.0274613408232152e-05, 'epoch': 0.99} {'loss': 0.7692, 'learning_rate': 1.0274286180008275e-05, 'epoch': 0.99} {'loss': 0.7267, 'learning_rate': 1.0273958951490477e-05, 'epoch': 0.99} {'loss': 0.8945, 'learning_rate': 1.027363172267911e-05, 'epoch': 0.99} {'loss': 0.9108, 'learning_rate': 1.027330449357452e-05, 'epoch': 0.99} {'loss': 0.5478, 'learning_rate': 1.0272977264177057e-05, 'epoch': 0.99} {'loss': 0.7125, 'learning_rate': 1.0272650034487078e-05, 'epoch': 0.99} {'loss': 0.909, 'learning_rate': 1.027232280450493e-05, 'epoch': 0.99} {'loss': 0.7725, 'learning_rate': 1.0271995574230962e-05, 'epoch': 0.99} {'loss': 0.7249, 'learning_rate': 1.0271668343665523e-05, 'epoch': 0.99} {'loss': 0.7815, 'learning_rate': 1.0271341112808971e-05, 'epoch': 0.99} {'loss': 0.5293, 'learning_rate': 1.0271013881661654e-05, 'epoch': 0.99} {'loss': 0.7583, 'learning_rate': 1.0270686650223918e-05, 'epoch': 0.99} {'loss': 0.6586, 'learning_rate': 1.0270359418496118e-05, 'epoch': 0.99} {'loss': 0.7454, 'learning_rate': 1.0270032186478602e-05, 'epoch': 0.99} {'loss': 0.7776, 'learning_rate': 1.0269704954171724e-05, 'epoch': 0.99} {'loss': 0.7809, 'learning_rate': 1.026937772157583e-05, 'epoch': 0.99} {'loss': 0.8795, 'learning_rate': 1.0269050488691276e-05, 'epoch': 0.99} {'loss': 0.9446, 'learning_rate': 1.0268723255518412e-05, 'epoch': 0.99} {'loss': 0.7035, 'learning_rate': 1.0268396022057586e-05, 'epoch': 0.99} {'loss': 0.7969, 'learning_rate': 1.0268068788309147e-05, 'epoch': 0.99} {'loss': 0.8458, 'learning_rate': 1.0267741554273447e-05, 'epoch': 0.99} {'loss': 0.838, 'learning_rate': 1.0267414319950839e-05, 'epoch': 0.99} {'loss': 0.7272, 'learning_rate': 1.0267087085341674e-05, 'epoch': 0.99} {'loss': 0.6249, 'learning_rate': 1.0266759850446298e-05, 'epoch': 0.99} {'loss': 0.733, 'learning_rate': 1.026643261526507e-05, 'epoch': 0.99} {'loss': 0.6854, 'learning_rate': 1.0266105379798332e-05, 'epoch': 0.99} {'loss': 0.7149, 'learning_rate': 1.0265778144046439e-05, 'epoch': 0.99} {'loss': 0.6628, 'learning_rate': 1.026545090800974e-05, 'epoch': 0.99} {'loss': 0.7063, 'learning_rate': 1.0265123671688585e-05, 'epoch': 0.99} {'loss': 0.8151, 'learning_rate': 1.0264796435083326e-05, 'epoch': 0.99} {'loss': 0.708, 'learning_rate': 1.0264469198194315e-05, 'epoch': 0.99} {'loss': 0.6351, 'learning_rate': 1.0264141961021902e-05, 'epoch': 0.99} {'loss': 0.7898, 'learning_rate': 1.0263814723566438e-05, 'epoch': 0.99} {'loss': 0.7561, 'learning_rate': 1.0263487485828271e-05, 'epoch': 0.99} {'loss': 0.5775, 'learning_rate': 1.0263160247807755e-05, 'epoch': 0.99} {'loss': 0.7461, 'learning_rate': 1.0262833009505237e-05, 'epoch': 0.99} {'loss': 0.6752, 'learning_rate': 1.026250577092107e-05, 'epoch': 0.99} {'loss': 0.745, 'learning_rate': 1.0262178532055607e-05, 'epoch': 0.99} {'loss': 0.8814, 'learning_rate': 1.0261851292909192e-05, 'epoch': 0.99} {'loss': 0.6249, 'learning_rate': 1.0261524053482184e-05, 'epoch': 0.99} {'loss': 0.8313, 'learning_rate': 1.0261196813774927e-05, 'epoch': 0.99} {'loss': 0.7706, 'learning_rate': 1.0260869573787773e-05, 'epoch': 0.99} {'loss': 0.7072, 'learning_rate': 1.0260542333521072e-05, 'epoch': 0.99} {'loss': 0.6441, 'learning_rate': 1.0260215092975183e-05, 'epoch': 0.99} {'loss': 0.9776, 'learning_rate': 1.0259887852150445e-05, 'epoch': 0.99} {'loss': 0.7781, 'learning_rate': 1.0259560611047215e-05, 'epoch': 0.99} {'loss': 0.6592, 'learning_rate': 1.0259233369665844e-05, 'epoch': 0.99} {'loss': 0.771, 'learning_rate': 1.0258906128006678e-05, 'epoch': 0.99} {'loss': 0.6626, 'learning_rate': 1.0258578886070072e-05, 'epoch': 0.99} {'loss': 0.8137, 'learning_rate': 1.0258251643856375e-05, 'epoch': 0.99} {'loss': 0.6406, 'learning_rate': 1.025792440136594e-05, 'epoch': 0.99} {'loss': 0.7577, 'learning_rate': 1.0257597158599113e-05, 'epoch': 0.99} {'loss': 0.8218, 'learning_rate': 1.025726991555625e-05, 'epoch': 0.99} {'loss': 0.7503, 'learning_rate': 1.0256942672237697e-05, 'epoch': 0.99} {'loss': 0.6491, 'learning_rate': 1.0256615428643808e-05, 'epoch': 0.99} {'loss': 0.7528, 'learning_rate': 1.0256288184774929e-05, 'epoch': 0.99} {'loss': 0.7326, 'learning_rate': 1.025596094063142e-05, 'epoch': 0.99} {'loss': 0.9282, 'learning_rate': 1.0255633696213623e-05, 'epoch': 0.99} {'loss': 0.8595, 'learning_rate': 1.025530645152189e-05, 'epoch': 0.99} {'loss': 0.7816, 'learning_rate': 1.0254979206556574e-05, 'epoch': 0.99} {'loss': 0.7633, 'learning_rate': 1.0254651961318025e-05, 'epoch': 0.99} {'loss': 0.5552, 'learning_rate': 1.0254324715806593e-05, 'epoch': 0.99} {'loss': 0.7283, 'learning_rate': 1.0253997470022632e-05, 'epoch': 0.99} {'loss': 0.8011, 'learning_rate': 1.0253670223966485e-05, 'epoch': 0.99} {'loss': 0.6243, 'learning_rate': 1.025334297763851e-05, 'epoch': 0.99} {'loss': 0.866, 'learning_rate': 1.0253015731039054e-05, 'epoch': 0.99} {'loss': 0.7609, 'learning_rate': 1.0252688484168471e-05, 'epoch': 0.99} {'loss': 0.6105, 'learning_rate': 1.0252361237027109e-05, 'epoch': 0.99} {'loss': 0.8676, 'learning_rate': 1.025203398961532e-05, 'epoch': 0.99} {'loss': 0.7605, 'learning_rate': 1.025170674193345e-05, 'epoch': 0.99} {'loss': 0.7707, 'learning_rate': 1.0251379493981855e-05, 'epoch': 0.99} {'loss': 0.8973, 'learning_rate': 1.0251052245760885e-05, 'epoch': 0.99} {'loss': 0.7283, 'learning_rate': 1.0250724997270889e-05, 'epoch': 0.99} {'loss': 0.7216, 'learning_rate': 1.025039774851222e-05, 'epoch': 0.99} {'loss': 0.6528, 'learning_rate': 1.0250070499485226e-05, 'epoch': 0.99} {'loss': 0.8502, 'learning_rate': 1.024974325019026e-05, 'epoch': 0.99} {'loss': 0.6946, 'learning_rate': 1.0249416000627673e-05, 'epoch': 0.99} {'loss': 0.6512, 'learning_rate': 1.0249088750797811e-05, 'epoch': 0.99} {'loss': 0.8427, 'learning_rate': 1.0248761500701027e-05, 'epoch': 0.99} {'loss': 0.727, 'learning_rate': 1.0248434250337675e-05, 'epoch': 0.99} {'loss': 0.6936, 'learning_rate': 1.0248106999708102e-05, 'epoch': 0.99} {'loss': 0.765, 'learning_rate': 1.0247779748812665e-05, 'epoch': 0.99} {'loss': 0.7464, 'learning_rate': 1.0247452497651704e-05, 'epoch': 0.99} {'loss': 0.6697, 'learning_rate': 1.0247125246225575e-05, 'epoch': 0.99} {'loss': 0.8764, 'learning_rate': 1.0246797994534631e-05, 'epoch': 0.99} {'loss': 0.639, 'learning_rate': 1.024647074257922e-05, 'epoch': 0.99} {'loss': 0.7312, 'learning_rate': 1.0246143490359697e-05, 'epoch': 0.99} {'loss': 0.7596, 'learning_rate': 1.0245816237876404e-05, 'epoch': 0.99} {'loss': 0.9094, 'learning_rate': 1.0245488985129702e-05, 'epoch': 0.99} {'loss': 0.8176, 'learning_rate': 1.024516173211993e-05, 'epoch': 0.99} {'loss': 0.892, 'learning_rate': 1.0244834478847448e-05, 'epoch': 0.99} {'loss': 0.8049, 'learning_rate': 1.0244507225312603e-05, 'epoch': 0.99} {'loss': 0.8067, 'learning_rate': 1.0244179971515747e-05, 'epoch': 0.99} {'loss': 0.7893, 'learning_rate': 1.0243852717457232e-05, 'epoch': 0.99} {'loss': 0.7748, 'learning_rate': 1.0243525463137407e-05, 'epoch': 0.99} {'loss': 0.8163, 'learning_rate': 1.024319820855662e-05, 'epoch': 0.99} {'loss': 0.7321, 'learning_rate': 1.0242870953715225e-05, 'epoch': 0.99} {'loss': 0.8822, 'learning_rate': 1.024254369861357e-05, 'epoch': 0.99} {'loss': 0.7296, 'learning_rate': 1.0242216443252008e-05, 'epoch': 0.99} {'loss': 0.8634, 'learning_rate': 1.024188918763089e-05, 'epoch': 0.99} {'loss': 0.7913, 'learning_rate': 1.024156193175057e-05, 'epoch': 0.99} {'loss': 0.7298, 'learning_rate': 1.0241234675611391e-05, 'epoch': 0.99} {'loss': 0.8016, 'learning_rate': 1.0240907419213709e-05, 'epoch': 0.99} {'loss': 0.7558, 'learning_rate': 1.0240580162557869e-05, 'epoch': 0.99} {'loss': 0.9038, 'learning_rate': 1.0240252905644228e-05, 'epoch': 0.99} {'loss': 0.7193, 'learning_rate': 1.0239925648473132e-05, 'epoch': 0.99} {'loss': 0.7239, 'learning_rate': 1.0239598391044938e-05, 'epoch': 0.99} {'loss': 0.6851, 'learning_rate': 1.0239271133359992e-05, 'epoch': 0.99} {'loss': 0.6974, 'learning_rate': 1.0238943875418645e-05, 'epoch': 0.99} {'loss': 0.8916, 'learning_rate': 1.0238616617221246e-05, 'epoch': 0.99} {'loss': 0.652, 'learning_rate': 1.023828935876815e-05, 'epoch': 0.99} {'loss': 0.7736, 'learning_rate': 1.0237962100059702e-05, 'epoch': 0.99} {'loss': 0.6655, 'learning_rate': 1.023763484109626e-05, 'epoch': 0.99} {'loss': 0.6002, 'learning_rate': 1.023730758187817e-05, 'epoch': 0.99} {'loss': 0.7522, 'learning_rate': 1.0236980322405782e-05, 'epoch': 0.99} {'loss': 0.7618, 'learning_rate': 1.0236653062679452e-05, 'epoch': 0.99} {'loss': 0.7095, 'learning_rate': 1.0236325802699523e-05, 'epoch': 0.99} {'loss': 0.8227, 'learning_rate': 1.023599854246635e-05, 'epoch': 0.99} {'loss': 0.8164, 'learning_rate': 1.0235671281980282e-05, 'epoch': 0.99} {'loss': 0.8671, 'learning_rate': 1.0235344021241676e-05, 'epoch': 0.99} {'loss': 0.8604, 'learning_rate': 1.0235016760250873e-05, 'epoch': 0.99} {'loss': 0.6607, 'learning_rate': 1.023468949900823e-05, 'epoch': 0.99} {'loss': 0.5581, 'learning_rate': 1.0234362237514097e-05, 'epoch': 0.99} {'loss': 0.7072, 'learning_rate': 1.0234034975768821e-05, 'epoch': 0.99} {'loss': 0.8879, 'learning_rate': 1.0233707713772758e-05, 'epoch': 0.99} {'loss': 0.7338, 'learning_rate': 1.0233380451526255e-05, 'epoch': 0.99} {'loss': 0.748, 'learning_rate': 1.0233053189029665e-05, 'epoch': 0.99} {'loss': 0.8652, 'learning_rate': 1.0232725926283336e-05, 'epoch': 0.99} {'loss': 0.7595, 'learning_rate': 1.0232398663287621e-05, 'epoch': 0.99} {'loss': 0.8336, 'learning_rate': 1.0232071400042869e-05, 'epoch': 0.99} {'loss': 0.9335, 'learning_rate': 1.023174413654943e-05, 'epoch': 0.99} {'loss': 0.764, 'learning_rate': 1.023141687280766e-05, 'epoch': 0.99} {'loss': 0.7346, 'learning_rate': 1.0231089608817903e-05, 'epoch': 0.99} {'loss': 0.9541, 'learning_rate': 1.0230762344580514e-05, 'epoch': 0.99} {'loss': 0.8007, 'learning_rate': 1.0230435080095842e-05, 'epoch': 0.99} {'loss': 0.8547, 'learning_rate': 1.0230107815364238e-05, 'epoch': 0.99} {'loss': 0.7448, 'learning_rate': 1.0229780550386053e-05, 'epoch': 0.99} {'loss': 0.7194, 'learning_rate': 1.0229453285161637e-05, 'epoch': 0.99} {'loss': 0.8041, 'learning_rate': 1.0229126019691342e-05, 'epoch': 0.99} {'loss': 0.9056, 'learning_rate': 1.0228798753975518e-05, 'epoch': 0.99} {'loss': 0.6656, 'learning_rate': 1.0228471488014513e-05, 'epoch': 0.99} {'loss': 0.6357, 'learning_rate': 1.022814422180868e-05, 'epoch': 0.99} {'loss': 0.7801, 'learning_rate': 1.0227816955358374e-05, 'epoch': 0.99} {'loss': 0.6238, 'learning_rate': 1.0227489688663939e-05, 'epoch': 0.99} {'loss': 0.7825, 'learning_rate': 1.022716242172573e-05, 'epoch': 0.99} {'loss': 0.8413, 'learning_rate': 1.0226835154544093e-05, 'epoch': 0.99} {'loss': 0.7034, 'learning_rate': 1.0226507887119383e-05, 'epoch': 0.99} {'loss': 0.6593, 'learning_rate': 1.022618061945195e-05, 'epoch': 0.99} {'loss': 0.7838, 'learning_rate': 1.022585335154214e-05, 'epoch': 0.99} {'loss': 0.7334, 'learning_rate': 1.0225526083390314e-05, 'epoch': 0.99} {'loss': 0.6738, 'learning_rate': 1.0225198814996816e-05, 'epoch': 0.99} {'loss': 0.7553, 'learning_rate': 1.0224871546361994e-05, 'epoch': 0.99} {'loss': 0.6719, 'learning_rate': 1.0224544277486202e-05, 'epoch': 0.99} {'loss': 0.7648, 'learning_rate': 1.022421700836979e-05, 'epoch': 0.99} {'loss': 0.7526, 'learning_rate': 1.022388973901311e-05, 'epoch': 0.99} {'loss': 0.7967, 'learning_rate': 1.022356246941651e-05, 'epoch': 0.99} {'loss': 0.9222, 'learning_rate': 1.0223235199580347e-05, 'epoch': 0.99} {'loss': 0.7193, 'learning_rate': 1.0222907929504968e-05, 'epoch': 0.99} {'loss': 0.611, 'learning_rate': 1.022258065919072e-05, 'epoch': 0.99} {'loss': 0.8039, 'learning_rate': 1.0222253388637954e-05, 'epoch': 0.99} {'loss': 0.8305, 'learning_rate': 1.0221926117847027e-05, 'epoch': 0.99} {'loss': 0.7711, 'learning_rate': 1.0221598846818285e-05, 'epoch': 0.99} {'loss': 0.7152, 'learning_rate': 1.0221271575552083e-05, 'epoch': 0.99} {'loss': 0.8394, 'learning_rate': 1.0220944304048766e-05, 'epoch': 0.99} {'loss': 0.6955, 'learning_rate': 1.0220617032308688e-05, 'epoch': 0.99} {'loss': 0.794, 'learning_rate': 1.0220289760332199e-05, 'epoch': 0.99} {'loss': 0.7081, 'learning_rate': 1.0219962488119646e-05, 'epoch': 0.99} {'loss': 0.8058, 'learning_rate': 1.0219635215671387e-05, 'epoch': 0.99} {'loss': 0.9415, 'learning_rate': 1.0219307942987767e-05, 'epoch': 0.99} {'loss': 0.7908, 'learning_rate': 1.021898067006914e-05, 'epoch': 0.99} {'loss': 0.6949, 'learning_rate': 1.0218653396915859e-05, 'epoch': 0.99} {'loss': 0.7629, 'learning_rate': 1.0218326123528266e-05, 'epoch': 0.99} {'loss': 0.7646, 'learning_rate': 1.0217998849906719e-05, 'epoch': 0.99} {'loss': 0.9562, 'learning_rate': 1.0217671576051564e-05, 'epoch': 0.99} {'loss': 0.8798, 'learning_rate': 1.0217344301963154e-05, 'epoch': 0.99} {'loss': 0.7599, 'learning_rate': 1.0217017027641845e-05, 'epoch': 0.99} {'loss': 0.7884, 'learning_rate': 1.021668975308798e-05, 'epoch': 0.99} {'loss': 0.6374, 'learning_rate': 1.0216362478301913e-05, 'epoch': 0.99} {'loss': 0.8717, 'learning_rate': 1.0216035203283993e-05, 'epoch': 0.99} {'loss': 0.687, 'learning_rate': 1.0215707928034573e-05, 'epoch': 0.99} {'loss': 0.7865, 'learning_rate': 1.0215380652553999e-05, 'epoch': 0.99} {'loss': 0.7524, 'learning_rate': 1.0215053376842627e-05, 'epoch': 0.99} {'loss': 0.7535, 'learning_rate': 1.021472610090081e-05, 'epoch': 0.99} {'loss': 0.9179, 'learning_rate': 1.021439882472889e-05, 'epoch': 0.99} {'loss': 0.7855, 'learning_rate': 1.0214071548327224e-05, 'epoch': 0.99} {'loss': 0.6073, 'learning_rate': 1.021374427169616e-05, 'epoch': 0.99} {'loss': 0.8931, 'learning_rate': 1.021341699483605e-05, 'epoch': 0.99} {'loss': 0.7991, 'learning_rate': 1.0213089717747244e-05, 'epoch': 0.99} {'loss': 0.714, 'learning_rate': 1.0212762440430095e-05, 'epoch': 0.99} {'loss': 0.7264, 'learning_rate': 1.021243516288495e-05, 'epoch': 0.99} {'loss': 0.6745, 'learning_rate': 1.0212107885112163e-05, 'epoch': 0.99} {'loss': 0.6618, 'learning_rate': 1.0211780607112083e-05, 'epoch': 0.99} {'loss': 0.7824, 'learning_rate': 1.0211453328885062e-05, 'epoch': 0.99} {'loss': 0.8598, 'learning_rate': 1.0211126050431446e-05, 'epoch': 0.99} {'loss': 0.7603, 'learning_rate': 1.0210798771751593e-05, 'epoch': 0.99} {'loss': 0.8002, 'learning_rate': 1.0210471492845848e-05, 'epoch': 0.99} {'loss': 0.7206, 'learning_rate': 1.0210144213714564e-05, 'epoch': 0.99} {'loss': 0.7232, 'learning_rate': 1.0209816934358092e-05, 'epoch': 0.99} {'loss': 0.6713, 'learning_rate': 1.0209489654776783e-05, 'epoch': 0.99} {'loss': 0.9252, 'learning_rate': 1.0209162374970984e-05, 'epoch': 0.99} {'loss': 0.7395, 'learning_rate': 1.0208835094941054e-05, 'epoch': 0.99} {'loss': 0.6375, 'learning_rate': 1.0208507814687334e-05, 'epoch': 0.99} {'loss': 0.802, 'learning_rate': 1.0208180534210178e-05, 'epoch': 0.99} {'loss': 0.7494, 'learning_rate': 1.020785325350994e-05, 'epoch': 0.99} {'loss': 0.7601, 'learning_rate': 1.020752597258697e-05, 'epoch': 0.99} {'loss': 0.7004, 'learning_rate': 1.0207198691441615e-05, 'epoch': 0.99} {'loss': 0.5558, 'learning_rate': 1.0206871410074228e-05, 'epoch': 0.99} {'loss': 0.8015, 'learning_rate': 1.0206544128485162e-05, 'epoch': 0.99} {'loss': 0.8796, 'learning_rate': 1.0206216846674764e-05, 'epoch': 0.99} {'loss': 0.7946, 'learning_rate': 1.0205889564643382e-05, 'epoch': 0.99} {'loss': 0.5614, 'learning_rate': 1.0205562282391374e-05, 'epoch': 0.99} {'loss': 1.0359, 'learning_rate': 1.020523499991909e-05, 'epoch': 0.99} {'loss': 0.8684, 'learning_rate': 1.0204907717226875e-05, 'epoch': 0.99} {'loss': 0.6491, 'learning_rate': 1.0204580434315086e-05, 'epoch': 0.99} {'loss': 0.8196, 'learning_rate': 1.0204253151184068e-05, 'epoch': 0.99} {'loss': 0.7658, 'learning_rate': 1.0203925867834175e-05, 'epoch': 0.99} {'loss': 0.7259, 'learning_rate': 1.0203598584265754e-05, 'epoch': 0.99} {'loss': 0.7381, 'learning_rate': 1.0203271300479161e-05, 'epoch': 0.99} {'loss': 0.7883, 'learning_rate': 1.0202944016474747e-05, 'epoch': 0.99} {'loss': 0.8168, 'learning_rate': 1.020261673225286e-05, 'epoch': 0.99} {'loss': 0.7681, 'learning_rate': 1.020228944781385e-05, 'epoch': 0.99} {'loss': 0.7992, 'learning_rate': 1.0201962163158066e-05, 'epoch': 0.99} {'loss': 0.7028, 'learning_rate': 1.0201634878285861e-05, 'epoch': 0.99} {'loss': 0.8713, 'learning_rate': 1.0201307593197587e-05, 'epoch': 0.99} {'loss': 0.7857, 'learning_rate': 1.0200980307893593e-05, 'epoch': 0.99} {'loss': 0.8521, 'learning_rate': 1.0200653022374233e-05, 'epoch': 0.99} {'loss': 0.7827, 'learning_rate': 1.0200325736639858e-05, 'epoch': 0.99} {'loss': 0.8138, 'learning_rate': 1.0199998450690812e-05, 'epoch': 0.99} {'loss': 0.8556, 'learning_rate': 1.0199671164527447e-05, 'epoch': 0.99} {'loss': 0.7934, 'learning_rate': 1.0199343878150119e-05, 'epoch': 0.99} {'loss': 0.6351, 'learning_rate': 1.0199016591559176e-05, 'epoch': 0.99} {'loss': 0.8424, 'learning_rate': 1.0198689304754968e-05, 'epoch': 0.99} {'loss': 0.805, 'learning_rate': 1.0198362017737849e-05, 'epoch': 0.99} {'loss': 0.7238, 'learning_rate': 1.0198034730508169e-05, 'epoch': 0.99} {'loss': 0.7331, 'learning_rate': 1.0197707443066272e-05, 'epoch': 0.99} {'loss': 0.7224, 'learning_rate': 1.0197380155412513e-05, 'epoch': 0.99} {'loss': 0.7814, 'learning_rate': 1.0197052867547246e-05, 'epoch': 0.99} {'loss': 0.8217, 'learning_rate': 1.0196725579470816e-05, 'epoch': 0.99} {'loss': 0.7002, 'learning_rate': 1.0196398291183582e-05, 'epoch': 0.99} {'loss': 0.8455, 'learning_rate': 1.0196071002685885e-05, 'epoch': 0.99} {'loss': 0.7636, 'learning_rate': 1.0195743713978085e-05, 'epoch': 0.99} {'loss': 0.8068, 'learning_rate': 1.0195416425060524e-05, 'epoch': 0.99} {'loss': 0.8012, 'learning_rate': 1.0195089135933558e-05, 'epoch': 0.99} {'loss': 0.7866, 'learning_rate': 1.0194761846597534e-05, 'epoch': 0.99} {'loss': 0.7371, 'learning_rate': 1.0194434557052808e-05, 'epoch': 0.99} {'loss': 0.7006, 'learning_rate': 1.0194107267299726e-05, 'epoch': 0.99} {'loss': 0.7898, 'learning_rate': 1.0193779977338644e-05, 'epoch': 0.99} {'loss': 0.6901, 'learning_rate': 1.0193452687169907e-05, 'epoch': 0.99} {'loss': 0.9097, 'learning_rate': 1.0193125396793866e-05, 'epoch': 0.99} {'loss': 0.6645, 'learning_rate': 1.0192798106210875e-05, 'epoch': 0.99} {'loss': 0.766, 'learning_rate': 1.0192470815421282e-05, 'epoch': 0.99} {'loss': 0.6202, 'learning_rate': 1.0192143524425444e-05, 'epoch': 0.99} {'loss': 0.7429, 'learning_rate': 1.0191816233223703e-05, 'epoch': 0.99} {'loss': 0.8776, 'learning_rate': 1.0191488941816416e-05, 'epoch': 0.99} {'loss': 0.7158, 'learning_rate': 1.0191161650203929e-05, 'epoch': 0.99} {'loss': 0.802, 'learning_rate': 1.0190834358386596e-05, 'epoch': 0.99} {'loss': 0.7642, 'learning_rate': 1.0190507066364765e-05, 'epoch': 0.99} {'loss': 0.81, 'learning_rate': 1.0190179774138793e-05, 'epoch': 0.99} {'loss': 0.7397, 'learning_rate': 1.0189852481709022e-05, 'epoch': 0.99} {'loss': 0.7989, 'learning_rate': 1.0189525189075809e-05, 'epoch': 0.99} {'loss': 0.6083, 'learning_rate': 1.0189197896239503e-05, 'epoch': 0.99} {'loss': 0.7933, 'learning_rate': 1.0188870603200452e-05, 'epoch': 0.99} {'loss': 0.792, 'learning_rate': 1.0188543309959008e-05, 'epoch': 0.99} {'loss': 0.7301, 'learning_rate': 1.0188216016515529e-05, 'epoch': 0.99} {'loss': 0.6866, 'learning_rate': 1.0187888722870353e-05, 'epoch': 0.99} {'loss': 0.6396, 'learning_rate': 1.018756142902384e-05, 'epoch': 0.99} {'loss': 0.7208, 'learning_rate': 1.0187234134976338e-05, 'epoch': 0.99} {'loss': 0.784, 'learning_rate': 1.0186906840728199e-05, 'epoch': 0.99} {'loss': 0.7374, 'learning_rate': 1.0186579546279772e-05, 'epoch': 0.99} {'loss': 0.8413, 'learning_rate': 1.0186252251631406e-05, 'epoch': 0.99} {'loss': 0.7629, 'learning_rate': 1.0185924956783454e-05, 'epoch': 0.99} {'loss': 0.9774, 'learning_rate': 1.0185597661736268e-05, 'epoch': 0.99} {'loss': 0.8893, 'learning_rate': 1.0185270366490199e-05, 'epoch': 0.99} {'loss': 0.7364, 'learning_rate': 1.0184943071045592e-05, 'epoch': 0.99} {'loss': 0.7081, 'learning_rate': 1.0184615775402807e-05, 'epoch': 0.99} {'loss': 0.7228, 'learning_rate': 1.0184288479562186e-05, 'epoch': 0.99} {'loss': 0.7585, 'learning_rate': 1.0183961183524085e-05, 'epoch': 0.99} {'loss': 0.7488, 'learning_rate': 1.0183633887288851e-05, 'epoch': 0.99} {'loss': 0.7011, 'learning_rate': 1.0183306590856836e-05, 'epoch': 0.99} {'loss': 0.6194, 'learning_rate': 1.0182979294228392e-05, 'epoch': 0.99} {'loss': 0.8083, 'learning_rate': 1.0182651997403871e-05, 'epoch': 0.99} {'loss': 0.8876, 'learning_rate': 1.0182324700383624e-05, 'epoch': 0.99} {'loss': 0.6476, 'learning_rate': 1.0181997403167998e-05, 'epoch': 0.99} {'loss': 0.6608, 'learning_rate': 1.0181670105757341e-05, 'epoch': 0.99} {'loss': 0.7937, 'learning_rate': 1.0181342808152012e-05, 'epoch': 0.99} {'loss': 0.7657, 'learning_rate': 1.0181015510352357e-05, 'epoch': 0.99} {'loss': 0.7088, 'learning_rate': 1.0180688212358727e-05, 'epoch': 0.99} {'loss': 0.8986, 'learning_rate': 1.0180360914171474e-05, 'epoch': 0.99} {'loss': 0.752, 'learning_rate': 1.0180033615790948e-05, 'epoch': 0.99} {'loss': 0.8445, 'learning_rate': 1.0179706317217501e-05, 'epoch': 0.99} {'loss': 0.778, 'learning_rate': 1.0179379018451481e-05, 'epoch': 0.99} {'loss': 0.7746, 'learning_rate': 1.0179051719493238e-05, 'epoch': 0.99} {'loss': 0.6468, 'learning_rate': 1.0178724420343126e-05, 'epoch': 0.99} {'loss': 0.7745, 'learning_rate': 1.0178397121001498e-05, 'epoch': 0.99} {'loss': 0.633, 'learning_rate': 1.0178069821468699e-05, 'epoch': 0.99} {'loss': 0.6777, 'learning_rate': 1.0177742521745084e-05, 'epoch': 0.99} {'loss': 0.8132, 'learning_rate': 1.0177415221831e-05, 'epoch': 0.99} {'loss': 0.8515, 'learning_rate': 1.0177087921726798e-05, 'epoch': 0.99} {'loss': 0.8468, 'learning_rate': 1.0176760621432833e-05, 'epoch': 0.99} {'loss': 0.7658, 'learning_rate': 1.017643332094945e-05, 'epoch': 0.99} {'loss': 0.8177, 'learning_rate': 1.0176106020277005e-05, 'epoch': 0.99} {'loss': 0.7865, 'learning_rate': 1.0175778719415848e-05, 'epoch': 0.99} {'loss': 0.8786, 'learning_rate': 1.0175451418366327e-05, 'epoch': 0.99} {'loss': 0.7045, 'learning_rate': 1.0175124117128794e-05, 'epoch': 0.99} {'loss': 0.7233, 'learning_rate': 1.0174796815703598e-05, 'epoch': 0.99} {'loss': 0.7657, 'learning_rate': 1.0174469514091092e-05, 'epoch': 0.99} {'loss': 0.8228, 'learning_rate': 1.0174142212291627e-05, 'epoch': 0.99} {'loss': 0.6428, 'learning_rate': 1.0173814910305554e-05, 'epoch': 0.99} {'loss': 0.6705, 'learning_rate': 1.0173487608133221e-05, 'epoch': 0.99} {'loss': 0.7791, 'learning_rate': 1.0173160305774982e-05, 'epoch': 0.99} {'loss': 0.6577, 'learning_rate': 1.0172833003231184e-05, 'epoch': 0.99} {'loss': 0.8168, 'learning_rate': 1.017250570050218e-05, 'epoch': 0.99} {'loss': 0.7972, 'learning_rate': 1.0172178397588321e-05, 'epoch': 0.99} {'loss': 0.6248, 'learning_rate': 1.0171851094489957e-05, 'epoch': 0.99} {'loss': 0.7166, 'learning_rate': 1.017152379120744e-05, 'epoch': 0.99} {'loss': 0.8604, 'learning_rate': 1.017119648774112e-05, 'epoch': 0.99} {'loss': 0.7529, 'learning_rate': 1.0170869184091347e-05, 'epoch': 0.99} {'loss': 0.8025, 'learning_rate': 1.0170541880258473e-05, 'epoch': 0.99} {'loss': 0.7504, 'learning_rate': 1.0170214576242848e-05, 'epoch': 0.99} {'loss': 0.7873, 'learning_rate': 1.0169887272044821e-05, 'epoch': 0.99} {'loss': 0.726, 'learning_rate': 1.0169559967664747e-05, 'epoch': 0.99} {'loss': 0.9049, 'learning_rate': 1.016923266310297e-05, 'epoch': 0.99} {'loss': 0.778, 'learning_rate': 1.0168905358359847e-05, 'epoch': 0.99} {'loss': 0.8814, 'learning_rate': 1.0168578053435728e-05, 'epoch': 0.99} {'loss': 0.7169, 'learning_rate': 1.0168250748330961e-05, 'epoch': 0.99} {'loss': 0.62, 'learning_rate': 1.01679234430459e-05, 'epoch': 0.99} {'loss': 0.7786, 'learning_rate': 1.0167596137580893e-05, 'epoch': 0.99} {'loss': 0.7221, 'learning_rate': 1.016726883193629e-05, 'epoch': 0.99} {'loss': 0.8091, 'learning_rate': 1.0166941526112445e-05, 'epoch': 0.99} {'loss': 0.8236, 'learning_rate': 1.0166614220109707e-05, 'epoch': 0.99} {'loss': 0.6759, 'learning_rate': 1.0166286913928424e-05, 'epoch': 0.99} {'loss': 0.7023, 'learning_rate': 1.0165959607568954e-05, 'epoch': 0.99} {'loss': 0.7679, 'learning_rate': 1.0165632301031642e-05, 'epoch': 0.99} {'loss': 0.8335, 'learning_rate': 1.0165304994316839e-05, 'epoch': 0.99} {'loss': 0.7898, 'learning_rate': 1.0164977687424895e-05, 'epoch': 0.99} {'loss': 0.6722, 'learning_rate': 1.0164650380356165e-05, 'epoch': 0.99} {'loss': 0.8159, 'learning_rate': 1.0164323073110998e-05, 'epoch': 0.99} {'loss': 0.8733, 'learning_rate': 1.0163995765689743e-05, 'epoch': 0.99} {'loss': 0.7274, 'learning_rate': 1.016366845809275e-05, 'epoch': 0.99} {'loss': 0.7411, 'learning_rate': 1.0163341150320376e-05, 'epoch': 0.99} {'loss': 0.6345, 'learning_rate': 1.0163013842372961e-05, 'epoch': 0.99} {'loss': 0.838, 'learning_rate': 1.0162686534250865e-05, 'epoch': 0.99} {'loss': 0.7082, 'learning_rate': 1.0162359225954437e-05, 'epoch': 0.99} {'loss': 0.9164, 'learning_rate': 1.0162031917484025e-05, 'epoch': 0.99} {'loss': 0.8456, 'learning_rate': 1.0161704608839982e-05, 'epoch': 0.99} {'loss': 0.869, 'learning_rate': 1.0161377300022659e-05, 'epoch': 0.99} {'loss': 0.9437, 'learning_rate': 1.0161049991032403e-05, 'epoch': 0.99} {'loss': 1.0311, 'learning_rate': 1.0160722681869569e-05, 'epoch': 0.99} {'loss': 0.861, 'learning_rate': 1.0160395372534504e-05, 'epoch': 0.99} {'loss': 0.6525, 'learning_rate': 1.0160068063027561e-05, 'epoch': 0.99} {'loss': 0.675, 'learning_rate': 1.0159740753349094e-05, 'epoch': 0.99} {'loss': 0.7755, 'learning_rate': 1.015941344349945e-05, 'epoch': 0.99} {'loss': 0.7965, 'learning_rate': 1.015908613347898e-05, 'epoch': 0.99} {'loss': 0.8014, 'learning_rate': 1.0158758823288032e-05, 'epoch': 0.99} {'loss': 0.7648, 'learning_rate': 1.015843151292696e-05, 'epoch': 0.99} {'loss': 0.7081, 'learning_rate': 1.0158104202396115e-05, 'epoch': 0.99} {'loss': 0.9302, 'learning_rate': 1.0157776891695848e-05, 'epoch': 0.99} {'loss': 0.8392, 'learning_rate': 1.0157449580826509e-05, 'epoch': 0.99} {'loss': 0.6272, 'learning_rate': 1.0157122269788449e-05, 'epoch': 0.99} {'loss': 0.8229, 'learning_rate': 1.0156794958582017e-05, 'epoch': 0.99} {'loss': 0.7244, 'learning_rate': 1.0156467647207565e-05, 'epoch': 0.99} {'loss': 0.6918, 'learning_rate': 1.0156140335665444e-05, 'epoch': 0.99} {'loss': 0.8519, 'learning_rate': 1.0155813023956003e-05, 'epoch': 0.99} {'loss': 0.9522, 'learning_rate': 1.0155485712079598e-05, 'epoch': 0.99} {'loss': 0.816, 'learning_rate': 1.0155158400036574e-05, 'epoch': 0.99} {'loss': 0.6685, 'learning_rate': 1.0154831087827284e-05, 'epoch': 0.99} {'loss': 0.8486, 'learning_rate': 1.0154503775452076e-05, 'epoch': 0.99} {'loss': 0.8381, 'learning_rate': 1.0154176462911305e-05, 'epoch': 0.99} {'loss': 0.9048, 'learning_rate': 1.0153849150205322e-05, 'epoch': 0.99} {'loss': 0.58, 'learning_rate': 1.0153521837334472e-05, 'epoch': 0.99} {'loss': 0.8121, 'learning_rate': 1.0153194524299113e-05, 'epoch': 0.99} {'loss': 0.6955, 'learning_rate': 1.0152867211099593e-05, 'epoch': 0.99} {'loss': 0.8163, 'learning_rate': 1.015253989773626e-05, 'epoch': 0.99} {'loss': 0.6784, 'learning_rate': 1.0152212584209464e-05, 'epoch': 0.99} {'loss': 0.8933, 'learning_rate': 1.0151885270519561e-05, 'epoch': 0.99} {'loss': 0.7196, 'learning_rate': 1.01515579566669e-05, 'epoch': 0.99} {'loss': 0.6317, 'learning_rate': 1.0151230642651831e-05, 'epoch': 0.99} {'loss': 0.6072, 'learning_rate': 1.0150903328474704e-05, 'epoch': 0.99} {'loss': 0.8427, 'learning_rate': 1.015057601413587e-05, 'epoch': 0.99} {'loss': 0.7112, 'learning_rate': 1.015024869963568e-05, 'epoch': 0.99} {'loss': 0.6216, 'learning_rate': 1.0149921384974486e-05, 'epoch': 0.99} {'loss': 0.7324, 'learning_rate': 1.0149594070152638e-05, 'epoch': 0.99} {'loss': 0.7262, 'learning_rate': 1.0149266755170484e-05, 'epoch': 0.99} {'loss': 0.7976, 'learning_rate': 1.014893944002838e-05, 'epoch': 0.99} {'loss': 0.7554, 'learning_rate': 1.0148612124726673e-05, 'epoch': 0.99} {'loss': 0.7497, 'learning_rate': 1.0148284809265715e-05, 'epoch': 0.99} {'loss': 0.8615, 'learning_rate': 1.0147957493645857e-05, 'epoch': 0.99} {'loss': 0.7146, 'learning_rate': 1.0147630177867447e-05, 'epoch': 0.99} {'loss': 0.7445, 'learning_rate': 1.014730286193084e-05, 'epoch': 0.99} {'loss': 0.7089, 'learning_rate': 1.0146975545836384e-05, 'epoch': 0.99} {'loss': 0.7715, 'learning_rate': 1.014664822958443e-05, 'epoch': 0.99} {'loss': 0.7074, 'learning_rate': 1.0146320913175329e-05, 'epoch': 0.99} {'loss': 0.8854, 'learning_rate': 1.0145993596609433e-05, 'epoch': 0.99} {'loss': 0.5466, 'learning_rate': 1.0145666279887091e-05, 'epoch': 0.99} {'loss': 0.7233, 'learning_rate': 1.0145338963008656e-05, 'epoch': 0.99} {'loss': 0.9072, 'learning_rate': 1.0145011645974477e-05, 'epoch': 0.99} {'loss': 0.6365, 'learning_rate': 1.0144684328784901e-05, 'epoch': 0.99} {'loss': 0.6286, 'learning_rate': 1.0144357011440284e-05, 'epoch': 0.99} {'loss': 0.6698, 'learning_rate': 1.0144029693940977e-05, 'epoch': 0.99} {'loss': 0.7234, 'learning_rate': 1.014370237628733e-05, 'epoch': 0.99} {'loss': 0.6956, 'learning_rate': 1.0143375058479692e-05, 'epoch': 0.99} {'loss': 0.6692, 'learning_rate': 1.0143047740518415e-05, 'epoch': 0.99} {'loss': 0.7867, 'learning_rate': 1.0142720422403848e-05, 'epoch': 0.99} {'loss': 0.7374, 'learning_rate': 1.0142393104136345e-05, 'epoch': 0.99} {'loss': 0.6344, 'learning_rate': 1.0142065785716252e-05, 'epoch': 0.99} {'loss': 0.6477, 'learning_rate': 1.014173846714393e-05, 'epoch': 0.99} {'loss': 0.7873, 'learning_rate': 1.0141411148419716e-05, 'epoch': 0.99} {'loss': 0.7038, 'learning_rate': 1.0141083829543967e-05, 'epoch': 0.99} {'loss': 0.8389, 'learning_rate': 1.0140756510517036e-05, 'epoch': 0.99} {'loss': 0.9073, 'learning_rate': 1.0140429191339272e-05, 'epoch': 0.99} {'loss': 0.7627, 'learning_rate': 1.0140101872011023e-05, 'epoch': 0.99} {'loss': 0.8804, 'learning_rate': 1.0139774552532644e-05, 'epoch': 0.99} {'loss': 0.7589, 'learning_rate': 1.0139447232904484e-05, 'epoch': 0.99} {'loss': 0.7209, 'learning_rate': 1.0139119913126894e-05, 'epoch': 0.99} {'loss': 0.6928, 'learning_rate': 1.0138792593200224e-05, 'epoch': 0.99} {'loss': 0.7527, 'learning_rate': 1.0138465273124824e-05, 'epoch': 0.99} {'loss': 0.843, 'learning_rate': 1.0138137952901047e-05, 'epoch': 0.99} {'loss': 0.7119, 'learning_rate': 1.0137810632529243e-05, 'epoch': 0.99} {'loss': 0.8541, 'learning_rate': 1.013748331200976e-05, 'epoch': 0.99} {'loss': 0.6732, 'learning_rate': 1.0137155991342957e-05, 'epoch': 0.99} {'loss': 0.8371, 'learning_rate': 1.0136828670529178e-05, 'epoch': 0.99} {'loss': 0.6815, 'learning_rate': 1.013650134956877e-05, 'epoch': 0.99} {'loss': 0.7921, 'learning_rate': 1.013617402846209e-05, 'epoch': 0.99} {'loss': 0.8111, 'learning_rate': 1.0135846707209486e-05, 'epoch': 0.99} {'loss': 0.7304, 'learning_rate': 1.0135519385811312e-05, 'epoch': 0.99} {'loss': 0.8966, 'learning_rate': 1.0135192064267916e-05, 'epoch': 0.99} {'loss': 0.752, 'learning_rate': 1.0134864742579651e-05, 'epoch': 0.99} {'loss': 0.6758, 'learning_rate': 1.0134537420746868e-05, 'epoch': 0.99} {'loss': 0.654, 'learning_rate': 1.0134210098769913e-05, 'epoch': 0.99} {'loss': 0.6311, 'learning_rate': 1.013388277664914e-05, 'epoch': 0.99} {'loss': 0.5727, 'learning_rate': 1.0133555454384898e-05, 'epoch': 0.99} {'loss': 0.6459, 'learning_rate': 1.0133228131977542e-05, 'epoch': 0.99} {'loss': 0.847, 'learning_rate': 1.0132900809427418e-05, 'epoch': 0.99} {'loss': 0.8815, 'learning_rate': 1.013257348673488e-05, 'epoch': 0.99} {'loss': 0.7626, 'learning_rate': 1.0132246163900279e-05, 'epoch': 0.99} {'loss': 0.7321, 'learning_rate': 1.0131918840923962e-05, 'epoch': 0.99} {'loss': 0.8127, 'learning_rate': 1.0131591517806282e-05, 'epoch': 0.99} {'loss': 0.8695, 'learning_rate': 1.013126419454759e-05, 'epoch': 0.99} {'loss': 0.7889, 'learning_rate': 1.0130936871148236e-05, 'epoch': 0.99} {'loss': 0.7027, 'learning_rate': 1.0130609547608575e-05, 'epoch': 0.99} {'loss': 0.7185, 'learning_rate': 1.0130282223928951e-05, 'epoch': 0.99} {'loss': 0.6892, 'learning_rate': 1.012995490010972e-05, 'epoch': 0.99} {'loss': 0.6125, 'learning_rate': 1.0129627576151227e-05, 'epoch': 0.99} {'loss': 0.8105, 'learning_rate': 1.0129300252053828e-05, 'epoch': 0.99} {'loss': 0.7387, 'learning_rate': 1.012897292781787e-05, 'epoch': 0.99} {'loss': 0.7823, 'learning_rate': 1.012864560344371e-05, 'epoch': 0.99} {'loss': 0.7737, 'learning_rate': 1.0128318278931692e-05, 'epoch': 0.99} {'loss': 0.8159, 'learning_rate': 1.0127990954282175e-05, 'epoch': 0.99} {'loss': 0.9296, 'learning_rate': 1.0127663629495496e-05, 'epoch': 1.0} {'loss': 0.8894, 'learning_rate': 1.0127336304572018e-05, 'epoch': 1.0} {'loss': 0.8724, 'learning_rate': 1.0127008979512085e-05, 'epoch': 1.0} {'loss': 0.6628, 'learning_rate': 1.0126681654316052e-05, 'epoch': 1.0} {'loss': 0.7632, 'learning_rate': 1.012635432898427e-05, 'epoch': 1.0} {'loss': 0.9339, 'learning_rate': 1.0126027003517087e-05, 'epoch': 1.0} {'loss': 0.8283, 'learning_rate': 1.0125699677914855e-05, 'epoch': 1.0} {'loss': 0.6832, 'learning_rate': 1.0125372352177922e-05, 'epoch': 1.0} {'loss': 0.7966, 'learning_rate': 1.0125045026306643e-05, 'epoch': 1.0} {'loss': 0.746, 'learning_rate': 1.0124717700301367e-05, 'epoch': 1.0} {'loss': 0.7729, 'learning_rate': 1.0124390374162446e-05, 'epoch': 1.0} {'loss': 0.6664, 'learning_rate': 1.0124063047890227e-05, 'epoch': 1.0} {'loss': 0.7516, 'learning_rate': 1.0123735721485063e-05, 'epoch': 1.0} {'loss': 0.7185, 'learning_rate': 1.0123408394947306e-05, 'epoch': 1.0} {'loss': 0.9533, 'learning_rate': 1.0123081068277308e-05, 'epoch': 1.0} {'loss': 0.7633, 'learning_rate': 1.0122753741475416e-05, 'epoch': 1.0} {'loss': 0.802, 'learning_rate': 1.0122426414541981e-05, 'epoch': 1.0} {'loss': 0.7794, 'learning_rate': 1.0122099087477355e-05, 'epoch': 1.0} {'loss': 0.627, 'learning_rate': 1.012177176028189e-05, 'epoch': 1.0} {'loss': 0.8064, 'learning_rate': 1.0121444432955934e-05, 'epoch': 1.0} {'loss': 0.6658, 'learning_rate': 1.0121117105499843e-05, 'epoch': 1.0} {'loss': 0.7743, 'learning_rate': 1.0120789777913962e-05, 'epoch': 1.0} {'loss': 0.6576, 'learning_rate': 1.0120462450198642e-05, 'epoch': 1.0} {'loss': 0.8199, 'learning_rate': 1.0120135122354237e-05, 'epoch': 1.0} {'loss': 0.7553, 'learning_rate': 1.0119807794381098e-05, 'epoch': 1.0} {'loss': 0.7006, 'learning_rate': 1.0119480466279571e-05, 'epoch': 1.0} {'loss': 0.8216, 'learning_rate': 1.011915313805001e-05, 'epoch': 1.0} {'loss': 0.79, 'learning_rate': 1.0118825809692769e-05, 'epoch': 1.0} {'loss': 0.8147, 'learning_rate': 1.0118498481208194e-05, 'epoch': 1.0} {'loss': 0.8505, 'learning_rate': 1.011817115259664e-05, 'epoch': 1.0} {'loss': 0.7107, 'learning_rate': 1.0117843823858449e-05, 'epoch': 1.0} {'loss': 0.7702, 'learning_rate': 1.011751649499398e-05, 'epoch': 1.0} {'loss': 0.7527, 'learning_rate': 1.011718916600358e-05, 'epoch': 1.0} {'loss': 0.6836, 'learning_rate': 1.0116861836887606e-05, 'epoch': 1.0} {'loss': 0.5459, 'learning_rate': 1.01165345076464e-05, 'epoch': 1.0} {'loss': 0.7654, 'learning_rate': 1.0116207178280319e-05, 'epoch': 1.0} {'loss': 0.9691, 'learning_rate': 1.011587984878971e-05, 'epoch': 1.0} {'loss': 0.7194, 'learning_rate': 1.0115552519174925e-05, 'epoch': 1.0} {'loss': 0.6414, 'learning_rate': 1.0115225189436316e-05, 'epoch': 1.0} {'loss': 0.7738, 'learning_rate': 1.0114897859574231e-05, 'epoch': 1.0} {'loss': 0.774, 'learning_rate': 1.0114570529589027e-05, 'epoch': 1.0} {'loss': 0.7652, 'learning_rate': 1.0114243199481046e-05, 'epoch': 1.0} {'loss': 0.7396, 'learning_rate': 1.0113915869250646e-05, 'epoch': 1.0} {'loss': 0.8327, 'learning_rate': 1.0113588538898173e-05, 'epoch': 1.0} {'loss': 0.8564, 'learning_rate': 1.0113261208423978e-05, 'epoch': 1.0} {'loss': 0.7503, 'learning_rate': 1.0112933877828417e-05, 'epoch': 1.0} {'loss': 0.8138, 'learning_rate': 1.0112606547111833e-05, 'epoch': 1.0} {'loss': 0.7814, 'learning_rate': 1.0112279216274588e-05, 'epoch': 1.0} {'loss': 0.8323, 'learning_rate': 1.0111951885317022e-05, 'epoch': 1.0} {'loss': 0.7373, 'learning_rate': 1.0111624554239487e-05, 'epoch': 1.0} {'loss': 0.788, 'learning_rate': 1.0111297223042338e-05, 'epoch': 1.0} {'loss': 0.7087, 'learning_rate': 1.0110969891725923e-05, 'epoch': 1.0} {'loss': 0.7659, 'learning_rate': 1.0110642560290593e-05, 'epoch': 1.0} {'loss': 0.7357, 'learning_rate': 1.01103152287367e-05, 'epoch': 1.0} {'loss': 0.6525, 'learning_rate': 1.0109987897064597e-05, 'epoch': 1.0} {'loss': 0.7977, 'learning_rate': 1.0109660565274633e-05, 'epoch': 1.0} {'loss': 0.7663, 'learning_rate': 1.0109333233367155e-05, 'epoch': 1.0} {'loss': 0.5914, 'learning_rate': 1.0109005901342517e-05, 'epoch': 1.0} {'loss': 0.7642, 'learning_rate': 1.0108678569201067e-05, 'epoch': 1.0} {'loss': 0.7504, 'learning_rate': 1.010835123694316e-05, 'epoch': 1.0} {'loss': 0.7384, 'learning_rate': 1.0108023904569146e-05, 'epoch': 1.0} {'loss': 0.8355, 'learning_rate': 1.0107696572079373e-05, 'epoch': 1.0} {'loss': 0.8865, 'learning_rate': 1.0107369239474196e-05, 'epoch': 1.0} {'loss': 0.7506, 'learning_rate': 1.0107041906753961e-05, 'epoch': 1.0} {'loss': 0.73, 'learning_rate': 1.0106714573919021e-05, 'epoch': 1.0} {'loss': 0.738, 'learning_rate': 1.0106387240969726e-05, 'epoch': 1.0} {'loss': 0.8389, 'learning_rate': 1.0106059907906428e-05, 'epoch': 1.0} {'loss': 0.8385, 'learning_rate': 1.010573257472948e-05, 'epoch': 1.0} {'loss': 0.8051, 'learning_rate': 1.0105405241439225e-05, 'epoch': 1.0} {'loss': 0.7592, 'learning_rate': 1.0105077908036024e-05, 'epoch': 1.0} {'loss': 0.7461, 'learning_rate': 1.0104750574520219e-05, 'epoch': 1.0} {'loss': 0.5929, 'learning_rate': 1.0104423240892164e-05, 'epoch': 1.0} {'loss': 0.7891, 'learning_rate': 1.0104095907152212e-05, 'epoch': 1.0} {'loss': 0.6904, 'learning_rate': 1.0103768573300712e-05, 'epoch': 1.0} {'loss': 0.718, 'learning_rate': 1.0103441239338015e-05, 'epoch': 1.0} {'loss': 0.7798, 'learning_rate': 1.010311390526447e-05, 'epoch': 1.0} {'loss': 0.7604, 'learning_rate': 1.0102786571080429e-05, 'epoch': 1.0} {'loss': 0.7401, 'learning_rate': 1.0102459236786242e-05, 'epoch': 1.0} {'loss': 0.7942, 'learning_rate': 1.0102131902382262e-05, 'epoch': 1.0} {'loss': 0.8, 'learning_rate': 1.010180456786884e-05, 'epoch': 1.0} {'loss': 0.7183, 'learning_rate': 1.0101477233246324e-05, 'epoch': 1.0} {'loss': 0.8096, 'learning_rate': 1.0101149898515064e-05, 'epoch': 1.0} {'loss': 0.857, 'learning_rate': 1.0100822563675417e-05, 'epoch': 1.0} {'loss': 0.7425, 'learning_rate': 1.0100495228727724e-05, 'epoch': 1.0} {'loss': 0.7825, 'learning_rate': 1.0100167893672343e-05, 'epoch': 1.0} {'loss': 0.8543, 'learning_rate': 1.0099840558509626e-05, 'epoch': 1.0} {'loss': 0.8972, 'learning_rate': 1.009951322323992e-05, 'epoch': 1.0} {'loss': 0.795, 'learning_rate': 1.0099185887863575e-05, 'epoch': 1.0} {'loss': 0.7189, 'learning_rate': 1.0098858552380943e-05, 'epoch': 1.0} {'loss': 0.8526, 'learning_rate': 1.0098531216792377e-05, 'epoch': 1.0} {'loss': 0.6788, 'learning_rate': 1.0098203881098225e-05, 'epoch': 1.0} {'loss': 0.8156, 'learning_rate': 1.0097876545298839e-05, 'epoch': 1.0} {'loss': 0.8471, 'learning_rate': 1.0097549209394571e-05, 'epoch': 1.0} {'loss': 0.7045, 'learning_rate': 1.0097221873385768e-05, 'epoch': 1.0} {'loss': 0.7173, 'learning_rate': 1.0096894537272782e-05, 'epoch': 1.0} {'loss': 0.8798, 'learning_rate': 1.0096567201055964e-05, 'epoch': 1.0} {'loss': 0.9148, 'learning_rate': 1.0096239864735672e-05, 'epoch': 1.0} {'loss': 0.6641, 'learning_rate': 1.0095912528312244e-05, 'epoch': 1.0} {'loss': 0.7687, 'learning_rate': 1.009558519178604e-05, 'epoch': 1.0} {'loss': 0.7766, 'learning_rate': 1.0095257855157405e-05, 'epoch': 1.0} {'loss': 0.6195, 'learning_rate': 1.0094930518426696e-05, 'epoch': 1.0} {'loss': 0.697, 'learning_rate': 1.0094603181594258e-05, 'epoch': 1.0} {'loss': 0.6872, 'learning_rate': 1.0094275844660444e-05, 'epoch': 1.0} {'loss': 0.5624, 'learning_rate': 1.0093948507625608e-05, 'epoch': 1.0} {'loss': 0.7489, 'learning_rate': 1.0093621170490096e-05, 'epoch': 1.0} {'loss': 0.5707, 'learning_rate': 1.009329383325426e-05, 'epoch': 1.0} {'loss': 0.6268, 'learning_rate': 1.009296649591845e-05, 'epoch': 1.0} {'loss': 0.8231, 'learning_rate': 1.009263915848302e-05, 'epoch': 1.0} {'loss': 0.7693, 'learning_rate': 1.0092311820948317e-05, 'epoch': 1.0} {'loss': 0.7691, 'learning_rate': 1.0091984483314696e-05, 'epoch': 1.0} {'loss': 0.7535, 'learning_rate': 1.0091657145582503e-05, 'epoch': 1.0} {'loss': 0.7561, 'learning_rate': 1.0091329807752095e-05, 'epoch': 1.0} {'loss': 0.7766, 'learning_rate': 1.0091002469823813e-05, 'epoch': 1.0} {'loss': 0.6633, 'learning_rate': 1.0090675131798018e-05, 'epoch': 1.0} {'loss': 0.8728, 'learning_rate': 1.0090347793675055e-05, 'epoch': 1.0} {'loss': 0.6976, 'learning_rate': 1.0090020455455274e-05, 'epoch': 1.0} {'loss': 0.6714, 'learning_rate': 1.0089693117139032e-05, 'epoch': 1.0} {'loss': 0.6273, 'learning_rate': 1.0089365778726673e-05, 'epoch': 1.0} {'loss': 0.8138, 'learning_rate': 1.0089038440218552e-05, 'epoch': 1.0} {'loss': 0.7368, 'learning_rate': 1.0088711101615018e-05, 'epoch': 1.0} {'loss': 0.7846, 'learning_rate': 1.0088383762916421e-05, 'epoch': 1.0} {'loss': 0.7358, 'learning_rate': 1.0088056424123114e-05, 'epoch': 1.0} {'loss': 0.5568, 'learning_rate': 1.0087729085235444e-05, 'epoch': 1.0} {'loss': 0.7153, 'learning_rate': 1.0087401746253769e-05, 'epoch': 1.0} {'loss': 0.7357, 'learning_rate': 1.0087074407178434e-05, 'epoch': 1.0} {'loss': 0.7209, 'learning_rate': 1.008674706800979e-05, 'epoch': 1.0} {'loss': 1.0124, 'learning_rate': 1.0086419728748187e-05, 'epoch': 1.0} {'loss': 0.6482, 'learning_rate': 1.0086092389393978e-05, 'epoch': 1.0} {'loss': 0.8009, 'learning_rate': 1.0085765049947514e-05, 'epoch': 1.0} {'loss': 0.645, 'learning_rate': 1.0085437710409143e-05, 'epoch': 1.0} {'loss': 0.8375, 'learning_rate': 1.0085110370779222e-05, 'epoch': 1.0} {'loss': 0.7734, 'learning_rate': 1.0084783031058097e-05, 'epoch': 1.0} {'loss': 0.6392, 'learning_rate': 1.0084455691246116e-05, 'epoch': 1.0} {'loss': 0.8125, 'learning_rate': 1.0084128351343634e-05, 'epoch': 1.0} {'loss': 0.7734, 'learning_rate': 1.0083801011351001e-05, 'epoch': 1.0} {'loss': 0.8457, 'learning_rate': 1.008347367126857e-05, 'epoch': 1.0} {'loss': 0.8224, 'learning_rate': 1.0083146331096688e-05, 'epoch': 1.0} {'loss': 0.7628, 'learning_rate': 1.0082818990835705e-05, 'epoch': 1.0} {'loss': 0.9582, 'learning_rate': 1.0082491650485976e-05, 'epoch': 1.0} {'loss': 0.788, 'learning_rate': 1.008216431004785e-05, 'epoch': 1.0} {'loss': 0.8474, 'learning_rate': 1.0081836969521676e-05, 'epoch': 1.0} {'loss': 0.8683, 'learning_rate': 1.0081509628907809e-05, 'epoch': 1.0} {'loss': 0.7385, 'learning_rate': 1.0081182288206598e-05, 'epoch': 1.0} {'loss': 0.8554, 'learning_rate': 1.0080854947418387e-05, 'epoch': 1.0} {'loss': 0.7444, 'learning_rate': 1.0080527606543536e-05, 'epoch': 1.0} {'loss': 0.6413, 'learning_rate': 1.0080200265582394e-05, 'epoch': 1.0} {'loss': 0.775, 'learning_rate': 1.0079872924535308e-05, 'epoch': 1.0} {'loss': 0.9197, 'learning_rate': 1.007954558340263e-05, 'epoch': 1.0} {'loss': 0.7156, 'learning_rate': 1.0079218242184717e-05, 'epoch': 1.0} {'loss': 0.8577, 'learning_rate': 1.0078890900881908e-05, 'epoch': 1.0} {'loss': 0.6966, 'learning_rate': 1.0078563559494563e-05, 'epoch': 1.0} {'loss': 0.7436, 'learning_rate': 1.007823621802303e-05, 'epoch': 1.0} {'loss': 0.9738, 'learning_rate': 1.0077908876467661e-05, 'epoch': 1.0} {'loss': 0.7413, 'learning_rate': 1.0077581534828805e-05, 'epoch': 1.0} {'loss': 0.8683, 'learning_rate': 1.0077254193106812e-05, 'epoch': 1.0} {'loss': 0.6028, 'learning_rate': 1.0076926851302035e-05, 'epoch': 1.0} {'loss': 0.8092, 'learning_rate': 1.0076599509414823e-05, 'epoch': 1.0} {'loss': 0.7703, 'learning_rate': 1.0076272167445529e-05, 'epoch': 1.0} {'loss': 0.7103, 'learning_rate': 1.0075944825394503e-05, 'epoch': 1.0} {'loss': 0.9895, 'learning_rate': 1.0075617483262094e-05, 'epoch': 1.0} {'loss': 0.7897, 'learning_rate': 1.0075290141048654e-05, 'epoch': 1.0} {'loss': 0.5408, 'learning_rate': 1.0074962798754538e-05, 'epoch': 1.0} {'loss': 0.8549, 'learning_rate': 1.0074635456380086e-05, 'epoch': 1.0} {'loss': 0.7368, 'learning_rate': 1.007430811392566e-05, 'epoch': 1.0} {'loss': 0.5934, 'learning_rate': 1.0073980771391603e-05, 'epoch': 1.0} {'loss': 0.7732, 'learning_rate': 1.0073653428778272e-05, 'epoch': 1.0} {'loss': 0.8119, 'learning_rate': 1.0073326086086013e-05, 'epoch': 1.0} {'loss': 0.7586, 'learning_rate': 1.0072998743315179e-05, 'epoch': 1.0} {'loss': 0.6598, 'learning_rate': 1.0072671400466119e-05, 'epoch': 1.0} {'loss': 0.7741, 'learning_rate': 1.0072344057539186e-05, 'epoch': 1.0} {'loss': 0.9217, 'learning_rate': 1.0072016714534729e-05, 'epoch': 1.0} {'loss': 0.9291, 'learning_rate': 1.00716893714531e-05, 'epoch': 1.0} {'loss': 0.8972, 'learning_rate': 1.007136202829465e-05, 'epoch': 1.0} {'loss': 0.7116, 'learning_rate': 1.0071034685059728e-05, 'epoch': 1.0} {'loss': 0.7541, 'learning_rate': 1.007070734174869e-05, 'epoch': 1.0} {'loss': 0.7345, 'learning_rate': 1.0070379998361877e-05, 'epoch': 1.0} {'loss': 0.7167, 'learning_rate': 1.0070052654899646e-05, 'epoch': 1.0} {'loss': 0.8011, 'learning_rate': 1.006972531136235e-05, 'epoch': 1.0} {'loss': 0.7422, 'learning_rate': 1.0069397967750337e-05, 'epoch': 1.0} {'loss': 0.8834, 'learning_rate': 1.0069070624063956e-05, 'epoch': 1.0} {'loss': 0.8248, 'learning_rate': 1.0068743280303563e-05, 'epoch': 1.0} {'loss': 0.7643, 'learning_rate': 1.0068415936469502e-05, 'epoch': 1.0} {'loss': 0.8128, 'learning_rate': 1.0068088592562129e-05, 'epoch': 1.0} {'loss': 0.7392, 'learning_rate': 1.0067761248581792e-05, 'epoch': 1.0} {'loss': 0.9089, 'learning_rate': 1.006743390452884e-05, 'epoch': 1.0} {'loss': 0.8699, 'learning_rate': 1.006710656040363e-05, 'epoch': 1.0} {'loss': 0.86, 'learning_rate': 1.0066779216206507e-05, 'epoch': 1.0} {'loss': 0.8545, 'learning_rate': 1.006645187193783e-05, 'epoch': 1.0} {'loss': 0.7376, 'learning_rate': 1.0066124527597938e-05, 'epoch': 1.0} {'loss': 0.7371, 'learning_rate': 1.006579718318719e-05, 'epoch': 1.0} {'loss': 0.825, 'learning_rate': 1.006546983870593e-05, 'epoch': 1.0} {'loss': 0.97, 'learning_rate': 1.0065142494154516e-05, 'epoch': 1.0} {'loss': 0.8255, 'learning_rate': 1.0064815149533297e-05, 'epoch': 1.0} {'loss': 0.8764, 'learning_rate': 1.0064487804842623e-05, 'epoch': 1.0} {'loss': 0.7578, 'learning_rate': 1.0064160460082845e-05, 'epoch': 1.0} {'loss': 0.7221, 'learning_rate': 1.0063833115254312e-05, 'epoch': 1.0} {'loss': 0.8467, 'learning_rate': 1.0063505770357377e-05, 'epoch': 1.0} {'loss': 0.7637, 'learning_rate': 1.0063178425392386e-05, 'epoch': 1.0} {'loss': 0.7479, 'learning_rate': 1.0062851080359697e-05, 'epoch': 1.0} {'loss': 0.6734, 'learning_rate': 1.0062523735259657e-05, 'epoch': 1.0} {'loss': 0.8297, 'learning_rate': 1.0062196390092619e-05, 'epoch': 1.0} {'loss': 0.8619, 'learning_rate': 1.0061869044858929e-05, 'epoch': 1.0} {'loss': 0.8855, 'learning_rate': 1.0061541699558942e-05, 'epoch': 1.0} {'loss': 0.7968, 'learning_rate': 1.0061214354193005e-05, 'epoch': 1.0} {'loss': 0.8032, 'learning_rate': 1.0060887008761473e-05, 'epoch': 1.0} {'loss': 0.6229, 'learning_rate': 1.0060559663264697e-05, 'epoch': 1.0} {'loss': 0.8689, 'learning_rate': 1.0060232317703026e-05, 'epoch': 1.0} {'loss': 0.7399, 'learning_rate': 1.0059904972076809e-05, 'epoch': 1.0} {'loss': 0.83, 'learning_rate': 1.0059577626386399e-05, 'epoch': 1.0} {'loss': 0.7117, 'learning_rate': 1.0059250280632145e-05, 'epoch': 1.0} {'loss': 0.6339, 'learning_rate': 1.0058922934814397e-05, 'epoch': 1.0} {'loss': 0.8315, 'learning_rate': 1.0058595588933513e-05, 'epoch': 1.0} {'loss': 0.8591, 'learning_rate': 1.0058268242989835e-05, 'epoch': 1.0} {'loss': 0.808, 'learning_rate': 1.0057940896983717e-05, 'epoch': 1.0} {'loss': 0.9488, 'learning_rate': 1.0057613550915513e-05, 'epoch': 1.0} {'loss': 0.7557, 'learning_rate': 1.005728620478557e-05, 'epoch': 1.0} {'loss': 0.7561, 'learning_rate': 1.0056958858594236e-05, 'epoch': 1.0} {'loss': 0.6404, 'learning_rate': 1.005663151234187e-05, 'epoch': 1.0} {'loss': 0.7368, 'learning_rate': 1.0056304166028817e-05, 'epoch': 1.0} {'loss': 0.7923, 'learning_rate': 1.0055976819655429e-05, 'epoch': 1.0} {'loss': 0.6119, 'learning_rate': 1.0055649473222056e-05, 'epoch': 1.0} {'loss': 0.7333, 'learning_rate': 1.005532212672905e-05, 'epoch': 1.0} {'loss': 0.7397, 'learning_rate': 1.0054994780176762e-05, 'epoch': 1.0} {'loss': 0.8178, 'learning_rate': 1.0054667433565539e-05, 'epoch': 1.0} {'loss': 0.7674, 'learning_rate': 1.005434008689574e-05, 'epoch': 1.0} {'loss': 0.5579, 'learning_rate': 1.0054012740167706e-05, 'epoch': 1.0} {'loss': 0.6901, 'learning_rate': 1.0053685393381797e-05, 'epoch': 1.0} {'loss': 0.7451, 'learning_rate': 1.0053358046538353e-05, 'epoch': 1.0} {'loss': 0.6894, 'learning_rate': 1.0053030699637738e-05, 'epoch': 1.0} {'loss': 0.8206, 'learning_rate': 1.005270335268029e-05, 'epoch': 1.0} {'loss': 0.8465, 'learning_rate': 1.005237600566637e-05, 'epoch': 1.0} {'loss': 0.6393, 'learning_rate': 1.0052048658596324e-05, 'epoch': 1.0} {'loss': 0.7688, 'learning_rate': 1.00517213114705e-05, 'epoch': 1.0} {'loss': 0.7292, 'learning_rate': 1.0051393964289254e-05, 'epoch': 1.0} {'loss': 0.853, 'learning_rate': 1.0051066617052934e-05, 'epoch': 1.0} {'loss': 0.8383, 'learning_rate': 1.0050739269761891e-05, 'epoch': 1.0} {'loss': 0.7649, 'learning_rate': 1.0050411922416479e-05, 'epoch': 1.0} {'loss': 0.5805, 'learning_rate': 1.0050084575017046e-05, 'epoch': 1.0} {'loss': 0.6899, 'learning_rate': 1.0049757227563938e-05, 'epoch': 1.0} {'loss': 0.7619, 'learning_rate': 1.0049429880057513e-05, 'epoch': 1.0} {'loss': 0.8498, 'learning_rate': 1.004910253249812e-05, 'epoch': 1.0} {'loss': 0.4801, 'learning_rate': 1.0048775184886113e-05, 'epoch': 1.0} {'loss': 0.6154, 'learning_rate': 1.0048447837221833e-05, 'epoch': 1.0} {'loss': 0.6349, 'learning_rate': 1.0048120489505642e-05, 'epoch': 1.0} {'loss': 0.6461, 'learning_rate': 1.004779314173788e-05, 'epoch': 1.0} {'loss': 0.7349, 'learning_rate': 1.0047465793918907e-05, 'epoch': 1.0} {'loss': 0.4841, 'learning_rate': 1.0047138446049068e-05, 'epoch': 1.0} {'loss': 0.6918, 'learning_rate': 1.0046811098128716e-05, 'epoch': 1.0} {'loss': 0.5353, 'learning_rate': 1.0046483750158205e-05, 'epoch': 1.0} {'loss': 0.4517, 'learning_rate': 1.004615640213788e-05, 'epoch': 1.0} {'loss': 0.6323, 'learning_rate': 1.0045829054068094e-05, 'epoch': 1.0} {'loss': 0.4741, 'learning_rate': 1.0045501705949198e-05, 'epoch': 1.0} {'loss': 0.6077, 'learning_rate': 1.0045174357781544e-05, 'epoch': 1.0} {'loss': 0.582, 'learning_rate': 1.004484700956548e-05, 'epoch': 1.0} {'loss': 0.5233, 'learning_rate': 1.004451966130136e-05, 'epoch': 1.0} {'loss': 0.5889, 'learning_rate': 1.0044192312989534e-05, 'epoch': 1.0} {'loss': 0.4188, 'learning_rate': 1.004386496463035e-05, 'epoch': 1.0} {'loss': 0.7562, 'learning_rate': 1.0043537616224161e-05, 'epoch': 1.0} {'loss': 0.5773, 'learning_rate': 1.0043210267771317e-05, 'epoch': 1.0} {'loss': 0.5748, 'learning_rate': 1.004288291927217e-05, 'epoch': 1.0} {'loss': 0.5791, 'learning_rate': 1.0042555570727069e-05, 'epoch': 1.0} {'loss': 0.605, 'learning_rate': 1.0042228222136366e-05, 'epoch': 1.0} {'loss': 0.54, 'learning_rate': 1.0041900873500414e-05, 'epoch': 1.0} {'loss': 0.4883, 'learning_rate': 1.0041573524819561e-05, 'epoch': 1.0} {'loss': 0.6289, 'learning_rate': 1.0041246176094157e-05, 'epoch': 1.0} {'loss': 0.6289, 'learning_rate': 1.0040918827324556e-05, 'epoch': 1.0} {'loss': 0.6315, 'learning_rate': 1.0040591478511101e-05, 'epoch': 1.0} {'loss': 0.6078, 'learning_rate': 1.0040264129654153e-05, 'epoch': 1.0} {'loss': 0.466, 'learning_rate': 1.0039936780754061e-05, 'epoch': 1.0} {'loss': 0.6246, 'learning_rate': 1.0039609431811168e-05, 'epoch': 1.0} {'loss': 0.57, 'learning_rate': 1.0039282082825834e-05, 'epoch': 1.0} {'loss': 0.5859, 'learning_rate': 1.0038954733798402e-05, 'epoch': 1.0} {'loss': 0.6402, 'learning_rate': 1.0038627384729227e-05, 'epoch': 1.0} {'loss': 0.582, 'learning_rate': 1.003830003561866e-05, 'epoch': 1.0} {'loss': 0.6563, 'learning_rate': 1.0037972686467055e-05, 'epoch': 1.0} {'loss': 0.6858, 'learning_rate': 1.0037645337274754e-05, 'epoch': 1.0} {'loss': 0.5537, 'learning_rate': 1.0037317988042115e-05, 'epoch': 1.0} {'loss': 0.6407, 'learning_rate': 1.0036990638769484e-05, 'epoch': 1.0} {'loss': 0.5448, 'learning_rate': 1.0036663289457217e-05, 'epoch': 1.0} {'loss': 0.6686, 'learning_rate': 1.003633594010566e-05, 'epoch': 1.0} {'loss': 0.5979, 'learning_rate': 1.0036008590715167e-05, 'epoch': 1.0} {'loss': 0.4511, 'learning_rate': 1.0035681241286086e-05, 'epoch': 1.0} {'loss': 0.4595, 'learning_rate': 1.003535389181877e-05, 'epoch': 1.0} {'loss': 0.6819, 'learning_rate': 1.003502654231357e-05, 'epoch': 1.0} {'loss': 0.5555, 'learning_rate': 1.0034699192770834e-05, 'epoch': 1.0} {'loss': 0.4931, 'learning_rate': 1.0034371843190915e-05, 'epoch': 1.0} {'loss': 0.5703, 'learning_rate': 1.0034044493574165e-05, 'epoch': 1.0} {'loss': 0.6575, 'learning_rate': 1.0033717143920933e-05, 'epoch': 1.0} {'loss': 0.3859, 'learning_rate': 1.0033389794231569e-05, 'epoch': 1.0} {'loss': 0.3989, 'learning_rate': 1.0033062444506424e-05, 'epoch': 1.0} {'loss': 0.5484, 'learning_rate': 1.0032735094745853e-05, 'epoch': 1.0} {'loss': 0.4939, 'learning_rate': 1.0032407744950202e-05, 'epoch': 1.0} {'loss': 0.6257, 'learning_rate': 1.0032080395119821e-05, 'epoch': 1.0} {'loss': 0.6864, 'learning_rate': 1.0031753045255065e-05, 'epoch': 1.0} {'loss': 0.6752, 'learning_rate': 1.0031425695356282e-05, 'epoch': 1.0} {'loss': 0.6935, 'learning_rate': 1.0031098345423825e-05, 'epoch': 1.0} {'loss': 0.5182, 'learning_rate': 1.0030770995458041e-05, 'epoch': 1.0} {'loss': 0.6155, 'learning_rate': 1.0030443645459285e-05, 'epoch': 1.0} {'loss': 0.4886, 'learning_rate': 1.0030116295427905e-05, 'epoch': 1.0} {'loss': 0.5755, 'learning_rate': 1.0029788945364254e-05, 'epoch': 1.0} {'loss': 0.6326, 'learning_rate': 1.002946159526868e-05, 'epoch': 1.0} {'loss': 0.5784, 'learning_rate': 1.0029134245141535e-05, 'epoch': 1.0} {'loss': 0.5392, 'learning_rate': 1.002880689498317e-05, 'epoch': 1.0} {'loss': 0.6346, 'learning_rate': 1.0028479544793934e-05, 'epoch': 1.0} {'loss': 0.6606, 'learning_rate': 1.0028152194574185e-05, 'epoch': 1.0} {'loss': 0.5729, 'learning_rate': 1.0027824844324266e-05, 'epoch': 1.0} {'loss': 0.553, 'learning_rate': 1.002749749404453e-05, 'epoch': 1.0} {'loss': 0.5812, 'learning_rate': 1.0027170143735326e-05, 'epoch': 1.0} {'loss': 0.6438, 'learning_rate': 1.0026842793397007e-05, 'epoch': 1.0} {'loss': 0.5576, 'learning_rate': 1.0026515443029925e-05, 'epoch': 1.0} {'loss': 0.5675, 'learning_rate': 1.002618809263443e-05, 'epoch': 1.0} {'loss': 0.4254, 'learning_rate': 1.002586074221087e-05, 'epoch': 1.0} {'loss': 0.668, 'learning_rate': 1.00255333917596e-05, 'epoch': 1.0} {'loss': 0.5071, 'learning_rate': 1.0025206041280969e-05, 'epoch': 1.0} {'loss': 0.5745, 'learning_rate': 1.0024878690775326e-05, 'epoch': 1.0} {'loss': 0.5244, 'learning_rate': 1.0024551340243021e-05, 'epoch': 1.0} {'loss': 0.6722, 'learning_rate': 1.002422398968441e-05, 'epoch': 1.0} {'loss': 0.5305, 'learning_rate': 1.0023896639099842e-05, 'epoch': 1.0} {'loss': 0.562, 'learning_rate': 1.0023569288489666e-05, 'epoch': 1.0} {'loss': 0.7076, 'learning_rate': 1.0023241937854232e-05, 'epoch': 1.0} {'loss': 0.5824, 'learning_rate': 1.002291458719389e-05, 'epoch': 1.0} {'loss': 0.645, 'learning_rate': 1.0022587236508996e-05, 'epoch': 1.0} {'loss': 0.4901, 'learning_rate': 1.0022259885799897e-05, 'epoch': 1.0} {'loss': 0.5879, 'learning_rate': 1.0021932535066942e-05, 'epoch': 1.0} {'loss': 0.6844, 'learning_rate': 1.0021605184310488e-05, 'epoch': 1.0} {'loss': 0.5913, 'learning_rate': 1.0021277833530882e-05, 'epoch': 1.0} {'loss': 0.5378, 'learning_rate': 1.0020950482728475e-05, 'epoch': 1.0} {'loss': 0.6683, 'learning_rate': 1.0020623131903614e-05, 'epoch': 1.0} {'loss': 0.5082, 'learning_rate': 1.0020295781056657e-05, 'epoch': 1.0} {'loss': 0.5636, 'learning_rate': 1.0019968430187949e-05, 'epoch': 1.0} {'loss': 0.5927, 'learning_rate': 1.0019641079297844e-05, 'epoch': 1.0} {'loss': 0.6906, 'learning_rate': 1.0019313728386692e-05, 'epoch': 1.0} {'loss': 0.6365, 'learning_rate': 1.0018986377454848e-05, 'epoch': 1.0} {'loss': 0.5635, 'learning_rate': 1.001865902650265e-05, 'epoch': 1.0} {'loss': 0.5256, 'learning_rate': 1.0018331675530461e-05, 'epoch': 1.0} {'loss': 0.6479, 'learning_rate': 1.0018004324538628e-05, 'epoch': 1.0} {'loss': 0.5626, 'learning_rate': 1.00176769735275e-05, 'epoch': 1.0} {'loss': 0.6926, 'learning_rate': 1.0017349622497434e-05, 'epoch': 1.0} {'loss': 0.7128, 'learning_rate': 1.0017022271448773e-05, 'epoch': 1.0} {'loss': 0.5074, 'learning_rate': 1.0016694920381876e-05, 'epoch': 1.0} {'loss': 0.571, 'learning_rate': 1.0016367569297082e-05, 'epoch': 1.0} {'loss': 0.5775, 'learning_rate': 1.0016040218194752e-05, 'epoch': 1.0} {'loss': 0.4507, 'learning_rate': 1.0015712867075232e-05, 'epoch': 1.0} {'loss': 0.4659, 'learning_rate': 1.0015385515938876e-05, 'epoch': 1.0} {'loss': 0.4709, 'learning_rate': 1.0015058164786032e-05, 'epoch': 1.0} {'loss': 0.5057, 'learning_rate': 1.0014730813617052e-05, 'epoch': 1.0} {'loss': 0.5828, 'learning_rate': 1.0014403462432288e-05, 'epoch': 1.0} {'loss': 0.4521, 'learning_rate': 1.0014076111232084e-05, 'epoch': 1.0} {'loss': 0.6077, 'learning_rate': 1.0013748760016802e-05, 'epoch': 1.0} {'loss': 0.5439, 'learning_rate': 1.0013421408786783e-05, 'epoch': 1.0} {'loss': 0.5528, 'learning_rate': 1.0013094057542385e-05, 'epoch': 1.0} {'loss': 0.6958, 'learning_rate': 1.0012766706283954e-05, 'epoch': 1.0} {'loss': 0.5016, 'learning_rate': 1.0012439355011845e-05, 'epoch': 1.0} {'loss': 0.6575, 'learning_rate': 1.0012112003726403e-05, 'epoch': 1.0} {'loss': 0.7063, 'learning_rate': 1.0011784652427982e-05, 'epoch': 1.0} {'loss': 0.643, 'learning_rate': 1.0011457301116934e-05, 'epoch': 1.0} {'loss': 0.6702, 'learning_rate': 1.0011129949793608e-05, 'epoch': 1.0} {'loss': 0.5679, 'learning_rate': 1.0010802598458353e-05, 'epoch': 1.0} {'loss': 0.842, 'learning_rate': 1.0010475247111524e-05, 'epoch': 1.0} {'loss': 0.664, 'learning_rate': 1.0010147895753472e-05, 'epoch': 1.0} {'loss': 0.5481, 'learning_rate': 1.0009820544384543e-05, 'epoch': 1.0} {'loss': 0.603, 'learning_rate': 1.000949319300509e-05, 'epoch': 1.0} {'loss': 0.6053, 'learning_rate': 1.0009165841615467e-05, 'epoch': 1.0} {'loss': 0.5849, 'learning_rate': 1.0008838490216019e-05, 'epoch': 1.0} {'loss': 0.5804, 'learning_rate': 1.00085111388071e-05, 'epoch': 1.0} {'loss': 0.6205, 'learning_rate': 1.0008183787389062e-05, 'epoch': 1.0} {'loss': 0.5142, 'learning_rate': 1.0007856435962255e-05, 'epoch': 1.0} {'loss': 0.5052, 'learning_rate': 1.0007529084527029e-05, 'epoch': 1.0} {'loss': 0.6277, 'learning_rate': 1.0007201733083733e-05, 'epoch': 1.0} {'loss': 0.4452, 'learning_rate': 1.000687438163272e-05, 'epoch': 1.0} {'loss': 0.5821, 'learning_rate': 1.0006547030174341e-05, 'epoch': 1.0} {'loss': 0.6981, 'learning_rate': 1.0006219678708943e-05, 'epoch': 1.0} {'loss': 0.6519, 'learning_rate': 1.0005892327236883e-05, 'epoch': 1.0} {'loss': 0.6554, 'learning_rate': 1.0005564975758512e-05, 'epoch': 1.0} {'loss': 0.5868, 'learning_rate': 1.0005237624274173e-05, 'epoch': 1.0} {'loss': 0.5282, 'learning_rate': 1.0004910272784225e-05, 'epoch': 1.0} {'loss': 0.5628, 'learning_rate': 1.0004582921289014e-05, 'epoch': 1.0} {'loss': 0.3937, 'learning_rate': 1.000425556978889e-05, 'epoch': 1.0} {'loss': 0.5734, 'learning_rate': 1.0003928218284206e-05, 'epoch': 1.0} {'loss': 0.541, 'learning_rate': 1.0003600866775314e-05, 'epoch': 1.0} {'loss': 0.5457, 'learning_rate': 1.0003273515262563e-05, 'epoch': 1.0} {'loss': 0.6342, 'learning_rate': 1.0002946163746308e-05, 'epoch': 1.0} {'loss': 0.6941, 'learning_rate': 1.000261881222689e-05, 'epoch': 1.0} {'loss': 0.5728, 'learning_rate': 1.0002291460704667e-05, 'epoch': 1.0} {'loss': 0.5729, 'learning_rate': 1.0001964109179989e-05, 'epoch': 1.0} {'loss': 0.5836, 'learning_rate': 1.0001636757653205e-05, 'epoch': 1.0} {'loss': 0.5205, 'learning_rate': 1.0001309406124671e-05, 'epoch': 1.0} {'loss': 0.5583, 'learning_rate': 1.000098205459473e-05, 'epoch': 1.0} {'loss': 0.6264, 'learning_rate': 1.0000654703063741e-05, 'epoch': 1.0} {'loss': 0.6926, 'learning_rate': 1.0000327351532046e-05, 'epoch': 1.0} {'loss': 0.5456, 'learning_rate': 1e-05, 'epoch': 1.0} {'loss': 0.5022, 'learning_rate': 9.999672648467959e-06, 'epoch': 1.0} {'loss': 0.4797, 'learning_rate': 9.999345296936262e-06, 'epoch': 1.0} {'loss': 0.573, 'learning_rate': 9.999017945405272e-06, 'epoch': 1.0} {'loss': 0.541, 'learning_rate': 9.998690593875332e-06, 'epoch': 1.0} {'loss': 0.5327, 'learning_rate': 9.998363242346797e-06, 'epoch': 1.0} {'loss': 0.5937, 'learning_rate': 9.998035890820011e-06, 'epoch': 1.0} {'loss': 0.5139, 'learning_rate': 9.997708539295335e-06, 'epoch': 1.0} {'loss': 0.5685, 'learning_rate': 9.997381187773115e-06, 'epoch': 1.0} {'loss': 0.6628, 'learning_rate': 9.997053836253697e-06, 'epoch': 1.0} {'loss': 0.6707, 'learning_rate': 9.996726484737438e-06, 'epoch': 1.0} {'loss': 0.668, 'learning_rate': 9.996399133224686e-06, 'epoch': 1.0} {'loss': 0.5011, 'learning_rate': 9.996071781715795e-06, 'epoch': 1.0} {'loss': 0.4524, 'learning_rate': 9.995744430211116e-06, 'epoch': 1.0} {'loss': 0.5028, 'learning_rate': 9.99541707871099e-06, 'epoch': 1.0} {'loss': 0.5584, 'learning_rate': 9.995089727215778e-06, 'epoch': 1.0} {'loss': 0.5801, 'learning_rate': 9.994762375725827e-06, 'epoch': 1.0} {'loss': 0.6197, 'learning_rate': 9.994435024241491e-06, 'epoch': 1.0} {'loss': 0.6202, 'learning_rate': 9.994107672763115e-06, 'epoch': 1.0} {'loss': 0.576, 'learning_rate': 9.993780321291058e-06, 'epoch': 1.0} {'loss': 0.6982, 'learning_rate': 9.993452969825664e-06, 'epoch': 1.0} {'loss': 0.6165, 'learning_rate': 9.993125618367283e-06, 'epoch': 1.0} {'loss': 0.65, 'learning_rate': 9.992798266916272e-06, 'epoch': 1.0} {'loss': 0.7329, 'learning_rate': 9.992470915472973e-06, 'epoch': 1.0} {'loss': 0.5856, 'learning_rate': 9.992143564037749e-06, 'epoch': 1.0} {'loss': 0.5256, 'learning_rate': 9.99181621261094e-06, 'epoch': 1.0} {'loss': 0.6055, 'learning_rate': 9.991488861192902e-06, 'epoch': 1.0} {'loss': 0.6586, 'learning_rate': 9.991161509783986e-06, 'epoch': 1.0} {'loss': 0.6772, 'learning_rate': 9.990834158384537e-06, 'epoch': 1.0} {'loss': 0.5672, 'learning_rate': 9.990506806994913e-06, 'epoch': 1.0} {'loss': 0.3871, 'learning_rate': 9.990179455615457e-06, 'epoch': 1.0} {'loss': 0.5226, 'learning_rate': 9.98985210424653e-06, 'epoch': 1.0} {'loss': 0.418, 'learning_rate': 9.989524752888478e-06, 'epoch': 1.0} {'loss': 0.5488, 'learning_rate': 9.989197401541648e-06, 'epoch': 1.0} {'loss': 0.5343, 'learning_rate': 9.988870050206397e-06, 'epoch': 1.0} {'loss': 0.5605, 'learning_rate': 9.988542698883067e-06, 'epoch': 1.0} {'loss': 0.5032, 'learning_rate': 9.988215347572021e-06, 'epoch': 1.0} {'loss': 0.5948, 'learning_rate': 9.987887996273599e-06, 'epoch': 1.0} {'loss': 0.5385, 'learning_rate': 9.987560644988159e-06, 'epoch': 1.0} {'loss': 0.4593, 'learning_rate': 9.987233293716049e-06, 'epoch': 1.0} {'loss': 0.6562, 'learning_rate': 9.986905942457617e-06, 'epoch': 1.0} {'loss': 0.6665, 'learning_rate': 9.98657859121322e-06, 'epoch': 1.0} {'loss': 0.5795, 'learning_rate': 9.9862512399832e-06, 'epoch': 1.0} {'loss': 0.5472, 'learning_rate': 9.985923888767917e-06, 'epoch': 1.0} {'loss': 0.573, 'learning_rate': 9.985596537567717e-06, 'epoch': 1.0} {'loss': 0.5132, 'learning_rate': 9.985269186382952e-06, 'epoch': 1.0} {'loss': 0.5553, 'learning_rate': 9.984941835213972e-06, 'epoch': 1.0} {'loss': 0.556, 'learning_rate': 9.984614484061128e-06, 'epoch': 1.0} {'loss': 0.6692, 'learning_rate': 9.984287132924772e-06, 'epoch': 1.0} {'loss': 0.5047, 'learning_rate': 9.98395978180525e-06, 'epoch': 1.0} {'loss': 0.6262, 'learning_rate': 9.983632430702921e-06, 'epoch': 1.0} {'loss': 0.4818, 'learning_rate': 9.983305079618131e-06, 'epoch': 1.0} {'loss': 0.503, 'learning_rate': 9.982977728551228e-06, 'epoch': 1.0} {'loss': 0.39, 'learning_rate': 9.982650377502571e-06, 'epoch': 1.0} {'loss': 0.5654, 'learning_rate': 9.982323026472499e-06, 'epoch': 1.0} {'loss': 0.6036, 'learning_rate': 9.981995675461374e-06, 'epoch': 1.0} {'loss': 0.5367, 'learning_rate': 9.981668324469539e-06, 'epoch': 1.0} {'loss': 0.6564, 'learning_rate': 9.981340973497351e-06, 'epoch': 1.0} {'loss': 0.438, 'learning_rate': 9.98101362254516e-06, 'epoch': 1.0} {'loss': 0.5218, 'learning_rate': 9.980686271613311e-06, 'epoch': 1.0} {'loss': 0.5286, 'learning_rate': 9.98035892070216e-06, 'epoch': 1.0} {'loss': 0.4863, 'learning_rate': 9.980031569812053e-06, 'epoch': 1.0} {'loss': 0.5585, 'learning_rate': 9.979704218943348e-06, 'epoch': 1.0} {'loss': 0.6995, 'learning_rate': 9.979376868096389e-06, 'epoch': 1.0} {'loss': 0.4122, 'learning_rate': 9.979049517271528e-06, 'epoch': 1.0} {'loss': 0.4939, 'learning_rate': 9.978722166469122e-06, 'epoch': 1.0} {'loss': 0.701, 'learning_rate': 9.978394815689514e-06, 'epoch': 1.0} {'loss': 0.6122, 'learning_rate': 9.97806746493306e-06, 'epoch': 1.0} {'loss': 0.6023, 'learning_rate': 9.977740114200105e-06, 'epoch': 1.0} {'loss': 0.6474, 'learning_rate': 9.977412763491007e-06, 'epoch': 1.0} {'loss': 0.5283, 'learning_rate': 9.977085412806115e-06, 'epoch': 1.0} {'loss': 0.5611, 'learning_rate': 9.976758062145771e-06, 'epoch': 1.0} {'loss': 0.4892, 'learning_rate': 9.976430711510339e-06, 'epoch': 1.0} {'loss': 0.5798, 'learning_rate': 9.976103360900162e-06, 'epoch': 1.0} {'loss': 0.5538, 'learning_rate': 9.975776010315594e-06, 'epoch': 1.0} {'loss': 0.4666, 'learning_rate': 9.975448659756979e-06, 'epoch': 1.0} {'loss': 0.5275, 'learning_rate': 9.975121309224678e-06, 'epoch': 1.0} {'loss': 0.5837, 'learning_rate': 9.974793958719036e-06, 'epoch': 1.0} {'loss': 0.5446, 'learning_rate': 9.974466608240401e-06, 'epoch': 1.0} {'loss': 0.5552, 'learning_rate': 9.974139257789131e-06, 'epoch': 1.0} {'loss': 0.5462, 'learning_rate': 9.973811907365572e-06, 'epoch': 1.0} {'loss': 0.5698, 'learning_rate': 9.973484556970077e-06, 'epoch': 1.0} {'loss': 0.4749, 'learning_rate': 9.973157206602996e-06, 'epoch': 1.0} {'loss': 0.3972, 'learning_rate': 9.972829856264676e-06, 'epoch': 1.0} {'loss': 0.7414, 'learning_rate': 9.972502505955475e-06, 'epoch': 1.0} {'loss': 0.5369, 'learning_rate': 9.972175155675736e-06, 'epoch': 1.0} {'loss': 0.6731, 'learning_rate': 9.971847805425818e-06, 'epoch': 1.0} {'loss': 0.5201, 'learning_rate': 9.971520455206066e-06, 'epoch': 1.0} {'loss': 0.5519, 'learning_rate': 9.971193105016833e-06, 'epoch': 1.0} {'loss': 0.6349, 'learning_rate': 9.97086575485847e-06, 'epoch': 1.0} {'loss': 0.4874, 'learning_rate': 9.970538404731322e-06, 'epoch': 1.0} {'loss': 0.59, 'learning_rate': 9.970211054635751e-06, 'epoch': 1.01} {'loss': 0.6441, 'learning_rate': 9.969883704572095e-06, 'epoch': 1.01} {'loss': 0.5821, 'learning_rate': 9.969556354540717e-06, 'epoch': 1.01} {'loss': 0.5912, 'learning_rate': 9.96922900454196e-06, 'epoch': 1.01} {'loss': 0.5431, 'learning_rate': 9.968901654576179e-06, 'epoch': 1.01} {'loss': 0.5617, 'learning_rate': 9.968574304643723e-06, 'epoch': 1.01} {'loss': 0.5049, 'learning_rate': 9.968246954744936e-06, 'epoch': 1.01} {'loss': 0.5514, 'learning_rate': 9.967919604880182e-06, 'epoch': 1.01} {'loss': 0.5145, 'learning_rate': 9.9675922550498e-06, 'epoch': 1.01} {'loss': 0.5241, 'learning_rate': 9.96726490525415e-06, 'epoch': 1.01} {'loss': 0.6028, 'learning_rate': 9.966937555493577e-06, 'epoch': 1.01} {'loss': 0.7185, 'learning_rate': 9.966610205768433e-06, 'epoch': 1.01} {'loss': 0.4972, 'learning_rate': 9.966282856079072e-06, 'epoch': 1.01} {'loss': 0.6482, 'learning_rate': 9.965955506425837e-06, 'epoch': 1.01} {'loss': 0.6107, 'learning_rate': 9.965628156809087e-06, 'epoch': 1.01} {'loss': 0.5409, 'learning_rate': 9.965300807229167e-06, 'epoch': 1.01} {'loss': 0.5825, 'learning_rate': 9.964973457686433e-06, 'epoch': 1.01} {'loss': 0.7677, 'learning_rate': 9.964646108181234e-06, 'epoch': 1.01} {'loss': 0.5251, 'learning_rate': 9.964318758713918e-06, 'epoch': 1.01} {'loss': 0.499, 'learning_rate': 9.96399140928484e-06, 'epoch': 1.01} {'loss': 0.5126, 'learning_rate': 9.963664059894342e-06, 'epoch': 1.01} {'loss': 0.4953, 'learning_rate': 9.963336710542787e-06, 'epoch': 1.01} {'loss': 0.7171, 'learning_rate': 9.963009361230518e-06, 'epoch': 1.01} {'loss': 0.5763, 'learning_rate': 9.962682011957889e-06, 'epoch': 1.01} {'loss': 0.595, 'learning_rate': 9.96235466272525e-06, 'epoch': 1.01} {'loss': 0.5034, 'learning_rate': 9.96202731353295e-06, 'epoch': 1.01} {'loss': 0.5573, 'learning_rate': 9.961699964381341e-06, 'epoch': 1.01} {'loss': 0.6373, 'learning_rate': 9.961372615270773e-06, 'epoch': 1.01} {'loss': 0.552, 'learning_rate': 9.9610452662016e-06, 'epoch': 1.01} {'loss': 0.5713, 'learning_rate': 9.960717917174173e-06, 'epoch': 1.01} {'loss': 0.7628, 'learning_rate': 9.960390568188835e-06, 'epoch': 1.01} {'loss': 0.5391, 'learning_rate': 9.960063219245944e-06, 'epoch': 1.01} {'loss': 0.5566, 'learning_rate': 9.959735870345848e-06, 'epoch': 1.01} {'loss': 0.5355, 'learning_rate': 9.9594085214889e-06, 'epoch': 1.01} {'loss': 0.6214, 'learning_rate': 9.959081172675446e-06, 'epoch': 1.01} {'loss': 0.5544, 'learning_rate': 9.958753823905846e-06, 'epoch': 1.01} {'loss': 0.6041, 'learning_rate': 9.958426475180442e-06, 'epoch': 1.01} {'loss': 0.532, 'learning_rate': 9.95809912649959e-06, 'epoch': 1.01} {'loss': 0.6458, 'learning_rate': 9.957771777863636e-06, 'epoch': 1.01} {'loss': 0.512, 'learning_rate': 9.957444429272933e-06, 'epoch': 1.01} {'loss': 0.591, 'learning_rate': 9.957117080727833e-06, 'epoch': 1.01} {'loss': 0.6211, 'learning_rate': 9.956789732228683e-06, 'epoch': 1.01} {'loss': 0.4827, 'learning_rate': 9.95646238377584e-06, 'epoch': 1.01} {'loss': 0.618, 'learning_rate': 9.956135035369653e-06, 'epoch': 1.01} {'loss': 0.5238, 'learning_rate': 9.955807687010471e-06, 'epoch': 1.01} {'loss': 0.4744, 'learning_rate': 9.955480338698645e-06, 'epoch': 1.01} {'loss': 0.5598, 'learning_rate': 9.95515299043452e-06, 'epoch': 1.01} {'loss': 0.657, 'learning_rate': 9.954825642218458e-06, 'epoch': 1.01} {'loss': 0.4878, 'learning_rate': 9.954498294050807e-06, 'epoch': 1.01} {'loss': 0.7625, 'learning_rate': 9.954170945931908e-06, 'epoch': 1.01} {'loss': 0.5346, 'learning_rate': 9.953843597862124e-06, 'epoch': 1.01} {'loss': 0.494, 'learning_rate': 9.953516249841798e-06, 'epoch': 1.01} {'loss': 0.486, 'learning_rate': 9.953188901871287e-06, 'epoch': 1.01} {'loss': 0.5556, 'learning_rate': 9.952861553950932e-06, 'epoch': 1.01} {'loss': 0.6109, 'learning_rate': 9.952534206081096e-06, 'epoch': 1.01} {'loss': 0.456, 'learning_rate': 9.952206858262125e-06, 'epoch': 1.01} {'loss': 0.6595, 'learning_rate': 9.951879510494361e-06, 'epoch': 1.01} {'loss': 0.5353, 'learning_rate': 9.95155216277817e-06, 'epoch': 1.01} {'loss': 0.6787, 'learning_rate': 9.95122481511389e-06, 'epoch': 1.01} {'loss': 0.5616, 'learning_rate': 9.950897467501882e-06, 'epoch': 1.01} {'loss': 0.6001, 'learning_rate': 9.950570119942492e-06, 'epoch': 1.01} {'loss': 0.494, 'learning_rate': 9.950242772436063e-06, 'epoch': 1.01} {'loss': 0.6025, 'learning_rate': 9.94991542498296e-06, 'epoch': 1.01} {'loss': 0.6607, 'learning_rate': 9.949588077583523e-06, 'epoch': 1.01} {'loss': 0.4738, 'learning_rate': 9.94926073023811e-06, 'epoch': 1.01} {'loss': 0.7252, 'learning_rate': 9.948933382947067e-06, 'epoch': 1.01} {'loss': 0.6892, 'learning_rate': 9.948606035710751e-06, 'epoch': 1.01} {'loss': 0.4979, 'learning_rate': 9.948278688529506e-06, 'epoch': 1.01} {'loss': 0.56, 'learning_rate': 9.94795134140368e-06, 'epoch': 1.01} {'loss': 0.4369, 'learning_rate': 9.947623994333634e-06, 'epoch': 1.01} {'loss': 0.5415, 'learning_rate': 9.94729664731971e-06, 'epoch': 1.01} {'loss': 0.6054, 'learning_rate': 9.946969300362266e-06, 'epoch': 1.01} {'loss': 0.7017, 'learning_rate': 9.946641953461647e-06, 'epoch': 1.01} {'loss': 0.6463, 'learning_rate': 9.946314606618208e-06, 'epoch': 1.01} {'loss': 0.6978, 'learning_rate': 9.945987259832299e-06, 'epoch': 1.01} {'loss': 0.6976, 'learning_rate': 9.945659913104263e-06, 'epoch': 1.01} {'loss': 0.6022, 'learning_rate': 9.945332566434463e-06, 'epoch': 1.01} {'loss': 0.6266, 'learning_rate': 9.94500521982324e-06, 'epoch': 1.01} {'loss': 0.6259, 'learning_rate': 9.944677873270952e-06, 'epoch': 1.01} {'loss': 0.5056, 'learning_rate': 9.944350526777948e-06, 'epoch': 1.01} {'loss': 0.5364, 'learning_rate': 9.944023180344575e-06, 'epoch': 1.01} {'loss': 0.6083, 'learning_rate': 9.943695833971188e-06, 'epoch': 1.01} {'loss': 0.5577, 'learning_rate': 9.943368487658131e-06, 'epoch': 1.01} {'loss': 0.542, 'learning_rate': 9.943041141405766e-06, 'epoch': 1.01} {'loss': 0.4766, 'learning_rate': 9.942713795214432e-06, 'epoch': 1.01} {'loss': 0.5435, 'learning_rate': 9.942386449084488e-06, 'epoch': 1.01} {'loss': 0.5981, 'learning_rate': 9.942059103016285e-06, 'epoch': 1.01} {'loss': 0.6544, 'learning_rate': 9.941731757010169e-06, 'epoch': 1.01} {'loss': 0.5022, 'learning_rate': 9.941404411066492e-06, 'epoch': 1.01} {'loss': 0.5645, 'learning_rate': 9.941077065185603e-06, 'epoch': 1.01} {'loss': 0.6491, 'learning_rate': 9.940749719367859e-06, 'epoch': 1.01} {'loss': 0.4792, 'learning_rate': 9.940422373613603e-06, 'epoch': 1.01} {'loss': 0.4433, 'learning_rate': 9.940095027923193e-06, 'epoch': 1.01} {'loss': 0.6836, 'learning_rate': 9.939767682296978e-06, 'epoch': 1.01} {'loss': 0.5143, 'learning_rate': 9.939440336735305e-06, 'epoch': 1.01} {'loss': 0.5499, 'learning_rate': 9.93911299123853e-06, 'epoch': 1.01} {'loss': 0.5164, 'learning_rate': 9.938785645806995e-06, 'epoch': 1.01} {'loss': 0.5891, 'learning_rate': 9.938458300441062e-06, 'epoch': 1.01} {'loss': 0.5716, 'learning_rate': 9.938130955141076e-06, 'epoch': 1.01} {'loss': 0.5234, 'learning_rate': 9.937803609907383e-06, 'epoch': 1.01} {'loss': 0.5551, 'learning_rate': 9.937476264740346e-06, 'epoch': 1.01} {'loss': 0.6184, 'learning_rate': 9.937148919640305e-06, 'epoch': 1.01} {'loss': 0.6028, 'learning_rate': 9.936821574607617e-06, 'epoch': 1.01} {'loss': 0.5311, 'learning_rate': 9.936494229642625e-06, 'epoch': 1.01} {'loss': 0.3826, 'learning_rate': 9.936166884745692e-06, 'epoch': 1.01} {'loss': 0.6519, 'learning_rate': 9.93583953991716e-06, 'epoch': 1.01} {'loss': 0.6134, 'learning_rate': 9.93551219515738e-06, 'epoch': 1.01} {'loss': 0.7579, 'learning_rate': 9.935184850466704e-06, 'epoch': 1.01} {'loss': 0.5285, 'learning_rate': 9.934857505845484e-06, 'epoch': 1.01} {'loss': 0.6282, 'learning_rate': 9.934530161294072e-06, 'epoch': 1.01} {'loss': 0.5787, 'learning_rate': 9.934202816812812e-06, 'epoch': 1.01} {'loss': 0.5529, 'learning_rate': 9.933875472402065e-06, 'epoch': 1.01} {'loss': 0.6707, 'learning_rate': 9.933548128062176e-06, 'epoch': 1.01} {'loss': 0.5086, 'learning_rate': 9.933220783793494e-06, 'epoch': 1.01} {'loss': 0.4843, 'learning_rate': 9.932893439596375e-06, 'epoch': 1.01} {'loss': 0.6324, 'learning_rate': 9.93256609547116e-06, 'epoch': 1.01} {'loss': 0.5501, 'learning_rate': 9.932238751418213e-06, 'epoch': 1.01} {'loss': 0.4595, 'learning_rate': 9.931911407437876e-06, 'epoch': 1.01} {'loss': 0.4616, 'learning_rate': 9.931584063530501e-06, 'epoch': 1.01} {'loss': 0.6137, 'learning_rate': 9.931256719696442e-06, 'epoch': 1.01} {'loss': 0.5221, 'learning_rate': 9.930929375936046e-06, 'epoch': 1.01} {'loss': 0.5934, 'learning_rate': 9.930602032249668e-06, 'epoch': 1.01} {'loss': 0.5106, 'learning_rate': 9.93027468863765e-06, 'epoch': 1.01} {'loss': 0.5419, 'learning_rate': 9.929947345100355e-06, 'epoch': 1.01} {'loss': 0.6296, 'learning_rate': 9.929620001638126e-06, 'epoch': 1.01} {'loss': 0.5456, 'learning_rate': 9.929292658251314e-06, 'epoch': 1.01} {'loss': 0.6807, 'learning_rate': 9.928965314940274e-06, 'epoch': 1.01} {'loss': 0.4557, 'learning_rate': 9.928637971705353e-06, 'epoch': 1.01} {'loss': 0.6456, 'learning_rate': 9.928310628546904e-06, 'epoch': 1.01} {'loss': 0.5344, 'learning_rate': 9.927983285465273e-06, 'epoch': 1.01} {'loss': 0.5572, 'learning_rate': 9.927655942460818e-06, 'epoch': 1.01} {'loss': 0.5913, 'learning_rate': 9.927328599533885e-06, 'epoch': 1.01} {'loss': 0.5954, 'learning_rate': 9.927001256684825e-06, 'epoch': 1.01} {'loss': 0.5441, 'learning_rate': 9.926673913913992e-06, 'epoch': 1.01} {'loss': 0.5017, 'learning_rate': 9.926346571221731e-06, 'epoch': 1.01} {'loss': 0.5891, 'learning_rate': 9.9260192286084e-06, 'epoch': 1.01} {'loss': 0.5168, 'learning_rate': 9.925691886074347e-06, 'epoch': 1.01} {'loss': 0.5721, 'learning_rate': 9.925364543619916e-06, 'epoch': 1.01} {'loss': 0.6256, 'learning_rate': 9.925037201245467e-06, 'epoch': 1.01} {'loss': 0.7105, 'learning_rate': 9.924709858951346e-06, 'epoch': 1.01} {'loss': 0.5999, 'learning_rate': 9.924382516737908e-06, 'epoch': 1.01} {'loss': 0.5128, 'learning_rate': 9.924055174605499e-06, 'epoch': 1.01} {'loss': 0.5563, 'learning_rate': 9.923727832554473e-06, 'epoch': 1.01} {'loss': 0.609, 'learning_rate': 9.923400490585182e-06, 'epoch': 1.01} {'loss': 0.4954, 'learning_rate': 9.923073148697966e-06, 'epoch': 1.01} {'loss': 0.5429, 'learning_rate': 9.922745806893191e-06, 'epoch': 1.01} {'loss': 0.4898, 'learning_rate': 9.922418465171197e-06, 'epoch': 1.01} {'loss': 0.4848, 'learning_rate': 9.922091123532342e-06, 'epoch': 1.01} {'loss': 0.5056, 'learning_rate': 9.921763781976972e-06, 'epoch': 1.01} {'loss': 0.5666, 'learning_rate': 9.92143644050544e-06, 'epoch': 1.01} {'loss': 0.5014, 'learning_rate': 9.921109099118097e-06, 'epoch': 1.01} {'loss': 0.5441, 'learning_rate': 9.920781757815287e-06, 'epoch': 1.01} {'loss': 0.5351, 'learning_rate': 9.920454416597372e-06, 'epoch': 1.01} {'loss': 0.6747, 'learning_rate': 9.920127075464693e-06, 'epoch': 1.01} {'loss': 0.6705, 'learning_rate': 9.91979973441761e-06, 'epoch': 1.01} {'loss': 0.6462, 'learning_rate': 9.919472393456466e-06, 'epoch': 1.01} {'loss': 0.5792, 'learning_rate': 9.919145052581614e-06, 'epoch': 1.01} {'loss': 0.5951, 'learning_rate': 9.91881771179341e-06, 'epoch': 1.01} {'loss': 0.4439, 'learning_rate': 9.918490371092193e-06, 'epoch': 1.01} {'loss': 0.5764, 'learning_rate': 9.918163030478326e-06, 'epoch': 1.01} {'loss': 0.5204, 'learning_rate': 9.91783568995215e-06, 'epoch': 1.01} {'loss': 0.6476, 'learning_rate': 9.917508349514025e-06, 'epoch': 1.01} {'loss': 0.5458, 'learning_rate': 9.917181009164297e-06, 'epoch': 1.01} {'loss': 0.5541, 'learning_rate': 9.916853668903316e-06, 'epoch': 1.01} {'loss': 0.5016, 'learning_rate': 9.916526328731435e-06, 'epoch': 1.01} {'loss': 0.5389, 'learning_rate': 9.916198988649e-06, 'epoch': 1.01} {'loss': 0.5194, 'learning_rate': 9.915871648656369e-06, 'epoch': 1.01} {'loss': 0.5035, 'learning_rate': 9.915544308753888e-06, 'epoch': 1.01} {'loss': 0.5304, 'learning_rate': 9.915216968941907e-06, 'epoch': 1.01} {'loss': 0.648, 'learning_rate': 9.91488962922078e-06, 'epoch': 1.01} {'loss': 0.4781, 'learning_rate': 9.914562289590857e-06, 'epoch': 1.01} {'loss': 0.6102, 'learning_rate': 9.91423495005249e-06, 'epoch': 1.01} {'loss': 0.441, 'learning_rate': 9.913907610606024e-06, 'epoch': 1.01} {'loss': 0.5845, 'learning_rate': 9.913580271251816e-06, 'epoch': 1.01} {'loss': 0.6753, 'learning_rate': 9.913252931990215e-06, 'epoch': 1.01} {'loss': 0.7179, 'learning_rate': 9.912925592821568e-06, 'epoch': 1.01} {'loss': 0.6144, 'learning_rate': 9.912598253746234e-06, 'epoch': 1.01} {'loss': 0.4366, 'learning_rate': 9.912270914764556e-06, 'epoch': 1.01} {'loss': 0.4827, 'learning_rate': 9.91194357587689e-06, 'epoch': 1.01} {'loss': 0.5494, 'learning_rate': 9.911616237083579e-06, 'epoch': 1.01} {'loss': 0.5121, 'learning_rate': 9.911288898384984e-06, 'epoch': 1.01} {'loss': 0.5911, 'learning_rate': 9.910961559781451e-06, 'epoch': 1.01} {'loss': 0.7297, 'learning_rate': 9.91063422127333e-06, 'epoch': 1.01} {'loss': 0.609, 'learning_rate': 9.910306882860971e-06, 'epoch': 1.01} {'loss': 0.4508, 'learning_rate': 9.909979544544726e-06, 'epoch': 1.01} {'loss': 0.5146, 'learning_rate': 9.909652206324949e-06, 'epoch': 1.01} {'loss': 0.6322, 'learning_rate': 9.909324868201987e-06, 'epoch': 1.01} {'loss': 0.4664, 'learning_rate': 9.908997530176188e-06, 'epoch': 1.01} {'loss': 0.312, 'learning_rate': 9.90867019224791e-06, 'epoch': 1.01} {'loss': 0.5507, 'learning_rate': 9.9083428544175e-06, 'epoch': 1.01} {'loss': 0.6443, 'learning_rate': 9.908015516685307e-06, 'epoch': 1.01} {'loss': 0.624, 'learning_rate': 9.907688179051683e-06, 'epoch': 1.01} {'loss': 0.6523, 'learning_rate': 9.907360841516982e-06, 'epoch': 1.01} {'loss': 0.4637, 'learning_rate': 9.907033504081555e-06, 'epoch': 1.01} {'loss': 0.5853, 'learning_rate': 9.906706166745743e-06, 'epoch': 1.01} {'loss': 0.5454, 'learning_rate': 9.906378829509908e-06, 'epoch': 1.01} {'loss': 0.5745, 'learning_rate': 9.906051492374395e-06, 'epoch': 1.01} {'loss': 0.6769, 'learning_rate': 9.905724155339559e-06, 'epoch': 1.01} {'loss': 0.4932, 'learning_rate': 9.905396818405743e-06, 'epoch': 1.01} {'loss': 0.7426, 'learning_rate': 9.905069481573307e-06, 'epoch': 1.01} {'loss': 0.5086, 'learning_rate': 9.904742144842599e-06, 'epoch': 1.01} {'loss': 0.5139, 'learning_rate': 9.904414808213962e-06, 'epoch': 1.01} {'loss': 0.3698, 'learning_rate': 9.904087471687759e-06, 'epoch': 1.01} {'loss': 0.5264, 'learning_rate': 9.903760135264333e-06, 'epoch': 1.01} {'loss': 0.4248, 'learning_rate': 9.903432798944037e-06, 'epoch': 1.01} {'loss': 0.661, 'learning_rate': 9.903105462727223e-06, 'epoch': 1.01} {'loss': 0.4566, 'learning_rate': 9.902778126614237e-06, 'epoch': 1.01} {'loss': 0.5558, 'learning_rate': 9.902450790605434e-06, 'epoch': 1.01} {'loss': 0.6387, 'learning_rate': 9.902123454701163e-06, 'epoch': 1.01} {'loss': 0.5738, 'learning_rate': 9.901796118901777e-06, 'epoch': 1.01} {'loss': 0.5423, 'learning_rate': 9.901468783207625e-06, 'epoch': 1.01} {'loss': 0.6625, 'learning_rate': 9.90114144761906e-06, 'epoch': 1.01} {'loss': 0.5822, 'learning_rate': 9.90081411213643e-06, 'epoch': 1.01} {'loss': 0.5114, 'learning_rate': 9.900486776760083e-06, 'epoch': 1.01} {'loss': 0.4, 'learning_rate': 9.900159441490377e-06, 'epoch': 1.01} {'loss': 0.6537, 'learning_rate': 9.899832106327655e-06, 'epoch': 1.01} {'loss': 0.6139, 'learning_rate': 9.899504771272277e-06, 'epoch': 1.01} {'loss': 0.672, 'learning_rate': 9.899177436324588e-06, 'epoch': 1.01} {'loss': 0.525, 'learning_rate': 9.89885010148494e-06, 'epoch': 1.01} {'loss': 0.6865, 'learning_rate': 9.898522766753682e-06, 'epoch': 1.01} {'loss': 0.6044, 'learning_rate': 9.898195432131162e-06, 'epoch': 1.01} {'loss': 0.4927, 'learning_rate': 9.897868097617741e-06, 'epoch': 1.01} {'loss': 0.6186, 'learning_rate': 9.897540763213758e-06, 'epoch': 1.01} {'loss': 0.5413, 'learning_rate': 9.897213428919573e-06, 'epoch': 1.01} {'loss': 0.5442, 'learning_rate': 9.896886094735534e-06, 'epoch': 1.01} {'loss': 0.5969, 'learning_rate': 9.89655876066199e-06, 'epoch': 1.01} {'loss': 0.504, 'learning_rate': 9.896231426699291e-06, 'epoch': 1.01} {'loss': 0.6011, 'learning_rate': 9.89590409284779e-06, 'epoch': 1.01} {'loss': 0.4846, 'learning_rate': 9.895576759107837e-06, 'epoch': 1.01} {'loss': 0.5569, 'learning_rate': 9.895249425479781e-06, 'epoch': 1.01} {'loss': 0.6206, 'learning_rate': 9.894922091963979e-06, 'epoch': 1.01} {'loss': 0.6388, 'learning_rate': 9.894594758560776e-06, 'epoch': 1.01} {'loss': 0.4974, 'learning_rate': 9.894267425270524e-06, 'epoch': 1.01} {'loss': 0.4554, 'learning_rate': 9.893940092093574e-06, 'epoch': 1.01} {'loss': 0.4656, 'learning_rate': 9.893612759030274e-06, 'epoch': 1.01} {'loss': 0.6577, 'learning_rate': 9.893285426080982e-06, 'epoch': 1.01} {'loss': 0.589, 'learning_rate': 9.892958093246044e-06, 'epoch': 1.01} {'loss': 0.3992, 'learning_rate': 9.892630760525807e-06, 'epoch': 1.01} {'loss': 0.6417, 'learning_rate': 9.892303427920628e-06, 'epoch': 1.01} {'loss': 0.5545, 'learning_rate': 9.891976095430856e-06, 'epoch': 1.01} {'loss': 0.6531, 'learning_rate': 9.891648763056842e-06, 'epoch': 1.01} {'loss': 0.6002, 'learning_rate': 9.891321430798933e-06, 'epoch': 1.01} {'loss': 0.5296, 'learning_rate': 9.890994098657488e-06, 'epoch': 1.01} {'loss': 0.5059, 'learning_rate': 9.89066676663285e-06, 'epoch': 1.01} {'loss': 0.5982, 'learning_rate': 9.89033943472537e-06, 'epoch': 1.01} {'loss': 0.6655, 'learning_rate': 9.890012102935404e-06, 'epoch': 1.01} {'loss': 0.5801, 'learning_rate': 9.8896847712633e-06, 'epoch': 1.01} {'loss': 0.5452, 'learning_rate': 9.889357439709409e-06, 'epoch': 1.01} {'loss': 0.6398, 'learning_rate': 9.889030108274079e-06, 'epoch': 1.01} {'loss': 0.4901, 'learning_rate': 9.888702776957665e-06, 'epoch': 1.01} {'loss': 0.6022, 'learning_rate': 9.888375445760518e-06, 'epoch': 1.01} {'loss': 0.6702, 'learning_rate': 9.888048114682983e-06, 'epoch': 1.01} {'loss': 0.3978, 'learning_rate': 9.887720783725417e-06, 'epoch': 1.01} {'loss': 0.5845, 'learning_rate': 9.887393452888167e-06, 'epoch': 1.01} {'loss': 0.5991, 'learning_rate': 9.887066122171586e-06, 'epoch': 1.01} {'loss': 0.4606, 'learning_rate': 9.886738791576027e-06, 'epoch': 1.01} {'loss': 0.6558, 'learning_rate': 9.886411461101828e-06, 'epoch': 1.01} {'loss': 0.4634, 'learning_rate': 9.886084130749359e-06, 'epoch': 1.01} {'loss': 0.7424, 'learning_rate': 9.885756800518954e-06, 'epoch': 1.01} {'loss': 0.5869, 'learning_rate': 9.885429470410977e-06, 'epoch': 1.01} {'loss': 0.6659, 'learning_rate': 9.885102140425769e-06, 'epoch': 1.01} {'loss': 0.5214, 'learning_rate': 9.884774810563686e-06, 'epoch': 1.01} {'loss': 0.6679, 'learning_rate': 9.88444748082508e-06, 'epoch': 1.01} {'loss': 0.6602, 'learning_rate': 9.884120151210293e-06, 'epoch': 1.01} {'loss': 0.5881, 'learning_rate': 9.883792821719686e-06, 'epoch': 1.01} {'loss': 0.4463, 'learning_rate': 9.883465492353602e-06, 'epoch': 1.01} {'loss': 0.5075, 'learning_rate': 9.883138163112397e-06, 'epoch': 1.01} {'loss': 0.5369, 'learning_rate': 9.88281083399642e-06, 'epoch': 1.01} {'loss': 0.5089, 'learning_rate': 9.882483505006023e-06, 'epoch': 1.01} {'loss': 0.464, 'learning_rate': 9.882156176141556e-06, 'epoch': 1.01} {'loss': 0.5872, 'learning_rate': 9.881828847403366e-06, 'epoch': 1.01} {'loss': 0.5308, 'learning_rate': 9.88150151879181e-06, 'epoch': 1.01} {'loss': 0.4885, 'learning_rate': 9.881174190307233e-06, 'epoch': 1.01} {'loss': 0.5757, 'learning_rate': 9.880846861949991e-06, 'epoch': 1.01} {'loss': 0.4351, 'learning_rate': 9.880519533720432e-06, 'epoch': 1.01} {'loss': 0.5231, 'learning_rate': 9.880192205618905e-06, 'epoch': 1.01} {'loss': 0.4799, 'learning_rate': 9.879864877645767e-06, 'epoch': 1.01} {'loss': 0.6462, 'learning_rate': 9.87953754980136e-06, 'epoch': 1.01} {'loss': 0.4645, 'learning_rate': 9.879210222086043e-06, 'epoch': 1.01} {'loss': 0.5967, 'learning_rate': 9.87888289450016e-06, 'epoch': 1.01} {'loss': 0.4391, 'learning_rate': 9.878555567044068e-06, 'epoch': 1.01} {'loss': 0.517, 'learning_rate': 9.878228239718115e-06, 'epoch': 1.01} {'loss': 0.5876, 'learning_rate': 9.877900912522647e-06, 'epoch': 1.01} {'loss': 0.5288, 'learning_rate': 9.877573585458024e-06, 'epoch': 1.01} {'loss': 0.5417, 'learning_rate': 9.877246258524586e-06, 'epoch': 1.01} {'loss': 0.5454, 'learning_rate': 9.876918931722696e-06, 'epoch': 1.01} {'loss': 0.5315, 'learning_rate': 9.876591605052695e-06, 'epoch': 1.01} {'loss': 0.4924, 'learning_rate': 9.87626427851494e-06, 'epoch': 1.01} {'loss': 0.571, 'learning_rate': 9.875936952109778e-06, 'epoch': 1.01} {'loss': 0.526, 'learning_rate': 9.875609625837558e-06, 'epoch': 1.01} {'loss': 0.6507, 'learning_rate': 9.875282299698637e-06, 'epoch': 1.01} {'loss': 0.6875, 'learning_rate': 9.874954973693357e-06, 'epoch': 1.01} {'loss': 0.6004, 'learning_rate': 9.87462764782208e-06, 'epoch': 1.01} {'loss': 0.5468, 'learning_rate': 9.87430032208515e-06, 'epoch': 1.01} {'loss': 0.4768, 'learning_rate': 9.873972996482916e-06, 'epoch': 1.01} {'loss': 0.7878, 'learning_rate': 9.873645671015734e-06, 'epoch': 1.01} {'loss': 0.5892, 'learning_rate': 9.873318345683948e-06, 'epoch': 1.01} {'loss': 0.5166, 'learning_rate': 9.872991020487917e-06, 'epoch': 1.01} {'loss': 0.6057, 'learning_rate': 9.872663695427983e-06, 'epoch': 1.01} {'loss': 0.5796, 'learning_rate': 9.872336370504505e-06, 'epoch': 1.01} {'loss': 0.4809, 'learning_rate': 9.872009045717832e-06, 'epoch': 1.01} {'loss': 0.5877, 'learning_rate': 9.87168172106831e-06, 'epoch': 1.01} {'loss': 0.645, 'learning_rate': 9.871354396556293e-06, 'epoch': 1.01} {'loss': 0.4795, 'learning_rate': 9.871027072182128e-06, 'epoch': 1.01} {'loss': 0.4876, 'learning_rate': 9.870699747946175e-06, 'epoch': 1.01} {'loss': 0.5009, 'learning_rate': 9.870372423848773e-06, 'epoch': 1.01} {'loss': 0.6334, 'learning_rate': 9.870045099890284e-06, 'epoch': 1.01} {'loss': 0.5557, 'learning_rate': 9.869717776071052e-06, 'epoch': 1.01} {'loss': 0.5397, 'learning_rate': 9.869390452391429e-06, 'epoch': 1.01} {'loss': 0.5748, 'learning_rate': 9.869063128851767e-06, 'epoch': 1.01} {'loss': 0.454, 'learning_rate': 9.868735805452412e-06, 'epoch': 1.01} {'loss': 0.6712, 'learning_rate': 9.868408482193721e-06, 'epoch': 1.01} {'loss': 0.5397, 'learning_rate': 9.868081159076043e-06, 'epoch': 1.01} {'loss': 0.5543, 'learning_rate': 9.867753836099724e-06, 'epoch': 1.01} {'loss': 0.5344, 'learning_rate': 9.867426513265123e-06, 'epoch': 1.01} {'loss': 0.6145, 'learning_rate': 9.867099190572584e-06, 'epoch': 1.01} {'loss': 0.5906, 'learning_rate': 9.866771868022462e-06, 'epoch': 1.01} {'loss': 0.6963, 'learning_rate': 9.866444545615102e-06, 'epoch': 1.01} {'loss': 0.4828, 'learning_rate': 9.866117223350864e-06, 'epoch': 1.01} {'loss': 0.5923, 'learning_rate': 9.865789901230092e-06, 'epoch': 1.01} {'loss': 0.3762, 'learning_rate': 9.865462579253134e-06, 'epoch': 1.01} {'loss': 0.5116, 'learning_rate': 9.86513525742035e-06, 'epoch': 1.01} {'loss': 0.4813, 'learning_rate': 9.864807935732084e-06, 'epoch': 1.01} {'loss': 0.6476, 'learning_rate': 9.864480614188691e-06, 'epoch': 1.01} {'loss': 0.4749, 'learning_rate': 9.864153292790519e-06, 'epoch': 1.01} {'loss': 0.4436, 'learning_rate': 9.863825971537912e-06, 'epoch': 1.01} {'loss': 0.6374, 'learning_rate': 9.863498650431236e-06, 'epoch': 1.01} {'loss': 0.6325, 'learning_rate': 9.863171329470827e-06, 'epoch': 1.01} {'loss': 0.5975, 'learning_rate': 9.862844008657046e-06, 'epoch': 1.01} {'loss': 0.5433, 'learning_rate': 9.86251668799024e-06, 'epoch': 1.01} {'loss': 0.6206, 'learning_rate': 9.86218936747076e-06, 'epoch': 1.01} {'loss': 0.586, 'learning_rate': 9.861862047098958e-06, 'epoch': 1.01} {'loss': 0.4535, 'learning_rate': 9.861534726875178e-06, 'epoch': 1.01} {'loss': 0.551, 'learning_rate': 9.86120740679978e-06, 'epoch': 1.01} {'loss': 0.6021, 'learning_rate': 9.860880086873106e-06, 'epoch': 1.01} {'loss': 0.4892, 'learning_rate': 9.860552767095518e-06, 'epoch': 1.01} {'loss': 0.4384, 'learning_rate': 9.860225447467358e-06, 'epoch': 1.01} {'loss': 0.583, 'learning_rate': 9.859898127988979e-06, 'epoch': 1.01} {'loss': 0.5955, 'learning_rate': 9.859570808660733e-06, 'epoch': 1.01} {'loss': 0.5263, 'learning_rate': 9.859243489482966e-06, 'epoch': 1.01} {'loss': 0.5648, 'learning_rate': 9.858916170456036e-06, 'epoch': 1.01} {'loss': 0.46, 'learning_rate': 9.858588851580287e-06, 'epoch': 1.01} {'loss': 0.5925, 'learning_rate': 9.858261532856074e-06, 'epoch': 1.01} {'loss': 0.5883, 'learning_rate': 9.85793421428375e-06, 'epoch': 1.01} {'loss': 0.5753, 'learning_rate': 9.857606895863658e-06, 'epoch': 1.01} {'loss': 0.4477, 'learning_rate': 9.857279577596155e-06, 'epoch': 1.01} {'loss': 0.6393, 'learning_rate': 9.856952259481587e-06, 'epoch': 1.01} {'loss': 0.5906, 'learning_rate': 9.856624941520312e-06, 'epoch': 1.01} {'loss': 0.6918, 'learning_rate': 9.856297623712671e-06, 'epoch': 1.01} {'loss': 0.5754, 'learning_rate': 9.855970306059024e-06, 'epoch': 1.01} {'loss': 0.6398, 'learning_rate': 9.855642988559717e-06, 'epoch': 1.01} {'loss': 0.6252, 'learning_rate': 9.8553156712151e-06, 'epoch': 1.01} {'loss': 0.5116, 'learning_rate': 9.85498835402553e-06, 'epoch': 1.01} {'loss': 0.482, 'learning_rate': 9.854661036991346e-06, 'epoch': 1.01} {'loss': 0.5194, 'learning_rate': 9.854333720112912e-06, 'epoch': 1.01} {'loss': 0.5645, 'learning_rate': 9.85400640339057e-06, 'epoch': 1.01} {'loss': 0.5058, 'learning_rate': 9.853679086824675e-06, 'epoch': 1.01} {'loss': 0.6264, 'learning_rate': 9.853351770415575e-06, 'epoch': 1.01} {'loss': 0.5896, 'learning_rate': 9.85302445416362e-06, 'epoch': 1.01} {'loss': 0.5674, 'learning_rate': 9.852697138069164e-06, 'epoch': 1.01} {'loss': 0.671, 'learning_rate': 9.852369822132553e-06, 'epoch': 1.01} {'loss': 0.665, 'learning_rate': 9.852042506354146e-06, 'epoch': 1.01} {'loss': 0.4355, 'learning_rate': 9.85171519073429e-06, 'epoch': 1.01} {'loss': 0.5908, 'learning_rate': 9.85138787527333e-06, 'epoch': 1.01} {'loss': 0.5619, 'learning_rate': 9.851060559971625e-06, 'epoch': 1.01} {'loss': 0.6383, 'learning_rate': 9.850733244829517e-06, 'epoch': 1.01} {'loss': 0.6804, 'learning_rate': 9.850405929847367e-06, 'epoch': 1.01} {'loss': 0.618, 'learning_rate': 9.850078615025514e-06, 'epoch': 1.01} {'loss': 0.6046, 'learning_rate': 9.849751300364322e-06, 'epoch': 1.01} {'loss': 0.5701, 'learning_rate': 9.849423985864133e-06, 'epoch': 1.01} {'loss': 0.6463, 'learning_rate': 9.8490966715253e-06, 'epoch': 1.01} {'loss': 0.5591, 'learning_rate': 9.848769357348174e-06, 'epoch': 1.01} {'loss': 0.659, 'learning_rate': 9.848442043333101e-06, 'epoch': 1.01} {'loss': 0.5344, 'learning_rate': 9.84811472948044e-06, 'epoch': 1.01} {'loss': 0.6258, 'learning_rate': 9.847787415790536e-06, 'epoch': 1.01} {'loss': 0.5138, 'learning_rate': 9.847460102263744e-06, 'epoch': 1.01} {'loss': 0.5968, 'learning_rate': 9.847132788900412e-06, 'epoch': 1.01} {'loss': 0.5871, 'learning_rate': 9.84680547570089e-06, 'epoch': 1.01} {'loss': 0.4306, 'learning_rate': 9.84647816266553e-06, 'epoch': 1.01} {'loss': 0.5444, 'learning_rate': 9.84615084979468e-06, 'epoch': 1.01} {'loss': 0.7382, 'learning_rate': 9.845823537088697e-06, 'epoch': 1.01} {'loss': 0.6526, 'learning_rate': 9.845496224547928e-06, 'epoch': 1.01} {'loss': 0.5754, 'learning_rate': 9.84516891217272e-06, 'epoch': 1.01} {'loss': 0.5886, 'learning_rate': 9.844841599963431e-06, 'epoch': 1.01} {'loss': 0.634, 'learning_rate': 9.844514287920406e-06, 'epoch': 1.01} {'loss': 0.6645, 'learning_rate': 9.844186976044e-06, 'epoch': 1.01} {'loss': 0.7235, 'learning_rate': 9.843859664334558e-06, 'epoch': 1.01} {'loss': 0.7316, 'learning_rate': 9.843532352792439e-06, 'epoch': 1.01} {'loss': 0.7881, 'learning_rate': 9.843205041417988e-06, 'epoch': 1.01} {'loss': 0.495, 'learning_rate': 9.842877730211553e-06, 'epoch': 1.01} {'loss': 0.2999, 'learning_rate': 9.842550419173495e-06, 'epoch': 1.01} {'loss': 0.6928, 'learning_rate': 9.842223108304153e-06, 'epoch': 1.01} {'loss': 0.5956, 'learning_rate': 9.841895797603888e-06, 'epoch': 1.01} {'loss': 0.7435, 'learning_rate': 9.84156848707304e-06, 'epoch': 1.01} {'loss': 0.5585, 'learning_rate': 9.841241176711971e-06, 'epoch': 1.01} {'loss': 0.544, 'learning_rate': 9.840913866521025e-06, 'epoch': 1.01} {'loss': 0.3916, 'learning_rate': 9.840586556500552e-06, 'epoch': 1.01} {'loss': 0.637, 'learning_rate': 9.840259246650908e-06, 'epoch': 1.01} {'loss': 0.5029, 'learning_rate': 9.839931936972437e-06, 'epoch': 1.01} {'loss': 0.5222, 'learning_rate': 9.839604627465498e-06, 'epoch': 1.01} {'loss': 0.5731, 'learning_rate': 9.839277318130436e-06, 'epoch': 1.01} {'loss': 0.4471, 'learning_rate': 9.838950008967599e-06, 'epoch': 1.01} {'loss': 0.4979, 'learning_rate': 9.838622699977346e-06, 'epoch': 1.01} {'loss': 0.4817, 'learning_rate': 9.838295391160018e-06, 'epoch': 1.01} {'loss': 0.6141, 'learning_rate': 9.837968082515977e-06, 'epoch': 1.01} {'loss': 0.5225, 'learning_rate': 9.837640774045563e-06, 'epoch': 1.01} {'loss': 0.5463, 'learning_rate': 9.837313465749137e-06, 'epoch': 1.01} {'loss': 0.561, 'learning_rate': 9.836986157627042e-06, 'epoch': 1.01} {'loss': 0.6675, 'learning_rate': 9.836658849679627e-06, 'epoch': 1.01} {'loss': 0.6641, 'learning_rate': 9.836331541907252e-06, 'epoch': 1.01} {'loss': 0.4101, 'learning_rate': 9.836004234310258e-06, 'epoch': 1.01} {'loss': 0.4022, 'learning_rate': 9.835676926889005e-06, 'epoch': 1.01} {'loss': 0.5726, 'learning_rate': 9.835349619643838e-06, 'epoch': 1.01} {'loss': 0.6241, 'learning_rate': 9.835022312575107e-06, 'epoch': 1.01} {'loss': 0.575, 'learning_rate': 9.834695005683166e-06, 'epoch': 1.01} {'loss': 0.5361, 'learning_rate': 9.83436769896836e-06, 'epoch': 1.01} {'loss': 0.5482, 'learning_rate': 9.83404039243105e-06, 'epoch': 1.01} {'loss': 0.5231, 'learning_rate': 9.833713086071577e-06, 'epoch': 1.01} {'loss': 0.6972, 'learning_rate': 9.833385779890296e-06, 'epoch': 1.01} {'loss': 0.5142, 'learning_rate': 9.833058473887559e-06, 'epoch': 1.01} {'loss': 0.5802, 'learning_rate': 9.832731168063713e-06, 'epoch': 1.01} {'loss': 0.5742, 'learning_rate': 9.832403862419112e-06, 'epoch': 1.01} {'loss': 0.5527, 'learning_rate': 9.832076556954102e-06, 'epoch': 1.01} {'loss': 0.4838, 'learning_rate': 9.831749251669042e-06, 'epoch': 1.01} {'loss': 0.7173, 'learning_rate': 9.831421946564275e-06, 'epoch': 1.01} {'loss': 0.5213, 'learning_rate': 9.831094641640155e-06, 'epoch': 1.01} {'loss': 0.5628, 'learning_rate': 9.830767336897032e-06, 'epoch': 1.01} {'loss': 0.4829, 'learning_rate': 9.830440032335258e-06, 'epoch': 1.01} {'loss': 0.5302, 'learning_rate': 9.830112727955184e-06, 'epoch': 1.01} {'loss': 0.5881, 'learning_rate': 9.829785423757154e-06, 'epoch': 1.01} {'loss': 0.5503, 'learning_rate': 9.82945811974153e-06, 'epoch': 1.01} {'loss': 0.6294, 'learning_rate': 9.829130815908658e-06, 'epoch': 1.01} {'loss': 0.5882, 'learning_rate': 9.828803512258884e-06, 'epoch': 1.01} {'loss': 0.6566, 'learning_rate': 9.828476208792565e-06, 'epoch': 1.01} {'loss': 0.5772, 'learning_rate': 9.828148905510045e-06, 'epoch': 1.01} {'loss': 0.5926, 'learning_rate': 9.827821602411682e-06, 'epoch': 1.01} {'loss': 0.6367, 'learning_rate': 9.82749429949782e-06, 'epoch': 1.01} {'loss': 0.5896, 'learning_rate': 9.82716699676882e-06, 'epoch': 1.01} {'loss': 0.5689, 'learning_rate': 9.826839694225023e-06, 'epoch': 1.01} {'loss': 0.5348, 'learning_rate': 9.826512391866782e-06, 'epoch': 1.01} {'loss': 0.5824, 'learning_rate': 9.826185089694451e-06, 'epoch': 1.01} {'loss': 0.4992, 'learning_rate': 9.825857787708373e-06, 'epoch': 1.01} {'loss': 0.6576, 'learning_rate': 9.82553048590891e-06, 'epoch': 1.01} {'loss': 0.3921, 'learning_rate': 9.825203184296402e-06, 'epoch': 1.01} {'loss': 0.4877, 'learning_rate': 9.824875882871209e-06, 'epoch': 1.01} {'loss': 0.5079, 'learning_rate': 9.824548581633678e-06, 'epoch': 1.01} {'loss': 0.5959, 'learning_rate': 9.824221280584155e-06, 'epoch': 1.01} {'loss': 0.3774, 'learning_rate': 9.823893979722998e-06, 'epoch': 1.01} {'loss': 0.5982, 'learning_rate': 9.82356667905055e-06, 'epoch': 1.01} {'loss': 0.5952, 'learning_rate': 9.82323937856717e-06, 'epoch': 1.01} {'loss': 0.5645, 'learning_rate': 9.822912078273207e-06, 'epoch': 1.01} {'loss': 0.6085, 'learning_rate': 9.822584778169004e-06, 'epoch': 1.01} {'loss': 0.6271, 'learning_rate': 9.82225747825492e-06, 'epoch': 1.01} {'loss': 0.6488, 'learning_rate': 9.821930178531303e-06, 'epoch': 1.01} {'loss': 0.6653, 'learning_rate': 9.821602878998507e-06, 'epoch': 1.01} {'loss': 0.579, 'learning_rate': 9.821275579656874e-06, 'epoch': 1.01} {'loss': 0.6657, 'learning_rate': 9.820948280506764e-06, 'epoch': 1.01} {'loss': 0.5987, 'learning_rate': 9.820620981548524e-06, 'epoch': 1.01} {'loss': 0.6871, 'learning_rate': 9.820293682782502e-06, 'epoch': 1.01} {'loss': 0.5894, 'learning_rate': 9.819966384209055e-06, 'epoch': 1.01} {'loss': 0.7011, 'learning_rate': 9.819639085828529e-06, 'epoch': 1.01} {'loss': 0.4071, 'learning_rate': 9.819311787641277e-06, 'epoch': 1.01} {'loss': 0.5195, 'learning_rate': 9.818984489647644e-06, 'epoch': 1.01} {'loss': 0.7284, 'learning_rate': 9.818657191847991e-06, 'epoch': 1.01} {'loss': 0.6073, 'learning_rate': 9.818329894242664e-06, 'epoch': 1.01} {'loss': 0.5584, 'learning_rate': 9.818002596832005e-06, 'epoch': 1.01} {'loss': 0.5437, 'learning_rate': 9.817675299616381e-06, 'epoch': 1.01} {'loss': 0.5196, 'learning_rate': 9.81734800259613e-06, 'epoch': 1.01} {'loss': 0.4451, 'learning_rate': 9.81702070577161e-06, 'epoch': 1.01} {'loss': 0.4999, 'learning_rate': 9.81669340914317e-06, 'epoch': 1.01} {'loss': 0.6726, 'learning_rate': 9.816366112711152e-06, 'epoch': 1.01} {'loss': 0.6325, 'learning_rate': 9.81603881647592e-06, 'epoch': 1.01} {'loss': 0.493, 'learning_rate': 9.815711520437815e-06, 'epoch': 1.01} {'loss': 0.5056, 'learning_rate': 9.815384224597197e-06, 'epoch': 1.01} {'loss': 0.5757, 'learning_rate': 9.815056928954408e-06, 'epoch': 1.01} {'loss': 0.5701, 'learning_rate': 9.814729633509806e-06, 'epoch': 1.01} {'loss': 0.4945, 'learning_rate': 9.814402338263735e-06, 'epoch': 1.01} {'loss': 0.5982, 'learning_rate': 9.814075043216547e-06, 'epoch': 1.01} {'loss': 0.5143, 'learning_rate': 9.813747748368597e-06, 'epoch': 1.01} {'loss': 0.5144, 'learning_rate': 9.81342045372023e-06, 'epoch': 1.01} {'loss': 0.475, 'learning_rate': 9.813093159271803e-06, 'epoch': 1.01} {'loss': 0.6462, 'learning_rate': 9.812765865023664e-06, 'epoch': 1.01} {'loss': 0.2472, 'learning_rate': 9.812438570976163e-06, 'epoch': 1.02} {'loss': 0.5304, 'learning_rate': 9.812111277129652e-06, 'epoch': 1.02} {'loss': 0.6283, 'learning_rate': 9.811783983484475e-06, 'epoch': 1.02} {'loss': 0.605, 'learning_rate': 9.811456690040993e-06, 'epoch': 1.02} {'loss': 0.5161, 'learning_rate': 9.81112939679955e-06, 'epoch': 1.02} {'loss': 0.5809, 'learning_rate': 9.8108021037605e-06, 'epoch': 1.02} {'loss': 0.4603, 'learning_rate': 9.810474810924196e-06, 'epoch': 1.02} {'loss': 0.7327, 'learning_rate': 9.810147518290981e-06, 'epoch': 1.02} {'loss': 0.4168, 'learning_rate': 9.809820225861214e-06, 'epoch': 1.02} {'loss': 0.4808, 'learning_rate': 9.809492933635235e-06, 'epoch': 1.02} {'loss': 0.5766, 'learning_rate': 9.809165641613407e-06, 'epoch': 1.02} {'loss': 0.5586, 'learning_rate': 9.808838349796071e-06, 'epoch': 1.02} {'loss': 0.4908, 'learning_rate': 9.808511058183587e-06, 'epoch': 1.02} {'loss': 0.6387, 'learning_rate': 9.8081837667763e-06, 'epoch': 1.02} {'loss': 0.5334, 'learning_rate': 9.807856475574559e-06, 'epoch': 1.02} {'loss': 0.464, 'learning_rate': 9.80752918457872e-06, 'epoch': 1.02} {'loss': 0.5881, 'learning_rate': 9.807201893789126e-06, 'epoch': 1.02} {'loss': 0.4685, 'learning_rate': 9.806874603206136e-06, 'epoch': 1.02} {'loss': 0.4398, 'learning_rate': 9.8065473128301e-06, 'epoch': 1.02} {'loss': 0.6998, 'learning_rate': 9.80622002266136e-06, 'epoch': 1.02} {'loss': 0.5188, 'learning_rate': 9.805892732700276e-06, 'epoch': 1.02} {'loss': 0.5902, 'learning_rate': 9.805565442947193e-06, 'epoch': 1.02} {'loss': 0.4993, 'learning_rate': 9.805238153402469e-06, 'epoch': 1.02} {'loss': 0.6385, 'learning_rate': 9.804910864066443e-06, 'epoch': 1.02} {'loss': 0.4805, 'learning_rate': 9.804583574939479e-06, 'epoch': 1.02} {'loss': 0.5885, 'learning_rate': 9.80425628602192e-06, 'epoch': 1.02} {'loss': 0.4113, 'learning_rate': 9.803928997314117e-06, 'epoch': 1.02} {'loss': 0.5444, 'learning_rate': 9.80360170881642e-06, 'epoch': 1.02} {'loss': 0.5149, 'learning_rate': 9.803274420529184e-06, 'epoch': 1.02} {'loss': 0.4371, 'learning_rate': 9.802947132452759e-06, 'epoch': 1.02} {'loss': 0.5922, 'learning_rate': 9.802619844587487e-06, 'epoch': 1.02} {'loss': 0.5407, 'learning_rate': 9.802292556933732e-06, 'epoch': 1.02} {'loss': 0.5001, 'learning_rate': 9.801965269491838e-06, 'epoch': 1.02} {'loss': 0.6113, 'learning_rate': 9.801637982262153e-06, 'epoch': 1.02} {'loss': 0.5064, 'learning_rate': 9.801310695245034e-06, 'epoch': 1.02} {'loss': 0.6376, 'learning_rate': 9.800983408440825e-06, 'epoch': 1.02} {'loss': 0.4849, 'learning_rate': 9.800656121849883e-06, 'epoch': 1.02} {'loss': 0.5428, 'learning_rate': 9.800328835472557e-06, 'epoch': 1.02} {'loss': 0.507, 'learning_rate': 9.800001549309191e-06, 'epoch': 1.02} {'loss': 0.6089, 'learning_rate': 9.799674263360147e-06, 'epoch': 1.02} {'loss': 0.6437, 'learning_rate': 9.799346977625768e-06, 'epoch': 1.02} {'loss': 0.6692, 'learning_rate': 9.799019692106409e-06, 'epoch': 1.02} {'loss': 0.649, 'learning_rate': 9.798692406802414e-06, 'epoch': 1.02} {'loss': 0.6873, 'learning_rate': 9.798365121714142e-06, 'epoch': 1.02} {'loss': 0.4272, 'learning_rate': 9.798037836841941e-06, 'epoch': 1.02} {'loss': 0.5335, 'learning_rate': 9.797710552186155e-06, 'epoch': 1.02} {'loss': 0.7049, 'learning_rate': 9.797383267747146e-06, 'epoch': 1.02} {'loss': 0.5381, 'learning_rate': 9.797055983525256e-06, 'epoch': 1.02} {'loss': 0.679, 'learning_rate': 9.79672869952084e-06, 'epoch': 1.02} {'loss': 0.6609, 'learning_rate': 9.796401415734246e-06, 'epoch': 1.02} {'loss': 0.5765, 'learning_rate': 9.796074132165829e-06, 'epoch': 1.02} {'loss': 0.6008, 'learning_rate': 9.795746848815937e-06, 'epoch': 1.02} {'loss': 0.6057, 'learning_rate': 9.795419565684918e-06, 'epoch': 1.02} {'loss': 0.505, 'learning_rate': 9.795092282773127e-06, 'epoch': 1.02} {'loss': 0.5371, 'learning_rate': 9.794765000080913e-06, 'epoch': 1.02} {'loss': 0.551, 'learning_rate': 9.794437717608627e-06, 'epoch': 1.02} {'loss': 0.5868, 'learning_rate': 9.794110435356621e-06, 'epoch': 1.02} {'loss': 0.4604, 'learning_rate': 9.79378315332524e-06, 'epoch': 1.02} {'loss': 0.4642, 'learning_rate': 9.793455871514843e-06, 'epoch': 1.02} {'loss': 0.5489, 'learning_rate': 9.793128589925772e-06, 'epoch': 1.02} {'loss': 0.6516, 'learning_rate': 9.792801308558387e-06, 'epoch': 1.02} {'loss': 0.6012, 'learning_rate': 9.79247402741303e-06, 'epoch': 1.02} {'loss': 0.5119, 'learning_rate': 9.792146746490062e-06, 'epoch': 1.02} {'loss': 0.7225, 'learning_rate': 9.791819465789825e-06, 'epoch': 1.02} {'loss': 0.4538, 'learning_rate': 9.791492185312668e-06, 'epoch': 1.02} {'loss': 0.5975, 'learning_rate': 9.791164905058951e-06, 'epoch': 1.02} {'loss': 0.467, 'learning_rate': 9.790837625029014e-06, 'epoch': 1.02} {'loss': 0.5519, 'learning_rate': 9.79051034522322e-06, 'epoch': 1.02} {'loss': 0.5665, 'learning_rate': 9.79018306564191e-06, 'epoch': 1.02} {'loss': 0.4834, 'learning_rate': 9.78985578628544e-06, 'epoch': 1.02} {'loss': 0.4694, 'learning_rate': 9.789528507154157e-06, 'epoch': 1.02} {'loss': 0.6518, 'learning_rate': 9.78920122824841e-06, 'epoch': 1.02} {'loss': 0.7145, 'learning_rate': 9.788873949568557e-06, 'epoch': 1.02} {'loss': 0.5615, 'learning_rate': 9.78854667111494e-06, 'epoch': 1.02} {'loss': 0.4878, 'learning_rate': 9.788219392887919e-06, 'epoch': 1.02} {'loss': 0.6888, 'learning_rate': 9.78789211488784e-06, 'epoch': 1.02} {'loss': 0.5476, 'learning_rate': 9.787564837115053e-06, 'epoch': 1.02} {'loss': 0.4906, 'learning_rate': 9.787237559569909e-06, 'epoch': 1.02} {'loss': 0.6083, 'learning_rate': 9.786910282252756e-06, 'epoch': 1.02} {'loss': 0.4756, 'learning_rate': 9.786583005163952e-06, 'epoch': 1.02} {'loss': 0.5824, 'learning_rate': 9.78625572830384e-06, 'epoch': 1.02} {'loss': 0.6228, 'learning_rate': 9.785928451672778e-06, 'epoch': 1.02} {'loss': 0.5832, 'learning_rate': 9.785601175271113e-06, 'epoch': 1.02} {'loss': 0.5513, 'learning_rate': 9.785273899099194e-06, 'epoch': 1.02} {'loss': 0.6391, 'learning_rate': 9.784946623157375e-06, 'epoch': 1.02} {'loss': 0.6294, 'learning_rate': 9.784619347446001e-06, 'epoch': 1.02} {'loss': 0.6856, 'learning_rate': 9.78429207196543e-06, 'epoch': 1.02} {'loss': 0.7057, 'learning_rate': 9.783964796716008e-06, 'epoch': 1.02} {'loss': 0.6815, 'learning_rate': 9.783637521698089e-06, 'epoch': 1.02} {'loss': 0.5287, 'learning_rate': 9.783310246912024e-06, 'epoch': 1.02} {'loss': 0.5165, 'learning_rate': 9.782982972358157e-06, 'epoch': 1.02} {'loss': 0.4686, 'learning_rate': 9.782655698036847e-06, 'epoch': 1.02} {'loss': 0.5871, 'learning_rate': 9.782328423948436e-06, 'epoch': 1.02} {'loss': 0.5933, 'learning_rate': 9.782001150093286e-06, 'epoch': 1.02} {'loss': 0.5869, 'learning_rate': 9.78167387647174e-06, 'epoch': 1.02} {'loss': 0.6885, 'learning_rate': 9.781346603084145e-06, 'epoch': 1.02} {'loss': 0.4995, 'learning_rate': 9.781019329930861e-06, 'epoch': 1.02} {'loss': 0.5827, 'learning_rate': 9.780692057012235e-06, 'epoch': 1.02} {'loss': 0.4854, 'learning_rate': 9.780364784328616e-06, 'epoch': 1.02} {'loss': 0.6227, 'learning_rate': 9.780037511880354e-06, 'epoch': 1.02} {'loss': 0.7869, 'learning_rate': 9.779710239667806e-06, 'epoch': 1.02} {'loss': 0.7085, 'learning_rate': 9.779382967691317e-06, 'epoch': 1.02} {'loss': 0.4981, 'learning_rate': 9.77905569595124e-06, 'epoch': 1.02} {'loss': 0.4796, 'learning_rate': 9.77872842444792e-06, 'epoch': 1.02} {'loss': 0.7835, 'learning_rate': 9.778401153181715e-06, 'epoch': 1.02} {'loss': 0.5735, 'learning_rate': 9.778073882152975e-06, 'epoch': 1.02} {'loss': 0.5528, 'learning_rate': 9.77774661136205e-06, 'epoch': 1.02} {'loss': 0.5979, 'learning_rate': 9.777419340809282e-06, 'epoch': 1.02} {'loss': 0.7129, 'learning_rate': 9.777092070495038e-06, 'epoch': 1.02} {'loss': 0.6817, 'learning_rate': 9.776764800419656e-06, 'epoch': 1.02} {'loss': 0.6943, 'learning_rate': 9.776437530583491e-06, 'epoch': 1.02} {'loss': 0.5077, 'learning_rate': 9.77611026098689e-06, 'epoch': 1.02} {'loss': 0.5449, 'learning_rate': 9.775782991630214e-06, 'epoch': 1.02} {'loss': 0.559, 'learning_rate': 9.775455722513803e-06, 'epoch': 1.02} {'loss': 0.6347, 'learning_rate': 9.77512845363801e-06, 'epoch': 1.02} {'loss': 0.6487, 'learning_rate': 9.77480118500319e-06, 'epoch': 1.02} {'loss': 0.5678, 'learning_rate': 9.77447391660969e-06, 'epoch': 1.02} {'loss': 0.6733, 'learning_rate': 9.774146648457861e-06, 'epoch': 1.02} {'loss': 0.5128, 'learning_rate': 9.773819380548052e-06, 'epoch': 1.02} {'loss': 0.5346, 'learning_rate': 9.77349211288062e-06, 'epoch': 1.02} {'loss': 0.5999, 'learning_rate': 9.773164845455912e-06, 'epoch': 1.02} {'loss': 0.5562, 'learning_rate': 9.772837578274274e-06, 'epoch': 1.02} {'loss': 0.5255, 'learning_rate': 9.772510311336064e-06, 'epoch': 1.02} {'loss': 0.6113, 'learning_rate': 9.77218304464163e-06, 'epoch': 1.02} {'loss': 0.5664, 'learning_rate': 9.771855778191323e-06, 'epoch': 1.02} {'loss': 0.5669, 'learning_rate': 9.771528511985493e-06, 'epoch': 1.02} {'loss': 0.5152, 'learning_rate': 9.771201246024487e-06, 'epoch': 1.02} {'loss': 0.6389, 'learning_rate': 9.770873980308663e-06, 'epoch': 1.02} {'loss': 0.4882, 'learning_rate': 9.770546714838363e-06, 'epoch': 1.02} {'loss': 0.6014, 'learning_rate': 9.77021944961395e-06, 'epoch': 1.02} {'loss': 0.4674, 'learning_rate': 9.769892184635765e-06, 'epoch': 1.02} {'loss': 0.6179, 'learning_rate': 9.769564919904163e-06, 'epoch': 1.02} {'loss': 0.5481, 'learning_rate': 9.769237655419491e-06, 'epoch': 1.02} {'loss': 0.59, 'learning_rate': 9.7689103911821e-06, 'epoch': 1.02} {'loss': 0.6829, 'learning_rate': 9.768583127192345e-06, 'epoch': 1.02} {'loss': 0.5605, 'learning_rate': 9.76825586345057e-06, 'epoch': 1.02} {'loss': 0.6729, 'learning_rate': 9.767928599957135e-06, 'epoch': 1.02} {'loss': 0.5626, 'learning_rate': 9.767601336712382e-06, 'epoch': 1.02} {'loss': 0.498, 'learning_rate': 9.767274073716669e-06, 'epoch': 1.02} {'loss': 0.6461, 'learning_rate': 9.766946810970342e-06, 'epoch': 1.02} {'loss': 0.5036, 'learning_rate': 9.766619548473746e-06, 'epoch': 1.02} {'loss': 0.5321, 'learning_rate': 9.766292286227246e-06, 'epoch': 1.02} {'loss': 0.5547, 'learning_rate': 9.765965024231179e-06, 'epoch': 1.02} {'loss': 0.7279, 'learning_rate': 9.765637762485906e-06, 'epoch': 1.02} {'loss': 0.4534, 'learning_rate': 9.765310500991774e-06, 'epoch': 1.02} {'loss': 0.5128, 'learning_rate': 9.764983239749129e-06, 'epoch': 1.02} {'loss': 0.6689, 'learning_rate': 9.76465597875833e-06, 'epoch': 1.02} {'loss': 0.4847, 'learning_rate': 9.764328718019718e-06, 'epoch': 1.02} {'loss': 0.5756, 'learning_rate': 9.764001457533653e-06, 'epoch': 1.02} {'loss': 0.4774, 'learning_rate': 9.763674197300477e-06, 'epoch': 1.02} {'loss': 0.677, 'learning_rate': 9.763346937320552e-06, 'epoch': 1.02} {'loss': 0.6134, 'learning_rate': 9.763019677594221e-06, 'epoch': 1.02} {'loss': 0.6423, 'learning_rate': 9.762692418121833e-06, 'epoch': 1.02} {'loss': 0.6025, 'learning_rate': 9.762365158903744e-06, 'epoch': 1.02} {'loss': 0.5565, 'learning_rate': 9.762037899940297e-06, 'epoch': 1.02} {'loss': 0.482, 'learning_rate': 9.761710641231853e-06, 'epoch': 1.02} {'loss': 0.5253, 'learning_rate': 9.761383382778754e-06, 'epoch': 1.02} {'loss': 0.4861, 'learning_rate': 9.761056124581359e-06, 'epoch': 1.02} {'loss': 0.6172, 'learning_rate': 9.760728866640013e-06, 'epoch': 1.02} {'loss': 0.6189, 'learning_rate': 9.760401608955064e-06, 'epoch': 1.02} {'loss': 0.6586, 'learning_rate': 9.76007435152687e-06, 'epoch': 1.02} {'loss': 0.481, 'learning_rate': 9.759747094355773e-06, 'epoch': 1.02} {'loss': 0.5746, 'learning_rate': 9.759419837442134e-06, 'epoch': 1.02} {'loss': 0.5927, 'learning_rate': 9.759092580786298e-06, 'epoch': 1.02} {'loss': 0.6004, 'learning_rate': 9.75876532438861e-06, 'epoch': 1.02} {'loss': 0.5222, 'learning_rate': 9.758438068249434e-06, 'epoch': 1.02} {'loss': 0.4561, 'learning_rate': 9.75811081236911e-06, 'epoch': 1.02} {'loss': 0.6393, 'learning_rate': 9.757783556747994e-06, 'epoch': 1.02} {'loss': 0.5417, 'learning_rate': 9.757456301386429e-06, 'epoch': 1.02} {'loss': 0.3894, 'learning_rate': 9.757129046284778e-06, 'epoch': 1.02} {'loss': 0.4944, 'learning_rate': 9.756801791443385e-06, 'epoch': 1.02} {'loss': 0.5527, 'learning_rate': 9.756474536862595e-06, 'epoch': 1.02} {'loss': 0.6602, 'learning_rate': 9.756147282542771e-06, 'epoch': 1.02} {'loss': 0.6519, 'learning_rate': 9.755820028484253e-06, 'epoch': 1.02} {'loss': 0.5647, 'learning_rate': 9.755492774687399e-06, 'epoch': 1.02} {'loss': 0.5924, 'learning_rate': 9.755165521152552e-06, 'epoch': 1.02} {'loss': 0.6354, 'learning_rate': 9.754838267880073e-06, 'epoch': 1.02} {'loss': 0.4313, 'learning_rate': 9.754511014870305e-06, 'epoch': 1.02} {'loss': 0.4884, 'learning_rate': 9.754183762123597e-06, 'epoch': 1.02} {'loss': 0.6298, 'learning_rate': 9.753856509640307e-06, 'epoch': 1.02} {'loss': 0.5552, 'learning_rate': 9.75352925742078e-06, 'epoch': 1.02} {'loss': 0.4589, 'learning_rate': 9.75320200546537e-06, 'epoch': 1.02} {'loss': 0.6701, 'learning_rate': 9.752874753774428e-06, 'epoch': 1.02} {'loss': 0.5934, 'learning_rate': 9.752547502348299e-06, 'epoch': 1.02} {'loss': 0.6221, 'learning_rate': 9.75222025118734e-06, 'epoch': 1.02} {'loss': 0.5309, 'learning_rate': 9.7518930002919e-06, 'epoch': 1.02} {'loss': 0.6489, 'learning_rate': 9.751565749662328e-06, 'epoch': 1.02} {'loss': 0.5022, 'learning_rate': 9.751238499298973e-06, 'epoch': 1.02} {'loss': 0.5446, 'learning_rate': 9.750911249202192e-06, 'epoch': 1.02} {'loss': 0.6608, 'learning_rate': 9.750583999372334e-06, 'epoch': 1.02} {'loss': 0.5005, 'learning_rate': 9.750256749809742e-06, 'epoch': 1.02} {'loss': 0.5965, 'learning_rate': 9.749929500514776e-06, 'epoch': 1.02} {'loss': 0.6627, 'learning_rate': 9.749602251487781e-06, 'epoch': 1.02} {'loss': 0.5147, 'learning_rate': 9.749275002729115e-06, 'epoch': 1.02} {'loss': 0.4978, 'learning_rate': 9.74894775423912e-06, 'epoch': 1.02} {'loss': 0.5509, 'learning_rate': 9.748620506018147e-06, 'epoch': 1.02} {'loss': 0.4373, 'learning_rate': 9.748293258066555e-06, 'epoch': 1.02} {'loss': 0.6403, 'learning_rate': 9.747966010384684e-06, 'epoch': 1.02} {'loss': 0.474, 'learning_rate': 9.747638762972895e-06, 'epoch': 1.02} {'loss': 0.614, 'learning_rate': 9.74731151583153e-06, 'epoch': 1.02} {'loss': 0.5198, 'learning_rate': 9.746984268960948e-06, 'epoch': 1.02} {'loss': 0.647, 'learning_rate': 9.746657022361495e-06, 'epoch': 1.02} {'loss': 0.5905, 'learning_rate': 9.746329776033517e-06, 'epoch': 1.02} {'loss': 0.5829, 'learning_rate': 9.746002529977375e-06, 'epoch': 1.02} {'loss': 0.4206, 'learning_rate': 9.745675284193408e-06, 'epoch': 1.02} {'loss': 0.5882, 'learning_rate': 9.745348038681978e-06, 'epoch': 1.02} {'loss': 0.4208, 'learning_rate': 9.745020793443428e-06, 'epoch': 1.02} {'loss': 0.6121, 'learning_rate': 9.744693548478114e-06, 'epoch': 1.02} {'loss': 0.4916, 'learning_rate': 9.744366303786384e-06, 'epoch': 1.02} {'loss': 0.5867, 'learning_rate': 9.744039059368584e-06, 'epoch': 1.02} {'loss': 0.5287, 'learning_rate': 9.743711815225072e-06, 'epoch': 1.02} {'loss': 0.5566, 'learning_rate': 9.743384571356193e-06, 'epoch': 1.02} {'loss': 0.566, 'learning_rate': 9.743057327762305e-06, 'epoch': 1.02} {'loss': 0.4968, 'learning_rate': 9.742730084443755e-06, 'epoch': 1.02} {'loss': 0.4749, 'learning_rate': 9.74240284140089e-06, 'epoch': 1.02} {'loss': 0.6114, 'learning_rate': 9.742075598634065e-06, 'epoch': 1.02} {'loss': 0.5418, 'learning_rate': 9.741748356143627e-06, 'epoch': 1.02} {'loss': 0.5967, 'learning_rate': 9.741421113929931e-06, 'epoch': 1.02} {'loss': 0.6153, 'learning_rate': 9.741093871993322e-06, 'epoch': 1.02} {'loss': 0.4879, 'learning_rate': 9.740766630334159e-06, 'epoch': 1.02} {'loss': 0.557, 'learning_rate': 9.740439388952789e-06, 'epoch': 1.02} {'loss': 0.6184, 'learning_rate': 9.740112147849558e-06, 'epoch': 1.02} {'loss': 0.5035, 'learning_rate': 9.739784907024822e-06, 'epoch': 1.02} {'loss': 0.5421, 'learning_rate': 9.739457666478926e-06, 'epoch': 1.02} {'loss': 0.515, 'learning_rate': 9.73913042621223e-06, 'epoch': 1.02} {'loss': 0.5311, 'learning_rate': 9.738803186225075e-06, 'epoch': 1.02} {'loss': 0.5274, 'learning_rate': 9.738475946517819e-06, 'epoch': 1.02} {'loss': 0.6295, 'learning_rate': 9.73814870709081e-06, 'epoch': 1.02} {'loss': 0.5012, 'learning_rate': 9.737821467944396e-06, 'epoch': 1.02} {'loss': 0.4727, 'learning_rate': 9.737494229078934e-06, 'epoch': 1.02} {'loss': 0.5411, 'learning_rate': 9.737166990494764e-06, 'epoch': 1.02} {'loss': 0.6763, 'learning_rate': 9.736839752192248e-06, 'epoch': 1.02} {'loss': 0.6413, 'learning_rate': 9.736512514171732e-06, 'epoch': 1.02} {'loss': 0.6261, 'learning_rate': 9.736185276433564e-06, 'epoch': 1.02} {'loss': 0.5984, 'learning_rate': 9.7358580389781e-06, 'epoch': 1.02} {'loss': 0.5127, 'learning_rate': 9.735530801805685e-06, 'epoch': 1.02} {'loss': 0.5755, 'learning_rate': 9.735203564916677e-06, 'epoch': 1.02} {'loss': 0.5421, 'learning_rate': 9.734876328311415e-06, 'epoch': 1.02} {'loss': 0.7035, 'learning_rate': 9.734549091990264e-06, 'epoch': 1.02} {'loss': 0.5643, 'learning_rate': 9.734221855953568e-06, 'epoch': 1.02} {'loss': 0.6335, 'learning_rate': 9.73389462020167e-06, 'epoch': 1.02} {'loss': 0.5179, 'learning_rate': 9.733567384734934e-06, 'epoch': 1.02} {'loss': 0.6308, 'learning_rate': 9.733240149553702e-06, 'epoch': 1.02} {'loss': 0.5553, 'learning_rate': 9.73291291465833e-06, 'epoch': 1.02} {'loss': 0.5024, 'learning_rate': 9.732585680049161e-06, 'epoch': 1.02} {'loss': 0.5596, 'learning_rate': 9.732258445726555e-06, 'epoch': 1.02} {'loss': 0.5861, 'learning_rate': 9.73193121169086e-06, 'epoch': 1.02} {'loss': 0.5892, 'learning_rate': 9.731603977942418e-06, 'epoch': 1.02} {'loss': 0.665, 'learning_rate': 9.731276744481593e-06, 'epoch': 1.02} {'loss': 0.6348, 'learning_rate': 9.730949511308726e-06, 'epoch': 1.02} {'loss': 0.6642, 'learning_rate': 9.730622278424171e-06, 'epoch': 1.02} {'loss': 0.576, 'learning_rate': 9.730295045828283e-06, 'epoch': 1.02} {'loss': 0.4799, 'learning_rate': 9.7299678135214e-06, 'epoch': 1.02} {'loss': 0.4381, 'learning_rate': 9.729640581503887e-06, 'epoch': 1.02} {'loss': 0.6209, 'learning_rate': 9.729313349776085e-06, 'epoch': 1.02} {'loss': 0.712, 'learning_rate': 9.72898611833835e-06, 'epoch': 1.02} {'loss': 0.6882, 'learning_rate': 9.728658887191029e-06, 'epoch': 1.02} {'loss': 0.5, 'learning_rate': 9.728331656334478e-06, 'epoch': 1.02} {'loss': 0.6225, 'learning_rate': 9.728004425769044e-06, 'epoch': 1.02} {'loss': 0.6091, 'learning_rate': 9.727677195495073e-06, 'epoch': 1.02} {'loss': 0.5109, 'learning_rate': 9.727349965512926e-06, 'epoch': 1.02} {'loss': 0.4925, 'learning_rate': 9.727022735822944e-06, 'epoch': 1.02} {'loss': 0.5043, 'learning_rate': 9.726695506425486e-06, 'epoch': 1.02} {'loss': 0.4848, 'learning_rate': 9.726368277320892e-06, 'epoch': 1.02} {'loss': 0.4913, 'learning_rate': 9.726041048509525e-06, 'epoch': 1.02} {'loss': 0.6355, 'learning_rate': 9.725713819991728e-06, 'epoch': 1.02} {'loss': 0.6158, 'learning_rate': 9.725386591767851e-06, 'epoch': 1.02} {'loss': 0.6235, 'learning_rate': 9.725059363838251e-06, 'epoch': 1.02} {'loss': 0.4744, 'learning_rate': 9.724732136203272e-06, 'epoch': 1.02} {'loss': 0.5645, 'learning_rate': 9.72440490886327e-06, 'epoch': 1.02} {'loss': 0.5545, 'learning_rate': 9.72407768181859e-06, 'epoch': 1.02} {'loss': 0.533, 'learning_rate': 9.723750455069587e-06, 'epoch': 1.02} {'loss': 0.5814, 'learning_rate': 9.723423228616612e-06, 'epoch': 1.02} {'loss': 0.604, 'learning_rate': 9.723096002460008e-06, 'epoch': 1.02} {'loss': 0.6972, 'learning_rate': 9.722768776600137e-06, 'epoch': 1.02} {'loss': 0.5657, 'learning_rate': 9.722441551037344e-06, 'epoch': 1.02} {'loss': 0.5228, 'learning_rate': 9.72211432577198e-06, 'epoch': 1.02} {'loss': 0.6416, 'learning_rate': 9.721787100804397e-06, 'epoch': 1.02} {'loss': 0.6378, 'learning_rate': 9.721459876134939e-06, 'epoch': 1.02} {'loss': 0.6359, 'learning_rate': 9.721132651763965e-06, 'epoch': 1.02} {'loss': 0.6514, 'learning_rate': 9.72080542769182e-06, 'epoch': 1.02} {'loss': 0.6808, 'learning_rate': 9.72047820391886e-06, 'epoch': 1.02} {'loss': 0.4233, 'learning_rate': 9.720150980445434e-06, 'epoch': 1.02} {'loss': 0.5267, 'learning_rate': 9.71982375727189e-06, 'epoch': 1.02} {'loss': 0.5377, 'learning_rate': 9.719496534398582e-06, 'epoch': 1.02} {'loss': 0.6315, 'learning_rate': 9.719169311825854e-06, 'epoch': 1.02} {'loss': 0.6122, 'learning_rate': 9.718842089554065e-06, 'epoch': 1.02} {'loss': 0.505, 'learning_rate': 9.718514867583559e-06, 'epoch': 1.02} {'loss': 0.5291, 'learning_rate': 9.718187645914693e-06, 'epoch': 1.02} {'loss': 0.5545, 'learning_rate': 9.717860424547814e-06, 'epoch': 1.02} {'loss': 0.5433, 'learning_rate': 9.717533203483272e-06, 'epoch': 1.02} {'loss': 0.7134, 'learning_rate': 9.717205982721421e-06, 'epoch': 1.02} {'loss': 0.6541, 'learning_rate': 9.716878762262603e-06, 'epoch': 1.02} {'loss': 0.5102, 'learning_rate': 9.71655154210718e-06, 'epoch': 1.02} {'loss': 0.6245, 'learning_rate': 9.716224322255495e-06, 'epoch': 1.02} {'loss': 0.6205, 'learning_rate': 9.715897102707905e-06, 'epoch': 1.02} {'loss': 0.4925, 'learning_rate': 9.715569883464757e-06, 'epoch': 1.02} {'loss': 0.5711, 'learning_rate': 9.715242664526398e-06, 'epoch': 1.02} {'loss': 0.7865, 'learning_rate': 9.714915445893185e-06, 'epoch': 1.02} {'loss': 0.4742, 'learning_rate': 9.714588227565463e-06, 'epoch': 1.02} {'loss': 0.625, 'learning_rate': 9.714261009543587e-06, 'epoch': 1.02} {'loss': 0.5013, 'learning_rate': 9.71393379182791e-06, 'epoch': 1.02} {'loss': 0.5212, 'learning_rate': 9.71360657441877e-06, 'epoch': 1.02} {'loss': 0.6426, 'learning_rate': 9.713279357316532e-06, 'epoch': 1.02} {'loss': 0.5067, 'learning_rate': 9.712952140521542e-06, 'epoch': 1.02} {'loss': 0.6314, 'learning_rate': 9.71262492403415e-06, 'epoch': 1.02} {'loss': 0.6319, 'learning_rate': 9.712297707854699e-06, 'epoch': 1.02} {'loss': 0.5836, 'learning_rate': 9.711970491983555e-06, 'epoch': 1.02} {'loss': 0.5647, 'learning_rate': 9.71164327642106e-06, 'epoch': 1.02} {'loss': 0.546, 'learning_rate': 9.71131606116756e-06, 'epoch': 1.02} {'loss': 0.5471, 'learning_rate': 9.710988846223415e-06, 'epoch': 1.02} {'loss': 0.4362, 'learning_rate': 9.71066163158897e-06, 'epoch': 1.02} {'loss': 0.5088, 'learning_rate': 9.71033441726458e-06, 'epoch': 1.02} {'loss': 0.4493, 'learning_rate': 9.710007203250588e-06, 'epoch': 1.02} {'loss': 0.5199, 'learning_rate': 9.709679989547354e-06, 'epoch': 1.02} {'loss': 0.5541, 'learning_rate': 9.709352776155223e-06, 'epoch': 1.02} {'loss': 0.5086, 'learning_rate': 9.709025563074543e-06, 'epoch': 1.02} {'loss': 0.5399, 'learning_rate': 9.708698350305673e-06, 'epoch': 1.02} {'loss': 0.6685, 'learning_rate': 9.708371137848956e-06, 'epoch': 1.02} {'loss': 0.3774, 'learning_rate': 9.70804392570475e-06, 'epoch': 1.02} {'loss': 0.5454, 'learning_rate': 9.707716713873399e-06, 'epoch': 1.02} {'loss': 0.4761, 'learning_rate': 9.707389502355252e-06, 'epoch': 1.02} {'loss': 0.5101, 'learning_rate': 9.707062291150669e-06, 'epoch': 1.02} {'loss': 0.5614, 'learning_rate': 9.706735080259989e-06, 'epoch': 1.02} {'loss': 0.591, 'learning_rate': 9.706407869683574e-06, 'epoch': 1.02} {'loss': 0.4086, 'learning_rate': 9.706080659421769e-06, 'epoch': 1.02} {'loss': 0.5473, 'learning_rate': 9.705753449474926e-06, 'epoch': 1.02} {'loss': 0.6537, 'learning_rate': 9.705426239843393e-06, 'epoch': 1.02} {'loss': 0.5801, 'learning_rate': 9.70509903052752e-06, 'epoch': 1.02} {'loss': 0.6769, 'learning_rate': 9.704771821527665e-06, 'epoch': 1.02} {'loss': 0.6876, 'learning_rate': 9.704444612844167e-06, 'epoch': 1.02} {'loss': 0.6066, 'learning_rate': 9.70411740447739e-06, 'epoch': 1.02} {'loss': 0.4931, 'learning_rate': 9.703790196427673e-06, 'epoch': 1.02} {'loss': 0.6165, 'learning_rate': 9.703462988695376e-06, 'epoch': 1.02} {'loss': 0.4562, 'learning_rate': 9.703135781280845e-06, 'epoch': 1.02} {'loss': 0.5962, 'learning_rate': 9.702808574184424e-06, 'epoch': 1.02} {'loss': 0.6868, 'learning_rate': 9.702481367406477e-06, 'epoch': 1.02} {'loss': 0.6168, 'learning_rate': 9.702154160947347e-06, 'epoch': 1.02} {'loss': 0.6315, 'learning_rate': 9.701826954807384e-06, 'epoch': 1.02} {'loss': 0.4619, 'learning_rate': 9.701499748986943e-06, 'epoch': 1.02} {'loss': 0.4615, 'learning_rate': 9.70117254348637e-06, 'epoch': 1.02} {'loss': 0.4454, 'learning_rate': 9.700845338306018e-06, 'epoch': 1.02} {'loss': 0.6446, 'learning_rate': 9.700518133446235e-06, 'epoch': 1.02} {'loss': 0.4882, 'learning_rate': 9.700190928907377e-06, 'epoch': 1.02} {'loss': 0.6635, 'learning_rate': 9.699863724689789e-06, 'epoch': 1.02} {'loss': 0.4739, 'learning_rate': 9.699536520793828e-06, 'epoch': 1.02} {'loss': 0.4766, 'learning_rate': 9.699209317219837e-06, 'epoch': 1.02} {'loss': 0.4476, 'learning_rate': 9.698882113968172e-06, 'epoch': 1.02} {'loss': 0.5613, 'learning_rate': 9.698554911039181e-06, 'epoch': 1.02} {'loss': 0.4774, 'learning_rate': 9.698227708433214e-06, 'epoch': 1.02} {'loss': 0.5869, 'learning_rate': 9.697900506150627e-06, 'epoch': 1.02} {'loss': 0.5974, 'learning_rate': 9.697573304191766e-06, 'epoch': 1.02} {'loss': 0.6505, 'learning_rate': 9.697246102556982e-06, 'epoch': 1.02} {'loss': 0.5097, 'learning_rate': 9.696918901246628e-06, 'epoch': 1.02} {'loss': 0.6718, 'learning_rate': 9.696591700261048e-06, 'epoch': 1.02} {'loss': 0.5032, 'learning_rate': 9.696264499600602e-06, 'epoch': 1.02} {'loss': 0.49, 'learning_rate': 9.69593729926563e-06, 'epoch': 1.02} {'loss': 0.525, 'learning_rate': 9.695610099256495e-06, 'epoch': 1.02} {'loss': 0.5813, 'learning_rate': 9.69528289957354e-06, 'epoch': 1.02} {'loss': 0.5941, 'learning_rate': 9.694955700217116e-06, 'epoch': 1.02} {'loss': 0.5686, 'learning_rate': 9.694628501187576e-06, 'epoch': 1.02} {'loss': 0.4862, 'learning_rate': 9.694301302485265e-06, 'epoch': 1.02} {'loss': 0.6599, 'learning_rate': 9.69397410411054e-06, 'epoch': 1.02} {'loss': 0.5559, 'learning_rate': 9.693646906063748e-06, 'epoch': 1.02} {'loss': 0.6835, 'learning_rate': 9.693319708345244e-06, 'epoch': 1.02} {'loss': 0.5629, 'learning_rate': 9.692992510955375e-06, 'epoch': 1.02} {'loss': 0.5711, 'learning_rate': 9.69266531389449e-06, 'epoch': 1.02} {'loss': 0.5335, 'learning_rate': 9.692338117162947e-06, 'epoch': 1.02} {'loss': 0.7256, 'learning_rate': 9.692010920761084e-06, 'epoch': 1.02} {'loss': 0.6289, 'learning_rate': 9.691683724689264e-06, 'epoch': 1.02} {'loss': 0.4922, 'learning_rate': 9.691356528947833e-06, 'epoch': 1.02} {'loss': 0.6205, 'learning_rate': 9.691029333537138e-06, 'epoch': 1.02} {'loss': 0.6629, 'learning_rate': 9.690702138457534e-06, 'epoch': 1.02} {'loss': 0.4135, 'learning_rate': 9.690374943709371e-06, 'epoch': 1.02} {'loss': 0.5242, 'learning_rate': 9.690047749293003e-06, 'epoch': 1.02} {'loss': 0.5833, 'learning_rate': 9.68972055520877e-06, 'epoch': 1.02} {'loss': 0.4318, 'learning_rate': 9.689393361457034e-06, 'epoch': 1.02} {'loss': 0.5394, 'learning_rate': 9.689066168038142e-06, 'epoch': 1.02} {'loss': 0.6278, 'learning_rate': 9.688738974952439e-06, 'epoch': 1.02} {'loss': 0.6561, 'learning_rate': 9.688411782200284e-06, 'epoch': 1.02} {'loss': 0.6209, 'learning_rate': 9.688084589782022e-06, 'epoch': 1.02} {'loss': 0.4036, 'learning_rate': 9.687757397698008e-06, 'epoch': 1.02} {'loss': 0.4431, 'learning_rate': 9.687430205948585e-06, 'epoch': 1.02} {'loss': 0.5878, 'learning_rate': 9.687103014534114e-06, 'epoch': 1.02} {'loss': 0.5276, 'learning_rate': 9.68677582345494e-06, 'epoch': 1.02} {'loss': 0.5814, 'learning_rate': 9.68644863271141e-06, 'epoch': 1.02} {'loss': 0.614, 'learning_rate': 9.686121442303882e-06, 'epoch': 1.02} {'loss': 0.5893, 'learning_rate': 9.685794252232702e-06, 'epoch': 1.02} {'loss': 0.6346, 'learning_rate': 9.685467062498223e-06, 'epoch': 1.02} {'loss': 0.5791, 'learning_rate': 9.685139873100794e-06, 'epoch': 1.02} {'loss': 0.5439, 'learning_rate': 9.684812684040764e-06, 'epoch': 1.02} {'loss': 0.5547, 'learning_rate': 9.684485495318488e-06, 'epoch': 1.02} {'loss': 0.6478, 'learning_rate': 9.684158306934311e-06, 'epoch': 1.02} {'loss': 0.6542, 'learning_rate': 9.683831118888591e-06, 'epoch': 1.02} {'loss': 0.6123, 'learning_rate': 9.683503931181672e-06, 'epoch': 1.02} {'loss': 0.4496, 'learning_rate': 9.68317674381391e-06, 'epoch': 1.02} {'loss': 0.5237, 'learning_rate': 9.682849556785651e-06, 'epoch': 1.02} {'loss': 0.5214, 'learning_rate': 9.682522370097244e-06, 'epoch': 1.02} {'loss': 0.5344, 'learning_rate': 9.682195183749048e-06, 'epoch': 1.02} {'loss': 0.6503, 'learning_rate': 9.681867997741404e-06, 'epoch': 1.02} {'loss': 0.6349, 'learning_rate': 9.68154081207467e-06, 'epoch': 1.02} {'loss': 0.5788, 'learning_rate': 9.681213626749194e-06, 'epoch': 1.02} {'loss': 0.5363, 'learning_rate': 9.680886441765327e-06, 'epoch': 1.02} {'loss': 0.5931, 'learning_rate': 9.68055925712342e-06, 'epoch': 1.02} {'loss': 0.4493, 'learning_rate': 9.680232072823817e-06, 'epoch': 1.02} {'loss': 0.6023, 'learning_rate': 9.679904888866879e-06, 'epoch': 1.02} {'loss': 0.6025, 'learning_rate': 9.679577705252947e-06, 'epoch': 1.02} {'loss': 0.6778, 'learning_rate': 9.679250521982382e-06, 'epoch': 1.02} {'loss': 0.6265, 'learning_rate': 9.678923339055528e-06, 'epoch': 1.02} {'loss': 0.5374, 'learning_rate': 9.678596156472735e-06, 'epoch': 1.02} {'loss': 0.3795, 'learning_rate': 9.678268974234358e-06, 'epoch': 1.02} {'loss': 0.5421, 'learning_rate': 9.677941792340738e-06, 'epoch': 1.02} {'loss': 0.6049, 'learning_rate': 9.677614610792238e-06, 'epoch': 1.02} {'loss': 0.5563, 'learning_rate': 9.677287429589201e-06, 'epoch': 1.02} {'loss': 0.6344, 'learning_rate': 9.67696024873198e-06, 'epoch': 1.02} {'loss': 0.5204, 'learning_rate': 9.676633068220928e-06, 'epoch': 1.02} {'loss': 0.5669, 'learning_rate': 9.67630588805639e-06, 'epoch': 1.02} {'loss': 0.5573, 'learning_rate': 9.675978708238721e-06, 'epoch': 1.02} {'loss': 0.724, 'learning_rate': 9.675651528768268e-06, 'epoch': 1.02} {'loss': 0.5652, 'learning_rate': 9.675324349645385e-06, 'epoch': 1.02} {'loss': 0.5039, 'learning_rate': 9.67499717087042e-06, 'epoch': 1.02} {'loss': 0.5872, 'learning_rate': 9.674669992443728e-06, 'epoch': 1.02} {'loss': 0.6003, 'learning_rate': 9.674342814365654e-06, 'epoch': 1.02} {'loss': 0.5808, 'learning_rate': 9.674015636636552e-06, 'epoch': 1.02} {'loss': 0.5286, 'learning_rate': 9.673688459256772e-06, 'epoch': 1.02} {'loss': 0.6804, 'learning_rate': 9.67336128222666e-06, 'epoch': 1.02} {'loss': 0.5436, 'learning_rate': 9.673034105546577e-06, 'epoch': 1.02} {'loss': 0.5287, 'learning_rate': 9.672706929216866e-06, 'epoch': 1.02} {'loss': 0.5641, 'learning_rate': 9.672379753237875e-06, 'epoch': 1.02} {'loss': 0.5079, 'learning_rate': 9.672052577609963e-06, 'epoch': 1.02} {'loss': 0.3801, 'learning_rate': 9.671725402333473e-06, 'epoch': 1.02} {'loss': 0.5476, 'learning_rate': 9.671398227408763e-06, 'epoch': 1.02} {'loss': 0.4708, 'learning_rate': 9.671071052836174e-06, 'epoch': 1.02} {'loss': 0.6424, 'learning_rate': 9.670743878616066e-06, 'epoch': 1.02} {'loss': 0.6499, 'learning_rate': 9.670416704748787e-06, 'epoch': 1.02} {'loss': 0.5817, 'learning_rate': 9.670089531234683e-06, 'epoch': 1.02} {'loss': 0.5284, 'learning_rate': 9.669762358074111e-06, 'epoch': 1.02} {'loss': 0.4955, 'learning_rate': 9.669435185267414e-06, 'epoch': 1.02} {'loss': 0.5293, 'learning_rate': 9.66910801281495e-06, 'epoch': 1.02} {'loss': 0.4006, 'learning_rate': 9.668780840717063e-06, 'epoch': 1.02} {'loss': 0.4705, 'learning_rate': 9.668453668974112e-06, 'epoch': 1.02} {'loss': 0.6258, 'learning_rate': 9.668126497586441e-06, 'epoch': 1.02} {'loss': 0.4073, 'learning_rate': 9.667799326554403e-06, 'epoch': 1.02} {'loss': 0.5531, 'learning_rate': 9.667472155878349e-06, 'epoch': 1.02} {'loss': 0.4146, 'learning_rate': 9.667144985558624e-06, 'epoch': 1.02} {'loss': 0.5115, 'learning_rate': 9.666817815595587e-06, 'epoch': 1.02} {'loss': 0.7059, 'learning_rate': 9.666490645989586e-06, 'epoch': 1.02} {'loss': 0.6227, 'learning_rate': 9.666163476740966e-06, 'epoch': 1.02} {'loss': 0.465, 'learning_rate': 9.665836307850084e-06, 'epoch': 1.02} {'loss': 0.6375, 'learning_rate': 9.66550913931729e-06, 'epoch': 1.02} {'loss': 0.5647, 'learning_rate': 9.665181971142934e-06, 'epoch': 1.02} {'loss': 0.6618, 'learning_rate': 9.66485480332736e-06, 'epoch': 1.02} {'loss': 0.5283, 'learning_rate': 9.66452763587093e-06, 'epoch': 1.02} {'loss': 0.6773, 'learning_rate': 9.664200468773988e-06, 'epoch': 1.02} {'loss': 0.6108, 'learning_rate': 9.66387330203688e-06, 'epoch': 1.02} {'loss': 0.5606, 'learning_rate': 9.663546135659971e-06, 'epoch': 1.02} {'loss': 0.6127, 'learning_rate': 9.663218969643596e-06, 'epoch': 1.02} {'loss': 0.5462, 'learning_rate': 9.662891803988118e-06, 'epoch': 1.02} {'loss': 0.668, 'learning_rate': 9.662564638693879e-06, 'epoch': 1.02} {'loss': 0.5164, 'learning_rate': 9.66223747376123e-06, 'epoch': 1.02} {'loss': 0.4743, 'learning_rate': 9.661910309190526e-06, 'epoch': 1.02} {'loss': 0.5918, 'learning_rate': 9.661583144982112e-06, 'epoch': 1.02} {'loss': 0.5257, 'learning_rate': 9.661255981136349e-06, 'epoch': 1.02} {'loss': 0.5391, 'learning_rate': 9.660928817653575e-06, 'epoch': 1.02} {'loss': 0.6518, 'learning_rate': 9.66060165453415e-06, 'epoch': 1.02} {'loss': 0.6802, 'learning_rate': 9.660274491778424e-06, 'epoch': 1.02} {'loss': 0.3978, 'learning_rate': 9.659947329386736e-06, 'epoch': 1.02} {'loss': 0.5622, 'learning_rate': 9.659620167359451e-06, 'epoch': 1.02} {'loss': 0.5283, 'learning_rate': 9.65929300569691e-06, 'epoch': 1.02} {'loss': 0.7031, 'learning_rate': 9.65896584439947e-06, 'epoch': 1.02} {'loss': 0.519, 'learning_rate': 9.658638683467478e-06, 'epoch': 1.02} {'loss': 0.5146, 'learning_rate': 9.658311522901288e-06, 'epoch': 1.02} {'loss': 0.5403, 'learning_rate': 9.657984362701247e-06, 'epoch': 1.02} {'loss': 0.6215, 'learning_rate': 9.657657202867703e-06, 'epoch': 1.02} {'loss': 0.547, 'learning_rate': 9.657330043401015e-06, 'epoch': 1.02} {'loss': 0.6586, 'learning_rate': 9.657002884301522e-06, 'epoch': 1.02} {'loss': 0.5035, 'learning_rate': 9.656675725569588e-06, 'epoch': 1.02} {'loss': 0.6569, 'learning_rate': 9.656348567205556e-06, 'epoch': 1.02} {'loss': 0.5473, 'learning_rate': 9.656021409209777e-06, 'epoch': 1.02} {'loss': 0.5976, 'learning_rate': 9.655694251582602e-06, 'epoch': 1.02} {'loss': 0.7091, 'learning_rate': 9.655367094324378e-06, 'epoch': 1.02} {'loss': 0.587, 'learning_rate': 9.655039937435464e-06, 'epoch': 1.03} {'loss': 0.7108, 'learning_rate': 9.654712780916202e-06, 'epoch': 1.03} {'loss': 0.4873, 'learning_rate': 9.65438562476695e-06, 'epoch': 1.03} {'loss': 0.4614, 'learning_rate': 9.654058468988056e-06, 'epoch': 1.03} {'loss': 0.5705, 'learning_rate': 9.653731313579866e-06, 'epoch': 1.03} {'loss': 0.5208, 'learning_rate': 9.653404158542737e-06, 'epoch': 1.03} {'loss': 0.5606, 'learning_rate': 9.653077003877012e-06, 'epoch': 1.03} {'loss': 0.4617, 'learning_rate': 9.65274984958305e-06, 'epoch': 1.03} {'loss': 0.5352, 'learning_rate': 9.652422695661198e-06, 'epoch': 1.03} {'loss': 0.5044, 'learning_rate': 9.652095542111805e-06, 'epoch': 1.03} {'loss': 0.4402, 'learning_rate': 9.651768388935226e-06, 'epoch': 1.03} {'loss': 0.4253, 'learning_rate': 9.651441236131804e-06, 'epoch': 1.03} {'loss': 0.5597, 'learning_rate': 9.651114083701898e-06, 'epoch': 1.03} {'loss': 0.5663, 'learning_rate': 9.650786931645851e-06, 'epoch': 1.03} {'loss': 0.6236, 'learning_rate': 9.650459779964021e-06, 'epoch': 1.03} {'loss': 0.6939, 'learning_rate': 9.650132628656756e-06, 'epoch': 1.03} {'loss': 0.5639, 'learning_rate': 9.649805477724403e-06, 'epoch': 1.03} {'loss': 0.6482, 'learning_rate': 9.649478327167314e-06, 'epoch': 1.03} {'loss': 0.5375, 'learning_rate': 9.64915117698584e-06, 'epoch': 1.03} {'loss': 0.6945, 'learning_rate': 9.648824027180336e-06, 'epoch': 1.03} {'loss': 0.5934, 'learning_rate': 9.648496877751144e-06, 'epoch': 1.03} {'loss': 0.59, 'learning_rate': 9.648169728698621e-06, 'epoch': 1.03} {'loss': 0.8122, 'learning_rate': 9.64784258002312e-06, 'epoch': 1.03} {'loss': 0.6169, 'learning_rate': 9.647515431724983e-06, 'epoch': 1.03} {'loss': 0.7467, 'learning_rate': 9.647188283804567e-06, 'epoch': 1.03} {'loss': 0.5432, 'learning_rate': 9.646861136262218e-06, 'epoch': 1.03} {'loss': 0.6031, 'learning_rate': 9.646533989098292e-06, 'epoch': 1.03} {'loss': 0.6651, 'learning_rate': 9.646206842313135e-06, 'epoch': 1.03} {'loss': 0.6012, 'learning_rate': 9.6458796959071e-06, 'epoch': 1.03} {'loss': 0.7106, 'learning_rate': 9.645552549880538e-06, 'epoch': 1.03} {'loss': 0.4411, 'learning_rate': 9.645225404233798e-06, 'epoch': 1.03} {'loss': 0.6355, 'learning_rate': 9.644898258967231e-06, 'epoch': 1.03} {'loss': 0.3979, 'learning_rate': 9.644571114081186e-06, 'epoch': 1.03} {'loss': 0.4731, 'learning_rate': 9.644243969576017e-06, 'epoch': 1.03} {'loss': 0.6134, 'learning_rate': 9.643916825452072e-06, 'epoch': 1.03} {'loss': 0.5512, 'learning_rate': 9.643589681709699e-06, 'epoch': 1.03} {'loss': 0.5026, 'learning_rate': 9.643262538349256e-06, 'epoch': 1.03} {'loss': 0.5478, 'learning_rate': 9.642935395371088e-06, 'epoch': 1.03} {'loss': 0.6296, 'learning_rate': 9.64260825277555e-06, 'epoch': 1.03} {'loss': 0.596, 'learning_rate': 9.642281110562982e-06, 'epoch': 1.03} {'loss': 0.67, 'learning_rate': 9.64195396873375e-06, 'epoch': 1.03} {'loss': 0.63, 'learning_rate': 9.641626827288195e-06, 'epoch': 1.03} {'loss': 0.5191, 'learning_rate': 9.641299686226664e-06, 'epoch': 1.03} {'loss': 0.4625, 'learning_rate': 9.640972545549518e-06, 'epoch': 1.03} {'loss': 0.5812, 'learning_rate': 9.6406454052571e-06, 'epoch': 1.03} {'loss': 0.4885, 'learning_rate': 9.640318265349765e-06, 'epoch': 1.03} {'loss': 0.5384, 'learning_rate': 9.639991125827857e-06, 'epoch': 1.03} {'loss': 0.5977, 'learning_rate': 9.639663986691735e-06, 'epoch': 1.03} {'loss': 0.6564, 'learning_rate': 9.639336847941747e-06, 'epoch': 1.03} {'loss': 0.4304, 'learning_rate': 9.639009709578236e-06, 'epoch': 1.03} {'loss': 0.3988, 'learning_rate': 9.638682571601564e-06, 'epoch': 1.03} {'loss': 0.5184, 'learning_rate': 9.638355434012075e-06, 'epoch': 1.03} {'loss': 0.6163, 'learning_rate': 9.638028296810121e-06, 'epoch': 1.03} {'loss': 0.4883, 'learning_rate': 9.637701159996054e-06, 'epoch': 1.03} {'loss': 0.516, 'learning_rate': 9.637374023570217e-06, 'epoch': 1.03} {'loss': 0.5828, 'learning_rate': 9.63704688753297e-06, 'epoch': 1.03} {'loss': 0.6062, 'learning_rate': 9.63671975188466e-06, 'epoch': 1.03} {'loss': 0.6201, 'learning_rate': 9.636392616625638e-06, 'epoch': 1.03} {'loss': 0.4903, 'learning_rate': 9.636065481756253e-06, 'epoch': 1.03} {'loss': 0.6361, 'learning_rate': 9.63573834727686e-06, 'epoch': 1.03} {'loss': 0.7032, 'learning_rate': 9.635411213187806e-06, 'epoch': 1.03} {'loss': 0.5038, 'learning_rate': 9.635084079489436e-06, 'epoch': 1.03} {'loss': 0.5604, 'learning_rate': 9.63475694618211e-06, 'epoch': 1.03} {'loss': 0.5081, 'learning_rate': 9.634429813266173e-06, 'epoch': 1.03} {'loss': 0.6493, 'learning_rate': 9.63410268074198e-06, 'epoch': 1.03} {'loss': 0.5454, 'learning_rate': 9.633775548609878e-06, 'epoch': 1.03} {'loss': 0.5379, 'learning_rate': 9.63344841687022e-06, 'epoch': 1.03} {'loss': 0.6075, 'learning_rate': 9.633121285523356e-06, 'epoch': 1.03} {'loss': 0.563, 'learning_rate': 9.63279415456963e-06, 'epoch': 1.03} {'loss': 0.5365, 'learning_rate': 9.632467024009404e-06, 'epoch': 1.03} {'loss': 0.5622, 'learning_rate': 9.632139893843017e-06, 'epoch': 1.03} {'loss': 0.4419, 'learning_rate': 9.631812764070831e-06, 'epoch': 1.03} {'loss': 0.501, 'learning_rate': 9.63148563469319e-06, 'epoch': 1.03} {'loss': 0.7088, 'learning_rate': 9.631158505710444e-06, 'epoch': 1.03} {'loss': 0.4783, 'learning_rate': 9.630831377122947e-06, 'epoch': 1.03} {'loss': 0.5729, 'learning_rate': 9.630504248931041e-06, 'epoch': 1.03} {'loss': 0.6014, 'learning_rate': 9.63017712113509e-06, 'epoch': 1.03} {'loss': 0.6113, 'learning_rate': 9.629849993735431e-06, 'epoch': 1.03} {'loss': 0.5059, 'learning_rate': 9.629522866732428e-06, 'epoch': 1.03} {'loss': 0.7157, 'learning_rate': 9.629195740126424e-06, 'epoch': 1.03} {'loss': 0.5998, 'learning_rate': 9.628868613917767e-06, 'epoch': 1.03} {'loss': 0.5312, 'learning_rate': 9.628541488106813e-06, 'epoch': 1.03} {'loss': 0.4873, 'learning_rate': 9.628214362693908e-06, 'epoch': 1.03} {'loss': 0.5979, 'learning_rate': 9.627887237679408e-06, 'epoch': 1.03} {'loss': 0.5653, 'learning_rate': 9.627560113063658e-06, 'epoch': 1.03} {'loss': 0.7276, 'learning_rate': 9.627232988847009e-06, 'epoch': 1.03} {'loss': 0.6852, 'learning_rate': 9.626905865029819e-06, 'epoch': 1.03} {'loss': 0.6928, 'learning_rate': 9.62657874161243e-06, 'epoch': 1.03} {'loss': 0.4631, 'learning_rate': 9.626251618595196e-06, 'epoch': 1.03} {'loss': 0.5623, 'learning_rate': 9.625924495978463e-06, 'epoch': 1.03} {'loss': 0.7081, 'learning_rate': 9.625597373762592e-06, 'epoch': 1.03} {'loss': 0.6394, 'learning_rate': 9.625270251947926e-06, 'epoch': 1.03} {'loss': 0.6985, 'learning_rate': 9.624943130534814e-06, 'epoch': 1.03} {'loss': 0.5724, 'learning_rate': 9.624616009523611e-06, 'epoch': 1.03} {'loss': 0.6591, 'learning_rate': 9.624288888914665e-06, 'epoch': 1.03} {'loss': 0.4687, 'learning_rate': 9.623961768708329e-06, 'epoch': 1.03} {'loss': 0.6144, 'learning_rate': 9.623634648904948e-06, 'epoch': 1.03} {'loss': 0.6068, 'learning_rate': 9.62330752950488e-06, 'epoch': 1.03} {'loss': 0.5025, 'learning_rate': 9.622980410508473e-06, 'epoch': 1.03} {'loss': 0.6642, 'learning_rate': 9.622653291916075e-06, 'epoch': 1.03} {'loss': 0.6364, 'learning_rate': 9.622326173728037e-06, 'epoch': 1.03} {'loss': 0.5919, 'learning_rate': 9.621999055944711e-06, 'epoch': 1.03} {'loss': 0.5183, 'learning_rate': 9.621671938566448e-06, 'epoch': 1.03} {'loss': 0.5563, 'learning_rate': 9.6213448215936e-06, 'epoch': 1.03} {'loss': 0.558, 'learning_rate': 9.621017705026508e-06, 'epoch': 1.03} {'loss': 0.6337, 'learning_rate': 9.620690588865537e-06, 'epoch': 1.03} {'loss': 0.7272, 'learning_rate': 9.620363473111026e-06, 'epoch': 1.03} {'loss': 0.611, 'learning_rate': 9.620036357763333e-06, 'epoch': 1.03} {'loss': 0.5727, 'learning_rate': 9.619709242822801e-06, 'epoch': 1.03} {'loss': 0.4981, 'learning_rate': 9.619382128289788e-06, 'epoch': 1.03} {'loss': 0.6054, 'learning_rate': 9.619055014164642e-06, 'epoch': 1.03} {'loss': 0.5062, 'learning_rate': 9.61872790044771e-06, 'epoch': 1.03} {'loss': 0.7061, 'learning_rate': 9.618400787139348e-06, 'epoch': 1.03} {'loss': 0.6245, 'learning_rate': 9.618073674239903e-06, 'epoch': 1.03} {'loss': 0.5709, 'learning_rate': 9.617746561749728e-06, 'epoch': 1.03} {'loss': 0.5997, 'learning_rate': 9.617419449669167e-06, 'epoch': 1.03} {'loss': 0.5574, 'learning_rate': 9.617092337998582e-06, 'epoch': 1.03} {'loss': 0.5677, 'learning_rate': 9.616765226738316e-06, 'epoch': 1.03} {'loss': 0.7487, 'learning_rate': 9.616438115888717e-06, 'epoch': 1.03} {'loss': 0.5922, 'learning_rate': 9.616111005450141e-06, 'epoch': 1.03} {'loss': 0.4822, 'learning_rate': 9.615783895422937e-06, 'epoch': 1.03} {'loss': 0.6761, 'learning_rate': 9.615456785807457e-06, 'epoch': 1.03} {'loss': 0.6155, 'learning_rate': 9.61512967660405e-06, 'epoch': 1.03} {'loss': 0.6879, 'learning_rate': 9.614802567813061e-06, 'epoch': 1.03} {'loss': 0.6417, 'learning_rate': 9.61447545943485e-06, 'epoch': 1.03} {'loss': 0.5446, 'learning_rate': 9.614148351469762e-06, 'epoch': 1.03} {'loss': 0.7157, 'learning_rate': 9.613821243918148e-06, 'epoch': 1.03} {'loss': 0.5413, 'learning_rate': 9.613494136780362e-06, 'epoch': 1.03} {'loss': 0.5307, 'learning_rate': 9.613167030056752e-06, 'epoch': 1.03} {'loss': 0.4611, 'learning_rate': 9.612839923747668e-06, 'epoch': 1.03} {'loss': 0.6912, 'learning_rate': 9.612512817853458e-06, 'epoch': 1.03} {'loss': 0.5862, 'learning_rate': 9.612185712374478e-06, 'epoch': 1.03} {'loss': 0.5551, 'learning_rate': 9.611858607311073e-06, 'epoch': 1.03} {'loss': 0.485, 'learning_rate': 9.6115315026636e-06, 'epoch': 1.03} {'loss': 0.5646, 'learning_rate': 9.611204398432406e-06, 'epoch': 1.03} {'loss': 0.6101, 'learning_rate': 9.610877294617843e-06, 'epoch': 1.03} {'loss': 0.715, 'learning_rate': 9.610550191220258e-06, 'epoch': 1.03} {'loss': 0.5836, 'learning_rate': 9.61022308824e-06, 'epoch': 1.03} {'loss': 0.509, 'learning_rate': 9.609895985677428e-06, 'epoch': 1.03} {'loss': 0.5313, 'learning_rate': 9.609568883532884e-06, 'epoch': 1.03} {'loss': 0.5025, 'learning_rate': 9.609241781806724e-06, 'epoch': 1.03} {'loss': 0.4504, 'learning_rate': 9.6089146804993e-06, 'epoch': 1.03} {'loss': 0.5417, 'learning_rate': 9.608587579610957e-06, 'epoch': 1.03} {'loss': 0.5849, 'learning_rate': 9.608260479142047e-06, 'epoch': 1.03} {'loss': 0.6035, 'learning_rate': 9.607933379092918e-06, 'epoch': 1.03} {'loss': 0.5936, 'learning_rate': 9.60760627946393e-06, 'epoch': 1.03} {'loss': 0.682, 'learning_rate': 9.607279180255421e-06, 'epoch': 1.03} {'loss': 0.5998, 'learning_rate': 9.606952081467753e-06, 'epoch': 1.03} {'loss': 0.5662, 'learning_rate': 9.606624983101271e-06, 'epoch': 1.03} {'loss': 0.6292, 'learning_rate': 9.606297885156323e-06, 'epoch': 1.03} {'loss': 0.5498, 'learning_rate': 9.605970787633265e-06, 'epoch': 1.03} {'loss': 0.5718, 'learning_rate': 9.60564369053244e-06, 'epoch': 1.03} {'loss': 0.6833, 'learning_rate': 9.60531659385421e-06, 'epoch': 1.03} {'loss': 0.4778, 'learning_rate': 9.604989497598914e-06, 'epoch': 1.03} {'loss': 0.632, 'learning_rate': 9.60466240176691e-06, 'epoch': 1.03} {'loss': 0.4979, 'learning_rate': 9.604335306358547e-06, 'epoch': 1.03} {'loss': 0.7405, 'learning_rate': 9.604008211374172e-06, 'epoch': 1.03} {'loss': 0.5424, 'learning_rate': 9.60368111681414e-06, 'epoch': 1.03} {'loss': 0.5722, 'learning_rate': 9.603354022678795e-06, 'epoch': 1.03} {'loss': 0.6111, 'learning_rate': 9.603026928968495e-06, 'epoch': 1.03} {'loss': 0.6012, 'learning_rate': 9.60269983568359e-06, 'epoch': 1.03} {'loss': 0.6493, 'learning_rate': 9.602372742824422e-06, 'epoch': 1.03} {'loss': 0.5527, 'learning_rate': 9.602045650391352e-06, 'epoch': 1.03} {'loss': 0.5226, 'learning_rate': 9.601718558384725e-06, 'epoch': 1.03} {'loss': 0.6114, 'learning_rate': 9.601391466804893e-06, 'epoch': 1.03} {'loss': 0.4462, 'learning_rate': 9.601064375652204e-06, 'epoch': 1.03} {'loss': 0.7622, 'learning_rate': 9.600737284927014e-06, 'epoch': 1.03} {'loss': 0.421, 'learning_rate': 9.600410194629668e-06, 'epoch': 1.03} {'loss': 0.5855, 'learning_rate': 9.600083104760516e-06, 'epoch': 1.03} {'loss': 0.6078, 'learning_rate': 9.599756015319916e-06, 'epoch': 1.03} {'loss': 0.5255, 'learning_rate': 9.599428926308209e-06, 'epoch': 1.03} {'loss': 0.522, 'learning_rate': 9.599101837725755e-06, 'epoch': 1.03} {'loss': 0.6247, 'learning_rate': 9.598774749572898e-06, 'epoch': 1.03} {'loss': 0.5682, 'learning_rate': 9.598447661849986e-06, 'epoch': 1.03} {'loss': 0.4961, 'learning_rate': 9.598120574557376e-06, 'epoch': 1.03} {'loss': 0.7013, 'learning_rate': 9.597793487695417e-06, 'epoch': 1.03} {'loss': 0.4537, 'learning_rate': 9.597466401264459e-06, 'epoch': 1.03} {'loss': 0.6627, 'learning_rate': 9.59713931526485e-06, 'epoch': 1.03} {'loss': 0.7046, 'learning_rate': 9.596812229696945e-06, 'epoch': 1.03} {'loss': 0.4984, 'learning_rate': 9.596485144561091e-06, 'epoch': 1.03} {'loss': 0.5258, 'learning_rate': 9.596158059857638e-06, 'epoch': 1.03} {'loss': 0.4954, 'learning_rate': 9.59583097558694e-06, 'epoch': 1.03} {'loss': 0.5648, 'learning_rate': 9.595503891749344e-06, 'epoch': 1.03} {'loss': 0.5691, 'learning_rate': 9.595176808345206e-06, 'epoch': 1.03} {'loss': 0.5086, 'learning_rate': 9.594849725374866e-06, 'epoch': 1.03} {'loss': 0.7019, 'learning_rate': 9.594522642838685e-06, 'epoch': 1.03} {'loss': 0.6623, 'learning_rate': 9.594195560737012e-06, 'epoch': 1.03} {'loss': 0.7101, 'learning_rate': 9.59386847907019e-06, 'epoch': 1.03} {'loss': 0.5701, 'learning_rate': 9.593541397838578e-06, 'epoch': 1.03} {'loss': 0.6006, 'learning_rate': 9.593214317042521e-06, 'epoch': 1.03} {'loss': 0.5777, 'learning_rate': 9.592887236682375e-06, 'epoch': 1.03} {'loss': 0.6467, 'learning_rate': 9.592560156758488e-06, 'epoch': 1.03} {'loss': 0.4878, 'learning_rate': 9.592233077271202e-06, 'epoch': 1.03} {'loss': 0.6108, 'learning_rate': 9.59190599822088e-06, 'epoch': 1.03} {'loss': 0.4584, 'learning_rate': 9.591578919607866e-06, 'epoch': 1.03} {'loss': 0.5863, 'learning_rate': 9.591251841432515e-06, 'epoch': 1.03} {'loss': 0.6443, 'learning_rate': 9.59092476369517e-06, 'epoch': 1.03} {'loss': 0.6398, 'learning_rate': 9.59059768639619e-06, 'epoch': 1.03} {'loss': 0.5268, 'learning_rate': 9.590270609535922e-06, 'epoch': 1.03} {'loss': 0.5964, 'learning_rate': 9.589943533114713e-06, 'epoch': 1.03} {'loss': 0.8171, 'learning_rate': 9.589616457132917e-06, 'epoch': 1.03} {'loss': 0.62, 'learning_rate': 9.589289381590884e-06, 'epoch': 1.03} {'loss': 0.5536, 'learning_rate': 9.588962306488965e-06, 'epoch': 1.03} {'loss': 0.5636, 'learning_rate': 9.58863523182751e-06, 'epoch': 1.03} {'loss': 0.7103, 'learning_rate': 9.588308157606871e-06, 'epoch': 1.03} {'loss': 0.5263, 'learning_rate': 9.587981083827397e-06, 'epoch': 1.03} {'loss': 0.5485, 'learning_rate': 9.587654010489435e-06, 'epoch': 1.03} {'loss': 0.5782, 'learning_rate': 9.587326937593343e-06, 'epoch': 1.03} {'loss': 0.4995, 'learning_rate': 9.586999865139461e-06, 'epoch': 1.03} {'loss': 0.4934, 'learning_rate': 9.586672793128153e-06, 'epoch': 1.03} {'loss': 0.6333, 'learning_rate': 9.586345721559761e-06, 'epoch': 1.03} {'loss': 0.5254, 'learning_rate': 9.586018650434634e-06, 'epoch': 1.03} {'loss': 0.4616, 'learning_rate': 9.58569157975313e-06, 'epoch': 1.03} {'loss': 0.5688, 'learning_rate': 9.585364509515588e-06, 'epoch': 1.03} {'loss': 0.6993, 'learning_rate': 9.58503743972237e-06, 'epoch': 1.03} {'loss': 0.4834, 'learning_rate': 9.58471037037382e-06, 'epoch': 1.03} {'loss': 0.5583, 'learning_rate': 9.584383301470293e-06, 'epoch': 1.03} {'loss': 0.6026, 'learning_rate': 9.584056233012135e-06, 'epoch': 1.03} {'loss': 0.5125, 'learning_rate': 9.5837291649997e-06, 'epoch': 1.03} {'loss': 0.6305, 'learning_rate': 9.583402097433335e-06, 'epoch': 1.03} {'loss': 0.4086, 'learning_rate': 9.58307503031339e-06, 'epoch': 1.03} {'loss': 0.5799, 'learning_rate': 9.582747963640222e-06, 'epoch': 1.03} {'loss': 0.6171, 'learning_rate': 9.582420897414174e-06, 'epoch': 1.03} {'loss': 0.6192, 'learning_rate': 9.582093831635601e-06, 'epoch': 1.03} {'loss': 0.6187, 'learning_rate': 9.581766766304853e-06, 'epoch': 1.03} {'loss': 0.6606, 'learning_rate': 9.58143970142228e-06, 'epoch': 1.03} {'loss': 0.5556, 'learning_rate': 9.581112636988233e-06, 'epoch': 1.03} {'loss': 0.6104, 'learning_rate': 9.580785573003056e-06, 'epoch': 1.03} {'loss': 0.5742, 'learning_rate': 9.580458509467112e-06, 'epoch': 1.03} {'loss': 0.5989, 'learning_rate': 9.580131446380742e-06, 'epoch': 1.03} {'loss': 0.731, 'learning_rate': 9.579804383744296e-06, 'epoch': 1.03} {'loss': 0.5861, 'learning_rate': 9.579477321558131e-06, 'epoch': 1.03} {'loss': 0.6296, 'learning_rate': 9.579150259822592e-06, 'epoch': 1.03} {'loss': 0.6076, 'learning_rate': 9.578823198538035e-06, 'epoch': 1.03} {'loss': 0.4778, 'learning_rate': 9.5784961377048e-06, 'epoch': 1.03} {'loss': 0.637, 'learning_rate': 9.578169077323252e-06, 'epoch': 1.03} {'loss': 0.5816, 'learning_rate': 9.577842017393732e-06, 'epoch': 1.03} {'loss': 0.5858, 'learning_rate': 9.577514957916588e-06, 'epoch': 1.03} {'loss': 0.5803, 'learning_rate': 9.57718789889218e-06, 'epoch': 1.03} {'loss': 0.6197, 'learning_rate': 9.57686084032085e-06, 'epoch': 1.03} {'loss': 0.6561, 'learning_rate': 9.576533782202956e-06, 'epoch': 1.03} {'loss': 0.6094, 'learning_rate': 9.576206724538837e-06, 'epoch': 1.03} {'loss': 0.5776, 'learning_rate': 9.575879667328856e-06, 'epoch': 1.03} {'loss': 0.6463, 'learning_rate': 9.57555261057336e-06, 'epoch': 1.03} {'loss': 0.5236, 'learning_rate': 9.575225554272692e-06, 'epoch': 1.03} {'loss': 0.5054, 'learning_rate': 9.574898498427214e-06, 'epoch': 1.03} {'loss': 0.5512, 'learning_rate': 9.574571443037267e-06, 'epoch': 1.03} {'loss': 0.6574, 'learning_rate': 9.574244388103206e-06, 'epoch': 1.03} {'loss': 0.5964, 'learning_rate': 9.573917333625381e-06, 'epoch': 1.03} {'loss': 0.5518, 'learning_rate': 9.57359027960414e-06, 'epoch': 1.03} {'loss': 0.5069, 'learning_rate': 9.573263226039838e-06, 'epoch': 1.03} {'loss': 0.5207, 'learning_rate': 9.572936172932821e-06, 'epoch': 1.03} {'loss': 0.4167, 'learning_rate': 9.572609120283442e-06, 'epoch': 1.03} {'loss': 0.6192, 'learning_rate': 9.572282068092051e-06, 'epoch': 1.03} {'loss': 0.501, 'learning_rate': 9.571955016359e-06, 'epoch': 1.03} {'loss': 0.6018, 'learning_rate': 9.57162796508464e-06, 'epoch': 1.03} {'loss': 0.5195, 'learning_rate': 9.571300914269312e-06, 'epoch': 1.03} {'loss': 0.625, 'learning_rate': 9.570973863913379e-06, 'epoch': 1.03} {'loss': 0.3982, 'learning_rate': 9.570646814017184e-06, 'epoch': 1.03} {'loss': 0.5739, 'learning_rate': 9.570319764581082e-06, 'epoch': 1.03} {'loss': 0.5942, 'learning_rate': 9.569992715605419e-06, 'epoch': 1.03} {'loss': 0.4822, 'learning_rate': 9.569665667090549e-06, 'epoch': 1.03} {'loss': 0.4626, 'learning_rate': 9.56933861903682e-06, 'epoch': 1.03} {'loss': 0.5803, 'learning_rate': 9.569011571444582e-06, 'epoch': 1.03} {'loss': 0.5824, 'learning_rate': 9.56868452431419e-06, 'epoch': 1.03} {'loss': 0.6009, 'learning_rate': 9.56835747764599e-06, 'epoch': 1.03} {'loss': 0.5039, 'learning_rate': 9.568030431440336e-06, 'epoch': 1.03} {'loss': 0.5257, 'learning_rate': 9.567703385697577e-06, 'epoch': 1.03} {'loss': 0.6664, 'learning_rate': 9.567376340418056e-06, 'epoch': 1.03} {'loss': 0.5473, 'learning_rate': 9.567049295602138e-06, 'epoch': 1.03} {'loss': 0.5073, 'learning_rate': 9.566722251250158e-06, 'epoch': 1.03} {'loss': 0.463, 'learning_rate': 9.566395207362481e-06, 'epoch': 1.03} {'loss': 0.6379, 'learning_rate': 9.566068163939448e-06, 'epoch': 1.03} {'loss': 0.4974, 'learning_rate': 9.565741120981414e-06, 'epoch': 1.03} {'loss': 0.5813, 'learning_rate': 9.565414078488729e-06, 'epoch': 1.03} {'loss': 0.4703, 'learning_rate': 9.565087036461735e-06, 'epoch': 1.03} {'loss': 0.5648, 'learning_rate': 9.564759994900795e-06, 'epoch': 1.03} {'loss': 0.623, 'learning_rate': 9.564432953806252e-06, 'epoch': 1.03} {'loss': 0.5773, 'learning_rate': 9.564105913178459e-06, 'epoch': 1.03} {'loss': 0.6024, 'learning_rate': 9.563778873017768e-06, 'epoch': 1.03} {'loss': 0.6323, 'learning_rate': 9.563451833324524e-06, 'epoch': 1.03} {'loss': 0.6021, 'learning_rate': 9.563124794099084e-06, 'epoch': 1.03} {'loss': 0.6244, 'learning_rate': 9.56279775534179e-06, 'epoch': 1.03} {'loss': 0.46, 'learning_rate': 9.562470717053002e-06, 'epoch': 1.03} {'loss': 0.7571, 'learning_rate': 9.562143679233063e-06, 'epoch': 1.03} {'loss': 0.5776, 'learning_rate': 9.561816641882329e-06, 'epoch': 1.03} {'loss': 0.5055, 'learning_rate': 9.56148960500115e-06, 'epoch': 1.03} {'loss': 0.6062, 'learning_rate': 9.561162568589872e-06, 'epoch': 1.03} {'loss': 0.5388, 'learning_rate': 9.560835532648848e-06, 'epoch': 1.03} {'loss': 0.5319, 'learning_rate': 9.560508497178426e-06, 'epoch': 1.03} {'loss': 0.598, 'learning_rate': 9.560181462178962e-06, 'epoch': 1.03} {'loss': 0.6673, 'learning_rate': 9.5598544276508e-06, 'epoch': 1.03} {'loss': 0.3884, 'learning_rate': 9.559527393594297e-06, 'epoch': 1.03} {'loss': 0.6282, 'learning_rate': 9.559200360009802e-06, 'epoch': 1.03} {'loss': 0.4786, 'learning_rate': 9.55887332689766e-06, 'epoch': 1.03} {'loss': 0.6523, 'learning_rate': 9.558546294258227e-06, 'epoch': 1.03} {'loss': 0.4367, 'learning_rate': 9.558219262091846e-06, 'epoch': 1.03} {'loss': 0.5336, 'learning_rate': 9.55789223039888e-06, 'epoch': 1.03} {'loss': 0.4412, 'learning_rate': 9.557565199179671e-06, 'epoch': 1.03} {'loss': 0.5422, 'learning_rate': 9.557238168434568e-06, 'epoch': 1.03} {'loss': 0.5186, 'learning_rate': 9.556911138163927e-06, 'epoch': 1.03} {'loss': 0.5722, 'learning_rate': 9.556584108368093e-06, 'epoch': 1.03} {'loss': 0.5949, 'learning_rate': 9.556257079047421e-06, 'epoch': 1.03} {'loss': 0.6252, 'learning_rate': 9.555930050202259e-06, 'epoch': 1.03} {'loss': 0.5116, 'learning_rate': 9.555603021832959e-06, 'epoch': 1.03} {'loss': 0.5554, 'learning_rate': 9.555275993939871e-06, 'epoch': 1.03} {'loss': 0.5373, 'learning_rate': 9.554948966523342e-06, 'epoch': 1.03} {'loss': 0.5867, 'learning_rate': 9.554621939583727e-06, 'epoch': 1.03} {'loss': 0.3953, 'learning_rate': 9.554294913121373e-06, 'epoch': 1.03} {'loss': 0.3234, 'learning_rate': 9.553967887136637e-06, 'epoch': 1.03} {'loss': 0.6399, 'learning_rate': 9.553640861629858e-06, 'epoch': 1.03} {'loss': 0.4811, 'learning_rate': 9.553313836601399e-06, 'epoch': 1.03} {'loss': 0.4852, 'learning_rate': 9.552986812051603e-06, 'epoch': 1.03} {'loss': 0.5671, 'learning_rate': 9.55265978798082e-06, 'epoch': 1.03} {'loss': 0.4439, 'learning_rate': 9.552332764389404e-06, 'epoch': 1.03} {'loss': 0.3889, 'learning_rate': 9.552005741277704e-06, 'epoch': 1.03} {'loss': 0.6381, 'learning_rate': 9.55167871864607e-06, 'epoch': 1.03} {'loss': 0.5266, 'learning_rate': 9.551351696494854e-06, 'epoch': 1.03} {'loss': 0.5203, 'learning_rate': 9.551024674824401e-06, 'epoch': 1.03} {'loss': 0.5389, 'learning_rate': 9.550697653635071e-06, 'epoch': 1.03} {'loss': 0.5173, 'learning_rate': 9.550370632927203e-06, 'epoch': 1.03} {'loss': 0.5056, 'learning_rate': 9.550043612701158e-06, 'epoch': 1.03} {'loss': 0.4583, 'learning_rate': 9.54971659295728e-06, 'epoch': 1.03} {'loss': 0.5691, 'learning_rate': 9.549389573695924e-06, 'epoch': 1.03} {'loss': 0.5592, 'learning_rate': 9.549062554917436e-06, 'epoch': 1.03} {'loss': 0.6643, 'learning_rate': 9.548735536622165e-06, 'epoch': 1.03} {'loss': 0.5445, 'learning_rate': 9.548408518810469e-06, 'epoch': 1.03} {'loss': 0.7302, 'learning_rate': 9.548081501482693e-06, 'epoch': 1.03} {'loss': 0.6369, 'learning_rate': 9.547754484639187e-06, 'epoch': 1.03} {'loss': 0.5449, 'learning_rate': 9.547427468280303e-06, 'epoch': 1.03} {'loss': 0.6538, 'learning_rate': 9.547100452406393e-06, 'epoch': 1.03} {'loss': 0.606, 'learning_rate': 9.546773437017807e-06, 'epoch': 1.03} {'loss': 0.5478, 'learning_rate': 9.54644642211489e-06, 'epoch': 1.03} {'loss': 0.5534, 'learning_rate': 9.546119407698e-06, 'epoch': 1.03} {'loss': 0.571, 'learning_rate': 9.545792393767481e-06, 'epoch': 1.03} {'loss': 0.5117, 'learning_rate': 9.54546538032369e-06, 'epoch': 1.03} {'loss': 0.6113, 'learning_rate': 9.545138367366971e-06, 'epoch': 1.03} {'loss': 0.6096, 'learning_rate': 9.544811354897678e-06, 'epoch': 1.03} {'loss': 0.6071, 'learning_rate': 9.544484342916162e-06, 'epoch': 1.03} {'loss': 0.5723, 'learning_rate': 9.544157331422769e-06, 'epoch': 1.03} {'loss': 0.6135, 'learning_rate': 9.543830320417855e-06, 'epoch': 1.03} {'loss': 0.5378, 'learning_rate': 9.543503309901767e-06, 'epoch': 1.03} {'loss': 0.5928, 'learning_rate': 9.543176299874859e-06, 'epoch': 1.03} {'loss': 0.5298, 'learning_rate': 9.542849290337478e-06, 'epoch': 1.03} {'loss': 0.6378, 'learning_rate': 9.542522281289973e-06, 'epoch': 1.03} {'loss': 0.4513, 'learning_rate': 9.542195272732698e-06, 'epoch': 1.03} {'loss': 0.4317, 'learning_rate': 9.541868264665998e-06, 'epoch': 1.03} {'loss': 0.4956, 'learning_rate': 9.541541257090235e-06, 'epoch': 1.03} {'loss': 0.5126, 'learning_rate': 9.54121425000575e-06, 'epoch': 1.03} {'loss': 0.5519, 'learning_rate': 9.540887243412891e-06, 'epoch': 1.03} {'loss': 0.6376, 'learning_rate': 9.540560237312018e-06, 'epoch': 1.03} {'loss': 0.5927, 'learning_rate': 9.540233231703472e-06, 'epoch': 1.03} {'loss': 0.4965, 'learning_rate': 9.53990622658761e-06, 'epoch': 1.03} {'loss': 0.5543, 'learning_rate': 9.539579221964776e-06, 'epoch': 1.03} {'loss': 0.6416, 'learning_rate': 9.539252217835328e-06, 'epoch': 1.03} {'loss': 0.5133, 'learning_rate': 9.538925214199614e-06, 'epoch': 1.03} {'loss': 0.6714, 'learning_rate': 9.538598211057981e-06, 'epoch': 1.03} {'loss': 0.4925, 'learning_rate': 9.538271208410783e-06, 'epoch': 1.03} {'loss': 0.5899, 'learning_rate': 9.537944206258366e-06, 'epoch': 1.03} {'loss': 0.5734, 'learning_rate': 9.537617204601088e-06, 'epoch': 1.03} {'loss': 0.5165, 'learning_rate': 9.53729020343929e-06, 'epoch': 1.03} {'loss': 0.6314, 'learning_rate': 9.536963202773332e-06, 'epoch': 1.03} {'loss': 0.6439, 'learning_rate': 9.53663620260356e-06, 'epoch': 1.03} {'loss': 0.5694, 'learning_rate': 9.53630920293032e-06, 'epoch': 1.03} {'loss': 0.4898, 'learning_rate': 9.535982203753971e-06, 'epoch': 1.03} {'loss': 0.4983, 'learning_rate': 9.535655205074853e-06, 'epoch': 1.03} {'loss': 0.5259, 'learning_rate': 9.535328206893327e-06, 'epoch': 1.03} {'loss': 0.49, 'learning_rate': 9.53500120920974e-06, 'epoch': 1.03} {'loss': 0.5598, 'learning_rate': 9.534674212024435e-06, 'epoch': 1.03} {'loss': 0.5788, 'learning_rate': 9.534347215337774e-06, 'epoch': 1.03} {'loss': 0.5304, 'learning_rate': 9.5340202191501e-06, 'epoch': 1.03} {'loss': 0.5181, 'learning_rate': 9.533693223461768e-06, 'epoch': 1.03} {'loss': 0.5452, 'learning_rate': 9.53336622827312e-06, 'epoch': 1.03} {'loss': 0.6485, 'learning_rate': 9.533039233584517e-06, 'epoch': 1.03} {'loss': 0.4239, 'learning_rate': 9.532712239396306e-06, 'epoch': 1.03} {'loss': 0.7103, 'learning_rate': 9.53238524570883e-06, 'epoch': 1.03} {'loss': 0.5271, 'learning_rate': 9.532058252522451e-06, 'epoch': 1.03} {'loss': 0.5741, 'learning_rate': 9.53173125983751e-06, 'epoch': 1.03} {'loss': 0.4906, 'learning_rate': 9.531404267654364e-06, 'epoch': 1.03} {'loss': 0.4481, 'learning_rate': 9.531077275973356e-06, 'epoch': 1.03} {'loss': 0.5805, 'learning_rate': 9.530750284794845e-06, 'epoch': 1.03} {'loss': 0.4613, 'learning_rate': 9.53042329411918e-06, 'epoch': 1.03} {'loss': 0.5623, 'learning_rate': 9.530096303946704e-06, 'epoch': 1.03} {'loss': 0.6472, 'learning_rate': 9.529769314277774e-06, 'epoch': 1.03} {'loss': 0.549, 'learning_rate': 9.529442325112738e-06, 'epoch': 1.03} {'loss': 0.541, 'learning_rate': 9.529115336451949e-06, 'epoch': 1.03} {'loss': 0.5774, 'learning_rate': 9.528788348295755e-06, 'epoch': 1.03} {'loss': 0.482, 'learning_rate': 9.528461360644503e-06, 'epoch': 1.03} {'loss': 0.5336, 'learning_rate': 9.528134373498552e-06, 'epoch': 1.03} {'loss': 0.5523, 'learning_rate': 9.527807386858243e-06, 'epoch': 1.03} {'loss': 0.5352, 'learning_rate': 9.527480400723934e-06, 'epoch': 1.03} {'loss': 0.7196, 'learning_rate': 9.527153415095972e-06, 'epoch': 1.03} {'loss': 0.656, 'learning_rate': 9.52682642997471e-06, 'epoch': 1.03} {'loss': 0.5446, 'learning_rate': 9.526499445360496e-06, 'epoch': 1.03} {'loss': 0.5616, 'learning_rate': 9.526172461253674e-06, 'epoch': 1.03} {'loss': 0.6083, 'learning_rate': 9.525845477654607e-06, 'epoch': 1.03} {'loss': 0.6298, 'learning_rate': 9.525518494563635e-06, 'epoch': 1.03} {'loss': 0.6424, 'learning_rate': 9.525191511981118e-06, 'epoch': 1.03} {'loss': 0.5999, 'learning_rate': 9.524864529907397e-06, 'epoch': 1.03} {'loss': 0.5807, 'learning_rate': 9.524537548342831e-06, 'epoch': 1.03} {'loss': 0.6143, 'learning_rate': 9.524210567287763e-06, 'epoch': 1.03} {'loss': 0.4912, 'learning_rate': 9.523883586742545e-06, 'epoch': 1.03} {'loss': 0.5161, 'learning_rate': 9.523556606707531e-06, 'epoch': 1.03} {'loss': 0.5452, 'learning_rate': 9.523229627183066e-06, 'epoch': 1.03} {'loss': 0.5125, 'learning_rate': 9.522902648169507e-06, 'epoch': 1.03} {'loss': 0.6846, 'learning_rate': 9.522575669667202e-06, 'epoch': 1.03} {'loss': 0.6739, 'learning_rate': 9.522248691676498e-06, 'epoch': 1.03} {'loss': 0.4795, 'learning_rate': 9.521921714197748e-06, 'epoch': 1.03} {'loss': 0.6139, 'learning_rate': 9.5215947372313e-06, 'epoch': 1.03} {'loss': 0.6257, 'learning_rate': 9.521267760777508e-06, 'epoch': 1.03} {'loss': 0.5979, 'learning_rate': 9.52094078483672e-06, 'epoch': 1.03} {'loss': 0.638, 'learning_rate': 9.520613809409288e-06, 'epoch': 1.03} {'loss': 0.6386, 'learning_rate': 9.520286834495563e-06, 'epoch': 1.03} {'loss': 0.6947, 'learning_rate': 9.519959860095893e-06, 'epoch': 1.03} {'loss': 0.5336, 'learning_rate': 9.51963288621063e-06, 'epoch': 1.03} {'loss': 0.5465, 'learning_rate': 9.51930591284012e-06, 'epoch': 1.03} {'loss': 0.5451, 'learning_rate': 9.518978939984721e-06, 'epoch': 1.03} {'loss': 0.603, 'learning_rate': 9.518651967644778e-06, 'epoch': 1.03} {'loss': 0.5835, 'learning_rate': 9.518324995820645e-06, 'epoch': 1.03} {'loss': 0.7669, 'learning_rate': 9.517998024512666e-06, 'epoch': 1.03} {'loss': 0.4996, 'learning_rate': 9.517671053721199e-06, 'epoch': 1.03} {'loss': 0.6367, 'learning_rate': 9.51734408344659e-06, 'epoch': 1.03} {'loss': 0.636, 'learning_rate': 9.51701711368919e-06, 'epoch': 1.03} {'loss': 0.5921, 'learning_rate': 9.516690144449349e-06, 'epoch': 1.03} {'loss': 0.552, 'learning_rate': 9.516363175727422e-06, 'epoch': 1.03} {'loss': 0.5299, 'learning_rate': 9.516036207523752e-06, 'epoch': 1.03} {'loss': 0.6458, 'learning_rate': 9.515709239838696e-06, 'epoch': 1.03} {'loss': 0.6505, 'learning_rate': 9.515382272672595e-06, 'epoch': 1.03} {'loss': 0.5983, 'learning_rate': 9.51505530602581e-06, 'epoch': 1.03} {'loss': 0.4655, 'learning_rate': 9.514728339898684e-06, 'epoch': 1.03} {'loss': 0.5928, 'learning_rate': 9.514401374291575e-06, 'epoch': 1.03} {'loss': 0.5996, 'learning_rate': 9.514074409204829e-06, 'epoch': 1.03} {'loss': 0.5178, 'learning_rate': 9.513747444638792e-06, 'epoch': 1.03} {'loss': 0.4916, 'learning_rate': 9.513420480593822e-06, 'epoch': 1.03} {'loss': 0.5862, 'learning_rate': 9.513093517070261e-06, 'epoch': 1.03} {'loss': 0.6192, 'learning_rate': 9.51276655406847e-06, 'epoch': 1.03} {'loss': 0.6495, 'learning_rate': 9.512439591588792e-06, 'epoch': 1.03} {'loss': 0.5879, 'learning_rate': 9.512112629631575e-06, 'epoch': 1.03} {'loss': 0.5412, 'learning_rate': 9.511785668197177e-06, 'epoch': 1.03} {'loss': 0.6755, 'learning_rate': 9.511458707285944e-06, 'epoch': 1.03} {'loss': 0.5832, 'learning_rate': 9.51113174689823e-06, 'epoch': 1.03} {'loss': 0.5912, 'learning_rate': 9.510804787034376e-06, 'epoch': 1.03} {'loss': 0.437, 'learning_rate': 9.510477827694745e-06, 'epoch': 1.03} {'loss': 0.3786, 'learning_rate': 9.510150868879678e-06, 'epoch': 1.03} {'loss': 0.5952, 'learning_rate': 9.509823910589527e-06, 'epoch': 1.03} {'loss': 0.6461, 'learning_rate': 9.509496952824649e-06, 'epoch': 1.03} {'loss': 0.7016, 'learning_rate': 9.509169995585385e-06, 'epoch': 1.03} {'loss': 0.5939, 'learning_rate': 9.508843038872092e-06, 'epoch': 1.03} {'loss': 0.6537, 'learning_rate': 9.508516082685114e-06, 'epoch': 1.03} {'loss': 0.6161, 'learning_rate': 9.508189127024811e-06, 'epoch': 1.03} {'loss': 0.4911, 'learning_rate': 9.507862171891527e-06, 'epoch': 1.03} {'loss': 0.5398, 'learning_rate': 9.507535217285607e-06, 'epoch': 1.03} {'loss': 0.4307, 'learning_rate': 9.507208263207414e-06, 'epoch': 1.03} {'loss': 0.6271, 'learning_rate': 9.506881309657289e-06, 'epoch': 1.03} {'loss': 0.4996, 'learning_rate': 9.506554356635586e-06, 'epoch': 1.03} {'loss': 0.5849, 'learning_rate': 9.506227404142656e-06, 'epoch': 1.03} {'loss': 0.529, 'learning_rate': 9.505900452178844e-06, 'epoch': 1.03} {'loss': 0.5188, 'learning_rate': 9.505573500744508e-06, 'epoch': 1.03} {'loss': 0.6053, 'learning_rate': 9.50524654983999e-06, 'epoch': 1.03} {'loss': 0.6866, 'learning_rate': 9.50491959946565e-06, 'epoch': 1.03} {'loss': 0.6188, 'learning_rate': 9.50459264962183e-06, 'epoch': 1.03} {'loss': 0.5074, 'learning_rate': 9.504265700308886e-06, 'epoch': 1.03} {'loss': 0.7182, 'learning_rate': 9.503938751527168e-06, 'epoch': 1.03} {'loss': 0.3727, 'learning_rate': 9.50361180327702e-06, 'epoch': 1.03} {'loss': 0.6644, 'learning_rate': 9.503284855558797e-06, 'epoch': 1.03} {'loss': 0.4908, 'learning_rate': 9.502957908372848e-06, 'epoch': 1.03} {'loss': 0.5742, 'learning_rate': 9.50263096171953e-06, 'epoch': 1.03} {'loss': 0.4831, 'learning_rate': 9.502304015599184e-06, 'epoch': 1.03} {'loss': 0.6874, 'learning_rate': 9.501977070012166e-06, 'epoch': 1.03} {'loss': 0.4856, 'learning_rate': 9.501650124958824e-06, 'epoch': 1.03} {'loss': 0.5554, 'learning_rate': 9.501323180439505e-06, 'epoch': 1.03} {'loss': 0.5442, 'learning_rate': 9.500996236454568e-06, 'epoch': 1.03} {'loss': 0.5744, 'learning_rate': 9.500669293004354e-06, 'epoch': 1.03} {'loss': 0.4899, 'learning_rate': 9.500342350089223e-06, 'epoch': 1.03} {'loss': 0.7546, 'learning_rate': 9.500015407709519e-06, 'epoch': 1.03} {'loss': 0.4572, 'learning_rate': 9.499688465865594e-06, 'epoch': 1.03} {'loss': 0.5277, 'learning_rate': 9.499361524557798e-06, 'epoch': 1.03} {'loss': 0.5067, 'learning_rate': 9.499034583786476e-06, 'epoch': 1.03} {'loss': 0.6808, 'learning_rate': 9.49870764355199e-06, 'epoch': 1.03} {'loss': 0.6772, 'learning_rate': 9.498380703854678e-06, 'epoch': 1.03} {'loss': 0.5747, 'learning_rate': 9.498053764694902e-06, 'epoch': 1.03} {'loss': 0.5834, 'learning_rate': 9.497726826073005e-06, 'epoch': 1.04} {'loss': 0.4494, 'learning_rate': 9.497399887989339e-06, 'epoch': 1.04} {'loss': 0.5876, 'learning_rate': 9.497072950444257e-06, 'epoch': 1.04} {'loss': 0.6641, 'learning_rate': 9.4967460134381e-06, 'epoch': 1.04} {'loss': 0.6054, 'learning_rate': 9.49641907697123e-06, 'epoch': 1.04} {'loss': 0.5705, 'learning_rate': 9.496092141043991e-06, 'epoch': 1.04} {'loss': 0.5653, 'learning_rate': 9.495765205656736e-06, 'epoch': 1.04} {'loss': 0.4905, 'learning_rate': 9.495438270809814e-06, 'epoch': 1.04} {'loss': 0.6397, 'learning_rate': 9.495111336503574e-06, 'epoch': 1.04} {'loss': 0.5047, 'learning_rate': 9.49478440273837e-06, 'epoch': 1.04} {'loss': 0.6713, 'learning_rate': 9.494457469514545e-06, 'epoch': 1.04} {'loss': 0.579, 'learning_rate': 9.49413053683246e-06, 'epoch': 1.04} {'loss': 0.6687, 'learning_rate': 9.49380360469246e-06, 'epoch': 1.04} {'loss': 0.5275, 'learning_rate': 9.493476673094892e-06, 'epoch': 1.04} {'loss': 0.4737, 'learning_rate': 9.493149742040108e-06, 'epoch': 1.04} {'loss': 0.5164, 'learning_rate': 9.492822811528462e-06, 'epoch': 1.04} {'loss': 0.5484, 'learning_rate': 9.492495881560305e-06, 'epoch': 1.04} {'loss': 0.4716, 'learning_rate': 9.492168952135978e-06, 'epoch': 1.04} {'loss': 0.5956, 'learning_rate': 9.491842023255845e-06, 'epoch': 1.04} {'loss': 0.5247, 'learning_rate': 9.491515094920247e-06, 'epoch': 1.04} {'loss': 0.6513, 'learning_rate': 9.491188167129533e-06, 'epoch': 1.04} {'loss': 0.4353, 'learning_rate': 9.49086123988406e-06, 'epoch': 1.04} {'loss': 0.6018, 'learning_rate': 9.490534313184172e-06, 'epoch': 1.04} {'loss': 0.5923, 'learning_rate': 9.490207387030226e-06, 'epoch': 1.04} {'loss': 0.6488, 'learning_rate': 9.489880461422564e-06, 'epoch': 1.04} {'loss': 0.5641, 'learning_rate': 9.489553536361546e-06, 'epoch': 1.04} {'loss': 0.5496, 'learning_rate': 9.489226611847519e-06, 'epoch': 1.04} {'loss': 0.735, 'learning_rate': 9.488899687880827e-06, 'epoch': 1.04} {'loss': 0.6809, 'learning_rate': 9.488572764461829e-06, 'epoch': 1.04} {'loss': 0.5015, 'learning_rate': 9.488245841590865e-06, 'epoch': 1.04} {'loss': 0.6364, 'learning_rate': 9.487918919268298e-06, 'epoch': 1.04} {'loss': 0.6529, 'learning_rate': 9.487591997494473e-06, 'epoch': 1.04} {'loss': 0.6224, 'learning_rate': 9.487265076269734e-06, 'epoch': 1.04} {'loss': 0.6006, 'learning_rate': 9.486938155594441e-06, 'epoch': 1.04} {'loss': 0.577, 'learning_rate': 9.486611235468937e-06, 'epoch': 1.04} {'loss': 0.7446, 'learning_rate': 9.486284315893577e-06, 'epoch': 1.04} {'loss': 0.5516, 'learning_rate': 9.485957396868708e-06, 'epoch': 1.04} {'loss': 0.6589, 'learning_rate': 9.485630478394684e-06, 'epoch': 1.04} {'loss': 0.5956, 'learning_rate': 9.485303560471856e-06, 'epoch': 1.04} {'loss': 0.5467, 'learning_rate': 9.484976643100566e-06, 'epoch': 1.04} {'loss': 0.5451, 'learning_rate': 9.484649726281173e-06, 'epoch': 1.04} {'loss': 0.5451, 'learning_rate': 9.484322810014025e-06, 'epoch': 1.04} {'loss': 0.5261, 'learning_rate': 9.483995894299472e-06, 'epoch': 1.04} {'loss': 0.5253, 'learning_rate': 9.483668979137864e-06, 'epoch': 1.04} {'loss': 0.3999, 'learning_rate': 9.483342064529546e-06, 'epoch': 1.04} {'loss': 0.5112, 'learning_rate': 9.48301515047488e-06, 'epoch': 1.04} {'loss': 0.6363, 'learning_rate': 9.482688236974203e-06, 'epoch': 1.04} {'loss': 0.6296, 'learning_rate': 9.48236132402788e-06, 'epoch': 1.04} {'loss': 0.526, 'learning_rate': 9.482034411636248e-06, 'epoch': 1.04} {'loss': 0.3819, 'learning_rate': 9.481707499799666e-06, 'epoch': 1.04} {'loss': 0.5212, 'learning_rate': 9.481380588518482e-06, 'epoch': 1.04} {'loss': 0.5757, 'learning_rate': 9.481053677793042e-06, 'epoch': 1.04} {'loss': 0.5886, 'learning_rate': 9.480726767623703e-06, 'epoch': 1.04} {'loss': 0.7119, 'learning_rate': 9.480399858010808e-06, 'epoch': 1.04} {'loss': 0.6594, 'learning_rate': 9.480072948954717e-06, 'epoch': 1.04} {'loss': 0.6114, 'learning_rate': 9.47974604045577e-06, 'epoch': 1.04} {'loss': 0.6745, 'learning_rate': 9.479419132514327e-06, 'epoch': 1.04} {'loss': 0.6748, 'learning_rate': 9.47909222513073e-06, 'epoch': 1.04} {'loss': 0.4469, 'learning_rate': 9.478765318305331e-06, 'epoch': 1.04} {'loss': 0.6399, 'learning_rate': 9.478438412038486e-06, 'epoch': 1.04} {'loss': 0.5635, 'learning_rate': 9.478111506330536e-06, 'epoch': 1.04} {'loss': 0.6076, 'learning_rate': 9.477784601181842e-06, 'epoch': 1.04} {'loss': 0.5866, 'learning_rate': 9.47745769659275e-06, 'epoch': 1.04} {'loss': 0.5676, 'learning_rate': 9.477130792563604e-06, 'epoch': 1.04} {'loss': 0.5505, 'learning_rate': 9.476803889094764e-06, 'epoch': 1.04} {'loss': 0.4627, 'learning_rate': 9.47647698618657e-06, 'epoch': 1.04} {'loss': 0.5042, 'learning_rate': 9.476150083839385e-06, 'epoch': 1.04} {'loss': 0.4629, 'learning_rate': 9.475823182053545e-06, 'epoch': 1.04} {'loss': 0.4954, 'learning_rate': 9.475496280829413e-06, 'epoch': 1.04} {'loss': 0.6467, 'learning_rate': 9.475169380167335e-06, 'epoch': 1.04} {'loss': 0.6165, 'learning_rate': 9.474842480067659e-06, 'epoch': 1.04} {'loss': 0.4834, 'learning_rate': 9.474515580530737e-06, 'epoch': 1.04} {'loss': 0.6539, 'learning_rate': 9.474188681556915e-06, 'epoch': 1.04} {'loss': 0.5434, 'learning_rate': 9.473861783146552e-06, 'epoch': 1.04} {'loss': 0.6848, 'learning_rate': 9.47353488529999e-06, 'epoch': 1.04} {'loss': 0.5648, 'learning_rate': 9.473207988017585e-06, 'epoch': 1.04} {'loss': 0.4992, 'learning_rate': 9.472881091299688e-06, 'epoch': 1.04} {'loss': 0.4412, 'learning_rate': 9.472554195146642e-06, 'epoch': 1.04} {'loss': 0.5761, 'learning_rate': 9.472227299558805e-06, 'epoch': 1.04} {'loss': 0.5822, 'learning_rate': 9.47190040453652e-06, 'epoch': 1.04} {'loss': 0.6729, 'learning_rate': 9.471573510080146e-06, 'epoch': 1.04} {'loss': 0.5502, 'learning_rate': 9.471246616190027e-06, 'epoch': 1.04} {'loss': 0.5529, 'learning_rate': 9.470919722866511e-06, 'epoch': 1.04} {'loss': 0.488, 'learning_rate': 9.470592830109958e-06, 'epoch': 1.04} {'loss': 0.5972, 'learning_rate': 9.47026593792071e-06, 'epoch': 1.04} {'loss': 0.4938, 'learning_rate': 9.469939046299121e-06, 'epoch': 1.04} {'loss': 0.6457, 'learning_rate': 9.469612155245536e-06, 'epoch': 1.04} {'loss': 0.6067, 'learning_rate': 9.469285264760315e-06, 'epoch': 1.04} {'loss': 0.6797, 'learning_rate': 9.468958374843803e-06, 'epoch': 1.04} {'loss': 0.6169, 'learning_rate': 9.468631485496347e-06, 'epoch': 1.04} {'loss': 0.586, 'learning_rate': 9.468304596718299e-06, 'epoch': 1.04} {'loss': 0.6564, 'learning_rate': 9.467977708510013e-06, 'epoch': 1.04} {'loss': 0.5651, 'learning_rate': 9.467650820871837e-06, 'epoch': 1.04} {'loss': 0.5931, 'learning_rate': 9.467323933804118e-06, 'epoch': 1.04} {'loss': 0.5041, 'learning_rate': 9.466997047307213e-06, 'epoch': 1.04} {'loss': 0.5964, 'learning_rate': 9.46667016138147e-06, 'epoch': 1.04} {'loss': 0.5674, 'learning_rate': 9.466343276027235e-06, 'epoch': 1.04} {'loss': 0.6104, 'learning_rate': 9.466016391244865e-06, 'epoch': 1.04} {'loss': 0.5625, 'learning_rate': 9.4656895070347e-06, 'epoch': 1.04} {'loss': 0.585, 'learning_rate': 9.465362623397103e-06, 'epoch': 1.04} {'loss': 0.577, 'learning_rate': 9.465035740332416e-06, 'epoch': 1.04} {'loss': 0.5873, 'learning_rate': 9.464708857840989e-06, 'epoch': 1.04} {'loss': 0.5523, 'learning_rate': 9.46438197592318e-06, 'epoch': 1.04} {'loss': 0.4916, 'learning_rate': 9.46405509457933e-06, 'epoch': 1.04} {'loss': 0.6787, 'learning_rate': 9.463728213809797e-06, 'epoch': 1.04} {'loss': 0.6717, 'learning_rate': 9.463401333614922e-06, 'epoch': 1.04} {'loss': 0.6552, 'learning_rate': 9.463074453995065e-06, 'epoch': 1.04} {'loss': 0.5076, 'learning_rate': 9.462747574950574e-06, 'epoch': 1.04} {'loss': 0.709, 'learning_rate': 9.462420696481791e-06, 'epoch': 1.04} {'loss': 0.6187, 'learning_rate': 9.462093818589079e-06, 'epoch': 1.04} {'loss': 0.587, 'learning_rate': 9.46176694127278e-06, 'epoch': 1.04} {'loss': 0.5012, 'learning_rate': 9.461440064533246e-06, 'epoch': 1.04} {'loss': 0.497, 'learning_rate': 9.461113188370824e-06, 'epoch': 1.04} {'loss': 0.6706, 'learning_rate': 9.460786312785873e-06, 'epoch': 1.04} {'loss': 0.5039, 'learning_rate': 9.460459437778738e-06, 'epoch': 1.04} {'loss': 0.5011, 'learning_rate': 9.460132563349765e-06, 'epoch': 1.04} {'loss': 0.5155, 'learning_rate': 9.459805689499313e-06, 'epoch': 1.04} {'loss': 0.5511, 'learning_rate': 9.459478816227726e-06, 'epoch': 1.04} {'loss': 0.6909, 'learning_rate': 9.459151943535359e-06, 'epoch': 1.04} {'loss': 0.568, 'learning_rate': 9.458825071422558e-06, 'epoch': 1.04} {'loss': 0.5059, 'learning_rate': 9.458498199889673e-06, 'epoch': 1.04} {'loss': 0.5501, 'learning_rate': 9.458171328937057e-06, 'epoch': 1.04} {'loss': 0.4802, 'learning_rate': 9.457844458565057e-06, 'epoch': 1.04} {'loss': 0.4294, 'learning_rate': 9.457517588774028e-06, 'epoch': 1.04} {'loss': 0.6132, 'learning_rate': 9.457190719564319e-06, 'epoch': 1.04} {'loss': 0.6973, 'learning_rate': 9.456863850936278e-06, 'epoch': 1.04} {'loss': 0.6105, 'learning_rate': 9.45653698289026e-06, 'epoch': 1.04} {'loss': 0.4623, 'learning_rate': 9.456210115426604e-06, 'epoch': 1.04} {'loss': 0.5796, 'learning_rate': 9.455883248545674e-06, 'epoch': 1.04} {'loss': 0.566, 'learning_rate': 9.45555638224781e-06, 'epoch': 1.04} {'loss': 0.6083, 'learning_rate': 9.45522951653337e-06, 'epoch': 1.04} {'loss': 0.5161, 'learning_rate': 9.4549026514027e-06, 'epoch': 1.04} {'loss': 0.5624, 'learning_rate': 9.45457578685615e-06, 'epoch': 1.04} {'loss': 0.5749, 'learning_rate': 9.454248922894073e-06, 'epoch': 1.04} {'loss': 0.6727, 'learning_rate': 9.453922059516814e-06, 'epoch': 1.04} {'loss': 0.5692, 'learning_rate': 9.45359519672473e-06, 'epoch': 1.04} {'loss': 0.509, 'learning_rate': 9.453268334518163e-06, 'epoch': 1.04} {'loss': 0.6893, 'learning_rate': 9.452941472897476e-06, 'epoch': 1.04} {'loss': 0.6375, 'learning_rate': 9.45261461186301e-06, 'epoch': 1.04} {'loss': 0.5018, 'learning_rate': 9.452287751415113e-06, 'epoch': 1.04} {'loss': 0.5336, 'learning_rate': 9.451960891554143e-06, 'epoch': 1.04} {'loss': 0.629, 'learning_rate': 9.451634032280442e-06, 'epoch': 1.04} {'loss': 0.5763, 'learning_rate': 9.451307173594369e-06, 'epoch': 1.04} {'loss': 0.5026, 'learning_rate': 9.450980315496264e-06, 'epoch': 1.04} {'loss': 0.5381, 'learning_rate': 9.450653457986488e-06, 'epoch': 1.04} {'loss': 0.576, 'learning_rate': 9.450326601065387e-06, 'epoch': 1.04} {'loss': 0.6727, 'learning_rate': 9.449999744733309e-06, 'epoch': 1.04} {'loss': 0.4474, 'learning_rate': 9.449672888990608e-06, 'epoch': 1.04} {'loss': 0.5142, 'learning_rate': 9.449346033837627e-06, 'epoch': 1.04} {'loss': 0.6564, 'learning_rate': 9.449019179274726e-06, 'epoch': 1.04} {'loss': 0.6426, 'learning_rate': 9.448692325302251e-06, 'epoch': 1.04} {'loss': 0.5469, 'learning_rate': 9.448365471920546e-06, 'epoch': 1.04} {'loss': 0.4625, 'learning_rate': 9.448038619129973e-06, 'epoch': 1.04} {'loss': 0.5391, 'learning_rate': 9.447711766930876e-06, 'epoch': 1.04} {'loss': 0.524, 'learning_rate': 9.447384915323605e-06, 'epoch': 1.04} {'loss': 0.6545, 'learning_rate': 9.447058064308508e-06, 'epoch': 1.04} {'loss': 0.5743, 'learning_rate': 9.446731213885942e-06, 'epoch': 1.04} {'loss': 0.5199, 'learning_rate': 9.446404364056252e-06, 'epoch': 1.04} {'loss': 0.6384, 'learning_rate': 9.446077514819788e-06, 'epoch': 1.04} {'loss': 0.6329, 'learning_rate': 9.445750666176907e-06, 'epoch': 1.04} {'loss': 0.647, 'learning_rate': 9.445423818127949e-06, 'epoch': 1.04} {'loss': 0.6248, 'learning_rate': 9.445096970673274e-06, 'epoch': 1.04} {'loss': 0.4076, 'learning_rate': 9.444770123813221e-06, 'epoch': 1.04} {'loss': 0.5225, 'learning_rate': 9.444443277548151e-06, 'epoch': 1.04} {'loss': 0.5677, 'learning_rate': 9.444116431878412e-06, 'epoch': 1.04} {'loss': 0.5277, 'learning_rate': 9.443789586804349e-06, 'epoch': 1.04} {'loss': 0.5539, 'learning_rate': 9.443462742326319e-06, 'epoch': 1.04} {'loss': 0.5271, 'learning_rate': 9.443135898444666e-06, 'epoch': 1.04} {'loss': 0.6336, 'learning_rate': 9.442809055159744e-06, 'epoch': 1.04} {'loss': 0.4537, 'learning_rate': 9.442482212471907e-06, 'epoch': 1.04} {'loss': 0.488, 'learning_rate': 9.442155370381491e-06, 'epoch': 1.04} {'loss': 0.4913, 'learning_rate': 9.441828528888863e-06, 'epoch': 1.04} {'loss': 0.4825, 'learning_rate': 9.441501687994365e-06, 'epoch': 1.04} {'loss': 0.6102, 'learning_rate': 9.441174847698345e-06, 'epoch': 1.04} {'loss': 0.537, 'learning_rate': 9.44084800800116e-06, 'epoch': 1.04} {'loss': 0.5056, 'learning_rate': 9.440521168903157e-06, 'epoch': 1.04} {'loss': 0.622, 'learning_rate': 9.440194330404686e-06, 'epoch': 1.04} {'loss': 0.5656, 'learning_rate': 9.439867492506095e-06, 'epoch': 1.04} {'loss': 0.5227, 'learning_rate': 9.439540655207738e-06, 'epoch': 1.04} {'loss': 0.497, 'learning_rate': 9.439213818509963e-06, 'epoch': 1.04} {'loss': 0.4712, 'learning_rate': 9.438886982413124e-06, 'epoch': 1.04} {'loss': 0.5884, 'learning_rate': 9.438560146917562e-06, 'epoch': 1.04} {'loss': 0.5938, 'learning_rate': 9.438233312023638e-06, 'epoch': 1.04} {'loss': 0.5651, 'learning_rate': 9.4379064777317e-06, 'epoch': 1.04} {'loss': 0.5403, 'learning_rate': 9.437579644042091e-06, 'epoch': 1.04} {'loss': 0.64, 'learning_rate': 9.437252810955169e-06, 'epoch': 1.04} {'loss': 0.477, 'learning_rate': 9.43692597847128e-06, 'epoch': 1.04} {'loss': 0.643, 'learning_rate': 9.436599146590779e-06, 'epoch': 1.04} {'loss': 0.494, 'learning_rate': 9.43627231531401e-06, 'epoch': 1.04} {'loss': 0.4754, 'learning_rate': 9.435945484641324e-06, 'epoch': 1.04} {'loss': 0.8156, 'learning_rate': 9.435618654573076e-06, 'epoch': 1.04} {'loss': 0.6279, 'learning_rate': 9.435291825109612e-06, 'epoch': 1.04} {'loss': 0.5097, 'learning_rate': 9.434964996251286e-06, 'epoch': 1.04} {'loss': 0.5596, 'learning_rate': 9.434638167998443e-06, 'epoch': 1.04} {'loss': 0.5583, 'learning_rate': 9.43431134035144e-06, 'epoch': 1.04} {'loss': 0.6542, 'learning_rate': 9.433984513310624e-06, 'epoch': 1.04} {'loss': 0.6915, 'learning_rate': 9.433657686876339e-06, 'epoch': 1.04} {'loss': 0.7062, 'learning_rate': 9.433330861048946e-06, 'epoch': 1.04} {'loss': 0.6288, 'learning_rate': 9.433004035828784e-06, 'epoch': 1.04} {'loss': 0.6104, 'learning_rate': 9.432677211216216e-06, 'epoch': 1.04} {'loss': 0.5411, 'learning_rate': 9.432350387211582e-06, 'epoch': 1.04} {'loss': 0.6246, 'learning_rate': 9.432023563815238e-06, 'epoch': 1.04} {'loss': 0.6182, 'learning_rate': 9.431696741027533e-06, 'epoch': 1.04} {'loss': 0.6631, 'learning_rate': 9.431369918848811e-06, 'epoch': 1.04} {'loss': 0.5634, 'learning_rate': 9.431043097279433e-06, 'epoch': 1.04} {'loss': 0.6097, 'learning_rate': 9.430716276319738e-06, 'epoch': 1.04} {'loss': 0.5229, 'learning_rate': 9.430389455970087e-06, 'epoch': 1.04} {'loss': 0.6166, 'learning_rate': 9.430062636230825e-06, 'epoch': 1.04} {'loss': 0.5561, 'learning_rate': 9.4297358171023e-06, 'epoch': 1.04} {'loss': 0.5892, 'learning_rate': 9.429408998584867e-06, 'epoch': 1.04} {'loss': 0.5813, 'learning_rate': 9.429082180678868e-06, 'epoch': 1.04} {'loss': 0.4638, 'learning_rate': 9.428755363384665e-06, 'epoch': 1.04} {'loss': 0.6062, 'learning_rate': 9.428428546702599e-06, 'epoch': 1.04} {'loss': 0.5918, 'learning_rate': 9.428101730633026e-06, 'epoch': 1.04} {'loss': 0.3573, 'learning_rate': 9.427774915176292e-06, 'epoch': 1.04} {'loss': 0.5622, 'learning_rate': 9.427448100332749e-06, 'epoch': 1.04} {'loss': 0.6634, 'learning_rate': 9.427121286102748e-06, 'epoch': 1.04} {'loss': 0.6122, 'learning_rate': 9.426794472486634e-06, 'epoch': 1.04} {'loss': 0.5734, 'learning_rate': 9.426467659484767e-06, 'epoch': 1.04} {'loss': 0.5668, 'learning_rate': 9.426140847097492e-06, 'epoch': 1.04} {'loss': 0.623, 'learning_rate': 9.425814035325152e-06, 'epoch': 1.04} {'loss': 0.4602, 'learning_rate': 9.42548722416811e-06, 'epoch': 1.04} {'loss': 0.4809, 'learning_rate': 9.425160413626708e-06, 'epoch': 1.04} {'loss': 0.4949, 'learning_rate': 9.424833603701302e-06, 'epoch': 1.04} {'loss': 0.3913, 'learning_rate': 9.424506794392232e-06, 'epoch': 1.04} {'loss': 0.5339, 'learning_rate': 9.42417998569986e-06, 'epoch': 1.04} {'loss': 0.4439, 'learning_rate': 9.423853177624531e-06, 'epoch': 1.04} {'loss': 0.5196, 'learning_rate': 9.423526370166591e-06, 'epoch': 1.04} {'loss': 0.6378, 'learning_rate': 9.423199563326399e-06, 'epoch': 1.04} {'loss': 0.4671, 'learning_rate': 9.4228727571043e-06, 'epoch': 1.04} {'loss': 0.5834, 'learning_rate': 9.422545951500646e-06, 'epoch': 1.04} {'loss': 0.4384, 'learning_rate': 9.422219146515781e-06, 'epoch': 1.04} {'loss': 0.7529, 'learning_rate': 9.421892342150065e-06, 'epoch': 1.04} {'loss': 0.5575, 'learning_rate': 9.421565538403844e-06, 'epoch': 1.04} {'loss': 0.471, 'learning_rate': 9.421238735277464e-06, 'epoch': 1.04} {'loss': 0.6319, 'learning_rate': 9.420911932771282e-06, 'epoch': 1.04} {'loss': 0.6159, 'learning_rate': 9.420585130885643e-06, 'epoch': 1.04} {'loss': 0.4274, 'learning_rate': 9.420258329620903e-06, 'epoch': 1.04} {'loss': 0.5955, 'learning_rate': 9.419931528977408e-06, 'epoch': 1.04} {'loss': 0.589, 'learning_rate': 9.419604728955502e-06, 'epoch': 1.04} {'loss': 0.6637, 'learning_rate': 9.419277929555549e-06, 'epoch': 1.04} {'loss': 0.5619, 'learning_rate': 9.418951130777887e-06, 'epoch': 1.04} {'loss': 0.5231, 'learning_rate': 9.418624332622875e-06, 'epoch': 1.04} {'loss': 0.692, 'learning_rate': 9.41829753509086e-06, 'epoch': 1.04} {'loss': 0.5628, 'learning_rate': 9.41797073818219e-06, 'epoch': 1.04} {'loss': 0.4146, 'learning_rate': 9.417643941897219e-06, 'epoch': 1.04} {'loss': 0.6702, 'learning_rate': 9.41731714623629e-06, 'epoch': 1.04} {'loss': 0.6191, 'learning_rate': 9.416990351199763e-06, 'epoch': 1.04} {'loss': 0.4979, 'learning_rate': 9.416663556787982e-06, 'epoch': 1.04} {'loss': 0.5385, 'learning_rate': 9.416336763001297e-06, 'epoch': 1.04} {'loss': 0.5374, 'learning_rate': 9.41600996984006e-06, 'epoch': 1.04} {'loss': 0.4417, 'learning_rate': 9.415683177304625e-06, 'epoch': 1.04} {'loss': 0.5661, 'learning_rate': 9.415356385395338e-06, 'epoch': 1.04} {'loss': 0.5013, 'learning_rate': 9.415029594112543e-06, 'epoch': 1.04} {'loss': 0.5581, 'learning_rate': 9.414702803456604e-06, 'epoch': 1.04} {'loss': 0.6261, 'learning_rate': 9.414376013427858e-06, 'epoch': 1.04} {'loss': 0.5415, 'learning_rate': 9.414049224026666e-06, 'epoch': 1.04} {'loss': 0.6077, 'learning_rate': 9.41372243525337e-06, 'epoch': 1.04} {'loss': 0.4547, 'learning_rate': 9.413395647108321e-06, 'epoch': 1.04} {'loss': 0.6138, 'learning_rate': 9.413068859591876e-06, 'epoch': 1.04} {'loss': 0.6414, 'learning_rate': 9.412742072704377e-06, 'epoch': 1.04} {'loss': 0.5376, 'learning_rate': 9.412415286446183e-06, 'epoch': 1.04} {'loss': 0.6028, 'learning_rate': 9.412088500817634e-06, 'epoch': 1.04} {'loss': 0.5349, 'learning_rate': 9.411761715819089e-06, 'epoch': 1.04} {'loss': 0.4179, 'learning_rate': 9.411434931450894e-06, 'epoch': 1.04} {'loss': 0.5933, 'learning_rate': 9.411108147713395e-06, 'epoch': 1.04} {'loss': 0.5631, 'learning_rate': 9.410781364606953e-06, 'epoch': 1.04} {'loss': 0.4786, 'learning_rate': 9.410454582131906e-06, 'epoch': 1.04} {'loss': 0.5456, 'learning_rate': 9.410127800288615e-06, 'epoch': 1.04} {'loss': 0.5051, 'learning_rate': 9.409801019077422e-06, 'epoch': 1.04} {'loss': 0.5383, 'learning_rate': 9.409474238498683e-06, 'epoch': 1.04} {'loss': 0.5504, 'learning_rate': 9.409147458552746e-06, 'epoch': 1.04} {'loss': 0.5998, 'learning_rate': 9.408820679239956e-06, 'epoch': 1.04} {'loss': 0.5635, 'learning_rate': 9.408493900560673e-06, 'epoch': 1.04} {'loss': 0.4798, 'learning_rate': 9.408167122515239e-06, 'epoch': 1.04} {'loss': 0.5168, 'learning_rate': 9.407840345104009e-06, 'epoch': 1.04} {'loss': 0.5007, 'learning_rate': 9.407513568327334e-06, 'epoch': 1.04} {'loss': 0.6617, 'learning_rate': 9.407186792185557e-06, 'epoch': 1.04} {'loss': 0.6904, 'learning_rate': 9.406860016679036e-06, 'epoch': 1.04} {'loss': 0.5685, 'learning_rate': 9.406533241808114e-06, 'epoch': 1.04} {'loss': 0.6792, 'learning_rate': 9.40620646757315e-06, 'epoch': 1.04} {'loss': 0.5311, 'learning_rate': 9.405879693974485e-06, 'epoch': 1.04} {'loss': 0.5122, 'learning_rate': 9.405552921012477e-06, 'epoch': 1.04} {'loss': 0.6449, 'learning_rate': 9.405226148687475e-06, 'epoch': 1.04} {'loss': 0.6635, 'learning_rate': 9.404899376999822e-06, 'epoch': 1.04} {'loss': 0.6424, 'learning_rate': 9.404572605949876e-06, 'epoch': 1.04} {'loss': 0.5299, 'learning_rate': 9.40424583553798e-06, 'epoch': 1.04} {'loss': 0.4754, 'learning_rate': 9.403919065764494e-06, 'epoch': 1.04} {'loss': 0.5241, 'learning_rate': 9.403592296629755e-06, 'epoch': 1.04} {'loss': 0.5329, 'learning_rate': 9.403265528134127e-06, 'epoch': 1.04} {'loss': 0.7068, 'learning_rate': 9.402938760277954e-06, 'epoch': 1.04} {'loss': 0.5488, 'learning_rate': 9.402611993061584e-06, 'epoch': 1.04} {'loss': 0.6305, 'learning_rate': 9.40228522648537e-06, 'epoch': 1.04} {'loss': 0.7819, 'learning_rate': 9.401958460549658e-06, 'epoch': 1.04} {'loss': 0.4547, 'learning_rate': 9.401631695254806e-06, 'epoch': 1.04} {'loss': 0.6038, 'learning_rate': 9.401304930601159e-06, 'epoch': 1.04} {'loss': 0.6127, 'learning_rate': 9.400978166589065e-06, 'epoch': 1.04} {'loss': 0.5698, 'learning_rate': 9.40065140321888e-06, 'epoch': 1.04} {'loss': 0.4918, 'learning_rate': 9.400324640490949e-06, 'epoch': 1.04} {'loss': 0.4776, 'learning_rate': 9.399997878405626e-06, 'epoch': 1.04} {'loss': 0.5692, 'learning_rate': 9.399671116963254e-06, 'epoch': 1.04} {'loss': 0.59, 'learning_rate': 9.399344356164197e-06, 'epoch': 1.04} {'loss': 0.5334, 'learning_rate': 9.399017596008793e-06, 'epoch': 1.04} {'loss': 0.4752, 'learning_rate': 9.398690836497394e-06, 'epoch': 1.04} {'loss': 0.54, 'learning_rate': 9.398364077630354e-06, 'epoch': 1.04} {'loss': 0.4937, 'learning_rate': 9.39803731940802e-06, 'epoch': 1.04} {'loss': 0.6747, 'learning_rate': 9.397710561830746e-06, 'epoch': 1.04} {'loss': 0.4996, 'learning_rate': 9.397383804898878e-06, 'epoch': 1.04} {'loss': 0.64, 'learning_rate': 9.397057048612765e-06, 'epoch': 1.04} {'loss': 0.4994, 'learning_rate': 9.396730292972765e-06, 'epoch': 1.04} {'loss': 0.6654, 'learning_rate': 9.396403537979216e-06, 'epoch': 1.04} {'loss': 0.4746, 'learning_rate': 9.396076783632481e-06, 'epoch': 1.04} {'loss': 0.5545, 'learning_rate': 9.395750029932902e-06, 'epoch': 1.04} {'loss': 0.5538, 'learning_rate': 9.395423276880833e-06, 'epoch': 1.04} {'loss': 0.526, 'learning_rate': 9.395096524476623e-06, 'epoch': 1.04} {'loss': 0.5638, 'learning_rate': 9.394769772720616e-06, 'epoch': 1.04} {'loss': 0.5104, 'learning_rate': 9.394443021613174e-06, 'epoch': 1.04} {'loss': 0.4848, 'learning_rate': 9.394116271154636e-06, 'epoch': 1.04} {'loss': 0.5701, 'learning_rate': 9.393789521345362e-06, 'epoch': 1.04} {'loss': 0.5187, 'learning_rate': 9.393462772185694e-06, 'epoch': 1.04} {'loss': 0.5457, 'learning_rate': 9.393136023675987e-06, 'epoch': 1.04} {'loss': 0.5355, 'learning_rate': 9.392809275816591e-06, 'epoch': 1.04} {'loss': 0.6107, 'learning_rate': 9.39248252860785e-06, 'epoch': 1.04} {'loss': 0.4189, 'learning_rate': 9.392155782050123e-06, 'epoch': 1.04} {'loss': 0.5413, 'learning_rate': 9.391829036143753e-06, 'epoch': 1.04} {'loss': 0.4129, 'learning_rate': 9.391502290889093e-06, 'epoch': 1.04} {'loss': 0.6618, 'learning_rate': 9.391175546286497e-06, 'epoch': 1.04} {'loss': 0.5895, 'learning_rate': 9.390848802336309e-06, 'epoch': 1.04} {'loss': 0.6748, 'learning_rate': 9.390522059038884e-06, 'epoch': 1.04} {'loss': 0.5519, 'learning_rate': 9.390195316394563e-06, 'epoch': 1.04} {'loss': 0.7003, 'learning_rate': 9.389868574403708e-06, 'epoch': 1.04} {'loss': 0.5726, 'learning_rate': 9.389541833066662e-06, 'epoch': 1.04} {'loss': 0.6928, 'learning_rate': 9.38921509238378e-06, 'epoch': 1.04} {'loss': 0.628, 'learning_rate': 9.388888352355406e-06, 'epoch': 1.04} {'loss': 0.558, 'learning_rate': 9.388561612981893e-06, 'epoch': 1.04} {'loss': 0.5387, 'learning_rate': 9.388234874263595e-06, 'epoch': 1.04} {'loss': 0.6492, 'learning_rate': 9.387908136200854e-06, 'epoch': 1.04} {'loss': 0.5452, 'learning_rate': 9.387581398794028e-06, 'epoch': 1.04} {'loss': 0.5553, 'learning_rate': 9.387254662043462e-06, 'epoch': 1.04} {'loss': 0.5068, 'learning_rate': 9.38692792594951e-06, 'epoch': 1.04} {'loss': 0.6064, 'learning_rate': 9.38660119051252e-06, 'epoch': 1.04} {'loss': 0.5077, 'learning_rate': 9.386274455732837e-06, 'epoch': 1.04} {'loss': 0.6425, 'learning_rate': 9.385947721610823e-06, 'epoch': 1.04} {'loss': 0.6952, 'learning_rate': 9.385620988146815e-06, 'epoch': 1.04} {'loss': 0.6023, 'learning_rate': 9.385294255341175e-06, 'epoch': 1.04} {'loss': 0.5956, 'learning_rate': 9.384967523194247e-06, 'epoch': 1.04} {'loss': 0.5576, 'learning_rate': 9.38464079170638e-06, 'epoch': 1.04} {'loss': 0.5194, 'learning_rate': 9.38431406087793e-06, 'epoch': 1.04} {'loss': 0.667, 'learning_rate': 9.383987330709235e-06, 'epoch': 1.04} {'loss': 0.6208, 'learning_rate': 9.38366060120066e-06, 'epoch': 1.04} {'loss': 0.5006, 'learning_rate': 9.383333872352543e-06, 'epoch': 1.04} {'loss': 0.6064, 'learning_rate': 9.383007144165245e-06, 'epoch': 1.04} {'loss': 0.5783, 'learning_rate': 9.38268041663911e-06, 'epoch': 1.04} {'loss': 0.6032, 'learning_rate': 9.382353689774486e-06, 'epoch': 1.04} {'loss': 0.6042, 'learning_rate': 9.382026963571728e-06, 'epoch': 1.04} {'loss': 0.5301, 'learning_rate': 9.381700238031178e-06, 'epoch': 1.04} {'loss': 0.5154, 'learning_rate': 9.381373513153197e-06, 'epoch': 1.04} {'loss': 0.68, 'learning_rate': 9.381046788938128e-06, 'epoch': 1.04} {'loss': 0.6403, 'learning_rate': 9.380720065386327e-06, 'epoch': 1.04} {'loss': 0.5797, 'learning_rate': 9.380393342498138e-06, 'epoch': 1.04} {'loss': 0.47, 'learning_rate': 9.380066620273915e-06, 'epoch': 1.04} {'loss': 0.5823, 'learning_rate': 9.379739898714005e-06, 'epoch': 1.04} {'loss': 0.5229, 'learning_rate': 9.379413177818757e-06, 'epoch': 1.04} {'loss': 0.504, 'learning_rate': 9.37908645758853e-06, 'epoch': 1.04} {'loss': 0.6543, 'learning_rate': 9.378759738023665e-06, 'epoch': 1.04} {'loss': 0.6889, 'learning_rate': 9.378433019124512e-06, 'epoch': 1.04} {'loss': 0.6137, 'learning_rate': 9.378106300891428e-06, 'epoch': 1.04} {'loss': 0.691, 'learning_rate': 9.377779583324756e-06, 'epoch': 1.04} {'loss': 0.6099, 'learning_rate': 9.377452866424853e-06, 'epoch': 1.04} {'loss': 0.4804, 'learning_rate': 9.37712615019206e-06, 'epoch': 1.04} {'loss': 0.5207, 'learning_rate': 9.37679943462674e-06, 'epoch': 1.04} {'loss': 0.6272, 'learning_rate': 9.37647271972923e-06, 'epoch': 1.04} {'loss': 0.5681, 'learning_rate': 9.376146005499887e-06, 'epoch': 1.04} {'loss': 0.5492, 'learning_rate': 9.375819291939061e-06, 'epoch': 1.04} {'loss': 0.6483, 'learning_rate': 9.3754925790471e-06, 'epoch': 1.04} {'loss': 0.6044, 'learning_rate': 9.375165866824357e-06, 'epoch': 1.04} {'loss': 0.5097, 'learning_rate': 9.374839155271175e-06, 'epoch': 1.04} {'loss': 0.6917, 'learning_rate': 9.374512444387915e-06, 'epoch': 1.04} {'loss': 0.5999, 'learning_rate': 9.374185734174921e-06, 'epoch': 1.04} {'loss': 0.7032, 'learning_rate': 9.37385902463254e-06, 'epoch': 1.04} {'loss': 0.5045, 'learning_rate': 9.373532315761128e-06, 'epoch': 1.04} {'loss': 0.433, 'learning_rate': 9.373205607561031e-06, 'epoch': 1.04} {'loss': 0.6017, 'learning_rate': 9.372878900032603e-06, 'epoch': 1.04} {'loss': 0.6059, 'learning_rate': 9.372552193176192e-06, 'epoch': 1.04} {'loss': 0.3895, 'learning_rate': 9.372225486992143e-06, 'epoch': 1.04} {'loss': 0.596, 'learning_rate': 9.371898781480817e-06, 'epoch': 1.04} {'loss': 0.556, 'learning_rate': 9.371572076642553e-06, 'epoch': 1.04} {'loss': 0.4735, 'learning_rate': 9.371245372477711e-06, 'epoch': 1.04} {'loss': 0.6666, 'learning_rate': 9.370918668986633e-06, 'epoch': 1.04} {'loss': 0.6712, 'learning_rate': 9.370591966169675e-06, 'epoch': 1.04} {'loss': 0.4808, 'learning_rate': 9.370265264027185e-06, 'epoch': 1.04} {'loss': 0.5655, 'learning_rate': 9.369938562559509e-06, 'epoch': 1.04} {'loss': 0.546, 'learning_rate': 9.369611861767003e-06, 'epoch': 1.04} {'loss': 0.539, 'learning_rate': 9.369285161650011e-06, 'epoch': 1.04} {'loss': 0.5771, 'learning_rate': 9.368958462208893e-06, 'epoch': 1.04} {'loss': 0.6701, 'learning_rate': 9.368631763443992e-06, 'epoch': 1.04} {'loss': 0.6738, 'learning_rate': 9.368305065355656e-06, 'epoch': 1.04} {'loss': 0.4904, 'learning_rate': 9.36797836794424e-06, 'epoch': 1.04} {'loss': 0.5714, 'learning_rate': 9.36765167121009e-06, 'epoch': 1.04} {'loss': 0.3855, 'learning_rate': 9.367324975153562e-06, 'epoch': 1.04} {'loss': 0.6591, 'learning_rate': 9.366998279774998e-06, 'epoch': 1.04} {'loss': 0.5867, 'learning_rate': 9.366671585074754e-06, 'epoch': 1.04} {'loss': 0.4932, 'learning_rate': 9.366344891053183e-06, 'epoch': 1.04} {'loss': 0.4597, 'learning_rate': 9.366018197710625e-06, 'epoch': 1.04} {'loss': 0.3779, 'learning_rate': 9.365691505047438e-06, 'epoch': 1.04} {'loss': 0.6507, 'learning_rate': 9.365364813063967e-06, 'epoch': 1.04} {'loss': 0.5442, 'learning_rate': 9.36503812176057e-06, 'epoch': 1.04} {'loss': 0.6124, 'learning_rate': 9.364711431137587e-06, 'epoch': 1.04} {'loss': 0.3586, 'learning_rate': 9.364384741195378e-06, 'epoch': 1.04} {'loss': 0.551, 'learning_rate': 9.364058051934284e-06, 'epoch': 1.04} {'loss': 0.4326, 'learning_rate': 9.36373136335466e-06, 'epoch': 1.04} {'loss': 0.6597, 'learning_rate': 9.36340467545686e-06, 'epoch': 1.04} {'loss': 0.5224, 'learning_rate': 9.363077988241221e-06, 'epoch': 1.04} {'loss': 0.5145, 'learning_rate': 9.362751301708107e-06, 'epoch': 1.04} {'loss': 0.5464, 'learning_rate': 9.362424615857862e-06, 'epoch': 1.04} {'loss': 0.5469, 'learning_rate': 9.362097930690835e-06, 'epoch': 1.04} {'loss': 0.5261, 'learning_rate': 9.36177124620738e-06, 'epoch': 1.04} {'loss': 0.5526, 'learning_rate': 9.36144456240784e-06, 'epoch': 1.04} {'loss': 0.5651, 'learning_rate': 9.361117879292576e-06, 'epoch': 1.04} {'loss': 0.4783, 'learning_rate': 9.360791196861925e-06, 'epoch': 1.04} {'loss': 0.4332, 'learning_rate': 9.360464515116249e-06, 'epoch': 1.04} {'loss': 0.5103, 'learning_rate': 9.360137834055894e-06, 'epoch': 1.04} {'loss': 0.6469, 'learning_rate': 9.359811153681206e-06, 'epoch': 1.04} {'loss': 0.581, 'learning_rate': 9.359484473992541e-06, 'epoch': 1.04} {'loss': 0.6492, 'learning_rate': 9.359157794990241e-06, 'epoch': 1.04} {'loss': 0.5797, 'learning_rate': 9.358831116674664e-06, 'epoch': 1.04} {'loss': 0.6091, 'learning_rate': 9.358504439046156e-06, 'epoch': 1.04} {'loss': 0.5512, 'learning_rate': 9.358177762105072e-06, 'epoch': 1.04} {'loss': 0.6414, 'learning_rate': 9.357851085851758e-06, 'epoch': 1.04} {'loss': 0.5636, 'learning_rate': 9.357524410286563e-06, 'epoch': 1.04} {'loss': 0.4433, 'learning_rate': 9.35719773540984e-06, 'epoch': 1.04} {'loss': 0.6669, 'learning_rate': 9.356871061221933e-06, 'epoch': 1.04} {'loss': 0.4834, 'learning_rate': 9.3565443877232e-06, 'epoch': 1.04} {'loss': 0.6984, 'learning_rate': 9.35621771491399e-06, 'epoch': 1.04} {'loss': 0.5345, 'learning_rate': 9.355891042794646e-06, 'epoch': 1.04} {'loss': 0.6426, 'learning_rate': 9.355564371365526e-06, 'epoch': 1.04} {'loss': 0.61, 'learning_rate': 9.355237700626976e-06, 'epoch': 1.04} {'loss': 0.5705, 'learning_rate': 9.35491103057935e-06, 'epoch': 1.04} {'loss': 0.4314, 'learning_rate': 9.354584361222989e-06, 'epoch': 1.04} {'loss': 0.5448, 'learning_rate': 9.354257692558255e-06, 'epoch': 1.04} {'loss': 0.5939, 'learning_rate': 9.35393102458549e-06, 'epoch': 1.04} {'loss': 0.5471, 'learning_rate': 9.353604357305044e-06, 'epoch': 1.04} {'loss': 0.503, 'learning_rate': 9.353277690717272e-06, 'epoch': 1.04} {'loss': 0.6325, 'learning_rate': 9.35295102482252e-06, 'epoch': 1.04} {'loss': 0.4476, 'learning_rate': 9.352624359621141e-06, 'epoch': 1.04} {'loss': 0.5732, 'learning_rate': 9.35229769511348e-06, 'epoch': 1.04} {'loss': 0.5681, 'learning_rate': 9.351971031299894e-06, 'epoch': 1.04} {'loss': 0.6467, 'learning_rate': 9.35164436818073e-06, 'epoch': 1.04} {'loss': 0.5471, 'learning_rate': 9.351317705756333e-06, 'epoch': 1.04} {'loss': 0.6605, 'learning_rate': 9.350991044027063e-06, 'epoch': 1.04} {'loss': 0.6028, 'learning_rate': 9.35066438299326e-06, 'epoch': 1.04} {'loss': 0.5043, 'learning_rate': 9.350337722655282e-06, 'epoch': 1.04} {'loss': 0.5756, 'learning_rate': 9.350011063013478e-06, 'epoch': 1.04} {'loss': 0.4888, 'learning_rate': 9.349684404068188e-06, 'epoch': 1.04} {'loss': 0.5806, 'learning_rate': 9.349357745819777e-06, 'epoch': 1.04} {'loss': 0.5239, 'learning_rate': 9.349031088268581e-06, 'epoch': 1.04} {'loss': 0.6724, 'learning_rate': 9.348704431414964e-06, 'epoch': 1.04} {'loss': 0.6693, 'learning_rate': 9.348377775259265e-06, 'epoch': 1.04} {'loss': 0.7003, 'learning_rate': 9.34805111980184e-06, 'epoch': 1.04} {'loss': 0.6996, 'learning_rate': 9.347724465043039e-06, 'epoch': 1.04} {'loss': 0.5707, 'learning_rate': 9.347397810983204e-06, 'epoch': 1.04} {'loss': 0.7007, 'learning_rate': 9.347071157622697e-06, 'epoch': 1.04} {'loss': 0.5202, 'learning_rate': 9.346744504961856e-06, 'epoch': 1.04} {'loss': 0.4561, 'learning_rate': 9.346417853001044e-06, 'epoch': 1.04} {'loss': 0.5018, 'learning_rate': 9.346091201740599e-06, 'epoch': 1.04} {'loss': 0.6616, 'learning_rate': 9.34576455118088e-06, 'epoch': 1.04} {'loss': 0.3117, 'learning_rate': 9.345437901322235e-06, 'epoch': 1.04} {'loss': 0.6933, 'learning_rate': 9.345111252165005e-06, 'epoch': 1.04} {'loss': 0.6889, 'learning_rate': 9.344784603709554e-06, 'epoch': 1.04} {'loss': 0.5984, 'learning_rate': 9.344457955956218e-06, 'epoch': 1.04} {'loss': 0.7244, 'learning_rate': 9.344131308905363e-06, 'epoch': 1.04} {'loss': 0.5578, 'learning_rate': 9.343804662557328e-06, 'epoch': 1.04} {'loss': 0.6329, 'learning_rate': 9.343478016912464e-06, 'epoch': 1.04} {'loss': 0.5424, 'learning_rate': 9.343151371971124e-06, 'epoch': 1.04} {'loss': 0.5891, 'learning_rate': 9.342824727733653e-06, 'epoch': 1.04} {'loss': 0.5922, 'learning_rate': 9.342498084200408e-06, 'epoch': 1.04} {'loss': 0.6286, 'learning_rate': 9.342171441371734e-06, 'epoch': 1.04} {'loss': 0.6858, 'learning_rate': 9.341844799247985e-06, 'epoch': 1.04} {'loss': 0.715, 'learning_rate': 9.341518157829507e-06, 'epoch': 1.04} {'loss': 0.6865, 'learning_rate': 9.341191517116652e-06, 'epoch': 1.04} {'loss': 0.4991, 'learning_rate': 9.340864877109771e-06, 'epoch': 1.04} {'loss': 0.4472, 'learning_rate': 9.34053823780921e-06, 'epoch': 1.04} {'loss': 0.6235, 'learning_rate': 9.340211599215324e-06, 'epoch': 1.05} {'loss': 0.5954, 'learning_rate': 9.339884961328463e-06, 'epoch': 1.05} {'loss': 0.6802, 'learning_rate': 9.339558324148968e-06, 'epoch': 1.05} {'loss': 0.6014, 'learning_rate': 9.339231687677202e-06, 'epoch': 1.05} {'loss': 0.582, 'learning_rate': 9.338905051913506e-06, 'epoch': 1.05} {'loss': 0.5444, 'learning_rate': 9.338578416858234e-06, 'epoch': 1.05} {'loss': 0.4581, 'learning_rate': 9.338251782511733e-06, 'epoch': 1.05} {'loss': 0.5191, 'learning_rate': 9.337925148874358e-06, 'epoch': 1.05} {'loss': 0.4096, 'learning_rate': 9.337598515946455e-06, 'epoch': 1.05} {'loss': 0.6218, 'learning_rate': 9.337271883728375e-06, 'epoch': 1.05} {'loss': 0.6399, 'learning_rate': 9.336945252220465e-06, 'epoch': 1.05} {'loss': 0.4807, 'learning_rate': 9.336618621423081e-06, 'epoch': 1.05} {'loss': 0.5599, 'learning_rate': 9.336291991336571e-06, 'epoch': 1.05} {'loss': 0.6985, 'learning_rate': 9.33596536196128e-06, 'epoch': 1.05} {'loss': 0.5216, 'learning_rate': 9.335638733297566e-06, 'epoch': 1.05} {'loss': 0.7445, 'learning_rate': 9.335312105345775e-06, 'epoch': 1.05} {'loss': 0.7401, 'learning_rate': 9.334985478106255e-06, 'epoch': 1.05} {'loss': 0.6821, 'learning_rate': 9.33465885157936e-06, 'epoch': 1.05} {'loss': 0.5467, 'learning_rate': 9.334332225765435e-06, 'epoch': 1.05} {'loss': 0.4156, 'learning_rate': 9.334005600664837e-06, 'epoch': 1.05} {'loss': 0.7626, 'learning_rate': 9.33367897627791e-06, 'epoch': 1.05} {'loss': 0.5717, 'learning_rate': 9.333352352605005e-06, 'epoch': 1.05} {'loss': 0.666, 'learning_rate': 9.333025729646475e-06, 'epoch': 1.05} {'loss': 0.5575, 'learning_rate': 9.332699107402667e-06, 'epoch': 1.05} {'loss': 0.5876, 'learning_rate': 9.332372485873934e-06, 'epoch': 1.05} {'loss': 0.57, 'learning_rate': 9.33204586506062e-06, 'epoch': 1.05} {'loss': 0.5604, 'learning_rate': 9.331719244963081e-06, 'epoch': 1.05} {'loss': 0.6178, 'learning_rate': 9.331392625581668e-06, 'epoch': 1.05} {'loss': 0.4992, 'learning_rate': 9.331066006916725e-06, 'epoch': 1.05} {'loss': 0.6637, 'learning_rate': 9.330739388968607e-06, 'epoch': 1.05} {'loss': 0.5337, 'learning_rate': 9.330412771737662e-06, 'epoch': 1.05} {'loss': 0.6505, 'learning_rate': 9.33008615522424e-06, 'epoch': 1.05} {'loss': 0.5455, 'learning_rate': 9.329759539428688e-06, 'epoch': 1.05} {'loss': 0.3744, 'learning_rate': 9.329432924351363e-06, 'epoch': 1.05} {'loss': 0.5651, 'learning_rate': 9.329106309992613e-06, 'epoch': 1.05} {'loss': 0.4285, 'learning_rate': 9.32877969635278e-06, 'epoch': 1.05} {'loss': 0.5653, 'learning_rate': 9.328453083432224e-06, 'epoch': 1.05} {'loss': 0.659, 'learning_rate': 9.32812647123129e-06, 'epoch': 1.05} {'loss': 0.5211, 'learning_rate': 9.327799859750332e-06, 'epoch': 1.05} {'loss': 0.5528, 'learning_rate': 9.327473248989697e-06, 'epoch': 1.05} {'loss': 0.642, 'learning_rate': 9.327146638949729e-06, 'epoch': 1.05} {'loss': 0.6277, 'learning_rate': 9.326820029630788e-06, 'epoch': 1.05} {'loss': 0.4976, 'learning_rate': 9.326493421033217e-06, 'epoch': 1.05} {'loss': 0.5735, 'learning_rate': 9.326166813157375e-06, 'epoch': 1.05} {'loss': 0.6059, 'learning_rate': 9.325840206003603e-06, 'epoch': 1.05} {'loss': 0.6061, 'learning_rate': 9.325513599572254e-06, 'epoch': 1.05} {'loss': 0.7233, 'learning_rate': 9.325186993863681e-06, 'epoch': 1.05} {'loss': 0.5096, 'learning_rate': 9.324860388878225e-06, 'epoch': 1.05} {'loss': 0.6056, 'learning_rate': 9.324533784616247e-06, 'epoch': 1.05} {'loss': 0.457, 'learning_rate': 9.324207181078087e-06, 'epoch': 1.05} {'loss': 0.6616, 'learning_rate': 9.323880578264107e-06, 'epoch': 1.05} {'loss': 0.8031, 'learning_rate': 9.323553976174645e-06, 'epoch': 1.05} {'loss': 0.6839, 'learning_rate': 9.323227374810058e-06, 'epoch': 1.05} {'loss': 0.4385, 'learning_rate': 9.322900774170694e-06, 'epoch': 1.05} {'loss': 0.611, 'learning_rate': 9.3225741742569e-06, 'epoch': 1.05} {'loss': 0.5909, 'learning_rate': 9.322247575069034e-06, 'epoch': 1.05} {'loss': 0.5135, 'learning_rate': 9.321920976607434e-06, 'epoch': 1.05} {'loss': 0.5069, 'learning_rate': 9.321594378872463e-06, 'epoch': 1.05} {'loss': 0.5938, 'learning_rate': 9.321267781864463e-06, 'epoch': 1.05} {'loss': 0.4505, 'learning_rate': 9.320941185583787e-06, 'epoch': 1.05} {'loss': 0.4499, 'learning_rate': 9.320614590030783e-06, 'epoch': 1.05} {'loss': 0.6401, 'learning_rate': 9.320287995205799e-06, 'epoch': 1.05} {'loss': 0.6065, 'learning_rate': 9.31996140110919e-06, 'epoch': 1.05} {'loss': 0.6955, 'learning_rate': 9.3196348077413e-06, 'epoch': 1.05} {'loss': 0.7603, 'learning_rate': 9.31930821510249e-06, 'epoch': 1.05} {'loss': 0.5703, 'learning_rate': 9.3189816231931e-06, 'epoch': 1.05} {'loss': 0.5831, 'learning_rate': 9.318655032013481e-06, 'epoch': 1.05} {'loss': 0.4891, 'learning_rate': 9.318328441563986e-06, 'epoch': 1.05} {'loss': 0.554, 'learning_rate': 9.31800185184496e-06, 'epoch': 1.05} {'loss': 0.5651, 'learning_rate': 9.317675262856762e-06, 'epoch': 1.05} {'loss': 0.5979, 'learning_rate': 9.31734867459973e-06, 'epoch': 1.05} {'loss': 0.5433, 'learning_rate': 9.317022087074227e-06, 'epoch': 1.05} {'loss': 0.6193, 'learning_rate': 9.316695500280596e-06, 'epoch': 1.05} {'loss': 0.5776, 'learning_rate': 9.316368914219184e-06, 'epoch': 1.05} {'loss': 0.4579, 'learning_rate': 9.316042328890347e-06, 'epoch': 1.05} {'loss': 0.6107, 'learning_rate': 9.31571574429443e-06, 'epoch': 1.05} {'loss': 0.5357, 'learning_rate': 9.315389160431786e-06, 'epoch': 1.05} {'loss': 0.5197, 'learning_rate': 9.315062577302769e-06, 'epoch': 1.05} {'loss': 0.6623, 'learning_rate': 9.314735994907717e-06, 'epoch': 1.05} {'loss': 0.5071, 'learning_rate': 9.314409413246992e-06, 'epoch': 1.05} {'loss': 0.5745, 'learning_rate': 9.314082832320937e-06, 'epoch': 1.05} {'loss': 0.4196, 'learning_rate': 9.313756252129906e-06, 'epoch': 1.05} {'loss': 0.4752, 'learning_rate': 9.313429672674243e-06, 'epoch': 1.05} {'loss': 0.5098, 'learning_rate': 9.313103093954306e-06, 'epoch': 1.05} {'loss': 0.6826, 'learning_rate': 9.312776515970441e-06, 'epoch': 1.05} {'loss': 0.657, 'learning_rate': 9.312449938722996e-06, 'epoch': 1.05} {'loss': 0.4189, 'learning_rate': 9.312123362212325e-06, 'epoch': 1.05} {'loss': 0.6114, 'learning_rate': 9.311796786438774e-06, 'epoch': 1.05} {'loss': 0.4686, 'learning_rate': 9.311470211402697e-06, 'epoch': 1.05} {'loss': 0.5624, 'learning_rate': 9.311143637104441e-06, 'epoch': 1.05} {'loss': 0.4496, 'learning_rate': 9.310817063544355e-06, 'epoch': 1.05} {'loss': 0.3586, 'learning_rate': 9.310490490722793e-06, 'epoch': 1.05} {'loss': 0.3785, 'learning_rate': 9.310163918640101e-06, 'epoch': 1.05} {'loss': 0.6009, 'learning_rate': 9.309837347296632e-06, 'epoch': 1.05} {'loss': 0.501, 'learning_rate': 9.309510776692731e-06, 'epoch': 1.05} {'loss': 0.5095, 'learning_rate': 9.309184206828756e-06, 'epoch': 1.05} {'loss': 0.5443, 'learning_rate': 9.308857637705052e-06, 'epoch': 1.05} {'loss': 0.5109, 'learning_rate': 9.308531069321965e-06, 'epoch': 1.05} {'loss': 0.7247, 'learning_rate': 9.308204501679855e-06, 'epoch': 1.05} {'loss': 0.5975, 'learning_rate': 9.307877934779062e-06, 'epoch': 1.05} {'loss': 0.6816, 'learning_rate': 9.307551368619944e-06, 'epoch': 1.05} {'loss': 0.6037, 'learning_rate': 9.307224803202843e-06, 'epoch': 1.05} {'loss': 0.5658, 'learning_rate': 9.306898238528117e-06, 'epoch': 1.05} {'loss': 0.4953, 'learning_rate': 9.306571674596112e-06, 'epoch': 1.05} {'loss': 0.5586, 'learning_rate': 9.306245111407174e-06, 'epoch': 1.05} {'loss': 0.573, 'learning_rate': 9.305918548961661e-06, 'epoch': 1.05} {'loss': 0.5432, 'learning_rate': 9.305591987259917e-06, 'epoch': 1.05} {'loss': 0.6598, 'learning_rate': 9.305265426302297e-06, 'epoch': 1.05} {'loss': 0.5935, 'learning_rate': 9.304938866089146e-06, 'epoch': 1.05} {'loss': 0.5337, 'learning_rate': 9.304612306620813e-06, 'epoch': 1.05} {'loss': 0.5307, 'learning_rate': 9.304285747897653e-06, 'epoch': 1.05} {'loss': 0.5836, 'learning_rate': 9.30395918992001e-06, 'epoch': 1.05} {'loss': 0.511, 'learning_rate': 9.303632632688244e-06, 'epoch': 1.05} {'loss': 0.5635, 'learning_rate': 9.303306076202693e-06, 'epoch': 1.05} {'loss': 0.5527, 'learning_rate': 9.302979520463717e-06, 'epoch': 1.05} {'loss': 0.5874, 'learning_rate': 9.302652965471662e-06, 'epoch': 1.05} {'loss': 0.5234, 'learning_rate': 9.302326411226871e-06, 'epoch': 1.05} {'loss': 0.6884, 'learning_rate': 9.301999857729705e-06, 'epoch': 1.05} {'loss': 0.5611, 'learning_rate': 9.301673304980505e-06, 'epoch': 1.05} {'loss': 0.6338, 'learning_rate': 9.301346752979628e-06, 'epoch': 1.05} {'loss': 0.5678, 'learning_rate': 9.301020201727421e-06, 'epoch': 1.05} {'loss': 0.4787, 'learning_rate': 9.300693651224236e-06, 'epoch': 1.05} {'loss': 0.697, 'learning_rate': 9.300367101470418e-06, 'epoch': 1.05} {'loss': 0.5372, 'learning_rate': 9.300040552466318e-06, 'epoch': 1.05} {'loss': 0.5214, 'learning_rate': 9.299714004212293e-06, 'epoch': 1.05} {'loss': 0.4141, 'learning_rate': 9.299387456708682e-06, 'epoch': 1.05} {'loss': 0.5213, 'learning_rate': 9.299060909955845e-06, 'epoch': 1.05} {'loss': 0.5052, 'learning_rate': 9.298734363954127e-06, 'epoch': 1.05} {'loss': 0.4903, 'learning_rate': 9.298407818703876e-06, 'epoch': 1.05} {'loss': 0.5846, 'learning_rate': 9.298081274205447e-06, 'epoch': 1.05} {'loss': 0.5022, 'learning_rate': 9.297754730459183e-06, 'epoch': 1.05} {'loss': 0.4732, 'learning_rate': 9.297428187465444e-06, 'epoch': 1.05} {'loss': 0.6633, 'learning_rate': 9.297101645224568e-06, 'epoch': 1.05} {'loss': 0.595, 'learning_rate': 9.296775103736917e-06, 'epoch': 1.05} {'loss': 0.7768, 'learning_rate': 9.296448563002833e-06, 'epoch': 1.05} {'loss': 0.734, 'learning_rate': 9.296122023022666e-06, 'epoch': 1.05} {'loss': 0.6221, 'learning_rate': 9.29579548379677e-06, 'epoch': 1.05} {'loss': 0.6597, 'learning_rate': 9.295468945325488e-06, 'epoch': 1.05} {'loss': 0.6442, 'learning_rate': 9.29514240760918e-06, 'epoch': 1.05} {'loss': 0.5026, 'learning_rate': 9.294815870648186e-06, 'epoch': 1.05} {'loss': 0.537, 'learning_rate': 9.294489334442864e-06, 'epoch': 1.05} {'loss': 0.4972, 'learning_rate': 9.294162798993561e-06, 'epoch': 1.05} {'loss': 0.6176, 'learning_rate': 9.293836264300625e-06, 'epoch': 1.05} {'loss': 0.6284, 'learning_rate': 9.29350973036441e-06, 'epoch': 1.05} {'loss': 0.6744, 'learning_rate': 9.293183197185255e-06, 'epoch': 1.05} {'loss': 0.4574, 'learning_rate': 9.292856664763524e-06, 'epoch': 1.05} {'loss': 0.5647, 'learning_rate': 9.292530133099562e-06, 'epoch': 1.05} {'loss': 0.5415, 'learning_rate': 9.292203602193714e-06, 'epoch': 1.05} {'loss': 0.636, 'learning_rate': 9.291877072046336e-06, 'epoch': 1.05} {'loss': 0.5968, 'learning_rate': 9.291550542657774e-06, 'epoch': 1.05} {'loss': 0.4405, 'learning_rate': 9.291224014028383e-06, 'epoch': 1.05} {'loss': 0.5957, 'learning_rate': 9.290897486158503e-06, 'epoch': 1.05} {'loss': 0.4581, 'learning_rate': 9.290570959048498e-06, 'epoch': 1.05} {'loss': 0.5459, 'learning_rate': 9.290244432698707e-06, 'epoch': 1.05} {'loss': 0.6142, 'learning_rate': 9.28991790710948e-06, 'epoch': 1.05} {'loss': 0.4837, 'learning_rate': 9.289591382281174e-06, 'epoch': 1.05} {'loss': 0.427, 'learning_rate': 9.289264858214134e-06, 'epoch': 1.05} {'loss': 0.4265, 'learning_rate': 9.288938334908712e-06, 'epoch': 1.05} {'loss': 0.6204, 'learning_rate': 9.288611812365252e-06, 'epoch': 1.05} {'loss': 0.4805, 'learning_rate': 9.288285290584113e-06, 'epoch': 1.05} {'loss': 0.6351, 'learning_rate': 9.287958769565641e-06, 'epoch': 1.05} {'loss': 0.5627, 'learning_rate': 9.287632249310184e-06, 'epoch': 1.05} {'loss': 0.6041, 'learning_rate': 9.287305729818092e-06, 'epoch': 1.05} {'loss': 0.6268, 'learning_rate': 9.286979211089718e-06, 'epoch': 1.05} {'loss': 0.4358, 'learning_rate': 9.286652693125411e-06, 'epoch': 1.05} {'loss': 0.5463, 'learning_rate': 9.28632617592552e-06, 'epoch': 1.05} {'loss': 0.4432, 'learning_rate': 9.28599965949039e-06, 'epoch': 1.05} {'loss': 0.5151, 'learning_rate': 9.285673143820381e-06, 'epoch': 1.05} {'loss': 0.5678, 'learning_rate': 9.285346628915837e-06, 'epoch': 1.05} {'loss': 0.5666, 'learning_rate': 9.28502011477711e-06, 'epoch': 1.05} {'loss': 0.3435, 'learning_rate': 9.284693601404541e-06, 'epoch': 1.05} {'loss': 0.7651, 'learning_rate': 9.284367088798496e-06, 'epoch': 1.05} {'loss': 0.5733, 'learning_rate': 9.284040576959313e-06, 'epoch': 1.05} {'loss': 0.4831, 'learning_rate': 9.283714065887343e-06, 'epoch': 1.05} {'loss': 0.4945, 'learning_rate': 9.283387555582941e-06, 'epoch': 1.05} {'loss': 0.5682, 'learning_rate': 9.283061046046453e-06, 'epoch': 1.05} {'loss': 0.5352, 'learning_rate': 9.282734537278231e-06, 'epoch': 1.05} {'loss': 0.54, 'learning_rate': 9.282408029278625e-06, 'epoch': 1.05} {'loss': 0.4592, 'learning_rate': 9.282081522047978e-06, 'epoch': 1.05} {'loss': 0.527, 'learning_rate': 9.281755015586648e-06, 'epoch': 1.05} {'loss': 0.5836, 'learning_rate': 9.281428509894982e-06, 'epoch': 1.05} {'loss': 0.4459, 'learning_rate': 9.28110200497333e-06, 'epoch': 1.05} {'loss': 0.5401, 'learning_rate': 9.280775500822043e-06, 'epoch': 1.05} {'loss': 0.5839, 'learning_rate': 9.280448997441472e-06, 'epoch': 1.05} {'loss': 0.4285, 'learning_rate': 9.280122494831965e-06, 'epoch': 1.05} {'loss': 0.5207, 'learning_rate': 9.279795992993866e-06, 'epoch': 1.05} {'loss': 0.5569, 'learning_rate': 9.279469491927537e-06, 'epoch': 1.05} {'loss': 0.625, 'learning_rate': 9.279142991633315e-06, 'epoch': 1.05} {'loss': 0.482, 'learning_rate': 9.278816492111562e-06, 'epoch': 1.05} {'loss': 0.596, 'learning_rate': 9.27848999336262e-06, 'epoch': 1.05} {'loss': 0.686, 'learning_rate': 9.278163495386842e-06, 'epoch': 1.05} {'loss': 0.531, 'learning_rate': 9.277836998184577e-06, 'epoch': 1.05} {'loss': 0.4681, 'learning_rate': 9.277510501756171e-06, 'epoch': 1.05} {'loss': 0.4792, 'learning_rate': 9.277184006101984e-06, 'epoch': 1.05} {'loss': 0.551, 'learning_rate': 9.276857511222353e-06, 'epoch': 1.05} {'loss': 0.5163, 'learning_rate': 9.27653101711764e-06, 'epoch': 1.05} {'loss': 0.5523, 'learning_rate': 9.276204523788189e-06, 'epoch': 1.05} {'loss': 0.6691, 'learning_rate': 9.275878031234347e-06, 'epoch': 1.05} {'loss': 0.6062, 'learning_rate': 9.27555153945647e-06, 'epoch': 1.05} {'loss': 0.5761, 'learning_rate': 9.2752250484549e-06, 'epoch': 1.05} {'loss': 0.6099, 'learning_rate': 9.274898558229997e-06, 'epoch': 1.05} {'loss': 0.6285, 'learning_rate': 9.2745720687821e-06, 'epoch': 1.05} {'loss': 0.4346, 'learning_rate': 9.274245580111571e-06, 'epoch': 1.05} {'loss': 0.3015, 'learning_rate': 9.273919092218752e-06, 'epoch': 1.05} {'loss': 0.5286, 'learning_rate': 9.273592605103992e-06, 'epoch': 1.05} {'loss': 0.4167, 'learning_rate': 9.273266118767645e-06, 'epoch': 1.05} {'loss': 0.4178, 'learning_rate': 9.272939633210055e-06, 'epoch': 1.05} {'loss': 0.3942, 'learning_rate': 9.27261314843158e-06, 'epoch': 1.05} {'loss': 0.6231, 'learning_rate': 9.272286664432562e-06, 'epoch': 1.05} {'loss': 0.4897, 'learning_rate': 9.271960181213357e-06, 'epoch': 1.05} {'loss': 0.4381, 'learning_rate': 9.271633698774314e-06, 'epoch': 1.05} {'loss': 0.5726, 'learning_rate': 9.271307217115779e-06, 'epoch': 1.05} {'loss': 0.6926, 'learning_rate': 9.270980736238107e-06, 'epoch': 1.05} {'loss': 0.575, 'learning_rate': 9.270654256141638e-06, 'epoch': 1.05} {'loss': 0.45, 'learning_rate': 9.270327776826735e-06, 'epoch': 1.05} {'loss': 0.5988, 'learning_rate': 9.270001298293742e-06, 'epoch': 1.05} {'loss': 0.5512, 'learning_rate': 9.269674820543002e-06, 'epoch': 1.05} {'loss': 0.4021, 'learning_rate': 9.269348343574879e-06, 'epoch': 1.05} {'loss': 0.7109, 'learning_rate': 9.269021867389712e-06, 'epoch': 1.05} {'loss': 0.6396, 'learning_rate': 9.268695391987854e-06, 'epoch': 1.05} {'loss': 0.4767, 'learning_rate': 9.268368917369652e-06, 'epoch': 1.05} {'loss': 0.6288, 'learning_rate': 9.268042443535464e-06, 'epoch': 1.05} {'loss': 0.6053, 'learning_rate': 9.267715970485633e-06, 'epoch': 1.05} {'loss': 0.542, 'learning_rate': 9.267389498220507e-06, 'epoch': 1.05} {'loss': 0.5993, 'learning_rate': 9.267063026740444e-06, 'epoch': 1.05} {'loss': 0.5687, 'learning_rate': 9.266736556045785e-06, 'epoch': 1.05} {'loss': 0.4843, 'learning_rate': 9.266410086136888e-06, 'epoch': 1.05} {'loss': 0.5233, 'learning_rate': 9.266083617014094e-06, 'epoch': 1.05} {'loss': 0.7164, 'learning_rate': 9.265757148677761e-06, 'epoch': 1.05} {'loss': 0.4332, 'learning_rate': 9.265430681128237e-06, 'epoch': 1.05} {'loss': 0.6728, 'learning_rate': 9.265104214365865e-06, 'epoch': 1.05} {'loss': 0.528, 'learning_rate': 9.264777748391006e-06, 'epoch': 1.05} {'loss': 0.6277, 'learning_rate': 9.264451283204e-06, 'epoch': 1.05} {'loss': 0.4813, 'learning_rate': 9.264124818805204e-06, 'epoch': 1.05} {'loss': 0.4953, 'learning_rate': 9.263798355194964e-06, 'epoch': 1.05} {'loss': 0.5358, 'learning_rate': 9.263471892373626e-06, 'epoch': 1.05} {'loss': 0.4485, 'learning_rate': 9.263145430341551e-06, 'epoch': 1.05} {'loss': 0.6107, 'learning_rate': 9.262818969099075e-06, 'epoch': 1.05} {'loss': 0.6201, 'learning_rate': 9.26249250864656e-06, 'epoch': 1.05} {'loss': 0.6183, 'learning_rate': 9.26216604898435e-06, 'epoch': 1.05} {'loss': 0.4935, 'learning_rate': 9.261839590112796e-06, 'epoch': 1.05} {'loss': 0.6367, 'learning_rate': 9.26151313203225e-06, 'epoch': 1.05} {'loss': 0.4532, 'learning_rate': 9.261186674743053e-06, 'epoch': 1.05} {'loss': 0.6118, 'learning_rate': 9.260860218245566e-06, 'epoch': 1.05} {'loss': 0.5372, 'learning_rate': 9.260533762540131e-06, 'epoch': 1.05} {'loss': 0.5546, 'learning_rate': 9.260207307627102e-06, 'epoch': 1.05} {'loss': 0.3977, 'learning_rate': 9.259880853506828e-06, 'epoch': 1.05} {'loss': 0.6424, 'learning_rate': 9.259554400179658e-06, 'epoch': 1.05} {'loss': 0.5307, 'learning_rate': 9.259227947645945e-06, 'epoch': 1.05} {'loss': 0.558, 'learning_rate': 9.25890149590603e-06, 'epoch': 1.05} {'loss': 0.5493, 'learning_rate': 9.258575044960275e-06, 'epoch': 1.05} {'loss': 0.5684, 'learning_rate': 9.258248594809021e-06, 'epoch': 1.05} {'loss': 0.6331, 'learning_rate': 9.257922145452623e-06, 'epoch': 1.05} {'loss': 0.5748, 'learning_rate': 9.257595696891427e-06, 'epoch': 1.05} {'loss': 0.5305, 'learning_rate': 9.25726924912578e-06, 'epoch': 1.05} {'loss': 0.5496, 'learning_rate': 9.256942802156043e-06, 'epoch': 1.05} {'loss': 0.5087, 'learning_rate': 9.256616355982553e-06, 'epoch': 1.05} {'loss': 0.6763, 'learning_rate': 9.25628991060567e-06, 'epoch': 1.05} {'loss': 0.5838, 'learning_rate': 9.255963466025736e-06, 'epoch': 1.05} {'loss': 0.4522, 'learning_rate': 9.255637022243107e-06, 'epoch': 1.05} {'loss': 0.4463, 'learning_rate': 9.255310579258131e-06, 'epoch': 1.05} {'loss': 0.6194, 'learning_rate': 9.254984137071152e-06, 'epoch': 1.05} {'loss': 0.6039, 'learning_rate': 9.254657695682529e-06, 'epoch': 1.05} {'loss': 0.5156, 'learning_rate': 9.254331255092604e-06, 'epoch': 1.05} {'loss': 0.5281, 'learning_rate': 9.254004815301734e-06, 'epoch': 1.05} {'loss': 0.4291, 'learning_rate': 9.253678376310263e-06, 'epoch': 1.05} {'loss': 0.45, 'learning_rate': 9.253351938118545e-06, 'epoch': 1.05} {'loss': 0.5941, 'learning_rate': 9.25302550072693e-06, 'epoch': 1.05} {'loss': 0.6229, 'learning_rate': 9.252699064135759e-06, 'epoch': 1.05} {'loss': 0.6409, 'learning_rate': 9.252372628345391e-06, 'epoch': 1.05} {'loss': 0.5691, 'learning_rate': 9.252046193356173e-06, 'epoch': 1.05} {'loss': 0.4495, 'learning_rate': 9.251719759168456e-06, 'epoch': 1.05} {'loss': 0.5736, 'learning_rate': 9.25139332578259e-06, 'epoch': 1.05} {'loss': 0.4912, 'learning_rate': 9.251066893198922e-06, 'epoch': 1.05} {'loss': 0.622, 'learning_rate': 9.250740461417805e-06, 'epoch': 1.05} {'loss': 0.574, 'learning_rate': 9.250414030439583e-06, 'epoch': 1.05} {'loss': 0.5664, 'learning_rate': 9.250087600264615e-06, 'epoch': 1.05} {'loss': 0.6355, 'learning_rate': 9.249761170893241e-06, 'epoch': 1.05} {'loss': 0.469, 'learning_rate': 9.24943474232582e-06, 'epoch': 1.05} {'loss': 0.564, 'learning_rate': 9.249108314562696e-06, 'epoch': 1.05} {'loss': 0.4967, 'learning_rate': 9.24878188760422e-06, 'epoch': 1.05} {'loss': 0.5618, 'learning_rate': 9.248455461450744e-06, 'epoch': 1.05} {'loss': 0.7041, 'learning_rate': 9.24812903610261e-06, 'epoch': 1.05} {'loss': 0.5414, 'learning_rate': 9.247802611560179e-06, 'epoch': 1.05} {'loss': 0.6551, 'learning_rate': 9.247476187823796e-06, 'epoch': 1.05} {'loss': 0.5785, 'learning_rate': 9.247149764893805e-06, 'epoch': 1.05} {'loss': 0.5772, 'learning_rate': 9.246823342770565e-06, 'epoch': 1.05} {'loss': 0.5695, 'learning_rate': 9.24649692145442e-06, 'epoch': 1.05} {'loss': 0.4707, 'learning_rate': 9.246170500945723e-06, 'epoch': 1.05} {'loss': 0.5007, 'learning_rate': 9.245844081244821e-06, 'epoch': 1.05} {'loss': 0.5793, 'learning_rate': 9.245517662352066e-06, 'epoch': 1.05} {'loss': 0.507, 'learning_rate': 9.245191244267808e-06, 'epoch': 1.05} {'loss': 0.4937, 'learning_rate': 9.244864826992392e-06, 'epoch': 1.05} {'loss': 0.612, 'learning_rate': 9.244538410526176e-06, 'epoch': 1.05} {'loss': 0.5774, 'learning_rate': 9.244211994869503e-06, 'epoch': 1.05} {'loss': 0.5, 'learning_rate': 9.243885580022726e-06, 'epoch': 1.05} {'loss': 0.481, 'learning_rate': 9.24355916598619e-06, 'epoch': 1.05} {'loss': 0.4649, 'learning_rate': 9.243232752760253e-06, 'epoch': 1.05} {'loss': 0.4447, 'learning_rate': 9.24290634034526e-06, 'epoch': 1.05} {'loss': 0.5014, 'learning_rate': 9.242579928741558e-06, 'epoch': 1.05} {'loss': 0.4806, 'learning_rate': 9.242253517949503e-06, 'epoch': 1.05} {'loss': 0.6036, 'learning_rate': 9.24192710796944e-06, 'epoch': 1.05} {'loss': 0.4136, 'learning_rate': 9.241600698801724e-06, 'epoch': 1.05} {'loss': 0.5957, 'learning_rate': 9.2412742904467e-06, 'epoch': 1.05} {'loss': 0.5523, 'learning_rate': 9.240947882904715e-06, 'epoch': 1.05} {'loss': 0.6421, 'learning_rate': 9.240621476176127e-06, 'epoch': 1.05} {'loss': 0.626, 'learning_rate': 9.240295070261278e-06, 'epoch': 1.05} {'loss': 0.7497, 'learning_rate': 9.239968665160525e-06, 'epoch': 1.05} {'loss': 0.7306, 'learning_rate': 9.239642260874213e-06, 'epoch': 1.05} {'loss': 0.4078, 'learning_rate': 9.239315857402695e-06, 'epoch': 1.05} {'loss': 0.5131, 'learning_rate': 9.238989454746318e-06, 'epoch': 1.05} {'loss': 0.4809, 'learning_rate': 9.238663052905428e-06, 'epoch': 1.05} {'loss': 0.4856, 'learning_rate': 9.238336651880383e-06, 'epoch': 1.05} {'loss': 0.5507, 'learning_rate': 9.238010251671525e-06, 'epoch': 1.05} {'loss': 0.447, 'learning_rate': 9.237683852279213e-06, 'epoch': 1.05} {'loss': 0.4504, 'learning_rate': 9.237357453703789e-06, 'epoch': 1.05} {'loss': 0.575, 'learning_rate': 9.237031055945608e-06, 'epoch': 1.05} {'loss': 0.6241, 'learning_rate': 9.236704659005016e-06, 'epoch': 1.05} {'loss': 0.438, 'learning_rate': 9.23637826288236e-06, 'epoch': 1.05} {'loss': 0.6001, 'learning_rate': 9.236051867577998e-06, 'epoch': 1.05} {'loss': 0.4237, 'learning_rate': 9.235725473092274e-06, 'epoch': 1.05} {'loss': 0.4782, 'learning_rate': 9.23539907942554e-06, 'epoch': 1.05} {'loss': 0.422, 'learning_rate': 9.235072686578143e-06, 'epoch': 1.05} {'loss': 0.6231, 'learning_rate': 9.234746294550436e-06, 'epoch': 1.05} {'loss': 0.6272, 'learning_rate': 9.234419903342769e-06, 'epoch': 1.05} {'loss': 0.6819, 'learning_rate': 9.234093512955485e-06, 'epoch': 1.05} {'loss': 0.5203, 'learning_rate': 9.233767123388944e-06, 'epoch': 1.05} {'loss': 0.548, 'learning_rate': 9.233440734643488e-06, 'epoch': 1.05} {'loss': 0.6113, 'learning_rate': 9.233114346719472e-06, 'epoch': 1.05} {'loss': 0.5178, 'learning_rate': 9.23278795961724e-06, 'epoch': 1.05} {'loss': 0.5375, 'learning_rate': 9.232461573337146e-06, 'epoch': 1.05} {'loss': 0.695, 'learning_rate': 9.232135187879541e-06, 'epoch': 1.05} {'loss': 0.4987, 'learning_rate': 9.231808803244768e-06, 'epoch': 1.05} {'loss': 0.5339, 'learning_rate': 9.231482419433184e-06, 'epoch': 1.05} {'loss': 0.4705, 'learning_rate': 9.231156036445136e-06, 'epoch': 1.05} {'loss': 0.5693, 'learning_rate': 9.230829654280975e-06, 'epoch': 1.05} {'loss': 0.5807, 'learning_rate': 9.230503272941049e-06, 'epoch': 1.05} {'loss': 0.6038, 'learning_rate': 9.230176892425703e-06, 'epoch': 1.05} {'loss': 0.683, 'learning_rate': 9.229850512735299e-06, 'epoch': 1.05} {'loss': 0.576, 'learning_rate': 9.229524133870174e-06, 'epoch': 1.05} {'loss': 0.6255, 'learning_rate': 9.229197755830687e-06, 'epoch': 1.05} {'loss': 0.4889, 'learning_rate': 9.228871378617185e-06, 'epoch': 1.05} {'loss': 0.6584, 'learning_rate': 9.228545002230015e-06, 'epoch': 1.05} {'loss': 0.6185, 'learning_rate': 9.22821862666953e-06, 'epoch': 1.05} {'loss': 0.5636, 'learning_rate': 9.227892251936074e-06, 'epoch': 1.05} {'loss': 0.5036, 'learning_rate': 9.227565878030007e-06, 'epoch': 1.05} {'loss': 0.4872, 'learning_rate': 9.227239504951667e-06, 'epoch': 1.05} {'loss': 0.6709, 'learning_rate': 9.226913132701413e-06, 'epoch': 1.05} {'loss': 0.5328, 'learning_rate': 9.226586761279593e-06, 'epoch': 1.05} {'loss': 0.6162, 'learning_rate': 9.226260390686553e-06, 'epoch': 1.05} {'loss': 0.5361, 'learning_rate': 9.225934020922646e-06, 'epoch': 1.05} {'loss': 0.5962, 'learning_rate': 9.225607651988218e-06, 'epoch': 1.05} {'loss': 0.6055, 'learning_rate': 9.225281283883625e-06, 'epoch': 1.05} {'loss': 0.6491, 'learning_rate': 9.224954916609207e-06, 'epoch': 1.05} {'loss': 0.4754, 'learning_rate': 9.224628550165326e-06, 'epoch': 1.05} {'loss': 0.439, 'learning_rate': 9.224302184552326e-06, 'epoch': 1.05} {'loss': 0.5075, 'learning_rate': 9.223975819770552e-06, 'epoch': 1.05} {'loss': 0.6732, 'learning_rate': 9.22364945582036e-06, 'epoch': 1.05} {'loss': 0.5653, 'learning_rate': 9.223323092702094e-06, 'epoch': 1.05} {'loss': 0.6036, 'learning_rate': 9.222996730416113e-06, 'epoch': 1.05} {'loss': 0.6694, 'learning_rate': 9.222670368962761e-06, 'epoch': 1.05} {'loss': 0.5469, 'learning_rate': 9.222344008342382e-06, 'epoch': 1.05} {'loss': 0.7395, 'learning_rate': 9.222017648555337e-06, 'epoch': 1.05} {'loss': 0.3446, 'learning_rate': 9.221691289601968e-06, 'epoch': 1.05} {'loss': 0.5206, 'learning_rate': 9.221364931482628e-06, 'epoch': 1.05} {'loss': 0.6092, 'learning_rate': 9.221038574197663e-06, 'epoch': 1.05} {'loss': 0.6056, 'learning_rate': 9.220712217747428e-06, 'epoch': 1.05} {'loss': 0.6774, 'learning_rate': 9.220385862132271e-06, 'epoch': 1.05} {'loss': 0.6404, 'learning_rate': 9.220059507352538e-06, 'epoch': 1.05} {'loss': 0.5587, 'learning_rate': 9.219733153408586e-06, 'epoch': 1.05} {'loss': 0.5352, 'learning_rate': 9.219406800300757e-06, 'epoch': 1.05} {'loss': 0.6782, 'learning_rate': 9.219080448029405e-06, 'epoch': 1.05} {'loss': 0.631, 'learning_rate': 9.218754096594881e-06, 'epoch': 1.05} {'loss': 0.4834, 'learning_rate': 9.218427745997528e-06, 'epoch': 1.05} {'loss': 0.5815, 'learning_rate': 9.218101396237703e-06, 'epoch': 1.05} {'loss': 0.6768, 'learning_rate': 9.217775047315748e-06, 'epoch': 1.05} {'loss': 0.6899, 'learning_rate': 9.217448699232024e-06, 'epoch': 1.05} {'loss': 0.3992, 'learning_rate': 9.217122351986873e-06, 'epoch': 1.05} {'loss': 0.5305, 'learning_rate': 9.216796005580646e-06, 'epoch': 1.05} {'loss': 0.4197, 'learning_rate': 9.216469660013694e-06, 'epoch': 1.05} {'loss': 0.5204, 'learning_rate': 9.21614331528636e-06, 'epoch': 1.05} {'loss': 0.564, 'learning_rate': 9.215816971399005e-06, 'epoch': 1.05} {'loss': 0.5879, 'learning_rate': 9.215490628351967e-06, 'epoch': 1.05} {'loss': 0.4805, 'learning_rate': 9.215164286145606e-06, 'epoch': 1.05} {'loss': 0.4794, 'learning_rate': 9.214837944780266e-06, 'epoch': 1.05} {'loss': 0.4402, 'learning_rate': 9.214511604256301e-06, 'epoch': 1.05} {'loss': 0.4963, 'learning_rate': 9.214185264574056e-06, 'epoch': 1.05} {'loss': 0.624, 'learning_rate': 9.21385892573388e-06, 'epoch': 1.05} {'loss': 0.5049, 'learning_rate': 9.213532587736126e-06, 'epoch': 1.05} {'loss': 0.6218, 'learning_rate': 9.213206250581143e-06, 'epoch': 1.05} {'loss': 0.4763, 'learning_rate': 9.212879914269281e-06, 'epoch': 1.05} {'loss': 0.5847, 'learning_rate': 9.212553578800891e-06, 'epoch': 1.05} {'loss': 0.4715, 'learning_rate': 9.212227244176319e-06, 'epoch': 1.05} {'loss': 0.7528, 'learning_rate': 9.211900910395918e-06, 'epoch': 1.05} {'loss': 0.5871, 'learning_rate': 9.211574577460033e-06, 'epoch': 1.05} {'loss': 0.5043, 'learning_rate': 9.21124824536902e-06, 'epoch': 1.05} {'loss': 0.5131, 'learning_rate': 9.210921914123225e-06, 'epoch': 1.05} {'loss': 0.6182, 'learning_rate': 9.210595583722997e-06, 'epoch': 1.05} {'loss': 0.4904, 'learning_rate': 9.21026925416869e-06, 'epoch': 1.05} {'loss': 0.3833, 'learning_rate': 9.209942925460649e-06, 'epoch': 1.05} {'loss': 0.5719, 'learning_rate': 9.209616597599227e-06, 'epoch': 1.05} {'loss': 0.602, 'learning_rate': 9.209290270584768e-06, 'epoch': 1.05} {'loss': 0.5176, 'learning_rate': 9.20896394441763e-06, 'epoch': 1.05} {'loss': 0.3765, 'learning_rate': 9.208637619098155e-06, 'epoch': 1.05} {'loss': 0.4765, 'learning_rate': 9.2083112946267e-06, 'epoch': 1.05} {'loss': 0.5851, 'learning_rate': 9.207984971003609e-06, 'epoch': 1.05} {'loss': 0.5994, 'learning_rate': 9.207658648229232e-06, 'epoch': 1.05} {'loss': 0.5637, 'learning_rate': 9.207332326303925e-06, 'epoch': 1.05} {'loss': 0.4545, 'learning_rate': 9.207006005228026e-06, 'epoch': 1.05} {'loss': 0.4542, 'learning_rate': 9.206679685001898e-06, 'epoch': 1.05} {'loss': 0.6258, 'learning_rate': 9.206353365625883e-06, 'epoch': 1.05} {'loss': 0.4767, 'learning_rate': 9.206027047100331e-06, 'epoch': 1.05} {'loss': 0.6338, 'learning_rate': 9.205700729425594e-06, 'epoch': 1.05} {'loss': 0.6032, 'learning_rate': 9.205374412602016e-06, 'epoch': 1.05} {'loss': 0.5517, 'learning_rate': 9.205048096629956e-06, 'epoch': 1.05} {'loss': 0.4858, 'learning_rate': 9.204721781509754e-06, 'epoch': 1.05} {'loss': 0.5999, 'learning_rate': 9.204395467241769e-06, 'epoch': 1.05} {'loss': 0.4459, 'learning_rate': 9.204069153826344e-06, 'epoch': 1.05} {'loss': 0.5974, 'learning_rate': 9.20374284126383e-06, 'epoch': 1.05} {'loss': 0.6131, 'learning_rate': 9.203416529554581e-06, 'epoch': 1.05} {'loss': 0.5408, 'learning_rate': 9.203090218698938e-06, 'epoch': 1.05} {'loss': 0.6137, 'learning_rate': 9.202763908697259e-06, 'epoch': 1.05} {'loss': 0.6602, 'learning_rate': 9.202437599549888e-06, 'epoch': 1.05} {'loss': 0.5571, 'learning_rate': 9.202111291257178e-06, 'epoch': 1.05} {'loss': 0.4893, 'learning_rate': 9.20178498381948e-06, 'epoch': 1.05} {'loss': 0.6261, 'learning_rate': 9.201458677237141e-06, 'epoch': 1.05} {'loss': 0.4529, 'learning_rate': 9.20113237151051e-06, 'epoch': 1.05} {'loss': 0.552, 'learning_rate': 9.200806066639936e-06, 'epoch': 1.05} {'loss': 0.5698, 'learning_rate': 9.200479762625774e-06, 'epoch': 1.05} {'loss': 0.6019, 'learning_rate': 9.200153459468369e-06, 'epoch': 1.05} {'loss': 0.4345, 'learning_rate': 9.199827157168068e-06, 'epoch': 1.05} {'loss': 0.6372, 'learning_rate': 9.19950085572523e-06, 'epoch': 1.05} {'loss': 0.6743, 'learning_rate': 9.199174555140195e-06, 'epoch': 1.05} {'loss': 0.4642, 'learning_rate': 9.19884825541332e-06, 'epoch': 1.05} {'loss': 0.4979, 'learning_rate': 9.198521956544947e-06, 'epoch': 1.05} {'loss': 0.597, 'learning_rate': 9.198195658535434e-06, 'epoch': 1.05} {'loss': 0.5568, 'learning_rate': 9.197869361385127e-06, 'epoch': 1.05} {'loss': 0.5455, 'learning_rate': 9.19754306509437e-06, 'epoch': 1.05} {'loss': 0.6734, 'learning_rate': 9.197216769663524e-06, 'epoch': 1.05} {'loss': 0.5727, 'learning_rate': 9.19689047509293e-06, 'epoch': 1.05} {'loss': 0.6586, 'learning_rate': 9.196564181382943e-06, 'epoch': 1.05} {'loss': 0.602, 'learning_rate': 9.196237888533906e-06, 'epoch': 1.05} {'loss': 0.6413, 'learning_rate': 9.195911596546175e-06, 'epoch': 1.05} {'loss': 0.6132, 'learning_rate': 9.195585305420099e-06, 'epoch': 1.05} {'loss': 0.5845, 'learning_rate': 9.195259015156021e-06, 'epoch': 1.05} {'loss': 0.5721, 'learning_rate': 9.1949327257543e-06, 'epoch': 1.05} {'loss': 0.4868, 'learning_rate': 9.194606437215278e-06, 'epoch': 1.05} {'loss': 0.4788, 'learning_rate': 9.194280149539311e-06, 'epoch': 1.05} {'loss': 0.5949, 'learning_rate': 9.193953862726745e-06, 'epoch': 1.05} {'loss': 0.4988, 'learning_rate': 9.193627576777927e-06, 'epoch': 1.05} {'loss': 0.6468, 'learning_rate': 9.193301291693214e-06, 'epoch': 1.05} {'loss': 0.5753, 'learning_rate': 9.192975007472946e-06, 'epoch': 1.05} {'loss': 0.6276, 'learning_rate': 9.192648724117483e-06, 'epoch': 1.05} {'loss': 0.5982, 'learning_rate': 9.192322441627168e-06, 'epoch': 1.05} {'loss': 0.5382, 'learning_rate': 9.191996160002354e-06, 'epoch': 1.05} {'loss': 0.4552, 'learning_rate': 9.19166987924339e-06, 'epoch': 1.05} {'loss': 0.5967, 'learning_rate': 9.191343599350619e-06, 'epoch': 1.05} {'loss': 0.6379, 'learning_rate': 9.191017320324402e-06, 'epoch': 1.05} {'loss': 0.7036, 'learning_rate': 9.190691042165079e-06, 'epoch': 1.05} {'loss': 0.5708, 'learning_rate': 9.190364764873007e-06, 'epoch': 1.05} {'loss': 0.4538, 'learning_rate': 9.190038488448531e-06, 'epoch': 1.05} {'loss': 0.4598, 'learning_rate': 9.189712212892001e-06, 'epoch': 1.05} {'loss': 0.5348, 'learning_rate': 9.18938593820377e-06, 'epoch': 1.05} {'loss': 0.5436, 'learning_rate': 9.18905966438418e-06, 'epoch': 1.05} {'loss': 0.5187, 'learning_rate': 9.18873339143359e-06, 'epoch': 1.05} {'loss': 0.4757, 'learning_rate': 9.188407119352342e-06, 'epoch': 1.05} {'loss': 0.5964, 'learning_rate': 9.188080848140793e-06, 'epoch': 1.05} {'loss': 0.526, 'learning_rate': 9.187754577799288e-06, 'epoch': 1.05} {'loss': 0.5373, 'learning_rate': 9.187428308328176e-06, 'epoch': 1.05} {'loss': 0.5952, 'learning_rate': 9.18710203972781e-06, 'epoch': 1.05} {'loss': 0.5968, 'learning_rate': 9.186775771998533e-06, 'epoch': 1.05} {'loss': 0.623, 'learning_rate': 9.186449505140703e-06, 'epoch': 1.05} {'loss': 0.488, 'learning_rate': 9.186123239154663e-06, 'epoch': 1.05} {'loss': 0.6193, 'learning_rate': 9.185796974040767e-06, 'epoch': 1.05} {'loss': 0.5323, 'learning_rate': 9.185470709799364e-06, 'epoch': 1.05} {'loss': 0.6529, 'learning_rate': 9.185144446430802e-06, 'epoch': 1.05} {'loss': 0.5088, 'learning_rate': 9.184818183935432e-06, 'epoch': 1.05} {'loss': 0.4409, 'learning_rate': 9.1844919223136e-06, 'epoch': 1.05} {'loss': 0.4772, 'learning_rate': 9.184165661565661e-06, 'epoch': 1.05} {'loss': 0.4579, 'learning_rate': 9.183839401691963e-06, 'epoch': 1.05} {'loss': 0.5795, 'learning_rate': 9.183513142692854e-06, 'epoch': 1.05} {'loss': 0.5299, 'learning_rate': 9.183186884568683e-06, 'epoch': 1.06} {'loss': 0.6019, 'learning_rate': 9.182860627319801e-06, 'epoch': 1.06} {'loss': 0.5075, 'learning_rate': 9.182534370946558e-06, 'epoch': 1.06} {'loss': 0.5544, 'learning_rate': 9.182208115449302e-06, 'epoch': 1.06} {'loss': 0.6934, 'learning_rate': 9.181881860828387e-06, 'epoch': 1.06} {'loss': 0.6122, 'learning_rate': 9.181555607084159e-06, 'epoch': 1.06} {'loss': 0.7301, 'learning_rate': 9.181229354216965e-06, 'epoch': 1.06} {'loss': 0.542, 'learning_rate': 9.180903102227162e-06, 'epoch': 1.06} {'loss': 0.4801, 'learning_rate': 9.180576851115088e-06, 'epoch': 1.06} {'loss': 0.5213, 'learning_rate': 9.180250600881106e-06, 'epoch': 1.06} {'loss': 0.4679, 'learning_rate': 9.179924351525555e-06, 'epoch': 1.06} {'loss': 0.5759, 'learning_rate': 9.179598103048794e-06, 'epoch': 1.06} {'loss': 0.5541, 'learning_rate': 9.179271855451167e-06, 'epoch': 1.06} {'loss': 0.6211, 'learning_rate': 9.178945608733024e-06, 'epoch': 1.06} {'loss': 0.5912, 'learning_rate': 9.178619362894714e-06, 'epoch': 1.06} {'loss': 0.5346, 'learning_rate': 9.178293117936586e-06, 'epoch': 1.06} {'loss': 0.5715, 'learning_rate': 9.177966873858992e-06, 'epoch': 1.06} {'loss': 0.5418, 'learning_rate': 9.177640630662283e-06, 'epoch': 1.06} {'loss': 0.67, 'learning_rate': 9.177314388346803e-06, 'epoch': 1.06} {'loss': 0.631, 'learning_rate': 9.176988146912907e-06, 'epoch': 1.06} {'loss': 0.3979, 'learning_rate': 9.17666190636094e-06, 'epoch': 1.06} {'loss': 0.5136, 'learning_rate': 9.176335666691259e-06, 'epoch': 1.06} {'loss': 0.5412, 'learning_rate': 9.1760094279042e-06, 'epoch': 1.06} {'loss': 0.5591, 'learning_rate': 9.17568319000013e-06, 'epoch': 1.06} {'loss': 0.5904, 'learning_rate': 9.175356952979388e-06, 'epoch': 1.06} {'loss': 0.593, 'learning_rate': 9.175030716842321e-06, 'epoch': 1.06} {'loss': 0.4972, 'learning_rate': 9.174704481589288e-06, 'epoch': 1.06} {'loss': 0.6539, 'learning_rate': 9.174378247220631e-06, 'epoch': 1.06} {'loss': 0.5247, 'learning_rate': 9.174052013736705e-06, 'epoch': 1.06} {'loss': 0.582, 'learning_rate': 9.173725781137851e-06, 'epoch': 1.06} {'loss': 0.5381, 'learning_rate': 9.17339954942443e-06, 'epoch': 1.06} {'loss': 0.5826, 'learning_rate': 9.173073318596786e-06, 'epoch': 1.06} {'loss': 0.5224, 'learning_rate': 9.172747088655264e-06, 'epoch': 1.06} {'loss': 0.4162, 'learning_rate': 9.172420859600221e-06, 'epoch': 1.06} {'loss': 0.7027, 'learning_rate': 9.172094631432005e-06, 'epoch': 1.06} {'loss': 0.4523, 'learning_rate': 9.171768404150964e-06, 'epoch': 1.06} {'loss': 0.4382, 'learning_rate': 9.171442177757448e-06, 'epoch': 1.06} {'loss': 0.5825, 'learning_rate': 9.171115952251802e-06, 'epoch': 1.06} {'loss': 0.527, 'learning_rate': 9.170789727634385e-06, 'epoch': 1.06} {'loss': 0.6053, 'learning_rate': 9.170463503905538e-06, 'epoch': 1.06} {'loss': 0.5199, 'learning_rate': 9.170137281065617e-06, 'epoch': 1.06} {'loss': 0.5975, 'learning_rate': 9.169811059114968e-06, 'epoch': 1.06} {'loss': 0.4424, 'learning_rate': 9.169484838053944e-06, 'epoch': 1.06} {'loss': 0.6584, 'learning_rate': 9.16915861788289e-06, 'epoch': 1.06} {'loss': 0.4526, 'learning_rate': 9.168832398602155e-06, 'epoch': 1.06} {'loss': 0.6231, 'learning_rate': 9.168506180212094e-06, 'epoch': 1.06} {'loss': 0.4573, 'learning_rate': 9.168179962713049e-06, 'epoch': 1.06} {'loss': 0.5427, 'learning_rate': 9.16785374610538e-06, 'epoch': 1.06} {'loss': 0.4779, 'learning_rate': 9.167527530389428e-06, 'epoch': 1.06} {'loss': 0.585, 'learning_rate': 9.167201315565549e-06, 'epoch': 1.06} {'loss': 0.4295, 'learning_rate': 9.166875101634088e-06, 'epoch': 1.06} {'loss': 0.5124, 'learning_rate': 9.16654888859539e-06, 'epoch': 1.06} {'loss': 0.5192, 'learning_rate': 9.166222676449814e-06, 'epoch': 1.06} {'loss': 0.4812, 'learning_rate': 9.165896465197703e-06, 'epoch': 1.06} {'loss': 0.6006, 'learning_rate': 9.165570254839414e-06, 'epoch': 1.06} {'loss': 0.4666, 'learning_rate': 9.165244045375291e-06, 'epoch': 1.06} {'loss': 0.5183, 'learning_rate': 9.164917836805683e-06, 'epoch': 1.06} {'loss': 0.5092, 'learning_rate': 9.16459162913094e-06, 'epoch': 1.06} {'loss': 0.5729, 'learning_rate': 9.164265422351411e-06, 'epoch': 1.06} {'loss': 0.6099, 'learning_rate': 9.16393921646745e-06, 'epoch': 1.06} {'loss': 0.5867, 'learning_rate': 9.163613011479401e-06, 'epoch': 1.06} {'loss': 0.4905, 'learning_rate': 9.163286807387618e-06, 'epoch': 1.06} {'loss': 0.5027, 'learning_rate': 9.162960604192453e-06, 'epoch': 1.06} {'loss': 0.6204, 'learning_rate': 9.162634401894246e-06, 'epoch': 1.06} {'loss': 0.4788, 'learning_rate': 9.162308200493353e-06, 'epoch': 1.06} {'loss': 0.5294, 'learning_rate': 9.161981999990119e-06, 'epoch': 1.06} {'loss': 0.526, 'learning_rate': 9.161655800384902e-06, 'epoch': 1.06} {'loss': 0.6497, 'learning_rate': 9.161329601678046e-06, 'epoch': 1.06} {'loss': 0.512, 'learning_rate': 9.161003403869898e-06, 'epoch': 1.06} {'loss': 0.4616, 'learning_rate': 9.160677206960812e-06, 'epoch': 1.06} {'loss': 0.5502, 'learning_rate': 9.160351010951137e-06, 'epoch': 1.06} {'loss': 0.5407, 'learning_rate': 9.160024815841221e-06, 'epoch': 1.06} {'loss': 0.6253, 'learning_rate': 9.159698621631411e-06, 'epoch': 1.06} {'loss': 0.4771, 'learning_rate': 9.159372428322065e-06, 'epoch': 1.06} {'loss': 0.5354, 'learning_rate': 9.159046235913527e-06, 'epoch': 1.06} {'loss': 0.5559, 'learning_rate': 9.158720044406142e-06, 'epoch': 1.06} {'loss': 0.5, 'learning_rate': 9.158393853800269e-06, 'epoch': 1.06} {'loss': 0.6213, 'learning_rate': 9.158067664096251e-06, 'epoch': 1.06} {'loss': 0.4673, 'learning_rate': 9.15774147529444e-06, 'epoch': 1.06} {'loss': 0.4172, 'learning_rate': 9.157415287395183e-06, 'epoch': 1.06} {'loss': 0.5577, 'learning_rate': 9.157089100398835e-06, 'epoch': 1.06} {'loss': 0.6826, 'learning_rate': 9.156762914305742e-06, 'epoch': 1.06} {'loss': 0.4603, 'learning_rate': 9.156436729116252e-06, 'epoch': 1.06} {'loss': 0.4209, 'learning_rate': 9.156110544830715e-06, 'epoch': 1.06} {'loss': 0.478, 'learning_rate': 9.155784361449483e-06, 'epoch': 1.06} {'loss': 0.524, 'learning_rate': 9.155458178972906e-06, 'epoch': 1.06} {'loss': 0.5113, 'learning_rate': 9.155131997401332e-06, 'epoch': 1.06} {'loss': 0.5335, 'learning_rate': 9.154805816735105e-06, 'epoch': 1.06} {'loss': 0.5327, 'learning_rate': 9.154479636974585e-06, 'epoch': 1.06} {'loss': 0.5637, 'learning_rate': 9.154153458120113e-06, 'epoch': 1.06} {'loss': 0.5422, 'learning_rate': 9.153827280172047e-06, 'epoch': 1.06} {'loss': 0.4653, 'learning_rate': 9.153501103130724e-06, 'epoch': 1.06} {'loss': 0.586, 'learning_rate': 9.153174926996506e-06, 'epoch': 1.06} {'loss': 0.4377, 'learning_rate': 9.152848751769738e-06, 'epoch': 1.06} {'loss': 0.3992, 'learning_rate': 9.152522577450766e-06, 'epoch': 1.06} {'loss': 0.6378, 'learning_rate': 9.152196404039946e-06, 'epoch': 1.06} {'loss': 0.4857, 'learning_rate': 9.15187023153762e-06, 'epoch': 1.06} {'loss': 0.5901, 'learning_rate': 9.151544059944146e-06, 'epoch': 1.06} {'loss': 0.3216, 'learning_rate': 9.151217889259865e-06, 'epoch': 1.06} {'loss': 0.5142, 'learning_rate': 9.150891719485133e-06, 'epoch': 1.06} {'loss': 0.6836, 'learning_rate': 9.150565550620299e-06, 'epoch': 1.06} {'loss': 0.4106, 'learning_rate': 9.150239382665704e-06, 'epoch': 1.06} {'loss': 0.4029, 'learning_rate': 9.14991321562171e-06, 'epoch': 1.06} {'loss': 0.5731, 'learning_rate': 9.14958704948866e-06, 'epoch': 1.06} {'loss': 0.5459, 'learning_rate': 9.149260884266906e-06, 'epoch': 1.06} {'loss': 0.6252, 'learning_rate': 9.148934719956793e-06, 'epoch': 1.06} {'loss': 0.7406, 'learning_rate': 9.14860855655867e-06, 'epoch': 1.06} {'loss': 0.6277, 'learning_rate': 9.148282394072896e-06, 'epoch': 1.06} {'loss': 0.6871, 'learning_rate': 9.147956232499808e-06, 'epoch': 1.06} {'loss': 0.5115, 'learning_rate': 9.147630071839767e-06, 'epoch': 1.06} {'loss': 0.6565, 'learning_rate': 9.147303912093115e-06, 'epoch': 1.06} {'loss': 0.6261, 'learning_rate': 9.146977753260206e-06, 'epoch': 1.06} {'loss': 0.6112, 'learning_rate': 9.146651595341389e-06, 'epoch': 1.06} {'loss': 0.5505, 'learning_rate': 9.146325438337005e-06, 'epoch': 1.06} {'loss': 0.5437, 'learning_rate': 9.145999282247415e-06, 'epoch': 1.06} {'loss': 0.6907, 'learning_rate': 9.145673127072961e-06, 'epoch': 1.06} {'loss': 0.6056, 'learning_rate': 9.145346972813997e-06, 'epoch': 1.06} {'loss': 0.4801, 'learning_rate': 9.14502081947087e-06, 'epoch': 1.06} {'loss': 0.5559, 'learning_rate': 9.144694667043934e-06, 'epoch': 1.06} {'loss': 0.5245, 'learning_rate': 9.144368515533535e-06, 'epoch': 1.06} {'loss': 0.4958, 'learning_rate': 9.144042364940016e-06, 'epoch': 1.06} {'loss': 0.5255, 'learning_rate': 9.143716215263738e-06, 'epoch': 1.06} {'loss': 0.6912, 'learning_rate': 9.143390066505041e-06, 'epoch': 1.06} {'loss': 0.5234, 'learning_rate': 9.143063918664283e-06, 'epoch': 1.06} {'loss': 0.4724, 'learning_rate': 9.142737771741809e-06, 'epoch': 1.06} {'loss': 0.5353, 'learning_rate': 9.142411625737967e-06, 'epoch': 1.06} {'loss': 0.5668, 'learning_rate': 9.142085480653112e-06, 'epoch': 1.06} {'loss': 0.4541, 'learning_rate': 9.141759336487585e-06, 'epoch': 1.06} {'loss': 0.5501, 'learning_rate': 9.141433193241743e-06, 'epoch': 1.06} {'loss': 0.6693, 'learning_rate': 9.14110705091593e-06, 'epoch': 1.06} {'loss': 0.7104, 'learning_rate': 9.140780909510502e-06, 'epoch': 1.06} {'loss': 0.6017, 'learning_rate': 9.140454769025805e-06, 'epoch': 1.06} {'loss': 0.6589, 'learning_rate': 9.140128629462186e-06, 'epoch': 1.06} {'loss': 0.5401, 'learning_rate': 9.13980249082e-06, 'epoch': 1.06} {'loss': 0.5731, 'learning_rate': 9.139476353099586e-06, 'epoch': 1.06} {'loss': 0.4943, 'learning_rate': 9.139150216301309e-06, 'epoch': 1.06} {'loss': 0.4218, 'learning_rate': 9.138824080425503e-06, 'epoch': 1.06} {'loss': 0.632, 'learning_rate': 9.13849794547253e-06, 'epoch': 1.06} {'loss': 0.7804, 'learning_rate': 9.138171811442733e-06, 'epoch': 1.06} {'loss': 0.5185, 'learning_rate': 9.137845678336462e-06, 'epoch': 1.06} {'loss': 0.6611, 'learning_rate': 9.137519546154068e-06, 'epoch': 1.06} {'loss': 0.5696, 'learning_rate': 9.137193414895898e-06, 'epoch': 1.06} {'loss': 0.4469, 'learning_rate': 9.136867284562305e-06, 'epoch': 1.06} {'loss': 0.481, 'learning_rate': 9.136541155153637e-06, 'epoch': 1.06} {'loss': 0.5167, 'learning_rate': 9.13621502667024e-06, 'epoch': 1.06} {'loss': 0.6047, 'learning_rate': 9.13588889911247e-06, 'epoch': 1.06} {'loss': 0.4277, 'learning_rate': 9.13556277248067e-06, 'epoch': 1.06} {'loss': 0.6387, 'learning_rate': 9.135236646775196e-06, 'epoch': 1.06} {'loss': 0.6565, 'learning_rate': 9.13491052199639e-06, 'epoch': 1.06} {'loss': 0.4845, 'learning_rate': 9.13458439814461e-06, 'epoch': 1.06} {'loss': 0.6816, 'learning_rate': 9.134258275220198e-06, 'epoch': 1.06} {'loss': 0.5543, 'learning_rate': 9.133932153223505e-06, 'epoch': 1.06} {'loss': 0.5019, 'learning_rate': 9.133606032154885e-06, 'epoch': 1.06} {'loss': 0.6879, 'learning_rate': 9.133279912014683e-06, 'epoch': 1.06} {'loss': 0.6093, 'learning_rate': 9.13295379280325e-06, 'epoch': 1.06} {'loss': 0.4964, 'learning_rate': 9.132627674520937e-06, 'epoch': 1.06} {'loss': 0.4236, 'learning_rate': 9.132301557168088e-06, 'epoch': 1.06} {'loss': 0.537, 'learning_rate': 9.13197544074506e-06, 'epoch': 1.06} {'loss': 0.4228, 'learning_rate': 9.131649325252195e-06, 'epoch': 1.06} {'loss': 0.6972, 'learning_rate': 9.131323210689847e-06, 'epoch': 1.06} {'loss': 0.5891, 'learning_rate': 9.130997097058364e-06, 'epoch': 1.06} {'loss': 0.5424, 'learning_rate': 9.1306709843581e-06, 'epoch': 1.06} {'loss': 0.6062, 'learning_rate': 9.1303448725894e-06, 'epoch': 1.06} {'loss': 0.6144, 'learning_rate': 9.130018761752608e-06, 'epoch': 1.06} {'loss': 0.4012, 'learning_rate': 9.129692651848086e-06, 'epoch': 1.06} {'loss': 0.6294, 'learning_rate': 9.129366542876172e-06, 'epoch': 1.06} {'loss': 0.643, 'learning_rate': 9.129040434837224e-06, 'epoch': 1.06} {'loss': 0.6631, 'learning_rate': 9.128714327731585e-06, 'epoch': 1.06} {'loss': 0.5628, 'learning_rate': 9.12838822155961e-06, 'epoch': 1.06} {'loss': 0.5027, 'learning_rate': 9.128062116321645e-06, 'epoch': 1.06} {'loss': 0.7217, 'learning_rate': 9.127736012018036e-06, 'epoch': 1.06} {'loss': 0.6722, 'learning_rate': 9.127409908649142e-06, 'epoch': 1.06} {'loss': 0.515, 'learning_rate': 9.127083806215305e-06, 'epoch': 1.06} {'loss': 0.7725, 'learning_rate': 9.126757704716878e-06, 'epoch': 1.06} {'loss': 0.4807, 'learning_rate': 9.12643160415421e-06, 'epoch': 1.06} {'loss': 0.57, 'learning_rate': 9.126105504527642e-06, 'epoch': 1.06} {'loss': 0.4584, 'learning_rate': 9.125779405837538e-06, 'epoch': 1.06} {'loss': 0.6388, 'learning_rate': 9.125453308084234e-06, 'epoch': 1.06} {'loss': 0.6576, 'learning_rate': 9.125127211268092e-06, 'epoch': 1.06} {'loss': 0.5578, 'learning_rate': 9.124801115389452e-06, 'epoch': 1.06} {'loss': 0.6224, 'learning_rate': 9.124475020448668e-06, 'epoch': 1.06} {'loss': 0.4733, 'learning_rate': 9.12414892644609e-06, 'epoch': 1.06} {'loss': 0.6592, 'learning_rate': 9.12382283338206e-06, 'epoch': 1.06} {'loss': 0.5402, 'learning_rate': 9.123496741256937e-06, 'epoch': 1.06} {'loss': 0.5198, 'learning_rate': 9.123170650071062e-06, 'epoch': 1.06} {'loss': 0.4859, 'learning_rate': 9.122844559824794e-06, 'epoch': 1.06} {'loss': 0.6422, 'learning_rate': 9.122518470518475e-06, 'epoch': 1.06} {'loss': 0.6398, 'learning_rate': 9.122192382152459e-06, 'epoch': 1.06} {'loss': 0.4804, 'learning_rate': 9.121866294727091e-06, 'epoch': 1.06} {'loss': 0.6783, 'learning_rate': 9.12154020824272e-06, 'epoch': 1.06} {'loss': 0.5648, 'learning_rate': 9.121214122699702e-06, 'epoch': 1.06} {'loss': 0.5929, 'learning_rate': 9.120888038098378e-06, 'epoch': 1.06} {'loss': 0.5845, 'learning_rate': 9.120561954439106e-06, 'epoch': 1.06} {'loss': 0.4868, 'learning_rate': 9.120235871722232e-06, 'epoch': 1.06} {'loss': 0.4735, 'learning_rate': 9.1199097899481e-06, 'epoch': 1.06} {'loss': 0.6831, 'learning_rate': 9.11958370911707e-06, 'epoch': 1.06} {'loss': 0.4571, 'learning_rate': 9.119257629229479e-06, 'epoch': 1.06} {'loss': 0.5985, 'learning_rate': 9.118931550285686e-06, 'epoch': 1.06} {'loss': 0.5766, 'learning_rate': 9.118605472286035e-06, 'epoch': 1.06} {'loss': 0.6764, 'learning_rate': 9.118279395230882e-06, 'epoch': 1.06} {'loss': 0.543, 'learning_rate': 9.117953319120572e-06, 'epoch': 1.06} {'loss': 0.6167, 'learning_rate': 9.117627243955453e-06, 'epoch': 1.06} {'loss': 0.5524, 'learning_rate': 9.117301169735878e-06, 'epoch': 1.06} {'loss': 0.4606, 'learning_rate': 9.116975096462188e-06, 'epoch': 1.06} {'loss': 0.6537, 'learning_rate': 9.116649024134744e-06, 'epoch': 1.06} {'loss': 0.574, 'learning_rate': 9.116322952753889e-06, 'epoch': 1.06} {'loss': 0.6031, 'learning_rate': 9.115996882319975e-06, 'epoch': 1.06} {'loss': 0.6587, 'learning_rate': 9.115670812833351e-06, 'epoch': 1.06} {'loss': 0.5023, 'learning_rate': 9.115344744294364e-06, 'epoch': 1.06} {'loss': 0.5528, 'learning_rate': 9.115018676703367e-06, 'epoch': 1.06} {'loss': 0.6321, 'learning_rate': 9.114692610060702e-06, 'epoch': 1.06} {'loss': 0.5899, 'learning_rate': 9.114366544366729e-06, 'epoch': 1.06} {'loss': 0.4843, 'learning_rate': 9.114040479621792e-06, 'epoch': 1.06} {'loss': 0.5824, 'learning_rate': 9.113714415826237e-06, 'epoch': 1.06} {'loss': 0.6173, 'learning_rate': 9.113388352980419e-06, 'epoch': 1.06} {'loss': 0.7438, 'learning_rate': 9.113062291084685e-06, 'epoch': 1.06} {'loss': 0.6594, 'learning_rate': 9.112736230139386e-06, 'epoch': 1.06} {'loss': 0.5384, 'learning_rate': 9.112410170144867e-06, 'epoch': 1.06} {'loss': 0.4647, 'learning_rate': 9.112084111101485e-06, 'epoch': 1.06} {'loss': 0.4518, 'learning_rate': 9.111758053009583e-06, 'epoch': 1.06} {'loss': 0.5307, 'learning_rate': 9.111431995869511e-06, 'epoch': 1.06} {'loss': 0.6384, 'learning_rate': 9.111105939681623e-06, 'epoch': 1.06} {'loss': 0.7292, 'learning_rate': 9.110779884446262e-06, 'epoch': 1.06} {'loss': 0.4965, 'learning_rate': 9.110453830163783e-06, 'epoch': 1.06} {'loss': 0.6189, 'learning_rate': 9.11012777683453e-06, 'epoch': 1.06} {'loss': 0.5257, 'learning_rate': 9.109801724458858e-06, 'epoch': 1.06} {'loss': 0.6514, 'learning_rate': 9.109475673037116e-06, 'epoch': 1.06} {'loss': 0.6079, 'learning_rate': 9.109149622569644e-06, 'epoch': 1.06} {'loss': 0.6455, 'learning_rate': 9.108823573056806e-06, 'epoch': 1.06} {'loss': 0.4889, 'learning_rate': 9.10849752449894e-06, 'epoch': 1.06} {'loss': 0.5116, 'learning_rate': 9.108171476896403e-06, 'epoch': 1.06} {'loss': 0.4404, 'learning_rate': 9.10784543024954e-06, 'epoch': 1.06} {'loss': 0.6944, 'learning_rate': 9.107519384558695e-06, 'epoch': 1.06} {'loss': 0.5585, 'learning_rate': 9.10719333982423e-06, 'epoch': 1.06} {'loss': 0.5629, 'learning_rate': 9.106867296046484e-06, 'epoch': 1.06} {'loss': 0.4544, 'learning_rate': 9.106541253225813e-06, 'epoch': 1.06} {'loss': 0.5271, 'learning_rate': 9.106215211362561e-06, 'epoch': 1.06} {'loss': 0.6872, 'learning_rate': 9.105889170457083e-06, 'epoch': 1.06} {'loss': 0.5412, 'learning_rate': 9.105563130509725e-06, 'epoch': 1.06} {'loss': 0.55, 'learning_rate': 9.105237091520834e-06, 'epoch': 1.06} {'loss': 0.5323, 'learning_rate': 9.104911053490766e-06, 'epoch': 1.06} {'loss': 0.4002, 'learning_rate': 9.104585016419864e-06, 'epoch': 1.06} {'loss': 0.5723, 'learning_rate': 9.104258980308483e-06, 'epoch': 1.06} {'loss': 0.4763, 'learning_rate': 9.103932945156966e-06, 'epoch': 1.06} {'loss': 0.5515, 'learning_rate': 9.103606910965666e-06, 'epoch': 1.06} {'loss': 0.6435, 'learning_rate': 9.103280877734935e-06, 'epoch': 1.06} {'loss': 0.674, 'learning_rate': 9.102954845465115e-06, 'epoch': 1.06} {'loss': 0.6786, 'learning_rate': 9.102628814156563e-06, 'epoch': 1.06} {'loss': 0.5731, 'learning_rate': 9.102302783809625e-06, 'epoch': 1.06} {'loss': 0.6368, 'learning_rate': 9.101976754424651e-06, 'epoch': 1.06} {'loss': 0.5494, 'learning_rate': 9.101650726001991e-06, 'epoch': 1.06} {'loss': 0.5011, 'learning_rate': 9.101324698541988e-06, 'epoch': 1.06} {'loss': 0.4684, 'learning_rate': 9.100998672045001e-06, 'epoch': 1.06} {'loss': 0.4882, 'learning_rate': 9.100672646511372e-06, 'epoch': 1.06} {'loss': 0.5744, 'learning_rate': 9.100346621941457e-06, 'epoch': 1.06} {'loss': 0.631, 'learning_rate': 9.100020598335601e-06, 'epoch': 1.06} {'loss': 0.6075, 'learning_rate': 9.099694575694154e-06, 'epoch': 1.06} {'loss': 0.3721, 'learning_rate': 9.099368554017466e-06, 'epoch': 1.06} {'loss': 0.6848, 'learning_rate': 9.099042533305883e-06, 'epoch': 1.06} {'loss': 0.5733, 'learning_rate': 9.09871651355976e-06, 'epoch': 1.06} {'loss': 0.6251, 'learning_rate': 9.098390494779441e-06, 'epoch': 1.06} {'loss': 0.4891, 'learning_rate': 9.098064476965281e-06, 'epoch': 1.06} {'loss': 0.6047, 'learning_rate': 9.097738460117626e-06, 'epoch': 1.06} {'loss': 0.6378, 'learning_rate': 9.097412444236825e-06, 'epoch': 1.06} {'loss': 0.688, 'learning_rate': 9.097086429323228e-06, 'epoch': 1.06} {'loss': 0.5787, 'learning_rate': 9.096760415377181e-06, 'epoch': 1.06} {'loss': 0.5139, 'learning_rate': 9.096434402399042e-06, 'epoch': 1.06} {'loss': 0.5129, 'learning_rate': 9.096108390389152e-06, 'epoch': 1.06} {'loss': 0.5857, 'learning_rate': 9.095782379347865e-06, 'epoch': 1.06} {'loss': 0.5869, 'learning_rate': 9.095456369275529e-06, 'epoch': 1.06} {'loss': 0.5776, 'learning_rate': 9.095130360172493e-06, 'epoch': 1.06} {'loss': 0.5343, 'learning_rate': 9.094804352039106e-06, 'epoch': 1.06} {'loss': 0.5666, 'learning_rate': 9.094478344875716e-06, 'epoch': 1.06} {'loss': 0.5576, 'learning_rate': 9.094152338682677e-06, 'epoch': 1.06} {'loss': 0.4945, 'learning_rate': 9.09382633346033e-06, 'epoch': 1.06} {'loss': 0.4746, 'learning_rate': 9.093500329209037e-06, 'epoch': 1.06} {'loss': 0.4073, 'learning_rate': 9.093174325929139e-06, 'epoch': 1.06} {'loss': 0.5362, 'learning_rate': 9.092848323620984e-06, 'epoch': 1.06} {'loss': 0.5623, 'learning_rate': 9.092522322284927e-06, 'epoch': 1.06} {'loss': 0.6373, 'learning_rate': 9.092196321921309e-06, 'epoch': 1.06} {'loss': 0.5713, 'learning_rate': 9.09187032253049e-06, 'epoch': 1.06} {'loss': 0.6033, 'learning_rate': 9.091544324112813e-06, 'epoch': 1.06} {'loss': 0.5562, 'learning_rate': 9.091218326668623e-06, 'epoch': 1.06} {'loss': 0.4426, 'learning_rate': 9.09089233019828e-06, 'epoch': 1.06} {'loss': 0.6523, 'learning_rate': 9.090566334702128e-06, 'epoch': 1.06} {'loss': 0.6293, 'learning_rate': 9.090240340180515e-06, 'epoch': 1.06} {'loss': 0.597, 'learning_rate': 9.089914346633787e-06, 'epoch': 1.06} {'loss': 0.5635, 'learning_rate': 9.089588354062305e-06, 'epoch': 1.06} {'loss': 0.56, 'learning_rate': 9.08926236246641e-06, 'epoch': 1.06} {'loss': 0.5304, 'learning_rate': 9.088936371846448e-06, 'epoch': 1.06} {'loss': 0.6993, 'learning_rate': 9.088610382202777e-06, 'epoch': 1.06} {'loss': 0.5267, 'learning_rate': 9.088284393535741e-06, 'epoch': 1.06} {'loss': 0.582, 'learning_rate': 9.087958405845693e-06, 'epoch': 1.06} {'loss': 0.616, 'learning_rate': 9.087632419132975e-06, 'epoch': 1.06} {'loss': 0.4385, 'learning_rate': 9.087306433397945e-06, 'epoch': 1.06} {'loss': 0.4676, 'learning_rate': 9.086980448640948e-06, 'epoch': 1.06} {'loss': 0.6776, 'learning_rate': 9.086654464862332e-06, 'epoch': 1.06} {'loss': 0.6663, 'learning_rate': 9.08632848206245e-06, 'epoch': 1.06} {'loss': 0.5206, 'learning_rate': 9.086002500241648e-06, 'epoch': 1.06} {'loss': 0.3957, 'learning_rate': 9.085676519400279e-06, 'epoch': 1.06} {'loss': 0.5929, 'learning_rate': 9.08535053953869e-06, 'epoch': 1.06} {'loss': 0.483, 'learning_rate': 9.085024560657226e-06, 'epoch': 1.06} {'loss': 0.628, 'learning_rate': 9.084698582756246e-06, 'epoch': 1.06} {'loss': 0.7471, 'learning_rate': 9.08437260583609e-06, 'epoch': 1.06} {'loss': 0.5751, 'learning_rate': 9.084046629897114e-06, 'epoch': 1.06} {'loss': 0.5176, 'learning_rate': 9.083720654939663e-06, 'epoch': 1.06} {'loss': 0.5868, 'learning_rate': 9.083394680964092e-06, 'epoch': 1.06} {'loss': 0.497, 'learning_rate': 9.083068707970744e-06, 'epoch': 1.06} {'loss': 0.491, 'learning_rate': 9.082742735959969e-06, 'epoch': 1.06} {'loss': 0.6196, 'learning_rate': 9.08241676493212e-06, 'epoch': 1.06} {'loss': 0.6539, 'learning_rate': 9.08209079488754e-06, 'epoch': 1.06} {'loss': 0.5444, 'learning_rate': 9.081764825826588e-06, 'epoch': 1.06} {'loss': 0.4041, 'learning_rate': 9.081438857749604e-06, 'epoch': 1.06} {'loss': 0.4775, 'learning_rate': 9.081112890656946e-06, 'epoch': 1.06} {'loss': 0.5609, 'learning_rate': 9.080786924548957e-06, 'epoch': 1.06} {'loss': 0.5755, 'learning_rate': 9.080460959425982e-06, 'epoch': 1.06} {'loss': 0.5368, 'learning_rate': 9.080134995288383e-06, 'epoch': 1.06} {'loss': 0.5241, 'learning_rate': 9.079809032136498e-06, 'epoch': 1.06} {'loss': 0.6913, 'learning_rate': 9.079483069970683e-06, 'epoch': 1.06} {'loss': 0.65, 'learning_rate': 9.079157108791286e-06, 'epoch': 1.06} {'loss': 0.456, 'learning_rate': 9.078831148598653e-06, 'epoch': 1.06} {'loss': 0.5322, 'learning_rate': 9.078505189393136e-06, 'epoch': 1.06} {'loss': 0.4927, 'learning_rate': 9.078179231175081e-06, 'epoch': 1.06} {'loss': 0.5386, 'learning_rate': 9.077853273944846e-06, 'epoch': 1.06} {'loss': 0.4839, 'learning_rate': 9.077527317702771e-06, 'epoch': 1.06} {'loss': 0.7284, 'learning_rate': 9.077201362449211e-06, 'epoch': 1.06} {'loss': 0.569, 'learning_rate': 9.076875408184511e-06, 'epoch': 1.06} {'loss': 0.5493, 'learning_rate': 9.076549454909022e-06, 'epoch': 1.06} {'loss': 0.522, 'learning_rate': 9.076223502623096e-06, 'epoch': 1.06} {'loss': 0.5146, 'learning_rate': 9.075897551327075e-06, 'epoch': 1.06} {'loss': 0.5582, 'learning_rate': 9.075571601021319e-06, 'epoch': 1.06} {'loss': 0.5191, 'learning_rate': 9.075245651706168e-06, 'epoch': 1.06} {'loss': 0.5066, 'learning_rate': 9.074919703381976e-06, 'epoch': 1.06} {'loss': 0.5114, 'learning_rate': 9.074593756049092e-06, 'epoch': 1.06} {'loss': 0.4955, 'learning_rate': 9.07426780970786e-06, 'epoch': 1.06} {'loss': 0.5681, 'learning_rate': 9.073941864358637e-06, 'epoch': 1.06} {'loss': 0.7201, 'learning_rate': 9.073615920001766e-06, 'epoch': 1.06} {'loss': 0.5692, 'learning_rate': 9.073289976637604e-06, 'epoch': 1.06} {'loss': 0.5444, 'learning_rate': 9.072964034266493e-06, 'epoch': 1.06} {'loss': 0.5565, 'learning_rate': 9.072638092888785e-06, 'epoch': 1.06} {'loss': 0.3528, 'learning_rate': 9.07231215250483e-06, 'epoch': 1.06} {'loss': 0.4207, 'learning_rate': 9.071986213114972e-06, 'epoch': 1.06} {'loss': 0.7451, 'learning_rate': 9.071660274719568e-06, 'epoch': 1.06} {'loss': 0.5965, 'learning_rate': 9.071334337318962e-06, 'epoch': 1.06} {'loss': 0.6302, 'learning_rate': 9.071008400913508e-06, 'epoch': 1.06} {'loss': 0.5577, 'learning_rate': 9.070682465503551e-06, 'epoch': 1.06} {'loss': 0.5294, 'learning_rate': 9.070356531089441e-06, 'epoch': 1.06} {'loss': 0.5769, 'learning_rate': 9.070030597671531e-06, 'epoch': 1.06} {'loss': 0.543, 'learning_rate': 9.069704665250161e-06, 'epoch': 1.06} {'loss': 0.4924, 'learning_rate': 9.069378733825691e-06, 'epoch': 1.06} {'loss': 0.6339, 'learning_rate': 9.069052803398466e-06, 'epoch': 1.06} {'loss': 0.4966, 'learning_rate': 9.06872687396883e-06, 'epoch': 1.06} {'loss': 0.6095, 'learning_rate': 9.068400945537142e-06, 'epoch': 1.06} {'loss': 0.5247, 'learning_rate': 9.068075018103744e-06, 'epoch': 1.06} {'loss': 0.435, 'learning_rate': 9.06774909166899e-06, 'epoch': 1.06} {'loss': 0.5573, 'learning_rate': 9.067423166233225e-06, 'epoch': 1.06} {'loss': 0.5135, 'learning_rate': 9.067097241796802e-06, 'epoch': 1.06} {'loss': 0.5994, 'learning_rate': 9.066771318360069e-06, 'epoch': 1.06} {'loss': 0.5072, 'learning_rate': 9.06644539592337e-06, 'epoch': 1.06} {'loss': 0.6005, 'learning_rate': 9.066119474487064e-06, 'epoch': 1.06} {'loss': 0.4071, 'learning_rate': 9.065793554051493e-06, 'epoch': 1.06} {'loss': 0.6681, 'learning_rate': 9.065467634617011e-06, 'epoch': 1.06} {'loss': 0.6462, 'learning_rate': 9.06514171618396e-06, 'epoch': 1.06} {'loss': 0.6231, 'learning_rate': 9.064815798752699e-06, 'epoch': 1.06} {'loss': 0.5846, 'learning_rate': 9.06448988232357e-06, 'epoch': 1.06} {'loss': 0.5844, 'learning_rate': 9.064163966896923e-06, 'epoch': 1.06} {'loss': 0.4582, 'learning_rate': 9.063838052473112e-06, 'epoch': 1.06} {'loss': 0.6475, 'learning_rate': 9.063512139052481e-06, 'epoch': 1.06} {'loss': 0.5386, 'learning_rate': 9.063186226635383e-06, 'epoch': 1.06} {'loss': 0.6507, 'learning_rate': 9.062860315222166e-06, 'epoch': 1.06} {'loss': 0.5977, 'learning_rate': 9.062534404813174e-06, 'epoch': 1.06} {'loss': 0.5028, 'learning_rate': 9.062208495408766e-06, 'epoch': 1.06} {'loss': 0.4232, 'learning_rate': 9.06188258700928e-06, 'epoch': 1.06} {'loss': 0.4552, 'learning_rate': 9.061556679615077e-06, 'epoch': 1.06} {'loss': 0.4526, 'learning_rate': 9.061230773226499e-06, 'epoch': 1.06} {'loss': 0.5403, 'learning_rate': 9.060904867843899e-06, 'epoch': 1.06} {'loss': 0.3436, 'learning_rate': 9.060578963467625e-06, 'epoch': 1.06} {'loss': 0.438, 'learning_rate': 9.06025306009802e-06, 'epoch': 1.06} {'loss': 0.5161, 'learning_rate': 9.059927157735443e-06, 'epoch': 1.06} {'loss': 0.6601, 'learning_rate': 9.059601256380236e-06, 'epoch': 1.06} {'loss': 0.6291, 'learning_rate': 9.059275356032754e-06, 'epoch': 1.06} {'loss': 0.5697, 'learning_rate': 9.058949456693341e-06, 'epoch': 1.06} {'loss': 0.5059, 'learning_rate': 9.05862355836235e-06, 'epoch': 1.06} {'loss': 0.6705, 'learning_rate': 9.05829766104013e-06, 'epoch': 1.06} {'loss': 0.4772, 'learning_rate': 9.057971764727026e-06, 'epoch': 1.06} {'loss': 0.5972, 'learning_rate': 9.057645869423393e-06, 'epoch': 1.06} {'loss': 0.4427, 'learning_rate': 9.057319975129573e-06, 'epoch': 1.06} {'loss': 0.534, 'learning_rate': 9.056994081845924e-06, 'epoch': 1.06} {'loss': 0.5032, 'learning_rate': 9.056668189572792e-06, 'epoch': 1.06} {'loss': 0.4879, 'learning_rate': 9.056342298310523e-06, 'epoch': 1.06} {'loss': 0.5819, 'learning_rate': 9.05601640805947e-06, 'epoch': 1.06} {'loss': 0.5159, 'learning_rate': 9.055690518819977e-06, 'epoch': 1.06} {'loss': 0.599, 'learning_rate': 9.0553646305924e-06, 'epoch': 1.06} {'loss': 0.5651, 'learning_rate': 9.055038743377083e-06, 'epoch': 1.06} {'loss': 0.6718, 'learning_rate': 9.054712857174379e-06, 'epoch': 1.06} {'loss': 0.5841, 'learning_rate': 9.054386971984636e-06, 'epoch': 1.06} {'loss': 0.5838, 'learning_rate': 9.054061087808201e-06, 'epoch': 1.06} {'loss': 0.6034, 'learning_rate': 9.053735204645427e-06, 'epoch': 1.06} {'loss': 0.4382, 'learning_rate': 9.053409322496656e-06, 'epoch': 1.06} {'loss': 0.588, 'learning_rate': 9.053083441362248e-06, 'epoch': 1.06} {'loss': 0.5129, 'learning_rate': 9.052757561242545e-06, 'epoch': 1.06} {'loss': 0.6211, 'learning_rate': 9.052431682137897e-06, 'epoch': 1.06} {'loss': 0.5048, 'learning_rate': 9.052105804048654e-06, 'epoch': 1.06} {'loss': 0.5239, 'learning_rate': 9.051779926975164e-06, 'epoch': 1.06} {'loss': 0.6108, 'learning_rate': 9.051454050917782e-06, 'epoch': 1.06} {'loss': 0.602, 'learning_rate': 9.051128175876846e-06, 'epoch': 1.06} {'loss': 0.48, 'learning_rate': 9.050802301852717e-06, 'epoch': 1.06} {'loss': 0.6518, 'learning_rate': 9.050476428845739e-06, 'epoch': 1.06} {'loss': 0.5073, 'learning_rate': 9.050150556856258e-06, 'epoch': 1.06} {'loss': 0.5043, 'learning_rate': 9.04982468588463e-06, 'epoch': 1.06} {'loss': 0.5193, 'learning_rate': 9.049498815931197e-06, 'epoch': 1.06} {'loss': 0.5734, 'learning_rate': 9.049172946996313e-06, 'epoch': 1.06} {'loss': 0.5032, 'learning_rate': 9.048847079080325e-06, 'epoch': 1.06} {'loss': 0.6149, 'learning_rate': 9.048521212183585e-06, 'epoch': 1.06} {'loss': 0.4331, 'learning_rate': 9.048195346306441e-06, 'epoch': 1.06} {'loss': 0.6061, 'learning_rate': 9.04786948144924e-06, 'epoch': 1.06} {'loss': 0.5552, 'learning_rate': 9.047543617612334e-06, 'epoch': 1.06} {'loss': 0.5373, 'learning_rate': 9.047217754796069e-06, 'epoch': 1.06} {'loss': 0.5458, 'learning_rate': 9.046891893000797e-06, 'epoch': 1.06} {'loss': 0.5974, 'learning_rate': 9.046566032226869e-06, 'epoch': 1.06} {'loss': 0.4723, 'learning_rate': 9.046240172474627e-06, 'epoch': 1.06} {'loss': 0.4713, 'learning_rate': 9.045914313744428e-06, 'epoch': 1.06} {'loss': 0.7537, 'learning_rate': 9.045588456036617e-06, 'epoch': 1.06} {'loss': 0.5477, 'learning_rate': 9.045262599351546e-06, 'epoch': 1.06} {'loss': 0.6052, 'learning_rate': 9.044936743689556e-06, 'epoch': 1.06} {'loss': 0.5528, 'learning_rate': 9.044610889051008e-06, 'epoch': 1.06} {'loss': 0.5605, 'learning_rate': 9.044285035436248e-06, 'epoch': 1.06} {'loss': 0.5443, 'learning_rate': 9.043959182845616e-06, 'epoch': 1.06} {'loss': 0.6045, 'learning_rate': 9.043633331279473e-06, 'epoch': 1.06} {'loss': 0.5566, 'learning_rate': 9.04330748073816e-06, 'epoch': 1.06} {'loss': 0.5482, 'learning_rate': 9.042981631222033e-06, 'epoch': 1.06} {'loss': 0.417, 'learning_rate': 9.042655782731433e-06, 'epoch': 1.06} {'loss': 0.5666, 'learning_rate': 9.042329935266718e-06, 'epoch': 1.06} {'loss': 0.5814, 'learning_rate': 9.042004088828232e-06, 'epoch': 1.06} {'loss': 0.6633, 'learning_rate': 9.041678243416322e-06, 'epoch': 1.06} {'loss': 0.5713, 'learning_rate': 9.041352399031343e-06, 'epoch': 1.06} {'loss': 0.5439, 'learning_rate': 9.04102655567364e-06, 'epoch': 1.06} {'loss': 0.6931, 'learning_rate': 9.040700713343567e-06, 'epoch': 1.06} {'loss': 0.5929, 'learning_rate': 9.04037487204147e-06, 'epoch': 1.06} {'loss': 0.6485, 'learning_rate': 9.040049031767692e-06, 'epoch': 1.06} {'loss': 0.5494, 'learning_rate': 9.039723192522593e-06, 'epoch': 1.06} {'loss': 0.5647, 'learning_rate': 9.039397354306511e-06, 'epoch': 1.06} {'loss': 0.47, 'learning_rate': 9.039071517119808e-06, 'epoch': 1.06} {'loss': 0.5208, 'learning_rate': 9.038745680962824e-06, 'epoch': 1.06} {'loss': 0.6625, 'learning_rate': 9.038419845835914e-06, 'epoch': 1.06} {'loss': 0.6717, 'learning_rate': 9.038094011739422e-06, 'epoch': 1.06} {'loss': 0.7158, 'learning_rate': 9.037768178673697e-06, 'epoch': 1.06} {'loss': 0.6425, 'learning_rate': 9.037442346639093e-06, 'epoch': 1.06} {'loss': 0.5416, 'learning_rate': 9.037116515635952e-06, 'epoch': 1.06} {'loss': 0.5855, 'learning_rate': 9.036790685664632e-06, 'epoch': 1.06} {'loss': 0.6359, 'learning_rate': 9.036464856725475e-06, 'epoch': 1.06} {'loss': 0.5157, 'learning_rate': 9.036139028818836e-06, 'epoch': 1.06} {'loss': 0.4731, 'learning_rate': 9.03581320194506e-06, 'epoch': 1.06} {'loss': 0.6755, 'learning_rate': 9.035487376104495e-06, 'epoch': 1.06} {'loss': 0.6514, 'learning_rate': 9.035161551297495e-06, 'epoch': 1.06} {'loss': 0.54, 'learning_rate': 9.034835727524402e-06, 'epoch': 1.06} {'loss': 0.7906, 'learning_rate': 9.034509904785574e-06, 'epoch': 1.06} {'loss': 0.5207, 'learning_rate': 9.034184083081357e-06, 'epoch': 1.06} {'loss': 0.6662, 'learning_rate': 9.033858262412095e-06, 'epoch': 1.06} {'loss': 0.5165, 'learning_rate': 9.033532442778145e-06, 'epoch': 1.06} {'loss': 0.6156, 'learning_rate': 9.033206624179846e-06, 'epoch': 1.06} {'loss': 0.5329, 'learning_rate': 9.03288080661756e-06, 'epoch': 1.06} {'loss': 0.6288, 'learning_rate': 9.032554990091623e-06, 'epoch': 1.06} {'loss': 0.5639, 'learning_rate': 9.032229174602395e-06, 'epoch': 1.06} {'loss': 0.5547, 'learning_rate': 9.031903360150222e-06, 'epoch': 1.06} {'loss': 0.611, 'learning_rate': 9.031577546735451e-06, 'epoch': 1.06} {'loss': 0.5406, 'learning_rate': 9.031251734358431e-06, 'epoch': 1.06} {'loss': 0.5314, 'learning_rate': 9.030925923019511e-06, 'epoch': 1.06} {'loss': 0.5289, 'learning_rate': 9.030600112719043e-06, 'epoch': 1.06} {'loss': 0.5948, 'learning_rate': 9.030274303457374e-06, 'epoch': 1.06} {'loss': 0.5682, 'learning_rate': 9.029948495234853e-06, 'epoch': 1.06} {'loss': 0.4739, 'learning_rate': 9.029622688051832e-06, 'epoch': 1.06} {'loss': 0.3783, 'learning_rate': 9.029296881908656e-06, 'epoch': 1.06} {'loss': 0.5544, 'learning_rate': 9.028971076805678e-06, 'epoch': 1.06} {'loss': 0.4741, 'learning_rate': 9.02864527274324e-06, 'epoch': 1.06} {'loss': 0.677, 'learning_rate': 9.0283194697217e-06, 'epoch': 1.06} {'loss': 0.4626, 'learning_rate': 9.027993667741405e-06, 'epoch': 1.06} {'loss': 0.637, 'learning_rate': 9.027667866802701e-06, 'epoch': 1.06} {'loss': 0.6193, 'learning_rate': 9.027342066905937e-06, 'epoch': 1.06} {'loss': 0.5333, 'learning_rate': 9.027016268051464e-06, 'epoch': 1.06} {'loss': 0.6357, 'learning_rate': 9.026690470239635e-06, 'epoch': 1.06} {'loss': 0.6379, 'learning_rate': 9.026364673470789e-06, 'epoch': 1.07} {'loss': 0.5948, 'learning_rate': 9.026038877745286e-06, 'epoch': 1.07} {'loss': 0.5755, 'learning_rate': 9.025713083063469e-06, 'epoch': 1.07} {'loss': 0.531, 'learning_rate': 9.025387289425687e-06, 'epoch': 1.07} {'loss': 0.5245, 'learning_rate': 9.025061496832294e-06, 'epoch': 1.07} {'loss': 0.7038, 'learning_rate': 9.02473570528363e-06, 'epoch': 1.07} {'loss': 0.6124, 'learning_rate': 9.024409914780053e-06, 'epoch': 1.07} {'loss': 0.6421, 'learning_rate': 9.024084125321906e-06, 'epoch': 1.07} {'loss': 0.5607, 'learning_rate': 9.023758336909545e-06, 'epoch': 1.07} {'loss': 0.64, 'learning_rate': 9.023432549543314e-06, 'epoch': 1.07} {'loss': 0.6346, 'learning_rate': 9.023106763223562e-06, 'epoch': 1.07} {'loss': 0.5966, 'learning_rate': 9.022780977950642e-06, 'epoch': 1.07} {'loss': 0.5369, 'learning_rate': 9.022455193724894e-06, 'epoch': 1.07} {'loss': 0.5583, 'learning_rate': 9.02212941054668e-06, 'epoch': 1.07} {'loss': 0.6021, 'learning_rate': 9.021803628416341e-06, 'epoch': 1.07} {'loss': 0.5165, 'learning_rate': 9.021477847334225e-06, 'epoch': 1.07} {'loss': 0.5346, 'learning_rate': 9.021152067300687e-06, 'epoch': 1.07} {'loss': 0.4642, 'learning_rate': 9.020826288316071e-06, 'epoch': 1.07} {'loss': 0.6107, 'learning_rate': 9.02050051038073e-06, 'epoch': 1.07} {'loss': 0.5141, 'learning_rate': 9.020174733495007e-06, 'epoch': 1.07} {'loss': 0.7109, 'learning_rate': 9.01984895765926e-06, 'epoch': 1.07} {'loss': 0.5635, 'learning_rate': 9.019523182873832e-06, 'epoch': 1.07} {'loss': 0.6812, 'learning_rate': 9.01919740913907e-06, 'epoch': 1.07} {'loss': 0.503, 'learning_rate': 9.01887163645533e-06, 'epoch': 1.07} {'loss': 0.5304, 'learning_rate': 9.018545864822957e-06, 'epoch': 1.07} {'loss': 0.6284, 'learning_rate': 9.018220094242301e-06, 'epoch': 1.07} {'loss': 0.5414, 'learning_rate': 9.017894324713713e-06, 'epoch': 1.07} {'loss': 0.6111, 'learning_rate': 9.017568556237533e-06, 'epoch': 1.07} {'loss': 0.6177, 'learning_rate': 9.017242788814124e-06, 'epoch': 1.07} {'loss': 0.5457, 'learning_rate': 9.016917022443822e-06, 'epoch': 1.07} {'loss': 0.469, 'learning_rate': 9.016591257126986e-06, 'epoch': 1.07} {'loss': 0.686, 'learning_rate': 9.01626549286396e-06, 'epoch': 1.07} {'loss': 0.5095, 'learning_rate': 9.015939729655097e-06, 'epoch': 1.07} {'loss': 0.477, 'learning_rate': 9.015613967500742e-06, 'epoch': 1.07} {'loss': 0.3664, 'learning_rate': 9.015288206401243e-06, 'epoch': 1.07} {'loss': 0.5697, 'learning_rate': 9.014962446356955e-06, 'epoch': 1.07} {'loss': 0.5228, 'learning_rate': 9.014636687368218e-06, 'epoch': 1.07} {'loss': 0.4415, 'learning_rate': 9.014310929435392e-06, 'epoch': 1.07} {'loss': 0.5462, 'learning_rate': 9.013985172558819e-06, 'epoch': 1.07} {'loss': 0.6153, 'learning_rate': 9.01365941673885e-06, 'epoch': 1.07} {'loss': 0.6918, 'learning_rate': 9.013333661975838e-06, 'epoch': 1.07} {'loss': 0.5662, 'learning_rate': 9.01300790827012e-06, 'epoch': 1.07} {'loss': 0.4633, 'learning_rate': 9.01268215562206e-06, 'epoch': 1.07} {'loss': 0.518, 'learning_rate': 9.012356404031995e-06, 'epoch': 1.07} {'loss': 0.6231, 'learning_rate': 9.012030653500283e-06, 'epoch': 1.07} {'loss': 0.6757, 'learning_rate': 9.01170490402727e-06, 'epoch': 1.07} {'loss': 0.5867, 'learning_rate': 9.0113791556133e-06, 'epoch': 1.07} {'loss': 0.5134, 'learning_rate': 9.011053408258733e-06, 'epoch': 1.07} {'loss': 0.5806, 'learning_rate': 9.010727661963903e-06, 'epoch': 1.07} {'loss': 0.5862, 'learning_rate': 9.010401916729175e-06, 'epoch': 1.07} {'loss': 0.6698, 'learning_rate': 9.010076172554884e-06, 'epoch': 1.07} {'loss': 0.6661, 'learning_rate': 9.00975042944139e-06, 'epoch': 1.07} {'loss': 0.6855, 'learning_rate': 9.00942468738904e-06, 'epoch': 1.07} {'loss': 0.5907, 'learning_rate': 9.009098946398177e-06, 'epoch': 1.07} {'loss': 0.5849, 'learning_rate': 9.008773206469157e-06, 'epoch': 1.07} {'loss': 0.5584, 'learning_rate': 9.008447467602321e-06, 'epoch': 1.07} {'loss': 0.664, 'learning_rate': 9.008121729798028e-06, 'epoch': 1.07} {'loss': 0.6439, 'learning_rate': 9.007795993056618e-06, 'epoch': 1.07} {'loss': 0.5131, 'learning_rate': 9.007470257378446e-06, 'epoch': 1.07} {'loss': 0.4839, 'learning_rate': 9.007144522763862e-06, 'epoch': 1.07} {'loss': 0.6462, 'learning_rate': 9.006818789213209e-06, 'epoch': 1.07} {'loss': 0.4834, 'learning_rate': 9.006493056726842e-06, 'epoch': 1.07} {'loss': 0.5529, 'learning_rate': 9.006167325305102e-06, 'epoch': 1.07} {'loss': 0.4918, 'learning_rate': 9.00584159494835e-06, 'epoch': 1.07} {'loss': 0.5619, 'learning_rate': 9.005515865656925e-06, 'epoch': 1.07} {'loss': 0.4778, 'learning_rate': 9.005190137431178e-06, 'epoch': 1.07} {'loss': 0.4517, 'learning_rate': 9.004864410271462e-06, 'epoch': 1.07} {'loss': 0.558, 'learning_rate': 9.004538684178123e-06, 'epoch': 1.07} {'loss': 0.5592, 'learning_rate': 9.00421295915151e-06, 'epoch': 1.07} {'loss': 0.6183, 'learning_rate': 9.003887235191972e-06, 'epoch': 1.07} {'loss': 0.5458, 'learning_rate': 9.003561512299861e-06, 'epoch': 1.07} {'loss': 0.603, 'learning_rate': 9.003235790475525e-06, 'epoch': 1.07} {'loss': 0.5829, 'learning_rate': 9.00291006971931e-06, 'epoch': 1.07} {'loss': 0.5374, 'learning_rate': 9.002584350031565e-06, 'epoch': 1.07} {'loss': 0.4429, 'learning_rate': 9.002258631412642e-06, 'epoch': 1.07} {'loss': 0.4409, 'learning_rate': 9.001932913862892e-06, 'epoch': 1.07} {'loss': 0.6247, 'learning_rate': 9.001607197382654e-06, 'epoch': 1.07} {'loss': 0.5461, 'learning_rate': 9.001281481972289e-06, 'epoch': 1.07} {'loss': 0.6072, 'learning_rate': 9.000955767632142e-06, 'epoch': 1.07} {'loss': 0.5246, 'learning_rate': 9.00063005436256e-06, 'epoch': 1.07} {'loss': 0.4236, 'learning_rate': 9.000304342163892e-06, 'epoch': 1.07} {'loss': 0.4777, 'learning_rate': 8.999978631036486e-06, 'epoch': 1.07} {'loss': 0.7698, 'learning_rate': 8.999652920980699e-06, 'epoch': 1.07} {'loss': 0.6693, 'learning_rate': 8.99932721199687e-06, 'epoch': 1.07} {'loss': 0.5766, 'learning_rate': 8.999001504085352e-06, 'epoch': 1.07} {'loss': 0.4582, 'learning_rate': 8.998675797246496e-06, 'epoch': 1.07} {'loss': 0.5267, 'learning_rate': 8.99835009148065e-06, 'epoch': 1.07} {'loss': 0.6169, 'learning_rate': 8.998024386788161e-06, 'epoch': 1.07} {'loss': 0.5311, 'learning_rate': 8.997698683169375e-06, 'epoch': 1.07} {'loss': 0.5783, 'learning_rate': 8.997372980624652e-06, 'epoch': 1.07} {'loss': 0.3949, 'learning_rate': 8.997047279154333e-06, 'epoch': 1.07} {'loss': 0.4995, 'learning_rate': 8.996721578758765e-06, 'epoch': 1.07} {'loss': 0.6186, 'learning_rate': 8.996395879438304e-06, 'epoch': 1.07} {'loss': 0.5947, 'learning_rate': 8.996070181193293e-06, 'epoch': 1.07} {'loss': 0.3925, 'learning_rate': 8.995744484024087e-06, 'epoch': 1.07} {'loss': 0.5238, 'learning_rate': 8.995418787931025e-06, 'epoch': 1.07} {'loss': 0.5324, 'learning_rate': 8.995093092914468e-06, 'epoch': 1.07} {'loss': 0.5505, 'learning_rate': 8.99476739897476e-06, 'epoch': 1.07} {'loss': 0.5338, 'learning_rate': 8.994441706112244e-06, 'epoch': 1.07} {'loss': 0.4721, 'learning_rate': 8.994116014327279e-06, 'epoch': 1.07} {'loss': 0.4403, 'learning_rate': 8.993790323620208e-06, 'epoch': 1.07} {'loss': 0.4946, 'learning_rate': 8.993464633991382e-06, 'epoch': 1.07} {'loss': 0.6013, 'learning_rate': 8.993138945441151e-06, 'epoch': 1.07} {'loss': 0.4826, 'learning_rate': 8.992813257969858e-06, 'epoch': 1.07} {'loss': 0.5678, 'learning_rate': 8.99248757157786e-06, 'epoch': 1.07} {'loss': 0.4754, 'learning_rate': 8.9921618862655e-06, 'epoch': 1.07} {'loss': 0.4871, 'learning_rate': 8.991836202033132e-06, 'epoch': 1.07} {'loss': 0.6749, 'learning_rate': 8.991510518881102e-06, 'epoch': 1.07} {'loss': 0.4784, 'learning_rate': 8.99118483680976e-06, 'epoch': 1.07} {'loss': 0.6073, 'learning_rate': 8.990859155819454e-06, 'epoch': 1.07} {'loss': 0.4717, 'learning_rate': 8.990533475910532e-06, 'epoch': 1.07} {'loss': 0.5801, 'learning_rate': 8.990207797083346e-06, 'epoch': 1.07} {'loss': 0.6628, 'learning_rate': 8.98988211933824e-06, 'epoch': 1.07} {'loss': 0.5381, 'learning_rate': 8.98955644267557e-06, 'epoch': 1.07} {'loss': 0.4303, 'learning_rate': 8.989230767095684e-06, 'epoch': 1.07} {'loss': 0.5331, 'learning_rate': 8.988905092598926e-06, 'epoch': 1.07} {'loss': 0.4217, 'learning_rate': 8.988579419185648e-06, 'epoch': 1.07} {'loss': 0.4509, 'learning_rate': 8.988253746856193e-06, 'epoch': 1.07} {'loss': 0.5112, 'learning_rate': 8.987928075610922e-06, 'epoch': 1.07} {'loss': 0.5081, 'learning_rate': 8.987602405450173e-06, 'epoch': 1.07} {'loss': 0.5478, 'learning_rate': 8.987276736374304e-06, 'epoch': 1.07} {'loss': 0.6554, 'learning_rate': 8.986951068383656e-06, 'epoch': 1.07} {'loss': 0.4952, 'learning_rate': 8.986625401478582e-06, 'epoch': 1.07} {'loss': 0.5145, 'learning_rate': 8.986299735659432e-06, 'epoch': 1.07} {'loss': 0.5029, 'learning_rate': 8.98597407092655e-06, 'epoch': 1.07} {'loss': 0.6555, 'learning_rate': 8.985648407280292e-06, 'epoch': 1.07} {'loss': 0.5615, 'learning_rate': 8.985322744720998e-06, 'epoch': 1.07} {'loss': 0.6281, 'learning_rate': 8.984997083249029e-06, 'epoch': 1.07} {'loss': 0.4715, 'learning_rate': 8.984671422864725e-06, 'epoch': 1.07} {'loss': 0.4915, 'learning_rate': 8.984345763568436e-06, 'epoch': 1.07} {'loss': 0.6444, 'learning_rate': 8.984020105360514e-06, 'epoch': 1.07} {'loss': 0.5074, 'learning_rate': 8.983694448241301e-06, 'epoch': 1.07} {'loss': 0.6432, 'learning_rate': 8.983368792211157e-06, 'epoch': 1.07} {'loss': 0.6315, 'learning_rate': 8.983043137270425e-06, 'epoch': 1.07} {'loss': 0.4141, 'learning_rate': 8.98271748341945e-06, 'epoch': 1.07} {'loss': 0.7454, 'learning_rate': 8.982391830658587e-06, 'epoch': 1.07} {'loss': 0.6302, 'learning_rate': 8.982066178988182e-06, 'epoch': 1.07} {'loss': 0.7138, 'learning_rate': 8.981740528408587e-06, 'epoch': 1.07} {'loss': 0.6984, 'learning_rate': 8.981414878920145e-06, 'epoch': 1.07} {'loss': 0.3958, 'learning_rate': 8.981089230523213e-06, 'epoch': 1.07} {'loss': 0.5876, 'learning_rate': 8.980763583218137e-06, 'epoch': 1.07} {'loss': 0.4415, 'learning_rate': 8.98043793700526e-06, 'epoch': 1.07} {'loss': 0.4619, 'learning_rate': 8.98011229188494e-06, 'epoch': 1.07} {'loss': 0.6927, 'learning_rate': 8.979786647857519e-06, 'epoch': 1.07} {'loss': 0.546, 'learning_rate': 8.979461004923351e-06, 'epoch': 1.07} {'loss': 0.4416, 'learning_rate': 8.979135363082778e-06, 'epoch': 1.07} {'loss': 0.6903, 'learning_rate': 8.978809722336158e-06, 'epoch': 1.07} {'loss': 0.571, 'learning_rate': 8.978484082683836e-06, 'epoch': 1.07} {'loss': 0.6764, 'learning_rate': 8.978158444126156e-06, 'epoch': 1.07} {'loss': 0.5986, 'learning_rate': 8.977832806663475e-06, 'epoch': 1.07} {'loss': 0.5454, 'learning_rate': 8.977507170296138e-06, 'epoch': 1.07} {'loss': 0.5773, 'learning_rate': 8.977181535024496e-06, 'epoch': 1.07} {'loss': 0.6075, 'learning_rate': 8.976855900848895e-06, 'epoch': 1.07} {'loss': 0.5829, 'learning_rate': 8.976530267769683e-06, 'epoch': 1.07} {'loss': 0.6453, 'learning_rate': 8.976204635787213e-06, 'epoch': 1.07} {'loss': 0.5493, 'learning_rate': 8.975879004901831e-06, 'epoch': 1.07} {'loss': 0.5931, 'learning_rate': 8.97555337511389e-06, 'epoch': 1.07} {'loss': 0.4739, 'learning_rate': 8.975227746423733e-06, 'epoch': 1.07} {'loss': 0.5633, 'learning_rate': 8.974902118831714e-06, 'epoch': 1.07} {'loss': 0.6538, 'learning_rate': 8.97457649233818e-06, 'epoch': 1.07} {'loss': 0.6753, 'learning_rate': 8.974250866943476e-06, 'epoch': 1.07} {'loss': 0.5784, 'learning_rate': 8.97392524264796e-06, 'epoch': 1.07} {'loss': 0.5275, 'learning_rate': 8.973599619451971e-06, 'epoch': 1.07} {'loss': 0.5861, 'learning_rate': 8.973273997355866e-06, 'epoch': 1.07} {'loss': 0.5607, 'learning_rate': 8.972948376359988e-06, 'epoch': 1.07} {'loss': 0.6628, 'learning_rate': 8.972622756464691e-06, 'epoch': 1.07} {'loss': 0.6162, 'learning_rate': 8.972297137670322e-06, 'epoch': 1.07} {'loss': 0.704, 'learning_rate': 8.971971519977225e-06, 'epoch': 1.07} {'loss': 0.4751, 'learning_rate': 8.971645903385758e-06, 'epoch': 1.07} {'loss': 0.5561, 'learning_rate': 8.971320287896263e-06, 'epoch': 1.07} {'loss': 0.5804, 'learning_rate': 8.970994673509093e-06, 'epoch': 1.07} {'loss': 0.5609, 'learning_rate': 8.970669060224595e-06, 'epoch': 1.07} {'loss': 0.5273, 'learning_rate': 8.970343448043114e-06, 'epoch': 1.07} {'loss': 0.6234, 'learning_rate': 8.970017836965007e-06, 'epoch': 1.07} {'loss': 0.6149, 'learning_rate': 8.969692226990615e-06, 'epoch': 1.07} {'loss': 0.5181, 'learning_rate': 8.969366618120294e-06, 'epoch': 1.07} {'loss': 0.5825, 'learning_rate': 8.969041010354387e-06, 'epoch': 1.07} {'loss': 0.6909, 'learning_rate': 8.96871540369325e-06, 'epoch': 1.07} {'loss': 0.4182, 'learning_rate': 8.968389798137227e-06, 'epoch': 1.07} {'loss': 0.5124, 'learning_rate': 8.968064193686661e-06, 'epoch': 1.07} {'loss': 0.5258, 'learning_rate': 8.967738590341914e-06, 'epoch': 1.07} {'loss': 0.4721, 'learning_rate': 8.967412988103323e-06, 'epoch': 1.07} {'loss': 0.5698, 'learning_rate': 8.967087386971248e-06, 'epoch': 1.07} {'loss': 0.6568, 'learning_rate': 8.966761786946028e-06, 'epoch': 1.07} {'loss': 0.5142, 'learning_rate': 8.966436188028019e-06, 'epoch': 1.07} {'loss': 0.57, 'learning_rate': 8.966110590217566e-06, 'epoch': 1.07} {'loss': 0.6894, 'learning_rate': 8.965784993515016e-06, 'epoch': 1.07} {'loss': 0.6075, 'learning_rate': 8.965459397920724e-06, 'epoch': 1.07} {'loss': 0.457, 'learning_rate': 8.965133803435032e-06, 'epoch': 1.07} {'loss': 0.5088, 'learning_rate': 8.964808210058295e-06, 'epoch': 1.07} {'loss': 0.4795, 'learning_rate': 8.964482617790862e-06, 'epoch': 1.07} {'loss': 0.3752, 'learning_rate': 8.964157026633076e-06, 'epoch': 1.07} {'loss': 0.6172, 'learning_rate': 8.963831436585291e-06, 'epoch': 1.07} {'loss': 0.6081, 'learning_rate': 8.96350584764785e-06, 'epoch': 1.07} {'loss': 0.4016, 'learning_rate': 8.96318025982111e-06, 'epoch': 1.07} {'loss': 0.6677, 'learning_rate': 8.962854673105414e-06, 'epoch': 1.07} {'loss': 0.496, 'learning_rate': 8.962529087501114e-06, 'epoch': 1.07} {'loss': 0.5813, 'learning_rate': 8.96220350300856e-06, 'epoch': 1.07} {'loss': 0.5414, 'learning_rate': 8.961877919628094e-06, 'epoch': 1.07} {'loss': 0.5963, 'learning_rate': 8.961552337360075e-06, 'epoch': 1.07} {'loss': 0.429, 'learning_rate': 8.96122675620484e-06, 'epoch': 1.07} {'loss': 0.4739, 'learning_rate': 8.960901176162748e-06, 'epoch': 1.07} {'loss': 0.6377, 'learning_rate': 8.960575597234146e-06, 'epoch': 1.07} {'loss': 0.6475, 'learning_rate': 8.960250019419375e-06, 'epoch': 1.07} {'loss': 0.6728, 'learning_rate': 8.959924442718795e-06, 'epoch': 1.07} {'loss': 0.4304, 'learning_rate': 8.959598867132749e-06, 'epoch': 1.07} {'loss': 0.5709, 'learning_rate': 8.959273292661586e-06, 'epoch': 1.07} {'loss': 0.6755, 'learning_rate': 8.958947719305653e-06, 'epoch': 1.07} {'loss': 0.5178, 'learning_rate': 8.958622147065305e-06, 'epoch': 1.07} {'loss': 0.6234, 'learning_rate': 8.958296575940889e-06, 'epoch': 1.07} {'loss': 0.5512, 'learning_rate': 8.957971005932748e-06, 'epoch': 1.07} {'loss': 0.6274, 'learning_rate': 8.957645437041239e-06, 'epoch': 1.07} {'loss': 0.7034, 'learning_rate': 8.957319869266703e-06, 'epoch': 1.07} {'loss': 0.4982, 'learning_rate': 8.956994302609496e-06, 'epoch': 1.07} {'loss': 0.6502, 'learning_rate': 8.95666873706996e-06, 'epoch': 1.07} {'loss': 0.6801, 'learning_rate': 8.95634317264845e-06, 'epoch': 1.07} {'loss': 0.579, 'learning_rate': 8.956017609345316e-06, 'epoch': 1.07} {'loss': 0.6166, 'learning_rate': 8.955692047160897e-06, 'epoch': 1.07} {'loss': 0.6518, 'learning_rate': 8.955366486095552e-06, 'epoch': 1.07} {'loss': 0.4632, 'learning_rate': 8.955040926149625e-06, 'epoch': 1.07} {'loss': 0.5938, 'learning_rate': 8.954715367323468e-06, 'epoch': 1.07} {'loss': 0.6659, 'learning_rate': 8.954389809617427e-06, 'epoch': 1.07} {'loss': 0.5487, 'learning_rate': 8.954064253031848e-06, 'epoch': 1.07} {'loss': 0.4483, 'learning_rate': 8.953738697567088e-06, 'epoch': 1.07} {'loss': 0.4372, 'learning_rate': 8.953413143223487e-06, 'epoch': 1.07} {'loss': 0.6167, 'learning_rate': 8.953087590001403e-06, 'epoch': 1.07} {'loss': 0.6754, 'learning_rate': 8.952762037901176e-06, 'epoch': 1.07} {'loss': 0.4849, 'learning_rate': 8.952436486923162e-06, 'epoch': 1.07} {'loss': 0.7455, 'learning_rate': 8.952110937067709e-06, 'epoch': 1.07} {'loss': 0.5947, 'learning_rate': 8.951785388335159e-06, 'epoch': 1.07} {'loss': 0.5297, 'learning_rate': 8.951459840725867e-06, 'epoch': 1.07} {'loss': 0.6185, 'learning_rate': 8.95113429424018e-06, 'epoch': 1.07} {'loss': 0.6815, 'learning_rate': 8.950808748878448e-06, 'epoch': 1.07} {'loss': 0.6316, 'learning_rate': 8.950483204641019e-06, 'epoch': 1.07} {'loss': 0.376, 'learning_rate': 8.950157661528243e-06, 'epoch': 1.07} {'loss': 0.7728, 'learning_rate': 8.949832119540468e-06, 'epoch': 1.07} {'loss': 0.5866, 'learning_rate': 8.949506578678038e-06, 'epoch': 1.07} {'loss': 0.5744, 'learning_rate': 8.949181038941312e-06, 'epoch': 1.07} {'loss': 0.4984, 'learning_rate': 8.94885550033063e-06, 'epoch': 1.07} {'loss': 0.6749, 'learning_rate': 8.948529962846348e-06, 'epoch': 1.07} {'loss': 0.6843, 'learning_rate': 8.948204426488808e-06, 'epoch': 1.07} {'loss': 0.5624, 'learning_rate': 8.947878891258361e-06, 'epoch': 1.07} {'loss': 0.53, 'learning_rate': 8.947553357155361e-06, 'epoch': 1.07} {'loss': 0.5724, 'learning_rate': 8.947227824180148e-06, 'epoch': 1.07} {'loss': 0.4983, 'learning_rate': 8.946902292333077e-06, 'epoch': 1.07} {'loss': 0.5401, 'learning_rate': 8.946576761614495e-06, 'epoch': 1.07} {'loss': 0.6723, 'learning_rate': 8.946251232024752e-06, 'epoch': 1.07} {'loss': 0.5989, 'learning_rate': 8.945925703564198e-06, 'epoch': 1.07} {'loss': 0.4718, 'learning_rate': 8.945600176233175e-06, 'epoch': 1.07} {'loss': 0.495, 'learning_rate': 8.94527465003204e-06, 'epoch': 1.07} {'loss': 0.5582, 'learning_rate': 8.944949124961135e-06, 'epoch': 1.07} {'loss': 0.6228, 'learning_rate': 8.944623601020815e-06, 'epoch': 1.07} {'loss': 0.5642, 'learning_rate': 8.944298078211425e-06, 'epoch': 1.07} {'loss': 0.5851, 'learning_rate': 8.943972556533318e-06, 'epoch': 1.07} {'loss': 0.4878, 'learning_rate': 8.943647035986837e-06, 'epoch': 1.07} {'loss': 0.4376, 'learning_rate': 8.94332151657233e-06, 'epoch': 1.07} {'loss': 0.5295, 'learning_rate': 8.942995998290155e-06, 'epoch': 1.07} {'loss': 0.4438, 'learning_rate': 8.942670481140651e-06, 'epoch': 1.07} {'loss': 0.5452, 'learning_rate': 8.942344965124174e-06, 'epoch': 1.07} {'loss': 0.639, 'learning_rate': 8.942019450241072e-06, 'epoch': 1.07} {'loss': 0.4862, 'learning_rate': 8.941693936491689e-06, 'epoch': 1.07} {'loss': 0.5692, 'learning_rate': 8.941368423876376e-06, 'epoch': 1.07} {'loss': 0.623, 'learning_rate': 8.94104291239548e-06, 'epoch': 1.07} {'loss': 0.6661, 'learning_rate': 8.940717402049356e-06, 'epoch': 1.07} {'loss': 0.5541, 'learning_rate': 8.940391892838345e-06, 'epoch': 1.07} {'loss': 0.5011, 'learning_rate': 8.940066384762803e-06, 'epoch': 1.07} {'loss': 0.5755, 'learning_rate': 8.939740877823077e-06, 'epoch': 1.07} {'loss': 0.471, 'learning_rate': 8.93941537201951e-06, 'epoch': 1.07} {'loss': 0.5601, 'learning_rate': 8.93908986735246e-06, 'epoch': 1.07} {'loss': 0.5594, 'learning_rate': 8.938764363822265e-06, 'epoch': 1.07} {'loss': 0.4833, 'learning_rate': 8.938438861429283e-06, 'epoch': 1.07} {'loss': 0.7201, 'learning_rate': 8.938113360173858e-06, 'epoch': 1.07} {'loss': 0.5106, 'learning_rate': 8.937787860056344e-06, 'epoch': 1.07} {'loss': 0.5369, 'learning_rate': 8.937462361077086e-06, 'epoch': 1.07} {'loss': 0.6741, 'learning_rate': 8.937136863236428e-06, 'epoch': 1.07} {'loss': 0.5876, 'learning_rate': 8.936811366534728e-06, 'epoch': 1.07} {'loss': 0.5281, 'learning_rate': 8.936485870972328e-06, 'epoch': 1.07} {'loss': 0.4807, 'learning_rate': 8.936160376549582e-06, 'epoch': 1.07} {'loss': 0.4842, 'learning_rate': 8.935834883266836e-06, 'epoch': 1.07} {'loss': 0.5438, 'learning_rate': 8.935509391124435e-06, 'epoch': 1.07} {'loss': 0.4297, 'learning_rate': 8.935183900122737e-06, 'epoch': 1.07} {'loss': 0.4674, 'learning_rate': 8.934858410262082e-06, 'epoch': 1.07} {'loss': 0.5673, 'learning_rate': 8.934532921542825e-06, 'epoch': 1.07} {'loss': 0.5644, 'learning_rate': 8.934207433965309e-06, 'epoch': 1.07} {'loss': 0.5432, 'learning_rate': 8.933881947529889e-06, 'epoch': 1.07} {'loss': 0.4872, 'learning_rate': 8.93355646223691e-06, 'epoch': 1.07} {'loss': 0.519, 'learning_rate': 8.933230978086718e-06, 'epoch': 1.07} {'loss': 0.4721, 'learning_rate': 8.93290549507967e-06, 'epoch': 1.07} {'loss': 0.4826, 'learning_rate': 8.932580013216108e-06, 'epoch': 1.07} {'loss': 0.5691, 'learning_rate': 8.932254532496383e-06, 'epoch': 1.07} {'loss': 0.5638, 'learning_rate': 8.931929052920848e-06, 'epoch': 1.07} {'loss': 0.502, 'learning_rate': 8.931603574489838e-06, 'epoch': 1.07} {'loss': 0.6735, 'learning_rate': 8.931278097203719e-06, 'epoch': 1.07} {'loss': 0.5224, 'learning_rate': 8.930952621062826e-06, 'epoch': 1.07} {'loss': 0.3648, 'learning_rate': 8.93062714606752e-06, 'epoch': 1.07} {'loss': 0.6106, 'learning_rate': 8.930301672218138e-06, 'epoch': 1.07} {'loss': 0.5202, 'learning_rate': 8.92997619951504e-06, 'epoch': 1.07} {'loss': 0.5178, 'learning_rate': 8.929650727958567e-06, 'epoch': 1.07} {'loss': 0.5588, 'learning_rate': 8.929325257549064e-06, 'epoch': 1.07} {'loss': 0.549, 'learning_rate': 8.928999788286894e-06, 'epoch': 1.07} {'loss': 0.5768, 'learning_rate': 8.92867432017239e-06, 'epoch': 1.07} {'loss': 0.5426, 'learning_rate': 8.928348853205913e-06, 'epoch': 1.07} {'loss': 0.658, 'learning_rate': 8.928023387387806e-06, 'epoch': 1.07} {'loss': 0.6304, 'learning_rate': 8.92769792271842e-06, 'epoch': 1.07} {'loss': 0.5638, 'learning_rate': 8.927372459198103e-06, 'epoch': 1.07} {'loss': 0.5287, 'learning_rate': 8.927046996827197e-06, 'epoch': 1.07} {'loss': 0.6414, 'learning_rate': 8.926721535606064e-06, 'epoch': 1.07} {'loss': 0.6086, 'learning_rate': 8.926396075535043e-06, 'epoch': 1.07} {'loss': 0.5394, 'learning_rate': 8.926070616614484e-06, 'epoch': 1.07} {'loss': 0.5407, 'learning_rate': 8.92574515884474e-06, 'epoch': 1.07} {'loss': 0.6227, 'learning_rate': 8.925419702226156e-06, 'epoch': 1.07} {'loss': 0.5765, 'learning_rate': 8.925094246759082e-06, 'epoch': 1.07} {'loss': 0.5067, 'learning_rate': 8.924768792443865e-06, 'epoch': 1.07} {'loss': 0.6017, 'learning_rate': 8.924443339280858e-06, 'epoch': 1.07} {'loss': 0.6844, 'learning_rate': 8.924117887270403e-06, 'epoch': 1.07} {'loss': 0.7549, 'learning_rate': 8.923792436412858e-06, 'epoch': 1.07} {'loss': 0.4582, 'learning_rate': 8.923466986708562e-06, 'epoch': 1.07} {'loss': 0.5711, 'learning_rate': 8.92314153815787e-06, 'epoch': 1.07} {'loss': 0.45, 'learning_rate': 8.922816090761131e-06, 'epoch': 1.07} {'loss': 0.4464, 'learning_rate': 8.922490644518687e-06, 'epoch': 1.07} {'loss': 0.4312, 'learning_rate': 8.922165199430895e-06, 'epoch': 1.07} {'loss': 0.541, 'learning_rate': 8.9218397554981e-06, 'epoch': 1.07} {'loss': 0.4426, 'learning_rate': 8.921514312720652e-06, 'epoch': 1.07} {'loss': 0.6516, 'learning_rate': 8.921188871098899e-06, 'epoch': 1.07} {'loss': 0.592, 'learning_rate': 8.920863430633184e-06, 'epoch': 1.07} {'loss': 0.4939, 'learning_rate': 8.920537991323868e-06, 'epoch': 1.07} {'loss': 0.5571, 'learning_rate': 8.920212553171288e-06, 'epoch': 1.07} {'loss': 0.5419, 'learning_rate': 8.9198871161758e-06, 'epoch': 1.07} {'loss': 0.6807, 'learning_rate': 8.919561680337751e-06, 'epoch': 1.07} {'loss': 0.521, 'learning_rate': 8.91923624565749e-06, 'epoch': 1.07} {'loss': 0.566, 'learning_rate': 8.918910812135364e-06, 'epoch': 1.07} {'loss': 0.6923, 'learning_rate': 8.918585379771718e-06, 'epoch': 1.07} {'loss': 0.6551, 'learning_rate': 8.918259948566912e-06, 'epoch': 1.07} {'loss': 0.5861, 'learning_rate': 8.917934518521283e-06, 'epoch': 1.07} {'loss': 0.5974, 'learning_rate': 8.917609089635187e-06, 'epoch': 1.07} {'loss': 0.617, 'learning_rate': 8.917283661908972e-06, 'epoch': 1.07} {'loss': 0.5865, 'learning_rate': 8.916958235342985e-06, 'epoch': 1.07} {'loss': 0.6023, 'learning_rate': 8.916632809937576e-06, 'epoch': 1.07} {'loss': 0.474, 'learning_rate': 8.916307385693087e-06, 'epoch': 1.07} {'loss': 0.6711, 'learning_rate': 8.915981962609878e-06, 'epoch': 1.07} {'loss': 0.7566, 'learning_rate': 8.915656540688287e-06, 'epoch': 1.07} {'loss': 0.493, 'learning_rate': 8.915331119928673e-06, 'epoch': 1.07} {'loss': 0.483, 'learning_rate': 8.91500570033138e-06, 'epoch': 1.07} {'loss': 0.6235, 'learning_rate': 8.914680281896754e-06, 'epoch': 1.07} {'loss': 0.5169, 'learning_rate': 8.914354864625147e-06, 'epoch': 1.07} {'loss': 0.5015, 'learning_rate': 8.914029448516902e-06, 'epoch': 1.07} {'loss': 0.5999, 'learning_rate': 8.91370403357238e-06, 'epoch': 1.07} {'loss': 0.5861, 'learning_rate': 8.913378619791919e-06, 'epoch': 1.07} {'loss': 0.5347, 'learning_rate': 8.913053207175867e-06, 'epoch': 1.07} {'loss': 0.5083, 'learning_rate': 8.912727795724583e-06, 'epoch': 1.07} {'loss': 0.5091, 'learning_rate': 8.912402385438406e-06, 'epoch': 1.07} {'loss': 0.4088, 'learning_rate': 8.91207697631769e-06, 'epoch': 1.07} {'loss': 0.4652, 'learning_rate': 8.911751568362778e-06, 'epoch': 1.07} {'loss': 0.6182, 'learning_rate': 8.911426161574025e-06, 'epoch': 1.07} {'loss': 0.5046, 'learning_rate': 8.911100755951777e-06, 'epoch': 1.07} {'loss': 0.5897, 'learning_rate': 8.910775351496382e-06, 'epoch': 1.07} {'loss': 0.6507, 'learning_rate': 8.910449948208191e-06, 'epoch': 1.07} {'loss': 0.4083, 'learning_rate': 8.910124546087549e-06, 'epoch': 1.07} {'loss': 0.5354, 'learning_rate': 8.909799145134809e-06, 'epoch': 1.07} {'loss': 0.6709, 'learning_rate': 8.909473745350314e-06, 'epoch': 1.07} {'loss': 0.5998, 'learning_rate': 8.909148346734421e-06, 'epoch': 1.07} {'loss': 0.5744, 'learning_rate': 8.908822949287475e-06, 'epoch': 1.07} {'loss': 0.5736, 'learning_rate': 8.908497553009817e-06, 'epoch': 1.07} {'loss': 0.6104, 'learning_rate': 8.908172157901807e-06, 'epoch': 1.07} {'loss': 0.6205, 'learning_rate': 8.907846763963788e-06, 'epoch': 1.07} {'loss': 0.539, 'learning_rate': 8.907521371196112e-06, 'epoch': 1.07} {'loss': 0.5107, 'learning_rate': 8.907195979599124e-06, 'epoch': 1.07} {'loss': 0.616, 'learning_rate': 8.906870589173171e-06, 'epoch': 1.07} {'loss': 0.5851, 'learning_rate': 8.906545199918608e-06, 'epoch': 1.07} {'loss': 0.4696, 'learning_rate': 8.906219811835779e-06, 'epoch': 1.07} {'loss': 0.6848, 'learning_rate': 8.905894424925036e-06, 'epoch': 1.07} {'loss': 0.604, 'learning_rate': 8.905569039186724e-06, 'epoch': 1.07} {'loss': 0.5887, 'learning_rate': 8.905243654621195e-06, 'epoch': 1.07} {'loss': 0.5776, 'learning_rate': 8.904918271228799e-06, 'epoch': 1.07} {'loss': 0.6468, 'learning_rate': 8.904592889009875e-06, 'epoch': 1.07} {'loss': 0.529, 'learning_rate': 8.904267507964785e-06, 'epoch': 1.07} {'loss': 0.6274, 'learning_rate': 8.903942128093865e-06, 'epoch': 1.07} {'loss': 0.5362, 'learning_rate': 8.903616749397476e-06, 'epoch': 1.07} {'loss': 0.5369, 'learning_rate': 8.903291371875957e-06, 'epoch': 1.07} {'loss': 0.4985, 'learning_rate': 8.902965995529661e-06, 'epoch': 1.07} {'loss': 0.5725, 'learning_rate': 8.90264062035894e-06, 'epoch': 1.07} {'loss': 0.6126, 'learning_rate': 8.902315246364131e-06, 'epoch': 1.07} {'loss': 0.3911, 'learning_rate': 8.901989873545596e-06, 'epoch': 1.07} {'loss': 0.5464, 'learning_rate': 8.901664501903675e-06, 'epoch': 1.07} {'loss': 0.6459, 'learning_rate': 8.901339131438721e-06, 'epoch': 1.07} {'loss': 0.528, 'learning_rate': 8.901013762151083e-06, 'epoch': 1.07} {'loss': 0.4794, 'learning_rate': 8.900688394041104e-06, 'epoch': 1.07} {'loss': 0.48, 'learning_rate': 8.900363027109141e-06, 'epoch': 1.07} {'loss': 0.5437, 'learning_rate': 8.900037661355533e-06, 'epoch': 1.07} {'loss': 0.5115, 'learning_rate': 8.899712296780638e-06, 'epoch': 1.07} {'loss': 0.5597, 'learning_rate': 8.8993869333848e-06, 'epoch': 1.07} {'loss': 0.7204, 'learning_rate': 8.899061571168366e-06, 'epoch': 1.07} {'loss': 0.4856, 'learning_rate': 8.89873621013169e-06, 'epoch': 1.07} {'loss': 0.4266, 'learning_rate': 8.898410850275115e-06, 'epoch': 1.07} {'loss': 0.6268, 'learning_rate': 8.898085491598996e-06, 'epoch': 1.07} {'loss': 0.5484, 'learning_rate': 8.897760134103671e-06, 'epoch': 1.07} {'loss': 0.5954, 'learning_rate': 8.897434777789502e-06, 'epoch': 1.07} {'loss': 0.5481, 'learning_rate': 8.89710942265683e-06, 'epoch': 1.07} {'loss': 0.6085, 'learning_rate': 8.896784068706002e-06, 'epoch': 1.07} {'loss': 0.5508, 'learning_rate': 8.89645871593737e-06, 'epoch': 1.07} {'loss': 0.5129, 'learning_rate': 8.896133364351283e-06, 'epoch': 1.07} {'loss': 0.503, 'learning_rate': 8.89580801394809e-06, 'epoch': 1.07} {'loss': 0.5582, 'learning_rate': 8.895482664728134e-06, 'epoch': 1.07} {'loss': 0.5551, 'learning_rate': 8.895157316691773e-06, 'epoch': 1.07} {'loss': 0.5409, 'learning_rate': 8.894831969839351e-06, 'epoch': 1.07} {'loss': 0.5569, 'learning_rate': 8.894506624171214e-06, 'epoch': 1.07} {'loss': 0.5133, 'learning_rate': 8.894181279687714e-06, 'epoch': 1.07} {'loss': 0.6531, 'learning_rate': 8.893855936389195e-06, 'epoch': 1.07} {'loss': 0.4812, 'learning_rate': 8.893530594276013e-06, 'epoch': 1.07} {'loss': 0.524, 'learning_rate': 8.893205253348508e-06, 'epoch': 1.07} {'loss': 0.4729, 'learning_rate': 8.89287991360704e-06, 'epoch': 1.07} {'loss': 0.6426, 'learning_rate': 8.89255457505195e-06, 'epoch': 1.07} {'loss': 0.4197, 'learning_rate': 8.892229237683585e-06, 'epoch': 1.07} {'loss': 0.561, 'learning_rate': 8.891903901502299e-06, 'epoch': 1.07} {'loss': 0.578, 'learning_rate': 8.891578566508433e-06, 'epoch': 1.07} {'loss': 0.482, 'learning_rate': 8.891253232702347e-06, 'epoch': 1.07} {'loss': 0.5415, 'learning_rate': 8.890927900084381e-06, 'epoch': 1.07} {'loss': 0.5654, 'learning_rate': 8.890602568654881e-06, 'epoch': 1.07} {'loss': 0.5167, 'learning_rate': 8.890277238414207e-06, 'epoch': 1.07} {'loss': 0.6992, 'learning_rate': 8.889951909362697e-06, 'epoch': 1.07} {'loss': 0.6417, 'learning_rate': 8.889626581500708e-06, 'epoch': 1.07} {'loss': 0.5791, 'learning_rate': 8.889301254828577e-06, 'epoch': 1.07} {'loss': 0.5146, 'learning_rate': 8.888975929346668e-06, 'epoch': 1.07} {'loss': 0.552, 'learning_rate': 8.88865060505532e-06, 'epoch': 1.07} {'loss': 0.4762, 'learning_rate': 8.888325281954877e-06, 'epoch': 1.07} {'loss': 0.6187, 'learning_rate': 8.8879999600457e-06, 'epoch': 1.07} {'loss': 0.6974, 'learning_rate': 8.88767463932813e-06, 'epoch': 1.07} {'loss': 0.4849, 'learning_rate': 8.887349319802517e-06, 'epoch': 1.07} {'loss': 0.582, 'learning_rate': 8.887024001469206e-06, 'epoch': 1.07} {'loss': 0.6528, 'learning_rate': 8.886698684328554e-06, 'epoch': 1.07} {'loss': 0.6202, 'learning_rate': 8.886373368380905e-06, 'epoch': 1.07} {'loss': 0.6687, 'learning_rate': 8.886048053626602e-06, 'epoch': 1.07} {'loss': 0.5989, 'learning_rate': 8.885722740066005e-06, 'epoch': 1.07} {'loss': 0.4185, 'learning_rate': 8.885397427699454e-06, 'epoch': 1.07} {'loss': 0.5347, 'learning_rate': 8.8850721165273e-06, 'epoch': 1.07} {'loss': 0.6001, 'learning_rate': 8.884746806549896e-06, 'epoch': 1.07} {'loss': 0.5309, 'learning_rate': 8.88442149776758e-06, 'epoch': 1.07} {'loss': 0.5606, 'learning_rate': 8.88409619018071e-06, 'epoch': 1.07} {'loss': 0.5087, 'learning_rate': 8.88377088378963e-06, 'epoch': 1.07} {'loss': 0.6044, 'learning_rate': 8.883445578594695e-06, 'epoch': 1.07} {'loss': 0.5021, 'learning_rate': 8.883120274596244e-06, 'epoch': 1.07} {'loss': 0.7471, 'learning_rate': 8.882794971794633e-06, 'epoch': 1.07} {'loss': 0.4971, 'learning_rate': 8.882469670190208e-06, 'epoch': 1.07} {'loss': 0.6688, 'learning_rate': 8.882144369783315e-06, 'epoch': 1.07} {'loss': 0.5201, 'learning_rate': 8.88181907057431e-06, 'epoch': 1.07} {'loss': 0.3913, 'learning_rate': 8.88149377256353e-06, 'epoch': 1.07} {'loss': 0.6257, 'learning_rate': 8.881168475751335e-06, 'epoch': 1.07} {'loss': 0.6072, 'learning_rate': 8.880843180138067e-06, 'epoch': 1.07} {'loss': 0.6563, 'learning_rate': 8.88051788572408e-06, 'epoch': 1.07} {'loss': 0.5382, 'learning_rate': 8.880192592509718e-06, 'epoch': 1.07} {'loss': 0.4617, 'learning_rate': 8.879867300495327e-06, 'epoch': 1.07} {'loss': 0.6252, 'learning_rate': 8.879542009681263e-06, 'epoch': 1.07} {'loss': 0.563, 'learning_rate': 8.879216720067867e-06, 'epoch': 1.07} {'loss': 0.5465, 'learning_rate': 8.878891431655496e-06, 'epoch': 1.07} {'loss': 0.4135, 'learning_rate': 8.878566144444493e-06, 'epoch': 1.07} {'loss': 0.5339, 'learning_rate': 8.878240858435207e-06, 'epoch': 1.07} {'loss': 0.6209, 'learning_rate': 8.877915573627987e-06, 'epoch': 1.07} {'loss': 0.4634, 'learning_rate': 8.877590290023179e-06, 'epoch': 1.07} {'loss': 0.4268, 'learning_rate': 8.877265007621138e-06, 'epoch': 1.07} {'loss': 0.6608, 'learning_rate': 8.876939726422206e-06, 'epoch': 1.07} {'loss': 0.4912, 'learning_rate': 8.876614446426739e-06, 'epoch': 1.07} {'loss': 0.6516, 'learning_rate': 8.876289167635078e-06, 'epoch': 1.07} {'loss': 0.6574, 'learning_rate': 8.875963890047574e-06, 'epoch': 1.07} {'loss': 0.6445, 'learning_rate': 8.875638613664578e-06, 'epoch': 1.07} {'loss': 0.3667, 'learning_rate': 8.875313338486433e-06, 'epoch': 1.07} {'loss': 0.6589, 'learning_rate': 8.874988064513496e-06, 'epoch': 1.07} {'loss': 0.5412, 'learning_rate': 8.874662791746108e-06, 'epoch': 1.07} {'loss': 0.4782, 'learning_rate': 8.87433752018462e-06, 'epoch': 1.07} {'loss': 0.5183, 'learning_rate': 8.874012249829384e-06, 'epoch': 1.07} {'loss': 0.4854, 'learning_rate': 8.873686980680744e-06, 'epoch': 1.07} {'loss': 0.5593, 'learning_rate': 8.87336171273905e-06, 'epoch': 1.07} {'loss': 0.476, 'learning_rate': 8.873036446004648e-06, 'epoch': 1.07} {'loss': 0.6322, 'learning_rate': 8.872711180477894e-06, 'epoch': 1.07} {'loss': 0.4469, 'learning_rate': 8.87238591615913e-06, 'epoch': 1.07} {'loss': 0.4243, 'learning_rate': 8.872060653048704e-06, 'epoch': 1.07} {'loss': 0.4518, 'learning_rate': 8.871735391146966e-06, 'epoch': 1.07} {'loss': 0.4587, 'learning_rate': 8.871410130454268e-06, 'epoch': 1.07} {'loss': 0.6733, 'learning_rate': 8.871084870970957e-06, 'epoch': 1.07} {'loss': 0.4495, 'learning_rate': 8.870759612697377e-06, 'epoch': 1.07} {'loss': 0.4923, 'learning_rate': 8.870434355633883e-06, 'epoch': 1.07} {'loss': 0.5357, 'learning_rate': 8.870109099780821e-06, 'epoch': 1.07} {'loss': 0.612, 'learning_rate': 8.869783845138537e-06, 'epoch': 1.07} {'loss': 0.7166, 'learning_rate': 8.869458591707383e-06, 'epoch': 1.08} {'loss': 0.3851, 'learning_rate': 8.869133339487703e-06, 'epoch': 1.08} {'loss': 0.5996, 'learning_rate': 8.868808088479853e-06, 'epoch': 1.08} {'loss': 0.5948, 'learning_rate': 8.868482838684178e-06, 'epoch': 1.08} {'loss': 0.5334, 'learning_rate': 8.868157590101019e-06, 'epoch': 1.08} {'loss': 0.3171, 'learning_rate': 8.867832342730736e-06, 'epoch': 1.08} {'loss': 0.6082, 'learning_rate': 8.867507096573672e-06, 'epoch': 1.08} {'loss': 0.66, 'learning_rate': 8.867181851630178e-06, 'epoch': 1.08} {'loss': 0.5904, 'learning_rate': 8.866856607900597e-06, 'epoch': 1.08} {'loss': 0.449, 'learning_rate': 8.866531365385286e-06, 'epoch': 1.08} {'loss': 0.5541, 'learning_rate': 8.866206124084587e-06, 'epoch': 1.08} {'loss': 0.5629, 'learning_rate': 8.865880883998847e-06, 'epoch': 1.08} {'loss': 0.5917, 'learning_rate': 8.865555645128423e-06, 'epoch': 1.08} {'loss': 0.4539, 'learning_rate': 8.865230407473656e-06, 'epoch': 1.08} {'loss': 0.6026, 'learning_rate': 8.8649051710349e-06, 'epoch': 1.08} {'loss': 0.5353, 'learning_rate': 8.864579935812496e-06, 'epoch': 1.08} {'loss': 0.4066, 'learning_rate': 8.8642547018068e-06, 'epoch': 1.08} {'loss': 0.5749, 'learning_rate': 8.86392946901816e-06, 'epoch': 1.08} {'loss': 0.7005, 'learning_rate': 8.863604237446915e-06, 'epoch': 1.08} {'loss': 0.6407, 'learning_rate': 8.863279007093426e-06, 'epoch': 1.08} {'loss': 0.4862, 'learning_rate': 8.862953777958035e-06, 'epoch': 1.08} {'loss': 0.5049, 'learning_rate': 8.862628550041092e-06, 'epoch': 1.08} {'loss': 0.6489, 'learning_rate': 8.862303323342947e-06, 'epoch': 1.08} {'loss': 0.5509, 'learning_rate': 8.861978097863941e-06, 'epoch': 1.08} {'loss': 0.5715, 'learning_rate': 8.861652873604432e-06, 'epoch': 1.08} {'loss': 0.6098, 'learning_rate': 8.861327650564763e-06, 'epoch': 1.08} {'loss': 0.6041, 'learning_rate': 8.861002428745287e-06, 'epoch': 1.08} {'loss': 0.6174, 'learning_rate': 8.860677208146346e-06, 'epoch': 1.08} {'loss': 0.4789, 'learning_rate': 8.860351988768297e-06, 'epoch': 1.08} {'loss': 0.631, 'learning_rate': 8.860026770611483e-06, 'epoch': 1.08} {'loss': 0.6373, 'learning_rate': 8.859701553676247e-06, 'epoch': 1.08} {'loss': 0.5463, 'learning_rate': 8.85937633796295e-06, 'epoch': 1.08} {'loss': 0.5458, 'learning_rate': 8.859051123471929e-06, 'epoch': 1.08} {'loss': 0.6627, 'learning_rate': 8.858725910203543e-06, 'epoch': 1.08} {'loss': 0.5941, 'learning_rate': 8.858400698158131e-06, 'epoch': 1.08} {'loss': 0.5865, 'learning_rate': 8.858075487336051e-06, 'epoch': 1.08} {'loss': 0.4758, 'learning_rate': 8.857750277737643e-06, 'epoch': 1.08} {'loss': 0.5884, 'learning_rate': 8.857425069363256e-06, 'epoch': 1.08} {'loss': 0.53, 'learning_rate': 8.857099862213246e-06, 'epoch': 1.08} {'loss': 0.6347, 'learning_rate': 8.856774656287951e-06, 'epoch': 1.08} {'loss': 0.4386, 'learning_rate': 8.85644945158773e-06, 'epoch': 1.08} {'loss': 0.6901, 'learning_rate': 8.856124248112927e-06, 'epoch': 1.08} {'loss': 0.6243, 'learning_rate': 8.855799045863888e-06, 'epoch': 1.08} {'loss': 0.5289, 'learning_rate': 8.855473844840965e-06, 'epoch': 1.08} {'loss': 0.5474, 'learning_rate': 8.855148645044501e-06, 'epoch': 1.08} {'loss': 0.5615, 'learning_rate': 8.854823446474853e-06, 'epoch': 1.08} {'loss': 0.5195, 'learning_rate': 8.85449824913236e-06, 'epoch': 1.08} {'loss': 0.4235, 'learning_rate': 8.854173053017381e-06, 'epoch': 1.08} {'loss': 0.4503, 'learning_rate': 8.85384785813026e-06, 'epoch': 1.08} {'loss': 0.5489, 'learning_rate': 8.85352266447134e-06, 'epoch': 1.08} {'loss': 0.6245, 'learning_rate': 8.853197472040976e-06, 'epoch': 1.08} {'loss': 0.4355, 'learning_rate': 8.852872280839511e-06, 'epoch': 1.08} {'loss': 0.4811, 'learning_rate': 8.852547090867301e-06, 'epoch': 1.08} {'loss': 0.5693, 'learning_rate': 8.852221902124687e-06, 'epoch': 1.08} {'loss': 0.6488, 'learning_rate': 8.851896714612024e-06, 'epoch': 1.08} {'loss': 0.5243, 'learning_rate': 8.851571528329658e-06, 'epoch': 1.08} {'loss': 0.6016, 'learning_rate': 8.851246343277935e-06, 'epoch': 1.08} {'loss': 0.5446, 'learning_rate': 8.850921159457206e-06, 'epoch': 1.08} {'loss': 0.5693, 'learning_rate': 8.850595976867815e-06, 'epoch': 1.08} {'loss': 0.4949, 'learning_rate': 8.850270795510119e-06, 'epoch': 1.08} {'loss': 0.5827, 'learning_rate': 8.84994561538446e-06, 'epoch': 1.08} {'loss': 0.5431, 'learning_rate': 8.849620436491186e-06, 'epoch': 1.08} {'loss': 0.4933, 'learning_rate': 8.849295258830651e-06, 'epoch': 1.08} {'loss': 0.396, 'learning_rate': 8.848970082403196e-06, 'epoch': 1.08} {'loss': 0.421, 'learning_rate': 8.848644907209179e-06, 'epoch': 1.08} {'loss': 0.4339, 'learning_rate': 8.848319733248936e-06, 'epoch': 1.08} {'loss': 0.6296, 'learning_rate': 8.847994560522827e-06, 'epoch': 1.08} {'loss': 0.4257, 'learning_rate': 8.847669389031198e-06, 'epoch': 1.08} {'loss': 0.6319, 'learning_rate': 8.84734421877439e-06, 'epoch': 1.08} {'loss': 0.6637, 'learning_rate': 8.847019049752757e-06, 'epoch': 1.08} {'loss': 0.5173, 'learning_rate': 8.84669388196665e-06, 'epoch': 1.08} {'loss': 0.4924, 'learning_rate': 8.846368715416414e-06, 'epoch': 1.08} {'loss': 0.5679, 'learning_rate': 8.846043550102394e-06, 'epoch': 1.08} {'loss': 0.4934, 'learning_rate': 8.845718386024949e-06, 'epoch': 1.08} {'loss': 0.5765, 'learning_rate': 8.845393223184419e-06, 'epoch': 1.08} {'loss': 0.6222, 'learning_rate': 8.845068061581152e-06, 'epoch': 1.08} {'loss': 0.5315, 'learning_rate': 8.844742901215502e-06, 'epoch': 1.08} {'loss': 0.4853, 'learning_rate': 8.844417742087809e-06, 'epoch': 1.08} {'loss': 0.6155, 'learning_rate': 8.844092584198431e-06, 'epoch': 1.08} {'loss': 0.5458, 'learning_rate': 8.843767427547713e-06, 'epoch': 1.08} {'loss': 0.4236, 'learning_rate': 8.843442272135998e-06, 'epoch': 1.08} {'loss': 0.5504, 'learning_rate': 8.843117117963643e-06, 'epoch': 1.08} {'loss': 0.5002, 'learning_rate': 8.842791965030991e-06, 'epoch': 1.08} {'loss': 0.6202, 'learning_rate': 8.842466813338392e-06, 'epoch': 1.08} {'loss': 0.5365, 'learning_rate': 8.842141662886192e-06, 'epoch': 1.08} {'loss': 0.6856, 'learning_rate': 8.841816513674746e-06, 'epoch': 1.08} {'loss': 0.3964, 'learning_rate': 8.841491365704398e-06, 'epoch': 1.08} {'loss': 0.6075, 'learning_rate': 8.841166218975492e-06, 'epoch': 1.08} {'loss': 0.4778, 'learning_rate': 8.840841073488384e-06, 'epoch': 1.08} {'loss': 0.5113, 'learning_rate': 8.84051592924342e-06, 'epoch': 1.08} {'loss': 0.5709, 'learning_rate': 8.840190786240947e-06, 'epoch': 1.08} {'loss': 0.5548, 'learning_rate': 8.839865644481316e-06, 'epoch': 1.08} {'loss': 0.4201, 'learning_rate': 8.83954050396487e-06, 'epoch': 1.08} {'loss': 0.4883, 'learning_rate': 8.839215364691963e-06, 'epoch': 1.08} {'loss': 0.59, 'learning_rate': 8.838890226662939e-06, 'epoch': 1.08} {'loss': 0.4191, 'learning_rate': 8.838565089878152e-06, 'epoch': 1.08} {'loss': 0.6193, 'learning_rate': 8.838239954337947e-06, 'epoch': 1.08} {'loss': 0.5195, 'learning_rate': 8.837914820042673e-06, 'epoch': 1.08} {'loss': 0.606, 'learning_rate': 8.83758968699268e-06, 'epoch': 1.08} {'loss': 0.6483, 'learning_rate': 8.83726455518831e-06, 'epoch': 1.08} {'loss': 0.5053, 'learning_rate': 8.836939424629919e-06, 'epoch': 1.08} {'loss': 0.5989, 'learning_rate': 8.836614295317848e-06, 'epoch': 1.08} {'loss': 0.4879, 'learning_rate': 8.836289167252455e-06, 'epoch': 1.08} {'loss': 0.4319, 'learning_rate': 8.835964040434081e-06, 'epoch': 1.08} {'loss': 0.598, 'learning_rate': 8.835638914863078e-06, 'epoch': 1.08} {'loss': 0.6242, 'learning_rate': 8.835313790539794e-06, 'epoch': 1.08} {'loss': 0.6602, 'learning_rate': 8.834988667464571e-06, 'epoch': 1.08} {'loss': 0.5338, 'learning_rate': 8.834663545637768e-06, 'epoch': 1.08} {'loss': 0.6489, 'learning_rate': 8.834338425059724e-06, 'epoch': 1.08} {'loss': 0.5311, 'learning_rate': 8.834013305730795e-06, 'epoch': 1.08} {'loss': 0.496, 'learning_rate': 8.833688187651327e-06, 'epoch': 1.08} {'loss': 0.6465, 'learning_rate': 8.833363070821664e-06, 'epoch': 1.08} {'loss': 0.556, 'learning_rate': 8.833037955242161e-06, 'epoch': 1.08} {'loss': 0.5007, 'learning_rate': 8.832712840913158e-06, 'epoch': 1.08} {'loss': 0.6091, 'learning_rate': 8.832387727835013e-06, 'epoch': 1.08} {'loss': 0.4512, 'learning_rate': 8.832062616008068e-06, 'epoch': 1.08} {'loss': 0.5843, 'learning_rate': 8.831737505432674e-06, 'epoch': 1.08} {'loss': 0.4793, 'learning_rate': 8.83141239610918e-06, 'epoch': 1.08} {'loss': 0.6064, 'learning_rate': 8.831087288037931e-06, 'epoch': 1.08} {'loss': 0.6435, 'learning_rate': 8.83076218121928e-06, 'epoch': 1.08} {'loss': 0.5226, 'learning_rate': 8.830437075653568e-06, 'epoch': 1.08} {'loss': 0.5309, 'learning_rate': 8.830111971341153e-06, 'epoch': 1.08} {'loss': 0.5511, 'learning_rate': 8.829786868282374e-06, 'epoch': 1.08} {'loss': 0.6647, 'learning_rate': 8.829461766477589e-06, 'epoch': 1.08} {'loss': 0.5027, 'learning_rate': 8.829136665927142e-06, 'epoch': 1.08} {'loss': 0.6074, 'learning_rate': 8.828811566631377e-06, 'epoch': 1.08} {'loss': 0.5201, 'learning_rate': 8.82848646859065e-06, 'epoch': 1.08} {'loss': 0.5448, 'learning_rate': 8.828161371805298e-06, 'epoch': 1.08} {'loss': 0.708, 'learning_rate': 8.827836276275683e-06, 'epoch': 1.08} {'loss': 0.3766, 'learning_rate': 8.827511182002147e-06, 'epoch': 1.08} {'loss': 0.576, 'learning_rate': 8.827186088985035e-06, 'epoch': 1.08} {'loss': 0.5309, 'learning_rate': 8.826860997224703e-06, 'epoch': 1.08} {'loss': 0.527, 'learning_rate': 8.826535906721492e-06, 'epoch': 1.08} {'loss': 0.6232, 'learning_rate': 8.826210817475757e-06, 'epoch': 1.08} {'loss': 0.5303, 'learning_rate': 8.82588572948784e-06, 'epoch': 1.08} {'loss': 0.5722, 'learning_rate': 8.825560642758095e-06, 'epoch': 1.08} {'loss': 0.6026, 'learning_rate': 8.825235557286868e-06, 'epoch': 1.08} {'loss': 0.623, 'learning_rate': 8.824910473074503e-06, 'epoch': 1.08} {'loss': 0.6081, 'learning_rate': 8.824585390121357e-06, 'epoch': 1.08} {'loss': 0.5561, 'learning_rate': 8.824260308427771e-06, 'epoch': 1.08} {'loss': 0.4722, 'learning_rate': 8.823935227994098e-06, 'epoch': 1.08} {'loss': 0.5016, 'learning_rate': 8.823610148820682e-06, 'epoch': 1.08} {'loss': 0.6092, 'learning_rate': 8.823285070907877e-06, 'epoch': 1.08} {'loss': 0.5476, 'learning_rate': 8.822959994256028e-06, 'epoch': 1.08} {'loss': 0.6099, 'learning_rate': 8.822634918865482e-06, 'epoch': 1.08} {'loss': 0.5921, 'learning_rate': 8.82230984473659e-06, 'epoch': 1.08} {'loss': 0.5665, 'learning_rate': 8.821984771869697e-06, 'epoch': 1.08} {'loss': 0.682, 'learning_rate': 8.821659700265157e-06, 'epoch': 1.08} {'loss': 0.5356, 'learning_rate': 8.821334629923315e-06, 'epoch': 1.08} {'loss': 0.7263, 'learning_rate': 8.821009560844515e-06, 'epoch': 1.08} {'loss': 0.4487, 'learning_rate': 8.820684493029113e-06, 'epoch': 1.08} {'loss': 0.5521, 'learning_rate': 8.820359426477454e-06, 'epoch': 1.08} {'loss': 0.563, 'learning_rate': 8.820034361189887e-06, 'epoch': 1.08} {'loss': 0.6114, 'learning_rate': 8.819709297166755e-06, 'epoch': 1.08} {'loss': 0.5361, 'learning_rate': 8.819384234408416e-06, 'epoch': 1.08} {'loss': 0.6249, 'learning_rate': 8.819059172915215e-06, 'epoch': 1.08} {'loss': 0.5521, 'learning_rate': 8.818734112687492e-06, 'epoch': 1.08} {'loss': 0.5476, 'learning_rate': 8.818409053725606e-06, 'epoch': 1.08} {'loss': 0.6764, 'learning_rate': 8.8180839960299e-06, 'epoch': 1.08} {'loss': 0.6581, 'learning_rate': 8.817758939600727e-06, 'epoch': 1.08} {'loss': 0.56, 'learning_rate': 8.817433884438427e-06, 'epoch': 1.08} {'loss': 0.5384, 'learning_rate': 8.817108830543356e-06, 'epoch': 1.08} {'loss': 0.5673, 'learning_rate': 8.816783777915862e-06, 'epoch': 1.08} {'loss': 0.5978, 'learning_rate': 8.816458726556284e-06, 'epoch': 1.08} {'loss': 0.6194, 'learning_rate': 8.816133676464985e-06, 'epoch': 1.08} {'loss': 0.4365, 'learning_rate': 8.815808627642301e-06, 'epoch': 1.08} {'loss': 0.6198, 'learning_rate': 8.815483580088587e-06, 'epoch': 1.08} {'loss': 0.5419, 'learning_rate': 8.815158533804192e-06, 'epoch': 1.08} {'loss': 0.4704, 'learning_rate': 8.814833488789454e-06, 'epoch': 1.08} {'loss': 0.5365, 'learning_rate': 8.814508445044734e-06, 'epoch': 1.08} {'loss': 0.5276, 'learning_rate': 8.814183402570372e-06, 'epoch': 1.08} {'loss': 0.6364, 'learning_rate': 8.813858361366723e-06, 'epoch': 1.08} {'loss': 0.6055, 'learning_rate': 8.81353332143413e-06, 'epoch': 1.08} {'loss': 0.5418, 'learning_rate': 8.813208282772945e-06, 'epoch': 1.08} {'loss': 0.5829, 'learning_rate': 8.812883245383514e-06, 'epoch': 1.08} {'loss': 0.5442, 'learning_rate': 8.812558209266184e-06, 'epoch': 1.08} {'loss': 0.5627, 'learning_rate': 8.812233174421306e-06, 'epoch': 1.08} {'loss': 0.5018, 'learning_rate': 8.811908140849224e-06, 'epoch': 1.08} {'loss': 0.6013, 'learning_rate': 8.811583108550295e-06, 'epoch': 1.08} {'loss': 0.5227, 'learning_rate': 8.811258077524862e-06, 'epoch': 1.08} {'loss': 0.5171, 'learning_rate': 8.81093304777327e-06, 'epoch': 1.08} {'loss': 0.5309, 'learning_rate': 8.810608019295873e-06, 'epoch': 1.08} {'loss': 0.6873, 'learning_rate': 8.810282992093013e-06, 'epoch': 1.08} {'loss': 0.5604, 'learning_rate': 8.809957966165046e-06, 'epoch': 1.08} {'loss': 0.6867, 'learning_rate': 8.809632941512312e-06, 'epoch': 1.08} {'loss': 0.5817, 'learning_rate': 8.80930791813517e-06, 'epoch': 1.08} {'loss': 0.5941, 'learning_rate': 8.80898289603396e-06, 'epoch': 1.08} {'loss': 0.5832, 'learning_rate': 8.80865787520903e-06, 'epoch': 1.08} {'loss': 0.6617, 'learning_rate': 8.808332855660734e-06, 'epoch': 1.08} {'loss': 0.5797, 'learning_rate': 8.808007837389411e-06, 'epoch': 1.08} {'loss': 0.5874, 'learning_rate': 8.80768282039542e-06, 'epoch': 1.08} {'loss': 0.6479, 'learning_rate': 8.807357804679101e-06, 'epoch': 1.08} {'loss': 0.474, 'learning_rate': 8.807032790240811e-06, 'epoch': 1.08} {'loss': 0.6302, 'learning_rate': 8.806707777080891e-06, 'epoch': 1.08} {'loss': 0.4614, 'learning_rate': 8.80638276519969e-06, 'epoch': 1.08} {'loss': 0.5611, 'learning_rate': 8.806057754597559e-06, 'epoch': 1.08} {'loss': 0.5395, 'learning_rate': 8.805732745274843e-06, 'epoch': 1.08} {'loss': 0.5011, 'learning_rate': 8.805407737231893e-06, 'epoch': 1.08} {'loss': 0.6471, 'learning_rate': 8.80508273046906e-06, 'epoch': 1.08} {'loss': 0.462, 'learning_rate': 8.804757724986682e-06, 'epoch': 1.08} {'loss': 0.4856, 'learning_rate': 8.804432720785118e-06, 'epoch': 1.08} {'loss': 0.585, 'learning_rate': 8.80410771786471e-06, 'epoch': 1.08} {'loss': 0.6304, 'learning_rate': 8.803782716225811e-06, 'epoch': 1.08} {'loss': 0.5835, 'learning_rate': 8.803457715868764e-06, 'epoch': 1.08} {'loss': 0.5389, 'learning_rate': 8.803132716793923e-06, 'epoch': 1.08} {'loss': 0.3558, 'learning_rate': 8.802807719001634e-06, 'epoch': 1.08} {'loss': 0.5108, 'learning_rate': 8.802482722492241e-06, 'epoch': 1.08} {'loss': 0.4927, 'learning_rate': 8.802157727266098e-06, 'epoch': 1.08} {'loss': 0.5098, 'learning_rate': 8.80183273332355e-06, 'epoch': 1.08} {'loss': 0.4408, 'learning_rate': 8.801507740664948e-06, 'epoch': 1.08} {'loss': 0.4974, 'learning_rate': 8.801182749290636e-06, 'epoch': 1.08} {'loss': 0.6523, 'learning_rate': 8.800857759200968e-06, 'epoch': 1.08} {'loss': 0.5171, 'learning_rate': 8.80053277039629e-06, 'epoch': 1.08} {'loss': 0.5887, 'learning_rate': 8.800207782876944e-06, 'epoch': 1.08} {'loss': 0.4942, 'learning_rate': 8.799882796643287e-06, 'epoch': 1.08} {'loss': 0.4672, 'learning_rate': 8.799557811695663e-06, 'epoch': 1.08} {'loss': 0.4224, 'learning_rate': 8.799232828034425e-06, 'epoch': 1.08} {'loss': 0.7026, 'learning_rate': 8.798907845659916e-06, 'epoch': 1.08} {'loss': 0.5909, 'learning_rate': 8.79858286457248e-06, 'epoch': 1.08} {'loss': 0.5565, 'learning_rate': 8.798257884772476e-06, 'epoch': 1.08} {'loss': 0.511, 'learning_rate': 8.797932906260244e-06, 'epoch': 1.08} {'loss': 0.5499, 'learning_rate': 8.797607929036138e-06, 'epoch': 1.08} {'loss': 0.7042, 'learning_rate': 8.797282953100502e-06, 'epoch': 1.08} {'loss': 0.5282, 'learning_rate': 8.796957978453688e-06, 'epoch': 1.08} {'loss': 0.542, 'learning_rate': 8.796633005096042e-06, 'epoch': 1.08} {'loss': 0.5257, 'learning_rate': 8.79630803302791e-06, 'epoch': 1.08} {'loss': 0.606, 'learning_rate': 8.795983062249644e-06, 'epoch': 1.08} {'loss': 0.5682, 'learning_rate': 8.795658092761591e-06, 'epoch': 1.08} {'loss': 0.5576, 'learning_rate': 8.795333124564098e-06, 'epoch': 1.08} {'loss': 0.5997, 'learning_rate': 8.795008157657514e-06, 'epoch': 1.08} {'loss': 0.4545, 'learning_rate': 8.79468319204219e-06, 'epoch': 1.08} {'loss': 0.6769, 'learning_rate': 8.794358227718472e-06, 'epoch': 1.08} {'loss': 0.5859, 'learning_rate': 8.794033264686703e-06, 'epoch': 1.08} {'loss': 0.6461, 'learning_rate': 8.793708302947241e-06, 'epoch': 1.08} {'loss': 0.5005, 'learning_rate': 8.793383342500428e-06, 'epoch': 1.08} {'loss': 0.557, 'learning_rate': 8.793058383346614e-06, 'epoch': 1.08} {'loss': 0.4751, 'learning_rate': 8.792733425486147e-06, 'epoch': 1.08} {'loss': 0.5617, 'learning_rate': 8.792408468919373e-06, 'epoch': 1.08} {'loss': 0.7073, 'learning_rate': 8.792083513646646e-06, 'epoch': 1.08} {'loss': 0.5282, 'learning_rate': 8.791758559668305e-06, 'epoch': 1.08} {'loss': 0.5464, 'learning_rate': 8.791433606984708e-06, 'epoch': 1.08} {'loss': 0.6011, 'learning_rate': 8.791108655596198e-06, 'epoch': 1.08} {'loss': 0.5571, 'learning_rate': 8.790783705503126e-06, 'epoch': 1.08} {'loss': 0.4042, 'learning_rate': 8.790458756705838e-06, 'epoch': 1.08} {'loss': 0.5226, 'learning_rate': 8.790133809204679e-06, 'epoch': 1.08} {'loss': 0.555, 'learning_rate': 8.789808863000003e-06, 'epoch': 1.08} {'loss': 0.5329, 'learning_rate': 8.789483918092154e-06, 'epoch': 1.08} {'loss': 0.4555, 'learning_rate': 8.789158974481486e-06, 'epoch': 1.08} {'loss': 0.6306, 'learning_rate': 8.78883403216834e-06, 'epoch': 1.08} {'loss': 0.5161, 'learning_rate': 8.788509091153073e-06, 'epoch': 1.08} {'loss': 0.4647, 'learning_rate': 8.788184151436024e-06, 'epoch': 1.08} {'loss': 0.589, 'learning_rate': 8.787859213017543e-06, 'epoch': 1.08} {'loss': 0.5711, 'learning_rate': 8.787534275897984e-06, 'epoch': 1.08} {'loss': 0.4975, 'learning_rate': 8.787209340077686e-06, 'epoch': 1.08} {'loss': 0.583, 'learning_rate': 8.78688440555701e-06, 'epoch': 1.08} {'loss': 0.5396, 'learning_rate': 8.786559472336294e-06, 'epoch': 1.08} {'loss': 0.5631, 'learning_rate': 8.786234540415889e-06, 'epoch': 1.08} {'loss': 0.6216, 'learning_rate': 8.785909609796144e-06, 'epoch': 1.08} {'loss': 0.6152, 'learning_rate': 8.785584680477402e-06, 'epoch': 1.08} {'loss': 0.5514, 'learning_rate': 8.785259752460021e-06, 'epoch': 1.08} {'loss': 0.539, 'learning_rate': 8.784934825744339e-06, 'epoch': 1.08} {'loss': 0.4665, 'learning_rate': 8.784609900330713e-06, 'epoch': 1.08} {'loss': 0.5676, 'learning_rate': 8.784284976219488e-06, 'epoch': 1.08} {'loss': 0.5217, 'learning_rate': 8.783960053411007e-06, 'epoch': 1.08} {'loss': 0.5359, 'learning_rate': 8.783635131905628e-06, 'epoch': 1.08} {'loss': 0.5521, 'learning_rate': 8.783310211703688e-06, 'epoch': 1.08} {'loss': 0.4793, 'learning_rate': 8.782985292805544e-06, 'epoch': 1.08} {'loss': 0.5732, 'learning_rate': 8.782660375211542e-06, 'epoch': 1.08} {'loss': 0.5409, 'learning_rate': 8.782335458922025e-06, 'epoch': 1.08} {'loss': 0.4937, 'learning_rate': 8.782010543937351e-06, 'epoch': 1.08} {'loss': 0.6282, 'learning_rate': 8.78168563025786e-06, 'epoch': 1.08} {'loss': 0.6139, 'learning_rate': 8.781360717883902e-06, 'epoch': 1.08} {'loss': 0.4357, 'learning_rate': 8.781035806815825e-06, 'epoch': 1.08} {'loss': 0.5414, 'learning_rate': 8.780710897053981e-06, 'epoch': 1.08} {'loss': 0.5048, 'learning_rate': 8.780385988598716e-06, 'epoch': 1.08} {'loss': 0.6176, 'learning_rate': 8.780061081450372e-06, 'epoch': 1.08} {'loss': 0.5016, 'learning_rate': 8.779736175609309e-06, 'epoch': 1.08} {'loss': 0.5607, 'learning_rate': 8.779411271075865e-06, 'epoch': 1.08} {'loss': 0.6489, 'learning_rate': 8.779086367850395e-06, 'epoch': 1.08} {'loss': 0.7354, 'learning_rate': 8.778761465933239e-06, 'epoch': 1.08} {'loss': 0.6178, 'learning_rate': 8.778436565324755e-06, 'epoch': 1.08} {'loss': 0.6743, 'learning_rate': 8.778111666025288e-06, 'epoch': 1.08} {'loss': 0.6815, 'learning_rate': 8.777786768035178e-06, 'epoch': 1.08} {'loss': 0.5794, 'learning_rate': 8.777461871354785e-06, 'epoch': 1.08} {'loss': 0.486, 'learning_rate': 8.77713697598445e-06, 'epoch': 1.08} {'loss': 0.6278, 'learning_rate': 8.776812081924525e-06, 'epoch': 1.08} {'loss': 0.5063, 'learning_rate': 8.776487189175357e-06, 'epoch': 1.08} {'loss': 0.519, 'learning_rate': 8.776162297737287e-06, 'epoch': 1.08} {'loss': 0.4969, 'learning_rate': 8.775837407610675e-06, 'epoch': 1.08} {'loss': 0.6126, 'learning_rate': 8.775512518795861e-06, 'epoch': 1.08} {'loss': 0.578, 'learning_rate': 8.775187631293198e-06, 'epoch': 1.08} {'loss': 0.5411, 'learning_rate': 8.774862745103031e-06, 'epoch': 1.08} {'loss': 0.6931, 'learning_rate': 8.77453786022571e-06, 'epoch': 1.08} {'loss': 0.5008, 'learning_rate': 8.774212976661585e-06, 'epoch': 1.08} {'loss': 0.7153, 'learning_rate': 8.773888094410995e-06, 'epoch': 1.08} {'loss': 0.4634, 'learning_rate': 8.773563213474299e-06, 'epoch': 1.08} {'loss': 0.5266, 'learning_rate': 8.773238333851837e-06, 'epoch': 1.08} {'loss': 0.5737, 'learning_rate': 8.772913455543964e-06, 'epoch': 1.08} {'loss': 0.5485, 'learning_rate': 8.772588578551025e-06, 'epoch': 1.08} {'loss': 0.6065, 'learning_rate': 8.772263702873369e-06, 'epoch': 1.08} {'loss': 0.7733, 'learning_rate': 8.771938828511342e-06, 'epoch': 1.08} {'loss': 0.6679, 'learning_rate': 8.77161395546529e-06, 'epoch': 1.08} {'loss': 0.6823, 'learning_rate': 8.77128908373557e-06, 'epoch': 1.08} {'loss': 0.481, 'learning_rate': 8.770964213322521e-06, 'epoch': 1.08} {'loss': 0.6703, 'learning_rate': 8.770639344226496e-06, 'epoch': 1.08} {'loss': 0.5221, 'learning_rate': 8.770314476447843e-06, 'epoch': 1.08} {'loss': 0.3461, 'learning_rate': 8.769989609986907e-06, 'epoch': 1.08} {'loss': 0.508, 'learning_rate': 8.769664744844041e-06, 'epoch': 1.08} {'loss': 0.6976, 'learning_rate': 8.769339881019584e-06, 'epoch': 1.08} {'loss': 0.6003, 'learning_rate': 8.769015018513899e-06, 'epoch': 1.08} {'loss': 0.4766, 'learning_rate': 8.768690157327319e-06, 'epoch': 1.08} {'loss': 0.5286, 'learning_rate': 8.768365297460204e-06, 'epoch': 1.08} {'loss': 0.5125, 'learning_rate': 8.76804043891289e-06, 'epoch': 1.08} {'loss': 0.4959, 'learning_rate': 8.767715581685736e-06, 'epoch': 1.08} {'loss': 0.5599, 'learning_rate': 8.767390725779088e-06, 'epoch': 1.08} {'loss': 0.6171, 'learning_rate': 8.767065871193287e-06, 'epoch': 1.08} {'loss': 0.6239, 'learning_rate': 8.76674101792869e-06, 'epoch': 1.08} {'loss': 0.6857, 'learning_rate': 8.76641616598564e-06, 'epoch': 1.08} {'loss': 0.577, 'learning_rate': 8.766091315364487e-06, 'epoch': 1.08} {'loss': 0.4174, 'learning_rate': 8.76576646606558e-06, 'epoch': 1.08} {'loss': 0.7045, 'learning_rate': 8.76544161808926e-06, 'epoch': 1.08} {'loss': 0.6393, 'learning_rate': 8.765116771435886e-06, 'epoch': 1.08} {'loss': 0.4729, 'learning_rate': 8.764791926105797e-06, 'epoch': 1.08} {'loss': 0.5745, 'learning_rate': 8.764467082099348e-06, 'epoch': 1.08} {'loss': 0.4703, 'learning_rate': 8.764142239416884e-06, 'epoch': 1.08} {'loss': 0.5833, 'learning_rate': 8.763817398058753e-06, 'epoch': 1.08} {'loss': 0.6062, 'learning_rate': 8.763492558025304e-06, 'epoch': 1.08} {'loss': 0.6239, 'learning_rate': 8.76316771931688e-06, 'epoch': 1.08} {'loss': 0.6989, 'learning_rate': 8.762842881933837e-06, 'epoch': 1.08} {'loss': 0.6173, 'learning_rate': 8.762518045876516e-06, 'epoch': 1.08} {'loss': 0.6498, 'learning_rate': 8.762193211145273e-06, 'epoch': 1.08} {'loss': 0.5333, 'learning_rate': 8.761868377740452e-06, 'epoch': 1.08} {'loss': 0.4899, 'learning_rate': 8.761543545662399e-06, 'epoch': 1.08} {'loss': 0.5217, 'learning_rate': 8.761218714911465e-06, 'epoch': 1.08} {'loss': 0.6117, 'learning_rate': 8.760893885487993e-06, 'epoch': 1.08} {'loss': 0.5672, 'learning_rate': 8.76056905739234e-06, 'epoch': 1.08} {'loss': 0.5195, 'learning_rate': 8.760244230624842e-06, 'epoch': 1.08} {'loss': 0.7112, 'learning_rate': 8.759919405185862e-06, 'epoch': 1.08} {'loss': 0.5976, 'learning_rate': 8.759594581075737e-06, 'epoch': 1.08} {'loss': 0.64, 'learning_rate': 8.759269758294819e-06, 'epoch': 1.08} {'loss': 0.6274, 'learning_rate': 8.758944936843456e-06, 'epoch': 1.08} {'loss': 0.6082, 'learning_rate': 8.758620116721991e-06, 'epoch': 1.08} {'loss': 0.6107, 'learning_rate': 8.758295297930783e-06, 'epoch': 1.08} {'loss': 0.4436, 'learning_rate': 8.757970480470172e-06, 'epoch': 1.08} {'loss': 0.6216, 'learning_rate': 8.757645664340504e-06, 'epoch': 1.08} {'loss': 0.549, 'learning_rate': 8.757320849542135e-06, 'epoch': 1.08} {'loss': 0.5593, 'learning_rate': 8.756996036075408e-06, 'epoch': 1.08} {'loss': 0.7115, 'learning_rate': 8.756671223940672e-06, 'epoch': 1.08} {'loss': 0.5716, 'learning_rate': 8.75634641313827e-06, 'epoch': 1.08} {'loss': 0.5127, 'learning_rate': 8.756021603668562e-06, 'epoch': 1.08} {'loss': 0.4913, 'learning_rate': 8.755696795531888e-06, 'epoch': 1.08} {'loss': 0.6739, 'learning_rate': 8.755371988728593e-06, 'epoch': 1.08} {'loss': 0.5481, 'learning_rate': 8.755047183259033e-06, 'epoch': 1.08} {'loss': 0.6356, 'learning_rate': 8.754722379123551e-06, 'epoch': 1.08} {'loss': 0.5215, 'learning_rate': 8.754397576322497e-06, 'epoch': 1.08} {'loss': 0.5256, 'learning_rate': 8.75407277485622e-06, 'epoch': 1.08} {'loss': 0.4852, 'learning_rate': 8.753747974725062e-06, 'epoch': 1.08} {'loss': 0.4832, 'learning_rate': 8.753423175929378e-06, 'epoch': 1.08} {'loss': 0.6267, 'learning_rate': 8.753098378469512e-06, 'epoch': 1.08} {'loss': 0.6437, 'learning_rate': 8.752773582345815e-06, 'epoch': 1.08} {'loss': 0.5424, 'learning_rate': 8.752448787558635e-06, 'epoch': 1.08} {'loss': 0.4214, 'learning_rate': 8.752123994108318e-06, 'epoch': 1.08} {'loss': 0.5318, 'learning_rate': 8.751799201995215e-06, 'epoch': 1.08} {'loss': 0.6668, 'learning_rate': 8.751474411219666e-06, 'epoch': 1.08} {'loss': 0.674, 'learning_rate': 8.751149621782029e-06, 'epoch': 1.08} {'loss': 0.6142, 'learning_rate': 8.750824833682644e-06, 'epoch': 1.08} {'loss': 0.4857, 'learning_rate': 8.750500046921866e-06, 'epoch': 1.08} {'loss': 0.5261, 'learning_rate': 8.75017526150004e-06, 'epoch': 1.08} {'loss': 0.4967, 'learning_rate': 8.749850477417516e-06, 'epoch': 1.08} {'loss': 0.6603, 'learning_rate': 8.749525694674639e-06, 'epoch': 1.08} {'loss': 0.5248, 'learning_rate': 8.749200913271753e-06, 'epoch': 1.08} {'loss': 0.553, 'learning_rate': 8.748876133209217e-06, 'epoch': 1.08} {'loss': 0.6003, 'learning_rate': 8.748551354487368e-06, 'epoch': 1.08} {'loss': 0.6582, 'learning_rate': 8.748226577106564e-06, 'epoch': 1.08} {'loss': 0.4278, 'learning_rate': 8.747901801067148e-06, 'epoch': 1.08} {'loss': 0.4973, 'learning_rate': 8.747577026369467e-06, 'epoch': 1.08} {'loss': 0.7309, 'learning_rate': 8.747252253013871e-06, 'epoch': 1.08} {'loss': 0.5584, 'learning_rate': 8.746927481000705e-06, 'epoch': 1.08} {'loss': 0.49, 'learning_rate': 8.746602710330321e-06, 'epoch': 1.08} {'loss': 0.5749, 'learning_rate': 8.746277941003065e-06, 'epoch': 1.08} {'loss': 0.6646, 'learning_rate': 8.745953173019284e-06, 'epoch': 1.08} {'loss': 0.5792, 'learning_rate': 8.74562840637933e-06, 'epoch': 1.08} {'loss': 0.5515, 'learning_rate': 8.745303641083546e-06, 'epoch': 1.08} {'loss': 0.5317, 'learning_rate': 8.744978877132287e-06, 'epoch': 1.08} {'loss': 0.5755, 'learning_rate': 8.744654114525889e-06, 'epoch': 1.08} {'loss': 0.6698, 'learning_rate': 8.744329353264713e-06, 'epoch': 1.08} {'loss': 0.5659, 'learning_rate': 8.744004593349098e-06, 'epoch': 1.08} {'loss': 0.5688, 'learning_rate': 8.7436798347794e-06, 'epoch': 1.08} {'loss': 0.5872, 'learning_rate': 8.743355077555958e-06, 'epoch': 1.08} {'loss': 0.6777, 'learning_rate': 8.743030321679125e-06, 'epoch': 1.08} {'loss': 0.4258, 'learning_rate': 8.74270556714925e-06, 'epoch': 1.08} {'loss': 0.6368, 'learning_rate': 8.742380813966678e-06, 'epoch': 1.08} {'loss': 0.6095, 'learning_rate': 8.74205606213176e-06, 'epoch': 1.08} {'loss': 0.6689, 'learning_rate': 8.741731311644844e-06, 'epoch': 1.08} {'loss': 0.4263, 'learning_rate': 8.741406562506273e-06, 'epoch': 1.08} {'loss': 0.6085, 'learning_rate': 8.7410818147164e-06, 'epoch': 1.08} {'loss': 0.4865, 'learning_rate': 8.74075706827557e-06, 'epoch': 1.08} {'loss': 0.4798, 'learning_rate': 8.740432323184136e-06, 'epoch': 1.08} {'loss': 0.542, 'learning_rate': 8.740107579442436e-06, 'epoch': 1.08} {'loss': 0.5367, 'learning_rate': 8.739782837050831e-06, 'epoch': 1.08} {'loss': 0.6552, 'learning_rate': 8.739458096009662e-06, 'epoch': 1.08} {'loss': 0.5189, 'learning_rate': 8.739133356319274e-06, 'epoch': 1.08} {'loss': 0.4977, 'learning_rate': 8.73880861798002e-06, 'epoch': 1.08} {'loss': 0.6178, 'learning_rate': 8.738483880992244e-06, 'epoch': 1.08} {'loss': 0.5023, 'learning_rate': 8.7381591453563e-06, 'epoch': 1.08} {'loss': 0.5415, 'learning_rate': 8.737834411072529e-06, 'epoch': 1.08} {'loss': 0.4943, 'learning_rate': 8.737509678141286e-06, 'epoch': 1.08} {'loss': 0.5306, 'learning_rate': 8.737184946562916e-06, 'epoch': 1.08} {'loss': 0.4776, 'learning_rate': 8.736860216337763e-06, 'epoch': 1.08} {'loss': 0.5926, 'learning_rate': 8.73653548746618e-06, 'epoch': 1.08} {'loss': 0.6289, 'learning_rate': 8.736210759948511e-06, 'epoch': 1.08} {'loss': 0.4704, 'learning_rate': 8.735886033785107e-06, 'epoch': 1.08} {'loss': 0.4963, 'learning_rate': 8.73556130897632e-06, 'epoch': 1.08} {'loss': 0.6628, 'learning_rate': 8.735236585522485e-06, 'epoch': 1.08} {'loss': 0.5999, 'learning_rate': 8.734911863423963e-06, 'epoch': 1.08} {'loss': 0.5007, 'learning_rate': 8.734587142681096e-06, 'epoch': 1.08} {'loss': 0.6731, 'learning_rate': 8.734262423294236e-06, 'epoch': 1.08} {'loss': 0.5111, 'learning_rate': 8.733937705263722e-06, 'epoch': 1.08} {'loss': 0.4427, 'learning_rate': 8.733612988589913e-06, 'epoch': 1.08} {'loss': 0.489, 'learning_rate': 8.733288273273153e-06, 'epoch': 1.08} {'loss': 0.4215, 'learning_rate': 8.732963559313783e-06, 'epoch': 1.08} {'loss': 0.5558, 'learning_rate': 8.732638846712163e-06, 'epoch': 1.08} {'loss': 0.6515, 'learning_rate': 8.73231413546863e-06, 'epoch': 1.08} {'loss': 0.5662, 'learning_rate': 8.731989425583541e-06, 'epoch': 1.08} {'loss': 0.5682, 'learning_rate': 8.731664717057235e-06, 'epoch': 1.08} {'loss': 0.617, 'learning_rate': 8.731340009890068e-06, 'epoch': 1.08} {'loss': 0.4074, 'learning_rate': 8.731015304082388e-06, 'epoch': 1.08} {'loss': 0.6217, 'learning_rate': 8.730690599634532e-06, 'epoch': 1.08} {'loss': 0.4535, 'learning_rate': 8.730365896546863e-06, 'epoch': 1.08} {'loss': 0.6021, 'learning_rate': 8.730041194819716e-06, 'epoch': 1.08} {'loss': 0.6114, 'learning_rate': 8.729716494453448e-06, 'epoch': 1.08} {'loss': 0.4835, 'learning_rate': 8.729391795448404e-06, 'epoch': 1.08} {'loss': 0.5297, 'learning_rate': 8.729067097804925e-06, 'epoch': 1.08} {'loss': 0.5693, 'learning_rate': 8.728742401523371e-06, 'epoch': 1.08} {'loss': 0.5625, 'learning_rate': 8.72841770660408e-06, 'epoch': 1.08} {'loss': 0.4899, 'learning_rate': 8.728093013047409e-06, 'epoch': 1.08} {'loss': 0.5264, 'learning_rate': 8.727768320853699e-06, 'epoch': 1.08} {'loss': 0.5863, 'learning_rate': 8.7274436300233e-06, 'epoch': 1.08} {'loss': 0.655, 'learning_rate': 8.727118940556565e-06, 'epoch': 1.08} {'loss': 0.4854, 'learning_rate': 8.726794252453827e-06, 'epoch': 1.08} {'loss': 0.6035, 'learning_rate': 8.726469565715452e-06, 'epoch': 1.08} {'loss': 0.4664, 'learning_rate': 8.726144880341774e-06, 'epoch': 1.08} {'loss': 0.7327, 'learning_rate': 8.72582019633315e-06, 'epoch': 1.08} {'loss': 0.5108, 'learning_rate': 8.725495513689927e-06, 'epoch': 1.08} {'loss': 0.4279, 'learning_rate': 8.725170832412446e-06, 'epoch': 1.08} {'loss': 0.6067, 'learning_rate': 8.724846152501063e-06, 'epoch': 1.08} {'loss': 0.5459, 'learning_rate': 8.724521473956118e-06, 'epoch': 1.08} {'loss': 0.5163, 'learning_rate': 8.724196796777968e-06, 'epoch': 1.08} {'loss': 0.6231, 'learning_rate': 8.723872120966952e-06, 'epoch': 1.08} {'loss': 0.4876, 'learning_rate': 8.723547446523426e-06, 'epoch': 1.08} {'loss': 0.6209, 'learning_rate': 8.723222773447734e-06, 'epoch': 1.08} {'loss': 0.5564, 'learning_rate': 8.722898101740223e-06, 'epoch': 1.08} {'loss': 0.6796, 'learning_rate': 8.722573431401242e-06, 'epoch': 1.08} {'loss': 0.5013, 'learning_rate': 8.722248762431136e-06, 'epoch': 1.08} {'loss': 0.5698, 'learning_rate': 8.72192409483026e-06, 'epoch': 1.08} {'loss': 0.4516, 'learning_rate': 8.721599428598956e-06, 'epoch': 1.08} {'loss': 0.5797, 'learning_rate': 8.721274763737573e-06, 'epoch': 1.08} {'loss': 0.6733, 'learning_rate': 8.720950100246461e-06, 'epoch': 1.08} {'loss': 0.6454, 'learning_rate': 8.720625438125965e-06, 'epoch': 1.08} {'loss': 0.7307, 'learning_rate': 8.720300777376437e-06, 'epoch': 1.08} {'loss': 0.5701, 'learning_rate': 8.719976117998217e-06, 'epoch': 1.08} {'loss': 0.6564, 'learning_rate': 8.719651459991662e-06, 'epoch': 1.08} {'loss': 0.6622, 'learning_rate': 8.719326803357117e-06, 'epoch': 1.08} {'loss': 0.5375, 'learning_rate': 8.719002148094927e-06, 'epoch': 1.08} {'loss': 0.6097, 'learning_rate': 8.718677494205441e-06, 'epoch': 1.08} {'loss': 0.3468, 'learning_rate': 8.718352841689008e-06, 'epoch': 1.08} {'loss': 0.5834, 'learning_rate': 8.718028190545979e-06, 'epoch': 1.08} {'loss': 0.6012, 'learning_rate': 8.717703540776692e-06, 'epoch': 1.08} {'loss': 0.514, 'learning_rate': 8.717378892381508e-06, 'epoch': 1.08} {'loss': 0.5637, 'learning_rate': 8.717054245360765e-06, 'epoch': 1.08} {'loss': 0.5377, 'learning_rate': 8.716729599714816e-06, 'epoch': 1.08} {'loss': 0.5595, 'learning_rate': 8.716404955444004e-06, 'epoch': 1.08} {'loss': 0.5277, 'learning_rate': 8.716080312548681e-06, 'epoch': 1.08} {'loss': 0.6778, 'learning_rate': 8.715755671029195e-06, 'epoch': 1.08} {'loss': 0.5903, 'learning_rate': 8.71543103088589e-06, 'epoch': 1.08} {'loss': 0.6078, 'learning_rate': 8.715106392119121e-06, 'epoch': 1.08} {'loss': 0.4861, 'learning_rate': 8.71478175472923e-06, 'epoch': 1.08} {'loss': 0.6679, 'learning_rate': 8.714457118716565e-06, 'epoch': 1.08} {'loss': 0.5931, 'learning_rate': 8.714132484081478e-06, 'epoch': 1.08} {'loss': 0.4578, 'learning_rate': 8.713807850824308e-06, 'epoch': 1.08} {'loss': 0.6174, 'learning_rate': 8.713483218945415e-06, 'epoch': 1.08} {'loss': 0.4785, 'learning_rate': 8.71315858844514e-06, 'epoch': 1.09} {'loss': 0.5767, 'learning_rate': 8.712833959323828e-06, 'epoch': 1.09} {'loss': 0.4013, 'learning_rate': 8.712509331581835e-06, 'epoch': 1.09} {'loss': 0.6469, 'learning_rate': 8.712184705219502e-06, 'epoch': 1.09} {'loss': 0.6966, 'learning_rate': 8.71186008023718e-06, 'epoch': 1.09} {'loss': 0.492, 'learning_rate': 8.711535456635213e-06, 'epoch': 1.09} {'loss': 0.5847, 'learning_rate': 8.711210834413958e-06, 'epoch': 1.09} {'loss': 0.5364, 'learning_rate': 8.710886213573755e-06, 'epoch': 1.09} {'loss': 0.4845, 'learning_rate': 8.71056159411495e-06, 'epoch': 1.09} {'loss': 0.5948, 'learning_rate': 8.710236976037898e-06, 'epoch': 1.09} {'loss': 0.6429, 'learning_rate': 8.709912359342942e-06, 'epoch': 1.09} {'loss': 0.4889, 'learning_rate': 8.709587744030434e-06, 'epoch': 1.09} {'loss': 0.5944, 'learning_rate': 8.709263130100715e-06, 'epoch': 1.09} {'loss': 0.53, 'learning_rate': 8.70893851755414e-06, 'epoch': 1.09} {'loss': 0.646, 'learning_rate': 8.708613906391055e-06, 'epoch': 1.09} {'loss': 0.5706, 'learning_rate': 8.708289296611803e-06, 'epoch': 1.09} {'loss': 0.4917, 'learning_rate': 8.70796468821674e-06, 'epoch': 1.09} {'loss': 0.4398, 'learning_rate': 8.707640081206206e-06, 'epoch': 1.09} {'loss': 0.542, 'learning_rate': 8.707315475580556e-06, 'epoch': 1.09} {'loss': 0.5477, 'learning_rate': 8.706990871340132e-06, 'epoch': 1.09} {'loss': 0.5803, 'learning_rate': 8.706666268485281e-06, 'epoch': 1.09} {'loss': 0.6347, 'learning_rate': 8.706341667016358e-06, 'epoch': 1.09} {'loss': 0.6527, 'learning_rate': 8.706017066933701e-06, 'epoch': 1.09} {'loss': 0.4271, 'learning_rate': 8.70569246823767e-06, 'epoch': 1.09} {'loss': 0.5306, 'learning_rate': 8.705367870928603e-06, 'epoch': 1.09} {'loss': 0.5521, 'learning_rate': 8.705043275006854e-06, 'epoch': 1.09} {'loss': 0.5591, 'learning_rate': 8.704718680472769e-06, 'epoch': 1.09} {'loss': 0.5457, 'learning_rate': 8.704394087326687e-06, 'epoch': 1.09} {'loss': 0.6346, 'learning_rate': 8.704069495568971e-06, 'epoch': 1.09} {'loss': 0.4875, 'learning_rate': 8.703744905199956e-06, 'epoch': 1.09} {'loss': 0.4945, 'learning_rate': 8.70342031622e-06, 'epoch': 1.09} {'loss': 0.5922, 'learning_rate': 8.703095728629443e-06, 'epoch': 1.09} {'loss': 0.5838, 'learning_rate': 8.70277114242864e-06, 'epoch': 1.09} {'loss': 0.4921, 'learning_rate': 8.702446557617934e-06, 'epoch': 1.09} {'loss': 0.5113, 'learning_rate': 8.70212197419767e-06, 'epoch': 1.09} {'loss': 0.5215, 'learning_rate': 8.701797392168201e-06, 'epoch': 1.09} {'loss': 0.5389, 'learning_rate': 8.701472811529873e-06, 'epoch': 1.09} {'loss': 0.5464, 'learning_rate': 8.701148232283036e-06, 'epoch': 1.09} {'loss': 0.5584, 'learning_rate': 8.700823654428036e-06, 'epoch': 1.09} {'loss': 0.6464, 'learning_rate': 8.700499077965219e-06, 'epoch': 1.09} {'loss': 0.6634, 'learning_rate': 8.700174502894935e-06, 'epoch': 1.09} {'loss': 0.575, 'learning_rate': 8.699849929217529e-06, 'epoch': 1.09} {'loss': 0.4515, 'learning_rate': 8.699525356933355e-06, 'epoch': 1.09} {'loss': 0.5627, 'learning_rate': 8.699200786042751e-06, 'epoch': 1.09} {'loss': 0.5731, 'learning_rate': 8.698876216546079e-06, 'epoch': 1.09} {'loss': 0.57, 'learning_rate': 8.698551648443675e-06, 'epoch': 1.09} {'loss': 0.4304, 'learning_rate': 8.698227081735889e-06, 'epoch': 1.09} {'loss': 0.4905, 'learning_rate': 8.697902516423073e-06, 'epoch': 1.09} {'loss': 0.6433, 'learning_rate': 8.697577952505568e-06, 'epoch': 1.09} {'loss': 0.5389, 'learning_rate': 8.697253389983729e-06, 'epoch': 1.09} {'loss': 0.8185, 'learning_rate': 8.696928828857902e-06, 'epoch': 1.09} {'loss': 0.4995, 'learning_rate': 8.696604269128429e-06, 'epoch': 1.09} {'loss': 0.5156, 'learning_rate': 8.696279710795664e-06, 'epoch': 1.09} {'loss': 0.6803, 'learning_rate': 8.695955153859952e-06, 'epoch': 1.09} {'loss': 0.4655, 'learning_rate': 8.695630598321645e-06, 'epoch': 1.09} {'loss': 0.6484, 'learning_rate': 8.695306044181082e-06, 'epoch': 1.09} {'loss': 0.5693, 'learning_rate': 8.694981491438621e-06, 'epoch': 1.09} {'loss': 0.5967, 'learning_rate': 8.694656940094605e-06, 'epoch': 1.09} {'loss': 0.6135, 'learning_rate': 8.694332390149378e-06, 'epoch': 1.09} {'loss': 0.5902, 'learning_rate': 8.694007841603296e-06, 'epoch': 1.09} {'loss': 0.5948, 'learning_rate': 8.6936832944567e-06, 'epoch': 1.09} {'loss': 0.6749, 'learning_rate': 8.693358748709944e-06, 'epoch': 1.09} {'loss': 0.6607, 'learning_rate': 8.693034204363366e-06, 'epoch': 1.09} {'loss': 0.5986, 'learning_rate': 8.692709661417324e-06, 'epoch': 1.09} {'loss': 0.5818, 'learning_rate': 8.692385119872163e-06, 'epoch': 1.09} {'loss': 0.6129, 'learning_rate': 8.692060579728226e-06, 'epoch': 1.09} {'loss': 0.3853, 'learning_rate': 8.691736040985863e-06, 'epoch': 1.09} {'loss': 0.5543, 'learning_rate': 8.691411503645426e-06, 'epoch': 1.09} {'loss': 0.6837, 'learning_rate': 8.691086967707258e-06, 'epoch': 1.09} {'loss': 0.6316, 'learning_rate': 8.690762433171712e-06, 'epoch': 1.09} {'loss': 0.5499, 'learning_rate': 8.690437900039126e-06, 'epoch': 1.09} {'loss': 0.4274, 'learning_rate': 8.69011336830986e-06, 'epoch': 1.09} {'loss': 0.5574, 'learning_rate': 8.689788837984252e-06, 'epoch': 1.09} {'loss': 0.5328, 'learning_rate': 8.689464309062655e-06, 'epoch': 1.09} {'loss': 0.3561, 'learning_rate': 8.689139781545413e-06, 'epoch': 1.09} {'loss': 0.6276, 'learning_rate': 8.688815255432878e-06, 'epoch': 1.09} {'loss': 0.5378, 'learning_rate': 8.688490730725399e-06, 'epoch': 1.09} {'loss': 0.7124, 'learning_rate': 8.688166207423313e-06, 'epoch': 1.09} {'loss': 0.4857, 'learning_rate': 8.68784168552698e-06, 'epoch': 1.09} {'loss': 0.4806, 'learning_rate': 8.687517165036742e-06, 'epoch': 1.09} {'loss': 0.656, 'learning_rate': 8.687192645952952e-06, 'epoch': 1.09} {'loss': 0.5848, 'learning_rate': 8.686868128275946e-06, 'epoch': 1.09} {'loss': 0.5491, 'learning_rate': 8.686543612006085e-06, 'epoch': 1.09} {'loss': 0.6282, 'learning_rate': 8.68621909714371e-06, 'epoch': 1.09} {'loss': 0.4468, 'learning_rate': 8.685894583689167e-06, 'epoch': 1.09} {'loss': 0.5924, 'learning_rate': 8.68557007164281e-06, 'epoch': 1.09} {'loss': 0.5401, 'learning_rate': 8.685245561004982e-06, 'epoch': 1.09} {'loss': 0.5302, 'learning_rate': 8.684921051776034e-06, 'epoch': 1.09} {'loss': 0.6102, 'learning_rate': 8.684596543956311e-06, 'epoch': 1.09} {'loss': 0.6213, 'learning_rate': 8.684272037546158e-06, 'epoch': 1.09} {'loss': 0.5214, 'learning_rate': 8.683947532545928e-06, 'epoch': 1.09} {'loss': 0.5527, 'learning_rate': 8.683623028955966e-06, 'epoch': 1.09} {'loss': 0.6483, 'learning_rate': 8.683298526776625e-06, 'epoch': 1.09} {'loss': 0.3598, 'learning_rate': 8.682974026008243e-06, 'epoch': 1.09} {'loss': 0.6784, 'learning_rate': 8.68264952665118e-06, 'epoch': 1.09} {'loss': 0.6102, 'learning_rate': 8.682325028705774e-06, 'epoch': 1.09} {'loss': 0.6422, 'learning_rate': 8.68200053217237e-06, 'epoch': 1.09} {'loss': 0.5326, 'learning_rate': 8.681676037051328e-06, 'epoch': 1.09} {'loss': 0.4731, 'learning_rate': 8.681351543342984e-06, 'epoch': 1.09} {'loss': 0.5547, 'learning_rate': 8.681027051047697e-06, 'epoch': 1.09} {'loss': 0.6443, 'learning_rate': 8.680702560165804e-06, 'epoch': 1.09} {'loss': 0.558, 'learning_rate': 8.68037807069766e-06, 'epoch': 1.09} {'loss': 0.4507, 'learning_rate': 8.68005358264361e-06, 'epoch': 1.09} {'loss': 0.3452, 'learning_rate': 8.679729096003999e-06, 'epoch': 1.09} {'loss': 0.6368, 'learning_rate': 8.679404610779181e-06, 'epoch': 1.09} {'loss': 0.5578, 'learning_rate': 8.679080126969495e-06, 'epoch': 1.09} {'loss': 0.4886, 'learning_rate': 8.678755644575299e-06, 'epoch': 1.09} {'loss': 0.6622, 'learning_rate': 8.678431163596934e-06, 'epoch': 1.09} {'loss': 0.547, 'learning_rate': 8.678106684034749e-06, 'epoch': 1.09} {'loss': 0.287, 'learning_rate': 8.677782205889092e-06, 'epoch': 1.09} {'loss': 0.5477, 'learning_rate': 8.677457729160308e-06, 'epoch': 1.09} {'loss': 0.7072, 'learning_rate': 8.677133253848751e-06, 'epoch': 1.09} {'loss': 0.605, 'learning_rate': 8.676808779954761e-06, 'epoch': 1.09} {'loss': 0.4978, 'learning_rate': 8.676484307478695e-06, 'epoch': 1.09} {'loss': 0.583, 'learning_rate': 8.676159836420896e-06, 'epoch': 1.09} {'loss': 0.6238, 'learning_rate': 8.675835366781707e-06, 'epoch': 1.09} {'loss': 0.6064, 'learning_rate': 8.675510898561483e-06, 'epoch': 1.09} {'loss': 0.501, 'learning_rate': 8.675186431760565e-06, 'epoch': 1.09} {'loss': 0.7615, 'learning_rate': 8.674861966379307e-06, 'epoch': 1.09} {'loss': 0.4383, 'learning_rate': 8.674537502418051e-06, 'epoch': 1.09} {'loss': 0.6516, 'learning_rate': 8.674213039877152e-06, 'epoch': 1.09} {'loss': 0.4536, 'learning_rate': 8.673888578756953e-06, 'epoch': 1.09} {'loss': 0.5825, 'learning_rate': 8.6735641190578e-06, 'epoch': 1.09} {'loss': 0.5789, 'learning_rate': 8.673239660780045e-06, 'epoch': 1.09} {'loss': 0.4403, 'learning_rate': 8.672915203924028e-06, 'epoch': 1.09} {'loss': 0.6832, 'learning_rate': 8.672590748490108e-06, 'epoch': 1.09} {'loss': 0.5025, 'learning_rate': 8.672266294478626e-06, 'epoch': 1.09} {'loss': 0.5182, 'learning_rate': 8.671941841889927e-06, 'epoch': 1.09} {'loss': 0.4554, 'learning_rate': 8.671617390724366e-06, 'epoch': 1.09} {'loss': 0.5623, 'learning_rate': 8.671292940982285e-06, 'epoch': 1.09} {'loss': 0.549, 'learning_rate': 8.670968492664035e-06, 'epoch': 1.09} {'loss': 0.5746, 'learning_rate': 8.670644045769959e-06, 'epoch': 1.09} {'loss': 0.5735, 'learning_rate': 8.670319600300411e-06, 'epoch': 1.09} {'loss': 0.6493, 'learning_rate': 8.669995156255737e-06, 'epoch': 1.09} {'loss': 0.4924, 'learning_rate': 8.669670713636277e-06, 'epoch': 1.09} {'loss': 0.552, 'learning_rate': 8.66934627244239e-06, 'epoch': 1.09} {'loss': 0.6911, 'learning_rate': 8.669021832674418e-06, 'epoch': 1.09} {'loss': 0.6399, 'learning_rate': 8.66869739433271e-06, 'epoch': 1.09} {'loss': 0.5624, 'learning_rate': 8.668372957417612e-06, 'epoch': 1.09} {'loss': 0.5736, 'learning_rate': 8.668048521929468e-06, 'epoch': 1.09} {'loss': 0.4636, 'learning_rate': 8.667724087868637e-06, 'epoch': 1.09} {'loss': 0.4962, 'learning_rate': 8.667399655235455e-06, 'epoch': 1.09} {'loss': 0.6797, 'learning_rate': 8.667075224030278e-06, 'epoch': 1.09} {'loss': 0.4554, 'learning_rate': 8.666750794253446e-06, 'epoch': 1.09} {'loss': 0.474, 'learning_rate': 8.666426365905316e-06, 'epoch': 1.09} {'loss': 0.525, 'learning_rate': 8.66610193898623e-06, 'epoch': 1.09} {'loss': 0.5407, 'learning_rate': 8.665777513496531e-06, 'epoch': 1.09} {'loss': 0.5371, 'learning_rate': 8.665453089436578e-06, 'epoch': 1.09} {'loss': 0.5147, 'learning_rate': 8.665128666806707e-06, 'epoch': 1.09} {'loss': 0.6482, 'learning_rate': 8.664804245607277e-06, 'epoch': 1.09} {'loss': 0.5579, 'learning_rate': 8.664479825838623e-06, 'epoch': 1.09} {'loss': 0.5351, 'learning_rate': 8.664155407501104e-06, 'epoch': 1.09} {'loss': 0.4845, 'learning_rate': 8.663830990595064e-06, 'epoch': 1.09} {'loss': 0.6933, 'learning_rate': 8.663506575120845e-06, 'epoch': 1.09} {'loss': 0.6113, 'learning_rate': 8.663182161078803e-06, 'epoch': 1.09} {'loss': 0.5305, 'learning_rate': 8.66285774846928e-06, 'epoch': 1.09} {'loss': 0.6146, 'learning_rate': 8.662533337292628e-06, 'epoch': 1.09} {'loss': 0.5775, 'learning_rate': 8.662208927549192e-06, 'epoch': 1.09} {'loss': 0.6377, 'learning_rate': 8.661884519239317e-06, 'epoch': 1.09} {'loss': 0.6009, 'learning_rate': 8.661560112363356e-06, 'epoch': 1.09} {'loss': 0.6192, 'learning_rate': 8.66123570692165e-06, 'epoch': 1.09} {'loss': 0.5367, 'learning_rate': 8.660911302914556e-06, 'epoch': 1.09} {'loss': 0.5679, 'learning_rate': 8.660586900342414e-06, 'epoch': 1.09} {'loss': 0.5938, 'learning_rate': 8.660262499205576e-06, 'epoch': 1.09} {'loss': 0.5741, 'learning_rate': 8.659938099504388e-06, 'epoch': 1.09} {'loss': 0.3987, 'learning_rate': 8.659613701239192e-06, 'epoch': 1.09} {'loss': 0.5183, 'learning_rate': 8.659289304410345e-06, 'epoch': 1.09} {'loss': 0.5015, 'learning_rate': 8.658964909018188e-06, 'epoch': 1.09} {'loss': 0.6204, 'learning_rate': 8.658640515063074e-06, 'epoch': 1.09} {'loss': 0.495, 'learning_rate': 8.658316122545347e-06, 'epoch': 1.09} {'loss': 0.5869, 'learning_rate': 8.657991731465355e-06, 'epoch': 1.09} {'loss': 0.4829, 'learning_rate': 8.657667341823449e-06, 'epoch': 1.09} {'loss': 0.4768, 'learning_rate': 8.657342953619968e-06, 'epoch': 1.09} {'loss': 0.6153, 'learning_rate': 8.657018566855268e-06, 'epoch': 1.09} {'loss': 0.6154, 'learning_rate': 8.656694181529692e-06, 'epoch': 1.09} {'loss': 0.5377, 'learning_rate': 8.656369797643592e-06, 'epoch': 1.09} {'loss': 0.3743, 'learning_rate': 8.656045415197314e-06, 'epoch': 1.09} {'loss': 0.4718, 'learning_rate': 8.655721034191203e-06, 'epoch': 1.09} {'loss': 0.4497, 'learning_rate': 8.65539665462561e-06, 'epoch': 1.09} {'loss': 0.6313, 'learning_rate': 8.655072276500876e-06, 'epoch': 1.09} {'loss': 0.5633, 'learning_rate': 8.654747899817358e-06, 'epoch': 1.09} {'loss': 0.4433, 'learning_rate': 8.654423524575393e-06, 'epoch': 1.09} {'loss': 0.6918, 'learning_rate': 8.654099150775342e-06, 'epoch': 1.09} {'loss': 0.5865, 'learning_rate': 8.653774778417543e-06, 'epoch': 1.09} {'loss': 0.6943, 'learning_rate': 8.653450407502344e-06, 'epoch': 1.09} {'loss': 0.6697, 'learning_rate': 8.653126038030097e-06, 'epoch': 1.09} {'loss': 0.6944, 'learning_rate': 8.652801670001143e-06, 'epoch': 1.09} {'loss': 0.5865, 'learning_rate': 8.652477303415837e-06, 'epoch': 1.09} {'loss': 0.5908, 'learning_rate': 8.65215293827452e-06, 'epoch': 1.09} {'loss': 0.5732, 'learning_rate': 8.651828574577546e-06, 'epoch': 1.09} {'loss': 0.5029, 'learning_rate': 8.65150421232526e-06, 'epoch': 1.09} {'loss': 0.5863, 'learning_rate': 8.651179851518007e-06, 'epoch': 1.09} {'loss': 0.574, 'learning_rate': 8.650855492156138e-06, 'epoch': 1.09} {'loss': 0.6242, 'learning_rate': 8.650531134239995e-06, 'epoch': 1.09} {'loss': 0.4616, 'learning_rate': 8.650206777769935e-06, 'epoch': 1.09} {'loss': 0.6571, 'learning_rate': 8.6498824227463e-06, 'epoch': 1.09} {'loss': 0.698, 'learning_rate': 8.649558069169433e-06, 'epoch': 1.09} {'loss': 0.6745, 'learning_rate': 8.64923371703969e-06, 'epoch': 1.09} {'loss': 0.6435, 'learning_rate': 8.648909366357414e-06, 'epoch': 1.09} {'loss': 0.5086, 'learning_rate': 8.648585017122955e-06, 'epoch': 1.09} {'loss': 0.5664, 'learning_rate': 8.648260669336655e-06, 'epoch': 1.09} {'loss': 0.6024, 'learning_rate': 8.64793632299887e-06, 'epoch': 1.09} {'loss': 0.4881, 'learning_rate': 8.647611978109944e-06, 'epoch': 1.09} {'loss': 0.5457, 'learning_rate': 8.647287634670219e-06, 'epoch': 1.09} {'loss': 0.5658, 'learning_rate': 8.64696329268005e-06, 'epoch': 1.09} {'loss': 0.4204, 'learning_rate': 8.646638952139782e-06, 'epoch': 1.09} {'loss': 0.4489, 'learning_rate': 8.646314613049764e-06, 'epoch': 1.09} {'loss': 0.5591, 'learning_rate': 8.645990275410338e-06, 'epoch': 1.09} {'loss': 0.5123, 'learning_rate': 8.64566593922186e-06, 'epoch': 1.09} {'loss': 0.5853, 'learning_rate': 8.645341604484672e-06, 'epoch': 1.09} {'loss': 0.6082, 'learning_rate': 8.64501727119912e-06, 'epoch': 1.09} {'loss': 0.5556, 'learning_rate': 8.644692939365558e-06, 'epoch': 1.09} {'loss': 0.6063, 'learning_rate': 8.644368608984326e-06, 'epoch': 1.09} {'loss': 0.5491, 'learning_rate': 8.644044280055782e-06, 'epoch': 1.09} {'loss': 0.5559, 'learning_rate': 8.643719952580263e-06, 'epoch': 1.09} {'loss': 0.7425, 'learning_rate': 8.643395626558117e-06, 'epoch': 1.09} {'loss': 0.4481, 'learning_rate': 8.6430713019897e-06, 'epoch': 1.09} {'loss': 0.5052, 'learning_rate': 8.642746978875352e-06, 'epoch': 1.09} {'loss': 0.6403, 'learning_rate': 8.642422657215422e-06, 'epoch': 1.09} {'loss': 0.5111, 'learning_rate': 8.64209833701026e-06, 'epoch': 1.09} {'loss': 0.5732, 'learning_rate': 8.641774018260216e-06, 'epoch': 1.09} {'loss': 0.6446, 'learning_rate': 8.641449700965631e-06, 'epoch': 1.09} {'loss': 0.6121, 'learning_rate': 8.641125385126851e-06, 'epoch': 1.09} {'loss': 0.6882, 'learning_rate': 8.640801070744234e-06, 'epoch': 1.09} {'loss': 0.5677, 'learning_rate': 8.640476757818117e-06, 'epoch': 1.09} {'loss': 0.4922, 'learning_rate': 8.640152446348854e-06, 'epoch': 1.09} {'loss': 0.4642, 'learning_rate': 8.639828136336792e-06, 'epoch': 1.09} {'loss': 0.5934, 'learning_rate': 8.639503827782273e-06, 'epoch': 1.09} {'loss': 0.5668, 'learning_rate': 8.639179520685652e-06, 'epoch': 1.09} {'loss': 0.5517, 'learning_rate': 8.638855215047269e-06, 'epoch': 1.09} {'loss': 0.5318, 'learning_rate': 8.638530910867479e-06, 'epoch': 1.09} {'loss': 0.4752, 'learning_rate': 8.638206608146625e-06, 'epoch': 1.09} {'loss': 0.4882, 'learning_rate': 8.637882306885056e-06, 'epoch': 1.09} {'loss': 0.6308, 'learning_rate': 8.63755800708312e-06, 'epoch': 1.09} {'loss': 0.6561, 'learning_rate': 8.637233708741159e-06, 'epoch': 1.09} {'loss': 0.5235, 'learning_rate': 8.636909411859528e-06, 'epoch': 1.09} {'loss': 0.6953, 'learning_rate': 8.63658511643857e-06, 'epoch': 1.09} {'loss': 0.5074, 'learning_rate': 8.636260822478637e-06, 'epoch': 1.09} {'loss': 0.3972, 'learning_rate': 8.635936529980072e-06, 'epoch': 1.09} {'loss': 0.5018, 'learning_rate': 8.635612238943226e-06, 'epoch': 1.09} {'loss': 0.6142, 'learning_rate': 8.635287949368445e-06, 'epoch': 1.09} {'loss': 0.5033, 'learning_rate': 8.63496366125607e-06, 'epoch': 1.09} {'loss': 0.6116, 'learning_rate': 8.634639374606462e-06, 'epoch': 1.09} {'loss': 0.4562, 'learning_rate': 8.634315089419954e-06, 'epoch': 1.09} {'loss': 0.5677, 'learning_rate': 8.633990805696908e-06, 'epoch': 1.09} {'loss': 0.5886, 'learning_rate': 8.633666523437661e-06, 'epoch': 1.09} {'loss': 0.6674, 'learning_rate': 8.633342242642563e-06, 'epoch': 1.09} {'loss': 0.5222, 'learning_rate': 8.633017963311963e-06, 'epoch': 1.09} {'loss': 0.5446, 'learning_rate': 8.632693685446205e-06, 'epoch': 1.09} {'loss': 0.5051, 'learning_rate': 8.632369409045642e-06, 'epoch': 1.09} {'loss': 0.6419, 'learning_rate': 8.632045134110616e-06, 'epoch': 1.09} {'loss': 0.5772, 'learning_rate': 8.63172086064148e-06, 'epoch': 1.09} {'loss': 0.5882, 'learning_rate': 8.63139658863858e-06, 'epoch': 1.09} {'loss': 0.5315, 'learning_rate': 8.631072318102259e-06, 'epoch': 1.09} {'loss': 0.4188, 'learning_rate': 8.630748049032869e-06, 'epoch': 1.09} {'loss': 0.438, 'learning_rate': 8.630423781430753e-06, 'epoch': 1.09} {'loss': 0.6044, 'learning_rate': 8.630099515296266e-06, 'epoch': 1.09} {'loss': 0.5102, 'learning_rate': 8.629775250629744e-06, 'epoch': 1.09} {'loss': 0.6576, 'learning_rate': 8.62945098743155e-06, 'epoch': 1.09} {'loss': 0.5313, 'learning_rate': 8.62912672570202e-06, 'epoch': 1.09} {'loss': 0.5969, 'learning_rate': 8.628802465441504e-06, 'epoch': 1.09} {'loss': 0.6604, 'learning_rate': 8.62847820665035e-06, 'epoch': 1.09} {'loss': 0.595, 'learning_rate': 8.628153949328902e-06, 'epoch': 1.09} {'loss': 0.5223, 'learning_rate': 8.627829693477515e-06, 'epoch': 1.09} {'loss': 0.4587, 'learning_rate': 8.627505439096534e-06, 'epoch': 1.09} {'loss': 0.6417, 'learning_rate': 8.6271811861863e-06, 'epoch': 1.09} {'loss': 0.4953, 'learning_rate': 8.626856934747168e-06, 'epoch': 1.09} {'loss': 0.6173, 'learning_rate': 8.62653268477948e-06, 'epoch': 1.09} {'loss': 0.6772, 'learning_rate': 8.62620843628359e-06, 'epoch': 1.09} {'loss': 0.5311, 'learning_rate': 8.625884189259838e-06, 'epoch': 1.09} {'loss': 0.4437, 'learning_rate': 8.625559943708579e-06, 'epoch': 1.09} {'loss': 0.5396, 'learning_rate': 8.625235699630155e-06, 'epoch': 1.09} {'loss': 0.6339, 'learning_rate': 8.624911457024912e-06, 'epoch': 1.09} {'loss': 0.5355, 'learning_rate': 8.624587215893206e-06, 'epoch': 1.09} {'loss': 0.617, 'learning_rate': 8.624262976235373e-06, 'epoch': 1.09} {'loss': 0.5951, 'learning_rate': 8.623938738051772e-06, 'epoch': 1.09} {'loss': 0.4438, 'learning_rate': 8.62361450134274e-06, 'epoch': 1.09} {'loss': 0.5399, 'learning_rate': 8.623290266108633e-06, 'epoch': 1.09} {'loss': 0.5027, 'learning_rate': 8.622966032349795e-06, 'epoch': 1.09} {'loss': 0.53, 'learning_rate': 8.622641800066568e-06, 'epoch': 1.09} {'loss': 0.5474, 'learning_rate': 8.622317569259309e-06, 'epoch': 1.09} {'loss': 0.3895, 'learning_rate': 8.621993339928361e-06, 'epoch': 1.09} {'loss': 0.5832, 'learning_rate': 8.621669112074071e-06, 'epoch': 1.09} {'loss': 0.6329, 'learning_rate': 8.621344885696788e-06, 'epoch': 1.09} {'loss': 0.7327, 'learning_rate': 8.621020660796856e-06, 'epoch': 1.09} {'loss': 0.5071, 'learning_rate': 8.620696437374627e-06, 'epoch': 1.09} {'loss': 0.5396, 'learning_rate': 8.620372215430441e-06, 'epoch': 1.09} {'loss': 0.4685, 'learning_rate': 8.620047994964657e-06, 'epoch': 1.09} {'loss': 0.5444, 'learning_rate': 8.619723775977613e-06, 'epoch': 1.09} {'loss': 0.6331, 'learning_rate': 8.61939955846966e-06, 'epoch': 1.09} {'loss': 0.6193, 'learning_rate': 8.619075342441148e-06, 'epoch': 1.09} {'loss': 0.5451, 'learning_rate': 8.618751127892416e-06, 'epoch': 1.09} {'loss': 0.6318, 'learning_rate': 8.618426914823821e-06, 'epoch': 1.09} {'loss': 0.4763, 'learning_rate': 8.618102703235703e-06, 'epoch': 1.09} {'loss': 0.5182, 'learning_rate': 8.617778493128417e-06, 'epoch': 1.09} {'loss': 0.5635, 'learning_rate': 8.617454284502303e-06, 'epoch': 1.09} {'loss': 0.5776, 'learning_rate': 8.617130077357713e-06, 'epoch': 1.09} {'loss': 0.4878, 'learning_rate': 8.616805871694993e-06, 'epoch': 1.09} {'loss': 0.5834, 'learning_rate': 8.616481667514486e-06, 'epoch': 1.09} {'loss': 0.5154, 'learning_rate': 8.61615746481655e-06, 'epoch': 1.09} {'loss': 0.6498, 'learning_rate': 8.615833263601524e-06, 'epoch': 1.09} {'loss': 0.5037, 'learning_rate': 8.615509063869754e-06, 'epoch': 1.09} {'loss': 0.7517, 'learning_rate': 8.615184865621597e-06, 'epoch': 1.09} {'loss': 0.6188, 'learning_rate': 8.61486066885739e-06, 'epoch': 1.09} {'loss': 0.5272, 'learning_rate': 8.614536473577488e-06, 'epoch': 1.09} {'loss': 0.6394, 'learning_rate': 8.61421227978223e-06, 'epoch': 1.09} {'loss': 0.6299, 'learning_rate': 8.613888087471974e-06, 'epoch': 1.09} {'loss': 0.6753, 'learning_rate': 8.613563896647059e-06, 'epoch': 1.09} {'loss': 0.6158, 'learning_rate': 8.613239707307838e-06, 'epoch': 1.09} {'loss': 0.5782, 'learning_rate': 8.612915519454654e-06, 'epoch': 1.09} {'loss': 0.594, 'learning_rate': 8.612591333087856e-06, 'epoch': 1.09} {'loss': 0.4268, 'learning_rate': 8.612267148207793e-06, 'epoch': 1.09} {'loss': 0.6285, 'learning_rate': 8.611942964814808e-06, 'epoch': 1.09} {'loss': 0.5515, 'learning_rate': 8.611618782909255e-06, 'epoch': 1.09} {'loss': 0.5602, 'learning_rate': 8.611294602491478e-06, 'epoch': 1.09} {'loss': 0.5805, 'learning_rate': 8.610970423561821e-06, 'epoch': 1.09} {'loss': 0.5649, 'learning_rate': 8.610646246120638e-06, 'epoch': 1.09} {'loss': 0.4487, 'learning_rate': 8.610322070168268e-06, 'epoch': 1.09} {'loss': 0.5719, 'learning_rate': 8.609997895705067e-06, 'epoch': 1.09} {'loss': 0.6741, 'learning_rate': 8.609673722731375e-06, 'epoch': 1.09} {'loss': 0.6254, 'learning_rate': 8.60934955124755e-06, 'epoch': 1.09} {'loss': 0.4905, 'learning_rate': 8.609025381253927e-06, 'epoch': 1.09} {'loss': 0.5438, 'learning_rate': 8.608701212750862e-06, 'epoch': 1.09} {'loss': 0.4276, 'learning_rate': 8.608377045738698e-06, 'epoch': 1.09} {'loss': 0.4409, 'learning_rate': 8.60805288021778e-06, 'epoch': 1.09} {'loss': 0.4608, 'learning_rate': 8.607728716188465e-06, 'epoch': 1.09} {'loss': 0.5685, 'learning_rate': 8.607404553651088e-06, 'epoch': 1.09} {'loss': 0.4926, 'learning_rate': 8.607080392606008e-06, 'epoch': 1.09} {'loss': 0.5673, 'learning_rate': 8.606756233053567e-06, 'epoch': 1.09} {'loss': 0.6067, 'learning_rate': 8.60643207499411e-06, 'epoch': 1.09} {'loss': 0.539, 'learning_rate': 8.606107918427989e-06, 'epoch': 1.09} {'loss': 0.6326, 'learning_rate': 8.605783763355545e-06, 'epoch': 1.09} {'loss': 0.3511, 'learning_rate': 8.605459609777134e-06, 'epoch': 1.09} {'loss': 0.4578, 'learning_rate': 8.605135457693098e-06, 'epoch': 1.09} {'loss': 0.464, 'learning_rate': 8.604811307103782e-06, 'epoch': 1.09} {'loss': 0.5164, 'learning_rate': 8.60448715800954e-06, 'epoch': 1.09} {'loss': 0.5921, 'learning_rate': 8.604163010410716e-06, 'epoch': 1.09} {'loss': 0.5945, 'learning_rate': 8.603838864307657e-06, 'epoch': 1.09} {'loss': 0.7293, 'learning_rate': 8.603514719700707e-06, 'epoch': 1.09} {'loss': 0.468, 'learning_rate': 8.603190576590222e-06, 'epoch': 1.09} {'loss': 0.5103, 'learning_rate': 8.602866434976544e-06, 'epoch': 1.09} {'loss': 0.4558, 'learning_rate': 8.602542294860015e-06, 'epoch': 1.09} {'loss': 0.591, 'learning_rate': 8.602218156240995e-06, 'epoch': 1.09} {'loss': 0.5041, 'learning_rate': 8.60189401911982e-06, 'epoch': 1.09} {'loss': 0.4576, 'learning_rate': 8.601569883496846e-06, 'epoch': 1.09} {'loss': 0.5496, 'learning_rate': 8.60124574937241e-06, 'epoch': 1.09} {'loss': 0.3043, 'learning_rate': 8.60092161674687e-06, 'epoch': 1.09} {'loss': 0.4561, 'learning_rate': 8.60059748562057e-06, 'epoch': 1.09} {'loss': 0.6023, 'learning_rate': 8.60027335599385e-06, 'epoch': 1.09} {'loss': 0.6123, 'learning_rate': 8.59994922786707e-06, 'epoch': 1.09} {'loss': 0.5759, 'learning_rate': 8.599625101240566e-06, 'epoch': 1.09} {'loss': 0.6232, 'learning_rate': 8.599300976114694e-06, 'epoch': 1.09} {'loss': 0.6497, 'learning_rate': 8.598976852489797e-06, 'epoch': 1.09} {'loss': 0.619, 'learning_rate': 8.598652730366219e-06, 'epoch': 1.09} {'loss': 0.7495, 'learning_rate': 8.598328609744313e-06, 'epoch': 1.09} {'loss': 0.5515, 'learning_rate': 8.598004490624421e-06, 'epoch': 1.09} {'loss': 0.5279, 'learning_rate': 8.5976803730069e-06, 'epoch': 1.09} {'loss': 0.5417, 'learning_rate': 8.597356256892087e-06, 'epoch': 1.09} {'loss': 0.751, 'learning_rate': 8.597032142280337e-06, 'epoch': 1.09} {'loss': 0.5757, 'learning_rate': 8.596708029171995e-06, 'epoch': 1.09} {'loss': 0.5495, 'learning_rate': 8.5963839175674e-06, 'epoch': 1.09} {'loss': 0.5248, 'learning_rate': 8.59605980746691e-06, 'epoch': 1.09} {'loss': 0.514, 'learning_rate': 8.595735698870866e-06, 'epoch': 1.09} {'loss': 0.4809, 'learning_rate': 8.59541159177962e-06, 'epoch': 1.09} {'loss': 0.5515, 'learning_rate': 8.595087486193518e-06, 'epoch': 1.09} {'loss': 0.5991, 'learning_rate': 8.594763382112908e-06, 'epoch': 1.09} {'loss': 0.6112, 'learning_rate': 8.594439279538135e-06, 'epoch': 1.09} {'loss': 0.6611, 'learning_rate': 8.594115178469544e-06, 'epoch': 1.09} {'loss': 0.5679, 'learning_rate': 8.59379107890749e-06, 'epoch': 1.09} {'loss': 0.5306, 'learning_rate': 8.59346698085231e-06, 'epoch': 1.09} {'loss': 0.6826, 'learning_rate': 8.593142884304361e-06, 'epoch': 1.09} {'loss': 0.617, 'learning_rate': 8.592818789263988e-06, 'epoch': 1.09} {'loss': 0.5538, 'learning_rate': 8.592494695731534e-06, 'epoch': 1.09} {'loss': 0.6826, 'learning_rate': 8.592170603707351e-06, 'epoch': 1.09} {'loss': 0.467, 'learning_rate': 8.591846513191781e-06, 'epoch': 1.09} {'loss': 0.507, 'learning_rate': 8.591522424185176e-06, 'epoch': 1.09} {'loss': 0.6927, 'learning_rate': 8.591198336687883e-06, 'epoch': 1.09} {'loss': 0.4836, 'learning_rate': 8.590874250700246e-06, 'epoch': 1.09} {'loss': 0.5826, 'learning_rate': 8.590550166222618e-06, 'epoch': 1.09} {'loss': 0.3636, 'learning_rate': 8.59022608325534e-06, 'epoch': 1.09} {'loss': 0.6287, 'learning_rate': 8.589902001798764e-06, 'epoch': 1.09} {'loss': 0.5598, 'learning_rate': 8.589577921853231e-06, 'epoch': 1.09} {'loss': 0.5409, 'learning_rate': 8.589253843419097e-06, 'epoch': 1.09} {'loss': 0.5346, 'learning_rate': 8.588929766496702e-06, 'epoch': 1.09} {'loss': 0.5798, 'learning_rate': 8.588605691086397e-06, 'epoch': 1.09} {'loss': 0.558, 'learning_rate': 8.58828161718853e-06, 'epoch': 1.09} {'loss': 0.494, 'learning_rate': 8.587957544803445e-06, 'epoch': 1.09} {'loss': 0.5934, 'learning_rate': 8.587633473931491e-06, 'epoch': 1.09} {'loss': 0.5412, 'learning_rate': 8.587309404573013e-06, 'epoch': 1.09} {'loss': 0.4837, 'learning_rate': 8.586985336728365e-06, 'epoch': 1.09} {'loss': 0.5102, 'learning_rate': 8.58666127039789e-06, 'epoch': 1.09} {'loss': 0.5366, 'learning_rate': 8.586337205581932e-06, 'epoch': 1.09} {'loss': 0.4643, 'learning_rate': 8.586013142280843e-06, 'epoch': 1.09} {'loss': 0.4714, 'learning_rate': 8.585689080494964e-06, 'epoch': 1.09} {'loss': 0.6289, 'learning_rate': 8.585365020224652e-06, 'epoch': 1.09} {'loss': 0.6942, 'learning_rate': 8.585040961470245e-06, 'epoch': 1.09} {'loss': 0.6172, 'learning_rate': 8.584716904232098e-06, 'epoch': 1.09} {'loss': 0.5772, 'learning_rate': 8.584392848510554e-06, 'epoch': 1.09} {'loss': 0.3809, 'learning_rate': 8.58406879430596e-06, 'epoch': 1.09} {'loss': 0.5947, 'learning_rate': 8.583744741618664e-06, 'epoch': 1.09} {'loss': 0.5912, 'learning_rate': 8.583420690449011e-06, 'epoch': 1.09} {'loss': 0.6077, 'learning_rate': 8.583096640797357e-06, 'epoch': 1.09} {'loss': 0.5218, 'learning_rate': 8.582772592664039e-06, 'epoch': 1.09} {'loss': 0.4984, 'learning_rate': 8.582448546049406e-06, 'epoch': 1.09} {'loss': 0.5044, 'learning_rate': 8.58212450095381e-06, 'epoch': 1.09} {'loss': 0.4519, 'learning_rate': 8.581800457377593e-06, 'epoch': 1.09} {'loss': 0.5942, 'learning_rate': 8.58147641532111e-06, 'epoch': 1.09} {'loss': 0.5566, 'learning_rate': 8.581152374784695e-06, 'epoch': 1.09} {'loss': 0.3776, 'learning_rate': 8.580828335768711e-06, 'epoch': 1.09} {'loss': 0.4099, 'learning_rate': 8.580504298273495e-06, 'epoch': 1.09} {'loss': 0.4544, 'learning_rate': 8.580180262299395e-06, 'epoch': 1.09} {'loss': 0.4969, 'learning_rate': 8.579856227846762e-06, 'epoch': 1.09} {'loss': 0.6091, 'learning_rate': 8.579532194915941e-06, 'epoch': 1.09} {'loss': 0.6161, 'learning_rate': 8.57920816350728e-06, 'epoch': 1.09} {'loss': 0.6165, 'learning_rate': 8.578884133621121e-06, 'epoch': 1.09} {'loss': 0.6256, 'learning_rate': 8.578560105257822e-06, 'epoch': 1.09} {'loss': 0.4971, 'learning_rate': 8.578236078417723e-06, 'epoch': 1.09} {'loss': 0.5915, 'learning_rate': 8.577912053101169e-06, 'epoch': 1.09} {'loss': 0.5913, 'learning_rate': 8.577588029308513e-06, 'epoch': 1.09} {'loss': 0.4473, 'learning_rate': 8.577264007040099e-06, 'epoch': 1.09} {'loss': 0.729, 'learning_rate': 8.576939986296278e-06, 'epoch': 1.09} {'loss': 0.4769, 'learning_rate': 8.576615967077394e-06, 'epoch': 1.09} {'loss': 0.4563, 'learning_rate': 8.576291949383789e-06, 'epoch': 1.09} {'loss': 0.5437, 'learning_rate': 8.575967933215819e-06, 'epoch': 1.09} {'loss': 0.5361, 'learning_rate': 8.575643918573825e-06, 'epoch': 1.09} {'loss': 0.5332, 'learning_rate': 8.575319905458162e-06, 'epoch': 1.09} {'loss': 0.646, 'learning_rate': 8.57499589386917e-06, 'epoch': 1.09} {'loss': 0.5679, 'learning_rate': 8.5746718838072e-06, 'epoch': 1.09} {'loss': 0.5291, 'learning_rate': 8.574347875272598e-06, 'epoch': 1.09} {'loss': 0.5027, 'learning_rate': 8.574023868265706e-06, 'epoch': 1.09} {'loss': 0.5495, 'learning_rate': 8.57369986278688e-06, 'epoch': 1.09} {'loss': 0.5915, 'learning_rate': 8.57337585883646e-06, 'epoch': 1.09} {'loss': 0.4505, 'learning_rate': 8.573051856414801e-06, 'epoch': 1.09} {'loss': 0.5125, 'learning_rate': 8.572727855522244e-06, 'epoch': 1.09} {'loss': 0.5633, 'learning_rate': 8.572403856159139e-06, 'epoch': 1.09} {'loss': 0.5188, 'learning_rate': 8.572079858325832e-06, 'epoch': 1.09} {'loss': 0.5203, 'learning_rate': 8.571755862022667e-06, 'epoch': 1.09} {'loss': 0.571, 'learning_rate': 8.571431867249998e-06, 'epoch': 1.09} {'loss': 0.6288, 'learning_rate': 8.571107874008166e-06, 'epoch': 1.09} {'loss': 0.5832, 'learning_rate': 8.570783882297524e-06, 'epoch': 1.09} {'loss': 0.6031, 'learning_rate': 8.570459892118415e-06, 'epoch': 1.09} {'loss': 0.6029, 'learning_rate': 8.570135903471186e-06, 'epoch': 1.09} {'loss': 0.5897, 'learning_rate': 8.56981191635619e-06, 'epoch': 1.09} {'loss': 0.6379, 'learning_rate': 8.569487930773761e-06, 'epoch': 1.09} {'loss': 0.7338, 'learning_rate': 8.569163946724261e-06, 'epoch': 1.09} {'loss': 0.5786, 'learning_rate': 8.568839964208028e-06, 'epoch': 1.09} {'loss': 0.6708, 'learning_rate': 8.568515983225415e-06, 'epoch': 1.09} {'loss': 0.4999, 'learning_rate': 8.568192003776766e-06, 'epoch': 1.09} {'loss': 0.5389, 'learning_rate': 8.567868025862427e-06, 'epoch': 1.09} {'loss': 0.5393, 'learning_rate': 8.56754404948275e-06, 'epoch': 1.09} {'loss': 0.6322, 'learning_rate': 8.567220074638071e-06, 'epoch': 1.09} {'loss': 0.4635, 'learning_rate': 8.566896101328752e-06, 'epoch': 1.09} {'loss': 0.4973, 'learning_rate': 8.566572129555131e-06, 'epoch': 1.09} {'loss': 0.5953, 'learning_rate': 8.566248159317557e-06, 'epoch': 1.09} {'loss': 0.5755, 'learning_rate': 8.565924190616379e-06, 'epoch': 1.09} {'loss': 0.6585, 'learning_rate': 8.565600223451941e-06, 'epoch': 1.09} {'loss': 0.4568, 'learning_rate': 8.565276257824595e-06, 'epoch': 1.09} {'loss': 0.4777, 'learning_rate': 8.564952293734679e-06, 'epoch': 1.09} {'loss': 0.6384, 'learning_rate': 8.564628331182551e-06, 'epoch': 1.09} {'loss': 0.5604, 'learning_rate': 8.564304370168554e-06, 'epoch': 1.09} {'loss': 0.6244, 'learning_rate': 8.563980410693032e-06, 'epoch': 1.09} {'loss': 0.6229, 'learning_rate': 8.563656452756334e-06, 'epoch': 1.09} {'loss': 0.6705, 'learning_rate': 8.563332496358809e-06, 'epoch': 1.09} {'loss': 0.5193, 'learning_rate': 8.563008541500804e-06, 'epoch': 1.09} {'loss': 0.5886, 'learning_rate': 8.562684588182662e-06, 'epoch': 1.09} {'loss': 0.5857, 'learning_rate': 8.562360636404736e-06, 'epoch': 1.09} {'loss': 0.49, 'learning_rate': 8.56203668616737e-06, 'epoch': 1.09} {'loss': 0.714, 'learning_rate': 8.56171273747091e-06, 'epoch': 1.09} {'loss': 0.5003, 'learning_rate': 8.561388790315707e-06, 'epoch': 1.09} {'loss': 0.5572, 'learning_rate': 8.5610648447021e-06, 'epoch': 1.09} {'loss': 0.7091, 'learning_rate': 8.560740900630448e-06, 'epoch': 1.09} {'loss': 0.5897, 'learning_rate': 8.560416958101088e-06, 'epoch': 1.09} {'loss': 0.5582, 'learning_rate': 8.560093017114374e-06, 'epoch': 1.09} {'loss': 0.5816, 'learning_rate': 8.559769077670652e-06, 'epoch': 1.09} {'loss': 0.6794, 'learning_rate': 8.559445139770263e-06, 'epoch': 1.09} {'loss': 0.5732, 'learning_rate': 8.559121203413563e-06, 'epoch': 1.09} {'loss': 0.5781, 'learning_rate': 8.558797268600889e-06, 'epoch': 1.09} {'loss': 0.5629, 'learning_rate': 8.5584733353326e-06, 'epoch': 1.09} {'loss': 0.6127, 'learning_rate': 8.558149403609034e-06, 'epoch': 1.09} {'loss': 0.5458, 'learning_rate': 8.557825473430538e-06, 'epoch': 1.09} {'loss': 0.4942, 'learning_rate': 8.557501544797467e-06, 'epoch': 1.09} {'loss': 0.5325, 'learning_rate': 8.55717761771016e-06, 'epoch': 1.1} {'loss': 0.5201, 'learning_rate': 8.55685369216897e-06, 'epoch': 1.1} {'loss': 0.5407, 'learning_rate': 8.556529768174237e-06, 'epoch': 1.1} {'loss': 0.5382, 'learning_rate': 8.55620584572632e-06, 'epoch': 1.1} {'loss': 0.4682, 'learning_rate': 8.555881924825554e-06, 'epoch': 1.1} {'loss': 0.5302, 'learning_rate': 8.555558005472289e-06, 'epoch': 1.1} {'loss': 0.6486, 'learning_rate': 8.555234087666879e-06, 'epoch': 1.1} {'loss': 0.6018, 'learning_rate': 8.554910171409662e-06, 'epoch': 1.1} {'loss': 0.5017, 'learning_rate': 8.554586256700991e-06, 'epoch': 1.1} {'loss': 0.6773, 'learning_rate': 8.554262343541215e-06, 'epoch': 1.1} {'loss': 0.5205, 'learning_rate': 8.553938431930669e-06, 'epoch': 1.1} {'loss': 0.6477, 'learning_rate': 8.553614521869715e-06, 'epoch': 1.1} {'loss': 0.6413, 'learning_rate': 8.55329061335869e-06, 'epoch': 1.1} {'loss': 0.522, 'learning_rate': 8.552966706397946e-06, 'epoch': 1.1} {'loss': 0.6272, 'learning_rate': 8.552642800987828e-06, 'epoch': 1.1} {'loss': 0.4961, 'learning_rate': 8.552318897128687e-06, 'epoch': 1.1} {'loss': 0.5079, 'learning_rate': 8.551994994820866e-06, 'epoch': 1.1} {'loss': 0.6051, 'learning_rate': 8.551671094064708e-06, 'epoch': 1.1} {'loss': 0.5031, 'learning_rate': 8.55134719486057e-06, 'epoch': 1.1} {'loss': 0.3793, 'learning_rate': 8.551023297208792e-06, 'epoch': 1.1} {'loss': 0.5366, 'learning_rate': 8.550699401109726e-06, 'epoch': 1.1} {'loss': 0.627, 'learning_rate': 8.550375506563714e-06, 'epoch': 1.1} {'loss': 0.447, 'learning_rate': 8.550051613571108e-06, 'epoch': 1.1} {'loss': 0.5648, 'learning_rate': 8.549727722132253e-06, 'epoch': 1.1} {'loss': 0.4589, 'learning_rate': 8.54940383224749e-06, 'epoch': 1.1} {'loss': 0.3598, 'learning_rate': 8.549079943917177e-06, 'epoch': 1.1} {'loss': 0.507, 'learning_rate': 8.548756057141652e-06, 'epoch': 1.1} {'loss': 0.586, 'learning_rate': 8.548432171921268e-06, 'epoch': 1.1} {'loss': 0.5534, 'learning_rate': 8.548108288256371e-06, 'epoch': 1.1} {'loss': 0.4914, 'learning_rate': 8.547784406147305e-06, 'epoch': 1.1} {'loss': 0.5723, 'learning_rate': 8.547460525594423e-06, 'epoch': 1.1} {'loss': 0.6015, 'learning_rate': 8.547136646598062e-06, 'epoch': 1.1} {'loss': 0.5129, 'learning_rate': 8.54681276915858e-06, 'epoch': 1.1} {'loss': 0.5327, 'learning_rate': 8.546488893276315e-06, 'epoch': 1.1} {'loss': 0.5564, 'learning_rate': 8.546165018951622e-06, 'epoch': 1.1} {'loss': 0.5187, 'learning_rate': 8.545841146184845e-06, 'epoch': 1.1} {'loss': 0.555, 'learning_rate': 8.545517274976329e-06, 'epoch': 1.1} {'loss': 0.4899, 'learning_rate': 8.545193405326422e-06, 'epoch': 1.1} {'loss': 0.6986, 'learning_rate': 8.54486953723547e-06, 'epoch': 1.1} {'loss': 0.6388, 'learning_rate': 8.544545670703826e-06, 'epoch': 1.1} {'loss': 0.5379, 'learning_rate': 8.544221805731827e-06, 'epoch': 1.1} {'loss': 0.5448, 'learning_rate': 8.54389794231983e-06, 'epoch': 1.1} {'loss': 0.5968, 'learning_rate': 8.543574080468179e-06, 'epoch': 1.1} {'loss': 0.5223, 'learning_rate': 8.543250220177216e-06, 'epoch': 1.1} {'loss': 0.5817, 'learning_rate': 8.542926361447295e-06, 'epoch': 1.1} {'loss': 0.5845, 'learning_rate': 8.542602504278757e-06, 'epoch': 1.1} {'loss': 0.5927, 'learning_rate': 8.542278648671954e-06, 'epoch': 1.1} {'loss': 0.5151, 'learning_rate': 8.541954794627232e-06, 'epoch': 1.1} {'loss': 0.6549, 'learning_rate': 8.541630942144932e-06, 'epoch': 1.1} {'loss': 0.5515, 'learning_rate': 8.541307091225411e-06, 'epoch': 1.1} {'loss': 0.506, 'learning_rate': 8.540983241869008e-06, 'epoch': 1.1} {'loss': 0.3928, 'learning_rate': 8.540659394076076e-06, 'epoch': 1.1} {'loss': 0.4754, 'learning_rate': 8.540335547846956e-06, 'epoch': 1.1} {'loss': 0.6182, 'learning_rate': 8.540011703182e-06, 'epoch': 1.1} {'loss': 0.5938, 'learning_rate': 8.539687860081556e-06, 'epoch': 1.1} {'loss': 0.7228, 'learning_rate': 8.539364018545964e-06, 'epoch': 1.1} {'loss': 0.6241, 'learning_rate': 8.539040178575577e-06, 'epoch': 1.1} {'loss': 0.3917, 'learning_rate': 8.53871634017074e-06, 'epoch': 1.1} {'loss': 0.5321, 'learning_rate': 8.538392503331801e-06, 'epoch': 1.1} {'loss': 0.5879, 'learning_rate': 8.538068668059103e-06, 'epoch': 1.1} {'loss': 0.7104, 'learning_rate': 8.537744834353001e-06, 'epoch': 1.1} {'loss': 0.5862, 'learning_rate': 8.537421002213837e-06, 'epoch': 1.1} {'loss': 0.5258, 'learning_rate': 8.537097171641955e-06, 'epoch': 1.1} {'loss': 0.4823, 'learning_rate': 8.53677334263771e-06, 'epoch': 1.1} {'loss': 0.4182, 'learning_rate': 8.53644951520144e-06, 'epoch': 1.1} {'loss': 0.5833, 'learning_rate': 8.5361256893335e-06, 'epoch': 1.1} {'loss': 0.7329, 'learning_rate': 8.535801865034232e-06, 'epoch': 1.1} {'loss': 0.5609, 'learning_rate': 8.535478042303981e-06, 'epoch': 1.1} {'loss': 0.5363, 'learning_rate': 8.535154221143103e-06, 'epoch': 1.1} {'loss': 0.5615, 'learning_rate': 8.534830401551936e-06, 'epoch': 1.1} {'loss': 0.4942, 'learning_rate': 8.534506583530832e-06, 'epoch': 1.1} {'loss': 0.5739, 'learning_rate': 8.534182767080133e-06, 'epoch': 1.1} {'loss': 0.4177, 'learning_rate': 8.533858952200195e-06, 'epoch': 1.1} {'loss': 0.4355, 'learning_rate': 8.533535138891358e-06, 'epoch': 1.1} {'loss': 0.66, 'learning_rate': 8.533211327153967e-06, 'epoch': 1.1} {'loss': 0.523, 'learning_rate': 8.532887516988376e-06, 'epoch': 1.1} {'loss': 0.4563, 'learning_rate': 8.532563708394927e-06, 'epoch': 1.1} {'loss': 0.6091, 'learning_rate': 8.53223990137397e-06, 'epoch': 1.1} {'loss': 0.4781, 'learning_rate': 8.531916095925845e-06, 'epoch': 1.1} {'loss': 0.5239, 'learning_rate': 8.53159229205091e-06, 'epoch': 1.1} {'loss': 0.5492, 'learning_rate': 8.531268489749507e-06, 'epoch': 1.1} {'loss': 0.4655, 'learning_rate': 8.530944689021977e-06, 'epoch': 1.1} {'loss': 0.529, 'learning_rate': 8.530620889868676e-06, 'epoch': 1.1} {'loss': 0.4951, 'learning_rate': 8.530297092289947e-06, 'epoch': 1.1} {'loss': 0.5634, 'learning_rate': 8.52997329628614e-06, 'epoch': 1.1} {'loss': 0.5543, 'learning_rate': 8.529649501857598e-06, 'epoch': 1.1} {'loss': 0.5864, 'learning_rate': 8.529325709004664e-06, 'epoch': 1.1} {'loss': 0.4264, 'learning_rate': 8.529001917727696e-06, 'epoch': 1.1} {'loss': 0.5641, 'learning_rate': 8.528678128027031e-06, 'epoch': 1.1} {'loss': 0.5204, 'learning_rate': 8.528354339903024e-06, 'epoch': 1.1} {'loss': 0.4619, 'learning_rate': 8.528030553356015e-06, 'epoch': 1.1} {'loss': 0.6685, 'learning_rate': 8.527706768386358e-06, 'epoch': 1.1} {'loss': 0.5917, 'learning_rate': 8.527382984994395e-06, 'epoch': 1.1} {'loss': 0.4717, 'learning_rate': 8.52705920318047e-06, 'epoch': 1.1} {'loss': 0.3742, 'learning_rate': 8.526735422944938e-06, 'epoch': 1.1} {'loss': 0.636, 'learning_rate': 8.526411644288139e-06, 'epoch': 1.1} {'loss': 0.5647, 'learning_rate': 8.526087867210426e-06, 'epoch': 1.1} {'loss': 0.6153, 'learning_rate': 8.52576409171214e-06, 'epoch': 1.1} {'loss': 0.693, 'learning_rate': 8.525440317793634e-06, 'epoch': 1.1} {'loss': 0.6651, 'learning_rate': 8.525116545455252e-06, 'epoch': 1.1} {'loss': 0.5324, 'learning_rate': 8.524792774697336e-06, 'epoch': 1.1} {'loss': 0.5676, 'learning_rate': 8.524469005520242e-06, 'epoch': 1.1} {'loss': 0.5273, 'learning_rate': 8.52414523792431e-06, 'epoch': 1.1} {'loss': 0.6085, 'learning_rate': 8.523821471909892e-06, 'epoch': 1.1} {'loss': 0.4468, 'learning_rate': 8.523497707477333e-06, 'epoch': 1.1} {'loss': 0.6874, 'learning_rate': 8.523173944626977e-06, 'epoch': 1.1} {'loss': 0.5465, 'learning_rate': 8.522850183359175e-06, 'epoch': 1.1} {'loss': 0.5793, 'learning_rate': 8.522526423674269e-06, 'epoch': 1.1} {'loss': 0.5779, 'learning_rate': 8.522202665572615e-06, 'epoch': 1.1} {'loss': 0.5475, 'learning_rate': 8.521878909054547e-06, 'epoch': 1.1} {'loss': 0.5873, 'learning_rate': 8.521555154120425e-06, 'epoch': 1.1} {'loss': 0.5642, 'learning_rate': 8.52123140077059e-06, 'epoch': 1.1} {'loss': 0.5256, 'learning_rate': 8.520907649005386e-06, 'epoch': 1.1} {'loss': 0.5999, 'learning_rate': 8.520583898825166e-06, 'epoch': 1.1} {'loss': 0.4719, 'learning_rate': 8.52026015023027e-06, 'epoch': 1.1} {'loss': 0.6561, 'learning_rate': 8.519936403221052e-06, 'epoch': 1.1} {'loss': 0.6115, 'learning_rate': 8.519612657797857e-06, 'epoch': 1.1} {'loss': 0.5668, 'learning_rate': 8.519288913961026e-06, 'epoch': 1.1} {'loss': 0.5505, 'learning_rate': 8.518965171710914e-06, 'epoch': 1.1} {'loss': 0.5141, 'learning_rate': 8.518641431047863e-06, 'epoch': 1.1} {'loss': 0.571, 'learning_rate': 8.518317691972224e-06, 'epoch': 1.1} {'loss': 0.5763, 'learning_rate': 8.517993954484335e-06, 'epoch': 1.1} {'loss': 0.6583, 'learning_rate': 8.517670218584554e-06, 'epoch': 1.1} {'loss': 0.6699, 'learning_rate': 8.517346484273225e-06, 'epoch': 1.1} {'loss': 0.7208, 'learning_rate': 8.517022751550687e-06, 'epoch': 1.1} {'loss': 0.4914, 'learning_rate': 8.516699020417299e-06, 'epoch': 1.1} {'loss': 0.551, 'learning_rate': 8.516375290873398e-06, 'epoch': 1.1} {'loss': 0.5656, 'learning_rate': 8.516051562919339e-06, 'epoch': 1.1} {'loss': 0.4595, 'learning_rate': 8.515727836555459e-06, 'epoch': 1.1} {'loss': 0.5772, 'learning_rate': 8.515404111782116e-06, 'epoch': 1.1} {'loss': 0.5196, 'learning_rate': 8.51508038859965e-06, 'epoch': 1.1} {'loss': 0.5851, 'learning_rate': 8.514756667008407e-06, 'epoch': 1.1} {'loss': 0.607, 'learning_rate': 8.514432947008738e-06, 'epoch': 1.1} {'loss': 0.5644, 'learning_rate': 8.514109228600985e-06, 'epoch': 1.1} {'loss': 0.6881, 'learning_rate': 8.513785511785505e-06, 'epoch': 1.1} {'loss': 0.6079, 'learning_rate': 8.513461796562634e-06, 'epoch': 1.1} {'loss': 0.561, 'learning_rate': 8.51313808293272e-06, 'epoch': 1.1} {'loss': 0.5426, 'learning_rate': 8.512814370896118e-06, 'epoch': 1.1} {'loss': 0.5238, 'learning_rate': 8.512490660453166e-06, 'epoch': 1.1} {'loss': 0.6035, 'learning_rate': 8.512166951604215e-06, 'epoch': 1.1} {'loss': 0.6588, 'learning_rate': 8.511843244349611e-06, 'epoch': 1.1} {'loss': 0.581, 'learning_rate': 8.511519538689703e-06, 'epoch': 1.1} {'loss': 0.7048, 'learning_rate': 8.511195834624838e-06, 'epoch': 1.1} {'loss': 0.6043, 'learning_rate': 8.510872132155356e-06, 'epoch': 1.1} {'loss': 0.6043, 'learning_rate': 8.510548431281613e-06, 'epoch': 1.1} {'loss': 0.6303, 'learning_rate': 8.51022473200395e-06, 'epoch': 1.1} {'loss': 0.62, 'learning_rate': 8.509901034322716e-06, 'epoch': 1.1} {'loss': 0.5243, 'learning_rate': 8.509577338238255e-06, 'epoch': 1.1} {'loss': 0.6113, 'learning_rate': 8.509253643750921e-06, 'epoch': 1.1} {'loss': 0.6335, 'learning_rate': 8.508929950861055e-06, 'epoch': 1.1} {'loss': 0.4016, 'learning_rate': 8.508606259569001e-06, 'epoch': 1.1} {'loss': 0.5014, 'learning_rate': 8.508282569875116e-06, 'epoch': 1.1} {'loss': 0.6268, 'learning_rate': 8.507958881779737e-06, 'epoch': 1.1} {'loss': 0.593, 'learning_rate': 8.507635195283218e-06, 'epoch': 1.1} {'loss': 0.4853, 'learning_rate': 8.5073115103859e-06, 'epoch': 1.1} {'loss': 0.5184, 'learning_rate': 8.506987827088131e-06, 'epoch': 1.1} {'loss': 0.5569, 'learning_rate': 8.506664145390264e-06, 'epoch': 1.1} {'loss': 0.6498, 'learning_rate': 8.506340465292635e-06, 'epoch': 1.1} {'loss': 0.4968, 'learning_rate': 8.506016786795601e-06, 'epoch': 1.1} {'loss': 0.6367, 'learning_rate': 8.505693109899502e-06, 'epoch': 1.1} {'loss': 0.4866, 'learning_rate': 8.505369434604694e-06, 'epoch': 1.1} {'loss': 0.517, 'learning_rate': 8.505045760911515e-06, 'epoch': 1.1} {'loss': 0.5962, 'learning_rate': 8.504722088820309e-06, 'epoch': 1.1} {'loss': 0.4952, 'learning_rate': 8.504398418331433e-06, 'epoch': 1.1} {'loss': 0.466, 'learning_rate': 8.504074749445225e-06, 'epoch': 1.1} {'loss': 0.4699, 'learning_rate': 8.503751082162042e-06, 'epoch': 1.1} {'loss': 0.6286, 'learning_rate': 8.50342741648222e-06, 'epoch': 1.1} {'loss': 0.5108, 'learning_rate': 8.503103752406114e-06, 'epoch': 1.1} {'loss': 0.4868, 'learning_rate': 8.502780089934067e-06, 'epoch': 1.1} {'loss': 0.5766, 'learning_rate': 8.502456429066423e-06, 'epoch': 1.1} {'loss': 0.5374, 'learning_rate': 8.502132769803534e-06, 'epoch': 1.1} {'loss': 0.5785, 'learning_rate': 8.501809112145744e-06, 'epoch': 1.1} {'loss': 0.5508, 'learning_rate': 8.501485456093404e-06, 'epoch': 1.1} {'loss': 0.5426, 'learning_rate': 8.501161801646856e-06, 'epoch': 1.1} {'loss': 0.5047, 'learning_rate': 8.500838148806447e-06, 'epoch': 1.1} {'loss': 0.5343, 'learning_rate': 8.500514497572528e-06, 'epoch': 1.1} {'loss': 0.7419, 'learning_rate': 8.500190847945437e-06, 'epoch': 1.1} {'loss': 0.6969, 'learning_rate': 8.499867199925533e-06, 'epoch': 1.1} {'loss': 0.6923, 'learning_rate': 8.499543553513152e-06, 'epoch': 1.1} {'loss': 0.5165, 'learning_rate': 8.49921990870865e-06, 'epoch': 1.1} {'loss': 0.576, 'learning_rate': 8.498896265512369e-06, 'epoch': 1.1} {'loss': 0.5852, 'learning_rate': 8.498572623924654e-06, 'epoch': 1.1} {'loss': 0.6938, 'learning_rate': 8.498248983945856e-06, 'epoch': 1.1} {'loss': 0.6115, 'learning_rate': 8.497925345576316e-06, 'epoch': 1.1} {'loss': 0.477, 'learning_rate': 8.497601708816387e-06, 'epoch': 1.1} {'loss': 0.6127, 'learning_rate': 8.497278073666412e-06, 'epoch': 1.1} {'loss': 0.5967, 'learning_rate': 8.496954440126742e-06, 'epoch': 1.1} {'loss': 0.5538, 'learning_rate': 8.496630808197721e-06, 'epoch': 1.1} {'loss': 0.5453, 'learning_rate': 8.496307177879693e-06, 'epoch': 1.1} {'loss': 0.6201, 'learning_rate': 8.49598354917301e-06, 'epoch': 1.1} {'loss': 0.5423, 'learning_rate': 8.495659922078012e-06, 'epoch': 1.1} {'loss': 0.6558, 'learning_rate': 8.495336296595056e-06, 'epoch': 1.1} {'loss': 0.5535, 'learning_rate': 8.495012672724482e-06, 'epoch': 1.1} {'loss': 0.6831, 'learning_rate': 8.494689050466633e-06, 'epoch': 1.1} {'loss': 0.5849, 'learning_rate': 8.494365429821865e-06, 'epoch': 1.1} {'loss': 0.5538, 'learning_rate': 8.494041810790519e-06, 'epoch': 1.1} {'loss': 0.5973, 'learning_rate': 8.493718193372943e-06, 'epoch': 1.1} {'loss': 0.6409, 'learning_rate': 8.493394577569482e-06, 'epoch': 1.1} {'loss': 0.4855, 'learning_rate': 8.493070963380488e-06, 'epoch': 1.1} {'loss': 0.5992, 'learning_rate': 8.492747350806306e-06, 'epoch': 1.1} {'loss': 0.5773, 'learning_rate': 8.492423739847274e-06, 'epoch': 1.1} {'loss': 0.5078, 'learning_rate': 8.492100130503751e-06, 'epoch': 1.1} {'loss': 0.6903, 'learning_rate': 8.491776522776079e-06, 'epoch': 1.1} {'loss': 0.5267, 'learning_rate': 8.491452916664604e-06, 'epoch': 1.1} {'loss': 0.657, 'learning_rate': 8.491129312169676e-06, 'epoch': 1.1} {'loss': 0.5865, 'learning_rate': 8.490805709291633e-06, 'epoch': 1.1} {'loss': 0.608, 'learning_rate': 8.490482108030833e-06, 'epoch': 1.1} {'loss': 0.6089, 'learning_rate': 8.490158508387612e-06, 'epoch': 1.1} {'loss': 0.4985, 'learning_rate': 8.489834910362329e-06, 'epoch': 1.1} {'loss': 0.5361, 'learning_rate': 8.48951131395532e-06, 'epoch': 1.1} {'loss': 0.7161, 'learning_rate': 8.48918771916694e-06, 'epoch': 1.1} {'loss': 0.6175, 'learning_rate': 8.48886412599753e-06, 'epoch': 1.1} {'loss': 0.517, 'learning_rate': 8.488540534447435e-06, 'epoch': 1.1} {'loss': 0.5994, 'learning_rate': 8.488216944517009e-06, 'epoch': 1.1} {'loss': 0.4648, 'learning_rate': 8.487893356206594e-06, 'epoch': 1.1} {'loss': 0.487, 'learning_rate': 8.487569769516536e-06, 'epoch': 1.1} {'loss': 0.7101, 'learning_rate': 8.487246184447184e-06, 'epoch': 1.1} {'loss': 0.5461, 'learning_rate': 8.486922600998887e-06, 'epoch': 1.1} {'loss': 0.5085, 'learning_rate': 8.48659901917199e-06, 'epoch': 1.1} {'loss': 0.5742, 'learning_rate': 8.486275438966833e-06, 'epoch': 1.1} {'loss': 0.6648, 'learning_rate': 8.485951860383773e-06, 'epoch': 1.1} {'loss': 0.5801, 'learning_rate': 8.485628283423149e-06, 'epoch': 1.1} {'loss': 0.5875, 'learning_rate': 8.485304708085314e-06, 'epoch': 1.1} {'loss': 0.608, 'learning_rate': 8.48498113437061e-06, 'epoch': 1.1} {'loss': 0.4663, 'learning_rate': 8.484657562279386e-06, 'epoch': 1.1} {'loss': 0.5531, 'learning_rate': 8.484333991811989e-06, 'epoch': 1.1} {'loss': 0.6953, 'learning_rate': 8.484010422968761e-06, 'epoch': 1.1} {'loss': 0.4905, 'learning_rate': 8.483686855750058e-06, 'epoch': 1.1} {'loss': 0.4921, 'learning_rate': 8.48336329015622e-06, 'epoch': 1.1} {'loss': 0.6391, 'learning_rate': 8.483039726187593e-06, 'epoch': 1.1} {'loss': 0.5259, 'learning_rate': 8.48271616384453e-06, 'epoch': 1.1} {'loss': 0.5286, 'learning_rate': 8.482392603127367e-06, 'epoch': 1.1} {'loss': 0.5474, 'learning_rate': 8.482069044036464e-06, 'epoch': 1.1} {'loss': 0.5257, 'learning_rate': 8.481745486572154e-06, 'epoch': 1.1} {'loss': 0.6209, 'learning_rate': 8.481421930734797e-06, 'epoch': 1.1} {'loss': 0.5898, 'learning_rate': 8.48109837652473e-06, 'epoch': 1.1} {'loss': 0.5015, 'learning_rate': 8.480774823942306e-06, 'epoch': 1.1} {'loss': 0.742, 'learning_rate': 8.480451272987869e-06, 'epoch': 1.1} {'loss': 0.5495, 'learning_rate': 8.48012772366176e-06, 'epoch': 1.1} {'loss': 0.4274, 'learning_rate': 8.479804175964336e-06, 'epoch': 1.1} {'loss': 0.5811, 'learning_rate': 8.479480629895937e-06, 'epoch': 1.1} {'loss': 0.5975, 'learning_rate': 8.479157085456914e-06, 'epoch': 1.1} {'loss': 0.6124, 'learning_rate': 8.478833542647612e-06, 'epoch': 1.1} {'loss': 0.6466, 'learning_rate': 8.478510001468375e-06, 'epoch': 1.1} {'loss': 0.6474, 'learning_rate': 8.478186461919553e-06, 'epoch': 1.1} {'loss': 0.4886, 'learning_rate': 8.47786292400149e-06, 'epoch': 1.1} {'loss': 0.588, 'learning_rate': 8.477539387714535e-06, 'epoch': 1.1} {'loss': 0.4771, 'learning_rate': 8.477215853059033e-06, 'epoch': 1.1} {'loss': 0.5456, 'learning_rate': 8.476892320035332e-06, 'epoch': 1.1} {'loss': 0.3615, 'learning_rate': 8.476568788643782e-06, 'epoch': 1.1} {'loss': 0.4371, 'learning_rate': 8.476245258884722e-06, 'epoch': 1.1} {'loss': 0.6006, 'learning_rate': 8.475921730758506e-06, 'epoch': 1.1} {'loss': 0.6003, 'learning_rate': 8.475598204265472e-06, 'epoch': 1.1} {'loss': 0.3964, 'learning_rate': 8.475274679405976e-06, 'epoch': 1.1} {'loss': 0.5853, 'learning_rate': 8.474951156180358e-06, 'epoch': 1.1} {'loss': 0.603, 'learning_rate': 8.474627634588972e-06, 'epoch': 1.1} {'loss': 0.519, 'learning_rate': 8.474304114632159e-06, 'epoch': 1.1} {'loss': 0.6391, 'learning_rate': 8.473980596310266e-06, 'epoch': 1.1} {'loss': 0.5785, 'learning_rate': 8.473657079623642e-06, 'epoch': 1.1} {'loss': 0.7402, 'learning_rate': 8.473333564572627e-06, 'epoch': 1.1} {'loss': 0.5967, 'learning_rate': 8.473010051157577e-06, 'epoch': 1.1} {'loss': 0.5899, 'learning_rate': 8.472686539378835e-06, 'epoch': 1.1} {'loss': 0.5061, 'learning_rate': 8.472363029236744e-06, 'epoch': 1.1} {'loss': 0.4751, 'learning_rate': 8.47203952073166e-06, 'epoch': 1.1} {'loss': 0.5678, 'learning_rate': 8.471716013863918e-06, 'epoch': 1.1} {'loss': 0.4683, 'learning_rate': 8.471392508633872e-06, 'epoch': 1.1} {'loss': 0.537, 'learning_rate': 8.471069005041865e-06, 'epoch': 1.1} {'loss': 0.6223, 'learning_rate': 8.470745503088248e-06, 'epoch': 1.1} {'loss': 0.5909, 'learning_rate': 8.470422002773367e-06, 'epoch': 1.1} {'loss': 0.5854, 'learning_rate': 8.47009850409756e-06, 'epoch': 1.1} {'loss': 0.5899, 'learning_rate': 8.469775007061187e-06, 'epoch': 1.1} {'loss': 0.5624, 'learning_rate': 8.469451511664585e-06, 'epoch': 1.1} {'loss': 0.7001, 'learning_rate': 8.469128017908108e-06, 'epoch': 1.1} {'loss': 0.516, 'learning_rate': 8.468804525792092e-06, 'epoch': 1.1} {'loss': 0.4456, 'learning_rate': 8.468481035316895e-06, 'epoch': 1.1} {'loss': 0.518, 'learning_rate': 8.468157546482858e-06, 'epoch': 1.1} {'loss': 0.6039, 'learning_rate': 8.467834059290324e-06, 'epoch': 1.1} {'loss': 0.4821, 'learning_rate': 8.46751057373965e-06, 'epoch': 1.1} {'loss': 0.5997, 'learning_rate': 8.467187089831175e-06, 'epoch': 1.1} {'loss': 0.5657, 'learning_rate': 8.466863607565248e-06, 'epoch': 1.1} {'loss': 0.5032, 'learning_rate': 8.466540126942216e-06, 'epoch': 1.1} {'loss': 0.6772, 'learning_rate': 8.46621664796242e-06, 'epoch': 1.1} {'loss': 0.6716, 'learning_rate': 8.465893170626214e-06, 'epoch': 1.1} {'loss': 0.5783, 'learning_rate': 8.465569694933939e-06, 'epoch': 1.1} {'loss': 0.5823, 'learning_rate': 8.46524622088595e-06, 'epoch': 1.1} {'loss': 0.4837, 'learning_rate': 8.464922748482584e-06, 'epoch': 1.1} {'loss': 0.5777, 'learning_rate': 8.464599277724196e-06, 'epoch': 1.1} {'loss': 0.3739, 'learning_rate': 8.464275808611127e-06, 'epoch': 1.1} {'loss': 0.5073, 'learning_rate': 8.463952341143722e-06, 'epoch': 1.1} {'loss': 0.6394, 'learning_rate': 8.463628875322335e-06, 'epoch': 1.1} {'loss': 0.5302, 'learning_rate': 8.463305411147305e-06, 'epoch': 1.1} {'loss': 0.6231, 'learning_rate': 8.462981948618982e-06, 'epoch': 1.1} {'loss': 0.8053, 'learning_rate': 8.462658487737715e-06, 'epoch': 1.1} {'loss': 0.6774, 'learning_rate': 8.462335028503846e-06, 'epoch': 1.1} {'loss': 0.6269, 'learning_rate': 8.462011570917726e-06, 'epoch': 1.1} {'loss': 0.683, 'learning_rate': 8.461688114979694e-06, 'epoch': 1.1} {'loss': 0.5953, 'learning_rate': 8.461364660690108e-06, 'epoch': 1.1} {'loss': 0.4913, 'learning_rate': 8.461041208049306e-06, 'epoch': 1.1} {'loss': 0.6708, 'learning_rate': 8.46071775705764e-06, 'epoch': 1.1} {'loss': 0.5228, 'learning_rate': 8.460394307715452e-06, 'epoch': 1.1} {'loss': 0.4938, 'learning_rate': 8.460070860023089e-06, 'epoch': 1.1} {'loss': 0.5367, 'learning_rate': 8.459747413980902e-06, 'epoch': 1.1} {'loss': 0.5049, 'learning_rate': 8.459423969589228e-06, 'epoch': 1.1} {'loss': 0.6941, 'learning_rate': 8.459100526848428e-06, 'epoch': 1.1} {'loss': 0.5521, 'learning_rate': 8.458777085758838e-06, 'epoch': 1.1} {'loss': 0.5368, 'learning_rate': 8.45845364632081e-06, 'epoch': 1.1} {'loss': 0.5971, 'learning_rate': 8.458130208534685e-06, 'epoch': 1.1} {'loss': 0.4336, 'learning_rate': 8.45780677240081e-06, 'epoch': 1.1} {'loss': 0.4854, 'learning_rate': 8.45748333791954e-06, 'epoch': 1.1} {'loss': 0.5104, 'learning_rate': 8.45715990509121e-06, 'epoch': 1.1} {'loss': 0.5982, 'learning_rate': 8.456836473916178e-06, 'epoch': 1.1} {'loss': 0.5291, 'learning_rate': 8.456513044394784e-06, 'epoch': 1.1} {'loss': 0.4355, 'learning_rate': 8.456189616527373e-06, 'epoch': 1.1} {'loss': 0.5312, 'learning_rate': 8.455866190314297e-06, 'epoch': 1.1} {'loss': 0.6473, 'learning_rate': 8.455542765755895e-06, 'epoch': 1.1} {'loss': 0.523, 'learning_rate': 8.455219342852523e-06, 'epoch': 1.1} {'loss': 0.5076, 'learning_rate': 8.454895921604519e-06, 'epoch': 1.1} {'loss': 0.4343, 'learning_rate': 8.454572502012237e-06, 'epoch': 1.1} {'loss': 0.7604, 'learning_rate': 8.454249084076021e-06, 'epoch': 1.1} {'loss': 0.4942, 'learning_rate': 8.453925667796214e-06, 'epoch': 1.1} {'loss': 0.4729, 'learning_rate': 8.453602253173166e-06, 'epoch': 1.1} {'loss': 0.4888, 'learning_rate': 8.453278840207221e-06, 'epoch': 1.1} {'loss': 0.6098, 'learning_rate': 8.45295542889873e-06, 'epoch': 1.1} {'loss': 0.4958, 'learning_rate': 8.452632019248033e-06, 'epoch': 1.1} {'loss': 0.428, 'learning_rate': 8.452308611255484e-06, 'epoch': 1.1} {'loss': 0.6041, 'learning_rate': 8.451985204921426e-06, 'epoch': 1.1} {'loss': 0.7076, 'learning_rate': 8.451661800246204e-06, 'epoch': 1.1} {'loss': 0.614, 'learning_rate': 8.451338397230169e-06, 'epoch': 1.1} {'loss': 0.448, 'learning_rate': 8.45101499587366e-06, 'epoch': 1.1} {'loss': 0.5499, 'learning_rate': 8.450691596177032e-06, 'epoch': 1.1} {'loss': 0.651, 'learning_rate': 8.450368198140627e-06, 'epoch': 1.1} {'loss': 0.4231, 'learning_rate': 8.45004480176479e-06, 'epoch': 1.1} {'loss': 0.551, 'learning_rate': 8.449721407049874e-06, 'epoch': 1.1} {'loss': 0.5095, 'learning_rate': 8.449398013996217e-06, 'epoch': 1.1} {'loss': 0.6031, 'learning_rate': 8.449074622604174e-06, 'epoch': 1.1} {'loss': 0.5402, 'learning_rate': 8.448751232874084e-06, 'epoch': 1.1} {'loss': 0.5362, 'learning_rate': 8.4484278448063e-06, 'epoch': 1.1} {'loss': 0.5529, 'learning_rate': 8.448104458401165e-06, 'epoch': 1.1} {'loss': 0.6631, 'learning_rate': 8.447781073659022e-06, 'epoch': 1.1} {'loss': 0.62, 'learning_rate': 8.447457690580228e-06, 'epoch': 1.1} {'loss': 0.5957, 'learning_rate': 8.447134309165119e-06, 'epoch': 1.1} {'loss': 0.6002, 'learning_rate': 8.44681092941405e-06, 'epoch': 1.1} {'loss': 0.6894, 'learning_rate': 8.446487551327358e-06, 'epoch': 1.1} {'loss': 0.5612, 'learning_rate': 8.446164174905397e-06, 'epoch': 1.1} {'loss': 0.5617, 'learning_rate': 8.445840800148514e-06, 'epoch': 1.1} {'loss': 0.5276, 'learning_rate': 8.445517427057046e-06, 'epoch': 1.1} {'loss': 0.4868, 'learning_rate': 8.445194055631354e-06, 'epoch': 1.1} {'loss': 0.4548, 'learning_rate': 8.444870685871772e-06, 'epoch': 1.1} {'loss': 0.5913, 'learning_rate': 8.444547317778656e-06, 'epoch': 1.1} {'loss': 0.5995, 'learning_rate': 8.444223951352347e-06, 'epoch': 1.1} {'loss': 0.6388, 'learning_rate': 8.443900586593185e-06, 'epoch': 1.1} {'loss': 0.6117, 'learning_rate': 8.443577223501532e-06, 'epoch': 1.1} {'loss': 0.5069, 'learning_rate': 8.443253862077722e-06, 'epoch': 1.1} {'loss': 0.5504, 'learning_rate': 8.442930502322109e-06, 'epoch': 1.1} {'loss': 0.5001, 'learning_rate': 8.442607144235034e-06, 'epoch': 1.1} {'loss': 0.5563, 'learning_rate': 8.442283787816849e-06, 'epoch': 1.1} {'loss': 0.6406, 'learning_rate': 8.441960433067897e-06, 'epoch': 1.1} {'loss': 0.5619, 'learning_rate': 8.441637079988521e-06, 'epoch': 1.1} {'loss': 0.6683, 'learning_rate': 8.441313728579076e-06, 'epoch': 1.1} {'loss': 0.5067, 'learning_rate': 8.4409903788399e-06, 'epoch': 1.1} {'loss': 0.4919, 'learning_rate': 8.440667030771348e-06, 'epoch': 1.1} {'loss': 0.5699, 'learning_rate': 8.44034368437376e-06, 'epoch': 1.1} {'loss': 0.565, 'learning_rate': 8.440020339647486e-06, 'epoch': 1.1} {'loss': 0.5657, 'learning_rate': 8.43969699659287e-06, 'epoch': 1.1} {'loss': 0.5148, 'learning_rate': 8.439373655210256e-06, 'epoch': 1.1} {'loss': 0.2828, 'learning_rate': 8.4390503155e-06, 'epoch': 1.1} {'loss': 0.6408, 'learning_rate': 8.438726977462435e-06, 'epoch': 1.1} {'loss': 0.6341, 'learning_rate': 8.438403641097922e-06, 'epoch': 1.1} {'loss': 0.4977, 'learning_rate': 8.4380803064068e-06, 'epoch': 1.1} {'loss': 0.5653, 'learning_rate': 8.437756973389413e-06, 'epoch': 1.1} {'loss': 0.4682, 'learning_rate': 8.437433642046112e-06, 'epoch': 1.1} {'loss': 0.5153, 'learning_rate': 8.437110312377238e-06, 'epoch': 1.1} {'loss': 0.4521, 'learning_rate': 8.436786984383147e-06, 'epoch': 1.1} {'loss': 0.6017, 'learning_rate': 8.436463658064176e-06, 'epoch': 1.1} {'loss': 0.5724, 'learning_rate': 8.436140333420676e-06, 'epoch': 1.1} {'loss': 0.6264, 'learning_rate': 8.435817010452994e-06, 'epoch': 1.1} {'loss': 0.4747, 'learning_rate': 8.435493689161474e-06, 'epoch': 1.1} {'loss': 0.4667, 'learning_rate': 8.435170369546466e-06, 'epoch': 1.1} {'loss': 0.4954, 'learning_rate': 8.434847051608311e-06, 'epoch': 1.1} {'loss': 0.5403, 'learning_rate': 8.43452373534736e-06, 'epoch': 1.1} {'loss': 0.5742, 'learning_rate': 8.43420042076396e-06, 'epoch': 1.1} {'loss': 0.5992, 'learning_rate': 8.433877107858454e-06, 'epoch': 1.1} {'loss': 0.5638, 'learning_rate': 8.433553796631188e-06, 'epoch': 1.1} {'loss': 0.6052, 'learning_rate': 8.433230487082513e-06, 'epoch': 1.1} {'loss': 0.4828, 'learning_rate': 8.432907179212774e-06, 'epoch': 1.1} {'loss': 0.5174, 'learning_rate': 8.432583873022311e-06, 'epoch': 1.1} {'loss': 0.5244, 'learning_rate': 8.432260568511482e-06, 'epoch': 1.1} {'loss': 0.5207, 'learning_rate': 8.431937265680626e-06, 'epoch': 1.1} {'loss': 0.4527, 'learning_rate': 8.43161396453009e-06, 'epoch': 1.1} {'loss': 0.4818, 'learning_rate': 8.431290665060222e-06, 'epoch': 1.1} {'loss': 0.7045, 'learning_rate': 8.430967367271362e-06, 'epoch': 1.1} {'loss': 0.5669, 'learning_rate': 8.43064407116387e-06, 'epoch': 1.1} {'loss': 0.5727, 'learning_rate': 8.430320776738077e-06, 'epoch': 1.1} {'loss': 0.5223, 'learning_rate': 8.429997483994344e-06, 'epoch': 1.1} {'loss': 0.4091, 'learning_rate': 8.429674192933008e-06, 'epoch': 1.1} {'loss': 0.5886, 'learning_rate': 8.429350903554417e-06, 'epoch': 1.1} {'loss': 0.7053, 'learning_rate': 8.429027615858919e-06, 'epoch': 1.1} {'loss': 0.5565, 'learning_rate': 8.428704329846856e-06, 'epoch': 1.1} {'loss': 0.4677, 'learning_rate': 8.428381045518583e-06, 'epoch': 1.1} {'loss': 0.5037, 'learning_rate': 8.428057762874443e-06, 'epoch': 1.1} {'loss': 0.6243, 'learning_rate': 8.427734481914773e-06, 'epoch': 1.1} {'loss': 0.6293, 'learning_rate': 8.427411202639934e-06, 'epoch': 1.1} {'loss': 0.5251, 'learning_rate': 8.427087925050264e-06, 'epoch': 1.1} {'loss': 0.6271, 'learning_rate': 8.426764649146114e-06, 'epoch': 1.1} {'loss': 0.4561, 'learning_rate': 8.426441374927821e-06, 'epoch': 1.1} {'loss': 0.6189, 'learning_rate': 8.426118102395744e-06, 'epoch': 1.1} {'loss': 0.5057, 'learning_rate': 8.425794831550222e-06, 'epoch': 1.1} {'loss': 0.4732, 'learning_rate': 8.425471562391601e-06, 'epoch': 1.1} {'loss': 0.4738, 'learning_rate': 8.425148294920231e-06, 'epoch': 1.1} {'loss': 0.4862, 'learning_rate': 8.424825029136456e-06, 'epoch': 1.1} {'loss': 0.6431, 'learning_rate': 8.424501765040625e-06, 'epoch': 1.1} {'loss': 0.4292, 'learning_rate': 8.42417850263308e-06, 'epoch': 1.1} {'loss': 0.5889, 'learning_rate': 8.423855241914173e-06, 'epoch': 1.1} {'loss': 0.4824, 'learning_rate': 8.423531982884247e-06, 'epoch': 1.1} {'loss': 0.6448, 'learning_rate': 8.423208725543645e-06, 'epoch': 1.1} {'loss': 0.6104, 'learning_rate': 8.42288546989272e-06, 'epoch': 1.1} {'loss': 0.4867, 'learning_rate': 8.422562215931814e-06, 'epoch': 1.1} {'loss': 0.5419, 'learning_rate': 8.422238963661277e-06, 'epoch': 1.1} {'loss': 0.6461, 'learning_rate': 8.421915713081455e-06, 'epoch': 1.1} {'loss': 0.4611, 'learning_rate': 8.421592464192687e-06, 'epoch': 1.1} {'loss': 0.5203, 'learning_rate': 8.42126921699533e-06, 'epoch': 1.1} {'loss': 0.5578, 'learning_rate': 8.420945971489722e-06, 'epoch': 1.1} {'loss': 0.5419, 'learning_rate': 8.420622727676215e-06, 'epoch': 1.1} {'loss': 0.4352, 'learning_rate': 8.420299485555154e-06, 'epoch': 1.1} {'loss': 0.5337, 'learning_rate': 8.419976245126885e-06, 'epoch': 1.1} {'loss': 0.5759, 'learning_rate': 8.419653006391754e-06, 'epoch': 1.1} {'loss': 0.4161, 'learning_rate': 8.419329769350102e-06, 'epoch': 1.1} {'loss': 0.44, 'learning_rate': 8.419006534002287e-06, 'epoch': 1.1} {'loss': 0.601, 'learning_rate': 8.418683300348645e-06, 'epoch': 1.1} {'loss': 0.6326, 'learning_rate': 8.418360068389531e-06, 'epoch': 1.1} {'loss': 0.5484, 'learning_rate': 8.418036838125283e-06, 'epoch': 1.1} {'loss': 0.4862, 'learning_rate': 8.417713609556255e-06, 'epoch': 1.1} {'loss': 0.6026, 'learning_rate': 8.41739038268279e-06, 'epoch': 1.1} {'loss': 0.5735, 'learning_rate': 8.417067157505227e-06, 'epoch': 1.1} {'loss': 0.4624, 'learning_rate': 8.416743934023927e-06, 'epoch': 1.1} {'loss': 0.4951, 'learning_rate': 8.416420712239223e-06, 'epoch': 1.1} {'loss': 0.4693, 'learning_rate': 8.416097492151471e-06, 'epoch': 1.1} {'loss': 0.6127, 'learning_rate': 8.415774273761015e-06, 'epoch': 1.1} {'loss': 0.5038, 'learning_rate': 8.415451057068196e-06, 'epoch': 1.1} {'loss': 0.5418, 'learning_rate': 8.415127842073367e-06, 'epoch': 1.1} {'loss': 0.4622, 'learning_rate': 8.414804628776869e-06, 'epoch': 1.1} {'loss': 0.5889, 'learning_rate': 8.414481417179053e-06, 'epoch': 1.1} {'loss': 0.5228, 'learning_rate': 8.414158207280258e-06, 'epoch': 1.1} {'loss': 0.5197, 'learning_rate': 8.413834999080844e-06, 'epoch': 1.1} {'loss': 0.5471, 'learning_rate': 8.413511792581145e-06, 'epoch': 1.1} {'loss': 0.5081, 'learning_rate': 8.413188587781512e-06, 'epoch': 1.1} {'loss': 0.5553, 'learning_rate': 8.412865384682291e-06, 'epoch': 1.1} {'loss': 0.6331, 'learning_rate': 8.412542183283823e-06, 'epoch': 1.1} {'loss': 0.5454, 'learning_rate': 8.412218983586466e-06, 'epoch': 1.1} {'loss': 0.4997, 'learning_rate': 8.411895785590556e-06, 'epoch': 1.1} {'loss': 0.5413, 'learning_rate': 8.411572589296442e-06, 'epoch': 1.1} {'loss': 0.5822, 'learning_rate': 8.411249394704474e-06, 'epoch': 1.1} {'loss': 0.5921, 'learning_rate': 8.410926201814995e-06, 'epoch': 1.1} {'loss': 0.5769, 'learning_rate': 8.410603010628353e-06, 'epoch': 1.1} {'loss': 0.5431, 'learning_rate': 8.41027982114489e-06, 'epoch': 1.1} {'loss': 0.6478, 'learning_rate': 8.40995663336496e-06, 'epoch': 1.1} {'loss': 0.5764, 'learning_rate': 8.409633447288904e-06, 'epoch': 1.1} {'loss': 0.5585, 'learning_rate': 8.409310262917067e-06, 'epoch': 1.1} {'loss': 0.5778, 'learning_rate': 8.408987080249799e-06, 'epoch': 1.1} {'loss': 0.6821, 'learning_rate': 8.408663899287443e-06, 'epoch': 1.1} {'loss': 0.5737, 'learning_rate': 8.408340720030352e-06, 'epoch': 1.1} {'loss': 0.6646, 'learning_rate': 8.408017542478861e-06, 'epoch': 1.1} {'loss': 0.4308, 'learning_rate': 8.407694366633328e-06, 'epoch': 1.1} {'loss': 0.5018, 'learning_rate': 8.407371192494095e-06, 'epoch': 1.1} {'loss': 0.567, 'learning_rate': 8.407048020061503e-06, 'epoch': 1.1} {'loss': 0.542, 'learning_rate': 8.406724849335907e-06, 'epoch': 1.1} {'loss': 0.5976, 'learning_rate': 8.406401680317645e-06, 'epoch': 1.1} {'loss': 0.5804, 'learning_rate': 8.40607851300707e-06, 'epoch': 1.1} {'loss': 0.6737, 'learning_rate': 8.405755347404528e-06, 'epoch': 1.1} {'loss': 0.3802, 'learning_rate': 8.405432183510356e-06, 'epoch': 1.1} {'loss': 0.4358, 'learning_rate': 8.405109021324913e-06, 'epoch': 1.1} {'loss': 0.6113, 'learning_rate': 8.404785860848538e-06, 'epoch': 1.1} {'loss': 0.5523, 'learning_rate': 8.404462702081581e-06, 'epoch': 1.1} {'loss': 0.6637, 'learning_rate': 8.404139545024381e-06, 'epoch': 1.1} {'loss': 0.4894, 'learning_rate': 8.403816389677295e-06, 'epoch': 1.1} {'loss': 0.524, 'learning_rate': 8.403493236040663e-06, 'epoch': 1.1} {'loss': 0.4344, 'learning_rate': 8.403170084114828e-06, 'epoch': 1.1} {'loss': 0.5467, 'learning_rate': 8.402846933900145e-06, 'epoch': 1.1} {'loss': 0.5426, 'learning_rate': 8.402523785396952e-06, 'epoch': 1.1} {'loss': 0.5884, 'learning_rate': 8.402200638605604e-06, 'epoch': 1.1} {'loss': 0.5965, 'learning_rate': 8.401877493526434e-06, 'epoch': 1.1} {'loss': 0.6139, 'learning_rate': 8.401554350159804e-06, 'epoch': 1.1} {'loss': 0.4545, 'learning_rate': 8.401231208506052e-06, 'epoch': 1.11} {'loss': 0.6099, 'learning_rate': 8.400908068565521e-06, 'epoch': 1.11} {'loss': 0.6102, 'learning_rate': 8.400584930338565e-06, 'epoch': 1.11} {'loss': 0.5263, 'learning_rate': 8.400261793825524e-06, 'epoch': 1.11} {'loss': 0.618, 'learning_rate': 8.399938659026749e-06, 'epoch': 1.11} {'loss': 0.4903, 'learning_rate': 8.399615525942585e-06, 'epoch': 1.11} {'loss': 0.5249, 'learning_rate': 8.399292394573374e-06, 'epoch': 1.11} {'loss': 0.5641, 'learning_rate': 8.398969264919469e-06, 'epoch': 1.11} {'loss': 0.638, 'learning_rate': 8.398646136981208e-06, 'epoch': 1.11} {'loss': 0.6513, 'learning_rate': 8.398323010758947e-06, 'epoch': 1.11} {'loss': 0.5643, 'learning_rate': 8.397999886253026e-06, 'epoch': 1.11} {'loss': 0.4152, 'learning_rate': 8.397676763463793e-06, 'epoch': 1.11} {'loss': 0.5379, 'learning_rate': 8.397353642391596e-06, 'epoch': 1.11} {'loss': 0.6589, 'learning_rate': 8.397030523036773e-06, 'epoch': 1.11} {'loss': 0.642, 'learning_rate': 8.396707405399682e-06, 'epoch': 1.11} {'loss': 0.4782, 'learning_rate': 8.39638428948066e-06, 'epoch': 1.11} {'loss': 0.5822, 'learning_rate': 8.39606117528006e-06, 'epoch': 1.11} {'loss': 0.6723, 'learning_rate': 8.395738062798224e-06, 'epoch': 1.11} {'loss': 0.5764, 'learning_rate': 8.395414952035501e-06, 'epoch': 1.11} {'loss': 0.5043, 'learning_rate': 8.395091842992235e-06, 'epoch': 1.11} {'loss': 0.6763, 'learning_rate': 8.394768735668771e-06, 'epoch': 1.11} {'loss': 0.4297, 'learning_rate': 8.39444563006546e-06, 'epoch': 1.11} {'loss': 0.6211, 'learning_rate': 8.39412252618264e-06, 'epoch': 1.11} {'loss': 0.6874, 'learning_rate': 8.393799424020668e-06, 'epoch': 1.11} {'loss': 0.5102, 'learning_rate': 8.393476323579885e-06, 'epoch': 1.11} {'loss': 0.5581, 'learning_rate': 8.393153224860636e-06, 'epoch': 1.11} {'loss': 0.4746, 'learning_rate': 8.39283012786327e-06, 'epoch': 1.11} {'loss': 0.3704, 'learning_rate': 8.392507032588126e-06, 'epoch': 1.11} {'loss': 0.5326, 'learning_rate': 8.392183939035561e-06, 'epoch': 1.11} {'loss': 0.6546, 'learning_rate': 8.391860847205912e-06, 'epoch': 1.11} {'loss': 0.5609, 'learning_rate': 8.391537757099533e-06, 'epoch': 1.11} {'loss': 0.4405, 'learning_rate': 8.391214668716766e-06, 'epoch': 1.11} {'loss': 0.5221, 'learning_rate': 8.390891582057956e-06, 'epoch': 1.11} {'loss': 0.5804, 'learning_rate': 8.390568497123454e-06, 'epoch': 1.11} {'loss': 0.6433, 'learning_rate': 8.390245413913596e-06, 'epoch': 1.11} {'loss': 0.6165, 'learning_rate': 8.389922332428742e-06, 'epoch': 1.11} {'loss': 0.5657, 'learning_rate': 8.389599252669228e-06, 'epoch': 1.11} {'loss': 0.5219, 'learning_rate': 8.389276174635407e-06, 'epoch': 1.11} {'loss': 0.5126, 'learning_rate': 8.388953098327622e-06, 'epoch': 1.11} {'loss': 0.5992, 'learning_rate': 8.388630023746216e-06, 'epoch': 1.11} {'loss': 0.7355, 'learning_rate': 8.388306950891542e-06, 'epoch': 1.11} {'loss': 0.4681, 'learning_rate': 8.387983879763937e-06, 'epoch': 1.11} {'loss': 0.6238, 'learning_rate': 8.387660810363758e-06, 'epoch': 1.11} {'loss': 0.6138, 'learning_rate': 8.387337742691346e-06, 'epoch': 1.11} {'loss': 0.6023, 'learning_rate': 8.387014676747042e-06, 'epoch': 1.11} {'loss': 0.625, 'learning_rate': 8.386691612531202e-06, 'epoch': 1.11} {'loss': 0.49, 'learning_rate': 8.386368550044165e-06, 'epoch': 1.11} {'loss': 0.6163, 'learning_rate': 8.386045489286284e-06, 'epoch': 1.11} {'loss': 0.4496, 'learning_rate': 8.385722430257894e-06, 'epoch': 1.11} {'loss': 0.6475, 'learning_rate': 8.385399372959354e-06, 'epoch': 1.11} {'loss': 0.5916, 'learning_rate': 8.385076317391004e-06, 'epoch': 1.11} {'loss': 0.6644, 'learning_rate': 8.384753263553188e-06, 'epoch': 1.11} {'loss': 0.5546, 'learning_rate': 8.384430211446255e-06, 'epoch': 1.11} {'loss': 0.4885, 'learning_rate': 8.384107161070551e-06, 'epoch': 1.11} {'loss': 0.4426, 'learning_rate': 8.383784112426423e-06, 'epoch': 1.11} {'loss': 0.4742, 'learning_rate': 8.383461065514213e-06, 'epoch': 1.11} {'loss': 0.5128, 'learning_rate': 8.383138020334274e-06, 'epoch': 1.11} {'loss': 0.462, 'learning_rate': 8.382814976886947e-06, 'epoch': 1.11} {'loss': 0.4976, 'learning_rate': 8.38249193517258e-06, 'epoch': 1.11} {'loss': 0.609, 'learning_rate': 8.382168895191522e-06, 'epoch': 1.11} {'loss': 0.509, 'learning_rate': 8.38184585694411e-06, 'epoch': 1.11} {'loss': 0.4787, 'learning_rate': 8.381522820430701e-06, 'epoch': 1.11} {'loss': 0.7101, 'learning_rate': 8.381199785651635e-06, 'epoch': 1.11} {'loss': 0.5744, 'learning_rate': 8.380876752607258e-06, 'epoch': 1.11} {'loss': 0.6012, 'learning_rate': 8.38055372129792e-06, 'epoch': 1.11} {'loss': 0.5014, 'learning_rate': 8.380230691723963e-06, 'epoch': 1.11} {'loss': 0.4896, 'learning_rate': 8.379907663885737e-06, 'epoch': 1.11} {'loss': 0.4801, 'learning_rate': 8.379584637783583e-06, 'epoch': 1.11} {'loss': 0.6383, 'learning_rate': 8.379261613417853e-06, 'epoch': 1.11} {'loss': 0.571, 'learning_rate': 8.378938590788892e-06, 'epoch': 1.11} {'loss': 0.6564, 'learning_rate': 8.378615569897039e-06, 'epoch': 1.11} {'loss': 0.5073, 'learning_rate': 8.37829255074265e-06, 'epoch': 1.11} {'loss': 0.5113, 'learning_rate': 8.377969533326064e-06, 'epoch': 1.11} {'loss': 0.524, 'learning_rate': 8.377646517647635e-06, 'epoch': 1.11} {'loss': 0.6215, 'learning_rate': 8.377323503707703e-06, 'epoch': 1.11} {'loss': 0.5958, 'learning_rate': 8.37700049150661e-06, 'epoch': 1.11} {'loss': 0.5201, 'learning_rate': 8.376677481044713e-06, 'epoch': 1.11} {'loss': 0.6479, 'learning_rate': 8.376354472322349e-06, 'epoch': 1.11} {'loss': 0.6368, 'learning_rate': 8.37603146533987e-06, 'epoch': 1.11} {'loss': 0.5976, 'learning_rate': 8.375708460097618e-06, 'epoch': 1.11} {'loss': 0.5012, 'learning_rate': 8.375385456595943e-06, 'epoch': 1.11} {'loss': 0.6559, 'learning_rate': 8.37506245483519e-06, 'epoch': 1.11} {'loss': 0.4834, 'learning_rate': 8.3747394548157e-06, 'epoch': 1.11} {'loss': 0.4433, 'learning_rate': 8.374416456537825e-06, 'epoch': 1.11} {'loss': 0.6901, 'learning_rate': 8.374093460001909e-06, 'epoch': 1.11} {'loss': 0.4707, 'learning_rate': 8.373770465208302e-06, 'epoch': 1.11} {'loss': 0.6593, 'learning_rate': 8.373447472157343e-06, 'epoch': 1.11} {'loss': 0.5285, 'learning_rate': 8.373124480849386e-06, 'epoch': 1.11} {'loss': 0.7082, 'learning_rate': 8.372801491284771e-06, 'epoch': 1.11} {'loss': 0.6186, 'learning_rate': 8.372478503463844e-06, 'epoch': 1.11} {'loss': 0.4147, 'learning_rate': 8.372155517386955e-06, 'epoch': 1.11} {'loss': 0.5269, 'learning_rate': 8.371832533054445e-06, 'epoch': 1.11} {'loss': 0.5215, 'learning_rate': 8.371509550466667e-06, 'epoch': 1.11} {'loss': 0.4994, 'learning_rate': 8.371186569623965e-06, 'epoch': 1.11} {'loss': 0.4837, 'learning_rate': 8.370863590526682e-06, 'epoch': 1.11} {'loss': 0.542, 'learning_rate': 8.370540613175167e-06, 'epoch': 1.11} {'loss': 0.7122, 'learning_rate': 8.37021763756976e-06, 'epoch': 1.11} {'loss': 0.6475, 'learning_rate': 8.369894663710816e-06, 'epoch': 1.11} {'loss': 0.5975, 'learning_rate': 8.369571691598672e-06, 'epoch': 1.11} {'loss': 0.5806, 'learning_rate': 8.369248721233685e-06, 'epoch': 1.11} {'loss': 0.4478, 'learning_rate': 8.368925752616194e-06, 'epoch': 1.11} {'loss': 0.5528, 'learning_rate': 8.368602785746544e-06, 'epoch': 1.11} {'loss': 0.5908, 'learning_rate': 8.368279820625088e-06, 'epoch': 1.11} {'loss': 0.727, 'learning_rate': 8.36795685725216e-06, 'epoch': 1.11} {'loss': 0.5559, 'learning_rate': 8.36763389562812e-06, 'epoch': 1.11} {'loss': 0.7272, 'learning_rate': 8.367310935753302e-06, 'epoch': 1.11} {'loss': 0.5988, 'learning_rate': 8.366987977628063e-06, 'epoch': 1.11} {'loss': 0.5614, 'learning_rate': 8.366665021252743e-06, 'epoch': 1.11} {'loss': 0.437, 'learning_rate': 8.366342066627688e-06, 'epoch': 1.11} {'loss': 0.5978, 'learning_rate': 8.366019113753245e-06, 'epoch': 1.11} {'loss': 0.7467, 'learning_rate': 8.365696162629758e-06, 'epoch': 1.11} {'loss': 0.5492, 'learning_rate': 8.365373213257577e-06, 'epoch': 1.11} {'loss': 0.6675, 'learning_rate': 8.365050265637048e-06, 'epoch': 1.11} {'loss': 0.6434, 'learning_rate': 8.364727319768509e-06, 'epoch': 1.11} {'loss': 0.5958, 'learning_rate': 8.364404375652317e-06, 'epoch': 1.11} {'loss': 0.6114, 'learning_rate': 8.364081433288813e-06, 'epoch': 1.11} {'loss': 0.6039, 'learning_rate': 8.363758492678345e-06, 'epoch': 1.11} {'loss': 0.5531, 'learning_rate': 8.363435553821252e-06, 'epoch': 1.11} {'loss': 0.7075, 'learning_rate': 8.36311261671789e-06, 'epoch': 1.11} {'loss': 0.5728, 'learning_rate': 8.362789681368602e-06, 'epoch': 1.11} {'loss': 0.5321, 'learning_rate': 8.362466747773727e-06, 'epoch': 1.11} {'loss': 0.5785, 'learning_rate': 8.362143815933621e-06, 'epoch': 1.11} {'loss': 0.4873, 'learning_rate': 8.361820885848623e-06, 'epoch': 1.11} {'loss': 0.6041, 'learning_rate': 8.361497957519086e-06, 'epoch': 1.11} {'loss': 0.5087, 'learning_rate': 8.361175030945345e-06, 'epoch': 1.11} {'loss': 0.5319, 'learning_rate': 8.360852106127758e-06, 'epoch': 1.11} {'loss': 0.4358, 'learning_rate': 8.360529183066668e-06, 'epoch': 1.11} {'loss': 0.5075, 'learning_rate': 8.360206261762415e-06, 'epoch': 1.11} {'loss': 0.6537, 'learning_rate': 8.359883342215349e-06, 'epoch': 1.11} {'loss': 0.4747, 'learning_rate': 8.359560424425817e-06, 'epoch': 1.11} {'loss': 0.6454, 'learning_rate': 8.359237508394165e-06, 'epoch': 1.11} {'loss': 0.5693, 'learning_rate': 8.358914594120738e-06, 'epoch': 1.11} {'loss': 0.5939, 'learning_rate': 8.358591681605878e-06, 'epoch': 1.11} {'loss': 0.5747, 'learning_rate': 8.35826877084994e-06, 'epoch': 1.11} {'loss': 0.6112, 'learning_rate': 8.357945861853262e-06, 'epoch': 1.11} {'loss': 0.648, 'learning_rate': 8.357622954616197e-06, 'epoch': 1.11} {'loss': 0.472, 'learning_rate': 8.357300049139082e-06, 'epoch': 1.11} {'loss': 0.5802, 'learning_rate': 8.356977145422274e-06, 'epoch': 1.11} {'loss': 0.5636, 'learning_rate': 8.35665424346611e-06, 'epoch': 1.11} {'loss': 0.5288, 'learning_rate': 8.356331343270939e-06, 'epoch': 1.11} {'loss': 0.5861, 'learning_rate': 8.356008444837109e-06, 'epoch': 1.11} {'loss': 0.7367, 'learning_rate': 8.355685548164962e-06, 'epoch': 1.11} {'loss': 0.5764, 'learning_rate': 8.355362653254849e-06, 'epoch': 1.11} {'loss': 0.509, 'learning_rate': 8.35503976010711e-06, 'epoch': 1.11} {'loss': 0.4735, 'learning_rate': 8.354716868722099e-06, 'epoch': 1.11} {'loss': 0.531, 'learning_rate': 8.354393979100154e-06, 'epoch': 1.11} {'loss': 0.6041, 'learning_rate': 8.354071091241624e-06, 'epoch': 1.11} {'loss': 0.5874, 'learning_rate': 8.353748205146857e-06, 'epoch': 1.11} {'loss': 0.6221, 'learning_rate': 8.353425320816197e-06, 'epoch': 1.11} {'loss': 0.6319, 'learning_rate': 8.353102438249992e-06, 'epoch': 1.11} {'loss': 0.5849, 'learning_rate': 8.352779557448586e-06, 'epoch': 1.11} {'loss': 0.545, 'learning_rate': 8.352456678412321e-06, 'epoch': 1.11} {'loss': 0.5453, 'learning_rate': 8.352133801141554e-06, 'epoch': 1.11} {'loss': 0.5367, 'learning_rate': 8.351810925636616e-06, 'epoch': 1.11} {'loss': 0.5298, 'learning_rate': 8.351488051897868e-06, 'epoch': 1.11} {'loss': 0.5921, 'learning_rate': 8.351165179925648e-06, 'epoch': 1.11} {'loss': 0.397, 'learning_rate': 8.350842309720304e-06, 'epoch': 1.11} {'loss': 0.5649, 'learning_rate': 8.350519441282181e-06, 'epoch': 1.11} {'loss': 0.6276, 'learning_rate': 8.350196574611623e-06, 'epoch': 1.11} {'loss': 0.6474, 'learning_rate': 8.34987370970898e-06, 'epoch': 1.11} {'loss': 0.5814, 'learning_rate': 8.349550846574593e-06, 'epoch': 1.11} {'loss': 0.5084, 'learning_rate': 8.349227985208817e-06, 'epoch': 1.11} {'loss': 0.5399, 'learning_rate': 8.34890512561199e-06, 'epoch': 1.11} {'loss': 0.4514, 'learning_rate': 8.34858226778446e-06, 'epoch': 1.11} {'loss': 0.3698, 'learning_rate': 8.348259411726573e-06, 'epoch': 1.11} {'loss': 0.425, 'learning_rate': 8.347936557438673e-06, 'epoch': 1.11} {'loss': 0.6355, 'learning_rate': 8.347613704921112e-06, 'epoch': 1.11} {'loss': 0.4696, 'learning_rate': 8.347290854174226e-06, 'epoch': 1.11} {'loss': 0.434, 'learning_rate': 8.346968005198372e-06, 'epoch': 1.11} {'loss': 0.5184, 'learning_rate': 8.346645157993892e-06, 'epoch': 1.11} {'loss': 0.6268, 'learning_rate': 8.346322312561128e-06, 'epoch': 1.11} {'loss': 0.4545, 'learning_rate': 8.345999468900431e-06, 'epoch': 1.11} {'loss': 0.5271, 'learning_rate': 8.345676627012143e-06, 'epoch': 1.11} {'loss': 0.563, 'learning_rate': 8.345353786896613e-06, 'epoch': 1.11} {'loss': 0.6127, 'learning_rate': 8.345030948554182e-06, 'epoch': 1.11} {'loss': 0.5304, 'learning_rate': 8.344708111985205e-06, 'epoch': 1.11} {'loss': 0.5445, 'learning_rate': 8.344385277190022e-06, 'epoch': 1.11} {'loss': 0.4473, 'learning_rate': 8.344062444168978e-06, 'epoch': 1.11} {'loss': 0.6389, 'learning_rate': 8.343739612922422e-06, 'epoch': 1.11} {'loss': 0.5556, 'learning_rate': 8.343416783450694e-06, 'epoch': 1.11} {'loss': 0.4648, 'learning_rate': 8.34309395575415e-06, 'epoch': 1.11} {'loss': 0.6536, 'learning_rate': 8.342771129833129e-06, 'epoch': 1.11} {'loss': 0.5816, 'learning_rate': 8.342448305687975e-06, 'epoch': 1.11} {'loss': 0.6331, 'learning_rate': 8.342125483319042e-06, 'epoch': 1.11} {'loss': 0.5755, 'learning_rate': 8.341802662726666e-06, 'epoch': 1.11} {'loss': 0.4643, 'learning_rate': 8.341479843911203e-06, 'epoch': 1.11} {'loss': 0.715, 'learning_rate': 8.34115702687299e-06, 'epoch': 1.11} {'loss': 0.6513, 'learning_rate': 8.34083421161238e-06, 'epoch': 1.11} {'loss': 0.49, 'learning_rate': 8.340511398129716e-06, 'epoch': 1.11} {'loss': 0.587, 'learning_rate': 8.34018858642534e-06, 'epoch': 1.11} {'loss': 0.4795, 'learning_rate': 8.339865776499606e-06, 'epoch': 1.11} {'loss': 0.5677, 'learning_rate': 8.339542968352853e-06, 'epoch': 1.11} {'loss': 0.5491, 'learning_rate': 8.339220161985433e-06, 'epoch': 1.11} {'loss': 0.5096, 'learning_rate': 8.338897357397682e-06, 'epoch': 1.11} {'loss': 0.5154, 'learning_rate': 8.33857455458996e-06, 'epoch': 1.11} {'loss': 0.6516, 'learning_rate': 8.338251753562603e-06, 'epoch': 1.11} {'loss': 0.6611, 'learning_rate': 8.337928954315955e-06, 'epoch': 1.11} {'loss': 0.6075, 'learning_rate': 8.33760615685037e-06, 'epoch': 1.11} {'loss': 0.547, 'learning_rate': 8.337283361166188e-06, 'epoch': 1.11} {'loss': 0.4415, 'learning_rate': 8.33696056726376e-06, 'epoch': 1.11} {'loss': 0.6547, 'learning_rate': 8.336637775143428e-06, 'epoch': 1.11} {'loss': 0.4815, 'learning_rate': 8.336314984805536e-06, 'epoch': 1.11} {'loss': 0.6597, 'learning_rate': 8.335992196250435e-06, 'epoch': 1.11} {'loss': 0.54, 'learning_rate': 8.335669409478467e-06, 'epoch': 1.11} {'loss': 0.4594, 'learning_rate': 8.335346624489983e-06, 'epoch': 1.11} {'loss': 0.5719, 'learning_rate': 8.33502384128532e-06, 'epoch': 1.11} {'loss': 0.6304, 'learning_rate': 8.334701059864834e-06, 'epoch': 1.11} {'loss': 0.5044, 'learning_rate': 8.334378280228866e-06, 'epoch': 1.11} {'loss': 0.4102, 'learning_rate': 8.334055502377757e-06, 'epoch': 1.11} {'loss': 0.5675, 'learning_rate': 8.333732726311862e-06, 'epoch': 1.11} {'loss': 0.4557, 'learning_rate': 8.333409952031521e-06, 'epoch': 1.11} {'loss': 0.7314, 'learning_rate': 8.33308717953708e-06, 'epoch': 1.11} {'loss': 0.6782, 'learning_rate': 8.332764408828891e-06, 'epoch': 1.11} {'loss': 0.5285, 'learning_rate': 8.332441639907293e-06, 'epoch': 1.11} {'loss': 0.514, 'learning_rate': 8.332118872772637e-06, 'epoch': 1.11} {'loss': 0.4381, 'learning_rate': 8.331796107425261e-06, 'epoch': 1.11} {'loss': 0.4774, 'learning_rate': 8.33147334386552e-06, 'epoch': 1.11} {'loss': 0.6323, 'learning_rate': 8.331150582093754e-06, 'epoch': 1.11} {'loss': 0.632, 'learning_rate': 8.330827822110314e-06, 'epoch': 1.11} {'loss': 0.6264, 'learning_rate': 8.330505063915539e-06, 'epoch': 1.11} {'loss': 0.5289, 'learning_rate': 8.33018230750978e-06, 'epoch': 1.11} {'loss': 0.6357, 'learning_rate': 8.329859552893383e-06, 'epoch': 1.11} {'loss': 0.5199, 'learning_rate': 8.329536800066687e-06, 'epoch': 1.11} {'loss': 0.5783, 'learning_rate': 8.329214049030048e-06, 'epoch': 1.11} {'loss': 0.5934, 'learning_rate': 8.328891299783803e-06, 'epoch': 1.11} {'loss': 0.4883, 'learning_rate': 8.328568552328307e-06, 'epoch': 1.11} {'loss': 0.5449, 'learning_rate': 8.3282458066639e-06, 'epoch': 1.11} {'loss': 0.5208, 'learning_rate': 8.327923062790922e-06, 'epoch': 1.11} {'loss': 0.6585, 'learning_rate': 8.327600320709731e-06, 'epoch': 1.11} {'loss': 0.6415, 'learning_rate': 8.327277580420663e-06, 'epoch': 1.11} {'loss': 0.5064, 'learning_rate': 8.326954841924072e-06, 'epoch': 1.11} {'loss': 0.5475, 'learning_rate': 8.3266321052203e-06, 'epoch': 1.11} {'loss': 0.4992, 'learning_rate': 8.326309370309692e-06, 'epoch': 1.11} {'loss': 0.4877, 'learning_rate': 8.325986637192596e-06, 'epoch': 1.11} {'loss': 0.5933, 'learning_rate': 8.325663905869351e-06, 'epoch': 1.11} {'loss': 0.4506, 'learning_rate': 8.325341176340313e-06, 'epoch': 1.11} {'loss': 0.4824, 'learning_rate': 8.32501844860582e-06, 'epoch': 1.11} {'loss': 0.5276, 'learning_rate': 8.324695722666223e-06, 'epoch': 1.11} {'loss': 0.5021, 'learning_rate': 8.324372998521869e-06, 'epoch': 1.11} {'loss': 0.5253, 'learning_rate': 8.324050276173094e-06, 'epoch': 1.11} {'loss': 0.6413, 'learning_rate': 8.323727555620256e-06, 'epoch': 1.11} {'loss': 0.5228, 'learning_rate': 8.32340483686369e-06, 'epoch': 1.11} {'loss': 0.5137, 'learning_rate': 8.32308211990375e-06, 'epoch': 1.11} {'loss': 0.6385, 'learning_rate': 8.322759404740776e-06, 'epoch': 1.11} {'loss': 0.5703, 'learning_rate': 8.32243669137512e-06, 'epoch': 1.11} {'loss': 0.6225, 'learning_rate': 8.322113979807125e-06, 'epoch': 1.11} {'loss': 0.5666, 'learning_rate': 8.321791270037137e-06, 'epoch': 1.11} {'loss': 0.629, 'learning_rate': 8.3214685620655e-06, 'epoch': 1.11} {'loss': 0.5283, 'learning_rate': 8.321145855892557e-06, 'epoch': 1.11} {'loss': 0.543, 'learning_rate': 8.320823151518663e-06, 'epoch': 1.11} {'loss': 0.5751, 'learning_rate': 8.320500448944156e-06, 'epoch': 1.11} {'loss': 0.6422, 'learning_rate': 8.320177748169382e-06, 'epoch': 1.11} {'loss': 0.7792, 'learning_rate': 8.319855049194694e-06, 'epoch': 1.11} {'loss': 0.6672, 'learning_rate': 8.31953235202043e-06, 'epoch': 1.11} {'loss': 0.5022, 'learning_rate': 8.31920965664694e-06, 'epoch': 1.11} {'loss': 0.5302, 'learning_rate': 8.318886963074566e-06, 'epoch': 1.11} {'loss': 0.5867, 'learning_rate': 8.31856427130366e-06, 'epoch': 1.11} {'loss': 0.4713, 'learning_rate': 8.318241581334565e-06, 'epoch': 1.11} {'loss': 0.6674, 'learning_rate': 8.31791889316762e-06, 'epoch': 1.11} {'loss': 0.5977, 'learning_rate': 8.317596206803183e-06, 'epoch': 1.11} {'loss': 0.5329, 'learning_rate': 8.31727352224159e-06, 'epoch': 1.11} {'loss': 0.5038, 'learning_rate': 8.316950839483192e-06, 'epoch': 1.11} {'loss': 0.5854, 'learning_rate': 8.31662815852833e-06, 'epoch': 1.11} {'loss': 0.6333, 'learning_rate': 8.316305479377355e-06, 'epoch': 1.11} {'loss': 0.5585, 'learning_rate': 8.315982802030614e-06, 'epoch': 1.11} {'loss': 0.4207, 'learning_rate': 8.315660126488441e-06, 'epoch': 1.11} {'loss': 0.3858, 'learning_rate': 8.315337452751197e-06, 'epoch': 1.11} {'loss': 0.6182, 'learning_rate': 8.315014780819219e-06, 'epoch': 1.11} {'loss': 0.4717, 'learning_rate': 8.314692110692857e-06, 'epoch': 1.11} {'loss': 0.6495, 'learning_rate': 8.314369442372453e-06, 'epoch': 1.11} {'loss': 0.5633, 'learning_rate': 8.314046775858352e-06, 'epoch': 1.11} {'loss': 0.6138, 'learning_rate': 8.313724111150904e-06, 'epoch': 1.11} {'loss': 0.5756, 'learning_rate': 8.31340144825045e-06, 'epoch': 1.11} {'loss': 0.6511, 'learning_rate': 8.313078787157343e-06, 'epoch': 1.11} {'loss': 0.6989, 'learning_rate': 8.312756127871923e-06, 'epoch': 1.11} {'loss': 0.5794, 'learning_rate': 8.312433470394537e-06, 'epoch': 1.11} {'loss': 0.6143, 'learning_rate': 8.312110814725532e-06, 'epoch': 1.11} {'loss': 0.522, 'learning_rate': 8.31178816086525e-06, 'epoch': 1.11} {'loss': 0.5383, 'learning_rate': 8.31146550881404e-06, 'epoch': 1.11} {'loss': 0.5897, 'learning_rate': 8.311142858572245e-06, 'epoch': 1.11} {'loss': 0.4622, 'learning_rate': 8.310820210140217e-06, 'epoch': 1.11} {'loss': 0.6425, 'learning_rate': 8.310497563518295e-06, 'epoch': 1.11} {'loss': 0.7636, 'learning_rate': 8.31017491870683e-06, 'epoch': 1.11} {'loss': 0.538, 'learning_rate': 8.309852275706165e-06, 'epoch': 1.11} {'loss': 0.5537, 'learning_rate': 8.309529634516641e-06, 'epoch': 1.11} {'loss': 0.6014, 'learning_rate': 8.309206995138614e-06, 'epoch': 1.11} {'loss': 0.3962, 'learning_rate': 8.308884357572422e-06, 'epoch': 1.11} {'loss': 0.5998, 'learning_rate': 8.308561721818412e-06, 'epoch': 1.11} {'loss': 0.5805, 'learning_rate': 8.308239087876934e-06, 'epoch': 1.11} {'loss': 0.5007, 'learning_rate': 8.307916455748328e-06, 'epoch': 1.11} {'loss': 0.5798, 'learning_rate': 8.307593825432944e-06, 'epoch': 1.11} {'loss': 0.6366, 'learning_rate': 8.307271196931121e-06, 'epoch': 1.11} {'loss': 0.6475, 'learning_rate': 8.306948570243217e-06, 'epoch': 1.11} {'loss': 0.5532, 'learning_rate': 8.306625945369564e-06, 'epoch': 1.11} {'loss': 0.645, 'learning_rate': 8.30630332231052e-06, 'epoch': 1.11} {'loss': 0.579, 'learning_rate': 8.305980701066421e-06, 'epoch': 1.11} {'loss': 0.6095, 'learning_rate': 8.305658081637616e-06, 'epoch': 1.11} {'loss': 0.6336, 'learning_rate': 8.305335464024455e-06, 'epoch': 1.11} {'loss': 0.5529, 'learning_rate': 8.305012848227274e-06, 'epoch': 1.11} {'loss': 0.5558, 'learning_rate': 8.30469023424643e-06, 'epoch': 1.11} {'loss': 0.5229, 'learning_rate': 8.304367622082261e-06, 'epoch': 1.11} {'loss': 0.6001, 'learning_rate': 8.304045011735118e-06, 'epoch': 1.11} {'loss': 0.5315, 'learning_rate': 8.303722403205344e-06, 'epoch': 1.11} {'loss': 0.6202, 'learning_rate': 8.303399796493278e-06, 'epoch': 1.11} {'loss': 0.6301, 'learning_rate': 8.303077191599278e-06, 'epoch': 1.11} {'loss': 0.671, 'learning_rate': 8.302754588523681e-06, 'epoch': 1.11} {'loss': 0.5545, 'learning_rate': 8.302431987266836e-06, 'epoch': 1.11} {'loss': 0.4933, 'learning_rate': 8.302109387829093e-06, 'epoch': 1.11} {'loss': 0.5891, 'learning_rate': 8.301786790210788e-06, 'epoch': 1.11} {'loss': 0.55, 'learning_rate': 8.301464194412276e-06, 'epoch': 1.11} {'loss': 0.6778, 'learning_rate': 8.301141600433892e-06, 'epoch': 1.11} {'loss': 0.6575, 'learning_rate': 8.300819008275994e-06, 'epoch': 1.11} {'loss': 0.514, 'learning_rate': 8.300496417938916e-06, 'epoch': 1.11} {'loss': 0.4985, 'learning_rate': 8.300173829423015e-06, 'epoch': 1.11} {'loss': 0.4287, 'learning_rate': 8.29985124272863e-06, 'epoch': 1.11} {'loss': 0.6001, 'learning_rate': 8.299528657856106e-06, 'epoch': 1.11} {'loss': 0.7022, 'learning_rate': 8.299206074805794e-06, 'epoch': 1.11} {'loss': 0.6042, 'learning_rate': 8.298883493578031e-06, 'epoch': 1.11} {'loss': 0.4396, 'learning_rate': 8.29856091417317e-06, 'epoch': 1.11} {'loss': 0.6061, 'learning_rate': 8.298238336591554e-06, 'epoch': 1.11} {'loss': 0.5893, 'learning_rate': 8.297915760833533e-06, 'epoch': 1.11} {'loss': 0.6829, 'learning_rate': 8.297593186899447e-06, 'epoch': 1.11} {'loss': 0.6333, 'learning_rate': 8.297270614789643e-06, 'epoch': 1.11} {'loss': 0.5218, 'learning_rate': 8.296948044504468e-06, 'epoch': 1.11} {'loss': 0.6963, 'learning_rate': 8.296625476044263e-06, 'epoch': 1.11} {'loss': 0.6121, 'learning_rate': 8.296302909409381e-06, 'epoch': 1.11} {'loss': 0.4392, 'learning_rate': 8.295980344600166e-06, 'epoch': 1.11} {'loss': 0.6074, 'learning_rate': 8.295657781616957e-06, 'epoch': 1.11} {'loss': 0.4905, 'learning_rate': 8.295335220460109e-06, 'epoch': 1.11} {'loss': 0.5857, 'learning_rate': 8.29501266112996e-06, 'epoch': 1.11} {'loss': 0.7001, 'learning_rate': 8.294690103626861e-06, 'epoch': 1.11} {'loss': 0.626, 'learning_rate': 8.294367547951153e-06, 'epoch': 1.11} {'loss': 0.5334, 'learning_rate': 8.294044994103186e-06, 'epoch': 1.11} {'loss': 0.5499, 'learning_rate': 8.293722442083305e-06, 'epoch': 1.11} {'loss': 0.637, 'learning_rate': 8.29339989189185e-06, 'epoch': 1.11} {'loss': 0.642, 'learning_rate': 8.293077343529174e-06, 'epoch': 1.11} {'loss': 0.5801, 'learning_rate': 8.29275479699562e-06, 'epoch': 1.11} {'loss': 0.4042, 'learning_rate': 8.292432252291534e-06, 'epoch': 1.11} {'loss': 0.5259, 'learning_rate': 8.292109709417262e-06, 'epoch': 1.11} {'loss': 0.6559, 'learning_rate': 8.291787168373143e-06, 'epoch': 1.11} {'loss': 0.5765, 'learning_rate': 8.291464629159534e-06, 'epoch': 1.11} {'loss': 0.5104, 'learning_rate': 8.29114209177677e-06, 'epoch': 1.11} {'loss': 0.5321, 'learning_rate': 8.290819556225205e-06, 'epoch': 1.11} {'loss': 0.4212, 'learning_rate': 8.290497022505179e-06, 'epoch': 1.11} {'loss': 0.5155, 'learning_rate': 8.290174490617043e-06, 'epoch': 1.11} {'loss': 0.5388, 'learning_rate': 8.289851960561137e-06, 'epoch': 1.11} {'loss': 0.4841, 'learning_rate': 8.289529432337807e-06, 'epoch': 1.11} {'loss': 0.6557, 'learning_rate': 8.289206905947404e-06, 'epoch': 1.11} {'loss': 0.6096, 'learning_rate': 8.288884381390267e-06, 'epoch': 1.11} {'loss': 0.5289, 'learning_rate': 8.288561858666747e-06, 'epoch': 1.11} {'loss': 0.5903, 'learning_rate': 8.288239337777186e-06, 'epoch': 1.11} {'loss': 0.4627, 'learning_rate': 8.287916818721934e-06, 'epoch': 1.11} {'loss': 0.5917, 'learning_rate': 8.287594301501334e-06, 'epoch': 1.11} {'loss': 0.4246, 'learning_rate': 8.287271786115727e-06, 'epoch': 1.11} {'loss': 0.5413, 'learning_rate': 8.286949272565466e-06, 'epoch': 1.11} {'loss': 0.5832, 'learning_rate': 8.28662676085089e-06, 'epoch': 1.11} {'loss': 0.5006, 'learning_rate': 8.286304250972352e-06, 'epoch': 1.11} {'loss': 0.4853, 'learning_rate': 8.285981742930194e-06, 'epoch': 1.11} {'loss': 0.5899, 'learning_rate': 8.285659236724759e-06, 'epoch': 1.11} {'loss': 0.5755, 'learning_rate': 8.285336732356396e-06, 'epoch': 1.11} {'loss': 0.6079, 'learning_rate': 8.285014229825446e-06, 'epoch': 1.11} {'loss': 0.3987, 'learning_rate': 8.284691729132262e-06, 'epoch': 1.11} {'loss': 0.4848, 'learning_rate': 8.284369230277184e-06, 'epoch': 1.11} {'loss': 0.5442, 'learning_rate': 8.284046733260559e-06, 'epoch': 1.11} {'loss': 0.5386, 'learning_rate': 8.283724238082736e-06, 'epoch': 1.11} {'loss': 0.5498, 'learning_rate': 8.283401744744053e-06, 'epoch': 1.11} {'loss': 0.6215, 'learning_rate': 8.283079253244863e-06, 'epoch': 1.11} {'loss': 0.4998, 'learning_rate': 8.282756763585504e-06, 'epoch': 1.11} {'loss': 0.5821, 'learning_rate': 8.282434275766331e-06, 'epoch': 1.11} {'loss': 0.6739, 'learning_rate': 8.282111789787684e-06, 'epoch': 1.11} {'loss': 0.5547, 'learning_rate': 8.281789305649909e-06, 'epoch': 1.11} {'loss': 0.5605, 'learning_rate': 8.28146682335335e-06, 'epoch': 1.11} {'loss': 0.586, 'learning_rate': 8.281144342898356e-06, 'epoch': 1.11} {'loss': 0.5462, 'learning_rate': 8.280821864285271e-06, 'epoch': 1.11} {'loss': 0.4786, 'learning_rate': 8.280499387514438e-06, 'epoch': 1.11} {'loss': 0.5861, 'learning_rate': 8.280176912586208e-06, 'epoch': 1.11} {'loss': 0.5052, 'learning_rate': 8.279854439500925e-06, 'epoch': 1.11} {'loss': 0.691, 'learning_rate': 8.279531968258931e-06, 'epoch': 1.11} {'loss': 0.6112, 'learning_rate': 8.279209498860576e-06, 'epoch': 1.11} {'loss': 0.5533, 'learning_rate': 8.278887031306198e-06, 'epoch': 1.11} {'loss': 0.4839, 'learning_rate': 8.278564565596153e-06, 'epoch': 1.11} {'loss': 0.4585, 'learning_rate': 8.278242101730776e-06, 'epoch': 1.11} {'loss': 0.5516, 'learning_rate': 8.277919639710423e-06, 'epoch': 1.11} {'loss': 0.6923, 'learning_rate': 8.277597179535435e-06, 'epoch': 1.11} {'loss': 0.419, 'learning_rate': 8.277274721206154e-06, 'epoch': 1.11} {'loss': 0.5021, 'learning_rate': 8.276952264722932e-06, 'epoch': 1.11} {'loss': 0.4487, 'learning_rate': 8.276629810086106e-06, 'epoch': 1.11} {'loss': 0.5981, 'learning_rate': 8.276307357296032e-06, 'epoch': 1.11} {'loss': 0.5819, 'learning_rate': 8.275984906353044e-06, 'epoch': 1.11} {'loss': 0.4823, 'learning_rate': 8.2756624572575e-06, 'epoch': 1.11} {'loss': 0.6345, 'learning_rate': 8.275340010009739e-06, 'epoch': 1.11} {'loss': 0.697, 'learning_rate': 8.275017564610104e-06, 'epoch': 1.11} {'loss': 0.6906, 'learning_rate': 8.274695121058945e-06, 'epoch': 1.11} {'loss': 0.5214, 'learning_rate': 8.274372679356602e-06, 'epoch': 1.11} {'loss': 0.598, 'learning_rate': 8.274050239503429e-06, 'epoch': 1.11} {'loss': 0.588, 'learning_rate': 8.273727801499767e-06, 'epoch': 1.11} {'loss': 0.4401, 'learning_rate': 8.273405365345957e-06, 'epoch': 1.11} {'loss': 0.7393, 'learning_rate': 8.273082931042354e-06, 'epoch': 1.11} {'loss': 0.6455, 'learning_rate': 8.272760498589296e-06, 'epoch': 1.11} {'loss': 0.5613, 'learning_rate': 8.272438067987131e-06, 'epoch': 1.11} {'loss': 0.4702, 'learning_rate': 8.272115639236203e-06, 'epoch': 1.11} {'loss': 0.5255, 'learning_rate': 8.271793212336862e-06, 'epoch': 1.11} {'loss': 0.5106, 'learning_rate': 8.271470787289452e-06, 'epoch': 1.11} {'loss': 0.5992, 'learning_rate': 8.271148364094313e-06, 'epoch': 1.11} {'loss': 0.4419, 'learning_rate': 8.270825942751796e-06, 'epoch': 1.11} {'loss': 0.6545, 'learning_rate': 8.270503523262245e-06, 'epoch': 1.11} {'loss': 0.7425, 'learning_rate': 8.270181105626007e-06, 'epoch': 1.11} {'loss': 0.5314, 'learning_rate': 8.269858689843423e-06, 'epoch': 1.11} {'loss': 0.5416, 'learning_rate': 8.269536275914844e-06, 'epoch': 1.11} {'loss': 0.6346, 'learning_rate': 8.269213863840615e-06, 'epoch': 1.11} {'loss': 0.5778, 'learning_rate': 8.268891453621073e-06, 'epoch': 1.11} {'loss': 0.6126, 'learning_rate': 8.268569045256577e-06, 'epoch': 1.11} {'loss': 0.5812, 'learning_rate': 8.268246638747462e-06, 'epoch': 1.11} {'loss': 0.6071, 'learning_rate': 8.267924234094079e-06, 'epoch': 1.11} {'loss': 0.6045, 'learning_rate': 8.267601831296772e-06, 'epoch': 1.11} {'loss': 0.6498, 'learning_rate': 8.26727943035588e-06, 'epoch': 1.11} {'loss': 0.5169, 'learning_rate': 8.26695703127176e-06, 'epoch': 1.11} {'loss': 0.4848, 'learning_rate': 8.266634634044749e-06, 'epoch': 1.11} {'loss': 0.5491, 'learning_rate': 8.266312238675198e-06, 'epoch': 1.11} {'loss': 0.6375, 'learning_rate': 8.265989845163449e-06, 'epoch': 1.11} {'loss': 0.5305, 'learning_rate': 8.26566745350985e-06, 'epoch': 1.11} {'loss': 0.5885, 'learning_rate': 8.265345063714745e-06, 'epoch': 1.11} {'loss': 0.5631, 'learning_rate': 8.265022675778474e-06, 'epoch': 1.11} {'loss': 0.5417, 'learning_rate': 8.264700289701393e-06, 'epoch': 1.11} {'loss': 0.5794, 'learning_rate': 8.264377905483839e-06, 'epoch': 1.11} {'loss': 0.4739, 'learning_rate': 8.264055523126164e-06, 'epoch': 1.11} {'loss': 0.515, 'learning_rate': 8.263733142628709e-06, 'epoch': 1.11} {'loss': 0.6766, 'learning_rate': 8.26341076399182e-06, 'epoch': 1.11} {'loss': 0.5794, 'learning_rate': 8.263088387215844e-06, 'epoch': 1.11} {'loss': 0.4337, 'learning_rate': 8.262766012301123e-06, 'epoch': 1.11} {'loss': 0.4842, 'learning_rate': 8.262443639248008e-06, 'epoch': 1.11} {'loss': 0.4112, 'learning_rate': 8.262121268056838e-06, 'epoch': 1.11} {'loss': 0.5318, 'learning_rate': 8.261798898727965e-06, 'epoch': 1.11} {'loss': 0.5993, 'learning_rate': 8.261476531261732e-06, 'epoch': 1.11} {'loss': 0.5402, 'learning_rate': 8.261154165658481e-06, 'epoch': 1.11} {'loss': 0.6295, 'learning_rate': 8.260831801918563e-06, 'epoch': 1.11} {'loss': 0.6318, 'learning_rate': 8.260509440042316e-06, 'epoch': 1.11} {'loss': 0.6184, 'learning_rate': 8.260187080030096e-06, 'epoch': 1.11} {'loss': 0.6382, 'learning_rate': 8.259864721882239e-06, 'epoch': 1.11} {'loss': 0.4125, 'learning_rate': 8.259542365599096e-06, 'epoch': 1.11} {'loss': 0.538, 'learning_rate': 8.259220011181011e-06, 'epoch': 1.11} {'loss': 0.503, 'learning_rate': 8.258897658628327e-06, 'epoch': 1.11} {'loss': 0.5904, 'learning_rate': 8.258575307941392e-06, 'epoch': 1.11} {'loss': 0.5688, 'learning_rate': 8.258252959120547e-06, 'epoch': 1.11} {'loss': 0.5464, 'learning_rate': 8.257930612166147e-06, 'epoch': 1.11} {'loss': 0.6251, 'learning_rate': 8.25760826707853e-06, 'epoch': 1.11} {'loss': 0.5872, 'learning_rate': 8.25728592385804e-06, 'epoch': 1.11} {'loss': 0.5446, 'learning_rate': 8.256963582505028e-06, 'epoch': 1.11} {'loss': 0.633, 'learning_rate': 8.256641243019836e-06, 'epoch': 1.11} {'loss': 0.5727, 'learning_rate': 8.256318905402813e-06, 'epoch': 1.11} {'loss': 0.3858, 'learning_rate': 8.255996569654296e-06, 'epoch': 1.11} {'loss': 0.4574, 'learning_rate': 8.255674235774642e-06, 'epoch': 1.11} {'loss': 0.6041, 'learning_rate': 8.255351903764188e-06, 'epoch': 1.11} {'loss': 0.5131, 'learning_rate': 8.255029573623283e-06, 'epoch': 1.11} {'loss': 0.4768, 'learning_rate': 8.254707245352268e-06, 'epoch': 1.11} {'loss': 0.5664, 'learning_rate': 8.254384918951494e-06, 'epoch': 1.11} {'loss': 0.4869, 'learning_rate': 8.254062594421306e-06, 'epoch': 1.11} {'loss': 0.5935, 'learning_rate': 8.253740271762042e-06, 'epoch': 1.11} {'loss': 0.5762, 'learning_rate': 8.253417950974057e-06, 'epoch': 1.11} {'loss': 0.5039, 'learning_rate': 8.253095632057693e-06, 'epoch': 1.11} {'loss': 0.5567, 'learning_rate': 8.252773315013294e-06, 'epoch': 1.11} {'loss': 0.5061, 'learning_rate': 8.252450999841205e-06, 'epoch': 1.11} {'loss': 0.6114, 'learning_rate': 8.252128686541771e-06, 'epoch': 1.11} {'loss': 0.6288, 'learning_rate': 8.251806375115343e-06, 'epoch': 1.11} {'loss': 0.5392, 'learning_rate': 8.251484065562261e-06, 'epoch': 1.11} {'loss': 0.5587, 'learning_rate': 8.251161757882868e-06, 'epoch': 1.11} {'loss': 0.576, 'learning_rate': 8.250839452077517e-06, 'epoch': 1.11} {'loss': 0.3952, 'learning_rate': 8.250517148146549e-06, 'epoch': 1.11} {'loss': 0.6358, 'learning_rate': 8.25019484609031e-06, 'epoch': 1.11} {'loss': 0.4487, 'learning_rate': 8.249872545909142e-06, 'epoch': 1.11} {'loss': 0.6076, 'learning_rate': 8.249550247603395e-06, 'epoch': 1.11} {'loss': 0.6631, 'learning_rate': 8.249227951173415e-06, 'epoch': 1.11} {'loss': 0.4968, 'learning_rate': 8.248905656619541e-06, 'epoch': 1.11} {'loss': 0.5921, 'learning_rate': 8.248583363942127e-06, 'epoch': 1.11} {'loss': 0.5929, 'learning_rate': 8.248261073141512e-06, 'epoch': 1.11} {'loss': 0.5256, 'learning_rate': 8.247938784218046e-06, 'epoch': 1.11} {'loss': 0.5561, 'learning_rate': 8.247616497172066e-06, 'epoch': 1.11} {'loss': 0.6892, 'learning_rate': 8.247294212003927e-06, 'epoch': 1.11} {'loss': 0.573, 'learning_rate': 8.246971928713972e-06, 'epoch': 1.11} {'loss': 0.7802, 'learning_rate': 8.24664964730254e-06, 'epoch': 1.11} {'loss': 0.5418, 'learning_rate': 8.246327367769986e-06, 'epoch': 1.11} {'loss': 0.4947, 'learning_rate': 8.246005090116647e-06, 'epoch': 1.12} {'loss': 0.5566, 'learning_rate': 8.245682814342875e-06, 'epoch': 1.12} {'loss': 0.4288, 'learning_rate': 8.245360540449012e-06, 'epoch': 1.12} {'loss': 0.6632, 'learning_rate': 8.245038268435399e-06, 'epoch': 1.12} {'loss': 0.4943, 'learning_rate': 8.24471599830239e-06, 'epoch': 1.12} {'loss': 0.6357, 'learning_rate': 8.244393730050324e-06, 'epoch': 1.12} {'loss': 0.4965, 'learning_rate': 8.24407146367955e-06, 'epoch': 1.12} {'loss': 0.4858, 'learning_rate': 8.243749199190412e-06, 'epoch': 1.12} {'loss': 0.5725, 'learning_rate': 8.243426936583257e-06, 'epoch': 1.12} {'loss': 0.5108, 'learning_rate': 8.243104675858427e-06, 'epoch': 1.12} {'loss': 0.6287, 'learning_rate': 8.242782417016266e-06, 'epoch': 1.12} {'loss': 0.5426, 'learning_rate': 8.242460160057126e-06, 'epoch': 1.12} {'loss': 0.4727, 'learning_rate': 8.242137904981344e-06, 'epoch': 1.12} {'loss': 0.546, 'learning_rate': 8.241815651789275e-06, 'epoch': 1.12} {'loss': 0.6491, 'learning_rate': 8.241493400481257e-06, 'epoch': 1.12} {'loss': 0.5747, 'learning_rate': 8.241171151057639e-06, 'epoch': 1.12} {'loss': 0.6332, 'learning_rate': 8.240848903518766e-06, 'epoch': 1.12} {'loss': 0.5718, 'learning_rate': 8.240526657864975e-06, 'epoch': 1.12} {'loss': 0.4713, 'learning_rate': 8.240204414096626e-06, 'epoch': 1.12} {'loss': 0.7169, 'learning_rate': 8.239882172214051e-06, 'epoch': 1.12} {'loss': 0.4537, 'learning_rate': 8.239559932217605e-06, 'epoch': 1.12} {'loss': 0.5181, 'learning_rate': 8.239237694107632e-06, 'epoch': 1.12} {'loss': 0.4692, 'learning_rate': 8.23891545788447e-06, 'epoch': 1.12} {'loss': 0.5765, 'learning_rate': 8.238593223548471e-06, 'epoch': 1.12} {'loss': 0.4619, 'learning_rate': 8.238270991099975e-06, 'epoch': 1.12} {'loss': 0.4698, 'learning_rate': 8.237948760539336e-06, 'epoch': 1.12} {'loss': 0.4877, 'learning_rate': 8.237626531866889e-06, 'epoch': 1.12} {'loss': 0.5994, 'learning_rate': 8.237304305082988e-06, 'epoch': 1.12} {'loss': 0.4832, 'learning_rate': 8.236982080187974e-06, 'epoch': 1.12} {'loss': 0.5071, 'learning_rate': 8.23665985718219e-06, 'epoch': 1.12} {'loss': 0.4593, 'learning_rate': 8.236337636065989e-06, 'epoch': 1.12} {'loss': 0.5557, 'learning_rate': 8.236015416839706e-06, 'epoch': 1.12} {'loss': 0.3718, 'learning_rate': 8.235693199503695e-06, 'epoch': 1.12} {'loss': 0.5246, 'learning_rate': 8.2353709840583e-06, 'epoch': 1.12} {'loss': 0.6205, 'learning_rate': 8.235048770503857e-06, 'epoch': 1.12} {'loss': 0.543, 'learning_rate': 8.234726558840724e-06, 'epoch': 1.12} {'loss': 0.6427, 'learning_rate': 8.23440434906924e-06, 'epoch': 1.12} {'loss': 0.5966, 'learning_rate': 8.234082141189752e-06, 'epoch': 1.12} {'loss': 0.5225, 'learning_rate': 8.2337599352026e-06, 'epoch': 1.12} {'loss': 0.5427, 'learning_rate': 8.23343773110814e-06, 'epoch': 1.12} {'loss': 0.5183, 'learning_rate': 8.233115528906709e-06, 'epoch': 1.12} {'loss': 0.4704, 'learning_rate': 8.232793328598649e-06, 'epoch': 1.12} {'loss': 0.4597, 'learning_rate': 8.232471130184316e-06, 'epoch': 1.12} {'loss': 0.5779, 'learning_rate': 8.232148933664048e-06, 'epoch': 1.12} {'loss': 0.4335, 'learning_rate': 8.231826739038194e-06, 'epoch': 1.12} {'loss': 0.4964, 'learning_rate': 8.231504546307093e-06, 'epoch': 1.12} {'loss': 0.6239, 'learning_rate': 8.231182355471097e-06, 'epoch': 1.12} {'loss': 0.4953, 'learning_rate': 8.23086016653055e-06, 'epoch': 1.12} {'loss': 0.4762, 'learning_rate': 8.230537979485795e-06, 'epoch': 1.12} {'loss': 0.4323, 'learning_rate': 8.230215794337177e-06, 'epoch': 1.12} {'loss': 0.6124, 'learning_rate': 8.229893611085042e-06, 'epoch': 1.12} {'loss': 0.4874, 'learning_rate': 8.229571429729739e-06, 'epoch': 1.12} {'loss': 0.5467, 'learning_rate': 8.22924925027161e-06, 'epoch': 1.12} {'loss': 0.455, 'learning_rate': 8.228927072710994e-06, 'epoch': 1.12} {'loss': 0.4058, 'learning_rate': 8.22860489704825e-06, 'epoch': 1.12} {'loss': 0.6777, 'learning_rate': 8.228282723283712e-06, 'epoch': 1.12} {'loss': 0.6248, 'learning_rate': 8.22796055141773e-06, 'epoch': 1.12} {'loss': 0.5309, 'learning_rate': 8.227638381450645e-06, 'epoch': 1.12} {'loss': 0.5764, 'learning_rate': 8.22731621338281e-06, 'epoch': 1.12} {'loss': 0.4774, 'learning_rate': 8.226994047214565e-06, 'epoch': 1.12} {'loss': 0.5096, 'learning_rate': 8.226671882946252e-06, 'epoch': 1.12} {'loss': 0.6666, 'learning_rate': 8.226349720578223e-06, 'epoch': 1.12} {'loss': 0.6127, 'learning_rate': 8.22602756011082e-06, 'epoch': 1.12} {'loss': 0.5279, 'learning_rate': 8.225705401544392e-06, 'epoch': 1.12} {'loss': 0.651, 'learning_rate': 8.225383244879274e-06, 'epoch': 1.12} {'loss': 0.4336, 'learning_rate': 8.225061090115824e-06, 'epoch': 1.12} {'loss': 0.576, 'learning_rate': 8.224738937254379e-06, 'epoch': 1.12} {'loss': 0.6423, 'learning_rate': 8.224416786295283e-06, 'epoch': 1.12} {'loss': 0.5019, 'learning_rate': 8.22409463723889e-06, 'epoch': 1.12} {'loss': 0.3646, 'learning_rate': 8.223772490085538e-06, 'epoch': 1.12} {'loss': 0.5138, 'learning_rate': 8.223450344835575e-06, 'epoch': 1.12} {'loss': 0.7182, 'learning_rate': 8.223128201489347e-06, 'epoch': 1.12} {'loss': 0.6376, 'learning_rate': 8.222806060047192e-06, 'epoch': 1.12} {'loss': 0.6482, 'learning_rate': 8.222483920509464e-06, 'epoch': 1.12} {'loss': 0.3683, 'learning_rate': 8.222161782876502e-06, 'epoch': 1.12} {'loss': 0.5492, 'learning_rate': 8.221839647148659e-06, 'epoch': 1.12} {'loss': 0.5487, 'learning_rate': 8.221517513326271e-06, 'epoch': 1.12} {'loss': 0.6479, 'learning_rate': 8.221195381409691e-06, 'epoch': 1.12} {'loss': 0.428, 'learning_rate': 8.22087325139926e-06, 'epoch': 1.12} {'loss': 0.6401, 'learning_rate': 8.22055112329532e-06, 'epoch': 1.12} {'loss': 0.5285, 'learning_rate': 8.220228997098225e-06, 'epoch': 1.12} {'loss': 0.5224, 'learning_rate': 8.219906872808311e-06, 'epoch': 1.12} {'loss': 0.4789, 'learning_rate': 8.21958475042593e-06, 'epoch': 1.12} {'loss': 0.4976, 'learning_rate': 8.219262629951424e-06, 'epoch': 1.12} {'loss': 0.504, 'learning_rate': 8.21894051138514e-06, 'epoch': 1.12} {'loss': 0.7104, 'learning_rate': 8.218618394727425e-06, 'epoch': 1.12} {'loss': 0.3952, 'learning_rate': 8.218296279978614e-06, 'epoch': 1.12} {'loss': 0.7564, 'learning_rate': 8.217974167139064e-06, 'epoch': 1.12} {'loss': 0.5242, 'learning_rate': 8.217652056209111e-06, 'epoch': 1.12} {'loss': 0.5194, 'learning_rate': 8.21732994718911e-06, 'epoch': 1.12} {'loss': 0.5611, 'learning_rate': 8.2170078400794e-06, 'epoch': 1.12} {'loss': 0.4879, 'learning_rate': 8.216685734880324e-06, 'epoch': 1.12} {'loss': 0.5352, 'learning_rate': 8.216363631592235e-06, 'epoch': 1.12} {'loss': 0.7236, 'learning_rate': 8.216041530215467e-06, 'epoch': 1.12} {'loss': 0.434, 'learning_rate': 8.215719430750376e-06, 'epoch': 1.12} {'loss': 0.4413, 'learning_rate': 8.215397333197299e-06, 'epoch': 1.12} {'loss': 0.5551, 'learning_rate': 8.215075237556589e-06, 'epoch': 1.12} {'loss': 0.4918, 'learning_rate': 8.214753143828586e-06, 'epoch': 1.12} {'loss': 0.5678, 'learning_rate': 8.214431052013636e-06, 'epoch': 1.12} {'loss': 0.5761, 'learning_rate': 8.214108962112084e-06, 'epoch': 1.12} {'loss': 0.6282, 'learning_rate': 8.213786874124272e-06, 'epoch': 1.12} {'loss': 0.6985, 'learning_rate': 8.213464788050553e-06, 'epoch': 1.12} {'loss': 0.5103, 'learning_rate': 8.213142703891263e-06, 'epoch': 1.12} {'loss': 0.4312, 'learning_rate': 8.212820621646758e-06, 'epoch': 1.12} {'loss': 0.6148, 'learning_rate': 8.212498541317375e-06, 'epoch': 1.12} {'loss': 0.6401, 'learning_rate': 8.21217646290346e-06, 'epoch': 1.12} {'loss': 0.544, 'learning_rate': 8.211854386405362e-06, 'epoch': 1.12} {'loss': 0.583, 'learning_rate': 8.211532311823418e-06, 'epoch': 1.12} {'loss': 0.6432, 'learning_rate': 8.211210239157983e-06, 'epoch': 1.12} {'loss': 0.5682, 'learning_rate': 8.210888168409398e-06, 'epoch': 1.12} {'loss': 0.5361, 'learning_rate': 8.210566099578004e-06, 'epoch': 1.12} {'loss': 0.6841, 'learning_rate': 8.210244032664154e-06, 'epoch': 1.12} {'loss': 0.5581, 'learning_rate': 8.209921967668186e-06, 'epoch': 1.12} {'loss': 0.6617, 'learning_rate': 8.209599904590451e-06, 'epoch': 1.12} {'loss': 0.5689, 'learning_rate': 8.209277843431287e-06, 'epoch': 1.12} {'loss': 0.446, 'learning_rate': 8.208955784191047e-06, 'epoch': 1.12} {'loss': 0.5248, 'learning_rate': 8.208633726870073e-06, 'epoch': 1.12} {'loss': 0.4577, 'learning_rate': 8.208311671468705e-06, 'epoch': 1.12} {'loss': 0.6376, 'learning_rate': 8.207989617987298e-06, 'epoch': 1.12} {'loss': 0.5472, 'learning_rate': 8.20766756642619e-06, 'epoch': 1.12} {'loss': 0.5377, 'learning_rate': 8.207345516785728e-06, 'epoch': 1.12} {'loss': 0.4828, 'learning_rate': 8.207023469066259e-06, 'epoch': 1.12} {'loss': 0.4118, 'learning_rate': 8.206701423268122e-06, 'epoch': 1.12} {'loss': 0.545, 'learning_rate': 8.206379379391669e-06, 'epoch': 1.12} {'loss': 0.4807, 'learning_rate': 8.206057337437242e-06, 'epoch': 1.12} {'loss': 0.6218, 'learning_rate': 8.205735297405185e-06, 'epoch': 1.12} {'loss': 0.6002, 'learning_rate': 8.205413259295845e-06, 'epoch': 1.12} {'loss': 0.595, 'learning_rate': 8.205091223109568e-06, 'epoch': 1.12} {'loss': 0.5725, 'learning_rate': 8.2047691888467e-06, 'epoch': 1.12} {'loss': 0.5701, 'learning_rate': 8.204447156507578e-06, 'epoch': 1.12} {'loss': 0.5814, 'learning_rate': 8.204125126092557e-06, 'epoch': 1.12} {'loss': 0.7542, 'learning_rate': 8.203803097601976e-06, 'epoch': 1.12} {'loss': 0.4887, 'learning_rate': 8.203481071036186e-06, 'epoch': 1.12} {'loss': 0.6217, 'learning_rate': 8.20315904639552e-06, 'epoch': 1.12} {'loss': 0.6347, 'learning_rate': 8.202837023680341e-06, 'epoch': 1.12} {'loss': 0.5333, 'learning_rate': 8.20251500289098e-06, 'epoch': 1.12} {'loss': 0.6329, 'learning_rate': 8.202192984027784e-06, 'epoch': 1.12} {'loss': 0.5462, 'learning_rate': 8.201870967091104e-06, 'epoch': 1.12} {'loss': 0.4878, 'learning_rate': 8.20154895208128e-06, 'epoch': 1.12} {'loss': 0.4914, 'learning_rate': 8.20122693899866e-06, 'epoch': 1.12} {'loss': 0.6605, 'learning_rate': 8.200904927843588e-06, 'epoch': 1.12} {'loss': 0.4559, 'learning_rate': 8.200582918616404e-06, 'epoch': 1.12} {'loss': 0.4642, 'learning_rate': 8.200260911317463e-06, 'epoch': 1.12} {'loss': 0.6732, 'learning_rate': 8.1999389059471e-06, 'epoch': 1.12} {'loss': 0.5072, 'learning_rate': 8.19961690250567e-06, 'epoch': 1.12} {'loss': 0.5442, 'learning_rate': 8.199294900993511e-06, 'epoch': 1.12} {'loss': 0.5951, 'learning_rate': 8.19897290141097e-06, 'epoch': 1.12} {'loss': 0.6973, 'learning_rate': 8.198650903758395e-06, 'epoch': 1.12} {'loss': 0.6079, 'learning_rate': 8.198328908036122e-06, 'epoch': 1.12} {'loss': 0.5087, 'learning_rate': 8.198006914244507e-06, 'epoch': 1.12} {'loss': 0.5353, 'learning_rate': 8.197684922383884e-06, 'epoch': 1.12} {'loss': 0.612, 'learning_rate': 8.19736293245461e-06, 'epoch': 1.12} {'loss': 0.4193, 'learning_rate': 8.197040944457024e-06, 'epoch': 1.12} {'loss': 0.495, 'learning_rate': 8.196718958391473e-06, 'epoch': 1.12} {'loss': 0.6517, 'learning_rate': 8.196396974258298e-06, 'epoch': 1.12} {'loss': 0.6038, 'learning_rate': 8.196074992057844e-06, 'epoch': 1.12} {'loss': 0.6118, 'learning_rate': 8.195753011790463e-06, 'epoch': 1.12} {'loss': 0.3355, 'learning_rate': 8.19543103345649e-06, 'epoch': 1.12} {'loss': 0.6247, 'learning_rate': 8.19510905705628e-06, 'epoch': 1.12} {'loss': 0.5326, 'learning_rate': 8.194787082590174e-06, 'epoch': 1.12} {'loss': 0.5126, 'learning_rate': 8.194465110058515e-06, 'epoch': 1.12} {'loss': 0.5712, 'learning_rate': 8.194143139461652e-06, 'epoch': 1.12} {'loss': 0.5954, 'learning_rate': 8.193821170799922e-06, 'epoch': 1.12} {'loss': 0.5598, 'learning_rate': 8.193499204073679e-06, 'epoch': 1.12} {'loss': 0.5538, 'learning_rate': 8.193177239283262e-06, 'epoch': 1.12} {'loss': 0.5106, 'learning_rate': 8.192855276429022e-06, 'epoch': 1.12} {'loss': 0.6283, 'learning_rate': 8.192533315511301e-06, 'epoch': 1.12} {'loss': 0.6666, 'learning_rate': 8.192211356530443e-06, 'epoch': 1.12} {'loss': 0.5713, 'learning_rate': 8.191889399486795e-06, 'epoch': 1.12} {'loss': 0.5218, 'learning_rate': 8.191567444380695e-06, 'epoch': 1.12} {'loss': 0.5092, 'learning_rate': 8.191245491212499e-06, 'epoch': 1.12} {'loss': 0.6495, 'learning_rate': 8.190923539982543e-06, 'epoch': 1.12} {'loss': 0.6121, 'learning_rate': 8.190601590691179e-06, 'epoch': 1.12} {'loss': 0.5514, 'learning_rate': 8.19027964333875e-06, 'epoch': 1.12} {'loss': 0.5358, 'learning_rate': 8.189957697925597e-06, 'epoch': 1.12} {'loss': 0.4731, 'learning_rate': 8.18963575445207e-06, 'epoch': 1.12} {'loss': 0.6112, 'learning_rate': 8.189313812918508e-06, 'epoch': 1.12} {'loss': 0.5337, 'learning_rate': 8.188991873325261e-06, 'epoch': 1.12} {'loss': 0.4792, 'learning_rate': 8.188669935672675e-06, 'epoch': 1.12} {'loss': 0.522, 'learning_rate': 8.188347999961088e-06, 'epoch': 1.12} {'loss': 0.4691, 'learning_rate': 8.188026066190854e-06, 'epoch': 1.12} {'loss': 0.5156, 'learning_rate': 8.187704134362311e-06, 'epoch': 1.12} {'loss': 0.4967, 'learning_rate': 8.18738220447581e-06, 'epoch': 1.12} {'loss': 0.4973, 'learning_rate': 8.187060276531687e-06, 'epoch': 1.12} {'loss': 0.5554, 'learning_rate': 8.186738350530297e-06, 'epoch': 1.12} {'loss': 0.5436, 'learning_rate': 8.18641642647198e-06, 'epoch': 1.12} {'loss': 0.4828, 'learning_rate': 8.186094504357078e-06, 'epoch': 1.12} {'loss': 0.4216, 'learning_rate': 8.185772584185944e-06, 'epoch': 1.12} {'loss': 0.684, 'learning_rate': 8.185450665958916e-06, 'epoch': 1.12} {'loss': 0.5406, 'learning_rate': 8.185128749676343e-06, 'epoch': 1.12} {'loss': 0.5324, 'learning_rate': 8.184806835338566e-06, 'epoch': 1.12} {'loss': 0.6097, 'learning_rate': 8.184484922945935e-06, 'epoch': 1.12} {'loss': 0.4435, 'learning_rate': 8.184163012498792e-06, 'epoch': 1.12} {'loss': 0.6175, 'learning_rate': 8.183841103997477e-06, 'epoch': 1.12} {'loss': 0.6505, 'learning_rate': 8.183519197442347e-06, 'epoch': 1.12} {'loss': 0.5725, 'learning_rate': 8.183197292833737e-06, 'epoch': 1.12} {'loss': 0.4802, 'learning_rate': 8.182875390171996e-06, 'epoch': 1.12} {'loss': 0.6522, 'learning_rate': 8.18255348945747e-06, 'epoch': 1.12} {'loss': 0.7622, 'learning_rate': 8.182231590690495e-06, 'epoch': 1.12} {'loss': 0.51, 'learning_rate': 8.18190969387143e-06, 'epoch': 1.12} {'loss': 0.4983, 'learning_rate': 8.18158779900061e-06, 'epoch': 1.12} {'loss': 0.5695, 'learning_rate': 8.181265906078382e-06, 'epoch': 1.12} {'loss': 0.5953, 'learning_rate': 8.180944015105093e-06, 'epoch': 1.12} {'loss': 0.5507, 'learning_rate': 8.180622126081087e-06, 'epoch': 1.12} {'loss': 0.6272, 'learning_rate': 8.18030023900671e-06, 'epoch': 1.12} {'loss': 0.5884, 'learning_rate': 8.179978353882301e-06, 'epoch': 1.12} {'loss': 0.4911, 'learning_rate': 8.179656470708213e-06, 'epoch': 1.12} {'loss': 0.5685, 'learning_rate': 8.179334589484785e-06, 'epoch': 1.12} {'loss': 0.4291, 'learning_rate': 8.179012710212368e-06, 'epoch': 1.12} {'loss': 0.6886, 'learning_rate': 8.178690832891298e-06, 'epoch': 1.12} {'loss': 0.56, 'learning_rate': 8.17836895752193e-06, 'epoch': 1.12} {'loss': 0.5819, 'learning_rate': 8.178047084104604e-06, 'epoch': 1.12} {'loss': 0.4381, 'learning_rate': 8.17772521263966e-06, 'epoch': 1.12} {'loss': 0.5487, 'learning_rate': 8.177403343127452e-06, 'epoch': 1.12} {'loss': 0.44, 'learning_rate': 8.17708147556832e-06, 'epoch': 1.12} {'loss': 0.5591, 'learning_rate': 8.176759609962612e-06, 'epoch': 1.12} {'loss': 0.5612, 'learning_rate': 8.176437746310668e-06, 'epoch': 1.12} {'loss': 0.5968, 'learning_rate': 8.176115884612833e-06, 'epoch': 1.12} {'loss': 0.5779, 'learning_rate': 8.175794024869459e-06, 'epoch': 1.12} {'loss': 0.5524, 'learning_rate': 8.175472167080883e-06, 'epoch': 1.12} {'loss': 0.6047, 'learning_rate': 8.175150311247455e-06, 'epoch': 1.12} {'loss': 0.4219, 'learning_rate': 8.174828457369518e-06, 'epoch': 1.12} {'loss': 0.6268, 'learning_rate': 8.174506605447418e-06, 'epoch': 1.12} {'loss': 0.5971, 'learning_rate': 8.1741847554815e-06, 'epoch': 1.12} {'loss': 0.4465, 'learning_rate': 8.173862907472103e-06, 'epoch': 1.12} {'loss': 0.4554, 'learning_rate': 8.173541061419582e-06, 'epoch': 1.12} {'loss': 0.5915, 'learning_rate': 8.17321921732427e-06, 'epoch': 1.12} {'loss': 0.531, 'learning_rate': 8.172897375186525e-06, 'epoch': 1.12} {'loss': 0.5765, 'learning_rate': 8.172575535006684e-06, 'epoch': 1.12} {'loss': 0.5855, 'learning_rate': 8.172253696785092e-06, 'epoch': 1.12} {'loss': 0.6125, 'learning_rate': 8.171931860522096e-06, 'epoch': 1.12} {'loss': 0.5137, 'learning_rate': 8.171610026218037e-06, 'epoch': 1.12} {'loss': 0.5314, 'learning_rate': 8.171288193873266e-06, 'epoch': 1.12} {'loss': 0.4973, 'learning_rate': 8.170966363488122e-06, 'epoch': 1.12} {'loss': 0.5561, 'learning_rate': 8.170644535062955e-06, 'epoch': 1.12} {'loss': 0.5429, 'learning_rate': 8.17032270859811e-06, 'epoch': 1.12} {'loss': 0.4892, 'learning_rate': 8.170000884093925e-06, 'epoch': 1.12} {'loss': 0.5455, 'learning_rate': 8.169679061550752e-06, 'epoch': 1.12} {'loss': 0.6156, 'learning_rate': 8.16935724096893e-06, 'epoch': 1.12} {'loss': 0.4253, 'learning_rate': 8.16903542234881e-06, 'epoch': 1.12} {'loss': 0.3577, 'learning_rate': 8.168713605690729e-06, 'epoch': 1.12} {'loss': 0.6733, 'learning_rate': 8.168391790995041e-06, 'epoch': 1.12} {'loss': 0.6022, 'learning_rate': 8.168069978262087e-06, 'epoch': 1.12} {'loss': 0.5356, 'learning_rate': 8.167748167492211e-06, 'epoch': 1.12} {'loss': 0.6616, 'learning_rate': 8.167426358685758e-06, 'epoch': 1.12} {'loss': 0.6341, 'learning_rate': 8.16710455184307e-06, 'epoch': 1.12} {'loss': 0.5648, 'learning_rate': 8.166782746964499e-06, 'epoch': 1.12} {'loss': 0.5822, 'learning_rate': 8.166460944050384e-06, 'epoch': 1.12} {'loss': 0.6527, 'learning_rate': 8.16613914310107e-06, 'epoch': 1.12} {'loss': 0.607, 'learning_rate': 8.165817344116907e-06, 'epoch': 1.12} {'loss': 0.523, 'learning_rate': 8.165495547098233e-06, 'epoch': 1.12} {'loss': 0.6247, 'learning_rate': 8.165173752045399e-06, 'epoch': 1.12} {'loss': 0.5591, 'learning_rate': 8.164851958958742e-06, 'epoch': 1.12} {'loss': 0.4446, 'learning_rate': 8.164530167838616e-06, 'epoch': 1.12} {'loss': 0.5466, 'learning_rate': 8.164208378685363e-06, 'epoch': 1.12} {'loss': 0.5251, 'learning_rate': 8.163886591499321e-06, 'epoch': 1.12} {'loss': 0.4384, 'learning_rate': 8.163564806280844e-06, 'epoch': 1.12} {'loss': 0.4701, 'learning_rate': 8.163243023030271e-06, 'epoch': 1.12} {'loss': 0.5688, 'learning_rate': 8.162921241747953e-06, 'epoch': 1.12} {'loss': 0.5525, 'learning_rate': 8.162599462434223e-06, 'epoch': 1.12} {'loss': 0.4418, 'learning_rate': 8.162277685089442e-06, 'epoch': 1.12} {'loss': 0.5703, 'learning_rate': 8.161955909713944e-06, 'epoch': 1.12} {'loss': 0.5301, 'learning_rate': 8.161634136308072e-06, 'epoch': 1.12} {'loss': 0.4897, 'learning_rate': 8.161312364872178e-06, 'epoch': 1.12} {'loss': 0.5932, 'learning_rate': 8.160990595406604e-06, 'epoch': 1.12} {'loss': 0.5151, 'learning_rate': 8.160668827911696e-06, 'epoch': 1.12} {'loss': 0.518, 'learning_rate': 8.160347062387797e-06, 'epoch': 1.12} {'loss': 0.5991, 'learning_rate': 8.160025298835248e-06, 'epoch': 1.12} {'loss': 0.5816, 'learning_rate': 8.159703537254402e-06, 'epoch': 1.12} {'loss': 0.5524, 'learning_rate': 8.159381777645595e-06, 'epoch': 1.12} {'loss': 0.5075, 'learning_rate': 8.159060020009182e-06, 'epoch': 1.12} {'loss': 0.5436, 'learning_rate': 8.158738264345499e-06, 'epoch': 1.12} {'loss': 0.4871, 'learning_rate': 8.158416510654897e-06, 'epoch': 1.12} {'loss': 0.6244, 'learning_rate': 8.158094758937719e-06, 'epoch': 1.12} {'loss': 0.7042, 'learning_rate': 8.157773009194302e-06, 'epoch': 1.12} {'loss': 0.3483, 'learning_rate': 8.157451261425002e-06, 'epoch': 1.12} {'loss': 0.5618, 'learning_rate': 8.157129515630156e-06, 'epoch': 1.12} {'loss': 0.6037, 'learning_rate': 8.156807771810117e-06, 'epoch': 1.12} {'loss': 0.6388, 'learning_rate': 8.156486029965223e-06, 'epoch': 1.12} {'loss': 0.6243, 'learning_rate': 8.156164290095821e-06, 'epoch': 1.12} {'loss': 0.6342, 'learning_rate': 8.155842552202256e-06, 'epoch': 1.12} {'loss': 0.4586, 'learning_rate': 8.155520816284868e-06, 'epoch': 1.12} {'loss': 0.4206, 'learning_rate': 8.15519908234401e-06, 'epoch': 1.12} {'loss': 0.5475, 'learning_rate': 8.154877350380021e-06, 'epoch': 1.12} {'loss': 0.4871, 'learning_rate': 8.154555620393248e-06, 'epoch': 1.12} {'loss': 0.5618, 'learning_rate': 8.154233892384036e-06, 'epoch': 1.12} {'loss': 0.5642, 'learning_rate': 8.153912166352727e-06, 'epoch': 1.12} {'loss': 0.5924, 'learning_rate': 8.15359044229967e-06, 'epoch': 1.12} {'loss': 0.6094, 'learning_rate': 8.153268720225204e-06, 'epoch': 1.12} {'loss': 0.5153, 'learning_rate': 8.15294700012968e-06, 'epoch': 1.12} {'loss': 0.6089, 'learning_rate': 8.15262528201344e-06, 'epoch': 1.12} {'loss': 0.5556, 'learning_rate': 8.15230356587683e-06, 'epoch': 1.12} {'loss': 0.6293, 'learning_rate': 8.15198185172019e-06, 'epoch': 1.12} {'loss': 0.6319, 'learning_rate': 8.15166013954387e-06, 'epoch': 1.12} {'loss': 0.5202, 'learning_rate': 8.151338429348214e-06, 'epoch': 1.12} {'loss': 0.5692, 'learning_rate': 8.151016721133562e-06, 'epoch': 1.12} {'loss': 0.493, 'learning_rate': 8.150695014900268e-06, 'epoch': 1.12} {'loss': 0.5855, 'learning_rate': 8.150373310648666e-06, 'epoch': 1.12} {'loss': 0.5687, 'learning_rate': 8.15005160837911e-06, 'epoch': 1.12} {'loss': 0.4688, 'learning_rate': 8.149729908091941e-06, 'epoch': 1.12} {'loss': 0.5627, 'learning_rate': 8.149408209787498e-06, 'epoch': 1.12} {'loss': 0.5725, 'learning_rate': 8.149086513466136e-06, 'epoch': 1.12} {'loss': 0.6435, 'learning_rate': 8.148764819128191e-06, 'epoch': 1.12} {'loss': 0.4843, 'learning_rate': 8.148443126774014e-06, 'epoch': 1.12} {'loss': 0.4944, 'learning_rate': 8.14812143640395e-06, 'epoch': 1.12} {'loss': 0.6851, 'learning_rate': 8.147799748018337e-06, 'epoch': 1.12} {'loss': 0.4965, 'learning_rate': 8.147478061617526e-06, 'epoch': 1.12} {'loss': 0.6069, 'learning_rate': 8.147156377201857e-06, 'epoch': 1.12} {'loss': 0.6596, 'learning_rate': 8.14683469477168e-06, 'epoch': 1.12} {'loss': 0.5704, 'learning_rate': 8.146513014327331e-06, 'epoch': 1.12} {'loss': 0.57, 'learning_rate': 8.146191335869167e-06, 'epoch': 1.12} {'loss': 0.5329, 'learning_rate': 8.145869659397527e-06, 'epoch': 1.12} {'loss': 0.4857, 'learning_rate': 8.145547984912752e-06, 'epoch': 1.12} {'loss': 0.4982, 'learning_rate': 8.145226312415191e-06, 'epoch': 1.12} {'loss': 0.4303, 'learning_rate': 8.144904641905184e-06, 'epoch': 1.12} {'loss': 0.5468, 'learning_rate': 8.144582973383082e-06, 'epoch': 1.12} {'loss': 0.4846, 'learning_rate': 8.14426130684923e-06, 'epoch': 1.12} {'loss': 0.5492, 'learning_rate': 8.143939642303963e-06, 'epoch': 1.12} {'loss': 0.6787, 'learning_rate': 8.143617979747636e-06, 'epoch': 1.12} {'loss': 0.6328, 'learning_rate': 8.143296319180588e-06, 'epoch': 1.12} {'loss': 0.5253, 'learning_rate': 8.142974660603168e-06, 'epoch': 1.12} {'loss': 0.5417, 'learning_rate': 8.142653004015714e-06, 'epoch': 1.12} {'loss': 0.6334, 'learning_rate': 8.14233134941858e-06, 'epoch': 1.12} {'loss': 0.5841, 'learning_rate': 8.142009696812104e-06, 'epoch': 1.12} {'loss': 0.6127, 'learning_rate': 8.141688046196629e-06, 'epoch': 1.12} {'loss': 0.6596, 'learning_rate': 8.141366397572508e-06, 'epoch': 1.12} {'loss': 0.7756, 'learning_rate': 8.141044750940077e-06, 'epoch': 1.12} {'loss': 0.6509, 'learning_rate': 8.140723106299687e-06, 'epoch': 1.12} {'loss': 0.4371, 'learning_rate': 8.140401463651677e-06, 'epoch': 1.12} {'loss': 0.5382, 'learning_rate': 8.140079822996398e-06, 'epoch': 1.12} {'loss': 0.5267, 'learning_rate': 8.13975818433419e-06, 'epoch': 1.12} {'loss': 0.5338, 'learning_rate': 8.139436547665395e-06, 'epoch': 1.12} {'loss': 0.5642, 'learning_rate': 8.139114912990367e-06, 'epoch': 1.12} {'loss': 0.4703, 'learning_rate': 8.138793280309443e-06, 'epoch': 1.12} {'loss': 0.5753, 'learning_rate': 8.138471649622973e-06, 'epoch': 1.12} {'loss': 0.4086, 'learning_rate': 8.138150020931298e-06, 'epoch': 1.12} {'loss': 0.5352, 'learning_rate': 8.13782839423476e-06, 'epoch': 1.12} {'loss': 0.5402, 'learning_rate': 8.137506769533708e-06, 'epoch': 1.12} {'loss': 0.6587, 'learning_rate': 8.137185146828484e-06, 'epoch': 1.12} {'loss': 0.6405, 'learning_rate': 8.136863526119438e-06, 'epoch': 1.12} {'loss': 0.5591, 'learning_rate': 8.136541907406909e-06, 'epoch': 1.12} {'loss': 0.4343, 'learning_rate': 8.136220290691245e-06, 'epoch': 1.12} {'loss': 0.52, 'learning_rate': 8.13589867597279e-06, 'epoch': 1.12} {'loss': 0.6173, 'learning_rate': 8.135577063251883e-06, 'epoch': 1.12} {'loss': 0.6658, 'learning_rate': 8.135255452528877e-06, 'epoch': 1.12} {'loss': 0.5647, 'learning_rate': 8.13493384380411e-06, 'epoch': 1.12} {'loss': 0.6478, 'learning_rate': 8.134612237077933e-06, 'epoch': 1.12} {'loss': 0.6057, 'learning_rate': 8.134290632350687e-06, 'epoch': 1.12} {'loss': 0.5943, 'learning_rate': 8.133969029622716e-06, 'epoch': 1.12} {'loss': 0.5418, 'learning_rate': 8.133647428894369e-06, 'epoch': 1.12} {'loss': 0.6493, 'learning_rate': 8.13332583016598e-06, 'epoch': 1.12} {'loss': 0.5598, 'learning_rate': 8.133004233437907e-06, 'epoch': 1.12} {'loss': 0.5207, 'learning_rate': 8.132682638710484e-06, 'epoch': 1.12} {'loss': 0.597, 'learning_rate': 8.132361045984064e-06, 'epoch': 1.12} {'loss': 0.574, 'learning_rate': 8.132039455258989e-06, 'epoch': 1.12} {'loss': 0.588, 'learning_rate': 8.131717866535598e-06, 'epoch': 1.12} {'loss': 0.781, 'learning_rate': 8.131396279814243e-06, 'epoch': 1.12} {'loss': 0.4334, 'learning_rate': 8.131074695095262e-06, 'epoch': 1.12} {'loss': 0.6894, 'learning_rate': 8.130753112379007e-06, 'epoch': 1.12} {'loss': 0.5423, 'learning_rate': 8.130431531665816e-06, 'epoch': 1.12} {'loss': 0.6539, 'learning_rate': 8.130109952956037e-06, 'epoch': 1.12} {'loss': 0.5146, 'learning_rate': 8.129788376250014e-06, 'epoch': 1.12} {'loss': 0.6311, 'learning_rate': 8.129466801548092e-06, 'epoch': 1.12} {'loss': 0.7301, 'learning_rate': 8.129145228850618e-06, 'epoch': 1.12} {'loss': 0.6018, 'learning_rate': 8.128823658157928e-06, 'epoch': 1.12} {'loss': 0.5837, 'learning_rate': 8.128502089470376e-06, 'epoch': 1.12} {'loss': 0.5971, 'learning_rate': 8.128180522788301e-06, 'epoch': 1.12} {'loss': 0.6428, 'learning_rate': 8.12785895811205e-06, 'epoch': 1.12} {'loss': 0.6094, 'learning_rate': 8.127537395441969e-06, 'epoch': 1.12} {'loss': 0.4137, 'learning_rate': 8.1272158347784e-06, 'epoch': 1.12} {'loss': 0.5291, 'learning_rate': 8.126894276121687e-06, 'epoch': 1.12} {'loss': 0.4153, 'learning_rate': 8.126572719472175e-06, 'epoch': 1.12} {'loss': 0.6478, 'learning_rate': 8.126251164830212e-06, 'epoch': 1.12} {'loss': 0.4883, 'learning_rate': 8.12592961219614e-06, 'epoch': 1.12} {'loss': 0.5685, 'learning_rate': 8.125608061570302e-06, 'epoch': 1.12} {'loss': 0.5454, 'learning_rate': 8.125286512953046e-06, 'epoch': 1.12} {'loss': 0.4925, 'learning_rate': 8.124964966344711e-06, 'epoch': 1.12} {'loss': 0.585, 'learning_rate': 8.124643421745649e-06, 'epoch': 1.12} {'loss': 0.5524, 'learning_rate': 8.124321879156196e-06, 'epoch': 1.12} {'loss': 0.6278, 'learning_rate': 8.124000338576706e-06, 'epoch': 1.12} {'loss': 0.5993, 'learning_rate': 8.123678800007519e-06, 'epoch': 1.12} {'loss': 0.4951, 'learning_rate': 8.123357263448978e-06, 'epoch': 1.12} {'loss': 0.5177, 'learning_rate': 8.12303572890143e-06, 'epoch': 1.12} {'loss': 0.4805, 'learning_rate': 8.122714196365216e-06, 'epoch': 1.12} {'loss': 0.5825, 'learning_rate': 8.122392665840686e-06, 'epoch': 1.12} {'loss': 0.5627, 'learning_rate': 8.122071137328178e-06, 'epoch': 1.12} {'loss': 0.5658, 'learning_rate': 8.121749610828045e-06, 'epoch': 1.12} {'loss': 0.6137, 'learning_rate': 8.121428086340626e-06, 'epoch': 1.12} {'loss': 0.5, 'learning_rate': 8.121106563866264e-06, 'epoch': 1.12} {'loss': 0.7132, 'learning_rate': 8.12078504340531e-06, 'epoch': 1.12} {'loss': 0.6848, 'learning_rate': 8.120463524958098e-06, 'epoch': 1.12} {'loss': 0.7428, 'learning_rate': 8.120142008524985e-06, 'epoch': 1.12} {'loss': 0.5746, 'learning_rate': 8.119820494106307e-06, 'epoch': 1.12} {'loss': 0.6808, 'learning_rate': 8.11949898170241e-06, 'epoch': 1.12} {'loss': 0.4694, 'learning_rate': 8.119177471313642e-06, 'epoch': 1.12} {'loss': 0.4952, 'learning_rate': 8.118855962940343e-06, 'epoch': 1.12} {'loss': 0.6788, 'learning_rate': 8.118534456582861e-06, 'epoch': 1.12} {'loss': 0.5191, 'learning_rate': 8.118212952241535e-06, 'epoch': 1.12} {'loss': 0.5035, 'learning_rate': 8.11789144991672e-06, 'epoch': 1.12} {'loss': 0.6824, 'learning_rate': 8.117569949608753e-06, 'epoch': 1.12} {'loss': 0.5833, 'learning_rate': 8.117248451317976e-06, 'epoch': 1.12} {'loss': 0.6364, 'learning_rate': 8.11692695504474e-06, 'epoch': 1.12} {'loss': 0.5556, 'learning_rate': 8.116605460789386e-06, 'epoch': 1.12} {'loss': 0.6287, 'learning_rate': 8.11628396855226e-06, 'epoch': 1.12} {'loss': 0.5095, 'learning_rate': 8.115962478333706e-06, 'epoch': 1.12} {'loss': 0.5637, 'learning_rate': 8.115640990134063e-06, 'epoch': 1.12} {'loss': 0.431, 'learning_rate': 8.115319503953687e-06, 'epoch': 1.12} {'loss': 0.5713, 'learning_rate': 8.114998019792913e-06, 'epoch': 1.12} {'loss': 0.5931, 'learning_rate': 8.114676537652091e-06, 'epoch': 1.12} {'loss': 0.5334, 'learning_rate': 8.11435505753156e-06, 'epoch': 1.12} {'loss': 0.5234, 'learning_rate': 8.114033579431672e-06, 'epoch': 1.12} {'loss': 0.4983, 'learning_rate': 8.113712103352768e-06, 'epoch': 1.12} {'loss': 0.5614, 'learning_rate': 8.113390629295187e-06, 'epoch': 1.12} {'loss': 0.4416, 'learning_rate': 8.11306915725928e-06, 'epoch': 1.12} {'loss': 0.5964, 'learning_rate': 8.112747687245387e-06, 'epoch': 1.12} {'loss': 0.6593, 'learning_rate': 8.11242621925386e-06, 'epoch': 1.12} {'loss': 0.6113, 'learning_rate': 8.112104753285035e-06, 'epoch': 1.12} {'loss': 0.5038, 'learning_rate': 8.111783289339264e-06, 'epoch': 1.12} {'loss': 0.7061, 'learning_rate': 8.111461827416887e-06, 'epoch': 1.12} {'loss': 0.5946, 'learning_rate': 8.111140367518245e-06, 'epoch': 1.12} {'loss': 0.5674, 'learning_rate': 8.110818909643691e-06, 'epoch': 1.12} {'loss': 0.6134, 'learning_rate': 8.11049745379356e-06, 'epoch': 1.12} {'loss': 0.5013, 'learning_rate': 8.110175999968206e-06, 'epoch': 1.12} {'loss': 0.5881, 'learning_rate': 8.10985454816797e-06, 'epoch': 1.12} {'loss': 0.5745, 'learning_rate': 8.109533098393191e-06, 'epoch': 1.12} {'loss': 0.594, 'learning_rate': 8.109211650644224e-06, 'epoch': 1.12} {'loss': 0.3808, 'learning_rate': 8.1088902049214e-06, 'epoch': 1.12} {'loss': 0.603, 'learning_rate': 8.108568761225076e-06, 'epoch': 1.12} {'loss': 0.621, 'learning_rate': 8.108247319555587e-06, 'epoch': 1.12} {'loss': 0.5334, 'learning_rate': 8.107925879913285e-06, 'epoch': 1.12} {'loss': 0.6687, 'learning_rate': 8.107604442298512e-06, 'epoch': 1.12} {'loss': 0.6412, 'learning_rate': 8.10728300671161e-06, 'epoch': 1.12} {'loss': 0.5194, 'learning_rate': 8.106961573152927e-06, 'epoch': 1.12} {'loss': 0.4255, 'learning_rate': 8.1066401416228e-06, 'epoch': 1.12} {'loss': 0.5788, 'learning_rate': 8.106318712121585e-06, 'epoch': 1.12} {'loss': 0.4731, 'learning_rate': 8.105997284649617e-06, 'epoch': 1.12} {'loss': 0.3908, 'learning_rate': 8.105675859207244e-06, 'epoch': 1.12} {'loss': 0.5842, 'learning_rate': 8.105354435794814e-06, 'epoch': 1.12} {'loss': 0.49, 'learning_rate': 8.105033014412665e-06, 'epoch': 1.12} {'loss': 0.6749, 'learning_rate': 8.104711595061144e-06, 'epoch': 1.12} {'loss': 0.5549, 'learning_rate': 8.104390177740593e-06, 'epoch': 1.12} {'loss': 0.62, 'learning_rate': 8.104068762451364e-06, 'epoch': 1.12} {'loss': 0.6307, 'learning_rate': 8.103747349193795e-06, 'epoch': 1.12} {'loss': 0.452, 'learning_rate': 8.10342593796823e-06, 'epoch': 1.12} {'loss': 0.6106, 'learning_rate': 8.103104528775016e-06, 'epoch': 1.12} {'loss': 0.5176, 'learning_rate': 8.102783121614497e-06, 'epoch': 1.12} {'loss': 0.6138, 'learning_rate': 8.102461716487019e-06, 'epoch': 1.12} {'loss': 0.4511, 'learning_rate': 8.102140313392918e-06, 'epoch': 1.12} {'loss': 0.625, 'learning_rate': 8.101818912332554e-06, 'epoch': 1.12} {'loss': 0.5608, 'learning_rate': 8.101497513306258e-06, 'epoch': 1.12} {'loss': 0.4154, 'learning_rate': 8.101176116314377e-06, 'epoch': 1.12} {'loss': 0.5184, 'learning_rate': 8.100854721357263e-06, 'epoch': 1.12} {'loss': 0.5366, 'learning_rate': 8.100533328435247e-06, 'epoch': 1.12} {'loss': 0.5138, 'learning_rate': 8.100211937548685e-06, 'epoch': 1.12} {'loss': 0.3643, 'learning_rate': 8.099890548697916e-06, 'epoch': 1.12} {'loss': 0.5412, 'learning_rate': 8.099569161883287e-06, 'epoch': 1.12} {'loss': 0.524, 'learning_rate': 8.099247777105142e-06, 'epoch': 1.12} {'loss': 0.6507, 'learning_rate': 8.098926394363823e-06, 'epoch': 1.12} {'loss': 0.4986, 'learning_rate': 8.098605013659678e-06, 'epoch': 1.12} {'loss': 0.4835, 'learning_rate': 8.098283634993045e-06, 'epoch': 1.12} {'loss': 0.5198, 'learning_rate': 8.097962258364275e-06, 'epoch': 1.12} {'loss': 0.5556, 'learning_rate': 8.097640883773714e-06, 'epoch': 1.12} {'loss': 0.5674, 'learning_rate': 8.097319511221695e-06, 'epoch': 1.12} {'loss': 0.4839, 'learning_rate': 8.096998140708576e-06, 'epoch': 1.12} {'loss': 0.5886, 'learning_rate': 8.096676772234692e-06, 'epoch': 1.12} {'loss': 0.4823, 'learning_rate': 8.096355405800393e-06, 'epoch': 1.12} {'loss': 0.717, 'learning_rate': 8.096034041406018e-06, 'epoch': 1.12} {'loss': 0.4589, 'learning_rate': 8.095712679051917e-06, 'epoch': 1.12} {'loss': 0.616, 'learning_rate': 8.095391318738433e-06, 'epoch': 1.12} {'loss': 0.6307, 'learning_rate': 8.095069960465904e-06, 'epoch': 1.12} {'loss': 0.5055, 'learning_rate': 8.094748604234683e-06, 'epoch': 1.12} {'loss': 0.4603, 'learning_rate': 8.09442725004511e-06, 'epoch': 1.12} {'loss': 0.5824, 'learning_rate': 8.094105897897533e-06, 'epoch': 1.12} {'loss': 0.5066, 'learning_rate': 8.093784547792287e-06, 'epoch': 1.12} {'loss': 0.513, 'learning_rate': 8.093463199729729e-06, 'epoch': 1.12} {'loss': 0.5647, 'learning_rate': 8.093141853710197e-06, 'epoch': 1.12} {'loss': 0.6006, 'learning_rate': 8.09282050973403e-06, 'epoch': 1.12} {'loss': 0.4533, 'learning_rate': 8.092499167801584e-06, 'epoch': 1.12} {'loss': 0.616, 'learning_rate': 8.092177827913195e-06, 'epoch': 1.12} {'loss': 0.5439, 'learning_rate': 8.09185649006921e-06, 'epoch': 1.12} {'loss': 0.6623, 'learning_rate': 8.091535154269975e-06, 'epoch': 1.12} {'loss': 0.5751, 'learning_rate': 8.091213820515826e-06, 'epoch': 1.13} {'loss': 0.632, 'learning_rate': 8.090892488807119e-06, 'epoch': 1.13} {'loss': 0.6178, 'learning_rate': 8.09057115914419e-06, 'epoch': 1.13} {'loss': 0.5949, 'learning_rate': 8.090249831527389e-06, 'epoch': 1.13} {'loss': 0.4078, 'learning_rate': 8.089928505957057e-06, 'epoch': 1.13} {'loss': 0.7445, 'learning_rate': 8.089607182433538e-06, 'epoch': 1.13} {'loss': 0.6508, 'learning_rate': 8.08928586095718e-06, 'epoch': 1.13} {'loss': 0.6512, 'learning_rate': 8.08896454152832e-06, 'epoch': 1.13} {'loss': 0.6068, 'learning_rate': 8.088643224147312e-06, 'epoch': 1.13} {'loss': 0.4924, 'learning_rate': 8.08832190881449e-06, 'epoch': 1.13} {'loss': 0.6551, 'learning_rate': 8.088000595530208e-06, 'epoch': 1.13} {'loss': 0.5858, 'learning_rate': 8.087679284294806e-06, 'epoch': 1.13} {'loss': 0.6754, 'learning_rate': 8.087357975108626e-06, 'epoch': 1.13} {'loss': 0.6525, 'learning_rate': 8.087036667972018e-06, 'epoch': 1.13} {'loss': 0.5953, 'learning_rate': 8.086715362885316e-06, 'epoch': 1.13} {'loss': 0.5541, 'learning_rate': 8.086394059848876e-06, 'epoch': 1.13} {'loss': 0.5886, 'learning_rate': 8.086072758863035e-06, 'epoch': 1.13} {'loss': 0.5931, 'learning_rate': 8.085751459928142e-06, 'epoch': 1.13} {'loss': 0.5448, 'learning_rate': 8.085430163044541e-06, 'epoch': 1.13} {'loss': 0.6251, 'learning_rate': 8.085108868212573e-06, 'epoch': 1.13} {'loss': 0.277, 'learning_rate': 8.084787575432584e-06, 'epoch': 1.13} {'loss': 0.6305, 'learning_rate': 8.084466284704913e-06, 'epoch': 1.13} {'loss': 0.4982, 'learning_rate': 8.084144996029915e-06, 'epoch': 1.13} {'loss': 0.4878, 'learning_rate': 8.083823709407923e-06, 'epoch': 1.13} {'loss': 0.5273, 'learning_rate': 8.083502424839292e-06, 'epoch': 1.13} {'loss': 0.6494, 'learning_rate': 8.083181142324361e-06, 'epoch': 1.13} {'loss': 0.4794, 'learning_rate': 8.082859861863472e-06, 'epoch': 1.13} {'loss': 0.5918, 'learning_rate': 8.082538583456973e-06, 'epoch': 1.13} {'loss': 0.6837, 'learning_rate': 8.082217307105205e-06, 'epoch': 1.13} {'loss': 0.5884, 'learning_rate': 8.081896032808517e-06, 'epoch': 1.13} {'loss': 0.504, 'learning_rate': 8.081574760567251e-06, 'epoch': 1.13} {'loss': 0.4935, 'learning_rate': 8.081253490381746e-06, 'epoch': 1.13} {'loss': 0.5133, 'learning_rate': 8.080932222252355e-06, 'epoch': 1.13} {'loss': 0.5558, 'learning_rate': 8.080610956179418e-06, 'epoch': 1.13} {'loss': 0.5666, 'learning_rate': 8.08028969216328e-06, 'epoch': 1.13} {'loss': 0.592, 'learning_rate': 8.079968430204281e-06, 'epoch': 1.13} {'loss': 0.654, 'learning_rate': 8.079647170302774e-06, 'epoch': 1.13} {'loss': 0.5418, 'learning_rate': 8.079325912459098e-06, 'epoch': 1.13} {'loss': 0.4203, 'learning_rate': 8.079004656673593e-06, 'epoch': 1.13} {'loss': 0.5166, 'learning_rate': 8.078683402946614e-06, 'epoch': 1.13} {'loss': 0.4964, 'learning_rate': 8.078362151278493e-06, 'epoch': 1.13} {'loss': 0.5257, 'learning_rate': 8.078040901669587e-06, 'epoch': 1.13} {'loss': 0.5862, 'learning_rate': 8.077719654120227e-06, 'epoch': 1.13} {'loss': 0.6358, 'learning_rate': 8.077398408630767e-06, 'epoch': 1.13} {'loss': 0.4957, 'learning_rate': 8.077077165201552e-06, 'epoch': 1.13} {'loss': 0.62, 'learning_rate': 8.076755923832917e-06, 'epoch': 1.13} {'loss': 0.5472, 'learning_rate': 8.076434684525212e-06, 'epoch': 1.13} {'loss': 0.6186, 'learning_rate': 8.076113447278781e-06, 'epoch': 1.13} {'loss': 0.4417, 'learning_rate': 8.075792212093971e-06, 'epoch': 1.13} {'loss': 0.543, 'learning_rate': 8.075470978971123e-06, 'epoch': 1.13} {'loss': 0.5767, 'learning_rate': 8.075149747910577e-06, 'epoch': 1.13} {'loss': 0.5539, 'learning_rate': 8.074828518912686e-06, 'epoch': 1.13} {'loss': 0.6255, 'learning_rate': 8.07450729197779e-06, 'epoch': 1.13} {'loss': 0.5993, 'learning_rate': 8.074186067106232e-06, 'epoch': 1.13} {'loss': 0.5961, 'learning_rate': 8.073864844298354e-06, 'epoch': 1.13} {'loss': 0.6659, 'learning_rate': 8.07354362355451e-06, 'epoch': 1.13} {'loss': 0.6513, 'learning_rate': 8.073222404875036e-06, 'epoch': 1.13} {'loss': 0.5406, 'learning_rate': 8.072901188260274e-06, 'epoch': 1.13} {'loss': 0.5908, 'learning_rate': 8.072579973710577e-06, 'epoch': 1.13} {'loss': 0.5975, 'learning_rate': 8.072258761226281e-06, 'epoch': 1.13} {'loss': 0.6057, 'learning_rate': 8.071937550807737e-06, 'epoch': 1.13} {'loss': 0.5815, 'learning_rate': 8.071616342455283e-06, 'epoch': 1.13} {'loss': 0.5828, 'learning_rate': 8.071295136169269e-06, 'epoch': 1.13} {'loss': 0.4689, 'learning_rate': 8.070973931950037e-06, 'epoch': 1.13} {'loss': 0.5819, 'learning_rate': 8.070652729797925e-06, 'epoch': 1.13} {'loss': 0.3693, 'learning_rate': 8.070331529713288e-06, 'epoch': 1.13} {'loss': 0.5246, 'learning_rate': 8.070010331696464e-06, 'epoch': 1.13} {'loss': 0.5299, 'learning_rate': 8.069689135747797e-06, 'epoch': 1.13} {'loss': 0.4301, 'learning_rate': 8.069367941867634e-06, 'epoch': 1.13} {'loss': 0.5225, 'learning_rate': 8.069046750056314e-06, 'epoch': 1.13} {'loss': 0.5898, 'learning_rate': 8.068725560314188e-06, 'epoch': 1.13} {'loss': 0.4592, 'learning_rate': 8.068404372641593e-06, 'epoch': 1.13} {'loss': 0.6215, 'learning_rate': 8.068083187038881e-06, 'epoch': 1.13} {'loss': 0.6462, 'learning_rate': 8.067762003506391e-06, 'epoch': 1.13} {'loss': 0.5482, 'learning_rate': 8.06744082204447e-06, 'epoch': 1.13} {'loss': 0.406, 'learning_rate': 8.06711964265346e-06, 'epoch': 1.13} {'loss': 0.5154, 'learning_rate': 8.066798465333702e-06, 'epoch': 1.13} {'loss': 0.6212, 'learning_rate': 8.066477290085549e-06, 'epoch': 1.13} {'loss': 0.6411, 'learning_rate': 8.066156116909334e-06, 'epoch': 1.13} {'loss': 0.4563, 'learning_rate': 8.065834945805413e-06, 'epoch': 1.13} {'loss': 0.5286, 'learning_rate': 8.06551377677412e-06, 'epoch': 1.13} {'loss': 0.5584, 'learning_rate': 8.065192609815809e-06, 'epoch': 1.13} {'loss': 0.6101, 'learning_rate': 8.064871444930817e-06, 'epoch': 1.13} {'loss': 0.511, 'learning_rate': 8.064550282119486e-06, 'epoch': 1.13} {'loss': 0.53, 'learning_rate': 8.064229121382168e-06, 'epoch': 1.13} {'loss': 0.4026, 'learning_rate': 8.0639079627192e-06, 'epoch': 1.13} {'loss': 0.5015, 'learning_rate': 8.063586806130933e-06, 'epoch': 1.13} {'loss': 0.5434, 'learning_rate': 8.063265651617707e-06, 'epoch': 1.13} {'loss': 0.5026, 'learning_rate': 8.062944499179864e-06, 'epoch': 1.13} {'loss': 0.4494, 'learning_rate': 8.062623348817754e-06, 'epoch': 1.13} {'loss': 0.4489, 'learning_rate': 8.062302200531712e-06, 'epoch': 1.13} {'loss': 0.4914, 'learning_rate': 8.061981054322095e-06, 'epoch': 1.13} {'loss': 0.5539, 'learning_rate': 8.061659910189234e-06, 'epoch': 1.13} {'loss': 0.6148, 'learning_rate': 8.061338768133486e-06, 'epoch': 1.13} {'loss': 0.676, 'learning_rate': 8.061017628155186e-06, 'epoch': 1.13} {'loss': 0.6659, 'learning_rate': 8.060696490254679e-06, 'epoch': 1.13} {'loss': 0.5775, 'learning_rate': 8.060375354432312e-06, 'epoch': 1.13} {'loss': 0.5859, 'learning_rate': 8.060054220688426e-06, 'epoch': 1.13} {'loss': 0.6159, 'learning_rate': 8.05973308902337e-06, 'epoch': 1.13} {'loss': 0.6427, 'learning_rate': 8.059411959437485e-06, 'epoch': 1.13} {'loss': 0.6809, 'learning_rate': 8.059090831931112e-06, 'epoch': 1.13} {'loss': 0.4934, 'learning_rate': 8.058769706504601e-06, 'epoch': 1.13} {'loss': 0.5059, 'learning_rate': 8.058448583158293e-06, 'epoch': 1.13} {'loss': 0.5328, 'learning_rate': 8.058127461892533e-06, 'epoch': 1.13} {'loss': 0.7424, 'learning_rate': 8.057806342707661e-06, 'epoch': 1.13} {'loss': 0.4768, 'learning_rate': 8.05748522560403e-06, 'epoch': 1.13} {'loss': 0.5834, 'learning_rate': 8.057164110581977e-06, 'epoch': 1.13} {'loss': 0.4831, 'learning_rate': 8.056842997641845e-06, 'epoch': 1.13} {'loss': 0.4431, 'learning_rate': 8.056521886783986e-06, 'epoch': 1.13} {'loss': 0.5814, 'learning_rate': 8.056200778008736e-06, 'epoch': 1.13} {'loss': 0.4968, 'learning_rate': 8.055879671316445e-06, 'epoch': 1.13} {'loss': 0.5179, 'learning_rate': 8.05555856670745e-06, 'epoch': 1.13} {'loss': 0.5552, 'learning_rate': 8.055237464182104e-06, 'epoch': 1.13} {'loss': 0.5477, 'learning_rate': 8.054916363740745e-06, 'epoch': 1.13} {'loss': 0.6022, 'learning_rate': 8.054595265383717e-06, 'epoch': 1.13} {'loss': 0.5092, 'learning_rate': 8.054274169111369e-06, 'epoch': 1.13} {'loss': 0.663, 'learning_rate': 8.05395307492404e-06, 'epoch': 1.13} {'loss': 0.4909, 'learning_rate': 8.053631982822076e-06, 'epoch': 1.13} {'loss': 0.5688, 'learning_rate': 8.053310892805824e-06, 'epoch': 1.13} {'loss': 0.4565, 'learning_rate': 8.052989804875618e-06, 'epoch': 1.13} {'loss': 0.585, 'learning_rate': 8.052668719031816e-06, 'epoch': 1.13} {'loss': 0.5418, 'learning_rate': 8.05234763527475e-06, 'epoch': 1.13} {'loss': 0.616, 'learning_rate': 8.05202655360477e-06, 'epoch': 1.13} {'loss': 0.6115, 'learning_rate': 8.051705474022222e-06, 'epoch': 1.13} {'loss': 0.4559, 'learning_rate': 8.051384396527448e-06, 'epoch': 1.13} {'loss': 0.5683, 'learning_rate': 8.05106332112079e-06, 'epoch': 1.13} {'loss': 0.6872, 'learning_rate': 8.050742247802593e-06, 'epoch': 1.13} {'loss': 0.6016, 'learning_rate': 8.050421176573204e-06, 'epoch': 1.13} {'loss': 0.4604, 'learning_rate': 8.05010010743296e-06, 'epoch': 1.13} {'loss': 0.4971, 'learning_rate': 8.049779040382216e-06, 'epoch': 1.13} {'loss': 0.6263, 'learning_rate': 8.049457975421303e-06, 'epoch': 1.13} {'loss': 0.6682, 'learning_rate': 8.049136912550577e-06, 'epoch': 1.13} {'loss': 0.5996, 'learning_rate': 8.048815851770376e-06, 'epoch': 1.13} {'loss': 0.494, 'learning_rate': 8.048494793081041e-06, 'epoch': 1.13} {'loss': 0.5312, 'learning_rate': 8.048173736482925e-06, 'epoch': 1.13} {'loss': 0.6793, 'learning_rate': 8.047852681976365e-06, 'epoch': 1.13} {'loss': 0.5219, 'learning_rate': 8.047531629561707e-06, 'epoch': 1.13} {'loss': 0.5897, 'learning_rate': 8.047210579239297e-06, 'epoch': 1.13} {'loss': 0.6346, 'learning_rate': 8.046889531009473e-06, 'epoch': 1.13} {'loss': 0.6573, 'learning_rate': 8.046568484872587e-06, 'epoch': 1.13} {'loss': 0.6488, 'learning_rate': 8.046247440828974e-06, 'epoch': 1.13} {'loss': 0.5507, 'learning_rate': 8.045926398878989e-06, 'epoch': 1.13} {'loss': 0.482, 'learning_rate': 8.045605359022967e-06, 'epoch': 1.13} {'loss': 0.6649, 'learning_rate': 8.045284321261257e-06, 'epoch': 1.13} {'loss': 0.6225, 'learning_rate': 8.044963285594203e-06, 'epoch': 1.13} {'loss': 0.4968, 'learning_rate': 8.044642252022142e-06, 'epoch': 1.13} {'loss': 0.5052, 'learning_rate': 8.044321220545427e-06, 'epoch': 1.13} {'loss': 0.6432, 'learning_rate': 8.044000191164394e-06, 'epoch': 1.13} {'loss': 0.5973, 'learning_rate': 8.043679163879396e-06, 'epoch': 1.13} {'loss': 0.5203, 'learning_rate': 8.043358138690771e-06, 'epoch': 1.13} {'loss': 0.7479, 'learning_rate': 8.043037115598866e-06, 'epoch': 1.13} {'loss': 0.3588, 'learning_rate': 8.042716094604025e-06, 'epoch': 1.13} {'loss': 0.4937, 'learning_rate': 8.042395075706582e-06, 'epoch': 1.13} {'loss': 0.5644, 'learning_rate': 8.042074058906897e-06, 'epoch': 1.13} {'loss': 0.5755, 'learning_rate': 8.0417530442053e-06, 'epoch': 1.13} {'loss': 0.5262, 'learning_rate': 8.041432031602147e-06, 'epoch': 1.13} {'loss': 0.5875, 'learning_rate': 8.041111021097776e-06, 'epoch': 1.13} {'loss': 0.4479, 'learning_rate': 8.04079001269253e-06, 'epoch': 1.13} {'loss': 0.5377, 'learning_rate': 8.040469006386756e-06, 'epoch': 1.13} {'loss': 0.5202, 'learning_rate': 8.04014800218079e-06, 'epoch': 1.13} {'loss': 0.5582, 'learning_rate': 8.03982700007499e-06, 'epoch': 1.13} {'loss': 0.4762, 'learning_rate': 8.039506000069685e-06, 'epoch': 1.13} {'loss': 0.6293, 'learning_rate': 8.039185002165233e-06, 'epoch': 1.13} {'loss': 0.5339, 'learning_rate': 8.03886400636197e-06, 'epoch': 1.13} {'loss': 0.5106, 'learning_rate': 8.03854301266024e-06, 'epoch': 1.13} {'loss': 0.5997, 'learning_rate': 8.038222021060389e-06, 'epoch': 1.13} {'loss': 0.6436, 'learning_rate': 8.037901031562756e-06, 'epoch': 1.13} {'loss': 0.6247, 'learning_rate': 8.037580044167694e-06, 'epoch': 1.13} {'loss': 0.4291, 'learning_rate': 8.037259058875537e-06, 'epoch': 1.13} {'loss': 0.5538, 'learning_rate': 8.03693807568664e-06, 'epoch': 1.13} {'loss': 0.6976, 'learning_rate': 8.03661709460134e-06, 'epoch': 1.13} {'loss': 0.5776, 'learning_rate': 8.03629611561998e-06, 'epoch': 1.13} {'loss': 0.6217, 'learning_rate': 8.035975138742908e-06, 'epoch': 1.13} {'loss': 0.55, 'learning_rate': 8.035654163970462e-06, 'epoch': 1.13} {'loss': 0.5678, 'learning_rate': 8.035333191302994e-06, 'epoch': 1.13} {'loss': 0.5662, 'learning_rate': 8.035012220740843e-06, 'epoch': 1.13} {'loss': 0.4472, 'learning_rate': 8.03469125228435e-06, 'epoch': 1.13} {'loss': 0.5108, 'learning_rate': 8.034370285933868e-06, 'epoch': 1.13} {'loss': 0.5608, 'learning_rate': 8.034049321689732e-06, 'epoch': 1.13} {'loss': 0.5512, 'learning_rate': 8.033728359552292e-06, 'epoch': 1.13} {'loss': 0.4307, 'learning_rate': 8.033407399521886e-06, 'epoch': 1.13} {'loss': 0.5676, 'learning_rate': 8.033086441598865e-06, 'epoch': 1.13} {'loss': 0.6822, 'learning_rate': 8.03276548578357e-06, 'epoch': 1.13} {'loss': 0.5431, 'learning_rate': 8.03244453207634e-06, 'epoch': 1.13} {'loss': 0.5361, 'learning_rate': 8.032123580477527e-06, 'epoch': 1.13} {'loss': 0.5412, 'learning_rate': 8.031802630987469e-06, 'epoch': 1.13} {'loss': 0.6525, 'learning_rate': 8.031481683606514e-06, 'epoch': 1.13} {'loss': 0.6037, 'learning_rate': 8.031160738335004e-06, 'epoch': 1.13} {'loss': 0.5024, 'learning_rate': 8.03083979517328e-06, 'epoch': 1.13} {'loss': 0.5579, 'learning_rate': 8.030518854121693e-06, 'epoch': 1.13} {'loss': 0.6197, 'learning_rate': 8.030197915180578e-06, 'epoch': 1.13} {'loss': 0.5305, 'learning_rate': 8.029876978350288e-06, 'epoch': 1.13} {'loss': 0.5495, 'learning_rate': 8.02955604363116e-06, 'epoch': 1.13} {'loss': 0.5165, 'learning_rate': 8.029235111023543e-06, 'epoch': 1.13} {'loss': 0.6797, 'learning_rate': 8.02891418052778e-06, 'epoch': 1.13} {'loss': 0.5815, 'learning_rate': 8.028593252144208e-06, 'epoch': 1.13} {'loss': 0.4281, 'learning_rate': 8.02827232587318e-06, 'epoch': 1.13} {'loss': 0.6297, 'learning_rate': 8.027951401715032e-06, 'epoch': 1.13} {'loss': 0.5865, 'learning_rate': 8.027630479670116e-06, 'epoch': 1.13} {'loss': 0.5505, 'learning_rate': 8.02730955973877e-06, 'epoch': 1.13} {'loss': 0.455, 'learning_rate': 8.026988641921342e-06, 'epoch': 1.13} {'loss': 0.5825, 'learning_rate': 8.026667726218175e-06, 'epoch': 1.13} {'loss': 0.5647, 'learning_rate': 8.026346812629607e-06, 'epoch': 1.13} {'loss': 0.5565, 'learning_rate': 8.02602590115599e-06, 'epoch': 1.13} {'loss': 0.694, 'learning_rate': 8.025704991797662e-06, 'epoch': 1.13} {'loss': 0.4206, 'learning_rate': 8.025384084554971e-06, 'epoch': 1.13} {'loss': 0.6089, 'learning_rate': 8.025063179428259e-06, 'epoch': 1.13} {'loss': 0.5015, 'learning_rate': 8.024742276417869e-06, 'epoch': 1.13} {'loss': 0.4995, 'learning_rate': 8.024421375524147e-06, 'epoch': 1.13} {'loss': 0.4453, 'learning_rate': 8.024100476747432e-06, 'epoch': 1.13} {'loss': 0.5738, 'learning_rate': 8.023779580088078e-06, 'epoch': 1.13} {'loss': 0.5868, 'learning_rate': 8.023458685546418e-06, 'epoch': 1.13} {'loss': 0.6987, 'learning_rate': 8.023137793122804e-06, 'epoch': 1.13} {'loss': 0.5405, 'learning_rate': 8.022816902817576e-06, 'epoch': 1.13} {'loss': 0.6072, 'learning_rate': 8.022496014631073e-06, 'epoch': 1.13} {'loss': 0.5784, 'learning_rate': 8.02217512856365e-06, 'epoch': 1.13} {'loss': 0.4283, 'learning_rate': 8.021854244615639e-06, 'epoch': 1.13} {'loss': 0.5489, 'learning_rate': 8.021533362787394e-06, 'epoch': 1.13} {'loss': 0.5809, 'learning_rate': 8.021212483079253e-06, 'epoch': 1.13} {'loss': 0.513, 'learning_rate': 8.020891605491563e-06, 'epoch': 1.13} {'loss': 0.3358, 'learning_rate': 8.020570730024667e-06, 'epoch': 1.13} {'loss': 0.5272, 'learning_rate': 8.020249856678903e-06, 'epoch': 1.13} {'loss': 0.5716, 'learning_rate': 8.019928985454625e-06, 'epoch': 1.13} {'loss': 0.5638, 'learning_rate': 8.019608116352168e-06, 'epoch': 1.13} {'loss': 0.713, 'learning_rate': 8.019287249371882e-06, 'epoch': 1.13} {'loss': 0.7108, 'learning_rate': 8.01896638451411e-06, 'epoch': 1.13} {'loss': 0.4912, 'learning_rate': 8.018645521779193e-06, 'epoch': 1.13} {'loss': 0.4976, 'learning_rate': 8.018324661167477e-06, 'epoch': 1.13} {'loss': 0.5556, 'learning_rate': 8.018003802679302e-06, 'epoch': 1.13} {'loss': 0.6259, 'learning_rate': 8.017682946315018e-06, 'epoch': 1.13} {'loss': 0.6527, 'learning_rate': 8.017362092074961e-06, 'epoch': 1.13} {'loss': 0.7564, 'learning_rate': 8.017041239959484e-06, 'epoch': 1.13} {'loss': 0.5396, 'learning_rate': 8.016720389968926e-06, 'epoch': 1.13} {'loss': 0.5548, 'learning_rate': 8.01639954210363e-06, 'epoch': 1.13} {'loss': 0.4049, 'learning_rate': 8.016078696363942e-06, 'epoch': 1.13} {'loss': 0.5763, 'learning_rate': 8.0157578527502e-06, 'epoch': 1.13} {'loss': 0.5808, 'learning_rate': 8.015437011262759e-06, 'epoch': 1.13} {'loss': 0.6328, 'learning_rate': 8.015116171901951e-06, 'epoch': 1.13} {'loss': 0.6565, 'learning_rate': 8.014795334668128e-06, 'epoch': 1.13} {'loss': 0.5898, 'learning_rate': 8.014474499561633e-06, 'epoch': 1.13} {'loss': 0.555, 'learning_rate': 8.014153666582805e-06, 'epoch': 1.13} {'loss': 0.6476, 'learning_rate': 8.013832835731993e-06, 'epoch': 1.13} {'loss': 0.5482, 'learning_rate': 8.013512007009533e-06, 'epoch': 1.13} {'loss': 0.5888, 'learning_rate': 8.013191180415778e-06, 'epoch': 1.13} {'loss': 0.4811, 'learning_rate': 8.01287035595107e-06, 'epoch': 1.13} {'loss': 0.5621, 'learning_rate': 8.012549533615746e-06, 'epoch': 1.13} {'loss': 0.4433, 'learning_rate': 8.012228713410158e-06, 'epoch': 1.13} {'loss': 0.6378, 'learning_rate': 8.011907895334645e-06, 'epoch': 1.13} {'loss': 0.5307, 'learning_rate': 8.011587079389553e-06, 'epoch': 1.13} {'loss': 0.5331, 'learning_rate': 8.011266265575223e-06, 'epoch': 1.13} {'loss': 0.5432, 'learning_rate': 8.010945453892003e-06, 'epoch': 1.13} {'loss': 0.5224, 'learning_rate': 8.010624644340235e-06, 'epoch': 1.13} {'loss': 0.6318, 'learning_rate': 8.010303836920258e-06, 'epoch': 1.13} {'loss': 0.5224, 'learning_rate': 8.009983031632425e-06, 'epoch': 1.13} {'loss': 0.6337, 'learning_rate': 8.009662228477071e-06, 'epoch': 1.13} {'loss': 0.5005, 'learning_rate': 8.009341427454547e-06, 'epoch': 1.13} {'loss': 0.5652, 'learning_rate': 8.009020628565188e-06, 'epoch': 1.13} {'loss': 0.6286, 'learning_rate': 8.008699831809348e-06, 'epoch': 1.13} {'loss': 0.6278, 'learning_rate': 8.008379037187366e-06, 'epoch': 1.13} {'loss': 0.5294, 'learning_rate': 8.00805824469958e-06, 'epoch': 1.13} {'loss': 0.5745, 'learning_rate': 8.007737454346346e-06, 'epoch': 1.13} {'loss': 0.6379, 'learning_rate': 8.007416666127998e-06, 'epoch': 1.13} {'loss': 0.5202, 'learning_rate': 8.007095880044885e-06, 'epoch': 1.13} {'loss': 0.5784, 'learning_rate': 8.006775096097347e-06, 'epoch': 1.13} {'loss': 0.5826, 'learning_rate': 8.006454314285728e-06, 'epoch': 1.13} {'loss': 0.5142, 'learning_rate': 8.006133534610376e-06, 'epoch': 1.13} {'loss': 0.5369, 'learning_rate': 8.005812757071628e-06, 'epoch': 1.13} {'loss': 0.6482, 'learning_rate': 8.005491981669836e-06, 'epoch': 1.13} {'loss': 0.6427, 'learning_rate': 8.005171208405336e-06, 'epoch': 1.13} {'loss': 0.496, 'learning_rate': 8.004850437278477e-06, 'epoch': 1.13} {'loss': 0.6227, 'learning_rate': 8.004529668289602e-06, 'epoch': 1.13} {'loss': 0.4829, 'learning_rate': 8.00420890143905e-06, 'epoch': 1.13} {'loss': 0.4822, 'learning_rate': 8.003888136727171e-06, 'epoch': 1.13} {'loss': 0.688, 'learning_rate': 8.003567374154304e-06, 'epoch': 1.13} {'loss': 0.6198, 'learning_rate': 8.003246613720796e-06, 'epoch': 1.13} {'loss': 0.5033, 'learning_rate': 8.00292585542699e-06, 'epoch': 1.13} {'loss': 0.4869, 'learning_rate': 8.002605099273228e-06, 'epoch': 1.13} {'loss': 0.3898, 'learning_rate': 8.00228434525986e-06, 'epoch': 1.13} {'loss': 0.4975, 'learning_rate': 8.001963593387215e-06, 'epoch': 1.13} {'loss': 0.4957, 'learning_rate': 8.001642843655654e-06, 'epoch': 1.13} {'loss': 0.4982, 'learning_rate': 8.00132209606551e-06, 'epoch': 1.13} {'loss': 0.581, 'learning_rate': 8.001001350617131e-06, 'epoch': 1.13} {'loss': 0.6193, 'learning_rate': 8.000680607310858e-06, 'epoch': 1.13} {'loss': 0.4516, 'learning_rate': 8.000359866147037e-06, 'epoch': 1.13} {'loss': 0.5297, 'learning_rate': 8.000039127126011e-06, 'epoch': 1.13} {'loss': 0.5683, 'learning_rate': 7.999718390248121e-06, 'epoch': 1.13} {'loss': 0.6211, 'learning_rate': 7.999397655513718e-06, 'epoch': 1.13} {'loss': 0.6185, 'learning_rate': 7.999076922923137e-06, 'epoch': 1.13} {'loss': 0.5396, 'learning_rate': 7.99875619247673e-06, 'epoch': 1.13} {'loss': 0.4595, 'learning_rate': 7.998435464174835e-06, 'epoch': 1.13} {'loss': 0.5184, 'learning_rate': 7.998114738017793e-06, 'epoch': 1.13} {'loss': 0.5101, 'learning_rate': 7.997794014005956e-06, 'epoch': 1.13} {'loss': 0.3085, 'learning_rate': 7.99747329213966e-06, 'epoch': 1.13} {'loss': 0.6101, 'learning_rate': 7.997152572419254e-06, 'epoch': 1.13} {'loss': 0.5905, 'learning_rate': 7.996831854845082e-06, 'epoch': 1.13} {'loss': 0.6879, 'learning_rate': 7.996511139417482e-06, 'epoch': 1.13} {'loss': 0.4877, 'learning_rate': 7.996190426136805e-06, 'epoch': 1.13} {'loss': 0.6227, 'learning_rate': 7.995869715003385e-06, 'epoch': 1.13} {'loss': 0.4529, 'learning_rate': 7.995549006017575e-06, 'epoch': 1.13} {'loss': 0.4856, 'learning_rate': 7.995228299179712e-06, 'epoch': 1.13} {'loss': 0.4847, 'learning_rate': 7.994907594490148e-06, 'epoch': 1.13} {'loss': 0.6753, 'learning_rate': 7.99458689194922e-06, 'epoch': 1.13} {'loss': 0.6678, 'learning_rate': 7.994266191557273e-06, 'epoch': 1.13} {'loss': 0.5286, 'learning_rate': 7.993945493314651e-06, 'epoch': 1.13} {'loss': 0.5021, 'learning_rate': 7.993624797221694e-06, 'epoch': 1.13} {'loss': 0.5509, 'learning_rate': 7.993304103278752e-06, 'epoch': 1.13} {'loss': 0.6018, 'learning_rate': 7.992983411486164e-06, 'epoch': 1.13} {'loss': 0.6284, 'learning_rate': 7.992662721844278e-06, 'epoch': 1.13} {'loss': 0.5327, 'learning_rate': 7.992342034353435e-06, 'epoch': 1.13} {'loss': 0.5329, 'learning_rate': 7.992021349013978e-06, 'epoch': 1.13} {'loss': 0.4925, 'learning_rate': 7.991700665826252e-06, 'epoch': 1.13} {'loss': 0.4238, 'learning_rate': 7.991379984790596e-06, 'epoch': 1.13} {'loss': 0.441, 'learning_rate': 7.991059305907363e-06, 'epoch': 1.13} {'loss': 0.6606, 'learning_rate': 7.99073862917689e-06, 'epoch': 1.13} {'loss': 0.4532, 'learning_rate': 7.990417954599518e-06, 'epoch': 1.13} {'loss': 0.5707, 'learning_rate': 7.9900972821756e-06, 'epoch': 1.13} {'loss': 0.6038, 'learning_rate': 7.98977661190547e-06, 'epoch': 1.13} {'loss': 0.4286, 'learning_rate': 7.989455943789479e-06, 'epoch': 1.13} {'loss': 0.6339, 'learning_rate': 7.989135277827962e-06, 'epoch': 1.13} {'loss': 0.4627, 'learning_rate': 7.988814614021274e-06, 'epoch': 1.13} {'loss': 0.5235, 'learning_rate': 7.988493952369752e-06, 'epoch': 1.13} {'loss': 0.3712, 'learning_rate': 7.988173292873736e-06, 'epoch': 1.13} {'loss': 0.5197, 'learning_rate': 7.987852635533578e-06, 'epoch': 1.13} {'loss': 0.5967, 'learning_rate': 7.987531980349615e-06, 'epoch': 1.13} {'loss': 0.5747, 'learning_rate': 7.987211327322197e-06, 'epoch': 1.13} {'loss': 0.5419, 'learning_rate': 7.986890676451658e-06, 'epoch': 1.13} {'loss': 0.3908, 'learning_rate': 7.986570027738352e-06, 'epoch': 1.13} {'loss': 0.5861, 'learning_rate': 7.986249381182616e-06, 'epoch': 1.13} {'loss': 0.573, 'learning_rate': 7.985928736784793e-06, 'epoch': 1.13} {'loss': 0.4738, 'learning_rate': 7.985608094545234e-06, 'epoch': 1.13} {'loss': 0.553, 'learning_rate': 7.985287454464275e-06, 'epoch': 1.13} {'loss': 0.5122, 'learning_rate': 7.984966816542266e-06, 'epoch': 1.13} {'loss': 0.577, 'learning_rate': 7.984646180779546e-06, 'epoch': 1.13} {'loss': 0.4691, 'learning_rate': 7.984325547176453e-06, 'epoch': 1.13} {'loss': 0.5885, 'learning_rate': 7.984004915733343e-06, 'epoch': 1.13} {'loss': 0.5216, 'learning_rate': 7.98368428645055e-06, 'epoch': 1.13} {'loss': 0.4188, 'learning_rate': 7.983363659328424e-06, 'epoch': 1.13} {'loss': 0.5544, 'learning_rate': 7.983043034367305e-06, 'epoch': 1.13} {'loss': 0.5588, 'learning_rate': 7.98272241156754e-06, 'epoch': 1.13} {'loss': 0.6417, 'learning_rate': 7.982401790929469e-06, 'epoch': 1.13} {'loss': 0.6123, 'learning_rate': 7.982081172453434e-06, 'epoch': 1.13} {'loss': 0.4798, 'learning_rate': 7.981760556139782e-06, 'epoch': 1.13} {'loss': 0.4439, 'learning_rate': 7.981439941988854e-06, 'epoch': 1.13} {'loss': 0.5155, 'learning_rate': 7.981119330001e-06, 'epoch': 1.13} {'loss': 0.6221, 'learning_rate': 7.980798720176554e-06, 'epoch': 1.13} {'loss': 0.5969, 'learning_rate': 7.98047811251587e-06, 'epoch': 1.13} {'loss': 0.5868, 'learning_rate': 7.980157507019283e-06, 'epoch': 1.13} {'loss': 0.6085, 'learning_rate': 7.979836903687137e-06, 'epoch': 1.13} {'loss': 0.6428, 'learning_rate': 7.979516302519781e-06, 'epoch': 1.13} {'loss': 0.4029, 'learning_rate': 7.979195703517552e-06, 'epoch': 1.13} {'loss': 0.6584, 'learning_rate': 7.978875106680804e-06, 'epoch': 1.13} {'loss': 0.5424, 'learning_rate': 7.97855451200987e-06, 'epoch': 1.13} {'loss': 0.4649, 'learning_rate': 7.978233919505098e-06, 'epoch': 1.13} {'loss': 0.524, 'learning_rate': 7.977913329166831e-06, 'epoch': 1.13} {'loss': 0.5096, 'learning_rate': 7.977592740995408e-06, 'epoch': 1.13} {'loss': 0.6561, 'learning_rate': 7.977272154991182e-06, 'epoch': 1.13} {'loss': 0.724, 'learning_rate': 7.97695157115449e-06, 'epoch': 1.13} {'loss': 0.7032, 'learning_rate': 7.976630989485676e-06, 'epoch': 1.13} {'loss': 0.5142, 'learning_rate': 7.976310409985086e-06, 'epoch': 1.13} {'loss': 0.4578, 'learning_rate': 7.975989832653061e-06, 'epoch': 1.13} {'loss': 0.564, 'learning_rate': 7.975669257489948e-06, 'epoch': 1.13} {'loss': 0.6683, 'learning_rate': 7.975348684496082e-06, 'epoch': 1.13} {'loss': 0.6283, 'learning_rate': 7.975028113671819e-06, 'epoch': 1.13} {'loss': 0.4703, 'learning_rate': 7.974707545017494e-06, 'epoch': 1.13} {'loss': 0.4958, 'learning_rate': 7.974386978533453e-06, 'epoch': 1.13} {'loss': 0.6663, 'learning_rate': 7.974066414220039e-06, 'epoch': 1.13} {'loss': 0.4826, 'learning_rate': 7.973745852077594e-06, 'epoch': 1.13} {'loss': 0.6164, 'learning_rate': 7.973425292106467e-06, 'epoch': 1.13} {'loss': 0.5712, 'learning_rate': 7.973104734306991e-06, 'epoch': 1.13} {'loss': 0.4568, 'learning_rate': 7.972784178679522e-06, 'epoch': 1.13} {'loss': 0.5243, 'learning_rate': 7.972463625224398e-06, 'epoch': 1.13} {'loss': 0.5618, 'learning_rate': 7.97214307394196e-06, 'epoch': 1.13} {'loss': 0.5487, 'learning_rate': 7.971822524832555e-06, 'epoch': 1.13} {'loss': 0.5271, 'learning_rate': 7.971501977896521e-06, 'epoch': 1.13} {'loss': 0.57, 'learning_rate': 7.971181433134211e-06, 'epoch': 1.13} {'loss': 0.4987, 'learning_rate': 7.970860890545959e-06, 'epoch': 1.13} {'loss': 0.676, 'learning_rate': 7.970540350132116e-06, 'epoch': 1.13} {'loss': 0.5858, 'learning_rate': 7.970219811893024e-06, 'epoch': 1.13} {'loss': 0.6574, 'learning_rate': 7.96989927582902e-06, 'epoch': 1.13} {'loss': 0.5344, 'learning_rate': 7.969578741940455e-06, 'epoch': 1.13} {'loss': 0.6707, 'learning_rate': 7.969258210227665e-06, 'epoch': 1.13} {'loss': 0.5375, 'learning_rate': 7.968937680691005e-06, 'epoch': 1.13} {'loss': 0.6686, 'learning_rate': 7.968617153330809e-06, 'epoch': 1.13} {'loss': 0.6443, 'learning_rate': 7.96829662814742e-06, 'epoch': 1.13} {'loss': 0.4865, 'learning_rate': 7.967976105141188e-06, 'epoch': 1.13} {'loss': 0.562, 'learning_rate': 7.967655584312452e-06, 'epoch': 1.13} {'loss': 0.52, 'learning_rate': 7.967335065661559e-06, 'epoch': 1.13} {'loss': 0.4895, 'learning_rate': 7.967014549188843e-06, 'epoch': 1.13} {'loss': 0.4754, 'learning_rate': 7.96669403489466e-06, 'epoch': 1.13} {'loss': 0.5463, 'learning_rate': 7.966373522779348e-06, 'epoch': 1.13} {'loss': 0.5559, 'learning_rate': 7.966053012843247e-06, 'epoch': 1.13} {'loss': 0.5743, 'learning_rate': 7.965732505086707e-06, 'epoch': 1.13} {'loss': 0.6184, 'learning_rate': 7.965411999510067e-06, 'epoch': 1.13} {'loss': 0.646, 'learning_rate': 7.965091496113672e-06, 'epoch': 1.13} {'loss': 0.5302, 'learning_rate': 7.96477099489786e-06, 'epoch': 1.13} {'loss': 0.6649, 'learning_rate': 7.964450495862987e-06, 'epoch': 1.13} {'loss': 0.6003, 'learning_rate': 7.964129999009389e-06, 'epoch': 1.13} {'loss': 0.6274, 'learning_rate': 7.963809504337402e-06, 'epoch': 1.13} {'loss': 0.6126, 'learning_rate': 7.963489011847385e-06, 'epoch': 1.13} {'loss': 0.608, 'learning_rate': 7.963168521539667e-06, 'epoch': 1.13} {'loss': 0.6716, 'learning_rate': 7.962848033414603e-06, 'epoch': 1.13} {'loss': 0.4755, 'learning_rate': 7.962527547472531e-06, 'epoch': 1.13} {'loss': 0.6048, 'learning_rate': 7.96220706371379e-06, 'epoch': 1.13} {'loss': 0.5507, 'learning_rate': 7.961886582138732e-06, 'epoch': 1.13} {'loss': 0.4852, 'learning_rate': 7.961566102747694e-06, 'epoch': 1.13} {'loss': 0.5059, 'learning_rate': 7.961245625541024e-06, 'epoch': 1.13} {'loss': 0.4287, 'learning_rate': 7.960925150519061e-06, 'epoch': 1.13} {'loss': 0.4857, 'learning_rate': 7.960604677682152e-06, 'epoch': 1.13} {'loss': 0.4633, 'learning_rate': 7.960284207030641e-06, 'epoch': 1.13} {'loss': 0.5108, 'learning_rate': 7.959963738564866e-06, 'epoch': 1.13} {'loss': 0.5624, 'learning_rate': 7.959643272285177e-06, 'epoch': 1.13} {'loss': 0.4053, 'learning_rate': 7.959322808191911e-06, 'epoch': 1.13} {'loss': 0.548, 'learning_rate': 7.959002346285419e-06, 'epoch': 1.13} {'loss': 0.5484, 'learning_rate': 7.958681886566037e-06, 'epoch': 1.13} {'loss': 0.5771, 'learning_rate': 7.958361429034114e-06, 'epoch': 1.13} {'loss': 0.4722, 'learning_rate': 7.95804097368999e-06, 'epoch': 1.13} {'loss': 0.6491, 'learning_rate': 7.957720520534008e-06, 'epoch': 1.13} {'loss': 0.5203, 'learning_rate': 7.957400069566514e-06, 'epoch': 1.13} {'loss': 0.6756, 'learning_rate': 7.957079620787848e-06, 'epoch': 1.13} {'loss': 0.6919, 'learning_rate': 7.956759174198359e-06, 'epoch': 1.13} {'loss': 0.5274, 'learning_rate': 7.956438729798386e-06, 'epoch': 1.13} {'loss': 0.651, 'learning_rate': 7.956118287588274e-06, 'epoch': 1.13} {'loss': 0.6378, 'learning_rate': 7.955797847568365e-06, 'epoch': 1.13} {'loss': 0.525, 'learning_rate': 7.955477409739e-06, 'epoch': 1.13} {'loss': 0.5892, 'learning_rate': 7.955156974100531e-06, 'epoch': 1.13} {'loss': 0.45, 'learning_rate': 7.95483654065329e-06, 'epoch': 1.13} {'loss': 0.5355, 'learning_rate': 7.95451610939763e-06, 'epoch': 1.13} {'loss': 0.4984, 'learning_rate': 7.954195680333892e-06, 'epoch': 1.13} {'loss': 0.5348, 'learning_rate': 7.953875253462416e-06, 'epoch': 1.13} {'loss': 0.537, 'learning_rate': 7.953554828783547e-06, 'epoch': 1.13} {'loss': 0.3269, 'learning_rate': 7.953234406297627e-06, 'epoch': 1.13} {'loss': 0.6797, 'learning_rate': 7.952913986005005e-06, 'epoch': 1.13} {'loss': 0.5646, 'learning_rate': 7.952593567906018e-06, 'epoch': 1.13} {'loss': 0.4861, 'learning_rate': 7.95227315200101e-06, 'epoch': 1.13} {'loss': 0.4645, 'learning_rate': 7.951952738290332e-06, 'epoch': 1.13} {'loss': 0.5995, 'learning_rate': 7.951632326774316e-06, 'epoch': 1.13} {'loss': 0.562, 'learning_rate': 7.951311917453315e-06, 'epoch': 1.13} {'loss': 0.5634, 'learning_rate': 7.950991510327662e-06, 'epoch': 1.13} {'loss': 0.4969, 'learning_rate': 7.950671105397713e-06, 'epoch': 1.13} {'loss': 0.4795, 'learning_rate': 7.950350702663804e-06, 'epoch': 1.13} {'loss': 0.6457, 'learning_rate': 7.950030302126277e-06, 'epoch': 1.13} {'loss': 0.6074, 'learning_rate': 7.949709903785477e-06, 'epoch': 1.13} {'loss': 0.7299, 'learning_rate': 7.949389507641748e-06, 'epoch': 1.13} {'loss': 0.5322, 'learning_rate': 7.949069113695435e-06, 'epoch': 1.13} {'loss': 0.5173, 'learning_rate': 7.948748721946878e-06, 'epoch': 1.13} {'loss': 0.5468, 'learning_rate': 7.948428332396423e-06, 'epoch': 1.13} {'loss': 0.5054, 'learning_rate': 7.948107945044414e-06, 'epoch': 1.13} {'loss': 0.6357, 'learning_rate': 7.947787559891189e-06, 'epoch': 1.13} {'loss': 0.5902, 'learning_rate': 7.947467176937098e-06, 'epoch': 1.13} {'loss': 0.4456, 'learning_rate': 7.947146796182476e-06, 'epoch': 1.13} {'loss': 0.5114, 'learning_rate': 7.946826417627676e-06, 'epoch': 1.13} {'loss': 0.6039, 'learning_rate': 7.946506041273038e-06, 'epoch': 1.13} {'loss': 0.6173, 'learning_rate': 7.946185667118898e-06, 'epoch': 1.13} {'loss': 0.5779, 'learning_rate': 7.94586529516561e-06, 'epoch': 1.13} {'loss': 0.6682, 'learning_rate': 7.945544925413513e-06, 'epoch': 1.13} {'loss': 0.46, 'learning_rate': 7.94522455786295e-06, 'epoch': 1.13} {'loss': 0.431, 'learning_rate': 7.944904192514262e-06, 'epoch': 1.13} {'loss': 0.4143, 'learning_rate': 7.944583829367796e-06, 'epoch': 1.13} {'loss': 0.4709, 'learning_rate': 7.944263468423895e-06, 'epoch': 1.13} {'loss': 0.4823, 'learning_rate': 7.943943109682897e-06, 'epoch': 1.13} {'loss': 0.4885, 'learning_rate': 7.943622753145156e-06, 'epoch': 1.13} {'loss': 0.5169, 'learning_rate': 7.943302398811004e-06, 'epoch': 1.13} {'loss': 0.4747, 'learning_rate': 7.942982046680791e-06, 'epoch': 1.13} {'loss': 0.6026, 'learning_rate': 7.942661696754856e-06, 'epoch': 1.13} {'loss': 0.4803, 'learning_rate': 7.942341349033549e-06, 'epoch': 1.13} {'loss': 0.4397, 'learning_rate': 7.942021003517208e-06, 'epoch': 1.13} {'loss': 0.5507, 'learning_rate': 7.941700660206174e-06, 'epoch': 1.13} {'loss': 0.5922, 'learning_rate': 7.941380319100796e-06, 'epoch': 1.13} {'loss': 0.5508, 'learning_rate': 7.941059980201413e-06, 'epoch': 1.13} {'loss': 0.3781, 'learning_rate': 7.940739643508372e-06, 'epoch': 1.13} {'loss': 0.6144, 'learning_rate': 7.940419309022017e-06, 'epoch': 1.13} {'loss': 0.5232, 'learning_rate': 7.940098976742682e-06, 'epoch': 1.13} {'loss': 0.5532, 'learning_rate': 7.939778646670722e-06, 'epoch': 1.13} {'loss': 0.5264, 'learning_rate': 7.93945831880647e-06, 'epoch': 1.13} {'loss': 0.6207, 'learning_rate': 7.939137993150279e-06, 'epoch': 1.13} {'loss': 0.4694, 'learning_rate': 7.938817669702486e-06, 'epoch': 1.13} {'loss': 0.6161, 'learning_rate': 7.938497348463436e-06, 'epoch': 1.13} {'loss': 0.456, 'learning_rate': 7.938177029433475e-06, 'epoch': 1.13} {'loss': 0.5264, 'learning_rate': 7.937856712612937e-06, 'epoch': 1.13} {'loss': 0.6109, 'learning_rate': 7.937536398002178e-06, 'epoch': 1.13} {'loss': 0.4962, 'learning_rate': 7.937216085601529e-06, 'epoch': 1.13} {'loss': 0.5689, 'learning_rate': 7.936895775411344e-06, 'epoch': 1.13} {'loss': 0.5582, 'learning_rate': 7.936575467431958e-06, 'epoch': 1.14} {'loss': 0.6197, 'learning_rate': 7.936255161663721e-06, 'epoch': 1.14} {'loss': 0.5923, 'learning_rate': 7.935934858106972e-06, 'epoch': 1.14} {'loss': 0.5858, 'learning_rate': 7.935614556762052e-06, 'epoch': 1.14} {'loss': 0.4959, 'learning_rate': 7.935294257629311e-06, 'epoch': 1.14} {'loss': 0.5788, 'learning_rate': 7.934973960709084e-06, 'epoch': 1.14} {'loss': 0.6504, 'learning_rate': 7.934653666001725e-06, 'epoch': 1.14} {'loss': 0.534, 'learning_rate': 7.934333373507569e-06, 'epoch': 1.14} {'loss': 0.4003, 'learning_rate': 7.93401308322696e-06, 'epoch': 1.14} {'loss': 0.4974, 'learning_rate': 7.933692795160244e-06, 'epoch': 1.14} {'loss': 0.3686, 'learning_rate': 7.933372509307758e-06, 'epoch': 1.14} {'loss': 0.5575, 'learning_rate': 7.933052225669856e-06, 'epoch': 1.14} {'loss': 0.6229, 'learning_rate': 7.932731944246869e-06, 'epoch': 1.14} {'loss': 0.5408, 'learning_rate': 7.93241166503915e-06, 'epoch': 1.14} {'loss': 0.5508, 'learning_rate': 7.93209138804704e-06, 'epoch': 1.14} {'loss': 0.4378, 'learning_rate': 7.931771113270878e-06, 'epoch': 1.14} {'loss': 0.5534, 'learning_rate': 7.931450840711012e-06, 'epoch': 1.14} {'loss': 0.6021, 'learning_rate': 7.93113057036778e-06, 'epoch': 1.14} {'loss': 0.5704, 'learning_rate': 7.930810302241531e-06, 'epoch': 1.14} {'loss': 0.5662, 'learning_rate': 7.930490036332601e-06, 'epoch': 1.14} {'loss': 0.5927, 'learning_rate': 7.930169772641344e-06, 'epoch': 1.14} {'loss': 0.5178, 'learning_rate': 7.929849511168096e-06, 'epoch': 1.14} {'loss': 0.6234, 'learning_rate': 7.9295292519132e-06, 'epoch': 1.14} {'loss': 0.624, 'learning_rate': 7.929208994877e-06, 'epoch': 1.14} {'loss': 0.6919, 'learning_rate': 7.928888740059837e-06, 'epoch': 1.14} {'loss': 0.5145, 'learning_rate': 7.92856848746206e-06, 'epoch': 1.14} {'loss': 0.5623, 'learning_rate': 7.928248237084008e-06, 'epoch': 1.14} {'loss': 0.5266, 'learning_rate': 7.927927988926022e-06, 'epoch': 1.14} {'loss': 0.4702, 'learning_rate': 7.927607742988454e-06, 'epoch': 1.14} {'loss': 0.6021, 'learning_rate': 7.927287499271637e-06, 'epoch': 1.14} {'loss': 0.6606, 'learning_rate': 7.926967257775921e-06, 'epoch': 1.14} {'loss': 0.5383, 'learning_rate': 7.926647018501642e-06, 'epoch': 1.14} {'loss': 0.7274, 'learning_rate': 7.926326781449153e-06, 'epoch': 1.14} {'loss': 0.5539, 'learning_rate': 7.926006546618792e-06, 'epoch': 1.14} {'loss': 0.624, 'learning_rate': 7.9256863140109e-06, 'epoch': 1.14} {'loss': 0.3916, 'learning_rate': 7.925366083625822e-06, 'epoch': 1.14} {'loss': 0.5454, 'learning_rate': 7.9250458554639e-06, 'epoch': 1.14} {'loss': 0.5663, 'learning_rate': 7.924725629525483e-06, 'epoch': 1.14} {'loss': 0.6013, 'learning_rate': 7.924405405810905e-06, 'epoch': 1.14} {'loss': 0.5046, 'learning_rate': 7.924085184320519e-06, 'epoch': 1.14} {'loss': 0.5703, 'learning_rate': 7.923764965054661e-06, 'epoch': 1.14} {'loss': 0.6109, 'learning_rate': 7.923444748013676e-06, 'epoch': 1.14} {'loss': 0.476, 'learning_rate': 7.923124533197909e-06, 'epoch': 1.14} {'loss': 0.6158, 'learning_rate': 7.922804320607697e-06, 'epoch': 1.14} {'loss': 0.4751, 'learning_rate': 7.922484110243392e-06, 'epoch': 1.14} {'loss': 0.5899, 'learning_rate': 7.922163902105333e-06, 'epoch': 1.14} {'loss': 0.5384, 'learning_rate': 7.921843696193859e-06, 'epoch': 1.14} {'loss': 0.5643, 'learning_rate': 7.92152349250932e-06, 'epoch': 1.14} {'loss': 0.5445, 'learning_rate': 7.921203291052053e-06, 'epoch': 1.14} {'loss': 0.6759, 'learning_rate': 7.92088309182241e-06, 'epoch': 1.14} {'loss': 0.6112, 'learning_rate': 7.920562894820721e-06, 'epoch': 1.14} {'loss': 0.4483, 'learning_rate': 7.920242700047343e-06, 'epoch': 1.14} {'loss': 0.5052, 'learning_rate': 7.919922507502611e-06, 'epoch': 1.14} {'loss': 0.7575, 'learning_rate': 7.919602317186868e-06, 'epoch': 1.14} {'loss': 0.4268, 'learning_rate': 7.91928212910046e-06, 'epoch': 1.14} {'loss': 0.6726, 'learning_rate': 7.918961943243728e-06, 'epoch': 1.14} {'loss': 0.4727, 'learning_rate': 7.918641759617019e-06, 'epoch': 1.14} {'loss': 0.4713, 'learning_rate': 7.918321578220674e-06, 'epoch': 1.14} {'loss': 0.4896, 'learning_rate': 7.918001399055028e-06, 'epoch': 1.14} {'loss': 0.5212, 'learning_rate': 7.917681222120438e-06, 'epoch': 1.14} {'loss': 0.4564, 'learning_rate': 7.917361047417236e-06, 'epoch': 1.14} {'loss': 0.6919, 'learning_rate': 7.917040874945775e-06, 'epoch': 1.14} {'loss': 0.4745, 'learning_rate': 7.916720704706387e-06, 'epoch': 1.14} {'loss': 0.5842, 'learning_rate': 7.916400536699426e-06, 'epoch': 1.14} {'loss': 0.4556, 'learning_rate': 7.916080370925229e-06, 'epoch': 1.14} {'loss': 0.6282, 'learning_rate': 7.915760207384135e-06, 'epoch': 1.14} {'loss': 0.5437, 'learning_rate': 7.915440046076497e-06, 'epoch': 1.14} {'loss': 0.4776, 'learning_rate': 7.915119887002648e-06, 'epoch': 1.14} {'loss': 0.5465, 'learning_rate': 7.914799730162943e-06, 'epoch': 1.14} {'loss': 0.5298, 'learning_rate': 7.914479575557715e-06, 'epoch': 1.14} {'loss': 0.3918, 'learning_rate': 7.91415942318731e-06, 'epoch': 1.14} {'loss': 0.5399, 'learning_rate': 7.913839273052074e-06, 'epoch': 1.14} {'loss': 0.5985, 'learning_rate': 7.913519125152342e-06, 'epoch': 1.14} {'loss': 0.5398, 'learning_rate': 7.913198979488468e-06, 'epoch': 1.14} {'loss': 0.635, 'learning_rate': 7.912878836060784e-06, 'epoch': 1.14} {'loss': 0.7134, 'learning_rate': 7.912558694869646e-06, 'epoch': 1.14} {'loss': 0.7471, 'learning_rate': 7.912238555915386e-06, 'epoch': 1.14} {'loss': 0.565, 'learning_rate': 7.911918419198351e-06, 'epoch': 1.14} {'loss': 0.523, 'learning_rate': 7.911598284718885e-06, 'epoch': 1.14} {'loss': 0.58, 'learning_rate': 7.911278152477326e-06, 'epoch': 1.14} {'loss': 0.5796, 'learning_rate': 7.910958022474026e-06, 'epoch': 1.14} {'loss': 0.5514, 'learning_rate': 7.910637894709316e-06, 'epoch': 1.14} {'loss': 0.5173, 'learning_rate': 7.910317769183553e-06, 'epoch': 1.14} {'loss': 0.5489, 'learning_rate': 7.909997645897073e-06, 'epoch': 1.14} {'loss': 0.5377, 'learning_rate': 7.909677524850217e-06, 'epoch': 1.14} {'loss': 0.591, 'learning_rate': 7.90935740604333e-06, 'epoch': 1.14} {'loss': 0.5813, 'learning_rate': 7.909037289476753e-06, 'epoch': 1.14} {'loss': 0.6142, 'learning_rate': 7.908717175150836e-06, 'epoch': 1.14} {'loss': 0.5825, 'learning_rate': 7.908397063065913e-06, 'epoch': 1.14} {'loss': 0.5462, 'learning_rate': 7.908076953222335e-06, 'epoch': 1.14} {'loss': 0.6981, 'learning_rate': 7.90775684562044e-06, 'epoch': 1.14} {'loss': 0.5358, 'learning_rate': 7.907436740260572e-06, 'epoch': 1.14} {'loss': 0.6169, 'learning_rate': 7.907116637143077e-06, 'epoch': 1.14} {'loss': 0.5941, 'learning_rate': 7.906796536268288e-06, 'epoch': 1.14} {'loss': 0.6114, 'learning_rate': 7.906476437636563e-06, 'epoch': 1.14} {'loss': 0.449, 'learning_rate': 7.906156341248236e-06, 'epoch': 1.14} {'loss': 0.5626, 'learning_rate': 7.905836247103648e-06, 'epoch': 1.14} {'loss': 0.5583, 'learning_rate': 7.90551615520315e-06, 'epoch': 1.14} {'loss': 0.6225, 'learning_rate': 7.905196065547076e-06, 'epoch': 1.14} {'loss': 0.6647, 'learning_rate': 7.904875978135778e-06, 'epoch': 1.14} {'loss': 0.6173, 'learning_rate': 7.90455589296959e-06, 'epoch': 1.14} {'loss': 0.565, 'learning_rate': 7.904235810048863e-06, 'epoch': 1.14} {'loss': 0.5651, 'learning_rate': 7.903915729373937e-06, 'epoch': 1.14} {'loss': 0.5107, 'learning_rate': 7.903595650945148e-06, 'epoch': 1.14} {'loss': 0.6639, 'learning_rate': 7.903275574762852e-06, 'epoch': 1.14} {'loss': 0.6075, 'learning_rate': 7.902955500827382e-06, 'epoch': 1.14} {'loss': 0.6389, 'learning_rate': 7.902635429139089e-06, 'epoch': 1.14} {'loss': 0.625, 'learning_rate': 7.902315359698306e-06, 'epoch': 1.14} {'loss': 0.5513, 'learning_rate': 7.901995292505384e-06, 'epoch': 1.14} {'loss': 0.4164, 'learning_rate': 7.901675227560666e-06, 'epoch': 1.14} {'loss': 0.5488, 'learning_rate': 7.901355164864488e-06, 'epoch': 1.14} {'loss': 0.4383, 'learning_rate': 7.901035104417199e-06, 'epoch': 1.14} {'loss': 0.4703, 'learning_rate': 7.90071504621914e-06, 'epoch': 1.14} {'loss': 0.6448, 'learning_rate': 7.900394990270657e-06, 'epoch': 1.14} {'loss': 0.6114, 'learning_rate': 7.900074936572088e-06, 'epoch': 1.14} {'loss': 0.5484, 'learning_rate': 7.899754885123776e-06, 'epoch': 1.14} {'loss': 0.6321, 'learning_rate': 7.899434835926069e-06, 'epoch': 1.14} {'loss': 0.7066, 'learning_rate': 7.899114788979307e-06, 'epoch': 1.14} {'loss': 0.6351, 'learning_rate': 7.898794744283832e-06, 'epoch': 1.14} {'loss': 0.6599, 'learning_rate': 7.898474701839988e-06, 'epoch': 1.14} {'loss': 0.6072, 'learning_rate': 7.898154661648119e-06, 'epoch': 1.14} {'loss': 0.6607, 'learning_rate': 7.89783462370857e-06, 'epoch': 1.14} {'loss': 0.554, 'learning_rate': 7.897514588021675e-06, 'epoch': 1.14} {'loss': 0.6681, 'learning_rate': 7.897194554587787e-06, 'epoch': 1.14} {'loss': 0.4283, 'learning_rate': 7.896874523407241e-06, 'epoch': 1.14} {'loss': 0.4897, 'learning_rate': 7.896554494480388e-06, 'epoch': 1.14} {'loss': 0.5731, 'learning_rate': 7.896234467807563e-06, 'epoch': 1.14} {'loss': 0.6112, 'learning_rate': 7.895914443389115e-06, 'epoch': 1.14} {'loss': 0.5522, 'learning_rate': 7.895594421225386e-06, 'epoch': 1.14} {'loss': 0.5739, 'learning_rate': 7.895274401316712e-06, 'epoch': 1.14} {'loss': 0.5221, 'learning_rate': 7.894954383663447e-06, 'epoch': 1.14} {'loss': 0.4941, 'learning_rate': 7.894634368265926e-06, 'epoch': 1.14} {'loss': 0.6013, 'learning_rate': 7.894314355124496e-06, 'epoch': 1.14} {'loss': 0.531, 'learning_rate': 7.8939943442395e-06, 'epoch': 1.14} {'loss': 0.7008, 'learning_rate': 7.893674335611272e-06, 'epoch': 1.14} {'loss': 0.6727, 'learning_rate': 7.893354329240169e-06, 'epoch': 1.14} {'loss': 0.6059, 'learning_rate': 7.89303432512652e-06, 'epoch': 1.14} {'loss': 0.5773, 'learning_rate': 7.89271432327068e-06, 'epoch': 1.14} {'loss': 0.5354, 'learning_rate': 7.892394323672984e-06, 'epoch': 1.14} {'loss': 0.5628, 'learning_rate': 7.892074326333782e-06, 'epoch': 1.14} {'loss': 0.5617, 'learning_rate': 7.891754331253412e-06, 'epoch': 1.14} {'loss': 0.5816, 'learning_rate': 7.891434338432214e-06, 'epoch': 1.14} {'loss': 0.6052, 'learning_rate': 7.891114347870536e-06, 'epoch': 1.14} {'loss': 0.4264, 'learning_rate': 7.890794359568716e-06, 'epoch': 1.14} {'loss': 0.4764, 'learning_rate': 7.890474373527105e-06, 'epoch': 1.14} {'loss': 0.4363, 'learning_rate': 7.890154389746043e-06, 'epoch': 1.14} {'loss': 0.5223, 'learning_rate': 7.889834408225865e-06, 'epoch': 1.14} {'loss': 0.6251, 'learning_rate': 7.889514428966925e-06, 'epoch': 1.14} {'loss': 0.4627, 'learning_rate': 7.889194451969555e-06, 'epoch': 1.14} {'loss': 0.4469, 'learning_rate': 7.88887447723411e-06, 'epoch': 1.14} {'loss': 0.4717, 'learning_rate': 7.88855450476092e-06, 'epoch': 1.14} {'loss': 0.5524, 'learning_rate': 7.888234534550338e-06, 'epoch': 1.14} {'loss': 0.5449, 'learning_rate': 7.887914566602706e-06, 'epoch': 1.14} {'loss': 0.5478, 'learning_rate': 7.88759460091836e-06, 'epoch': 1.14} {'loss': 0.5625, 'learning_rate': 7.88727463749765e-06, 'epoch': 1.14} {'loss': 0.5776, 'learning_rate': 7.886954676340913e-06, 'epoch': 1.14} {'loss': 0.5422, 'learning_rate': 7.886634717448497e-06, 'epoch': 1.14} {'loss': 0.7526, 'learning_rate': 7.886314760820739e-06, 'epoch': 1.14} {'loss': 0.471, 'learning_rate': 7.88599480645799e-06, 'epoch': 1.14} {'loss': 0.5858, 'learning_rate': 7.885674854360587e-06, 'epoch': 1.14} {'loss': 0.4561, 'learning_rate': 7.885354904528873e-06, 'epoch': 1.14} {'loss': 0.5766, 'learning_rate': 7.885034956963195e-06, 'epoch': 1.14} {'loss': 0.5024, 'learning_rate': 7.884715011663888e-06, 'epoch': 1.14} {'loss': 0.5285, 'learning_rate': 7.884395068631304e-06, 'epoch': 1.14} {'loss': 0.6573, 'learning_rate': 7.884075127865783e-06, 'epoch': 1.14} {'loss': 0.393, 'learning_rate': 7.88375518936766e-06, 'epoch': 1.14} {'loss': 0.5493, 'learning_rate': 7.88343525313729e-06, 'epoch': 1.14} {'loss': 0.5243, 'learning_rate': 7.883115319175008e-06, 'epoch': 1.14} {'loss': 0.4902, 'learning_rate': 7.88279538748116e-06, 'epoch': 1.14} {'loss': 0.5139, 'learning_rate': 7.882475458056083e-06, 'epoch': 1.14} {'loss': 0.6702, 'learning_rate': 7.88215553090013e-06, 'epoch': 1.14} {'loss': 0.5035, 'learning_rate': 7.881835606013641e-06, 'epoch': 1.14} {'loss': 0.5526, 'learning_rate': 7.88151568339695e-06, 'epoch': 1.14} {'loss': 0.4992, 'learning_rate': 7.88119576305041e-06, 'epoch': 1.14} {'loss': 0.5719, 'learning_rate': 7.880875844974357e-06, 'epoch': 1.14} {'loss': 0.614, 'learning_rate': 7.88055592916914e-06, 'epoch': 1.14} {'loss': 0.5583, 'learning_rate': 7.880236015635095e-06, 'epoch': 1.14} {'loss': 0.5326, 'learning_rate': 7.879916104372571e-06, 'epoch': 1.14} {'loss': 0.602, 'learning_rate': 7.879596195381909e-06, 'epoch': 1.14} {'loss': 0.5487, 'learning_rate': 7.879276288663447e-06, 'epoch': 1.14} {'loss': 0.5067, 'learning_rate': 7.878956384217536e-06, 'epoch': 1.14} {'loss': 0.4977, 'learning_rate': 7.878636482044514e-06, 'epoch': 1.14} {'loss': 0.5024, 'learning_rate': 7.878316582144726e-06, 'epoch': 1.14} {'loss': 0.6671, 'learning_rate': 7.877996684518511e-06, 'epoch': 1.14} {'loss': 0.3917, 'learning_rate': 7.877676789166211e-06, 'epoch': 1.14} {'loss': 0.5834, 'learning_rate': 7.877356896088177e-06, 'epoch': 1.14} {'loss': 0.534, 'learning_rate': 7.877037005284742e-06, 'epoch': 1.14} {'loss': 0.654, 'learning_rate': 7.876717116756257e-06, 'epoch': 1.14} {'loss': 0.6279, 'learning_rate': 7.87639723050306e-06, 'epoch': 1.14} {'loss': 0.4503, 'learning_rate': 7.876077346525496e-06, 'epoch': 1.14} {'loss': 0.5625, 'learning_rate': 7.875757464823908e-06, 'epoch': 1.14} {'loss': 0.4897, 'learning_rate': 7.875437585398633e-06, 'epoch': 1.14} {'loss': 0.6678, 'learning_rate': 7.875117708250024e-06, 'epoch': 1.14} {'loss': 0.4978, 'learning_rate': 7.874797833378413e-06, 'epoch': 1.14} {'loss': 0.6447, 'learning_rate': 7.87447796078415e-06, 'epoch': 1.14} {'loss': 0.4842, 'learning_rate': 7.874158090467576e-06, 'epoch': 1.14} {'loss': 0.6028, 'learning_rate': 7.873838222429036e-06, 'epoch': 1.14} {'loss': 0.466, 'learning_rate': 7.873518356668868e-06, 'epoch': 1.14} {'loss': 0.5566, 'learning_rate': 7.873198493187414e-06, 'epoch': 1.14} {'loss': 0.573, 'learning_rate': 7.872878631985024e-06, 'epoch': 1.14} {'loss': 0.4711, 'learning_rate': 7.872558773062034e-06, 'epoch': 1.14} {'loss': 0.389, 'learning_rate': 7.872238916418792e-06, 'epoch': 1.14} {'loss': 0.451, 'learning_rate': 7.871919062055636e-06, 'epoch': 1.14} {'loss': 0.5104, 'learning_rate': 7.871599209972912e-06, 'epoch': 1.14} {'loss': 0.3344, 'learning_rate': 7.871279360170962e-06, 'epoch': 1.14} {'loss': 0.7179, 'learning_rate': 7.870959512650124e-06, 'epoch': 1.14} {'loss': 0.376, 'learning_rate': 7.87063966741075e-06, 'epoch': 1.14} {'loss': 0.5505, 'learning_rate': 7.870319824453173e-06, 'epoch': 1.14} {'loss': 0.4242, 'learning_rate': 7.869999983777746e-06, 'epoch': 1.14} {'loss': 0.5129, 'learning_rate': 7.869680145384805e-06, 'epoch': 1.14} {'loss': 0.637, 'learning_rate': 7.869360309274689e-06, 'epoch': 1.14} {'loss': 0.6301, 'learning_rate': 7.869040475447752e-06, 'epoch': 1.14} {'loss': 0.5416, 'learning_rate': 7.868720643904326e-06, 'epoch': 1.14} {'loss': 0.7257, 'learning_rate': 7.868400814644761e-06, 'epoch': 1.14} {'loss': 0.6831, 'learning_rate': 7.868080987669396e-06, 'epoch': 1.14} {'loss': 0.5812, 'learning_rate': 7.867761162978574e-06, 'epoch': 1.14} {'loss': 0.4483, 'learning_rate': 7.867441340572642e-06, 'epoch': 1.14} {'loss': 0.7915, 'learning_rate': 7.867121520451932e-06, 'epoch': 1.14} {'loss': 0.6435, 'learning_rate': 7.8668017026168e-06, 'epoch': 1.14} {'loss': 0.6054, 'learning_rate': 7.866481887067578e-06, 'epoch': 1.14} {'loss': 0.5277, 'learning_rate': 7.866162073804617e-06, 'epoch': 1.14} {'loss': 0.587, 'learning_rate': 7.865842262828255e-06, 'epoch': 1.14} {'loss': 0.64, 'learning_rate': 7.865522454138834e-06, 'epoch': 1.14} {'loss': 0.6504, 'learning_rate': 7.865202647736702e-06, 'epoch': 1.14} {'loss': 0.6713, 'learning_rate': 7.864882843622192e-06, 'epoch': 1.14} {'loss': 0.4887, 'learning_rate': 7.864563041795658e-06, 'epoch': 1.14} {'loss': 0.5511, 'learning_rate': 7.864243242257433e-06, 'epoch': 1.14} {'loss': 0.6208, 'learning_rate': 7.863923445007869e-06, 'epoch': 1.14} {'loss': 0.5277, 'learning_rate': 7.863603650047302e-06, 'epoch': 1.14} {'loss': 0.38, 'learning_rate': 7.863283857376077e-06, 'epoch': 1.14} {'loss': 0.611, 'learning_rate': 7.862964066994535e-06, 'epoch': 1.14} {'loss': 0.5915, 'learning_rate': 7.862644278903018e-06, 'epoch': 1.14} {'loss': 0.4883, 'learning_rate': 7.862324493101873e-06, 'epoch': 1.14} {'loss': 0.5299, 'learning_rate': 7.862004709591443e-06, 'epoch': 1.14} {'loss': 0.4882, 'learning_rate': 7.861684928372062e-06, 'epoch': 1.14} {'loss': 0.4878, 'learning_rate': 7.861365149444083e-06, 'epoch': 1.14} {'loss': 0.6345, 'learning_rate': 7.861045372807841e-06, 'epoch': 1.14} {'loss': 0.5635, 'learning_rate': 7.860725598463686e-06, 'epoch': 1.14} {'loss': 0.5969, 'learning_rate': 7.860405826411953e-06, 'epoch': 1.14} {'loss': 0.6178, 'learning_rate': 7.860086056652988e-06, 'epoch': 1.14} {'loss': 0.5805, 'learning_rate': 7.859766289187139e-06, 'epoch': 1.14} {'loss': 0.428, 'learning_rate': 7.859446524014736e-06, 'epoch': 1.14} {'loss': 0.5296, 'learning_rate': 7.859126761136136e-06, 'epoch': 1.14} {'loss': 0.444, 'learning_rate': 7.858807000551672e-06, 'epoch': 1.14} {'loss': 0.5277, 'learning_rate': 7.858487242261691e-06, 'epoch': 1.14} {'loss': 0.5178, 'learning_rate': 7.85816748626653e-06, 'epoch': 1.14} {'loss': 0.6037, 'learning_rate': 7.85784773256654e-06, 'epoch': 1.14} {'loss': 0.6933, 'learning_rate': 7.857527981162059e-06, 'epoch': 1.14} {'loss': 0.5578, 'learning_rate': 7.857208232053428e-06, 'epoch': 1.14} {'loss': 0.5996, 'learning_rate': 7.856888485240994e-06, 'epoch': 1.14} {'loss': 0.5222, 'learning_rate': 7.856568740725097e-06, 'epoch': 1.14} {'loss': 0.5676, 'learning_rate': 7.856248998506081e-06, 'epoch': 1.14} {'loss': 0.6197, 'learning_rate': 7.855929258584288e-06, 'epoch': 1.14} {'loss': 0.5845, 'learning_rate': 7.855609520960056e-06, 'epoch': 1.14} {'loss': 0.6816, 'learning_rate': 7.855289785633735e-06, 'epoch': 1.14} {'loss': 0.6464, 'learning_rate': 7.854970052605662e-06, 'epoch': 1.14} {'loss': 0.6157, 'learning_rate': 7.854650321876185e-06, 'epoch': 1.14} {'loss': 0.5945, 'learning_rate': 7.854330593445644e-06, 'epoch': 1.14} {'loss': 0.5827, 'learning_rate': 7.854010867314382e-06, 'epoch': 1.14} {'loss': 0.6147, 'learning_rate': 7.85369114348274e-06, 'epoch': 1.14} {'loss': 0.5054, 'learning_rate': 7.85337142195106e-06, 'epoch': 1.14} {'loss': 0.4824, 'learning_rate': 7.853051702719689e-06, 'epoch': 1.14} {'loss': 0.5163, 'learning_rate': 7.852731985788963e-06, 'epoch': 1.14} {'loss': 0.6278, 'learning_rate': 7.852412271159232e-06, 'epoch': 1.14} {'loss': 0.5196, 'learning_rate': 7.852092558830833e-06, 'epoch': 1.14} {'loss': 0.5506, 'learning_rate': 7.851772848804113e-06, 'epoch': 1.14} {'loss': 0.7038, 'learning_rate': 7.851453141079413e-06, 'epoch': 1.14} {'loss': 0.5768, 'learning_rate': 7.85113343565707e-06, 'epoch': 1.14} {'loss': 0.6225, 'learning_rate': 7.850813732537437e-06, 'epoch': 1.14} {'loss': 0.5593, 'learning_rate': 7.850494031720846e-06, 'epoch': 1.14} {'loss': 0.5376, 'learning_rate': 7.850174333207647e-06, 'epoch': 1.14} {'loss': 0.6055, 'learning_rate': 7.849854636998182e-06, 'epoch': 1.14} {'loss': 0.6292, 'learning_rate': 7.849534943092788e-06, 'epoch': 1.14} {'loss': 0.6264, 'learning_rate': 7.849215251491818e-06, 'epoch': 1.14} {'loss': 0.6467, 'learning_rate': 7.8488955621956e-06, 'epoch': 1.14} {'loss': 0.5728, 'learning_rate': 7.848575875204489e-06, 'epoch': 1.14} {'loss': 0.4158, 'learning_rate': 7.848256190518822e-06, 'epoch': 1.14} {'loss': 0.6487, 'learning_rate': 7.847936508138944e-06, 'epoch': 1.14} {'loss': 0.6255, 'learning_rate': 7.847616828065194e-06, 'epoch': 1.14} {'loss': 0.502, 'learning_rate': 7.847297150297918e-06, 'epoch': 1.14} {'loss': 0.5957, 'learning_rate': 7.846977474837458e-06, 'epoch': 1.14} {'loss': 0.5646, 'learning_rate': 7.846657801684153e-06, 'epoch': 1.14} {'loss': 0.6119, 'learning_rate': 7.846338130838352e-06, 'epoch': 1.14} {'loss': 0.6675, 'learning_rate': 7.846018462300393e-06, 'epoch': 1.14} {'loss': 0.6396, 'learning_rate': 7.845698796070622e-06, 'epoch': 1.14} {'loss': 0.4975, 'learning_rate': 7.845379132149378e-06, 'epoch': 1.14} {'loss': 0.6118, 'learning_rate': 7.845059470537e-06, 'epoch': 1.14} {'loss': 0.5721, 'learning_rate': 7.84473981123384e-06, 'epoch': 1.14} {'loss': 0.5918, 'learning_rate': 7.844420154240233e-06, 'epoch': 1.14} {'loss': 0.5116, 'learning_rate': 7.844100499556525e-06, 'epoch': 1.14} {'loss': 0.5791, 'learning_rate': 7.843780847183063e-06, 'epoch': 1.14} {'loss': 0.6447, 'learning_rate': 7.84346119712018e-06, 'epoch': 1.14} {'loss': 0.6055, 'learning_rate': 7.843141549368222e-06, 'epoch': 1.14} {'loss': 0.6757, 'learning_rate': 7.842821903927532e-06, 'epoch': 1.14} {'loss': 0.6849, 'learning_rate': 7.842502260798456e-06, 'epoch': 1.14} {'loss': 0.6569, 'learning_rate': 7.84218261998133e-06, 'epoch': 1.14} {'loss': 0.4813, 'learning_rate': 7.841862981476503e-06, 'epoch': 1.14} {'loss': 0.7049, 'learning_rate': 7.841543345284316e-06, 'epoch': 1.14} {'loss': 0.4968, 'learning_rate': 7.841223711405108e-06, 'epoch': 1.14} {'loss': 0.6069, 'learning_rate': 7.840904079839224e-06, 'epoch': 1.14} {'loss': 0.6802, 'learning_rate': 7.840584450587005e-06, 'epoch': 1.14} {'loss': 0.5664, 'learning_rate': 7.840264823648795e-06, 'epoch': 1.14} {'loss': 0.5285, 'learning_rate': 7.839945199024935e-06, 'epoch': 1.14} {'loss': 0.6483, 'learning_rate': 7.839625576715772e-06, 'epoch': 1.14} {'loss': 0.4999, 'learning_rate': 7.839305956721645e-06, 'epoch': 1.14} {'loss': 0.5287, 'learning_rate': 7.838986339042895e-06, 'epoch': 1.14} {'loss': 0.5385, 'learning_rate': 7.838666723679868e-06, 'epoch': 1.14} {'loss': 0.5036, 'learning_rate': 7.8383471106329e-06, 'epoch': 1.14} {'loss': 0.6719, 'learning_rate': 7.838027499902343e-06, 'epoch': 1.14} {'loss': 0.6182, 'learning_rate': 7.837707891488533e-06, 'epoch': 1.14} {'loss': 0.5217, 'learning_rate': 7.837388285391813e-06, 'epoch': 1.14} {'loss': 0.575, 'learning_rate': 7.837068681612528e-06, 'epoch': 1.14} {'loss': 0.546, 'learning_rate': 7.83674908015102e-06, 'epoch': 1.14} {'loss': 0.5065, 'learning_rate': 7.83642948100763e-06, 'epoch': 1.14} {'loss': 0.6222, 'learning_rate': 7.836109884182698e-06, 'epoch': 1.14} {'loss': 0.5466, 'learning_rate': 7.835790289676574e-06, 'epoch': 1.14} {'loss': 0.5594, 'learning_rate': 7.835470697489595e-06, 'epoch': 1.14} {'loss': 0.497, 'learning_rate': 7.8351511076221e-06, 'epoch': 1.14} {'loss': 0.6262, 'learning_rate': 7.834831520074441e-06, 'epoch': 1.14} {'loss': 0.5269, 'learning_rate': 7.834511934846955e-06, 'epoch': 1.14} {'loss': 0.5371, 'learning_rate': 7.834192351939984e-06, 'epoch': 1.14} {'loss': 0.6039, 'learning_rate': 7.833872771353874e-06, 'epoch': 1.14} {'loss': 0.5368, 'learning_rate': 7.833553193088959e-06, 'epoch': 1.14} {'loss': 0.4423, 'learning_rate': 7.833233617145593e-06, 'epoch': 1.14} {'loss': 0.5368, 'learning_rate': 7.832914043524106e-06, 'epoch': 1.14} {'loss': 0.5647, 'learning_rate': 7.832594472224853e-06, 'epoch': 1.14} {'loss': 0.5773, 'learning_rate': 7.83227490324817e-06, 'epoch': 1.14} {'loss': 0.528, 'learning_rate': 7.831955336594399e-06, 'epoch': 1.14} {'loss': 0.6037, 'learning_rate': 7.831635772263886e-06, 'epoch': 1.14} {'loss': 0.6017, 'learning_rate': 7.831316210256965e-06, 'epoch': 1.14} {'loss': 0.5253, 'learning_rate': 7.83099665057399e-06, 'epoch': 1.14} {'loss': 0.5227, 'learning_rate': 7.830677093215293e-06, 'epoch': 1.14} {'loss': 0.7477, 'learning_rate': 7.830357538181226e-06, 'epoch': 1.14} {'loss': 0.6162, 'learning_rate': 7.830037985472125e-06, 'epoch': 1.14} {'loss': 0.6314, 'learning_rate': 7.829718435088334e-06, 'epoch': 1.14} {'loss': 0.5422, 'learning_rate': 7.829398887030198e-06, 'epoch': 1.14} {'loss': 0.5433, 'learning_rate': 7.829079341298052e-06, 'epoch': 1.14} {'loss': 0.5721, 'learning_rate': 7.828759797892248e-06, 'epoch': 1.14} {'loss': 0.5241, 'learning_rate': 7.82844025681312e-06, 'epoch': 1.14} {'loss': 0.5434, 'learning_rate': 7.828120718061016e-06, 'epoch': 1.14} {'loss': 0.4762, 'learning_rate': 7.827801181636279e-06, 'epoch': 1.14} {'loss': 0.4986, 'learning_rate': 7.827481647539245e-06, 'epoch': 1.14} {'loss': 0.3975, 'learning_rate': 7.827162115770266e-06, 'epoch': 1.14} {'loss': 0.4531, 'learning_rate': 7.826842586329671e-06, 'epoch': 1.14} {'loss': 0.4811, 'learning_rate': 7.826523059217816e-06, 'epoch': 1.14} {'loss': 0.5057, 'learning_rate': 7.826203534435038e-06, 'epoch': 1.14} {'loss': 0.5345, 'learning_rate': 7.825884011981676e-06, 'epoch': 1.14} {'loss': 0.5248, 'learning_rate': 7.825564491858077e-06, 'epoch': 1.14} {'loss': 0.4579, 'learning_rate': 7.825244974064582e-06, 'epoch': 1.14} {'loss': 0.6597, 'learning_rate': 7.824925458601536e-06, 'epoch': 1.14} {'loss': 0.5982, 'learning_rate': 7.824605945469272e-06, 'epoch': 1.14} {'loss': 0.435, 'learning_rate': 7.824286434668144e-06, 'epoch': 1.14} {'loss': 0.6639, 'learning_rate': 7.823966926198488e-06, 'epoch': 1.14} {'loss': 0.6405, 'learning_rate': 7.82364742006065e-06, 'epoch': 1.14} {'loss': 0.5076, 'learning_rate': 7.823327916254967e-06, 'epoch': 1.14} {'loss': 0.5466, 'learning_rate': 7.823008414781787e-06, 'epoch': 1.14} {'loss': 0.4693, 'learning_rate': 7.82268891564145e-06, 'epoch': 1.14} {'loss': 0.6397, 'learning_rate': 7.822369418834294e-06, 'epoch': 1.14} {'loss': 0.5367, 'learning_rate': 7.82204992436067e-06, 'epoch': 1.14} {'loss': 0.4383, 'learning_rate': 7.821730432220918e-06, 'epoch': 1.14} {'loss': 0.5868, 'learning_rate': 7.821410942415374e-06, 'epoch': 1.14} {'loss': 0.6513, 'learning_rate': 7.821091454944388e-06, 'epoch': 1.14} {'loss': 0.4673, 'learning_rate': 7.820771969808295e-06, 'epoch': 1.14} {'loss': 0.5372, 'learning_rate': 7.820452487007445e-06, 'epoch': 1.14} {'loss': 0.5859, 'learning_rate': 7.820133006542174e-06, 'epoch': 1.14} {'loss': 0.5036, 'learning_rate': 7.81981352841283e-06, 'epoch': 1.14} {'loss': 0.5273, 'learning_rate': 7.819494052619754e-06, 'epoch': 1.14} {'loss': 0.5735, 'learning_rate': 7.819174579163284e-06, 'epoch': 1.14} {'loss': 0.5888, 'learning_rate': 7.818855108043768e-06, 'epoch': 1.14} {'loss': 0.419, 'learning_rate': 7.818535639261541e-06, 'epoch': 1.14} {'loss': 0.5179, 'learning_rate': 7.818216172816954e-06, 'epoch': 1.14} {'loss': 0.4331, 'learning_rate': 7.81789670871034e-06, 'epoch': 1.14} {'loss': 0.7626, 'learning_rate': 7.817577246942052e-06, 'epoch': 1.14} {'loss': 0.7367, 'learning_rate': 7.817257787512426e-06, 'epoch': 1.14} {'loss': 0.6222, 'learning_rate': 7.816938330421807e-06, 'epoch': 1.14} {'loss': 0.4454, 'learning_rate': 7.816618875670533e-06, 'epoch': 1.14} {'loss': 0.4303, 'learning_rate': 7.816299423258946e-06, 'epoch': 1.14} {'loss': 0.4947, 'learning_rate': 7.815979973187397e-06, 'epoch': 1.14} {'loss': 0.4685, 'learning_rate': 7.81566052545622e-06, 'epoch': 1.14} {'loss': 0.6217, 'learning_rate': 7.815341080065759e-06, 'epoch': 1.14} {'loss': 0.4634, 'learning_rate': 7.815021637016359e-06, 'epoch': 1.14} {'loss': 0.5025, 'learning_rate': 7.81470219630836e-06, 'epoch': 1.14} {'loss': 0.494, 'learning_rate': 7.814382757942105e-06, 'epoch': 1.14} {'loss': 0.4422, 'learning_rate': 7.814063321917934e-06, 'epoch': 1.14} {'loss': 0.5378, 'learning_rate': 7.813743888236195e-06, 'epoch': 1.14} {'loss': 0.605, 'learning_rate': 7.813424456897225e-06, 'epoch': 1.14} {'loss': 0.5475, 'learning_rate': 7.813105027901365e-06, 'epoch': 1.14} {'loss': 0.5942, 'learning_rate': 7.812785601248965e-06, 'epoch': 1.14} {'loss': 0.5952, 'learning_rate': 7.81246617694036e-06, 'epoch': 1.14} {'loss': 0.6116, 'learning_rate': 7.812146754975897e-06, 'epoch': 1.14} {'loss': 0.4822, 'learning_rate': 7.811827335355913e-06, 'epoch': 1.14} {'loss': 0.4582, 'learning_rate': 7.811507918080757e-06, 'epoch': 1.14} {'loss': 0.5709, 'learning_rate': 7.811188503150767e-06, 'epoch': 1.14} {'loss': 0.5038, 'learning_rate': 7.810869090566283e-06, 'epoch': 1.14} {'loss': 0.636, 'learning_rate': 7.810549680327654e-06, 'epoch': 1.14} {'loss': 0.5137, 'learning_rate': 7.810230272435217e-06, 'epoch': 1.14} {'loss': 0.5928, 'learning_rate': 7.80991086688932e-06, 'epoch': 1.14} {'loss': 0.5822, 'learning_rate': 7.809591463690297e-06, 'epoch': 1.14} {'loss': 0.4932, 'learning_rate': 7.809272062838493e-06, 'epoch': 1.14} {'loss': 0.4511, 'learning_rate': 7.808952664334254e-06, 'epoch': 1.14} {'loss': 0.6156, 'learning_rate': 7.808633268177916e-06, 'epoch': 1.14} {'loss': 0.6941, 'learning_rate': 7.808313874369831e-06, 'epoch': 1.14} {'loss': 0.57, 'learning_rate': 7.807994482910333e-06, 'epoch': 1.14} {'loss': 0.4121, 'learning_rate': 7.80767509379977e-06, 'epoch': 1.14} {'loss': 0.6845, 'learning_rate': 7.807355707038477e-06, 'epoch': 1.14} {'loss': 0.3942, 'learning_rate': 7.8070363226268e-06, 'epoch': 1.14} {'loss': 0.5824, 'learning_rate': 7.806716940565085e-06, 'epoch': 1.14} {'loss': 0.5792, 'learning_rate': 7.806397560853664e-06, 'epoch': 1.14} {'loss': 0.4267, 'learning_rate': 7.806078183492893e-06, 'epoch': 1.14} {'loss': 0.6254, 'learning_rate': 7.805758808483103e-06, 'epoch': 1.14} {'loss': 0.4956, 'learning_rate': 7.805439435824645e-06, 'epoch': 1.14} {'loss': 0.4049, 'learning_rate': 7.805120065517855e-06, 'epoch': 1.14} {'loss': 0.486, 'learning_rate': 7.804800697563072e-06, 'epoch': 1.14} {'loss': 0.5538, 'learning_rate': 7.804481331960651e-06, 'epoch': 1.14} {'loss': 0.5263, 'learning_rate': 7.80416196871092e-06, 'epoch': 1.14} {'loss': 0.4764, 'learning_rate': 7.80384260781423e-06, 'epoch': 1.14} {'loss': 0.5465, 'learning_rate': 7.803523249270924e-06, 'epoch': 1.14} {'loss': 0.4821, 'learning_rate': 7.803203893081338e-06, 'epoch': 1.14} {'loss': 0.5321, 'learning_rate': 7.802884539245817e-06, 'epoch': 1.14} {'loss': 0.5399, 'learning_rate': 7.802565187764702e-06, 'epoch': 1.14} {'loss': 0.4925, 'learning_rate': 7.80224583863834e-06, 'epoch': 1.14} {'loss': 0.5651, 'learning_rate': 7.801926491867067e-06, 'epoch': 1.14} {'loss': 0.4395, 'learning_rate': 7.80160714745123e-06, 'epoch': 1.14} {'loss': 0.5948, 'learning_rate': 7.801287805391172e-06, 'epoch': 1.14} {'loss': 0.5831, 'learning_rate': 7.800968465687228e-06, 'epoch': 1.14} {'loss': 0.5381, 'learning_rate': 7.800649128339747e-06, 'epoch': 1.14} {'loss': 0.4804, 'learning_rate': 7.800329793349066e-06, 'epoch': 1.14} {'loss': 0.5441, 'learning_rate': 7.800010460715535e-06, 'epoch': 1.14} {'loss': 0.6656, 'learning_rate': 7.79969113043949e-06, 'epoch': 1.14} {'loss': 0.4567, 'learning_rate': 7.799371802521272e-06, 'epoch': 1.14} {'loss': 0.5755, 'learning_rate': 7.799052476961227e-06, 'epoch': 1.14} {'loss': 0.565, 'learning_rate': 7.798733153759696e-06, 'epoch': 1.14} {'loss': 0.5933, 'learning_rate': 7.798413832917023e-06, 'epoch': 1.14} {'loss': 0.5054, 'learning_rate': 7.798094514433544e-06, 'epoch': 1.14} {'loss': 0.3762, 'learning_rate': 7.79777519830961e-06, 'epoch': 1.14} {'loss': 0.568, 'learning_rate': 7.797455884545558e-06, 'epoch': 1.14} {'loss': 0.4278, 'learning_rate': 7.797136573141729e-06, 'epoch': 1.14} {'loss': 0.5836, 'learning_rate': 7.796817264098465e-06, 'epoch': 1.14} {'loss': 0.6617, 'learning_rate': 7.796497957416113e-06, 'epoch': 1.14} {'loss': 0.5643, 'learning_rate': 7.796178653095013e-06, 'epoch': 1.14} {'loss': 0.5158, 'learning_rate': 7.795859351135503e-06, 'epoch': 1.14} {'loss': 0.6834, 'learning_rate': 7.795540051537933e-06, 'epoch': 1.14} {'loss': 0.5381, 'learning_rate': 7.795220754302639e-06, 'epoch': 1.14} {'loss': 0.543, 'learning_rate': 7.794901459429964e-06, 'epoch': 1.14} {'loss': 0.4873, 'learning_rate': 7.794582166920255e-06, 'epoch': 1.14} {'loss': 0.6117, 'learning_rate': 7.794262876773843e-06, 'epoch': 1.14} {'loss': 0.6959, 'learning_rate': 7.793943588991085e-06, 'epoch': 1.14} {'loss': 0.5679, 'learning_rate': 7.793624303572312e-06, 'epoch': 1.14} {'loss': 0.5457, 'learning_rate': 7.793305020517868e-06, 'epoch': 1.14} {'loss': 0.6236, 'learning_rate': 7.792985739828099e-06, 'epoch': 1.14} {'loss': 0.6272, 'learning_rate': 7.792666461503344e-06, 'epoch': 1.14} {'loss': 0.6297, 'learning_rate': 7.79234718554395e-06, 'epoch': 1.14} {'loss': 0.5037, 'learning_rate': 7.792027911950248e-06, 'epoch': 1.14} {'loss': 0.4761, 'learning_rate': 7.791708640722593e-06, 'epoch': 1.14} {'loss': 0.5087, 'learning_rate': 7.791389371861321e-06, 'epoch': 1.14} {'loss': 0.5002, 'learning_rate': 7.791070105366772e-06, 'epoch': 1.14} {'loss': 0.4953, 'learning_rate': 7.790750841239293e-06, 'epoch': 1.14} {'loss': 0.5895, 'learning_rate': 7.790431579479221e-06, 'epoch': 1.14} {'loss': 0.5104, 'learning_rate': 7.790112320086905e-06, 'epoch': 1.14} {'loss': 0.5026, 'learning_rate': 7.789793063062679e-06, 'epoch': 1.14} {'loss': 0.6048, 'learning_rate': 7.789473808406893e-06, 'epoch': 1.14} {'loss': 0.5977, 'learning_rate': 7.789154556119885e-06, 'epoch': 1.14} {'loss': 0.5355, 'learning_rate': 7.788835306201993e-06, 'epoch': 1.14} {'loss': 0.5744, 'learning_rate': 7.78851605865357e-06, 'epoch': 1.14} {'loss': 0.507, 'learning_rate': 7.788196813474947e-06, 'epoch': 1.14} {'loss': 0.4935, 'learning_rate': 7.787877570666474e-06, 'epoch': 1.14} {'loss': 0.615, 'learning_rate': 7.787558330228488e-06, 'epoch': 1.14} {'loss': 0.5567, 'learning_rate': 7.78723909216133e-06, 'epoch': 1.14} {'loss': 0.4795, 'learning_rate': 7.78691985646535e-06, 'epoch': 1.14} {'loss': 0.5821, 'learning_rate': 7.786600623140881e-06, 'epoch': 1.14} {'loss': 0.6274, 'learning_rate': 7.786281392188272e-06, 'epoch': 1.14} {'loss': 0.5399, 'learning_rate': 7.78596216360786e-06, 'epoch': 1.14} {'loss': 0.5647, 'learning_rate': 7.785642937399993e-06, 'epoch': 1.14} {'loss': 0.5936, 'learning_rate': 7.78532371356501e-06, 'epoch': 1.14} {'loss': 0.5361, 'learning_rate': 7.785004492103247e-06, 'epoch': 1.14} {'loss': 0.6336, 'learning_rate': 7.784685273015054e-06, 'epoch': 1.14} {'loss': 0.6336, 'learning_rate': 7.784366056300769e-06, 'epoch': 1.14} {'loss': 0.5366, 'learning_rate': 7.784046841960739e-06, 'epoch': 1.14} {'loss': 0.639, 'learning_rate': 7.783727629995302e-06, 'epoch': 1.14} {'loss': 0.5007, 'learning_rate': 7.783408420404802e-06, 'epoch': 1.14} {'loss': 0.4821, 'learning_rate': 7.78308921318958e-06, 'epoch': 1.14} {'loss': 0.4655, 'learning_rate': 7.782770008349974e-06, 'epoch': 1.15} {'loss': 0.5998, 'learning_rate': 7.782450805886333e-06, 'epoch': 1.15} {'loss': 0.5144, 'learning_rate': 7.782131605798993e-06, 'epoch': 1.15} {'loss': 0.5924, 'learning_rate': 7.781812408088304e-06, 'epoch': 1.15} {'loss': 0.7187, 'learning_rate': 7.781493212754602e-06, 'epoch': 1.15} {'loss': 0.3071, 'learning_rate': 7.78117401979823e-06, 'epoch': 1.15} {'loss': 0.5696, 'learning_rate': 7.78085482921953e-06, 'epoch': 1.15} {'loss': 0.5993, 'learning_rate': 7.780535641018841e-06, 'epoch': 1.15} {'loss': 0.519, 'learning_rate': 7.780216455196513e-06, 'epoch': 1.15} {'loss': 0.5538, 'learning_rate': 7.779897271752879e-06, 'epoch': 1.15} {'loss': 0.5521, 'learning_rate': 7.77957809068829e-06, 'epoch': 1.15} {'loss': 0.6821, 'learning_rate': 7.779258912003082e-06, 'epoch': 1.15} {'loss': 0.5394, 'learning_rate': 7.778939735697598e-06, 'epoch': 1.15} {'loss': 0.435, 'learning_rate': 7.778620561772181e-06, 'epoch': 1.15} {'loss': 0.6454, 'learning_rate': 7.778301390227172e-06, 'epoch': 1.15} {'loss': 0.6044, 'learning_rate': 7.777982221062914e-06, 'epoch': 1.15} {'loss': 0.5945, 'learning_rate': 7.777663054279745e-06, 'epoch': 1.15} {'loss': 0.4134, 'learning_rate': 7.777343889878017e-06, 'epoch': 1.15} {'loss': 0.5681, 'learning_rate': 7.777024727858064e-06, 'epoch': 1.15} {'loss': 0.5423, 'learning_rate': 7.776705568220228e-06, 'epoch': 1.15} {'loss': 0.6323, 'learning_rate': 7.776386410964854e-06, 'epoch': 1.15} {'loss': 0.588, 'learning_rate': 7.77606725609228e-06, 'epoch': 1.15} {'loss': 0.6585, 'learning_rate': 7.775748103602853e-06, 'epoch': 1.15} {'loss': 0.5809, 'learning_rate': 7.775428953496913e-06, 'epoch': 1.15} {'loss': 0.4539, 'learning_rate': 7.775109805774798e-06, 'epoch': 1.15} {'loss': 0.6427, 'learning_rate': 7.774790660436857e-06, 'epoch': 1.15} {'loss': 0.4718, 'learning_rate': 7.774471517483428e-06, 'epoch': 1.15} {'loss': 0.5895, 'learning_rate': 7.774152376914855e-06, 'epoch': 1.15} {'loss': 0.4562, 'learning_rate': 7.773833238731474e-06, 'epoch': 1.15} {'loss': 0.5404, 'learning_rate': 7.773514102933635e-06, 'epoch': 1.15} {'loss': 0.5568, 'learning_rate': 7.77319496952168e-06, 'epoch': 1.15} {'loss': 0.5555, 'learning_rate': 7.772875838495942e-06, 'epoch': 1.15} {'loss': 0.6436, 'learning_rate': 7.77255670985677e-06, 'epoch': 1.15} {'loss': 0.5831, 'learning_rate': 7.772237583604506e-06, 'epoch': 1.15} {'loss': 0.5781, 'learning_rate': 7.771918459739489e-06, 'epoch': 1.15} {'loss': 0.5282, 'learning_rate': 7.771599338262065e-06, 'epoch': 1.15} {'loss': 0.6687, 'learning_rate': 7.771280219172569e-06, 'epoch': 1.15} {'loss': 0.502, 'learning_rate': 7.770961102471351e-06, 'epoch': 1.15} {'loss': 0.6403, 'learning_rate': 7.770641988158747e-06, 'epoch': 1.15} {'loss': 0.6685, 'learning_rate': 7.770322876235105e-06, 'epoch': 1.15} {'loss': 0.7123, 'learning_rate': 7.770003766700758e-06, 'epoch': 1.15} {'loss': 0.545, 'learning_rate': 7.769684659556057e-06, 'epoch': 1.15} {'loss': 0.7817, 'learning_rate': 7.76936555480134e-06, 'epoch': 1.15} {'loss': 0.541, 'learning_rate': 7.769046452436945e-06, 'epoch': 1.15} {'loss': 0.6181, 'learning_rate': 7.768727352463223e-06, 'epoch': 1.15} {'loss': 0.5301, 'learning_rate': 7.76840825488051e-06, 'epoch': 1.15} {'loss': 0.5014, 'learning_rate': 7.768089159689149e-06, 'epoch': 1.15} {'loss': 0.5052, 'learning_rate': 7.76777006688948e-06, 'epoch': 1.15} {'loss': 0.7168, 'learning_rate': 7.767450976481848e-06, 'epoch': 1.15} {'loss': 0.5358, 'learning_rate': 7.767131888466596e-06, 'epoch': 1.15} {'loss': 0.6102, 'learning_rate': 7.76681280284406e-06, 'epoch': 1.15} {'loss': 0.5405, 'learning_rate': 7.766493719614587e-06, 'epoch': 1.15} {'loss': 0.5416, 'learning_rate': 7.766174638778517e-06, 'epoch': 1.15} {'loss': 0.4939, 'learning_rate': 7.765855560336194e-06, 'epoch': 1.15} {'loss': 0.5631, 'learning_rate': 7.765536484287961e-06, 'epoch': 1.15} {'loss': 0.6097, 'learning_rate': 7.76521741063415e-06, 'epoch': 1.15} {'loss': 0.5299, 'learning_rate': 7.764898339375118e-06, 'epoch': 1.15} {'loss': 0.5423, 'learning_rate': 7.764579270511193e-06, 'epoch': 1.15} {'loss': 0.5031, 'learning_rate': 7.764260204042726e-06, 'epoch': 1.15} {'loss': 0.4216, 'learning_rate': 7.763941139970054e-06, 'epoch': 1.15} {'loss': 0.5966, 'learning_rate': 7.763622078293525e-06, 'epoch': 1.15} {'loss': 0.6395, 'learning_rate': 7.763303019013475e-06, 'epoch': 1.15} {'loss': 0.6646, 'learning_rate': 7.762983962130244e-06, 'epoch': 1.15} {'loss': 0.4656, 'learning_rate': 7.762664907644181e-06, 'epoch': 1.15} {'loss': 0.5411, 'learning_rate': 7.762345855555622e-06, 'epoch': 1.15} {'loss': 0.592, 'learning_rate': 7.762026805864916e-06, 'epoch': 1.15} {'loss': 0.5796, 'learning_rate': 7.761707758572397e-06, 'epoch': 1.15} {'loss': 0.5351, 'learning_rate': 7.761388713678412e-06, 'epoch': 1.15} {'loss': 0.5301, 'learning_rate': 7.761069671183301e-06, 'epoch': 1.15} {'loss': 0.6167, 'learning_rate': 7.760750631087402e-06, 'epoch': 1.15} {'loss': 0.6499, 'learning_rate': 7.760431593391065e-06, 'epoch': 1.15} {'loss': 0.6736, 'learning_rate': 7.760112558094623e-06, 'epoch': 1.15} {'loss': 0.6319, 'learning_rate': 7.759793525198428e-06, 'epoch': 1.15} {'loss': 0.4339, 'learning_rate': 7.759474494702816e-06, 'epoch': 1.15} {'loss': 0.5494, 'learning_rate': 7.759155466608127e-06, 'epoch': 1.15} {'loss': 0.5119, 'learning_rate': 7.758836440914706e-06, 'epoch': 1.15} {'loss': 0.5756, 'learning_rate': 7.758517417622891e-06, 'epoch': 1.15} {'loss': 0.5009, 'learning_rate': 7.75819839673303e-06, 'epoch': 1.15} {'loss': 0.5549, 'learning_rate': 7.75787937824546e-06, 'epoch': 1.15} {'loss': 0.4171, 'learning_rate': 7.757560362160528e-06, 'epoch': 1.15} {'loss': 0.5707, 'learning_rate': 7.757241348478572e-06, 'epoch': 1.15} {'loss': 0.688, 'learning_rate': 7.756922337199932e-06, 'epoch': 1.15} {'loss': 0.5293, 'learning_rate': 7.756603328324954e-06, 'epoch': 1.15} {'loss': 0.5112, 'learning_rate': 7.756284321853973e-06, 'epoch': 1.15} {'loss': 0.5395, 'learning_rate': 7.755965317787342e-06, 'epoch': 1.15} {'loss': 0.4846, 'learning_rate': 7.755646316125391e-06, 'epoch': 1.15} {'loss': 0.4014, 'learning_rate': 7.755327316868474e-06, 'epoch': 1.15} {'loss': 0.573, 'learning_rate': 7.755008320016923e-06, 'epoch': 1.15} {'loss': 0.4392, 'learning_rate': 7.754689325571085e-06, 'epoch': 1.15} {'loss': 0.5325, 'learning_rate': 7.7543703335313e-06, 'epoch': 1.15} {'loss': 0.4541, 'learning_rate': 7.754051343897904e-06, 'epoch': 1.15} {'loss': 0.5702, 'learning_rate': 7.753732356671252e-06, 'epoch': 1.15} {'loss': 0.5773, 'learning_rate': 7.753413371851677e-06, 'epoch': 1.15} {'loss': 0.4823, 'learning_rate': 7.753094389439517e-06, 'epoch': 1.15} {'loss': 0.6013, 'learning_rate': 7.752775409435125e-06, 'epoch': 1.15} {'loss': 0.5645, 'learning_rate': 7.752456431838835e-06, 'epoch': 1.15} {'loss': 0.6048, 'learning_rate': 7.752137456650992e-06, 'epoch': 1.15} {'loss': 0.5648, 'learning_rate': 7.751818483871933e-06, 'epoch': 1.15} {'loss': 0.6363, 'learning_rate': 7.751499513502007e-06, 'epoch': 1.15} {'loss': 0.6249, 'learning_rate': 7.751180545541553e-06, 'epoch': 1.15} {'loss': 0.4155, 'learning_rate': 7.750861579990909e-06, 'epoch': 1.15} {'loss': 0.3955, 'learning_rate': 7.750542616850422e-06, 'epoch': 1.15} {'loss': 0.4788, 'learning_rate': 7.750223656120429e-06, 'epoch': 1.15} {'loss': 0.4944, 'learning_rate': 7.749904697801278e-06, 'epoch': 1.15} {'loss': 0.6041, 'learning_rate': 7.749585741893302e-06, 'epoch': 1.15} {'loss': 0.484, 'learning_rate': 7.749266788396853e-06, 'epoch': 1.15} {'loss': 0.5761, 'learning_rate': 7.748947837312267e-06, 'epoch': 1.15} {'loss': 0.6761, 'learning_rate': 7.748628888639886e-06, 'epoch': 1.15} {'loss': 0.5696, 'learning_rate': 7.74830994238005e-06, 'epoch': 1.15} {'loss': 0.5067, 'learning_rate': 7.747990998533105e-06, 'epoch': 1.15} {'loss': 0.6644, 'learning_rate': 7.747672057099393e-06, 'epoch': 1.15} {'loss': 0.664, 'learning_rate': 7.747353118079252e-06, 'epoch': 1.15} {'loss': 0.5427, 'learning_rate': 7.747034181473023e-06, 'epoch': 1.15} {'loss': 0.6672, 'learning_rate': 7.746715247281053e-06, 'epoch': 1.15} {'loss': 0.5084, 'learning_rate': 7.746396315503681e-06, 'epoch': 1.15} {'loss': 0.4766, 'learning_rate': 7.746077386141249e-06, 'epoch': 1.15} {'loss': 0.5948, 'learning_rate': 7.745758459194096e-06, 'epoch': 1.15} {'loss': 0.395, 'learning_rate': 7.745439534662567e-06, 'epoch': 1.15} {'loss': 0.5007, 'learning_rate': 7.745120612547005e-06, 'epoch': 1.15} {'loss': 0.5608, 'learning_rate': 7.744801692847747e-06, 'epoch': 1.15} {'loss': 0.6736, 'learning_rate': 7.744482775565141e-06, 'epoch': 1.15} {'loss': 0.5385, 'learning_rate': 7.744163860699522e-06, 'epoch': 1.15} {'loss': 0.5094, 'learning_rate': 7.743844948251239e-06, 'epoch': 1.15} {'loss': 0.535, 'learning_rate': 7.743526038220628e-06, 'epoch': 1.15} {'loss': 0.5829, 'learning_rate': 7.743207130608028e-06, 'epoch': 1.15} {'loss': 0.5488, 'learning_rate': 7.74288822541379e-06, 'epoch': 1.15} {'loss': 0.539, 'learning_rate': 7.742569322638247e-06, 'epoch': 1.15} {'loss': 0.5225, 'learning_rate': 7.742250422281749e-06, 'epoch': 1.15} {'loss': 0.5748, 'learning_rate': 7.741931524344632e-06, 'epoch': 1.15} {'loss': 0.6528, 'learning_rate': 7.741612628827241e-06, 'epoch': 1.15} {'loss': 0.5872, 'learning_rate': 7.741293735729915e-06, 'epoch': 1.15} {'loss': 0.5003, 'learning_rate': 7.740974845052994e-06, 'epoch': 1.15} {'loss': 0.4766, 'learning_rate': 7.740655956796825e-06, 'epoch': 1.15} {'loss': 0.6691, 'learning_rate': 7.740337070961744e-06, 'epoch': 1.15} {'loss': 0.5683, 'learning_rate': 7.7400181875481e-06, 'epoch': 1.15} {'loss': 0.4982, 'learning_rate': 7.739699306556228e-06, 'epoch': 1.15} {'loss': 0.7759, 'learning_rate': 7.739380427986474e-06, 'epoch': 1.15} {'loss': 0.479, 'learning_rate': 7.739061551839177e-06, 'epoch': 1.15} {'loss': 0.4789, 'learning_rate': 7.738742678114677e-06, 'epoch': 1.15} {'loss': 0.6177, 'learning_rate': 7.738423806813322e-06, 'epoch': 1.15} {'loss': 0.5648, 'learning_rate': 7.738104937935446e-06, 'epoch': 1.15} {'loss': 0.6105, 'learning_rate': 7.737786071481397e-06, 'epoch': 1.15} {'loss': 0.5008, 'learning_rate': 7.737467207451516e-06, 'epoch': 1.15} {'loss': 0.5109, 'learning_rate': 7.737148345846143e-06, 'epoch': 1.15} {'loss': 0.4176, 'learning_rate': 7.736829486665619e-06, 'epoch': 1.15} {'loss': 0.5522, 'learning_rate': 7.736510629910283e-06, 'epoch': 1.15} {'loss': 0.4931, 'learning_rate': 7.736191775580484e-06, 'epoch': 1.15} {'loss': 0.6443, 'learning_rate': 7.735872923676557e-06, 'epoch': 1.15} {'loss': 0.6964, 'learning_rate': 7.73555407419885e-06, 'epoch': 1.15} {'loss': 0.4966, 'learning_rate': 7.735235227147701e-06, 'epoch': 1.15} {'loss': 0.4459, 'learning_rate': 7.73491638252345e-06, 'epoch': 1.15} {'loss': 0.5413, 'learning_rate': 7.734597540326443e-06, 'epoch': 1.15} {'loss': 0.5813, 'learning_rate': 7.734278700557015e-06, 'epoch': 1.15} {'loss': 0.6566, 'learning_rate': 7.733959863215514e-06, 'epoch': 1.15} {'loss': 0.5652, 'learning_rate': 7.733641028302278e-06, 'epoch': 1.15} {'loss': 0.5963, 'learning_rate': 7.733322195817652e-06, 'epoch': 1.15} {'loss': 0.5736, 'learning_rate': 7.733003365761978e-06, 'epoch': 1.15} {'loss': 0.6078, 'learning_rate': 7.732684538135592e-06, 'epoch': 1.15} {'loss': 0.6439, 'learning_rate': 7.732365712938841e-06, 'epoch': 1.15} {'loss': 0.6396, 'learning_rate': 7.732046890172063e-06, 'epoch': 1.15} {'loss': 0.4336, 'learning_rate': 7.731728069835604e-06, 'epoch': 1.15} {'loss': 0.3484, 'learning_rate': 7.731409251929802e-06, 'epoch': 1.15} {'loss': 0.5768, 'learning_rate': 7.731090436454997e-06, 'epoch': 1.15} {'loss': 0.5749, 'learning_rate': 7.730771623411538e-06, 'epoch': 1.15} {'loss': 0.3905, 'learning_rate': 7.730452812799759e-06, 'epoch': 1.15} {'loss': 0.5328, 'learning_rate': 7.730134004620006e-06, 'epoch': 1.15} {'loss': 0.5621, 'learning_rate': 7.729815198872617e-06, 'epoch': 1.15} {'loss': 0.5316, 'learning_rate': 7.729496395557939e-06, 'epoch': 1.15} {'loss': 0.5481, 'learning_rate': 7.72917759467631e-06, 'epoch': 1.15} {'loss': 0.3885, 'learning_rate': 7.728858796228069e-06, 'epoch': 1.15} {'loss': 0.6189, 'learning_rate': 7.728540000213564e-06, 'epoch': 1.15} {'loss': 0.5468, 'learning_rate': 7.728221206633133e-06, 'epoch': 1.15} {'loss': 0.485, 'learning_rate': 7.727902415487118e-06, 'epoch': 1.15} {'loss': 0.6161, 'learning_rate': 7.727583626775858e-06, 'epoch': 1.15} {'loss': 0.5423, 'learning_rate': 7.7272648404997e-06, 'epoch': 1.15} {'loss': 0.6253, 'learning_rate': 7.726946056658986e-06, 'epoch': 1.15} {'loss': 0.533, 'learning_rate': 7.726627275254046e-06, 'epoch': 1.15} {'loss': 0.554, 'learning_rate': 7.726308496285238e-06, 'epoch': 1.15} {'loss': 0.5674, 'learning_rate': 7.725989719752891e-06, 'epoch': 1.15} {'loss': 0.4945, 'learning_rate': 7.725670945657355e-06, 'epoch': 1.15} {'loss': 0.6292, 'learning_rate': 7.725352173998966e-06, 'epoch': 1.15} {'loss': 0.3895, 'learning_rate': 7.725033404778063e-06, 'epoch': 1.15} {'loss': 0.4739, 'learning_rate': 7.724714637994998e-06, 'epoch': 1.15} {'loss': 0.6003, 'learning_rate': 7.724395873650105e-06, 'epoch': 1.15} {'loss': 0.5606, 'learning_rate': 7.724077111743727e-06, 'epoch': 1.15} {'loss': 0.505, 'learning_rate': 7.723758352276204e-06, 'epoch': 1.15} {'loss': 0.6032, 'learning_rate': 7.723439595247882e-06, 'epoch': 1.15} {'loss': 0.4818, 'learning_rate': 7.723120840659103e-06, 'epoch': 1.15} {'loss': 0.602, 'learning_rate': 7.722802088510197e-06, 'epoch': 1.15} {'loss': 0.592, 'learning_rate': 7.72248333880152e-06, 'epoch': 1.15} {'loss': 0.6105, 'learning_rate': 7.722164591533406e-06, 'epoch': 1.15} {'loss': 0.5922, 'learning_rate': 7.721845846706197e-06, 'epoch': 1.15} {'loss': 0.5594, 'learning_rate': 7.721527104320237e-06, 'epoch': 1.15} {'loss': 0.5869, 'learning_rate': 7.721208364375868e-06, 'epoch': 1.15} {'loss': 0.5667, 'learning_rate': 7.72088962687343e-06, 'epoch': 1.15} {'loss': 0.5818, 'learning_rate': 7.72057089181326e-06, 'epoch': 1.15} {'loss': 0.6255, 'learning_rate': 7.720252159195709e-06, 'epoch': 1.15} {'loss': 0.7131, 'learning_rate': 7.719933429021111e-06, 'epoch': 1.15} {'loss': 0.561, 'learning_rate': 7.719614701289812e-06, 'epoch': 1.15} {'loss': 0.6027, 'learning_rate': 7.71929597600215e-06, 'epoch': 1.15} {'loss': 0.6211, 'learning_rate': 7.718977253158469e-06, 'epoch': 1.15} {'loss': 0.3396, 'learning_rate': 7.718658532759109e-06, 'epoch': 1.15} {'loss': 0.418, 'learning_rate': 7.71833981480441e-06, 'epoch': 1.15} {'loss': 0.5242, 'learning_rate': 7.71802109929472e-06, 'epoch': 1.15} {'loss': 0.4337, 'learning_rate': 7.717702386230374e-06, 'epoch': 1.15} {'loss': 0.498, 'learning_rate': 7.717383675611719e-06, 'epoch': 1.15} {'loss': 0.5356, 'learning_rate': 7.717064967439092e-06, 'epoch': 1.15} {'loss': 0.4765, 'learning_rate': 7.716746261712833e-06, 'epoch': 1.15} {'loss': 0.5226, 'learning_rate': 7.71642755843329e-06, 'epoch': 1.15} {'loss': 0.6175, 'learning_rate': 7.716108857600795e-06, 'epoch': 1.15} {'loss': 0.5478, 'learning_rate': 7.715790159215703e-06, 'epoch': 1.15} {'loss': 0.4887, 'learning_rate': 7.715471463278346e-06, 'epoch': 1.15} {'loss': 0.5246, 'learning_rate': 7.715152769789066e-06, 'epoch': 1.15} {'loss': 0.4894, 'learning_rate': 7.714834078748208e-06, 'epoch': 1.15} {'loss': 0.4023, 'learning_rate': 7.714515390156108e-06, 'epoch': 1.15} {'loss': 0.533, 'learning_rate': 7.714196704013113e-06, 'epoch': 1.15} {'loss': 0.5732, 'learning_rate': 7.71387802031956e-06, 'epoch': 1.15} {'loss': 0.6002, 'learning_rate': 7.713559339075798e-06, 'epoch': 1.15} {'loss': 0.5343, 'learning_rate': 7.713240660282163e-06, 'epoch': 1.15} {'loss': 0.4158, 'learning_rate': 7.712921983938994e-06, 'epoch': 1.15} {'loss': 0.6166, 'learning_rate': 7.712603310046638e-06, 'epoch': 1.15} {'loss': 0.5691, 'learning_rate': 7.712284638605429e-06, 'epoch': 1.15} {'loss': 0.5622, 'learning_rate': 7.71196596961572e-06, 'epoch': 1.15} {'loss': 0.5642, 'learning_rate': 7.71164730307784e-06, 'epoch': 1.15} {'loss': 0.6107, 'learning_rate': 7.711328638992142e-06, 'epoch': 1.15} {'loss': 0.5933, 'learning_rate': 7.71100997735896e-06, 'epoch': 1.15} {'loss': 0.4608, 'learning_rate': 7.710691318178637e-06, 'epoch': 1.15} {'loss': 0.6438, 'learning_rate': 7.710372661451517e-06, 'epoch': 1.15} {'loss': 0.5189, 'learning_rate': 7.710054007177933e-06, 'epoch': 1.15} {'loss': 0.5576, 'learning_rate': 7.709735355358239e-06, 'epoch': 1.15} {'loss': 0.5548, 'learning_rate': 7.70941670599277e-06, 'epoch': 1.15} {'loss': 0.5344, 'learning_rate': 7.709098059081863e-06, 'epoch': 1.15} {'loss': 0.5012, 'learning_rate': 7.708779414625869e-06, 'epoch': 1.15} {'loss': 0.5922, 'learning_rate': 7.708460772625121e-06, 'epoch': 1.15} {'loss': 0.5177, 'learning_rate': 7.708142133079967e-06, 'epoch': 1.15} {'loss': 0.7886, 'learning_rate': 7.707823495990743e-06, 'epoch': 1.15} {'loss': 0.6076, 'learning_rate': 7.707504861357797e-06, 'epoch': 1.15} {'loss': 0.5722, 'learning_rate': 7.707186229181465e-06, 'epoch': 1.15} {'loss': 0.6131, 'learning_rate': 7.706867599462085e-06, 'epoch': 1.15} {'loss': 0.6236, 'learning_rate': 7.70654897220001e-06, 'epoch': 1.15} {'loss': 0.3475, 'learning_rate': 7.70623034739557e-06, 'epoch': 1.15} {'loss': 0.5553, 'learning_rate': 7.705911725049115e-06, 'epoch': 1.15} {'loss': 0.4138, 'learning_rate': 7.705593105160977e-06, 'epoch': 1.15} {'loss': 0.6035, 'learning_rate': 7.70527448773151e-06, 'epoch': 1.15} {'loss': 0.5432, 'learning_rate': 7.704955872761046e-06, 'epoch': 1.15} {'loss': 0.6185, 'learning_rate': 7.704637260249926e-06, 'epoch': 1.15} {'loss': 0.5037, 'learning_rate': 7.704318650198499e-06, 'epoch': 1.15} {'loss': 0.6107, 'learning_rate': 7.704000042607098e-06, 'epoch': 1.15} {'loss': 0.4669, 'learning_rate': 7.703681437476071e-06, 'epoch': 1.15} {'loss': 0.4826, 'learning_rate': 7.703362834805756e-06, 'epoch': 1.15} {'loss': 0.6111, 'learning_rate': 7.703044234596492e-06, 'epoch': 1.15} {'loss': 0.5885, 'learning_rate': 7.702725636848626e-06, 'epoch': 1.15} {'loss': 0.5076, 'learning_rate': 7.702407041562496e-06, 'epoch': 1.15} {'loss': 0.587, 'learning_rate': 7.702088448738446e-06, 'epoch': 1.15} {'loss': 0.5159, 'learning_rate': 7.701769858376812e-06, 'epoch': 1.15} {'loss': 0.4659, 'learning_rate': 7.701451270477944e-06, 'epoch': 1.15} {'loss': 0.6683, 'learning_rate': 7.701132685042178e-06, 'epoch': 1.15} {'loss': 0.5256, 'learning_rate': 7.70081410206985e-06, 'epoch': 1.15} {'loss': 0.6167, 'learning_rate': 7.700495521561311e-06, 'epoch': 1.15} {'loss': 0.4115, 'learning_rate': 7.700176943516897e-06, 'epoch': 1.15} {'loss': 0.5462, 'learning_rate': 7.699858367936954e-06, 'epoch': 1.15} {'loss': 0.5398, 'learning_rate': 7.699539794821817e-06, 'epoch': 1.15} {'loss': 0.5605, 'learning_rate': 7.699221224171835e-06, 'epoch': 1.15} {'loss': 0.5593, 'learning_rate': 7.698902655987343e-06, 'epoch': 1.15} {'loss': 0.5417, 'learning_rate': 7.698584090268681e-06, 'epoch': 1.15} {'loss': 0.5213, 'learning_rate': 7.6982655270162e-06, 'epoch': 1.15} {'loss': 0.4765, 'learning_rate': 7.697946966230231e-06, 'epoch': 1.15} {'loss': 0.584, 'learning_rate': 7.69762840791112e-06, 'epoch': 1.15} {'loss': 0.488, 'learning_rate': 7.69730985205921e-06, 'epoch': 1.15} {'loss': 0.536, 'learning_rate': 7.696991298674839e-06, 'epoch': 1.15} {'loss': 0.5135, 'learning_rate': 7.696672747758352e-06, 'epoch': 1.15} {'loss': 0.5766, 'learning_rate': 7.696354199310082e-06, 'epoch': 1.15} {'loss': 0.5288, 'learning_rate': 7.696035653330381e-06, 'epoch': 1.15} {'loss': 0.5157, 'learning_rate': 7.695717109819585e-06, 'epoch': 1.15} {'loss': 0.5747, 'learning_rate': 7.695398568778037e-06, 'epoch': 1.15} {'loss': 0.5282, 'learning_rate': 7.695080030206076e-06, 'epoch': 1.15} {'loss': 0.5763, 'learning_rate': 7.694761494104043e-06, 'epoch': 1.15} {'loss': 0.6471, 'learning_rate': 7.694442960472286e-06, 'epoch': 1.15} {'loss': 0.541, 'learning_rate': 7.694124429311137e-06, 'epoch': 1.15} {'loss': 0.4952, 'learning_rate': 7.693805900620943e-06, 'epoch': 1.15} {'loss': 0.6128, 'learning_rate': 7.693487374402045e-06, 'epoch': 1.15} {'loss': 0.5772, 'learning_rate': 7.693168850654786e-06, 'epoch': 1.15} {'loss': 0.4895, 'learning_rate': 7.692850329379502e-06, 'epoch': 1.15} {'loss': 0.4082, 'learning_rate': 7.692531810576535e-06, 'epoch': 1.15} {'loss': 0.592, 'learning_rate': 7.692213294246232e-06, 'epoch': 1.15} {'loss': 0.5414, 'learning_rate': 7.691894780388927e-06, 'epoch': 1.15} {'loss': 0.6295, 'learning_rate': 7.691576269004967e-06, 'epoch': 1.15} {'loss': 0.6058, 'learning_rate': 7.691257760094693e-06, 'epoch': 1.15} {'loss': 0.5341, 'learning_rate': 7.690939253658444e-06, 'epoch': 1.15} {'loss': 0.4582, 'learning_rate': 7.690620749696563e-06, 'epoch': 1.15} {'loss': 0.4949, 'learning_rate': 7.690302248209385e-06, 'epoch': 1.15} {'loss': 0.4623, 'learning_rate': 7.689983749197262e-06, 'epoch': 1.15} {'loss': 0.5707, 'learning_rate': 7.689665252660526e-06, 'epoch': 1.15} {'loss': 0.5994, 'learning_rate': 7.689346758599525e-06, 'epoch': 1.15} {'loss': 0.5729, 'learning_rate': 7.6890282670146e-06, 'epoch': 1.15} {'loss': 0.5864, 'learning_rate': 7.688709777906085e-06, 'epoch': 1.15} {'loss': 0.5228, 'learning_rate': 7.688391291274328e-06, 'epoch': 1.15} {'loss': 0.3536, 'learning_rate': 7.688072807119666e-06, 'epoch': 1.15} {'loss': 0.4692, 'learning_rate': 7.687754325442446e-06, 'epoch': 1.15} {'loss': 0.4443, 'learning_rate': 7.687435846243007e-06, 'epoch': 1.15} {'loss': 0.4207, 'learning_rate': 7.687117369521684e-06, 'epoch': 1.15} {'loss': 0.51, 'learning_rate': 7.686798895278828e-06, 'epoch': 1.15} {'loss': 0.5104, 'learning_rate': 7.686480423514773e-06, 'epoch': 1.15} {'loss': 0.4939, 'learning_rate': 7.686161954229865e-06, 'epoch': 1.15} {'loss': 0.698, 'learning_rate': 7.68584348742444e-06, 'epoch': 1.15} {'loss': 0.6222, 'learning_rate': 7.685525023098847e-06, 'epoch': 1.15} {'loss': 0.6475, 'learning_rate': 7.685206561253421e-06, 'epoch': 1.15} {'loss': 0.6245, 'learning_rate': 7.684888101888504e-06, 'epoch': 1.15} {'loss': 0.4811, 'learning_rate': 7.68456964500444e-06, 'epoch': 1.15} {'loss': 0.6245, 'learning_rate': 7.684251190601567e-06, 'epoch': 1.15} {'loss': 0.623, 'learning_rate': 7.68393273868023e-06, 'epoch': 1.15} {'loss': 0.5788, 'learning_rate': 7.683614289240764e-06, 'epoch': 1.15} {'loss': 0.6197, 'learning_rate': 7.68329584228352e-06, 'epoch': 1.15} {'loss': 0.4359, 'learning_rate': 7.682977397808832e-06, 'epoch': 1.15} {'loss': 0.5953, 'learning_rate': 7.682658955817038e-06, 'epoch': 1.15} {'loss': 0.3737, 'learning_rate': 7.68234051630849e-06, 'epoch': 1.15} {'loss': 0.6676, 'learning_rate': 7.68202207928352e-06, 'epoch': 1.15} {'loss': 0.4605, 'learning_rate': 7.681703644742475e-06, 'epoch': 1.15} {'loss': 0.5528, 'learning_rate': 7.681385212685695e-06, 'epoch': 1.15} {'loss': 0.5563, 'learning_rate': 7.681066783113514e-06, 'epoch': 1.15} {'loss': 0.516, 'learning_rate': 7.680748356026285e-06, 'epoch': 1.15} {'loss': 0.5401, 'learning_rate': 7.680429931424337e-06, 'epoch': 1.15} {'loss': 0.4545, 'learning_rate': 7.680111509308024e-06, 'epoch': 1.15} {'loss': 0.548, 'learning_rate': 7.679793089677677e-06, 'epoch': 1.15} {'loss': 0.6656, 'learning_rate': 7.679474672533644e-06, 'epoch': 1.15} {'loss': 0.6089, 'learning_rate': 7.679156257876264e-06, 'epoch': 1.15} {'loss': 0.5572, 'learning_rate': 7.678837845705873e-06, 'epoch': 1.15} {'loss': 0.6305, 'learning_rate': 7.678519436022822e-06, 'epoch': 1.15} {'loss': 0.5089, 'learning_rate': 7.678201028827441e-06, 'epoch': 1.15} {'loss': 0.5642, 'learning_rate': 7.677882624120082e-06, 'epoch': 1.15} {'loss': 0.5773, 'learning_rate': 7.67756422190108e-06, 'epoch': 1.15} {'loss': 0.5853, 'learning_rate': 7.677245822170778e-06, 'epoch': 1.15} {'loss': 0.5243, 'learning_rate': 7.676927424929518e-06, 'epoch': 1.15} {'loss': 0.7339, 'learning_rate': 7.676609030177636e-06, 'epoch': 1.15} {'loss': 0.5393, 'learning_rate': 7.67629063791548e-06, 'epoch': 1.15} {'loss': 0.6587, 'learning_rate': 7.675972248143385e-06, 'epoch': 1.15} {'loss': 0.5429, 'learning_rate': 7.675653860861698e-06, 'epoch': 1.15} {'loss': 0.5463, 'learning_rate': 7.67533547607076e-06, 'epoch': 1.15} {'loss': 0.5988, 'learning_rate': 7.675017093770906e-06, 'epoch': 1.15} {'loss': 0.6115, 'learning_rate': 7.674698713962485e-06, 'epoch': 1.15} {'loss': 0.807, 'learning_rate': 7.674380336645829e-06, 'epoch': 1.15} {'loss': 0.5193, 'learning_rate': 7.674061961821289e-06, 'epoch': 1.15} {'loss': 0.7342, 'learning_rate': 7.6737435894892e-06, 'epoch': 1.15} {'loss': 0.5303, 'learning_rate': 7.673425219649902e-06, 'epoch': 1.15} {'loss': 0.3462, 'learning_rate': 7.673106852303744e-06, 'epoch': 1.15} {'loss': 0.4822, 'learning_rate': 7.672788487451058e-06, 'epoch': 1.15} {'loss': 0.3841, 'learning_rate': 7.672470125092193e-06, 'epoch': 1.15} {'loss': 0.5383, 'learning_rate': 7.67215176522748e-06, 'epoch': 1.15} {'loss': 0.5515, 'learning_rate': 7.671833407857272e-06, 'epoch': 1.15} {'loss': 0.4892, 'learning_rate': 7.671515052981903e-06, 'epoch': 1.15} {'loss': 0.6729, 'learning_rate': 7.671196700601716e-06, 'epoch': 1.15} {'loss': 0.5351, 'learning_rate': 7.67087835071705e-06, 'epoch': 1.15} {'loss': 0.5531, 'learning_rate': 7.670560003328251e-06, 'epoch': 1.15} {'loss': 0.6365, 'learning_rate': 7.670241658435658e-06, 'epoch': 1.15} {'loss': 0.5489, 'learning_rate': 7.669923316039606e-06, 'epoch': 1.15} {'loss': 0.4912, 'learning_rate': 7.669604976140446e-06, 'epoch': 1.15} {'loss': 0.6255, 'learning_rate': 7.669286638738514e-06, 'epoch': 1.15} {'loss': 0.4547, 'learning_rate': 7.668968303834152e-06, 'epoch': 1.15} {'loss': 0.4251, 'learning_rate': 7.6686499714277e-06, 'epoch': 1.15} {'loss': 0.6061, 'learning_rate': 7.668331641519497e-06, 'epoch': 1.15} {'loss': 0.5337, 'learning_rate': 7.668013314109892e-06, 'epoch': 1.15} {'loss': 0.5207, 'learning_rate': 7.667694989199216e-06, 'epoch': 1.15} {'loss': 0.5958, 'learning_rate': 7.66737666678782e-06, 'epoch': 1.15} {'loss': 0.5, 'learning_rate': 7.667058346876041e-06, 'epoch': 1.15} {'loss': 0.503, 'learning_rate': 7.666740029464216e-06, 'epoch': 1.15} {'loss': 0.5256, 'learning_rate': 7.666421714552694e-06, 'epoch': 1.15} {'loss': 0.6728, 'learning_rate': 7.666103402141805e-06, 'epoch': 1.15} {'loss': 0.6507, 'learning_rate': 7.665785092231902e-06, 'epoch': 1.15} {'loss': 0.4393, 'learning_rate': 7.665466784823317e-06, 'epoch': 1.15} {'loss': 0.6551, 'learning_rate': 7.665148479916398e-06, 'epoch': 1.15} {'loss': 0.5697, 'learning_rate': 7.664830177511485e-06, 'epoch': 1.15} {'loss': 0.586, 'learning_rate': 7.664511877608915e-06, 'epoch': 1.15} {'loss': 0.6081, 'learning_rate': 7.664193580209034e-06, 'epoch': 1.15} {'loss': 0.5989, 'learning_rate': 7.663875285312174e-06, 'epoch': 1.15} {'loss': 0.3794, 'learning_rate': 7.663556992918687e-06, 'epoch': 1.15} {'loss': 0.6349, 'learning_rate': 7.66323870302891e-06, 'epoch': 1.15} {'loss': 0.3295, 'learning_rate': 7.662920415643181e-06, 'epoch': 1.15} {'loss': 0.5551, 'learning_rate': 7.662602130761845e-06, 'epoch': 1.15} {'loss': 0.4891, 'learning_rate': 7.662283848385242e-06, 'epoch': 1.15} {'loss': 0.3954, 'learning_rate': 7.661965568513715e-06, 'epoch': 1.15} {'loss': 0.4147, 'learning_rate': 7.661647291147597e-06, 'epoch': 1.15} {'loss': 0.5215, 'learning_rate': 7.66132901628724e-06, 'epoch': 1.15} {'loss': 0.5362, 'learning_rate': 7.66101074393298e-06, 'epoch': 1.15} {'loss': 0.5785, 'learning_rate': 7.660692474085155e-06, 'epoch': 1.15} {'loss': 0.7401, 'learning_rate': 7.660374206744113e-06, 'epoch': 1.15} {'loss': 0.6491, 'learning_rate': 7.660055941910187e-06, 'epoch': 1.15} {'loss': 0.5083, 'learning_rate': 7.659737679583726e-06, 'epoch': 1.15} {'loss': 0.6294, 'learning_rate': 7.659419419765068e-06, 'epoch': 1.15} {'loss': 0.4262, 'learning_rate': 7.659101162454548e-06, 'epoch': 1.15} {'loss': 0.579, 'learning_rate': 7.658782907652518e-06, 'epoch': 1.15} {'loss': 0.5775, 'learning_rate': 7.658464655359308e-06, 'epoch': 1.15} {'loss': 0.6418, 'learning_rate': 7.658146405575268e-06, 'epoch': 1.15} {'loss': 0.5612, 'learning_rate': 7.657828158300734e-06, 'epoch': 1.15} {'loss': 0.5514, 'learning_rate': 7.65750991353605e-06, 'epoch': 1.15} {'loss': 0.6711, 'learning_rate': 7.657191671281558e-06, 'epoch': 1.15} {'loss': 0.6475, 'learning_rate': 7.65687343153759e-06, 'epoch': 1.15} {'loss': 0.6186, 'learning_rate': 7.656555194304499e-06, 'epoch': 1.15} {'loss': 0.5811, 'learning_rate': 7.656236959582616e-06, 'epoch': 1.15} {'loss': 0.7044, 'learning_rate': 7.65591872737229e-06, 'epoch': 1.15} {'loss': 0.4856, 'learning_rate': 7.655600497673858e-06, 'epoch': 1.15} {'loss': 0.6276, 'learning_rate': 7.655282270487663e-06, 'epoch': 1.15} {'loss': 0.6443, 'learning_rate': 7.654964045814044e-06, 'epoch': 1.15} {'loss': 0.4187, 'learning_rate': 7.65464582365334e-06, 'epoch': 1.15} {'loss': 0.6647, 'learning_rate': 7.654327604005897e-06, 'epoch': 1.15} {'loss': 0.5766, 'learning_rate': 7.65400938687205e-06, 'epoch': 1.15} {'loss': 0.5355, 'learning_rate': 7.65369117225215e-06, 'epoch': 1.15} {'loss': 0.5925, 'learning_rate': 7.65337296014653e-06, 'epoch': 1.15} {'loss': 0.5716, 'learning_rate': 7.65305475055553e-06, 'epoch': 1.15} {'loss': 0.5181, 'learning_rate': 7.652736543479497e-06, 'epoch': 1.15} {'loss': 0.5082, 'learning_rate': 7.652418338918764e-06, 'epoch': 1.15} {'loss': 0.534, 'learning_rate': 7.652100136873681e-06, 'epoch': 1.15} {'loss': 0.5313, 'learning_rate': 7.65178193734458e-06, 'epoch': 1.15} {'loss': 0.5121, 'learning_rate': 7.65146374033181e-06, 'epoch': 1.15} {'loss': 0.5838, 'learning_rate': 7.65114554583571e-06, 'epoch': 1.15} {'loss': 0.5238, 'learning_rate': 7.650827353856618e-06, 'epoch': 1.15} {'loss': 0.5919, 'learning_rate': 7.650509164394877e-06, 'epoch': 1.15} {'loss': 0.4355, 'learning_rate': 7.650190977450825e-06, 'epoch': 1.15} {'loss': 0.5307, 'learning_rate': 7.649872793024808e-06, 'epoch': 1.15} {'loss': 0.6123, 'learning_rate': 7.649554611117163e-06, 'epoch': 1.15} {'loss': 0.5454, 'learning_rate': 7.649236431728232e-06, 'epoch': 1.15} {'loss': 0.4541, 'learning_rate': 7.648918254858358e-06, 'epoch': 1.15} {'loss': 0.5645, 'learning_rate': 7.64860008050788e-06, 'epoch': 1.15} {'loss': 0.5414, 'learning_rate': 7.64828190867714e-06, 'epoch': 1.15} {'loss': 0.5182, 'learning_rate': 7.647963739366473e-06, 'epoch': 1.15} {'loss': 0.6164, 'learning_rate': 7.647645572576231e-06, 'epoch': 1.15} {'loss': 0.5523, 'learning_rate': 7.647327408306748e-06, 'epoch': 1.15} {'loss': 0.6727, 'learning_rate': 7.647009246558366e-06, 'epoch': 1.15} {'loss': 0.5112, 'learning_rate': 7.646691087331424e-06, 'epoch': 1.15} {'loss': 0.628, 'learning_rate': 7.646372930626265e-06, 'epoch': 1.15} {'loss': 0.5091, 'learning_rate': 7.646054776443233e-06, 'epoch': 1.15} {'loss': 0.7832, 'learning_rate': 7.64573662478266e-06, 'epoch': 1.15} {'loss': 0.4445, 'learning_rate': 7.645418475644898e-06, 'epoch': 1.15} {'loss': 0.5772, 'learning_rate': 7.645100329030283e-06, 'epoch': 1.15} {'loss': 0.547, 'learning_rate': 7.644782184939152e-06, 'epoch': 1.15} {'loss': 0.4711, 'learning_rate': 7.644464043371854e-06, 'epoch': 1.15} {'loss': 0.6266, 'learning_rate': 7.644145904328717e-06, 'epoch': 1.15} {'loss': 0.8022, 'learning_rate': 7.643827767810098e-06, 'epoch': 1.15} {'loss': 0.5481, 'learning_rate': 7.643509633816325e-06, 'epoch': 1.15} {'loss': 0.4741, 'learning_rate': 7.643191502347748e-06, 'epoch': 1.15} {'loss': 0.5629, 'learning_rate': 7.642873373404704e-06, 'epoch': 1.15} {'loss': 0.6835, 'learning_rate': 7.642555246987534e-06, 'epoch': 1.15} {'loss': 0.6656, 'learning_rate': 7.642237123096578e-06, 'epoch': 1.15} {'loss': 0.6067, 'learning_rate': 7.641919001732175e-06, 'epoch': 1.15} {'loss': 0.5802, 'learning_rate': 7.641600882894674e-06, 'epoch': 1.15} {'loss': 0.5859, 'learning_rate': 7.641282766584407e-06, 'epoch': 1.15} {'loss': 0.4682, 'learning_rate': 7.640964652801716e-06, 'epoch': 1.15} {'loss': 0.534, 'learning_rate': 7.64064654154695e-06, 'epoch': 1.15} {'loss': 0.5706, 'learning_rate': 7.640328432820441e-06, 'epoch': 1.15} {'loss': 0.4812, 'learning_rate': 7.640010326622534e-06, 'epoch': 1.15} {'loss': 0.5022, 'learning_rate': 7.639692222953565e-06, 'epoch': 1.15} {'loss': 0.3317, 'learning_rate': 7.639374121813886e-06, 'epoch': 1.15} {'loss': 0.4863, 'learning_rate': 7.639056023203826e-06, 'epoch': 1.15} {'loss': 0.4273, 'learning_rate': 7.638737927123729e-06, 'epoch': 1.15} {'loss': 0.4917, 'learning_rate': 7.638419833573943e-06, 'epoch': 1.15} {'loss': 0.5722, 'learning_rate': 7.6381017425548e-06, 'epoch': 1.15} {'loss': 0.5651, 'learning_rate': 7.637783654066645e-06, 'epoch': 1.15} {'loss': 0.3963, 'learning_rate': 7.637465568109814e-06, 'epoch': 1.15} {'loss': 0.6123, 'learning_rate': 7.637147484684657e-06, 'epoch': 1.15} {'loss': 0.4127, 'learning_rate': 7.63682940379151e-06, 'epoch': 1.15} {'loss': 0.4641, 'learning_rate': 7.636511325430708e-06, 'epoch': 1.15} {'loss': 0.6367, 'learning_rate': 7.636193249602602e-06, 'epoch': 1.15} {'loss': 0.4871, 'learning_rate': 7.635875176307527e-06, 'epoch': 1.15} {'loss': 0.5545, 'learning_rate': 7.635557105545827e-06, 'epoch': 1.15} {'loss': 0.6153, 'learning_rate': 7.635239037317842e-06, 'epoch': 1.15} {'loss': 0.6088, 'learning_rate': 7.634920971623904e-06, 'epoch': 1.15} {'loss': 0.501, 'learning_rate': 7.634602908464371e-06, 'epoch': 1.15} {'loss': 0.4501, 'learning_rate': 7.634284847839565e-06, 'epoch': 1.15} {'loss': 0.5081, 'learning_rate': 7.633966789749844e-06, 'epoch': 1.15} {'loss': 0.6483, 'learning_rate': 7.633648734195538e-06, 'epoch': 1.15} {'loss': 0.6953, 'learning_rate': 7.633330681176994e-06, 'epoch': 1.15} {'loss': 0.6248, 'learning_rate': 7.633012630694548e-06, 'epoch': 1.15} {'loss': 0.5388, 'learning_rate': 7.63269458274854e-06, 'epoch': 1.15} {'loss': 0.6052, 'learning_rate': 7.632376537339317e-06, 'epoch': 1.15} {'loss': 0.5052, 'learning_rate': 7.632058494467212e-06, 'epoch': 1.15} {'loss': 0.5696, 'learning_rate': 7.631740454132574e-06, 'epoch': 1.15} {'loss': 0.628, 'learning_rate': 7.63142241633574e-06, 'epoch': 1.15} {'loss': 0.5373, 'learning_rate': 7.631104381077048e-06, 'epoch': 1.15} {'loss': 0.4592, 'learning_rate': 7.630786348356845e-06, 'epoch': 1.15} {'loss': 0.6528, 'learning_rate': 7.630468318175462e-06, 'epoch': 1.15} {'loss': 0.5919, 'learning_rate': 7.630150290533253e-06, 'epoch': 1.15} {'loss': 0.6153, 'learning_rate': 7.629832265430546e-06, 'epoch': 1.15} {'loss': 0.5266, 'learning_rate': 7.629514242867692e-06, 'epoch': 1.16} {'loss': 0.5821, 'learning_rate': 7.629196222845027e-06, 'epoch': 1.16} {'loss': 0.514, 'learning_rate': 7.6288782053628905e-06, 'epoch': 1.16} {'loss': 0.6148, 'learning_rate': 7.6285601904216275e-06, 'epoch': 1.16} {'loss': 0.6153, 'learning_rate': 7.628242178021572e-06, 'epoch': 1.16} {'loss': 0.6418, 'learning_rate': 7.627924168163072e-06, 'epoch': 1.16} {'loss': 0.5081, 'learning_rate': 7.627606160846463e-06, 'epoch': 1.16} {'loss': 0.5597, 'learning_rate': 7.6272881560720914e-06, 'epoch': 1.16} {'loss': 0.5095, 'learning_rate': 7.626970153840294e-06, 'epoch': 1.16} {'loss': 0.5713, 'learning_rate': 7.626652154151411e-06, 'epoch': 1.16} {'loss': 0.3971, 'learning_rate': 7.626334157005787e-06, 'epoch': 1.16} {'loss': 0.5479, 'learning_rate': 7.6260161624037555e-06, 'epoch': 1.16} {'loss': 0.664, 'learning_rate': 7.625698170345665e-06, 'epoch': 1.16} {'loss': 0.5949, 'learning_rate': 7.625380180831856e-06, 'epoch': 1.16} {'loss': 0.6245, 'learning_rate': 7.62506219386266e-06, 'epoch': 1.16} {'loss': 0.5546, 'learning_rate': 7.624744209438429e-06, 'epoch': 1.16} {'loss': 0.4838, 'learning_rate': 7.624426227559497e-06, 'epoch': 1.16} {'loss': 0.4648, 'learning_rate': 7.6241082482262085e-06, 'epoch': 1.16} {'loss': 0.5509, 'learning_rate': 7.6237902714388975e-06, 'epoch': 1.16} {'loss': 0.5078, 'learning_rate': 7.623472297197916e-06, 'epoch': 1.16} {'loss': 0.6856, 'learning_rate': 7.623154325503597e-06, 'epoch': 1.16} {'loss': 0.5297, 'learning_rate': 7.622836356356279e-06, 'epoch': 1.16} {'loss': 0.4642, 'learning_rate': 7.622518389756311e-06, 'epoch': 1.16} {'loss': 0.4075, 'learning_rate': 7.622200425704025e-06, 'epoch': 1.16} {'loss': 0.5546, 'learning_rate': 7.62188246419977e-06, 'epoch': 1.16} {'loss': 0.5374, 'learning_rate': 7.621564505243877e-06, 'epoch': 1.16} {'loss': 0.5401, 'learning_rate': 7.621246548836697e-06, 'epoch': 1.16} {'loss': 0.5598, 'learning_rate': 7.620928594978567e-06, 'epoch': 1.16} {'loss': 0.5495, 'learning_rate': 7.620610643669824e-06, 'epoch': 1.16} {'loss': 0.5948, 'learning_rate': 7.62029269491081e-06, 'epoch': 1.16} {'loss': 0.5493, 'learning_rate': 7.6199747487018695e-06, 'epoch': 1.16} {'loss': 0.5294, 'learning_rate': 7.619656805043342e-06, 'epoch': 1.16} {'loss': 0.4901, 'learning_rate': 7.619338863935566e-06, 'epoch': 1.16} {'loss': 0.4931, 'learning_rate': 7.61902092537888e-06, 'epoch': 1.16} {'loss': 0.4416, 'learning_rate': 7.618702989373633e-06, 'epoch': 1.16} {'loss': 0.5697, 'learning_rate': 7.618385055920158e-06, 'epoch': 1.16} {'loss': 0.5777, 'learning_rate': 7.6180671250188e-06, 'epoch': 1.16} {'loss': 0.6011, 'learning_rate': 7.617749196669894e-06, 'epoch': 1.16} {'loss': 0.4607, 'learning_rate': 7.6174312708737884e-06, 'epoch': 1.16} {'loss': 0.6552, 'learning_rate': 7.6171133476308216e-06, 'epoch': 1.16} {'loss': 0.4579, 'learning_rate': 7.616795426941328e-06, 'epoch': 1.16} {'loss': 0.6245, 'learning_rate': 7.616477508805658e-06, 'epoch': 1.16} {'loss': 0.5313, 'learning_rate': 7.616159593224144e-06, 'epoch': 1.16} {'loss': 0.5029, 'learning_rate': 7.615841680197134e-06, 'epoch': 1.16} {'loss': 0.5889, 'learning_rate': 7.615523769724958e-06, 'epoch': 1.16} {'loss': 0.6042, 'learning_rate': 7.615205861807971e-06, 'epoch': 1.16} {'loss': 0.5312, 'learning_rate': 7.614887956446504e-06, 'epoch': 1.16} {'loss': 0.5692, 'learning_rate': 7.614570053640895e-06, 'epoch': 1.16} {'loss': 0.4543, 'learning_rate': 7.614252153391495e-06, 'epoch': 1.16} {'loss': 0.4767, 'learning_rate': 7.613934255698637e-06, 'epoch': 1.16} {'loss': 0.4062, 'learning_rate': 7.613616360562666e-06, 'epoch': 1.16} {'loss': 0.6141, 'learning_rate': 7.61329846798392e-06, 'epoch': 1.16} {'loss': 0.5002, 'learning_rate': 7.612980577962737e-06, 'epoch': 1.16} {'loss': 0.4662, 'learning_rate': 7.612662690499464e-06, 'epoch': 1.16} {'loss': 0.6571, 'learning_rate': 7.612344805594434e-06, 'epoch': 1.16} {'loss': 0.5895, 'learning_rate': 7.612026923247996e-06, 'epoch': 1.16} {'loss': 0.6591, 'learning_rate': 7.611709043460485e-06, 'epoch': 1.16} {'loss': 0.5444, 'learning_rate': 7.611391166232246e-06, 'epoch': 1.16} {'loss': 0.6681, 'learning_rate': 7.611073291563616e-06, 'epoch': 1.16} {'loss': 0.5382, 'learning_rate': 7.610755419454932e-06, 'epoch': 1.16} {'loss': 0.4713, 'learning_rate': 7.610437549906545e-06, 'epoch': 1.16} {'loss': 0.4259, 'learning_rate': 7.610119682918785e-06, 'epoch': 1.16} {'loss': 0.5019, 'learning_rate': 7.609801818492002e-06, 'epoch': 1.16} {'loss': 0.5268, 'learning_rate': 7.609483956626529e-06, 'epoch': 1.16} {'loss': 0.5191, 'learning_rate': 7.609166097322712e-06, 'epoch': 1.16} {'loss': 0.5759, 'learning_rate': 7.6088482405808905e-06, 'epoch': 1.16} {'loss': 0.3744, 'learning_rate': 7.608530386401398e-06, 'epoch': 1.16} {'loss': 0.5737, 'learning_rate': 7.608212534784587e-06, 'epoch': 1.16} {'loss': 0.4799, 'learning_rate': 7.607894685730787e-06, 'epoch': 1.16} {'loss': 0.5392, 'learning_rate': 7.6075768392403475e-06, 'epoch': 1.16} {'loss': 0.6073, 'learning_rate': 7.607258995313606e-06, 'epoch': 1.16} {'loss': 0.64, 'learning_rate': 7.6069411539509e-06, 'epoch': 1.16} {'loss': 0.4952, 'learning_rate': 7.6066233151525745e-06, 'epoch': 1.16} {'loss': 0.4502, 'learning_rate': 7.606305478918965e-06, 'epoch': 1.16} {'loss': 0.5367, 'learning_rate': 7.605987645250419e-06, 'epoch': 1.16} {'loss': 0.6057, 'learning_rate': 7.6056698141472675e-06, 'epoch': 1.16} {'loss': 0.6606, 'learning_rate': 7.6053519856098636e-06, 'epoch': 1.16} {'loss': 0.6149, 'learning_rate': 7.605034159638539e-06, 'epoch': 1.16} {'loss': 0.5044, 'learning_rate': 7.604716336233635e-06, 'epoch': 1.16} {'loss': 0.513, 'learning_rate': 7.604398515395497e-06, 'epoch': 1.16} {'loss': 0.611, 'learning_rate': 7.604080697124457e-06, 'epoch': 1.16} {'loss': 0.5627, 'learning_rate': 7.603762881420864e-06, 'epoch': 1.16} {'loss': 0.6786, 'learning_rate': 7.6034450682850566e-06, 'epoch': 1.16} {'loss': 0.6425, 'learning_rate': 7.60312725771737e-06, 'epoch': 1.16} {'loss': 0.6055, 'learning_rate': 7.602809449718153e-06, 'epoch': 1.16} {'loss': 0.4534, 'learning_rate': 7.60249164428774e-06, 'epoch': 1.16} {'loss': 0.6641, 'learning_rate': 7.6021738414264744e-06, 'epoch': 1.16} {'loss': 0.6052, 'learning_rate': 7.601856041134693e-06, 'epoch': 1.16} {'loss': 0.5682, 'learning_rate': 7.601538243412744e-06, 'epoch': 1.16} {'loss': 0.5947, 'learning_rate': 7.601220448260962e-06, 'epoch': 1.16} {'loss': 0.4728, 'learning_rate': 7.600902655679685e-06, 'epoch': 1.16} {'loss': 0.5665, 'learning_rate': 7.600584865669261e-06, 'epoch': 1.16} {'loss': 0.6161, 'learning_rate': 7.6002670782300255e-06, 'epoch': 1.16} {'loss': 0.5525, 'learning_rate': 7.599949293362323e-06, 'epoch': 1.16} {'loss': 0.5561, 'learning_rate': 7.599631511066487e-06, 'epoch': 1.16} {'loss': 0.5232, 'learning_rate': 7.5993137313428656e-06, 'epoch': 1.16} {'loss': 0.5305, 'learning_rate': 7.598995954191797e-06, 'epoch': 1.16} {'loss': 0.6072, 'learning_rate': 7.598678179613616e-06, 'epoch': 1.16} {'loss': 0.5822, 'learning_rate': 7.598360407608674e-06, 'epoch': 1.16} {'loss': 0.6014, 'learning_rate': 7.5980426381773024e-06, 'epoch': 1.16} {'loss': 0.608, 'learning_rate': 7.597724871319847e-06, 'epoch': 1.16} {'loss': 0.5822, 'learning_rate': 7.597407107036646e-06, 'epoch': 1.16} {'loss': 0.7549, 'learning_rate': 7.597089345328037e-06, 'epoch': 1.16} {'loss': 0.5583, 'learning_rate': 7.596771586194367e-06, 'epoch': 1.16} {'loss': 0.4796, 'learning_rate': 7.59645382963597e-06, 'epoch': 1.16} {'loss': 0.4906, 'learning_rate': 7.596136075653191e-06, 'epoch': 1.16} {'loss': 0.5375, 'learning_rate': 7.595818324246369e-06, 'epoch': 1.16} {'loss': 0.7489, 'learning_rate': 7.595500575415846e-06, 'epoch': 1.16} {'loss': 0.5713, 'learning_rate': 7.595182829161962e-06, 'epoch': 1.16} {'loss': 0.5521, 'learning_rate': 7.594865085485053e-06, 'epoch': 1.16} {'loss': 0.5022, 'learning_rate': 7.594547344385467e-06, 'epoch': 1.16} {'loss': 0.4491, 'learning_rate': 7.594229605863538e-06, 'epoch': 1.16} {'loss': 0.5346, 'learning_rate': 7.59391186991961e-06, 'epoch': 1.16} {'loss': 0.3545, 'learning_rate': 7.593594136554021e-06, 'epoch': 1.16} {'loss': 0.5068, 'learning_rate': 7.593276405767116e-06, 'epoch': 1.16} {'loss': 0.4879, 'learning_rate': 7.592958677559232e-06, 'epoch': 1.16} {'loss': 0.581, 'learning_rate': 7.592640951930706e-06, 'epoch': 1.16} {'loss': 0.5211, 'learning_rate': 7.592323228881887e-06, 'epoch': 1.16} {'loss': 0.6226, 'learning_rate': 7.592005508413109e-06, 'epoch': 1.16} {'loss': 0.5742, 'learning_rate': 7.591687790524716e-06, 'epoch': 1.16} {'loss': 0.518, 'learning_rate': 7.591370075217049e-06, 'epoch': 1.16} {'loss': 0.5128, 'learning_rate': 7.5910523624904395e-06, 'epoch': 1.16} {'loss': 0.5585, 'learning_rate': 7.5907346523452395e-06, 'epoch': 1.16} {'loss': 0.5927, 'learning_rate': 7.5904169447817824e-06, 'epoch': 1.16} {'loss': 0.4702, 'learning_rate': 7.590099239800414e-06, 'epoch': 1.16} {'loss': 0.4985, 'learning_rate': 7.589781537401469e-06, 'epoch': 1.16} {'loss': 0.6105, 'learning_rate': 7.589463837585294e-06, 'epoch': 1.16} {'loss': 0.5016, 'learning_rate': 7.589146140352225e-06, 'epoch': 1.16} {'loss': 0.6474, 'learning_rate': 7.588828445702599e-06, 'epoch': 1.16} {'loss': 0.557, 'learning_rate': 7.588510753636766e-06, 'epoch': 1.16} {'loss': 0.5781, 'learning_rate': 7.588193064155057e-06, 'epoch': 1.16} {'loss': 0.481, 'learning_rate': 7.5878753772578205e-06, 'epoch': 1.16} {'loss': 0.4881, 'learning_rate': 7.587557692945392e-06, 'epoch': 1.16} {'loss': 0.5067, 'learning_rate': 7.587240011218116e-06, 'epoch': 1.16} {'loss': 0.4471, 'learning_rate': 7.586922332076329e-06, 'epoch': 1.16} {'loss': 0.6222, 'learning_rate': 7.586604655520368e-06, 'epoch': 1.16} {'loss': 0.3637, 'learning_rate': 7.586286981550582e-06, 'epoch': 1.16} {'loss': 0.5282, 'learning_rate': 7.585969310167304e-06, 'epoch': 1.16} {'loss': 0.6629, 'learning_rate': 7.585651641370881e-06, 'epoch': 1.16} {'loss': 0.4525, 'learning_rate': 7.5853339751616504e-06, 'epoch': 1.16} {'loss': 0.5395, 'learning_rate': 7.585016311539951e-06, 'epoch': 1.16} {'loss': 0.5935, 'learning_rate': 7.584698650506126e-06, 'epoch': 1.16} {'loss': 0.5528, 'learning_rate': 7.5843809920605114e-06, 'epoch': 1.16} {'loss': 0.543, 'learning_rate': 7.584063336203453e-06, 'epoch': 1.16} {'loss': 0.3536, 'learning_rate': 7.583745682935286e-06, 'epoch': 1.16} {'loss': 0.6055, 'learning_rate': 7.583428032256357e-06, 'epoch': 1.16} {'loss': 0.6681, 'learning_rate': 7.583110384167004e-06, 'epoch': 1.16} {'loss': 0.4254, 'learning_rate': 7.582792738667564e-06, 'epoch': 1.16} {'loss': 0.5041, 'learning_rate': 7.582475095758381e-06, 'epoch': 1.16} {'loss': 0.4776, 'learning_rate': 7.582157455439789e-06, 'epoch': 1.16} {'loss': 0.4606, 'learning_rate': 7.58183981771214e-06, 'epoch': 1.16} {'loss': 0.5802, 'learning_rate': 7.5815221825757626e-06, 'epoch': 1.16} {'loss': 0.6389, 'learning_rate': 7.5812045500310075e-06, 'epoch': 1.16} {'loss': 0.4274, 'learning_rate': 7.580886920078209e-06, 'epoch': 1.16} {'loss': 0.623, 'learning_rate': 7.580569292717705e-06, 'epoch': 1.16} {'loss': 0.6154, 'learning_rate': 7.580251667949844e-06, 'epoch': 1.16} {'loss': 0.6204, 'learning_rate': 7.579934045774957e-06, 'epoch': 1.16} {'loss': 0.4098, 'learning_rate': 7.579616426193392e-06, 'epoch': 1.16} {'loss': 0.4959, 'learning_rate': 7.579298809205488e-06, 'epoch': 1.16} {'loss': 0.4452, 'learning_rate': 7.578981194811579e-06, 'epoch': 1.16} {'loss': 0.5715, 'learning_rate': 7.578663583012015e-06, 'epoch': 1.16} {'loss': 0.4954, 'learning_rate': 7.578345973807129e-06, 'epoch': 1.16} {'loss': 0.4262, 'learning_rate': 7.578028367197266e-06, 'epoch': 1.16} {'loss': 0.7263, 'learning_rate': 7.57771076318276e-06, 'epoch': 1.16} {'loss': 0.4321, 'learning_rate': 7.577393161763958e-06, 'epoch': 1.16} {'loss': 0.5998, 'learning_rate': 7.577075562941199e-06, 'epoch': 1.16} {'loss': 0.5139, 'learning_rate': 7.57675796671482e-06, 'epoch': 1.16} {'loss': 0.539, 'learning_rate': 7.576440373085166e-06, 'epoch': 1.16} {'loss': 0.5652, 'learning_rate': 7.576122782052573e-06, 'epoch': 1.16} {'loss': 0.4844, 'learning_rate': 7.575805193617385e-06, 'epoch': 1.16} {'loss': 0.6791, 'learning_rate': 7.575487607779941e-06, 'epoch': 1.16} {'loss': 0.6037, 'learning_rate': 7.575170024540576e-06, 'epoch': 1.16} {'loss': 0.5765, 'learning_rate': 7.574852443899639e-06, 'epoch': 1.16} {'loss': 0.461, 'learning_rate': 7.574534865857464e-06, 'epoch': 1.16} {'loss': 0.6011, 'learning_rate': 7.5742172904143966e-06, 'epoch': 1.16} {'loss': 0.6264, 'learning_rate': 7.573899717570773e-06, 'epoch': 1.16} {'loss': 0.6192, 'learning_rate': 7.5735821473269364e-06, 'epoch': 1.16} {'loss': 0.5598, 'learning_rate': 7.5732645796832264e-06, 'epoch': 1.16} {'loss': 0.6214, 'learning_rate': 7.572947014639978e-06, 'epoch': 1.16} {'loss': 0.5173, 'learning_rate': 7.572629452197539e-06, 'epoch': 1.16} {'loss': 0.4118, 'learning_rate': 7.572311892356246e-06, 'epoch': 1.16} {'loss': 0.5725, 'learning_rate': 7.571994335116438e-06, 'epoch': 1.16} {'loss': 0.5392, 'learning_rate': 7.571676780478458e-06, 'epoch': 1.16} {'loss': 0.6541, 'learning_rate': 7.571359228442648e-06, 'epoch': 1.16} {'loss': 0.6243, 'learning_rate': 7.571041679009346e-06, 'epoch': 1.16} {'loss': 0.5164, 'learning_rate': 7.570724132178888e-06, 'epoch': 1.16} {'loss': 0.4743, 'learning_rate': 7.570406587951622e-06, 'epoch': 1.16} {'loss': 0.5764, 'learning_rate': 7.570089046327883e-06, 'epoch': 1.16} {'loss': 0.4373, 'learning_rate': 7.569771507308015e-06, 'epoch': 1.16} {'loss': 0.6539, 'learning_rate': 7.569453970892353e-06, 'epoch': 1.16} {'loss': 0.4715, 'learning_rate': 7.5691364370812415e-06, 'epoch': 1.16} {'loss': 0.5782, 'learning_rate': 7.568818905875022e-06, 'epoch': 1.16} {'loss': 0.5851, 'learning_rate': 7.568501377274027e-06, 'epoch': 1.16} {'loss': 0.4887, 'learning_rate': 7.5681838512786075e-06, 'epoch': 1.16} {'loss': 0.5037, 'learning_rate': 7.567866327889096e-06, 'epoch': 1.16} {'loss': 0.5556, 'learning_rate': 7.567548807105838e-06, 'epoch': 1.16} {'loss': 0.6785, 'learning_rate': 7.56723128892917e-06, 'epoch': 1.16} {'loss': 0.5181, 'learning_rate': 7.56691377335943e-06, 'epoch': 1.16} {'loss': 0.5902, 'learning_rate': 7.566596260396965e-06, 'epoch': 1.16} {'loss': 0.4948, 'learning_rate': 7.566278750042108e-06, 'epoch': 1.16} {'loss': 0.4821, 'learning_rate': 7.565961242295207e-06, 'epoch': 1.16} {'loss': 0.6218, 'learning_rate': 7.565643737156596e-06, 'epoch': 1.16} {'loss': 0.4863, 'learning_rate': 7.565326234626618e-06, 'epoch': 1.16} {'loss': 0.6318, 'learning_rate': 7.565008734705616e-06, 'epoch': 1.16} {'loss': 0.5383, 'learning_rate': 7.5646912373939195e-06, 'epoch': 1.16} {'loss': 0.5797, 'learning_rate': 7.5643737426918825e-06, 'epoch': 1.16} {'loss': 0.5232, 'learning_rate': 7.564056250599834e-06, 'epoch': 1.16} {'loss': 0.7073, 'learning_rate': 7.563738761118123e-06, 'epoch': 1.16} {'loss': 0.6284, 'learning_rate': 7.563421274247087e-06, 'epoch': 1.16} {'loss': 0.4872, 'learning_rate': 7.563103789987061e-06, 'epoch': 1.16} {'loss': 0.6459, 'learning_rate': 7.562786308338392e-06, 'epoch': 1.16} {'loss': 0.4198, 'learning_rate': 7.562468829301414e-06, 'epoch': 1.16} {'loss': 0.4603, 'learning_rate': 7.562151352876475e-06, 'epoch': 1.16} {'loss': 0.6257, 'learning_rate': 7.561833879063906e-06, 'epoch': 1.16} {'loss': 0.5046, 'learning_rate': 7.561516407864056e-06, 'epoch': 1.16} {'loss': 0.6612, 'learning_rate': 7.561198939277261e-06, 'epoch': 1.16} {'loss': 0.5738, 'learning_rate': 7.56088147330386e-06, 'epoch': 1.16} {'loss': 0.567, 'learning_rate': 7.560564009944197e-06, 'epoch': 1.16} {'loss': 0.5395, 'learning_rate': 7.560246549198606e-06, 'epoch': 1.16} {'loss': 0.6441, 'learning_rate': 7.559929091067434e-06, 'epoch': 1.16} {'loss': 0.4932, 'learning_rate': 7.559611635551014e-06, 'epoch': 1.16} {'loss': 0.5417, 'learning_rate': 7.5592941826496955e-06, 'epoch': 1.16} {'loss': 0.5349, 'learning_rate': 7.558976732363813e-06, 'epoch': 1.16} {'loss': 0.6255, 'learning_rate': 7.558659284693706e-06, 'epoch': 1.16} {'loss': 0.5355, 'learning_rate': 7.5583418396397165e-06, 'epoch': 1.16} {'loss': 0.6163, 'learning_rate': 7.5580243972021815e-06, 'epoch': 1.16} {'loss': 0.4562, 'learning_rate': 7.557706957381446e-06, 'epoch': 1.16} {'loss': 0.6652, 'learning_rate': 7.557389520177851e-06, 'epoch': 1.16} {'loss': 0.6267, 'learning_rate': 7.5570720855917265e-06, 'epoch': 1.16} {'loss': 0.5051, 'learning_rate': 7.556754653623425e-06, 'epoch': 1.16} {'loss': 0.4537, 'learning_rate': 7.556437224273279e-06, 'epoch': 1.16} {'loss': 0.4416, 'learning_rate': 7.556119797541634e-06, 'epoch': 1.16} {'loss': 0.548, 'learning_rate': 7.555802373428822e-06, 'epoch': 1.16} {'loss': 0.572, 'learning_rate': 7.555484951935192e-06, 'epoch': 1.16} {'loss': 0.59, 'learning_rate': 7.555167533061083e-06, 'epoch': 1.16} {'loss': 0.6047, 'learning_rate': 7.554850116806827e-06, 'epoch': 1.16} {'loss': 0.6195, 'learning_rate': 7.5545327031727735e-06, 'epoch': 1.16} {'loss': 0.4257, 'learning_rate': 7.554215292159257e-06, 'epoch': 1.16} {'loss': 0.6089, 'learning_rate': 7.553897883766622e-06, 'epoch': 1.16} {'loss': 0.6802, 'learning_rate': 7.553580477995201e-06, 'epoch': 1.16} {'loss': 0.4704, 'learning_rate': 7.553263074845345e-06, 'epoch': 1.16} {'loss': 0.5896, 'learning_rate': 7.552945674317389e-06, 'epoch': 1.16} {'loss': 0.3671, 'learning_rate': 7.5526282764116665e-06, 'epoch': 1.16} {'loss': 0.6173, 'learning_rate': 7.5523108811285284e-06, 'epoch': 1.16} {'loss': 0.6467, 'learning_rate': 7.551993488468309e-06, 'epoch': 1.16} {'loss': 0.6504, 'learning_rate': 7.551676098431351e-06, 'epoch': 1.16} {'loss': 0.5905, 'learning_rate': 7.551358711017993e-06, 'epoch': 1.16} {'loss': 0.4426, 'learning_rate': 7.55104132622857e-06, 'epoch': 1.16} {'loss': 0.5016, 'learning_rate': 7.550723944063433e-06, 'epoch': 1.16} {'loss': 0.6013, 'learning_rate': 7.550406564522911e-06, 'epoch': 1.16} {'loss': 0.6158, 'learning_rate': 7.550089187607355e-06, 'epoch': 1.16} {'loss': 0.3781, 'learning_rate': 7.549771813317096e-06, 'epoch': 1.16} {'loss': 0.4618, 'learning_rate': 7.549454441652481e-06, 'epoch': 1.16} {'loss': 0.6133, 'learning_rate': 7.549137072613846e-06, 'epoch': 1.16} {'loss': 0.5112, 'learning_rate': 7.548819706201527e-06, 'epoch': 1.16} {'loss': 0.5843, 'learning_rate': 7.548502342415873e-06, 'epoch': 1.16} {'loss': 0.6175, 'learning_rate': 7.54818498125722e-06, 'epoch': 1.16} {'loss': 0.5051, 'learning_rate': 7.547867622725906e-06, 'epoch': 1.16} {'loss': 0.6753, 'learning_rate': 7.547550266822277e-06, 'epoch': 1.16} {'loss': 0.2938, 'learning_rate': 7.547232913546666e-06, 'epoch': 1.16} {'loss': 0.569, 'learning_rate': 7.5469155628994186e-06, 'epoch': 1.16} {'loss': 0.584, 'learning_rate': 7.546598214880868e-06, 'epoch': 1.16} {'loss': 0.4797, 'learning_rate': 7.546280869491364e-06, 'epoch': 1.16} {'loss': 0.5459, 'learning_rate': 7.545963526731238e-06, 'epoch': 1.16} {'loss': 0.5821, 'learning_rate': 7.545646186600837e-06, 'epoch': 1.16} {'loss': 0.5623, 'learning_rate': 7.545328849100495e-06, 'epoch': 1.16} {'loss': 0.5446, 'learning_rate': 7.5450115142305546e-06, 'epoch': 1.16} {'loss': 0.4548, 'learning_rate': 7.544694181991359e-06, 'epoch': 1.16} {'loss': 0.5576, 'learning_rate': 7.54437685238324e-06, 'epoch': 1.16} {'loss': 0.5653, 'learning_rate': 7.544059525406546e-06, 'epoch': 1.16} {'loss': 0.5805, 'learning_rate': 7.5437422010616136e-06, 'epoch': 1.16} {'loss': 0.6112, 'learning_rate': 7.543424879348784e-06, 'epoch': 1.16} {'loss': 0.6522, 'learning_rate': 7.543107560268395e-06, 'epoch': 1.16} {'loss': 0.4715, 'learning_rate': 7.542790243820788e-06, 'epoch': 1.16} {'loss': 0.4798, 'learning_rate': 7.5424729300063045e-06, 'epoch': 1.16} {'loss': 0.6469, 'learning_rate': 7.5421556188252796e-06, 'epoch': 1.16} {'loss': 0.5184, 'learning_rate': 7.541838310278061e-06, 'epoch': 1.16} {'loss': 0.6791, 'learning_rate': 7.541521004364984e-06, 'epoch': 1.16} {'loss': 0.5423, 'learning_rate': 7.541203701086388e-06, 'epoch': 1.16} {'loss': 0.6785, 'learning_rate': 7.540886400442615e-06, 'epoch': 1.16} {'loss': 0.4805, 'learning_rate': 7.540569102434001e-06, 'epoch': 1.16} {'loss': 0.6091, 'learning_rate': 7.540251807060892e-06, 'epoch': 1.16} {'loss': 0.8046, 'learning_rate': 7.5399345143236226e-06, 'epoch': 1.16} {'loss': 0.5043, 'learning_rate': 7.53961722422254e-06, 'epoch': 1.16} {'loss': 0.5461, 'learning_rate': 7.539299936757978e-06, 'epoch': 1.16} {'loss': 0.5396, 'learning_rate': 7.538982651930276e-06, 'epoch': 1.16} {'loss': 0.5538, 'learning_rate': 7.5386653697397795e-06, 'epoch': 1.16} {'loss': 0.374, 'learning_rate': 7.53834809018682e-06, 'epoch': 1.16} {'loss': 0.5616, 'learning_rate': 7.538030813271747e-06, 'epoch': 1.16} {'loss': 0.6363, 'learning_rate': 7.537713538994893e-06, 'epoch': 1.16} {'loss': 0.5475, 'learning_rate': 7.537396267356604e-06, 'epoch': 1.16} {'loss': 0.5765, 'learning_rate': 7.537078998357218e-06, 'epoch': 1.16} {'loss': 0.7442, 'learning_rate': 7.536761731997072e-06, 'epoch': 1.16} {'loss': 0.4696, 'learning_rate': 7.53644446827651e-06, 'epoch': 1.16} {'loss': 0.5193, 'learning_rate': 7.536127207195866e-06, 'epoch': 1.16} {'loss': 0.5294, 'learning_rate': 7.535809948755488e-06, 'epoch': 1.16} {'loss': 0.461, 'learning_rate': 7.535492692955713e-06, 'epoch': 1.16} {'loss': 0.5555, 'learning_rate': 7.535175439796875e-06, 'epoch': 1.16} {'loss': 0.5178, 'learning_rate': 7.534858189279324e-06, 'epoch': 1.16} {'loss': 0.6218, 'learning_rate': 7.5345409414033924e-06, 'epoch': 1.16} {'loss': 0.543, 'learning_rate': 7.534223696169424e-06, 'epoch': 1.16} {'loss': 0.5105, 'learning_rate': 7.533906453577754e-06, 'epoch': 1.16} {'loss': 0.5439, 'learning_rate': 7.53358921362873e-06, 'epoch': 1.16} {'loss': 0.5178, 'learning_rate': 7.533271976322687e-06, 'epoch': 1.16} {'loss': 0.4897, 'learning_rate': 7.532954741659962e-06, 'epoch': 1.16} {'loss': 0.5236, 'learning_rate': 7.532637509640903e-06, 'epoch': 1.16} {'loss': 0.5203, 'learning_rate': 7.5323202802658436e-06, 'epoch': 1.16} {'loss': 0.5647, 'learning_rate': 7.532003053535128e-06, 'epoch': 1.16} {'loss': 0.5546, 'learning_rate': 7.531685829449089e-06, 'epoch': 1.16} {'loss': 0.7139, 'learning_rate': 7.5313686080080765e-06, 'epoch': 1.16} {'loss': 0.5018, 'learning_rate': 7.531051389212425e-06, 'epoch': 1.16} {'loss': 0.3924, 'learning_rate': 7.53073417306247e-06, 'epoch': 1.16} {'loss': 0.4717, 'learning_rate': 7.530416959558561e-06, 'epoch': 1.16} {'loss': 0.6046, 'learning_rate': 7.53009974870103e-06, 'epoch': 1.16} {'loss': 0.4831, 'learning_rate': 7.529782540490225e-06, 'epoch': 1.16} {'loss': 0.623, 'learning_rate': 7.529465334926478e-06, 'epoch': 1.16} {'loss': 0.4916, 'learning_rate': 7.529148132010129e-06, 'epoch': 1.16} {'loss': 0.5337, 'learning_rate': 7.528830931741524e-06, 'epoch': 1.16} {'loss': 0.5172, 'learning_rate': 7.528513734120997e-06, 'epoch': 1.16} {'loss': 0.4502, 'learning_rate': 7.528196539148893e-06, 'epoch': 1.16} {'loss': 0.5574, 'learning_rate': 7.527879346825549e-06, 'epoch': 1.16} {'loss': 0.638, 'learning_rate': 7.527562157151307e-06, 'epoch': 1.16} {'loss': 0.4334, 'learning_rate': 7.527244970126505e-06, 'epoch': 1.16} {'loss': 0.3777, 'learning_rate': 7.5269277857514785e-06, 'epoch': 1.16} {'loss': 0.4366, 'learning_rate': 7.526610604026577e-06, 'epoch': 1.16} {'loss': 0.4112, 'learning_rate': 7.526293424952131e-06, 'epoch': 1.16} {'loss': 0.5689, 'learning_rate': 7.525976248528489e-06, 'epoch': 1.16} {'loss': 0.5761, 'learning_rate': 7.5256590747559856e-06, 'epoch': 1.16} {'loss': 0.361, 'learning_rate': 7.525341903634963e-06, 'epoch': 1.16} {'loss': 0.5366, 'learning_rate': 7.5250247351657605e-06, 'epoch': 1.16} {'loss': 0.5702, 'learning_rate': 7.524707569348712e-06, 'epoch': 1.16} {'loss': 0.6737, 'learning_rate': 7.5243904061841675e-06, 'epoch': 1.16} {'loss': 0.7084, 'learning_rate': 7.5240732456724585e-06, 'epoch': 1.16} {'loss': 0.5396, 'learning_rate': 7.523756087813933e-06, 'epoch': 1.16} {'loss': 0.5338, 'learning_rate': 7.523438932608925e-06, 'epoch': 1.16} {'loss': 0.4595, 'learning_rate': 7.523121780057775e-06, 'epoch': 1.16} {'loss': 0.5309, 'learning_rate': 7.522804630160825e-06, 'epoch': 1.16} {'loss': 0.5306, 'learning_rate': 7.5224874829184095e-06, 'epoch': 1.16} {'loss': 0.7058, 'learning_rate': 7.522170338330876e-06, 'epoch': 1.16} {'loss': 0.5317, 'learning_rate': 7.521853196398559e-06, 'epoch': 1.16} {'loss': 0.5112, 'learning_rate': 7.521536057121799e-06, 'epoch': 1.16} {'loss': 0.4643, 'learning_rate': 7.521218920500939e-06, 'epoch': 1.16} {'loss': 0.5152, 'learning_rate': 7.520901786536316e-06, 'epoch': 1.16} {'loss': 0.5569, 'learning_rate': 7.5205846552282715e-06, 'epoch': 1.16} {'loss': 0.6192, 'learning_rate': 7.520267526577141e-06, 'epoch': 1.16} {'loss': 0.4174, 'learning_rate': 7.51995040058327e-06, 'epoch': 1.16} {'loss': 0.399, 'learning_rate': 7.5196332772469985e-06, 'epoch': 1.16} {'loss': 0.3582, 'learning_rate': 7.519316156568659e-06, 'epoch': 1.16} {'loss': 0.3431, 'learning_rate': 7.5189990385485974e-06, 'epoch': 1.16} {'loss': 0.5458, 'learning_rate': 7.518681923187152e-06, 'epoch': 1.16} {'loss': 0.5657, 'learning_rate': 7.518364810484666e-06, 'epoch': 1.16} {'loss': 0.6559, 'learning_rate': 7.518047700441471e-06, 'epoch': 1.16} {'loss': 0.4764, 'learning_rate': 7.517730593057917e-06, 'epoch': 1.16} {'loss': 0.679, 'learning_rate': 7.5174134883343375e-06, 'epoch': 1.16} {'loss': 0.4681, 'learning_rate': 7.517096386271072e-06, 'epoch': 1.16} {'loss': 0.6928, 'learning_rate': 7.516779286868464e-06, 'epoch': 1.16} {'loss': 0.6383, 'learning_rate': 7.516462190126847e-06, 'epoch': 1.16} {'loss': 0.6287, 'learning_rate': 7.516145096046569e-06, 'epoch': 1.16} {'loss': 0.5214, 'learning_rate': 7.515828004627961e-06, 'epoch': 1.16} {'loss': 0.6614, 'learning_rate': 7.515510915871373e-06, 'epoch': 1.16} {'loss': 0.5354, 'learning_rate': 7.5151938297771375e-06, 'epoch': 1.16} {'loss': 0.6717, 'learning_rate': 7.514876746345595e-06, 'epoch': 1.16} {'loss': 0.4825, 'learning_rate': 7.514559665577088e-06, 'epoch': 1.16} {'loss': 0.5392, 'learning_rate': 7.514242587471952e-06, 'epoch': 1.16} {'loss': 0.6101, 'learning_rate': 7.513925512030531e-06, 'epoch': 1.16} {'loss': 0.4982, 'learning_rate': 7.513608439253165e-06, 'epoch': 1.16} {'loss': 0.4855, 'learning_rate': 7.513291369140187e-06, 'epoch': 1.16} {'loss': 0.5235, 'learning_rate': 7.512974301691947e-06, 'epoch': 1.16} {'loss': 0.4861, 'learning_rate': 7.512657236908777e-06, 'epoch': 1.16} {'loss': 0.6074, 'learning_rate': 7.512340174791021e-06, 'epoch': 1.16} {'loss': 0.4593, 'learning_rate': 7.5120231153390126e-06, 'epoch': 1.16} {'loss': 0.527, 'learning_rate': 7.511706058553101e-06, 'epoch': 1.16} {'loss': 0.4101, 'learning_rate': 7.51138900443362e-06, 'epoch': 1.16} {'loss': 0.5542, 'learning_rate': 7.511071952980906e-06, 'epoch': 1.16} {'loss': 0.5796, 'learning_rate': 7.510754904195307e-06, 'epoch': 1.16} {'loss': 0.6914, 'learning_rate': 7.510437858077159e-06, 'epoch': 1.16} {'loss': 0.641, 'learning_rate': 7.5101208146268025e-06, 'epoch': 1.16} {'loss': 0.4817, 'learning_rate': 7.50980377384457e-06, 'epoch': 1.16} {'loss': 0.5133, 'learning_rate': 7.509486735730815e-06, 'epoch': 1.16} {'loss': 0.4115, 'learning_rate': 7.5091697002858675e-06, 'epoch': 1.16} {'loss': 0.48, 'learning_rate': 7.508852667510066e-06, 'epoch': 1.16} {'loss': 0.5171, 'learning_rate': 7.5085356374037575e-06, 'epoch': 1.16} {'loss': 0.4544, 'learning_rate': 7.508218609967276e-06, 'epoch': 1.16} {'loss': 0.4614, 'learning_rate': 7.507901585200965e-06, 'epoch': 1.16} {'loss': 0.6245, 'learning_rate': 7.507584563105163e-06, 'epoch': 1.16} {'loss': 0.5055, 'learning_rate': 7.507267543680205e-06, 'epoch': 1.16} {'loss': 0.5756, 'learning_rate': 7.506950526926439e-06, 'epoch': 1.16} {'loss': 0.5463, 'learning_rate': 7.506633512844196e-06, 'epoch': 1.16} {'loss': 0.6907, 'learning_rate': 7.506316501433823e-06, 'epoch': 1.16} {'loss': 0.5153, 'learning_rate': 7.505999492695657e-06, 'epoch': 1.16} {'loss': 0.5101, 'learning_rate': 7.505682486630039e-06, 'epoch': 1.16} {'loss': 0.6069, 'learning_rate': 7.505365483237308e-06, 'epoch': 1.16} {'loss': 0.4429, 'learning_rate': 7.5050484825177985e-06, 'epoch': 1.16} {'loss': 0.4626, 'learning_rate': 7.504731484471858e-06, 'epoch': 1.16} {'loss': 0.523, 'learning_rate': 7.5044144890998195e-06, 'epoch': 1.16} {'loss': 0.5264, 'learning_rate': 7.50409749640203e-06, 'epoch': 1.16} {'loss': 0.6772, 'learning_rate': 7.503780506378824e-06, 'epoch': 1.16} {'loss': 0.6774, 'learning_rate': 7.503463519030543e-06, 'epoch': 1.16} {'loss': 0.5109, 'learning_rate': 7.503146534357527e-06, 'epoch': 1.16} {'loss': 0.5447, 'learning_rate': 7.502829552360111e-06, 'epoch': 1.16} {'loss': 0.5888, 'learning_rate': 7.502512573038643e-06, 'epoch': 1.16} {'loss': 0.5267, 'learning_rate': 7.502195596393453e-06, 'epoch': 1.16} {'loss': 0.6153, 'learning_rate': 7.501878622424891e-06, 'epoch': 1.16} {'loss': 0.593, 'learning_rate': 7.501561651133291e-06, 'epoch': 1.16} {'loss': 0.6111, 'learning_rate': 7.501244682518991e-06, 'epoch': 1.16} {'loss': 0.5817, 'learning_rate': 7.500927716582335e-06, 'epoch': 1.16} {'loss': 0.5934, 'learning_rate': 7.500610753323656e-06, 'epoch': 1.16} {'loss': 0.5812, 'learning_rate': 7.500293792743303e-06, 'epoch': 1.16} {'loss': 0.5183, 'learning_rate': 7.499976834841607e-06, 'epoch': 1.16} {'loss': 0.4497, 'learning_rate': 7.4996598796189145e-06, 'epoch': 1.16} {'loss': 0.6736, 'learning_rate': 7.499342927075563e-06, 'epoch': 1.16} {'loss': 0.5566, 'learning_rate': 7.499025977211889e-06, 'epoch': 1.16} {'loss': 0.6014, 'learning_rate': 7.498709030028235e-06, 'epoch': 1.16} {'loss': 0.4643, 'learning_rate': 7.498392085524937e-06, 'epoch': 1.16} {'loss': 0.668, 'learning_rate': 7.498075143702343e-06, 'epoch': 1.16} {'loss': 0.5822, 'learning_rate': 7.497758204560783e-06, 'epoch': 1.16} {'loss': 0.4987, 'learning_rate': 7.497441268100603e-06, 'epoch': 1.16} {'loss': 0.5155, 'learning_rate': 7.497124334322141e-06, 'epoch': 1.16} {'loss': 0.4792, 'learning_rate': 7.496807403225736e-06, 'epoch': 1.16} {'loss': 0.6888, 'learning_rate': 7.496490474811729e-06, 'epoch': 1.16} {'loss': 0.6009, 'learning_rate': 7.496173549080453e-06, 'epoch': 1.16} {'loss': 0.5519, 'learning_rate': 7.495856626032259e-06, 'epoch': 1.16} {'loss': 0.5452, 'learning_rate': 7.49553970566748e-06, 'epoch': 1.16} {'loss': 0.5271, 'learning_rate': 7.495222787986453e-06, 'epoch': 1.16} {'loss': 0.5409, 'learning_rate': 7.494905872989522e-06, 'epoch': 1.16} {'loss': 0.4602, 'learning_rate': 7.494588960677025e-06, 'epoch': 1.16} {'loss': 0.5914, 'learning_rate': 7.494272051049305e-06, 'epoch': 1.16} {'loss': 0.5419, 'learning_rate': 7.493955144106694e-06, 'epoch': 1.16} {'loss': 0.5718, 'learning_rate': 7.49363823984954e-06, 'epoch': 1.16} {'loss': 0.5196, 'learning_rate': 7.493321338278179e-06, 'epoch': 1.16} {'loss': 0.6179, 'learning_rate': 7.493004439392948e-06, 'epoch': 1.16} {'loss': 0.5907, 'learning_rate': 7.492687543194193e-06, 'epoch': 1.16} {'loss': 0.5468, 'learning_rate': 7.492370649682244e-06, 'epoch': 1.16} {'loss': 0.497, 'learning_rate': 7.49205375885745e-06, 'epoch': 1.16} {'loss': 0.5827, 'learning_rate': 7.4917368707201465e-06, 'epoch': 1.16} {'loss': 0.6133, 'learning_rate': 7.491419985270669e-06, 'epoch': 1.16} {'loss': 0.5468, 'learning_rate': 7.491103102509367e-06, 'epoch': 1.16} {'loss': 0.5449, 'learning_rate': 7.490786222436572e-06, 'epoch': 1.16} {'loss': 0.4744, 'learning_rate': 7.490469345052628e-06, 'epoch': 1.16} {'loss': 0.4296, 'learning_rate': 7.490152470357868e-06, 'epoch': 1.16} {'loss': 0.4889, 'learning_rate': 7.489835598352641e-06, 'epoch': 1.16} {'loss': 0.5373, 'learning_rate': 7.489518729037282e-06, 'epoch': 1.16} {'loss': 0.5847, 'learning_rate': 7.489201862412124e-06, 'epoch': 1.16} {'loss': 0.5249, 'learning_rate': 7.4888849984775195e-06, 'epoch': 1.16} {'loss': 0.5128, 'learning_rate': 7.4885681372337986e-06, 'epoch': 1.16} {'loss': 0.5252, 'learning_rate': 7.488251278681305e-06, 'epoch': 1.16} {'loss': 0.5294, 'learning_rate': 7.487934422820372e-06, 'epoch': 1.16} {'loss': 0.6496, 'learning_rate': 7.487617569651349e-06, 'epoch': 1.16} {'loss': 0.6626, 'learning_rate': 7.487300719174571e-06, 'epoch': 1.16} {'loss': 0.587, 'learning_rate': 7.486983871390372e-06, 'epoch': 1.16} {'loss': 0.492, 'learning_rate': 7.486667026299101e-06, 'epoch': 1.16} {'loss': 0.6628, 'learning_rate': 7.4863501839010925e-06, 'epoch': 1.16} {'loss': 0.4006, 'learning_rate': 7.486033344196687e-06, 'epoch': 1.16} {'loss': 0.5947, 'learning_rate': 7.4857165071862244e-06, 'epoch': 1.16} {'loss': 0.3987, 'learning_rate': 7.485399672870039e-06, 'epoch': 1.16} {'loss': 0.5606, 'learning_rate': 7.485082841248478e-06, 'epoch': 1.16} {'loss': 0.6492, 'learning_rate': 7.484766012321876e-06, 'epoch': 1.16} {'loss': 0.3917, 'learning_rate': 7.484449186090577e-06, 'epoch': 1.16} {'loss': 0.5404, 'learning_rate': 7.484132362554915e-06, 'epoch': 1.16} {'loss': 0.5776, 'learning_rate': 7.483815541715236e-06, 'epoch': 1.16} {'loss': 0.6393, 'learning_rate': 7.4834987235718744e-06, 'epoch': 1.16} {'loss': 0.5443, 'learning_rate': 7.4831819081251675e-06, 'epoch': 1.16} {'loss': 0.4668, 'learning_rate': 7.482865095375462e-06, 'epoch': 1.16} {'loss': 0.5282, 'learning_rate': 7.48254828532309e-06, 'epoch': 1.16} {'loss': 0.702, 'learning_rate': 7.482231477968399e-06, 'epoch': 1.16} {'loss': 0.6317, 'learning_rate': 7.481914673311722e-06, 'epoch': 1.16} {'loss': 0.494, 'learning_rate': 7.481597871353403e-06, 'epoch': 1.16} {'loss': 0.4738, 'learning_rate': 7.481281072093778e-06, 'epoch': 1.16} {'loss': 0.4347, 'learning_rate': 7.4809642755331845e-06, 'epoch': 1.16} {'loss': 0.4601, 'learning_rate': 7.48064748167197e-06, 'epoch': 1.16} {'loss': 0.5788, 'learning_rate': 7.480330690510463e-06, 'epoch': 1.16} {'loss': 0.479, 'learning_rate': 7.480013902049015e-06, 'epoch': 1.16} {'loss': 0.483, 'learning_rate': 7.479697116287958e-06, 'epoch': 1.16} {'loss': 0.5223, 'learning_rate': 7.479380333227633e-06, 'epoch': 1.16} {'loss': 0.5625, 'learning_rate': 7.47906355286838e-06, 'epoch': 1.16} {'loss': 0.5882, 'learning_rate': 7.478746775210534e-06, 'epoch': 1.16} {'loss': 0.5287, 'learning_rate': 7.478430000254443e-06, 'epoch': 1.16} {'loss': 0.5321, 'learning_rate': 7.478113228000437e-06, 'epoch': 1.16} {'loss': 0.5619, 'learning_rate': 7.477796458448865e-06, 'epoch': 1.16} {'loss': 0.5763, 'learning_rate': 7.477479691600063e-06, 'epoch': 1.16} {'loss': 0.539, 'learning_rate': 7.477162927454365e-06, 'epoch': 1.16} {'loss': 0.4912, 'learning_rate': 7.476846166012117e-06, 'epoch': 1.16} {'loss': 0.6554, 'learning_rate': 7.476529407273652e-06, 'epoch': 1.17} {'loss': 0.6467, 'learning_rate': 7.476212651239318e-06, 'epoch': 1.17} {'loss': 0.5248, 'learning_rate': 7.475895897909446e-06, 'epoch': 1.17} {'loss': 0.374, 'learning_rate': 7.475579147284383e-06, 'epoch': 1.17} {'loss': 0.5966, 'learning_rate': 7.475262399364465e-06, 'epoch': 1.17} {'loss': 0.5876, 'learning_rate': 7.47494565415003e-06, 'epoch': 1.17} {'loss': 0.4979, 'learning_rate': 7.47462891164142e-06, 'epoch': 1.17} {'loss': 0.5944, 'learning_rate': 7.4743121718389675e-06, 'epoch': 1.17} {'loss': 0.5488, 'learning_rate': 7.473995434743023e-06, 'epoch': 1.17} {'loss': 0.5908, 'learning_rate': 7.47367870035392e-06, 'epoch': 1.17} {'loss': 0.4332, 'learning_rate': 7.473361968671995e-06, 'epoch': 1.17} {'loss': 0.642, 'learning_rate': 7.473045239697594e-06, 'epoch': 1.17} {'loss': 0.4463, 'learning_rate': 7.472728513431051e-06, 'epoch': 1.17} {'loss': 0.6351, 'learning_rate': 7.47241178987271e-06, 'epoch': 1.17} {'loss': 0.5883, 'learning_rate': 7.472095069022904e-06, 'epoch': 1.17} {'loss': 0.4745, 'learning_rate': 7.47177835088198e-06, 'epoch': 1.17} {'loss': 0.548, 'learning_rate': 7.471461635450274e-06, 'epoch': 1.17} {'loss': 0.6393, 'learning_rate': 7.471144922728122e-06, 'epoch': 1.17} {'loss': 0.5497, 'learning_rate': 7.470828212715867e-06, 'epoch': 1.17} {'loss': 0.5153, 'learning_rate': 7.470511505413849e-06, 'epoch': 1.17} {'loss': 0.6167, 'learning_rate': 7.470194800822407e-06, 'epoch': 1.17} {'loss': 0.5138, 'learning_rate': 7.4698780989418754e-06, 'epoch': 1.17} {'loss': 0.4213, 'learning_rate': 7.469561399772602e-06, 'epoch': 1.17} {'loss': 0.5789, 'learning_rate': 7.469244703314921e-06, 'epoch': 1.17} {'loss': 0.5006, 'learning_rate': 7.468928009569173e-06, 'epoch': 1.17} {'loss': 0.6002, 'learning_rate': 7.468611318535699e-06, 'epoch': 1.17} {'loss': 0.4496, 'learning_rate': 7.468294630214831e-06, 'epoch': 1.17} {'loss': 0.581, 'learning_rate': 7.467977944606918e-06, 'epoch': 1.17} {'loss': 0.5577, 'learning_rate': 7.467661261712296e-06, 'epoch': 1.17} {'loss': 0.5537, 'learning_rate': 7.4673445815312975e-06, 'epoch': 1.17} {'loss': 0.4484, 'learning_rate': 7.467027904064275e-06, 'epoch': 1.17} {'loss': 0.3944, 'learning_rate': 7.4667112293115565e-06, 'epoch': 1.17} {'loss': 0.4662, 'learning_rate': 7.466394557273487e-06, 'epoch': 1.17} {'loss': 0.4893, 'learning_rate': 7.466077887950402e-06, 'epoch': 1.17} {'loss': 0.5859, 'learning_rate': 7.465761221342646e-06, 'epoch': 1.17} {'loss': 0.5682, 'learning_rate': 7.465444557450557e-06, 'epoch': 1.17} {'loss': 0.5309, 'learning_rate': 7.465127896274468e-06, 'epoch': 1.17} {'loss': 0.4218, 'learning_rate': 7.464811237814726e-06, 'epoch': 1.17} {'loss': 0.6476, 'learning_rate': 7.464494582071669e-06, 'epoch': 1.17} {'loss': 0.4782, 'learning_rate': 7.464177929045634e-06, 'epoch': 1.17} {'loss': 0.6467, 'learning_rate': 7.463861278736958e-06, 'epoch': 1.17} {'loss': 0.499, 'learning_rate': 7.463544631145988e-06, 'epoch': 1.17} {'loss': 0.4952, 'learning_rate': 7.4632279862730585e-06, 'epoch': 1.17} {'loss': 0.7094, 'learning_rate': 7.462911344118504e-06, 'epoch': 1.17} {'loss': 0.5281, 'learning_rate': 7.462594704682675e-06, 'epoch': 1.17} {'loss': 0.5799, 'learning_rate': 7.462278067965902e-06, 'epoch': 1.17} {'loss': 0.6781, 'learning_rate': 7.46196143396853e-06, 'epoch': 1.17} {'loss': 0.5777, 'learning_rate': 7.461644802690894e-06, 'epoch': 1.17} {'loss': 0.6056, 'learning_rate': 7.461328174133331e-06, 'epoch': 1.17} {'loss': 0.5611, 'learning_rate': 7.461011548296189e-06, 'epoch': 1.17} {'loss': 0.5128, 'learning_rate': 7.460694925179797e-06, 'epoch': 1.17} {'loss': 0.6572, 'learning_rate': 7.460378304784504e-06, 'epoch': 1.17} {'loss': 0.6126, 'learning_rate': 7.460061687110642e-06, 'epoch': 1.17} {'loss': 0.5338, 'learning_rate': 7.459745072158556e-06, 'epoch': 1.17} {'loss': 0.4554, 'learning_rate': 7.459428459928583e-06, 'epoch': 1.17} {'loss': 0.628, 'learning_rate': 7.4591118504210566e-06, 'epoch': 1.17} {'loss': 0.5758, 'learning_rate': 7.458795243636325e-06, 'epoch': 1.17} {'loss': 0.61, 'learning_rate': 7.458478639574721e-06, 'epoch': 1.17} {'loss': 0.5804, 'learning_rate': 7.45816203823659e-06, 'epoch': 1.17} {'loss': 0.6143, 'learning_rate': 7.457845439622268e-06, 'epoch': 1.17} {'loss': 0.4525, 'learning_rate': 7.457528843732091e-06, 'epoch': 1.17} {'loss': 0.58, 'learning_rate': 7.457212250566405e-06, 'epoch': 1.17} {'loss': 0.7022, 'learning_rate': 7.45689566012554e-06, 'epoch': 1.17} {'loss': 0.3515, 'learning_rate': 7.4565790724098456e-06, 'epoch': 1.17} {'loss': 0.5881, 'learning_rate': 7.456262487419652e-06, 'epoch': 1.17} {'loss': 0.6017, 'learning_rate': 7.455945905155306e-06, 'epoch': 1.17} {'loss': 0.4257, 'learning_rate': 7.4556293256171455e-06, 'epoch': 1.17} {'loss': 0.5364, 'learning_rate': 7.455312748805504e-06, 'epoch': 1.17} {'loss': 0.4981, 'learning_rate': 7.454996174720728e-06, 'epoch': 1.17} {'loss': 0.7527, 'learning_rate': 7.454679603363148e-06, 'epoch': 1.17} {'loss': 0.63, 'learning_rate': 7.454363034733114e-06, 'epoch': 1.17} {'loss': 0.3775, 'learning_rate': 7.454046468830954e-06, 'epoch': 1.17} {'loss': 0.6182, 'learning_rate': 7.453729905657019e-06, 'epoch': 1.17} {'loss': 0.5777, 'learning_rate': 7.453413345211641e-06, 'epoch': 1.17} {'loss': 0.544, 'learning_rate': 7.453096787495158e-06, 'epoch': 1.17} {'loss': 0.4123, 'learning_rate': 7.452780232507914e-06, 'epoch': 1.17} {'loss': 0.6397, 'learning_rate': 7.452463680250243e-06, 'epoch': 1.17} {'loss': 0.4688, 'learning_rate': 7.452147130722489e-06, 'epoch': 1.17} {'loss': 0.5148, 'learning_rate': 7.451830583924991e-06, 'epoch': 1.17} {'loss': 0.3957, 'learning_rate': 7.451514039858082e-06, 'epoch': 1.17} {'loss': 0.5468, 'learning_rate': 7.45119749852211e-06, 'epoch': 1.17} {'loss': 0.5489, 'learning_rate': 7.450880959917408e-06, 'epoch': 1.17} {'loss': 0.4401, 'learning_rate': 7.4505644240443184e-06, 'epoch': 1.17} {'loss': 0.5229, 'learning_rate': 7.450247890903175e-06, 'epoch': 1.17} {'loss': 0.5461, 'learning_rate': 7.449931360494327e-06, 'epoch': 1.17} {'loss': 0.6269, 'learning_rate': 7.449614832818106e-06, 'epoch': 1.17} {'loss': 0.6589, 'learning_rate': 7.4492983078748485e-06, 'epoch': 1.17} {'loss': 0.5885, 'learning_rate': 7.4489817856649036e-06, 'epoch': 1.17} {'loss': 0.5531, 'learning_rate': 7.4486652661886016e-06, 'epoch': 1.17} {'loss': 0.5606, 'learning_rate': 7.448348749446288e-06, 'epoch': 1.17} {'loss': 0.5604, 'learning_rate': 7.448032235438294e-06, 'epoch': 1.17} {'loss': 0.5316, 'learning_rate': 7.447715724164969e-06, 'epoch': 1.17} {'loss': 0.4109, 'learning_rate': 7.447399215626647e-06, 'epoch': 1.17} {'loss': 0.5377, 'learning_rate': 7.447082709823662e-06, 'epoch': 1.17} {'loss': 0.5412, 'learning_rate': 7.446766206756363e-06, 'epoch': 1.17} {'loss': 0.4406, 'learning_rate': 7.446449706425082e-06, 'epoch': 1.17} {'loss': 0.4662, 'learning_rate': 7.446133208830163e-06, 'epoch': 1.17} {'loss': 0.6436, 'learning_rate': 7.445816713971943e-06, 'epoch': 1.17} {'loss': 0.689, 'learning_rate': 7.4455002218507565e-06, 'epoch': 1.17} {'loss': 0.6157, 'learning_rate': 7.445183732466951e-06, 'epoch': 1.17} {'loss': 0.4757, 'learning_rate': 7.444867245820859e-06, 'epoch': 1.17} {'loss': 0.5755, 'learning_rate': 7.444550761912823e-06, 'epoch': 1.17} {'loss': 0.639, 'learning_rate': 7.444234280743183e-06, 'epoch': 1.17} {'loss': 0.6663, 'learning_rate': 7.443917802312277e-06, 'epoch': 1.17} {'loss': 0.552, 'learning_rate': 7.443601326620444e-06, 'epoch': 1.17} {'loss': 0.6428, 'learning_rate': 7.443284853668019e-06, 'epoch': 1.17} {'loss': 0.671, 'learning_rate': 7.442968383455349e-06, 'epoch': 1.17} {'loss': 0.5705, 'learning_rate': 7.442651915982768e-06, 'epoch': 1.17} {'loss': 0.5055, 'learning_rate': 7.442335451250617e-06, 'epoch': 1.17} {'loss': 0.5643, 'learning_rate': 7.442018989259231e-06, 'epoch': 1.17} {'loss': 0.4554, 'learning_rate': 7.4417025300089564e-06, 'epoch': 1.17} {'loss': 0.5565, 'learning_rate': 7.441386073500128e-06, 'epoch': 1.17} {'loss': 0.6148, 'learning_rate': 7.441069619733082e-06, 'epoch': 1.17} {'loss': 0.5675, 'learning_rate': 7.440753168708166e-06, 'epoch': 1.17} {'loss': 0.6177, 'learning_rate': 7.44043672042571e-06, 'epoch': 1.17} {'loss': 0.5868, 'learning_rate': 7.44012027488606e-06, 'epoch': 1.17} {'loss': 0.4962, 'learning_rate': 7.4398038320895515e-06, 'epoch': 1.17} {'loss': 0.5318, 'learning_rate': 7.43948739203652e-06, 'epoch': 1.17} {'loss': 0.5716, 'learning_rate': 7.439170954727315e-06, 'epoch': 1.17} {'loss': 0.5755, 'learning_rate': 7.438854520162263e-06, 'epoch': 1.17} {'loss': 0.6212, 'learning_rate': 7.438538088341714e-06, 'epoch': 1.17} {'loss': 0.5627, 'learning_rate': 7.4382216592660015e-06, 'epoch': 1.17} {'loss': 0.5336, 'learning_rate': 7.437905232935467e-06, 'epoch': 1.17} {'loss': 0.6258, 'learning_rate': 7.437588809350449e-06, 'epoch': 1.17} {'loss': 0.45, 'learning_rate': 7.437272388511282e-06, 'epoch': 1.17} {'loss': 0.4835, 'learning_rate': 7.436955970418313e-06, 'epoch': 1.17} {'loss': 0.4826, 'learning_rate': 7.436639555071872e-06, 'epoch': 1.17} {'loss': 0.5664, 'learning_rate': 7.436323142472307e-06, 'epoch': 1.17} {'loss': 0.5792, 'learning_rate': 7.436006732619952e-06, 'epoch': 1.17} {'loss': 0.5598, 'learning_rate': 7.435690325515148e-06, 'epoch': 1.17} {'loss': 0.6409, 'learning_rate': 7.435373921158236e-06, 'epoch': 1.17} {'loss': 0.4327, 'learning_rate': 7.435057519549545e-06, 'epoch': 1.17} {'loss': 0.4724, 'learning_rate': 7.4347411206894275e-06, 'epoch': 1.17} {'loss': 0.5825, 'learning_rate': 7.434424724578211e-06, 'epoch': 1.17} {'loss': 0.5866, 'learning_rate': 7.434108331216245e-06, 'epoch': 1.17} {'loss': 0.4484, 'learning_rate': 7.433791940603863e-06, 'epoch': 1.17} {'loss': 0.4602, 'learning_rate': 7.433475552741402e-06, 'epoch': 1.17} {'loss': 0.4725, 'learning_rate': 7.433159167629207e-06, 'epoch': 1.17} {'loss': 0.6384, 'learning_rate': 7.432842785267609e-06, 'epoch': 1.17} {'loss': 0.7037, 'learning_rate': 7.432526405656957e-06, 'epoch': 1.17} {'loss': 0.5786, 'learning_rate': 7.432210028797577e-06, 'epoch': 1.17} {'loss': 0.6147, 'learning_rate': 7.431893654689824e-06, 'epoch': 1.17} {'loss': 0.522, 'learning_rate': 7.431577283334026e-06, 'epoch': 1.17} {'loss': 0.4677, 'learning_rate': 7.431260914730523e-06, 'epoch': 1.17} {'loss': 0.7291, 'learning_rate': 7.4309445488796595e-06, 'epoch': 1.17} {'loss': 0.43, 'learning_rate': 7.430628185781765e-06, 'epoch': 1.17} {'loss': 0.5808, 'learning_rate': 7.430311825437188e-06, 'epoch': 1.17} {'loss': 0.4532, 'learning_rate': 7.429995467846265e-06, 'epoch': 1.17} {'loss': 0.5013, 'learning_rate': 7.429679113009329e-06, 'epoch': 1.17} {'loss': 0.6728, 'learning_rate': 7.429362760926729e-06, 'epoch': 1.17} {'loss': 0.6843, 'learning_rate': 7.429046411598797e-06, 'epoch': 1.17} {'loss': 0.5643, 'learning_rate': 7.428730065025874e-06, 'epoch': 1.17} {'loss': 0.4809, 'learning_rate': 7.428413721208296e-06, 'epoch': 1.17} {'loss': 0.6672, 'learning_rate': 7.428097380146408e-06, 'epoch': 1.17} {'loss': 0.4851, 'learning_rate': 7.427781041840547e-06, 'epoch': 1.17} {'loss': 0.4562, 'learning_rate': 7.427464706291046e-06, 'epoch': 1.17} {'loss': 0.4763, 'learning_rate': 7.427148373498253e-06, 'epoch': 1.17} {'loss': 0.5348, 'learning_rate': 7.4268320434624995e-06, 'epoch': 1.17} {'loss': 0.6871, 'learning_rate': 7.426515716184132e-06, 'epoch': 1.17} {'loss': 0.4929, 'learning_rate': 7.42619939166348e-06, 'epoch': 1.17} {'loss': 0.605, 'learning_rate': 7.425883069900892e-06, 'epoch': 1.17} {'loss': 0.4326, 'learning_rate': 7.4255667508967025e-06, 'epoch': 1.17} {'loss': 0.3752, 'learning_rate': 7.425250434651246e-06, 'epoch': 1.17} {'loss': 0.5735, 'learning_rate': 7.424934121164869e-06, 'epoch': 1.17} {'loss': 0.5833, 'learning_rate': 7.424617810437908e-06, 'epoch': 1.17} {'loss': 0.4967, 'learning_rate': 7.424301502470702e-06, 'epoch': 1.17} {'loss': 0.6275, 'learning_rate': 7.42398519726359e-06, 'epoch': 1.17} {'loss': 0.4407, 'learning_rate': 7.423668894816906e-06, 'epoch': 1.17} {'loss': 0.744, 'learning_rate': 7.423352595130997e-06, 'epoch': 1.17} {'loss': 0.5388, 'learning_rate': 7.423036298206194e-06, 'epoch': 1.17} {'loss': 0.374, 'learning_rate': 7.422720004042846e-06, 'epoch': 1.17} {'loss': 0.6217, 'learning_rate': 7.422403712641283e-06, 'epoch': 1.17} {'loss': 0.4523, 'learning_rate': 7.422087424001849e-06, 'epoch': 1.17} {'loss': 0.766, 'learning_rate': 7.4217711381248806e-06, 'epoch': 1.17} {'loss': 0.4451, 'learning_rate': 7.421454855010714e-06, 'epoch': 1.17} {'loss': 0.6495, 'learning_rate': 7.421138574659694e-06, 'epoch': 1.17} {'loss': 0.5673, 'learning_rate': 7.420822297072156e-06, 'epoch': 1.17} {'loss': 0.5186, 'learning_rate': 7.420506022248439e-06, 'epoch': 1.17} {'loss': 0.5012, 'learning_rate': 7.420189750188884e-06, 'epoch': 1.17} {'loss': 0.7157, 'learning_rate': 7.419873480893829e-06, 'epoch': 1.17} {'loss': 0.5858, 'learning_rate': 7.419557214363613e-06, 'epoch': 1.17} {'loss': 0.5457, 'learning_rate': 7.41924095059857e-06, 'epoch': 1.17} {'loss': 0.4984, 'learning_rate': 7.4189246895990474e-06, 'epoch': 1.17} {'loss': 0.5453, 'learning_rate': 7.418608431365378e-06, 'epoch': 1.17} {'loss': 0.4279, 'learning_rate': 7.418292175897906e-06, 'epoch': 1.17} {'loss': 0.5869, 'learning_rate': 7.417975923196963e-06, 'epoch': 1.17} {'loss': 0.4644, 'learning_rate': 7.417659673262892e-06, 'epoch': 1.17} {'loss': 0.5346, 'learning_rate': 7.417343426096034e-06, 'epoch': 1.17} {'loss': 0.4693, 'learning_rate': 7.417027181696721e-06, 'epoch': 1.17} {'loss': 0.5735, 'learning_rate': 7.416710940065301e-06, 'epoch': 1.17} {'loss': 0.499, 'learning_rate': 7.416394701202108e-06, 'epoch': 1.17} {'loss': 0.5885, 'learning_rate': 7.416078465107481e-06, 'epoch': 1.17} {'loss': 0.4217, 'learning_rate': 7.41576223178176e-06, 'epoch': 1.17} {'loss': 0.621, 'learning_rate': 7.415446001225279e-06, 'epoch': 1.17} {'loss': 0.5858, 'learning_rate': 7.415129773438385e-06, 'epoch': 1.17} {'loss': 0.6027, 'learning_rate': 7.414813548421409e-06, 'epoch': 1.17} {'loss': 0.5474, 'learning_rate': 7.414497326174698e-06, 'epoch': 1.17} {'loss': 0.5026, 'learning_rate': 7.414181106698584e-06, 'epoch': 1.17} {'loss': 0.5436, 'learning_rate': 7.41386488999341e-06, 'epoch': 1.17} {'loss': 0.5796, 'learning_rate': 7.413548676059514e-06, 'epoch': 1.17} {'loss': 0.5824, 'learning_rate': 7.413232464897229e-06, 'epoch': 1.17} {'loss': 0.5445, 'learning_rate': 7.412916256506904e-06, 'epoch': 1.17} {'loss': 0.6482, 'learning_rate': 7.412600050888867e-06, 'epoch': 1.17} {'loss': 0.6264, 'learning_rate': 7.412283848043466e-06, 'epoch': 1.17} {'loss': 0.6039, 'learning_rate': 7.411967647971039e-06, 'epoch': 1.17} {'loss': 0.6235, 'learning_rate': 7.4116514506719195e-06, 'epoch': 1.17} {'loss': 0.4522, 'learning_rate': 7.41133525614645e-06, 'epoch': 1.17} {'loss': 0.6296, 'learning_rate': 7.411019064394967e-06, 'epoch': 1.17} {'loss': 0.4465, 'learning_rate': 7.410702875417812e-06, 'epoch': 1.17} {'loss': 0.7149, 'learning_rate': 7.410386689215319e-06, 'epoch': 1.17} {'loss': 0.5512, 'learning_rate': 7.410070505787835e-06, 'epoch': 1.17} {'loss': 0.3423, 'learning_rate': 7.409754325135694e-06, 'epoch': 1.17} {'loss': 0.5649, 'learning_rate': 7.409438147259234e-06, 'epoch': 1.17} {'loss': 0.553, 'learning_rate': 7.4091219721587945e-06, 'epoch': 1.17} {'loss': 0.5205, 'learning_rate': 7.4088057998347125e-06, 'epoch': 1.17} {'loss': 0.4882, 'learning_rate': 7.408489630287333e-06, 'epoch': 1.17} {'loss': 0.6304, 'learning_rate': 7.408173463516985e-06, 'epoch': 1.17} {'loss': 0.7629, 'learning_rate': 7.4078572995240195e-06, 'epoch': 1.17} {'loss': 0.6329, 'learning_rate': 7.407541138308768e-06, 'epoch': 1.17} {'loss': 0.5849, 'learning_rate': 7.407224979871568e-06, 'epoch': 1.17} {'loss': 0.5206, 'learning_rate': 7.406908824212762e-06, 'epoch': 1.17} {'loss': 0.5296, 'learning_rate': 7.406592671332684e-06, 'epoch': 1.17} {'loss': 0.6202, 'learning_rate': 7.406276521231679e-06, 'epoch': 1.17} {'loss': 0.526, 'learning_rate': 7.405960373910084e-06, 'epoch': 1.17} {'loss': 0.5294, 'learning_rate': 7.405644229368232e-06, 'epoch': 1.17} {'loss': 0.5531, 'learning_rate': 7.4053280876064705e-06, 'epoch': 1.17} {'loss': 0.5717, 'learning_rate': 7.4050119486251315e-06, 'epoch': 1.17} {'loss': 0.5244, 'learning_rate': 7.404695812424559e-06, 'epoch': 1.17} {'loss': 0.7248, 'learning_rate': 7.404379679005085e-06, 'epoch': 1.17} {'loss': 0.4788, 'learning_rate': 7.404063548367058e-06, 'epoch': 1.17} {'loss': 0.5629, 'learning_rate': 7.40374742051081e-06, 'epoch': 1.17} {'loss': 0.5191, 'learning_rate': 7.403431295436676e-06, 'epoch': 1.17} {'loss': 0.5397, 'learning_rate': 7.403115173145004e-06, 'epoch': 1.17} {'loss': 0.6053, 'learning_rate': 7.402799053636127e-06, 'epoch': 1.17} {'loss': 0.4688, 'learning_rate': 7.4024829369103866e-06, 'epoch': 1.17} {'loss': 0.4274, 'learning_rate': 7.402166822968121e-06, 'epoch': 1.17} {'loss': 0.5633, 'learning_rate': 7.401850711809664e-06, 'epoch': 1.17} {'loss': 0.579, 'learning_rate': 7.401534603435362e-06, 'epoch': 1.17} {'loss': 0.593, 'learning_rate': 7.401218497845546e-06, 'epoch': 1.17} {'loss': 0.4467, 'learning_rate': 7.400902395040564e-06, 'epoch': 1.17} {'loss': 0.6241, 'learning_rate': 7.400586295020746e-06, 'epoch': 1.17} {'loss': 0.6394, 'learning_rate': 7.400270197786439e-06, 'epoch': 1.17} {'loss': 0.4377, 'learning_rate': 7.399954103337975e-06, 'epoch': 1.17} {'loss': 0.7153, 'learning_rate': 7.399638011675692e-06, 'epoch': 1.17} {'loss': 0.5225, 'learning_rate': 7.399321922799935e-06, 'epoch': 1.17} {'loss': 0.5372, 'learning_rate': 7.399005836711035e-06, 'epoch': 1.17} {'loss': 0.5179, 'learning_rate': 7.398689753409338e-06, 'epoch': 1.17} {'loss': 0.5152, 'learning_rate': 7.39837367289518e-06, 'epoch': 1.17} {'loss': 0.5233, 'learning_rate': 7.3980575951689e-06, 'epoch': 1.17} {'loss': 0.6341, 'learning_rate': 7.397741520230837e-06, 'epoch': 1.17} {'loss': 0.5511, 'learning_rate': 7.397425448081324e-06, 'epoch': 1.17} {'loss': 0.6264, 'learning_rate': 7.39710937872071e-06, 'epoch': 1.17} {'loss': 0.4823, 'learning_rate': 7.396793312149324e-06, 'epoch': 1.17} {'loss': 0.5857, 'learning_rate': 7.3964772483675105e-06, 'epoch': 1.17} {'loss': 0.5754, 'learning_rate': 7.396161187375608e-06, 'epoch': 1.17} {'loss': 0.5144, 'learning_rate': 7.395845129173953e-06, 'epoch': 1.17} {'loss': 0.5452, 'learning_rate': 7.395529073762886e-06, 'epoch': 1.17} {'loss': 0.4346, 'learning_rate': 7.39521302114274e-06, 'epoch': 1.17} {'loss': 0.5064, 'learning_rate': 7.394896971313863e-06, 'epoch': 1.17} {'loss': 0.4655, 'learning_rate': 7.394580924276586e-06, 'epoch': 1.17} {'loss': 0.6214, 'learning_rate': 7.394264880031255e-06, 'epoch': 1.17} {'loss': 0.4804, 'learning_rate': 7.3939488385782e-06, 'epoch': 1.17} {'loss': 0.4974, 'learning_rate': 7.393632799917765e-06, 'epoch': 1.17} {'loss': 0.5694, 'learning_rate': 7.393316764050291e-06, 'epoch': 1.17} {'loss': 0.6307, 'learning_rate': 7.393000730976107e-06, 'epoch': 1.17} {'loss': 0.4213, 'learning_rate': 7.3926847006955635e-06, 'epoch': 1.17} {'loss': 0.5522, 'learning_rate': 7.392368673208992e-06, 'epoch': 1.17} {'loss': 0.7166, 'learning_rate': 7.392052648516734e-06, 'epoch': 1.17} {'loss': 0.5829, 'learning_rate': 7.391736626619127e-06, 'epoch': 1.17} {'loss': 0.5433, 'learning_rate': 7.391420607516505e-06, 'epoch': 1.17} {'loss': 0.5039, 'learning_rate': 7.391104591209217e-06, 'epoch': 1.17} {'loss': 0.3742, 'learning_rate': 7.390788577697589e-06, 'epoch': 1.17} {'loss': 0.5286, 'learning_rate': 7.390472566981974e-06, 'epoch': 1.17} {'loss': 0.4809, 'learning_rate': 7.390156559062701e-06, 'epoch': 1.17} {'loss': 0.523, 'learning_rate': 7.38984055394011e-06, 'epoch': 1.17} {'loss': 0.5743, 'learning_rate': 7.389524551614542e-06, 'epoch': 1.17} {'loss': 0.5036, 'learning_rate': 7.389208552086329e-06, 'epoch': 1.17} {'loss': 0.5383, 'learning_rate': 7.38889255535582e-06, 'epoch': 1.17} {'loss': 0.5925, 'learning_rate': 7.388576561423344e-06, 'epoch': 1.17} {'loss': 0.5517, 'learning_rate': 7.388260570289247e-06, 'epoch': 1.17} {'loss': 0.5597, 'learning_rate': 7.387944581953866e-06, 'epoch': 1.17} {'loss': 0.5652, 'learning_rate': 7.387628596417536e-06, 'epoch': 1.17} {'loss': 0.5586, 'learning_rate': 7.387312613680597e-06, 'epoch': 1.17} {'loss': 0.5382, 'learning_rate': 7.386996633743387e-06, 'epoch': 1.17} {'loss': 0.525, 'learning_rate': 7.3866806566062495e-06, 'epoch': 1.17} {'loss': 0.5356, 'learning_rate': 7.386364682269515e-06, 'epoch': 1.17} {'loss': 0.6114, 'learning_rate': 7.386048710733532e-06, 'epoch': 1.17} {'loss': 0.5785, 'learning_rate': 7.385732741998633e-06, 'epoch': 1.17} {'loss': 0.5371, 'learning_rate': 7.385416776065155e-06, 'epoch': 1.17} {'loss': 0.6042, 'learning_rate': 7.385100812933441e-06, 'epoch': 1.17} {'loss': 0.7116, 'learning_rate': 7.384784852603823e-06, 'epoch': 1.17} {'loss': 0.4382, 'learning_rate': 7.3844688950766486e-06, 'epoch': 1.17} {'loss': 0.4765, 'learning_rate': 7.3841529403522526e-06, 'epoch': 1.17} {'loss': 0.5968, 'learning_rate': 7.383836988430968e-06, 'epoch': 1.17} {'loss': 0.5687, 'learning_rate': 7.383521039313142e-06, 'epoch': 1.17} {'loss': 0.4473, 'learning_rate': 7.3832050929991085e-06, 'epoch': 1.17} {'loss': 0.5718, 'learning_rate': 7.382889149489208e-06, 'epoch': 1.17} {'loss': 0.5303, 'learning_rate': 7.382573208783773e-06, 'epoch': 1.17} {'loss': 0.4578, 'learning_rate': 7.382257270883153e-06, 'epoch': 1.17} {'loss': 0.4991, 'learning_rate': 7.381941335787679e-06, 'epoch': 1.17} {'loss': 0.5154, 'learning_rate': 7.3816254034976875e-06, 'epoch': 1.17} {'loss': 0.7318, 'learning_rate': 7.381309474013525e-06, 'epoch': 1.17} {'loss': 0.5655, 'learning_rate': 7.380993547335525e-06, 'epoch': 1.17} {'loss': 0.5496, 'learning_rate': 7.380677623464027e-06, 'epoch': 1.17} {'loss': 0.4154, 'learning_rate': 7.380361702399366e-06, 'epoch': 1.17} {'loss': 0.4829, 'learning_rate': 7.380045784141887e-06, 'epoch': 1.17} {'loss': 0.5505, 'learning_rate': 7.379729868691927e-06, 'epoch': 1.17} {'loss': 0.5661, 'learning_rate': 7.379413956049817e-06, 'epoch': 1.17} {'loss': 0.6086, 'learning_rate': 7.379098046215907e-06, 'epoch': 1.17} {'loss': 0.4956, 'learning_rate': 7.378782139190528e-06, 'epoch': 1.17} {'loss': 0.5494, 'learning_rate': 7.3784662349740225e-06, 'epoch': 1.17} {'loss': 0.5165, 'learning_rate': 7.378150333566727e-06, 'epoch': 1.17} {'loss': 0.4331, 'learning_rate': 7.3778344349689744e-06, 'epoch': 1.17} {'loss': 0.5154, 'learning_rate': 7.377518539181114e-06, 'epoch': 1.17} {'loss': 0.5272, 'learning_rate': 7.377202646203476e-06, 'epoch': 1.17} {'loss': 0.6435, 'learning_rate': 7.376886756036406e-06, 'epoch': 1.17} {'loss': 0.5349, 'learning_rate': 7.376570868680235e-06, 'epoch': 1.17} {'loss': 0.5665, 'learning_rate': 7.3762549841353095e-06, 'epoch': 1.17} {'loss': 0.4848, 'learning_rate': 7.375939102401961e-06, 'epoch': 1.17} {'loss': 0.5376, 'learning_rate': 7.375623223480528e-06, 'epoch': 1.17} {'loss': 0.5895, 'learning_rate': 7.375307347371355e-06, 'epoch': 1.17} {'loss': 0.5533, 'learning_rate': 7.374991474074773e-06, 'epoch': 1.17} {'loss': 0.4102, 'learning_rate': 7.37467560359113e-06, 'epoch': 1.17} {'loss': 0.6578, 'learning_rate': 7.374359735920757e-06, 'epoch': 1.17} {'loss': 0.515, 'learning_rate': 7.374043871063994e-06, 'epoch': 1.17} {'loss': 0.5301, 'learning_rate': 7.373728009021181e-06, 'epoch': 1.17} {'loss': 0.4909, 'learning_rate': 7.373412149792654e-06, 'epoch': 1.17} {'loss': 0.6013, 'learning_rate': 7.373096293378754e-06, 'epoch': 1.17} {'loss': 0.6589, 'learning_rate': 7.372780439779817e-06, 'epoch': 1.17} {'loss': 0.592, 'learning_rate': 7.3724645889961844e-06, 'epoch': 1.17} {'loss': 0.4736, 'learning_rate': 7.372148741028193e-06, 'epoch': 1.17} {'loss': 0.3841, 'learning_rate': 7.371832895876181e-06, 'epoch': 1.17} {'loss': 0.5149, 'learning_rate': 7.371517053540489e-06, 'epoch': 1.17} {'loss': 0.5174, 'learning_rate': 7.371201214021449e-06, 'epoch': 1.17} {'loss': 0.5894, 'learning_rate': 7.3708853773194075e-06, 'epoch': 1.17} {'loss': 0.4043, 'learning_rate': 7.3705695434347e-06, 'epoch': 1.17} {'loss': 0.5554, 'learning_rate': 7.370253712367665e-06, 'epoch': 1.17} {'loss': 0.413, 'learning_rate': 7.369937884118639e-06, 'epoch': 1.17} {'loss': 0.648, 'learning_rate': 7.369622058687962e-06, 'epoch': 1.17} {'loss': 0.5288, 'learning_rate': 7.369306236075973e-06, 'epoch': 1.17} {'loss': 0.4952, 'learning_rate': 7.368990416283007e-06, 'epoch': 1.17} {'loss': 0.5601, 'learning_rate': 7.3686745993094086e-06, 'epoch': 1.17} {'loss': 0.5641, 'learning_rate': 7.368358785155514e-06, 'epoch': 1.17} {'loss': 0.5339, 'learning_rate': 7.368042973821659e-06, 'epoch': 1.17} {'loss': 0.7102, 'learning_rate': 7.36772716530818e-06, 'epoch': 1.17} {'loss': 0.4531, 'learning_rate': 7.367411359615422e-06, 'epoch': 1.17} {'loss': 0.675, 'learning_rate': 7.367095556743722e-06, 'epoch': 1.17} {'loss': 0.4192, 'learning_rate': 7.366779756693412e-06, 'epoch': 1.17} {'loss': 0.5492, 'learning_rate': 7.36646395946484e-06, 'epoch': 1.17} {'loss': 0.4424, 'learning_rate': 7.366148165058339e-06, 'epoch': 1.17} {'loss': 0.5602, 'learning_rate': 7.3658323734742456e-06, 'epoch': 1.17} {'loss': 0.5014, 'learning_rate': 7.365516584712903e-06, 'epoch': 1.17} {'loss': 0.4715, 'learning_rate': 7.365200798774643e-06, 'epoch': 1.17} {'loss': 0.4552, 'learning_rate': 7.364885015659813e-06, 'epoch': 1.17} {'loss': 0.6607, 'learning_rate': 7.3645692353687415e-06, 'epoch': 1.17} {'loss': 0.6613, 'learning_rate': 7.364253457901776e-06, 'epoch': 1.17} {'loss': 0.3944, 'learning_rate': 7.36393768325925e-06, 'epoch': 1.17} {'loss': 0.6282, 'learning_rate': 7.363621911441503e-06, 'epoch': 1.17} {'loss': 0.6475, 'learning_rate': 7.363306142448874e-06, 'epoch': 1.17} {'loss': 0.4577, 'learning_rate': 7.3629903762816955e-06, 'epoch': 1.17} {'loss': 0.5731, 'learning_rate': 7.362674612940316e-06, 'epoch': 1.17} {'loss': 0.5902, 'learning_rate': 7.362358852425068e-06, 'epoch': 1.17} {'loss': 0.6093, 'learning_rate': 7.362043094736287e-06, 'epoch': 1.17} {'loss': 0.6039, 'learning_rate': 7.361727339874318e-06, 'epoch': 1.17} {'loss': 0.4449, 'learning_rate': 7.361411587839495e-06, 'epoch': 1.17} {'loss': 0.595, 'learning_rate': 7.361095838632159e-06, 'epoch': 1.17} {'loss': 0.7478, 'learning_rate': 7.360780092252644e-06, 'epoch': 1.17} {'loss': 0.4237, 'learning_rate': 7.360464348701295e-06, 'epoch': 1.17} {'loss': 0.5727, 'learning_rate': 7.360148607978448e-06, 'epoch': 1.17} {'loss': 0.532, 'learning_rate': 7.359832870084433e-06, 'epoch': 1.17} {'loss': 0.5725, 'learning_rate': 7.359517135019602e-06, 'epoch': 1.17} {'loss': 0.5886, 'learning_rate': 7.359201402784284e-06, 'epoch': 1.17} {'loss': 0.7078, 'learning_rate': 7.358885673378822e-06, 'epoch': 1.17} {'loss': 0.7043, 'learning_rate': 7.3585699468035465e-06, 'epoch': 1.17} {'loss': 0.4683, 'learning_rate': 7.358254223058809e-06, 'epoch': 1.17} {'loss': 0.5606, 'learning_rate': 7.357938502144938e-06, 'epoch': 1.17} {'loss': 0.5304, 'learning_rate': 7.357622784062271e-06, 'epoch': 1.17} {'loss': 0.5559, 'learning_rate': 7.357307068811155e-06, 'epoch': 1.17} {'loss': 0.6966, 'learning_rate': 7.356991356391918e-06, 'epoch': 1.17} {'loss': 0.431, 'learning_rate': 7.3566756468049085e-06, 'epoch': 1.17} {'loss': 0.7157, 'learning_rate': 7.356359940050458e-06, 'epoch': 1.17} {'loss': 0.539, 'learning_rate': 7.356044236128903e-06, 'epoch': 1.17} {'loss': 0.5368, 'learning_rate': 7.355728535040589e-06, 'epoch': 1.17} {'loss': 0.5716, 'learning_rate': 7.355412836785847e-06, 'epoch': 1.17} {'loss': 0.4658, 'learning_rate': 7.355097141365022e-06, 'epoch': 1.17} {'loss': 0.4455, 'learning_rate': 7.354781448778448e-06, 'epoch': 1.17} {'loss': 0.4864, 'learning_rate': 7.354465759026466e-06, 'epoch': 1.17} {'loss': 0.6564, 'learning_rate': 7.354150072109412e-06, 'epoch': 1.17} {'loss': 0.4682, 'learning_rate': 7.3538343880276205e-06, 'epoch': 1.17} {'loss': 0.4621, 'learning_rate': 7.3535187067814394e-06, 'epoch': 1.17} {'loss': 0.491, 'learning_rate': 7.353203028371198e-06, 'epoch': 1.17} {'loss': 0.5701, 'learning_rate': 7.352887352797242e-06, 'epoch': 1.17} {'loss': 0.5235, 'learning_rate': 7.352571680059906e-06, 'epoch': 1.17} {'loss': 0.6597, 'learning_rate': 7.352256010159529e-06, 'epoch': 1.17} {'loss': 0.6781, 'learning_rate': 7.3519403430964485e-06, 'epoch': 1.17} {'loss': 0.4711, 'learning_rate': 7.351624678870999e-06, 'epoch': 1.17} {'loss': 0.4537, 'learning_rate': 7.351309017483526e-06, 'epoch': 1.17} {'loss': 0.5789, 'learning_rate': 7.350993358934361e-06, 'epoch': 1.17} {'loss': 0.3576, 'learning_rate': 7.3506777032238495e-06, 'epoch': 1.17} {'loss': 0.4857, 'learning_rate': 7.350362050352327e-06, 'epoch': 1.17} {'loss': 0.5163, 'learning_rate': 7.350046400320127e-06, 'epoch': 1.17} {'loss': 0.4639, 'learning_rate': 7.3497307531275955e-06, 'epoch': 1.17} {'loss': 0.4818, 'learning_rate': 7.34941510877506e-06, 'epoch': 1.17} {'loss': 0.5264, 'learning_rate': 7.349099467262872e-06, 'epoch': 1.17} {'loss': 0.6129, 'learning_rate': 7.348783828591357e-06, 'epoch': 1.17} {'loss': 0.5648, 'learning_rate': 7.348468192760865e-06, 'epoch': 1.17} {'loss': 0.4197, 'learning_rate': 7.348152559771728e-06, 'epoch': 1.17} {'loss': 0.5571, 'learning_rate': 7.347836929624283e-06, 'epoch': 1.17} {'loss': 0.426, 'learning_rate': 7.347521302318873e-06, 'epoch': 1.17} {'loss': 0.564, 'learning_rate': 7.347205677855828e-06, 'epoch': 1.17} {'loss': 0.4124, 'learning_rate': 7.346890056235496e-06, 'epoch': 1.17} {'loss': 0.658, 'learning_rate': 7.346574437458211e-06, 'epoch': 1.17} {'loss': 0.4988, 'learning_rate': 7.346258821524308e-06, 'epoch': 1.17} {'loss': 0.4404, 'learning_rate': 7.34594320843413e-06, 'epoch': 1.17} {'loss': 0.6002, 'learning_rate': 7.3456275981880125e-06, 'epoch': 1.17} {'loss': 0.5213, 'learning_rate': 7.345311990786297e-06, 'epoch': 1.17} {'loss': 0.4585, 'learning_rate': 7.344996386229315e-06, 'epoch': 1.17} {'loss': 0.5843, 'learning_rate': 7.3446807845174125e-06, 'epoch': 1.17} {'loss': 0.6386, 'learning_rate': 7.344365185650924e-06, 'epoch': 1.17} {'loss': 0.5318, 'learning_rate': 7.344049589630186e-06, 'epoch': 1.17} {'loss': 0.5761, 'learning_rate': 7.34373399645554e-06, 'epoch': 1.17} {'loss': 0.609, 'learning_rate': 7.343418406127322e-06, 'epoch': 1.17} {'loss': 0.4101, 'learning_rate': 7.343102818645873e-06, 'epoch': 1.17} {'loss': 0.6282, 'learning_rate': 7.342787234011523e-06, 'epoch': 1.17} {'loss': 0.3347, 'learning_rate': 7.3424716522246235e-06, 'epoch': 1.17} {'loss': 0.5912, 'learning_rate': 7.342156073285504e-06, 'epoch': 1.17} {'loss': 0.537, 'learning_rate': 7.341840497194502e-06, 'epoch': 1.17} {'loss': 0.4621, 'learning_rate': 7.341524923951961e-06, 'epoch': 1.17} {'loss': 0.4669, 'learning_rate': 7.34120935355821e-06, 'epoch': 1.17} {'loss': 0.5667, 'learning_rate': 7.340893786013599e-06, 'epoch': 1.17} {'loss': 0.5775, 'learning_rate': 7.340578221318459e-06, 'epoch': 1.17} {'loss': 0.5132, 'learning_rate': 7.340262659473126e-06, 'epoch': 1.17} {'loss': 0.5943, 'learning_rate': 7.339947100477947e-06, 'epoch': 1.17} {'loss': 0.5989, 'learning_rate': 7.33963154433325e-06, 'epoch': 1.17} {'loss': 0.5418, 'learning_rate': 7.339315991039382e-06, 'epoch': 1.17} {'loss': 0.3676, 'learning_rate': 7.339000440596672e-06, 'epoch': 1.17} {'loss': 0.468, 'learning_rate': 7.3386848930054675e-06, 'epoch': 1.17} {'loss': 0.499, 'learning_rate': 7.338369348266102e-06, 'epoch': 1.17} {'loss': 0.514, 'learning_rate': 7.3380538063789105e-06, 'epoch': 1.17} {'loss': 0.4653, 'learning_rate': 7.3377382673442385e-06, 'epoch': 1.17} {'loss': 0.6485, 'learning_rate': 7.337422731162418e-06, 'epoch': 1.17} {'loss': 0.5563, 'learning_rate': 7.337107197833792e-06, 'epoch': 1.17} {'loss': 0.5598, 'learning_rate': 7.3367916673586915e-06, 'epoch': 1.17} {'loss': 0.6125, 'learning_rate': 7.336476139737463e-06, 'epoch': 1.17} {'loss': 0.4899, 'learning_rate': 7.336160614970441e-06, 'epoch': 1.17} {'loss': 0.589, 'learning_rate': 7.335845093057958e-06, 'epoch': 1.17} {'loss': 0.5333, 'learning_rate': 7.335529574000364e-06, 'epoch': 1.17} {'loss': 0.5315, 'learning_rate': 7.3352140577979865e-06, 'epoch': 1.17} {'loss': 0.3446, 'learning_rate': 7.33489854445117e-06, 'epoch': 1.17} {'loss': 0.6032, 'learning_rate': 7.334583033960252e-06, 'epoch': 1.17} {'loss': 0.4515, 'learning_rate': 7.334267526325563e-06, 'epoch': 1.17} {'loss': 0.574, 'learning_rate': 7.33395202154745e-06, 'epoch': 1.17} {'loss': 0.5931, 'learning_rate': 7.333636519626246e-06, 'epoch': 1.17} {'loss': 0.6105, 'learning_rate': 7.333321020562294e-06, 'epoch': 1.17} {'loss': 0.611, 'learning_rate': 7.333005524355928e-06, 'epoch': 1.17} {'loss': 0.5103, 'learning_rate': 7.33269003100749e-06, 'epoch': 1.17} {'loss': 0.4055, 'learning_rate': 7.332374540517314e-06, 'epoch': 1.17} {'loss': 0.501, 'learning_rate': 7.332059052885736e-06, 'epoch': 1.17} {'loss': 0.5224, 'learning_rate': 7.331743568113101e-06, 'epoch': 1.17} {'loss': 0.528, 'learning_rate': 7.33142808619974e-06, 'epoch': 1.17} {'loss': 0.519, 'learning_rate': 7.3311126071459985e-06, 'epoch': 1.17} {'loss': 0.5053, 'learning_rate': 7.330797130952209e-06, 'epoch': 1.17} {'loss': 0.53, 'learning_rate': 7.330481657618713e-06, 'epoch': 1.17} {'loss': 0.3783, 'learning_rate': 7.330166187145846e-06, 'epoch': 1.17} {'loss': 0.516, 'learning_rate': 7.329850719533944e-06, 'epoch': 1.17} {'loss': 0.5683, 'learning_rate': 7.329535254783353e-06, 'epoch': 1.17} {'loss': 0.5107, 'learning_rate': 7.3292197928944e-06, 'epoch': 1.17} {'loss': 0.5722, 'learning_rate': 7.328904333867435e-06, 'epoch': 1.17} {'loss': 0.5696, 'learning_rate': 7.328588877702788e-06, 'epoch': 1.17} {'loss': 0.5671, 'learning_rate': 7.328273424400798e-06, 'epoch': 1.17} {'loss': 0.6133, 'learning_rate': 7.327957973961806e-06, 'epoch': 1.17} {'loss': 0.6046, 'learning_rate': 7.327642526386145e-06, 'epoch': 1.17} {'loss': 0.5302, 'learning_rate': 7.327327081674159e-06, 'epoch': 1.17} {'loss': 0.4923, 'learning_rate': 7.3270116398261806e-06, 'epoch': 1.17} {'loss': 0.6529, 'learning_rate': 7.326696200842553e-06, 'epoch': 1.17} {'loss': 0.5863, 'learning_rate': 7.326380764723613e-06, 'epoch': 1.17} {'loss': 0.564, 'learning_rate': 7.326065331469694e-06, 'epoch': 1.17} {'loss': 0.5951, 'learning_rate': 7.32574990108114e-06, 'epoch': 1.17} {'loss': 0.4415, 'learning_rate': 7.325434473558284e-06, 'epoch': 1.17} {'loss': 0.6086, 'learning_rate': 7.3251190489014676e-06, 'epoch': 1.17} {'loss': 0.724, 'learning_rate': 7.324803627111026e-06, 'epoch': 1.17} {'loss': 0.4558, 'learning_rate': 7.324488208187301e-06, 'epoch': 1.18} {'loss': 0.5686, 'learning_rate': 7.324172792130628e-06, 'epoch': 1.18} {'loss': 0.619, 'learning_rate': 7.3238573789413455e-06, 'epoch': 1.18} {'loss': 0.4495, 'learning_rate': 7.323541968619792e-06, 'epoch': 1.18} {'loss': 0.5217, 'learning_rate': 7.323226561166301e-06, 'epoch': 1.18} {'loss': 0.6371, 'learning_rate': 7.322911156581218e-06, 'epoch': 1.18} {'loss': 0.5875, 'learning_rate': 7.322595754864879e-06, 'epoch': 1.18} {'loss': 0.4873, 'learning_rate': 7.322280356017614e-06, 'epoch': 1.18} {'loss': 0.4947, 'learning_rate': 7.321964960039771e-06, 'epoch': 1.18} {'loss': 0.5331, 'learning_rate': 7.3216495669316845e-06, 'epoch': 1.18} {'loss': 0.4806, 'learning_rate': 7.321334176693693e-06, 'epoch': 1.18} {'loss': 0.6006, 'learning_rate': 7.32101878932613e-06, 'epoch': 1.18} {'loss': 0.5521, 'learning_rate': 7.320703404829341e-06, 'epoch': 1.18} {'loss': 0.5993, 'learning_rate': 7.3203880232036594e-06, 'epoch': 1.18} {'loss': 0.5617, 'learning_rate': 7.320072644449423e-06, 'epoch': 1.18} {'loss': 0.4504, 'learning_rate': 7.31975726856697e-06, 'epoch': 1.18} {'loss': 0.5666, 'learning_rate': 7.31944189555664e-06, 'epoch': 1.18} {'loss': 0.6976, 'learning_rate': 7.319126525418772e-06, 'epoch': 1.18} {'loss': 0.4761, 'learning_rate': 7.3188111581537e-06, 'epoch': 1.18} {'loss': 0.533, 'learning_rate': 7.318495793761762e-06, 'epoch': 1.18} {'loss': 0.426, 'learning_rate': 7.318180432243301e-06, 'epoch': 1.18} {'loss': 0.5679, 'learning_rate': 7.317865073598649e-06, 'epoch': 1.18} {'loss': 0.4059, 'learning_rate': 7.317549717828149e-06, 'epoch': 1.18} {'loss': 0.4965, 'learning_rate': 7.317234364932132e-06, 'epoch': 1.18} {'loss': 0.5895, 'learning_rate': 7.316919014910946e-06, 'epoch': 1.18} {'loss': 0.5234, 'learning_rate': 7.316603667764922e-06, 'epoch': 1.18} {'loss': 0.6667, 'learning_rate': 7.316288323494396e-06, 'epoch': 1.18} {'loss': 0.5199, 'learning_rate': 7.315972982099713e-06, 'epoch': 1.18} {'loss': 0.5622, 'learning_rate': 7.315657643581207e-06, 'epoch': 1.18} {'loss': 0.5499, 'learning_rate': 7.315342307939215e-06, 'epoch': 1.18} {'loss': 0.2882, 'learning_rate': 7.315026975174074e-06, 'epoch': 1.18} {'loss': 0.4686, 'learning_rate': 7.314711645286128e-06, 'epoch': 1.18} {'loss': 0.7373, 'learning_rate': 7.3143963182757094e-06, 'epoch': 1.18} {'loss': 0.5883, 'learning_rate': 7.314080994143156e-06, 'epoch': 1.18} {'loss': 0.4075, 'learning_rate': 7.313765672888809e-06, 'epoch': 1.18} {'loss': 0.6109, 'learning_rate': 7.3134503545130034e-06, 'epoch': 1.18} {'loss': 0.5983, 'learning_rate': 7.313135039016079e-06, 'epoch': 1.18} {'loss': 0.6441, 'learning_rate': 7.312819726398374e-06, 'epoch': 1.18} {'loss': 0.5476, 'learning_rate': 7.312504416660222e-06, 'epoch': 1.18} {'loss': 0.3915, 'learning_rate': 7.3121891098019685e-06, 'epoch': 1.18} {'loss': 0.6473, 'learning_rate': 7.311873805823941e-06, 'epoch': 1.18} {'loss': 0.5327, 'learning_rate': 7.311558504726488e-06, 'epoch': 1.18} {'loss': 0.6308, 'learning_rate': 7.311243206509941e-06, 'epoch': 1.18} {'loss': 0.4812, 'learning_rate': 7.310927911174641e-06, 'epoch': 1.18} {'loss': 0.6291, 'learning_rate': 7.310612618720925e-06, 'epoch': 1.18} {'loss': 0.6032, 'learning_rate': 7.310297329149125e-06, 'epoch': 1.18} {'loss': 0.5406, 'learning_rate': 7.30998204245959e-06, 'epoch': 1.18} {'loss': 0.5638, 'learning_rate': 7.309666758652647e-06, 'epoch': 1.18} {'loss': 0.6769, 'learning_rate': 7.309351477728643e-06, 'epoch': 1.18} {'loss': 0.5319, 'learning_rate': 7.309036199687911e-06, 'epoch': 1.18} {'loss': 0.4287, 'learning_rate': 7.30872092453079e-06, 'epoch': 1.18} {'loss': 0.4762, 'learning_rate': 7.308405652257618e-06, 'epoch': 1.18} {'loss': 0.4909, 'learning_rate': 7.3080903828687284e-06, 'epoch': 1.18} {'loss': 0.5797, 'learning_rate': 7.307775116364466e-06, 'epoch': 1.18} {'loss': 0.4933, 'learning_rate': 7.307459852745162e-06, 'epoch': 1.18} {'loss': 0.6717, 'learning_rate': 7.307144592011164e-06, 'epoch': 1.18} {'loss': 0.5462, 'learning_rate': 7.306829334162801e-06, 'epoch': 1.18} {'loss': 0.4532, 'learning_rate': 7.306514079200413e-06, 'epoch': 1.18} {'loss': 0.5636, 'learning_rate': 7.306198827124339e-06, 'epoch': 1.18} {'loss': 0.4798, 'learning_rate': 7.305883577934912e-06, 'epoch': 1.18} {'loss': 0.4893, 'learning_rate': 7.305568331632479e-06, 'epoch': 1.18} {'loss': 0.5687, 'learning_rate': 7.3052530882173675e-06, 'epoch': 1.18} {'loss': 0.5491, 'learning_rate': 7.304937847689926e-06, 'epoch': 1.18} {'loss': 0.5043, 'learning_rate': 7.304622610050485e-06, 'epoch': 1.18} {'loss': 0.5795, 'learning_rate': 7.3043073752993845e-06, 'epoch': 1.18} {'loss': 0.5787, 'learning_rate': 7.303992143436962e-06, 'epoch': 1.18} {'loss': 0.5222, 'learning_rate': 7.3036769144635514e-06, 'epoch': 1.18} {'loss': 0.5126, 'learning_rate': 7.303361688379499e-06, 'epoch': 1.18} {'loss': 0.5681, 'learning_rate': 7.303046465185133e-06, 'epoch': 1.18} {'loss': 0.5145, 'learning_rate': 7.3027312448808006e-06, 'epoch': 1.18} {'loss': 0.5763, 'learning_rate': 7.302416027466837e-06, 'epoch': 1.18} {'loss': 0.5398, 'learning_rate': 7.3021008129435734e-06, 'epoch': 1.18} {'loss': 0.5477, 'learning_rate': 7.301785601311356e-06, 'epoch': 1.18} {'loss': 0.5708, 'learning_rate': 7.301470392570514e-06, 'epoch': 1.18} {'loss': 0.5111, 'learning_rate': 7.301155186721394e-06, 'epoch': 1.18} {'loss': 0.3393, 'learning_rate': 7.30083998376433e-06, 'epoch': 1.18} {'loss': 0.5932, 'learning_rate': 7.3005247836996564e-06, 'epoch': 1.18} {'loss': 0.5494, 'learning_rate': 7.300209586527717e-06, 'epoch': 1.18} {'loss': 0.6438, 'learning_rate': 7.299894392248845e-06, 'epoch': 1.18} {'loss': 0.6567, 'learning_rate': 7.299579200863383e-06, 'epoch': 1.18} {'loss': 0.5341, 'learning_rate': 7.299264012371659e-06, 'epoch': 1.18} {'loss': 0.3844, 'learning_rate': 7.298948826774024e-06, 'epoch': 1.18} {'loss': 0.6419, 'learning_rate': 7.298633644070807e-06, 'epoch': 1.18} {'loss': 0.4985, 'learning_rate': 7.298318464262345e-06, 'epoch': 1.18} {'loss': 0.4769, 'learning_rate': 7.298003287348983e-06, 'epoch': 1.18} {'loss': 0.4619, 'learning_rate': 7.297688113331052e-06, 'epoch': 1.18} {'loss': 0.4411, 'learning_rate': 7.297372942208894e-06, 'epoch': 1.18} {'loss': 0.5818, 'learning_rate': 7.2970577739828394e-06, 'epoch': 1.18} {'loss': 0.5334, 'learning_rate': 7.296742608653238e-06, 'epoch': 1.18} {'loss': 0.5451, 'learning_rate': 7.296427446220419e-06, 'epoch': 1.18} {'loss': 0.5841, 'learning_rate': 7.29611228668472e-06, 'epoch': 1.18} {'loss': 0.4312, 'learning_rate': 7.295797130046483e-06, 'epoch': 1.18} {'loss': 0.5466, 'learning_rate': 7.29548197630604e-06, 'epoch': 1.18} {'loss': 0.6221, 'learning_rate': 7.2951668254637364e-06, 'epoch': 1.18} {'loss': 0.5888, 'learning_rate': 7.294851677519906e-06, 'epoch': 1.18} {'loss': 0.6456, 'learning_rate': 7.294536532474881e-06, 'epoch': 1.18} {'loss': 0.4853, 'learning_rate': 7.294221390329008e-06, 'epoch': 1.18} {'loss': 0.6138, 'learning_rate': 7.29390625108262e-06, 'epoch': 1.18} {'loss': 0.6074, 'learning_rate': 7.293591114736057e-06, 'epoch': 1.18} {'loss': 0.4175, 'learning_rate': 7.2932759812896515e-06, 'epoch': 1.18} {'loss': 0.5708, 'learning_rate': 7.2929608507437495e-06, 'epoch': 1.18} {'loss': 0.5739, 'learning_rate': 7.292645723098684e-06, 'epoch': 1.18} {'loss': 0.4813, 'learning_rate': 7.292330598354789e-06, 'epoch': 1.18} {'loss': 0.7247, 'learning_rate': 7.2920154765124105e-06, 'epoch': 1.18} {'loss': 0.5982, 'learning_rate': 7.291700357571879e-06, 'epoch': 1.18} {'loss': 0.5172, 'learning_rate': 7.291385241533537e-06, 'epoch': 1.18} {'loss': 0.5168, 'learning_rate': 7.291070128397721e-06, 'epoch': 1.18} {'loss': 0.6249, 'learning_rate': 7.290755018164764e-06, 'epoch': 1.18} {'loss': 0.5264, 'learning_rate': 7.2904399108350125e-06, 'epoch': 1.18} {'loss': 0.5768, 'learning_rate': 7.290124806408793e-06, 'epoch': 1.18} {'loss': 0.5145, 'learning_rate': 7.2898097048864536e-06, 'epoch': 1.18} {'loss': 0.61, 'learning_rate': 7.289494606268326e-06, 'epoch': 1.18} {'loss': 0.5961, 'learning_rate': 7.2891795105547515e-06, 'epoch': 1.18} {'loss': 0.4683, 'learning_rate': 7.288864417746066e-06, 'epoch': 1.18} {'loss': 0.3569, 'learning_rate': 7.288549327842604e-06, 'epoch': 1.18} {'loss': 0.5539, 'learning_rate': 7.288234240844709e-06, 'epoch': 1.18} {'loss': 0.3931, 'learning_rate': 7.287919156752712e-06, 'epoch': 1.18} {'loss': 0.6164, 'learning_rate': 7.287604075566959e-06, 'epoch': 1.18} {'loss': 0.4495, 'learning_rate': 7.287288997287781e-06, 'epoch': 1.18} {'loss': 0.4741, 'learning_rate': 7.286973921915518e-06, 'epoch': 1.18} {'loss': 0.5546, 'learning_rate': 7.286658849450508e-06, 'epoch': 1.18} {'loss': 0.6659, 'learning_rate': 7.286343779893085e-06, 'epoch': 1.18} {'loss': 0.6189, 'learning_rate': 7.286028713243593e-06, 'epoch': 1.18} {'loss': 0.613, 'learning_rate': 7.285713649502362e-06, 'epoch': 1.18} {'loss': 0.6373, 'learning_rate': 7.285398588669737e-06, 'epoch': 1.18} {'loss': 0.5839, 'learning_rate': 7.285083530746053e-06, 'epoch': 1.18} {'loss': 0.4261, 'learning_rate': 7.284768475731646e-06, 'epoch': 1.18} {'loss': 0.5686, 'learning_rate': 7.284453423626856e-06, 'epoch': 1.18} {'loss': 0.6767, 'learning_rate': 7.284138374432015e-06, 'epoch': 1.18} {'loss': 0.5076, 'learning_rate': 7.2838233281474705e-06, 'epoch': 1.18} {'loss': 0.5344, 'learning_rate': 7.283508284773548e-06, 'epoch': 1.18} {'loss': 0.516, 'learning_rate': 7.283193244310596e-06, 'epoch': 1.18} {'loss': 0.5408, 'learning_rate': 7.282878206758948e-06, 'epoch': 1.18} {'loss': 0.6746, 'learning_rate': 7.2825631721189406e-06, 'epoch': 1.18} {'loss': 0.494, 'learning_rate': 7.2822481403909125e-06, 'epoch': 1.18} {'loss': 0.5507, 'learning_rate': 7.281933111575196e-06, 'epoch': 1.18} {'loss': 0.4293, 'learning_rate': 7.2816180856721394e-06, 'epoch': 1.18} {'loss': 0.5169, 'learning_rate': 7.28130306268207e-06, 'epoch': 1.18} {'loss': 0.4991, 'learning_rate': 7.280988042605334e-06, 'epoch': 1.18} {'loss': 0.5715, 'learning_rate': 7.280673025442264e-06, 'epoch': 1.18} {'loss': 0.5047, 'learning_rate': 7.2803580111931956e-06, 'epoch': 1.18} {'loss': 0.4336, 'learning_rate': 7.280042999858472e-06, 'epoch': 1.18} {'loss': 0.6169, 'learning_rate': 7.279727991438423e-06, 'epoch': 1.18} {'loss': 0.5192, 'learning_rate': 7.2794129859333965e-06, 'epoch': 1.18} {'loss': 0.6672, 'learning_rate': 7.279097983343724e-06, 'epoch': 1.18} {'loss': 0.5167, 'learning_rate': 7.278782983669739e-06, 'epoch': 1.18} {'loss': 0.5039, 'learning_rate': 7.278467986911788e-06, 'epoch': 1.18} {'loss': 0.5828, 'learning_rate': 7.278152993070202e-06, 'epoch': 1.18} {'loss': 0.5202, 'learning_rate': 7.277838002145323e-06, 'epoch': 1.18} {'loss': 0.503, 'learning_rate': 7.277523014137482e-06, 'epoch': 1.18} {'loss': 0.5997, 'learning_rate': 7.2772080290470245e-06, 'epoch': 1.18} {'loss': 0.552, 'learning_rate': 7.276893046874285e-06, 'epoch': 1.18} {'loss': 0.5618, 'learning_rate': 7.276578067619597e-06, 'epoch': 1.18} {'loss': 0.545, 'learning_rate': 7.276263091283305e-06, 'epoch': 1.18} {'loss': 0.5754, 'learning_rate': 7.27594811786574e-06, 'epoch': 1.18} {'loss': 0.5968, 'learning_rate': 7.275633147367245e-06, 'epoch': 1.18} {'loss': 0.5958, 'learning_rate': 7.275318179788151e-06, 'epoch': 1.18} {'loss': 0.4796, 'learning_rate': 7.275003215128803e-06, 'epoch': 1.18} {'loss': 0.529, 'learning_rate': 7.274688253389536e-06, 'epoch': 1.18} {'loss': 0.5125, 'learning_rate': 7.274373294570681e-06, 'epoch': 1.18} {'loss': 0.5554, 'learning_rate': 7.274058338672586e-06, 'epoch': 1.18} {'loss': 0.5731, 'learning_rate': 7.273743385695582e-06, 'epoch': 1.18} {'loss': 0.6129, 'learning_rate': 7.273428435640008e-06, 'epoch': 1.18} {'loss': 0.5143, 'learning_rate': 7.273113488506205e-06, 'epoch': 1.18} {'loss': 0.5344, 'learning_rate': 7.2727985442945005e-06, 'epoch': 1.18} {'loss': 0.5902, 'learning_rate': 7.2724836030052425e-06, 'epoch': 1.18} {'loss': 0.5039, 'learning_rate': 7.272168664638761e-06, 'epoch': 1.18} {'loss': 0.4922, 'learning_rate': 7.271853729195402e-06, 'epoch': 1.18} {'loss': 0.5258, 'learning_rate': 7.271538796675495e-06, 'epoch': 1.18} {'loss': 0.6024, 'learning_rate': 7.2712238670793825e-06, 'epoch': 1.18} {'loss': 0.4779, 'learning_rate': 7.2709089404074e-06, 'epoch': 1.18} {'loss': 0.5437, 'learning_rate': 7.27059401665988e-06, 'epoch': 1.18} {'loss': 0.5336, 'learning_rate': 7.270279095837169e-06, 'epoch': 1.18} {'loss': 0.5452, 'learning_rate': 7.269964177939599e-06, 'epoch': 1.18} {'loss': 0.4353, 'learning_rate': 7.269649262967509e-06, 'epoch': 1.18} {'loss': 0.503, 'learning_rate': 7.269334350921236e-06, 'epoch': 1.18} {'loss': 0.5107, 'learning_rate': 7.269019441801119e-06, 'epoch': 1.18} {'loss': 0.6472, 'learning_rate': 7.268704535607495e-06, 'epoch': 1.18} {'loss': 0.4124, 'learning_rate': 7.2683896323406955e-06, 'epoch': 1.18} {'loss': 0.4164, 'learning_rate': 7.268074732001069e-06, 'epoch': 1.18} {'loss': 0.5207, 'learning_rate': 7.267759834588944e-06, 'epoch': 1.18} {'loss': 0.4544, 'learning_rate': 7.267444940104662e-06, 'epoch': 1.18} {'loss': 0.4568, 'learning_rate': 7.267130048548559e-06, 'epoch': 1.18} {'loss': 0.517, 'learning_rate': 7.266815159920971e-06, 'epoch': 1.18} {'loss': 0.5767, 'learning_rate': 7.266500274222241e-06, 'epoch': 1.18} {'loss': 0.4302, 'learning_rate': 7.2661853914526985e-06, 'epoch': 1.18} {'loss': 0.4091, 'learning_rate': 7.265870511612687e-06, 'epoch': 1.18} {'loss': 0.4647, 'learning_rate': 7.265555634702541e-06, 'epoch': 1.18} {'loss': 0.6518, 'learning_rate': 7.265240760722603e-06, 'epoch': 1.18} {'loss': 0.4942, 'learning_rate': 7.264925889673205e-06, 'epoch': 1.18} {'loss': 0.6456, 'learning_rate': 7.264611021554682e-06, 'epoch': 1.18} {'loss': 0.518, 'learning_rate': 7.264296156367379e-06, 'epoch': 1.18} {'loss': 0.5463, 'learning_rate': 7.263981294111624e-06, 'epoch': 1.18} {'loss': 0.3479, 'learning_rate': 7.2636664347877665e-06, 'epoch': 1.18} {'loss': 0.4659, 'learning_rate': 7.263351578396135e-06, 'epoch': 1.18} {'loss': 0.507, 'learning_rate': 7.2630367249370696e-06, 'epoch': 1.18} {'loss': 0.4761, 'learning_rate': 7.262721874410907e-06, 'epoch': 1.18} {'loss': 0.4227, 'learning_rate': 7.262407026817982e-06, 'epoch': 1.18} {'loss': 0.4929, 'learning_rate': 7.26209218215864e-06, 'epoch': 1.18} {'loss': 0.5627, 'learning_rate': 7.261777340433208e-06, 'epoch': 1.18} {'loss': 0.464, 'learning_rate': 7.261462501642034e-06, 'epoch': 1.18} {'loss': 0.6191, 'learning_rate': 7.261147665785449e-06, 'epoch': 1.18} {'loss': 0.4758, 'learning_rate': 7.260832832863789e-06, 'epoch': 1.18} {'loss': 0.5274, 'learning_rate': 7.260518002877397e-06, 'epoch': 1.18} {'loss': 0.5714, 'learning_rate': 7.260203175826603e-06, 'epoch': 1.18} {'loss': 0.5442, 'learning_rate': 7.259888351711753e-06, 'epoch': 1.18} {'loss': 0.5865, 'learning_rate': 7.259573530533175e-06, 'epoch': 1.18} {'loss': 0.6444, 'learning_rate': 7.259258712291215e-06, 'epoch': 1.18} {'loss': 0.6684, 'learning_rate': 7.258943896986208e-06, 'epoch': 1.18} {'loss': 0.4601, 'learning_rate': 7.258629084618487e-06, 'epoch': 1.18} {'loss': 0.6001, 'learning_rate': 7.258314275188396e-06, 'epoch': 1.18} {'loss': 0.5006, 'learning_rate': 7.257999468696262e-06, 'epoch': 1.18} {'loss': 0.6681, 'learning_rate': 7.257684665142435e-06, 'epoch': 1.18} {'loss': 0.3816, 'learning_rate': 7.257369864527246e-06, 'epoch': 1.18} {'loss': 0.5673, 'learning_rate': 7.257055066851029e-06, 'epoch': 1.18} {'loss': 0.5883, 'learning_rate': 7.256740272114129e-06, 'epoch': 1.18} {'loss': 0.5728, 'learning_rate': 7.2564254803168765e-06, 'epoch': 1.18} {'loss': 0.6144, 'learning_rate': 7.256110691459614e-06, 'epoch': 1.18} {'loss': 0.6798, 'learning_rate': 7.255795905542673e-06, 'epoch': 1.18} {'loss': 0.3982, 'learning_rate': 7.2554811225663975e-06, 'epoch': 1.18} {'loss': 0.5149, 'learning_rate': 7.255166342531123e-06, 'epoch': 1.18} {'loss': 0.6123, 'learning_rate': 7.254851565437181e-06, 'epoch': 1.18} {'loss': 0.526, 'learning_rate': 7.254536791284917e-06, 'epoch': 1.18} {'loss': 0.3046, 'learning_rate': 7.254222020074662e-06, 'epoch': 1.18} {'loss': 0.6626, 'learning_rate': 7.25390725180676e-06, 'epoch': 1.18} {'loss': 0.5538, 'learning_rate': 7.253592486481539e-06, 'epoch': 1.18} {'loss': 0.4493, 'learning_rate': 7.253277724099346e-06, 'epoch': 1.18} {'loss': 0.505, 'learning_rate': 7.252962964660513e-06, 'epoch': 1.18} {'loss': 0.4905, 'learning_rate': 7.252648208165374e-06, 'epoch': 1.18} {'loss': 0.6273, 'learning_rate': 7.2523334546142755e-06, 'epoch': 1.18} {'loss': 0.4872, 'learning_rate': 7.2520187040075465e-06, 'epoch': 1.18} {'loss': 0.5431, 'learning_rate': 7.25170395634553e-06, 'epoch': 1.18} {'loss': 0.5358, 'learning_rate': 7.251389211628561e-06, 'epoch': 1.18} {'loss': 0.6074, 'learning_rate': 7.2510744698569716e-06, 'epoch': 1.18} {'loss': 0.6601, 'learning_rate': 7.25075973103111e-06, 'epoch': 1.18} {'loss': 0.5736, 'learning_rate': 7.250444995151301e-06, 'epoch': 1.18} {'loss': 0.6015, 'learning_rate': 7.2501302622178934e-06, 'epoch': 1.18} {'loss': 0.5283, 'learning_rate': 7.2498155322312184e-06, 'epoch': 1.18} {'loss': 0.4683, 'learning_rate': 7.249500805191615e-06, 'epoch': 1.18} {'loss': 0.5242, 'learning_rate': 7.2491860810994194e-06, 'epoch': 1.18} {'loss': 0.6752, 'learning_rate': 7.248871359954968e-06, 'epoch': 1.18} {'loss': 0.5514, 'learning_rate': 7.248556641758599e-06, 'epoch': 1.18} {'loss': 0.4208, 'learning_rate': 7.248241926510648e-06, 'epoch': 1.18} {'loss': 0.6374, 'learning_rate': 7.247927214211459e-06, 'epoch': 1.18} {'loss': 0.5106, 'learning_rate': 7.2476125048613625e-06, 'epoch': 1.18} {'loss': 0.4697, 'learning_rate': 7.247297798460699e-06, 'epoch': 1.18} {'loss': 0.5667, 'learning_rate': 7.246983095009803e-06, 'epoch': 1.18} {'loss': 0.5746, 'learning_rate': 7.246668394509011e-06, 'epoch': 1.18} {'loss': 0.5812, 'learning_rate': 7.2463536969586655e-06, 'epoch': 1.18} {'loss': 0.5465, 'learning_rate': 7.2460390023590975e-06, 'epoch': 1.18} {'loss': 0.637, 'learning_rate': 7.245724310710649e-06, 'epoch': 1.18} {'loss': 0.5933, 'learning_rate': 7.245409622013657e-06, 'epoch': 1.18} {'loss': 0.5108, 'learning_rate': 7.245094936268455e-06, 'epoch': 1.18} {'loss': 0.5648, 'learning_rate': 7.244780253475385e-06, 'epoch': 1.18} {'loss': 0.5574, 'learning_rate': 7.244465573634776e-06, 'epoch': 1.18} {'loss': 0.6733, 'learning_rate': 7.244150896746976e-06, 'epoch': 1.18} {'loss': 0.6094, 'learning_rate': 7.243836222812315e-06, 'epoch': 1.18} {'loss': 0.5722, 'learning_rate': 7.243521551831134e-06, 'epoch': 1.18} {'loss': 0.4273, 'learning_rate': 7.243206883803767e-06, 'epoch': 1.18} {'loss': 0.4128, 'learning_rate': 7.2428922187305524e-06, 'epoch': 1.18} {'loss': 0.6901, 'learning_rate': 7.242577556611829e-06, 'epoch': 1.18} {'loss': 0.5557, 'learning_rate': 7.242262897447929e-06, 'epoch': 1.18} {'loss': 0.6299, 'learning_rate': 7.241948241239199e-06, 'epoch': 1.18} {'loss': 0.5054, 'learning_rate': 7.241633587985965e-06, 'epoch': 1.18} {'loss': 0.4263, 'learning_rate': 7.241318937688575e-06, 'epoch': 1.18} {'loss': 0.5359, 'learning_rate': 7.241004290347359e-06, 'epoch': 1.18} {'loss': 0.5607, 'learning_rate': 7.240689645962651e-06, 'epoch': 1.18} {'loss': 0.5158, 'learning_rate': 7.2403750045347985e-06, 'epoch': 1.18} {'loss': 0.6271, 'learning_rate': 7.240060366064129e-06, 'epoch': 1.18} {'loss': 0.6604, 'learning_rate': 7.239745730550988e-06, 'epoch': 1.18} {'loss': 0.4692, 'learning_rate': 7.2394310979957085e-06, 'epoch': 1.18} {'loss': 0.6091, 'learning_rate': 7.239116468398625e-06, 'epoch': 1.18} {'loss': 0.6318, 'learning_rate': 7.23880184176008e-06, 'epoch': 1.18} {'loss': 0.6, 'learning_rate': 7.238487218080403e-06, 'epoch': 1.18} {'loss': 0.3825, 'learning_rate': 7.2381725973599424e-06, 'epoch': 1.18} {'loss': 0.3996, 'learning_rate': 7.237857979599023e-06, 'epoch': 1.18} {'loss': 0.5523, 'learning_rate': 7.237543364797994e-06, 'epoch': 1.18} {'loss': 0.6068, 'learning_rate': 7.237228752957185e-06, 'epoch': 1.18} {'loss': 0.477, 'learning_rate': 7.236914144076934e-06, 'epoch': 1.18} {'loss': 0.4893, 'learning_rate': 7.2365995381575804e-06, 'epoch': 1.18} {'loss': 0.5923, 'learning_rate': 7.236284935199455e-06, 'epoch': 1.18} {'loss': 0.688, 'learning_rate': 7.2359703352029045e-06, 'epoch': 1.18} {'loss': 0.6055, 'learning_rate': 7.235655738168262e-06, 'epoch': 1.18} {'loss': 0.574, 'learning_rate': 7.235341144095858e-06, 'epoch': 1.18} {'loss': 0.5864, 'learning_rate': 7.2350265529860395e-06, 'epoch': 1.18} {'loss': 0.49, 'learning_rate': 7.23471196483914e-06, 'epoch': 1.18} {'loss': 0.6531, 'learning_rate': 7.2343973796554956e-06, 'epoch': 1.18} {'loss': 0.691, 'learning_rate': 7.234082797435442e-06, 'epoch': 1.18} {'loss': 0.5086, 'learning_rate': 7.233768218179321e-06, 'epoch': 1.18} {'loss': 0.4878, 'learning_rate': 7.233453641887468e-06, 'epoch': 1.18} {'loss': 0.5011, 'learning_rate': 7.233139068560214e-06, 'epoch': 1.18} {'loss': 0.558, 'learning_rate': 7.232824498197906e-06, 'epoch': 1.18} {'loss': 0.4295, 'learning_rate': 7.232509930800875e-06, 'epoch': 1.18} {'loss': 0.5189, 'learning_rate': 7.232195366369461e-06, 'epoch': 1.18} {'loss': 0.3234, 'learning_rate': 7.231880804903995e-06, 'epoch': 1.18} {'loss': 0.5742, 'learning_rate': 7.231566246404822e-06, 'epoch': 1.18} {'loss': 0.5939, 'learning_rate': 7.231251690872277e-06, 'epoch': 1.18} {'loss': 0.5858, 'learning_rate': 7.230937138306691e-06, 'epoch': 1.18} {'loss': 0.4362, 'learning_rate': 7.230622588708409e-06, 'epoch': 1.18} {'loss': 0.5472, 'learning_rate': 7.230308042077763e-06, 'epoch': 1.18} {'loss': 0.5735, 'learning_rate': 7.2299934984150954e-06, 'epoch': 1.18} {'loss': 0.5824, 'learning_rate': 7.229678957720738e-06, 'epoch': 1.18} {'loss': 0.4603, 'learning_rate': 7.229364419995026e-06, 'epoch': 1.18} {'loss': 0.6413, 'learning_rate': 7.229049885238306e-06, 'epoch': 1.18} {'loss': 0.5691, 'learning_rate': 7.228735353450903e-06, 'epoch': 1.18} {'loss': 0.4726, 'learning_rate': 7.228420824633164e-06, 'epoch': 1.18} {'loss': 0.6244, 'learning_rate': 7.228106298785422e-06, 'epoch': 1.18} {'loss': 0.4879, 'learning_rate': 7.227791775908015e-06, 'epoch': 1.18} {'loss': 0.5806, 'learning_rate': 7.227477256001281e-06, 'epoch': 1.18} {'loss': 0.4059, 'learning_rate': 7.22716273906555e-06, 'epoch': 1.18} {'loss': 0.4364, 'learning_rate': 7.226848225101169e-06, 'epoch': 1.18} {'loss': 0.7524, 'learning_rate': 7.226533714108465e-06, 'epoch': 1.18} {'loss': 0.5692, 'learning_rate': 7.226219206087786e-06, 'epoch': 1.18} {'loss': 0.5464, 'learning_rate': 7.2259047010394604e-06, 'epoch': 1.18} {'loss': 0.5607, 'learning_rate': 7.22559019896383e-06, 'epoch': 1.18} {'loss': 0.5321, 'learning_rate': 7.225275699861232e-06, 'epoch': 1.18} {'loss': 0.5812, 'learning_rate': 7.224961203731995e-06, 'epoch': 1.18} {'loss': 0.6829, 'learning_rate': 7.224646710576468e-06, 'epoch': 1.18} {'loss': 0.4617, 'learning_rate': 7.224332220394978e-06, 'epoch': 1.18} {'loss': 0.575, 'learning_rate': 7.2240177331878715e-06, 'epoch': 1.18} {'loss': 0.4998, 'learning_rate': 7.22370324895548e-06, 'epoch': 1.18} {'loss': 0.532, 'learning_rate': 7.2233887676981396e-06, 'epoch': 1.18} {'loss': 0.6218, 'learning_rate': 7.22307428941619e-06, 'epoch': 1.18} {'loss': 0.3988, 'learning_rate': 7.222759814109963e-06, 'epoch': 1.18} {'loss': 0.4289, 'learning_rate': 7.2224453417798045e-06, 'epoch': 1.18} {'loss': 0.548, 'learning_rate': 7.222130872426043e-06, 'epoch': 1.18} {'loss': 0.5562, 'learning_rate': 7.22181640604902e-06, 'epoch': 1.18} {'loss': 0.5361, 'learning_rate': 7.221501942649073e-06, 'epoch': 1.18} {'loss': 0.5199, 'learning_rate': 7.221187482226535e-06, 'epoch': 1.18} {'loss': 0.5813, 'learning_rate': 7.22087302478175e-06, 'epoch': 1.18} {'loss': 0.4585, 'learning_rate': 7.220558570315043e-06, 'epoch': 1.18} {'loss': 0.4804, 'learning_rate': 7.2202441188267635e-06, 'epoch': 1.18} {'loss': 0.6391, 'learning_rate': 7.219929670317241e-06, 'epoch': 1.18} {'loss': 0.6152, 'learning_rate': 7.219615224786818e-06, 'epoch': 1.18} {'loss': 0.4757, 'learning_rate': 7.219300782235825e-06, 'epoch': 1.18} {'loss': 0.4963, 'learning_rate': 7.218986342664604e-06, 'epoch': 1.18} {'loss': 0.3587, 'learning_rate': 7.2186719060734915e-06, 'epoch': 1.18} {'loss': 0.7281, 'learning_rate': 7.218357472462817e-06, 'epoch': 1.18} {'loss': 0.5722, 'learning_rate': 7.21804304183293e-06, 'epoch': 1.18} {'loss': 0.6116, 'learning_rate': 7.217728614184159e-06, 'epoch': 1.18} {'loss': 0.6643, 'learning_rate': 7.217414189516843e-06, 'epoch': 1.18} {'loss': 0.4955, 'learning_rate': 7.217099767831319e-06, 'epoch': 1.18} {'loss': 0.6412, 'learning_rate': 7.216785349127919e-06, 'epoch': 1.18} {'loss': 0.4034, 'learning_rate': 7.2164709334069915e-06, 'epoch': 1.18} {'loss': 0.5979, 'learning_rate': 7.216156520668861e-06, 'epoch': 1.18} {'loss': 0.5309, 'learning_rate': 7.215842110913874e-06, 'epoch': 1.18} {'loss': 0.589, 'learning_rate': 7.2155277041423645e-06, 'epoch': 1.18} {'loss': 0.5357, 'learning_rate': 7.215213300354666e-06, 'epoch': 1.18} {'loss': 0.6187, 'learning_rate': 7.214898899551119e-06, 'epoch': 1.18} {'loss': 0.5734, 'learning_rate': 7.214584501732056e-06, 'epoch': 1.18} {'loss': 0.5174, 'learning_rate': 7.2142701068978205e-06, 'epoch': 1.18} {'loss': 0.5908, 'learning_rate': 7.213955715048742e-06, 'epoch': 1.18} {'loss': 0.4242, 'learning_rate': 7.213641326185166e-06, 'epoch': 1.18} {'loss': 0.5546, 'learning_rate': 7.213326940307424e-06, 'epoch': 1.18} {'loss': 0.6051, 'learning_rate': 7.2130125574158525e-06, 'epoch': 1.18} {'loss': 0.4462, 'learning_rate': 7.2126981775107906e-06, 'epoch': 1.18} {'loss': 0.6524, 'learning_rate': 7.212383800592571e-06, 'epoch': 1.18} {'loss': 0.4649, 'learning_rate': 7.2120694266615385e-06, 'epoch': 1.18} {'loss': 0.6128, 'learning_rate': 7.211755055718024e-06, 'epoch': 1.18} {'loss': 0.5724, 'learning_rate': 7.211440687762361e-06, 'epoch': 1.18} {'loss': 0.5945, 'learning_rate': 7.211126322794897e-06, 'epoch': 1.18} {'loss': 0.6352, 'learning_rate': 7.21081196081596e-06, 'epoch': 1.18} {'loss': 0.5336, 'learning_rate': 7.210497601825891e-06, 'epoch': 1.18} {'loss': 0.5455, 'learning_rate': 7.210183245825022e-06, 'epoch': 1.18} {'loss': 0.4866, 'learning_rate': 7.209868892813698e-06, 'epoch': 1.18} {'loss': 0.5198, 'learning_rate': 7.209554542792251e-06, 'epoch': 1.18} {'loss': 0.3886, 'learning_rate': 7.209240195761014e-06, 'epoch': 1.18} {'loss': 0.6528, 'learning_rate': 7.208925851720332e-06, 'epoch': 1.18} {'loss': 0.4603, 'learning_rate': 7.208611510670535e-06, 'epoch': 1.18} {'loss': 0.7158, 'learning_rate': 7.2082971726119665e-06, 'epoch': 1.18} {'loss': 0.5628, 'learning_rate': 7.207982837544958e-06, 'epoch': 1.18} {'loss': 0.5166, 'learning_rate': 7.207668505469845e-06, 'epoch': 1.18} {'loss': 0.5171, 'learning_rate': 7.207354176386972e-06, 'epoch': 1.18} {'loss': 0.5402, 'learning_rate': 7.207039850296664e-06, 'epoch': 1.18} {'loss': 0.5771, 'learning_rate': 7.206725527199271e-06, 'epoch': 1.18} {'loss': 0.5949, 'learning_rate': 7.206411207095121e-06, 'epoch': 1.18} {'loss': 0.5856, 'learning_rate': 7.206096889984556e-06, 'epoch': 1.18} {'loss': 0.6393, 'learning_rate': 7.20578257586791e-06, 'epoch': 1.18} {'loss': 0.6021, 'learning_rate': 7.205468264745517e-06, 'epoch': 1.18} {'loss': 0.4244, 'learning_rate': 7.205153956617721e-06, 'epoch': 1.18} {'loss': 0.5998, 'learning_rate': 7.204839651484849e-06, 'epoch': 1.18} {'loss': 0.4497, 'learning_rate': 7.2045253493472485e-06, 'epoch': 1.18} {'loss': 0.5178, 'learning_rate': 7.20421105020525e-06, 'epoch': 1.18} {'loss': 0.5526, 'learning_rate': 7.2038967540591945e-06, 'epoch': 1.18} {'loss': 0.6077, 'learning_rate': 7.2035824609094155e-06, 'epoch': 1.18} {'loss': 0.3812, 'learning_rate': 7.203268170756244e-06, 'epoch': 1.18} {'loss': 0.6051, 'learning_rate': 7.202953883600029e-06, 'epoch': 1.18} {'loss': 0.6418, 'learning_rate': 7.202639599441097e-06, 'epoch': 1.18} {'loss': 0.5777, 'learning_rate': 7.202325318279794e-06, 'epoch': 1.18} {'loss': 0.596, 'learning_rate': 7.20201104011645e-06, 'epoch': 1.18} {'loss': 0.5906, 'learning_rate': 7.201696764951403e-06, 'epoch': 1.18} {'loss': 0.5337, 'learning_rate': 7.201382492784993e-06, 'epoch': 1.18} {'loss': 0.5358, 'learning_rate': 7.201068223617549e-06, 'epoch': 1.18} {'loss': 0.6003, 'learning_rate': 7.200753957449418e-06, 'epoch': 1.18} {'loss': 0.4338, 'learning_rate': 7.200439694280928e-06, 'epoch': 1.18} {'loss': 0.4338, 'learning_rate': 7.200125434112421e-06, 'epoch': 1.18} {'loss': 0.5696, 'learning_rate': 7.199811176944236e-06, 'epoch': 1.18} {'loss': 0.6187, 'learning_rate': 7.199496922776702e-06, 'epoch': 1.18} {'loss': 0.528, 'learning_rate': 7.199182671610162e-06, 'epoch': 1.18} {'loss': 0.5647, 'learning_rate': 7.1988684234449465e-06, 'epoch': 1.18} {'loss': 0.5826, 'learning_rate': 7.198554178281401e-06, 'epoch': 1.18} {'loss': 0.4109, 'learning_rate': 7.198239936119855e-06, 'epoch': 1.18} {'loss': 0.5624, 'learning_rate': 7.197925696960648e-06, 'epoch': 1.18} {'loss': 0.4964, 'learning_rate': 7.197611460804118e-06, 'epoch': 1.18} {'loss': 0.6155, 'learning_rate': 7.197297227650598e-06, 'epoch': 1.18} {'loss': 0.7209, 'learning_rate': 7.19698299750043e-06, 'epoch': 1.18} {'loss': 0.5174, 'learning_rate': 7.196668770353943e-06, 'epoch': 1.18} {'loss': 0.6321, 'learning_rate': 7.196354546211483e-06, 'epoch': 1.18} {'loss': 0.4609, 'learning_rate': 7.196040325073381e-06, 'epoch': 1.18} {'loss': 0.4697, 'learning_rate': 7.1957261069399745e-06, 'epoch': 1.18} {'loss': 0.4521, 'learning_rate': 7.195411891811599e-06, 'epoch': 1.18} {'loss': 0.5536, 'learning_rate': 7.195097679688594e-06, 'epoch': 1.18} {'loss': 0.6721, 'learning_rate': 7.194783470571296e-06, 'epoch': 1.18} {'loss': 0.6011, 'learning_rate': 7.194469264460038e-06, 'epoch': 1.18} {'loss': 0.3758, 'learning_rate': 7.194155061355163e-06, 'epoch': 1.18} {'loss': 0.5553, 'learning_rate': 7.193840861257003e-06, 'epoch': 1.18} {'loss': 0.5433, 'learning_rate': 7.193526664165895e-06, 'epoch': 1.18} {'loss': 0.3898, 'learning_rate': 7.193212470082178e-06, 'epoch': 1.18} {'loss': 0.4397, 'learning_rate': 7.192898279006183e-06, 'epoch': 1.18} {'loss': 0.5224, 'learning_rate': 7.192584090938255e-06, 'epoch': 1.18} {'loss': 0.6085, 'learning_rate': 7.192269905878722e-06, 'epoch': 1.18} {'loss': 0.4563, 'learning_rate': 7.19195572382793e-06, 'epoch': 1.18} {'loss': 0.49, 'learning_rate': 7.191641544786211e-06, 'epoch': 1.18} {'loss': 0.6112, 'learning_rate': 7.191327368753899e-06, 'epoch': 1.18} {'loss': 0.6698, 'learning_rate': 7.191013195731336e-06, 'epoch': 1.18} {'loss': 0.5818, 'learning_rate': 7.19069902571885e-06, 'epoch': 1.18} {'loss': 0.5328, 'learning_rate': 7.19038485871679e-06, 'epoch': 1.18} {'loss': 0.4107, 'learning_rate': 7.190070694725485e-06, 'epoch': 1.18} {'loss': 0.6049, 'learning_rate': 7.189756533745269e-06, 'epoch': 1.18} {'loss': 0.6346, 'learning_rate': 7.189442375776486e-06, 'epoch': 1.18} {'loss': 0.584, 'learning_rate': 7.189128220819468e-06, 'epoch': 1.18} {'loss': 0.536, 'learning_rate': 7.188814068874554e-06, 'epoch': 1.18} {'loss': 0.5056, 'learning_rate': 7.188499919942076e-06, 'epoch': 1.18} {'loss': 0.6113, 'learning_rate': 7.188185774022378e-06, 'epoch': 1.18} {'loss': 0.6839, 'learning_rate': 7.187871631115792e-06, 'epoch': 1.18} {'loss': 0.5263, 'learning_rate': 7.187557491222653e-06, 'epoch': 1.18} {'loss': 0.4055, 'learning_rate': 7.187243354343303e-06, 'epoch': 1.18} {'loss': 0.6343, 'learning_rate': 7.186929220478074e-06, 'epoch': 1.18} {'loss': 0.6684, 'learning_rate': 7.186615089627306e-06, 'epoch': 1.18} {'loss': 0.5425, 'learning_rate': 7.186300961791329e-06, 'epoch': 1.18} {'loss': 0.4145, 'learning_rate': 7.185986836970488e-06, 'epoch': 1.18} {'loss': 0.626, 'learning_rate': 7.18567271516512e-06, 'epoch': 1.18} {'loss': 0.4913, 'learning_rate': 7.185358596375549e-06, 'epoch': 1.18} {'loss': 0.6143, 'learning_rate': 7.185044480602127e-06, 'epoch': 1.18} {'loss': 0.6684, 'learning_rate': 7.184730367845181e-06, 'epoch': 1.18} {'loss': 0.6299, 'learning_rate': 7.184416258105054e-06, 'epoch': 1.18} {'loss': 0.4246, 'learning_rate': 7.184102151382077e-06, 'epoch': 1.18} {'loss': 0.4926, 'learning_rate': 7.1837880476765855e-06, 'epoch': 1.18} {'loss': 0.5681, 'learning_rate': 7.183473946988924e-06, 'epoch': 1.18} {'loss': 0.6246, 'learning_rate': 7.183159849319419e-06, 'epoch': 1.18} {'loss': 0.4963, 'learning_rate': 7.182845754668417e-06, 'epoch': 1.18} {'loss': 0.6314, 'learning_rate': 7.1825316630362475e-06, 'epoch': 1.18} {'loss': 0.5592, 'learning_rate': 7.182217574423252e-06, 'epoch': 1.18} {'loss': 0.5249, 'learning_rate': 7.181903488829766e-06, 'epoch': 1.18} {'loss': 0.6004, 'learning_rate': 7.18158940625612e-06, 'epoch': 1.18} {'loss': 0.6507, 'learning_rate': 7.181275326702659e-06, 'epoch': 1.18} {'loss': 0.6366, 'learning_rate': 7.180961250169711e-06, 'epoch': 1.18} {'loss': 0.7296, 'learning_rate': 7.180647176657622e-06, 'epoch': 1.18} {'loss': 0.5734, 'learning_rate': 7.180333106166726e-06, 'epoch': 1.18} {'loss': 0.4913, 'learning_rate': 7.180019038697353e-06, 'epoch': 1.18} {'loss': 0.5924, 'learning_rate': 7.179704974249847e-06, 'epoch': 1.18} {'loss': 0.5585, 'learning_rate': 7.179390912824538e-06, 'epoch': 1.18} {'loss': 0.5549, 'learning_rate': 7.17907685442177e-06, 'epoch': 1.18} {'loss': 0.5483, 'learning_rate': 7.178762799041871e-06, 'epoch': 1.18} {'loss': 0.5869, 'learning_rate': 7.178448746685187e-06, 'epoch': 1.18} {'loss': 0.4786, 'learning_rate': 7.1781346973520505e-06, 'epoch': 1.18} {'loss': 0.4908, 'learning_rate': 7.177820651042795e-06, 'epoch': 1.18} {'loss': 0.5709, 'learning_rate': 7.17750660775776e-06, 'epoch': 1.18} {'loss': 0.6667, 'learning_rate': 7.17719256749728e-06, 'epoch': 1.18} {'loss': 0.4855, 'learning_rate': 7.176878530261695e-06, 'epoch': 1.18} {'loss': 0.5189, 'learning_rate': 7.1765644960513344e-06, 'epoch': 1.18} {'loss': 0.5623, 'learning_rate': 7.176250464866546e-06, 'epoch': 1.18} {'loss': 0.5616, 'learning_rate': 7.17593643670766e-06, 'epoch': 1.18} {'loss': 0.5759, 'learning_rate': 7.17562241157501e-06, 'epoch': 1.18} {'loss': 0.6573, 'learning_rate': 7.175308389468938e-06, 'epoch': 1.18} {'loss': 0.6627, 'learning_rate': 7.174994370389774e-06, 'epoch': 1.18} {'loss': 0.4996, 'learning_rate': 7.174680354337862e-06, 'epoch': 1.18} {'loss': 0.5796, 'learning_rate': 7.174366341313535e-06, 'epoch': 1.18} {'loss': 0.549, 'learning_rate': 7.174052331317127e-06, 'epoch': 1.18} {'loss': 0.4636, 'learning_rate': 7.17373832434898e-06, 'epoch': 1.18} {'loss': 0.436, 'learning_rate': 7.173424320409424e-06, 'epoch': 1.18} {'loss': 0.4177, 'learning_rate': 7.173110319498804e-06, 'epoch': 1.19} {'loss': 0.5906, 'learning_rate': 7.1727963216174445e-06, 'epoch': 1.19} {'loss': 0.6095, 'learning_rate': 7.172482326765695e-06, 'epoch': 1.19} {'loss': 0.6133, 'learning_rate': 7.172168334943884e-06, 'epoch': 1.19} {'loss': 0.5341, 'learning_rate': 7.1718543461523474e-06, 'epoch': 1.19} {'loss': 0.5736, 'learning_rate': 7.171540360391427e-06, 'epoch': 1.19} {'loss': 0.5607, 'learning_rate': 7.171226377661455e-06, 'epoch': 1.19} {'loss': 0.6479, 'learning_rate': 7.170912397962772e-06, 'epoch': 1.19} {'loss': 0.5029, 'learning_rate': 7.170598421295707e-06, 'epoch': 1.19} {'loss': 0.5121, 'learning_rate': 7.170284447660605e-06, 'epoch': 1.19} {'loss': 0.569, 'learning_rate': 7.1699704770577985e-06, 'epoch': 1.19} {'loss': 0.4967, 'learning_rate': 7.1696565094876215e-06, 'epoch': 1.19} {'loss': 0.5317, 'learning_rate': 7.169342544950415e-06, 'epoch': 1.19} {'loss': 0.562, 'learning_rate': 7.169028583446511e-06, 'epoch': 1.19} {'loss': 0.6961, 'learning_rate': 7.168714624976251e-06, 'epoch': 1.19} {'loss': 0.5081, 'learning_rate': 7.168400669539971e-06, 'epoch': 1.19} {'loss': 0.6053, 'learning_rate': 7.168086717137999e-06, 'epoch': 1.19} {'loss': 0.5963, 'learning_rate': 7.1677727677706825e-06, 'epoch': 1.19} {'loss': 0.478, 'learning_rate': 7.167458821438351e-06, 'epoch': 1.19} {'loss': 0.6464, 'learning_rate': 7.167144878141345e-06, 'epoch': 1.19} {'loss': 0.597, 'learning_rate': 7.166830937879995e-06, 'epoch': 1.19} {'loss': 0.4361, 'learning_rate': 7.166517000654644e-06, 'epoch': 1.19} {'loss': 0.509, 'learning_rate': 7.166203066465629e-06, 'epoch': 1.19} {'loss': 0.5263, 'learning_rate': 7.165889135313276e-06, 'epoch': 1.19} {'loss': 0.629, 'learning_rate': 7.165575207197935e-06, 'epoch': 1.19} {'loss': 0.541, 'learning_rate': 7.165261282119933e-06, 'epoch': 1.19} {'loss': 0.5752, 'learning_rate': 7.1649473600796106e-06, 'epoch': 1.19} {'loss': 0.5474, 'learning_rate': 7.1646334410773e-06, 'epoch': 1.19} {'loss': 0.5665, 'learning_rate': 7.164319525113344e-06, 'epoch': 1.19} {'loss': 0.6798, 'learning_rate': 7.164005612188075e-06, 'epoch': 1.19} {'loss': 0.5702, 'learning_rate': 7.163691702301827e-06, 'epoch': 1.19} {'loss': 0.6554, 'learning_rate': 7.163377795454943e-06, 'epoch': 1.19} {'loss': 0.5802, 'learning_rate': 7.163063891647754e-06, 'epoch': 1.19} {'loss': 0.5672, 'learning_rate': 7.1627499908805995e-06, 'epoch': 1.19} {'loss': 0.5277, 'learning_rate': 7.162436093153815e-06, 'epoch': 1.19} {'loss': 0.381, 'learning_rate': 7.1621221984677314e-06, 'epoch': 1.19} {'loss': 0.6016, 'learning_rate': 7.161808306822695e-06, 'epoch': 1.19} {'loss': 0.6057, 'learning_rate': 7.161494418219032e-06, 'epoch': 1.19} {'loss': 0.6243, 'learning_rate': 7.16118053265709e-06, 'epoch': 1.19} {'loss': 0.5907, 'learning_rate': 7.160866650137196e-06, 'epoch': 1.19} {'loss': 0.4671, 'learning_rate': 7.160552770659692e-06, 'epoch': 1.19} {'loss': 0.4587, 'learning_rate': 7.160238894224911e-06, 'epoch': 1.19} {'loss': 0.6479, 'learning_rate': 7.159925020833187e-06, 'epoch': 1.19} {'loss': 0.5316, 'learning_rate': 7.1596111504848646e-06, 'epoch': 1.19} {'loss': 0.5507, 'learning_rate': 7.1592972831802696e-06, 'epoch': 1.19} {'loss': 0.5573, 'learning_rate': 7.158983418919749e-06, 'epoch': 1.19} {'loss': 0.672, 'learning_rate': 7.158669557703631e-06, 'epoch': 1.19} {'loss': 0.4197, 'learning_rate': 7.158355699532258e-06, 'epoch': 1.19} {'loss': 0.5385, 'learning_rate': 7.158041844405963e-06, 'epoch': 1.19} {'loss': 0.5925, 'learning_rate': 7.1577279923250785e-06, 'epoch': 1.19} {'loss': 0.6284, 'learning_rate': 7.157414143289949e-06, 'epoch': 1.19} {'loss': 0.544, 'learning_rate': 7.157100297300903e-06, 'epoch': 1.19} {'loss': 0.76, 'learning_rate': 7.156786454358286e-06, 'epoch': 1.19} {'loss': 0.4741, 'learning_rate': 7.156472614462427e-06, 'epoch': 1.19} {'loss': 0.5424, 'learning_rate': 7.1561587776136636e-06, 'epoch': 1.19} {'loss': 0.5081, 'learning_rate': 7.155844943812334e-06, 'epoch': 1.19} {'loss': 0.5144, 'learning_rate': 7.155531113058769e-06, 'epoch': 1.19} {'loss': 0.45, 'learning_rate': 7.155217285353313e-06, 'epoch': 1.19} {'loss': 0.5079, 'learning_rate': 7.154903460696294e-06, 'epoch': 1.19} {'loss': 0.635, 'learning_rate': 7.154589639088059e-06, 'epoch': 1.19} {'loss': 0.5064, 'learning_rate': 7.154275820528935e-06, 'epoch': 1.19} {'loss': 0.5671, 'learning_rate': 7.153962005019261e-06, 'epoch': 1.19} {'loss': 0.6282, 'learning_rate': 7.153648192559376e-06, 'epoch': 1.19} {'loss': 0.5632, 'learning_rate': 7.153334383149609e-06, 'epoch': 1.19} {'loss': 0.5923, 'learning_rate': 7.153020576790306e-06, 'epoch': 1.19} {'loss': 0.4952, 'learning_rate': 7.1527067734817975e-06, 'epoch': 1.19} {'loss': 0.6249, 'learning_rate': 7.1523929732244164e-06, 'epoch': 1.19} {'loss': 0.6842, 'learning_rate': 7.15207917601851e-06, 'epoch': 1.19} {'loss': 0.6306, 'learning_rate': 7.151765381864402e-06, 'epoch': 1.19} {'loss': 0.5303, 'learning_rate': 7.151451590762438e-06, 'epoch': 1.19} {'loss': 0.5042, 'learning_rate': 7.1511378027129465e-06, 'epoch': 1.19} {'loss': 0.6635, 'learning_rate': 7.1508240177162735e-06, 'epoch': 1.19} {'loss': 0.5644, 'learning_rate': 7.150510235772748e-06, 'epoch': 1.19} {'loss': 0.5373, 'learning_rate': 7.1501964568827045e-06, 'epoch': 1.19} {'loss': 0.6222, 'learning_rate': 7.149882681046487e-06, 'epoch': 1.19} {'loss': 0.6764, 'learning_rate': 7.149568908264425e-06, 'epoch': 1.19} {'loss': 0.4754, 'learning_rate': 7.149255138536859e-06, 'epoch': 1.19} {'loss': 0.6485, 'learning_rate': 7.14894137186412e-06, 'epoch': 1.19} {'loss': 0.5758, 'learning_rate': 7.148627608246551e-06, 'epoch': 1.19} {'loss': 0.6005, 'learning_rate': 7.1483138476844845e-06, 'epoch': 1.19} {'loss': 0.5406, 'learning_rate': 7.148000090178256e-06, 'epoch': 1.19} {'loss': 0.5306, 'learning_rate': 7.147686335728203e-06, 'epoch': 1.19} {'loss': 0.6168, 'learning_rate': 7.147372584334662e-06, 'epoch': 1.19} {'loss': 0.5442, 'learning_rate': 7.1470588359979696e-06, 'epoch': 1.19} {'loss': 0.6031, 'learning_rate': 7.146745090718461e-06, 'epoch': 1.19} {'loss': 0.34, 'learning_rate': 7.146431348496469e-06, 'epoch': 1.19} {'loss': 0.5029, 'learning_rate': 7.146117609332338e-06, 'epoch': 1.19} {'loss': 0.5485, 'learning_rate': 7.145803873226397e-06, 'epoch': 1.19} {'loss': 0.5457, 'learning_rate': 7.145490140178985e-06, 'epoch': 1.19} {'loss': 0.565, 'learning_rate': 7.145176410190437e-06, 'epoch': 1.19} {'loss': 0.6027, 'learning_rate': 7.144862683261093e-06, 'epoch': 1.19} {'loss': 0.5866, 'learning_rate': 7.144548959391286e-06, 'epoch': 1.19} {'loss': 0.4706, 'learning_rate': 7.144235238581349e-06, 'epoch': 1.19} {'loss': 0.5739, 'learning_rate': 7.143921520831625e-06, 'epoch': 1.19} {'loss': 0.4841, 'learning_rate': 7.143607806142445e-06, 'epoch': 1.19} {'loss': 0.4483, 'learning_rate': 7.14329409451415e-06, 'epoch': 1.19} {'loss': 0.4683, 'learning_rate': 7.142980385947068e-06, 'epoch': 1.19} {'loss': 0.5637, 'learning_rate': 7.142666680441544e-06, 'epoch': 1.19} {'loss': 0.4813, 'learning_rate': 7.142352977997913e-06, 'epoch': 1.19} {'loss': 0.6013, 'learning_rate': 7.142039278616502e-06, 'epoch': 1.19} {'loss': 0.5633, 'learning_rate': 7.14172558229766e-06, 'epoch': 1.19} {'loss': 0.5286, 'learning_rate': 7.141411889041714e-06, 'epoch': 1.19} {'loss': 0.3726, 'learning_rate': 7.141098198849004e-06, 'epoch': 1.19} {'loss': 0.5595, 'learning_rate': 7.140784511719867e-06, 'epoch': 1.19} {'loss': 0.6778, 'learning_rate': 7.1404708276546335e-06, 'epoch': 1.19} {'loss': 0.417, 'learning_rate': 7.140157146653646e-06, 'epoch': 1.19} {'loss': 0.6262, 'learning_rate': 7.139843468717236e-06, 'epoch': 1.19} {'loss': 0.4363, 'learning_rate': 7.139529793845745e-06, 'epoch': 1.19} {'loss': 0.7131, 'learning_rate': 7.139216122039503e-06, 'epoch': 1.19} {'loss': 0.6035, 'learning_rate': 7.1389024532988526e-06, 'epoch': 1.19} {'loss': 0.3403, 'learning_rate': 7.138588787624126e-06, 'epoch': 1.19} {'loss': 0.5675, 'learning_rate': 7.138275125015656e-06, 'epoch': 1.19} {'loss': 0.4728, 'learning_rate': 7.137961465473786e-06, 'epoch': 1.19} {'loss': 0.5183, 'learning_rate': 7.137647808998844e-06, 'epoch': 1.19} {'loss': 0.625, 'learning_rate': 7.137334155591177e-06, 'epoch': 1.19} {'loss': 0.5147, 'learning_rate': 7.137020505251111e-06, 'epoch': 1.19} {'loss': 0.5172, 'learning_rate': 7.136706857978989e-06, 'epoch': 1.19} {'loss': 0.6105, 'learning_rate': 7.136393213775143e-06, 'epoch': 1.19} {'loss': 0.5884, 'learning_rate': 7.1360795726399065e-06, 'epoch': 1.19} {'loss': 0.4415, 'learning_rate': 7.135765934573624e-06, 'epoch': 1.19} {'loss': 0.5443, 'learning_rate': 7.1354522995766215e-06, 'epoch': 1.19} {'loss': 0.5887, 'learning_rate': 7.135138667649245e-06, 'epoch': 1.19} {'loss': 0.5487, 'learning_rate': 7.134825038791826e-06, 'epoch': 1.19} {'loss': 0.443, 'learning_rate': 7.134511413004699e-06, 'epoch': 1.19} {'loss': 0.5224, 'learning_rate': 7.134197790288202e-06, 'epoch': 1.19} {'loss': 0.6265, 'learning_rate': 7.133884170642669e-06, 'epoch': 1.19} {'loss': 0.4994, 'learning_rate': 7.1335705540684406e-06, 'epoch': 1.19} {'loss': 0.5339, 'learning_rate': 7.133256940565846e-06, 'epoch': 1.19} {'loss': 0.6278, 'learning_rate': 7.132943330135229e-06, 'epoch': 1.19} {'loss': 0.5328, 'learning_rate': 7.1326297227769225e-06, 'epoch': 1.19} {'loss': 0.5679, 'learning_rate': 7.13231611849126e-06, 'epoch': 1.19} {'loss': 0.716, 'learning_rate': 7.1320025172785826e-06, 'epoch': 1.19} {'loss': 0.6769, 'learning_rate': 7.131688919139217e-06, 'epoch': 1.19} {'loss': 0.5828, 'learning_rate': 7.131375324073511e-06, 'epoch': 1.19} {'loss': 0.5836, 'learning_rate': 7.131061732081792e-06, 'epoch': 1.19} {'loss': 0.463, 'learning_rate': 7.130748143164403e-06, 'epoch': 1.19} {'loss': 0.6385, 'learning_rate': 7.130434557321675e-06, 'epoch': 1.19} {'loss': 0.6144, 'learning_rate': 7.130120974553945e-06, 'epoch': 1.19} {'loss': 0.6056, 'learning_rate': 7.12980739486155e-06, 'epoch': 1.19} {'loss': 0.4789, 'learning_rate': 7.1294938182448225e-06, 'epoch': 1.19} {'loss': 0.6199, 'learning_rate': 7.129180244704105e-06, 'epoch': 1.19} {'loss': 0.517, 'learning_rate': 7.1288666742397295e-06, 'epoch': 1.19} {'loss': 0.3864, 'learning_rate': 7.128553106852029e-06, 'epoch': 1.19} {'loss': 0.5342, 'learning_rate': 7.1282395425413475e-06, 'epoch': 1.19} {'loss': 0.6542, 'learning_rate': 7.1279259813080135e-06, 'epoch': 1.19} {'loss': 0.4278, 'learning_rate': 7.127612423152369e-06, 'epoch': 1.19} {'loss': 0.4426, 'learning_rate': 7.127298868074742e-06, 'epoch': 1.19} {'loss': 0.6571, 'learning_rate': 7.1269853160754785e-06, 'epoch': 1.19} {'loss': 0.6454, 'learning_rate': 7.126671767154909e-06, 'epoch': 1.19} {'loss': 0.7085, 'learning_rate': 7.126358221313367e-06, 'epoch': 1.19} {'loss': 0.4707, 'learning_rate': 7.126044678551194e-06, 'epoch': 1.19} {'loss': 0.6423, 'learning_rate': 7.125731138868723e-06, 'epoch': 1.19} {'loss': 0.6254, 'learning_rate': 7.125417602266292e-06, 'epoch': 1.19} {'loss': 0.6077, 'learning_rate': 7.125104068744235e-06, 'epoch': 1.19} {'loss': 0.5788, 'learning_rate': 7.124790538302884e-06, 'epoch': 1.19} {'loss': 0.6558, 'learning_rate': 7.124477010942585e-06, 'epoch': 1.19} {'loss': 0.6021, 'learning_rate': 7.124163486663662e-06, 'epoch': 1.19} {'loss': 0.5713, 'learning_rate': 7.123849965466464e-06, 'epoch': 1.19} {'loss': 0.4372, 'learning_rate': 7.123536447351318e-06, 'epoch': 1.19} {'loss': 0.6083, 'learning_rate': 7.123222932318563e-06, 'epoch': 1.19} {'loss': 0.5765, 'learning_rate': 7.1229094203685355e-06, 'epoch': 1.19} {'loss': 0.4799, 'learning_rate': 7.122595911501564e-06, 'epoch': 1.19} {'loss': 0.5073, 'learning_rate': 7.122282405717998e-06, 'epoch': 1.19} {'loss': 0.594, 'learning_rate': 7.121968903018161e-06, 'epoch': 1.19} {'loss': 0.5519, 'learning_rate': 7.121655403402397e-06, 'epoch': 1.19} {'loss': 0.3852, 'learning_rate': 7.121341906871036e-06, 'epoch': 1.19} {'loss': 0.5808, 'learning_rate': 7.121028413424421e-06, 'epoch': 1.19} {'loss': 0.5858, 'learning_rate': 7.120714923062883e-06, 'epoch': 1.19} {'loss': 0.5674, 'learning_rate': 7.120401435786755e-06, 'epoch': 1.19} {'loss': 0.6003, 'learning_rate': 7.120087951596381e-06, 'epoch': 1.19} {'loss': 0.6768, 'learning_rate': 7.119774470492091e-06, 'epoch': 1.19} {'loss': 0.4875, 'learning_rate': 7.119460992474225e-06, 'epoch': 1.19} {'loss': 0.5241, 'learning_rate': 7.119147517543114e-06, 'epoch': 1.19} {'loss': 0.4765, 'learning_rate': 7.118834045699095e-06, 'epoch': 1.19} {'loss': 0.6763, 'learning_rate': 7.1185205769425094e-06, 'epoch': 1.19} {'loss': 0.407, 'learning_rate': 7.118207111273685e-06, 'epoch': 1.19} {'loss': 0.7019, 'learning_rate': 7.117893648692964e-06, 'epoch': 1.19} {'loss': 0.5604, 'learning_rate': 7.117580189200679e-06, 'epoch': 1.19} {'loss': 0.5853, 'learning_rate': 7.11726673279717e-06, 'epoch': 1.19} {'loss': 0.5874, 'learning_rate': 7.116953279482769e-06, 'epoch': 1.19} {'loss': 0.5416, 'learning_rate': 7.116639829257809e-06, 'epoch': 1.19} {'loss': 0.5613, 'learning_rate': 7.116326382122634e-06, 'epoch': 1.19} {'loss': 0.4622, 'learning_rate': 7.11601293807757e-06, 'epoch': 1.19} {'loss': 0.5932, 'learning_rate': 7.1156994971229634e-06, 'epoch': 1.19} {'loss': 0.6484, 'learning_rate': 7.115386059259143e-06, 'epoch': 1.19} {'loss': 0.5207, 'learning_rate': 7.11507262448645e-06, 'epoch': 1.19} {'loss': 0.5456, 'learning_rate': 7.114759192805215e-06, 'epoch': 1.19} {'loss': 0.5712, 'learning_rate': 7.114445764215773e-06, 'epoch': 1.19} {'loss': 0.5006, 'learning_rate': 7.1141323387184665e-06, 'epoch': 1.19} {'loss': 0.4802, 'learning_rate': 7.113818916313624e-06, 'epoch': 1.19} {'loss': 0.6128, 'learning_rate': 7.1135054970015896e-06, 'epoch': 1.19} {'loss': 0.488, 'learning_rate': 7.113192080782694e-06, 'epoch': 1.19} {'loss': 0.6105, 'learning_rate': 7.11287866765727e-06, 'epoch': 1.19} {'loss': 0.533, 'learning_rate': 7.112565257625661e-06, 'epoch': 1.19} {'loss': 0.5737, 'learning_rate': 7.112251850688194e-06, 'epoch': 1.19} {'loss': 0.4332, 'learning_rate': 7.111938446845216e-06, 'epoch': 1.19} {'loss': 0.5038, 'learning_rate': 7.111625046097051e-06, 'epoch': 1.19} {'loss': 0.499, 'learning_rate': 7.111311648444043e-06, 'epoch': 1.19} {'loss': 0.54, 'learning_rate': 7.110998253886527e-06, 'epoch': 1.19} {'loss': 0.6568, 'learning_rate': 7.110684862424835e-06, 'epoch': 1.19} {'loss': 0.5492, 'learning_rate': 7.110371474059308e-06, 'epoch': 1.19} {'loss': 0.3456, 'learning_rate': 7.110058088790273e-06, 'epoch': 1.19} {'loss': 0.5236, 'learning_rate': 7.109744706618076e-06, 'epoch': 1.19} {'loss': 0.654, 'learning_rate': 7.109431327543044e-06, 'epoch': 1.19} {'loss': 0.488, 'learning_rate': 7.109117951565523e-06, 'epoch': 1.19} {'loss': 0.6797, 'learning_rate': 7.108804578685842e-06, 'epoch': 1.19} {'loss': 0.6138, 'learning_rate': 7.108491208904335e-06, 'epoch': 1.19} {'loss': 0.5833, 'learning_rate': 7.108177842221342e-06, 'epoch': 1.19} {'loss': 0.6713, 'learning_rate': 7.107864478637195e-06, 'epoch': 1.19} {'loss': 0.6347, 'learning_rate': 7.107551118152236e-06, 'epoch': 1.19} {'loss': 0.6021, 'learning_rate': 7.107237760766798e-06, 'epoch': 1.19} {'loss': 0.5701, 'learning_rate': 7.106924406481211e-06, 'epoch': 1.19} {'loss': 0.7131, 'learning_rate': 7.106611055295819e-06, 'epoch': 1.19} {'loss': 0.5181, 'learning_rate': 7.106297707210953e-06, 'epoch': 1.19} {'loss': 0.5376, 'learning_rate': 7.105984362226952e-06, 'epoch': 1.19} {'loss': 0.5402, 'learning_rate': 7.105671020344145e-06, 'epoch': 1.19} {'loss': 0.5488, 'learning_rate': 7.105357681562879e-06, 'epoch': 1.19} {'loss': 0.6362, 'learning_rate': 7.105044345883482e-06, 'epoch': 1.19} {'loss': 0.567, 'learning_rate': 7.104731013306288e-06, 'epoch': 1.19} {'loss': 0.4551, 'learning_rate': 7.104417683831639e-06, 'epoch': 1.19} {'loss': 0.5184, 'learning_rate': 7.104104357459867e-06, 'epoch': 1.19} {'loss': 0.6456, 'learning_rate': 7.10379103419131e-06, 'epoch': 1.19} {'loss': 0.5522, 'learning_rate': 7.103477714026297e-06, 'epoch': 1.19} {'loss': 0.6604, 'learning_rate': 7.103164396965175e-06, 'epoch': 1.19} {'loss': 0.5458, 'learning_rate': 7.102851083008273e-06, 'epoch': 1.19} {'loss': 0.72, 'learning_rate': 7.102537772155923e-06, 'epoch': 1.19} {'loss': 0.5751, 'learning_rate': 7.102224464408469e-06, 'epoch': 1.19} {'loss': 0.4658, 'learning_rate': 7.101911159766243e-06, 'epoch': 1.19} {'loss': 0.6318, 'learning_rate': 7.101597858229581e-06, 'epoch': 1.19} {'loss': 0.5507, 'learning_rate': 7.10128455979882e-06, 'epoch': 1.19} {'loss': 0.4845, 'learning_rate': 7.100971264474289e-06, 'epoch': 1.19} {'loss': 0.5767, 'learning_rate': 7.1006579722563326e-06, 'epoch': 1.19} {'loss': 0.5019, 'learning_rate': 7.10034468314528e-06, 'epoch': 1.19} {'loss': 0.7665, 'learning_rate': 7.100031397141473e-06, 'epoch': 1.19} {'loss': 0.4867, 'learning_rate': 7.099718114245242e-06, 'epoch': 1.19} {'loss': 0.4313, 'learning_rate': 7.099404834456929e-06, 'epoch': 1.19} {'loss': 0.4535, 'learning_rate': 7.099091557776862e-06, 'epoch': 1.19} {'loss': 0.5493, 'learning_rate': 7.0987782842053785e-06, 'epoch': 1.19} {'loss': 0.4715, 'learning_rate': 7.098465013742819e-06, 'epoch': 1.19} {'loss': 0.4274, 'learning_rate': 7.098151746389513e-06, 'epoch': 1.19} {'loss': 0.6351, 'learning_rate': 7.097838482145802e-06, 'epoch': 1.19} {'loss': 0.4343, 'learning_rate': 7.097525221012018e-06, 'epoch': 1.19} {'loss': 0.5598, 'learning_rate': 7.0972119629885006e-06, 'epoch': 1.19} {'loss': 0.3334, 'learning_rate': 7.096898708075581e-06, 'epoch': 1.19} {'loss': 0.4471, 'learning_rate': 7.096585456273594e-06, 'epoch': 1.19} {'loss': 0.4873, 'learning_rate': 7.0962722075828804e-06, 'epoch': 1.19} {'loss': 0.5559, 'learning_rate': 7.0959589620037705e-06, 'epoch': 1.19} {'loss': 0.5737, 'learning_rate': 7.0956457195366045e-06, 'epoch': 1.19} {'loss': 0.5809, 'learning_rate': 7.095332480181718e-06, 'epoch': 1.19} {'loss': 0.6005, 'learning_rate': 7.095019243939442e-06, 'epoch': 1.19} {'loss': 0.4785, 'learning_rate': 7.094706010810117e-06, 'epoch': 1.19} {'loss': 0.6148, 'learning_rate': 7.094392780794073e-06, 'epoch': 1.19} {'loss': 0.5424, 'learning_rate': 7.094079553891654e-06, 'epoch': 1.19} {'loss': 0.3975, 'learning_rate': 7.093766330103189e-06, 'epoch': 1.19} {'loss': 0.4458, 'learning_rate': 7.093453109429016e-06, 'epoch': 1.19} {'loss': 0.5223, 'learning_rate': 7.093139891869471e-06, 'epoch': 1.19} {'loss': 0.6274, 'learning_rate': 7.092826677424886e-06, 'epoch': 1.19} {'loss': 0.5197, 'learning_rate': 7.092513466095604e-06, 'epoch': 1.19} {'loss': 0.4716, 'learning_rate': 7.092200257881952e-06, 'epoch': 1.19} {'loss': 0.5779, 'learning_rate': 7.091887052784272e-06, 'epoch': 1.19} {'loss': 0.5804, 'learning_rate': 7.0915738508029e-06, 'epoch': 1.19} {'loss': 0.5762, 'learning_rate': 7.091260651938165e-06, 'epoch': 1.19} {'loss': 0.4581, 'learning_rate': 7.090947456190409e-06, 'epoch': 1.19} {'loss': 0.4414, 'learning_rate': 7.090634263559963e-06, 'epoch': 1.19} {'loss': 0.4308, 'learning_rate': 7.090321074047168e-06, 'epoch': 1.19} {'loss': 0.4095, 'learning_rate': 7.090007887652353e-06, 'epoch': 1.19} {'loss': 0.606, 'learning_rate': 7.08969470437586e-06, 'epoch': 1.19} {'loss': 0.6638, 'learning_rate': 7.089381524218022e-06, 'epoch': 1.19} {'loss': 0.6259, 'learning_rate': 7.089068347179173e-06, 'epoch': 1.19} {'loss': 0.5001, 'learning_rate': 7.088755173259652e-06, 'epoch': 1.19} {'loss': 0.5906, 'learning_rate': 7.088442002459789e-06, 'epoch': 1.19} {'loss': 0.4889, 'learning_rate': 7.088128834779926e-06, 'epoch': 1.19} {'loss': 0.6107, 'learning_rate': 7.0878156702203925e-06, 'epoch': 1.19} {'loss': 0.7142, 'learning_rate': 7.0875025087815316e-06, 'epoch': 1.19} {'loss': 0.5039, 'learning_rate': 7.0871893504636745e-06, 'epoch': 1.19} {'loss': 0.4852, 'learning_rate': 7.086876195267154e-06, 'epoch': 1.19} {'loss': 0.4642, 'learning_rate': 7.086563043192312e-06, 'epoch': 1.19} {'loss': 0.67, 'learning_rate': 7.0862498942394765e-06, 'epoch': 1.19} {'loss': 0.5162, 'learning_rate': 7.08593674840899e-06, 'epoch': 1.19} {'loss': 0.6155, 'learning_rate': 7.085623605701186e-06, 'epoch': 1.19} {'loss': 0.5149, 'learning_rate': 7.085310466116395e-06, 'epoch': 1.19} {'loss': 0.3532, 'learning_rate': 7.084997329654961e-06, 'epoch': 1.19} {'loss': 0.4149, 'learning_rate': 7.084684196317214e-06, 'epoch': 1.19} {'loss': 0.4702, 'learning_rate': 7.084371066103492e-06, 'epoch': 1.19} {'loss': 0.6113, 'learning_rate': 7.0840579390141265e-06, 'epoch': 1.19} {'loss': 0.4798, 'learning_rate': 7.08374481504946e-06, 'epoch': 1.19} {'loss': 0.598, 'learning_rate': 7.083431694209823e-06, 'epoch': 1.19} {'loss': 0.677, 'learning_rate': 7.08311857649555e-06, 'epoch': 1.19} {'loss': 0.53, 'learning_rate': 7.082805461906983e-06, 'epoch': 1.19} {'loss': 0.4946, 'learning_rate': 7.08249235044445e-06, 'epoch': 1.19} {'loss': 0.4624, 'learning_rate': 7.082179242108291e-06, 'epoch': 1.19} {'loss': 0.6971, 'learning_rate': 7.081866136898837e-06, 'epoch': 1.19} {'loss': 0.6427, 'learning_rate': 7.081553034816431e-06, 'epoch': 1.19} {'loss': 0.5416, 'learning_rate': 7.081239935861405e-06, 'epoch': 1.19} {'loss': 0.5812, 'learning_rate': 7.080926840034088e-06, 'epoch': 1.19} {'loss': 0.3789, 'learning_rate': 7.080613747334828e-06, 'epoch': 1.19} {'loss': 0.6174, 'learning_rate': 7.08030065776395e-06, 'epoch': 1.19} {'loss': 0.6097, 'learning_rate': 7.079987571321796e-06, 'epoch': 1.19} {'loss': 0.4213, 'learning_rate': 7.079674488008699e-06, 'epoch': 1.19} {'loss': 0.5905, 'learning_rate': 7.0793614078249896e-06, 'epoch': 1.19} {'loss': 0.6462, 'learning_rate': 7.079048330771013e-06, 'epoch': 1.19} {'loss': 0.6875, 'learning_rate': 7.078735256847094e-06, 'epoch': 1.19} {'loss': 0.4605, 'learning_rate': 7.078422186053579e-06, 'epoch': 1.19} {'loss': 0.7129, 'learning_rate': 7.078109118390796e-06, 'epoch': 1.19} {'loss': 0.3951, 'learning_rate': 7.077796053859085e-06, 'epoch': 1.19} {'loss': 0.6977, 'learning_rate': 7.07748299245878e-06, 'epoch': 1.19} {'loss': 0.4277, 'learning_rate': 7.077169934190211e-06, 'epoch': 1.19} {'loss': 0.6161, 'learning_rate': 7.076856879053722e-06, 'epoch': 1.19} {'loss': 0.5114, 'learning_rate': 7.07654382704964e-06, 'epoch': 1.19} {'loss': 0.6718, 'learning_rate': 7.07623077817831e-06, 'epoch': 1.19} {'loss': 0.552, 'learning_rate': 7.075917732440062e-06, 'epoch': 1.19} {'loss': 0.6389, 'learning_rate': 7.075604689835233e-06, 'epoch': 1.19} {'loss': 0.524, 'learning_rate': 7.075291650364158e-06, 'epoch': 1.19} {'loss': 0.7746, 'learning_rate': 7.074978614027166e-06, 'epoch': 1.19} {'loss': 0.4869, 'learning_rate': 7.074665580824605e-06, 'epoch': 1.19} {'loss': 0.4961, 'learning_rate': 7.074352550756798e-06, 'epoch': 1.19} {'loss': 0.5368, 'learning_rate': 7.07403952382409e-06, 'epoch': 1.19} {'loss': 0.5821, 'learning_rate': 7.073726500026814e-06, 'epoch': 1.19} {'loss': 0.4333, 'learning_rate': 7.073413479365302e-06, 'epoch': 1.19} {'loss': 0.5426, 'learning_rate': 7.073100461839893e-06, 'epoch': 1.19} {'loss': 0.5398, 'learning_rate': 7.072787447450917e-06, 'epoch': 1.19} {'loss': 0.5266, 'learning_rate': 7.072474436198719e-06, 'epoch': 1.19} {'loss': 0.3531, 'learning_rate': 7.072161428083626e-06, 'epoch': 1.19} {'loss': 0.4719, 'learning_rate': 7.0718484231059755e-06, 'epoch': 1.19} {'loss': 0.6163, 'learning_rate': 7.071535421266106e-06, 'epoch': 1.19} {'loss': 0.7164, 'learning_rate': 7.071222422564349e-06, 'epoch': 1.19} {'loss': 0.4765, 'learning_rate': 7.070909427001043e-06, 'epoch': 1.19} {'loss': 0.4661, 'learning_rate': 7.070596434576518e-06, 'epoch': 1.19} {'loss': 0.4462, 'learning_rate': 7.0702834452911175e-06, 'epoch': 1.19} {'loss': 0.5419, 'learning_rate': 7.069970459145171e-06, 'epoch': 1.19} {'loss': 0.5095, 'learning_rate': 7.069657476139018e-06, 'epoch': 1.19} {'loss': 0.7163, 'learning_rate': 7.069344496272988e-06, 'epoch': 1.19} {'loss': 0.4962, 'learning_rate': 7.069031519547421e-06, 'epoch': 1.19} {'loss': 0.4839, 'learning_rate': 7.068718545962654e-06, 'epoch': 1.19} {'loss': 0.5367, 'learning_rate': 7.068405575519014e-06, 'epoch': 1.19} {'loss': 0.5118, 'learning_rate': 7.068092608216847e-06, 'epoch': 1.19} {'loss': 0.7293, 'learning_rate': 7.0677796440564825e-06, 'epoch': 1.19} {'loss': 0.5286, 'learning_rate': 7.0674666830382554e-06, 'epoch': 1.19} {'loss': 0.6205, 'learning_rate': 7.0671537251625046e-06, 'epoch': 1.19} {'loss': 0.4689, 'learning_rate': 7.066840770429559e-06, 'epoch': 1.19} {'loss': 0.589, 'learning_rate': 7.066527818839762e-06, 'epoch': 1.19} {'loss': 0.6704, 'learning_rate': 7.066214870393442e-06, 'epoch': 1.19} {'loss': 0.4198, 'learning_rate': 7.065901925090941e-06, 'epoch': 1.19} {'loss': 0.5646, 'learning_rate': 7.065588982932591e-06, 'epoch': 1.19} {'loss': 0.6289, 'learning_rate': 7.065276043918725e-06, 'epoch': 1.19} {'loss': 0.5182, 'learning_rate': 7.064963108049682e-06, 'epoch': 1.19} {'loss': 0.5026, 'learning_rate': 7.064650175325793e-06, 'epoch': 1.19} {'loss': 0.6794, 'learning_rate': 7.0643372457474005e-06, 'epoch': 1.19} {'loss': 0.4232, 'learning_rate': 7.064024319314835e-06, 'epoch': 1.19} {'loss': 0.4023, 'learning_rate': 7.063711396028429e-06, 'epoch': 1.19} {'loss': 0.543, 'learning_rate': 7.0633984758885245e-06, 'epoch': 1.19} {'loss': 0.6369, 'learning_rate': 7.0630855588954516e-06, 'epoch': 1.19} {'loss': 0.4802, 'learning_rate': 7.062772645049549e-06, 'epoch': 1.19} {'loss': 0.4929, 'learning_rate': 7.062459734351148e-06, 'epoch': 1.19} {'loss': 0.6402, 'learning_rate': 7.062146826800591e-06, 'epoch': 1.19} {'loss': 0.5457, 'learning_rate': 7.061833922398207e-06, 'epoch': 1.19} {'loss': 0.5222, 'learning_rate': 7.061521021144331e-06, 'epoch': 1.19} {'loss': 0.5502, 'learning_rate': 7.0612081230393025e-06, 'epoch': 1.19} {'loss': 0.7219, 'learning_rate': 7.060895228083453e-06, 'epoch': 1.19} {'loss': 0.6367, 'learning_rate': 7.060582336277123e-06, 'epoch': 1.19} {'loss': 0.5767, 'learning_rate': 7.06026944762064e-06, 'epoch': 1.19} {'loss': 0.5389, 'learning_rate': 7.059956562114348e-06, 'epoch': 1.19} {'loss': 0.5858, 'learning_rate': 7.0596436797585755e-06, 'epoch': 1.19} {'loss': 0.5151, 'learning_rate': 7.059330800553657e-06, 'epoch': 1.19} {'loss': 0.4519, 'learning_rate': 7.059017924499936e-06, 'epoch': 1.19} {'loss': 0.6287, 'learning_rate': 7.058705051597741e-06, 'epoch': 1.19} {'loss': 0.4376, 'learning_rate': 7.058392181847411e-06, 'epoch': 1.19} {'loss': 0.5993, 'learning_rate': 7.058079315249277e-06, 'epoch': 1.19} {'loss': 0.6316, 'learning_rate': 7.057766451803676e-06, 'epoch': 1.19} {'loss': 0.5488, 'learning_rate': 7.057453591510945e-06, 'epoch': 1.19} {'loss': 0.4151, 'learning_rate': 7.057140734371415e-06, 'epoch': 1.19} {'loss': 0.5443, 'learning_rate': 7.056827880385428e-06, 'epoch': 1.19} {'loss': 0.4979, 'learning_rate': 7.0565150295533144e-06, 'epoch': 1.19} {'loss': 0.5439, 'learning_rate': 7.0562021818754124e-06, 'epoch': 1.19} {'loss': 0.5088, 'learning_rate': 7.055889337352055e-06, 'epoch': 1.19} {'loss': 0.497, 'learning_rate': 7.055576495983574e-06, 'epoch': 1.19} {'loss': 0.5158, 'learning_rate': 7.055263657770313e-06, 'epoch': 1.19} {'loss': 0.6261, 'learning_rate': 7.0549508227125986e-06, 'epoch': 1.19} {'loss': 0.6399, 'learning_rate': 7.054637990810773e-06, 'epoch': 1.19} {'loss': 0.5787, 'learning_rate': 7.054325162065167e-06, 'epoch': 1.19} {'loss': 0.5419, 'learning_rate': 7.054012336476122e-06, 'epoch': 1.19} {'loss': 0.4961, 'learning_rate': 7.053699514043966e-06, 'epoch': 1.19} {'loss': 0.5441, 'learning_rate': 7.053386694769033e-06, 'epoch': 1.19} {'loss': 0.6466, 'learning_rate': 7.053073878651669e-06, 'epoch': 1.19} {'loss': 0.6337, 'learning_rate': 7.0527610656921955e-06, 'epoch': 1.19} {'loss': 0.4889, 'learning_rate': 7.052448255890958e-06, 'epoch': 1.19} {'loss': 0.6574, 'learning_rate': 7.05213544924829e-06, 'epoch': 1.19} {'loss': 0.5716, 'learning_rate': 7.0518226457645225e-06, 'epoch': 1.19} {'loss': 0.4976, 'learning_rate': 7.051509845439994e-06, 'epoch': 1.19} {'loss': 0.6224, 'learning_rate': 7.051197048275036e-06, 'epoch': 1.19} {'loss': 0.4857, 'learning_rate': 7.05088425426999e-06, 'epoch': 1.19} {'loss': 0.4246, 'learning_rate': 7.0505714634251845e-06, 'epoch': 1.19} {'loss': 0.4751, 'learning_rate': 7.050258675740961e-06, 'epoch': 1.19} {'loss': 0.6201, 'learning_rate': 7.0499458912176525e-06, 'epoch': 1.19} {'loss': 0.6634, 'learning_rate': 7.04963310985559e-06, 'epoch': 1.19} {'loss': 0.6526, 'learning_rate': 7.049320331655114e-06, 'epoch': 1.19} {'loss': 0.5808, 'learning_rate': 7.049007556616554e-06, 'epoch': 1.19} {'loss': 0.5775, 'learning_rate': 7.048694784740253e-06, 'epoch': 1.19} {'loss': 0.5838, 'learning_rate': 7.04838201602654e-06, 'epoch': 1.19} {'loss': 0.5053, 'learning_rate': 7.048069250475752e-06, 'epoch': 1.19} {'loss': 0.679, 'learning_rate': 7.047756488088226e-06, 'epoch': 1.19} {'loss': 0.4676, 'learning_rate': 7.047443728864294e-06, 'epoch': 1.19} {'loss': 0.6041, 'learning_rate': 7.047130972804293e-06, 'epoch': 1.19} {'loss': 0.3818, 'learning_rate': 7.046818219908556e-06, 'epoch': 1.19} {'loss': 0.4459, 'learning_rate': 7.046505470177422e-06, 'epoch': 1.19} {'loss': 0.6158, 'learning_rate': 7.046192723611224e-06, 'epoch': 1.19} {'loss': 0.6753, 'learning_rate': 7.045879980210295e-06, 'epoch': 1.19} {'loss': 0.6991, 'learning_rate': 7.045567239974973e-06, 'epoch': 1.19} {'loss': 0.4038, 'learning_rate': 7.045254502905592e-06, 'epoch': 1.19} {'loss': 0.4379, 'learning_rate': 7.044941769002489e-06, 'epoch': 1.19} {'loss': 0.5408, 'learning_rate': 7.044629038265995e-06, 'epoch': 1.19} {'loss': 0.448, 'learning_rate': 7.0443163106964505e-06, 'epoch': 1.19} {'loss': 0.5018, 'learning_rate': 7.044003586294188e-06, 'epoch': 1.19} {'loss': 0.5035, 'learning_rate': 7.043690865059541e-06, 'epoch': 1.19} {'loss': 0.4921, 'learning_rate': 7.0433781469928475e-06, 'epoch': 1.19} {'loss': 0.4313, 'learning_rate': 7.043065432094438e-06, 'epoch': 1.19} {'loss': 0.4876, 'learning_rate': 7.042752720364654e-06, 'epoch': 1.19} {'loss': 0.4503, 'learning_rate': 7.042440011803824e-06, 'epoch': 1.19} {'loss': 0.4212, 'learning_rate': 7.0421273064122895e-06, 'epoch': 1.19} {'loss': 0.657, 'learning_rate': 7.041814604190383e-06, 'epoch': 1.19} {'loss': 0.5674, 'learning_rate': 7.041501905138437e-06, 'epoch': 1.19} {'loss': 0.5082, 'learning_rate': 7.041189209256791e-06, 'epoch': 1.19} {'loss': 0.4741, 'learning_rate': 7.0408765165457736e-06, 'epoch': 1.19} {'loss': 0.7229, 'learning_rate': 7.040563827005729e-06, 'epoch': 1.19} {'loss': 0.3401, 'learning_rate': 7.040251140636987e-06, 'epoch': 1.19} {'loss': 0.5148, 'learning_rate': 7.039938457439878e-06, 'epoch': 1.19} {'loss': 0.6177, 'learning_rate': 7.039625777414747e-06, 'epoch': 1.19} {'loss': 0.6032, 'learning_rate': 7.039313100561922e-06, 'epoch': 1.19} {'loss': 0.3331, 'learning_rate': 7.039000426881741e-06, 'epoch': 1.19} {'loss': 0.6327, 'learning_rate': 7.038687756374536e-06, 'epoch': 1.19} {'loss': 0.436, 'learning_rate': 7.038375089040647e-06, 'epoch': 1.19} {'loss': 0.6301, 'learning_rate': 7.038062424880407e-06, 'epoch': 1.19} {'loss': 0.7678, 'learning_rate': 7.037749763894147e-06, 'epoch': 1.19} {'loss': 0.6273, 'learning_rate': 7.03743710608221e-06, 'epoch': 1.19} {'loss': 0.371, 'learning_rate': 7.037124451444923e-06, 'epoch': 1.19} {'loss': 0.7472, 'learning_rate': 7.036811799982628e-06, 'epoch': 1.19} {'loss': 0.5469, 'learning_rate': 7.036499151695655e-06, 'epoch': 1.19} {'loss': 0.6356, 'learning_rate': 7.036186506584337e-06, 'epoch': 1.19} {'loss': 0.5834, 'learning_rate': 7.035873864649018e-06, 'epoch': 1.19} {'loss': 0.4758, 'learning_rate': 7.035561225890022e-06, 'epoch': 1.19} {'loss': 0.5479, 'learning_rate': 7.035248590307695e-06, 'epoch': 1.19} {'loss': 0.5525, 'learning_rate': 7.034935957902365e-06, 'epoch': 1.19} {'loss': 0.5411, 'learning_rate': 7.034623328674369e-06, 'epoch': 1.19} {'loss': 0.6017, 'learning_rate': 7.034310702624043e-06, 'epoch': 1.19} {'loss': 0.4145, 'learning_rate': 7.033998079751716e-06, 'epoch': 1.19} {'loss': 0.4858, 'learning_rate': 7.033685460057733e-06, 'epoch': 1.19} {'loss': 0.4749, 'learning_rate': 7.033372843542419e-06, 'epoch': 1.19} {'loss': 0.5516, 'learning_rate': 7.0330602302061166e-06, 'epoch': 1.19} {'loss': 0.5554, 'learning_rate': 7.0327476200491575e-06, 'epoch': 1.19} {'loss': 0.6151, 'learning_rate': 7.032435013071879e-06, 'epoch': 1.19} {'loss': 0.5523, 'learning_rate': 7.0321224092746134e-06, 'epoch': 1.19} {'loss': 0.5244, 'learning_rate': 7.0318098086576925e-06, 'epoch': 1.19} {'loss': 0.5706, 'learning_rate': 7.031497211221461e-06, 'epoch': 1.19} {'loss': 0.5427, 'learning_rate': 7.0311846169662425e-06, 'epoch': 1.19} {'loss': 0.4813, 'learning_rate': 7.030872025892381e-06, 'epoch': 1.19} {'loss': 0.5167, 'learning_rate': 7.030559438000211e-06, 'epoch': 1.19} {'loss': 0.4844, 'learning_rate': 7.030246853290059e-06, 'epoch': 1.19} {'loss': 0.4602, 'learning_rate': 7.029934271762271e-06, 'epoch': 1.19} {'loss': 0.5631, 'learning_rate': 7.02962169341717e-06, 'epoch': 1.19} {'loss': 0.5949, 'learning_rate': 7.029309118255102e-06, 'epoch': 1.19} {'loss': 0.407, 'learning_rate': 7.028996546276394e-06, 'epoch': 1.19} {'loss': 0.5756, 'learning_rate': 7.028683977481387e-06, 'epoch': 1.19} {'loss': 0.5612, 'learning_rate': 7.0283714118704145e-06, 'epoch': 1.19} {'loss': 0.4447, 'learning_rate': 7.028058849443809e-06, 'epoch': 1.19} {'loss': 0.501, 'learning_rate': 7.027746290201907e-06, 'epoch': 1.19} {'loss': 0.4133, 'learning_rate': 7.02743373414504e-06, 'epoch': 1.19} {'loss': 0.4818, 'learning_rate': 7.027121181273551e-06, 'epoch': 1.19} {'loss': 0.5556, 'learning_rate': 7.026808631587764e-06, 'epoch': 1.19} {'loss': 0.4904, 'learning_rate': 7.026496085088023e-06, 'epoch': 1.19} {'loss': 0.5365, 'learning_rate': 7.0261835417746625e-06, 'epoch': 1.19} {'loss': 0.5964, 'learning_rate': 7.0258710016480125e-06, 'epoch': 1.19} {'loss': 0.5693, 'learning_rate': 7.025558464708411e-06, 'epoch': 1.19} {'loss': 0.4626, 'learning_rate': 7.025245930956188e-06, 'epoch': 1.19} {'loss': 0.6751, 'learning_rate': 7.024933400391688e-06, 'epoch': 1.19} {'loss': 0.5996, 'learning_rate': 7.02462087301524e-06, 'epoch': 1.19} {'loss': 0.4872, 'learning_rate': 7.0243083488271734e-06, 'epoch': 1.19} {'loss': 0.5449, 'learning_rate': 7.023995827827834e-06, 'epoch': 1.19} {'loss': 0.6268, 'learning_rate': 7.0236833100175505e-06, 'epoch': 1.19} {'loss': 0.4222, 'learning_rate': 7.02337079539666e-06, 'epoch': 1.19} {'loss': 0.6694, 'learning_rate': 7.023058283965494e-06, 'epoch': 1.19} {'loss': 0.4995, 'learning_rate': 7.022745775724391e-06, 'epoch': 1.19} {'loss': 0.61, 'learning_rate': 7.022433270673687e-06, 'epoch': 1.19} {'loss': 0.5365, 'learning_rate': 7.0221207688137115e-06, 'epoch': 1.2} {'loss': 0.5938, 'learning_rate': 7.021808270144802e-06, 'epoch': 1.2} {'loss': 0.5682, 'learning_rate': 7.021495774667294e-06, 'epoch': 1.2} {'loss': 0.4468, 'learning_rate': 7.021183282381525e-06, 'epoch': 1.2} {'loss': 0.5128, 'learning_rate': 7.020870793287822e-06, 'epoch': 1.2} {'loss': 0.5144, 'learning_rate': 7.020558307386529e-06, 'epoch': 1.2} {'loss': 0.3868, 'learning_rate': 7.020245824677976e-06, 'epoch': 1.2} {'loss': 0.5491, 'learning_rate': 7.019933345162497e-06, 'epoch': 1.2} {'loss': 0.5201, 'learning_rate': 7.019620868840431e-06, 'epoch': 1.2} {'loss': 0.4747, 'learning_rate': 7.019308395712106e-06, 'epoch': 1.2} {'loss': 0.6244, 'learning_rate': 7.018995925777865e-06, 'epoch': 1.2} {'loss': 0.4384, 'learning_rate': 7.018683459038039e-06, 'epoch': 1.2} {'loss': 0.4397, 'learning_rate': 7.018370995492958e-06, 'epoch': 1.2} {'loss': 0.6066, 'learning_rate': 7.018058535142966e-06, 'epoch': 1.2} {'loss': 0.5188, 'learning_rate': 7.0177460779883925e-06, 'epoch': 1.2} {'loss': 0.6091, 'learning_rate': 7.017433624029575e-06, 'epoch': 1.2} {'loss': 0.4436, 'learning_rate': 7.0171211732668405e-06, 'epoch': 1.2} {'loss': 0.4608, 'learning_rate': 7.0168087257005366e-06, 'epoch': 1.2} {'loss': 0.5993, 'learning_rate': 7.01649628133099e-06, 'epoch': 1.2} {'loss': 0.6352, 'learning_rate': 7.016183840158533e-06, 'epoch': 1.2} {'loss': 0.5555, 'learning_rate': 7.015871402183508e-06, 'epoch': 1.2} {'loss': 0.5787, 'learning_rate': 7.015558967406244e-06, 'epoch': 1.2} {'loss': 0.4161, 'learning_rate': 7.01524653582708e-06, 'epoch': 1.2} {'loss': 0.5161, 'learning_rate': 7.014934107446346e-06, 'epoch': 1.2} {'loss': 0.5935, 'learning_rate': 7.014621682264383e-06, 'epoch': 1.2} {'loss': 0.6351, 'learning_rate': 7.0143092602815225e-06, 'epoch': 1.2} {'loss': 0.6161, 'learning_rate': 7.013996841498094e-06, 'epoch': 1.2} {'loss': 0.5969, 'learning_rate': 7.013684425914442e-06, 'epoch': 1.2} {'loss': 0.536, 'learning_rate': 7.0133720135308945e-06, 'epoch': 1.2} {'loss': 0.4186, 'learning_rate': 7.013059604347792e-06, 'epoch': 1.2} {'loss': 0.5538, 'learning_rate': 7.0127471983654635e-06, 'epoch': 1.2} {'loss': 0.6395, 'learning_rate': 7.012434795584242e-06, 'epoch': 1.2} {'loss': 0.4401, 'learning_rate': 7.012122396004471e-06, 'epoch': 1.2} {'loss': 0.6165, 'learning_rate': 7.011809999626477e-06, 'epoch': 1.2} {'loss': 0.5609, 'learning_rate': 7.011497606450601e-06, 'epoch': 1.2} {'loss': 0.4167, 'learning_rate': 7.011185216477174e-06, 'epoch': 1.2} {'loss': 0.5814, 'learning_rate': 7.010872829706534e-06, 'epoch': 1.2} {'loss': 0.5126, 'learning_rate': 7.010560446139014e-06, 'epoch': 1.2} {'loss': 0.509, 'learning_rate': 7.010248065774942e-06, 'epoch': 1.2} {'loss': 0.6183, 'learning_rate': 7.009935688614667e-06, 'epoch': 1.2} {'loss': 0.5313, 'learning_rate': 7.009623314658509e-06, 'epoch': 1.2} {'loss': 0.4908, 'learning_rate': 7.009310943906813e-06, 'epoch': 1.2} {'loss': 0.5454, 'learning_rate': 7.008998576359911e-06, 'epoch': 1.2} {'loss': 0.6274, 'learning_rate': 7.0086862120181365e-06, 'epoch': 1.2} {'loss': 0.4017, 'learning_rate': 7.008373850881824e-06, 'epoch': 1.2} {'loss': 0.5997, 'learning_rate': 7.008061492951307e-06, 'epoch': 1.2} {'loss': 0.5827, 'learning_rate': 7.007749138226924e-06, 'epoch': 1.2} {'loss': 0.4908, 'learning_rate': 7.007436786709007e-06, 'epoch': 1.2} {'loss': 0.4847, 'learning_rate': 7.007124438397894e-06, 'epoch': 1.2} {'loss': 0.4834, 'learning_rate': 7.006812093293916e-06, 'epoch': 1.2} {'loss': 0.6382, 'learning_rate': 7.006499751397409e-06, 'epoch': 1.2} {'loss': 0.6398, 'learning_rate': 7.0061874127087095e-06, 'epoch': 1.2} {'loss': 0.5507, 'learning_rate': 7.005875077228144e-06, 'epoch': 1.2} {'loss': 0.5421, 'learning_rate': 7.00556274495606e-06, 'epoch': 1.2} {'loss': 0.6713, 'learning_rate': 7.005250415892781e-06, 'epoch': 1.2} {'loss': 0.5067, 'learning_rate': 7.004938090038651e-06, 'epoch': 1.2} {'loss': 0.4256, 'learning_rate': 7.004625767394e-06, 'epoch': 1.2} {'loss': 0.4616, 'learning_rate': 7.00431344795916e-06, 'epoch': 1.2} {'loss': 0.5179, 'learning_rate': 7.004001131734472e-06, 'epoch': 1.2} {'loss': 0.6044, 'learning_rate': 7.003688818720262e-06, 'epoch': 1.2} {'loss': 0.5441, 'learning_rate': 7.003376508916874e-06, 'epoch': 1.2} {'loss': 0.4593, 'learning_rate': 7.003064202324638e-06, 'epoch': 1.2} {'loss': 0.5452, 'learning_rate': 7.002751898943887e-06, 'epoch': 1.2} {'loss': 0.5168, 'learning_rate': 7.0024395987749605e-06, 'epoch': 1.2} {'loss': 0.5347, 'learning_rate': 7.002127301818189e-06, 'epoch': 1.2} {'loss': 0.5755, 'learning_rate': 7.00181500807391e-06, 'epoch': 1.2} {'loss': 0.5162, 'learning_rate': 7.001502717542453e-06, 'epoch': 1.2} {'loss': 0.4468, 'learning_rate': 7.001190430224161e-06, 'epoch': 1.2} {'loss': 0.5555, 'learning_rate': 7.000878146119363e-06, 'epoch': 1.2} {'loss': 0.551, 'learning_rate': 7.000565865228393e-06, 'epoch': 1.2} {'loss': 0.6468, 'learning_rate': 7.000253587551589e-06, 'epoch': 1.2} {'loss': 0.5095, 'learning_rate': 6.999941313089283e-06, 'epoch': 1.2} {'loss': 0.5327, 'learning_rate': 6.999629041841813e-06, 'epoch': 1.2} {'loss': 0.4483, 'learning_rate': 6.999316773809507e-06, 'epoch': 1.2} {'loss': 0.5569, 'learning_rate': 6.999004508992708e-06, 'epoch': 1.2} {'loss': 0.5255, 'learning_rate': 6.998692247391746e-06, 'epoch': 1.2} {'loss': 0.6038, 'learning_rate': 6.998379989006952e-06, 'epoch': 1.2} {'loss': 0.5223, 'learning_rate': 6.998067733838669e-06, 'epoch': 1.2} {'loss': 0.533, 'learning_rate': 6.997755481887227e-06, 'epoch': 1.2} {'loss': 0.3997, 'learning_rate': 6.99744323315296e-06, 'epoch': 1.2} {'loss': 0.6137, 'learning_rate': 6.997130987636207e-06, 'epoch': 1.2} {'loss': 0.5123, 'learning_rate': 6.996818745337293e-06, 'epoch': 1.2} {'loss': 0.612, 'learning_rate': 6.996506506256563e-06, 'epoch': 1.2} {'loss': 0.461, 'learning_rate': 6.996194270394345e-06, 'epoch': 1.2} {'loss': 0.5792, 'learning_rate': 6.995882037750976e-06, 'epoch': 1.2} {'loss': 0.5391, 'learning_rate': 6.995569808326792e-06, 'epoch': 1.2} {'loss': 0.5514, 'learning_rate': 6.995257582122127e-06, 'epoch': 1.2} {'loss': 0.6121, 'learning_rate': 6.994945359137315e-06, 'epoch': 1.2} {'loss': 0.6414, 'learning_rate': 6.994633139372686e-06, 'epoch': 1.2} {'loss': 0.6981, 'learning_rate': 6.994320922828583e-06, 'epoch': 1.2} {'loss': 0.5448, 'learning_rate': 6.9940087095053335e-06, 'epoch': 1.2} {'loss': 0.6112, 'learning_rate': 6.993696499403279e-06, 'epoch': 1.2} {'loss': 0.5909, 'learning_rate': 6.993384292522745e-06, 'epoch': 1.2} {'loss': 0.5617, 'learning_rate': 6.993072088864075e-06, 'epoch': 1.2} {'loss': 0.6112, 'learning_rate': 6.992759888427598e-06, 'epoch': 1.2} {'loss': 0.5876, 'learning_rate': 6.9924476912136484e-06, 'epoch': 1.2} {'loss': 0.6744, 'learning_rate': 6.992135497222565e-06, 'epoch': 1.2} {'loss': 0.5493, 'learning_rate': 6.991823306454679e-06, 'epoch': 1.2} {'loss': 0.527, 'learning_rate': 6.991511118910328e-06, 'epoch': 1.2} {'loss': 0.527, 'learning_rate': 6.991198934589845e-06, 'epoch': 1.2} {'loss': 0.5181, 'learning_rate': 6.990886753493558e-06, 'epoch': 1.2} {'loss': 0.5273, 'learning_rate': 6.990574575621814e-06, 'epoch': 1.2} {'loss': 0.5266, 'learning_rate': 6.990262400974934e-06, 'epoch': 1.2} {'loss': 0.4864, 'learning_rate': 6.989950229553264e-06, 'epoch': 1.2} {'loss': 0.5195, 'learning_rate': 6.9896380613571335e-06, 'epoch': 1.2} {'loss': 0.5966, 'learning_rate': 6.989325896386878e-06, 'epoch': 1.2} {'loss': 0.5531, 'learning_rate': 6.989013734642833e-06, 'epoch': 1.2} {'loss': 0.5235, 'learning_rate': 6.988701576125327e-06, 'epoch': 1.2} {'loss': 0.7026, 'learning_rate': 6.988389420834703e-06, 'epoch': 1.2} {'loss': 0.5375, 'learning_rate': 6.988077268771287e-06, 'epoch': 1.2} {'loss': 0.6019, 'learning_rate': 6.987765119935424e-06, 'epoch': 1.2} {'loss': 0.728, 'learning_rate': 6.987452974327438e-06, 'epoch': 1.2} {'loss': 0.4363, 'learning_rate': 6.987140831947672e-06, 'epoch': 1.2} {'loss': 0.4129, 'learning_rate': 6.986828692796455e-06, 'epoch': 1.2} {'loss': 0.726, 'learning_rate': 6.986516556874119e-06, 'epoch': 1.2} {'loss': 0.4669, 'learning_rate': 6.986204424181008e-06, 'epoch': 1.2} {'loss': 0.4834, 'learning_rate': 6.985892294717446e-06, 'epoch': 1.2} {'loss': 0.6875, 'learning_rate': 6.985580168483777e-06, 'epoch': 1.2} {'loss': 0.6808, 'learning_rate': 6.985268045480329e-06, 'epoch': 1.2} {'loss': 0.5229, 'learning_rate': 6.984955925707439e-06, 'epoch': 1.2} {'loss': 0.5681, 'learning_rate': 6.984643809165441e-06, 'epoch': 1.2} {'loss': 0.6435, 'learning_rate': 6.984331695854667e-06, 'epoch': 1.2} {'loss': 0.736, 'learning_rate': 6.984019585775457e-06, 'epoch': 1.2} {'loss': 0.5104, 'learning_rate': 6.983707478928136e-06, 'epoch': 1.2} {'loss': 0.4559, 'learning_rate': 6.983395375313051e-06, 'epoch': 1.2} {'loss': 0.4587, 'learning_rate': 6.983083274930531e-06, 'epoch': 1.2} {'loss': 0.5217, 'learning_rate': 6.982771177780906e-06, 'epoch': 1.2} {'loss': 0.4715, 'learning_rate': 6.982459083864517e-06, 'epoch': 1.2} {'loss': 0.5065, 'learning_rate': 6.9821469931816896e-06, 'epoch': 1.2} {'loss': 0.6041, 'learning_rate': 6.9818349057327696e-06, 'epoch': 1.2} {'loss': 0.6431, 'learning_rate': 6.981522821518086e-06, 'epoch': 1.2} {'loss': 0.6034, 'learning_rate': 6.981210740537969e-06, 'epoch': 1.2} {'loss': 0.5147, 'learning_rate': 6.980898662792761e-06, 'epoch': 1.2} {'loss': 0.4678, 'learning_rate': 6.980586588282789e-06, 'epoch': 1.2} {'loss': 0.4977, 'learning_rate': 6.980274517008396e-06, 'epoch': 1.2} {'loss': 0.7506, 'learning_rate': 6.9799624489699055e-06, 'epoch': 1.2} {'loss': 0.5974, 'learning_rate': 6.979650384167662e-06, 'epoch': 1.2} {'loss': 0.4391, 'learning_rate': 6.979338322601996e-06, 'epoch': 1.2} {'loss': 0.6116, 'learning_rate': 6.979026264273237e-06, 'epoch': 1.2} {'loss': 0.5389, 'learning_rate': 6.978714209181729e-06, 'epoch': 1.2} {'loss': 0.5154, 'learning_rate': 6.978402157327799e-06, 'epoch': 1.2} {'loss': 0.502, 'learning_rate': 6.978090108711786e-06, 'epoch': 1.2} {'loss': 0.5834, 'learning_rate': 6.977778063334017e-06, 'epoch': 1.2} {'loss': 0.5458, 'learning_rate': 6.977466021194836e-06, 'epoch': 1.2} {'loss': 0.567, 'learning_rate': 6.977153982294574e-06, 'epoch': 1.2} {'loss': 0.4872, 'learning_rate': 6.9768419466335605e-06, 'epoch': 1.2} {'loss': 0.5375, 'learning_rate': 6.976529914212137e-06, 'epoch': 1.2} {'loss': 0.5399, 'learning_rate': 6.976217885030632e-06, 'epoch': 1.2} {'loss': 0.4944, 'learning_rate': 6.975905859089385e-06, 'epoch': 1.2} {'loss': 0.476, 'learning_rate': 6.975593836388728e-06, 'epoch': 1.2} {'loss': 0.5648, 'learning_rate': 6.975281816928992e-06, 'epoch': 1.2} {'loss': 0.6398, 'learning_rate': 6.974969800710517e-06, 'epoch': 1.2} {'loss': 0.5463, 'learning_rate': 6.974657787733632e-06, 'epoch': 1.2} {'loss': 0.5975, 'learning_rate': 6.974345777998677e-06, 'epoch': 1.2} {'loss': 0.6881, 'learning_rate': 6.974033771505981e-06, 'epoch': 1.2} {'loss': 0.609, 'learning_rate': 6.973721768255885e-06, 'epoch': 1.2} {'loss': 0.647, 'learning_rate': 6.973409768248719e-06, 'epoch': 1.2} {'loss': 0.4017, 'learning_rate': 6.9730977714848136e-06, 'epoch': 1.2} {'loss': 0.6422, 'learning_rate': 6.9727857779645104e-06, 'epoch': 1.2} {'loss': 0.4533, 'learning_rate': 6.9724737876881385e-06, 'epoch': 1.2} {'loss': 0.6898, 'learning_rate': 6.972161800656034e-06, 'epoch': 1.2} {'loss': 0.5686, 'learning_rate': 6.9718498168685325e-06, 'epoch': 1.2} {'loss': 0.5331, 'learning_rate': 6.971537836325968e-06, 'epoch': 1.2} {'loss': 0.5898, 'learning_rate': 6.971225859028674e-06, 'epoch': 1.2} {'loss': 0.3757, 'learning_rate': 6.970913884976982e-06, 'epoch': 1.2} {'loss': 0.5761, 'learning_rate': 6.9706019141712326e-06, 'epoch': 1.2} {'loss': 0.5732, 'learning_rate': 6.970289946611755e-06, 'epoch': 1.2} {'loss': 0.4666, 'learning_rate': 6.969977982298886e-06, 'epoch': 1.2} {'loss': 0.5036, 'learning_rate': 6.969666021232957e-06, 'epoch': 1.2} {'loss': 0.6141, 'learning_rate': 6.969354063414306e-06, 'epoch': 1.2} {'loss': 0.5385, 'learning_rate': 6.969042108843267e-06, 'epoch': 1.2} {'loss': 0.3983, 'learning_rate': 6.968730157520168e-06, 'epoch': 1.2} {'loss': 0.4943, 'learning_rate': 6.968418209445353e-06, 'epoch': 1.2} {'loss': 0.5051, 'learning_rate': 6.96810626461915e-06, 'epoch': 1.2} {'loss': 0.4977, 'learning_rate': 6.967794323041896e-06, 'epoch': 1.2} {'loss': 0.5213, 'learning_rate': 6.967482384713925e-06, 'epoch': 1.2} {'loss': 0.4875, 'learning_rate': 6.967170449635565e-06, 'epoch': 1.2} {'loss': 0.5009, 'learning_rate': 6.96685851780716e-06, 'epoch': 1.2} {'loss': 0.4435, 'learning_rate': 6.966546589229037e-06, 'epoch': 1.2} {'loss': 0.5451, 'learning_rate': 6.9662346639015365e-06, 'epoch': 1.2} {'loss': 0.4474, 'learning_rate': 6.965922741824986e-06, 'epoch': 1.2} {'loss': 0.5743, 'learning_rate': 6.965610822999726e-06, 'epoch': 1.2} {'loss': 0.5455, 'learning_rate': 6.965298907426089e-06, 'epoch': 1.2} {'loss': 0.3957, 'learning_rate': 6.964986995104403e-06, 'epoch': 1.2} {'loss': 0.5713, 'learning_rate': 6.964675086035012e-06, 'epoch': 1.2} {'loss': 0.4675, 'learning_rate': 6.964363180218241e-06, 'epoch': 1.2} {'loss': 0.5015, 'learning_rate': 6.964051277654433e-06, 'epoch': 1.2} {'loss': 0.6337, 'learning_rate': 6.9637393783439185e-06, 'epoch': 1.2} {'loss': 0.5443, 'learning_rate': 6.963427482287029e-06, 'epoch': 1.2} {'loss': 0.5308, 'learning_rate': 6.963115589484103e-06, 'epoch': 1.2} {'loss': 0.6764, 'learning_rate': 6.962803699935468e-06, 'epoch': 1.2} {'loss': 0.5197, 'learning_rate': 6.962491813641468e-06, 'epoch': 1.2} {'loss': 0.5178, 'learning_rate': 6.962179930602428e-06, 'epoch': 1.2} {'loss': 0.7187, 'learning_rate': 6.96186805081869e-06, 'epoch': 1.2} {'loss': 0.5391, 'learning_rate': 6.961556174290585e-06, 'epoch': 1.2} {'loss': 0.4471, 'learning_rate': 6.961244301018444e-06, 'epoch': 1.2} {'loss': 0.6055, 'learning_rate': 6.960932431002607e-06, 'epoch': 1.2} {'loss': 0.4898, 'learning_rate': 6.960620564243401e-06, 'epoch': 1.2} {'loss': 0.6546, 'learning_rate': 6.960308700741167e-06, 'epoch': 1.2} {'loss': 0.641, 'learning_rate': 6.959996840496235e-06, 'epoch': 1.2} {'loss': 0.5058, 'learning_rate': 6.959684983508943e-06, 'epoch': 1.2} {'loss': 0.6611, 'learning_rate': 6.959373129779623e-06, 'epoch': 1.2} {'loss': 0.5408, 'learning_rate': 6.959061279308608e-06, 'epoch': 1.2} {'loss': 0.4749, 'learning_rate': 6.9587494320962345e-06, 'epoch': 1.2} {'loss': 0.4678, 'learning_rate': 6.958437588142832e-06, 'epoch': 1.2} {'loss': 0.6145, 'learning_rate': 6.958125747448743e-06, 'epoch': 1.2} {'loss': 0.4969, 'learning_rate': 6.957813910014295e-06, 'epoch': 1.2} {'loss': 0.626, 'learning_rate': 6.957502075839821e-06, 'epoch': 1.2} {'loss': 0.5062, 'learning_rate': 6.957190244925662e-06, 'epoch': 1.2} {'loss': 0.4945, 'learning_rate': 6.956878417272146e-06, 'epoch': 1.2} {'loss': 0.6523, 'learning_rate': 6.956566592879612e-06, 'epoch': 1.2} {'loss': 0.5986, 'learning_rate': 6.956254771748388e-06, 'epoch': 1.2} {'loss': 0.5075, 'learning_rate': 6.955942953878814e-06, 'epoch': 1.2} {'loss': 0.5894, 'learning_rate': 6.955631139271223e-06, 'epoch': 1.2} {'loss': 0.6388, 'learning_rate': 6.955319327925944e-06, 'epoch': 1.2} {'loss': 0.4157, 'learning_rate': 6.955007519843317e-06, 'epoch': 1.2} {'loss': 0.5219, 'learning_rate': 6.954695715023676e-06, 'epoch': 1.2} {'loss': 0.5024, 'learning_rate': 6.954383913467353e-06, 'epoch': 1.2} {'loss': 0.5344, 'learning_rate': 6.954072115174683e-06, 'epoch': 1.2} {'loss': 0.5797, 'learning_rate': 6.953760320145996e-06, 'epoch': 1.2} {'loss': 0.7134, 'learning_rate': 6.953448528381633e-06, 'epoch': 1.2} {'loss': 0.6548, 'learning_rate': 6.953136739881921e-06, 'epoch': 1.2} {'loss': 0.5762, 'learning_rate': 6.952824954647204e-06, 'epoch': 1.2} {'loss': 0.4749, 'learning_rate': 6.952513172677806e-06, 'epoch': 1.2} {'loss': 0.5561, 'learning_rate': 6.952201393974067e-06, 'epoch': 1.2} {'loss': 0.5503, 'learning_rate': 6.951889618536321e-06, 'epoch': 1.2} {'loss': 0.6122, 'learning_rate': 6.951577846364894e-06, 'epoch': 1.2} {'loss': 0.5451, 'learning_rate': 6.951266077460132e-06, 'epoch': 1.2} {'loss': 0.4932, 'learning_rate': 6.95095431182236e-06, 'epoch': 1.2} {'loss': 0.5271, 'learning_rate': 6.950642549451918e-06, 'epoch': 1.2} {'loss': 0.4599, 'learning_rate': 6.950330790349138e-06, 'epoch': 1.2} {'loss': 0.6012, 'learning_rate': 6.950019034514354e-06, 'epoch': 1.2} {'loss': 0.4224, 'learning_rate': 6.9497072819479e-06, 'epoch': 1.2} {'loss': 0.4614, 'learning_rate': 6.949395532650107e-06, 'epoch': 1.2} {'loss': 0.6451, 'learning_rate': 6.949083786621316e-06, 'epoch': 1.2} {'loss': 0.4864, 'learning_rate': 6.948772043861853e-06, 'epoch': 1.2} {'loss': 0.5383, 'learning_rate': 6.948460304372058e-06, 'epoch': 1.2} {'loss': 0.5712, 'learning_rate': 6.948148568152264e-06, 'epoch': 1.2} {'loss': 0.5173, 'learning_rate': 6.947836835202804e-06, 'epoch': 1.2} {'loss': 0.4888, 'learning_rate': 6.9475251055240134e-06, 'epoch': 1.2} {'loss': 0.5503, 'learning_rate': 6.947213379116221e-06, 'epoch': 1.2} {'loss': 0.5397, 'learning_rate': 6.94690165597977e-06, 'epoch': 1.2} {'loss': 0.6012, 'learning_rate': 6.946589936114986e-06, 'epoch': 1.2} {'loss': 0.6232, 'learning_rate': 6.946278219522209e-06, 'epoch': 1.2} {'loss': 0.6137, 'learning_rate': 6.945966506201769e-06, 'epoch': 1.2} {'loss': 0.6028, 'learning_rate': 6.945654796154e-06, 'epoch': 1.2} {'loss': 0.5691, 'learning_rate': 6.945343089379241e-06, 'epoch': 1.2} {'loss': 0.5789, 'learning_rate': 6.945031385877819e-06, 'epoch': 1.2} {'loss': 0.4617, 'learning_rate': 6.944719685650074e-06, 'epoch': 1.2} {'loss': 0.4961, 'learning_rate': 6.944407988696337e-06, 'epoch': 1.2} {'loss': 0.5095, 'learning_rate': 6.944096295016944e-06, 'epoch': 1.2} {'loss': 0.4943, 'learning_rate': 6.943784604612227e-06, 'epoch': 1.2} {'loss': 0.5835, 'learning_rate': 6.943472917482518e-06, 'epoch': 1.2} {'loss': 0.3848, 'learning_rate': 6.943161233628157e-06, 'epoch': 1.2} {'loss': 0.6883, 'learning_rate': 6.94284955304947e-06, 'epoch': 1.2} {'loss': 0.5098, 'learning_rate': 6.9425378757468e-06, 'epoch': 1.2} {'loss': 0.5153, 'learning_rate': 6.942226201720477e-06, 'epoch': 1.2} {'loss': 0.568, 'learning_rate': 6.941914530970832e-06, 'epoch': 1.2} {'loss': 0.6367, 'learning_rate': 6.941602863498205e-06, 'epoch': 1.2} {'loss': 0.6964, 'learning_rate': 6.941291199302922e-06, 'epoch': 1.2} {'loss': 0.6881, 'learning_rate': 6.940979538385324e-06, 'epoch': 1.2} {'loss': 0.5512, 'learning_rate': 6.9406678807457395e-06, 'epoch': 1.2} {'loss': 0.4944, 'learning_rate': 6.9403562263845105e-06, 'epoch': 1.2} {'loss': 0.6141, 'learning_rate': 6.940044575301965e-06, 'epoch': 1.2} {'loss': 0.6751, 'learning_rate': 6.939732927498436e-06, 'epoch': 1.2} {'loss': 0.4418, 'learning_rate': 6.9394212829742614e-06, 'epoch': 1.2} {'loss': 0.6364, 'learning_rate': 6.939109641729769e-06, 'epoch': 1.2} {'loss': 0.5212, 'learning_rate': 6.938798003765301e-06, 'epoch': 1.2} {'loss': 0.5556, 'learning_rate': 6.938486369081184e-06, 'epoch': 1.2} {'loss': 0.4537, 'learning_rate': 6.938174737677758e-06, 'epoch': 1.2} {'loss': 0.5099, 'learning_rate': 6.937863109555354e-06, 'epoch': 1.2} {'loss': 0.5967, 'learning_rate': 6.937551484714305e-06, 'epoch': 1.2} {'loss': 0.5655, 'learning_rate': 6.9372398631549474e-06, 'epoch': 1.2} {'loss': 0.6347, 'learning_rate': 6.93692824487761e-06, 'epoch': 1.2} {'loss': 0.4563, 'learning_rate': 6.9366166298826345e-06, 'epoch': 1.2} {'loss': 0.5762, 'learning_rate': 6.93630501817035e-06, 'epoch': 1.2} {'loss': 0.5761, 'learning_rate': 6.935993409741089e-06, 'epoch': 1.2} {'loss': 0.5329, 'learning_rate': 6.935681804595189e-06, 'epoch': 1.2} {'loss': 0.5399, 'learning_rate': 6.935370202732983e-06, 'epoch': 1.2} {'loss': 0.5621, 'learning_rate': 6.9350586041548055e-06, 'epoch': 1.2} {'loss': 0.6123, 'learning_rate': 6.9347470088609846e-06, 'epoch': 1.2} {'loss': 0.5601, 'learning_rate': 6.934435416851863e-06, 'epoch': 1.2} {'loss': 0.6052, 'learning_rate': 6.934123828127771e-06, 'epoch': 1.2} {'loss': 0.6289, 'learning_rate': 6.933812242689037e-06, 'epoch': 1.2} {'loss': 0.6134, 'learning_rate': 6.933500660536006e-06, 'epoch': 1.2} {'loss': 0.5898, 'learning_rate': 6.933189081669003e-06, 'epoch': 1.2} {'loss': 0.4747, 'learning_rate': 6.932877506088367e-06, 'epoch': 1.2} {'loss': 0.6063, 'learning_rate': 6.932565933794424e-06, 'epoch': 1.2} {'loss': 0.5963, 'learning_rate': 6.9322543647875184e-06, 'epoch': 1.2} {'loss': 0.4608, 'learning_rate': 6.93194279906798e-06, 'epoch': 1.2} {'loss': 0.5734, 'learning_rate': 6.931631236636137e-06, 'epoch': 1.2} {'loss': 0.6536, 'learning_rate': 6.931319677492332e-06, 'epoch': 1.2} {'loss': 0.6266, 'learning_rate': 6.931008121636893e-06, 'epoch': 1.2} {'loss': 0.494, 'learning_rate': 6.930696569070159e-06, 'epoch': 1.2} {'loss': 0.4952, 'learning_rate': 6.930385019792458e-06, 'epoch': 1.2} {'loss': 0.3906, 'learning_rate': 6.9300734738041245e-06, 'epoch': 1.2} {'loss': 0.5959, 'learning_rate': 6.929761931105499e-06, 'epoch': 1.2} {'loss': 0.5197, 'learning_rate': 6.9294503916969044e-06, 'epoch': 1.2} {'loss': 0.5659, 'learning_rate': 6.9291388555786864e-06, 'epoch': 1.2} {'loss': 0.4541, 'learning_rate': 6.92882732275117e-06, 'epoch': 1.2} {'loss': 0.6254, 'learning_rate': 6.928515793214696e-06, 'epoch': 1.2} {'loss': 0.4866, 'learning_rate': 6.9282042669695936e-06, 'epoch': 1.2} {'loss': 0.6274, 'learning_rate': 6.927892744016194e-06, 'epoch': 1.2} {'loss': 0.6364, 'learning_rate': 6.927581224354838e-06, 'epoch': 1.2} {'loss': 0.5996, 'learning_rate': 6.927269707985853e-06, 'epoch': 1.2} {'loss': 0.3979, 'learning_rate': 6.926958194909578e-06, 'epoch': 1.2} {'loss': 0.6466, 'learning_rate': 6.926646685126346e-06, 'epoch': 1.2} {'loss': 0.4917, 'learning_rate': 6.926335178636487e-06, 'epoch': 1.2} {'loss': 0.5599, 'learning_rate': 6.926023675440341e-06, 'epoch': 1.2} {'loss': 0.4659, 'learning_rate': 6.925712175538232e-06, 'epoch': 1.2} {'loss': 0.5278, 'learning_rate': 6.9254006789305054e-06, 'epoch': 1.2} {'loss': 0.5582, 'learning_rate': 6.925089185617484e-06, 'epoch': 1.2} {'loss': 0.6044, 'learning_rate': 6.9247776955995115e-06, 'epoch': 1.2} {'loss': 0.457, 'learning_rate': 6.924466208876917e-06, 'epoch': 1.2} {'loss': 0.6637, 'learning_rate': 6.924154725450033e-06, 'epoch': 1.2} {'loss': 0.5611, 'learning_rate': 6.923843245319197e-06, 'epoch': 1.2} {'loss': 0.5573, 'learning_rate': 6.923531768484736e-06, 'epoch': 1.2} {'loss': 0.4056, 'learning_rate': 6.923220294946993e-06, 'epoch': 1.2} {'loss': 0.6545, 'learning_rate': 6.922908824706295e-06, 'epoch': 1.2} {'loss': 0.6967, 'learning_rate': 6.922597357762977e-06, 'epoch': 1.2} {'loss': 0.4431, 'learning_rate': 6.922285894117377e-06, 'epoch': 1.2} {'loss': 0.6947, 'learning_rate': 6.921974433769822e-06, 'epoch': 1.2} {'loss': 0.4552, 'learning_rate': 6.921662976720654e-06, 'epoch': 1.2} {'loss': 0.4781, 'learning_rate': 6.9213515229701945e-06, 'epoch': 1.2} {'loss': 0.5517, 'learning_rate': 6.921040072518791e-06, 'epoch': 1.2} {'loss': 0.5997, 'learning_rate': 6.920728625366771e-06, 'epoch': 1.2} {'loss': 0.5412, 'learning_rate': 6.920417181514465e-06, 'epoch': 1.2} {'loss': 0.6231, 'learning_rate': 6.920105740962211e-06, 'epoch': 1.2} {'loss': 0.58, 'learning_rate': 6.919794303710341e-06, 'epoch': 1.2} {'loss': 0.7551, 'learning_rate': 6.9194828697591905e-06, 'epoch': 1.2} {'loss': 0.5601, 'learning_rate': 6.919171439109089e-06, 'epoch': 1.2} {'loss': 0.5648, 'learning_rate': 6.918860011760378e-06, 'epoch': 1.2} {'loss': 0.5296, 'learning_rate': 6.9185485877133865e-06, 'epoch': 1.2} {'loss': 0.6759, 'learning_rate': 6.918237166968445e-06, 'epoch': 1.2} {'loss': 0.6437, 'learning_rate': 6.9179257495258935e-06, 'epoch': 1.2} {'loss': 0.6371, 'learning_rate': 6.9176143353860595e-06, 'epoch': 1.2} {'loss': 0.4724, 'learning_rate': 6.917302924549283e-06, 'epoch': 1.2} {'loss': 0.5535, 'learning_rate': 6.91699151701589e-06, 'epoch': 1.2} {'loss': 0.5889, 'learning_rate': 6.916680112786224e-06, 'epoch': 1.2} {'loss': 0.6504, 'learning_rate': 6.916368711860613e-06, 'epoch': 1.2} {'loss': 0.5308, 'learning_rate': 6.91605731423939e-06, 'epoch': 1.2} {'loss': 0.4231, 'learning_rate': 6.9157459199228915e-06, 'epoch': 1.2} {'loss': 0.6343, 'learning_rate': 6.9154345289114445e-06, 'epoch': 1.2} {'loss': 0.6047, 'learning_rate': 6.915123141205393e-06, 'epoch': 1.2} {'loss': 0.5549, 'learning_rate': 6.914811756805065e-06, 'epoch': 1.2} {'loss': 0.4947, 'learning_rate': 6.914500375710791e-06, 'epoch': 1.2} {'loss': 0.6129, 'learning_rate': 6.914188997922912e-06, 'epoch': 1.2} {'loss': 0.5043, 'learning_rate': 6.913877623441756e-06, 'epoch': 1.2} {'loss': 0.4631, 'learning_rate': 6.913566252267661e-06, 'epoch': 1.2} {'loss': 0.4832, 'learning_rate': 6.913254884400955e-06, 'epoch': 1.2} {'loss': 0.5351, 'learning_rate': 6.912943519841977e-06, 'epoch': 1.2} {'loss': 0.5778, 'learning_rate': 6.91263215859106e-06, 'epoch': 1.2} {'loss': 0.5959, 'learning_rate': 6.912320800648533e-06, 'epoch': 1.2} {'loss': 0.5573, 'learning_rate': 6.912009446014736e-06, 'epoch': 1.2} {'loss': 0.6817, 'learning_rate': 6.911698094689997e-06, 'epoch': 1.2} {'loss': 0.543, 'learning_rate': 6.911386746674655e-06, 'epoch': 1.2} {'loss': 0.5881, 'learning_rate': 6.911075401969036e-06, 'epoch': 1.2} {'loss': 0.5572, 'learning_rate': 6.910764060573484e-06, 'epoch': 1.2} {'loss': 0.5456, 'learning_rate': 6.910452722488327e-06, 'epoch': 1.2} {'loss': 0.4711, 'learning_rate': 6.910141387713893e-06, 'epoch': 1.2} {'loss': 0.6416, 'learning_rate': 6.909830056250527e-06, 'epoch': 1.2} {'loss': 0.4822, 'learning_rate': 6.909518728098555e-06, 'epoch': 1.2} {'loss': 0.5036, 'learning_rate': 6.909207403258313e-06, 'epoch': 1.2} {'loss': 0.6155, 'learning_rate': 6.908896081730136e-06, 'epoch': 1.2} {'loss': 0.6011, 'learning_rate': 6.908584763514351e-06, 'epoch': 1.2} {'loss': 0.4184, 'learning_rate': 6.9082734486113e-06, 'epoch': 1.2} {'loss': 0.547, 'learning_rate': 6.9079621370213105e-06, 'epoch': 1.2} {'loss': 0.5339, 'learning_rate': 6.907650828744722e-06, 'epoch': 1.2} {'loss': 0.5335, 'learning_rate': 6.907339523781862e-06, 'epoch': 1.2} {'loss': 0.5503, 'learning_rate': 6.90702822213307e-06, 'epoch': 1.2} {'loss': 0.5707, 'learning_rate': 6.906716923798675e-06, 'epoch': 1.2} {'loss': 0.5104, 'learning_rate': 6.9064056287790096e-06, 'epoch': 1.2} {'loss': 0.6224, 'learning_rate': 6.906094337074413e-06, 'epoch': 1.2} {'loss': 0.5491, 'learning_rate': 6.905783048685211e-06, 'epoch': 1.2} {'loss': 0.6442, 'learning_rate': 6.905471763611746e-06, 'epoch': 1.2} {'loss': 0.3905, 'learning_rate': 6.905160481854346e-06, 'epoch': 1.2} {'loss': 0.5351, 'learning_rate': 6.904849203413347e-06, 'epoch': 1.2} {'loss': 0.5068, 'learning_rate': 6.904537928289083e-06, 'epoch': 1.2} {'loss': 0.4877, 'learning_rate': 6.9042266564818805e-06, 'epoch': 1.2} {'loss': 0.4545, 'learning_rate': 6.903915387992083e-06, 'epoch': 1.2} {'loss': 0.5258, 'learning_rate': 6.903604122820016e-06, 'epoch': 1.2} {'loss': 0.6662, 'learning_rate': 6.90329286096602e-06, 'epoch': 1.2} {'loss': 0.3955, 'learning_rate': 6.9029816024304255e-06, 'epoch': 1.2} {'loss': 0.5073, 'learning_rate': 6.9026703472135625e-06, 'epoch': 1.2} {'loss': 0.6151, 'learning_rate': 6.902359095315772e-06, 'epoch': 1.2} {'loss': 0.4787, 'learning_rate': 6.902047846737377e-06, 'epoch': 1.2} {'loss': 0.618, 'learning_rate': 6.901736601478723e-06, 'epoch': 1.2} {'loss': 0.6383, 'learning_rate': 6.901425359540133e-06, 'epoch': 1.2} {'loss': 0.5112, 'learning_rate': 6.90111412092195e-06, 'epoch': 1.2} {'loss': 0.4935, 'learning_rate': 6.900802885624502e-06, 'epoch': 1.2} {'loss': 0.6402, 'learning_rate': 6.900491653648123e-06, 'epoch': 1.2} {'loss': 0.4915, 'learning_rate': 6.900180424993148e-06, 'epoch': 1.2} {'loss': 0.4722, 'learning_rate': 6.899869199659905e-06, 'epoch': 1.2} {'loss': 0.5776, 'learning_rate': 6.899557977648738e-06, 'epoch': 1.2} {'loss': 0.6333, 'learning_rate': 6.8992467589599725e-06, 'epoch': 1.2} {'loss': 0.6264, 'learning_rate': 6.898935543593941e-06, 'epoch': 1.2} {'loss': 0.5446, 'learning_rate': 6.898624331550983e-06, 'epoch': 1.2} {'loss': 0.6099, 'learning_rate': 6.898313122831426e-06, 'epoch': 1.2} {'loss': 0.5438, 'learning_rate': 6.89800191743561e-06, 'epoch': 1.2} {'loss': 0.5778, 'learning_rate': 6.89769071536386e-06, 'epoch': 1.2} {'loss': 0.4744, 'learning_rate': 6.897379516616521e-06, 'epoch': 1.2} {'loss': 0.6011, 'learning_rate': 6.897068321193917e-06, 'epoch': 1.2} {'loss': 0.5678, 'learning_rate': 6.8967571290963835e-06, 'epoch': 1.2} {'loss': 0.4968, 'learning_rate': 6.896445940324254e-06, 'epoch': 1.2} {'loss': 0.4205, 'learning_rate': 6.896134754877864e-06, 'epoch': 1.2} {'loss': 0.4866, 'learning_rate': 6.895823572757547e-06, 'epoch': 1.2} {'loss': 0.6444, 'learning_rate': 6.895512393963631e-06, 'epoch': 1.2} {'loss': 0.5148, 'learning_rate': 6.895201218496459e-06, 'epoch': 1.2} {'loss': 0.5956, 'learning_rate': 6.894890046356357e-06, 'epoch': 1.2} {'loss': 0.5819, 'learning_rate': 6.894578877543661e-06, 'epoch': 1.2} {'loss': 0.4608, 'learning_rate': 6.8942677120587044e-06, 'epoch': 1.2} {'loss': 0.5311, 'learning_rate': 6.893956549901817e-06, 'epoch': 1.2} {'loss': 0.5385, 'learning_rate': 6.893645391073338e-06, 'epoch': 1.2} {'loss': 0.5291, 'learning_rate': 6.8933342355736e-06, 'epoch': 1.2} {'loss': 0.5107, 'learning_rate': 6.89302308340293e-06, 'epoch': 1.2} {'loss': 0.5257, 'learning_rate': 6.89271193456167e-06, 'epoch': 1.2} {'loss': 0.5358, 'learning_rate': 6.892400789050149e-06, 'epoch': 1.2} {'loss': 0.5621, 'learning_rate': 6.8920896468687004e-06, 'epoch': 1.2} {'loss': 0.649, 'learning_rate': 6.891778508017657e-06, 'epoch': 1.2} {'loss': 0.5509, 'learning_rate': 6.8914673724973555e-06, 'epoch': 1.2} {'loss': 0.6412, 'learning_rate': 6.8911562403081276e-06, 'epoch': 1.2} {'loss': 0.5839, 'learning_rate': 6.890845111450304e-06, 'epoch': 1.2} {'loss': 0.6224, 'learning_rate': 6.890533985924223e-06, 'epoch': 1.2} {'loss': 0.4692, 'learning_rate': 6.890222863730214e-06, 'epoch': 1.2} {'loss': 0.6458, 'learning_rate': 6.889911744868614e-06, 'epoch': 1.2} {'loss': 0.4571, 'learning_rate': 6.88960062933975e-06, 'epoch': 1.2} {'loss': 0.58, 'learning_rate': 6.889289517143964e-06, 'epoch': 1.2} {'loss': 0.6864, 'learning_rate': 6.8889784082815834e-06, 'epoch': 1.2} {'loss': 0.5091, 'learning_rate': 6.88866730275294e-06, 'epoch': 1.2} {'loss': 0.5317, 'learning_rate': 6.888356200558376e-06, 'epoch': 1.2} {'loss': 0.5909, 'learning_rate': 6.888045101698215e-06, 'epoch': 1.2} {'loss': 0.6471, 'learning_rate': 6.887734006172799e-06, 'epoch': 1.2} {'loss': 0.5508, 'learning_rate': 6.887422913982456e-06, 'epoch': 1.2} {'loss': 0.5019, 'learning_rate': 6.8871118251275146e-06, 'epoch': 1.2} {'loss': 0.6633, 'learning_rate': 6.886800739608319e-06, 'epoch': 1.2} {'loss': 0.5579, 'learning_rate': 6.886489657425193e-06, 'epoch': 1.2} {'loss': 0.4982, 'learning_rate': 6.88617857857848e-06, 'epoch': 1.2} {'loss': 0.633, 'learning_rate': 6.885867503068504e-06, 'epoch': 1.2} {'loss': 0.4729, 'learning_rate': 6.885556430895604e-06, 'epoch': 1.2} {'loss': 0.5183, 'learning_rate': 6.885245362060112e-06, 'epoch': 1.2} {'loss': 0.5971, 'learning_rate': 6.884934296562357e-06, 'epoch': 1.2} {'loss': 0.5258, 'learning_rate': 6.88462323440268e-06, 'epoch': 1.2} {'loss': 0.507, 'learning_rate': 6.884312175581404e-06, 'epoch': 1.2} {'loss': 0.568, 'learning_rate': 6.884001120098875e-06, 'epoch': 1.2} {'loss': 0.6158, 'learning_rate': 6.88369006795542e-06, 'epoch': 1.2} {'loss': 0.5026, 'learning_rate': 6.88337901915137e-06, 'epoch': 1.2} {'loss': 0.6881, 'learning_rate': 6.883067973687064e-06, 'epoch': 1.2} {'loss': 0.5872, 'learning_rate': 6.882756931562826e-06, 'epoch': 1.2} {'loss': 0.505, 'learning_rate': 6.882445892779001e-06, 'epoch': 1.2} {'loss': 0.5504, 'learning_rate': 6.8821348573359115e-06, 'epoch': 1.2} {'loss': 0.4494, 'learning_rate': 6.8818238252339e-06, 'epoch': 1.2} {'loss': 0.4686, 'learning_rate': 6.881512796473295e-06, 'epoch': 1.2} {'loss': 0.5567, 'learning_rate': 6.881201771054431e-06, 'epoch': 1.2} {'loss': 0.5286, 'learning_rate': 6.88089074897764e-06, 'epoch': 1.2} {'loss': 0.5623, 'learning_rate': 6.880579730243253e-06, 'epoch': 1.2} {'loss': 0.5773, 'learning_rate': 6.880268714851611e-06, 'epoch': 1.2} {'loss': 0.6299, 'learning_rate': 6.8799577028030375e-06, 'epoch': 1.2} {'loss': 0.5571, 'learning_rate': 6.879646694097877e-06, 'epoch': 1.2} {'loss': 0.6447, 'learning_rate': 6.879335688736455e-06, 'epoch': 1.2} {'loss': 0.4581, 'learning_rate': 6.879024686719104e-06, 'epoch': 1.2} {'loss': 0.5221, 'learning_rate': 6.878713688046164e-06, 'epoch': 1.2} {'loss': 0.4413, 'learning_rate': 6.878402692717958e-06, 'epoch': 1.2} {'loss': 0.5025, 'learning_rate': 6.878091700734829e-06, 'epoch': 1.2} {'loss': 0.5572, 'learning_rate': 6.877780712097104e-06, 'epoch': 1.2} {'loss': 0.559, 'learning_rate': 6.877469726805121e-06, 'epoch': 1.2} {'loss': 0.5379, 'learning_rate': 6.877158744859213e-06, 'epoch': 1.2} {'loss': 0.5988, 'learning_rate': 6.876847766259708e-06, 'epoch': 1.2} {'loss': 0.5355, 'learning_rate': 6.876536791006945e-06, 'epoch': 1.2} {'loss': 0.5508, 'learning_rate': 6.87622581910125e-06, 'epoch': 1.2} {'loss': 0.5642, 'learning_rate': 6.875914850542966e-06, 'epoch': 1.2} {'loss': 0.4191, 'learning_rate': 6.87560388533242e-06, 'epoch': 1.2} {'loss': 0.5608, 'learning_rate': 6.875292923469943e-06, 'epoch': 1.2} {'loss': 0.5104, 'learning_rate': 6.8749819649558755e-06, 'epoch': 1.2} {'loss': 0.5366, 'learning_rate': 6.874671009790546e-06, 'epoch': 1.2} {'loss': 0.3786, 'learning_rate': 6.8743600579742895e-06, 'epoch': 1.2} {'loss': 0.5333, 'learning_rate': 6.8740491095074345e-06, 'epoch': 1.2} {'loss': 0.5514, 'learning_rate': 6.873738164390322e-06, 'epoch': 1.2} {'loss': 0.6011, 'learning_rate': 6.8734272226232816e-06, 'epoch': 1.2} {'loss': 0.4873, 'learning_rate': 6.873116284206644e-06, 'epoch': 1.2} {'loss': 0.6201, 'learning_rate': 6.872805349140744e-06, 'epoch': 1.2} {'loss': 0.5363, 'learning_rate': 6.872494417425916e-06, 'epoch': 1.2} {'loss': 0.4569, 'learning_rate': 6.872183489062494e-06, 'epoch': 1.21} {'loss': 0.3883, 'learning_rate': 6.87187256405081e-06, 'epoch': 1.21} {'loss': 0.4416, 'learning_rate': 6.871561642391194e-06, 'epoch': 1.21} {'loss': 0.4324, 'learning_rate': 6.871250724083984e-06, 'epoch': 1.21} {'loss': 0.569, 'learning_rate': 6.87093980912951e-06, 'epoch': 1.21} {'loss': 0.4455, 'learning_rate': 6.870628897528109e-06, 'epoch': 1.21} {'loss': 0.6249, 'learning_rate': 6.870317989280106e-06, 'epoch': 1.21} {'loss': 0.5561, 'learning_rate': 6.870007084385846e-06, 'epoch': 1.21} {'loss': 0.4917, 'learning_rate': 6.8696961828456535e-06, 'epoch': 1.21} {'loss': 0.5167, 'learning_rate': 6.869385284659862e-06, 'epoch': 1.21} {'loss': 0.6777, 'learning_rate': 6.869074389828809e-06, 'epoch': 1.21} {'loss': 0.6594, 'learning_rate': 6.868763498352825e-06, 'epoch': 1.21} {'loss': 0.4852, 'learning_rate': 6.868452610232245e-06, 'epoch': 1.21} {'loss': 0.5176, 'learning_rate': 6.868141725467396e-06, 'epoch': 1.21} {'loss': 0.416, 'learning_rate': 6.867830844058621e-06, 'epoch': 1.21} {'loss': 0.4224, 'learning_rate': 6.8675199660062466e-06, 'epoch': 1.21} {'loss': 0.455, 'learning_rate': 6.8672090913106046e-06, 'epoch': 1.21} {'loss': 0.6098, 'learning_rate': 6.866898219972034e-06, 'epoch': 1.21} {'loss': 0.3968, 'learning_rate': 6.866587351990863e-06, 'epoch': 1.21} {'loss': 0.5147, 'learning_rate': 6.866276487367428e-06, 'epoch': 1.21} {'loss': 0.4685, 'learning_rate': 6.865965626102061e-06, 'epoch': 1.21} {'loss': 0.6757, 'learning_rate': 6.865654768195092e-06, 'epoch': 1.21} {'loss': 0.5657, 'learning_rate': 6.865343913646858e-06, 'epoch': 1.21} {'loss': 0.56, 'learning_rate': 6.8650330624576885e-06, 'epoch': 1.21} {'loss': 0.7042, 'learning_rate': 6.864722214627923e-06, 'epoch': 1.21} {'loss': 0.5554, 'learning_rate': 6.864411370157889e-06, 'epoch': 1.21} {'loss': 0.5526, 'learning_rate': 6.864100529047922e-06, 'epoch': 1.21} {'loss': 0.5648, 'learning_rate': 6.863789691298355e-06, 'epoch': 1.21} {'loss': 0.5566, 'learning_rate': 6.863478856909517e-06, 'epoch': 1.21} {'loss': 0.4226, 'learning_rate': 6.863168025881748e-06, 'epoch': 1.21} {'loss': 0.6762, 'learning_rate': 6.862857198215373e-06, 'epoch': 1.21} {'loss': 0.5965, 'learning_rate': 6.862546373910734e-06, 'epoch': 1.21} {'loss': 0.6844, 'learning_rate': 6.862235552968158e-06, 'epoch': 1.21} {'loss': 0.6948, 'learning_rate': 6.8619247353879825e-06, 'epoch': 1.21} {'loss': 0.5095, 'learning_rate': 6.861613921170538e-06, 'epoch': 1.21} {'loss': 0.5711, 'learning_rate': 6.861303110316151e-06, 'epoch': 1.21} {'loss': 0.6793, 'learning_rate': 6.860992302825167e-06, 'epoch': 1.21} {'loss': 0.4585, 'learning_rate': 6.860681498697908e-06, 'epoch': 1.21} {'loss': 0.5937, 'learning_rate': 6.860370697934717e-06, 'epoch': 1.21} {'loss': 0.5513, 'learning_rate': 6.860059900535922e-06, 'epoch': 1.21} {'loss': 0.4947, 'learning_rate': 6.859749106501854e-06, 'epoch': 1.21} {'loss': 0.4856, 'learning_rate': 6.859438315832851e-06, 'epoch': 1.21} {'loss': 0.5881, 'learning_rate': 6.859127528529239e-06, 'epoch': 1.21} {'loss': 0.5484, 'learning_rate': 6.858816744591359e-06, 'epoch': 1.21} {'loss': 0.4777, 'learning_rate': 6.858505964019535e-06, 'epoch': 1.21} {'loss': 0.5379, 'learning_rate': 6.858195186814111e-06, 'epoch': 1.21} {'loss': 0.4174, 'learning_rate': 6.857884412975415e-06, 'epoch': 1.21} {'loss': 0.5231, 'learning_rate': 6.857573642503776e-06, 'epoch': 1.21} {'loss': 0.5177, 'learning_rate': 6.857262875399533e-06, 'epoch': 1.21} {'loss': 0.4181, 'learning_rate': 6.8569521116630135e-06, 'epoch': 1.21} {'loss': 0.5217, 'learning_rate': 6.856641351294556e-06, 'epoch': 1.21} {'loss': 0.6534, 'learning_rate': 6.856330594294488e-06, 'epoch': 1.21} {'loss': 0.4391, 'learning_rate': 6.856019840663148e-06, 'epoch': 1.21} {'loss': 0.5033, 'learning_rate': 6.8557090904008685e-06, 'epoch': 1.21} {'loss': 0.4497, 'learning_rate': 6.855398343507978e-06, 'epoch': 1.21} {'loss': 0.3945, 'learning_rate': 6.855087599984813e-06, 'epoch': 1.21} {'loss': 0.4922, 'learning_rate': 6.8547768598317025e-06, 'epoch': 1.21} {'loss': 0.5878, 'learning_rate': 6.854466123048986e-06, 'epoch': 1.21} {'loss': 0.5179, 'learning_rate': 6.854155389636993e-06, 'epoch': 1.21} {'loss': 0.553, 'learning_rate': 6.853844659596052e-06, 'epoch': 1.21} {'loss': 0.6426, 'learning_rate': 6.853533932926505e-06, 'epoch': 1.21} {'loss': 0.6214, 'learning_rate': 6.8532232096286785e-06, 'epoch': 1.21} {'loss': 0.5463, 'learning_rate': 6.8529124897029085e-06, 'epoch': 1.21} {'loss': 0.5127, 'learning_rate': 6.852601773149523e-06, 'epoch': 1.21} {'loss': 0.5753, 'learning_rate': 6.852291059968863e-06, 'epoch': 1.21} {'loss': 0.5046, 'learning_rate': 6.851980350161258e-06, 'epoch': 1.21} {'loss': 0.5949, 'learning_rate': 6.851669643727035e-06, 'epoch': 1.21} {'loss': 0.6061, 'learning_rate': 6.851358940666537e-06, 'epoch': 1.21} {'loss': 0.4235, 'learning_rate': 6.85104824098009e-06, 'epoch': 1.21} {'loss': 0.4707, 'learning_rate': 6.850737544668031e-06, 'epoch': 1.21} {'loss': 0.445, 'learning_rate': 6.850426851730686e-06, 'epoch': 1.21} {'loss': 0.6017, 'learning_rate': 6.8501161621683984e-06, 'epoch': 1.21} {'loss': 0.6024, 'learning_rate': 6.849805475981495e-06, 'epoch': 1.21} {'loss': 0.5802, 'learning_rate': 6.849494793170306e-06, 'epoch': 1.21} {'loss': 0.4157, 'learning_rate': 6.84918411373517e-06, 'epoch': 1.21} {'loss': 0.5676, 'learning_rate': 6.848873437676416e-06, 'epoch': 1.21} {'loss': 0.6059, 'learning_rate': 6.848562764994381e-06, 'epoch': 1.21} {'loss': 0.4903, 'learning_rate': 6.848252095689396e-06, 'epoch': 1.21} {'loss': 0.5634, 'learning_rate': 6.847941429761789e-06, 'epoch': 1.21} {'loss': 0.6109, 'learning_rate': 6.8476307672119e-06, 'epoch': 1.21} {'loss': 0.6468, 'learning_rate': 6.847320108040059e-06, 'epoch': 1.21} {'loss': 0.4335, 'learning_rate': 6.8470094522466e-06, 'epoch': 1.21} {'loss': 0.5021, 'learning_rate': 6.84669879983185e-06, 'epoch': 1.21} {'loss': 0.547, 'learning_rate': 6.846388150796152e-06, 'epoch': 1.21} {'loss': 0.5968, 'learning_rate': 6.8460775051398346e-06, 'epoch': 1.21} {'loss': 0.6605, 'learning_rate': 6.845766862863225e-06, 'epoch': 1.21} {'loss': 0.4312, 'learning_rate': 6.8454562239666646e-06, 'epoch': 1.21} {'loss': 0.5175, 'learning_rate': 6.8451455884504814e-06, 'epoch': 1.21} {'loss': 0.756, 'learning_rate': 6.844834956315009e-06, 'epoch': 1.21} {'loss': 0.5096, 'learning_rate': 6.844524327560584e-06, 'epoch': 1.21} {'loss': 0.5269, 'learning_rate': 6.84421370218753e-06, 'epoch': 1.21} {'loss': 0.5208, 'learning_rate': 6.843903080196191e-06, 'epoch': 1.21} {'loss': 0.6055, 'learning_rate': 6.84359246158689e-06, 'epoch': 1.21} {'loss': 0.4923, 'learning_rate': 6.8432818463599684e-06, 'epoch': 1.21} {'loss': 0.5278, 'learning_rate': 6.842971234515754e-06, 'epoch': 1.21} {'loss': 0.5472, 'learning_rate': 6.842660626054583e-06, 'epoch': 1.21} {'loss': 0.6234, 'learning_rate': 6.842350020976784e-06, 'epoch': 1.21} {'loss': 0.6237, 'learning_rate': 6.842039419282689e-06, 'epoch': 1.21} {'loss': 0.6036, 'learning_rate': 6.8417288209726395e-06, 'epoch': 1.21} {'loss': 0.7565, 'learning_rate': 6.841418226046956e-06, 'epoch': 1.21} {'loss': 0.6304, 'learning_rate': 6.841107634505984e-06, 'epoch': 1.21} {'loss': 0.7406, 'learning_rate': 6.840797046350048e-06, 'epoch': 1.21} {'loss': 0.6509, 'learning_rate': 6.840486461579484e-06, 'epoch': 1.21} {'loss': 0.6278, 'learning_rate': 6.8401758801946235e-06, 'epoch': 1.21} {'loss': 0.4737, 'learning_rate': 6.8398653021957985e-06, 'epoch': 1.21} {'loss': 0.5611, 'learning_rate': 6.839554727583344e-06, 'epoch': 1.21} {'loss': 0.4697, 'learning_rate': 6.8392441563575895e-06, 'epoch': 1.21} {'loss': 0.5369, 'learning_rate': 6.838933588518875e-06, 'epoch': 1.21} {'loss': 0.6128, 'learning_rate': 6.838623024067527e-06, 'epoch': 1.21} {'loss': 0.5468, 'learning_rate': 6.838312463003878e-06, 'epoch': 1.21} {'loss': 0.5608, 'learning_rate': 6.838001905328264e-06, 'epoch': 1.21} {'loss': 0.5461, 'learning_rate': 6.837691351041014e-06, 'epoch': 1.21} {'loss': 0.488, 'learning_rate': 6.837380800142466e-06, 'epoch': 1.21} {'loss': 0.5617, 'learning_rate': 6.837070252632945e-06, 'epoch': 1.21} {'loss': 0.6342, 'learning_rate': 6.836759708512795e-06, 'epoch': 1.21} {'loss': 0.595, 'learning_rate': 6.83644916778234e-06, 'epoch': 1.21} {'loss': 0.6193, 'learning_rate': 6.836138630441915e-06, 'epoch': 1.21} {'loss': 0.4501, 'learning_rate': 6.835828096491854e-06, 'epoch': 1.21} {'loss': 0.5998, 'learning_rate': 6.835517565932486e-06, 'epoch': 1.21} {'loss': 0.516, 'learning_rate': 6.835207038764149e-06, 'epoch': 1.21} {'loss': 0.5422, 'learning_rate': 6.8348965149871706e-06, 'epoch': 1.21} {'loss': 0.606, 'learning_rate': 6.8345859946018885e-06, 'epoch': 1.21} {'loss': 0.5764, 'learning_rate': 6.834275477608635e-06, 'epoch': 1.21} {'loss': 0.5666, 'learning_rate': 6.833964964007737e-06, 'epoch': 1.21} {'loss': 0.5322, 'learning_rate': 6.833654453799537e-06, 'epoch': 1.21} {'loss': 0.6032, 'learning_rate': 6.833343946984354e-06, 'epoch': 1.21} {'loss': 0.4088, 'learning_rate': 6.833033443562536e-06, 'epoch': 1.21} {'loss': 0.4351, 'learning_rate': 6.832722943534406e-06, 'epoch': 1.21} {'loss': 0.6433, 'learning_rate': 6.8324124469002965e-06, 'epoch': 1.21} {'loss': 0.6163, 'learning_rate': 6.832101953660547e-06, 'epoch': 1.21} {'loss': 0.6398, 'learning_rate': 6.831791463815485e-06, 'epoch': 1.21} {'loss': 0.5073, 'learning_rate': 6.831480977365444e-06, 'epoch': 1.21} {'loss': 0.524, 'learning_rate': 6.831170494310755e-06, 'epoch': 1.21} {'loss': 0.5378, 'learning_rate': 6.830860014651756e-06, 'epoch': 1.21} {'loss': 0.5819, 'learning_rate': 6.830549538388778e-06, 'epoch': 1.21} {'loss': 0.4371, 'learning_rate': 6.830239065522146e-06, 'epoch': 1.21} {'loss': 0.5176, 'learning_rate': 6.829928596052205e-06, 'epoch': 1.21} {'loss': 0.4937, 'learning_rate': 6.8296181299792775e-06, 'epoch': 1.21} {'loss': 0.5352, 'learning_rate': 6.829307667303704e-06, 'epoch': 1.21} {'loss': 0.4324, 'learning_rate': 6.8289972080258085e-06, 'epoch': 1.21} {'loss': 0.4741, 'learning_rate': 6.8286867521459325e-06, 'epoch': 1.21} {'loss': 0.519, 'learning_rate': 6.828376299664405e-06, 'epoch': 1.21} {'loss': 0.4457, 'learning_rate': 6.828065850581555e-06, 'epoch': 1.21} {'loss': 0.6774, 'learning_rate': 6.827755404897723e-06, 'epoch': 1.21} {'loss': 0.5241, 'learning_rate': 6.827444962613235e-06, 'epoch': 1.21} {'loss': 0.5519, 'learning_rate': 6.827134523728429e-06, 'epoch': 1.21} {'loss': 0.7132, 'learning_rate': 6.8268240882436335e-06, 'epoch': 1.21} {'loss': 0.5854, 'learning_rate': 6.82651365615918e-06, 'epoch': 1.21} {'loss': 0.4209, 'learning_rate': 6.826203227475406e-06, 'epoch': 1.21} {'loss': 0.5525, 'learning_rate': 6.825892802192637e-06, 'epoch': 1.21} {'loss': 0.4793, 'learning_rate': 6.8255823803112155e-06, 'epoch': 1.21} {'loss': 0.5271, 'learning_rate': 6.825271961831468e-06, 'epoch': 1.21} {'loss': 0.5368, 'learning_rate': 6.824961546753728e-06, 'epoch': 1.21} {'loss': 0.4944, 'learning_rate': 6.82465113507833e-06, 'epoch': 1.21} {'loss': 0.428, 'learning_rate': 6.824340726805601e-06, 'epoch': 1.21} {'loss': 0.599, 'learning_rate': 6.8240303219358795e-06, 'epoch': 1.21} {'loss': 0.4783, 'learning_rate': 6.823719920469496e-06, 'epoch': 1.21} {'loss': 0.5998, 'learning_rate': 6.823409522406782e-06, 'epoch': 1.21} {'loss': 0.6157, 'learning_rate': 6.823099127748071e-06, 'epoch': 1.21} {'loss': 0.6086, 'learning_rate': 6.8227887364937e-06, 'epoch': 1.21} {'loss': 0.4775, 'learning_rate': 6.822478348643997e-06, 'epoch': 1.21} {'loss': 0.5345, 'learning_rate': 6.822167964199291e-06, 'epoch': 1.21} {'loss': 0.6942, 'learning_rate': 6.821857583159923e-06, 'epoch': 1.21} {'loss': 0.5454, 'learning_rate': 6.821547205526219e-06, 'epoch': 1.21} {'loss': 0.5341, 'learning_rate': 6.821236831298517e-06, 'epoch': 1.21} {'loss': 0.6054, 'learning_rate': 6.820926460477143e-06, 'epoch': 1.21} {'loss': 0.6152, 'learning_rate': 6.820616093062434e-06, 'epoch': 1.21} {'loss': 0.5248, 'learning_rate': 6.820305729054724e-06, 'epoch': 1.21} {'loss': 0.5136, 'learning_rate': 6.819995368454339e-06, 'epoch': 1.21} {'loss': 0.5133, 'learning_rate': 6.819685011261621e-06, 'epoch': 1.21} {'loss': 0.5465, 'learning_rate': 6.819374657476895e-06, 'epoch': 1.21} {'loss': 0.5036, 'learning_rate': 6.819064307100498e-06, 'epoch': 1.21} {'loss': 0.4594, 'learning_rate': 6.81875396013276e-06, 'epoch': 1.21} {'loss': 0.4629, 'learning_rate': 6.818443616574011e-06, 'epoch': 1.21} {'loss': 0.5498, 'learning_rate': 6.818133276424591e-06, 'epoch': 1.21} {'loss': 0.4093, 'learning_rate': 6.817822939684824e-06, 'epoch': 1.21} {'loss': 0.5342, 'learning_rate': 6.817512606355051e-06, 'epoch': 1.21} {'loss': 0.5039, 'learning_rate': 6.817202276435602e-06, 'epoch': 1.21} {'loss': 0.5111, 'learning_rate': 6.8168919499268025e-06, 'epoch': 1.21} {'loss': 0.5788, 'learning_rate': 6.8165816268289955e-06, 'epoch': 1.21} {'loss': 0.5252, 'learning_rate': 6.816271307142504e-06, 'epoch': 1.21} {'loss': 0.5684, 'learning_rate': 6.815960990867669e-06, 'epoch': 1.21} {'loss': 0.5386, 'learning_rate': 6.815650678004815e-06, 'epoch': 1.21} {'loss': 0.6587, 'learning_rate': 6.815340368554282e-06, 'epoch': 1.21} {'loss': 0.4084, 'learning_rate': 6.815030062516401e-06, 'epoch': 1.21} {'loss': 0.6108, 'learning_rate': 6.814719759891499e-06, 'epoch': 1.21} {'loss': 0.5966, 'learning_rate': 6.814409460679916e-06, 'epoch': 1.21} {'loss': 0.4454, 'learning_rate': 6.814099164881975e-06, 'epoch': 1.21} {'loss': 0.4566, 'learning_rate': 6.813788872498019e-06, 'epoch': 1.21} {'loss': 0.4858, 'learning_rate': 6.813478583528372e-06, 'epoch': 1.21} {'loss': 0.5708, 'learning_rate': 6.813168297973374e-06, 'epoch': 1.21} {'loss': 0.4057, 'learning_rate': 6.8128580158333545e-06, 'epoch': 1.21} {'loss': 0.6287, 'learning_rate': 6.812547737108643e-06, 'epoch': 1.21} {'loss': 0.6953, 'learning_rate': 6.812237461799575e-06, 'epoch': 1.21} {'loss': 0.5735, 'learning_rate': 6.81192718990648e-06, 'epoch': 1.21} {'loss': 0.4615, 'learning_rate': 6.811616921429696e-06, 'epoch': 1.21} {'loss': 0.5612, 'learning_rate': 6.811306656369552e-06, 'epoch': 1.21} {'loss': 0.538, 'learning_rate': 6.810996394726377e-06, 'epoch': 1.21} {'loss': 0.5632, 'learning_rate': 6.810686136500511e-06, 'epoch': 1.21} {'loss': 0.5225, 'learning_rate': 6.810375881692282e-06, 'epoch': 1.21} {'loss': 0.6733, 'learning_rate': 6.810065630302023e-06, 'epoch': 1.21} {'loss': 0.658, 'learning_rate': 6.809755382330065e-06, 'epoch': 1.21} {'loss': 0.5072, 'learning_rate': 6.809445137776745e-06, 'epoch': 1.21} {'loss': 0.6133, 'learning_rate': 6.809134896642391e-06, 'epoch': 1.21} {'loss': 0.5429, 'learning_rate': 6.8088246589273344e-06, 'epoch': 1.21} {'loss': 0.485, 'learning_rate': 6.808514424631914e-06, 'epoch': 1.21} {'loss': 0.6223, 'learning_rate': 6.808204193756456e-06, 'epoch': 1.21} {'loss': 0.5861, 'learning_rate': 6.807893966301298e-06, 'epoch': 1.21} {'loss': 0.607, 'learning_rate': 6.807583742266766e-06, 'epoch': 1.21} {'loss': 0.5676, 'learning_rate': 6.8072735216532e-06, 'epoch': 1.21} {'loss': 0.5557, 'learning_rate': 6.8069633044609275e-06, 'epoch': 1.21} {'loss': 0.5416, 'learning_rate': 6.806653090690279e-06, 'epoch': 1.21} {'loss': 0.5864, 'learning_rate': 6.806342880341592e-06, 'epoch': 1.21} {'loss': 0.4818, 'learning_rate': 6.806032673415197e-06, 'epoch': 1.21} {'loss': 0.5135, 'learning_rate': 6.805722469911427e-06, 'epoch': 1.21} {'loss': 0.4363, 'learning_rate': 6.8054122698306145e-06, 'epoch': 1.21} {'loss': 0.5362, 'learning_rate': 6.805102073173087e-06, 'epoch': 1.21} {'loss': 0.6576, 'learning_rate': 6.804791879939185e-06, 'epoch': 1.21} {'loss': 0.6132, 'learning_rate': 6.804481690129232e-06, 'epoch': 1.21} {'loss': 0.5739, 'learning_rate': 6.804171503743571e-06, 'epoch': 1.21} {'loss': 0.6363, 'learning_rate': 6.803861320782525e-06, 'epoch': 1.21} {'loss': 0.6821, 'learning_rate': 6.803551141246434e-06, 'epoch': 1.21} {'loss': 0.4729, 'learning_rate': 6.803240965135625e-06, 'epoch': 1.21} {'loss': 0.53, 'learning_rate': 6.802930792450427e-06, 'epoch': 1.21} {'loss': 0.6266, 'learning_rate': 6.802620623191183e-06, 'epoch': 1.21} {'loss': 0.6291, 'learning_rate': 6.802310457358215e-06, 'epoch': 1.21} {'loss': 0.4995, 'learning_rate': 6.802000294951864e-06, 'epoch': 1.21} {'loss': 0.5725, 'learning_rate': 6.8016901359724564e-06, 'epoch': 1.21} {'loss': 0.622, 'learning_rate': 6.801379980420327e-06, 'epoch': 1.21} {'loss': 0.5024, 'learning_rate': 6.8010698282958095e-06, 'epoch': 1.21} {'loss': 0.573, 'learning_rate': 6.800759679599229e-06, 'epoch': 1.21} {'loss': 0.5767, 'learning_rate': 6.800449534330929e-06, 'epoch': 1.21} {'loss': 0.5115, 'learning_rate': 6.800139392491233e-06, 'epoch': 1.21} {'loss': 0.5306, 'learning_rate': 6.799829254080477e-06, 'epoch': 1.21} {'loss': 0.6593, 'learning_rate': 6.799519119098994e-06, 'epoch': 1.21} {'loss': 0.4685, 'learning_rate': 6.7992089875471136e-06, 'epoch': 1.21} {'loss': 0.5874, 'learning_rate': 6.798898859425171e-06, 'epoch': 1.21} {'loss': 0.681, 'learning_rate': 6.798588734733494e-06, 'epoch': 1.21} {'loss': 0.5441, 'learning_rate': 6.7982786134724225e-06, 'epoch': 1.21} {'loss': 0.5289, 'learning_rate': 6.797968495642281e-06, 'epoch': 1.21} {'loss': 0.4764, 'learning_rate': 6.797658381243408e-06, 'epoch': 1.21} {'loss': 0.5881, 'learning_rate': 6.797348270276132e-06, 'epoch': 1.21} {'loss': 0.5959, 'learning_rate': 6.797038162740784e-06, 'epoch': 1.21} {'loss': 0.4661, 'learning_rate': 6.796728058637703e-06, 'epoch': 1.21} {'loss': 0.6315, 'learning_rate': 6.796417957967212e-06, 'epoch': 1.21} {'loss': 0.5727, 'learning_rate': 6.796107860729653e-06, 'epoch': 1.21} {'loss': 0.4526, 'learning_rate': 6.79579776692535e-06, 'epoch': 1.21} {'loss': 0.6474, 'learning_rate': 6.795487676554643e-06, 'epoch': 1.21} {'loss': 0.5222, 'learning_rate': 6.7951775896178585e-06, 'epoch': 1.21} {'loss': 0.4898, 'learning_rate': 6.794867506115328e-06, 'epoch': 1.21} {'loss': 0.528, 'learning_rate': 6.794557426047389e-06, 'epoch': 1.21} {'loss': 0.4083, 'learning_rate': 6.794247349414367e-06, 'epoch': 1.21} {'loss': 0.4641, 'learning_rate': 6.793937276216602e-06, 'epoch': 1.21} {'loss': 0.5376, 'learning_rate': 6.793627206454425e-06, 'epoch': 1.21} {'loss': 0.7315, 'learning_rate': 6.793317140128162e-06, 'epoch': 1.21} {'loss': 0.6542, 'learning_rate': 6.79300707723815e-06, 'epoch': 1.21} {'loss': 0.456, 'learning_rate': 6.7926970177847174e-06, 'epoch': 1.21} {'loss': 0.5645, 'learning_rate': 6.792386961768205e-06, 'epoch': 1.21} {'loss': 0.5747, 'learning_rate': 6.792076909188934e-06, 'epoch': 1.21} {'loss': 0.4725, 'learning_rate': 6.791766860047246e-06, 'epoch': 1.21} {'loss': 0.5775, 'learning_rate': 6.791456814343469e-06, 'epoch': 1.21} {'loss': 0.4863, 'learning_rate': 6.7911467720779346e-06, 'epoch': 1.21} {'loss': 0.6885, 'learning_rate': 6.790836733250978e-06, 'epoch': 1.21} {'loss': 0.6704, 'learning_rate': 6.790526697862924e-06, 'epoch': 1.21} {'loss': 0.7567, 'learning_rate': 6.790216665914116e-06, 'epoch': 1.21} {'loss': 0.517, 'learning_rate': 6.7899066374048795e-06, 'epoch': 1.21} {'loss': 0.7049, 'learning_rate': 6.789596612335545e-06, 'epoch': 1.21} {'loss': 0.4056, 'learning_rate': 6.789286590706449e-06, 'epoch': 1.21} {'loss': 0.6039, 'learning_rate': 6.788976572517923e-06, 'epoch': 1.21} {'loss': 0.4548, 'learning_rate': 6.788666557770301e-06, 'epoch': 1.21} {'loss': 0.5951, 'learning_rate': 6.788356546463905e-06, 'epoch': 1.21} {'loss': 0.7217, 'learning_rate': 6.788046538599082e-06, 'epoch': 1.21} {'loss': 0.5685, 'learning_rate': 6.787736534176156e-06, 'epoch': 1.21} {'loss': 0.4805, 'learning_rate': 6.787426533195456e-06, 'epoch': 1.21} {'loss': 0.5882, 'learning_rate': 6.787116535657322e-06, 'epoch': 1.21} {'loss': 0.5307, 'learning_rate': 6.786806541562081e-06, 'epoch': 1.21} {'loss': 0.4938, 'learning_rate': 6.786496550910069e-06, 'epoch': 1.21} {'loss': 0.5033, 'learning_rate': 6.786186563701613e-06, 'epoch': 1.21} {'loss': 0.5773, 'learning_rate': 6.785876579937049e-06, 'epoch': 1.21} {'loss': 0.6125, 'learning_rate': 6.785566599616711e-06, 'epoch': 1.21} {'loss': 0.5196, 'learning_rate': 6.785256622740925e-06, 'epoch': 1.21} {'loss': 0.5156, 'learning_rate': 6.7849466493100295e-06, 'epoch': 1.21} {'loss': 0.5505, 'learning_rate': 6.784636679324351e-06, 'epoch': 1.21} {'loss': 0.417, 'learning_rate': 6.784326712784228e-06, 'epoch': 1.21} {'loss': 0.4278, 'learning_rate': 6.784016749689987e-06, 'epoch': 1.21} {'loss': 0.6515, 'learning_rate': 6.783706790041961e-06, 'epoch': 1.21} {'loss': 0.4624, 'learning_rate': 6.783396833840486e-06, 'epoch': 1.21} {'loss': 0.6457, 'learning_rate': 6.783086881085889e-06, 'epoch': 1.21} {'loss': 0.5611, 'learning_rate': 6.782776931778507e-06, 'epoch': 1.21} {'loss': 0.523, 'learning_rate': 6.782466985918669e-06, 'epoch': 1.21} {'loss': 0.5208, 'learning_rate': 6.78215704350671e-06, 'epoch': 1.21} {'loss': 0.5566, 'learning_rate': 6.78184710454296e-06, 'epoch': 1.21} {'loss': 0.5746, 'learning_rate': 6.781537169027746e-06, 'epoch': 1.21} {'loss': 0.5199, 'learning_rate': 6.781227236961412e-06, 'epoch': 1.21} {'loss': 0.5027, 'learning_rate': 6.780917308344277e-06, 'epoch': 1.21} {'loss': 0.5276, 'learning_rate': 6.780607383176685e-06, 'epoch': 1.21} {'loss': 0.5957, 'learning_rate': 6.78029746145896e-06, 'epoch': 1.21} {'loss': 0.406, 'learning_rate': 6.779987543191439e-06, 'epoch': 1.21} {'loss': 0.4818, 'learning_rate': 6.779677628374452e-06, 'epoch': 1.21} {'loss': 0.5102, 'learning_rate': 6.7793677170083275e-06, 'epoch': 1.21} {'loss': 0.5797, 'learning_rate': 6.7790578090934055e-06, 'epoch': 1.21} {'loss': 0.5487, 'learning_rate': 6.77874790463001e-06, 'epoch': 1.21} {'loss': 0.4247, 'learning_rate': 6.778438003618479e-06, 'epoch': 1.21} {'loss': 0.5098, 'learning_rate': 6.7781281060591446e-06, 'epoch': 1.21} {'loss': 0.4024, 'learning_rate': 6.7778182119523325e-06, 'epoch': 1.21} {'loss': 0.696, 'learning_rate': 6.7775083212983825e-06, 'epoch': 1.21} {'loss': 0.5066, 'learning_rate': 6.777198434097618e-06, 'epoch': 1.21} {'loss': 0.5363, 'learning_rate': 6.776888550350382e-06, 'epoch': 1.21} {'loss': 0.564, 'learning_rate': 6.776578670056998e-06, 'epoch': 1.21} {'loss': 0.6173, 'learning_rate': 6.776268793217801e-06, 'epoch': 1.21} {'loss': 0.5016, 'learning_rate': 6.775958919833125e-06, 'epoch': 1.21} {'loss': 0.5883, 'learning_rate': 6.775649049903297e-06, 'epoch': 1.21} {'loss': 0.4392, 'learning_rate': 6.775339183428655e-06, 'epoch': 1.21} {'loss': 0.513, 'learning_rate': 6.775029320409524e-06, 'epoch': 1.21} {'loss': 0.5423, 'learning_rate': 6.774719460846244e-06, 'epoch': 1.21} {'loss': 0.5063, 'learning_rate': 6.774409604739142e-06, 'epoch': 1.21} {'loss': 0.5827, 'learning_rate': 6.774099752088552e-06, 'epoch': 1.21} {'loss': 0.6129, 'learning_rate': 6.773789902894804e-06, 'epoch': 1.21} {'loss': 0.5051, 'learning_rate': 6.77348005715823e-06, 'epoch': 1.21} {'loss': 0.3762, 'learning_rate': 6.773170214879168e-06, 'epoch': 1.21} {'loss': 0.4508, 'learning_rate': 6.772860376057939e-06, 'epoch': 1.21} {'loss': 0.5257, 'learning_rate': 6.772550540694886e-06, 'epoch': 1.21} {'loss': 0.5593, 'learning_rate': 6.772240708790338e-06, 'epoch': 1.21} {'loss': 0.5358, 'learning_rate': 6.771930880344622e-06, 'epoch': 1.21} {'loss': 0.4877, 'learning_rate': 6.771621055358075e-06, 'epoch': 1.21} {'loss': 0.8033, 'learning_rate': 6.7713112338310235e-06, 'epoch': 1.21} {'loss': 0.5085, 'learning_rate': 6.7710014157638075e-06, 'epoch': 1.21} {'loss': 0.6563, 'learning_rate': 6.770691601156752e-06, 'epoch': 1.21} {'loss': 0.6468, 'learning_rate': 6.770381790010194e-06, 'epoch': 1.21} {'loss': 0.5876, 'learning_rate': 6.7700719823244644e-06, 'epoch': 1.21} {'loss': 0.4644, 'learning_rate': 6.769762178099892e-06, 'epoch': 1.21} {'loss': 0.5761, 'learning_rate': 6.769452377336814e-06, 'epoch': 1.21} {'loss': 0.5572, 'learning_rate': 6.769142580035555e-06, 'epoch': 1.21} {'loss': 0.5447, 'learning_rate': 6.7688327861964545e-06, 'epoch': 1.21} {'loss': 0.5468, 'learning_rate': 6.7685229958198374e-06, 'epoch': 1.21} {'loss': 0.5445, 'learning_rate': 6.768213208906045e-06, 'epoch': 1.21} {'loss': 0.6584, 'learning_rate': 6.767903425455402e-06, 'epoch': 1.21} {'loss': 0.6402, 'learning_rate': 6.76759364546824e-06, 'epoch': 1.21} {'loss': 0.5889, 'learning_rate': 6.767283868944896e-06, 'epoch': 1.21} {'loss': 0.5161, 'learning_rate': 6.766974095885697e-06, 'epoch': 1.21} {'loss': 0.4564, 'learning_rate': 6.766664326290978e-06, 'epoch': 1.21} {'loss': 0.616, 'learning_rate': 6.766354560161071e-06, 'epoch': 1.21} {'loss': 0.5566, 'learning_rate': 6.766044797496303e-06, 'epoch': 1.21} {'loss': 0.511, 'learning_rate': 6.765735038297014e-06, 'epoch': 1.21} {'loss': 0.5383, 'learning_rate': 6.765425282563531e-06, 'epoch': 1.21} {'loss': 0.4705, 'learning_rate': 6.765115530296187e-06, 'epoch': 1.21} {'loss': 0.565, 'learning_rate': 6.76480578149531e-06, 'epoch': 1.21} {'loss': 0.6095, 'learning_rate': 6.76449603616124e-06, 'epoch': 1.21} {'loss': 0.6066, 'learning_rate': 6.764186294294305e-06, 'epoch': 1.21} {'loss': 0.6415, 'learning_rate': 6.763876555894831e-06, 'epoch': 1.21} {'loss': 0.7294, 'learning_rate': 6.7635668209631614e-06, 'epoch': 1.21} {'loss': 0.4823, 'learning_rate': 6.763257089499617e-06, 'epoch': 1.21} {'loss': 0.4933, 'learning_rate': 6.76294736150454e-06, 'epoch': 1.21} {'loss': 0.6528, 'learning_rate': 6.762637636978251e-06, 'epoch': 1.21} {'loss': 0.5058, 'learning_rate': 6.7623279159210935e-06, 'epoch': 1.21} {'loss': 0.5761, 'learning_rate': 6.762018198333393e-06, 'epoch': 1.21} {'loss': 0.7205, 'learning_rate': 6.7617084842154766e-06, 'epoch': 1.21} {'loss': 0.6479, 'learning_rate': 6.761398773567689e-06, 'epoch': 1.21} {'loss': 0.6088, 'learning_rate': 6.761089066390352e-06, 'epoch': 1.21} {'loss': 0.557, 'learning_rate': 6.7607793626838e-06, 'epoch': 1.21} {'loss': 0.544, 'learning_rate': 6.760469662448368e-06, 'epoch': 1.21} {'loss': 0.5458, 'learning_rate': 6.760159965684379e-06, 'epoch': 1.21} {'loss': 0.7307, 'learning_rate': 6.7598502723921766e-06, 'epoch': 1.21} {'loss': 0.544, 'learning_rate': 6.759540582572084e-06, 'epoch': 1.21} {'loss': 0.5999, 'learning_rate': 6.759230896224438e-06, 'epoch': 1.21} {'loss': 0.6097, 'learning_rate': 6.7589212133495675e-06, 'epoch': 1.21} {'loss': 0.5867, 'learning_rate': 6.758611533947807e-06, 'epoch': 1.21} {'loss': 0.5757, 'learning_rate': 6.758301858019487e-06, 'epoch': 1.21} {'loss': 0.6272, 'learning_rate': 6.757992185564936e-06, 'epoch': 1.21} {'loss': 0.5815, 'learning_rate': 6.757682516584492e-06, 'epoch': 1.21} {'loss': 0.5645, 'learning_rate': 6.75737285107848e-06, 'epoch': 1.21} {'loss': 0.6303, 'learning_rate': 6.757063189047239e-06, 'epoch': 1.21} {'loss': 0.6396, 'learning_rate': 6.7567535304910996e-06, 'epoch': 1.21} {'loss': 0.5961, 'learning_rate': 6.756443875410388e-06, 'epoch': 1.21} {'loss': 0.6252, 'learning_rate': 6.756134223805442e-06, 'epoch': 1.21} {'loss': 0.5554, 'learning_rate': 6.755824575676586e-06, 'epoch': 1.21} {'loss': 0.7446, 'learning_rate': 6.755514931024161e-06, 'epoch': 1.21} {'loss': 0.4165, 'learning_rate': 6.755205289848491e-06, 'epoch': 1.21} {'loss': 0.5677, 'learning_rate': 6.754895652149916e-06, 'epoch': 1.21} {'loss': 0.658, 'learning_rate': 6.754586017928762e-06, 'epoch': 1.21} {'loss': 0.6886, 'learning_rate': 6.754276387185361e-06, 'epoch': 1.21} {'loss': 0.6089, 'learning_rate': 6.7539667599200475e-06, 'epoch': 1.21} {'loss': 0.5429, 'learning_rate': 6.753657136133147e-06, 'epoch': 1.21} {'loss': 0.5919, 'learning_rate': 6.753347515825001e-06, 'epoch': 1.21} {'loss': 0.5346, 'learning_rate': 6.753037898995933e-06, 'epoch': 1.21} {'loss': 0.4825, 'learning_rate': 6.752728285646278e-06, 'epoch': 1.21} {'loss': 0.572, 'learning_rate': 6.752418675776371e-06, 'epoch': 1.21} {'loss': 0.5605, 'learning_rate': 6.7521090693865374e-06, 'epoch': 1.21} {'loss': 0.6158, 'learning_rate': 6.751799466477115e-06, 'epoch': 1.21} {'loss': 0.4797, 'learning_rate': 6.751489867048428e-06, 'epoch': 1.21} {'loss': 0.5567, 'learning_rate': 6.751180271100816e-06, 'epoch': 1.21} {'loss': 0.5075, 'learning_rate': 6.750870678634609e-06, 'epoch': 1.21} {'loss': 0.5933, 'learning_rate': 6.750561089650132e-06, 'epoch': 1.21} {'loss': 0.5217, 'learning_rate': 6.750251504147727e-06, 'epoch': 1.21} {'loss': 0.5997, 'learning_rate': 6.749941922127719e-06, 'epoch': 1.21} {'loss': 0.6981, 'learning_rate': 6.749632343590442e-06, 'epoch': 1.21} {'loss': 0.6362, 'learning_rate': 6.749322768536225e-06, 'epoch': 1.21} {'loss': 0.4271, 'learning_rate': 6.749013196965406e-06, 'epoch': 1.21} {'loss': 0.5151, 'learning_rate': 6.7487036288783125e-06, 'epoch': 1.21} {'loss': 0.6002, 'learning_rate': 6.748394064275274e-06, 'epoch': 1.21} {'loss': 0.69, 'learning_rate': 6.748084503156624e-06, 'epoch': 1.21} {'loss': 0.4486, 'learning_rate': 6.747774945522696e-06, 'epoch': 1.21} {'loss': 0.6787, 'learning_rate': 6.747465391373824e-06, 'epoch': 1.21} {'loss': 0.6391, 'learning_rate': 6.7471558407103314e-06, 'epoch': 1.21} {'loss': 0.4829, 'learning_rate': 6.746846293532557e-06, 'epoch': 1.21} {'loss': 0.6367, 'learning_rate': 6.746536749840833e-06, 'epoch': 1.21} {'loss': 0.5297, 'learning_rate': 6.746227209635485e-06, 'epoch': 1.21} {'loss': 0.5542, 'learning_rate': 6.745917672916851e-06, 'epoch': 1.21} {'loss': 0.6196, 'learning_rate': 6.745608139685256e-06, 'epoch': 1.21} {'loss': 0.5112, 'learning_rate': 6.745298609941039e-06, 'epoch': 1.21} {'loss': 0.531, 'learning_rate': 6.744989083684528e-06, 'epoch': 1.21} {'loss': 0.5552, 'learning_rate': 6.744679560916052e-06, 'epoch': 1.21} {'loss': 0.5661, 'learning_rate': 6.744370041635948e-06, 'epoch': 1.21} {'loss': 0.492, 'learning_rate': 6.7440605258445446e-06, 'epoch': 1.21} {'loss': 0.78, 'learning_rate': 6.743751013542177e-06, 'epoch': 1.21} {'loss': 0.6796, 'learning_rate': 6.743441504729169e-06, 'epoch': 1.21} {'loss': 0.5638, 'learning_rate': 6.7431319994058605e-06, 'epoch': 1.21} {'loss': 0.6307, 'learning_rate': 6.742822497572582e-06, 'epoch': 1.21} {'loss': 0.4725, 'learning_rate': 6.742512999229658e-06, 'epoch': 1.21} {'loss': 0.4765, 'learning_rate': 6.742203504377429e-06, 'epoch': 1.21} {'loss': 0.445, 'learning_rate': 6.741894013016222e-06, 'epoch': 1.21} {'loss': 0.5012, 'learning_rate': 6.741584525146372e-06, 'epoch': 1.21} {'loss': 0.6283, 'learning_rate': 6.741275040768202e-06, 'epoch': 1.21} {'loss': 0.5234, 'learning_rate': 6.740965559882056e-06, 'epoch': 1.21} {'loss': 0.4668, 'learning_rate': 6.74065608248826e-06, 'epoch': 1.21} {'loss': 0.5477, 'learning_rate': 6.74034660858714e-06, 'epoch': 1.21} {'loss': 0.6101, 'learning_rate': 6.740037138179036e-06, 'epoch': 1.21} {'loss': 0.5441, 'learning_rate': 6.739727671264275e-06, 'epoch': 1.21} {'loss': 0.5425, 'learning_rate': 6.739418207843193e-06, 'epoch': 1.21} {'loss': 0.429, 'learning_rate': 6.739108747916119e-06, 'epoch': 1.21} {'loss': 0.5739, 'learning_rate': 6.738799291483378e-06, 'epoch': 1.21} {'loss': 0.7016, 'learning_rate': 6.738489838545314e-06, 'epoch': 1.21} {'loss': 0.6028, 'learning_rate': 6.738180389102247e-06, 'epoch': 1.21} {'loss': 0.5092, 'learning_rate': 6.737870943154519e-06, 'epoch': 1.21} {'loss': 0.5295, 'learning_rate': 6.737561500702454e-06, 'epoch': 1.21} {'loss': 0.7192, 'learning_rate': 6.73725206174639e-06, 'epoch': 1.21} {'loss': 0.5464, 'learning_rate': 6.736942626286653e-06, 'epoch': 1.21} {'loss': 0.489, 'learning_rate': 6.736633194323574e-06, 'epoch': 1.21} {'loss': 0.5372, 'learning_rate': 6.736323765857491e-06, 'epoch': 1.21} {'loss': 0.6511, 'learning_rate': 6.736014340888726e-06, 'epoch': 1.21} {'loss': 0.5731, 'learning_rate': 6.735704919417621e-06, 'epoch': 1.21} {'loss': 0.5284, 'learning_rate': 6.735395501444501e-06, 'epoch': 1.21} {'loss': 0.4515, 'learning_rate': 6.735086086969702e-06, 'epoch': 1.21} {'loss': 0.4097, 'learning_rate': 6.7347766759935515e-06, 'epoch': 1.21} {'loss': 0.6589, 'learning_rate': 6.73446726851638e-06, 'epoch': 1.21} {'loss': 0.497, 'learning_rate': 6.734157864538524e-06, 'epoch': 1.21} {'loss': 0.5139, 'learning_rate': 6.733848464060311e-06, 'epoch': 1.21} {'loss': 0.4299, 'learning_rate': 6.733539067082075e-06, 'epoch': 1.21} {'loss': 0.5593, 'learning_rate': 6.733229673604149e-06, 'epoch': 1.21} {'loss': 0.7254, 'learning_rate': 6.732920283626861e-06, 'epoch': 1.21} {'loss': 0.6786, 'learning_rate': 6.732610897150543e-06, 'epoch': 1.21} {'loss': 0.5219, 'learning_rate': 6.732301514175526e-06, 'epoch': 1.21} {'loss': 0.6459, 'learning_rate': 6.731992134702144e-06, 'epoch': 1.21} {'loss': 0.5305, 'learning_rate': 6.731682758730724e-06, 'epoch': 1.21} {'loss': 0.6992, 'learning_rate': 6.731373386261607e-06, 'epoch': 1.21} {'loss': 0.4678, 'learning_rate': 6.731064017295117e-06, 'epoch': 1.21} {'loss': 0.5848, 'learning_rate': 6.7307546518315855e-06, 'epoch': 1.21} {'loss': 0.5398, 'learning_rate': 6.730445289871348e-06, 'epoch': 1.21} {'loss': 0.6636, 'learning_rate': 6.730135931414728e-06, 'epoch': 1.21} {'loss': 0.5301, 'learning_rate': 6.729826576462066e-06, 'epoch': 1.21} {'loss': 0.5407, 'learning_rate': 6.729517225013692e-06, 'epoch': 1.21} {'loss': 0.5122, 'learning_rate': 6.72920787706993e-06, 'epoch': 1.21} {'loss': 0.5428, 'learning_rate': 6.728898532631123e-06, 'epoch': 1.21} {'loss': 0.4586, 'learning_rate': 6.728589191697592e-06, 'epoch': 1.21} {'loss': 0.4812, 'learning_rate': 6.728279854269677e-06, 'epoch': 1.21} {'loss': 0.4896, 'learning_rate': 6.7279705203477e-06, 'epoch': 1.21} {'loss': 0.616, 'learning_rate': 6.727661189932002e-06, 'epoch': 1.21} {'loss': 0.4859, 'learning_rate': 6.72735186302291e-06, 'epoch': 1.21} {'loss': 0.3726, 'learning_rate': 6.727042539620753e-06, 'epoch': 1.21} {'loss': 0.6264, 'learning_rate': 6.72673321972587e-06, 'epoch': 1.21} {'loss': 0.4849, 'learning_rate': 6.726423903338583e-06, 'epoch': 1.21} {'loss': 0.5235, 'learning_rate': 6.726114590459232e-06, 'epoch': 1.21} {'loss': 0.6262, 'learning_rate': 6.725805281088141e-06, 'epoch': 1.21} {'loss': 0.5639, 'learning_rate': 6.7254959752256484e-06, 'epoch': 1.21} {'loss': 0.5462, 'learning_rate': 6.725186672872083e-06, 'epoch': 1.21} {'loss': 0.5277, 'learning_rate': 6.724877374027774e-06, 'epoch': 1.21} {'loss': 0.4572, 'learning_rate': 6.724568078693052e-06, 'epoch': 1.21} {'loss': 0.509, 'learning_rate': 6.724258786868254e-06, 'epoch': 1.21} {'loss': 0.4839, 'learning_rate': 6.723949498553709e-06, 'epoch': 1.21} {'loss': 0.6657, 'learning_rate': 6.723640213749748e-06, 'epoch': 1.21} {'loss': 0.3837, 'learning_rate': 6.723330932456698e-06, 'epoch': 1.21} {'loss': 0.5351, 'learning_rate': 6.7230216546749e-06, 'epoch': 1.21} {'loss': 0.6248, 'learning_rate': 6.7227123804046755e-06, 'epoch': 1.22} {'loss': 0.3598, 'learning_rate': 6.722403109646365e-06, 'epoch': 1.22} {'loss': 0.5655, 'learning_rate': 6.72209384240029e-06, 'epoch': 1.22} {'loss': 0.4303, 'learning_rate': 6.7217845786667915e-06, 'epoch': 1.22} {'loss': 0.5721, 'learning_rate': 6.721475318446195e-06, 'epoch': 1.22} {'loss': 0.4253, 'learning_rate': 6.721166061738833e-06, 'epoch': 1.22} {'loss': 0.5155, 'learning_rate': 6.72085680854504e-06, 'epoch': 1.22} {'loss': 0.5796, 'learning_rate': 6.720547558865143e-06, 'epoch': 1.22} {'loss': 0.6285, 'learning_rate': 6.720238312699476e-06, 'epoch': 1.22} {'loss': 0.4991, 'learning_rate': 6.719929070048367e-06, 'epoch': 1.22} {'loss': 0.6149, 'learning_rate': 6.719619830912154e-06, 'epoch': 1.22} {'loss': 0.4356, 'learning_rate': 6.719310595291164e-06, 'epoch': 1.22} {'loss': 0.4796, 'learning_rate': 6.719001363185724e-06, 'epoch': 1.22} {'loss': 0.4635, 'learning_rate': 6.718692134596177e-06, 'epoch': 1.22} {'loss': 0.5763, 'learning_rate': 6.718382909522843e-06, 'epoch': 1.22} {'loss': 0.6698, 'learning_rate': 6.718073687966061e-06, 'epoch': 1.22} {'loss': 0.5183, 'learning_rate': 6.717764469926158e-06, 'epoch': 1.22} {'loss': 0.4826, 'learning_rate': 6.7174552554034635e-06, 'epoch': 1.22} {'loss': 0.5599, 'learning_rate': 6.717146044398315e-06, 'epoch': 1.22} {'loss': 0.4398, 'learning_rate': 6.716836836911038e-06, 'epoch': 1.22} {'loss': 0.5486, 'learning_rate': 6.71652763294197e-06, 'epoch': 1.22} {'loss': 0.5334, 'learning_rate': 6.7162184324914385e-06, 'epoch': 1.22} {'loss': 0.4577, 'learning_rate': 6.715909235559775e-06, 'epoch': 1.22} {'loss': 0.4956, 'learning_rate': 6.715600042147313e-06, 'epoch': 1.22} {'loss': 0.5701, 'learning_rate': 6.715290852254377e-06, 'epoch': 1.22} {'loss': 0.601, 'learning_rate': 6.714981665881308e-06, 'epoch': 1.22} {'loss': 0.5998, 'learning_rate': 6.714672483028429e-06, 'epoch': 1.22} {'loss': 0.5066, 'learning_rate': 6.714363303696077e-06, 'epoch': 1.22} {'loss': 0.5189, 'learning_rate': 6.714054127884582e-06, 'epoch': 1.22} {'loss': 0.4655, 'learning_rate': 6.713744955594274e-06, 'epoch': 1.22} {'loss': 0.6412, 'learning_rate': 6.713435786825486e-06, 'epoch': 1.22} {'loss': 0.5326, 'learning_rate': 6.713126621578544e-06, 'epoch': 1.22} {'loss': 0.4384, 'learning_rate': 6.7128174598537874e-06, 'epoch': 1.22} {'loss': 0.6721, 'learning_rate': 6.71250830165154e-06, 'epoch': 1.22} {'loss': 0.4684, 'learning_rate': 6.7121991469721405e-06, 'epoch': 1.22} {'loss': 0.5122, 'learning_rate': 6.711889995815917e-06, 'epoch': 1.22} {'loss': 0.6171, 'learning_rate': 6.7115808481831965e-06, 'epoch': 1.22} {'loss': 0.4746, 'learning_rate': 6.711271704074318e-06, 'epoch': 1.22} {'loss': 0.6628, 'learning_rate': 6.7109625634896024e-06, 'epoch': 1.22} {'loss': 0.5478, 'learning_rate': 6.710653426429392e-06, 'epoch': 1.22} {'loss': 0.4175, 'learning_rate': 6.710344292894011e-06, 'epoch': 1.22} {'loss': 0.5446, 'learning_rate': 6.710035162883795e-06, 'epoch': 1.22} {'loss': 0.3838, 'learning_rate': 6.709726036399075e-06, 'epoch': 1.22} {'loss': 0.6422, 'learning_rate': 6.709416913440176e-06, 'epoch': 1.22} {'loss': 0.5615, 'learning_rate': 6.709107794007439e-06, 'epoch': 1.22} {'loss': 0.5887, 'learning_rate': 6.708798678101183e-06, 'epoch': 1.22} {'loss': 0.6153, 'learning_rate': 6.708489565721752e-06, 'epoch': 1.22} {'loss': 0.4514, 'learning_rate': 6.7081804568694664e-06, 'epoch': 1.22} {'loss': 0.5272, 'learning_rate': 6.707871351544668e-06, 'epoch': 1.22} {'loss': 0.7166, 'learning_rate': 6.7075622497476825e-06, 'epoch': 1.22} {'loss': 0.6689, 'learning_rate': 6.707253151478839e-06, 'epoch': 1.22} {'loss': 0.4718, 'learning_rate': 6.706944056738471e-06, 'epoch': 1.22} {'loss': 0.4732, 'learning_rate': 6.706634965526908e-06, 'epoch': 1.22} {'loss': 0.6105, 'learning_rate': 6.706325877844486e-06, 'epoch': 1.22} {'loss': 0.6205, 'learning_rate': 6.706016793691532e-06, 'epoch': 1.22} {'loss': 0.5993, 'learning_rate': 6.705707713068377e-06, 'epoch': 1.22} {'loss': 0.4636, 'learning_rate': 6.7053986359753555e-06, 'epoch': 1.22} {'loss': 0.7139, 'learning_rate': 6.705089562412794e-06, 'epoch': 1.22} {'loss': 0.5551, 'learning_rate': 6.7047804923810315e-06, 'epoch': 1.22} {'loss': 0.5612, 'learning_rate': 6.704471425880388e-06, 'epoch': 1.22} {'loss': 0.4682, 'learning_rate': 6.704162362911204e-06, 'epoch': 1.22} {'loss': 0.5807, 'learning_rate': 6.703853303473808e-06, 'epoch': 1.22} {'loss': 0.485, 'learning_rate': 6.703544247568527e-06, 'epoch': 1.22} {'loss': 0.4947, 'learning_rate': 6.7032351951957005e-06, 'epoch': 1.22} {'loss': 0.5458, 'learning_rate': 6.702926146355653e-06, 'epoch': 1.22} {'loss': 0.4389, 'learning_rate': 6.70261710104872e-06, 'epoch': 1.22} {'loss': 0.5191, 'learning_rate': 6.702308059275229e-06, 'epoch': 1.22} {'loss': 0.6485, 'learning_rate': 6.701999021035509e-06, 'epoch': 1.22} {'loss': 0.5799, 'learning_rate': 6.701689986329899e-06, 'epoch': 1.22} {'loss': 0.6396, 'learning_rate': 6.701380955158724e-06, 'epoch': 1.22} {'loss': 0.5859, 'learning_rate': 6.7010719275223165e-06, 'epoch': 1.22} {'loss': 0.6068, 'learning_rate': 6.7007629034210085e-06, 'epoch': 1.22} {'loss': 0.6774, 'learning_rate': 6.700453882855134e-06, 'epoch': 1.22} {'loss': 0.6444, 'learning_rate': 6.700144865825019e-06, 'epoch': 1.22} {'loss': 0.5549, 'learning_rate': 6.699835852330994e-06, 'epoch': 1.22} {'loss': 0.4826, 'learning_rate': 6.699526842373396e-06, 'epoch': 1.22} {'loss': 0.5697, 'learning_rate': 6.699217835952551e-06, 'epoch': 1.22} {'loss': 0.5636, 'learning_rate': 6.698908833068793e-06, 'epoch': 1.22} {'loss': 0.5542, 'learning_rate': 6.69859983372245e-06, 'epoch': 1.22} {'loss': 0.4079, 'learning_rate': 6.698290837913859e-06, 'epoch': 1.22} {'loss': 0.5015, 'learning_rate': 6.697981845643346e-06, 'epoch': 1.22} {'loss': 0.5323, 'learning_rate': 6.697672856911239e-06, 'epoch': 1.22} {'loss': 0.6305, 'learning_rate': 6.69736387171788e-06, 'epoch': 1.22} {'loss': 0.5038, 'learning_rate': 6.6970548900635904e-06, 'epoch': 1.22} {'loss': 0.5437, 'learning_rate': 6.6967459119487065e-06, 'epoch': 1.22} {'loss': 0.6226, 'learning_rate': 6.696436937373558e-06, 'epoch': 1.22} {'loss': 0.4985, 'learning_rate': 6.69612796633847e-06, 'epoch': 1.22} {'loss': 0.514, 'learning_rate': 6.695818998843786e-06, 'epoch': 1.22} {'loss': 0.5558, 'learning_rate': 6.695510034889824e-06, 'epoch': 1.22} {'loss': 0.41, 'learning_rate': 6.6952010744769255e-06, 'epoch': 1.22} {'loss': 0.5468, 'learning_rate': 6.694892117605416e-06, 'epoch': 1.22} {'loss': 0.6241, 'learning_rate': 6.69458316427563e-06, 'epoch': 1.22} {'loss': 0.6606, 'learning_rate': 6.694274214487895e-06, 'epoch': 1.22} {'loss': 0.5047, 'learning_rate': 6.693965268242541e-06, 'epoch': 1.22} {'loss': 0.6479, 'learning_rate': 6.6936563255399046e-06, 'epoch': 1.22} {'loss': 0.4085, 'learning_rate': 6.69334738638031e-06, 'epoch': 1.22} {'loss': 0.5841, 'learning_rate': 6.693038450764097e-06, 'epoch': 1.22} {'loss': 0.5261, 'learning_rate': 6.692729518691589e-06, 'epoch': 1.22} {'loss': 0.6981, 'learning_rate': 6.6924205901631225e-06, 'epoch': 1.22} {'loss': 0.5524, 'learning_rate': 6.692111665179024e-06, 'epoch': 1.22} {'loss': 0.6747, 'learning_rate': 6.691802743739624e-06, 'epoch': 1.22} {'loss': 0.6482, 'learning_rate': 6.69149382584526e-06, 'epoch': 1.22} {'loss': 0.3894, 'learning_rate': 6.691184911496255e-06, 'epoch': 1.22} {'loss': 0.5433, 'learning_rate': 6.6908760006929474e-06, 'epoch': 1.22} {'loss': 0.6144, 'learning_rate': 6.6905670934356645e-06, 'epoch': 1.22} {'loss': 0.6295, 'learning_rate': 6.690258189724737e-06, 'epoch': 1.22} {'loss': 0.6748, 'learning_rate': 6.6899492895604974e-06, 'epoch': 1.22} {'loss': 0.5568, 'learning_rate': 6.689640392943273e-06, 'epoch': 1.22} {'loss': 0.4592, 'learning_rate': 6.689331499873402e-06, 'epoch': 1.22} {'loss': 0.5383, 'learning_rate': 6.689022610351206e-06, 'epoch': 1.22} {'loss': 0.6023, 'learning_rate': 6.688713724377024e-06, 'epoch': 1.22} {'loss': 0.4683, 'learning_rate': 6.688404841951186e-06, 'epoch': 1.22} {'loss': 0.607, 'learning_rate': 6.688095963074018e-06, 'epoch': 1.22} {'loss': 0.497, 'learning_rate': 6.6877870877458566e-06, 'epoch': 1.22} {'loss': 0.5898, 'learning_rate': 6.687478215967026e-06, 'epoch': 1.22} {'loss': 0.603, 'learning_rate': 6.687169347737865e-06, 'epoch': 1.22} {'loss': 0.3447, 'learning_rate': 6.6868604830587e-06, 'epoch': 1.22} {'loss': 0.4874, 'learning_rate': 6.686551621929863e-06, 'epoch': 1.22} {'loss': 0.5508, 'learning_rate': 6.6862427643516865e-06, 'epoch': 1.22} {'loss': 0.5759, 'learning_rate': 6.685933910324499e-06, 'epoch': 1.22} {'loss': 0.5096, 'learning_rate': 6.685625059848634e-06, 'epoch': 1.22} {'loss': 0.4333, 'learning_rate': 6.6853162129244155e-06, 'epoch': 1.22} {'loss': 0.4706, 'learning_rate': 6.685007369552185e-06, 'epoch': 1.22} {'loss': 0.378, 'learning_rate': 6.684698529732268e-06, 'epoch': 1.22} {'loss': 0.565, 'learning_rate': 6.684389693464992e-06, 'epoch': 1.22} {'loss': 0.4749, 'learning_rate': 6.684080860750697e-06, 'epoch': 1.22} {'loss': 0.4686, 'learning_rate': 6.6837720315897045e-06, 'epoch': 1.22} {'loss': 0.4699, 'learning_rate': 6.683463205982352e-06, 'epoch': 1.22} {'loss': 0.5454, 'learning_rate': 6.683154383928965e-06, 'epoch': 1.22} {'loss': 0.4969, 'learning_rate': 6.682845565429881e-06, 'epoch': 1.22} {'loss': 0.4594, 'learning_rate': 6.682536750485427e-06, 'epoch': 1.22} {'loss': 0.5746, 'learning_rate': 6.682227939095931e-06, 'epoch': 1.22} {'loss': 0.4427, 'learning_rate': 6.681919131261729e-06, 'epoch': 1.22} {'loss': 0.5221, 'learning_rate': 6.68161032698315e-06, 'epoch': 1.22} {'loss': 0.8115, 'learning_rate': 6.6813015262605276e-06, 'epoch': 1.22} {'loss': 0.3609, 'learning_rate': 6.680992729094185e-06, 'epoch': 1.22} {'loss': 0.4767, 'learning_rate': 6.680683935484463e-06, 'epoch': 1.22} {'loss': 0.5325, 'learning_rate': 6.680375145431688e-06, 'epoch': 1.22} {'loss': 0.4322, 'learning_rate': 6.680066358936186e-06, 'epoch': 1.22} {'loss': 0.6189, 'learning_rate': 6.679757575998296e-06, 'epoch': 1.22} {'loss': 0.5586, 'learning_rate': 6.679448796618344e-06, 'epoch': 1.22} {'loss': 0.493, 'learning_rate': 6.679140020796664e-06, 'epoch': 1.22} {'loss': 0.4932, 'learning_rate': 6.678831248533586e-06, 'epoch': 1.22} {'loss': 0.6169, 'learning_rate': 6.678522479829435e-06, 'epoch': 1.22} {'loss': 0.5125, 'learning_rate': 6.678213714684552e-06, 'epoch': 1.22} {'loss': 0.492, 'learning_rate': 6.67790495309926e-06, 'epoch': 1.22} {'loss': 0.4974, 'learning_rate': 6.6775961950738936e-06, 'epoch': 1.22} {'loss': 0.4465, 'learning_rate': 6.677287440608782e-06, 'epoch': 1.22} {'loss': 0.6418, 'learning_rate': 6.676978689704259e-06, 'epoch': 1.22} {'loss': 0.5761, 'learning_rate': 6.676669942360653e-06, 'epoch': 1.22} {'loss': 0.5354, 'learning_rate': 6.676361198578292e-06, 'epoch': 1.22} {'loss': 0.5874, 'learning_rate': 6.676052458357513e-06, 'epoch': 1.22} {'loss': 0.4913, 'learning_rate': 6.675743721698642e-06, 'epoch': 1.22} {'loss': 0.4413, 'learning_rate': 6.675434988602014e-06, 'epoch': 1.22} {'loss': 0.6158, 'learning_rate': 6.675126259067954e-06, 'epoch': 1.22} {'loss': 0.5481, 'learning_rate': 6.674817533096798e-06, 'epoch': 1.22} {'loss': 0.4784, 'learning_rate': 6.6745088106888764e-06, 'epoch': 1.22} {'loss': 0.6305, 'learning_rate': 6.674200091844516e-06, 'epoch': 1.22} {'loss': 0.4719, 'learning_rate': 6.673891376564053e-06, 'epoch': 1.22} {'loss': 0.5477, 'learning_rate': 6.673582664847813e-06, 'epoch': 1.22} {'loss': 0.5622, 'learning_rate': 6.673273956696133e-06, 'epoch': 1.22} {'loss': 0.4897, 'learning_rate': 6.67296525210934e-06, 'epoch': 1.22} {'loss': 0.407, 'learning_rate': 6.6726565510877595e-06, 'epoch': 1.22} {'loss': 0.5966, 'learning_rate': 6.672347853631734e-06, 'epoch': 1.22} {'loss': 0.6275, 'learning_rate': 6.6720391597415825e-06, 'epoch': 1.22} {'loss': 0.5579, 'learning_rate': 6.671730469417645e-06, 'epoch': 1.22} {'loss': 0.3853, 'learning_rate': 6.671421782660248e-06, 'epoch': 1.22} {'loss': 0.6189, 'learning_rate': 6.671113099469725e-06, 'epoch': 1.22} {'loss': 0.4756, 'learning_rate': 6.670804419846404e-06, 'epoch': 1.22} {'loss': 0.5917, 'learning_rate': 6.670495743790612e-06, 'epoch': 1.22} {'loss': 0.6568, 'learning_rate': 6.670187071302691e-06, 'epoch': 1.22} {'loss': 0.472, 'learning_rate': 6.6698784023829585e-06, 'epoch': 1.22} {'loss': 0.6055, 'learning_rate': 6.669569737031757e-06, 'epoch': 1.22} {'loss': 0.6159, 'learning_rate': 6.669261075249412e-06, 'epoch': 1.22} {'loss': 0.4262, 'learning_rate': 6.668952417036252e-06, 'epoch': 1.22} {'loss': 0.6114, 'learning_rate': 6.668643762392613e-06, 'epoch': 1.22} {'loss': 0.741, 'learning_rate': 6.6683351113188174e-06, 'epoch': 1.22} {'loss': 0.6095, 'learning_rate': 6.668026463815206e-06, 'epoch': 1.22} {'loss': 0.58, 'learning_rate': 6.6677178198821e-06, 'epoch': 1.22} {'loss': 0.554, 'learning_rate': 6.667409179519841e-06, 'epoch': 1.22} {'loss': 0.5349, 'learning_rate': 6.667100542728753e-06, 'epoch': 1.22} {'loss': 0.4554, 'learning_rate': 6.666791909509166e-06, 'epoch': 1.22} {'loss': 0.482, 'learning_rate': 6.666483279861414e-06, 'epoch': 1.22} {'loss': 0.5088, 'learning_rate': 6.666174653785822e-06, 'epoch': 1.22} {'loss': 0.5671, 'learning_rate': 6.665866031282729e-06, 'epoch': 1.22} {'loss': 0.5517, 'learning_rate': 6.665557412352457e-06, 'epoch': 1.22} {'loss': 0.5234, 'learning_rate': 6.665248796995345e-06, 'epoch': 1.22} {'loss': 0.524, 'learning_rate': 6.664940185211721e-06, 'epoch': 1.22} {'loss': 0.4825, 'learning_rate': 6.664631577001912e-06, 'epoch': 1.22} {'loss': 0.6461, 'learning_rate': 6.664322972366253e-06, 'epoch': 1.22} {'loss': 0.6146, 'learning_rate': 6.66401437130507e-06, 'epoch': 1.22} {'loss': 0.6186, 'learning_rate': 6.6637057738187e-06, 'epoch': 1.22} {'loss': 0.6163, 'learning_rate': 6.663397179907469e-06, 'epoch': 1.22} {'loss': 0.5458, 'learning_rate': 6.663088589571706e-06, 'epoch': 1.22} {'loss': 0.533, 'learning_rate': 6.662780002811751e-06, 'epoch': 1.22} {'loss': 0.7076, 'learning_rate': 6.662471419627924e-06, 'epoch': 1.22} {'loss': 0.5272, 'learning_rate': 6.662162840020563e-06, 'epoch': 1.22} {'loss': 0.699, 'learning_rate': 6.66185426398999e-06, 'epoch': 1.22} {'loss': 0.62, 'learning_rate': 6.661545691536548e-06, 'epoch': 1.22} {'loss': 0.5198, 'learning_rate': 6.66123712266056e-06, 'epoch': 1.22} {'loss': 0.3923, 'learning_rate': 6.660928557362354e-06, 'epoch': 1.22} {'loss': 0.6439, 'learning_rate': 6.660619995642268e-06, 'epoch': 1.22} {'loss': 0.681, 'learning_rate': 6.660311437500626e-06, 'epoch': 1.22} {'loss': 0.5907, 'learning_rate': 6.660002882937766e-06, 'epoch': 1.22} {'loss': 0.4962, 'learning_rate': 6.65969433195401e-06, 'epoch': 1.22} {'loss': 0.4699, 'learning_rate': 6.659385784549696e-06, 'epoch': 1.22} {'loss': 0.55, 'learning_rate': 6.659077240725152e-06, 'epoch': 1.22} {'loss': 0.4255, 'learning_rate': 6.658768700480703e-06, 'epoch': 1.22} {'loss': 0.414, 'learning_rate': 6.658460163816691e-06, 'epoch': 1.22} {'loss': 0.581, 'learning_rate': 6.658151630733438e-06, 'epoch': 1.22} {'loss': 0.5792, 'learning_rate': 6.6578431012312785e-06, 'epoch': 1.22} {'loss': 0.4093, 'learning_rate': 6.6575345753105426e-06, 'epoch': 1.22} {'loss': 0.5159, 'learning_rate': 6.657226052971555e-06, 'epoch': 1.22} {'loss': 0.6032, 'learning_rate': 6.656917534214655e-06, 'epoch': 1.22} {'loss': 0.5175, 'learning_rate': 6.656609019040168e-06, 'epoch': 1.22} {'loss': 0.4952, 'learning_rate': 6.656300507448428e-06, 'epoch': 1.22} {'loss': 0.7215, 'learning_rate': 6.655991999439762e-06, 'epoch': 1.22} {'loss': 0.5603, 'learning_rate': 6.655683495014506e-06, 'epoch': 1.22} {'loss': 0.5265, 'learning_rate': 6.655374994172985e-06, 'epoch': 1.22} {'loss': 0.5953, 'learning_rate': 6.65506649691553e-06, 'epoch': 1.22} {'loss': 0.4632, 'learning_rate': 6.654758003242474e-06, 'epoch': 1.22} {'loss': 0.5949, 'learning_rate': 6.6544495131541444e-06, 'epoch': 1.22} {'loss': 0.6319, 'learning_rate': 6.654141026650879e-06, 'epoch': 1.22} {'loss': 0.6159, 'learning_rate': 6.653832543733001e-06, 'epoch': 1.22} {'loss': 0.5749, 'learning_rate': 6.653524064400845e-06, 'epoch': 1.22} {'loss': 0.6338, 'learning_rate': 6.65321558865474e-06, 'epoch': 1.22} {'loss': 0.5224, 'learning_rate': 6.6529071164950106e-06, 'epoch': 1.22} {'loss': 0.5995, 'learning_rate': 6.652598647922001e-06, 'epoch': 1.22} {'loss': 0.3765, 'learning_rate': 6.65229018293603e-06, 'epoch': 1.22} {'loss': 0.4146, 'learning_rate': 6.651981721537432e-06, 'epoch': 1.22} {'loss': 0.5046, 'learning_rate': 6.651673263726541e-06, 'epoch': 1.22} {'loss': 0.5204, 'learning_rate': 6.651364809503681e-06, 'epoch': 1.22} {'loss': 0.4994, 'learning_rate': 6.651056358869188e-06, 'epoch': 1.22} {'loss': 0.5789, 'learning_rate': 6.6507479118233876e-06, 'epoch': 1.22} {'loss': 0.5587, 'learning_rate': 6.6504394683666165e-06, 'epoch': 1.22} {'loss': 0.6107, 'learning_rate': 6.650131028499199e-06, 'epoch': 1.22} {'loss': 0.5096, 'learning_rate': 6.649822592221471e-06, 'epoch': 1.22} {'loss': 0.5004, 'learning_rate': 6.6495141595337585e-06, 'epoch': 1.22} {'loss': 0.5453, 'learning_rate': 6.649205730436395e-06, 'epoch': 1.22} {'loss': 0.6244, 'learning_rate': 6.648897304929711e-06, 'epoch': 1.22} {'loss': 0.494, 'learning_rate': 6.648588883014031e-06, 'epoch': 1.22} {'loss': 0.5656, 'learning_rate': 6.6482804646896955e-06, 'epoch': 1.22} {'loss': 0.6907, 'learning_rate': 6.64797204995703e-06, 'epoch': 1.22} {'loss': 0.6158, 'learning_rate': 6.647663638816364e-06, 'epoch': 1.22} {'loss': 0.6308, 'learning_rate': 6.647355231268029e-06, 'epoch': 1.22} {'loss': 0.5492, 'learning_rate': 6.647046827312353e-06, 'epoch': 1.22} {'loss': 0.484, 'learning_rate': 6.646738426949673e-06, 'epoch': 1.22} {'loss': 0.6697, 'learning_rate': 6.646430030180311e-06, 'epoch': 1.22} {'loss': 0.5535, 'learning_rate': 6.6461216370046055e-06, 'epoch': 1.22} {'loss': 0.4788, 'learning_rate': 6.645813247422883e-06, 'epoch': 1.22} {'loss': 0.5392, 'learning_rate': 6.645504861435472e-06, 'epoch': 1.22} {'loss': 0.4671, 'learning_rate': 6.645196479042709e-06, 'epoch': 1.22} {'loss': 0.397, 'learning_rate': 6.644888100244916e-06, 'epoch': 1.22} {'loss': 0.5765, 'learning_rate': 6.644579725042433e-06, 'epoch': 1.22} {'loss': 0.6, 'learning_rate': 6.6442713534355806e-06, 'epoch': 1.22} {'loss': 0.5391, 'learning_rate': 6.643962985424698e-06, 'epoch': 1.22} {'loss': 0.5134, 'learning_rate': 6.643654621010113e-06, 'epoch': 1.22} {'loss': 0.6383, 'learning_rate': 6.643346260192152e-06, 'epoch': 1.22} {'loss': 0.5116, 'learning_rate': 6.6430379029711515e-06, 'epoch': 1.22} {'loss': 0.6064, 'learning_rate': 6.642729549347435e-06, 'epoch': 1.22} {'loss': 0.5552, 'learning_rate': 6.642421199321339e-06, 'epoch': 1.22} {'loss': 0.5415, 'learning_rate': 6.642112852893194e-06, 'epoch': 1.22} {'loss': 0.6311, 'learning_rate': 6.641804510063322e-06, 'epoch': 1.22} {'loss': 0.4753, 'learning_rate': 6.641496170832064e-06, 'epoch': 1.22} {'loss': 0.4478, 'learning_rate': 6.641187835199745e-06, 'epoch': 1.22} {'loss': 0.4293, 'learning_rate': 6.640879503166699e-06, 'epoch': 1.22} {'loss': 0.5057, 'learning_rate': 6.640571174733248e-06, 'epoch': 1.22} {'loss': 0.6292, 'learning_rate': 6.640262849899732e-06, 'epoch': 1.22} {'loss': 0.5739, 'learning_rate': 6.639954528666479e-06, 'epoch': 1.22} {'loss': 0.654, 'learning_rate': 6.639646211033814e-06, 'epoch': 1.22} {'loss': 0.4573, 'learning_rate': 6.639337897002075e-06, 'epoch': 1.22} {'loss': 0.6459, 'learning_rate': 6.639029586571587e-06, 'epoch': 1.22} {'loss': 0.6336, 'learning_rate': 6.638721279742684e-06, 'epoch': 1.22} {'loss': 0.64, 'learning_rate': 6.638412976515689e-06, 'epoch': 1.22} {'loss': 0.5499, 'learning_rate': 6.6381046768909444e-06, 'epoch': 1.22} {'loss': 0.5406, 'learning_rate': 6.637796380868773e-06, 'epoch': 1.22} {'loss': 0.4375, 'learning_rate': 6.637488088449502e-06, 'epoch': 1.22} {'loss': 0.5985, 'learning_rate': 6.6371797996334695e-06, 'epoch': 1.22} {'loss': 0.7094, 'learning_rate': 6.636871514421001e-06, 'epoch': 1.22} {'loss': 0.6582, 'learning_rate': 6.6365632328124305e-06, 'epoch': 1.22} {'loss': 0.6232, 'learning_rate': 6.636254954808086e-06, 'epoch': 1.22} {'loss': 0.4844, 'learning_rate': 6.635946680408294e-06, 'epoch': 1.22} {'loss': 0.6349, 'learning_rate': 6.635638409613392e-06, 'epoch': 1.22} {'loss': 0.4778, 'learning_rate': 6.635330142423704e-06, 'epoch': 1.22} {'loss': 0.6996, 'learning_rate': 6.635021878839567e-06, 'epoch': 1.22} {'loss': 0.4014, 'learning_rate': 6.634713618861306e-06, 'epoch': 1.22} {'loss': 0.5087, 'learning_rate': 6.634405362489253e-06, 'epoch': 1.22} {'loss': 0.7061, 'learning_rate': 6.6340971097237415e-06, 'epoch': 1.22} {'loss': 0.5907, 'learning_rate': 6.6337888605650935e-06, 'epoch': 1.22} {'loss': 0.5463, 'learning_rate': 6.633480615013648e-06, 'epoch': 1.22} {'loss': 0.5639, 'learning_rate': 6.633172373069729e-06, 'epoch': 1.22} {'loss': 0.5538, 'learning_rate': 6.632864134733673e-06, 'epoch': 1.22} {'loss': 0.5728, 'learning_rate': 6.632555900005805e-06, 'epoch': 1.22} {'loss': 0.4677, 'learning_rate': 6.63224766888646e-06, 'epoch': 1.22} {'loss': 0.5881, 'learning_rate': 6.631939441375964e-06, 'epoch': 1.22} {'loss': 0.6282, 'learning_rate': 6.631631217474645e-06, 'epoch': 1.22} {'loss': 0.5284, 'learning_rate': 6.631322997182843e-06, 'epoch': 1.22} {'loss': 0.4101, 'learning_rate': 6.631014780500877e-06, 'epoch': 1.22} {'loss': 0.6802, 'learning_rate': 6.630706567429088e-06, 'epoch': 1.22} {'loss': 0.4376, 'learning_rate': 6.6303983579678e-06, 'epoch': 1.22} {'loss': 0.5488, 'learning_rate': 6.630090152117342e-06, 'epoch': 1.22} {'loss': 0.5786, 'learning_rate': 6.629781949878049e-06, 'epoch': 1.22} {'loss': 0.4431, 'learning_rate': 6.629473751250245e-06, 'epoch': 1.22} {'loss': 0.5954, 'learning_rate': 6.629165556234268e-06, 'epoch': 1.22} {'loss': 0.6046, 'learning_rate': 6.628857364830442e-06, 'epoch': 1.22} {'loss': 0.4954, 'learning_rate': 6.628549177039101e-06, 'epoch': 1.22} {'loss': 0.5323, 'learning_rate': 6.6282409928605736e-06, 'epoch': 1.22} {'loss': 0.5616, 'learning_rate': 6.62793281229519e-06, 'epoch': 1.22} {'loss': 0.5424, 'learning_rate': 6.627624635343282e-06, 'epoch': 1.22} {'loss': 0.5444, 'learning_rate': 6.627316462005174e-06, 'epoch': 1.22} {'loss': 0.4031, 'learning_rate': 6.627008292281206e-06, 'epoch': 1.22} {'loss': 0.5237, 'learning_rate': 6.6267001261717015e-06, 'epoch': 1.22} {'loss': 0.437, 'learning_rate': 6.626391963676992e-06, 'epoch': 1.22} {'loss': 0.5411, 'learning_rate': 6.626083804797407e-06, 'epoch': 1.22} {'loss': 0.5704, 'learning_rate': 6.6257756495332795e-06, 'epoch': 1.22} {'loss': 0.7041, 'learning_rate': 6.625467497884939e-06, 'epoch': 1.22} {'loss': 0.6426, 'learning_rate': 6.625159349852709e-06, 'epoch': 1.22} {'loss': 0.5592, 'learning_rate': 6.624851205436931e-06, 'epoch': 1.22} {'loss': 0.5566, 'learning_rate': 6.6245430646379295e-06, 'epoch': 1.22} {'loss': 0.5555, 'learning_rate': 6.624234927456032e-06, 'epoch': 1.22} {'loss': 0.6351, 'learning_rate': 6.623926793891573e-06, 'epoch': 1.22} {'loss': 0.5815, 'learning_rate': 6.623618663944877e-06, 'epoch': 1.22} {'loss': 0.4826, 'learning_rate': 6.623310537616284e-06, 'epoch': 1.22} {'loss': 0.6041, 'learning_rate': 6.623002414906115e-06, 'epoch': 1.22} {'loss': 0.4658, 'learning_rate': 6.622694295814705e-06, 'epoch': 1.22} {'loss': 0.7365, 'learning_rate': 6.622386180342385e-06, 'epoch': 1.22} {'loss': 0.4923, 'learning_rate': 6.622078068489481e-06, 'epoch': 1.22} {'loss': 0.5942, 'learning_rate': 6.621769960256326e-06, 'epoch': 1.22} {'loss': 0.6747, 'learning_rate': 6.621461855643246e-06, 'epoch': 1.22} {'loss': 0.5037, 'learning_rate': 6.621153754650579e-06, 'epoch': 1.22} {'loss': 0.5883, 'learning_rate': 6.62084565727865e-06, 'epoch': 1.22} {'loss': 0.5438, 'learning_rate': 6.620537563527787e-06, 'epoch': 1.22} {'loss': 0.5448, 'learning_rate': 6.620229473398325e-06, 'epoch': 1.22} {'loss': 0.6464, 'learning_rate': 6.619921386890592e-06, 'epoch': 1.22} {'loss': 0.3666, 'learning_rate': 6.61961330400492e-06, 'epoch': 1.22} {'loss': 0.5572, 'learning_rate': 6.619305224741632e-06, 'epoch': 1.22} {'loss': 0.5239, 'learning_rate': 6.61899714910107e-06, 'epoch': 1.22} {'loss': 0.5796, 'learning_rate': 6.6186890770835555e-06, 'epoch': 1.22} {'loss': 0.4431, 'learning_rate': 6.6183810086894185e-06, 'epoch': 1.22} {'loss': 0.5013, 'learning_rate': 6.618072943918994e-06, 'epoch': 1.22} {'loss': 0.4787, 'learning_rate': 6.617764882772608e-06, 'epoch': 1.22} {'loss': 0.3428, 'learning_rate': 6.617456825250594e-06, 'epoch': 1.22} {'loss': 0.5891, 'learning_rate': 6.617148771353278e-06, 'epoch': 1.22} {'loss': 0.6446, 'learning_rate': 6.616840721080995e-06, 'epoch': 1.22} {'loss': 0.4296, 'learning_rate': 6.616532674434073e-06, 'epoch': 1.22} {'loss': 0.5963, 'learning_rate': 6.6162246314128375e-06, 'epoch': 1.22} {'loss': 0.5741, 'learning_rate': 6.6159165920176264e-06, 'epoch': 1.22} {'loss': 0.6088, 'learning_rate': 6.615608556248763e-06, 'epoch': 1.22} {'loss': 0.5849, 'learning_rate': 6.6153005241065845e-06, 'epoch': 1.22} {'loss': 0.5096, 'learning_rate': 6.614992495591417e-06, 'epoch': 1.22} {'loss': 0.4098, 'learning_rate': 6.614684470703585e-06, 'epoch': 1.22} {'loss': 0.4625, 'learning_rate': 6.6143764494434295e-06, 'epoch': 1.22} {'loss': 0.5225, 'learning_rate': 6.614068431811271e-06, 'epoch': 1.22} {'loss': 0.4301, 'learning_rate': 6.613760417807447e-06, 'epoch': 1.22} {'loss': 0.5291, 'learning_rate': 6.6134524074322825e-06, 'epoch': 1.22} {'loss': 0.5473, 'learning_rate': 6.6131444006861115e-06, 'epoch': 1.22} {'loss': 0.5207, 'learning_rate': 6.612836397569262e-06, 'epoch': 1.22} {'loss': 0.599, 'learning_rate': 6.61252839808206e-06, 'epoch': 1.22} {'loss': 0.4132, 'learning_rate': 6.612220402224844e-06, 'epoch': 1.22} {'loss': 0.4012, 'learning_rate': 6.611912409997935e-06, 'epoch': 1.22} {'loss': 0.516, 'learning_rate': 6.611604421401672e-06, 'epoch': 1.22} {'loss': 0.492, 'learning_rate': 6.6112964364363786e-06, 'epoch': 1.22} {'loss': 0.6269, 'learning_rate': 6.610988455102389e-06, 'epoch': 1.22} {'loss': 0.6198, 'learning_rate': 6.610680477400031e-06, 'epoch': 1.22} {'loss': 0.53, 'learning_rate': 6.610372503329631e-06, 'epoch': 1.22} {'loss': 0.4032, 'learning_rate': 6.610064532891527e-06, 'epoch': 1.22} {'loss': 0.5061, 'learning_rate': 6.60975656608604e-06, 'epoch': 1.22} {'loss': 0.6367, 'learning_rate': 6.609448602913509e-06, 'epoch': 1.22} {'loss': 0.4977, 'learning_rate': 6.60914064337426e-06, 'epoch': 1.22} {'loss': 0.7005, 'learning_rate': 6.608832687468621e-06, 'epoch': 1.22} {'loss': 0.7321, 'learning_rate': 6.608524735196926e-06, 'epoch': 1.22} {'loss': 0.5156, 'learning_rate': 6.6082167865594985e-06, 'epoch': 1.22} {'loss': 0.5575, 'learning_rate': 6.607908841556676e-06, 'epoch': 1.22} {'loss': 0.6878, 'learning_rate': 6.607600900188783e-06, 'epoch': 1.22} {'loss': 0.6074, 'learning_rate': 6.607292962456155e-06, 'epoch': 1.22} {'loss': 0.5106, 'learning_rate': 6.606985028359119e-06, 'epoch': 1.22} {'loss': 0.5376, 'learning_rate': 6.606677097898002e-06, 'epoch': 1.22} {'loss': 0.5321, 'learning_rate': 6.6063691710731405e-06, 'epoch': 1.22} {'loss': 0.6017, 'learning_rate': 6.606061247884856e-06, 'epoch': 1.22} {'loss': 0.4143, 'learning_rate': 6.605753328333487e-06, 'epoch': 1.22} {'loss': 0.5662, 'learning_rate': 6.605445412419357e-06, 'epoch': 1.22} {'loss': 0.4583, 'learning_rate': 6.605137500142799e-06, 'epoch': 1.22} {'loss': 0.5683, 'learning_rate': 6.604829591504145e-06, 'epoch': 1.22} {'loss': 0.4676, 'learning_rate': 6.60452168650372e-06, 'epoch': 1.22} {'loss': 0.5731, 'learning_rate': 6.60421378514186e-06, 'epoch': 1.22} {'loss': 0.6843, 'learning_rate': 6.603905887418884e-06, 'epoch': 1.22} {'loss': 0.4958, 'learning_rate': 6.603597993335137e-06, 'epoch': 1.22} {'loss': 0.5499, 'learning_rate': 6.6032901028909404e-06, 'epoch': 1.22} {'loss': 0.5596, 'learning_rate': 6.602982216086622e-06, 'epoch': 1.22} {'loss': 0.5502, 'learning_rate': 6.602674332922514e-06, 'epoch': 1.22} {'loss': 0.4693, 'learning_rate': 6.60236645339895e-06, 'epoch': 1.22} {'loss': 0.5265, 'learning_rate': 6.602058577516256e-06, 'epoch': 1.22} {'loss': 0.4797, 'learning_rate': 6.601750705274761e-06, 'epoch': 1.22} {'loss': 0.4811, 'learning_rate': 6.6014428366748e-06, 'epoch': 1.22} {'loss': 0.4888, 'learning_rate': 6.601134971716698e-06, 'epoch': 1.22} {'loss': 0.6377, 'learning_rate': 6.600827110400787e-06, 'epoch': 1.22} {'loss': 0.5336, 'learning_rate': 6.6005192527273986e-06, 'epoch': 1.22} {'loss': 0.545, 'learning_rate': 6.6002113986968565e-06, 'epoch': 1.22} {'loss': 0.5835, 'learning_rate': 6.599903548309497e-06, 'epoch': 1.22} {'loss': 0.3522, 'learning_rate': 6.599595701565645e-06, 'epoch': 1.22} {'loss': 0.4901, 'learning_rate': 6.599287858465637e-06, 'epoch': 1.22} {'loss': 0.4996, 'learning_rate': 6.5989800190098e-06, 'epoch': 1.22} {'loss': 0.5567, 'learning_rate': 6.59867218319846e-06, 'epoch': 1.22} {'loss': 0.5887, 'learning_rate': 6.598364351031952e-06, 'epoch': 1.22} {'loss': 0.59, 'learning_rate': 6.598056522510598e-06, 'epoch': 1.22} {'loss': 0.5231, 'learning_rate': 6.59774869763474e-06, 'epoch': 1.22} {'loss': 0.4957, 'learning_rate': 6.597440876404699e-06, 'epoch': 1.22} {'loss': 0.4963, 'learning_rate': 6.597133058820805e-06, 'epoch': 1.22} {'loss': 0.61, 'learning_rate': 6.596825244883393e-06, 'epoch': 1.22} {'loss': 0.7122, 'learning_rate': 6.596517434592788e-06, 'epoch': 1.22} {'loss': 0.442, 'learning_rate': 6.596209627949324e-06, 'epoch': 1.22} {'loss': 0.6406, 'learning_rate': 6.595901824953326e-06, 'epoch': 1.22} {'loss': 0.587, 'learning_rate': 6.595594025605128e-06, 'epoch': 1.22} {'loss': 0.5639, 'learning_rate': 6.59528622990506e-06, 'epoch': 1.22} {'loss': 0.4512, 'learning_rate': 6.594978437853445e-06, 'epoch': 1.22} {'loss': 0.5605, 'learning_rate': 6.594670649450623e-06, 'epoch': 1.22} {'loss': 0.6136, 'learning_rate': 6.594362864696915e-06, 'epoch': 1.22} {'loss': 0.5469, 'learning_rate': 6.594055083592659e-06, 'epoch': 1.22} {'loss': 0.6323, 'learning_rate': 6.5937473061381785e-06, 'epoch': 1.22} {'loss': 0.7594, 'learning_rate': 6.5934395323338005e-06, 'epoch': 1.22} {'loss': 0.5314, 'learning_rate': 6.593131762179865e-06, 'epoch': 1.22} {'loss': 0.4642, 'learning_rate': 6.592823995676693e-06, 'epoch': 1.22} {'loss': 0.5998, 'learning_rate': 6.592516232824619e-06, 'epoch': 1.22} {'loss': 0.5912, 'learning_rate': 6.592208473623972e-06, 'epoch': 1.22} {'loss': 0.3804, 'learning_rate': 6.5919007180750825e-06, 'epoch': 1.22} {'loss': 0.5988, 'learning_rate': 6.59159296617828e-06, 'epoch': 1.22} {'loss': 0.6918, 'learning_rate': 6.591285217933887e-06, 'epoch': 1.22} {'loss': 0.5859, 'learning_rate': 6.590977473342244e-06, 'epoch': 1.22} {'loss': 0.6386, 'learning_rate': 6.590669732403673e-06, 'epoch': 1.22} {'loss': 0.4169, 'learning_rate': 6.590361995118511e-06, 'epoch': 1.22} {'loss': 0.6359, 'learning_rate': 6.590054261487082e-06, 'epoch': 1.22} {'loss': 0.5777, 'learning_rate': 6.58974653150972e-06, 'epoch': 1.22} {'loss': 0.3699, 'learning_rate': 6.589438805186752e-06, 'epoch': 1.22} {'loss': 0.6117, 'learning_rate': 6.589131082518503e-06, 'epoch': 1.22} {'loss': 0.4779, 'learning_rate': 6.588823363505312e-06, 'epoch': 1.22} {'loss': 0.5503, 'learning_rate': 6.588515648147502e-06, 'epoch': 1.22} {'loss': 0.5448, 'learning_rate': 6.58820793644541e-06, 'epoch': 1.22} {'loss': 0.559, 'learning_rate': 6.5879002283993596e-06, 'epoch': 1.22} {'loss': 0.6281, 'learning_rate': 6.5875925240096806e-06, 'epoch': 1.22} {'loss': 0.6435, 'learning_rate': 6.5872848232767055e-06, 'epoch': 1.22} {'loss': 0.7004, 'learning_rate': 6.5869771262007595e-06, 'epoch': 1.22} {'loss': 0.5126, 'learning_rate': 6.58666943278218e-06, 'epoch': 1.22} {'loss': 0.4225, 'learning_rate': 6.586361743021287e-06, 'epoch': 1.22} {'loss': 0.6269, 'learning_rate': 6.586054056918421e-06, 'epoch': 1.22} {'loss': 0.412, 'learning_rate': 6.585746374473905e-06, 'epoch': 1.22} {'loss': 0.5394, 'learning_rate': 6.585438695688068e-06, 'epoch': 1.22} {'loss': 0.6182, 'learning_rate': 6.585131020561244e-06, 'epoch': 1.22} {'loss': 0.5825, 'learning_rate': 6.584823349093756e-06, 'epoch': 1.22} {'loss': 0.646, 'learning_rate': 6.584515681285942e-06, 'epoch': 1.22} {'loss': 0.6051, 'learning_rate': 6.584208017138124e-06, 'epoch': 1.22} {'loss': 0.5347, 'learning_rate': 6.583900356650639e-06, 'epoch': 1.22} {'loss': 0.4816, 'learning_rate': 6.583592699823813e-06, 'epoch': 1.22} {'loss': 0.42, 'learning_rate': 6.583285046657975e-06, 'epoch': 1.22} {'loss': 0.4936, 'learning_rate': 6.582977397153456e-06, 'epoch': 1.22} {'loss': 0.484, 'learning_rate': 6.582669751310582e-06, 'epoch': 1.22} {'loss': 0.4696, 'learning_rate': 6.58236210912969e-06, 'epoch': 1.22} {'loss': 0.4803, 'learning_rate': 6.582054470611106e-06, 'epoch': 1.22} {'loss': 0.5519, 'learning_rate': 6.581746835755154e-06, 'epoch': 1.22} {'loss': 0.5671, 'learning_rate': 6.581439204562172e-06, 'epoch': 1.22} {'loss': 0.6106, 'learning_rate': 6.5811315770324855e-06, 'epoch': 1.22} {'loss': 0.3924, 'learning_rate': 6.5808239531664264e-06, 'epoch': 1.22} {'loss': 0.4835, 'learning_rate': 6.580516332964319e-06, 'epoch': 1.22} {'loss': 0.6106, 'learning_rate': 6.580208716426503e-06, 'epoch': 1.22} {'loss': 0.6023, 'learning_rate': 6.579901103553301e-06, 'epoch': 1.22} {'loss': 0.464, 'learning_rate': 6.5795934943450405e-06, 'epoch': 1.22} {'loss': 0.5406, 'learning_rate': 6.579285888802055e-06, 'epoch': 1.22} {'loss': 0.4889, 'learning_rate': 6.578978286924673e-06, 'epoch': 1.22} {'loss': 0.5134, 'learning_rate': 6.578670688713227e-06, 'epoch': 1.22} {'loss': 0.5293, 'learning_rate': 6.578363094168041e-06, 'epoch': 1.22} {'loss': 0.4177, 'learning_rate': 6.578055503289451e-06, 'epoch': 1.22} {'loss': 0.4661, 'learning_rate': 6.577747916077783e-06, 'epoch': 1.22} {'loss': 0.641, 'learning_rate': 6.577440332533365e-06, 'epoch': 1.22} {'loss': 0.5834, 'learning_rate': 6.577132752656529e-06, 'epoch': 1.22} {'loss': 0.5096, 'learning_rate': 6.576825176447603e-06, 'epoch': 1.22} {'loss': 0.4042, 'learning_rate': 6.5765176039069225e-06, 'epoch': 1.22} {'loss': 0.5584, 'learning_rate': 6.57621003503481e-06, 'epoch': 1.22} {'loss': 0.3833, 'learning_rate': 6.5759024698315945e-06, 'epoch': 1.22} {'loss': 0.59, 'learning_rate': 6.575594908297611e-06, 'epoch': 1.22} {'loss': 0.5543, 'learning_rate': 6.575287350433186e-06, 'epoch': 1.22} {'loss': 0.6055, 'learning_rate': 6.574979796238652e-06, 'epoch': 1.22} {'loss': 0.6276, 'learning_rate': 6.574672245714332e-06, 'epoch': 1.22} {'loss': 0.5953, 'learning_rate': 6.574364698860563e-06, 'epoch': 1.23} {'loss': 0.5647, 'learning_rate': 6.574057155677673e-06, 'epoch': 1.23} {'loss': 0.4909, 'learning_rate': 6.573749616165985e-06, 'epoch': 1.23} {'loss': 0.4931, 'learning_rate': 6.573442080325837e-06, 'epoch': 1.23} {'loss': 0.6062, 'learning_rate': 6.573134548157553e-06, 'epoch': 1.23} {'loss': 0.5606, 'learning_rate': 6.572827019661467e-06, 'epoch': 1.23} {'loss': 0.4567, 'learning_rate': 6.572519494837904e-06, 'epoch': 1.23} {'loss': 0.5634, 'learning_rate': 6.572211973687197e-06, 'epoch': 1.23} {'loss': 0.4571, 'learning_rate': 6.571904456209677e-06, 'epoch': 1.23} {'loss': 0.4439, 'learning_rate': 6.5715969424056644e-06, 'epoch': 1.23} {'loss': 0.6085, 'learning_rate': 6.571289432275499e-06, 'epoch': 1.23} {'loss': 0.5257, 'learning_rate': 6.570981925819506e-06, 'epoch': 1.23} {'loss': 0.5669, 'learning_rate': 6.570674423038017e-06, 'epoch': 1.23} {'loss': 0.4661, 'learning_rate': 6.5703669239313595e-06, 'epoch': 1.23} {'loss': 0.616, 'learning_rate': 6.5700594284998585e-06, 'epoch': 1.23} {'loss': 0.4346, 'learning_rate': 6.569751936743854e-06, 'epoch': 1.23} {'loss': 0.4716, 'learning_rate': 6.569444448663664e-06, 'epoch': 1.23} {'loss': 0.6218, 'learning_rate': 6.56913696425963e-06, 'epoch': 1.23} {'loss': 0.4191, 'learning_rate': 6.568829483532073e-06, 'epoch': 1.23} {'loss': 0.5107, 'learning_rate': 6.568522006481326e-06, 'epoch': 1.23} {'loss': 0.7158, 'learning_rate': 6.568214533107717e-06, 'epoch': 1.23} {'loss': 0.512, 'learning_rate': 6.5679070634115735e-06, 'epoch': 1.23} {'loss': 0.6719, 'learning_rate': 6.5675995973932305e-06, 'epoch': 1.23} {'loss': 0.5085, 'learning_rate': 6.56729213505301e-06, 'epoch': 1.23} {'loss': 0.722, 'learning_rate': 6.56698467639125e-06, 'epoch': 1.23} {'loss': 0.5684, 'learning_rate': 6.566677221408276e-06, 'epoch': 1.23} {'loss': 0.5061, 'learning_rate': 6.566369770104415e-06, 'epoch': 1.23} {'loss': 0.5439, 'learning_rate': 6.566062322480001e-06, 'epoch': 1.23} {'loss': 0.6248, 'learning_rate': 6.565754878535358e-06, 'epoch': 1.23} {'loss': 0.5726, 'learning_rate': 6.56544743827082e-06, 'epoch': 1.23} {'loss': 0.578, 'learning_rate': 6.565140001686713e-06, 'epoch': 1.23} {'loss': 0.573, 'learning_rate': 6.564832568783372e-06, 'epoch': 1.23} {'loss': 0.6828, 'learning_rate': 6.564525139561123e-06, 'epoch': 1.23} {'loss': 0.5552, 'learning_rate': 6.5642177140202935e-06, 'epoch': 1.23} {'loss': 0.4881, 'learning_rate': 6.563910292161217e-06, 'epoch': 1.23} {'loss': 0.5813, 'learning_rate': 6.563602873984216e-06, 'epoch': 1.23} {'loss': 0.6216, 'learning_rate': 6.563295459489629e-06, 'epoch': 1.23} {'loss': 0.5849, 'learning_rate': 6.562988048677778e-06, 'epoch': 1.23} {'loss': 0.3422, 'learning_rate': 6.562680641549e-06, 'epoch': 1.23} {'loss': 0.6335, 'learning_rate': 6.562373238103617e-06, 'epoch': 1.23} {'loss': 0.3584, 'learning_rate': 6.562065838341962e-06, 'epoch': 1.23} {'loss': 0.5159, 'learning_rate': 6.561758442264364e-06, 'epoch': 1.23} {'loss': 0.4895, 'learning_rate': 6.561451049871149e-06, 'epoch': 1.23} {'loss': 0.4755, 'learning_rate': 6.5611436611626545e-06, 'epoch': 1.23} {'loss': 0.5291, 'learning_rate': 6.560836276139204e-06, 'epoch': 1.23} {'loss': 0.5261, 'learning_rate': 6.560528894801124e-06, 'epoch': 1.23} {'loss': 0.4647, 'learning_rate': 6.56022151714875e-06, 'epoch': 1.23} {'loss': 0.5206, 'learning_rate': 6.559914143182408e-06, 'epoch': 1.23} {'loss': 0.5293, 'learning_rate': 6.5596067729024326e-06, 'epoch': 1.23} {'loss': 0.5644, 'learning_rate': 6.559299406309143e-06, 'epoch': 1.23} {'loss': 0.6349, 'learning_rate': 6.55899204340288e-06, 'epoch': 1.23} {'loss': 0.4176, 'learning_rate': 6.5586846841839666e-06, 'epoch': 1.23} {'loss': 0.5983, 'learning_rate': 6.55837732865273e-06, 'epoch': 1.23} {'loss': 0.4937, 'learning_rate': 6.558069976809505e-06, 'epoch': 1.23} {'loss': 0.5621, 'learning_rate': 6.557762628654618e-06, 'epoch': 1.23} {'loss': 0.6486, 'learning_rate': 6.557455284188401e-06, 'epoch': 1.23} {'loss': 0.5155, 'learning_rate': 6.557147943411177e-06, 'epoch': 1.23} {'loss': 0.4861, 'learning_rate': 6.5568406063232834e-06, 'epoch': 1.23} {'loss': 0.6961, 'learning_rate': 6.5565332729250475e-06, 'epoch': 1.23} {'loss': 0.447, 'learning_rate': 6.556225943216791e-06, 'epoch': 1.23} {'loss': 0.5416, 'learning_rate': 6.555918617198854e-06, 'epoch': 1.23} {'loss': 0.4637, 'learning_rate': 6.555611294871559e-06, 'epoch': 1.23} {'loss': 0.5857, 'learning_rate': 6.555303976235239e-06, 'epoch': 1.23} {'loss': 0.5052, 'learning_rate': 6.554996661290223e-06, 'epoch': 1.23} {'loss': 0.4654, 'learning_rate': 6.554689350036834e-06, 'epoch': 1.23} {'loss': 0.4525, 'learning_rate': 6.55438204247541e-06, 'epoch': 1.23} {'loss': 0.3528, 'learning_rate': 6.554074738606275e-06, 'epoch': 1.23} {'loss': 0.5303, 'learning_rate': 6.553767438429761e-06, 'epoch': 1.23} {'loss': 0.4616, 'learning_rate': 6.553460141946195e-06, 'epoch': 1.23} {'loss': 0.5044, 'learning_rate': 6.55315284915591e-06, 'epoch': 1.23} {'loss': 0.5167, 'learning_rate': 6.5528455600592324e-06, 'epoch': 1.23} {'loss': 0.3976, 'learning_rate': 6.552538274656488e-06, 'epoch': 1.23} {'loss': 0.6101, 'learning_rate': 6.552230992948014e-06, 'epoch': 1.23} {'loss': 0.6219, 'learning_rate': 6.551923714934134e-06, 'epoch': 1.23} {'loss': 0.4438, 'learning_rate': 6.55161644061518e-06, 'epoch': 1.23} {'loss': 0.496, 'learning_rate': 6.5513091699914775e-06, 'epoch': 1.23} {'loss': 0.476, 'learning_rate': 6.551001903063361e-06, 'epoch': 1.23} {'loss': 0.6779, 'learning_rate': 6.550694639831159e-06, 'epoch': 1.23} {'loss': 0.6428, 'learning_rate': 6.550387380295193e-06, 'epoch': 1.23} {'loss': 0.5752, 'learning_rate': 6.550080124455804e-06, 'epoch': 1.23} {'loss': 0.5384, 'learning_rate': 6.5497728723133135e-06, 'epoch': 1.23} {'loss': 0.5222, 'learning_rate': 6.549465623868055e-06, 'epoch': 1.23} {'loss': 0.4979, 'learning_rate': 6.549158379120354e-06, 'epoch': 1.23} {'loss': 0.5264, 'learning_rate': 6.548851138070538e-06, 'epoch': 1.23} {'loss': 0.7353, 'learning_rate': 6.5485439007189434e-06, 'epoch': 1.23} {'loss': 0.4569, 'learning_rate': 6.548236667065891e-06, 'epoch': 1.23} {'loss': 0.5677, 'learning_rate': 6.54792943711172e-06, 'epoch': 1.23} {'loss': 0.5946, 'learning_rate': 6.5476222108567515e-06, 'epoch': 1.23} {'loss': 0.5899, 'learning_rate': 6.547314988301319e-06, 'epoch': 1.23} {'loss': 0.6245, 'learning_rate': 6.54700776944575e-06, 'epoch': 1.23} {'loss': 0.6435, 'learning_rate': 6.54670055429037e-06, 'epoch': 1.23} {'loss': 0.5919, 'learning_rate': 6.546393342835518e-06, 'epoch': 1.23} {'loss': 0.5364, 'learning_rate': 6.546086135081511e-06, 'epoch': 1.23} {'loss': 0.8309, 'learning_rate': 6.545778931028688e-06, 'epoch': 1.23} {'loss': 0.5374, 'learning_rate': 6.545471730677373e-06, 'epoch': 1.23} {'loss': 0.4939, 'learning_rate': 6.5451645340279e-06, 'epoch': 1.23} {'loss': 0.5332, 'learning_rate': 6.544857341080595e-06, 'epoch': 1.23} {'loss': 0.429, 'learning_rate': 6.544550151835783e-06, 'epoch': 1.23} {'loss': 0.4126, 'learning_rate': 6.5442429662938e-06, 'epoch': 1.23} {'loss': 0.5636, 'learning_rate': 6.543935784454969e-06, 'epoch': 1.23} {'loss': 0.4151, 'learning_rate': 6.543628606319627e-06, 'epoch': 1.23} {'loss': 0.5467, 'learning_rate': 6.543321431888101e-06, 'epoch': 1.23} {'loss': 0.6588, 'learning_rate': 6.543014261160714e-06, 'epoch': 1.23} {'loss': 0.4237, 'learning_rate': 6.542707094137801e-06, 'epoch': 1.23} {'loss': 0.6012, 'learning_rate': 6.542399930819685e-06, 'epoch': 1.23} {'loss': 0.3653, 'learning_rate': 6.542092771206705e-06, 'epoch': 1.23} {'loss': 0.5185, 'learning_rate': 6.541785615299181e-06, 'epoch': 1.23} {'loss': 0.52, 'learning_rate': 6.541478463097448e-06, 'epoch': 1.23} {'loss': 0.5481, 'learning_rate': 6.541171314601835e-06, 'epoch': 1.23} {'loss': 0.4466, 'learning_rate': 6.5408641698126666e-06, 'epoch': 1.23} {'loss': 0.4376, 'learning_rate': 6.540557028730275e-06, 'epoch': 1.23} {'loss': 0.5668, 'learning_rate': 6.540249891354986e-06, 'epoch': 1.23} {'loss': 0.5563, 'learning_rate': 6.539942757687134e-06, 'epoch': 1.23} {'loss': 0.4124, 'learning_rate': 6.539635627727048e-06, 'epoch': 1.23} {'loss': 0.5248, 'learning_rate': 6.5393285014750484e-06, 'epoch': 1.23} {'loss': 0.7452, 'learning_rate': 6.539021378931476e-06, 'epoch': 1.23} {'loss': 0.5066, 'learning_rate': 6.538714260096653e-06, 'epoch': 1.23} {'loss': 0.5311, 'learning_rate': 6.538407144970911e-06, 'epoch': 1.23} {'loss': 0.5559, 'learning_rate': 6.538100033554575e-06, 'epoch': 1.23} {'loss': 0.5191, 'learning_rate': 6.537792925847981e-06, 'epoch': 1.23} {'loss': 0.5114, 'learning_rate': 6.537485821851455e-06, 'epoch': 1.23} {'loss': 0.5287, 'learning_rate': 6.53717872156532e-06, 'epoch': 1.23} {'loss': 0.7075, 'learning_rate': 6.536871624989915e-06, 'epoch': 1.23} {'loss': 0.6611, 'learning_rate': 6.536564532125562e-06, 'epoch': 1.23} {'loss': 0.4024, 'learning_rate': 6.536257442972595e-06, 'epoch': 1.23} {'loss': 0.6499, 'learning_rate': 6.535950357531339e-06, 'epoch': 1.23} {'loss': 0.5124, 'learning_rate': 6.535643275802126e-06, 'epoch': 1.23} {'loss': 0.5476, 'learning_rate': 6.535336197785286e-06, 'epoch': 1.23} {'loss': 0.4755, 'learning_rate': 6.53502912348114e-06, 'epoch': 1.23} {'loss': 0.5596, 'learning_rate': 6.5347220528900294e-06, 'epoch': 1.23} {'loss': 0.6494, 'learning_rate': 6.534414986012273e-06, 'epoch': 1.23} {'loss': 0.6011, 'learning_rate': 6.5341079228482065e-06, 'epoch': 1.23} {'loss': 0.6023, 'learning_rate': 6.533800863398157e-06, 'epoch': 1.23} {'loss': 0.5355, 'learning_rate': 6.533493807662447e-06, 'epoch': 1.23} {'loss': 0.4951, 'learning_rate': 6.5331867556414164e-06, 'epoch': 1.23} {'loss': 0.4429, 'learning_rate': 6.532879707335384e-06, 'epoch': 1.23} {'loss': 0.6436, 'learning_rate': 6.5325726627446886e-06, 'epoch': 1.23} {'loss': 0.5997, 'learning_rate': 6.532265621869652e-06, 'epoch': 1.23} {'loss': 0.5324, 'learning_rate': 6.531958584710609e-06, 'epoch': 1.23} {'loss': 0.4334, 'learning_rate': 6.531651551267883e-06, 'epoch': 1.23} {'loss': 0.5497, 'learning_rate': 6.531344521541805e-06, 'epoch': 1.23} {'loss': 0.517, 'learning_rate': 6.531037495532706e-06, 'epoch': 1.23} {'loss': 0.6305, 'learning_rate': 6.530730473240911e-06, 'epoch': 1.23} {'loss': 0.5635, 'learning_rate': 6.530423454666752e-06, 'epoch': 1.23} {'loss': 0.6269, 'learning_rate': 6.530116439810558e-06, 'epoch': 1.23} {'loss': 0.4561, 'learning_rate': 6.52980942867266e-06, 'epoch': 1.23} {'loss': 0.455, 'learning_rate': 6.529502421253384e-06, 'epoch': 1.23} {'loss': 0.5366, 'learning_rate': 6.529195417553054e-06, 'epoch': 1.23} {'loss': 0.3978, 'learning_rate': 6.52888841757201e-06, 'epoch': 1.23} {'loss': 0.6254, 'learning_rate': 6.528581421310571e-06, 'epoch': 1.23} {'loss': 0.4102, 'learning_rate': 6.528274428769074e-06, 'epoch': 1.23} {'loss': 0.7083, 'learning_rate': 6.527967439947844e-06, 'epoch': 1.23} {'loss': 0.4294, 'learning_rate': 6.5276604548472075e-06, 'epoch': 1.23} {'loss': 0.5689, 'learning_rate': 6.527353473467499e-06, 'epoch': 1.23} {'loss': 0.5335, 'learning_rate': 6.527046495809042e-06, 'epoch': 1.23} {'loss': 0.5523, 'learning_rate': 6.5267395218721706e-06, 'epoch': 1.23} {'loss': 0.6468, 'learning_rate': 6.526432551657209e-06, 'epoch': 1.23} {'loss': 0.6434, 'learning_rate': 6.526125585164491e-06, 'epoch': 1.23} {'loss': 0.4971, 'learning_rate': 6.525818622394344e-06, 'epoch': 1.23} {'loss': 0.6492, 'learning_rate': 6.5255116633470905e-06, 'epoch': 1.23} {'loss': 0.5261, 'learning_rate': 6.525204708023069e-06, 'epoch': 1.23} {'loss': 0.5075, 'learning_rate': 6.5248977564226016e-06, 'epoch': 1.23} {'loss': 0.5462, 'learning_rate': 6.524590808546023e-06, 'epoch': 1.23} {'loss': 0.5753, 'learning_rate': 6.524283864393657e-06, 'epoch': 1.23} {'loss': 0.5626, 'learning_rate': 6.523976923965836e-06, 'epoch': 1.23} {'loss': 0.5595, 'learning_rate': 6.523669987262888e-06, 'epoch': 1.23} {'loss': 0.6144, 'learning_rate': 6.523363054285138e-06, 'epoch': 1.23} {'loss': 0.5188, 'learning_rate': 6.523056125032922e-06, 'epoch': 1.23} {'loss': 0.5862, 'learning_rate': 6.522749199506559e-06, 'epoch': 1.23} {'loss': 0.5259, 'learning_rate': 6.522442277706391e-06, 'epoch': 1.23} {'loss': 0.4085, 'learning_rate': 6.522135359632739e-06, 'epoch': 1.23} {'loss': 0.4685, 'learning_rate': 6.52182844528593e-06, 'epoch': 1.23} {'loss': 0.5628, 'learning_rate': 6.5215215346662995e-06, 'epoch': 1.23} {'loss': 0.518, 'learning_rate': 6.521214627774167e-06, 'epoch': 1.23} {'loss': 0.4796, 'learning_rate': 6.5209077246098715e-06, 'epoch': 1.23} {'loss': 0.5083, 'learning_rate': 6.520600825173733e-06, 'epoch': 1.23} {'loss': 0.6247, 'learning_rate': 6.5202939294660904e-06, 'epoch': 1.23} {'loss': 0.5115, 'learning_rate': 6.519987037487266e-06, 'epoch': 1.23} {'loss': 0.5963, 'learning_rate': 6.519680149237586e-06, 'epoch': 1.23} {'loss': 0.466, 'learning_rate': 6.519373264717387e-06, 'epoch': 1.23} {'loss': 0.5392, 'learning_rate': 6.519066383926988e-06, 'epoch': 1.23} {'loss': 0.5932, 'learning_rate': 6.518759506866729e-06, 'epoch': 1.23} {'loss': 0.5567, 'learning_rate': 6.518452633536929e-06, 'epoch': 1.23} {'loss': 0.5993, 'learning_rate': 6.518145763937924e-06, 'epoch': 1.23} {'loss': 0.6005, 'learning_rate': 6.517838898070041e-06, 'epoch': 1.23} {'loss': 0.5269, 'learning_rate': 6.517532035933607e-06, 'epoch': 1.23} {'loss': 0.6043, 'learning_rate': 6.517225177528952e-06, 'epoch': 1.23} {'loss': 0.5868, 'learning_rate': 6.5169183228564015e-06, 'epoch': 1.23} {'loss': 0.3756, 'learning_rate': 6.516611471916292e-06, 'epoch': 1.23} {'loss': 0.6272, 'learning_rate': 6.516304624708947e-06, 'epoch': 1.23} {'loss': 0.4571, 'learning_rate': 6.515997781234691e-06, 'epoch': 1.23} {'loss': 0.5324, 'learning_rate': 6.515690941493863e-06, 'epoch': 1.23} {'loss': 0.5702, 'learning_rate': 6.515384105486784e-06, 'epoch': 1.23} {'loss': 0.4343, 'learning_rate': 6.515077273213788e-06, 'epoch': 1.23} {'loss': 0.4814, 'learning_rate': 6.514770444675197e-06, 'epoch': 1.23} {'loss': 0.6293, 'learning_rate': 6.514463619871347e-06, 'epoch': 1.23} {'loss': 0.5845, 'learning_rate': 6.514156798802567e-06, 'epoch': 1.23} {'loss': 0.5254, 'learning_rate': 6.513849981469176e-06, 'epoch': 1.23} {'loss': 0.472, 'learning_rate': 6.513543167871513e-06, 'epoch': 1.23} {'loss': 0.5588, 'learning_rate': 6.513236358009902e-06, 'epoch': 1.23} {'loss': 0.5268, 'learning_rate': 6.512929551884674e-06, 'epoch': 1.23} {'loss': 0.561, 'learning_rate': 6.512622749496159e-06, 'epoch': 1.23} {'loss': 0.6607, 'learning_rate': 6.512315950844679e-06, 'epoch': 1.23} {'loss': 0.5004, 'learning_rate': 6.51200915593057e-06, 'epoch': 1.23} {'loss': 0.5639, 'learning_rate': 6.511702364754154e-06, 'epoch': 1.23} {'loss': 0.5531, 'learning_rate': 6.511395577315769e-06, 'epoch': 1.23} {'loss': 0.5822, 'learning_rate': 6.511088793615734e-06, 'epoch': 1.23} {'loss': 0.5278, 'learning_rate': 6.510782013654387e-06, 'epoch': 1.23} {'loss': 0.5264, 'learning_rate': 6.51047523743205e-06, 'epoch': 1.23} {'loss': 0.6199, 'learning_rate': 6.510168464949051e-06, 'epoch': 1.23} {'loss': 0.4233, 'learning_rate': 6.509861696205726e-06, 'epoch': 1.23} {'loss': 0.4295, 'learning_rate': 6.509554931202393e-06, 'epoch': 1.23} {'loss': 0.6214, 'learning_rate': 6.509248169939393e-06, 'epoch': 1.23} {'loss': 0.5741, 'learning_rate': 6.5089414124170455e-06, 'epoch': 1.23} {'loss': 0.514, 'learning_rate': 6.5086346586356855e-06, 'epoch': 1.23} {'loss': 0.4936, 'learning_rate': 6.508327908595638e-06, 'epoch': 1.23} {'loss': 0.6115, 'learning_rate': 6.508021162297227e-06, 'epoch': 1.23} {'loss': 0.6563, 'learning_rate': 6.507714419740792e-06, 'epoch': 1.23} {'loss': 0.5922, 'learning_rate': 6.507407680926654e-06, 'epoch': 1.23} {'loss': 0.4253, 'learning_rate': 6.5071009458551436e-06, 'epoch': 1.23} {'loss': 0.6297, 'learning_rate': 6.506794214526592e-06, 'epoch': 1.23} {'loss': 0.7157, 'learning_rate': 6.506487486941324e-06, 'epoch': 1.23} {'loss': 0.5157, 'learning_rate': 6.506180763099671e-06, 'epoch': 1.23} {'loss': 0.4021, 'learning_rate': 6.505874043001957e-06, 'epoch': 1.23} {'loss': 0.544, 'learning_rate': 6.505567326648518e-06, 'epoch': 1.23} {'loss': 0.5682, 'learning_rate': 6.505260614039679e-06, 'epoch': 1.23} {'loss': 0.4982, 'learning_rate': 6.504953905175768e-06, 'epoch': 1.23} {'loss': 0.566, 'learning_rate': 6.504647200057115e-06, 'epoch': 1.23} {'loss': 0.4455, 'learning_rate': 6.504340498684045e-06, 'epoch': 1.23} {'loss': 0.5455, 'learning_rate': 6.5040338010568935e-06, 'epoch': 1.23} {'loss': 0.6418, 'learning_rate': 6.503727107175981e-06, 'epoch': 1.23} {'loss': 0.6206, 'learning_rate': 6.5034204170416445e-06, 'epoch': 1.23} {'loss': 0.4971, 'learning_rate': 6.503113730654207e-06, 'epoch': 1.23} {'loss': 0.555, 'learning_rate': 6.502807048014e-06, 'epoch': 1.23} {'loss': 0.4088, 'learning_rate': 6.502500369121352e-06, 'epoch': 1.23} {'loss': 0.4653, 'learning_rate': 6.502193693976585e-06, 'epoch': 1.23} {'loss': 0.5453, 'learning_rate': 6.501887022580038e-06, 'epoch': 1.23} {'loss': 0.4154, 'learning_rate': 6.501580354932031e-06, 'epoch': 1.23} {'loss': 0.4931, 'learning_rate': 6.501273691032899e-06, 'epoch': 1.23} {'loss': 0.5486, 'learning_rate': 6.50096703088297e-06, 'epoch': 1.23} {'loss': 0.618, 'learning_rate': 6.500660374482568e-06, 'epoch': 1.23} {'loss': 0.5425, 'learning_rate': 6.500353721832026e-06, 'epoch': 1.23} {'loss': 0.5387, 'learning_rate': 6.500047072931665e-06, 'epoch': 1.23} {'loss': 0.4972, 'learning_rate': 6.499740427781827e-06, 'epoch': 1.23} {'loss': 0.5056, 'learning_rate': 6.499433786382827e-06, 'epoch': 1.23} {'loss': 0.5397, 'learning_rate': 6.4991271487350035e-06, 'epoch': 1.23} {'loss': 0.566, 'learning_rate': 6.498820514838682e-06, 'epoch': 1.23} {'loss': 0.4531, 'learning_rate': 6.498513884694189e-06, 'epoch': 1.23} {'loss': 0.5706, 'learning_rate': 6.498207258301854e-06, 'epoch': 1.23} {'loss': 0.4889, 'learning_rate': 6.4979006356620045e-06, 'epoch': 1.23} {'loss': 0.6639, 'learning_rate': 6.497594016774973e-06, 'epoch': 1.23} {'loss': 0.487, 'learning_rate': 6.497287401641081e-06, 'epoch': 1.23} {'loss': 0.5563, 'learning_rate': 6.496980790260667e-06, 'epoch': 1.23} {'loss': 0.375, 'learning_rate': 6.4966741826340555e-06, 'epoch': 1.23} {'loss': 0.5519, 'learning_rate': 6.496367578761569e-06, 'epoch': 1.23} {'loss': 0.4306, 'learning_rate': 6.496060978643544e-06, 'epoch': 1.23} {'loss': 0.4805, 'learning_rate': 6.495754382280302e-06, 'epoch': 1.23} {'loss': 0.5074, 'learning_rate': 6.49544778967218e-06, 'epoch': 1.23} {'loss': 0.4072, 'learning_rate': 6.495141200819501e-06, 'epoch': 1.23} {'loss': 0.5292, 'learning_rate': 6.494834615722592e-06, 'epoch': 1.23} {'loss': 0.5296, 'learning_rate': 6.4945280343817875e-06, 'epoch': 1.23} {'loss': 0.5217, 'learning_rate': 6.494221456797409e-06, 'epoch': 1.23} {'loss': 0.5008, 'learning_rate': 6.493914882969793e-06, 'epoch': 1.23} {'loss': 0.6502, 'learning_rate': 6.493608312899258e-06, 'epoch': 1.23} {'loss': 0.4401, 'learning_rate': 6.493301746586143e-06, 'epoch': 1.23} {'loss': 0.5528, 'learning_rate': 6.492995184030772e-06, 'epoch': 1.23} {'loss': 0.4835, 'learning_rate': 6.492688625233468e-06, 'epoch': 1.23} {'loss': 0.5702, 'learning_rate': 6.49238207019457e-06, 'epoch': 1.23} {'loss': 0.4885, 'learning_rate': 6.492075518914398e-06, 'epoch': 1.23} {'loss': 0.4024, 'learning_rate': 6.491768971393286e-06, 'epoch': 1.23} {'loss': 0.6548, 'learning_rate': 6.491462427631556e-06, 'epoch': 1.23} {'loss': 0.4009, 'learning_rate': 6.491155887629546e-06, 'epoch': 1.23} {'loss': 0.4944, 'learning_rate': 6.490849351387577e-06, 'epoch': 1.23} {'loss': 0.5532, 'learning_rate': 6.490542818905977e-06, 'epoch': 1.23} {'loss': 0.4186, 'learning_rate': 6.490236290185081e-06, 'epoch': 1.23} {'loss': 0.5322, 'learning_rate': 6.4899297652252114e-06, 'epoch': 1.23} {'loss': 0.439, 'learning_rate': 6.4896232440267016e-06, 'epoch': 1.23} {'loss': 0.8027, 'learning_rate': 6.489316726589876e-06, 'epoch': 1.23} {'loss': 0.4884, 'learning_rate': 6.489010212915061e-06, 'epoch': 1.23} {'loss': 0.6762, 'learning_rate': 6.4887037030025926e-06, 'epoch': 1.23} {'loss': 0.4527, 'learning_rate': 6.488397196852791e-06, 'epoch': 1.23} {'loss': 0.4971, 'learning_rate': 6.488090694465993e-06, 'epoch': 1.23} {'loss': 0.4554, 'learning_rate': 6.48778419584252e-06, 'epoch': 1.23} {'loss': 0.4186, 'learning_rate': 6.487477700982706e-06, 'epoch': 1.23} {'loss': 0.5012, 'learning_rate': 6.487171209886877e-06, 'epoch': 1.23} {'loss': 0.5471, 'learning_rate': 6.486864722555356e-06, 'epoch': 1.23} {'loss': 0.4488, 'learning_rate': 6.486558238988481e-06, 'epoch': 1.23} {'loss': 0.5373, 'learning_rate': 6.486251759186573e-06, 'epoch': 1.23} {'loss': 0.4979, 'learning_rate': 6.4859452831499656e-06, 'epoch': 1.23} {'loss': 0.658, 'learning_rate': 6.485638810878986e-06, 'epoch': 1.23} {'loss': 0.5739, 'learning_rate': 6.48533234237396e-06, 'epoch': 1.23} {'loss': 0.4922, 'learning_rate': 6.485025877635218e-06, 'epoch': 1.23} {'loss': 0.4336, 'learning_rate': 6.484719416663085e-06, 'epoch': 1.23} {'loss': 0.6234, 'learning_rate': 6.484412959457898e-06, 'epoch': 1.23} {'loss': 0.4623, 'learning_rate': 6.484106506019974e-06, 'epoch': 1.23} {'loss': 0.5748, 'learning_rate': 6.483800056349651e-06, 'epoch': 1.23} {'loss': 0.5315, 'learning_rate': 6.483493610447253e-06, 'epoch': 1.23} {'loss': 0.536, 'learning_rate': 6.483187168313108e-06, 'epoch': 1.23} {'loss': 0.4946, 'learning_rate': 6.482880729947548e-06, 'epoch': 1.23} {'loss': 0.7011, 'learning_rate': 6.4825742953508944e-06, 'epoch': 1.23} {'loss': 0.5275, 'learning_rate': 6.482267864523483e-06, 'epoch': 1.23} {'loss': 0.5452, 'learning_rate': 6.481961437465638e-06, 'epoch': 1.23} {'loss': 0.6013, 'learning_rate': 6.481655014177688e-06, 'epoch': 1.23} {'loss': 0.592, 'learning_rate': 6.4813485946599665e-06, 'epoch': 1.23} {'loss': 0.6562, 'learning_rate': 6.481042178912793e-06, 'epoch': 1.23} {'loss': 0.6408, 'learning_rate': 6.480735766936503e-06, 'epoch': 1.23} {'loss': 0.4842, 'learning_rate': 6.4804293587314195e-06, 'epoch': 1.23} {'loss': 0.4463, 'learning_rate': 6.480122954297876e-06, 'epoch': 1.23} {'loss': 0.4119, 'learning_rate': 6.479816553636199e-06, 'epoch': 1.23} {'loss': 0.5932, 'learning_rate': 6.479510156746714e-06, 'epoch': 1.23} {'loss': 0.4378, 'learning_rate': 6.479203763629752e-06, 'epoch': 1.23} {'loss': 0.487, 'learning_rate': 6.478897374285641e-06, 'epoch': 1.23} {'loss': 0.6902, 'learning_rate': 6.478590988714711e-06, 'epoch': 1.23} {'loss': 0.5636, 'learning_rate': 6.478284606917285e-06, 'epoch': 1.23} {'loss': 0.4141, 'learning_rate': 6.477978228893698e-06, 'epoch': 1.23} {'loss': 0.5663, 'learning_rate': 6.4776718546442766e-06, 'epoch': 1.23} {'loss': 0.6193, 'learning_rate': 6.4773654841693445e-06, 'epoch': 1.23} {'loss': 0.5576, 'learning_rate': 6.477059117469235e-06, 'epoch': 1.23} {'loss': 0.4965, 'learning_rate': 6.476752754544272e-06, 'epoch': 1.23} {'loss': 0.5498, 'learning_rate': 6.4764463953947896e-06, 'epoch': 1.23} {'loss': 0.4088, 'learning_rate': 6.476140040021109e-06, 'epoch': 1.23} {'loss': 0.5571, 'learning_rate': 6.4758336884235674e-06, 'epoch': 1.23} {'loss': 0.5062, 'learning_rate': 6.475527340602487e-06, 'epoch': 1.23} {'loss': 0.6551, 'learning_rate': 6.4752209965581945e-06, 'epoch': 1.23} {'loss': 0.6382, 'learning_rate': 6.474914656291025e-06, 'epoch': 1.23} {'loss': 0.5989, 'learning_rate': 6.474608319801297e-06, 'epoch': 1.23} {'loss': 0.498, 'learning_rate': 6.474301987089347e-06, 'epoch': 1.23} {'loss': 0.3768, 'learning_rate': 6.473995658155503e-06, 'epoch': 1.23} {'loss': 0.4946, 'learning_rate': 6.473689333000086e-06, 'epoch': 1.23} {'loss': 0.4903, 'learning_rate': 6.473383011623433e-06, 'epoch': 1.23} {'loss': 0.4951, 'learning_rate': 6.473076694025867e-06, 'epoch': 1.23} {'loss': 0.4062, 'learning_rate': 6.472770380207719e-06, 'epoch': 1.23} {'loss': 0.5838, 'learning_rate': 6.472464070169313e-06, 'epoch': 1.23} {'loss': 0.4126, 'learning_rate': 6.472157763910982e-06, 'epoch': 1.23} {'loss': 0.6779, 'learning_rate': 6.471851461433054e-06, 'epoch': 1.23} {'loss': 0.4126, 'learning_rate': 6.471545162735851e-06, 'epoch': 1.23} {'loss': 0.6363, 'learning_rate': 6.4712388678197115e-06, 'epoch': 1.23} {'loss': 0.604, 'learning_rate': 6.470932576684954e-06, 'epoch': 1.23} {'loss': 0.6696, 'learning_rate': 6.4706262893319136e-06, 'epoch': 1.23} {'loss': 0.572, 'learning_rate': 6.47032000576091e-06, 'epoch': 1.23} {'loss': 0.5141, 'learning_rate': 6.470013725972284e-06, 'epoch': 1.23} {'loss': 0.6081, 'learning_rate': 6.469707449966356e-06, 'epoch': 1.23} {'loss': 0.6907, 'learning_rate': 6.46940117774345e-06, 'epoch': 1.23} {'loss': 0.6393, 'learning_rate': 6.469094909303903e-06, 'epoch': 1.23} {'loss': 0.6063, 'learning_rate': 6.468788644648038e-06, 'epoch': 1.23} {'loss': 0.4325, 'learning_rate': 6.468482383776188e-06, 'epoch': 1.23} {'loss': 0.5326, 'learning_rate': 6.468176126688677e-06, 'epoch': 1.23} {'loss': 0.4795, 'learning_rate': 6.46786987338583e-06, 'epoch': 1.23} {'loss': 0.5172, 'learning_rate': 6.467563623867983e-06, 'epoch': 1.23} {'loss': 0.5029, 'learning_rate': 6.467257378135457e-06, 'epoch': 1.23} {'loss': 0.5841, 'learning_rate': 6.466951136188586e-06, 'epoch': 1.23} {'loss': 0.5324, 'learning_rate': 6.4666448980276955e-06, 'epoch': 1.23} {'loss': 0.4809, 'learning_rate': 6.466338663653115e-06, 'epoch': 1.23} {'loss': 0.5294, 'learning_rate': 6.466032433065172e-06, 'epoch': 1.23} {'loss': 0.6564, 'learning_rate': 6.46572620626419e-06, 'epoch': 1.23} {'loss': 0.5486, 'learning_rate': 6.465419983250505e-06, 'epoch': 1.23} {'loss': 0.4997, 'learning_rate': 6.4651137640244374e-06, 'epoch': 1.23} {'loss': 0.4854, 'learning_rate': 6.464807548586325e-06, 'epoch': 1.23} {'loss': 0.4915, 'learning_rate': 6.464501336936486e-06, 'epoch': 1.23} {'loss': 0.5289, 'learning_rate': 6.464195129075257e-06, 'epoch': 1.23} {'loss': 0.4548, 'learning_rate': 6.463888925002962e-06, 'epoch': 1.23} {'loss': 0.6107, 'learning_rate': 6.463582724719924e-06, 'epoch': 1.23} {'loss': 0.559, 'learning_rate': 6.4632765282264805e-06, 'epoch': 1.23} {'loss': 0.5314, 'learning_rate': 6.462970335522951e-06, 'epoch': 1.23} {'loss': 0.4333, 'learning_rate': 6.462664146609674e-06, 'epoch': 1.23} {'loss': 0.4759, 'learning_rate': 6.462357961486969e-06, 'epoch': 1.23} {'loss': 0.5533, 'learning_rate': 6.4620517801551675e-06, 'epoch': 1.23} {'loss': 0.5856, 'learning_rate': 6.461745602614597e-06, 'epoch': 1.23} {'loss': 0.6281, 'learning_rate': 6.461439428865581e-06, 'epoch': 1.23} {'loss': 0.4511, 'learning_rate': 6.461133258908457e-06, 'epoch': 1.23} {'loss': 0.5007, 'learning_rate': 6.460827092743545e-06, 'epoch': 1.23} {'loss': 0.4655, 'learning_rate': 6.460520930371179e-06, 'epoch': 1.23} {'loss': 0.6506, 'learning_rate': 6.460214771791684e-06, 'epoch': 1.23} {'loss': 0.5544, 'learning_rate': 6.459908617005386e-06, 'epoch': 1.23} {'loss': 0.6467, 'learning_rate': 6.4596024660126185e-06, 'epoch': 1.23} {'loss': 0.429, 'learning_rate': 6.459296318813703e-06, 'epoch': 1.23} {'loss': 0.5061, 'learning_rate': 6.4589901754089746e-06, 'epoch': 1.23} {'loss': 0.5036, 'learning_rate': 6.458684035798757e-06, 'epoch': 1.23} {'loss': 0.6015, 'learning_rate': 6.458377899983375e-06, 'epoch': 1.23} {'loss': 0.5203, 'learning_rate': 6.458071767963165e-06, 'epoch': 1.23} {'loss': 0.4645, 'learning_rate': 6.457765639738449e-06, 'epoch': 1.23} {'loss': 0.591, 'learning_rate': 6.457459515309559e-06, 'epoch': 1.23} {'loss': 0.4554, 'learning_rate': 6.457153394676817e-06, 'epoch': 1.23} {'loss': 0.4854, 'learning_rate': 6.456847277840559e-06, 'epoch': 1.23} {'loss': 0.535, 'learning_rate': 6.456541164801109e-06, 'epoch': 1.23} {'loss': 0.535, 'learning_rate': 6.456235055558793e-06, 'epoch': 1.23} {'loss': 0.5483, 'learning_rate': 6.45592895011394e-06, 'epoch': 1.23} {'loss': 0.6005, 'learning_rate': 6.455622848466879e-06, 'epoch': 1.23} {'loss': 0.7137, 'learning_rate': 6.455316750617942e-06, 'epoch': 1.23} {'loss': 0.547, 'learning_rate': 6.4550106565674466e-06, 'epoch': 1.23} {'loss': 0.4812, 'learning_rate': 6.4547045663157324e-06, 'epoch': 1.23} {'loss': 0.5318, 'learning_rate': 6.454398479863122e-06, 'epoch': 1.23} {'loss': 0.4873, 'learning_rate': 6.454092397209941e-06, 'epoch': 1.23} {'loss': 0.5943, 'learning_rate': 6.4537863183565234e-06, 'epoch': 1.23} {'loss': 0.4276, 'learning_rate': 6.453480243303189e-06, 'epoch': 1.23} {'loss': 0.445, 'learning_rate': 6.453174172050275e-06, 'epoch': 1.23} {'loss': 0.5209, 'learning_rate': 6.452868104598104e-06, 'epoch': 1.23} {'loss': 0.5693, 'learning_rate': 6.4525620409470025e-06, 'epoch': 1.23} {'loss': 0.5316, 'learning_rate': 6.452255981097304e-06, 'epoch': 1.23} {'loss': 0.5766, 'learning_rate': 6.451949925049333e-06, 'epoch': 1.23} {'loss': 0.5594, 'learning_rate': 6.451643872803417e-06, 'epoch': 1.23} {'loss': 0.5358, 'learning_rate': 6.451337824359883e-06, 'epoch': 1.23} {'loss': 0.4621, 'learning_rate': 6.451031779719064e-06, 'epoch': 1.23} {'loss': 0.5396, 'learning_rate': 6.450725738881285e-06, 'epoch': 1.23} {'loss': 0.477, 'learning_rate': 6.450419701846868e-06, 'epoch': 1.23} {'loss': 0.5375, 'learning_rate': 6.450113668616153e-06, 'epoch': 1.23} {'loss': 0.5236, 'learning_rate': 6.449807639189459e-06, 'epoch': 1.23} {'loss': 0.6046, 'learning_rate': 6.4495016135671195e-06, 'epoch': 1.23} {'loss': 0.403, 'learning_rate': 6.449195591749453e-06, 'epoch': 1.23} {'loss': 0.4927, 'learning_rate': 6.4488895737368005e-06, 'epoch': 1.23} {'loss': 0.3618, 'learning_rate': 6.448583559529482e-06, 'epoch': 1.23} {'loss': 0.5364, 'learning_rate': 6.448277549127823e-06, 'epoch': 1.23} {'loss': 0.6184, 'learning_rate': 6.447971542532159e-06, 'epoch': 1.23} {'loss': 0.469, 'learning_rate': 6.447665539742811e-06, 'epoch': 1.23} {'loss': 0.5252, 'learning_rate': 6.447359540760114e-06, 'epoch': 1.23} {'loss': 0.5447, 'learning_rate': 6.447053545584391e-06, 'epoch': 1.23} {'loss': 0.5064, 'learning_rate': 6.446747554215966e-06, 'epoch': 1.23} {'loss': 0.6552, 'learning_rate': 6.4464415666551775e-06, 'epoch': 1.23} {'loss': 0.4755, 'learning_rate': 6.446135582902342e-06, 'epoch': 1.23} {'loss': 0.3609, 'learning_rate': 6.445829602957798e-06, 'epoch': 1.23} {'loss': 0.5471, 'learning_rate': 6.445523626821865e-06, 'epoch': 1.23} {'loss': 0.6771, 'learning_rate': 6.445217654494878e-06, 'epoch': 1.23} {'loss': 0.4475, 'learning_rate': 6.44491168597716e-06, 'epoch': 1.23} {'loss': 0.5498, 'learning_rate': 6.444605721269037e-06, 'epoch': 1.23} {'loss': 0.5447, 'learning_rate': 6.444299760370842e-06, 'epoch': 1.23} {'loss': 0.4609, 'learning_rate': 6.4439938032829e-06, 'epoch': 1.23} {'loss': 0.5546, 'learning_rate': 6.44368785000554e-06, 'epoch': 1.23} {'loss': 0.5241, 'learning_rate': 6.44338190053909e-06, 'epoch': 1.23} {'loss': 0.4809, 'learning_rate': 6.443075954883877e-06, 'epoch': 1.23} {'loss': 0.5416, 'learning_rate': 6.4427700130402314e-06, 'epoch': 1.23} {'loss': 0.4479, 'learning_rate': 6.442464075008474e-06, 'epoch': 1.23} {'loss': 0.4702, 'learning_rate': 6.442158140788941e-06, 'epoch': 1.23} {'loss': 0.5881, 'learning_rate': 6.441852210381953e-06, 'epoch': 1.23} {'loss': 0.5019, 'learning_rate': 6.441546283787845e-06, 'epoch': 1.23} {'loss': 0.556, 'learning_rate': 6.441240361006942e-06, 'epoch': 1.23} {'loss': 0.5327, 'learning_rate': 6.440934442039568e-06, 'epoch': 1.23} {'loss': 0.4539, 'learning_rate': 6.440628526886057e-06, 'epoch': 1.23} {'loss': 0.5526, 'learning_rate': 6.4403226155467305e-06, 'epoch': 1.23} {'loss': 0.4069, 'learning_rate': 6.440016708021922e-06, 'epoch': 1.23} {'loss': 0.5366, 'learning_rate': 6.439710804311954e-06, 'epoch': 1.23} {'loss': 0.6279, 'learning_rate': 6.439404904417162e-06, 'epoch': 1.23} {'loss': 0.4973, 'learning_rate': 6.439099008337867e-06, 'epoch': 1.23} {'loss': 0.5184, 'learning_rate': 6.4387931160743975e-06, 'epoch': 1.23} {'loss': 0.6233, 'learning_rate': 6.438487227627084e-06, 'epoch': 1.23} {'loss': 0.4296, 'learning_rate': 6.43818134299625e-06, 'epoch': 1.23} {'loss': 0.5197, 'learning_rate': 6.437875462182231e-06, 'epoch': 1.23} {'loss': 0.6116, 'learning_rate': 6.437569585185344e-06, 'epoch': 1.23} {'loss': 0.538, 'learning_rate': 6.437263712005928e-06, 'epoch': 1.23} {'loss': 0.5415, 'learning_rate': 6.436957842644305e-06, 'epoch': 1.23} {'loss': 0.6522, 'learning_rate': 6.436651977100801e-06, 'epoch': 1.23} {'loss': 0.4899, 'learning_rate': 6.436346115375747e-06, 'epoch': 1.23} {'loss': 0.6243, 'learning_rate': 6.436040257469467e-06, 'epoch': 1.23} {'loss': 0.4409, 'learning_rate': 6.435734403382297e-06, 'epoch': 1.23} {'loss': 0.4732, 'learning_rate': 6.435428553114558e-06, 'epoch': 1.23} {'loss': 0.594, 'learning_rate': 6.435122706666575e-06, 'epoch': 1.23} {'loss': 0.5349, 'learning_rate': 6.434816864038682e-06, 'epoch': 1.23} {'loss': 0.6073, 'learning_rate': 6.434511025231205e-06, 'epoch': 1.23} {'loss': 0.6056, 'learning_rate': 6.434205190244471e-06, 'epoch': 1.23} {'loss': 0.5371, 'learning_rate': 6.433899359078806e-06, 'epoch': 1.23} {'loss': 0.4488, 'learning_rate': 6.433593531734544e-06, 'epoch': 1.23} {'loss': 0.4543, 'learning_rate': 6.433287708212006e-06, 'epoch': 1.23} {'loss': 0.4148, 'learning_rate': 6.432981888511523e-06, 'epoch': 1.23} {'loss': 0.3367, 'learning_rate': 6.4326760726334196e-06, 'epoch': 1.23} {'loss': 0.5548, 'learning_rate': 6.432370260578027e-06, 'epoch': 1.23} {'loss': 0.5634, 'learning_rate': 6.4320644523456725e-06, 'epoch': 1.23} {'loss': 0.4287, 'learning_rate': 6.431758647936683e-06, 'epoch': 1.23} {'loss': 0.4667, 'learning_rate': 6.431452847351384e-06, 'epoch': 1.23} {'loss': 0.4339, 'learning_rate': 6.431147050590108e-06, 'epoch': 1.23} {'loss': 0.6624, 'learning_rate': 6.430841257653179e-06, 'epoch': 1.23} {'loss': 0.5185, 'learning_rate': 6.430535468540926e-06, 'epoch': 1.23} {'loss': 0.4648, 'learning_rate': 6.430229683253674e-06, 'epoch': 1.23} {'loss': 0.4932, 'learning_rate': 6.429923901791757e-06, 'epoch': 1.23} {'loss': 0.5799, 'learning_rate': 6.429618124155498e-06, 'epoch': 1.23} {'loss': 0.4473, 'learning_rate': 6.4293123503452215e-06, 'epoch': 1.23} {'loss': 0.6066, 'learning_rate': 6.429006580361263e-06, 'epoch': 1.23} {'loss': 0.5429, 'learning_rate': 6.428700814203945e-06, 'epoch': 1.23} {'loss': 0.5581, 'learning_rate': 6.428395051873597e-06, 'epoch': 1.23} {'loss': 0.5435, 'learning_rate': 6.428089293370543e-06, 'epoch': 1.23} {'loss': 0.5092, 'learning_rate': 6.427783538695118e-06, 'epoch': 1.23} {'loss': 0.4762, 'learning_rate': 6.427477787847646e-06, 'epoch': 1.23} {'loss': 0.5423, 'learning_rate': 6.4271720408284485e-06, 'epoch': 1.23} {'loss': 0.7386, 'learning_rate': 6.4268662976378635e-06, 'epoch': 1.24} {'loss': 0.5766, 'learning_rate': 6.426560558276211e-06, 'epoch': 1.24} {'loss': 0.6142, 'learning_rate': 6.426254822743824e-06, 'epoch': 1.24} {'loss': 0.5013, 'learning_rate': 6.425949091041027e-06, 'epoch': 1.24} {'loss': 0.456, 'learning_rate': 6.425643363168145e-06, 'epoch': 1.24} {'loss': 0.6584, 'learning_rate': 6.425337639125512e-06, 'epoch': 1.24} {'loss': 0.4572, 'learning_rate': 6.425031918913449e-06, 'epoch': 1.24} {'loss': 0.534, 'learning_rate': 6.4247262025322895e-06, 'epoch': 1.24} {'loss': 0.5623, 'learning_rate': 6.424420489982358e-06, 'epoch': 1.24} {'loss': 0.4506, 'learning_rate': 6.424114781263984e-06, 'epoch': 1.24} {'loss': 0.5198, 'learning_rate': 6.423809076377494e-06, 'epoch': 1.24} {'loss': 0.4882, 'learning_rate': 6.423503375323212e-06, 'epoch': 1.24} {'loss': 0.6389, 'learning_rate': 6.423197678101471e-06, 'epoch': 1.24} {'loss': 0.5609, 'learning_rate': 6.422891984712595e-06, 'epoch': 1.24} {'loss': 0.4917, 'learning_rate': 6.422586295156916e-06, 'epoch': 1.24} {'loss': 0.5763, 'learning_rate': 6.422280609434756e-06, 'epoch': 1.24} {'loss': 0.5999, 'learning_rate': 6.421974927546448e-06, 'epoch': 1.24} {'loss': 0.4882, 'learning_rate': 6.421669249492317e-06, 'epoch': 1.24} {'loss': 0.7027, 'learning_rate': 6.421363575272686e-06, 'epoch': 1.24} {'loss': 0.5714, 'learning_rate': 6.4210579048878904e-06, 'epoch': 1.24} {'loss': 0.5089, 'learning_rate': 6.42075223833825e-06, 'epoch': 1.24} {'loss': 0.5102, 'learning_rate': 6.420446575624102e-06, 'epoch': 1.24} {'loss': 0.5248, 'learning_rate': 6.420140916745767e-06, 'epoch': 1.24} {'loss': 0.4922, 'learning_rate': 6.419835261703574e-06, 'epoch': 1.24} {'loss': 0.4894, 'learning_rate': 6.419529610497852e-06, 'epoch': 1.24} {'loss': 0.6318, 'learning_rate': 6.419223963128922e-06, 'epoch': 1.24} {'loss': 0.5305, 'learning_rate': 6.418918319597122e-06, 'epoch': 1.24} {'loss': 0.4746, 'learning_rate': 6.418612679902769e-06, 'epoch': 1.24} {'loss': 0.559, 'learning_rate': 6.418307044046201e-06, 'epoch': 1.24} {'loss': 0.5822, 'learning_rate': 6.41800141202774e-06, 'epoch': 1.24} {'loss': 0.5989, 'learning_rate': 6.4176957838477115e-06, 'epoch': 1.24} {'loss': 0.5028, 'learning_rate': 6.417390159506448e-06, 'epoch': 1.24} {'loss': 0.6646, 'learning_rate': 6.417084539004271e-06, 'epoch': 1.24} {'loss': 0.5689, 'learning_rate': 6.416778922341513e-06, 'epoch': 1.24} {'loss': 0.5105, 'learning_rate': 6.416473309518496e-06, 'epoch': 1.24} {'loss': 0.6296, 'learning_rate': 6.416167700535556e-06, 'epoch': 1.24} {'loss': 0.4951, 'learning_rate': 6.415862095393017e-06, 'epoch': 1.24} {'loss': 0.5603, 'learning_rate': 6.415556494091202e-06, 'epoch': 1.24} {'loss': 0.5197, 'learning_rate': 6.415250896630442e-06, 'epoch': 1.24} {'loss': 0.6633, 'learning_rate': 6.414945303011063e-06, 'epoch': 1.24} {'loss': 0.4626, 'learning_rate': 6.414639713233397e-06, 'epoch': 1.24} {'loss': 0.5753, 'learning_rate': 6.414334127297768e-06, 'epoch': 1.24} {'loss': 0.5402, 'learning_rate': 6.4140285452045e-06, 'epoch': 1.24} {'loss': 0.5552, 'learning_rate': 6.413722966953927e-06, 'epoch': 1.24} {'loss': 0.5427, 'learning_rate': 6.413417392546372e-06, 'epoch': 1.24} {'loss': 0.6103, 'learning_rate': 6.413111821982165e-06, 'epoch': 1.24} {'loss': 0.4359, 'learning_rate': 6.41280625526163e-06, 'epoch': 1.24} {'loss': 0.6286, 'learning_rate': 6.4125006923851005e-06, 'epoch': 1.24} {'loss': 0.6179, 'learning_rate': 6.412195133352901e-06, 'epoch': 1.24} {'loss': 0.565, 'learning_rate': 6.411889578165352e-06, 'epoch': 1.24} {'loss': 0.546, 'learning_rate': 6.411584026822793e-06, 'epoch': 1.24} {'loss': 0.4515, 'learning_rate': 6.411278479325543e-06, 'epoch': 1.24} {'loss': 0.4755, 'learning_rate': 6.410972935673934e-06, 'epoch': 1.24} {'loss': 0.5351, 'learning_rate': 6.410667395868288e-06, 'epoch': 1.24} {'loss': 0.5926, 'learning_rate': 6.410361859908939e-06, 'epoch': 1.24} {'loss': 0.5734, 'learning_rate': 6.410056327796212e-06, 'epoch': 1.24} {'loss': 0.6617, 'learning_rate': 6.409750799530431e-06, 'epoch': 1.24} {'loss': 0.5885, 'learning_rate': 6.409445275111926e-06, 'epoch': 1.24} {'loss': 0.4195, 'learning_rate': 6.409139754541025e-06, 'epoch': 1.24} {'loss': 0.5549, 'learning_rate': 6.408834237818057e-06, 'epoch': 1.24} {'loss': 0.5636, 'learning_rate': 6.408528724943347e-06, 'epoch': 1.24} {'loss': 0.4789, 'learning_rate': 6.408223215917217e-06, 'epoch': 1.24} {'loss': 0.5558, 'learning_rate': 6.407917710740007e-06, 'epoch': 1.24} {'loss': 0.47, 'learning_rate': 6.407612209412033e-06, 'epoch': 1.24} {'loss': 0.5987, 'learning_rate': 6.4073067119336284e-06, 'epoch': 1.24} {'loss': 0.5468, 'learning_rate': 6.407001218305118e-06, 'epoch': 1.24} {'loss': 0.6712, 'learning_rate': 6.406695728526833e-06, 'epoch': 1.24} {'loss': 0.5785, 'learning_rate': 6.406390242599096e-06, 'epoch': 1.24} {'loss': 0.5103, 'learning_rate': 6.406084760522233e-06, 'epoch': 1.24} {'loss': 0.4763, 'learning_rate': 6.405779282296581e-06, 'epoch': 1.24} {'loss': 0.3608, 'learning_rate': 6.405473807922456e-06, 'epoch': 1.24} {'loss': 0.3522, 'learning_rate': 6.405168337400192e-06, 'epoch': 1.24} {'loss': 0.5058, 'learning_rate': 6.4048628707301116e-06, 'epoch': 1.24} {'loss': 0.6058, 'learning_rate': 6.404557407912549e-06, 'epoch': 1.24} {'loss': 0.5346, 'learning_rate': 6.404251948947829e-06, 'epoch': 1.24} {'loss': 0.474, 'learning_rate': 6.40394649383627e-06, 'epoch': 1.24} {'loss': 0.6109, 'learning_rate': 6.403641042578215e-06, 'epoch': 1.24} {'loss': 0.5255, 'learning_rate': 6.403335595173979e-06, 'epoch': 1.24} {'loss': 0.432, 'learning_rate': 6.403030151623896e-06, 'epoch': 1.24} {'loss': 0.6311, 'learning_rate': 6.402724711928291e-06, 'epoch': 1.24} {'loss': 0.5722, 'learning_rate': 6.402419276087486e-06, 'epoch': 1.24} {'loss': 0.3717, 'learning_rate': 6.402113844101818e-06, 'epoch': 1.24} {'loss': 0.478, 'learning_rate': 6.401808415971607e-06, 'epoch': 1.24} {'loss': 0.6094, 'learning_rate': 6.401502991697186e-06, 'epoch': 1.24} {'loss': 0.4298, 'learning_rate': 6.4011975712788775e-06, 'epoch': 1.24} {'loss': 0.6345, 'learning_rate': 6.4008921547170135e-06, 'epoch': 1.24} {'loss': 0.6643, 'learning_rate': 6.400586742011916e-06, 'epoch': 1.24} {'loss': 0.4845, 'learning_rate': 6.400281333163914e-06, 'epoch': 1.24} {'loss': 0.5761, 'learning_rate': 6.3999759281733365e-06, 'epoch': 1.24} {'loss': 0.5245, 'learning_rate': 6.399670527040507e-06, 'epoch': 1.24} {'loss': 0.5879, 'learning_rate': 6.39936512976576e-06, 'epoch': 1.24} {'loss': 0.4947, 'learning_rate': 6.399059736349417e-06, 'epoch': 1.24} {'loss': 0.5495, 'learning_rate': 6.3987543467918045e-06, 'epoch': 1.24} {'loss': 0.5982, 'learning_rate': 6.398448961093255e-06, 'epoch': 1.24} {'loss': 0.5782, 'learning_rate': 6.398143579254088e-06, 'epoch': 1.24} {'loss': 0.4562, 'learning_rate': 6.397838201274638e-06, 'epoch': 1.24} {'loss': 0.5111, 'learning_rate': 6.397532827155226e-06, 'epoch': 1.24} {'loss': 0.5765, 'learning_rate': 6.397227456896188e-06, 'epoch': 1.24} {'loss': 0.499, 'learning_rate': 6.396922090497846e-06, 'epoch': 1.24} {'loss': 0.4826, 'learning_rate': 6.396616727960523e-06, 'epoch': 1.24} {'loss': 0.453, 'learning_rate': 6.396311369284555e-06, 'epoch': 1.24} {'loss': 0.5934, 'learning_rate': 6.3960060144702586e-06, 'epoch': 1.24} {'loss': 0.516, 'learning_rate': 6.395700663517972e-06, 'epoch': 1.24} {'loss': 0.6124, 'learning_rate': 6.395395316428013e-06, 'epoch': 1.24} {'loss': 0.5019, 'learning_rate': 6.395089973200718e-06, 'epoch': 1.24} {'loss': 0.4845, 'learning_rate': 6.394784633836408e-06, 'epoch': 1.24} {'loss': 0.5127, 'learning_rate': 6.394479298335412e-06, 'epoch': 1.24} {'loss': 0.503, 'learning_rate': 6.394173966698056e-06, 'epoch': 1.24} {'loss': 0.6571, 'learning_rate': 6.393868638924666e-06, 'epoch': 1.24} {'loss': 0.3891, 'learning_rate': 6.393563315015575e-06, 'epoch': 1.24} {'loss': 0.5793, 'learning_rate': 6.393257994971107e-06, 'epoch': 1.24} {'loss': 0.4052, 'learning_rate': 6.392952678791583e-06, 'epoch': 1.24} {'loss': 0.5939, 'learning_rate': 6.39264736647734e-06, 'epoch': 1.24} {'loss': 0.5031, 'learning_rate': 6.3923420580287e-06, 'epoch': 1.24} {'loss': 0.3585, 'learning_rate': 6.392036753445992e-06, 'epoch': 1.24} {'loss': 0.5632, 'learning_rate': 6.39173145272954e-06, 'epoch': 1.24} {'loss': 0.61, 'learning_rate': 6.3914261558796755e-06, 'epoch': 1.24} {'loss': 0.4328, 'learning_rate': 6.391120862896724e-06, 'epoch': 1.24} {'loss': 0.5098, 'learning_rate': 6.390815573781009e-06, 'epoch': 1.24} {'loss': 0.4555, 'learning_rate': 6.390510288532864e-06, 'epoch': 1.24} {'loss': 0.5321, 'learning_rate': 6.390205007152612e-06, 'epoch': 1.24} {'loss': 0.5511, 'learning_rate': 6.389899729640582e-06, 'epoch': 1.24} {'loss': 0.7199, 'learning_rate': 6.389594455997097e-06, 'epoch': 1.24} {'loss': 0.4844, 'learning_rate': 6.389289186222491e-06, 'epoch': 1.24} {'loss': 0.5175, 'learning_rate': 6.388983920317088e-06, 'epoch': 1.24} {'loss': 0.6634, 'learning_rate': 6.38867865828121e-06, 'epoch': 1.24} {'loss': 0.5303, 'learning_rate': 6.388373400115193e-06, 'epoch': 1.24} {'loss': 0.4723, 'learning_rate': 6.3880681458193585e-06, 'epoch': 1.24} {'loss': 0.5658, 'learning_rate': 6.387762895394036e-06, 'epoch': 1.24} {'loss': 0.4775, 'learning_rate': 6.387457648839553e-06, 'epoch': 1.24} {'loss': 0.4307, 'learning_rate': 6.387152406156229e-06, 'epoch': 1.24} {'loss': 0.5547, 'learning_rate': 6.386847167344403e-06, 'epoch': 1.24} {'loss': 0.588, 'learning_rate': 6.386541932404391e-06, 'epoch': 1.24} {'loss': 0.6163, 'learning_rate': 6.38623670133653e-06, 'epoch': 1.24} {'loss': 0.5232, 'learning_rate': 6.385931474141142e-06, 'epoch': 1.24} {'loss': 0.717, 'learning_rate': 6.385626250818555e-06, 'epoch': 1.24} {'loss': 0.569, 'learning_rate': 6.385321031369096e-06, 'epoch': 1.24} {'loss': 0.327, 'learning_rate': 6.385015815793087e-06, 'epoch': 1.24} {'loss': 0.536, 'learning_rate': 6.384710604090867e-06, 'epoch': 1.24} {'loss': 0.5457, 'learning_rate': 6.38440539626275e-06, 'epoch': 1.24} {'loss': 0.3392, 'learning_rate': 6.384100192309071e-06, 'epoch': 1.24} {'loss': 0.5665, 'learning_rate': 6.383794992230154e-06, 'epoch': 1.24} {'loss': 0.6115, 'learning_rate': 6.38348979602633e-06, 'epoch': 1.24} {'loss': 0.4954, 'learning_rate': 6.383184603697922e-06, 'epoch': 1.24} {'loss': 0.4542, 'learning_rate': 6.382879415245256e-06, 'epoch': 1.24} {'loss': 0.4929, 'learning_rate': 6.3825742306686635e-06, 'epoch': 1.24} {'loss': 0.6038, 'learning_rate': 6.382269049968468e-06, 'epoch': 1.24} {'loss': 0.4728, 'learning_rate': 6.381963873145e-06, 'epoch': 1.24} {'loss': 0.4888, 'learning_rate': 6.381658700198581e-06, 'epoch': 1.24} {'loss': 0.4715, 'learning_rate': 6.3813535311295415e-06, 'epoch': 1.24} {'loss': 0.5343, 'learning_rate': 6.381048365938211e-06, 'epoch': 1.24} {'loss': 0.5118, 'learning_rate': 6.380743204624911e-06, 'epoch': 1.24} {'loss': 0.5489, 'learning_rate': 6.380438047189973e-06, 'epoch': 1.24} {'loss': 0.452, 'learning_rate': 6.380132893633721e-06, 'epoch': 1.24} {'loss': 0.6843, 'learning_rate': 6.379827743956486e-06, 'epoch': 1.24} {'loss': 0.5525, 'learning_rate': 6.379522598158591e-06, 'epoch': 1.24} {'loss': 0.5984, 'learning_rate': 6.379217456240362e-06, 'epoch': 1.24} {'loss': 0.4237, 'learning_rate': 6.378912318202131e-06, 'epoch': 1.24} {'loss': 0.4671, 'learning_rate': 6.3786071840442185e-06, 'epoch': 1.24} {'loss': 0.7864, 'learning_rate': 6.3783020537669605e-06, 'epoch': 1.24} {'loss': 0.4572, 'learning_rate': 6.377996927370675e-06, 'epoch': 1.24} {'loss': 0.6432, 'learning_rate': 6.377691804855696e-06, 'epoch': 1.24} {'loss': 0.5403, 'learning_rate': 6.3773866862223465e-06, 'epoch': 1.24} {'loss': 0.6415, 'learning_rate': 6.37708157147095e-06, 'epoch': 1.24} {'loss': 0.5793, 'learning_rate': 6.376776460601841e-06, 'epoch': 1.24} {'loss': 0.4847, 'learning_rate': 6.376471353615341e-06, 'epoch': 1.24} {'loss': 0.5227, 'learning_rate': 6.376166250511782e-06, 'epoch': 1.24} {'loss': 0.59, 'learning_rate': 6.375861151291487e-06, 'epoch': 1.24} {'loss': 0.4977, 'learning_rate': 6.375556055954784e-06, 'epoch': 1.24} {'loss': 0.7446, 'learning_rate': 6.375250964502e-06, 'epoch': 1.24} {'loss': 0.5783, 'learning_rate': 6.374945876933457e-06, 'epoch': 1.24} {'loss': 0.5516, 'learning_rate': 6.374640793249493e-06, 'epoch': 1.24} {'loss': 0.4678, 'learning_rate': 6.374335713450423e-06, 'epoch': 1.24} {'loss': 0.4629, 'learning_rate': 6.374030637536584e-06, 'epoch': 1.24} {'loss': 0.5644, 'learning_rate': 6.373725565508298e-06, 'epoch': 1.24} {'loss': 0.5672, 'learning_rate': 6.373420497365891e-06, 'epoch': 1.24} {'loss': 0.5198, 'learning_rate': 6.373115433109694e-06, 'epoch': 1.24} {'loss': 0.5409, 'learning_rate': 6.372810372740025e-06, 'epoch': 1.24} {'loss': 0.3893, 'learning_rate': 6.3725053162572225e-06, 'epoch': 1.24} {'loss': 0.6287, 'learning_rate': 6.372200263661608e-06, 'epoch': 1.24} {'loss': 0.5396, 'learning_rate': 6.371895214953503e-06, 'epoch': 1.24} {'loss': 0.4599, 'learning_rate': 6.371590170133245e-06, 'epoch': 1.24} {'loss': 0.5071, 'learning_rate': 6.3712851292011534e-06, 'epoch': 1.24} {'loss': 0.6315, 'learning_rate': 6.370980092157559e-06, 'epoch': 1.24} {'loss': 0.5176, 'learning_rate': 6.370675059002784e-06, 'epoch': 1.24} {'loss': 0.5348, 'learning_rate': 6.3703700297371605e-06, 'epoch': 1.24} {'loss': 0.4963, 'learning_rate': 6.370065004361015e-06, 'epoch': 1.24} {'loss': 0.7049, 'learning_rate': 6.369759982874667e-06, 'epoch': 1.24} {'loss': 0.4577, 'learning_rate': 6.369454965278454e-06, 'epoch': 1.24} {'loss': 0.6416, 'learning_rate': 6.369149951572695e-06, 'epoch': 1.24} {'loss': 0.6154, 'learning_rate': 6.368844941757721e-06, 'epoch': 1.24} {'loss': 0.5741, 'learning_rate': 6.3685399358338555e-06, 'epoch': 1.24} {'loss': 0.4618, 'learning_rate': 6.368234933801429e-06, 'epoch': 1.24} {'loss': 0.6783, 'learning_rate': 6.367929935660767e-06, 'epoch': 1.24} {'loss': 0.583, 'learning_rate': 6.367624941412191e-06, 'epoch': 1.24} {'loss': 0.3831, 'learning_rate': 6.367319951056039e-06, 'epoch': 1.24} {'loss': 0.6026, 'learning_rate': 6.367014964592628e-06, 'epoch': 1.24} {'loss': 0.5979, 'learning_rate': 6.366709982022291e-06, 'epoch': 1.24} {'loss': 0.4741, 'learning_rate': 6.3664050033453525e-06, 'epoch': 1.24} {'loss': 0.6039, 'learning_rate': 6.366100028562135e-06, 'epoch': 1.24} {'loss': 0.5106, 'learning_rate': 6.365795057672972e-06, 'epoch': 1.24} {'loss': 0.4905, 'learning_rate': 6.365490090678183e-06, 'epoch': 1.24} {'loss': 0.717, 'learning_rate': 6.365185127578106e-06, 'epoch': 1.24} {'loss': 0.3735, 'learning_rate': 6.364880168373058e-06, 'epoch': 1.24} {'loss': 0.5783, 'learning_rate': 6.3645752130633706e-06, 'epoch': 1.24} {'loss': 0.5214, 'learning_rate': 6.36427026164937e-06, 'epoch': 1.24} {'loss': 0.4591, 'learning_rate': 6.363965314131377e-06, 'epoch': 1.24} {'loss': 0.526, 'learning_rate': 6.363660370509728e-06, 'epoch': 1.24} {'loss': 0.5312, 'learning_rate': 6.36335543078474e-06, 'epoch': 1.24} {'loss': 0.4774, 'learning_rate': 6.3630504949567494e-06, 'epoch': 1.24} {'loss': 0.5018, 'learning_rate': 6.362745563026077e-06, 'epoch': 1.24} {'loss': 0.6525, 'learning_rate': 6.362440634993052e-06, 'epoch': 1.24} {'loss': 0.4388, 'learning_rate': 6.362135710858002e-06, 'epoch': 1.24} {'loss': 0.5903, 'learning_rate': 6.361830790621246e-06, 'epoch': 1.24} {'loss': 0.541, 'learning_rate': 6.361525874283121e-06, 'epoch': 1.24} {'loss': 0.6178, 'learning_rate': 6.361220961843948e-06, 'epoch': 1.24} {'loss': 0.5067, 'learning_rate': 6.360916053304056e-06, 'epoch': 1.24} {'loss': 0.5431, 'learning_rate': 6.360611148663771e-06, 'epoch': 1.24} {'loss': 0.4907, 'learning_rate': 6.360306247923419e-06, 'epoch': 1.24} {'loss': 0.4734, 'learning_rate': 6.360001351083329e-06, 'epoch': 1.24} {'loss': 0.5734, 'learning_rate': 6.359696458143821e-06, 'epoch': 1.24} {'loss': 0.5062, 'learning_rate': 6.3593915691052335e-06, 'epoch': 1.24} {'loss': 0.4753, 'learning_rate': 6.359086683967881e-06, 'epoch': 1.24} {'loss': 0.5496, 'learning_rate': 6.358781802732101e-06, 'epoch': 1.24} {'loss': 0.6542, 'learning_rate': 6.358476925398212e-06, 'epoch': 1.24} {'loss': 0.4391, 'learning_rate': 6.358172051966542e-06, 'epoch': 1.24} {'loss': 0.3601, 'learning_rate': 6.3578671824374225e-06, 'epoch': 1.24} {'loss': 0.6315, 'learning_rate': 6.357562316811172e-06, 'epoch': 1.24} {'loss': 0.5759, 'learning_rate': 6.357257455088128e-06, 'epoch': 1.24} {'loss': 0.572, 'learning_rate': 6.356952597268609e-06, 'epoch': 1.24} {'loss': 0.5158, 'learning_rate': 6.356647743352946e-06, 'epoch': 1.24} {'loss': 0.5144, 'learning_rate': 6.356342893341463e-06, 'epoch': 1.24} {'loss': 0.5659, 'learning_rate': 6.356038047234484e-06, 'epoch': 1.24} {'loss': 0.6432, 'learning_rate': 6.355733205032343e-06, 'epoch': 1.24} {'loss': 0.4257, 'learning_rate': 6.355428366735359e-06, 'epoch': 1.24} {'loss': 0.4782, 'learning_rate': 6.3551235323438655e-06, 'epoch': 1.24} {'loss': 0.5374, 'learning_rate': 6.354818701858187e-06, 'epoch': 1.24} {'loss': 0.3602, 'learning_rate': 6.354513875278647e-06, 'epoch': 1.24} {'loss': 0.5549, 'learning_rate': 6.354209052605578e-06, 'epoch': 1.24} {'loss': 0.5008, 'learning_rate': 6.353904233839297e-06, 'epoch': 1.24} {'loss': 0.6126, 'learning_rate': 6.353599418980141e-06, 'epoch': 1.24} {'loss': 0.5707, 'learning_rate': 6.353294608028429e-06, 'epoch': 1.24} {'loss': 0.5989, 'learning_rate': 6.352989800984495e-06, 'epoch': 1.24} {'loss': 0.5905, 'learning_rate': 6.352684997848662e-06, 'epoch': 1.24} {'loss': 0.5373, 'learning_rate': 6.352380198621253e-06, 'epoch': 1.24} {'loss': 0.4794, 'learning_rate': 6.3520754033026e-06, 'epoch': 1.24} {'loss': 0.6063, 'learning_rate': 6.3517706118930236e-06, 'epoch': 1.24} {'loss': 0.4691, 'learning_rate': 6.351465824392857e-06, 'epoch': 1.24} {'loss': 0.5895, 'learning_rate': 6.351161040802423e-06, 'epoch': 1.24} {'loss': 0.605, 'learning_rate': 6.350856261122052e-06, 'epoch': 1.24} {'loss': 0.488, 'learning_rate': 6.350551485352067e-06, 'epoch': 1.24} {'loss': 0.4964, 'learning_rate': 6.350246713492794e-06, 'epoch': 1.24} {'loss': 0.557, 'learning_rate': 6.349941945544563e-06, 'epoch': 1.24} {'loss': 0.5628, 'learning_rate': 6.349637181507695e-06, 'epoch': 1.24} {'loss': 0.517, 'learning_rate': 6.349332421382524e-06, 'epoch': 1.24} {'loss': 0.3746, 'learning_rate': 6.349027665169373e-06, 'epoch': 1.24} {'loss': 0.3877, 'learning_rate': 6.348722912868564e-06, 'epoch': 1.24} {'loss': 0.4926, 'learning_rate': 6.348418164480432e-06, 'epoch': 1.24} {'loss': 0.5807, 'learning_rate': 6.348113420005298e-06, 'epoch': 1.24} {'loss': 0.6039, 'learning_rate': 6.3478086794434915e-06, 'epoch': 1.24} {'loss': 0.6352, 'learning_rate': 6.347503942795333e-06, 'epoch': 1.24} {'loss': 0.5424, 'learning_rate': 6.347199210061159e-06, 'epoch': 1.24} {'loss': 0.4732, 'learning_rate': 6.34689448124129e-06, 'epoch': 1.24} {'loss': 0.4484, 'learning_rate': 6.34658975633605e-06, 'epoch': 1.24} {'loss': 0.6455, 'learning_rate': 6.346285035345771e-06, 'epoch': 1.24} {'loss': 0.5799, 'learning_rate': 6.345980318270778e-06, 'epoch': 1.24} {'loss': 0.5915, 'learning_rate': 6.345675605111396e-06, 'epoch': 1.24} {'loss': 0.4708, 'learning_rate': 6.345370895867955e-06, 'epoch': 1.24} {'loss': 0.6416, 'learning_rate': 6.345066190540774e-06, 'epoch': 1.24} {'loss': 0.5666, 'learning_rate': 6.344761489130189e-06, 'epoch': 1.24} {'loss': 0.581, 'learning_rate': 6.344456791636518e-06, 'epoch': 1.24} {'loss': 0.5119, 'learning_rate': 6.344152098060094e-06, 'epoch': 1.24} {'loss': 0.6312, 'learning_rate': 6.3438474084012405e-06, 'epoch': 1.24} {'loss': 0.4445, 'learning_rate': 6.343542722660285e-06, 'epoch': 1.24} {'loss': 0.5101, 'learning_rate': 6.343238040837553e-06, 'epoch': 1.24} {'loss': 0.5643, 'learning_rate': 6.34293336293337e-06, 'epoch': 1.24} {'loss': 0.5565, 'learning_rate': 6.342628688948067e-06, 'epoch': 1.24} {'loss': 0.5776, 'learning_rate': 6.342324018881962e-06, 'epoch': 1.24} {'loss': 0.573, 'learning_rate': 6.3420193527353935e-06, 'epoch': 1.24} {'loss': 0.715, 'learning_rate': 6.341714690508678e-06, 'epoch': 1.24} {'loss': 0.7449, 'learning_rate': 6.341410032202147e-06, 'epoch': 1.24} {'loss': 0.6733, 'learning_rate': 6.341105377816126e-06, 'epoch': 1.24} {'loss': 0.3461, 'learning_rate': 6.340800727350936e-06, 'epoch': 1.24} {'loss': 0.5565, 'learning_rate': 6.340496080806914e-06, 'epoch': 1.24} {'loss': 0.5853, 'learning_rate': 6.340191438184376e-06, 'epoch': 1.24} {'loss': 0.5348, 'learning_rate': 6.339886799483657e-06, 'epoch': 1.24} {'loss': 0.4935, 'learning_rate': 6.339582164705078e-06, 'epoch': 1.24} {'loss': 0.5385, 'learning_rate': 6.339277533848967e-06, 'epoch': 1.24} {'loss': 0.6104, 'learning_rate': 6.338972906915652e-06, 'epoch': 1.24} {'loss': 0.5962, 'learning_rate': 6.338668283905454e-06, 'epoch': 1.24} {'loss': 0.6459, 'learning_rate': 6.338363664818708e-06, 'epoch': 1.24} {'loss': 0.5198, 'learning_rate': 6.3380590496557334e-06, 'epoch': 1.24} {'loss': 0.5123, 'learning_rate': 6.337754438416859e-06, 'epoch': 1.24} {'loss': 0.4593, 'learning_rate': 6.337449831102414e-06, 'epoch': 1.24} {'loss': 0.5882, 'learning_rate': 6.337145227712718e-06, 'epoch': 1.24} {'loss': 0.6077, 'learning_rate': 6.336840628248104e-06, 'epoch': 1.24} {'loss': 0.5003, 'learning_rate': 6.336536032708893e-06, 'epoch': 1.24} {'loss': 0.5737, 'learning_rate': 6.336231441095419e-06, 'epoch': 1.24} {'loss': 0.6183, 'learning_rate': 6.335926853408e-06, 'epoch': 1.24} {'loss': 0.5841, 'learning_rate': 6.335622269646968e-06, 'epoch': 1.24} {'loss': 0.4855, 'learning_rate': 6.335317689812647e-06, 'epoch': 1.24} {'loss': 0.5032, 'learning_rate': 6.335013113905363e-06, 'epoch': 1.24} {'loss': 0.5163, 'learning_rate': 6.334708541925445e-06, 'epoch': 1.24} {'loss': 0.536, 'learning_rate': 6.334403973873214e-06, 'epoch': 1.24} {'loss': 0.5714, 'learning_rate': 6.334099409749004e-06, 'epoch': 1.24} {'loss': 0.6109, 'learning_rate': 6.333794849553137e-06, 'epoch': 1.24} {'loss': 0.6, 'learning_rate': 6.333490293285938e-06, 'epoch': 1.24} {'loss': 0.5091, 'learning_rate': 6.333185740947736e-06, 'epoch': 1.24} {'loss': 0.4989, 'learning_rate': 6.332881192538853e-06, 'epoch': 1.24} {'loss': 0.5457, 'learning_rate': 6.332576648059624e-06, 'epoch': 1.24} {'loss': 0.5347, 'learning_rate': 6.332272107510365e-06, 'epoch': 1.24} {'loss': 0.4643, 'learning_rate': 6.331967570891412e-06, 'epoch': 1.24} {'loss': 0.4598, 'learning_rate': 6.331663038203086e-06, 'epoch': 1.24} {'loss': 0.7083, 'learning_rate': 6.331358509445713e-06, 'epoch': 1.24} {'loss': 0.4125, 'learning_rate': 6.331053984619623e-06, 'epoch': 1.24} {'loss': 0.6203, 'learning_rate': 6.3307494637251345e-06, 'epoch': 1.24} {'loss': 0.5546, 'learning_rate': 6.3304449467625835e-06, 'epoch': 1.24} {'loss': 0.6111, 'learning_rate': 6.330140433732288e-06, 'epoch': 1.24} {'loss': 0.6562, 'learning_rate': 6.329835924634582e-06, 'epoch': 1.24} {'loss': 0.5223, 'learning_rate': 6.329531419469789e-06, 'epoch': 1.24} {'loss': 0.4751, 'learning_rate': 6.329226918238231e-06, 'epoch': 1.24} {'loss': 0.6612, 'learning_rate': 6.328922420940241e-06, 'epoch': 1.24} {'loss': 0.4837, 'learning_rate': 6.328617927576138e-06, 'epoch': 1.24} {'loss': 0.6491, 'learning_rate': 6.3283134381462545e-06, 'epoch': 1.24} {'loss': 0.6503, 'learning_rate': 6.328008952650916e-06, 'epoch': 1.24} {'loss': 0.4405, 'learning_rate': 6.327704471090443e-06, 'epoch': 1.24} {'loss': 0.6288, 'learning_rate': 6.327399993465169e-06, 'epoch': 1.24} {'loss': 0.5645, 'learning_rate': 6.327095519775417e-06, 'epoch': 1.24} {'loss': 0.5524, 'learning_rate': 6.326791050021516e-06, 'epoch': 1.24} {'loss': 0.4988, 'learning_rate': 6.326486584203783e-06, 'epoch': 1.24} {'loss': 0.5405, 'learning_rate': 6.326182122322559e-06, 'epoch': 1.24} {'loss': 0.6687, 'learning_rate': 6.3258776643781606e-06, 'epoch': 1.24} {'loss': 0.6882, 'learning_rate': 6.325573210370912e-06, 'epoch': 1.24} {'loss': 0.5306, 'learning_rate': 6.325268760301146e-06, 'epoch': 1.24} {'loss': 0.4796, 'learning_rate': 6.324964314169187e-06, 'epoch': 1.24} {'loss': 0.5103, 'learning_rate': 6.3246598719753606e-06, 'epoch': 1.24} {'loss': 0.4584, 'learning_rate': 6.3243554337199886e-06, 'epoch': 1.24} {'loss': 0.5664, 'learning_rate': 6.324050999403406e-06, 'epoch': 1.24} {'loss': 0.5011, 'learning_rate': 6.323746569025934e-06, 'epoch': 1.24} {'loss': 0.584, 'learning_rate': 6.323442142587897e-06, 'epoch': 1.24} {'loss': 0.3768, 'learning_rate': 6.323137720089626e-06, 'epoch': 1.24} {'loss': 0.4708, 'learning_rate': 6.322833301531444e-06, 'epoch': 1.24} {'loss': 0.4362, 'learning_rate': 6.322528886913679e-06, 'epoch': 1.24} {'loss': 0.5779, 'learning_rate': 6.3222244762366556e-06, 'epoch': 1.24} {'loss': 0.5263, 'learning_rate': 6.3219200695006975e-06, 'epoch': 1.24} {'loss': 0.5075, 'learning_rate': 6.321615666706139e-06, 'epoch': 1.24} {'loss': 0.4649, 'learning_rate': 6.321311267853296e-06, 'epoch': 1.24} {'loss': 0.5324, 'learning_rate': 6.321006872942504e-06, 'epoch': 1.24} {'loss': 0.5371, 'learning_rate': 6.320702481974084e-06, 'epoch': 1.24} {'loss': 0.4069, 'learning_rate': 6.320398094948366e-06, 'epoch': 1.24} {'loss': 0.6576, 'learning_rate': 6.3200937118656715e-06, 'epoch': 1.24} {'loss': 0.6259, 'learning_rate': 6.319789332726325e-06, 'epoch': 1.24} {'loss': 0.5596, 'learning_rate': 6.319484957530662e-06, 'epoch': 1.24} {'loss': 0.5643, 'learning_rate': 6.319180586278997e-06, 'epoch': 1.24} {'loss': 0.5618, 'learning_rate': 6.318876218971668e-06, 'epoch': 1.24} {'loss': 0.5163, 'learning_rate': 6.318571855608995e-06, 'epoch': 1.24} {'loss': 0.5618, 'learning_rate': 6.3182674961913015e-06, 'epoch': 1.24} {'loss': 0.5473, 'learning_rate': 6.317963140718919e-06, 'epoch': 1.24} {'loss': 0.6424, 'learning_rate': 6.317658789192169e-06, 'epoch': 1.24} {'loss': 0.545, 'learning_rate': 6.317354441611383e-06, 'epoch': 1.24} {'loss': 0.5095, 'learning_rate': 6.317050097976879e-06, 'epoch': 1.24} {'loss': 0.5913, 'learning_rate': 6.3167457582889934e-06, 'epoch': 1.24} {'loss': 0.5118, 'learning_rate': 6.316441422548046e-06, 'epoch': 1.24} {'loss': 0.6206, 'learning_rate': 6.3161370907543625e-06, 'epoch': 1.24} {'loss': 0.6076, 'learning_rate': 6.315832762908274e-06, 'epoch': 1.24} {'loss': 0.7145, 'learning_rate': 6.315528439010098e-06, 'epoch': 1.24} {'loss': 0.4338, 'learning_rate': 6.315224119060171e-06, 'epoch': 1.24} {'loss': 0.4765, 'learning_rate': 6.314919803058808e-06, 'epoch': 1.24} {'loss': 0.4853, 'learning_rate': 6.314615491006346e-06, 'epoch': 1.24} {'loss': 0.4306, 'learning_rate': 6.314311182903106e-06, 'epoch': 1.24} {'loss': 0.6703, 'learning_rate': 6.314006878749412e-06, 'epoch': 1.24} {'loss': 0.5866, 'learning_rate': 6.313702578545595e-06, 'epoch': 1.24} {'loss': 0.6297, 'learning_rate': 6.313398282291974e-06, 'epoch': 1.24} {'loss': 0.4909, 'learning_rate': 6.313093989988883e-06, 'epoch': 1.24} {'loss': 0.4802, 'learning_rate': 6.312789701636645e-06, 'epoch': 1.24} {'loss': 0.6014, 'learning_rate': 6.312485417235581e-06, 'epoch': 1.24} {'loss': 0.5789, 'learning_rate': 6.312181136786027e-06, 'epoch': 1.24} {'loss': 0.4323, 'learning_rate': 6.3118768602883e-06, 'epoch': 1.24} {'loss': 0.6598, 'learning_rate': 6.311572587742734e-06, 'epoch': 1.24} {'loss': 0.4551, 'learning_rate': 6.311268319149646e-06, 'epoch': 1.24} {'loss': 0.4699, 'learning_rate': 6.31096405450937e-06, 'epoch': 1.24} {'loss': 0.5236, 'learning_rate': 6.310659793822229e-06, 'epoch': 1.24} {'loss': 0.5972, 'learning_rate': 6.3103555370885485e-06, 'epoch': 1.24} {'loss': 0.4987, 'learning_rate': 6.3100512843086536e-06, 'epoch': 1.24} {'loss': 0.4227, 'learning_rate': 6.3097470354828735e-06, 'epoch': 1.24} {'loss': 0.6022, 'learning_rate': 6.309442790611533e-06, 'epoch': 1.24} {'loss': 0.6446, 'learning_rate': 6.309138549694954e-06, 'epoch': 1.24} {'loss': 0.6185, 'learning_rate': 6.308834312733471e-06, 'epoch': 1.24} {'loss': 0.4802, 'learning_rate': 6.308530079727404e-06, 'epoch': 1.24} {'loss': 0.6343, 'learning_rate': 6.308225850677079e-06, 'epoch': 1.24} {'loss': 0.563, 'learning_rate': 6.307921625582825e-06, 'epoch': 1.24} {'loss': 0.5871, 'learning_rate': 6.307617404444961e-06, 'epoch': 1.24} {'loss': 0.581, 'learning_rate': 6.307313187263824e-06, 'epoch': 1.24} {'loss': 0.4945, 'learning_rate': 6.307008974039733e-06, 'epoch': 1.24} {'loss': 0.4803, 'learning_rate': 6.306704764773012e-06, 'epoch': 1.24} {'loss': 0.6021, 'learning_rate': 6.306400559463994e-06, 'epoch': 1.24} {'loss': 0.5565, 'learning_rate': 6.306096358112999e-06, 'epoch': 1.24} {'loss': 0.5438, 'learning_rate': 6.305792160720357e-06, 'epoch': 1.24} {'loss': 0.6396, 'learning_rate': 6.305487967286388e-06, 'epoch': 1.24} {'loss': 0.6575, 'learning_rate': 6.305183777811426e-06, 'epoch': 1.24} {'loss': 0.6861, 'learning_rate': 6.304879592295794e-06, 'epoch': 1.24} {'loss': 0.5754, 'learning_rate': 6.304575410739813e-06, 'epoch': 1.24} {'loss': 0.6424, 'learning_rate': 6.304271233143815e-06, 'epoch': 1.24} {'loss': 0.6447, 'learning_rate': 6.303967059508125e-06, 'epoch': 1.24} {'loss': 0.6708, 'learning_rate': 6.303662889833068e-06, 'epoch': 1.24} {'loss': 0.4815, 'learning_rate': 6.303358724118965e-06, 'epoch': 1.24} {'loss': 0.5401, 'learning_rate': 6.303054562366152e-06, 'epoch': 1.24} {'loss': 0.529, 'learning_rate': 6.30275040457495e-06, 'epoch': 1.24} {'loss': 0.571, 'learning_rate': 6.302446250745679e-06, 'epoch': 1.24} {'loss': 0.6048, 'learning_rate': 6.302142100878676e-06, 'epoch': 1.24} {'loss': 0.607, 'learning_rate': 6.30183795497426e-06, 'epoch': 1.24} {'loss': 0.6227, 'learning_rate': 6.301533813032759e-06, 'epoch': 1.24} {'loss': 0.4783, 'learning_rate': 6.3012296750545e-06, 'epoch': 1.24} {'loss': 0.7227, 'learning_rate': 6.3009255410398015e-06, 'epoch': 1.24} {'loss': 0.5332, 'learning_rate': 6.3006214109890006e-06, 'epoch': 1.24} {'loss': 0.6239, 'learning_rate': 6.300317284902413e-06, 'epoch': 1.24} {'loss': 0.5398, 'learning_rate': 6.300013162780373e-06, 'epoch': 1.24} {'loss': 0.6628, 'learning_rate': 6.299709044623201e-06, 'epoch': 1.24} {'loss': 0.5789, 'learning_rate': 6.299404930431228e-06, 'epoch': 1.24} {'loss': 0.6495, 'learning_rate': 6.299100820204776e-06, 'epoch': 1.24} {'loss': 0.729, 'learning_rate': 6.2987967139441664e-06, 'epoch': 1.24} {'loss': 0.5354, 'learning_rate': 6.298492611649734e-06, 'epoch': 1.24} {'loss': 0.4854, 'learning_rate': 6.298188513321798e-06, 'epoch': 1.24} {'loss': 0.4531, 'learning_rate': 6.2978844189606915e-06, 'epoch': 1.24} {'loss': 0.4121, 'learning_rate': 6.297580328566732e-06, 'epoch': 1.24} {'loss': 0.5935, 'learning_rate': 6.297276242140253e-06, 'epoch': 1.24} {'loss': 0.5767, 'learning_rate': 6.296972159681576e-06, 'epoch': 1.24} {'loss': 0.5152, 'learning_rate': 6.2966680811910245e-06, 'epoch': 1.24} {'loss': 0.4842, 'learning_rate': 6.296364006668931e-06, 'epoch': 1.24} {'loss': 0.6445, 'learning_rate': 6.2960599361156125e-06, 'epoch': 1.24} {'loss': 0.6299, 'learning_rate': 6.2957558695314054e-06, 'epoch': 1.24} {'loss': 0.5219, 'learning_rate': 6.29545180691663e-06, 'epoch': 1.24} {'loss': 0.6278, 'learning_rate': 6.2951477482716105e-06, 'epoch': 1.24} {'loss': 0.4672, 'learning_rate': 6.2948436935966765e-06, 'epoch': 1.24} {'loss': 0.5041, 'learning_rate': 6.294539642892148e-06, 'epoch': 1.24} {'loss': 0.573, 'learning_rate': 6.294235596158358e-06, 'epoch': 1.24} {'loss': 0.4843, 'learning_rate': 6.293931553395625e-06, 'epoch': 1.24} {'loss': 0.5548, 'learning_rate': 6.293627514604283e-06, 'epoch': 1.24} {'loss': 0.4215, 'learning_rate': 6.293323479784655e-06, 'epoch': 1.24} {'loss': 0.4666, 'learning_rate': 6.293019448937062e-06, 'epoch': 1.24} {'loss': 0.5046, 'learning_rate': 6.292715422061834e-06, 'epoch': 1.24} {'loss': 0.5524, 'learning_rate': 6.292411399159295e-06, 'epoch': 1.24} {'loss': 0.4753, 'learning_rate': 6.292107380229775e-06, 'epoch': 1.24} {'loss': 0.5891, 'learning_rate': 6.291803365273596e-06, 'epoch': 1.24} {'loss': 0.5848, 'learning_rate': 6.291499354291079e-06, 'epoch': 1.24} {'loss': 0.6862, 'learning_rate': 6.291195347282562e-06, 'epoch': 1.24} {'loss': 0.5367, 'learning_rate': 6.2908913442483595e-06, 'epoch': 1.24} {'loss': 0.6336, 'learning_rate': 6.290587345188806e-06, 'epoch': 1.24} {'loss': 0.5149, 'learning_rate': 6.290283350104217e-06, 'epoch': 1.24} {'loss': 0.6492, 'learning_rate': 6.289979358994929e-06, 'epoch': 1.24} {'loss': 0.6286, 'learning_rate': 6.289675371861262e-06, 'epoch': 1.24} {'loss': 0.5561, 'learning_rate': 6.28937138870354e-06, 'epoch': 1.24} {'loss': 0.6228, 'learning_rate': 6.289067409522095e-06, 'epoch': 1.24} {'loss': 0.4506, 'learning_rate': 6.288763434317247e-06, 'epoch': 1.24} {'loss': 0.6153, 'learning_rate': 6.288459463089327e-06, 'epoch': 1.24} {'loss': 0.5676, 'learning_rate': 6.288155495838653e-06, 'epoch': 1.24} {'loss': 0.5189, 'learning_rate': 6.287851532565558e-06, 'epoch': 1.24} {'loss': 0.621, 'learning_rate': 6.287547573270367e-06, 'epoch': 1.24} {'loss': 0.6468, 'learning_rate': 6.2872436179534015e-06, 'epoch': 1.24} {'loss': 0.5299, 'learning_rate': 6.286939666614989e-06, 'epoch': 1.24} {'loss': 0.5504, 'learning_rate': 6.286635719255456e-06, 'epoch': 1.24} {'loss': 0.5542, 'learning_rate': 6.28633177587513e-06, 'epoch': 1.24} {'loss': 0.554, 'learning_rate': 6.286027836474335e-06, 'epoch': 1.24} {'loss': 0.6491, 'learning_rate': 6.285723901053391e-06, 'epoch': 1.24} {'loss': 0.6006, 'learning_rate': 6.285419969612635e-06, 'epoch': 1.24} {'loss': 0.5309, 'learning_rate': 6.2851160421523835e-06, 'epoch': 1.24} {'loss': 0.6133, 'learning_rate': 6.284812118672968e-06, 'epoch': 1.24} {'loss': 0.5187, 'learning_rate': 6.2845081991747085e-06, 'epoch': 1.24} {'loss': 0.617, 'learning_rate': 6.284204283657936e-06, 'epoch': 1.24} {'loss': 0.4583, 'learning_rate': 6.283900372122975e-06, 'epoch': 1.24} {'loss': 0.5105, 'learning_rate': 6.283596464570146e-06, 'epoch': 1.24} {'loss': 0.5157, 'learning_rate': 6.283292560999783e-06, 'epoch': 1.24} {'loss': 0.3719, 'learning_rate': 6.282988661412204e-06, 'epoch': 1.24} {'loss': 0.6899, 'learning_rate': 6.282684765807741e-06, 'epoch': 1.24} {'loss': 0.5016, 'learning_rate': 6.282380874186713e-06, 'epoch': 1.24} {'loss': 0.5917, 'learning_rate': 6.282076986549455e-06, 'epoch': 1.24} {'loss': 0.4566, 'learning_rate': 6.281773102896285e-06, 'epoch': 1.24} {'loss': 0.5353, 'learning_rate': 6.281469223227527e-06, 'epoch': 1.24} {'loss': 0.5056, 'learning_rate': 6.2811653475435155e-06, 'epoch': 1.24} {'loss': 0.5616, 'learning_rate': 6.2808614758445685e-06, 'epoch': 1.24} {'loss': 0.5811, 'learning_rate': 6.280557608131015e-06, 'epoch': 1.24} {'loss': 0.425, 'learning_rate': 6.280253744403181e-06, 'epoch': 1.24} {'loss': 0.5033, 'learning_rate': 6.279949884661386e-06, 'epoch': 1.25} {'loss': 0.5189, 'learning_rate': 6.279646028905965e-06, 'epoch': 1.25} {'loss': 0.6359, 'learning_rate': 6.279342177137236e-06, 'epoch': 1.25} {'loss': 0.531, 'learning_rate': 6.279038329355529e-06, 'epoch': 1.25} {'loss': 0.5291, 'learning_rate': 6.278734485561168e-06, 'epoch': 1.25} {'loss': 0.4848, 'learning_rate': 6.278430645754481e-06, 'epoch': 1.25} {'loss': 0.6074, 'learning_rate': 6.27812680993579e-06, 'epoch': 1.25} {'loss': 0.5475, 'learning_rate': 6.277822978105419e-06, 'epoch': 1.25} {'loss': 0.5457, 'learning_rate': 6.277519150263702e-06, 'epoch': 1.25} {'loss': 0.6309, 'learning_rate': 6.277215326410954e-06, 'epoch': 1.25} {'loss': 0.549, 'learning_rate': 6.276911506547509e-06, 'epoch': 1.25} {'loss': 0.4591, 'learning_rate': 6.276607690673688e-06, 'epoch': 1.25} {'loss': 0.5549, 'learning_rate': 6.27630387878982e-06, 'epoch': 1.25} {'loss': 0.4973, 'learning_rate': 6.276000070896229e-06, 'epoch': 1.25} {'loss': 0.5878, 'learning_rate': 6.275696266993236e-06, 'epoch': 1.25} {'loss': 0.5136, 'learning_rate': 6.275392467081174e-06, 'epoch': 1.25} {'loss': 0.5595, 'learning_rate': 6.275088671160361e-06, 'epoch': 1.25} {'loss': 0.5382, 'learning_rate': 6.27478487923113e-06, 'epoch': 1.25} {'loss': 0.573, 'learning_rate': 6.274481091293805e-06, 'epoch': 1.25} {'loss': 0.5255, 'learning_rate': 6.2741773073487065e-06, 'epoch': 1.25} {'loss': 0.5871, 'learning_rate': 6.273873527396166e-06, 'epoch': 1.25} {'loss': 0.5437, 'learning_rate': 6.273569751436501e-06, 'epoch': 1.25} {'loss': 0.4905, 'learning_rate': 6.273265979470049e-06, 'epoch': 1.25} {'loss': 0.4513, 'learning_rate': 6.272962211497122e-06, 'epoch': 1.25} {'loss': 0.63, 'learning_rate': 6.272658447518059e-06, 'epoch': 1.25} {'loss': 0.5944, 'learning_rate': 6.2723546875331775e-06, 'epoch': 1.25} {'loss': 0.6073, 'learning_rate': 6.272050931542801e-06, 'epoch': 1.25} {'loss': 0.5264, 'learning_rate': 6.271747179547263e-06, 'epoch': 1.25} {'loss': 0.4938, 'learning_rate': 6.271443431546879e-06, 'epoch': 1.25} {'loss': 0.5102, 'learning_rate': 6.271139687541984e-06, 'epoch': 1.25} {'loss': 0.4289, 'learning_rate': 6.270835947532895e-06, 'epoch': 1.25} {'loss': 0.6155, 'learning_rate': 6.2705322115199465e-06, 'epoch': 1.25} {'loss': 0.5139, 'learning_rate': 6.27022847950346e-06, 'epoch': 1.25} {'loss': 0.5596, 'learning_rate': 6.269924751483757e-06, 'epoch': 1.25} {'loss': 0.558, 'learning_rate': 6.269621027461168e-06, 'epoch': 1.25} {'loss': 0.6188, 'learning_rate': 6.269317307436013e-06, 'epoch': 1.25} {'loss': 0.7584, 'learning_rate': 6.269013591408626e-06, 'epoch': 1.25} {'loss': 0.4259, 'learning_rate': 6.268709879379329e-06, 'epoch': 1.25} {'loss': 0.4849, 'learning_rate': 6.26840617134844e-06, 'epoch': 1.25} {'loss': 0.479, 'learning_rate': 6.268102467316295e-06, 'epoch': 1.25} {'loss': 0.5962, 'learning_rate': 6.267798767283213e-06, 'epoch': 1.25} {'loss': 0.6173, 'learning_rate': 6.267495071249523e-06, 'epoch': 1.25} {'loss': 0.5125, 'learning_rate': 6.267191379215546e-06, 'epoch': 1.25} {'loss': 0.6189, 'learning_rate': 6.266887691181614e-06, 'epoch': 1.25} {'loss': 0.5946, 'learning_rate': 6.266584007148049e-06, 'epoch': 1.25} {'loss': 0.6863, 'learning_rate': 6.266280327115172e-06, 'epoch': 1.25} {'loss': 0.4775, 'learning_rate': 6.265976651083317e-06, 'epoch': 1.25} {'loss': 0.5594, 'learning_rate': 6.265672979052802e-06, 'epoch': 1.25} {'loss': 0.7114, 'learning_rate': 6.265369311023958e-06, 'epoch': 1.25} {'loss': 0.4701, 'learning_rate': 6.265065646997107e-06, 'epoch': 1.25} {'loss': 0.5871, 'learning_rate': 6.264761986972571e-06, 'epoch': 1.25} {'loss': 0.4695, 'learning_rate': 6.264458330950687e-06, 'epoch': 1.25} {'loss': 0.4944, 'learning_rate': 6.264154678931769e-06, 'epoch': 1.25} {'loss': 0.5604, 'learning_rate': 6.263851030916145e-06, 'epoch': 1.25} {'loss': 0.4903, 'learning_rate': 6.263547386904143e-06, 'epoch': 1.25} {'loss': 0.4802, 'learning_rate': 6.263243746896089e-06, 'epoch': 1.25} {'loss': 0.5449, 'learning_rate': 6.2629401108923075e-06, 'epoch': 1.25} {'loss': 0.5787, 'learning_rate': 6.262636478893118e-06, 'epoch': 1.25} {'loss': 0.4903, 'learning_rate': 6.262332850898856e-06, 'epoch': 1.25} {'loss': 0.6104, 'learning_rate': 6.262029226909838e-06, 'epoch': 1.25} {'loss': 0.5175, 'learning_rate': 6.261725606926396e-06, 'epoch': 1.25} {'loss': 0.5722, 'learning_rate': 6.261421990948848e-06, 'epoch': 1.25} {'loss': 0.531, 'learning_rate': 6.261118378977529e-06, 'epoch': 1.25} {'loss': 0.4774, 'learning_rate': 6.260814771012758e-06, 'epoch': 1.25} {'loss': 0.5162, 'learning_rate': 6.260511167054857e-06, 'epoch': 1.25} {'loss': 0.6072, 'learning_rate': 6.26020756710416e-06, 'epoch': 1.25} {'loss': 0.4632, 'learning_rate': 6.259903971160988e-06, 'epoch': 1.25} {'loss': 0.556, 'learning_rate': 6.2596003792256665e-06, 'epoch': 1.25} {'loss': 0.445, 'learning_rate': 6.259296791298522e-06, 'epoch': 1.25} {'loss': 0.5561, 'learning_rate': 6.258993207379873e-06, 'epoch': 1.25} {'loss': 0.5421, 'learning_rate': 6.258689627470056e-06, 'epoch': 1.25} {'loss': 0.5551, 'learning_rate': 6.258386051569385e-06, 'epoch': 1.25} {'loss': 0.5066, 'learning_rate': 6.2580824796781955e-06, 'epoch': 1.25} {'loss': 0.7285, 'learning_rate': 6.257778911796808e-06, 'epoch': 1.25} {'loss': 0.5098, 'learning_rate': 6.257475347925549e-06, 'epoch': 1.25} {'loss': 0.485, 'learning_rate': 6.2571717880647435e-06, 'epoch': 1.25} {'loss': 0.5715, 'learning_rate': 6.256868232214712e-06, 'epoch': 1.25} {'loss': 0.5442, 'learning_rate': 6.256564680375787e-06, 'epoch': 1.25} {'loss': 0.5843, 'learning_rate': 6.256261132548288e-06, 'epoch': 1.25} {'loss': 0.5395, 'learning_rate': 6.255957588732546e-06, 'epoch': 1.25} {'loss': 0.5246, 'learning_rate': 6.255654048928883e-06, 'epoch': 1.25} {'loss': 0.5965, 'learning_rate': 6.255350513137626e-06, 'epoch': 1.25} {'loss': 0.6304, 'learning_rate': 6.255046981359098e-06, 'epoch': 1.25} {'loss': 0.6788, 'learning_rate': 6.2547434535936214e-06, 'epoch': 1.25} {'loss': 0.5774, 'learning_rate': 6.254439929841531e-06, 'epoch': 1.25} {'loss': 0.5986, 'learning_rate': 6.2541364101031395e-06, 'epoch': 1.25} {'loss': 0.5438, 'learning_rate': 6.253832894378785e-06, 'epoch': 1.25} {'loss': 0.552, 'learning_rate': 6.253529382668786e-06, 'epoch': 1.25} {'loss': 0.5177, 'learning_rate': 6.253225874973466e-06, 'epoch': 1.25} {'loss': 0.4735, 'learning_rate': 6.252922371293155e-06, 'epoch': 1.25} {'loss': 0.4703, 'learning_rate': 6.252618871628172e-06, 'epoch': 1.25} {'loss': 0.3063, 'learning_rate': 6.2523153759788506e-06, 'epoch': 1.25} {'loss': 0.6919, 'learning_rate': 6.252011884345507e-06, 'epoch': 1.25} {'loss': 0.5565, 'learning_rate': 6.251708396728476e-06, 'epoch': 1.25} {'loss': 0.5974, 'learning_rate': 6.251404913128075e-06, 'epoch': 1.25} {'loss': 0.5309, 'learning_rate': 6.251101433544632e-06, 'epoch': 1.25} {'loss': 0.6205, 'learning_rate': 6.250797957978474e-06, 'epoch': 1.25} {'loss': 0.6051, 'learning_rate': 6.25049448642992e-06, 'epoch': 1.25} {'loss': 0.4574, 'learning_rate': 6.2501910188993035e-06, 'epoch': 1.25} {'loss': 0.4716, 'learning_rate': 6.249887555386942e-06, 'epoch': 1.25} {'loss': 0.6547, 'learning_rate': 6.249584095893169e-06, 'epoch': 1.25} {'loss': 0.4543, 'learning_rate': 6.249280640418305e-06, 'epoch': 1.25} {'loss': 0.4667, 'learning_rate': 6.248977188962673e-06, 'epoch': 1.25} {'loss': 0.481, 'learning_rate': 6.248673741526601e-06, 'epoch': 1.25} {'loss': 0.5273, 'learning_rate': 6.248370298110411e-06, 'epoch': 1.25} {'loss': 0.5458, 'learning_rate': 6.248066858714435e-06, 'epoch': 1.25} {'loss': 0.5642, 'learning_rate': 6.247763423338995e-06, 'epoch': 1.25} {'loss': 0.4636, 'learning_rate': 6.247459991984409e-06, 'epoch': 1.25} {'loss': 0.5951, 'learning_rate': 6.247156564651013e-06, 'epoch': 1.25} {'loss': 0.4922, 'learning_rate': 6.246853141339126e-06, 'epoch': 1.25} {'loss': 0.6232, 'learning_rate': 6.246549722049077e-06, 'epoch': 1.25} {'loss': 0.5317, 'learning_rate': 6.246246306781184e-06, 'epoch': 1.25} {'loss': 0.6251, 'learning_rate': 6.2459428955357814e-06, 'epoch': 1.25} {'loss': 0.4191, 'learning_rate': 6.245639488313189e-06, 'epoch': 1.25} {'loss': 0.4939, 'learning_rate': 6.245336085113729e-06, 'epoch': 1.25} {'loss': 0.4727, 'learning_rate': 6.245032685937735e-06, 'epoch': 1.25} {'loss': 0.6058, 'learning_rate': 6.244729290785525e-06, 'epoch': 1.25} {'loss': 0.6434, 'learning_rate': 6.244425899657428e-06, 'epoch': 1.25} {'loss': 0.6101, 'learning_rate': 6.244122512553763e-06, 'epoch': 1.25} {'loss': 0.5473, 'learning_rate': 6.243819129474865e-06, 'epoch': 1.25} {'loss': 0.642, 'learning_rate': 6.243515750421054e-06, 'epoch': 1.25} {'loss': 0.4417, 'learning_rate': 6.24321237539265e-06, 'epoch': 1.25} {'loss': 0.4833, 'learning_rate': 6.2429090043899876e-06, 'epoch': 1.25} {'loss': 0.5684, 'learning_rate': 6.242605637413386e-06, 'epoch': 1.25} {'loss': 0.5336, 'learning_rate': 6.242302274463172e-06, 'epoch': 1.25} {'loss': 0.6573, 'learning_rate': 6.241998915539671e-06, 'epoch': 1.25} {'loss': 0.5128, 'learning_rate': 6.241695560643203e-06, 'epoch': 1.25} {'loss': 0.6303, 'learning_rate': 6.241392209774102e-06, 'epoch': 1.25} {'loss': 0.4289, 'learning_rate': 6.241088862932686e-06, 'epoch': 1.25} {'loss': 0.5089, 'learning_rate': 6.240785520119282e-06, 'epoch': 1.25} {'loss': 0.5309, 'learning_rate': 6.2404821813342175e-06, 'epoch': 1.25} {'loss': 0.6244, 'learning_rate': 6.240178846577816e-06, 'epoch': 1.25} {'loss': 0.5289, 'learning_rate': 6.239875515850402e-06, 'epoch': 1.25} {'loss': 0.4538, 'learning_rate': 6.239572189152298e-06, 'epoch': 1.25} {'loss': 0.5359, 'learning_rate': 6.2392688664838354e-06, 'epoch': 1.25} {'loss': 0.6725, 'learning_rate': 6.238965547845333e-06, 'epoch': 1.25} {'loss': 0.7503, 'learning_rate': 6.2386622332371216e-06, 'epoch': 1.25} {'loss': 0.5979, 'learning_rate': 6.2383589226595195e-06, 'epoch': 1.25} {'loss': 0.3916, 'learning_rate': 6.2380556161128565e-06, 'epoch': 1.25} {'loss': 0.6382, 'learning_rate': 6.237752313597458e-06, 'epoch': 1.25} {'loss': 0.6356, 'learning_rate': 6.237449015113645e-06, 'epoch': 1.25} {'loss': 0.6507, 'learning_rate': 6.237145720661748e-06, 'epoch': 1.25} {'loss': 0.5615, 'learning_rate': 6.236842430242086e-06, 'epoch': 1.25} {'loss': 0.5268, 'learning_rate': 6.23653914385499e-06, 'epoch': 1.25} {'loss': 0.5897, 'learning_rate': 6.236235861500779e-06, 'epoch': 1.25} {'loss': 0.4184, 'learning_rate': 6.235932583179783e-06, 'epoch': 1.25} {'loss': 0.4716, 'learning_rate': 6.235629308892324e-06, 'epoch': 1.25} {'loss': 0.5108, 'learning_rate': 6.2353260386387256e-06, 'epoch': 1.25} {'loss': 0.4059, 'learning_rate': 6.235022772419319e-06, 'epoch': 1.25} {'loss': 0.5219, 'learning_rate': 6.234719510234424e-06, 'epoch': 1.25} {'loss': 0.6334, 'learning_rate': 6.234416252084368e-06, 'epoch': 1.25} {'loss': 0.6122, 'learning_rate': 6.234112997969475e-06, 'epoch': 1.25} {'loss': 0.6985, 'learning_rate': 6.233809747890065e-06, 'epoch': 1.25} {'loss': 0.3852, 'learning_rate': 6.233506501846473e-06, 'epoch': 1.25} {'loss': 0.3902, 'learning_rate': 6.233203259839015e-06, 'epoch': 1.25} {'loss': 0.3832, 'learning_rate': 6.2329000218680225e-06, 'epoch': 1.25} {'loss': 0.5604, 'learning_rate': 6.232596787933819e-06, 'epoch': 1.25} {'loss': 0.522, 'learning_rate': 6.232293558036725e-06, 'epoch': 1.25} {'loss': 0.5439, 'learning_rate': 6.231990332177071e-06, 'epoch': 1.25} {'loss': 0.5721, 'learning_rate': 6.231687110355175e-06, 'epoch': 1.25} {'loss': 0.6851, 'learning_rate': 6.23138389257137e-06, 'epoch': 1.25} {'loss': 0.5956, 'learning_rate': 6.231080678825974e-06, 'epoch': 1.25} {'loss': 0.5159, 'learning_rate': 6.23077746911932e-06, 'epoch': 1.25} {'loss': 0.4422, 'learning_rate': 6.230474263451727e-06, 'epoch': 1.25} {'loss': 0.5612, 'learning_rate': 6.230171061823519e-06, 'epoch': 1.25} {'loss': 0.4513, 'learning_rate': 6.229867864235026e-06, 'epoch': 1.25} {'loss': 0.5646, 'learning_rate': 6.2295646706865655e-06, 'epoch': 1.25} {'loss': 0.5094, 'learning_rate': 6.22926148117847e-06, 'epoch': 1.25} {'loss': 0.5732, 'learning_rate': 6.228958295711056e-06, 'epoch': 1.25} {'loss': 0.503, 'learning_rate': 6.2286551142846604e-06, 'epoch': 1.25} {'loss': 0.5277, 'learning_rate': 6.2283519368995995e-06, 'epoch': 1.25} {'loss': 0.4807, 'learning_rate': 6.2280487635561986e-06, 'epoch': 1.25} {'loss': 0.6272, 'learning_rate': 6.227745594254786e-06, 'epoch': 1.25} {'loss': 0.4878, 'learning_rate': 6.227442428995679e-06, 'epoch': 1.25} {'loss': 0.5576, 'learning_rate': 6.227139267779214e-06, 'epoch': 1.25} {'loss': 0.6825, 'learning_rate': 6.226836110605708e-06, 'epoch': 1.25} {'loss': 0.5515, 'learning_rate': 6.226532957475484e-06, 'epoch': 1.25} {'loss': 0.6107, 'learning_rate': 6.226229808388875e-06, 'epoch': 1.25} {'loss': 0.534, 'learning_rate': 6.2259266633462e-06, 'epoch': 1.25} {'loss': 0.5393, 'learning_rate': 6.225623522347786e-06, 'epoch': 1.25} {'loss': 0.6097, 'learning_rate': 6.225320385393953e-06, 'epoch': 1.25} {'loss': 0.5059, 'learning_rate': 6.225017252485035e-06, 'epoch': 1.25} {'loss': 0.6001, 'learning_rate': 6.224714123621352e-06, 'epoch': 1.25} {'loss': 0.6397, 'learning_rate': 6.224410998803223e-06, 'epoch': 1.25} {'loss': 0.4716, 'learning_rate': 6.224107878030984e-06, 'epoch': 1.25} {'loss': 0.5522, 'learning_rate': 6.223804761304952e-06, 'epoch': 1.25} {'loss': 0.7075, 'learning_rate': 6.223501648625454e-06, 'epoch': 1.25} {'loss': 0.3734, 'learning_rate': 6.223198539992812e-06, 'epoch': 1.25} {'loss': 0.6208, 'learning_rate': 6.222895435407359e-06, 'epoch': 1.25} {'loss': 0.4043, 'learning_rate': 6.222592334869413e-06, 'epoch': 1.25} {'loss': 0.5154, 'learning_rate': 6.222289238379297e-06, 'epoch': 1.25} {'loss': 0.3827, 'learning_rate': 6.221986145937342e-06, 'epoch': 1.25} {'loss': 0.5148, 'learning_rate': 6.221683057543868e-06, 'epoch': 1.25} {'loss': 0.5927, 'learning_rate': 6.221379973199204e-06, 'epoch': 1.25} {'loss': 0.6635, 'learning_rate': 6.221076892903672e-06, 'epoch': 1.25} {'loss': 0.54, 'learning_rate': 6.2207738166575946e-06, 'epoch': 1.25} {'loss': 0.6079, 'learning_rate': 6.220470744461302e-06, 'epoch': 1.25} {'loss': 0.5491, 'learning_rate': 6.220167676315112e-06, 'epoch': 1.25} {'loss': 0.7024, 'learning_rate': 6.219864612219358e-06, 'epoch': 1.25} {'loss': 0.574, 'learning_rate': 6.219561552174358e-06, 'epoch': 1.25} {'loss': 0.7822, 'learning_rate': 6.219258496180441e-06, 'epoch': 1.25} {'loss': 0.5707, 'learning_rate': 6.2189554442379305e-06, 'epoch': 1.25} {'loss': 0.6571, 'learning_rate': 6.2186523963471446e-06, 'epoch': 1.25} {'loss': 0.5296, 'learning_rate': 6.218349352508419e-06, 'epoch': 1.25} {'loss': 0.4946, 'learning_rate': 6.21804631272207e-06, 'epoch': 1.25} {'loss': 0.4984, 'learning_rate': 6.2177432769884295e-06, 'epoch': 1.25} {'loss': 0.5377, 'learning_rate': 6.217440245307816e-06, 'epoch': 1.25} {'loss': 0.5576, 'learning_rate': 6.217137217680559e-06, 'epoch': 1.25} {'loss': 0.5716, 'learning_rate': 6.216834194106981e-06, 'epoch': 1.25} {'loss': 0.6761, 'learning_rate': 6.2165311745874024e-06, 'epoch': 1.25} {'loss': 0.4723, 'learning_rate': 6.216228159122155e-06, 'epoch': 1.25} {'loss': 0.6051, 'learning_rate': 6.215925147711561e-06, 'epoch': 1.25} {'loss': 0.5539, 'learning_rate': 6.215622140355943e-06, 'epoch': 1.25} {'loss': 0.4722, 'learning_rate': 6.21531913705563e-06, 'epoch': 1.25} {'loss': 0.5387, 'learning_rate': 6.215016137810942e-06, 'epoch': 1.25} {'loss': 0.6274, 'learning_rate': 6.214713142622209e-06, 'epoch': 1.25} {'loss': 0.4193, 'learning_rate': 6.214410151489747e-06, 'epoch': 1.25} {'loss': 0.4688, 'learning_rate': 6.21410716441389e-06, 'epoch': 1.25} {'loss': 0.5718, 'learning_rate': 6.213804181394958e-06, 'epoch': 1.25} {'loss': 0.4569, 'learning_rate': 6.2135012024332775e-06, 'epoch': 1.25} {'loss': 0.5736, 'learning_rate': 6.21319822752917e-06, 'epoch': 1.25} {'loss': 0.6225, 'learning_rate': 6.2128952566829635e-06, 'epoch': 1.25} {'loss': 0.6384, 'learning_rate': 6.212592289894983e-06, 'epoch': 1.25} {'loss': 0.59, 'learning_rate': 6.212289327165548e-06, 'epoch': 1.25} {'loss': 0.5736, 'learning_rate': 6.211986368494991e-06, 'epoch': 1.25} {'loss': 0.3607, 'learning_rate': 6.211683413883632e-06, 'epoch': 1.25} {'loss': 0.4373, 'learning_rate': 6.211380463331794e-06, 'epoch': 1.25} {'loss': 0.6646, 'learning_rate': 6.211077516839806e-06, 'epoch': 1.25} {'loss': 0.6193, 'learning_rate': 6.210774574407987e-06, 'epoch': 1.25} {'loss': 0.4804, 'learning_rate': 6.210471636036668e-06, 'epoch': 1.25} {'loss': 0.5841, 'learning_rate': 6.2101687017261666e-06, 'epoch': 1.25} {'loss': 0.6798, 'learning_rate': 6.209865771476817e-06, 'epoch': 1.25} {'loss': 0.4493, 'learning_rate': 6.209562845288937e-06, 'epoch': 1.25} {'loss': 0.5677, 'learning_rate': 6.209259923162852e-06, 'epoch': 1.25} {'loss': 0.5336, 'learning_rate': 6.208957005098888e-06, 'epoch': 1.25} {'loss': 0.5219, 'learning_rate': 6.208654091097364e-06, 'epoch': 1.25} {'loss': 0.6845, 'learning_rate': 6.208351181158614e-06, 'epoch': 1.25} {'loss': 0.4577, 'learning_rate': 6.208048275282954e-06, 'epoch': 1.25} {'loss': 0.6541, 'learning_rate': 6.207745373470717e-06, 'epoch': 1.25} {'loss': 0.5502, 'learning_rate': 6.207442475722223e-06, 'epoch': 1.25} {'loss': 0.5742, 'learning_rate': 6.207139582037793e-06, 'epoch': 1.25} {'loss': 0.6944, 'learning_rate': 6.206836692417759e-06, 'epoch': 1.25} {'loss': 0.4981, 'learning_rate': 6.206533806862438e-06, 'epoch': 1.25} {'loss': 0.606, 'learning_rate': 6.206230925372161e-06, 'epoch': 1.25} {'loss': 0.5371, 'learning_rate': 6.205928047947251e-06, 'epoch': 1.25} {'loss': 0.5837, 'learning_rate': 6.2056251745880285e-06, 'epoch': 1.25} {'loss': 0.597, 'learning_rate': 6.205322305294823e-06, 'epoch': 1.25} {'loss': 0.5216, 'learning_rate': 6.205019440067957e-06, 'epoch': 1.25} {'loss': 0.5385, 'learning_rate': 6.204716578907755e-06, 'epoch': 1.25} {'loss': 0.4516, 'learning_rate': 6.2044137218145394e-06, 'epoch': 1.25} {'loss': 0.4571, 'learning_rate': 6.20411086878864e-06, 'epoch': 1.25} {'loss': 0.6422, 'learning_rate': 6.20380801983038e-06, 'epoch': 1.25} {'loss': 0.4959, 'learning_rate': 6.2035051749400765e-06, 'epoch': 1.25} {'loss': 0.5797, 'learning_rate': 6.203202334118066e-06, 'epoch': 1.25} {'loss': 0.441, 'learning_rate': 6.202899497364663e-06, 'epoch': 1.25} {'loss': 0.4375, 'learning_rate': 6.202596664680198e-06, 'epoch': 1.25} {'loss': 0.5648, 'learning_rate': 6.2022938360649894e-06, 'epoch': 1.25} {'loss': 0.5409, 'learning_rate': 6.2019910115193716e-06, 'epoch': 1.25} {'loss': 0.6227, 'learning_rate': 6.201688191043662e-06, 'epoch': 1.25} {'loss': 0.6192, 'learning_rate': 6.201385374638183e-06, 'epoch': 1.25} {'loss': 0.512, 'learning_rate': 6.201082562303265e-06, 'epoch': 1.25} {'loss': 0.666, 'learning_rate': 6.200779754039228e-06, 'epoch': 1.25} {'loss': 0.4902, 'learning_rate': 6.200476949846401e-06, 'epoch': 1.25} {'loss': 0.4648, 'learning_rate': 6.200174149725106e-06, 'epoch': 1.25} {'loss': 0.6131, 'learning_rate': 6.199871353675662e-06, 'epoch': 1.25} {'loss': 0.6294, 'learning_rate': 6.199568561698405e-06, 'epoch': 1.25} {'loss': 0.5374, 'learning_rate': 6.199265773793648e-06, 'epoch': 1.25} {'loss': 0.6473, 'learning_rate': 6.198962989961725e-06, 'epoch': 1.25} {'loss': 0.4735, 'learning_rate': 6.198660210202955e-06, 'epoch': 1.25} {'loss': 0.5778, 'learning_rate': 6.198357434517664e-06, 'epoch': 1.25} {'loss': 0.5702, 'learning_rate': 6.198054662906178e-06, 'epoch': 1.25} {'loss': 0.4858, 'learning_rate': 6.197751895368814e-06, 'epoch': 1.25} {'loss': 0.5335, 'learning_rate': 6.1974491319059074e-06, 'epoch': 1.25} {'loss': 0.498, 'learning_rate': 6.197146372517773e-06, 'epoch': 1.25} {'loss': 0.4652, 'learning_rate': 6.196843617204742e-06, 'epoch': 1.25} {'loss': 0.5384, 'learning_rate': 6.196540865967136e-06, 'epoch': 1.25} {'loss': 0.5735, 'learning_rate': 6.19623811880528e-06, 'epoch': 1.25} {'loss': 0.6, 'learning_rate': 6.1959353757195e-06, 'epoch': 1.25} {'loss': 0.4997, 'learning_rate': 6.195632636710114e-06, 'epoch': 1.25} {'loss': 0.562, 'learning_rate': 6.195329901777454e-06, 'epoch': 1.25} {'loss': 0.4785, 'learning_rate': 6.195027170921839e-06, 'epoch': 1.25} {'loss': 0.5623, 'learning_rate': 6.194724444143599e-06, 'epoch': 1.25} {'loss': 0.5732, 'learning_rate': 6.194421721443056e-06, 'epoch': 1.25} {'loss': 0.5795, 'learning_rate': 6.19411900282053e-06, 'epoch': 1.25} {'loss': 0.3664, 'learning_rate': 6.193816288276352e-06, 'epoch': 1.25} {'loss': 0.6071, 'learning_rate': 6.193513577810839e-06, 'epoch': 1.25} {'loss': 0.5085, 'learning_rate': 6.193210871424324e-06, 'epoch': 1.25} {'loss': 0.6078, 'learning_rate': 6.192908169117124e-06, 'epoch': 1.25} {'loss': 0.6817, 'learning_rate': 6.192605470889568e-06, 'epoch': 1.25} {'loss': 0.5303, 'learning_rate': 6.1923027767419804e-06, 'epoch': 1.25} {'loss': 0.5642, 'learning_rate': 6.192000086674684e-06, 'epoch': 1.25} {'loss': 0.4352, 'learning_rate': 6.191697400688002e-06, 'epoch': 1.25} {'loss': 0.4401, 'learning_rate': 6.191394718782258e-06, 'epoch': 1.25} {'loss': 0.487, 'learning_rate': 6.1910920409577815e-06, 'epoch': 1.25} {'loss': 0.4504, 'learning_rate': 6.190789367214891e-06, 'epoch': 1.25} {'loss': 0.5156, 'learning_rate': 6.190486697553917e-06, 'epoch': 1.25} {'loss': 0.703, 'learning_rate': 6.190184031975177e-06, 'epoch': 1.25} {'loss': 0.6413, 'learning_rate': 6.1898813704789995e-06, 'epoch': 1.25} {'loss': 0.4876, 'learning_rate': 6.18957871306571e-06, 'epoch': 1.25} {'loss': 0.3875, 'learning_rate': 6.189276059735626e-06, 'epoch': 1.25} {'loss': 0.7275, 'learning_rate': 6.1889734104890805e-06, 'epoch': 1.25} {'loss': 0.4679, 'learning_rate': 6.188670765326396e-06, 'epoch': 1.25} {'loss': 0.5627, 'learning_rate': 6.188368124247891e-06, 'epoch': 1.25} {'loss': 0.5666, 'learning_rate': 6.1880654872538955e-06, 'epoch': 1.25} {'loss': 0.4942, 'learning_rate': 6.1877628543447284e-06, 'epoch': 1.25} {'loss': 0.6334, 'learning_rate': 6.1874602255207225e-06, 'epoch': 1.25} {'loss': 0.2706, 'learning_rate': 6.187157600782192e-06, 'epoch': 1.25} {'loss': 0.4616, 'learning_rate': 6.18685498012947e-06, 'epoch': 1.25} {'loss': 0.3716, 'learning_rate': 6.1865523635628766e-06, 'epoch': 1.25} {'loss': 0.5649, 'learning_rate': 6.1862497510827355e-06, 'epoch': 1.25} {'loss': 0.5006, 'learning_rate': 6.185947142689374e-06, 'epoch': 1.25} {'loss': 0.4137, 'learning_rate': 6.1856445383831106e-06, 'epoch': 1.25} {'loss': 0.696, 'learning_rate': 6.185341938164276e-06, 'epoch': 1.25} {'loss': 0.5476, 'learning_rate': 6.185039342033193e-06, 'epoch': 1.25} {'loss': 0.6638, 'learning_rate': 6.184736749990181e-06, 'epoch': 1.25} {'loss': 0.6273, 'learning_rate': 6.184434162035571e-06, 'epoch': 1.25} {'loss': 0.588, 'learning_rate': 6.184131578169683e-06, 'epoch': 1.25} {'loss': 0.5896, 'learning_rate': 6.183828998392843e-06, 'epoch': 1.25} {'loss': 0.4586, 'learning_rate': 6.1835264227053714e-06, 'epoch': 1.25} {'loss': 0.45, 'learning_rate': 6.1832238511076e-06, 'epoch': 1.25} {'loss': 0.6247, 'learning_rate': 6.182921283599848e-06, 'epoch': 1.25} {'loss': 0.5927, 'learning_rate': 6.182618720182438e-06, 'epoch': 1.25} {'loss': 0.5222, 'learning_rate': 6.182316160855699e-06, 'epoch': 1.25} {'loss': 0.6375, 'learning_rate': 6.182013605619952e-06, 'epoch': 1.25} {'loss': 0.5644, 'learning_rate': 6.1817110544755236e-06, 'epoch': 1.25} {'loss': 0.6116, 'learning_rate': 6.1814085074227316e-06, 'epoch': 1.25} {'loss': 0.4642, 'learning_rate': 6.181105964461908e-06, 'epoch': 1.25} {'loss': 0.6109, 'learning_rate': 6.180803425593377e-06, 'epoch': 1.25} {'loss': 0.5592, 'learning_rate': 6.1805008908174546e-06, 'epoch': 1.25} {'loss': 0.5555, 'learning_rate': 6.180198360134474e-06, 'epoch': 1.25} {'loss': 0.5486, 'learning_rate': 6.1798958335447535e-06, 'epoch': 1.25} {'loss': 0.5969, 'learning_rate': 6.1795933110486215e-06, 'epoch': 1.25} {'loss': 0.4931, 'learning_rate': 6.1792907926463996e-06, 'epoch': 1.25} {'loss': 0.6193, 'learning_rate': 6.178988278338409e-06, 'epoch': 1.25} {'loss': 0.4972, 'learning_rate': 6.178685768124982e-06, 'epoch': 1.25} {'loss': 0.5264, 'learning_rate': 6.178383262006433e-06, 'epoch': 1.25} {'loss': 0.7162, 'learning_rate': 6.1780807599830965e-06, 'epoch': 1.25} {'loss': 0.6907, 'learning_rate': 6.177778262055288e-06, 'epoch': 1.25} {'loss': 0.6552, 'learning_rate': 6.177475768223338e-06, 'epoch': 1.25} {'loss': 0.5812, 'learning_rate': 6.177173278487567e-06, 'epoch': 1.25} {'loss': 0.4971, 'learning_rate': 6.176870792848298e-06, 'epoch': 1.25} {'loss': 0.6123, 'learning_rate': 6.176568311305859e-06, 'epoch': 1.25} {'loss': 0.6309, 'learning_rate': 6.176265833860567e-06, 'epoch': 1.25} {'loss': 0.4851, 'learning_rate': 6.175963360512758e-06, 'epoch': 1.25} {'loss': 0.4736, 'learning_rate': 6.175660891262745e-06, 'epoch': 1.25} {'loss': 0.4917, 'learning_rate': 6.1753584261108605e-06, 'epoch': 1.25} {'loss': 0.4829, 'learning_rate': 6.1750559650574235e-06, 'epoch': 1.25} {'loss': 0.5309, 'learning_rate': 6.174753508102755e-06, 'epoch': 1.25} {'loss': 0.4843, 'learning_rate': 6.174451055247188e-06, 'epoch': 1.25} {'loss': 0.4963, 'learning_rate': 6.174148606491037e-06, 'epoch': 1.25} {'loss': 0.5385, 'learning_rate': 6.173846161834637e-06, 'epoch': 1.25} {'loss': 0.6118, 'learning_rate': 6.173543721278305e-06, 'epoch': 1.25} {'loss': 0.5737, 'learning_rate': 6.173241284822365e-06, 'epoch': 1.25} {'loss': 0.4331, 'learning_rate': 6.172938852467143e-06, 'epoch': 1.25} {'loss': 0.6, 'learning_rate': 6.1726364242129585e-06, 'epoch': 1.25} {'loss': 0.4925, 'learning_rate': 6.172334000060145e-06, 'epoch': 1.25} {'loss': 0.4849, 'learning_rate': 6.172031580009016e-06, 'epoch': 1.25} {'loss': 0.4842, 'learning_rate': 6.171729164059906e-06, 'epoch': 1.25} {'loss': 0.4641, 'learning_rate': 6.1714267522131325e-06, 'epoch': 1.25} {'loss': 0.5557, 'learning_rate': 6.171124344469017e-06, 'epoch': 1.25} {'loss': 0.5441, 'learning_rate': 6.1708219408278915e-06, 'epoch': 1.25} {'loss': 0.6461, 'learning_rate': 6.170519541290072e-06, 'epoch': 1.25} {'loss': 0.5704, 'learning_rate': 6.17021714585589e-06, 'epoch': 1.25} {'loss': 0.5803, 'learning_rate': 6.169914754525664e-06, 'epoch': 1.25} {'loss': 0.6144, 'learning_rate': 6.16961236729972e-06, 'epoch': 1.25} {'loss': 0.6106, 'learning_rate': 6.1693099841783845e-06, 'epoch': 1.25} {'loss': 0.5591, 'learning_rate': 6.1690076051619765e-06, 'epoch': 1.25} {'loss': 0.341, 'learning_rate': 6.1687052302508255e-06, 'epoch': 1.25} {'loss': 0.5935, 'learning_rate': 6.168402859445248e-06, 'epoch': 1.25} {'loss': 0.5579, 'learning_rate': 6.168100492745577e-06, 'epoch': 1.25} {'loss': 0.4935, 'learning_rate': 6.167798130152132e-06, 'epoch': 1.25} {'loss': 0.5195, 'learning_rate': 6.167495771665235e-06, 'epoch': 1.25} {'loss': 0.5617, 'learning_rate': 6.167193417285211e-06, 'epoch': 1.25} {'loss': 0.5306, 'learning_rate': 6.166891067012387e-06, 'epoch': 1.25} {'loss': 0.4301, 'learning_rate': 6.1665887208470864e-06, 'epoch': 1.25} {'loss': 0.463, 'learning_rate': 6.166286378789628e-06, 'epoch': 1.25} {'loss': 0.4757, 'learning_rate': 6.165984040840345e-06, 'epoch': 1.25} {'loss': 0.4958, 'learning_rate': 6.165681706999554e-06, 'epoch': 1.25} {'loss': 0.516, 'learning_rate': 6.165379377267581e-06, 'epoch': 1.25} {'loss': 0.5493, 'learning_rate': 6.16507705164475e-06, 'epoch': 1.25} {'loss': 0.5874, 'learning_rate': 6.1647747301313836e-06, 'epoch': 1.25} {'loss': 0.6427, 'learning_rate': 6.164472412727809e-06, 'epoch': 1.25} {'loss': 0.4596, 'learning_rate': 6.164170099434346e-06, 'epoch': 1.25} {'loss': 0.592, 'learning_rate': 6.163867790251323e-06, 'epoch': 1.25} {'loss': 0.5407, 'learning_rate': 6.163565485179064e-06, 'epoch': 1.25} {'loss': 0.417, 'learning_rate': 6.163263184217888e-06, 'epoch': 1.25} {'loss': 0.7441, 'learning_rate': 6.162960887368123e-06, 'epoch': 1.25} {'loss': 0.5454, 'learning_rate': 6.162658594630089e-06, 'epoch': 1.25} {'loss': 0.527, 'learning_rate': 6.162356306004117e-06, 'epoch': 1.25} {'loss': 0.4823, 'learning_rate': 6.162054021490526e-06, 'epoch': 1.25} {'loss': 0.5716, 'learning_rate': 6.161751741089637e-06, 'epoch': 1.25} {'loss': 0.5176, 'learning_rate': 6.16144946480178e-06, 'epoch': 1.25} {'loss': 0.5905, 'learning_rate': 6.161147192627275e-06, 'epoch': 1.25} {'loss': 0.5176, 'learning_rate': 6.160844924566449e-06, 'epoch': 1.25} {'loss': 0.554, 'learning_rate': 6.1605426606196206e-06, 'epoch': 1.25} {'loss': 0.5397, 'learning_rate': 6.1602404007871205e-06, 'epoch': 1.25} {'loss': 0.4899, 'learning_rate': 6.159938145069271e-06, 'epoch': 1.25} {'loss': 0.4698, 'learning_rate': 6.159635893466389e-06, 'epoch': 1.25} {'loss': 0.4138, 'learning_rate': 6.159333645978809e-06, 'epoch': 1.25} {'loss': 0.4437, 'learning_rate': 6.159031402606846e-06, 'epoch': 1.25} {'loss': 0.5925, 'learning_rate': 6.158729163350831e-06, 'epoch': 1.25} {'loss': 0.6731, 'learning_rate': 6.158426928211083e-06, 'epoch': 1.25} {'loss': 0.5908, 'learning_rate': 6.158124697187924e-06, 'epoch': 1.25} {'loss': 0.4601, 'learning_rate': 6.157822470281684e-06, 'epoch': 1.25} {'loss': 0.5568, 'learning_rate': 6.157520247492682e-06, 'epoch': 1.25} {'loss': 0.443, 'learning_rate': 6.157218028821248e-06, 'epoch': 1.25} {'loss': 0.677, 'learning_rate': 6.156915814267699e-06, 'epoch': 1.25} {'loss': 0.5886, 'learning_rate': 6.156613603832362e-06, 'epoch': 1.25} {'loss': 0.5152, 'learning_rate': 6.156311397515562e-06, 'epoch': 1.25} {'loss': 0.5589, 'learning_rate': 6.1560091953176175e-06, 'epoch': 1.25} {'loss': 0.5034, 'learning_rate': 6.155706997238859e-06, 'epoch': 1.25} {'loss': 0.5663, 'learning_rate': 6.155404803279603e-06, 'epoch': 1.25} {'loss': 0.6151, 'learning_rate': 6.155102613440183e-06, 'epoch': 1.25} {'loss': 0.599, 'learning_rate': 6.154800427720915e-06, 'epoch': 1.25} {'loss': 0.5072, 'learning_rate': 6.154498246122129e-06, 'epoch': 1.25} {'loss': 0.5424, 'learning_rate': 6.154196068644142e-06, 'epoch': 1.25} {'loss': 0.5028, 'learning_rate': 6.15389389528728e-06, 'epoch': 1.25} {'loss': 0.6347, 'learning_rate': 6.153591726051871e-06, 'epoch': 1.25} {'loss': 0.4626, 'learning_rate': 6.1532895609382316e-06, 'epoch': 1.25} {'loss': 0.6296, 'learning_rate': 6.152987399946693e-06, 'epoch': 1.25} {'loss': 0.4009, 'learning_rate': 6.152685243077577e-06, 'epoch': 1.25} {'loss': 0.4998, 'learning_rate': 6.152383090331202e-06, 'epoch': 1.25} {'loss': 0.5871, 'learning_rate': 6.152080941707899e-06, 'epoch': 1.25} {'loss': 0.4922, 'learning_rate': 6.151778797207983e-06, 'epoch': 1.25} {'loss': 0.5849, 'learning_rate': 6.151476656831789e-06, 'epoch': 1.25} {'loss': 0.4665, 'learning_rate': 6.151174520579631e-06, 'epoch': 1.25} {'loss': 0.5689, 'learning_rate': 6.1508723884518405e-06, 'epoch': 1.25} {'loss': 0.639, 'learning_rate': 6.150570260448738e-06, 'epoch': 1.25} {'loss': 0.4144, 'learning_rate': 6.150268136570645e-06, 'epoch': 1.25} {'loss': 0.5507, 'learning_rate': 6.14996601681789e-06, 'epoch': 1.25} {'loss': 0.516, 'learning_rate': 6.149663901190787e-06, 'epoch': 1.25} {'loss': 0.5341, 'learning_rate': 6.149361789689674e-06, 'epoch': 1.25} {'loss': 0.5402, 'learning_rate': 6.149059682314861e-06, 'epoch': 1.25} {'loss': 0.513, 'learning_rate': 6.148757579066683e-06, 'epoch': 1.25} {'loss': 0.3624, 'learning_rate': 6.148455479945459e-06, 'epoch': 1.25} {'loss': 0.547, 'learning_rate': 6.1481533849515095e-06, 'epoch': 1.25} {'loss': 0.5716, 'learning_rate': 6.1478512940851655e-06, 'epoch': 1.25} {'loss': 0.4937, 'learning_rate': 6.14754920734674e-06, 'epoch': 1.25} {'loss': 0.4096, 'learning_rate': 6.1472471247365685e-06, 'epoch': 1.25} {'loss': 0.6272, 'learning_rate': 6.146945046254969e-06, 'epoch': 1.25} {'loss': 0.6122, 'learning_rate': 6.146642971902263e-06, 'epoch': 1.25} {'loss': 0.5573, 'learning_rate': 6.146340901678779e-06, 'epoch': 1.25} {'loss': 0.4063, 'learning_rate': 6.146038835584838e-06, 'epoch': 1.25} {'loss': 0.4866, 'learning_rate': 6.145736773620765e-06, 'epoch': 1.25} {'loss': 0.6045, 'learning_rate': 6.1454347157868795e-06, 'epoch': 1.25} {'loss': 0.4851, 'learning_rate': 6.145132662083513e-06, 'epoch': 1.25} {'loss': 0.6043, 'learning_rate': 6.144830612510983e-06, 'epoch': 1.25} {'loss': 0.426, 'learning_rate': 6.144528567069613e-06, 'epoch': 1.25} {'loss': 0.5863, 'learning_rate': 6.144226525759733e-06, 'epoch': 1.25} {'loss': 0.584, 'learning_rate': 6.143924488581659e-06, 'epoch': 1.25} {'loss': 0.5701, 'learning_rate': 6.14362245553572e-06, 'epoch': 1.25} {'loss': 0.4513, 'learning_rate': 6.143320426622233e-06, 'epoch': 1.25} {'loss': 0.6032, 'learning_rate': 6.143018401841532e-06, 'epoch': 1.25} {'loss': 0.6561, 'learning_rate': 6.142716381193934e-06, 'epoch': 1.25} {'loss': 0.5094, 'learning_rate': 6.142414364679761e-06, 'epoch': 1.25} {'loss': 0.6544, 'learning_rate': 6.142112352299339e-06, 'epoch': 1.25} {'loss': 0.4834, 'learning_rate': 6.141810344052992e-06, 'epoch': 1.25} {'loss': 0.6282, 'learning_rate': 6.141508339941047e-06, 'epoch': 1.25} {'loss': 0.4509, 'learning_rate': 6.1412063399638235e-06, 'epoch': 1.25} {'loss': 0.4514, 'learning_rate': 6.140904344121641e-06, 'epoch': 1.25} {'loss': 0.5752, 'learning_rate': 6.14060235241483e-06, 'epoch': 1.25} {'loss': 0.6344, 'learning_rate': 6.140300364843712e-06, 'epoch': 1.25} {'loss': 0.4669, 'learning_rate': 6.139998381408614e-06, 'epoch': 1.25} {'loss': 0.3315, 'learning_rate': 6.139696402109849e-06, 'epoch': 1.25} {'loss': 0.4307, 'learning_rate': 6.1393944269477536e-06, 'epoch': 1.25} {'loss': 0.5366, 'learning_rate': 6.139092455922646e-06, 'epoch': 1.25} {'loss': 0.5111, 'learning_rate': 6.138790489034844e-06, 'epoch': 1.25} {'loss': 0.6816, 'learning_rate': 6.138488526284681e-06, 'epoch': 1.25} {'loss': 0.5439, 'learning_rate': 6.138186567672473e-06, 'epoch': 1.25} {'loss': 0.4748, 'learning_rate': 6.1378846131985506e-06, 'epoch': 1.25} {'loss': 0.6505, 'learning_rate': 6.1375826628632285e-06, 'epoch': 1.25} {'loss': 0.5425, 'learning_rate': 6.137280716666838e-06, 'epoch': 1.25} {'loss': 0.5141, 'learning_rate': 6.136978774609701e-06, 'epoch': 1.25} {'loss': 0.531, 'learning_rate': 6.136676836692137e-06, 'epoch': 1.25} {'loss': 0.6551, 'learning_rate': 6.136374902914475e-06, 'epoch': 1.25} {'loss': 0.6257, 'learning_rate': 6.1360729732770345e-06, 'epoch': 1.25} {'loss': 0.6069, 'learning_rate': 6.135771047780141e-06, 'epoch': 1.25} {'loss': 0.5309, 'learning_rate': 6.1354691264241195e-06, 'epoch': 1.25} {'loss': 0.6366, 'learning_rate': 6.1351672092092875e-06, 'epoch': 1.25} {'loss': 0.5114, 'learning_rate': 6.1348652961359765e-06, 'epoch': 1.25} {'loss': 0.5357, 'learning_rate': 6.134563387204502e-06, 'epoch': 1.25} {'loss': 0.5331, 'learning_rate': 6.134261482415196e-06, 'epoch': 1.26} {'loss': 0.6035, 'learning_rate': 6.133959581768374e-06, 'epoch': 1.26} {'loss': 0.6602, 'learning_rate': 6.133657685264367e-06, 'epoch': 1.26} {'loss': 0.5292, 'learning_rate': 6.133355792903495e-06, 'epoch': 1.26} {'loss': 0.4836, 'learning_rate': 6.133053904686076e-06, 'epoch': 1.26} {'loss': 0.468, 'learning_rate': 6.132752020612442e-06, 'epoch': 1.26} {'loss': 0.3924, 'learning_rate': 6.132450140682912e-06, 'epoch': 1.26} {'loss': 0.3552, 'learning_rate': 6.1321482648978124e-06, 'epoch': 1.26} {'loss': 0.5633, 'learning_rate': 6.131846393257467e-06, 'epoch': 1.26} {'loss': 0.5736, 'learning_rate': 6.131544525762194e-06, 'epoch': 1.26} {'loss': 0.5856, 'learning_rate': 6.131242662412322e-06, 'epoch': 1.26} {'loss': 0.4353, 'learning_rate': 6.130940803208169e-06, 'epoch': 1.26} {'loss': 0.4019, 'learning_rate': 6.130638948150068e-06, 'epoch': 1.26} {'loss': 0.5706, 'learning_rate': 6.13033709723833e-06, 'epoch': 1.26} {'loss': 0.6516, 'learning_rate': 6.130035250473289e-06, 'epoch': 1.26} {'loss': 0.5871, 'learning_rate': 6.129733407855266e-06, 'epoch': 1.26} {'loss': 0.6454, 'learning_rate': 6.129431569384581e-06, 'epoch': 1.26} {'loss': 0.66, 'learning_rate': 6.129129735061561e-06, 'epoch': 1.26} {'loss': 0.6738, 'learning_rate': 6.1288279048865226e-06, 'epoch': 1.26} {'loss': 0.6139, 'learning_rate': 6.1285260788598e-06, 'epoch': 1.26} {'loss': 0.7101, 'learning_rate': 6.128224256981706e-06, 'epoch': 1.26} {'loss': 0.5568, 'learning_rate': 6.127922439252574e-06, 'epoch': 1.26} {'loss': 0.4589, 'learning_rate': 6.127620625672723e-06, 'epoch': 1.26} {'loss': 0.5758, 'learning_rate': 6.127318816242474e-06, 'epoch': 1.26} {'loss': 0.4394, 'learning_rate': 6.127017010962153e-06, 'epoch': 1.26} {'loss': 0.5382, 'learning_rate': 6.126715209832079e-06, 'epoch': 1.26} {'loss': 0.4701, 'learning_rate': 6.1264134128525855e-06, 'epoch': 1.26} {'loss': 0.6083, 'learning_rate': 6.126111620023987e-06, 'epoch': 1.26} {'loss': 0.5202, 'learning_rate': 6.125809831346607e-06, 'epoch': 1.26} {'loss': 0.4384, 'learning_rate': 6.125508046820775e-06, 'epoch': 1.26} {'loss': 0.4775, 'learning_rate': 6.125206266446808e-06, 'epoch': 1.26} {'loss': 0.5341, 'learning_rate': 6.124904490225037e-06, 'epoch': 1.26} {'loss': 0.6458, 'learning_rate': 6.124602718155774e-06, 'epoch': 1.26} {'loss': 0.5956, 'learning_rate': 6.124300950239352e-06, 'epoch': 1.26} {'loss': 0.5977, 'learning_rate': 6.123999186476095e-06, 'epoch': 1.26} {'loss': 0.4817, 'learning_rate': 6.123697426866315e-06, 'epoch': 1.26} {'loss': 0.4822, 'learning_rate': 6.123395671410351e-06, 'epoch': 1.26} {'loss': 0.5339, 'learning_rate': 6.123093920108512e-06, 'epoch': 1.26} {'loss': 0.6305, 'learning_rate': 6.1227921729611326e-06, 'epoch': 1.26} {'loss': 0.3522, 'learning_rate': 6.1224904299685264e-06, 'epoch': 1.26} {'loss': 0.5533, 'learning_rate': 6.122188691131026e-06, 'epoch': 1.26} {'loss': 0.5683, 'learning_rate': 6.121886956448951e-06, 'epoch': 1.26} {'loss': 0.5178, 'learning_rate': 6.12158522592262e-06, 'epoch': 1.26} {'loss': 0.5672, 'learning_rate': 6.121283499552363e-06, 'epoch': 1.26} {'loss': 0.6469, 'learning_rate': 6.1209817773384996e-06, 'epoch': 1.26} {'loss': 0.5917, 'learning_rate': 6.120680059281357e-06, 'epoch': 1.26} {'loss': 0.6527, 'learning_rate': 6.120378345381255e-06, 'epoch': 1.26} {'loss': 0.5053, 'learning_rate': 6.120076635638515e-06, 'epoch': 1.26} {'loss': 0.6262, 'learning_rate': 6.119774930053466e-06, 'epoch': 1.26} {'loss': 0.6056, 'learning_rate': 6.119473228626426e-06, 'epoch': 1.26} {'loss': 0.579, 'learning_rate': 6.1191715313577215e-06, 'epoch': 1.26} {'loss': 0.674, 'learning_rate': 6.118869838247674e-06, 'epoch': 1.26} {'loss': 0.471, 'learning_rate': 6.118568149296611e-06, 'epoch': 1.26} {'loss': 0.5205, 'learning_rate': 6.118266464504852e-06, 'epoch': 1.26} {'loss': 0.5572, 'learning_rate': 6.117964783872716e-06, 'epoch': 1.26} {'loss': 0.5631, 'learning_rate': 6.1176631074005365e-06, 'epoch': 1.26} {'loss': 0.5681, 'learning_rate': 6.117361435088629e-06, 'epoch': 1.26} {'loss': 0.5822, 'learning_rate': 6.117059766937321e-06, 'epoch': 1.26} {'loss': 0.6616, 'learning_rate': 6.116758102946929e-06, 'epoch': 1.26} {'loss': 0.5985, 'learning_rate': 6.116456443117786e-06, 'epoch': 1.26} {'loss': 0.5297, 'learning_rate': 6.116154787450211e-06, 'epoch': 1.26} {'loss': 0.4594, 'learning_rate': 6.115853135944523e-06, 'epoch': 1.26} {'loss': 0.4133, 'learning_rate': 6.115551488601053e-06, 'epoch': 1.26} {'loss': 0.5462, 'learning_rate': 6.115249845420116e-06, 'epoch': 1.26} {'loss': 0.4677, 'learning_rate': 6.114948206402043e-06, 'epoch': 1.26} {'loss': 0.5347, 'learning_rate': 6.114646571547154e-06, 'epoch': 1.26} {'loss': 0.4283, 'learning_rate': 6.114344940855767e-06, 'epoch': 1.26} {'loss': 0.5324, 'learning_rate': 6.114043314328213e-06, 'epoch': 1.26} {'loss': 0.5642, 'learning_rate': 6.11374169196481e-06, 'epoch': 1.26} {'loss': 0.5748, 'learning_rate': 6.113440073765887e-06, 'epoch': 1.26} {'loss': 0.61, 'learning_rate': 6.113138459731763e-06, 'epoch': 1.26} {'loss': 0.6016, 'learning_rate': 6.112836849862762e-06, 'epoch': 1.26} {'loss': 0.5361, 'learning_rate': 6.112535244159208e-06, 'epoch': 1.26} {'loss': 0.4169, 'learning_rate': 6.112233642621419e-06, 'epoch': 1.26} {'loss': 0.5707, 'learning_rate': 6.111932045249727e-06, 'epoch': 1.26} {'loss': 0.5633, 'learning_rate': 6.111630452044448e-06, 'epoch': 1.26} {'loss': 0.5646, 'learning_rate': 6.111328863005909e-06, 'epoch': 1.26} {'loss': 0.4533, 'learning_rate': 6.111027278134432e-06, 'epoch': 1.26} {'loss': 0.4656, 'learning_rate': 6.110725697430342e-06, 'epoch': 1.26} {'loss': 0.614, 'learning_rate': 6.1104241208939605e-06, 'epoch': 1.26} {'loss': 0.5669, 'learning_rate': 6.110122548525606e-06, 'epoch': 1.26} {'loss': 0.5459, 'learning_rate': 6.109820980325611e-06, 'epoch': 1.26} {'loss': 0.5841, 'learning_rate': 6.1095194162942896e-06, 'epoch': 1.26} {'loss': 0.4565, 'learning_rate': 6.109217856431975e-06, 'epoch': 1.26} {'loss': 0.5254, 'learning_rate': 6.108916300738983e-06, 'epoch': 1.26} {'loss': 0.495, 'learning_rate': 6.108614749215635e-06, 'epoch': 1.26} {'loss': 0.4874, 'learning_rate': 6.108313201862261e-06, 'epoch': 1.26} {'loss': 0.545, 'learning_rate': 6.108011658679177e-06, 'epoch': 1.26} {'loss': 0.5995, 'learning_rate': 6.107710119666713e-06, 'epoch': 1.26} {'loss': 0.5576, 'learning_rate': 6.107408584825185e-06, 'epoch': 1.26} {'loss': 0.4776, 'learning_rate': 6.107107054154925e-06, 'epoch': 1.26} {'loss': 0.692, 'learning_rate': 6.10680552765625e-06, 'epoch': 1.26} {'loss': 0.5653, 'learning_rate': 6.106504005329483e-06, 'epoch': 1.26} {'loss': 0.5031, 'learning_rate': 6.106202487174951e-06, 'epoch': 1.26} {'loss': 0.6137, 'learning_rate': 6.105900973192969e-06, 'epoch': 1.26} {'loss': 0.6089, 'learning_rate': 6.105599463383869e-06, 'epoch': 1.26} {'loss': 0.6047, 'learning_rate': 6.105297957747973e-06, 'epoch': 1.26} {'loss': 0.4848, 'learning_rate': 6.104996456285596e-06, 'epoch': 1.26} {'loss': 0.4332, 'learning_rate': 6.10469495899707e-06, 'epoch': 1.26} {'loss': 0.4581, 'learning_rate': 6.104393465882715e-06, 'epoch': 1.26} {'loss': 0.4746, 'learning_rate': 6.104091976942856e-06, 'epoch': 1.26} {'loss': 0.5057, 'learning_rate': 6.103790492177809e-06, 'epoch': 1.26} {'loss': 0.4829, 'learning_rate': 6.103489011587906e-06, 'epoch': 1.26} {'loss': 0.5449, 'learning_rate': 6.103187535173467e-06, 'epoch': 1.26} {'loss': 0.4972, 'learning_rate': 6.102886062934809e-06, 'epoch': 1.26} {'loss': 0.7003, 'learning_rate': 6.102584594872267e-06, 'epoch': 1.26} {'loss': 0.6665, 'learning_rate': 6.102283130986153e-06, 'epoch': 1.26} {'loss': 0.5916, 'learning_rate': 6.101981671276798e-06, 'epoch': 1.26} {'loss': 0.7242, 'learning_rate': 6.101680215744517e-06, 'epoch': 1.26} {'loss': 0.5145, 'learning_rate': 6.1013787643896404e-06, 'epoch': 1.26} {'loss': 0.5378, 'learning_rate': 6.101077317212489e-06, 'epoch': 1.26} {'loss': 0.4691, 'learning_rate': 6.100775874213381e-06, 'epoch': 1.26} {'loss': 0.4301, 'learning_rate': 6.100474435392647e-06, 'epoch': 1.26} {'loss': 0.5519, 'learning_rate': 6.100173000750606e-06, 'epoch': 1.26} {'loss': 0.6661, 'learning_rate': 6.099871570287584e-06, 'epoch': 1.26} {'loss': 0.5615, 'learning_rate': 6.099570144003899e-06, 'epoch': 1.26} {'loss': 0.5554, 'learning_rate': 6.099268721899874e-06, 'epoch': 1.26} {'loss': 0.664, 'learning_rate': 6.098967303975839e-06, 'epoch': 1.26} {'loss': 0.5047, 'learning_rate': 6.0986658902321085e-06, 'epoch': 1.26} {'loss': 0.5847, 'learning_rate': 6.0983644806690135e-06, 'epoch': 1.26} {'loss': 0.3849, 'learning_rate': 6.098063075286871e-06, 'epoch': 1.26} {'loss': 0.5791, 'learning_rate': 6.097761674086009e-06, 'epoch': 1.26} {'loss': 0.5142, 'learning_rate': 6.0974602770667465e-06, 'epoch': 1.26} {'loss': 0.5501, 'learning_rate': 6.097158884229404e-06, 'epoch': 1.26} {'loss': 0.7195, 'learning_rate': 6.096857495574311e-06, 'epoch': 1.26} {'loss': 0.5562, 'learning_rate': 6.096556111101785e-06, 'epoch': 1.26} {'loss': 0.5635, 'learning_rate': 6.096254730812154e-06, 'epoch': 1.26} {'loss': 0.542, 'learning_rate': 6.095953354705737e-06, 'epoch': 1.26} {'loss': 0.4368, 'learning_rate': 6.0956519827828605e-06, 'epoch': 1.26} {'loss': 0.4227, 'learning_rate': 6.095350615043846e-06, 'epoch': 1.26} {'loss': 0.5432, 'learning_rate': 6.09504925148901e-06, 'epoch': 1.26} {'loss': 0.6423, 'learning_rate': 6.094747892118686e-06, 'epoch': 1.26} {'loss': 0.6006, 'learning_rate': 6.0944465369331905e-06, 'epoch': 1.26} {'loss': 0.6496, 'learning_rate': 6.094145185932851e-06, 'epoch': 1.26} {'loss': 0.385, 'learning_rate': 6.0938438391179835e-06, 'epoch': 1.26} {'loss': 0.4806, 'learning_rate': 6.093542496488915e-06, 'epoch': 1.26} {'loss': 0.313, 'learning_rate': 6.093241158045972e-06, 'epoch': 1.26} {'loss': 0.535, 'learning_rate': 6.092939823789468e-06, 'epoch': 1.26} {'loss': 0.6035, 'learning_rate': 6.0926384937197354e-06, 'epoch': 1.26} {'loss': 0.6247, 'learning_rate': 6.092337167837092e-06, 'epoch': 1.26} {'loss': 0.5295, 'learning_rate': 6.092035846141866e-06, 'epoch': 1.26} {'loss': 0.4907, 'learning_rate': 6.091734528634375e-06, 'epoch': 1.26} {'loss': 0.4618, 'learning_rate': 6.091433215314937e-06, 'epoch': 1.26} {'loss': 0.634, 'learning_rate': 6.091131906183887e-06, 'epoch': 1.26} {'loss': 0.5946, 'learning_rate': 6.090830601241537e-06, 'epoch': 1.26} {'loss': 0.6444, 'learning_rate': 6.090529300488221e-06, 'epoch': 1.26} {'loss': 0.5865, 'learning_rate': 6.0902280039242525e-06, 'epoch': 1.26} {'loss': 0.6785, 'learning_rate': 6.089926711549958e-06, 'epoch': 1.26} {'loss': 0.58, 'learning_rate': 6.089625423365661e-06, 'epoch': 1.26} {'loss': 0.5499, 'learning_rate': 6.08932413937168e-06, 'epoch': 1.26} {'loss': 0.5094, 'learning_rate': 6.089022859568345e-06, 'epoch': 1.26} {'loss': 0.4074, 'learning_rate': 6.08872158395597e-06, 'epoch': 1.26} {'loss': 0.6273, 'learning_rate': 6.088420312534889e-06, 'epoch': 1.26} {'loss': 0.5853, 'learning_rate': 6.088119045305416e-06, 'epoch': 1.26} {'loss': 0.5321, 'learning_rate': 6.087817782267877e-06, 'epoch': 1.26} {'loss': 0.4841, 'learning_rate': 6.0875165234225945e-06, 'epoch': 1.26} {'loss': 0.5583, 'learning_rate': 6.087215268769888e-06, 'epoch': 1.26} {'loss': 0.4106, 'learning_rate': 6.086914018310086e-06, 'epoch': 1.26} {'loss': 0.6328, 'learning_rate': 6.086612772043507e-06, 'epoch': 1.26} {'loss': 0.5495, 'learning_rate': 6.086311529970479e-06, 'epoch': 1.26} {'loss': 0.5945, 'learning_rate': 6.08601029209132e-06, 'epoch': 1.26} {'loss': 0.5128, 'learning_rate': 6.0857090584063535e-06, 'epoch': 1.26} {'loss': 0.5868, 'learning_rate': 6.0854078289159054e-06, 'epoch': 1.26} {'loss': 0.5193, 'learning_rate': 6.0851066036202914e-06, 'epoch': 1.26} {'loss': 0.4857, 'learning_rate': 6.084805382519843e-06, 'epoch': 1.26} {'loss': 0.5796, 'learning_rate': 6.084504165614875e-06, 'epoch': 1.26} {'loss': 0.466, 'learning_rate': 6.084202952905718e-06, 'epoch': 1.26} {'loss': 0.5643, 'learning_rate': 6.083901744392692e-06, 'epoch': 1.26} {'loss': 0.5294, 'learning_rate': 6.0836005400761156e-06, 'epoch': 1.26} {'loss': 0.5091, 'learning_rate': 6.083299339956316e-06, 'epoch': 1.26} {'loss': 0.4552, 'learning_rate': 6.082998144033614e-06, 'epoch': 1.26} {'loss': 0.5733, 'learning_rate': 6.082696952308334e-06, 'epoch': 1.26} {'loss': 0.5354, 'learning_rate': 6.082395764780798e-06, 'epoch': 1.26} {'loss': 0.6359, 'learning_rate': 6.082094581451326e-06, 'epoch': 1.26} {'loss': 0.6095, 'learning_rate': 6.081793402320247e-06, 'epoch': 1.26} {'loss': 0.5971, 'learning_rate': 6.0814922273878776e-06, 'epoch': 1.26} {'loss': 0.6698, 'learning_rate': 6.081191056654544e-06, 'epoch': 1.26} {'loss': 0.4442, 'learning_rate': 6.080889890120565e-06, 'epoch': 1.26} {'loss': 0.5045, 'learning_rate': 6.0805887277862695e-06, 'epoch': 1.26} {'loss': 0.5106, 'learning_rate': 6.080287569651977e-06, 'epoch': 1.26} {'loss': 0.6461, 'learning_rate': 6.079986415718007e-06, 'epoch': 1.26} {'loss': 0.5477, 'learning_rate': 6.079685265984688e-06, 'epoch': 1.26} {'loss': 0.5057, 'learning_rate': 6.079384120452338e-06, 'epoch': 1.26} {'loss': 0.4845, 'learning_rate': 6.079082979121286e-06, 'epoch': 1.26} {'loss': 0.6535, 'learning_rate': 6.078781841991846e-06, 'epoch': 1.26} {'loss': 0.5735, 'learning_rate': 6.078480709064347e-06, 'epoch': 1.26} {'loss': 0.6011, 'learning_rate': 6.078179580339111e-06, 'epoch': 1.26} {'loss': 0.5964, 'learning_rate': 6.077878455816455e-06, 'epoch': 1.26} {'loss': 0.5383, 'learning_rate': 6.077577335496712e-06, 'epoch': 1.26} {'loss': 0.4791, 'learning_rate': 6.077276219380195e-06, 'epoch': 1.26} {'loss': 0.4264, 'learning_rate': 6.0769751074672336e-06, 'epoch': 1.26} {'loss': 0.6561, 'learning_rate': 6.076673999758147e-06, 'epoch': 1.26} {'loss': 0.391, 'learning_rate': 6.076372896253255e-06, 'epoch': 1.26} {'loss': 0.553, 'learning_rate': 6.076071796952887e-06, 'epoch': 1.26} {'loss': 0.5408, 'learning_rate': 6.075770701857357e-06, 'epoch': 1.26} {'loss': 0.5657, 'learning_rate': 6.075469610967e-06, 'epoch': 1.26} {'loss': 0.4867, 'learning_rate': 6.075168524282127e-06, 'epoch': 1.26} {'loss': 0.6712, 'learning_rate': 6.074867441803068e-06, 'epoch': 1.26} {'loss': 0.4556, 'learning_rate': 6.074566363530143e-06, 'epoch': 1.26} {'loss': 0.4989, 'learning_rate': 6.07426528946367e-06, 'epoch': 1.26} {'loss': 0.5818, 'learning_rate': 6.073964219603981e-06, 'epoch': 1.26} {'loss': 0.4704, 'learning_rate': 6.07366315395139e-06, 'epoch': 1.26} {'loss': 0.4476, 'learning_rate': 6.0733620925062245e-06, 'epoch': 1.26} {'loss': 0.6291, 'learning_rate': 6.073061035268808e-06, 'epoch': 1.26} {'loss': 0.6067, 'learning_rate': 6.0727599822394575e-06, 'epoch': 1.26} {'loss': 0.4665, 'learning_rate': 6.072458933418503e-06, 'epoch': 1.26} {'loss': 0.7068, 'learning_rate': 6.072157888806258e-06, 'epoch': 1.26} {'loss': 0.5122, 'learning_rate': 6.071856848403055e-06, 'epoch': 1.26} {'loss': 0.6709, 'learning_rate': 6.0715558122092085e-06, 'epoch': 1.26} {'loss': 0.5558, 'learning_rate': 6.071254780225049e-06, 'epoch': 1.26} {'loss': 0.5573, 'learning_rate': 6.070953752450891e-06, 'epoch': 1.26} {'loss': 0.528, 'learning_rate': 6.070652728887061e-06, 'epoch': 1.26} {'loss': 0.4225, 'learning_rate': 6.070351709533884e-06, 'epoch': 1.26} {'loss': 0.4313, 'learning_rate': 6.070050694391674e-06, 'epoch': 1.26} {'loss': 0.4712, 'learning_rate': 6.069749683460765e-06, 'epoch': 1.26} {'loss': 0.5597, 'learning_rate': 6.069448676741472e-06, 'epoch': 1.26} {'loss': 0.4465, 'learning_rate': 6.069147674234121e-06, 'epoch': 1.26} {'loss': 0.5147, 'learning_rate': 6.068846675939033e-06, 'epoch': 1.26} {'loss': 0.6128, 'learning_rate': 6.068545681856526e-06, 'epoch': 1.26} {'loss': 0.5048, 'learning_rate': 6.068244691986931e-06, 'epoch': 1.26} {'loss': 0.523, 'learning_rate': 6.067943706330564e-06, 'epoch': 1.26} {'loss': 0.4805, 'learning_rate': 6.067642724887754e-06, 'epoch': 1.26} {'loss': 0.5238, 'learning_rate': 6.067341747658819e-06, 'epoch': 1.26} {'loss': 0.5451, 'learning_rate': 6.067040774644079e-06, 'epoch': 1.26} {'loss': 0.4873, 'learning_rate': 6.066739805843864e-06, 'epoch': 1.26} {'loss': 0.4035, 'learning_rate': 6.066438841258489e-06, 'epoch': 1.26} {'loss': 0.5168, 'learning_rate': 6.066137880888282e-06, 'epoch': 1.26} {'loss': 0.5167, 'learning_rate': 6.0658369247335595e-06, 'epoch': 1.26} {'loss': 0.4935, 'learning_rate': 6.065535972794652e-06, 'epoch': 1.26} {'loss': 0.6077, 'learning_rate': 6.065235025071879e-06, 'epoch': 1.26} {'loss': 0.4671, 'learning_rate': 6.0649340815655576e-06, 'epoch': 1.26} {'loss': 0.5032, 'learning_rate': 6.064633142276017e-06, 'epoch': 1.26} {'loss': 0.5138, 'learning_rate': 6.0643322072035735e-06, 'epoch': 1.26} {'loss': 0.4575, 'learning_rate': 6.0640312763485585e-06, 'epoch': 1.26} {'loss': 0.634, 'learning_rate': 6.063730349711284e-06, 'epoch': 1.26} {'loss': 0.6321, 'learning_rate': 6.063429427292083e-06, 'epoch': 1.26} {'loss': 0.5464, 'learning_rate': 6.063128509091271e-06, 'epoch': 1.26} {'loss': 0.6402, 'learning_rate': 6.062827595109171e-06, 'epoch': 1.26} {'loss': 0.6139, 'learning_rate': 6.062526685346109e-06, 'epoch': 1.26} {'loss': 0.5764, 'learning_rate': 6.0622257798024e-06, 'epoch': 1.26} {'loss': 0.4489, 'learning_rate': 6.061924878478376e-06, 'epoch': 1.26} {'loss': 0.591, 'learning_rate': 6.061623981374354e-06, 'epoch': 1.26} {'loss': 0.5873, 'learning_rate': 6.061323088490654e-06, 'epoch': 1.26} {'loss': 0.5937, 'learning_rate': 6.061022199827606e-06, 'epoch': 1.26} {'loss': 0.5851, 'learning_rate': 6.060721315385526e-06, 'epoch': 1.26} {'loss': 0.5764, 'learning_rate': 6.060420435164741e-06, 'epoch': 1.26} {'loss': 0.4293, 'learning_rate': 6.060119559165567e-06, 'epoch': 1.26} {'loss': 0.5728, 'learning_rate': 6.059818687388335e-06, 'epoch': 1.26} {'loss': 0.5297, 'learning_rate': 6.0595178198333615e-06, 'epoch': 1.26} {'loss': 0.4563, 'learning_rate': 6.059216956500967e-06, 'epoch': 1.26} {'loss': 0.6229, 'learning_rate': 6.058916097391481e-06, 'epoch': 1.26} {'loss': 0.4781, 'learning_rate': 6.058615242505221e-06, 'epoch': 1.26} {'loss': 0.6502, 'learning_rate': 6.058314391842513e-06, 'epoch': 1.26} {'loss': 0.5659, 'learning_rate': 6.05801354540367e-06, 'epoch': 1.26} {'loss': 0.4724, 'learning_rate': 6.057712703189027e-06, 'epoch': 1.26} {'loss': 0.5835, 'learning_rate': 6.057411865198901e-06, 'epoch': 1.26} {'loss': 0.7826, 'learning_rate': 6.0571110314336104e-06, 'epoch': 1.26} {'loss': 0.5719, 'learning_rate': 6.056810201893484e-06, 'epoch': 1.26} {'loss': 0.5781, 'learning_rate': 6.056509376578841e-06, 'epoch': 1.26} {'loss': 0.5728, 'learning_rate': 6.056208555490004e-06, 'epoch': 1.26} {'loss': 0.5142, 'learning_rate': 6.055907738627297e-06, 'epoch': 1.26} {'loss': 0.549, 'learning_rate': 6.055606925991036e-06, 'epoch': 1.26} {'loss': 0.4254, 'learning_rate': 6.055306117581552e-06, 'epoch': 1.26} {'loss': 0.5819, 'learning_rate': 6.055005313399161e-06, 'epoch': 1.26} {'loss': 0.5256, 'learning_rate': 6.05470451344419e-06, 'epoch': 1.26} {'loss': 0.5713, 'learning_rate': 6.054403717716959e-06, 'epoch': 1.26} {'loss': 0.4051, 'learning_rate': 6.054102926217791e-06, 'epoch': 1.26} {'loss': 0.6323, 'learning_rate': 6.053802138947009e-06, 'epoch': 1.26} {'loss': 0.5026, 'learning_rate': 6.053501355904929e-06, 'epoch': 1.26} {'loss': 0.6373, 'learning_rate': 6.053200577091884e-06, 'epoch': 1.26} {'loss': 0.565, 'learning_rate': 6.052899802508185e-06, 'epoch': 1.26} {'loss': 0.5203, 'learning_rate': 6.052599032154165e-06, 'epoch': 1.26} {'loss': 0.7201, 'learning_rate': 6.052298266030141e-06, 'epoch': 1.26} {'loss': 0.5342, 'learning_rate': 6.051997504136435e-06, 'epoch': 1.26} {'loss': 0.7202, 'learning_rate': 6.051696746473372e-06, 'epoch': 1.26} {'loss': 0.4296, 'learning_rate': 6.051395993041267e-06, 'epoch': 1.26} {'loss': 0.5889, 'learning_rate': 6.0510952438404525e-06, 'epoch': 1.26} {'loss': 0.5523, 'learning_rate': 6.050794498871242e-06, 'epoch': 1.26} {'loss': 0.4135, 'learning_rate': 6.050493758133964e-06, 'epoch': 1.26} {'loss': 0.5489, 'learning_rate': 6.05019302162894e-06, 'epoch': 1.26} {'loss': 0.4901, 'learning_rate': 6.049892289356487e-06, 'epoch': 1.26} {'loss': 0.5661, 'learning_rate': 6.049591561316934e-06, 'epoch': 1.26} {'loss': 0.5511, 'learning_rate': 6.049290837510598e-06, 'epoch': 1.26} {'loss': 0.5931, 'learning_rate': 6.048990117937805e-06, 'epoch': 1.26} {'loss': 0.6425, 'learning_rate': 6.048689402598874e-06, 'epoch': 1.26} {'loss': 0.4633, 'learning_rate': 6.0483886914941295e-06, 'epoch': 1.26} {'loss': 0.5607, 'learning_rate': 6.048087984623895e-06, 'epoch': 1.26} {'loss': 0.6995, 'learning_rate': 6.047787281988489e-06, 'epoch': 1.26} {'loss': 0.3929, 'learning_rate': 6.0474865835882375e-06, 'epoch': 1.26} {'loss': 0.4307, 'learning_rate': 6.047185889423457e-06, 'epoch': 1.26} {'loss': 0.5266, 'learning_rate': 6.0468851994944765e-06, 'epoch': 1.26} {'loss': 0.4508, 'learning_rate': 6.046584513801617e-06, 'epoch': 1.26} {'loss': 0.5344, 'learning_rate': 6.046283832345196e-06, 'epoch': 1.26} {'loss': 0.4705, 'learning_rate': 6.045983155125539e-06, 'epoch': 1.26} {'loss': 0.5088, 'learning_rate': 6.045682482142968e-06, 'epoch': 1.26} {'loss': 0.4875, 'learning_rate': 6.045381813397808e-06, 'epoch': 1.26} {'loss': 0.438, 'learning_rate': 6.045081148890373e-06, 'epoch': 1.26} {'loss': 0.6056, 'learning_rate': 6.044780488620995e-06, 'epoch': 1.26} {'loss': 0.4612, 'learning_rate': 6.0444798325899915e-06, 'epoch': 1.26} {'loss': 0.3871, 'learning_rate': 6.044179180797682e-06, 'epoch': 1.26} {'loss': 0.6475, 'learning_rate': 6.043878533244395e-06, 'epoch': 1.26} {'loss': 0.5844, 'learning_rate': 6.043577889930445e-06, 'epoch': 1.26} {'loss': 0.5248, 'learning_rate': 6.043277250856162e-06, 'epoch': 1.26} {'loss': 0.5357, 'learning_rate': 6.0429766160218605e-06, 'epoch': 1.26} {'loss': 0.5137, 'learning_rate': 6.0426759854278704e-06, 'epoch': 1.26} {'loss': 0.5109, 'learning_rate': 6.04237535907451e-06, 'epoch': 1.26} {'loss': 0.4887, 'learning_rate': 6.0420747369621015e-06, 'epoch': 1.26} {'loss': 0.4741, 'learning_rate': 6.041774119090967e-06, 'epoch': 1.26} {'loss': 0.4913, 'learning_rate': 6.041473505461426e-06, 'epoch': 1.26} {'loss': 0.6369, 'learning_rate': 6.041172896073807e-06, 'epoch': 1.26} {'loss': 0.6765, 'learning_rate': 6.040872290928428e-06, 'epoch': 1.26} {'loss': 0.5774, 'learning_rate': 6.04057169002561e-06, 'epoch': 1.26} {'loss': 0.6565, 'learning_rate': 6.040271093365677e-06, 'epoch': 1.26} {'loss': 0.7741, 'learning_rate': 6.039970500948952e-06, 'epoch': 1.26} {'loss': 0.6561, 'learning_rate': 6.039669912775756e-06, 'epoch': 1.26} {'loss': 0.6029, 'learning_rate': 6.039369328846409e-06, 'epoch': 1.26} {'loss': 0.5727, 'learning_rate': 6.039068749161239e-06, 'epoch': 1.26} {'loss': 0.5244, 'learning_rate': 6.038768173720563e-06, 'epoch': 1.26} {'loss': 0.5087, 'learning_rate': 6.0384676025247e-06, 'epoch': 1.26} {'loss': 0.4403, 'learning_rate': 6.0381670355739826e-06, 'epoch': 1.26} {'loss': 0.5405, 'learning_rate': 6.037866472868723e-06, 'epoch': 1.26} {'loss': 0.4044, 'learning_rate': 6.03756591440925e-06, 'epoch': 1.26} {'loss': 0.539, 'learning_rate': 6.037265360195878e-06, 'epoch': 1.26} {'loss': 0.6495, 'learning_rate': 6.03696481022894e-06, 'epoch': 1.26} {'loss': 0.771, 'learning_rate': 6.036664264508749e-06, 'epoch': 1.26} {'loss': 0.5874, 'learning_rate': 6.036363723035627e-06, 'epoch': 1.26} {'loss': 0.5243, 'learning_rate': 6.0360631858099035e-06, 'epoch': 1.26} {'loss': 0.561, 'learning_rate': 6.035762652831894e-06, 'epoch': 1.26} {'loss': 0.6109, 'learning_rate': 6.0354621241019255e-06, 'epoch': 1.26} {'loss': 0.5448, 'learning_rate': 6.0351615996203165e-06, 'epoch': 1.26} {'loss': 0.6005, 'learning_rate': 6.034861079387384e-06, 'epoch': 1.26} {'loss': 0.5704, 'learning_rate': 6.034560563403462e-06, 'epoch': 1.26} {'loss': 0.4309, 'learning_rate': 6.034260051668861e-06, 'epoch': 1.26} {'loss': 0.6223, 'learning_rate': 6.033959544183913e-06, 'epoch': 1.26} {'loss': 0.4842, 'learning_rate': 6.033659040948933e-06, 'epoch': 1.26} {'loss': 0.5766, 'learning_rate': 6.033358541964247e-06, 'epoch': 1.26} {'loss': 0.5296, 'learning_rate': 6.033058047230176e-06, 'epoch': 1.26} {'loss': 0.4963, 'learning_rate': 6.032757556747036e-06, 'epoch': 1.26} {'loss': 0.6559, 'learning_rate': 6.03245707051516e-06, 'epoch': 1.26} {'loss': 0.389, 'learning_rate': 6.032156588534859e-06, 'epoch': 1.26} {'loss': 0.545, 'learning_rate': 6.031856110806464e-06, 'epoch': 1.26} {'loss': 0.5295, 'learning_rate': 6.031555637330293e-06, 'epoch': 1.26} {'loss': 0.5024, 'learning_rate': 6.03125516810667e-06, 'epoch': 1.26} {'loss': 0.6102, 'learning_rate': 6.030954703135915e-06, 'epoch': 1.26} {'loss': 0.6612, 'learning_rate': 6.030654242418346e-06, 'epoch': 1.26} {'loss': 0.5698, 'learning_rate': 6.030353785954293e-06, 'epoch': 1.26} {'loss': 0.6409, 'learning_rate': 6.03005333374407e-06, 'epoch': 1.26} {'loss': 0.5066, 'learning_rate': 6.029752885788009e-06, 'epoch': 1.26} {'loss': 0.5247, 'learning_rate': 6.029452442086424e-06, 'epoch': 1.26} {'loss': 0.4816, 'learning_rate': 6.029152002639638e-06, 'epoch': 1.26} {'loss': 0.4585, 'learning_rate': 6.028851567447976e-06, 'epoch': 1.26} {'loss': 0.6137, 'learning_rate': 6.0285511365117535e-06, 'epoch': 1.26} {'loss': 0.3719, 'learning_rate': 6.028250709831303e-06, 'epoch': 1.26} {'loss': 0.5042, 'learning_rate': 6.027950287406934e-06, 'epoch': 1.26} {'loss': 0.4915, 'learning_rate': 6.0276498692389785e-06, 'epoch': 1.26} {'loss': 0.4786, 'learning_rate': 6.027349455327755e-06, 'epoch': 1.26} {'loss': 0.5828, 'learning_rate': 6.027049045673585e-06, 'epoch': 1.26} {'loss': 0.476, 'learning_rate': 6.026748640276791e-06, 'epoch': 1.26} {'loss': 0.6838, 'learning_rate': 6.02644823913769e-06, 'epoch': 1.26} {'loss': 0.4189, 'learning_rate': 6.026147842256613e-06, 'epoch': 1.26} {'loss': 0.5497, 'learning_rate': 6.025847449633876e-06, 'epoch': 1.26} {'loss': 0.5241, 'learning_rate': 6.025547061269801e-06, 'epoch': 1.26} {'loss': 0.5181, 'learning_rate': 6.025246677164713e-06, 'epoch': 1.26} {'loss': 0.3522, 'learning_rate': 6.024946297318931e-06, 'epoch': 1.26} {'loss': 0.5354, 'learning_rate': 6.024645921732779e-06, 'epoch': 1.26} {'loss': 0.4766, 'learning_rate': 6.024345550406574e-06, 'epoch': 1.26} {'loss': 0.408, 'learning_rate': 6.024045183340646e-06, 'epoch': 1.26} {'loss': 0.491, 'learning_rate': 6.023744820535311e-06, 'epoch': 1.26} {'loss': 0.3896, 'learning_rate': 6.023444461990891e-06, 'epoch': 1.26} {'loss': 0.5802, 'learning_rate': 6.02314410770771e-06, 'epoch': 1.26} {'loss': 0.5911, 'learning_rate': 6.022843757686088e-06, 'epoch': 1.26} {'loss': 0.5369, 'learning_rate': 6.022543411926351e-06, 'epoch': 1.26} {'loss': 0.4225, 'learning_rate': 6.022243070428812e-06, 'epoch': 1.26} {'loss': 0.544, 'learning_rate': 6.021942733193804e-06, 'epoch': 1.26} {'loss': 0.5508, 'learning_rate': 6.021642400221644e-06, 'epoch': 1.26} {'loss': 0.4256, 'learning_rate': 6.021342071512649e-06, 'epoch': 1.26} {'loss': 0.4068, 'learning_rate': 6.021041747067149e-06, 'epoch': 1.26} {'loss': 0.4346, 'learning_rate': 6.020741426885457e-06, 'epoch': 1.26} {'loss': 0.6135, 'learning_rate': 6.020441110967904e-06, 'epoch': 1.26} {'loss': 0.473, 'learning_rate': 6.020140799314806e-06, 'epoch': 1.26} {'loss': 0.6251, 'learning_rate': 6.0198404919264855e-06, 'epoch': 1.26} {'loss': 0.4828, 'learning_rate': 6.019540188803267e-06, 'epoch': 1.26} {'loss': 0.6192, 'learning_rate': 6.019239889945468e-06, 'epoch': 1.26} {'loss': 0.4489, 'learning_rate': 6.018939595353417e-06, 'epoch': 1.26} {'loss': 0.7143, 'learning_rate': 6.018639305027425e-06, 'epoch': 1.26} {'loss': 0.5805, 'learning_rate': 6.018339018967824e-06, 'epoch': 1.26} {'loss': 0.439, 'learning_rate': 6.018038737174935e-06, 'epoch': 1.26} {'loss': 0.473, 'learning_rate': 6.017738459649072e-06, 'epoch': 1.26} {'loss': 0.4101, 'learning_rate': 6.017438186390565e-06, 'epoch': 1.26} {'loss': 0.648, 'learning_rate': 6.01713791739973e-06, 'epoch': 1.26} {'loss': 0.42, 'learning_rate': 6.016837652676895e-06, 'epoch': 1.26} {'loss': 0.5412, 'learning_rate': 6.016537392222372e-06, 'epoch': 1.26} {'loss': 0.536, 'learning_rate': 6.016237136036494e-06, 'epoch': 1.26} {'loss': 0.4929, 'learning_rate': 6.0159368841195755e-06, 'epoch': 1.26} {'loss': 0.5782, 'learning_rate': 6.015636636471938e-06, 'epoch': 1.26} {'loss': 0.6315, 'learning_rate': 6.015336393093909e-06, 'epoch': 1.26} {'loss': 0.4975, 'learning_rate': 6.015036153985805e-06, 'epoch': 1.26} {'loss': 0.4973, 'learning_rate': 6.01473591914795e-06, 'epoch': 1.26} {'loss': 0.5641, 'learning_rate': 6.014435688580667e-06, 'epoch': 1.26} {'loss': 0.4751, 'learning_rate': 6.014135462284272e-06, 'epoch': 1.26} {'loss': 0.4403, 'learning_rate': 6.013835240259093e-06, 'epoch': 1.26} {'loss': 0.4363, 'learning_rate': 6.013535022505446e-06, 'epoch': 1.26} {'loss': 0.5664, 'learning_rate': 6.01323480902366e-06, 'epoch': 1.26} {'loss': 0.6247, 'learning_rate': 6.012934599814051e-06, 'epoch': 1.26} {'loss': 0.4625, 'learning_rate': 6.012634394876944e-06, 'epoch': 1.26} {'loss': 0.4592, 'learning_rate': 6.012334194212659e-06, 'epoch': 1.26} {'loss': 0.5456, 'learning_rate': 6.012033997821515e-06, 'epoch': 1.26} {'loss': 0.6277, 'learning_rate': 6.011733805703839e-06, 'epoch': 1.26} {'loss': 0.4692, 'learning_rate': 6.011433617859948e-06, 'epoch': 1.26} {'loss': 0.6254, 'learning_rate': 6.011133434290169e-06, 'epoch': 1.26} {'loss': 0.5576, 'learning_rate': 6.010833254994817e-06, 'epoch': 1.26} {'loss': 0.7521, 'learning_rate': 6.0105330799742214e-06, 'epoch': 1.26} {'loss': 0.5871, 'learning_rate': 6.010232909228698e-06, 'epoch': 1.26} {'loss': 0.6193, 'learning_rate': 6.009932742758567e-06, 'epoch': 1.26} {'loss': 0.3956, 'learning_rate': 6.009632580564158e-06, 'epoch': 1.26} {'loss': 0.4152, 'learning_rate': 6.009332422645782e-06, 'epoch': 1.26} {'loss': 0.6436, 'learning_rate': 6.0090322690037715e-06, 'epoch': 1.26} {'loss': 0.5206, 'learning_rate': 6.008732119638443e-06, 'epoch': 1.26} {'loss': 0.5732, 'learning_rate': 6.0084319745501175e-06, 'epoch': 1.26} {'loss': 0.653, 'learning_rate': 6.0081318337391174e-06, 'epoch': 1.26} {'loss': 0.5637, 'learning_rate': 6.007831697205762e-06, 'epoch': 1.26} {'loss': 0.6478, 'learning_rate': 6.007531564950377e-06, 'epoch': 1.26} {'loss': 0.5596, 'learning_rate': 6.00723143697328e-06, 'epoch': 1.26} {'loss': 0.5374, 'learning_rate': 6.0069313132748e-06, 'epoch': 1.26} {'loss': 0.526, 'learning_rate': 6.006631193855251e-06, 'epoch': 1.26} {'loss': 0.5141, 'learning_rate': 6.006331078714957e-06, 'epoch': 1.26} {'loss': 0.5409, 'learning_rate': 6.00603096785424e-06, 'epoch': 1.26} {'loss': 0.5124, 'learning_rate': 6.005730861273418e-06, 'epoch': 1.26} {'loss': 0.549, 'learning_rate': 6.005430758972821e-06, 'epoch': 1.26} {'loss': 0.661, 'learning_rate': 6.005130660952761e-06, 'epoch': 1.26} {'loss': 0.6733, 'learning_rate': 6.004830567213567e-06, 'epoch': 1.26} {'loss': 0.5014, 'learning_rate': 6.004530477755558e-06, 'epoch': 1.26} {'loss': 0.5715, 'learning_rate': 6.004230392579053e-06, 'epoch': 1.26} {'loss': 0.467, 'learning_rate': 6.003930311684379e-06, 'epoch': 1.26} {'loss': 0.6381, 'learning_rate': 6.003630235071849e-06, 'epoch': 1.26} {'loss': 0.6414, 'learning_rate': 6.003330162741795e-06, 'epoch': 1.26} {'loss': 0.4274, 'learning_rate': 6.003030094694533e-06, 'epoch': 1.26} {'loss': 0.5916, 'learning_rate': 6.00273003093038e-06, 'epoch': 1.26} {'loss': 0.5173, 'learning_rate': 6.0024299714496685e-06, 'epoch': 1.26} {'loss': 0.4458, 'learning_rate': 6.00212991625271e-06, 'epoch': 1.26} {'loss': 0.499, 'learning_rate': 6.001829865339834e-06, 'epoch': 1.26} {'loss': 0.5756, 'learning_rate': 6.001529818711354e-06, 'epoch': 1.26} {'loss': 0.5092, 'learning_rate': 6.001229776367599e-06, 'epoch': 1.26} {'loss': 0.5207, 'learning_rate': 6.000929738308887e-06, 'epoch': 1.26} {'loss': 0.4055, 'learning_rate': 6.0006297045355365e-06, 'epoch': 1.26} {'loss': 0.5846, 'learning_rate': 6.0003296750478744e-06, 'epoch': 1.26} {'loss': 0.5173, 'learning_rate': 6.000029649846219e-06, 'epoch': 1.26} {'loss': 0.6935, 'learning_rate': 5.999729628930896e-06, 'epoch': 1.26} {'loss': 0.3581, 'learning_rate': 5.999429612302219e-06, 'epoch': 1.26} {'loss': 0.6767, 'learning_rate': 5.999129599960518e-06, 'epoch': 1.26} {'loss': 0.4334, 'learning_rate': 5.9988295919061105e-06, 'epoch': 1.26} {'loss': 0.5654, 'learning_rate': 5.998529588139317e-06, 'epoch': 1.26} {'loss': 0.591, 'learning_rate': 5.998229588660463e-06, 'epoch': 1.26} {'loss': 0.5207, 'learning_rate': 5.99792959346986e-06, 'epoch': 1.26} {'loss': 0.4847, 'learning_rate': 5.997629602567843e-06, 'epoch': 1.26} {'loss': 0.5259, 'learning_rate': 5.997329615954728e-06, 'epoch': 1.26} {'loss': 0.6511, 'learning_rate': 5.997029633630828e-06, 'epoch': 1.26} {'loss': 0.6176, 'learning_rate': 5.996729655596481e-06, 'epoch': 1.26} {'loss': 0.4764, 'learning_rate': 5.996429681851994e-06, 'epoch': 1.26} {'loss': 0.4949, 'learning_rate': 5.996129712397697e-06, 'epoch': 1.26} {'loss': 0.508, 'learning_rate': 5.995829747233903e-06, 'epoch': 1.26} {'loss': 0.5021, 'learning_rate': 5.995529786360945e-06, 'epoch': 1.26} {'loss': 0.6854, 'learning_rate': 5.995229829779137e-06, 'epoch': 1.26} {'loss': 0.6041, 'learning_rate': 5.994929877488798e-06, 'epoch': 1.26} {'loss': 0.3733, 'learning_rate': 5.9946299294902565e-06, 'epoch': 1.26} {'loss': 0.4211, 'learning_rate': 5.99432998578383e-06, 'epoch': 1.26} {'loss': 0.559, 'learning_rate': 5.9940300463698405e-06, 'epoch': 1.26} {'loss': 0.6243, 'learning_rate': 5.993730111248611e-06, 'epoch': 1.26} {'loss': 0.4552, 'learning_rate': 5.993430180420457e-06, 'epoch': 1.26} {'loss': 0.4525, 'learning_rate': 5.993130253885708e-06, 'epoch': 1.26} {'loss': 0.4984, 'learning_rate': 5.992830331644678e-06, 'epoch': 1.26} {'loss': 0.5754, 'learning_rate': 5.992530413697695e-06, 'epoch': 1.26} {'loss': 0.6893, 'learning_rate': 5.992230500045075e-06, 'epoch': 1.26} {'loss': 0.6025, 'learning_rate': 5.991930590687145e-06, 'epoch': 1.26} {'loss': 0.4683, 'learning_rate': 5.991630685624223e-06, 'epoch': 1.26} {'loss': 0.5979, 'learning_rate': 5.991330784856626e-06, 'epoch': 1.26} {'loss': 0.5317, 'learning_rate': 5.991030888384684e-06, 'epoch': 1.26} {'loss': 0.4097, 'learning_rate': 5.990730996208711e-06, 'epoch': 1.26} {'loss': 0.4718, 'learning_rate': 5.990431108329034e-06, 'epoch': 1.26} {'loss': 0.6741, 'learning_rate': 5.990131224745972e-06, 'epoch': 1.26} {'loss': 0.5768, 'learning_rate': 5.989831345459847e-06, 'epoch': 1.26} {'loss': 0.6042, 'learning_rate': 5.989531470470979e-06, 'epoch': 1.27} {'loss': 0.5819, 'learning_rate': 5.989231599779688e-06, 'epoch': 1.27} {'loss': 0.5647, 'learning_rate': 5.9889317333863e-06, 'epoch': 1.27} {'loss': 0.6156, 'learning_rate': 5.9886318712911284e-06, 'epoch': 1.27} {'loss': 0.4605, 'learning_rate': 5.988332013494507e-06, 'epoch': 1.27} {'loss': 0.4996, 'learning_rate': 5.988032159996747e-06, 'epoch': 1.27} {'loss': 0.4546, 'learning_rate': 5.987732310798171e-06, 'epoch': 1.27} {'loss': 0.4994, 'learning_rate': 5.987432465899106e-06, 'epoch': 1.27} {'loss': 0.5385, 'learning_rate': 5.987132625299863e-06, 'epoch': 1.27} {'loss': 0.5455, 'learning_rate': 5.986832789000775e-06, 'epoch': 1.27} {'loss': 0.646, 'learning_rate': 5.986532957002153e-06, 'epoch': 1.27} {'loss': 0.7096, 'learning_rate': 5.9862331293043285e-06, 'epoch': 1.27} {'loss': 0.7458, 'learning_rate': 5.985933305907617e-06, 'epoch': 1.27} {'loss': 0.4959, 'learning_rate': 5.985633486812336e-06, 'epoch': 1.27} {'loss': 0.5557, 'learning_rate': 5.985333672018816e-06, 'epoch': 1.27} {'loss': 0.6966, 'learning_rate': 5.985033861527367e-06, 'epoch': 1.27} {'loss': 0.5523, 'learning_rate': 5.984734055338323e-06, 'epoch': 1.27} {'loss': 0.4684, 'learning_rate': 5.984434253451994e-06, 'epoch': 1.27} {'loss': 0.5264, 'learning_rate': 5.984134455868709e-06, 'epoch': 1.27} {'loss': 0.6492, 'learning_rate': 5.983834662588788e-06, 'epoch': 1.27} {'loss': 0.5573, 'learning_rate': 5.9835348736125464e-06, 'epoch': 1.27} {'loss': 0.6706, 'learning_rate': 5.983235088940313e-06, 'epoch': 1.27} {'loss': 0.5358, 'learning_rate': 5.9829353085724025e-06, 'epoch': 1.27} {'loss': 0.4362, 'learning_rate': 5.982635532509142e-06, 'epoch': 1.27} {'loss': 0.4817, 'learning_rate': 5.982335760750853e-06, 'epoch': 1.27} {'loss': 0.5693, 'learning_rate': 5.9820359932978465e-06, 'epoch': 1.27} {'loss': 0.453, 'learning_rate': 5.981736230150457e-06, 'epoch': 1.27} {'loss': 0.5987, 'learning_rate': 5.981436471308997e-06, 'epoch': 1.27} {'loss': 0.5973, 'learning_rate': 5.9811367167737925e-06, 'epoch': 1.27} {'loss': 0.4764, 'learning_rate': 5.980836966545158e-06, 'epoch': 1.27} {'loss': 0.4822, 'learning_rate': 5.9805372206234235e-06, 'epoch': 1.27} {'loss': 0.658, 'learning_rate': 5.980237479008908e-06, 'epoch': 1.27} {'loss': 0.5125, 'learning_rate': 5.979937741701926e-06, 'epoch': 1.27} {'loss': 0.4704, 'learning_rate': 5.979638008702806e-06, 'epoch': 1.27} {'loss': 0.5641, 'learning_rate': 5.979338280011866e-06, 'epoch': 1.27} {'loss': 0.5114, 'learning_rate': 5.97903855562943e-06, 'epoch': 1.27} {'loss': 0.4791, 'learning_rate': 5.978738835555813e-06, 'epoch': 1.27} {'loss': 0.4212, 'learning_rate': 5.978439119791345e-06, 'epoch': 1.27} {'loss': 0.5724, 'learning_rate': 5.978139408336342e-06, 'epoch': 1.27} {'loss': 0.6701, 'learning_rate': 5.977839701191122e-06, 'epoch': 1.27} {'loss': 0.4847, 'learning_rate': 5.977539998356013e-06, 'epoch': 1.27} {'loss': 0.6166, 'learning_rate': 5.9772402998313305e-06, 'epoch': 1.27} {'loss': 0.5594, 'learning_rate': 5.976940605617401e-06, 'epoch': 1.27} {'loss': 0.547, 'learning_rate': 5.9766409157145426e-06, 'epoch': 1.27} {'loss': 0.7369, 'learning_rate': 5.976341230123072e-06, 'epoch': 1.27} {'loss': 0.6284, 'learning_rate': 5.976041548843319e-06, 'epoch': 1.27} {'loss': 0.4754, 'learning_rate': 5.9757418718756e-06, 'epoch': 1.27} {'loss': 0.4652, 'learning_rate': 5.975442199220235e-06, 'epoch': 1.27} {'loss': 0.4416, 'learning_rate': 5.975142530877548e-06, 'epoch': 1.27} {'loss': 0.4582, 'learning_rate': 5.974842866847861e-06, 'epoch': 1.27} {'loss': 0.6531, 'learning_rate': 5.974543207131493e-06, 'epoch': 1.27} {'loss': 0.574, 'learning_rate': 5.974243551728761e-06, 'epoch': 1.27} {'loss': 0.6052, 'learning_rate': 5.9739439006399945e-06, 'epoch': 1.27} {'loss': 0.5616, 'learning_rate': 5.9736442538655095e-06, 'epoch': 1.27} {'loss': 0.5635, 'learning_rate': 5.973344611405628e-06, 'epoch': 1.27} {'loss': 0.4943, 'learning_rate': 5.973044973260669e-06, 'epoch': 1.27} {'loss': 0.4682, 'learning_rate': 5.972745339430958e-06, 'epoch': 1.27} {'loss': 0.6186, 'learning_rate': 5.972445709916817e-06, 'epoch': 1.27} {'loss': 0.4741, 'learning_rate': 5.9721460847185565e-06, 'epoch': 1.27} {'loss': 0.5082, 'learning_rate': 5.97184646383651e-06, 'epoch': 1.27} {'loss': 0.4859, 'learning_rate': 5.971546847270993e-06, 'epoch': 1.27} {'loss': 0.7096, 'learning_rate': 5.971247235022329e-06, 'epoch': 1.27} {'loss': 0.6194, 'learning_rate': 5.970947627090835e-06, 'epoch': 1.27} {'loss': 0.5647, 'learning_rate': 5.9706480234768316e-06, 'epoch': 1.27} {'loss': 0.5349, 'learning_rate': 5.9703484241806464e-06, 'epoch': 1.27} {'loss': 0.4647, 'learning_rate': 5.970048829202593e-06, 'epoch': 1.27} {'loss': 0.5637, 'learning_rate': 5.969749238542999e-06, 'epoch': 1.27} {'loss': 0.6903, 'learning_rate': 5.969449652202182e-06, 'epoch': 1.27} {'loss': 0.4775, 'learning_rate': 5.969150070180465e-06, 'epoch': 1.27} {'loss': 0.4768, 'learning_rate': 5.968850492478166e-06, 'epoch': 1.27} {'loss': 0.5498, 'learning_rate': 5.968550919095605e-06, 'epoch': 1.27} {'loss': 0.5068, 'learning_rate': 5.96825135003311e-06, 'epoch': 1.27} {'loss': 0.6029, 'learning_rate': 5.967951785290992e-06, 'epoch': 1.27} {'loss': 0.545, 'learning_rate': 5.967652224869583e-06, 'epoch': 1.27} {'loss': 0.5953, 'learning_rate': 5.967352668769197e-06, 'epoch': 1.27} {'loss': 0.6187, 'learning_rate': 5.967053116990156e-06, 'epoch': 1.27} {'loss': 0.5495, 'learning_rate': 5.966753569532783e-06, 'epoch': 1.27} {'loss': 0.4317, 'learning_rate': 5.966454026397393e-06, 'epoch': 1.27} {'loss': 0.4537, 'learning_rate': 5.966154487584317e-06, 'epoch': 1.27} {'loss': 0.517, 'learning_rate': 5.965854953093866e-06, 'epoch': 1.27} {'loss': 0.4797, 'learning_rate': 5.965555422926368e-06, 'epoch': 1.27} {'loss': 0.5864, 'learning_rate': 5.965255897082143e-06, 'epoch': 1.27} {'loss': 0.6336, 'learning_rate': 5.964956375561508e-06, 'epoch': 1.27} {'loss': 0.6489, 'learning_rate': 5.96465685836479e-06, 'epoch': 1.27} {'loss': 0.4896, 'learning_rate': 5.9643573454922995e-06, 'epoch': 1.27} {'loss': 0.6074, 'learning_rate': 5.96405783694437e-06, 'epoch': 1.27} {'loss': 0.4433, 'learning_rate': 5.963758332721313e-06, 'epoch': 1.27} {'loss': 0.6096, 'learning_rate': 5.963458832823457e-06, 'epoch': 1.27} {'loss': 0.5569, 'learning_rate': 5.96315933725112e-06, 'epoch': 1.27} {'loss': 0.5057, 'learning_rate': 5.962859846004618e-06, 'epoch': 1.27} {'loss': 0.39, 'learning_rate': 5.96256035908428e-06, 'epoch': 1.27} {'loss': 0.5478, 'learning_rate': 5.962260876490418e-06, 'epoch': 1.27} {'loss': 0.5873, 'learning_rate': 5.961961398223362e-06, 'epoch': 1.27} {'loss': 0.4911, 'learning_rate': 5.9616619242834295e-06, 'epoch': 1.27} {'loss': 0.6786, 'learning_rate': 5.961362454670936e-06, 'epoch': 1.27} {'loss': 0.4879, 'learning_rate': 5.961062989386211e-06, 'epoch': 1.27} {'loss': 0.5334, 'learning_rate': 5.960763528429571e-06, 'epoch': 1.27} {'loss': 0.6093, 'learning_rate': 5.960464071801337e-06, 'epoch': 1.27} {'loss': 0.4797, 'learning_rate': 5.9601646195018295e-06, 'epoch': 1.27} {'loss': 0.678, 'learning_rate': 5.959865171531371e-06, 'epoch': 1.27} {'loss': 0.4891, 'learning_rate': 5.959565727890284e-06, 'epoch': 1.27} {'loss': 0.624, 'learning_rate': 5.959266288578882e-06, 'epoch': 1.27} {'loss': 0.5487, 'learning_rate': 5.9589668535974945e-06, 'epoch': 1.27} {'loss': 0.5633, 'learning_rate': 5.958667422946437e-06, 'epoch': 1.27} {'loss': 0.5302, 'learning_rate': 5.958367996626034e-06, 'epoch': 1.27} {'loss': 0.6024, 'learning_rate': 5.958068574636601e-06, 'epoch': 1.27} {'loss': 0.4814, 'learning_rate': 5.957769156978466e-06, 'epoch': 1.27} {'loss': 0.6414, 'learning_rate': 5.957469743651947e-06, 'epoch': 1.27} {'loss': 0.56, 'learning_rate': 5.957170334657358e-06, 'epoch': 1.27} {'loss': 0.6745, 'learning_rate': 5.956870929995031e-06, 'epoch': 1.27} {'loss': 0.3824, 'learning_rate': 5.95657152966528e-06, 'epoch': 1.27} {'loss': 0.5975, 'learning_rate': 5.956272133668431e-06, 'epoch': 1.27} {'loss': 0.5915, 'learning_rate': 5.955972742004798e-06, 'epoch': 1.27} {'loss': 0.5672, 'learning_rate': 5.955673354674703e-06, 'epoch': 1.27} {'loss': 0.5654, 'learning_rate': 5.955373971678473e-06, 'epoch': 1.27} {'loss': 0.5467, 'learning_rate': 5.955074593016421e-06, 'epoch': 1.27} {'loss': 0.4317, 'learning_rate': 5.954775218688876e-06, 'epoch': 1.27} {'loss': 0.5891, 'learning_rate': 5.954475848696152e-06, 'epoch': 1.27} {'loss': 0.5166, 'learning_rate': 5.954176483038574e-06, 'epoch': 1.27} {'loss': 0.4615, 'learning_rate': 5.9538771217164605e-06, 'epoch': 1.27} {'loss': 0.4664, 'learning_rate': 5.95357776473013e-06, 'epoch': 1.27} {'loss': 0.4893, 'learning_rate': 5.95327841207991e-06, 'epoch': 1.27} {'loss': 0.5213, 'learning_rate': 5.9529790637661154e-06, 'epoch': 1.27} {'loss': 0.5945, 'learning_rate': 5.952679719789068e-06, 'epoch': 1.27} {'loss': 0.572, 'learning_rate': 5.952380380149091e-06, 'epoch': 1.27} {'loss': 0.4939, 'learning_rate': 5.952081044846505e-06, 'epoch': 1.27} {'loss': 0.5885, 'learning_rate': 5.9517817138816296e-06, 'epoch': 1.27} {'loss': 0.5044, 'learning_rate': 5.951482387254781e-06, 'epoch': 1.27} {'loss': 0.5312, 'learning_rate': 5.9511830649662895e-06, 'epoch': 1.27} {'loss': 0.463, 'learning_rate': 5.950883747016467e-06, 'epoch': 1.27} {'loss': 0.6745, 'learning_rate': 5.9505844334056415e-06, 'epoch': 1.27} {'loss': 0.5206, 'learning_rate': 5.950285124134129e-06, 'epoch': 1.27} {'loss': 0.5623, 'learning_rate': 5.9499858192022496e-06, 'epoch': 1.27} {'loss': 0.6439, 'learning_rate': 5.949686518610329e-06, 'epoch': 1.27} {'loss': 0.5931, 'learning_rate': 5.94938722235868e-06, 'epoch': 1.27} {'loss': 0.55, 'learning_rate': 5.949087930447634e-06, 'epoch': 1.27} {'loss': 0.6417, 'learning_rate': 5.948788642877502e-06, 'epoch': 1.27} {'loss': 0.5885, 'learning_rate': 5.948489359648611e-06, 'epoch': 1.27} {'loss': 0.4658, 'learning_rate': 5.94819008076128e-06, 'epoch': 1.27} {'loss': 0.5409, 'learning_rate': 5.947890806215825e-06, 'epoch': 1.27} {'loss': 0.5396, 'learning_rate': 5.947591536012574e-06, 'epoch': 1.27} {'loss': 0.5584, 'learning_rate': 5.947292270151841e-06, 'epoch': 1.27} {'loss': 0.5203, 'learning_rate': 5.946993008633954e-06, 'epoch': 1.27} {'loss': 0.495, 'learning_rate': 5.9466937514592274e-06, 'epoch': 1.27} {'loss': 0.4979, 'learning_rate': 5.946394498627987e-06, 'epoch': 1.27} {'loss': 0.506, 'learning_rate': 5.94609525014055e-06, 'epoch': 1.27} {'loss': 0.4566, 'learning_rate': 5.9457960059972345e-06, 'epoch': 1.27} {'loss': 0.5633, 'learning_rate': 5.945496766198369e-06, 'epoch': 1.27} {'loss': 0.6956, 'learning_rate': 5.9451975307442645e-06, 'epoch': 1.27} {'loss': 0.5201, 'learning_rate': 5.944898299635251e-06, 'epoch': 1.27} {'loss': 0.6127, 'learning_rate': 5.944599072871644e-06, 'epoch': 1.27} {'loss': 0.5399, 'learning_rate': 5.944299850453765e-06, 'epoch': 1.27} {'loss': 0.4611, 'learning_rate': 5.944000632381936e-06, 'epoch': 1.27} {'loss': 0.6818, 'learning_rate': 5.943701418656472e-06, 'epoch': 1.27} {'loss': 0.5275, 'learning_rate': 5.943402209277702e-06, 'epoch': 1.27} {'loss': 0.5545, 'learning_rate': 5.9431030042459405e-06, 'epoch': 1.27} {'loss': 0.4345, 'learning_rate': 5.942803803561512e-06, 'epoch': 1.27} {'loss': 0.72, 'learning_rate': 5.942504607224737e-06, 'epoch': 1.27} {'loss': 0.4962, 'learning_rate': 5.942205415235931e-06, 'epoch': 1.27} {'loss': 0.5006, 'learning_rate': 5.941906227595421e-06, 'epoch': 1.27} {'loss': 0.6959, 'learning_rate': 5.941607044303521e-06, 'epoch': 1.27} {'loss': 0.5559, 'learning_rate': 5.941307865360559e-06, 'epoch': 1.27} {'loss': 0.468, 'learning_rate': 5.9410086907668515e-06, 'epoch': 1.27} {'loss': 0.6309, 'learning_rate': 5.940709520522716e-06, 'epoch': 1.27} {'loss': 0.5601, 'learning_rate': 5.940410354628481e-06, 'epoch': 1.27} {'loss': 0.5286, 'learning_rate': 5.9401111930844606e-06, 'epoch': 1.27} {'loss': 0.4591, 'learning_rate': 5.9398120358909796e-06, 'epoch': 1.27} {'loss': 0.5817, 'learning_rate': 5.93951288304835e-06, 'epoch': 1.27} {'loss': 0.4617, 'learning_rate': 5.939213734556905e-06, 'epoch': 1.27} {'loss': 0.5614, 'learning_rate': 5.93891459041696e-06, 'epoch': 1.27} {'loss': 0.4644, 'learning_rate': 5.93861545062883e-06, 'epoch': 1.27} {'loss': 0.5944, 'learning_rate': 5.938316315192843e-06, 'epoch': 1.27} {'loss': 0.545, 'learning_rate': 5.938017184109315e-06, 'epoch': 1.27} {'loss': 0.3743, 'learning_rate': 5.937718057378571e-06, 'epoch': 1.27} {'loss': 0.5045, 'learning_rate': 5.937418935000925e-06, 'epoch': 1.27} {'loss': 0.5027, 'learning_rate': 5.9371198169767046e-06, 'epoch': 1.27} {'loss': 0.5636, 'learning_rate': 5.936820703306225e-06, 'epoch': 1.27} {'loss': 0.4686, 'learning_rate': 5.936521593989808e-06, 'epoch': 1.27} {'loss': 0.5995, 'learning_rate': 5.9362224890277765e-06, 'epoch': 1.27} {'loss': 0.5454, 'learning_rate': 5.9359233884204484e-06, 'epoch': 1.27} {'loss': 0.6224, 'learning_rate': 5.935624292168147e-06, 'epoch': 1.27} {'loss': 0.5682, 'learning_rate': 5.935325200271192e-06, 'epoch': 1.27} {'loss': 0.5254, 'learning_rate': 5.935026112729898e-06, 'epoch': 1.27} {'loss': 0.735, 'learning_rate': 5.934727029544594e-06, 'epoch': 1.27} {'loss': 0.5236, 'learning_rate': 5.934427950715593e-06, 'epoch': 1.27} {'loss': 0.6243, 'learning_rate': 5.934128876243224e-06, 'epoch': 1.27} {'loss': 0.4671, 'learning_rate': 5.933829806127801e-06, 'epoch': 1.27} {'loss': 0.4784, 'learning_rate': 5.933530740369649e-06, 'epoch': 1.27} {'loss': 0.354, 'learning_rate': 5.933231678969084e-06, 'epoch': 1.27} {'loss': 0.3599, 'learning_rate': 5.9329326219264245e-06, 'epoch': 1.27} {'loss': 0.512, 'learning_rate': 5.932633569242e-06, 'epoch': 1.27} {'loss': 0.4753, 'learning_rate': 5.932334520916121e-06, 'epoch': 1.27} {'loss': 0.5448, 'learning_rate': 5.932035476949116e-06, 'epoch': 1.27} {'loss': 0.4571, 'learning_rate': 5.931736437341302e-06, 'epoch': 1.27} {'loss': 0.6147, 'learning_rate': 5.931437402093001e-06, 'epoch': 1.27} {'loss': 0.6267, 'learning_rate': 5.93113837120453e-06, 'epoch': 1.27} {'loss': 0.638, 'learning_rate': 5.930839344676209e-06, 'epoch': 1.27} {'loss': 0.506, 'learning_rate': 5.930540322508366e-06, 'epoch': 1.27} {'loss': 0.4844, 'learning_rate': 5.930241304701313e-06, 'epoch': 1.27} {'loss': 0.4941, 'learning_rate': 5.929942291255375e-06, 'epoch': 1.27} {'loss': 0.6887, 'learning_rate': 5.929643282170872e-06, 'epoch': 1.27} {'loss': 0.6392, 'learning_rate': 5.929344277448122e-06, 'epoch': 1.27} {'loss': 0.6944, 'learning_rate': 5.929045277087449e-06, 'epoch': 1.27} {'loss': 0.6851, 'learning_rate': 5.9287462810891665e-06, 'epoch': 1.27} {'loss': 0.4988, 'learning_rate': 5.9284472894536045e-06, 'epoch': 1.27} {'loss': 0.6682, 'learning_rate': 5.928148302181077e-06, 'epoch': 1.27} {'loss': 0.4802, 'learning_rate': 5.927849319271908e-06, 'epoch': 1.27} {'loss': 0.5509, 'learning_rate': 5.927550340726413e-06, 'epoch': 1.27} {'loss': 0.6092, 'learning_rate': 5.9272513665449174e-06, 'epoch': 1.27} {'loss': 0.4318, 'learning_rate': 5.92695239672774e-06, 'epoch': 1.27} {'loss': 0.5905, 'learning_rate': 5.926653431275198e-06, 'epoch': 1.27} {'loss': 0.5153, 'learning_rate': 5.926354470187616e-06, 'epoch': 1.27} {'loss': 0.4893, 'learning_rate': 5.926055513465313e-06, 'epoch': 1.27} {'loss': 0.7511, 'learning_rate': 5.925756561108611e-06, 'epoch': 1.27} {'loss': 0.3587, 'learning_rate': 5.925457613117829e-06, 'epoch': 1.27} {'loss': 0.4904, 'learning_rate': 5.92515866949328e-06, 'epoch': 1.27} {'loss': 0.5402, 'learning_rate': 5.924859730235298e-06, 'epoch': 1.27} {'loss': 0.635, 'learning_rate': 5.924560795344192e-06, 'epoch': 1.27} {'loss': 0.454, 'learning_rate': 5.924261864820291e-06, 'epoch': 1.27} {'loss': 0.5715, 'learning_rate': 5.923962938663912e-06, 'epoch': 1.27} {'loss': 0.5853, 'learning_rate': 5.923664016875373e-06, 'epoch': 1.27} {'loss': 0.4459, 'learning_rate': 5.923365099454996e-06, 'epoch': 1.27} {'loss': 0.4657, 'learning_rate': 5.923066186403097e-06, 'epoch': 1.27} {'loss': 0.5901, 'learning_rate': 5.922767277720005e-06, 'epoch': 1.27} {'loss': 0.5925, 'learning_rate': 5.922468373406034e-06, 'epoch': 1.27} {'loss': 0.6233, 'learning_rate': 5.922169473461508e-06, 'epoch': 1.27} {'loss': 0.6338, 'learning_rate': 5.9218705778867456e-06, 'epoch': 1.27} {'loss': 0.2707, 'learning_rate': 5.921571686682066e-06, 'epoch': 1.27} {'loss': 0.6713, 'learning_rate': 5.9212727998477915e-06, 'epoch': 1.27} {'loss': 0.4803, 'learning_rate': 5.920973917384238e-06, 'epoch': 1.27} {'loss': 0.4845, 'learning_rate': 5.920675039291732e-06, 'epoch': 1.27} {'loss': 0.3928, 'learning_rate': 5.920376165570587e-06, 'epoch': 1.27} {'loss': 0.5093, 'learning_rate': 5.9200772962211324e-06, 'epoch': 1.27} {'loss': 0.6169, 'learning_rate': 5.919778431243684e-06, 'epoch': 1.27} {'loss': 0.6885, 'learning_rate': 5.919479570638557e-06, 'epoch': 1.27} {'loss': 0.4895, 'learning_rate': 5.919180714406079e-06, 'epoch': 1.27} {'loss': 0.4308, 'learning_rate': 5.918881862546561e-06, 'epoch': 1.27} {'loss': 0.6522, 'learning_rate': 5.918583015060337e-06, 'epoch': 1.27} {'loss': 0.5873, 'learning_rate': 5.918284171947718e-06, 'epoch': 1.27} {'loss': 0.6238, 'learning_rate': 5.917985333209022e-06, 'epoch': 1.27} {'loss': 0.6453, 'learning_rate': 5.917686498844577e-06, 'epoch': 1.27} {'loss': 0.706, 'learning_rate': 5.917387668854697e-06, 'epoch': 1.27} {'loss': 0.4136, 'learning_rate': 5.917088843239707e-06, 'epoch': 1.27} {'loss': 0.5147, 'learning_rate': 5.916790021999921e-06, 'epoch': 1.27} {'loss': 0.4571, 'learning_rate': 5.916491205135667e-06, 'epoch': 1.27} {'loss': 0.5831, 'learning_rate': 5.916192392647262e-06, 'epoch': 1.27} {'loss': 0.4667, 'learning_rate': 5.91589358453502e-06, 'epoch': 1.27} {'loss': 0.4772, 'learning_rate': 5.915594780799271e-06, 'epoch': 1.27} {'loss': 0.6022, 'learning_rate': 5.915295981440329e-06, 'epoch': 1.27} {'loss': 0.5693, 'learning_rate': 5.9149971864585174e-06, 'epoch': 1.27} {'loss': 0.5165, 'learning_rate': 5.914698395854157e-06, 'epoch': 1.27} {'loss': 0.5447, 'learning_rate': 5.914399609627559e-06, 'epoch': 1.27} {'loss': 0.6372, 'learning_rate': 5.914100827779056e-06, 'epoch': 1.27} {'loss': 0.5139, 'learning_rate': 5.91380205030896e-06, 'epoch': 1.27} {'loss': 0.6337, 'learning_rate': 5.913503277217597e-06, 'epoch': 1.27} {'loss': 0.5762, 'learning_rate': 5.913204508505282e-06, 'epoch': 1.27} {'loss': 0.6013, 'learning_rate': 5.912905744172339e-06, 'epoch': 1.27} {'loss': 0.5413, 'learning_rate': 5.912606984219087e-06, 'epoch': 1.27} {'loss': 0.6057, 'learning_rate': 5.91230822864584e-06, 'epoch': 1.27} {'loss': 0.4969, 'learning_rate': 5.912009477452929e-06, 'epoch': 1.27} {'loss': 0.6255, 'learning_rate': 5.9117107306406655e-06, 'epoch': 1.27} {'loss': 0.7052, 'learning_rate': 5.911411988209374e-06, 'epoch': 1.27} {'loss': 0.5548, 'learning_rate': 5.911113250159375e-06, 'epoch': 1.27} {'loss': 0.5162, 'learning_rate': 5.910814516490988e-06, 'epoch': 1.27} {'loss': 0.5189, 'learning_rate': 5.9105157872045315e-06, 'epoch': 1.27} {'loss': 0.7133, 'learning_rate': 5.910217062300323e-06, 'epoch': 1.27} {'loss': 0.6186, 'learning_rate': 5.909918341778691e-06, 'epoch': 1.27} {'loss': 0.5698, 'learning_rate': 5.909619625639944e-06, 'epoch': 1.27} {'loss': 0.5087, 'learning_rate': 5.909320913884415e-06, 'epoch': 1.27} {'loss': 0.4078, 'learning_rate': 5.9090222065124185e-06, 'epoch': 1.27} {'loss': 0.4529, 'learning_rate': 5.9087235035242694e-06, 'epoch': 1.27} {'loss': 0.489, 'learning_rate': 5.908424804920296e-06, 'epoch': 1.27} {'loss': 0.6383, 'learning_rate': 5.90812611070081e-06, 'epoch': 1.27} {'loss': 0.5151, 'learning_rate': 5.9078274208661415e-06, 'epoch': 1.27} {'loss': 0.5262, 'learning_rate': 5.907528735416601e-06, 'epoch': 1.27} {'loss': 0.5538, 'learning_rate': 5.9072300543525156e-06, 'epoch': 1.27} {'loss': 0.5859, 'learning_rate': 5.9069313776742034e-06, 'epoch': 1.27} {'loss': 0.4548, 'learning_rate': 5.90663270538198e-06, 'epoch': 1.27} {'loss': 0.4839, 'learning_rate': 5.906334037476173e-06, 'epoch': 1.27} {'loss': 0.6796, 'learning_rate': 5.906035373957094e-06, 'epoch': 1.27} {'loss': 0.5418, 'learning_rate': 5.905736714825072e-06, 'epoch': 1.27} {'loss': 0.5292, 'learning_rate': 5.90543806008042e-06, 'epoch': 1.27} {'loss': 0.5772, 'learning_rate': 5.905139409723462e-06, 'epoch': 1.27} {'loss': 0.5977, 'learning_rate': 5.904840763754516e-06, 'epoch': 1.27} {'loss': 0.565, 'learning_rate': 5.904542122173903e-06, 'epoch': 1.27} {'loss': 0.425, 'learning_rate': 5.904243484981944e-06, 'epoch': 1.27} {'loss': 0.588, 'learning_rate': 5.9039448521789535e-06, 'epoch': 1.27} {'loss': 0.5133, 'learning_rate': 5.9036462237652606e-06, 'epoch': 1.27} {'loss': 0.5464, 'learning_rate': 5.90334759974118e-06, 'epoch': 1.27} {'loss': 0.4962, 'learning_rate': 5.903048980107031e-06, 'epoch': 1.27} {'loss': 0.6493, 'learning_rate': 5.9027503648631355e-06, 'epoch': 1.27} {'loss': 0.5975, 'learning_rate': 5.90245175400981e-06, 'epoch': 1.27} {'loss': 0.5903, 'learning_rate': 5.90215314754738e-06, 'epoch': 1.27} {'loss': 0.5225, 'learning_rate': 5.90185454547616e-06, 'epoch': 1.27} {'loss': 0.5909, 'learning_rate': 5.901555947796476e-06, 'epoch': 1.27} {'loss': 0.4787, 'learning_rate': 5.901257354508645e-06, 'epoch': 1.27} {'loss': 0.5094, 'learning_rate': 5.900958765612984e-06, 'epoch': 1.27} {'loss': 0.5627, 'learning_rate': 5.900660181109818e-06, 'epoch': 1.27} {'loss': 0.525, 'learning_rate': 5.90036160099946e-06, 'epoch': 1.27} {'loss': 0.5254, 'learning_rate': 5.900063025282241e-06, 'epoch': 1.27} {'loss': 0.6199, 'learning_rate': 5.899764453958467e-06, 'epoch': 1.27} {'loss': 0.6521, 'learning_rate': 5.899465887028473e-06, 'epoch': 1.27} {'loss': 0.4398, 'learning_rate': 5.89916732449257e-06, 'epoch': 1.27} {'loss': 0.3777, 'learning_rate': 5.898868766351076e-06, 'epoch': 1.27} {'loss': 0.6237, 'learning_rate': 5.898570212604318e-06, 'epoch': 1.27} {'loss': 0.428, 'learning_rate': 5.898271663252606e-06, 'epoch': 1.27} {'loss': 0.5057, 'learning_rate': 5.897973118296272e-06, 'epoch': 1.27} {'loss': 0.3245, 'learning_rate': 5.89767457773563e-06, 'epoch': 1.27} {'loss': 0.6705, 'learning_rate': 5.897376041570995e-06, 'epoch': 1.27} {'loss': 0.4138, 'learning_rate': 5.897077509802698e-06, 'epoch': 1.27} {'loss': 0.5348, 'learning_rate': 5.8967789824310485e-06, 'epoch': 1.27} {'loss': 0.5664, 'learning_rate': 5.896480459456373e-06, 'epoch': 1.27} {'loss': 0.5909, 'learning_rate': 5.896181940878985e-06, 'epoch': 1.27} {'loss': 0.4828, 'learning_rate': 5.895883426699213e-06, 'epoch': 1.27} {'loss': 0.69, 'learning_rate': 5.895584916917373e-06, 'epoch': 1.27} {'loss': 0.5938, 'learning_rate': 5.895286411533778e-06, 'epoch': 1.27} {'loss': 0.4653, 'learning_rate': 5.89498791054876e-06, 'epoch': 1.27} {'loss': 0.4281, 'learning_rate': 5.894689413962631e-06, 'epoch': 1.27} {'loss': 0.4568, 'learning_rate': 5.894390921775715e-06, 'epoch': 1.27} {'loss': 0.5704, 'learning_rate': 5.894092433988324e-06, 'epoch': 1.27} {'loss': 0.5721, 'learning_rate': 5.893793950600788e-06, 'epoch': 1.27} {'loss': 0.4413, 'learning_rate': 5.893495471613424e-06, 'epoch': 1.27} {'loss': 0.5586, 'learning_rate': 5.893196997026545e-06, 'epoch': 1.27} {'loss': 0.531, 'learning_rate': 5.89289852684048e-06, 'epoch': 1.27} {'loss': 0.5073, 'learning_rate': 5.892600061055542e-06, 'epoch': 1.27} {'loss': 0.6177, 'learning_rate': 5.892301599672058e-06, 'epoch': 1.27} {'loss': 0.6481, 'learning_rate': 5.892003142690342e-06, 'epoch': 1.27} {'loss': 0.6229, 'learning_rate': 5.891704690110711e-06, 'epoch': 1.27} {'loss': 0.437, 'learning_rate': 5.891406241933495e-06, 'epoch': 1.27} {'loss': 0.5642, 'learning_rate': 5.891107798159004e-06, 'epoch': 1.27} {'loss': 0.5334, 'learning_rate': 5.8908093587875635e-06, 'epoch': 1.27} {'loss': 0.5575, 'learning_rate': 5.890510923819491e-06, 'epoch': 1.27} {'loss': 0.5049, 'learning_rate': 5.89021249325511e-06, 'epoch': 1.27} {'loss': 0.5254, 'learning_rate': 5.889914067094735e-06, 'epoch': 1.27} {'loss': 0.5181, 'learning_rate': 5.889615645338686e-06, 'epoch': 1.27} {'loss': 0.5523, 'learning_rate': 5.889317227987288e-06, 'epoch': 1.27} {'loss': 0.7518, 'learning_rate': 5.889018815040854e-06, 'epoch': 1.27} {'loss': 0.609, 'learning_rate': 5.88872040649971e-06, 'epoch': 1.27} {'loss': 0.6251, 'learning_rate': 5.888422002364176e-06, 'epoch': 1.27} {'loss': 0.5447, 'learning_rate': 5.888123602634564e-06, 'epoch': 1.27} {'loss': 0.5785, 'learning_rate': 5.887825207311202e-06, 'epoch': 1.27} {'loss': 0.5307, 'learning_rate': 5.887526816394402e-06, 'epoch': 1.27} {'loss': 0.6045, 'learning_rate': 5.887228429884493e-06, 'epoch': 1.27} {'loss': 0.6034, 'learning_rate': 5.886930047781785e-06, 'epoch': 1.27} {'loss': 0.5269, 'learning_rate': 5.886631670086608e-06, 'epoch': 1.27} {'loss': 0.594, 'learning_rate': 5.886333296799276e-06, 'epoch': 1.27} {'loss': 0.4721, 'learning_rate': 5.886034927920106e-06, 'epoch': 1.27} {'loss': 0.5612, 'learning_rate': 5.885736563449424e-06, 'epoch': 1.27} {'loss': 0.4653, 'learning_rate': 5.8854382033875415e-06, 'epoch': 1.27} {'loss': 0.6344, 'learning_rate': 5.885139847734788e-06, 'epoch': 1.27} {'loss': 0.5553, 'learning_rate': 5.8848414964914745e-06, 'epoch': 1.27} {'loss': 0.4784, 'learning_rate': 5.8845431496579285e-06, 'epoch': 1.27} {'loss': 0.4556, 'learning_rate': 5.884244807234467e-06, 'epoch': 1.27} {'loss': 0.6221, 'learning_rate': 5.8839464692214055e-06, 'epoch': 1.27} {'loss': 0.6645, 'learning_rate': 5.883648135619069e-06, 'epoch': 1.27} {'loss': 0.4817, 'learning_rate': 5.883349806427772e-06, 'epoch': 1.27} {'loss': 0.5168, 'learning_rate': 5.88305148164784e-06, 'epoch': 1.27} {'loss': 0.6779, 'learning_rate': 5.882753161279591e-06, 'epoch': 1.27} {'loss': 0.5575, 'learning_rate': 5.882454845323339e-06, 'epoch': 1.27} {'loss': 0.591, 'learning_rate': 5.8821565337794126e-06, 'epoch': 1.27} {'loss': 0.5789, 'learning_rate': 5.881858226648125e-06, 'epoch': 1.27} {'loss': 0.577, 'learning_rate': 5.881559923929799e-06, 'epoch': 1.27} {'loss': 0.5307, 'learning_rate': 5.88126162562475e-06, 'epoch': 1.27} {'loss': 0.5727, 'learning_rate': 5.8809633317333046e-06, 'epoch': 1.27} {'loss': 0.4519, 'learning_rate': 5.88066504225578e-06, 'epoch': 1.27} {'loss': 0.4976, 'learning_rate': 5.880366757192492e-06, 'epoch': 1.27} {'loss': 0.6175, 'learning_rate': 5.880068476543762e-06, 'epoch': 1.27} {'loss': 0.5368, 'learning_rate': 5.879770200309911e-06, 'epoch': 1.27} {'loss': 0.4914, 'learning_rate': 5.8794719284912605e-06, 'epoch': 1.27} {'loss': 0.5319, 'learning_rate': 5.879173661088123e-06, 'epoch': 1.27} {'loss': 0.4602, 'learning_rate': 5.878875398100827e-06, 'epoch': 1.27} {'loss': 0.5541, 'learning_rate': 5.878577139529689e-06, 'epoch': 1.27} {'loss': 0.561, 'learning_rate': 5.8782788853750235e-06, 'epoch': 1.27} {'loss': 0.5794, 'learning_rate': 5.877980635637159e-06, 'epoch': 1.27} {'loss': 0.4436, 'learning_rate': 5.877682390316404e-06, 'epoch': 1.27} {'loss': 0.6753, 'learning_rate': 5.87738414941309e-06, 'epoch': 1.27} {'loss': 0.5903, 'learning_rate': 5.87708591292753e-06, 'epoch': 1.27} {'loss': 0.4757, 'learning_rate': 5.876787680860041e-06, 'epoch': 1.27} {'loss': 0.5308, 'learning_rate': 5.8764894532109495e-06, 'epoch': 1.27} {'loss': 0.4831, 'learning_rate': 5.87619122998057e-06, 'epoch': 1.27} {'loss': 0.5833, 'learning_rate': 5.875893011169225e-06, 'epoch': 1.27} {'loss': 0.6784, 'learning_rate': 5.875594796777231e-06, 'epoch': 1.27} {'loss': 0.5735, 'learning_rate': 5.875296586804911e-06, 'epoch': 1.27} {'loss': 0.6782, 'learning_rate': 5.874998381252585e-06, 'epoch': 1.27} {'loss': 0.577, 'learning_rate': 5.874700180120565e-06, 'epoch': 1.27} {'loss': 0.5451, 'learning_rate': 5.874401983409181e-06, 'epoch': 1.27} {'loss': 0.5265, 'learning_rate': 5.874103791118746e-06, 'epoch': 1.27} {'loss': 0.7013, 'learning_rate': 5.873805603249581e-06, 'epoch': 1.27} {'loss': 0.5939, 'learning_rate': 5.873507419802005e-06, 'epoch': 1.27} {'loss': 0.522, 'learning_rate': 5.87320924077634e-06, 'epoch': 1.27} {'loss': 0.5049, 'learning_rate': 5.872911066172904e-06, 'epoch': 1.27} {'loss': 0.6177, 'learning_rate': 5.872612895992012e-06, 'epoch': 1.27} {'loss': 0.6193, 'learning_rate': 5.872314730233992e-06, 'epoch': 1.27} {'loss': 0.3707, 'learning_rate': 5.872016568899158e-06, 'epoch': 1.27} {'loss': 0.4713, 'learning_rate': 5.871718411987833e-06, 'epoch': 1.27} {'loss': 0.5629, 'learning_rate': 5.871420259500333e-06, 'epoch': 1.27} {'loss': 0.5147, 'learning_rate': 5.8711221114369765e-06, 'epoch': 1.27} {'loss': 0.4087, 'learning_rate': 5.870823967798088e-06, 'epoch': 1.27} {'loss': 0.5767, 'learning_rate': 5.870525828583982e-06, 'epoch': 1.27} {'loss': 0.4407, 'learning_rate': 5.870227693794982e-06, 'epoch': 1.27} {'loss': 0.3987, 'learning_rate': 5.869929563431405e-06, 'epoch': 1.27} {'loss': 0.6078, 'learning_rate': 5.869631437493573e-06, 'epoch': 1.27} {'loss': 0.6541, 'learning_rate': 5.869333315981803e-06, 'epoch': 1.27} {'loss': 0.668, 'learning_rate': 5.8690351988964125e-06, 'epoch': 1.27} {'loss': 0.6032, 'learning_rate': 5.868737086237727e-06, 'epoch': 1.27} {'loss': 0.564, 'learning_rate': 5.868438978006059e-06, 'epoch': 1.27} {'loss': 0.6132, 'learning_rate': 5.868140874201734e-06, 'epoch': 1.27} {'loss': 0.5801, 'learning_rate': 5.867842774825069e-06, 'epoch': 1.27} {'loss': 0.5393, 'learning_rate': 5.8675446798763845e-06, 'epoch': 1.27} {'loss': 0.5582, 'learning_rate': 5.867246589355999e-06, 'epoch': 1.27} {'loss': 0.5868, 'learning_rate': 5.866948503264227e-06, 'epoch': 1.27} {'loss': 0.5064, 'learning_rate': 5.866650421601397e-06, 'epoch': 1.27} {'loss': 0.4232, 'learning_rate': 5.866352344367821e-06, 'epoch': 1.27} {'loss': 0.5113, 'learning_rate': 5.866054271563826e-06, 'epoch': 1.27} {'loss': 0.6719, 'learning_rate': 5.8657562031897255e-06, 'epoch': 1.27} {'loss': 0.6501, 'learning_rate': 5.8654581392458385e-06, 'epoch': 1.27} {'loss': 0.6322, 'learning_rate': 5.865160079732488e-06, 'epoch': 1.27} {'loss': 0.4028, 'learning_rate': 5.864862024649988e-06, 'epoch': 1.27} {'loss': 0.4188, 'learning_rate': 5.864563973998667e-06, 'epoch': 1.27} {'loss': 0.6215, 'learning_rate': 5.864265927778834e-06, 'epoch': 1.27} {'loss': 0.4897, 'learning_rate': 5.863967885990816e-06, 'epoch': 1.27} {'loss': 0.6617, 'learning_rate': 5.863669848634932e-06, 'epoch': 1.27} {'loss': 0.6226, 'learning_rate': 5.863371815711496e-06, 'epoch': 1.27} {'loss': 0.537, 'learning_rate': 5.863073787220832e-06, 'epoch': 1.27} {'loss': 0.4836, 'learning_rate': 5.862775763163254e-06, 'epoch': 1.27} {'loss': 0.6182, 'learning_rate': 5.86247774353909e-06, 'epoch': 1.27} {'loss': 0.4662, 'learning_rate': 5.862179728348654e-06, 'epoch': 1.27} {'loss': 0.4355, 'learning_rate': 5.861881717592262e-06, 'epoch': 1.27} {'loss': 0.5411, 'learning_rate': 5.86158371127024e-06, 'epoch': 1.27} {'loss': 0.4526, 'learning_rate': 5.8612857093829045e-06, 'epoch': 1.27} {'loss': 0.474, 'learning_rate': 5.860987711930574e-06, 'epoch': 1.27} {'loss': 0.5731, 'learning_rate': 5.860689718913568e-06, 'epoch': 1.27} {'loss': 0.4669, 'learning_rate': 5.860391730332209e-06, 'epoch': 1.27} {'loss': 0.5734, 'learning_rate': 5.860093746186815e-06, 'epoch': 1.27} {'loss': 0.5787, 'learning_rate': 5.859795766477698e-06, 'epoch': 1.27} {'loss': 0.4754, 'learning_rate': 5.85949779120519e-06, 'epoch': 1.27} {'loss': 0.4747, 'learning_rate': 5.859199820369601e-06, 'epoch': 1.27} {'loss': 0.39, 'learning_rate': 5.858901853971255e-06, 'epoch': 1.27} {'loss': 0.6105, 'learning_rate': 5.8586038920104645e-06, 'epoch': 1.27} {'loss': 0.6426, 'learning_rate': 5.858305934487558e-06, 'epoch': 1.27} {'loss': 0.5265, 'learning_rate': 5.858007981402851e-06, 'epoch': 1.27} {'loss': 0.5004, 'learning_rate': 5.85771003275666e-06, 'epoch': 1.27} {'loss': 0.4529, 'learning_rate': 5.857412088549308e-06, 'epoch': 1.27} {'loss': 0.5619, 'learning_rate': 5.857114148781111e-06, 'epoch': 1.27} {'loss': 0.5599, 'learning_rate': 5.856816213452393e-06, 'epoch': 1.27} {'loss': 0.7159, 'learning_rate': 5.856518282563471e-06, 'epoch': 1.27} {'loss': 0.4446, 'learning_rate': 5.856220356114658e-06, 'epoch': 1.27} {'loss': 0.4971, 'learning_rate': 5.855922434106284e-06, 'epoch': 1.27} {'loss': 0.5194, 'learning_rate': 5.85562451653866e-06, 'epoch': 1.27} {'loss': 0.5245, 'learning_rate': 5.8553266034121126e-06, 'epoch': 1.27} {'loss': 0.4917, 'learning_rate': 5.855028694726951e-06, 'epoch': 1.27} {'loss': 0.5355, 'learning_rate': 5.854730790483505e-06, 'epoch': 1.27} {'loss': 0.4931, 'learning_rate': 5.8544328906820876e-06, 'epoch': 1.27} {'loss': 0.5162, 'learning_rate': 5.854134995323017e-06, 'epoch': 1.27} {'loss': 0.6261, 'learning_rate': 5.853837104406619e-06, 'epoch': 1.27} {'loss': 0.5951, 'learning_rate': 5.853539217933206e-06, 'epoch': 1.27} {'loss': 0.581, 'learning_rate': 5.853241335903103e-06, 'epoch': 1.27} {'loss': 0.6588, 'learning_rate': 5.852943458316621e-06, 'epoch': 1.27} {'loss': 0.5525, 'learning_rate': 5.852645585174088e-06, 'epoch': 1.27} {'loss': 0.4503, 'learning_rate': 5.852347716475821e-06, 'epoch': 1.27} {'loss': 0.5921, 'learning_rate': 5.852049852222134e-06, 'epoch': 1.27} {'loss': 0.4555, 'learning_rate': 5.851751992413353e-06, 'epoch': 1.27} {'loss': 0.3797, 'learning_rate': 5.851454137049793e-06, 'epoch': 1.27} {'loss': 0.3799, 'learning_rate': 5.851156286131775e-06, 'epoch': 1.27} {'loss': 0.5159, 'learning_rate': 5.850858439659618e-06, 'epoch': 1.27} {'loss': 0.4693, 'learning_rate': 5.850560597633636e-06, 'epoch': 1.27} {'loss': 0.4519, 'learning_rate': 5.850262760054159e-06, 'epoch': 1.27} {'loss': 0.5638, 'learning_rate': 5.849964926921494e-06, 'epoch': 1.27} {'loss': 0.5553, 'learning_rate': 5.8496670982359715e-06, 'epoch': 1.27} {'loss': 0.5393, 'learning_rate': 5.849369273997902e-06, 'epoch': 1.27} {'loss': 0.5807, 'learning_rate': 5.849071454207611e-06, 'epoch': 1.27} {'loss': 0.5095, 'learning_rate': 5.848773638865414e-06, 'epoch': 1.27} {'loss': 0.4331, 'learning_rate': 5.848475827971627e-06, 'epoch': 1.27} {'loss': 0.5957, 'learning_rate': 5.848178021526576e-06, 'epoch': 1.27} {'loss': 0.5085, 'learning_rate': 5.847880219530574e-06, 'epoch': 1.27} {'loss': 0.366, 'learning_rate': 5.847582421983946e-06, 'epoch': 1.27} {'loss': 0.5023, 'learning_rate': 5.8472846288870074e-06, 'epoch': 1.27} {'loss': 0.5031, 'learning_rate': 5.846986840240081e-06, 'epoch': 1.27} {'loss': 0.586, 'learning_rate': 5.846689056043481e-06, 'epoch': 1.27} {'loss': 0.5088, 'learning_rate': 5.846391276297525e-06, 'epoch': 1.27} {'loss': 0.5592, 'learning_rate': 5.84609350100254e-06, 'epoch': 1.27} {'loss': 0.4979, 'learning_rate': 5.845795730158836e-06, 'epoch': 1.27} {'loss': 0.612, 'learning_rate': 5.8454979637667415e-06, 'epoch': 1.28} {'loss': 0.6276, 'learning_rate': 5.845200201826571e-06, 'epoch': 1.28} {'loss': 0.5748, 'learning_rate': 5.844902444338642e-06, 'epoch': 1.28} {'loss': 0.5826, 'learning_rate': 5.844604691303276e-06, 'epoch': 1.28} {'loss': 0.4865, 'learning_rate': 5.844306942720788e-06, 'epoch': 1.28} {'loss': 0.5853, 'learning_rate': 5.8440091985915026e-06, 'epoch': 1.28} {'loss': 0.7374, 'learning_rate': 5.8437114589157336e-06, 'epoch': 1.28} {'loss': 0.4515, 'learning_rate': 5.843413723693807e-06, 'epoch': 1.28} {'loss': 0.5628, 'learning_rate': 5.843115992926039e-06, 'epoch': 1.28} {'loss': 0.5529, 'learning_rate': 5.842818266612743e-06, 'epoch': 1.28} {'loss': 0.5246, 'learning_rate': 5.842520544754245e-06, 'epoch': 1.28} {'loss': 0.5078, 'learning_rate': 5.8422228273508585e-06, 'epoch': 1.28} {'loss': 0.3999, 'learning_rate': 5.841925114402909e-06, 'epoch': 1.28} {'loss': 0.5762, 'learning_rate': 5.841627405910708e-06, 'epoch': 1.28} {'loss': 0.5922, 'learning_rate': 5.841329701874582e-06, 'epoch': 1.28} {'loss': 0.4449, 'learning_rate': 5.8410320022948466e-06, 'epoch': 1.28} {'loss': 0.5116, 'learning_rate': 5.8407343071718205e-06, 'epoch': 1.28} {'loss': 0.5769, 'learning_rate': 5.8404366165058225e-06, 'epoch': 1.28} {'loss': 0.5677, 'learning_rate': 5.84013893029717e-06, 'epoch': 1.28} {'loss': 0.7263, 'learning_rate': 5.839841248546187e-06, 'epoch': 1.28} {'loss': 0.5445, 'learning_rate': 5.83954357125319e-06, 'epoch': 1.28} {'loss': 0.4929, 'learning_rate': 5.839245898418493e-06, 'epoch': 1.28} {'loss': 0.6023, 'learning_rate': 5.838948230042425e-06, 'epoch': 1.28} {'loss': 0.5105, 'learning_rate': 5.838650566125297e-06, 'epoch': 1.28} {'loss': 0.445, 'learning_rate': 5.83835290666743e-06, 'epoch': 1.28} {'loss': 0.3313, 'learning_rate': 5.838055251669144e-06, 'epoch': 1.28} {'loss': 0.4989, 'learning_rate': 5.83775760113076e-06, 'epoch': 1.28} {'loss': 0.4877, 'learning_rate': 5.8374599550525916e-06, 'epoch': 1.28} {'loss': 0.5397, 'learning_rate': 5.8371623134349605e-06, 'epoch': 1.28} {'loss': 0.5458, 'learning_rate': 5.836864676278184e-06, 'epoch': 1.28} {'loss': 0.503, 'learning_rate': 5.836567043582586e-06, 'epoch': 1.28} {'loss': 0.5468, 'learning_rate': 5.83626941534848e-06, 'epoch': 1.28} {'loss': 0.5993, 'learning_rate': 5.835971791576191e-06, 'epoch': 1.28} {'loss': 0.4889, 'learning_rate': 5.835674172266032e-06, 'epoch': 1.28} {'loss': 0.3799, 'learning_rate': 5.835376557418322e-06, 'epoch': 1.28} {'loss': 0.5673, 'learning_rate': 5.835078947033383e-06, 'epoch': 1.28} {'loss': 0.6105, 'learning_rate': 5.834781341111532e-06, 'epoch': 1.28} {'loss': 0.4551, 'learning_rate': 5.83448373965309e-06, 'epoch': 1.28} {'loss': 0.408, 'learning_rate': 5.834186142658372e-06, 'epoch': 1.28} {'loss': 0.5308, 'learning_rate': 5.833888550127707e-06, 'epoch': 1.28} {'loss': 0.4961, 'learning_rate': 5.833590962061399e-06, 'epoch': 1.28} {'loss': 0.5454, 'learning_rate': 5.833293378459777e-06, 'epoch': 1.28} {'loss': 0.5498, 'learning_rate': 5.832995799323155e-06, 'epoch': 1.28} {'loss': 0.6718, 'learning_rate': 5.832698224651856e-06, 'epoch': 1.28} {'loss': 0.486, 'learning_rate': 5.832400654446196e-06, 'epoch': 1.28} {'loss': 0.4698, 'learning_rate': 5.832103088706496e-06, 'epoch': 1.28} {'loss': 0.5248, 'learning_rate': 5.831805527433076e-06, 'epoch': 1.28} {'loss': 0.5238, 'learning_rate': 5.83150797062625e-06, 'epoch': 1.28} {'loss': 0.5233, 'learning_rate': 5.831210418286339e-06, 'epoch': 1.28} {'loss': 0.4216, 'learning_rate': 5.830912870413662e-06, 'epoch': 1.28} {'loss': 0.4268, 'learning_rate': 5.830615327008537e-06, 'epoch': 1.28} {'loss': 0.4977, 'learning_rate': 5.830317788071291e-06, 'epoch': 1.28} {'loss': 0.5836, 'learning_rate': 5.830020253602227e-06, 'epoch': 1.28} {'loss': 0.522, 'learning_rate': 5.829722723601679e-06, 'epoch': 1.28} {'loss': 0.4935, 'learning_rate': 5.829425198069955e-06, 'epoch': 1.28} {'loss': 0.5501, 'learning_rate': 5.82912767700738e-06, 'epoch': 1.28} {'loss': 0.5458, 'learning_rate': 5.828830160414271e-06, 'epoch': 1.28} {'loss': 0.4424, 'learning_rate': 5.828532648290947e-06, 'epoch': 1.28} {'loss': 0.6378, 'learning_rate': 5.828235140637731e-06, 'epoch': 1.28} {'loss': 0.564, 'learning_rate': 5.827937637454928e-06, 'epoch': 1.28} {'loss': 0.5157, 'learning_rate': 5.827640138742876e-06, 'epoch': 1.28} {'loss': 0.5772, 'learning_rate': 5.827342644501879e-06, 'epoch': 1.28} {'loss': 0.6712, 'learning_rate': 5.827045154732263e-06, 'epoch': 1.28} {'loss': 0.3775, 'learning_rate': 5.826747669434343e-06, 'epoch': 1.28} {'loss': 0.3436, 'learning_rate': 5.826450188608439e-06, 'epoch': 1.28} {'loss': 0.4571, 'learning_rate': 5.826152712254875e-06, 'epoch': 1.28} {'loss': 0.4323, 'learning_rate': 5.825855240373957e-06, 'epoch': 1.28} {'loss': 0.5856, 'learning_rate': 5.825557772966021e-06, 'epoch': 1.28} {'loss': 0.5507, 'learning_rate': 5.825260310031371e-06, 'epoch': 1.28} {'loss': 0.637, 'learning_rate': 5.824962851570333e-06, 'epoch': 1.28} {'loss': 0.5564, 'learning_rate': 5.824665397583227e-06, 'epoch': 1.28} {'loss': 0.5772, 'learning_rate': 5.82436794807036e-06, 'epoch': 1.28} {'loss': 0.4912, 'learning_rate': 5.824070503032069e-06, 'epoch': 1.28} {'loss': 0.6059, 'learning_rate': 5.82377306246866e-06, 'epoch': 1.28} {'loss': 0.5524, 'learning_rate': 5.823475626380453e-06, 'epoch': 1.28} {'loss': 0.5475, 'learning_rate': 5.82317819476777e-06, 'epoch': 1.28} {'loss': 0.4154, 'learning_rate': 5.822880767630929e-06, 'epoch': 1.28} {'loss': 0.4519, 'learning_rate': 5.822583344970252e-06, 'epoch': 1.28} {'loss': 0.4712, 'learning_rate': 5.822285926786046e-06, 'epoch': 1.28} {'loss': 0.6754, 'learning_rate': 5.821988513078645e-06, 'epoch': 1.28} {'loss': 0.5936, 'learning_rate': 5.821691103848357e-06, 'epoch': 1.28} {'loss': 0.5778, 'learning_rate': 5.821393699095503e-06, 'epoch': 1.28} {'loss': 0.4351, 'learning_rate': 5.821096298820403e-06, 'epoch': 1.28} {'loss': 0.649, 'learning_rate': 5.820798903023377e-06, 'epoch': 1.28} {'loss': 0.5884, 'learning_rate': 5.8205015117047455e-06, 'epoch': 1.28} {'loss': 0.5346, 'learning_rate': 5.820204124864816e-06, 'epoch': 1.28} {'loss': 0.5513, 'learning_rate': 5.819906742503922e-06, 'epoch': 1.28} {'loss': 0.4937, 'learning_rate': 5.8196093646223725e-06, 'epoch': 1.28} {'loss': 0.6314, 'learning_rate': 5.819311991220489e-06, 'epoch': 1.28} {'loss': 0.6869, 'learning_rate': 5.819014622298593e-06, 'epoch': 1.28} {'loss': 0.6742, 'learning_rate': 5.818717257856992e-06, 'epoch': 1.28} {'loss': 0.5061, 'learning_rate': 5.818419897896022e-06, 'epoch': 1.28} {'loss': 0.5323, 'learning_rate': 5.818122542415984e-06, 'epoch': 1.28} {'loss': 0.5878, 'learning_rate': 5.817825191417212e-06, 'epoch': 1.28} {'loss': 0.425, 'learning_rate': 5.817527844900015e-06, 'epoch': 1.28} {'loss': 0.5156, 'learning_rate': 5.817230502864715e-06, 'epoch': 1.28} {'loss': 0.5371, 'learning_rate': 5.816933165311634e-06, 'epoch': 1.28} {'loss': 0.6556, 'learning_rate': 5.8166358322410765e-06, 'epoch': 1.28} {'loss': 0.3691, 'learning_rate': 5.81633850365338e-06, 'epoch': 1.28} {'loss': 0.6546, 'learning_rate': 5.816041179548848e-06, 'epoch': 1.28} {'loss': 0.4858, 'learning_rate': 5.815743859927813e-06, 'epoch': 1.28} {'loss': 0.5533, 'learning_rate': 5.815446544790581e-06, 'epoch': 1.28} {'loss': 0.5614, 'learning_rate': 5.815149234137476e-06, 'epoch': 1.28} {'loss': 0.5204, 'learning_rate': 5.814851927968821e-06, 'epoch': 1.28} {'loss': 0.6601, 'learning_rate': 5.814554626284922e-06, 'epoch': 1.28} {'loss': 0.4901, 'learning_rate': 5.814257329086113e-06, 'epoch': 1.28} {'loss': 0.559, 'learning_rate': 5.813960036372697e-06, 'epoch': 1.28} {'loss': 0.3759, 'learning_rate': 5.813662748145008e-06, 'epoch': 1.28} {'loss': 0.6268, 'learning_rate': 5.813365464403356e-06, 'epoch': 1.28} {'loss': 0.4177, 'learning_rate': 5.8130681851480575e-06, 'epoch': 1.28} {'loss': 0.6232, 'learning_rate': 5.81277091037944e-06, 'epoch': 1.28} {'loss': 0.6162, 'learning_rate': 5.812473640097807e-06, 'epoch': 1.28} {'loss': 0.5613, 'learning_rate': 5.812176374303495e-06, 'epoch': 1.28} {'loss': 0.4747, 'learning_rate': 5.811879112996808e-06, 'epoch': 1.28} {'loss': 0.5809, 'learning_rate': 5.811581856178077e-06, 'epoch': 1.28} {'loss': 0.549, 'learning_rate': 5.811284603847609e-06, 'epoch': 1.28} {'loss': 0.5242, 'learning_rate': 5.810987356005729e-06, 'epoch': 1.28} {'loss': 0.5081, 'learning_rate': 5.810690112652757e-06, 'epoch': 1.28} {'loss': 0.5804, 'learning_rate': 5.810392873789001e-06, 'epoch': 1.28} {'loss': 0.5396, 'learning_rate': 5.810095639414797e-06, 'epoch': 1.28} {'loss': 0.5301, 'learning_rate': 5.809798409530447e-06, 'epoch': 1.28} {'loss': 0.3264, 'learning_rate': 5.809501184136277e-06, 'epoch': 1.28} {'loss': 0.5299, 'learning_rate': 5.809203963232606e-06, 'epoch': 1.28} {'loss': 0.6171, 'learning_rate': 5.80890674681975e-06, 'epoch': 1.28} {'loss': 0.3063, 'learning_rate': 5.8086095348980335e-06, 'epoch': 1.28} {'loss': 0.5277, 'learning_rate': 5.808312327467761e-06, 'epoch': 1.28} {'loss': 0.5628, 'learning_rate': 5.808015124529269e-06, 'epoch': 1.28} {'loss': 0.5131, 'learning_rate': 5.807717926082863e-06, 'epoch': 1.28} {'loss': 0.4724, 'learning_rate': 5.807420732128866e-06, 'epoch': 1.28} {'loss': 0.6532, 'learning_rate': 5.807123542667596e-06, 'epoch': 1.28} {'loss': 0.5287, 'learning_rate': 5.806826357699371e-06, 'epoch': 1.28} {'loss': 0.5714, 'learning_rate': 5.806529177224513e-06, 'epoch': 1.28} {'loss': 0.4246, 'learning_rate': 5.806232001243331e-06, 'epoch': 1.28} {'loss': 0.4396, 'learning_rate': 5.805934829756159e-06, 'epoch': 1.28} {'loss': 0.4812, 'learning_rate': 5.805637662763301e-06, 'epoch': 1.28} {'loss': 0.4857, 'learning_rate': 5.80534050026508e-06, 'epoch': 1.28} {'loss': 0.6193, 'learning_rate': 5.8050433422618156e-06, 'epoch': 1.28} {'loss': 0.6244, 'learning_rate': 5.804746188753827e-06, 'epoch': 1.28} {'loss': 0.5131, 'learning_rate': 5.8044490397414354e-06, 'epoch': 1.28} {'loss': 0.4747, 'learning_rate': 5.80415189522495e-06, 'epoch': 1.28} {'loss': 0.6599, 'learning_rate': 5.803854755204696e-06, 'epoch': 1.28} {'loss': 0.4468, 'learning_rate': 5.8035576196809886e-06, 'epoch': 1.28} {'loss': 0.4938, 'learning_rate': 5.80326048865415e-06, 'epoch': 1.28} {'loss': 0.5896, 'learning_rate': 5.802963362124495e-06, 'epoch': 1.28} {'loss': 0.5692, 'learning_rate': 5.802666240092345e-06, 'epoch': 1.28} {'loss': 0.4575, 'learning_rate': 5.80236912255802e-06, 'epoch': 1.28} {'loss': 0.4614, 'learning_rate': 5.802072009521831e-06, 'epoch': 1.28} {'loss': 0.6722, 'learning_rate': 5.801774900984101e-06, 'epoch': 1.28} {'loss': 0.529, 'learning_rate': 5.801477796945149e-06, 'epoch': 1.28} {'loss': 0.6452, 'learning_rate': 5.801180697405291e-06, 'epoch': 1.28} {'loss': 0.6408, 'learning_rate': 5.800883602364849e-06, 'epoch': 1.28} {'loss': 0.4707, 'learning_rate': 5.800586511824137e-06, 'epoch': 1.28} {'loss': 0.3434, 'learning_rate': 5.800289425783481e-06, 'epoch': 1.28} {'loss': 0.5213, 'learning_rate': 5.799992344243188e-06, 'epoch': 1.28} {'loss': 0.3999, 'learning_rate': 5.799695267203585e-06, 'epoch': 1.28} {'loss': 0.5514, 'learning_rate': 5.799398194664984e-06, 'epoch': 1.28} {'loss': 0.5246, 'learning_rate': 5.799101126627711e-06, 'epoch': 1.28} {'loss': 0.3724, 'learning_rate': 5.798804063092079e-06, 'epoch': 1.28} {'loss': 0.5697, 'learning_rate': 5.79850700405841e-06, 'epoch': 1.28} {'loss': 0.6269, 'learning_rate': 5.798209949527017e-06, 'epoch': 1.28} {'loss': 0.4394, 'learning_rate': 5.797912899498222e-06, 'epoch': 1.28} {'loss': 0.6412, 'learning_rate': 5.797615853972341e-06, 'epoch': 1.28} {'loss': 0.3685, 'learning_rate': 5.797318812949695e-06, 'epoch': 1.28} {'loss': 0.6548, 'learning_rate': 5.797021776430601e-06, 'epoch': 1.28} {'loss': 0.5757, 'learning_rate': 5.796724744415383e-06, 'epoch': 1.28} {'loss': 0.4764, 'learning_rate': 5.796427716904347e-06, 'epoch': 1.28} {'loss': 0.4775, 'learning_rate': 5.79613069389782e-06, 'epoch': 1.28} {'loss': 0.5617, 'learning_rate': 5.795833675396118e-06, 'epoch': 1.28} {'loss': 0.5491, 'learning_rate': 5.795536661399559e-06, 'epoch': 1.28} {'loss': 0.565, 'learning_rate': 5.795239651908463e-06, 'epoch': 1.28} {'loss': 0.6097, 'learning_rate': 5.7949426469231474e-06, 'epoch': 1.28} {'loss': 0.3852, 'learning_rate': 5.794645646443933e-06, 'epoch': 1.28} {'loss': 0.6312, 'learning_rate': 5.794348650471131e-06, 'epoch': 1.28} {'loss': 0.4647, 'learning_rate': 5.7940516590050655e-06, 'epoch': 1.28} {'loss': 0.5474, 'learning_rate': 5.7937546720460526e-06, 'epoch': 1.28} {'loss': 0.4716, 'learning_rate': 5.793457689594412e-06, 'epoch': 1.28} {'loss': 0.58, 'learning_rate': 5.7931607116504605e-06, 'epoch': 1.28} {'loss': 0.6553, 'learning_rate': 5.79286373821452e-06, 'epoch': 1.28} {'loss': 0.496, 'learning_rate': 5.792566769286902e-06, 'epoch': 1.28} {'loss': 0.5678, 'learning_rate': 5.792269804867929e-06, 'epoch': 1.28} {'loss': 0.5637, 'learning_rate': 5.7919728449579205e-06, 'epoch': 1.28} {'loss': 0.4976, 'learning_rate': 5.791675889557191e-06, 'epoch': 1.28} {'loss': 0.599, 'learning_rate': 5.79137893866606e-06, 'epoch': 1.28} {'loss': 0.524, 'learning_rate': 5.791081992284847e-06, 'epoch': 1.28} {'loss': 0.4559, 'learning_rate': 5.790785050413874e-06, 'epoch': 1.28} {'loss': 0.4749, 'learning_rate': 5.79048811305345e-06, 'epoch': 1.28} {'loss': 0.5509, 'learning_rate': 5.790191180203899e-06, 'epoch': 1.28} {'loss': 0.5555, 'learning_rate': 5.789894251865538e-06, 'epoch': 1.28} {'loss': 0.5715, 'learning_rate': 5.789597328038683e-06, 'epoch': 1.28} {'loss': 0.6367, 'learning_rate': 5.789300408723657e-06, 'epoch': 1.28} {'loss': 0.4002, 'learning_rate': 5.7890034939207755e-06, 'epoch': 1.28} {'loss': 0.5242, 'learning_rate': 5.788706583630359e-06, 'epoch': 1.28} {'loss': 0.5199, 'learning_rate': 5.788409677852721e-06, 'epoch': 1.28} {'loss': 0.4776, 'learning_rate': 5.788112776588182e-06, 'epoch': 1.28} {'loss': 0.4382, 'learning_rate': 5.7878158798370595e-06, 'epoch': 1.28} {'loss': 0.5731, 'learning_rate': 5.787518987599673e-06, 'epoch': 1.28} {'loss': 0.6297, 'learning_rate': 5.787222099876344e-06, 'epoch': 1.28} {'loss': 0.4624, 'learning_rate': 5.7869252166673785e-06, 'epoch': 1.28} {'loss': 0.4222, 'learning_rate': 5.7866283379731125e-06, 'epoch': 1.28} {'loss': 0.5887, 'learning_rate': 5.786331463793848e-06, 'epoch': 1.28} {'loss': 0.4805, 'learning_rate': 5.786034594129912e-06, 'epoch': 1.28} {'loss': 0.5626, 'learning_rate': 5.785737728981619e-06, 'epoch': 1.28} {'loss': 0.4989, 'learning_rate': 5.785440868349288e-06, 'epoch': 1.28} {'loss': 0.5613, 'learning_rate': 5.785144012233242e-06, 'epoch': 1.28} {'loss': 0.6206, 'learning_rate': 5.7848471606337865e-06, 'epoch': 1.28} {'loss': 0.4681, 'learning_rate': 5.784550313551256e-06, 'epoch': 1.28} {'loss': 0.5135, 'learning_rate': 5.784253470985956e-06, 'epoch': 1.28} {'loss': 0.7172, 'learning_rate': 5.78395663293821e-06, 'epoch': 1.28} {'loss': 0.3774, 'learning_rate': 5.783659799408337e-06, 'epoch': 1.28} {'loss': 0.5612, 'learning_rate': 5.783362970396647e-06, 'epoch': 1.28} {'loss': 0.5288, 'learning_rate': 5.783066145903471e-06, 'epoch': 1.28} {'loss': 0.573, 'learning_rate': 5.7827693259291125e-06, 'epoch': 1.28} {'loss': 0.5859, 'learning_rate': 5.782472510473905e-06, 'epoch': 1.28} {'loss': 0.4381, 'learning_rate': 5.782175699538155e-06, 'epoch': 1.28} {'loss': 0.5716, 'learning_rate': 5.781878893122186e-06, 'epoch': 1.28} {'loss': 0.5473, 'learning_rate': 5.781582091226316e-06, 'epoch': 1.28} {'loss': 0.4696, 'learning_rate': 5.7812852938508555e-06, 'epoch': 1.28} {'loss': 0.4742, 'learning_rate': 5.780988500996135e-06, 'epoch': 1.28} {'loss': 0.5869, 'learning_rate': 5.7806917126624585e-06, 'epoch': 1.28} {'loss': 0.3983, 'learning_rate': 5.78039492885016e-06, 'epoch': 1.28} {'loss': 0.5627, 'learning_rate': 5.780098149559546e-06, 'epoch': 1.28} {'loss': 0.6088, 'learning_rate': 5.779801374790937e-06, 'epoch': 1.28} {'loss': 0.5116, 'learning_rate': 5.7795046045446545e-06, 'epoch': 1.28} {'loss': 0.456, 'learning_rate': 5.779207838821007e-06, 'epoch': 1.28} {'loss': 0.4244, 'learning_rate': 5.778911077620327e-06, 'epoch': 1.28} {'loss': 0.5713, 'learning_rate': 5.7786143209429165e-06, 'epoch': 1.28} {'loss': 0.3818, 'learning_rate': 5.77831756878911e-06, 'epoch': 1.28} {'loss': 0.4908, 'learning_rate': 5.778020821159214e-06, 'epoch': 1.28} {'loss': 0.4084, 'learning_rate': 5.777724078053548e-06, 'epoch': 1.28} {'loss': 0.7138, 'learning_rate': 5.777427339472437e-06, 'epoch': 1.28} {'loss': 0.6072, 'learning_rate': 5.7771306054161855e-06, 'epoch': 1.28} {'loss': 0.4089, 'learning_rate': 5.776833875885129e-06, 'epoch': 1.28} {'loss': 0.3423, 'learning_rate': 5.77653715087957e-06, 'epoch': 1.28} {'loss': 0.4704, 'learning_rate': 5.776240430399833e-06, 'epoch': 1.28} {'loss': 0.6205, 'learning_rate': 5.775943714446237e-06, 'epoch': 1.28} {'loss': 0.5846, 'learning_rate': 5.775647003019097e-06, 'epoch': 1.28} {'loss': 0.5633, 'learning_rate': 5.775350296118738e-06, 'epoch': 1.28} {'loss': 0.4328, 'learning_rate': 5.775053593745463e-06, 'epoch': 1.28} {'loss': 0.5164, 'learning_rate': 5.7747568958996085e-06, 'epoch': 1.28} {'loss': 0.4282, 'learning_rate': 5.774460202581478e-06, 'epoch': 1.28} {'loss': 0.4436, 'learning_rate': 5.774163513791395e-06, 'epoch': 1.28} {'loss': 0.4409, 'learning_rate': 5.773866829529678e-06, 'epoch': 1.28} {'loss': 0.3489, 'learning_rate': 5.773570149796645e-06, 'epoch': 1.28} {'loss': 0.5478, 'learning_rate': 5.773273474592615e-06, 'epoch': 1.28} {'loss': 0.478, 'learning_rate': 5.772976803917898e-06, 'epoch': 1.28} {'loss': 0.4409, 'learning_rate': 5.772680137772824e-06, 'epoch': 1.28} {'loss': 0.419, 'learning_rate': 5.772383476157701e-06, 'epoch': 1.28} {'loss': 0.4932, 'learning_rate': 5.772086819072853e-06, 'epoch': 1.28} {'loss': 0.5717, 'learning_rate': 5.771790166518597e-06, 'epoch': 1.28} {'loss': 0.4619, 'learning_rate': 5.7714935184952425e-06, 'epoch': 1.28} {'loss': 0.4557, 'learning_rate': 5.771196875003122e-06, 'epoch': 1.28} {'loss': 0.518, 'learning_rate': 5.7709002360425385e-06, 'epoch': 1.28} {'loss': 0.6317, 'learning_rate': 5.7706036016138246e-06, 'epoch': 1.28} {'loss': 0.4621, 'learning_rate': 5.770306971717286e-06, 'epoch': 1.28} {'loss': 0.5067, 'learning_rate': 5.770010346353246e-06, 'epoch': 1.28} {'loss': 0.5904, 'learning_rate': 5.769713725522024e-06, 'epoch': 1.28} {'loss': 0.5628, 'learning_rate': 5.7694171092239296e-06, 'epoch': 1.28} {'loss': 0.5696, 'learning_rate': 5.769120497459294e-06, 'epoch': 1.28} {'loss': 0.7124, 'learning_rate': 5.76882389022842e-06, 'epoch': 1.28} {'loss': 0.4409, 'learning_rate': 5.76852728753164e-06, 'epoch': 1.28} {'loss': 0.6299, 'learning_rate': 5.768230689369262e-06, 'epoch': 1.28} {'loss': 0.4557, 'learning_rate': 5.767934095741606e-06, 'epoch': 1.28} {'loss': 0.6786, 'learning_rate': 5.767637506648996e-06, 'epoch': 1.28} {'loss': 0.4718, 'learning_rate': 5.767340922091735e-06, 'epoch': 1.28} {'loss': 0.6197, 'learning_rate': 5.767044342070158e-06, 'epoch': 1.28} {'loss': 0.5077, 'learning_rate': 5.766747766584573e-06, 'epoch': 1.28} {'loss': 0.5324, 'learning_rate': 5.7664511956352974e-06, 'epoch': 1.28} {'loss': 0.4733, 'learning_rate': 5.766154629222653e-06, 'epoch': 1.28} {'loss': 0.6069, 'learning_rate': 5.765858067346955e-06, 'epoch': 1.28} {'loss': 0.4308, 'learning_rate': 5.765561510008527e-06, 'epoch': 1.28} {'loss': 0.6086, 'learning_rate': 5.765264957207675e-06, 'epoch': 1.28} {'loss': 0.4679, 'learning_rate': 5.7649684089447285e-06, 'epoch': 1.28} {'loss': 0.5845, 'learning_rate': 5.76467186522e-06, 'epoch': 1.28} {'loss': 0.5694, 'learning_rate': 5.764375326033807e-06, 'epoch': 1.28} {'loss': 0.7271, 'learning_rate': 5.7640787913864675e-06, 'epoch': 1.28} {'loss': 0.4507, 'learning_rate': 5.763782261278299e-06, 'epoch': 1.28} {'loss': 0.6651, 'learning_rate': 5.763485735709626e-06, 'epoch': 1.28} {'loss': 0.5496, 'learning_rate': 5.763189214680751e-06, 'epoch': 1.28} {'loss': 0.6572, 'learning_rate': 5.76289269819201e-06, 'epoch': 1.28} {'loss': 0.4842, 'learning_rate': 5.7625961862437075e-06, 'epoch': 1.28} {'loss': 0.4872, 'learning_rate': 5.762299678836166e-06, 'epoch': 1.28} {'loss': 0.5129, 'learning_rate': 5.762003175969704e-06, 'epoch': 1.28} {'loss': 0.6286, 'learning_rate': 5.761706677644636e-06, 'epoch': 1.28} {'loss': 0.4402, 'learning_rate': 5.761410183861287e-06, 'epoch': 1.28} {'loss': 0.7367, 'learning_rate': 5.761113694619964e-06, 'epoch': 1.28} {'loss': 0.519, 'learning_rate': 5.7608172099209925e-06, 'epoch': 1.28} {'loss': 0.4593, 'learning_rate': 5.760520729764687e-06, 'epoch': 1.28} {'loss': 0.5451, 'learning_rate': 5.760224254151365e-06, 'epoch': 1.28} {'loss': 0.5114, 'learning_rate': 5.7599277830813476e-06, 'epoch': 1.28} {'loss': 0.5896, 'learning_rate': 5.759631316554948e-06, 'epoch': 1.28} {'loss': 0.6053, 'learning_rate': 5.7593348545724914e-06, 'epoch': 1.28} {'loss': 0.5118, 'learning_rate': 5.759038397134287e-06, 'epoch': 1.28} {'loss': 0.5566, 'learning_rate': 5.758741944240654e-06, 'epoch': 1.28} {'loss': 0.6769, 'learning_rate': 5.758445495891913e-06, 'epoch': 1.28} {'loss': 0.5982, 'learning_rate': 5.75814905208838e-06, 'epoch': 1.28} {'loss': 0.4615, 'learning_rate': 5.7578526128303735e-06, 'epoch': 1.28} {'loss': 0.6428, 'learning_rate': 5.757556178118215e-06, 'epoch': 1.28} {'loss': 0.3939, 'learning_rate': 5.757259747952213e-06, 'epoch': 1.28} {'loss': 0.5648, 'learning_rate': 5.7569633223326915e-06, 'epoch': 1.28} {'loss': 0.436, 'learning_rate': 5.756666901259965e-06, 'epoch': 1.28} {'loss': 0.6327, 'learning_rate': 5.756370484734355e-06, 'epoch': 1.28} {'loss': 0.4567, 'learning_rate': 5.756074072756175e-06, 'epoch': 1.28} {'loss': 0.5157, 'learning_rate': 5.755777665325746e-06, 'epoch': 1.28} {'loss': 0.3936, 'learning_rate': 5.755481262443387e-06, 'epoch': 1.28} {'loss': 0.4283, 'learning_rate': 5.75518486410941e-06, 'epoch': 1.28} {'loss': 0.6206, 'learning_rate': 5.754888470324136e-06, 'epoch': 1.28} {'loss': 0.5927, 'learning_rate': 5.754592081087881e-06, 'epoch': 1.28} {'loss': 0.692, 'learning_rate': 5.754295696400965e-06, 'epoch': 1.28} {'loss': 0.4509, 'learning_rate': 5.753999316263703e-06, 'epoch': 1.28} {'loss': 0.5136, 'learning_rate': 5.753702940676413e-06, 'epoch': 1.28} {'loss': 0.554, 'learning_rate': 5.7534065696394195e-06, 'epoch': 1.28} {'loss': 0.5358, 'learning_rate': 5.753110203153029e-06, 'epoch': 1.28} {'loss': 0.5949, 'learning_rate': 5.752813841217566e-06, 'epoch': 1.28} {'loss': 0.4543, 'learning_rate': 5.752517483833345e-06, 'epoch': 1.28} {'loss': 0.5477, 'learning_rate': 5.7522211310006855e-06, 'epoch': 1.28} {'loss': 0.5163, 'learning_rate': 5.751924782719909e-06, 'epoch': 1.28} {'loss': 0.5506, 'learning_rate': 5.751628438991323e-06, 'epoch': 1.28} {'loss': 0.6058, 'learning_rate': 5.75133209981525e-06, 'epoch': 1.28} {'loss': 0.5315, 'learning_rate': 5.75103576519201e-06, 'epoch': 1.28} {'loss': 0.5133, 'learning_rate': 5.750739435121917e-06, 'epoch': 1.28} {'loss': 0.6358, 'learning_rate': 5.750443109605293e-06, 'epoch': 1.28} {'loss': 0.6053, 'learning_rate': 5.75014678864245e-06, 'epoch': 1.28} {'loss': 0.5743, 'learning_rate': 5.749850472233713e-06, 'epoch': 1.28} {'loss': 0.6501, 'learning_rate': 5.749554160379392e-06, 'epoch': 1.28} {'loss': 0.534, 'learning_rate': 5.749257853079806e-06, 'epoch': 1.28} {'loss': 0.6156, 'learning_rate': 5.7489615503352734e-06, 'epoch': 1.28} {'loss': 0.3415, 'learning_rate': 5.748665252146113e-06, 'epoch': 1.28} {'loss': 0.5767, 'learning_rate': 5.7483689585126414e-06, 'epoch': 1.28} {'loss': 0.5644, 'learning_rate': 5.748072669435177e-06, 'epoch': 1.28} {'loss': 0.4822, 'learning_rate': 5.7477763849140385e-06, 'epoch': 1.28} {'loss': 0.6615, 'learning_rate': 5.747480104949539e-06, 'epoch': 1.28} {'loss': 0.5375, 'learning_rate': 5.747183829541998e-06, 'epoch': 1.28} {'loss': 0.5721, 'learning_rate': 5.746887558691734e-06, 'epoch': 1.28} {'loss': 0.5528, 'learning_rate': 5.746591292399063e-06, 'epoch': 1.28} {'loss': 0.5496, 'learning_rate': 5.746295030664307e-06, 'epoch': 1.28} {'loss': 0.5868, 'learning_rate': 5.7459987734877735e-06, 'epoch': 1.28} {'loss': 0.564, 'learning_rate': 5.7457025208697924e-06, 'epoch': 1.28} {'loss': 0.4619, 'learning_rate': 5.7454062728106715e-06, 'epoch': 1.28} {'loss': 0.5358, 'learning_rate': 5.745110029310732e-06, 'epoch': 1.28} {'loss': 0.5995, 'learning_rate': 5.744813790370291e-06, 'epoch': 1.28} {'loss': 0.5296, 'learning_rate': 5.744517555989666e-06, 'epoch': 1.28} {'loss': 0.5879, 'learning_rate': 5.744221326169179e-06, 'epoch': 1.28} {'loss': 0.442, 'learning_rate': 5.743925100909136e-06, 'epoch': 1.28} {'loss': 0.5493, 'learning_rate': 5.743628880209867e-06, 'epoch': 1.28} {'loss': 0.5223, 'learning_rate': 5.7433326640716815e-06, 'epoch': 1.28} {'loss': 0.3944, 'learning_rate': 5.743036452494898e-06, 'epoch': 1.28} {'loss': 0.4361, 'learning_rate': 5.742740245479837e-06, 'epoch': 1.28} {'loss': 0.4962, 'learning_rate': 5.742444043026811e-06, 'epoch': 1.28} {'loss': 0.6528, 'learning_rate': 5.742147845136148e-06, 'epoch': 1.28} {'loss': 0.4625, 'learning_rate': 5.741851651808148e-06, 'epoch': 1.28} {'loss': 0.5714, 'learning_rate': 5.7415554630431454e-06, 'epoch': 1.28} {'loss': 0.524, 'learning_rate': 5.741259278841448e-06, 'epoch': 1.28} {'loss': 0.5788, 'learning_rate': 5.740963099203375e-06, 'epoch': 1.28} {'loss': 0.5748, 'learning_rate': 5.7406669241292486e-06, 'epoch': 1.28} {'loss': 0.5789, 'learning_rate': 5.7403707536193744e-06, 'epoch': 1.28} {'loss': 0.6477, 'learning_rate': 5.740074587674085e-06, 'epoch': 1.28} {'loss': 0.5098, 'learning_rate': 5.739778426293683e-06, 'epoch': 1.28} {'loss': 0.5041, 'learning_rate': 5.7394822694785006e-06, 'epoch': 1.28} {'loss': 0.4549, 'learning_rate': 5.7391861172288424e-06, 'epoch': 1.28} {'loss': 0.4385, 'learning_rate': 5.7388899695450316e-06, 'epoch': 1.28} {'loss': 0.5158, 'learning_rate': 5.738593826427388e-06, 'epoch': 1.28} {'loss': 0.585, 'learning_rate': 5.738297687876219e-06, 'epoch': 1.28} {'loss': 0.6966, 'learning_rate': 5.738001553891855e-06, 'epoch': 1.28} {'loss': 0.6053, 'learning_rate': 5.7377054244746e-06, 'epoch': 1.28} {'loss': 0.6953, 'learning_rate': 5.737409299624788e-06, 'epoch': 1.28} {'loss': 0.3575, 'learning_rate': 5.737113179342719e-06, 'epoch': 1.28} {'loss': 0.4961, 'learning_rate': 5.736817063628722e-06, 'epoch': 1.28} {'loss': 0.5374, 'learning_rate': 5.736520952483111e-06, 'epoch': 1.28} {'loss': 0.54, 'learning_rate': 5.736224845906196e-06, 'epoch': 1.28} {'loss': 0.5442, 'learning_rate': 5.735928743898309e-06, 'epoch': 1.28} {'loss': 0.6121, 'learning_rate': 5.7356326464597515e-06, 'epoch': 1.28} {'loss': 0.5413, 'learning_rate': 5.735336553590855e-06, 'epoch': 1.28} {'loss': 0.5687, 'learning_rate': 5.735040465291928e-06, 'epoch': 1.28} {'loss': 0.534, 'learning_rate': 5.73474438156329e-06, 'epoch': 1.28} {'loss': 0.4976, 'learning_rate': 5.734448302405262e-06, 'epoch': 1.28} {'loss': 0.4011, 'learning_rate': 5.734152227818148e-06, 'epoch': 1.28} {'loss': 0.5347, 'learning_rate': 5.7338561578022846e-06, 'epoch': 1.28} {'loss': 0.5557, 'learning_rate': 5.7335600923579715e-06, 'epoch': 1.28} {'loss': 0.4734, 'learning_rate': 5.733264031485542e-06, 'epoch': 1.28} {'loss': 0.5206, 'learning_rate': 5.7329679751853e-06, 'epoch': 1.28} {'loss': 0.3276, 'learning_rate': 5.732671923457569e-06, 'epoch': 1.28} {'loss': 0.6419, 'learning_rate': 5.732375876302669e-06, 'epoch': 1.28} {'loss': 0.5232, 'learning_rate': 5.732079833720905e-06, 'epoch': 1.28} {'loss': 0.514, 'learning_rate': 5.731783795712611e-06, 'epoch': 1.28} {'loss': 0.4544, 'learning_rate': 5.731487762278087e-06, 'epoch': 1.28} {'loss': 0.4341, 'learning_rate': 5.731191733417668e-06, 'epoch': 1.28} {'loss': 0.5808, 'learning_rate': 5.730895709131659e-06, 'epoch': 1.28} {'loss': 0.5707, 'learning_rate': 5.73059968942038e-06, 'epoch': 1.28} {'loss': 0.6628, 'learning_rate': 5.730303674284152e-06, 'epoch': 1.28} {'loss': 0.5427, 'learning_rate': 5.73000766372328e-06, 'epoch': 1.28} {'loss': 0.5755, 'learning_rate': 5.729711657738101e-06, 'epoch': 1.28} {'loss': 0.5648, 'learning_rate': 5.729415656328916e-06, 'epoch': 1.28} {'loss': 0.5744, 'learning_rate': 5.729119659496047e-06, 'epoch': 1.28} {'loss': 0.5561, 'learning_rate': 5.728823667239813e-06, 'epoch': 1.28} {'loss': 0.381, 'learning_rate': 5.7285276795605296e-06, 'epoch': 1.28} {'loss': 0.5859, 'learning_rate': 5.728231696458517e-06, 'epoch': 1.28} {'loss': 0.5104, 'learning_rate': 5.727935717934083e-06, 'epoch': 1.28} {'loss': 0.3908, 'learning_rate': 5.727639743987559e-06, 'epoch': 1.28} {'loss': 0.5232, 'learning_rate': 5.727343774619251e-06, 'epoch': 1.28} {'loss': 0.5819, 'learning_rate': 5.72704780982948e-06, 'epoch': 1.28} {'loss': 0.6596, 'learning_rate': 5.726751849618561e-06, 'epoch': 1.28} {'loss': 0.5925, 'learning_rate': 5.7264558939868155e-06, 'epoch': 1.28} {'loss': 0.43, 'learning_rate': 5.726159942934561e-06, 'epoch': 1.28} {'loss': 0.4651, 'learning_rate': 5.725863996462109e-06, 'epoch': 1.28} {'loss': 0.3714, 'learning_rate': 5.725568054569779e-06, 'epoch': 1.28} {'loss': 0.5114, 'learning_rate': 5.725272117257887e-06, 'epoch': 1.28} {'loss': 0.5821, 'learning_rate': 5.724976184526754e-06, 'epoch': 1.28} {'loss': 0.445, 'learning_rate': 5.7246802563766975e-06, 'epoch': 1.28} {'loss': 0.5639, 'learning_rate': 5.724384332808024e-06, 'epoch': 1.28} {'loss': 0.5207, 'learning_rate': 5.724088413821067e-06, 'epoch': 1.28} {'loss': 0.5978, 'learning_rate': 5.723792499416132e-06, 'epoch': 1.28} {'loss': 0.3578, 'learning_rate': 5.723496589593538e-06, 'epoch': 1.28} {'loss': 0.6658, 'learning_rate': 5.723200684353603e-06, 'epoch': 1.28} {'loss': 0.5723, 'learning_rate': 5.722904783696646e-06, 'epoch': 1.28} {'loss': 0.5793, 'learning_rate': 5.722608887622986e-06, 'epoch': 1.28} {'loss': 0.3573, 'learning_rate': 5.722312996132929e-06, 'epoch': 1.28} {'loss': 0.6673, 'learning_rate': 5.722017109226806e-06, 'epoch': 1.28} {'loss': 0.4771, 'learning_rate': 5.721721226904925e-06, 'epoch': 1.28} {'loss': 0.5004, 'learning_rate': 5.721425349167606e-06, 'epoch': 1.28} {'loss': 0.5158, 'learning_rate': 5.721129476015166e-06, 'epoch': 1.28} {'loss': 0.5671, 'learning_rate': 5.720833607447922e-06, 'epoch': 1.28} {'loss': 0.6194, 'learning_rate': 5.720537743466195e-06, 'epoch': 1.28} {'loss': 0.4819, 'learning_rate': 5.7202418840702925e-06, 'epoch': 1.28} {'loss': 0.5697, 'learning_rate': 5.719946029260539e-06, 'epoch': 1.28} {'loss': 0.6748, 'learning_rate': 5.7196501790372486e-06, 'epoch': 1.28} {'loss': 0.4854, 'learning_rate': 5.71935433340074e-06, 'epoch': 1.28} {'loss': 0.5861, 'learning_rate': 5.719058492351328e-06, 'epoch': 1.28} {'loss': 0.449, 'learning_rate': 5.718762655889334e-06, 'epoch': 1.28} {'loss': 0.6162, 'learning_rate': 5.718466824015074e-06, 'epoch': 1.28} {'loss': 0.5501, 'learning_rate': 5.71817099672886e-06, 'epoch': 1.28} {'loss': 0.5286, 'learning_rate': 5.7178751740310114e-06, 'epoch': 1.28} {'loss': 0.4955, 'learning_rate': 5.717579355921847e-06, 'epoch': 1.28} {'loss': 0.5447, 'learning_rate': 5.7172835424016835e-06, 'epoch': 1.28} {'loss': 0.4868, 'learning_rate': 5.716987733470836e-06, 'epoch': 1.28} {'loss': 0.6543, 'learning_rate': 5.716691929129623e-06, 'epoch': 1.28} {'loss': 0.6202, 'learning_rate': 5.716396129378365e-06, 'epoch': 1.28} {'loss': 0.6519, 'learning_rate': 5.7161003342173715e-06, 'epoch': 1.28} {'loss': 0.5514, 'learning_rate': 5.715804543646963e-06, 'epoch': 1.28} {'loss': 0.559, 'learning_rate': 5.715508757667456e-06, 'epoch': 1.28} {'loss': 0.524, 'learning_rate': 5.71521297627917e-06, 'epoch': 1.28} {'loss': 0.6275, 'learning_rate': 5.714917199482418e-06, 'epoch': 1.28} {'loss': 0.4503, 'learning_rate': 5.714621427277525e-06, 'epoch': 1.28} {'loss': 0.5543, 'learning_rate': 5.714325659664795e-06, 'epoch': 1.28} {'loss': 0.5714, 'learning_rate': 5.7140298966445555e-06, 'epoch': 1.28} {'loss': 0.5305, 'learning_rate': 5.713734138217117e-06, 'epoch': 1.28} {'loss': 0.5019, 'learning_rate': 5.713438384382799e-06, 'epoch': 1.28} {'loss': 0.3337, 'learning_rate': 5.7131426351419205e-06, 'epoch': 1.28} {'loss': 0.567, 'learning_rate': 5.712846890494795e-06, 'epoch': 1.28} {'loss': 0.5177, 'learning_rate': 5.7125511504417465e-06, 'epoch': 1.28} {'loss': 0.4724, 'learning_rate': 5.7122554149830814e-06, 'epoch': 1.28} {'loss': 0.4582, 'learning_rate': 5.711959684119121e-06, 'epoch': 1.28} {'loss': 0.5456, 'learning_rate': 5.711663957850184e-06, 'epoch': 1.28} {'loss': 0.4695, 'learning_rate': 5.7113682361765865e-06, 'epoch': 1.28} {'loss': 0.5572, 'learning_rate': 5.711072519098644e-06, 'epoch': 1.28} {'loss': 0.5348, 'learning_rate': 5.710776806616676e-06, 'epoch': 1.28} {'loss': 0.5529, 'learning_rate': 5.710481098731e-06, 'epoch': 1.28} {'loss': 0.5723, 'learning_rate': 5.710185395441927e-06, 'epoch': 1.28} {'loss': 0.6109, 'learning_rate': 5.7098896967497775e-06, 'epoch': 1.28} {'loss': 0.4894, 'learning_rate': 5.709594002654868e-06, 'epoch': 1.28} {'loss': 0.4506, 'learning_rate': 5.709298313157517e-06, 'epoch': 1.28} {'loss': 0.5768, 'learning_rate': 5.709002628258043e-06, 'epoch': 1.28} {'loss': 0.5534, 'learning_rate': 5.7087069479567525e-06, 'epoch': 1.28} {'loss': 0.5085, 'learning_rate': 5.708411272253977e-06, 'epoch': 1.28} {'loss': 0.5282, 'learning_rate': 5.708115601150024e-06, 'epoch': 1.28} {'loss': 0.5397, 'learning_rate': 5.707819934645212e-06, 'epoch': 1.28} {'loss': 0.4465, 'learning_rate': 5.707524272739857e-06, 'epoch': 1.28} {'loss': 0.5123, 'learning_rate': 5.707228615434278e-06, 'epoch': 1.28} {'loss': 0.4119, 'learning_rate': 5.706932962728795e-06, 'epoch': 1.28} {'loss': 0.5538, 'learning_rate': 5.706637314623713e-06, 'epoch': 1.28} {'loss': 0.4533, 'learning_rate': 5.706341671119364e-06, 'epoch': 1.28} {'loss': 0.4728, 'learning_rate': 5.706046032216054e-06, 'epoch': 1.28} {'loss': 0.5636, 'learning_rate': 5.705750397914103e-06, 'epoch': 1.28} {'loss': 0.6612, 'learning_rate': 5.705454768213828e-06, 'epoch': 1.28} {'loss': 0.5241, 'learning_rate': 5.705159143115546e-06, 'epoch': 1.28} {'loss': 0.5863, 'learning_rate': 5.704863522619577e-06, 'epoch': 1.28} {'loss': 0.5643, 'learning_rate': 5.704567906726231e-06, 'epoch': 1.28} {'loss': 0.4076, 'learning_rate': 5.704272295435829e-06, 'epoch': 1.28} {'loss': 0.5624, 'learning_rate': 5.703976688748685e-06, 'epoch': 1.28} {'loss': 0.6839, 'learning_rate': 5.7036810866651186e-06, 'epoch': 1.28} {'loss': 0.5331, 'learning_rate': 5.703385489185449e-06, 'epoch': 1.28} {'loss': 0.4331, 'learning_rate': 5.703089896309984e-06, 'epoch': 1.28} {'loss': 0.4502, 'learning_rate': 5.702794308039052e-06, 'epoch': 1.29} {'loss': 0.5657, 'learning_rate': 5.7024987243729605e-06, 'epoch': 1.29} {'loss': 0.6071, 'learning_rate': 5.702203145312028e-06, 'epoch': 1.29} {'loss': 0.491, 'learning_rate': 5.7019075708565745e-06, 'epoch': 1.29} {'loss': 0.4727, 'learning_rate': 5.701612001006914e-06, 'epoch': 1.29} {'loss': 0.5027, 'learning_rate': 5.7013164357633685e-06, 'epoch': 1.29} {'loss': 0.6238, 'learning_rate': 5.7010208751262415e-06, 'epoch': 1.29} {'loss': 0.5076, 'learning_rate': 5.700725319095869e-06, 'epoch': 1.29} {'loss': 0.5809, 'learning_rate': 5.7004297676725515e-06, 'epoch': 1.29} {'loss': 0.5171, 'learning_rate': 5.700134220856613e-06, 'epoch': 1.29} {'loss': 0.7259, 'learning_rate': 5.699838678648371e-06, 'epoch': 1.29} {'loss': 0.417, 'learning_rate': 5.6995431410481326e-06, 'epoch': 1.29} {'loss': 0.5668, 'learning_rate': 5.69924760805623e-06, 'epoch': 1.29} {'loss': 0.6001, 'learning_rate': 5.698952079672964e-06, 'epoch': 1.29} {'loss': 0.5366, 'learning_rate': 5.6986565558986675e-06, 'epoch': 1.29} {'loss': 0.5281, 'learning_rate': 5.698361036733643e-06, 'epoch': 1.29} {'loss': 0.481, 'learning_rate': 5.698065522178213e-06, 'epoch': 1.29} {'loss': 0.5318, 'learning_rate': 5.697770012232699e-06, 'epoch': 1.29} {'loss': 0.5324, 'learning_rate': 5.697474506897406e-06, 'epoch': 1.29} {'loss': 0.5314, 'learning_rate': 5.697179006172664e-06, 'epoch': 1.29} {'loss': 0.5035, 'learning_rate': 5.696883510058775e-06, 'epoch': 1.29} {'loss': 0.4224, 'learning_rate': 5.696588018556071e-06, 'epoch': 1.29} {'loss': 0.4967, 'learning_rate': 5.69629253166486e-06, 'epoch': 1.29} {'loss': 0.6539, 'learning_rate': 5.6959970493854575e-06, 'epoch': 1.29} {'loss': 0.5501, 'learning_rate': 5.695701571718186e-06, 'epoch': 1.29} {'loss': 0.4718, 'learning_rate': 5.6954060986633535e-06, 'epoch': 1.29} {'loss': 0.5512, 'learning_rate': 5.695110630221288e-06, 'epoch': 1.29} {'loss': 0.4687, 'learning_rate': 5.6948151663922926e-06, 'epoch': 1.29} {'loss': 0.4865, 'learning_rate': 5.6945197071766986e-06, 'epoch': 1.29} {'loss': 0.5538, 'learning_rate': 5.694224252574813e-06, 'epoch': 1.29} {'loss': 0.5937, 'learning_rate': 5.693928802586953e-06, 'epoch': 1.29} {'loss': 0.5982, 'learning_rate': 5.693633357213442e-06, 'epoch': 1.29} {'loss': 0.5705, 'learning_rate': 5.693337916454582e-06, 'epoch': 1.29} {'loss': 0.6886, 'learning_rate': 5.693042480310709e-06, 'epoch': 1.29} {'loss': 0.3869, 'learning_rate': 5.6927470487821216e-06, 'epoch': 1.29} {'loss': 0.8114, 'learning_rate': 5.6924516218691505e-06, 'epoch': 1.29} {'loss': 0.5198, 'learning_rate': 5.692156199572104e-06, 'epoch': 1.29} {'loss': 0.6081, 'learning_rate': 5.691860781891301e-06, 'epoch': 1.29} {'loss': 0.611, 'learning_rate': 5.691565368827061e-06, 'epoch': 1.29} {'loss': 0.4425, 'learning_rate': 5.6912699603796905e-06, 'epoch': 1.29} {'loss': 0.5222, 'learning_rate': 5.69097455654952e-06, 'epoch': 1.29} {'loss': 0.5166, 'learning_rate': 5.690679157336852e-06, 'epoch': 1.29} {'loss': 0.5874, 'learning_rate': 5.690383762742018e-06, 'epoch': 1.29} {'loss': 0.6801, 'learning_rate': 5.690088372765324e-06, 'epoch': 1.29} {'loss': 0.5108, 'learning_rate': 5.689792987407088e-06, 'epoch': 1.29} {'loss': 0.6404, 'learning_rate': 5.689497606667631e-06, 'epoch': 1.29} {'loss': 0.5094, 'learning_rate': 5.689202230547259e-06, 'epoch': 1.29} {'loss': 0.5156, 'learning_rate': 5.688906859046306e-06, 'epoch': 1.29} {'loss': 0.5259, 'learning_rate': 5.688611492165073e-06, 'epoch': 1.29} {'loss': 0.5378, 'learning_rate': 5.6883161299038805e-06, 'epoch': 1.29} {'loss': 0.5706, 'learning_rate': 5.688020772263048e-06, 'epoch': 1.29} {'loss': 0.4608, 'learning_rate': 5.687725419242889e-06, 'epoch': 1.29} {'loss': 0.6096, 'learning_rate': 5.687430070843727e-06, 'epoch': 1.29} {'loss': 0.4591, 'learning_rate': 5.687134727065864e-06, 'epoch': 1.29} {'loss': 0.568, 'learning_rate': 5.686839387909633e-06, 'epoch': 1.29} {'loss': 0.5108, 'learning_rate': 5.68654405337534e-06, 'epoch': 1.29} {'loss': 0.4981, 'learning_rate': 5.686248723463304e-06, 'epoch': 1.29} {'loss': 0.4373, 'learning_rate': 5.6859533981738425e-06, 'epoch': 1.29} {'loss': 0.5773, 'learning_rate': 5.68565807750727e-06, 'epoch': 1.29} {'loss': 0.4407, 'learning_rate': 5.685362761463909e-06, 'epoch': 1.29} {'loss': 0.6216, 'learning_rate': 5.685067450044062e-06, 'epoch': 1.29} {'loss': 0.4613, 'learning_rate': 5.684772143248064e-06, 'epoch': 1.29} {'loss': 0.4131, 'learning_rate': 5.684476841076218e-06, 'epoch': 1.29} {'loss': 0.6339, 'learning_rate': 5.6841815435288435e-06, 'epoch': 1.29} {'loss': 0.4342, 'learning_rate': 5.683886250606259e-06, 'epoch': 1.29} {'loss': 0.5949, 'learning_rate': 5.68359096230878e-06, 'epoch': 1.29} {'loss': 0.5691, 'learning_rate': 5.683295678636727e-06, 'epoch': 1.29} {'loss': 0.4328, 'learning_rate': 5.683000399590408e-06, 'epoch': 1.29} {'loss': 0.6566, 'learning_rate': 5.682705125170144e-06, 'epoch': 1.29} {'loss': 0.6486, 'learning_rate': 5.682409855376251e-06, 'epoch': 1.29} {'loss': 0.4713, 'learning_rate': 5.682114590209044e-06, 'epoch': 1.29} {'loss': 0.4809, 'learning_rate': 5.681819329668843e-06, 'epoch': 1.29} {'loss': 0.6004, 'learning_rate': 5.681524073755962e-06, 'epoch': 1.29} {'loss': 0.5992, 'learning_rate': 5.681228822470721e-06, 'epoch': 1.29} {'loss': 0.637, 'learning_rate': 5.68093357581343e-06, 'epoch': 1.29} {'loss': 0.6908, 'learning_rate': 5.680638333784407e-06, 'epoch': 1.29} {'loss': 0.46, 'learning_rate': 5.680343096383971e-06, 'epoch': 1.29} {'loss': 0.5216, 'learning_rate': 5.6800478636124365e-06, 'epoch': 1.29} {'loss': 0.6498, 'learning_rate': 5.679752635470126e-06, 'epoch': 1.29} {'loss': 0.4296, 'learning_rate': 5.6794574119573406e-06, 'epoch': 1.29} {'loss': 0.5173, 'learning_rate': 5.679162193074417e-06, 'epoch': 1.29} {'loss': 0.574, 'learning_rate': 5.678866978821655e-06, 'epoch': 1.29} {'loss': 0.4728, 'learning_rate': 5.678571769199377e-06, 'epoch': 1.29} {'loss': 0.5615, 'learning_rate': 5.6782765642079004e-06, 'epoch': 1.29} {'loss': 0.5503, 'learning_rate': 5.67798136384754e-06, 'epoch': 1.29} {'loss': 0.6634, 'learning_rate': 5.6776861681186165e-06, 'epoch': 1.29} {'loss': 0.6013, 'learning_rate': 5.67739097702144e-06, 'epoch': 1.29} {'loss': 0.6228, 'learning_rate': 5.6770957905563274e-06, 'epoch': 1.29} {'loss': 0.4048, 'learning_rate': 5.676800608723598e-06, 'epoch': 1.29} {'loss': 0.5159, 'learning_rate': 5.676505431523566e-06, 'epoch': 1.29} {'loss': 0.6192, 'learning_rate': 5.676210258956549e-06, 'epoch': 1.29} {'loss': 0.5393, 'learning_rate': 5.675915091022863e-06, 'epoch': 1.29} {'loss': 0.5628, 'learning_rate': 5.675619927722829e-06, 'epoch': 1.29} {'loss': 0.5858, 'learning_rate': 5.675324769056753e-06, 'epoch': 1.29} {'loss': 0.52, 'learning_rate': 5.675029615024956e-06, 'epoch': 1.29} {'loss': 0.3992, 'learning_rate': 5.674734465627758e-06, 'epoch': 1.29} {'loss': 0.7882, 'learning_rate': 5.67443932086547e-06, 'epoch': 1.29} {'loss': 0.5927, 'learning_rate': 5.674144180738412e-06, 'epoch': 1.29} {'loss': 0.5573, 'learning_rate': 5.673849045246903e-06, 'epoch': 1.29} {'loss': 0.4964, 'learning_rate': 5.673553914391251e-06, 'epoch': 1.29} {'loss': 0.6203, 'learning_rate': 5.673258788171776e-06, 'epoch': 1.29} {'loss': 0.4162, 'learning_rate': 5.672963666588795e-06, 'epoch': 1.29} {'loss': 0.6083, 'learning_rate': 5.672668549642624e-06, 'epoch': 1.29} {'loss': 0.4753, 'learning_rate': 5.67237343733358e-06, 'epoch': 1.29} {'loss': 0.5133, 'learning_rate': 5.672078329661977e-06, 'epoch': 1.29} {'loss': 0.3761, 'learning_rate': 5.671783226628138e-06, 'epoch': 1.29} {'loss': 0.5502, 'learning_rate': 5.67148812823237e-06, 'epoch': 1.29} {'loss': 0.5927, 'learning_rate': 5.671193034474991e-06, 'epoch': 1.29} {'loss': 0.6177, 'learning_rate': 5.670897945356322e-06, 'epoch': 1.29} {'loss': 0.4764, 'learning_rate': 5.670602860876675e-06, 'epoch': 1.29} {'loss': 0.5084, 'learning_rate': 5.670307781036368e-06, 'epoch': 1.29} {'loss': 0.599, 'learning_rate': 5.670012705835717e-06, 'epoch': 1.29} {'loss': 0.5249, 'learning_rate': 5.6697176352750424e-06, 'epoch': 1.29} {'loss': 0.6282, 'learning_rate': 5.669422569354652e-06, 'epoch': 1.29} {'loss': 0.4178, 'learning_rate': 5.669127508074867e-06, 'epoch': 1.29} {'loss': 0.5207, 'learning_rate': 5.668832451436002e-06, 'epoch': 1.29} {'loss': 0.4838, 'learning_rate': 5.668537399438374e-06, 'epoch': 1.29} {'loss': 0.417, 'learning_rate': 5.6682423520823025e-06, 'epoch': 1.29} {'loss': 0.66, 'learning_rate': 5.667947309368093e-06, 'epoch': 1.29} {'loss': 0.5737, 'learning_rate': 5.667652271296077e-06, 'epoch': 1.29} {'loss': 0.5931, 'learning_rate': 5.667357237866559e-06, 'epoch': 1.29} {'loss': 0.581, 'learning_rate': 5.667062209079857e-06, 'epoch': 1.29} {'loss': 0.6084, 'learning_rate': 5.666767184936291e-06, 'epoch': 1.29} {'loss': 0.5733, 'learning_rate': 5.666472165436174e-06, 'epoch': 1.29} {'loss': 0.5187, 'learning_rate': 5.666177150579828e-06, 'epoch': 1.29} {'loss': 0.5023, 'learning_rate': 5.665882140367556e-06, 'epoch': 1.29} {'loss': 0.4518, 'learning_rate': 5.6655871347996895e-06, 'epoch': 1.29} {'loss': 0.4811, 'learning_rate': 5.665292133876534e-06, 'epoch': 1.29} {'loss': 0.5928, 'learning_rate': 5.664997137598409e-06, 'epoch': 1.29} {'loss': 0.4559, 'learning_rate': 5.664702145965633e-06, 'epoch': 1.29} {'loss': 0.4727, 'learning_rate': 5.664407158978517e-06, 'epoch': 1.29} {'loss': 0.541, 'learning_rate': 5.664112176637386e-06, 'epoch': 1.29} {'loss': 0.5521, 'learning_rate': 5.663817198942541e-06, 'epoch': 1.29} {'loss': 0.4596, 'learning_rate': 5.663522225894316e-06, 'epoch': 1.29} {'loss': 0.6211, 'learning_rate': 5.663227257493013e-06, 'epoch': 1.29} {'loss': 0.5743, 'learning_rate': 5.6629322937389555e-06, 'epoch': 1.29} {'loss': 0.5214, 'learning_rate': 5.66263733463246e-06, 'epoch': 1.29} {'loss': 0.5075, 'learning_rate': 5.662342380173833e-06, 'epoch': 1.29} {'loss': 0.6084, 'learning_rate': 5.662047430363405e-06, 'epoch': 1.29} {'loss': 0.4356, 'learning_rate': 5.661752485201477e-06, 'epoch': 1.29} {'loss': 0.6913, 'learning_rate': 5.66145754468838e-06, 'epoch': 1.29} {'loss': 0.5908, 'learning_rate': 5.66116260882442e-06, 'epoch': 1.29} {'loss': 0.5888, 'learning_rate': 5.660867677609916e-06, 'epoch': 1.29} {'loss': 0.4352, 'learning_rate': 5.660572751045185e-06, 'epoch': 1.29} {'loss': 0.4164, 'learning_rate': 5.6602778291305386e-06, 'epoch': 1.29} {'loss': 0.4719, 'learning_rate': 5.659982911866301e-06, 'epoch': 1.29} {'loss': 0.3859, 'learning_rate': 5.65968799925278e-06, 'epoch': 1.29} {'loss': 0.5764, 'learning_rate': 5.659393091290295e-06, 'epoch': 1.29} {'loss': 0.5115, 'learning_rate': 5.659098187979162e-06, 'epoch': 1.29} {'loss': 0.5149, 'learning_rate': 5.658803289319698e-06, 'epoch': 1.29} {'loss': 0.5345, 'learning_rate': 5.658508395312221e-06, 'epoch': 1.29} {'loss': 0.6053, 'learning_rate': 5.658213505957038e-06, 'epoch': 1.29} {'loss': 0.5447, 'learning_rate': 5.657918621254477e-06, 'epoch': 1.29} {'loss': 0.4245, 'learning_rate': 5.657623741204844e-06, 'epoch': 1.29} {'loss': 0.5317, 'learning_rate': 5.65732886580846e-06, 'epoch': 1.29} {'loss': 0.5911, 'learning_rate': 5.657033995065639e-06, 'epoch': 1.29} {'loss': 0.4368, 'learning_rate': 5.6567391289767e-06, 'epoch': 1.29} {'loss': 0.6151, 'learning_rate': 5.656444267541961e-06, 'epoch': 1.29} {'loss': 0.6556, 'learning_rate': 5.656149410761724e-06, 'epoch': 1.29} {'loss': 0.584, 'learning_rate': 5.655854558636324e-06, 'epoch': 1.29} {'loss': 0.5752, 'learning_rate': 5.655559711166063e-06, 'epoch': 1.29} {'loss': 0.5269, 'learning_rate': 5.655264868351264e-06, 'epoch': 1.29} {'loss': 0.584, 'learning_rate': 5.654970030192244e-06, 'epoch': 1.29} {'loss': 0.6385, 'learning_rate': 5.654675196689307e-06, 'epoch': 1.29} {'loss': 0.5218, 'learning_rate': 5.654380367842785e-06, 'epoch': 1.29} {'loss': 0.5358, 'learning_rate': 5.654085543652981e-06, 'epoch': 1.29} {'loss': 0.5336, 'learning_rate': 5.6537907241202226e-06, 'epoch': 1.29} {'loss': 0.479, 'learning_rate': 5.6534959092448176e-06, 'epoch': 1.29} {'loss': 0.5428, 'learning_rate': 5.6532010990270816e-06, 'epoch': 1.29} {'loss': 0.6479, 'learning_rate': 5.652906293467338e-06, 'epoch': 1.29} {'loss': 0.5204, 'learning_rate': 5.65261149256589e-06, 'epoch': 1.29} {'loss': 0.4611, 'learning_rate': 5.652316696323069e-06, 'epoch': 1.29} {'loss': 0.4875, 'learning_rate': 5.652021904739175e-06, 'epoch': 1.29} {'loss': 0.5303, 'learning_rate': 5.65172711781454e-06, 'epoch': 1.29} {'loss': 0.5661, 'learning_rate': 5.6514323355494685e-06, 'epoch': 1.29} {'loss': 0.7187, 'learning_rate': 5.65113755794428e-06, 'epoch': 1.29} {'loss': 0.4848, 'learning_rate': 5.650842784999292e-06, 'epoch': 1.29} {'loss': 0.5882, 'learning_rate': 5.650548016714812e-06, 'epoch': 1.29} {'loss': 0.4081, 'learning_rate': 5.650253253091169e-06, 'epoch': 1.29} {'loss': 0.6018, 'learning_rate': 5.6499584941286665e-06, 'epoch': 1.29} {'loss': 0.5435, 'learning_rate': 5.6496637398276335e-06, 'epoch': 1.29} {'loss': 0.4443, 'learning_rate': 5.649368990188373e-06, 'epoch': 1.29} {'loss': 0.4834, 'learning_rate': 5.649074245211207e-06, 'epoch': 1.29} {'loss': 0.5359, 'learning_rate': 5.648779504896456e-06, 'epoch': 1.29} {'loss': 0.6165, 'learning_rate': 5.64848476924442e-06, 'epoch': 1.29} {'loss': 0.5303, 'learning_rate': 5.648190038255435e-06, 'epoch': 1.29} {'loss': 0.5882, 'learning_rate': 5.647895311929803e-06, 'epoch': 1.29} {'loss': 0.6763, 'learning_rate': 5.647600590267843e-06, 'epoch': 1.29} {'loss': 0.6123, 'learning_rate': 5.647305873269873e-06, 'epoch': 1.29} {'loss': 0.6326, 'learning_rate': 5.647011160936207e-06, 'epoch': 1.29} {'loss': 0.6452, 'learning_rate': 5.646716453267165e-06, 'epoch': 1.29} {'loss': 0.395, 'learning_rate': 5.646421750263051e-06, 'epoch': 1.29} {'loss': 0.4664, 'learning_rate': 5.646127051924199e-06, 'epoch': 1.29} {'loss': 0.697, 'learning_rate': 5.645832358250909e-06, 'epoch': 1.29} {'loss': 0.6206, 'learning_rate': 5.645537669243504e-06, 'epoch': 1.29} {'loss': 0.564, 'learning_rate': 5.6452429849022974e-06, 'epoch': 1.29} {'loss': 0.2411, 'learning_rate': 5.644948305227606e-06, 'epoch': 1.29} {'loss': 0.6195, 'learning_rate': 5.64465363021975e-06, 'epoch': 1.29} {'loss': 0.5264, 'learning_rate': 5.644358959879033e-06, 'epoch': 1.29} {'loss': 0.4688, 'learning_rate': 5.644064294205785e-06, 'epoch': 1.29} {'loss': 0.6336, 'learning_rate': 5.6437696332003135e-06, 'epoch': 1.29} {'loss': 0.5616, 'learning_rate': 5.6434749768629336e-06, 'epoch': 1.29} {'loss': 0.3782, 'learning_rate': 5.643180325193964e-06, 'epoch': 1.29} {'loss': 0.4726, 'learning_rate': 5.642885678193721e-06, 'epoch': 1.29} {'loss': 0.569, 'learning_rate': 5.642591035862523e-06, 'epoch': 1.29} {'loss': 0.5125, 'learning_rate': 5.642296398200678e-06, 'epoch': 1.29} {'loss': 0.6145, 'learning_rate': 5.6420017652085055e-06, 'epoch': 1.29} {'loss': 0.5708, 'learning_rate': 5.641707136886322e-06, 'epoch': 1.29} {'loss': 0.5479, 'learning_rate': 5.641412513234441e-06, 'epoch': 1.29} {'loss': 0.5973, 'learning_rate': 5.6411178942531815e-06, 'epoch': 1.29} {'loss': 0.5345, 'learning_rate': 5.6408232799428575e-06, 'epoch': 1.29} {'loss': 0.5817, 'learning_rate': 5.640528670303789e-06, 'epoch': 1.29} {'loss': 0.5945, 'learning_rate': 5.640234065336282e-06, 'epoch': 1.29} {'loss': 0.6925, 'learning_rate': 5.639939465040658e-06, 'epoch': 1.29} {'loss': 0.4816, 'learning_rate': 5.639644869417233e-06, 'epoch': 1.29} {'loss': 0.5931, 'learning_rate': 5.639350278466322e-06, 'epoch': 1.29} {'loss': 0.5727, 'learning_rate': 5.639055692188241e-06, 'epoch': 1.29} {'loss': 0.6266, 'learning_rate': 5.6387611105833066e-06, 'epoch': 1.29} {'loss': 0.3645, 'learning_rate': 5.638466533651834e-06, 'epoch': 1.29} {'loss': 0.5285, 'learning_rate': 5.638171961394136e-06, 'epoch': 1.29} {'loss': 0.5298, 'learning_rate': 5.637877393810531e-06, 'epoch': 1.29} {'loss': 0.5978, 'learning_rate': 5.6375828309013335e-06, 'epoch': 1.29} {'loss': 0.6798, 'learning_rate': 5.637288272666861e-06, 'epoch': 1.29} {'loss': 0.47, 'learning_rate': 5.636993719107427e-06, 'epoch': 1.29} {'loss': 0.5873, 'learning_rate': 5.63669917022335e-06, 'epoch': 1.29} {'loss': 0.4767, 'learning_rate': 5.636404626014942e-06, 'epoch': 1.29} {'loss': 0.5315, 'learning_rate': 5.6361100864825204e-06, 'epoch': 1.29} {'loss': 0.5716, 'learning_rate': 5.635815551626399e-06, 'epoch': 1.29} {'loss': 0.5586, 'learning_rate': 5.635521021446896e-06, 'epoch': 1.29} {'loss': 0.6178, 'learning_rate': 5.635226495944326e-06, 'epoch': 1.29} {'loss': 0.5002, 'learning_rate': 5.634931975119004e-06, 'epoch': 1.29} {'loss': 0.5899, 'learning_rate': 5.634637458971252e-06, 'epoch': 1.29} {'loss': 0.4413, 'learning_rate': 5.634342947501375e-06, 'epoch': 1.29} {'loss': 0.5133, 'learning_rate': 5.634048440709694e-06, 'epoch': 1.29} {'loss': 0.4435, 'learning_rate': 5.633753938596524e-06, 'epoch': 1.29} {'loss': 0.5193, 'learning_rate': 5.6334594411621815e-06, 'epoch': 1.29} {'loss': 0.4453, 'learning_rate': 5.63316494840698e-06, 'epoch': 1.29} {'loss': 0.6502, 'learning_rate': 5.6328704603312414e-06, 'epoch': 1.29} {'loss': 0.4819, 'learning_rate': 5.632575976935272e-06, 'epoch': 1.29} {'loss': 0.402, 'learning_rate': 5.632281498219391e-06, 'epoch': 1.29} {'loss': 0.521, 'learning_rate': 5.6319870241839145e-06, 'epoch': 1.29} {'loss': 0.5346, 'learning_rate': 5.631692554829159e-06, 'epoch': 1.29} {'loss': 0.406, 'learning_rate': 5.631398090155439e-06, 'epoch': 1.29} {'loss': 0.4798, 'learning_rate': 5.631103630163074e-06, 'epoch': 1.29} {'loss': 0.6688, 'learning_rate': 5.630809174852372e-06, 'epoch': 1.29} {'loss': 0.5654, 'learning_rate': 5.6305147242236525e-06, 'epoch': 1.29} {'loss': 0.495, 'learning_rate': 5.63022027827723e-06, 'epoch': 1.29} {'loss': 0.4322, 'learning_rate': 5.629925837013421e-06, 'epoch': 1.29} {'loss': 0.612, 'learning_rate': 5.6296314004325414e-06, 'epoch': 1.29} {'loss': 0.6852, 'learning_rate': 5.629336968534906e-06, 'epoch': 1.29} {'loss': 0.5187, 'learning_rate': 5.629042541320835e-06, 'epoch': 1.29} {'loss': 0.6176, 'learning_rate': 5.628748118790634e-06, 'epoch': 1.29} {'loss': 0.6054, 'learning_rate': 5.628453700944625e-06, 'epoch': 1.29} {'loss': 0.5045, 'learning_rate': 5.628159287783123e-06, 'epoch': 1.29} {'loss': 0.4081, 'learning_rate': 5.627864879306441e-06, 'epoch': 1.29} {'loss': 0.5256, 'learning_rate': 5.6275704755148985e-06, 'epoch': 1.29} {'loss': 0.6175, 'learning_rate': 5.627276076408807e-06, 'epoch': 1.29} {'loss': 0.4457, 'learning_rate': 5.6269816819884904e-06, 'epoch': 1.29} {'loss': 0.6193, 'learning_rate': 5.626687292254251e-06, 'epoch': 1.29} {'loss': 0.4978, 'learning_rate': 5.6263929072064124e-06, 'epoch': 1.29} {'loss': 0.5879, 'learning_rate': 5.626098526845287e-06, 'epoch': 1.29} {'loss': 0.4398, 'learning_rate': 5.625804151171194e-06, 'epoch': 1.29} {'loss': 0.4194, 'learning_rate': 5.625509780184449e-06, 'epoch': 1.29} {'loss': 0.4859, 'learning_rate': 5.6252154138853585e-06, 'epoch': 1.29} {'loss': 0.5593, 'learning_rate': 5.6249210522742505e-06, 'epoch': 1.29} {'loss': 0.4285, 'learning_rate': 5.624626695351432e-06, 'epoch': 1.29} {'loss': 0.5948, 'learning_rate': 5.624332343117221e-06, 'epoch': 1.29} {'loss': 0.4312, 'learning_rate': 5.624037995571932e-06, 'epoch': 1.29} {'loss': 0.4759, 'learning_rate': 5.623743652715881e-06, 'epoch': 1.29} {'loss': 0.371, 'learning_rate': 5.62344931454939e-06, 'epoch': 1.29} {'loss': 0.5498, 'learning_rate': 5.6231549810727574e-06, 'epoch': 1.29} {'loss': 0.6246, 'learning_rate': 5.6228606522863174e-06, 'epoch': 1.29} {'loss': 0.3989, 'learning_rate': 5.622566328190375e-06, 'epoch': 1.29} {'loss': 0.5698, 'learning_rate': 5.622272008785247e-06, 'epoch': 1.29} {'loss': 0.5123, 'learning_rate': 5.621977694071252e-06, 'epoch': 1.29} {'loss': 0.509, 'learning_rate': 5.621683384048697e-06, 'epoch': 1.29} {'loss': 0.512, 'learning_rate': 5.621389078717912e-06, 'epoch': 1.29} {'loss': 0.5654, 'learning_rate': 5.621094778079195e-06, 'epoch': 1.29} {'loss': 0.5892, 'learning_rate': 5.620800482132878e-06, 'epoch': 1.29} {'loss': 0.4744, 'learning_rate': 5.620506190879265e-06, 'epoch': 1.29} {'loss': 0.5259, 'learning_rate': 5.620211904318673e-06, 'epoch': 1.29} {'loss': 0.6495, 'learning_rate': 5.619917622451425e-06, 'epoch': 1.29} {'loss': 0.5072, 'learning_rate': 5.619623345277822e-06, 'epoch': 1.29} {'loss': 0.4651, 'learning_rate': 5.6193290727981966e-06, 'epoch': 1.29} {'loss': 0.4814, 'learning_rate': 5.619034805012846e-06, 'epoch': 1.29} {'loss': 0.5341, 'learning_rate': 5.618740541922105e-06, 'epoch': 1.29} {'loss': 0.532, 'learning_rate': 5.618446283526274e-06, 'epoch': 1.29} {'loss': 0.5515, 'learning_rate': 5.618152029825674e-06, 'epoch': 1.29} {'loss': 0.575, 'learning_rate': 5.617857780820622e-06, 'epoch': 1.29} {'loss': 0.4714, 'learning_rate': 5.617563536511423e-06, 'epoch': 1.29} {'loss': 0.5448, 'learning_rate': 5.61726929689841e-06, 'epoch': 1.29} {'loss': 0.4776, 'learning_rate': 5.6169750619818796e-06, 'epoch': 1.29} {'loss': 0.5422, 'learning_rate': 5.616680831762165e-06, 'epoch': 1.29} {'loss': 0.4754, 'learning_rate': 5.6163866062395655e-06, 'epoch': 1.29} {'loss': 0.5558, 'learning_rate': 5.616092385414407e-06, 'epoch': 1.29} {'loss': 0.3518, 'learning_rate': 5.615798169287004e-06, 'epoch': 1.29} {'loss': 0.5656, 'learning_rate': 5.6155039578576595e-06, 'epoch': 1.29} {'loss': 0.7484, 'learning_rate': 5.615209751126706e-06, 'epoch': 1.29} {'loss': 0.5829, 'learning_rate': 5.614915549094445e-06, 'epoch': 1.29} {'loss': 0.4512, 'learning_rate': 5.614621351761204e-06, 'epoch': 1.29} {'loss': 0.4851, 'learning_rate': 5.614327159127291e-06, 'epoch': 1.29} {'loss': 0.5699, 'learning_rate': 5.6140329711930196e-06, 'epoch': 1.29} {'loss': 0.5693, 'learning_rate': 5.613738787958711e-06, 'epoch': 1.29} {'loss': 0.697, 'learning_rate': 5.613444609424672e-06, 'epoch': 1.29} {'loss': 0.6215, 'learning_rate': 5.613150435591229e-06, 'epoch': 1.29} {'loss': 0.553, 'learning_rate': 5.612856266458688e-06, 'epoch': 1.29} {'loss': 0.6139, 'learning_rate': 5.612562102027368e-06, 'epoch': 1.29} {'loss': 0.382, 'learning_rate': 5.612267942297583e-06, 'epoch': 1.29} {'loss': 0.5347, 'learning_rate': 5.611973787269649e-06, 'epoch': 1.29} {'loss': 0.6555, 'learning_rate': 5.611679636943884e-06, 'epoch': 1.29} {'loss': 0.4506, 'learning_rate': 5.611385491320594e-06, 'epoch': 1.29} {'loss': 0.4961, 'learning_rate': 5.611091350400108e-06, 'epoch': 1.29} {'loss': 0.5384, 'learning_rate': 5.6107972141827296e-06, 'epoch': 1.29} {'loss': 0.5655, 'learning_rate': 5.610503082668778e-06, 'epoch': 1.29} {'loss': 0.5506, 'learning_rate': 5.610208955858569e-06, 'epoch': 1.29} {'loss': 0.4116, 'learning_rate': 5.609914833752417e-06, 'epoch': 1.29} {'loss': 0.5699, 'learning_rate': 5.609620716350641e-06, 'epoch': 1.29} {'loss': 0.569, 'learning_rate': 5.609326603653545e-06, 'epoch': 1.29} {'loss': 0.5002, 'learning_rate': 5.6090324956614606e-06, 'epoch': 1.29} {'loss': 0.6529, 'learning_rate': 5.60873839237469e-06, 'epoch': 1.29} {'loss': 0.6798, 'learning_rate': 5.608444293793551e-06, 'epoch': 1.29} {'loss': 0.6158, 'learning_rate': 5.608150199918366e-06, 'epoch': 1.29} {'loss': 0.5962, 'learning_rate': 5.6078561107494365e-06, 'epoch': 1.29} {'loss': 0.5106, 'learning_rate': 5.607562026287092e-06, 'epoch': 1.29} {'loss': 0.5047, 'learning_rate': 5.607267946531635e-06, 'epoch': 1.29} {'loss': 0.4716, 'learning_rate': 5.6069738714833945e-06, 'epoch': 1.29} {'loss': 0.5952, 'learning_rate': 5.606679801142674e-06, 'epoch': 1.29} {'loss': 0.5943, 'learning_rate': 5.606385735509792e-06, 'epoch': 1.29} {'loss': 0.6266, 'learning_rate': 5.606091674585068e-06, 'epoch': 1.29} {'loss': 0.6275, 'learning_rate': 5.605797618368806e-06, 'epoch': 1.29} {'loss': 0.5429, 'learning_rate': 5.6055035668613355e-06, 'epoch': 1.29} {'loss': 0.5663, 'learning_rate': 5.605209520062962e-06, 'epoch': 1.29} {'loss': 0.3958, 'learning_rate': 5.604915477974002e-06, 'epoch': 1.29} {'loss': 0.5126, 'learning_rate': 5.604621440594773e-06, 'epoch': 1.29} {'loss': 0.6177, 'learning_rate': 5.6043274079255875e-06, 'epoch': 1.29} {'loss': 0.5042, 'learning_rate': 5.604033379966767e-06, 'epoch': 1.29} {'loss': 0.5448, 'learning_rate': 5.603739356718611e-06, 'epoch': 1.29} {'loss': 0.568, 'learning_rate': 5.603445338181457e-06, 'epoch': 1.29} {'loss': 0.4882, 'learning_rate': 5.603151324355601e-06, 'epoch': 1.29} {'loss': 0.5546, 'learning_rate': 5.602857315241367e-06, 'epoch': 1.29} {'loss': 0.5526, 'learning_rate': 5.602563310839066e-06, 'epoch': 1.29} {'loss': 0.5719, 'learning_rate': 5.6022693111490175e-06, 'epoch': 1.29} {'loss': 0.4993, 'learning_rate': 5.601975316171538e-06, 'epoch': 1.29} {'loss': 0.6183, 'learning_rate': 5.601681325906932e-06, 'epoch': 1.29} {'loss': 0.5019, 'learning_rate': 5.6013873403555265e-06, 'epoch': 1.29} {'loss': 0.6207, 'learning_rate': 5.60109335951763e-06, 'epoch': 1.29} {'loss': 0.5225, 'learning_rate': 5.600799383393558e-06, 'epoch': 1.29} {'loss': 0.4451, 'learning_rate': 5.600505411983626e-06, 'epoch': 1.29} {'loss': 0.6034, 'learning_rate': 5.6002114452881505e-06, 'epoch': 1.29} {'loss': 0.4876, 'learning_rate': 5.599917483307449e-06, 'epoch': 1.29} {'loss': 0.4391, 'learning_rate': 5.599623526041829e-06, 'epoch': 1.29} {'loss': 0.5079, 'learning_rate': 5.59932957349161e-06, 'epoch': 1.29} {'loss': 0.5248, 'learning_rate': 5.599035625657105e-06, 'epoch': 1.29} {'loss': 0.4264, 'learning_rate': 5.598741682538633e-06, 'epoch': 1.29} {'loss': 0.6298, 'learning_rate': 5.5984477441365045e-06, 'epoch': 1.29} {'loss': 0.4741, 'learning_rate': 5.598153810451038e-06, 'epoch': 1.29} {'loss': 0.4964, 'learning_rate': 5.59785988148255e-06, 'epoch': 1.29} {'loss': 0.4652, 'learning_rate': 5.597565957231349e-06, 'epoch': 1.29} {'loss': 0.6541, 'learning_rate': 5.5972720376977526e-06, 'epoch': 1.29} {'loss': 0.5989, 'learning_rate': 5.596978122882077e-06, 'epoch': 1.29} {'loss': 0.6574, 'learning_rate': 5.596684212784638e-06, 'epoch': 1.29} {'loss': 0.4043, 'learning_rate': 5.596390307405748e-06, 'epoch': 1.29} {'loss': 0.487, 'learning_rate': 5.596096406745728e-06, 'epoch': 1.29} {'loss': 0.6474, 'learning_rate': 5.595802510804883e-06, 'epoch': 1.29} {'loss': 0.673, 'learning_rate': 5.595508619583534e-06, 'epoch': 1.29} {'loss': 0.4515, 'learning_rate': 5.595214733081995e-06, 'epoch': 1.29} {'loss': 0.6015, 'learning_rate': 5.594920851300581e-06, 'epoch': 1.29} {'loss': 0.5296, 'learning_rate': 5.594626974239606e-06, 'epoch': 1.29} {'loss': 0.5287, 'learning_rate': 5.594333101899386e-06, 'epoch': 1.29} {'loss': 0.5052, 'learning_rate': 5.59403923428024e-06, 'epoch': 1.29} {'loss': 0.63, 'learning_rate': 5.593745371382475e-06, 'epoch': 1.29} {'loss': 0.681, 'learning_rate': 5.59345151320641e-06, 'epoch': 1.29} {'loss': 0.5546, 'learning_rate': 5.593157659752358e-06, 'epoch': 1.29} {'loss': 0.4706, 'learning_rate': 5.592863811020637e-06, 'epoch': 1.29} {'loss': 0.4344, 'learning_rate': 5.592569967011558e-06, 'epoch': 1.29} {'loss': 0.5266, 'learning_rate': 5.59227612772544e-06, 'epoch': 1.29} {'loss': 0.5086, 'learning_rate': 5.591982293162599e-06, 'epoch': 1.29} {'loss': 0.5151, 'learning_rate': 5.591688463323343e-06, 'epoch': 1.29} {'loss': 0.3489, 'learning_rate': 5.591394638207991e-06, 'epoch': 1.29} {'loss': 0.5473, 'learning_rate': 5.591100817816857e-06, 'epoch': 1.29} {'loss': 0.5474, 'learning_rate': 5.5908070021502565e-06, 'epoch': 1.29} {'loss': 0.6758, 'learning_rate': 5.590513191208508e-06, 'epoch': 1.29} {'loss': 0.5804, 'learning_rate': 5.5902193849919165e-06, 'epoch': 1.29} {'loss': 0.5453, 'learning_rate': 5.589925583500808e-06, 'epoch': 1.29} {'loss': 0.5579, 'learning_rate': 5.589631786735491e-06, 'epoch': 1.29} {'loss': 0.6105, 'learning_rate': 5.58933799469628e-06, 'epoch': 1.29} {'loss': 0.4933, 'learning_rate': 5.589044207383492e-06, 'epoch': 1.29} {'loss': 0.372, 'learning_rate': 5.588750424797441e-06, 'epoch': 1.29} {'loss': 0.5981, 'learning_rate': 5.588456646938446e-06, 'epoch': 1.29} {'loss': 0.5116, 'learning_rate': 5.588162873806814e-06, 'epoch': 1.29} {'loss': 0.5226, 'learning_rate': 5.587869105402864e-06, 'epoch': 1.29} {'loss': 0.5769, 'learning_rate': 5.58757534172691e-06, 'epoch': 1.29} {'loss': 0.6243, 'learning_rate': 5.587281582779267e-06, 'epoch': 1.29} {'loss': 0.5933, 'learning_rate': 5.586987828560251e-06, 'epoch': 1.29} {'loss': 0.6458, 'learning_rate': 5.5866940790701754e-06, 'epoch': 1.29} {'loss': 0.5695, 'learning_rate': 5.586400334309359e-06, 'epoch': 1.29} {'loss': 0.5275, 'learning_rate': 5.586106594278109e-06, 'epoch': 1.29} {'loss': 0.4265, 'learning_rate': 5.585812858976745e-06, 'epoch': 1.29} {'loss': 0.5421, 'learning_rate': 5.58551912840558e-06, 'epoch': 1.29} {'loss': 0.6348, 'learning_rate': 5.58522540256493e-06, 'epoch': 1.29} {'loss': 0.5536, 'learning_rate': 5.584931681455114e-06, 'epoch': 1.29} {'loss': 0.6021, 'learning_rate': 5.584637965076434e-06, 'epoch': 1.29} {'loss': 0.5088, 'learning_rate': 5.584344253429219e-06, 'epoch': 1.29} {'loss': 0.6109, 'learning_rate': 5.584050546513776e-06, 'epoch': 1.29} {'loss': 0.5193, 'learning_rate': 5.583756844330421e-06, 'epoch': 1.29} {'loss': 0.5824, 'learning_rate': 5.583463146879468e-06, 'epoch': 1.29} {'loss': 0.6423, 'learning_rate': 5.583169454161235e-06, 'epoch': 1.29} {'loss': 0.5626, 'learning_rate': 5.582875766176037e-06, 'epoch': 1.29} {'loss': 0.6902, 'learning_rate': 5.582582082924179e-06, 'epoch': 1.29} {'loss': 0.8273, 'learning_rate': 5.58228840440599e-06, 'epoch': 1.29} {'loss': 0.5707, 'learning_rate': 5.581994730621773e-06, 'epoch': 1.29} {'loss': 0.414, 'learning_rate': 5.5817010615718495e-06, 'epoch': 1.29} {'loss': 0.3968, 'learning_rate': 5.581407397256531e-06, 'epoch': 1.29} {'loss': 0.5878, 'learning_rate': 5.581113737676134e-06, 'epoch': 1.29} {'loss': 0.6054, 'learning_rate': 5.5808200828309755e-06, 'epoch': 1.29} {'loss': 0.4835, 'learning_rate': 5.580526432721361e-06, 'epoch': 1.29} {'loss': 0.5628, 'learning_rate': 5.580232787347617e-06, 'epoch': 1.29} {'loss': 0.5556, 'learning_rate': 5.579939146710049e-06, 'epoch': 1.29} {'loss': 0.4847, 'learning_rate': 5.579645510808975e-06, 'epoch': 1.29} {'loss': 0.5529, 'learning_rate': 5.579351879644714e-06, 'epoch': 1.29} {'loss': 0.5153, 'learning_rate': 5.5790582532175695e-06, 'epoch': 1.29} {'loss': 0.5481, 'learning_rate': 5.578764631527871e-06, 'epoch': 1.29} {'loss': 0.4267, 'learning_rate': 5.5784710145759165e-06, 'epoch': 1.29} {'loss': 0.5532, 'learning_rate': 5.578177402362037e-06, 'epoch': 1.29} {'loss': 0.5126, 'learning_rate': 5.577883794886536e-06, 'epoch': 1.29} {'loss': 0.5247, 'learning_rate': 5.5775901921497315e-06, 'epoch': 1.29} {'loss': 0.6757, 'learning_rate': 5.577296594151943e-06, 'epoch': 1.29} {'loss': 0.6648, 'learning_rate': 5.5770030008934715e-06, 'epoch': 1.29} {'loss': 0.4272, 'learning_rate': 5.576709412374649e-06, 'epoch': 1.29} {'loss': 0.5144, 'learning_rate': 5.576415828595774e-06, 'epoch': 1.29} {'loss': 0.6443, 'learning_rate': 5.5761222495571745e-06, 'epoch': 1.29} {'loss': 0.4889, 'learning_rate': 5.575828675259157e-06, 'epoch': 1.29} {'loss': 0.595, 'learning_rate': 5.575535105702039e-06, 'epoch': 1.29} {'loss': 0.4638, 'learning_rate': 5.575241540886137e-06, 'epoch': 1.29} {'loss': 0.6667, 'learning_rate': 5.5749479808117555e-06, 'epoch': 1.29} {'loss': 0.689, 'learning_rate': 5.5746544254792245e-06, 'epoch': 1.29} {'loss': 0.4113, 'learning_rate': 5.574360874888845e-06, 'epoch': 1.29} {'loss': 0.4987, 'learning_rate': 5.574067329040942e-06, 'epoch': 1.29} {'loss': 0.3685, 'learning_rate': 5.573773787935823e-06, 'epoch': 1.29} {'loss': 0.4142, 'learning_rate': 5.573480251573804e-06, 'epoch': 1.29} {'loss': 0.475, 'learning_rate': 5.573186719955206e-06, 'epoch': 1.29} {'loss': 0.5201, 'learning_rate': 5.572893193080329e-06, 'epoch': 1.29} {'loss': 0.5751, 'learning_rate': 5.572599670949503e-06, 'epoch': 1.29} {'loss': 0.5606, 'learning_rate': 5.572306153563029e-06, 'epoch': 1.29} {'loss': 0.4466, 'learning_rate': 5.572012640921238e-06, 'epoch': 1.29} {'loss': 0.4976, 'learning_rate': 5.57171913302443e-06, 'epoch': 1.29} {'loss': 0.685, 'learning_rate': 5.5714256298729245e-06, 'epoch': 1.29} {'loss': 0.574, 'learning_rate': 5.571132131467041e-06, 'epoch': 1.29} {'loss': 0.5434, 'learning_rate': 5.570838637807081e-06, 'epoch': 1.29} {'loss': 0.6305, 'learning_rate': 5.5705451488933734e-06, 'epoch': 1.29} {'loss': 0.4225, 'learning_rate': 5.570251664726225e-06, 'epoch': 1.29} {'loss': 0.4812, 'learning_rate': 5.56995818530595e-06, 'epoch': 1.29} {'loss': 0.5899, 'learning_rate': 5.569664710632865e-06, 'epoch': 1.29} {'loss': 0.5766, 'learning_rate': 5.569371240707284e-06, 'epoch': 1.29} {'loss': 0.404, 'learning_rate': 5.569077775529525e-06, 'epoch': 1.29} {'loss': 0.5328, 'learning_rate': 5.568784315099893e-06, 'epoch': 1.29} {'loss': 0.4314, 'learning_rate': 5.568490859418716e-06, 'epoch': 1.29} {'loss': 0.5636, 'learning_rate': 5.568197408486296e-06, 'epoch': 1.29} {'loss': 0.4918, 'learning_rate': 5.567903962302954e-06, 'epoch': 1.29} {'loss': 0.5498, 'learning_rate': 5.5676105208690015e-06, 'epoch': 1.29} {'loss': 0.4761, 'learning_rate': 5.567317084184755e-06, 'epoch': 1.29} {'loss': 0.3795, 'learning_rate': 5.567023652250532e-06, 'epoch': 1.29} {'loss': 0.3784, 'learning_rate': 5.566730225066635e-06, 'epoch': 1.29} {'loss': 0.486, 'learning_rate': 5.566436802633395e-06, 'epoch': 1.29} {'loss': 0.6057, 'learning_rate': 5.5661433849511144e-06, 'epoch': 1.29} {'loss': 0.5211, 'learning_rate': 5.565849972020111e-06, 'epoch': 1.29} {'loss': 0.4981, 'learning_rate': 5.5655565638406995e-06, 'epoch': 1.29} {'loss': 0.4346, 'learning_rate': 5.565263160413195e-06, 'epoch': 1.29} {'loss': 0.4878, 'learning_rate': 5.564969761737915e-06, 'epoch': 1.29} {'loss': 0.5732, 'learning_rate': 5.564676367815166e-06, 'epoch': 1.29} {'loss': 0.5413, 'learning_rate': 5.564382978645267e-06, 'epoch': 1.29} {'loss': 0.6206, 'learning_rate': 5.564089594228531e-06, 'epoch': 1.29} {'loss': 0.6352, 'learning_rate': 5.563796214565273e-06, 'epoch': 1.29} {'loss': 0.5255, 'learning_rate': 5.56350283965581e-06, 'epoch': 1.29} {'loss': 0.6656, 'learning_rate': 5.563209469500452e-06, 'epoch': 1.29} {'loss': 0.5797, 'learning_rate': 5.56291610409952e-06, 'epoch': 1.29} {'loss': 0.5976, 'learning_rate': 5.562622743453321e-06, 'epoch': 1.29} {'loss': 0.5731, 'learning_rate': 5.562329387562171e-06, 'epoch': 1.29} {'loss': 0.6306, 'learning_rate': 5.5620360364263855e-06, 'epoch': 1.29} {'loss': 0.6188, 'learning_rate': 5.561742690046281e-06, 'epoch': 1.29} {'loss': 0.6353, 'learning_rate': 5.561449348422172e-06, 'epoch': 1.29} {'loss': 0.4572, 'learning_rate': 5.561156011554363e-06, 'epoch': 1.3} {'loss': 0.4705, 'learning_rate': 5.560862679443184e-06, 'epoch': 1.3} {'loss': 0.4512, 'learning_rate': 5.560569352088937e-06, 'epoch': 1.3} {'loss': 0.5659, 'learning_rate': 5.56027602949194e-06, 'epoch': 1.3} {'loss': 0.5291, 'learning_rate': 5.55998271165251e-06, 'epoch': 1.3} {'loss': 0.4957, 'learning_rate': 5.559689398570958e-06, 'epoch': 1.3} {'loss': 0.5731, 'learning_rate': 5.559396090247603e-06, 'epoch': 1.3} {'loss': 0.5865, 'learning_rate': 5.559102786682753e-06, 'epoch': 1.3} {'loss': 0.6074, 'learning_rate': 5.558809487876724e-06, 'epoch': 1.3} {'loss': 0.5426, 'learning_rate': 5.558516193829832e-06, 'epoch': 1.3} {'loss': 0.3924, 'learning_rate': 5.55822290454239e-06, 'epoch': 1.3} {'loss': 0.4744, 'learning_rate': 5.557929620014715e-06, 'epoch': 1.3} {'loss': 0.4197, 'learning_rate': 5.557636340247118e-06, 'epoch': 1.3} {'loss': 0.5198, 'learning_rate': 5.557343065239919e-06, 'epoch': 1.3} {'loss': 0.5354, 'learning_rate': 5.5570497949934234e-06, 'epoch': 1.3} {'loss': 0.5865, 'learning_rate': 5.55675652950795e-06, 'epoch': 1.3} {'loss': 0.6434, 'learning_rate': 5.556463268783814e-06, 'epoch': 1.3} {'loss': 0.6043, 'learning_rate': 5.556170012821327e-06, 'epoch': 1.3} {'loss': 0.4234, 'learning_rate': 5.555876761620807e-06, 'epoch': 1.3} {'loss': 0.4187, 'learning_rate': 5.555583515182565e-06, 'epoch': 1.3} {'loss': 0.5884, 'learning_rate': 5.555290273506919e-06, 'epoch': 1.3} {'loss': 0.4463, 'learning_rate': 5.554997036594178e-06, 'epoch': 1.3} {'loss': 0.3289, 'learning_rate': 5.554703804444659e-06, 'epoch': 1.3} {'loss': 0.4465, 'learning_rate': 5.554410577058677e-06, 'epoch': 1.3} {'loss': 0.5398, 'learning_rate': 5.554117354436544e-06, 'epoch': 1.3} {'loss': 0.6883, 'learning_rate': 5.553824136578576e-06, 'epoch': 1.3} {'loss': 0.6246, 'learning_rate': 5.553530923485091e-06, 'epoch': 1.3} {'loss': 0.624, 'learning_rate': 5.553237715156395e-06, 'epoch': 1.3} {'loss': 0.4316, 'learning_rate': 5.552944511592804e-06, 'epoch': 1.3} {'loss': 0.5193, 'learning_rate': 5.552651312794637e-06, 'epoch': 1.3} {'loss': 0.588, 'learning_rate': 5.552358118762205e-06, 'epoch': 1.3} {'loss': 0.5551, 'learning_rate': 5.552064929495821e-06, 'epoch': 1.3} {'loss': 0.6422, 'learning_rate': 5.551771744995802e-06, 'epoch': 1.3} {'loss': 0.5783, 'learning_rate': 5.551478565262464e-06, 'epoch': 1.3} {'loss': 0.6429, 'learning_rate': 5.551185390296117e-06, 'epoch': 1.3} {'loss': 0.4462, 'learning_rate': 5.550892220097074e-06, 'epoch': 1.3} {'loss': 0.5486, 'learning_rate': 5.550599054665653e-06, 'epoch': 1.3} {'loss': 0.485, 'learning_rate': 5.550305894002166e-06, 'epoch': 1.3} {'loss': 0.504, 'learning_rate': 5.5500127381069265e-06, 'epoch': 1.3} {'loss': 0.5829, 'learning_rate': 5.549719586980251e-06, 'epoch': 1.3} {'loss': 0.6428, 'learning_rate': 5.549426440622457e-06, 'epoch': 1.3} {'loss': 0.5584, 'learning_rate': 5.5491332990338505e-06, 'epoch': 1.3} {'loss': 0.5542, 'learning_rate': 5.548840162214749e-06, 'epoch': 1.3} {'loss': 0.5098, 'learning_rate': 5.548547030165468e-06, 'epoch': 1.3} {'loss': 0.4338, 'learning_rate': 5.548253902886318e-06, 'epoch': 1.3} {'loss': 0.5632, 'learning_rate': 5.547960780377621e-06, 'epoch': 1.3} {'loss': 0.5413, 'learning_rate': 5.547667662639679e-06, 'epoch': 1.3} {'loss': 0.609, 'learning_rate': 5.547374549672821e-06, 'epoch': 1.3} {'loss': 0.5262, 'learning_rate': 5.547081441477348e-06, 'epoch': 1.3} {'loss': 0.5729, 'learning_rate': 5.546788338053579e-06, 'epoch': 1.3} {'loss': 0.6426, 'learning_rate': 5.5464952394018286e-06, 'epoch': 1.3} {'loss': 0.5421, 'learning_rate': 5.54620214552241e-06, 'epoch': 1.3} {'loss': 0.5606, 'learning_rate': 5.545909056415644e-06, 'epoch': 1.3} {'loss': 0.6033, 'learning_rate': 5.545615972081828e-06, 'epoch': 1.3} {'loss': 0.4568, 'learning_rate': 5.545322892521294e-06, 'epoch': 1.3} {'loss': 0.6222, 'learning_rate': 5.5450298177343466e-06, 'epoch': 1.3} {'loss': 0.5622, 'learning_rate': 5.544736747721302e-06, 'epoch': 1.3} {'loss': 0.5657, 'learning_rate': 5.544443682482476e-06, 'epoch': 1.3} {'loss': 0.4757, 'learning_rate': 5.544150622018174e-06, 'epoch': 1.3} {'loss': 0.6804, 'learning_rate': 5.543857566328725e-06, 'epoch': 1.3} {'loss': 0.4849, 'learning_rate': 5.543564515414426e-06, 'epoch': 1.3} {'loss': 0.6598, 'learning_rate': 5.543271469275608e-06, 'epoch': 1.3} {'loss': 0.6822, 'learning_rate': 5.5429784279125746e-06, 'epoch': 1.3} {'loss': 0.649, 'learning_rate': 5.54268539132564e-06, 'epoch': 1.3} {'loss': 0.5936, 'learning_rate': 5.542392359515125e-06, 'epoch': 1.3} {'loss': 0.4126, 'learning_rate': 5.542099332481331e-06, 'epoch': 1.3} {'loss': 0.5166, 'learning_rate': 5.541806310224588e-06, 'epoch': 1.3} {'loss': 0.5602, 'learning_rate': 5.541513292745197e-06, 'epoch': 1.3} {'loss': 0.4927, 'learning_rate': 5.541220280043478e-06, 'epoch': 1.3} {'loss': 0.5714, 'learning_rate': 5.540927272119744e-06, 'epoch': 1.3} {'loss': 0.6896, 'learning_rate': 5.5406342689743074e-06, 'epoch': 1.3} {'loss': 0.6486, 'learning_rate': 5.54034127060749e-06, 'epoch': 1.3} {'loss': 0.4226, 'learning_rate': 5.540048277019589e-06, 'epoch': 1.3} {'loss': 0.6001, 'learning_rate': 5.539755288210939e-06, 'epoch': 1.3} {'loss': 0.5429, 'learning_rate': 5.539462304181837e-06, 'epoch': 1.3} {'loss': 0.6011, 'learning_rate': 5.5391693249326065e-06, 'epoch': 1.3} {'loss': 0.3894, 'learning_rate': 5.538876350463558e-06, 'epoch': 1.3} {'loss': 0.5047, 'learning_rate': 5.538583380775005e-06, 'epoch': 1.3} {'loss': 0.6647, 'learning_rate': 5.5382904158672665e-06, 'epoch': 1.3} {'loss': 0.5364, 'learning_rate': 5.537997455740647e-06, 'epoch': 1.3} {'loss': 0.5851, 'learning_rate': 5.537704500395471e-06, 'epoch': 1.3} {'loss': 0.5388, 'learning_rate': 5.5374115498320455e-06, 'epoch': 1.3} {'loss': 0.5835, 'learning_rate': 5.537118604050686e-06, 'epoch': 1.3} {'loss': 0.3905, 'learning_rate': 5.536825663051709e-06, 'epoch': 1.3} {'loss': 0.3582, 'learning_rate': 5.53653272683542e-06, 'epoch': 1.3} {'loss': 0.6278, 'learning_rate': 5.536239795402145e-06, 'epoch': 1.3} {'loss': 0.6266, 'learning_rate': 5.535946868752186e-06, 'epoch': 1.3} {'loss': 0.4401, 'learning_rate': 5.535653946885871e-06, 'epoch': 1.3} {'loss': 0.5583, 'learning_rate': 5.5353610298035e-06, 'epoch': 1.3} {'loss': 0.6714, 'learning_rate': 5.535068117505393e-06, 'epoch': 1.3} {'loss': 0.4964, 'learning_rate': 5.534775209991868e-06, 'epoch': 1.3} {'loss': 0.3719, 'learning_rate': 5.534482307263227e-06, 'epoch': 1.3} {'loss': 0.7133, 'learning_rate': 5.534189409319799e-06, 'epoch': 1.3} {'loss': 0.5448, 'learning_rate': 5.533896516161881e-06, 'epoch': 1.3} {'loss': 0.5276, 'learning_rate': 5.533603627789805e-06, 'epoch': 1.3} {'loss': 0.5856, 'learning_rate': 5.53331074420387e-06, 'epoch': 1.3} {'loss': 0.4653, 'learning_rate': 5.533017865404397e-06, 'epoch': 1.3} {'loss': 0.5952, 'learning_rate': 5.532724991391704e-06, 'epoch': 1.3} {'loss': 0.6143, 'learning_rate': 5.53243212216609e-06, 'epoch': 1.3} {'loss': 0.5275, 'learning_rate': 5.532139257727886e-06, 'epoch': 1.3} {'loss': 0.5155, 'learning_rate': 5.531846398077389e-06, 'epoch': 1.3} {'loss': 0.5622, 'learning_rate': 5.531553543214932e-06, 'epoch': 1.3} {'loss': 0.5917, 'learning_rate': 5.5312606931408145e-06, 'epoch': 1.3} {'loss': 0.6242, 'learning_rate': 5.530967847855353e-06, 'epoch': 1.3} {'loss': 0.4407, 'learning_rate': 5.5306750073588674e-06, 'epoch': 1.3} {'loss': 0.5864, 'learning_rate': 5.53038217165166e-06, 'epoch': 1.3} {'loss': 0.4613, 'learning_rate': 5.53008934073406e-06, 'epoch': 1.3} {'loss': 0.5554, 'learning_rate': 5.529796514606363e-06, 'epoch': 1.3} {'loss': 0.5364, 'learning_rate': 5.529503693268901e-06, 'epoch': 1.3} {'loss': 0.5651, 'learning_rate': 5.529210876721973e-06, 'epoch': 1.3} {'loss': 0.3958, 'learning_rate': 5.528918064965902e-06, 'epoch': 1.3} {'loss': 0.5919, 'learning_rate': 5.528625258001001e-06, 'epoch': 1.3} {'loss': 0.5075, 'learning_rate': 5.528332455827576e-06, 'epoch': 1.3} {'loss': 0.5691, 'learning_rate': 5.528039658445953e-06, 'epoch': 1.3} {'loss': 0.4752, 'learning_rate': 5.527746865856435e-06, 'epoch': 1.3} {'loss': 0.6127, 'learning_rate': 5.52745407805934e-06, 'epoch': 1.3} {'loss': 0.5693, 'learning_rate': 5.527161295054981e-06, 'epoch': 1.3} {'loss': 0.5034, 'learning_rate': 5.526868516843673e-06, 'epoch': 1.3} {'loss': 0.556, 'learning_rate': 5.5265757434257335e-06, 'epoch': 1.3} {'loss': 0.4395, 'learning_rate': 5.526282974801464e-06, 'epoch': 1.3} {'loss': 0.5057, 'learning_rate': 5.525990210971193e-06, 'epoch': 1.3} {'loss': 0.5192, 'learning_rate': 5.525697451935224e-06, 'epoch': 1.3} {'loss': 0.663, 'learning_rate': 5.525404697693873e-06, 'epoch': 1.3} {'loss': 0.6154, 'learning_rate': 5.525111948247457e-06, 'epoch': 1.3} {'loss': 0.5576, 'learning_rate': 5.524819203596285e-06, 'epoch': 1.3} {'loss': 0.593, 'learning_rate': 5.524526463740678e-06, 'epoch': 1.3} {'loss': 0.5713, 'learning_rate': 5.5242337286809365e-06, 'epoch': 1.3} {'loss': 0.6489, 'learning_rate': 5.523940998417392e-06, 'epoch': 1.3} {'loss': 0.4027, 'learning_rate': 5.5236482729503436e-06, 'epoch': 1.3} {'loss': 0.5058, 'learning_rate': 5.52335555228011e-06, 'epoch': 1.3} {'loss': 0.5432, 'learning_rate': 5.523062836407005e-06, 'epoch': 1.3} {'loss': 0.6809, 'learning_rate': 5.522770125331343e-06, 'epoch': 1.3} {'loss': 0.5818, 'learning_rate': 5.5224774190534406e-06, 'epoch': 1.3} {'loss': 0.5763, 'learning_rate': 5.522184717573602e-06, 'epoch': 1.3} {'loss': 0.576, 'learning_rate': 5.521892020892149e-06, 'epoch': 1.3} {'loss': 0.4913, 'learning_rate': 5.521599329009391e-06, 'epoch': 1.3} {'loss': 0.5527, 'learning_rate': 5.521306641925646e-06, 'epoch': 1.3} {'loss': 0.3948, 'learning_rate': 5.521013959641223e-06, 'epoch': 1.3} {'loss': 0.5085, 'learning_rate': 5.520721282156438e-06, 'epoch': 1.3} {'loss': 0.5626, 'learning_rate': 5.520428609471609e-06, 'epoch': 1.3} {'loss': 0.4308, 'learning_rate': 5.520135941587042e-06, 'epoch': 1.3} {'loss': 0.5245, 'learning_rate': 5.519843278503052e-06, 'epoch': 1.3} {'loss': 0.625, 'learning_rate': 5.519550620219955e-06, 'epoch': 1.3} {'loss': 0.5694, 'learning_rate': 5.519257966738063e-06, 'epoch': 1.3} {'loss': 0.3623, 'learning_rate': 5.518965318057692e-06, 'epoch': 1.3} {'loss': 0.5349, 'learning_rate': 5.518672674179158e-06, 'epoch': 1.3} {'loss': 0.6048, 'learning_rate': 5.518380035102764e-06, 'epoch': 1.3} {'loss': 0.6111, 'learning_rate': 5.518087400828833e-06, 'epoch': 1.3} {'loss': 0.4703, 'learning_rate': 5.5177947713576755e-06, 'epoch': 1.3} {'loss': 0.4943, 'learning_rate': 5.517502146689605e-06, 'epoch': 1.3} {'loss': 0.4005, 'learning_rate': 5.517209526824936e-06, 'epoch': 1.3} {'loss': 0.6464, 'learning_rate': 5.516916911763985e-06, 'epoch': 1.3} {'loss': 0.4821, 'learning_rate': 5.516624301507058e-06, 'epoch': 1.3} {'loss': 0.5343, 'learning_rate': 5.516331696054473e-06, 'epoch': 1.3} {'loss': 0.3919, 'learning_rate': 5.516039095406544e-06, 'epoch': 1.3} {'loss': 0.4705, 'learning_rate': 5.515746499563583e-06, 'epoch': 1.3} {'loss': 0.5524, 'learning_rate': 5.515453908525905e-06, 'epoch': 1.3} {'loss': 0.4622, 'learning_rate': 5.5151613222938216e-06, 'epoch': 1.3} {'loss': 0.6835, 'learning_rate': 5.514868740867652e-06, 'epoch': 1.3} {'loss': 0.3312, 'learning_rate': 5.514576164247702e-06, 'epoch': 1.3} {'loss': 0.4872, 'learning_rate': 5.514283592434289e-06, 'epoch': 1.3} {'loss': 0.5458, 'learning_rate': 5.513991025427725e-06, 'epoch': 1.3} {'loss': 0.5421, 'learning_rate': 5.513698463228326e-06, 'epoch': 1.3} {'loss': 0.5509, 'learning_rate': 5.513405905836402e-06, 'epoch': 1.3} {'loss': 0.7324, 'learning_rate': 5.513113353252273e-06, 'epoch': 1.3} {'loss': 0.3663, 'learning_rate': 5.512820805476244e-06, 'epoch': 1.3} {'loss': 0.5723, 'learning_rate': 5.512528262508633e-06, 'epoch': 1.3} {'loss': 0.5462, 'learning_rate': 5.5122357243497525e-06, 'epoch': 1.3} {'loss': 0.5617, 'learning_rate': 5.511943190999918e-06, 'epoch': 1.3} {'loss': 0.5614, 'learning_rate': 5.51165066245944e-06, 'epoch': 1.3} {'loss': 0.6666, 'learning_rate': 5.511358138728633e-06, 'epoch': 1.3} {'loss': 0.4772, 'learning_rate': 5.511065619807816e-06, 'epoch': 1.3} {'loss': 0.4624, 'learning_rate': 5.510773105697293e-06, 'epoch': 1.3} {'loss': 0.484, 'learning_rate': 5.510480596397381e-06, 'epoch': 1.3} {'loss': 0.3741, 'learning_rate': 5.510188091908395e-06, 'epoch': 1.3} {'loss': 0.4676, 'learning_rate': 5.5098955922306476e-06, 'epoch': 1.3} {'loss': 0.5724, 'learning_rate': 5.509603097364452e-06, 'epoch': 1.3} {'loss': 0.4778, 'learning_rate': 5.509310607310123e-06, 'epoch': 1.3} {'loss': 0.5282, 'learning_rate': 5.509018122067975e-06, 'epoch': 1.3} {'loss': 0.6223, 'learning_rate': 5.508725641638317e-06, 'epoch': 1.3} {'loss': 0.3869, 'learning_rate': 5.508433166021465e-06, 'epoch': 1.3} {'loss': 0.4674, 'learning_rate': 5.508140695217732e-06, 'epoch': 1.3} {'loss': 0.4855, 'learning_rate': 5.50784822922743e-06, 'epoch': 1.3} {'loss': 0.6755, 'learning_rate': 5.5075557680508805e-06, 'epoch': 1.3} {'loss': 0.5497, 'learning_rate': 5.507263311688382e-06, 'epoch': 1.3} {'loss': 0.6186, 'learning_rate': 5.506970860140264e-06, 'epoch': 1.3} {'loss': 0.5333, 'learning_rate': 5.506678413406827e-06, 'epoch': 1.3} {'loss': 0.5454, 'learning_rate': 5.50638597148839e-06, 'epoch': 1.3} {'loss': 0.5369, 'learning_rate': 5.506093534385268e-06, 'epoch': 1.3} {'loss': 0.4343, 'learning_rate': 5.505801102097771e-06, 'epoch': 1.3} {'loss': 0.5299, 'learning_rate': 5.505508674626217e-06, 'epoch': 1.3} {'loss': 0.6747, 'learning_rate': 5.50521625197091e-06, 'epoch': 1.3} {'loss': 0.6187, 'learning_rate': 5.504923834132176e-06, 'epoch': 1.3} {'loss': 0.5932, 'learning_rate': 5.504631421110318e-06, 'epoch': 1.3} {'loss': 0.5149, 'learning_rate': 5.504339012905653e-06, 'epoch': 1.3} {'loss': 0.5046, 'learning_rate': 5.504046609518496e-06, 'epoch': 1.3} {'loss': 0.6563, 'learning_rate': 5.5037542109491574e-06, 'epoch': 1.3} {'loss': 0.5325, 'learning_rate': 5.503461817197956e-06, 'epoch': 1.3} {'loss': 0.5369, 'learning_rate': 5.503169428265194e-06, 'epoch': 1.3} {'loss': 0.6861, 'learning_rate': 5.502877044151198e-06, 'epoch': 1.3} {'loss': 0.5539, 'learning_rate': 5.502584664856273e-06, 'epoch': 1.3} {'loss': 0.6069, 'learning_rate': 5.502292290380734e-06, 'epoch': 1.3} {'loss': 0.5105, 'learning_rate': 5.501999920724899e-06, 'epoch': 1.3} {'loss': 0.5236, 'learning_rate': 5.501707555889068e-06, 'epoch': 1.3} {'loss': 0.6156, 'learning_rate': 5.501415195873572e-06, 'epoch': 1.3} {'loss': 0.4779, 'learning_rate': 5.501122840678708e-06, 'epoch': 1.3} {'loss': 0.5633, 'learning_rate': 5.500830490304805e-06, 'epoch': 1.3} {'loss': 0.4051, 'learning_rate': 5.500538144752163e-06, 'epoch': 1.3} {'loss': 0.512, 'learning_rate': 5.5002458040211004e-06, 'epoch': 1.3} {'loss': 0.5371, 'learning_rate': 5.499953468111936e-06, 'epoch': 1.3} {'loss': 0.527, 'learning_rate': 5.49966113702497e-06, 'epoch': 1.3} {'loss': 0.5199, 'learning_rate': 5.499368810760529e-06, 'epoch': 1.3} {'loss': 0.5404, 'learning_rate': 5.499076489318914e-06, 'epoch': 1.3} {'loss': 0.5281, 'learning_rate': 5.498784172700453e-06, 'epoch': 1.3} {'loss': 0.6156, 'learning_rate': 5.498491860905446e-06, 'epoch': 1.3} {'loss': 0.4369, 'learning_rate': 5.498199553934212e-06, 'epoch': 1.3} {'loss': 0.6529, 'learning_rate': 5.497907251787067e-06, 'epoch': 1.3} {'loss': 0.5388, 'learning_rate': 5.497614954464314e-06, 'epoch': 1.3} {'loss': 0.5922, 'learning_rate': 5.49732266196628e-06, 'epoch': 1.3} {'loss': 0.6603, 'learning_rate': 5.497030374293266e-06, 'epoch': 1.3} {'loss': 0.5431, 'learning_rate': 5.496738091445592e-06, 'epoch': 1.3} {'loss': 0.6315, 'learning_rate': 5.4964458134235695e-06, 'epoch': 1.3} {'loss': 0.5443, 'learning_rate': 5.496153540227511e-06, 'epoch': 1.3} {'loss': 0.6975, 'learning_rate': 5.495861271857734e-06, 'epoch': 1.3} {'loss': 0.4822, 'learning_rate': 5.495569008314542e-06, 'epoch': 1.3} {'loss': 0.5733, 'learning_rate': 5.495276749598262e-06, 'epoch': 1.3} {'loss': 0.4716, 'learning_rate': 5.4949844957091945e-06, 'epoch': 1.3} {'loss': 0.5224, 'learning_rate': 5.494692246647657e-06, 'epoch': 1.3} {'loss': 0.5681, 'learning_rate': 5.494400002413965e-06, 'epoch': 1.3} {'loss': 0.4422, 'learning_rate': 5.49410776300843e-06, 'epoch': 1.3} {'loss': 0.5659, 'learning_rate': 5.493815528431369e-06, 'epoch': 1.3} {'loss': 0.3903, 'learning_rate': 5.493523298683083e-06, 'epoch': 1.3} {'loss': 0.525, 'learning_rate': 5.4932310737639015e-06, 'epoch': 1.3} {'loss': 0.5654, 'learning_rate': 5.492938853674125e-06, 'epoch': 1.3} {'loss': 0.4383, 'learning_rate': 5.4926466384140735e-06, 'epoch': 1.3} {'loss': 0.5006, 'learning_rate': 5.49235442798406e-06, 'epoch': 1.3} {'loss': 0.4732, 'learning_rate': 5.4920622223843885e-06, 'epoch': 1.3} {'loss': 0.564, 'learning_rate': 5.4917700216153865e-06, 'epoch': 1.3} {'loss': 0.5646, 'learning_rate': 5.491477825677351e-06, 'epoch': 1.3} {'loss': 0.5143, 'learning_rate': 5.491185634570615e-06, 'epoch': 1.3} {'loss': 0.6394, 'learning_rate': 5.490893448295473e-06, 'epoch': 1.3} {'loss': 0.4529, 'learning_rate': 5.490601266852249e-06, 'epoch': 1.3} {'loss': 0.517, 'learning_rate': 5.490309090241255e-06, 'epoch': 1.3} {'loss': 0.5854, 'learning_rate': 5.490016918462793e-06, 'epoch': 1.3} {'loss': 0.6271, 'learning_rate': 5.489724751517194e-06, 'epoch': 1.3} {'loss': 0.4183, 'learning_rate': 5.489432589404754e-06, 'epoch': 1.3} {'loss': 0.619, 'learning_rate': 5.489140432125801e-06, 'epoch': 1.3} {'loss': 0.568, 'learning_rate': 5.488848279680639e-06, 'epoch': 1.3} {'loss': 0.4241, 'learning_rate': 5.488556132069582e-06, 'epoch': 1.3} {'loss': 0.4305, 'learning_rate': 5.488263989292948e-06, 'epoch': 1.3} {'loss': 0.5769, 'learning_rate': 5.4879718513510395e-06, 'epoch': 1.3} {'loss': 0.529, 'learning_rate': 5.487679718244183e-06, 'epoch': 1.3} {'loss': 0.5243, 'learning_rate': 5.487387589972683e-06, 'epoch': 1.3} {'loss': 0.5373, 'learning_rate': 5.487095466536853e-06, 'epoch': 1.3} {'loss': 0.5598, 'learning_rate': 5.4868033479370074e-06, 'epoch': 1.3} {'loss': 0.5306, 'learning_rate': 5.4865112341734594e-06, 'epoch': 1.3} {'loss': 0.6392, 'learning_rate': 5.4862191252465255e-06, 'epoch': 1.3} {'loss': 0.6395, 'learning_rate': 5.48592702115651e-06, 'epoch': 1.3} {'loss': 0.3757, 'learning_rate': 5.4856349219037354e-06, 'epoch': 1.3} {'loss': 0.6034, 'learning_rate': 5.485342827488509e-06, 'epoch': 1.3} {'loss': 0.4398, 'learning_rate': 5.485050737911144e-06, 'epoch': 1.3} {'loss': 0.2838, 'learning_rate': 5.4847586531719556e-06, 'epoch': 1.3} {'loss': 0.4147, 'learning_rate': 5.484466573271254e-06, 'epoch': 1.3} {'loss': 0.5416, 'learning_rate': 5.484174498209361e-06, 'epoch': 1.3} {'loss': 0.4112, 'learning_rate': 5.483882427986571e-06, 'epoch': 1.3} {'loss': 0.7473, 'learning_rate': 5.4835903626032195e-06, 'epoch': 1.3} {'loss': 0.5188, 'learning_rate': 5.483298302059603e-06, 'epoch': 1.3} {'loss': 0.6162, 'learning_rate': 5.483006246356041e-06, 'epoch': 1.3} {'loss': 0.5771, 'learning_rate': 5.482714195492844e-06, 'epoch': 1.3} {'loss': 0.6472, 'learning_rate': 5.482422149470328e-06, 'epoch': 1.3} {'loss': 0.5368, 'learning_rate': 5.482130108288808e-06, 'epoch': 1.3} {'loss': 0.5175, 'learning_rate': 5.481838071948588e-06, 'epoch': 1.3} {'loss': 0.5476, 'learning_rate': 5.481546040449989e-06, 'epoch': 1.3} {'loss': 0.5209, 'learning_rate': 5.48125401379332e-06, 'epoch': 1.3} {'loss': 0.5708, 'learning_rate': 5.480961991978894e-06, 'epoch': 1.3} {'loss': 0.383, 'learning_rate': 5.480669975007027e-06, 'epoch': 1.3} {'loss': 0.5455, 'learning_rate': 5.480377962878029e-06, 'epoch': 1.3} {'loss': 0.6061, 'learning_rate': 5.480085955592217e-06, 'epoch': 1.3} {'loss': 0.6135, 'learning_rate': 5.479793953149898e-06, 'epoch': 1.3} {'loss': 0.5942, 'learning_rate': 5.479501955551387e-06, 'epoch': 1.3} {'loss': 0.5326, 'learning_rate': 5.479209962796998e-06, 'epoch': 1.3} {'loss': 0.3946, 'learning_rate': 5.478917974887045e-06, 'epoch': 1.3} {'loss': 0.5316, 'learning_rate': 5.478625991821837e-06, 'epoch': 1.3} {'loss': 0.4949, 'learning_rate': 5.478334013601692e-06, 'epoch': 1.3} {'loss': 0.7163, 'learning_rate': 5.478042040226922e-06, 'epoch': 1.3} {'loss': 0.6266, 'learning_rate': 5.477750071697835e-06, 'epoch': 1.3} {'loss': 0.4938, 'learning_rate': 5.477458108014746e-06, 'epoch': 1.3} {'loss': 0.4691, 'learning_rate': 5.477166149177971e-06, 'epoch': 1.3} {'loss': 0.5538, 'learning_rate': 5.476874195187818e-06, 'epoch': 1.3} {'loss': 0.6369, 'learning_rate': 5.4765822460446035e-06, 'epoch': 1.3} {'loss': 0.563, 'learning_rate': 5.476290301748645e-06, 'epoch': 1.3} {'loss': 0.6209, 'learning_rate': 5.475998362300243e-06, 'epoch': 1.3} {'loss': 0.6394, 'learning_rate': 5.475706427699718e-06, 'epoch': 1.3} {'loss': 0.4491, 'learning_rate': 5.475414497947385e-06, 'epoch': 1.3} {'loss': 0.6166, 'learning_rate': 5.47512257304355e-06, 'epoch': 1.3} {'loss': 0.5634, 'learning_rate': 5.47483065298853e-06, 'epoch': 1.3} {'loss': 0.5983, 'learning_rate': 5.474538737782639e-06, 'epoch': 1.3} {'loss': 0.797, 'learning_rate': 5.47424682742619e-06, 'epoch': 1.3} {'loss': 0.5423, 'learning_rate': 5.473954921919492e-06, 'epoch': 1.3} {'loss': 0.3562, 'learning_rate': 5.473663021262859e-06, 'epoch': 1.3} {'loss': 0.5069, 'learning_rate': 5.473371125456604e-06, 'epoch': 1.3} {'loss': 0.5296, 'learning_rate': 5.473079234501042e-06, 'epoch': 1.3} {'loss': 0.5511, 'learning_rate': 5.472787348396483e-06, 'epoch': 1.3} {'loss': 0.5293, 'learning_rate': 5.472495467143242e-06, 'epoch': 1.3} {'loss': 0.505, 'learning_rate': 5.472203590741634e-06, 'epoch': 1.3} {'loss': 0.3973, 'learning_rate': 5.471911719191965e-06, 'epoch': 1.3} {'loss': 0.5303, 'learning_rate': 5.471619852494549e-06, 'epoch': 1.3} {'loss': 0.6819, 'learning_rate': 5.4713279906497045e-06, 'epoch': 1.3} {'loss': 0.559, 'learning_rate': 5.4710361336577375e-06, 'epoch': 1.3} {'loss': 0.4791, 'learning_rate': 5.4707442815189695e-06, 'epoch': 1.3} {'loss': 0.6245, 'learning_rate': 5.470452434233704e-06, 'epoch': 1.3} {'loss': 0.3904, 'learning_rate': 5.470160591802258e-06, 'epoch': 1.3} {'loss': 0.6121, 'learning_rate': 5.469868754224943e-06, 'epoch': 1.3} {'loss': 0.396, 'learning_rate': 5.469576921502073e-06, 'epoch': 1.3} {'loss': 0.5965, 'learning_rate': 5.4692850936339604e-06, 'epoch': 1.3} {'loss': 0.4804, 'learning_rate': 5.468993270620917e-06, 'epoch': 1.3} {'loss': 0.571, 'learning_rate': 5.4687014524632605e-06, 'epoch': 1.3} {'loss': 0.4629, 'learning_rate': 5.468409639161295e-06, 'epoch': 1.3} {'loss': 0.5875, 'learning_rate': 5.468117830715338e-06, 'epoch': 1.3} {'loss': 0.6231, 'learning_rate': 5.467826027125702e-06, 'epoch': 1.3} {'loss': 0.5871, 'learning_rate': 5.467534228392699e-06, 'epoch': 1.3} {'loss': 0.4954, 'learning_rate': 5.467242434516646e-06, 'epoch': 1.3} {'loss': 0.6142, 'learning_rate': 5.4669506454978435e-06, 'epoch': 1.3} {'loss': 0.6597, 'learning_rate': 5.466658861336622e-06, 'epoch': 1.3} {'loss': 0.6272, 'learning_rate': 5.4663670820332805e-06, 'epoch': 1.3} {'loss': 0.6109, 'learning_rate': 5.466075307588134e-06, 'epoch': 1.3} {'loss': 0.6228, 'learning_rate': 5.465783538001499e-06, 'epoch': 1.3} {'loss': 0.4242, 'learning_rate': 5.465491773273686e-06, 'epoch': 1.3} {'loss': 0.5363, 'learning_rate': 5.465200013405011e-06, 'epoch': 1.3} {'loss': 0.4658, 'learning_rate': 5.464908258395775e-06, 'epoch': 1.3} {'loss': 0.4638, 'learning_rate': 5.464616508246309e-06, 'epoch': 1.3} {'loss': 0.5061, 'learning_rate': 5.464324762956911e-06, 'epoch': 1.3} {'loss': 0.4861, 'learning_rate': 5.464033022527897e-06, 'epoch': 1.3} {'loss': 0.4099, 'learning_rate': 5.463741286959583e-06, 'epoch': 1.3} {'loss': 0.5521, 'learning_rate': 5.4634495562522784e-06, 'epoch': 1.3} {'loss': 0.5483, 'learning_rate': 5.463157830406301e-06, 'epoch': 1.3} {'loss': 0.5655, 'learning_rate': 5.462866109421952e-06, 'epoch': 1.3} {'loss': 0.4502, 'learning_rate': 5.46257439329956e-06, 'epoch': 1.3} {'loss': 0.4515, 'learning_rate': 5.462282682039423e-06, 'epoch': 1.3} {'loss': 0.5944, 'learning_rate': 5.4619909756418625e-06, 'epoch': 1.3} {'loss': 0.5456, 'learning_rate': 5.461699274107191e-06, 'epoch': 1.3} {'loss': 0.5621, 'learning_rate': 5.461407577435709e-06, 'epoch': 1.3} {'loss': 0.5169, 'learning_rate': 5.461115885627748e-06, 'epoch': 1.3} {'loss': 0.556, 'learning_rate': 5.4608241986836015e-06, 'epoch': 1.3} {'loss': 0.7011, 'learning_rate': 5.4605325166036e-06, 'epoch': 1.3} {'loss': 0.5912, 'learning_rate': 5.460240839388045e-06, 'epoch': 1.3} {'loss': 0.4715, 'learning_rate': 5.459949167037251e-06, 'epoch': 1.3} {'loss': 0.5638, 'learning_rate': 5.459657499551535e-06, 'epoch': 1.3} {'loss': 0.5152, 'learning_rate': 5.459365836931198e-06, 'epoch': 1.3} {'loss': 0.4833, 'learning_rate': 5.459074179176568e-06, 'epoch': 1.3} {'loss': 0.5824, 'learning_rate': 5.4587825262879426e-06, 'epoch': 1.3} {'loss': 0.5849, 'learning_rate': 5.458490878265649e-06, 'epoch': 1.3} {'loss': 0.4141, 'learning_rate': 5.458199235109988e-06, 'epoch': 1.3} {'loss': 0.4562, 'learning_rate': 5.457907596821277e-06, 'epoch': 1.3} {'loss': 0.3097, 'learning_rate': 5.457615963399831e-06, 'epoch': 1.3} {'loss': 0.5221, 'learning_rate': 5.457324334845953e-06, 'epoch': 1.3} {'loss': 0.5052, 'learning_rate': 5.457032711159968e-06, 'epoch': 1.3} {'loss': 0.3037, 'learning_rate': 5.456741092342177e-06, 'epoch': 1.3} {'loss': 0.526, 'learning_rate': 5.456449478392905e-06, 'epoch': 1.3} {'loss': 0.3111, 'learning_rate': 5.4561578693124526e-06, 'epoch': 1.3} {'loss': 0.4972, 'learning_rate': 5.455866265101137e-06, 'epoch': 1.3} {'loss': 0.3763, 'learning_rate': 5.455574665759276e-06, 'epoch': 1.3} {'loss': 0.4532, 'learning_rate': 5.455283071287167e-06, 'epoch': 1.3} {'loss': 0.5104, 'learning_rate': 5.454991481685143e-06, 'epoch': 1.3} {'loss': 0.5604, 'learning_rate': 5.454699896953497e-06, 'epoch': 1.3} {'loss': 0.4371, 'learning_rate': 5.454408317092558e-06, 'epoch': 1.3} {'loss': 0.6797, 'learning_rate': 5.4541167421026265e-06, 'epoch': 1.3} {'loss': 0.6488, 'learning_rate': 5.4538251719840195e-06, 'epoch': 1.3} {'loss': 0.414, 'learning_rate': 5.453533606737052e-06, 'epoch': 1.3} {'loss': 0.5961, 'learning_rate': 5.453242046362027e-06, 'epoch': 1.3} {'loss': 0.4465, 'learning_rate': 5.452950490859271e-06, 'epoch': 1.3} {'loss': 0.4196, 'learning_rate': 5.452658940229081e-06, 'epoch': 1.3} {'loss': 0.4898, 'learning_rate': 5.452367394471786e-06, 'epoch': 1.3} {'loss': 0.5906, 'learning_rate': 5.452075853587685e-06, 'epoch': 1.3} {'loss': 0.644, 'learning_rate': 5.451784317577096e-06, 'epoch': 1.3} {'loss': 0.4126, 'learning_rate': 5.451492786440334e-06, 'epoch': 1.3} {'loss': 0.6329, 'learning_rate': 5.4512012601776985e-06, 'epoch': 1.3} {'loss': 0.4363, 'learning_rate': 5.450909738789523e-06, 'epoch': 1.3} {'loss': 0.6606, 'learning_rate': 5.450618222276101e-06, 'epoch': 1.3} {'loss': 0.4767, 'learning_rate': 5.450326710637753e-06, 'epoch': 1.3} {'loss': 0.4932, 'learning_rate': 5.450035203874791e-06, 'epoch': 1.3} {'loss': 0.3836, 'learning_rate': 5.4497437019875275e-06, 'epoch': 1.3} {'loss': 0.6315, 'learning_rate': 5.449452204976277e-06, 'epoch': 1.3} {'loss': 0.5748, 'learning_rate': 5.449160712841343e-06, 'epoch': 1.3} {'loss': 0.4693, 'learning_rate': 5.448869225583051e-06, 'epoch': 1.3} {'loss': 0.4839, 'learning_rate': 5.4485777432017015e-06, 'epoch': 1.3} {'loss': 0.4709, 'learning_rate': 5.448286265697613e-06, 'epoch': 1.3} {'loss': 0.591, 'learning_rate': 5.447994793071096e-06, 'epoch': 1.3} {'loss': 0.4857, 'learning_rate': 5.447703325322464e-06, 'epoch': 1.3} {'loss': 0.7637, 'learning_rate': 5.4474118624520324e-06, 'epoch': 1.3} {'loss': 0.6378, 'learning_rate': 5.447120404460101e-06, 'epoch': 1.3} {'loss': 0.5373, 'learning_rate': 5.446828951347e-06, 'epoch': 1.3} {'loss': 0.5805, 'learning_rate': 5.4465375031130286e-06, 'epoch': 1.3} {'loss': 0.4702, 'learning_rate': 5.4462460597585036e-06, 'epoch': 1.3} {'loss': 0.3917, 'learning_rate': 5.44595462128374e-06, 'epoch': 1.3} {'loss': 0.4186, 'learning_rate': 5.44566318768904e-06, 'epoch': 1.3} {'loss': 0.5673, 'learning_rate': 5.44537175897473e-06, 'epoch': 1.3} {'loss': 0.5481, 'learning_rate': 5.4450803351411116e-06, 'epoch': 1.3} {'loss': 0.5807, 'learning_rate': 5.444788916188501e-06, 'epoch': 1.3} {'loss': 0.6226, 'learning_rate': 5.44449750211721e-06, 'epoch': 1.3} {'loss': 0.438, 'learning_rate': 5.444206092927552e-06, 'epoch': 1.3} {'loss': 0.4423, 'learning_rate': 5.443914688619841e-06, 'epoch': 1.3} {'loss': 0.3384, 'learning_rate': 5.44362328919438e-06, 'epoch': 1.3} {'loss': 0.5898, 'learning_rate': 5.4433318946514945e-06, 'epoch': 1.3} {'loss': 0.545, 'learning_rate': 5.4430405049914866e-06, 'epoch': 1.3} {'loss': 0.4123, 'learning_rate': 5.442749120214672e-06, 'epoch': 1.3} {'loss': 0.48, 'learning_rate': 5.442457740321363e-06, 'epoch': 1.3} {'loss': 0.5966, 'learning_rate': 5.4421663653118725e-06, 'epoch': 1.3} {'loss': 0.5807, 'learning_rate': 5.441874995186515e-06, 'epoch': 1.3} {'loss': 0.5951, 'learning_rate': 5.4415836299455974e-06, 'epoch': 1.3} {'loss': 0.6742, 'learning_rate': 5.441292269589433e-06, 'epoch': 1.3} {'loss': 0.5466, 'learning_rate': 5.441000914118337e-06, 'epoch': 1.3} {'loss': 0.6607, 'learning_rate': 5.440709563532618e-06, 'epoch': 1.3} {'loss': 0.5503, 'learning_rate': 5.440418217832592e-06, 'epoch': 1.3} {'loss': 0.4571, 'learning_rate': 5.440126877018568e-06, 'epoch': 1.3} {'loss': 0.5569, 'learning_rate': 5.439835541090865e-06, 'epoch': 1.3} {'loss': 0.6515, 'learning_rate': 5.439544210049784e-06, 'epoch': 1.3} {'loss': 0.4043, 'learning_rate': 5.439252883895643e-06, 'epoch': 1.3} {'loss': 0.421, 'learning_rate': 5.438961562628756e-06, 'epoch': 1.3} {'loss': 0.548, 'learning_rate': 5.4386702462494325e-06, 'epoch': 1.3} {'loss': 0.5259, 'learning_rate': 5.4383789347579856e-06, 'epoch': 1.3} {'loss': 0.4433, 'learning_rate': 5.438087628154727e-06, 'epoch': 1.3} {'loss': 0.4448, 'learning_rate': 5.437796326439974e-06, 'epoch': 1.3} {'loss': 0.5183, 'learning_rate': 5.43750502961403e-06, 'epoch': 1.3} {'loss': 0.5485, 'learning_rate': 5.437213737677209e-06, 'epoch': 1.3} {'loss': 0.5615, 'learning_rate': 5.436922450629827e-06, 'epoch': 1.3} {'loss': 0.5878, 'learning_rate': 5.436631168472195e-06, 'epoch': 1.3} {'loss': 0.3782, 'learning_rate': 5.436339891204624e-06, 'epoch': 1.3} {'loss': 0.5425, 'learning_rate': 5.436048618827429e-06, 'epoch': 1.3} {'loss': 0.487, 'learning_rate': 5.4357573513409186e-06, 'epoch': 1.3} {'loss': 0.5457, 'learning_rate': 5.435466088745405e-06, 'epoch': 1.3} {'loss': 0.4505, 'learning_rate': 5.435174831041201e-06, 'epoch': 1.3} {'loss': 0.4523, 'learning_rate': 5.43488357822862e-06, 'epoch': 1.3} {'loss': 0.4853, 'learning_rate': 5.434592330307973e-06, 'epoch': 1.3} {'loss': 0.4851, 'learning_rate': 5.434301087279572e-06, 'epoch': 1.3} {'loss': 0.4701, 'learning_rate': 5.434009849143734e-06, 'epoch': 1.3} {'loss': 0.5429, 'learning_rate': 5.433718615900762e-06, 'epoch': 1.3} {'loss': 0.4857, 'learning_rate': 5.433427387550974e-06, 'epoch': 1.3} {'loss': 0.6202, 'learning_rate': 5.433136164094679e-06, 'epoch': 1.3} {'loss': 0.396, 'learning_rate': 5.432844945532192e-06, 'epoch': 1.3} {'loss': 0.5173, 'learning_rate': 5.432553731863823e-06, 'epoch': 1.3} {'loss': 0.6377, 'learning_rate': 5.432262523089885e-06, 'epoch': 1.3} {'loss': 0.6027, 'learning_rate': 5.431971319210694e-06, 'epoch': 1.3} {'loss': 0.5425, 'learning_rate': 5.431680120226555e-06, 'epoch': 1.3} {'loss': 0.5743, 'learning_rate': 5.431388926137782e-06, 'epoch': 1.3} {'loss': 0.5603, 'learning_rate': 5.431097736944688e-06, 'epoch': 1.3} {'loss': 0.6415, 'learning_rate': 5.430806552647585e-06, 'epoch': 1.3} {'loss': 0.6247, 'learning_rate': 5.4305153732467895e-06, 'epoch': 1.3} {'loss': 0.576, 'learning_rate': 5.430224198742602e-06, 'epoch': 1.3} {'loss': 0.4753, 'learning_rate': 5.429933029135349e-06, 'epoch': 1.3} {'loss': 0.5085, 'learning_rate': 5.4296418644253316e-06, 'epoch': 1.3} {'loss': 0.3843, 'learning_rate': 5.429350704612865e-06, 'epoch': 1.3} {'loss': 0.582, 'learning_rate': 5.429059549698261e-06, 'epoch': 1.3} {'loss': 0.4704, 'learning_rate': 5.428768399681834e-06, 'epoch': 1.3} {'loss': 0.4146, 'learning_rate': 5.4284772545638974e-06, 'epoch': 1.3} {'loss': 0.4873, 'learning_rate': 5.428186114344751e-06, 'epoch': 1.3} {'loss': 0.5501, 'learning_rate': 5.4278949790247256e-06, 'epoch': 1.3} {'loss': 0.4476, 'learning_rate': 5.427603848604118e-06, 'epoch': 1.3} {'loss': 0.484, 'learning_rate': 5.427312723083247e-06, 'epoch': 1.3} {'loss': 0.4998, 'learning_rate': 5.427021602462421e-06, 'epoch': 1.3} {'loss': 0.4695, 'learning_rate': 5.426730486741956e-06, 'epoch': 1.3} {'loss': 0.5581, 'learning_rate': 5.426439375922165e-06, 'epoch': 1.3} {'loss': 0.5686, 'learning_rate': 5.426148270003353e-06, 'epoch': 1.3} {'loss': 0.6795, 'learning_rate': 5.4258571689858376e-06, 'epoch': 1.3} {'loss': 0.5957, 'learning_rate': 5.425566072869927e-06, 'epoch': 1.3} {'loss': 0.5218, 'learning_rate': 5.425274981655936e-06, 'epoch': 1.3} {'loss': 0.6043, 'learning_rate': 5.42498389534418e-06, 'epoch': 1.3} {'loss': 0.4368, 'learning_rate': 5.4246928139349575e-06, 'epoch': 1.3} {'loss': 0.5729, 'learning_rate': 5.4244017374285995e-06, 'epoch': 1.3} {'loss': 0.5608, 'learning_rate': 5.424110665825403e-06, 'epoch': 1.3} {'loss': 0.499, 'learning_rate': 5.4238195991256846e-06, 'epoch': 1.3} {'loss': 0.441, 'learning_rate': 5.423528537329756e-06, 'epoch': 1.3} {'loss': 0.5285, 'learning_rate': 5.423237480437931e-06, 'epoch': 1.3} {'loss': 0.3516, 'learning_rate': 5.422946428450524e-06, 'epoch': 1.3} {'loss': 0.515, 'learning_rate': 5.422655381367834e-06, 'epoch': 1.3} {'loss': 0.5793, 'learning_rate': 5.422364339190191e-06, 'epoch': 1.3} {'loss': 0.3736, 'learning_rate': 5.422073301917894e-06, 'epoch': 1.3} {'loss': 0.6249, 'learning_rate': 5.421782269551257e-06, 'epoch': 1.3} {'loss': 0.6234, 'learning_rate': 5.421491242090595e-06, 'epoch': 1.3} {'loss': 0.6771, 'learning_rate': 5.4212002195362175e-06, 'epoch': 1.3} {'loss': 0.4777, 'learning_rate': 5.4209092018884426e-06, 'epoch': 1.3} {'loss': 0.4842, 'learning_rate': 5.420618189147566e-06, 'epoch': 1.3} {'loss': 0.5801, 'learning_rate': 5.42032718131392e-06, 'epoch': 1.31} {'loss': 0.5362, 'learning_rate': 5.420036178387804e-06, 'epoch': 1.31} {'loss': 0.685, 'learning_rate': 5.419745180369531e-06, 'epoch': 1.31} {'loss': 0.5504, 'learning_rate': 5.4194541872594186e-06, 'epoch': 1.31} {'loss': 0.5353, 'learning_rate': 5.4191631990577665e-06, 'epoch': 1.31} {'loss': 0.5101, 'learning_rate': 5.418872215764903e-06, 'epoch': 1.31} {'loss': 0.4293, 'learning_rate': 5.418581237381123e-06, 'epoch': 1.31} {'loss': 0.5195, 'learning_rate': 5.418290263906756e-06, 'epoch': 1.31} {'loss': 0.467, 'learning_rate': 5.417999295342098e-06, 'epoch': 1.31} {'loss': 0.5084, 'learning_rate': 5.417708331687469e-06, 'epoch': 1.31} {'loss': 0.6704, 'learning_rate': 5.417417372943183e-06, 'epoch': 1.31} {'loss': 0.5259, 'learning_rate': 5.4171264191095396e-06, 'epoch': 1.31} {'loss': 0.5409, 'learning_rate': 5.416835470186866e-06, 'epoch': 1.31} {'loss': 0.5593, 'learning_rate': 5.41654452617546e-06, 'epoch': 1.31} {'loss': 0.3552, 'learning_rate': 5.416253587075648e-06, 'epoch': 1.31} {'loss': 0.4302, 'learning_rate': 5.4159626528877294e-06, 'epoch': 1.31} {'loss': 0.496, 'learning_rate': 5.415671723612022e-06, 'epoch': 1.31} {'loss': 0.701, 'learning_rate': 5.41538079924884e-06, 'epoch': 1.31} {'loss': 0.664, 'learning_rate': 5.4150898797984805e-06, 'epoch': 1.31} {'loss': 0.4978, 'learning_rate': 5.414798965261276e-06, 'epoch': 1.31} {'loss': 0.4605, 'learning_rate': 5.414508055637521e-06, 'epoch': 1.31} {'loss': 0.5743, 'learning_rate': 5.414217150927541e-06, 'epoch': 1.31} {'loss': 0.4392, 'learning_rate': 5.413926251131638e-06, 'epoch': 1.31} {'loss': 0.6499, 'learning_rate': 5.413635356250126e-06, 'epoch': 1.31} {'loss': 0.541, 'learning_rate': 5.413344466283324e-06, 'epoch': 1.31} {'loss': 0.6153, 'learning_rate': 5.413053581231528e-06, 'epoch': 1.31} {'loss': 0.4889, 'learning_rate': 5.412762701095067e-06, 'epoch': 1.31} {'loss': 0.4816, 'learning_rate': 5.412471825874237e-06, 'epoch': 1.31} {'loss': 0.6154, 'learning_rate': 5.412180955569364e-06, 'epoch': 1.31} {'loss': 0.6297, 'learning_rate': 5.411890090180752e-06, 'epoch': 1.31} {'loss': 0.5907, 'learning_rate': 5.41159922970871e-06, 'epoch': 1.31} {'loss': 0.4655, 'learning_rate': 5.411308374153561e-06, 'epoch': 1.31} {'loss': 0.5674, 'learning_rate': 5.4110175235156005e-06, 'epoch': 1.31} {'loss': 0.5377, 'learning_rate': 5.410726677795156e-06, 'epoch': 1.31} {'loss': 0.4636, 'learning_rate': 5.410435836992529e-06, 'epoch': 1.31} {'loss': 0.5673, 'learning_rate': 5.410145001108033e-06, 'epoch': 1.31} {'loss': 0.5137, 'learning_rate': 5.409854170141981e-06, 'epoch': 1.31} {'loss': 0.4646, 'learning_rate': 5.409563344094686e-06, 'epoch': 1.31} {'loss': 0.3466, 'learning_rate': 5.409272522966462e-06, 'epoch': 1.31} {'loss': 0.438, 'learning_rate': 5.408981706757608e-06, 'epoch': 1.31} {'loss': 0.4706, 'learning_rate': 5.4086908954684525e-06, 'epoch': 1.31} {'loss': 0.4803, 'learning_rate': 5.408400089099295e-06, 'epoch': 1.31} {'loss': 0.4314, 'learning_rate': 5.408109287650451e-06, 'epoch': 1.31} {'loss': 0.5084, 'learning_rate': 5.407818491122234e-06, 'epoch': 1.31} {'loss': 0.5075, 'learning_rate': 5.407527699514953e-06, 'epoch': 1.31} {'loss': 0.3749, 'learning_rate': 5.407236912828924e-06, 'epoch': 1.31} {'loss': 0.5199, 'learning_rate': 5.406946131064448e-06, 'epoch': 1.31} {'loss': 0.5724, 'learning_rate': 5.4066553542218505e-06, 'epoch': 1.31} {'loss': 0.5131, 'learning_rate': 5.406364582301433e-06, 'epoch': 1.31} {'loss': 0.4172, 'learning_rate': 5.406073815303512e-06, 'epoch': 1.31} {'loss': 0.5567, 'learning_rate': 5.405783053228395e-06, 'epoch': 1.31} {'loss': 0.6191, 'learning_rate': 5.4054922960763975e-06, 'epoch': 1.31} {'loss': 0.5607, 'learning_rate': 5.405201543847833e-06, 'epoch': 1.31} {'loss': 0.5504, 'learning_rate': 5.404910796543007e-06, 'epoch': 1.31} {'loss': 0.3993, 'learning_rate': 5.404620054162233e-06, 'epoch': 1.31} {'loss': 0.5893, 'learning_rate': 5.404329316705823e-06, 'epoch': 1.31} {'loss': 0.5724, 'learning_rate': 5.4040385841740895e-06, 'epoch': 1.31} {'loss': 0.5463, 'learning_rate': 5.403747856567343e-06, 'epoch': 1.31} {'loss': 0.5937, 'learning_rate': 5.403457133885897e-06, 'epoch': 1.31} {'loss': 0.4233, 'learning_rate': 5.403166416130063e-06, 'epoch': 1.31} {'loss': 0.5288, 'learning_rate': 5.402875703300149e-06, 'epoch': 1.31} {'loss': 0.5284, 'learning_rate': 5.402584995396468e-06, 'epoch': 1.31} {'loss': 0.4781, 'learning_rate': 5.402294292419332e-06, 'epoch': 1.31} {'loss': 0.5465, 'learning_rate': 5.402003594369053e-06, 'epoch': 1.31} {'loss': 0.5511, 'learning_rate': 5.4017129012459415e-06, 'epoch': 1.31} {'loss': 0.5753, 'learning_rate': 5.401422213050312e-06, 'epoch': 1.31} {'loss': 0.4905, 'learning_rate': 5.401131529782475e-06, 'epoch': 1.31} {'loss': 0.5695, 'learning_rate': 5.400840851442737e-06, 'epoch': 1.31} {'loss': 0.6433, 'learning_rate': 5.400550178031414e-06, 'epoch': 1.31} {'loss': 0.6755, 'learning_rate': 5.400259509548816e-06, 'epoch': 1.31} {'loss': 0.5192, 'learning_rate': 5.399968845995254e-06, 'epoch': 1.31} {'loss': 0.3265, 'learning_rate': 5.399678187371047e-06, 'epoch': 1.31} {'loss': 0.5787, 'learning_rate': 5.399387533676495e-06, 'epoch': 1.31} {'loss': 0.5864, 'learning_rate': 5.399096884911914e-06, 'epoch': 1.31} {'loss': 0.5428, 'learning_rate': 5.398806241077615e-06, 'epoch': 1.31} {'loss': 0.5631, 'learning_rate': 5.3985156021739125e-06, 'epoch': 1.31} {'loss': 0.6101, 'learning_rate': 5.398224968201115e-06, 'epoch': 1.31} {'loss': 0.5376, 'learning_rate': 5.397934339159534e-06, 'epoch': 1.31} {'loss': 0.5539, 'learning_rate': 5.397643715049486e-06, 'epoch': 1.31} {'loss': 0.6053, 'learning_rate': 5.397353095871276e-06, 'epoch': 1.31} {'loss': 0.6349, 'learning_rate': 5.397062481625215e-06, 'epoch': 1.31} {'loss': 0.6408, 'learning_rate': 5.396771872311619e-06, 'epoch': 1.31} {'loss': 0.5133, 'learning_rate': 5.396481267930795e-06, 'epoch': 1.31} {'loss': 0.6217, 'learning_rate': 5.396190668483059e-06, 'epoch': 1.31} {'loss': 0.6619, 'learning_rate': 5.39590007396872e-06, 'epoch': 1.31} {'loss': 0.4511, 'learning_rate': 5.395609484388093e-06, 'epoch': 1.31} {'loss': 0.4842, 'learning_rate': 5.3953188997414815e-06, 'epoch': 1.31} {'loss': 0.5311, 'learning_rate': 5.395028320029203e-06, 'epoch': 1.31} {'loss': 0.3999, 'learning_rate': 5.394737745251566e-06, 'epoch': 1.31} {'loss': 0.432, 'learning_rate': 5.394447175408883e-06, 'epoch': 1.31} {'loss': 0.5167, 'learning_rate': 5.394156610501468e-06, 'epoch': 1.31} {'loss': 0.4108, 'learning_rate': 5.3938660505296315e-06, 'epoch': 1.31} {'loss': 0.6176, 'learning_rate': 5.393575495493679e-06, 'epoch': 1.31} {'loss': 0.6002, 'learning_rate': 5.3932849453939275e-06, 'epoch': 1.31} {'loss': 0.585, 'learning_rate': 5.392994400230687e-06, 'epoch': 1.31} {'loss': 0.4119, 'learning_rate': 5.392703860004267e-06, 'epoch': 1.31} {'loss': 0.5065, 'learning_rate': 5.392413324714982e-06, 'epoch': 1.31} {'loss': 0.601, 'learning_rate': 5.3921227943631416e-06, 'epoch': 1.31} {'loss': 0.5331, 'learning_rate': 5.391832268949062e-06, 'epoch': 1.31} {'loss': 0.5204, 'learning_rate': 5.391541748473046e-06, 'epoch': 1.31} {'loss': 0.4769, 'learning_rate': 5.391251232935409e-06, 'epoch': 1.31} {'loss': 0.5118, 'learning_rate': 5.390960722336461e-06, 'epoch': 1.31} {'loss': 0.577, 'learning_rate': 5.390670216676515e-06, 'epoch': 1.31} {'loss': 0.5913, 'learning_rate': 5.390379715955882e-06, 'epoch': 1.31} {'loss': 0.5033, 'learning_rate': 5.390089220174875e-06, 'epoch': 1.31} {'loss': 0.5587, 'learning_rate': 5.389798729333806e-06, 'epoch': 1.31} {'loss': 0.3997, 'learning_rate': 5.38950824343298e-06, 'epoch': 1.31} {'loss': 0.7014, 'learning_rate': 5.389217762472711e-06, 'epoch': 1.31} {'loss': 0.6133, 'learning_rate': 5.388927286453313e-06, 'epoch': 1.31} {'loss': 0.4156, 'learning_rate': 5.388636815375095e-06, 'epoch': 1.31} {'loss': 0.5374, 'learning_rate': 5.388346349238371e-06, 'epoch': 1.31} {'loss': 0.4481, 'learning_rate': 5.3880558880434445e-06, 'epoch': 1.31} {'loss': 0.4604, 'learning_rate': 5.387765431790639e-06, 'epoch': 1.31} {'loss': 0.6176, 'learning_rate': 5.387474980480256e-06, 'epoch': 1.31} {'loss': 0.4792, 'learning_rate': 5.38718453411261e-06, 'epoch': 1.31} {'loss': 0.5354, 'learning_rate': 5.386894092688011e-06, 'epoch': 1.31} {'loss': 0.4558, 'learning_rate': 5.3866036562067725e-06, 'epoch': 1.31} {'loss': 0.4592, 'learning_rate': 5.386313224669209e-06, 'epoch': 1.31} {'loss': 0.4634, 'learning_rate': 5.386022798075618e-06, 'epoch': 1.31} {'loss': 0.5629, 'learning_rate': 5.385732376426327e-06, 'epoch': 1.31} {'loss': 0.4317, 'learning_rate': 5.385441959721638e-06, 'epoch': 1.31} {'loss': 0.427, 'learning_rate': 5.385151547961865e-06, 'epoch': 1.31} {'loss': 0.6381, 'learning_rate': 5.384861141147321e-06, 'epoch': 1.31} {'loss': 0.6195, 'learning_rate': 5.384570739278308e-06, 'epoch': 1.31} {'loss': 0.5028, 'learning_rate': 5.38428034235515e-06, 'epoch': 1.31} {'loss': 0.4698, 'learning_rate': 5.383989950378147e-06, 'epoch': 1.31} {'loss': 0.4438, 'learning_rate': 5.3836995633476215e-06, 'epoch': 1.31} {'loss': 0.4364, 'learning_rate': 5.3834091812638755e-06, 'epoch': 1.31} {'loss': 0.705, 'learning_rate': 5.383118804127223e-06, 'epoch': 1.31} {'loss': 0.5933, 'learning_rate': 5.382828431937979e-06, 'epoch': 1.31} {'loss': 0.5299, 'learning_rate': 5.382538064696443e-06, 'epoch': 1.31} {'loss': 0.3389, 'learning_rate': 5.382247702402943e-06, 'epoch': 1.31} {'loss': 0.4689, 'learning_rate': 5.381957345057774e-06, 'epoch': 1.31} {'loss': 0.6372, 'learning_rate': 5.381666992661261e-06, 'epoch': 1.31} {'loss': 0.4746, 'learning_rate': 5.381376645213705e-06, 'epoch': 1.31} {'loss': 0.542, 'learning_rate': 5.381086302715421e-06, 'epoch': 1.31} {'loss': 0.4827, 'learning_rate': 5.380795965166723e-06, 'epoch': 1.31} {'loss': 0.5926, 'learning_rate': 5.3805056325679115e-06, 'epoch': 1.31} {'loss': 0.4947, 'learning_rate': 5.380215304919314e-06, 'epoch': 1.31} {'loss': 0.4691, 'learning_rate': 5.379924982221228e-06, 'epoch': 1.31} {'loss': 0.4956, 'learning_rate': 5.37963466447397e-06, 'epoch': 1.31} {'loss': 0.4523, 'learning_rate': 5.37934435167785e-06, 'epoch': 1.31} {'loss': 0.5319, 'learning_rate': 5.37905404383318e-06, 'epoch': 1.31} {'loss': 0.4574, 'learning_rate': 5.378763740940274e-06, 'epoch': 1.31} {'loss': 0.442, 'learning_rate': 5.378473442999432e-06, 'epoch': 1.31} {'loss': 0.4776, 'learning_rate': 5.378183150010981e-06, 'epoch': 1.31} {'loss': 0.5592, 'learning_rate': 5.37789286197522e-06, 'epoch': 1.31} {'loss': 0.3984, 'learning_rate': 5.377602578892463e-06, 'epoch': 1.31} {'loss': 0.547, 'learning_rate': 5.377312300763022e-06, 'epoch': 1.31} {'loss': 0.5423, 'learning_rate': 5.37702202758721e-06, 'epoch': 1.31} {'loss': 0.6021, 'learning_rate': 5.376731759365339e-06, 'epoch': 1.31} {'loss': 0.4081, 'learning_rate': 5.376441496097708e-06, 'epoch': 1.31} {'loss': 0.6112, 'learning_rate': 5.3761512377846485e-06, 'epoch': 1.31} {'loss': 0.476, 'learning_rate': 5.375860984426453e-06, 'epoch': 1.31} {'loss': 0.5112, 'learning_rate': 5.375570736023441e-06, 'epoch': 1.31} {'loss': 0.4425, 'learning_rate': 5.375280492575927e-06, 'epoch': 1.31} {'loss': 0.6328, 'learning_rate': 5.374990254084209e-06, 'epoch': 1.31} {'loss': 0.3867, 'learning_rate': 5.374700020548613e-06, 'epoch': 1.31} {'loss': 0.6073, 'learning_rate': 5.374409791969437e-06, 'epoch': 1.31} {'loss': 0.5595, 'learning_rate': 5.374119568347006e-06, 'epoch': 1.31} {'loss': 0.7303, 'learning_rate': 5.373829349681618e-06, 'epoch': 1.31} {'loss': 0.4615, 'learning_rate': 5.373539135973592e-06, 'epoch': 1.31} {'loss': 0.4877, 'learning_rate': 5.373248927223239e-06, 'epoch': 1.31} {'loss': 0.5325, 'learning_rate': 5.372958723430859e-06, 'epoch': 1.31} {'loss': 0.5886, 'learning_rate': 5.3726685245967804e-06, 'epoch': 1.31} {'loss': 0.4399, 'learning_rate': 5.372378330721296e-06, 'epoch': 1.31} {'loss': 0.6868, 'learning_rate': 5.3720881418047345e-06, 'epoch': 1.31} {'loss': 0.5925, 'learning_rate': 5.371797957847395e-06, 'epoch': 1.31} {'loss': 0.5905, 'learning_rate': 5.3715077788495895e-06, 'epoch': 1.31} {'loss': 0.5125, 'learning_rate': 5.371217604811637e-06, 'epoch': 1.31} {'loss': 0.5691, 'learning_rate': 5.370927435733835e-06, 'epoch': 1.31} {'loss': 0.614, 'learning_rate': 5.370637271616508e-06, 'epoch': 1.31} {'loss': 0.4277, 'learning_rate': 5.370347112459955e-06, 'epoch': 1.31} {'loss': 0.5881, 'learning_rate': 5.3700569582645e-06, 'epoch': 1.31} {'loss': 0.4853, 'learning_rate': 5.369766809030442e-06, 'epoch': 1.31} {'loss': 0.7216, 'learning_rate': 5.369476664758098e-06, 'epoch': 1.31} {'loss': 0.6559, 'learning_rate': 5.369186525447782e-06, 'epoch': 1.31} {'loss': 0.4358, 'learning_rate': 5.368896391099791e-06, 'epoch': 1.31} {'loss': 0.6077, 'learning_rate': 5.368606261714455e-06, 'epoch': 1.31} {'loss': 0.5232, 'learning_rate': 5.368316137292071e-06, 'epoch': 1.31} {'loss': 0.5453, 'learning_rate': 5.368026017832954e-06, 'epoch': 1.31} {'loss': 0.4049, 'learning_rate': 5.367735903337415e-06, 'epoch': 1.31} {'loss': 0.5391, 'learning_rate': 5.3674457938057656e-06, 'epoch': 1.31} {'loss': 0.562, 'learning_rate': 5.367155689238319e-06, 'epoch': 1.31} {'loss': 0.5078, 'learning_rate': 5.366865589635377e-06, 'epoch': 1.31} {'loss': 0.5734, 'learning_rate': 5.366575494997263e-06, 'epoch': 1.31} {'loss': 0.3756, 'learning_rate': 5.366285405324278e-06, 'epoch': 1.31} {'loss': 0.4872, 'learning_rate': 5.365995320616738e-06, 'epoch': 1.31} {'loss': 0.5893, 'learning_rate': 5.365705240874951e-06, 'epoch': 1.31} {'loss': 0.5249, 'learning_rate': 5.3654151660992296e-06, 'epoch': 1.31} {'loss': 0.5173, 'learning_rate': 5.365125096289887e-06, 'epoch': 1.31} {'loss': 0.5123, 'learning_rate': 5.3648350314472245e-06, 'epoch': 1.31} {'loss': 0.4833, 'learning_rate': 5.364544971571567e-06, 'epoch': 1.31} {'loss': 0.6265, 'learning_rate': 5.364254916663214e-06, 'epoch': 1.31} {'loss': 0.6436, 'learning_rate': 5.363964866722479e-06, 'epoch': 1.31} {'loss': 0.5289, 'learning_rate': 5.363674821749676e-06, 'epoch': 1.31} {'loss': 0.6144, 'learning_rate': 5.363384781745114e-06, 'epoch': 1.31} {'loss': 0.3901, 'learning_rate': 5.363094746709107e-06, 'epoch': 1.31} {'loss': 0.5929, 'learning_rate': 5.362804716641958e-06, 'epoch': 1.31} {'loss': 0.6015, 'learning_rate': 5.362514691543983e-06, 'epoch': 1.31} {'loss': 0.5921, 'learning_rate': 5.362224671415491e-06, 'epoch': 1.31} {'loss': 0.4567, 'learning_rate': 5.361934656256796e-06, 'epoch': 1.31} {'loss': 0.5125, 'learning_rate': 5.361644646068204e-06, 'epoch': 1.31} {'loss': 0.4759, 'learning_rate': 5.3613546408500296e-06, 'epoch': 1.31} {'loss': 0.6066, 'learning_rate': 5.361064640602587e-06, 'epoch': 1.31} {'loss': 0.6463, 'learning_rate': 5.360774645326177e-06, 'epoch': 1.31} {'loss': 0.4973, 'learning_rate': 5.360484655021116e-06, 'epoch': 1.31} {'loss': 0.5001, 'learning_rate': 5.360194669687715e-06, 'epoch': 1.31} {'loss': 0.5649, 'learning_rate': 5.359904689326284e-06, 'epoch': 1.31} {'loss': 0.5067, 'learning_rate': 5.359614713937133e-06, 'epoch': 1.31} {'loss': 0.4298, 'learning_rate': 5.35932474352058e-06, 'epoch': 1.31} {'loss': 0.5757, 'learning_rate': 5.359034778076924e-06, 'epoch': 1.31} {'loss': 0.6212, 'learning_rate': 5.35874481760648e-06, 'epoch': 1.31} {'loss': 0.4883, 'learning_rate': 5.358454862109561e-06, 'epoch': 1.31} {'loss': 0.4949, 'learning_rate': 5.358164911586476e-06, 'epoch': 1.31} {'loss': 0.5467, 'learning_rate': 5.357874966037537e-06, 'epoch': 1.31} {'loss': 0.4406, 'learning_rate': 5.357585025463054e-06, 'epoch': 1.31} {'loss': 0.5599, 'learning_rate': 5.3572950898633415e-06, 'epoch': 1.31} {'loss': 0.5634, 'learning_rate': 5.357005159238702e-06, 'epoch': 1.31} {'loss': 0.448, 'learning_rate': 5.35671523358945e-06, 'epoch': 1.31} {'loss': 0.4846, 'learning_rate': 5.356425312915897e-06, 'epoch': 1.31} {'loss': 0.4075, 'learning_rate': 5.356135397218354e-06, 'epoch': 1.31} {'loss': 0.642, 'learning_rate': 5.355845486497131e-06, 'epoch': 1.31} {'loss': 0.6433, 'learning_rate': 5.3555555807525424e-06, 'epoch': 1.31} {'loss': 0.6601, 'learning_rate': 5.355265679984891e-06, 'epoch': 1.31} {'loss': 0.5809, 'learning_rate': 5.354975784194491e-06, 'epoch': 1.31} {'loss': 0.5126, 'learning_rate': 5.354685893381656e-06, 'epoch': 1.31} {'loss': 0.4745, 'learning_rate': 5.354396007546692e-06, 'epoch': 1.31} {'loss': 0.5768, 'learning_rate': 5.354106126689913e-06, 'epoch': 1.31} {'loss': 0.3945, 'learning_rate': 5.3538162508116335e-06, 'epoch': 1.31} {'loss': 0.6572, 'learning_rate': 5.353526379912154e-06, 'epoch': 1.31} {'loss': 0.4835, 'learning_rate': 5.3532365139917905e-06, 'epoch': 1.31} {'loss': 0.4633, 'learning_rate': 5.352946653050853e-06, 'epoch': 1.31} {'loss': 0.6947, 'learning_rate': 5.352656797089654e-06, 'epoch': 1.31} {'loss': 0.5599, 'learning_rate': 5.3523669461085015e-06, 'epoch': 1.31} {'loss': 0.5871, 'learning_rate': 5.352077100107707e-06, 'epoch': 1.31} {'loss': 0.6534, 'learning_rate': 5.351787259087586e-06, 'epoch': 1.31} {'loss': 0.5441, 'learning_rate': 5.351497423048442e-06, 'epoch': 1.31} {'loss': 0.3737, 'learning_rate': 5.351207591990586e-06, 'epoch': 1.31} {'loss': 0.5461, 'learning_rate': 5.35091776591433e-06, 'epoch': 1.31} {'loss': 0.5282, 'learning_rate': 5.350627944819987e-06, 'epoch': 1.31} {'loss': 0.5421, 'learning_rate': 5.350338128707866e-06, 'epoch': 1.31} {'loss': 0.4458, 'learning_rate': 5.350048317578276e-06, 'epoch': 1.31} {'loss': 0.543, 'learning_rate': 5.349758511431533e-06, 'epoch': 1.31} {'loss': 0.4289, 'learning_rate': 5.34946871026794e-06, 'epoch': 1.31} {'loss': 0.5221, 'learning_rate': 5.349178914087812e-06, 'epoch': 1.31} {'loss': 0.6267, 'learning_rate': 5.348889122891456e-06, 'epoch': 1.31} {'loss': 0.489, 'learning_rate': 5.3485993366791875e-06, 'epoch': 1.31} {'loss': 0.6879, 'learning_rate': 5.348309555451318e-06, 'epoch': 1.31} {'loss': 0.5026, 'learning_rate': 5.348019779208147e-06, 'epoch': 1.31} {'loss': 0.7135, 'learning_rate': 5.347730007949998e-06, 'epoch': 1.31} {'loss': 0.5623, 'learning_rate': 5.347440241677175e-06, 'epoch': 1.31} {'loss': 0.4376, 'learning_rate': 5.3471504803899885e-06, 'epoch': 1.31} {'loss': 0.4587, 'learning_rate': 5.346860724088752e-06, 'epoch': 1.31} {'loss': 0.4762, 'learning_rate': 5.346570972773772e-06, 'epoch': 1.31} {'loss': 0.5302, 'learning_rate': 5.346281226445367e-06, 'epoch': 1.31} {'loss': 0.6431, 'learning_rate': 5.345991485103832e-06, 'epoch': 1.31} {'loss': 0.654, 'learning_rate': 5.345701748749497e-06, 'epoch': 1.31} {'loss': 0.6076, 'learning_rate': 5.345412017382656e-06, 'epoch': 1.31} {'loss': 0.5376, 'learning_rate': 5.345122291003628e-06, 'epoch': 1.31} {'loss': 0.5932, 'learning_rate': 5.3448325696127215e-06, 'epoch': 1.31} {'loss': 0.3995, 'learning_rate': 5.344542853210246e-06, 'epoch': 1.31} {'loss': 0.5235, 'learning_rate': 5.344253141796518e-06, 'epoch': 1.31} {'loss': 0.5377, 'learning_rate': 5.343963435371835e-06, 'epoch': 1.31} {'loss': 0.5102, 'learning_rate': 5.343673733936523e-06, 'epoch': 1.31} {'loss': 0.6603, 'learning_rate': 5.343384037490882e-06, 'epoch': 1.31} {'loss': 0.6787, 'learning_rate': 5.343094346035225e-06, 'epoch': 1.31} {'loss': 0.475, 'learning_rate': 5.342804659569864e-06, 'epoch': 1.31} {'loss': 0.5883, 'learning_rate': 5.342514978095103e-06, 'epoch': 1.31} {'loss': 0.5538, 'learning_rate': 5.342225301611266e-06, 'epoch': 1.31} {'loss': 0.5022, 'learning_rate': 5.341935630118645e-06, 'epoch': 1.31} {'loss': 0.6187, 'learning_rate': 5.34164596361757e-06, 'epoch': 1.31} {'loss': 0.5208, 'learning_rate': 5.341356302108336e-06, 'epoch': 1.31} {'loss': 0.5125, 'learning_rate': 5.341066645591261e-06, 'epoch': 1.31} {'loss': 0.624, 'learning_rate': 5.340776994066656e-06, 'epoch': 1.31} {'loss': 0.5449, 'learning_rate': 5.3404873475348216e-06, 'epoch': 1.31} {'loss': 0.5506, 'learning_rate': 5.340197705996084e-06, 'epoch': 1.31} {'loss': 0.5892, 'learning_rate': 5.3399080694507366e-06, 'epoch': 1.31} {'loss': 0.4972, 'learning_rate': 5.339618437899106e-06, 'epoch': 1.31} {'loss': 0.49, 'learning_rate': 5.339328811341492e-06, 'epoch': 1.31} {'loss': 0.4543, 'learning_rate': 5.339039189778208e-06, 'epoch': 1.31} {'loss': 0.4912, 'learning_rate': 5.338749573209567e-06, 'epoch': 1.31} {'loss': 0.5032, 'learning_rate': 5.338459961635869e-06, 'epoch': 1.31} {'loss': 0.438, 'learning_rate': 5.338170355057439e-06, 'epoch': 1.31} {'loss': 0.5624, 'learning_rate': 5.337880753474573e-06, 'epoch': 1.31} {'loss': 0.4071, 'learning_rate': 5.337591156887597e-06, 'epoch': 1.31} {'loss': 0.5112, 'learning_rate': 5.337301565296808e-06, 'epoch': 1.31} {'loss': 0.5122, 'learning_rate': 5.337011978702522e-06, 'epoch': 1.31} {'loss': 0.5036, 'learning_rate': 5.336722397105052e-06, 'epoch': 1.31} {'loss': 0.5821, 'learning_rate': 5.336432820504698e-06, 'epoch': 1.31} {'loss': 0.5553, 'learning_rate': 5.336143248901784e-06, 'epoch': 1.31} {'loss': 0.4148, 'learning_rate': 5.33585368229661e-06, 'epoch': 1.31} {'loss': 0.7122, 'learning_rate': 5.3355641206894896e-06, 'epoch': 1.31} {'loss': 0.6208, 'learning_rate': 5.3352745640807324e-06, 'epoch': 1.31} {'loss': 0.4642, 'learning_rate': 5.3349850124706505e-06, 'epoch': 1.31} {'loss': 0.5951, 'learning_rate': 5.334695465859556e-06, 'epoch': 1.31} {'loss': 0.545, 'learning_rate': 5.3344059242477495e-06, 'epoch': 1.31} {'loss': 0.5141, 'learning_rate': 5.334116387635555e-06, 'epoch': 1.31} {'loss': 0.5715, 'learning_rate': 5.3338268560232744e-06, 'epoch': 1.31} {'loss': 0.5234, 'learning_rate': 5.333537329411217e-06, 'epoch': 1.31} {'loss': 0.7731, 'learning_rate': 5.333247807799696e-06, 'epoch': 1.31} {'loss': 0.5384, 'learning_rate': 5.332958291189022e-06, 'epoch': 1.31} {'loss': 0.5537, 'learning_rate': 5.332668779579509e-06, 'epoch': 1.31} {'loss': 0.4471, 'learning_rate': 5.332379272971453e-06, 'epoch': 1.31} {'loss': 0.5674, 'learning_rate': 5.332089771365182e-06, 'epoch': 1.31} {'loss': 0.4067, 'learning_rate': 5.331800274760994e-06, 'epoch': 1.31} {'loss': 0.4965, 'learning_rate': 5.331510783159205e-06, 'epoch': 1.31} {'loss': 0.6163, 'learning_rate': 5.331221296560126e-06, 'epoch': 1.31} {'loss': 0.535, 'learning_rate': 5.330931814964058e-06, 'epoch': 1.31} {'loss': 0.4967, 'learning_rate': 5.330642338371324e-06, 'epoch': 1.31} {'loss': 0.5127, 'learning_rate': 5.330352866782223e-06, 'epoch': 1.31} {'loss': 0.6788, 'learning_rate': 5.330063400197076e-06, 'epoch': 1.31} {'loss': 0.4515, 'learning_rate': 5.3297739386161854e-06, 'epoch': 1.31} {'loss': 0.3724, 'learning_rate': 5.329484482039862e-06, 'epoch': 1.31} {'loss': 0.5267, 'learning_rate': 5.329195030468422e-06, 'epoch': 1.31} {'loss': 0.5989, 'learning_rate': 5.328905583902162e-06, 'epoch': 1.31} {'loss': 0.4978, 'learning_rate': 5.328616142341411e-06, 'epoch': 1.31} {'loss': 0.4584, 'learning_rate': 5.328326705786464e-06, 'epoch': 1.31} {'loss': 0.497, 'learning_rate': 5.3280372742376384e-06, 'epoch': 1.31} {'loss': 0.5867, 'learning_rate': 5.3277478476952415e-06, 'epoch': 1.31} {'loss': 0.5628, 'learning_rate': 5.327458426159584e-06, 'epoch': 1.31} {'loss': 0.6623, 'learning_rate': 5.327169009630981e-06, 'epoch': 1.31} {'loss': 0.6174, 'learning_rate': 5.326879598109731e-06, 'epoch': 1.31} {'loss': 0.5288, 'learning_rate': 5.326590191596157e-06, 'epoch': 1.31} {'loss': 0.4163, 'learning_rate': 5.326300790090562e-06, 'epoch': 1.31} {'loss': 0.5926, 'learning_rate': 5.326011393593256e-06, 'epoch': 1.31} {'loss': 0.4608, 'learning_rate': 5.325722002104551e-06, 'epoch': 1.31} {'loss': 0.5794, 'learning_rate': 5.325432615624757e-06, 'epoch': 1.31} {'loss': 0.5815, 'learning_rate': 5.325143234154186e-06, 'epoch': 1.31} {'loss': 0.641, 'learning_rate': 5.324853857693141e-06, 'epoch': 1.31} {'loss': 0.5218, 'learning_rate': 5.324564486241943e-06, 'epoch': 1.31} {'loss': 0.4214, 'learning_rate': 5.324275119800893e-06, 'epoch': 1.31} {'loss': 0.5057, 'learning_rate': 5.3239857583703046e-06, 'epoch': 1.31} {'loss': 0.5603, 'learning_rate': 5.3236964019504865e-06, 'epoch': 1.31} {'loss': 0.6791, 'learning_rate': 5.32340705054175e-06, 'epoch': 1.31} {'loss': 0.5527, 'learning_rate': 5.3231177041444096e-06, 'epoch': 1.31} {'loss': 0.434, 'learning_rate': 5.322828362758765e-06, 'epoch': 1.31} {'loss': 0.5688, 'learning_rate': 5.322539026385134e-06, 'epoch': 1.31} {'loss': 0.5133, 'learning_rate': 5.322249695023824e-06, 'epoch': 1.31} {'loss': 0.4631, 'learning_rate': 5.321960368675146e-06, 'epoch': 1.31} {'loss': 0.4971, 'learning_rate': 5.321671047339408e-06, 'epoch': 1.31} {'loss': 0.5453, 'learning_rate': 5.321381731016923e-06, 'epoch': 1.31} {'loss': 0.5305, 'learning_rate': 5.321092419708003e-06, 'epoch': 1.31} {'loss': 0.4853, 'learning_rate': 5.320803113412951e-06, 'epoch': 1.31} {'loss': 0.5702, 'learning_rate': 5.320513812132082e-06, 'epoch': 1.31} {'loss': 0.5683, 'learning_rate': 5.320224515865704e-06, 'epoch': 1.31} {'loss': 0.5511, 'learning_rate': 5.319935224614128e-06, 'epoch': 1.31} {'loss': 0.6107, 'learning_rate': 5.319645938377663e-06, 'epoch': 1.31} {'loss': 0.4075, 'learning_rate': 5.31935665715662e-06, 'epoch': 1.31} {'loss': 0.5175, 'learning_rate': 5.319067380951312e-06, 'epoch': 1.31} {'loss': 0.5761, 'learning_rate': 5.318778109762044e-06, 'epoch': 1.31} {'loss': 0.4571, 'learning_rate': 5.318488843589127e-06, 'epoch': 1.31} {'loss': 0.5763, 'learning_rate': 5.318199582432872e-06, 'epoch': 1.31} {'loss': 0.4008, 'learning_rate': 5.3179103262935875e-06, 'epoch': 1.31} {'loss': 0.427, 'learning_rate': 5.317621075171585e-06, 'epoch': 1.31} {'loss': 0.6931, 'learning_rate': 5.317331829067178e-06, 'epoch': 1.31} {'loss': 0.5027, 'learning_rate': 5.31704258798067e-06, 'epoch': 1.31} {'loss': 0.5102, 'learning_rate': 5.316753351912372e-06, 'epoch': 1.31} {'loss': 0.5965, 'learning_rate': 5.3164641208625965e-06, 'epoch': 1.31} {'loss': 0.4794, 'learning_rate': 5.3161748948316515e-06, 'epoch': 1.31} {'loss': 0.4158, 'learning_rate': 5.315885673819847e-06, 'epoch': 1.31} {'loss': 0.564, 'learning_rate': 5.315596457827497e-06, 'epoch': 1.31} {'loss': 0.5949, 'learning_rate': 5.315307246854909e-06, 'epoch': 1.31} {'loss': 0.5291, 'learning_rate': 5.315018040902388e-06, 'epoch': 1.31} {'loss': 0.5712, 'learning_rate': 5.314728839970251e-06, 'epoch': 1.31} {'loss': 0.4945, 'learning_rate': 5.314439644058803e-06, 'epoch': 1.31} {'loss': 0.5157, 'learning_rate': 5.314150453168357e-06, 'epoch': 1.31} {'loss': 0.6758, 'learning_rate': 5.31386126729922e-06, 'epoch': 1.31} {'loss': 0.5084, 'learning_rate': 5.313572086451704e-06, 'epoch': 1.31} {'loss': 0.5851, 'learning_rate': 5.313282910626123e-06, 'epoch': 1.31} {'loss': 0.4563, 'learning_rate': 5.312993739822778e-06, 'epoch': 1.31} {'loss': 0.5784, 'learning_rate': 5.312704574041984e-06, 'epoch': 1.31} {'loss': 0.6258, 'learning_rate': 5.312415413284049e-06, 'epoch': 1.31} {'loss': 0.62, 'learning_rate': 5.312126257549285e-06, 'epoch': 1.31} {'loss': 0.4623, 'learning_rate': 5.311837106838004e-06, 'epoch': 1.31} {'loss': 0.5979, 'learning_rate': 5.311547961150505e-06, 'epoch': 1.31} {'loss': 0.518, 'learning_rate': 5.311258820487113e-06, 'epoch': 1.31} {'loss': 0.4881, 'learning_rate': 5.3109696848481275e-06, 'epoch': 1.31} {'loss': 0.549, 'learning_rate': 5.31068055423386e-06, 'epoch': 1.31} {'loss': 0.5018, 'learning_rate': 5.310391428644622e-06, 'epoch': 1.31} {'loss': 0.5256, 'learning_rate': 5.310102308080724e-06, 'epoch': 1.31} {'loss': 0.6282, 'learning_rate': 5.309813192542477e-06, 'epoch': 1.31} {'loss': 0.6074, 'learning_rate': 5.309524082030185e-06, 'epoch': 1.31} {'loss': 0.5063, 'learning_rate': 5.309234976544162e-06, 'epoch': 1.31} {'loss': 0.5606, 'learning_rate': 5.308945876084717e-06, 'epoch': 1.31} {'loss': 0.5875, 'learning_rate': 5.308656780652159e-06, 'epoch': 1.31} {'loss': 0.4227, 'learning_rate': 5.308367690246803e-06, 'epoch': 1.31} {'loss': 0.6074, 'learning_rate': 5.308078604868946e-06, 'epoch': 1.31} {'loss': 0.6109, 'learning_rate': 5.307789524518915e-06, 'epoch': 1.31} {'loss': 0.4874, 'learning_rate': 5.307500449197007e-06, 'epoch': 1.31} {'loss': 0.417, 'learning_rate': 5.307211378903535e-06, 'epoch': 1.31} {'loss': 0.5561, 'learning_rate': 5.30692231363881e-06, 'epoch': 1.31} {'loss': 0.572, 'learning_rate': 5.3066332534031415e-06, 'epoch': 1.31} {'loss': 0.6582, 'learning_rate': 5.306344198196844e-06, 'epoch': 1.31} {'loss': 0.4414, 'learning_rate': 5.306055148020213e-06, 'epoch': 1.31} {'loss': 0.4659, 'learning_rate': 5.305766102873575e-06, 'epoch': 1.31} {'loss': 0.4796, 'learning_rate': 5.305477062757229e-06, 'epoch': 1.31} {'loss': 0.5723, 'learning_rate': 5.305188027671488e-06, 'epoch': 1.31} {'loss': 0.629, 'learning_rate': 5.304898997616663e-06, 'epoch': 1.31} {'loss': 0.5414, 'learning_rate': 5.304609972593061e-06, 'epoch': 1.31} {'loss': 0.6776, 'learning_rate': 5.304320952600999e-06, 'epoch': 1.31} {'loss': 0.5442, 'learning_rate': 5.30403193764077e-06, 'epoch': 1.31} {'loss': 0.6927, 'learning_rate': 5.303742927712705e-06, 'epoch': 1.31} {'loss': 0.6145, 'learning_rate': 5.303453922817099e-06, 'epoch': 1.31} {'loss': 0.6218, 'learning_rate': 5.303164922954265e-06, 'epoch': 1.31} {'loss': 0.5665, 'learning_rate': 5.302875928124518e-06, 'epoch': 1.31} {'loss': 0.4479, 'learning_rate': 5.3025869383281555e-06, 'epoch': 1.31} {'loss': 0.4595, 'learning_rate': 5.302297953565503e-06, 'epoch': 1.31} {'loss': 0.3786, 'learning_rate': 5.302008973836854e-06, 'epoch': 1.31} {'loss': 0.4399, 'learning_rate': 5.301719999142536e-06, 'epoch': 1.31} {'loss': 0.4474, 'learning_rate': 5.301431029482844e-06, 'epoch': 1.31} {'loss': 0.6519, 'learning_rate': 5.301142064858091e-06, 'epoch': 1.31} {'loss': 0.4557, 'learning_rate': 5.300853105268595e-06, 'epoch': 1.31} {'loss': 0.5221, 'learning_rate': 5.30056415071465e-06, 'epoch': 1.31} {'loss': 0.5513, 'learning_rate': 5.300275201196583e-06, 'epoch': 1.31} {'loss': 0.6282, 'learning_rate': 5.299986256714687e-06, 'epoch': 1.31} {'loss': 0.6271, 'learning_rate': 5.299697317269288e-06, 'epoch': 1.31} {'loss': 0.5169, 'learning_rate': 5.299408382860683e-06, 'epoch': 1.31} {'loss': 0.4654, 'learning_rate': 5.299119453489187e-06, 'epoch': 1.31} {'loss': 0.5967, 'learning_rate': 5.298830529155112e-06, 'epoch': 1.31} {'loss': 0.6771, 'learning_rate': 5.298541609858757e-06, 'epoch': 1.31} {'loss': 0.444, 'learning_rate': 5.298252695600446e-06, 'epoch': 1.31} {'loss': 0.5112, 'learning_rate': 5.297963786380476e-06, 'epoch': 1.31} {'loss': 0.5741, 'learning_rate': 5.297674882199168e-06, 'epoch': 1.31} {'loss': 0.5676, 'learning_rate': 5.297385983056822e-06, 'epoch': 1.31} {'loss': 0.4952, 'learning_rate': 5.297097088953752e-06, 'epoch': 1.31} {'loss': 0.4504, 'learning_rate': 5.296808199890271e-06, 'epoch': 1.31} {'loss': 0.3846, 'learning_rate': 5.296519315866675e-06, 'epoch': 1.31} {'loss': 0.6201, 'learning_rate': 5.296230436883293e-06, 'epoch': 1.31} {'loss': 0.481, 'learning_rate': 5.295941562940417e-06, 'epoch': 1.31} {'loss': 0.5659, 'learning_rate': 5.295652694038369e-06, 'epoch': 1.31} {'loss': 0.5345, 'learning_rate': 5.295363830177452e-06, 'epoch': 1.31} {'loss': 0.689, 'learning_rate': 5.295074971357978e-06, 'epoch': 1.31} {'loss': 0.4759, 'learning_rate': 5.294786117580258e-06, 'epoch': 1.31} {'loss': 0.5647, 'learning_rate': 5.294497268844593e-06, 'epoch': 1.31} {'loss': 0.5239, 'learning_rate': 5.294208425151306e-06, 'epoch': 1.31} {'loss': 0.6689, 'learning_rate': 5.293919586500691e-06, 'epoch': 1.31} {'loss': 0.5572, 'learning_rate': 5.293630752893075e-06, 'epoch': 1.31} {'loss': 0.4377, 'learning_rate': 5.2933419243287545e-06, 'epoch': 1.31} {'loss': 0.668, 'learning_rate': 5.293053100808041e-06, 'epoch': 1.31} {'loss': 0.6392, 'learning_rate': 5.292764282331251e-06, 'epoch': 1.31} {'loss': 0.5622, 'learning_rate': 5.292475468898681e-06, 'epoch': 1.31} {'loss': 0.5026, 'learning_rate': 5.292186660510656e-06, 'epoch': 1.31} {'loss': 0.633, 'learning_rate': 5.2918978571674765e-06, 'epoch': 1.31} {'loss': 0.6427, 'learning_rate': 5.2916090588694504e-06, 'epoch': 1.31} {'loss': 0.4673, 'learning_rate': 5.2913202656168905e-06, 'epoch': 1.31} {'loss': 0.6459, 'learning_rate': 5.291031477410107e-06, 'epoch': 1.31} {'loss': 0.5365, 'learning_rate': 5.2907426942494115e-06, 'epoch': 1.31} {'loss': 0.4554, 'learning_rate': 5.290453916135103e-06, 'epoch': 1.31} {'loss': 0.5737, 'learning_rate': 5.290165143067505e-06, 'epoch': 1.31} {'loss': 0.3728, 'learning_rate': 5.2898763750469175e-06, 'epoch': 1.31} {'loss': 0.5658, 'learning_rate': 5.289587612073653e-06, 'epoch': 1.31} {'loss': 0.6856, 'learning_rate': 5.289298854148017e-06, 'epoch': 1.31} {'loss': 0.5454, 'learning_rate': 5.289010101270327e-06, 'epoch': 1.31} {'loss': 0.5699, 'learning_rate': 5.288721353440889e-06, 'epoch': 1.31} {'loss': 0.489, 'learning_rate': 5.288432610660003e-06, 'epoch': 1.31} {'loss': 0.4966, 'learning_rate': 5.288143872927996e-06, 'epoch': 1.31} {'loss': 0.5048, 'learning_rate': 5.287855140245164e-06, 'epoch': 1.31} {'loss': 0.4824, 'learning_rate': 5.28756641261182e-06, 'epoch': 1.31} {'loss': 0.4657, 'learning_rate': 5.287277690028274e-06, 'epoch': 1.31} {'loss': 0.4628, 'learning_rate': 5.286988972494836e-06, 'epoch': 1.31} {'loss': 0.597, 'learning_rate': 5.286700260011819e-06, 'epoch': 1.31} {'loss': 0.4896, 'learning_rate': 5.2864115525795225e-06, 'epoch': 1.31} {'loss': 0.6096, 'learning_rate': 5.286122850198263e-06, 'epoch': 1.31} {'loss': 0.6042, 'learning_rate': 5.285834152868347e-06, 'epoch': 1.31} {'loss': 0.5945, 'learning_rate': 5.285545460590087e-06, 'epoch': 1.31} {'loss': 0.5173, 'learning_rate': 5.285256773363792e-06, 'epoch': 1.31} {'loss': 0.5283, 'learning_rate': 5.284968091189764e-06, 'epoch': 1.31} {'loss': 0.5121, 'learning_rate': 5.2846794140683256e-06, 'epoch': 1.31} {'loss': 0.5818, 'learning_rate': 5.284390741999774e-06, 'epoch': 1.31} {'loss': 0.4742, 'learning_rate': 5.284102074984424e-06, 'epoch': 1.31} {'loss': 0.7174, 'learning_rate': 5.283813413022585e-06, 'epoch': 1.31} {'loss': 0.3967, 'learning_rate': 5.2835247561145645e-06, 'epoch': 1.31} {'loss': 0.6239, 'learning_rate': 5.283236104260677e-06, 'epoch': 1.31} {'loss': 0.6318, 'learning_rate': 5.282947457461224e-06, 'epoch': 1.31} {'loss': 0.4683, 'learning_rate': 5.282658815716519e-06, 'epoch': 1.31} {'loss': 0.5242, 'learning_rate': 5.28237017902687e-06, 'epoch': 1.31} {'loss': 0.3622, 'learning_rate': 5.282081547392588e-06, 'epoch': 1.31} {'loss': 0.4427, 'learning_rate': 5.281792920813981e-06, 'epoch': 1.31} {'loss': 0.5368, 'learning_rate': 5.281504299291358e-06, 'epoch': 1.31} {'loss': 0.5235, 'learning_rate': 5.281215682825034e-06, 'epoch': 1.31} {'loss': 0.4741, 'learning_rate': 5.28092707141531e-06, 'epoch': 1.32} {'loss': 0.4189, 'learning_rate': 5.280638465062497e-06, 'epoch': 1.32} {'loss': 0.6061, 'learning_rate': 5.2803498637669055e-06, 'epoch': 1.32} {'loss': 0.7507, 'learning_rate': 5.2800612675288466e-06, 'epoch': 1.32} {'loss': 0.5723, 'learning_rate': 5.279772676348627e-06, 'epoch': 1.32} {'loss': 0.5121, 'learning_rate': 5.279484090226557e-06, 'epoch': 1.32} {'loss': 0.5616, 'learning_rate': 5.279195509162951e-06, 'epoch': 1.32} {'loss': 0.661, 'learning_rate': 5.278906933158108e-06, 'epoch': 1.32} {'loss': 0.5458, 'learning_rate': 5.278618362212344e-06, 'epoch': 1.32} {'loss': 0.4696, 'learning_rate': 5.278329796325965e-06, 'epoch': 1.32} {'loss': 0.5418, 'learning_rate': 5.278041235499282e-06, 'epoch': 1.32} {'loss': 0.5237, 'learning_rate': 5.277752679732604e-06, 'epoch': 1.32} {'loss': 0.5609, 'learning_rate': 5.277464129026244e-06, 'epoch': 1.32} {'loss': 0.3602, 'learning_rate': 5.2771755833805026e-06, 'epoch': 1.32} {'loss': 0.6019, 'learning_rate': 5.276887042795696e-06, 'epoch': 1.32} {'loss': 0.5262, 'learning_rate': 5.276598507272131e-06, 'epoch': 1.32} {'loss': 0.6305, 'learning_rate': 5.2763099768101146e-06, 'epoch': 1.32} {'loss': 0.5915, 'learning_rate': 5.2760214514099605e-06, 'epoch': 1.32} {'loss': 0.5069, 'learning_rate': 5.275732931071975e-06, 'epoch': 1.32} {'loss': 0.5571, 'learning_rate': 5.275444415796472e-06, 'epoch': 1.32} {'loss': 0.5955, 'learning_rate': 5.2751559055837534e-06, 'epoch': 1.32} {'loss': 0.6045, 'learning_rate': 5.274867400434132e-06, 'epoch': 1.32} {'loss': 0.5354, 'learning_rate': 5.274578900347915e-06, 'epoch': 1.32} {'loss': 0.5678, 'learning_rate': 5.274290405325415e-06, 'epoch': 1.32} {'loss': 0.5901, 'learning_rate': 5.274001915366937e-06, 'epoch': 1.32} {'loss': 0.5736, 'learning_rate': 5.273713430472796e-06, 'epoch': 1.32} {'loss': 0.6328, 'learning_rate': 5.273424950643298e-06, 'epoch': 1.32} {'loss': 0.6642, 'learning_rate': 5.273136475878751e-06, 'epoch': 1.32} {'loss': 0.549, 'learning_rate': 5.272848006179463e-06, 'epoch': 1.32} {'loss': 0.5451, 'learning_rate': 5.272559541545746e-06, 'epoch': 1.32} {'loss': 0.6233, 'learning_rate': 5.272271081977906e-06, 'epoch': 1.32} {'loss': 0.6228, 'learning_rate': 5.27198262747626e-06, 'epoch': 1.32} {'loss': 0.5285, 'learning_rate': 5.271694178041102e-06, 'epoch': 1.32} {'loss': 0.401, 'learning_rate': 5.2714057336727606e-06, 'epoch': 1.32} {'loss': 0.436, 'learning_rate': 5.2711172943715295e-06, 'epoch': 1.32} {'loss': 0.6606, 'learning_rate': 5.270828860137722e-06, 'epoch': 1.32} {'loss': 0.5536, 'learning_rate': 5.27054043097165e-06, 'epoch': 1.32} {'loss': 0.6246, 'learning_rate': 5.2702520068736195e-06, 'epoch': 1.32} {'loss': 0.4927, 'learning_rate': 5.269963587843947e-06, 'epoch': 1.32} {'loss': 0.5389, 'learning_rate': 5.269675173882925e-06, 'epoch': 1.32} {'loss': 0.434, 'learning_rate': 5.269386764990883e-06, 'epoch': 1.32} {'loss': 0.4776, 'learning_rate': 5.269098361168114e-06, 'epoch': 1.32} {'loss': 0.5289, 'learning_rate': 5.268809962414933e-06, 'epoch': 1.32} {'loss': 0.679, 'learning_rate': 5.268521568731652e-06, 'epoch': 1.32} {'loss': 0.5738, 'learning_rate': 5.268233180118575e-06, 'epoch': 1.32} {'loss': 0.488, 'learning_rate': 5.2679447965760166e-06, 'epoch': 1.32} {'loss': 0.4354, 'learning_rate': 5.267656418104277e-06, 'epoch': 1.32} {'loss': 0.5932, 'learning_rate': 5.2673680447036755e-06, 'epoch': 1.32} {'loss': 0.4513, 'learning_rate': 5.267079676374514e-06, 'epoch': 1.32} {'loss': 0.4728, 'learning_rate': 5.266791313117104e-06, 'epoch': 1.32} {'loss': 0.5716, 'learning_rate': 5.266502954931758e-06, 'epoch': 1.32} {'loss': 0.5316, 'learning_rate': 5.266214601818773e-06, 'epoch': 1.32} {'loss': 0.6398, 'learning_rate': 5.265926253778475e-06, 'epoch': 1.32} {'loss': 0.556, 'learning_rate': 5.26563791081116e-06, 'epoch': 1.32} {'loss': 0.5572, 'learning_rate': 5.265349572917141e-06, 'epoch': 1.32} {'loss': 0.6803, 'learning_rate': 5.2650612400967276e-06, 'epoch': 1.32} {'loss': 0.3954, 'learning_rate': 5.264772912350229e-06, 'epoch': 1.32} {'loss': 0.6044, 'learning_rate': 5.264484589677956e-06, 'epoch': 1.32} {'loss': 0.6469, 'learning_rate': 5.2641962720802085e-06, 'epoch': 1.32} {'loss': 0.498, 'learning_rate': 5.26390795955731e-06, 'epoch': 1.32} {'loss': 0.561, 'learning_rate': 5.263619652109557e-06, 'epoch': 1.32} {'loss': 0.4741, 'learning_rate': 5.263331349737263e-06, 'epoch': 1.32} {'loss': 0.5484, 'learning_rate': 5.263043052440737e-06, 'epoch': 1.32} {'loss': 0.6009, 'learning_rate': 5.262754760220289e-06, 'epoch': 1.32} {'loss': 0.5609, 'learning_rate': 5.262466473076229e-06, 'epoch': 1.32} {'loss': 0.5671, 'learning_rate': 5.262178191008858e-06, 'epoch': 1.32} {'loss': 0.5426, 'learning_rate': 5.261889914018497e-06, 'epoch': 1.32} {'loss': 0.4874, 'learning_rate': 5.261601642105445e-06, 'epoch': 1.32} {'loss': 0.562, 'learning_rate': 5.2613133752700145e-06, 'epoch': 1.32} {'loss': 0.5979, 'learning_rate': 5.261025113512519e-06, 'epoch': 1.32} {'loss': 0.5578, 'learning_rate': 5.260736856833254e-06, 'epoch': 1.32} {'loss': 0.4931, 'learning_rate': 5.260448605232544e-06, 'epoch': 1.32} {'loss': 0.5305, 'learning_rate': 5.2601603587106865e-06, 'epoch': 1.32} {'loss': 0.7121, 'learning_rate': 5.259872117268e-06, 'epoch': 1.32} {'loss': 0.4013, 'learning_rate': 5.259583880904786e-06, 'epoch': 1.32} {'loss': 0.5134, 'learning_rate': 5.259295649621354e-06, 'epoch': 1.32} {'loss': 0.5204, 'learning_rate': 5.259007423418021e-06, 'epoch': 1.32} {'loss': 0.4678, 'learning_rate': 5.258719202295079e-06, 'epoch': 1.32} {'loss': 0.5308, 'learning_rate': 5.258430986252857e-06, 'epoch': 1.32} {'loss': 0.4479, 'learning_rate': 5.258142775291646e-06, 'epoch': 1.32} {'loss': 0.5286, 'learning_rate': 5.2578545694117714e-06, 'epoch': 1.32} {'loss': 0.5353, 'learning_rate': 5.257566368613527e-06, 'epoch': 1.32} {'loss': 0.8439, 'learning_rate': 5.257278172897231e-06, 'epoch': 1.32} {'loss': 0.4445, 'learning_rate': 5.256989982263192e-06, 'epoch': 1.32} {'loss': 0.5144, 'learning_rate': 5.2567017967117094e-06, 'epoch': 1.32} {'loss': 0.531, 'learning_rate': 5.256413616243106e-06, 'epoch': 1.32} {'loss': 0.5674, 'learning_rate': 5.256125440857677e-06, 'epoch': 1.32} {'loss': 0.5975, 'learning_rate': 5.255837270555744e-06, 'epoch': 1.32} {'loss': 0.5187, 'learning_rate': 5.255549105337606e-06, 'epoch': 1.32} {'loss': 0.6189, 'learning_rate': 5.255260945203576e-06, 'epoch': 1.32} {'loss': 0.503, 'learning_rate': 5.254972790153966e-06, 'epoch': 1.32} {'loss': 0.4802, 'learning_rate': 5.254684640189073e-06, 'epoch': 1.32} {'loss': 0.6114, 'learning_rate': 5.254396495309221e-06, 'epoch': 1.32} {'loss': 0.4611, 'learning_rate': 5.254108355514704e-06, 'epoch': 1.32} {'loss': 0.4997, 'learning_rate': 5.253820220805846e-06, 'epoch': 1.32} {'loss': 0.6134, 'learning_rate': 5.253532091182945e-06, 'epoch': 1.32} {'loss': 0.5625, 'learning_rate': 5.253243966646311e-06, 'epoch': 1.32} {'loss': 0.5898, 'learning_rate': 5.252955847196259e-06, 'epoch': 1.32} {'loss': 0.6384, 'learning_rate': 5.252667732833086e-06, 'epoch': 1.32} {'loss': 0.7027, 'learning_rate': 5.252379623557116e-06, 'epoch': 1.32} {'loss': 0.4881, 'learning_rate': 5.252091519368645e-06, 'epoch': 1.32} {'loss': 0.546, 'learning_rate': 5.251803420267987e-06, 'epoch': 1.32} {'loss': 0.6948, 'learning_rate': 5.251515326255449e-06, 'epoch': 1.32} {'loss': 0.4913, 'learning_rate': 5.251227237331343e-06, 'epoch': 1.32} {'loss': 0.602, 'learning_rate': 5.250939153495978e-06, 'epoch': 1.32} {'loss': 0.5045, 'learning_rate': 5.250651074749653e-06, 'epoch': 1.32} {'loss': 0.5553, 'learning_rate': 5.250363001092692e-06, 'epoch': 1.32} {'loss': 0.5092, 'learning_rate': 5.250074932525392e-06, 'epoch': 1.32} {'loss': 0.5163, 'learning_rate': 5.249786869048065e-06, 'epoch': 1.32} {'loss': 0.4319, 'learning_rate': 5.24949881066102e-06, 'epoch': 1.32} {'loss': 0.4769, 'learning_rate': 5.249210757364566e-06, 'epoch': 1.32} {'loss': 0.5704, 'learning_rate': 5.248922709159014e-06, 'epoch': 1.32} {'loss': 0.5187, 'learning_rate': 5.248634666044665e-06, 'epoch': 1.32} {'loss': 0.5806, 'learning_rate': 5.248346628021839e-06, 'epoch': 1.32} {'loss': 0.61, 'learning_rate': 5.248058595090835e-06, 'epoch': 1.32} {'loss': 0.4291, 'learning_rate': 5.247770567251964e-06, 'epoch': 1.32} {'loss': 0.6045, 'learning_rate': 5.247482544505538e-06, 'epoch': 1.32} {'loss': 0.5324, 'learning_rate': 5.247194526851862e-06, 'epoch': 1.32} {'loss': 0.4807, 'learning_rate': 5.24690651429125e-06, 'epoch': 1.32} {'loss': 0.5746, 'learning_rate': 5.246618506824002e-06, 'epoch': 1.32} {'loss': 0.5584, 'learning_rate': 5.246330504450432e-06, 'epoch': 1.32} {'loss': 0.5182, 'learning_rate': 5.246042507170848e-06, 'epoch': 1.32} {'loss': 0.4335, 'learning_rate': 5.245754514985558e-06, 'epoch': 1.32} {'loss': 0.516, 'learning_rate': 5.245466527894871e-06, 'epoch': 1.32} {'loss': 0.4425, 'learning_rate': 5.2451785458990964e-06, 'epoch': 1.32} {'loss': 0.5461, 'learning_rate': 5.244890568998546e-06, 'epoch': 1.32} {'loss': 0.489, 'learning_rate': 5.244602597193522e-06, 'epoch': 1.32} {'loss': 0.5303, 'learning_rate': 5.244314630484333e-06, 'epoch': 1.32} {'loss': 0.559, 'learning_rate': 5.244026668871292e-06, 'epoch': 1.32} {'loss': 0.6214, 'learning_rate': 5.2437387123547045e-06, 'epoch': 1.32} {'loss': 0.5977, 'learning_rate': 5.24345076093488e-06, 'epoch': 1.32} {'loss': 0.542, 'learning_rate': 5.243162814612128e-06, 'epoch': 1.32} {'loss': 0.5895, 'learning_rate': 5.24287487338676e-06, 'epoch': 1.32} {'loss': 0.5718, 'learning_rate': 5.242586937259078e-06, 'epoch': 1.32} {'loss': 0.644, 'learning_rate': 5.242299006229392e-06, 'epoch': 1.32} {'loss': 0.6331, 'learning_rate': 5.242011080298014e-06, 'epoch': 1.32} {'loss': 0.4946, 'learning_rate': 5.241723159465248e-06, 'epoch': 1.32} {'loss': 0.5338, 'learning_rate': 5.241435243731412e-06, 'epoch': 1.32} {'loss': 0.5568, 'learning_rate': 5.241147333096801e-06, 'epoch': 1.32} {'loss': 0.6096, 'learning_rate': 5.240859427561731e-06, 'epoch': 1.32} {'loss': 0.4721, 'learning_rate': 5.24057152712651e-06, 'epoch': 1.32} {'loss': 0.5555, 'learning_rate': 5.2402836317914465e-06, 'epoch': 1.32} {'loss': 0.5226, 'learning_rate': 5.239995741556848e-06, 'epoch': 1.32} {'loss': 0.5387, 'learning_rate': 5.239707856423024e-06, 'epoch': 1.32} {'loss': 0.5843, 'learning_rate': 5.239419976390286e-06, 'epoch': 1.32} {'loss': 0.5781, 'learning_rate': 5.239132101458937e-06, 'epoch': 1.32} {'loss': 0.5738, 'learning_rate': 5.238844231629285e-06, 'epoch': 1.32} {'loss': 0.6119, 'learning_rate': 5.238556366901643e-06, 'epoch': 1.32} {'loss': 0.5465, 'learning_rate': 5.238268507276317e-06, 'epoch': 1.32} {'loss': 0.5291, 'learning_rate': 5.2379806527536156e-06, 'epoch': 1.32} {'loss': 0.4974, 'learning_rate': 5.237692803333849e-06, 'epoch': 1.32} {'loss': 0.5336, 'learning_rate': 5.237404959017327e-06, 'epoch': 1.32} {'loss': 0.4326, 'learning_rate': 5.237117119804354e-06, 'epoch': 1.32} {'loss': 0.4477, 'learning_rate': 5.236829285695238e-06, 'epoch': 1.32} {'loss': 0.6705, 'learning_rate': 5.236541456690287e-06, 'epoch': 1.32} {'loss': 0.5252, 'learning_rate': 5.236253632789815e-06, 'epoch': 1.32} {'loss': 0.4937, 'learning_rate': 5.235965813994126e-06, 'epoch': 1.32} {'loss': 0.5291, 'learning_rate': 5.235678000303535e-06, 'epoch': 1.32} {'loss': 0.528, 'learning_rate': 5.235390191718339e-06, 'epoch': 1.32} {'loss': 0.5733, 'learning_rate': 5.235102388238853e-06, 'epoch': 1.32} {'loss': 0.4579, 'learning_rate': 5.234814589865385e-06, 'epoch': 1.32} {'loss': 0.5136, 'learning_rate': 5.234526796598245e-06, 'epoch': 1.32} {'loss': 0.5431, 'learning_rate': 5.234239008437737e-06, 'epoch': 1.32} {'loss': 0.5813, 'learning_rate': 5.233951225384173e-06, 'epoch': 1.32} {'loss': 0.5897, 'learning_rate': 5.233663447437865e-06, 'epoch': 1.32} {'loss': 0.5489, 'learning_rate': 5.2333756745991126e-06, 'epoch': 1.32} {'loss': 0.5373, 'learning_rate': 5.233087906868228e-06, 'epoch': 1.32} {'loss': 0.62, 'learning_rate': 5.23280014424552e-06, 'epoch': 1.32} {'loss': 0.5709, 'learning_rate': 5.232512386731296e-06, 'epoch': 1.32} {'loss': 0.4807, 'learning_rate': 5.232224634325871e-06, 'epoch': 1.32} {'loss': 0.3902, 'learning_rate': 5.231936887029538e-06, 'epoch': 1.32} {'loss': 0.5134, 'learning_rate': 5.231649144842625e-06, 'epoch': 1.32} {'loss': 0.5416, 'learning_rate': 5.2313614077654254e-06, 'epoch': 1.32} {'loss': 0.5318, 'learning_rate': 5.2310736757982516e-06, 'epoch': 1.32} {'loss': 0.6395, 'learning_rate': 5.230785948941414e-06, 'epoch': 1.32} {'loss': 0.4282, 'learning_rate': 5.230498227195219e-06, 'epoch': 1.32} {'loss': 0.5817, 'learning_rate': 5.230210510559979e-06, 'epoch': 1.32} {'loss': 0.6746, 'learning_rate': 5.229922799035991e-06, 'epoch': 1.32} {'loss': 0.5796, 'learning_rate': 5.229635092623582e-06, 'epoch': 1.32} {'loss': 0.6343, 'learning_rate': 5.229347391323043e-06, 'epoch': 1.32} {'loss': 0.6693, 'learning_rate': 5.229059695134688e-06, 'epoch': 1.32} {'loss': 0.4385, 'learning_rate': 5.2287720040588285e-06, 'epoch': 1.32} {'loss': 0.4844, 'learning_rate': 5.228484318095769e-06, 'epoch': 1.32} {'loss': 0.4853, 'learning_rate': 5.228196637245824e-06, 'epoch': 1.32} {'loss': 0.4512, 'learning_rate': 5.227908961509288e-06, 'epoch': 1.32} {'loss': 0.6865, 'learning_rate': 5.2276212908864866e-06, 'epoch': 1.32} {'loss': 0.5339, 'learning_rate': 5.227333625377716e-06, 'epoch': 1.32} {'loss': 0.5183, 'learning_rate': 5.227045964983288e-06, 'epoch': 1.32} {'loss': 0.5691, 'learning_rate': 5.226758309703516e-06, 'epoch': 1.32} {'loss': 0.5845, 'learning_rate': 5.226470659538694e-06, 'epoch': 1.32} {'loss': 0.3723, 'learning_rate': 5.226183014489148e-06, 'epoch': 1.32} {'loss': 0.594, 'learning_rate': 5.22589537455517e-06, 'epoch': 1.32} {'loss': 0.5688, 'learning_rate': 5.2256077397370845e-06, 'epoch': 1.32} {'loss': 0.6201, 'learning_rate': 5.225320110035186e-06, 'epoch': 1.32} {'loss': 0.5043, 'learning_rate': 5.225032485449788e-06, 'epoch': 1.32} {'loss': 0.4635, 'learning_rate': 5.224744865981203e-06, 'epoch': 1.32} {'loss': 0.5257, 'learning_rate': 5.224457251629726e-06, 'epoch': 1.32} {'loss': 0.4929, 'learning_rate': 5.224169642395684e-06, 'epoch': 1.32} {'loss': 0.4946, 'learning_rate': 5.223882038279366e-06, 'epoch': 1.32} {'loss': 0.5522, 'learning_rate': 5.223594439281098e-06, 'epoch': 1.32} {'loss': 0.6093, 'learning_rate': 5.223306845401175e-06, 'epoch': 1.32} {'loss': 0.4541, 'learning_rate': 5.223019256639911e-06, 'epoch': 1.32} {'loss': 0.6176, 'learning_rate': 5.2227316729976165e-06, 'epoch': 1.32} {'loss': 0.4015, 'learning_rate': 5.222444094474588e-06, 'epoch': 1.32} {'loss': 0.6098, 'learning_rate': 5.222156521071149e-06, 'epoch': 1.32} {'loss': 0.467, 'learning_rate': 5.221868952787593e-06, 'epoch': 1.32} {'loss': 0.6312, 'learning_rate': 5.221581389624244e-06, 'epoch': 1.32} {'loss': 0.4825, 'learning_rate': 5.221293831581398e-06, 'epoch': 1.32} {'loss': 0.5341, 'learning_rate': 5.221006278659367e-06, 'epoch': 1.32} {'loss': 0.6023, 'learning_rate': 5.220718730858463e-06, 'epoch': 1.32} {'loss': 0.4634, 'learning_rate': 5.220431188178982e-06, 'epoch': 1.32} {'loss': 0.6221, 'learning_rate': 5.220143650621248e-06, 'epoch': 1.32} {'loss': 0.5668, 'learning_rate': 5.219856118185558e-06, 'epoch': 1.32} {'loss': 0.4908, 'learning_rate': 5.2195685908722234e-06, 'epoch': 1.32} {'loss': 0.6321, 'learning_rate': 5.219281068681553e-06, 'epoch': 1.32} {'loss': 0.4296, 'learning_rate': 5.218993551613854e-06, 'epoch': 1.32} {'loss': 0.4809, 'learning_rate': 5.218706039669439e-06, 'epoch': 1.32} {'loss': 0.635, 'learning_rate': 5.218418532848604e-06, 'epoch': 1.32} {'loss': 0.4488, 'learning_rate': 5.218131031151673e-06, 'epoch': 1.32} {'loss': 0.5034, 'learning_rate': 5.217843534578943e-06, 'epoch': 1.32} {'loss': 0.6716, 'learning_rate': 5.217556043130725e-06, 'epoch': 1.32} {'loss': 0.5162, 'learning_rate': 5.2172685568073265e-06, 'epoch': 1.32} {'loss': 0.5527, 'learning_rate': 5.216981075609057e-06, 'epoch': 1.32} {'loss': 0.6111, 'learning_rate': 5.216693599536227e-06, 'epoch': 1.32} {'loss': 0.4695, 'learning_rate': 5.216406128589135e-06, 'epoch': 1.32} {'loss': 0.4877, 'learning_rate': 5.216118662768102e-06, 'epoch': 1.32} {'loss': 0.5715, 'learning_rate': 5.215831202073427e-06, 'epoch': 1.32} {'loss': 0.4936, 'learning_rate': 5.215543746505421e-06, 'epoch': 1.32} {'loss': 0.4671, 'learning_rate': 5.2152562960643945e-06, 'epoch': 1.32} {'loss': 0.5484, 'learning_rate': 5.214968850750646e-06, 'epoch': 1.32} {'loss': 0.5937, 'learning_rate': 5.214681410564497e-06, 'epoch': 1.32} {'loss': 0.5433, 'learning_rate': 5.21439397550624e-06, 'epoch': 1.32} {'loss': 0.4882, 'learning_rate': 5.214106545576201e-06, 'epoch': 1.32} {'loss': 0.4866, 'learning_rate': 5.213819120774675e-06, 'epoch': 1.32} {'loss': 0.4642, 'learning_rate': 5.213531701101973e-06, 'epoch': 1.32} {'loss': 0.4594, 'learning_rate': 5.21324428655841e-06, 'epoch': 1.32} {'loss': 0.4283, 'learning_rate': 5.212956877144278e-06, 'epoch': 1.32} {'loss': 0.5339, 'learning_rate': 5.212669472859901e-06, 'epoch': 1.32} {'loss': 0.5822, 'learning_rate': 5.212382073705575e-06, 'epoch': 1.32} {'loss': 0.5182, 'learning_rate': 5.212094679681622e-06, 'epoch': 1.32} {'loss': 0.5075, 'learning_rate': 5.211807290788338e-06, 'epoch': 1.32} {'loss': 0.5299, 'learning_rate': 5.211519907026032e-06, 'epoch': 1.32} {'loss': 0.6276, 'learning_rate': 5.21123252839502e-06, 'epoch': 1.32} {'loss': 0.6095, 'learning_rate': 5.210945154895598e-06, 'epoch': 1.32} {'loss': 0.5808, 'learning_rate': 5.210657786528087e-06, 'epoch': 1.32} {'loss': 0.4954, 'learning_rate': 5.2103704232927855e-06, 'epoch': 1.32} {'loss': 0.5219, 'learning_rate': 5.210083065190003e-06, 'epoch': 1.32} {'loss': 0.3186, 'learning_rate': 5.209795712220049e-06, 'epoch': 1.32} {'loss': 0.5493, 'learning_rate': 5.2095083643832325e-06, 'epoch': 1.32} {'loss': 0.6849, 'learning_rate': 5.209221021679863e-06, 'epoch': 1.32} {'loss': 0.4604, 'learning_rate': 5.208933684110238e-06, 'epoch': 1.32} {'loss': 0.4322, 'learning_rate': 5.208646351674681e-06, 'epoch': 1.32} {'loss': 0.6237, 'learning_rate': 5.208359024373489e-06, 'epoch': 1.32} {'loss': 0.584, 'learning_rate': 5.20807170220697e-06, 'epoch': 1.32} {'loss': 0.5134, 'learning_rate': 5.2077843851754365e-06, 'epoch': 1.32} {'loss': 0.663, 'learning_rate': 5.207497073279195e-06, 'epoch': 1.32} {'loss': 0.3319, 'learning_rate': 5.207209766518555e-06, 'epoch': 1.32} {'loss': 0.4735, 'learning_rate': 5.20692246489382e-06, 'epoch': 1.32} {'loss': 0.6016, 'learning_rate': 5.206635168405301e-06, 'epoch': 1.32} {'loss': 0.4967, 'learning_rate': 5.2063478770533025e-06, 'epoch': 1.32} {'loss': 0.4007, 'learning_rate': 5.206060590838135e-06, 'epoch': 1.32} {'loss': 0.5175, 'learning_rate': 5.205773309760109e-06, 'epoch': 1.32} {'loss': 0.3943, 'learning_rate': 5.205486033819528e-06, 'epoch': 1.32} {'loss': 0.5512, 'learning_rate': 5.205198763016706e-06, 'epoch': 1.32} {'loss': 0.5774, 'learning_rate': 5.204911497351941e-06, 'epoch': 1.32} {'loss': 0.49, 'learning_rate': 5.2046242368255475e-06, 'epoch': 1.32} {'loss': 0.4008, 'learning_rate': 5.204336981437831e-06, 'epoch': 1.32} {'loss': 0.566, 'learning_rate': 5.204049731189101e-06, 'epoch': 1.32} {'loss': 0.6445, 'learning_rate': 5.203762486079664e-06, 'epoch': 1.32} {'loss': 0.5713, 'learning_rate': 5.2034752461098284e-06, 'epoch': 1.32} {'loss': 0.5553, 'learning_rate': 5.203188011279906e-06, 'epoch': 1.32} {'loss': 0.5084, 'learning_rate': 5.202900781590196e-06, 'epoch': 1.32} {'loss': 0.5163, 'learning_rate': 5.2026135570410115e-06, 'epoch': 1.32} {'loss': 0.4486, 'learning_rate': 5.202326337632659e-06, 'epoch': 1.32} {'loss': 0.4942, 'learning_rate': 5.202039123365449e-06, 'epoch': 1.32} {'loss': 0.6002, 'learning_rate': 5.2017519142396855e-06, 'epoch': 1.32} {'loss': 0.5872, 'learning_rate': 5.201464710255681e-06, 'epoch': 1.32} {'loss': 0.6301, 'learning_rate': 5.201177511413737e-06, 'epoch': 1.32} {'loss': 0.5526, 'learning_rate': 5.200890317714165e-06, 'epoch': 1.32} {'loss': 0.5, 'learning_rate': 5.200603129157271e-06, 'epoch': 1.32} {'loss': 0.5441, 'learning_rate': 5.200315945743366e-06, 'epoch': 1.32} {'loss': 0.5822, 'learning_rate': 5.200028767472754e-06, 'epoch': 1.32} {'loss': 0.4879, 'learning_rate': 5.199741594345744e-06, 'epoch': 1.32} {'loss': 0.5338, 'learning_rate': 5.199454426362649e-06, 'epoch': 1.32} {'loss': 0.423, 'learning_rate': 5.1991672635237675e-06, 'epoch': 1.32} {'loss': 0.563, 'learning_rate': 5.198880105829412e-06, 'epoch': 1.32} {'loss': 0.4128, 'learning_rate': 5.198592953279889e-06, 'epoch': 1.32} {'loss': 0.5972, 'learning_rate': 5.198305805875507e-06, 'epoch': 1.32} {'loss': 0.4726, 'learning_rate': 5.198018663616575e-06, 'epoch': 1.32} {'loss': 0.5798, 'learning_rate': 5.197731526503399e-06, 'epoch': 1.32} {'loss': 0.5326, 'learning_rate': 5.197444394536291e-06, 'epoch': 1.32} {'loss': 0.6323, 'learning_rate': 5.197157267715549e-06, 'epoch': 1.32} {'loss': 0.5567, 'learning_rate': 5.196870146041489e-06, 'epoch': 1.32} {'loss': 0.6558, 'learning_rate': 5.196583029514415e-06, 'epoch': 1.32} {'loss': 0.5782, 'learning_rate': 5.196295918134636e-06, 'epoch': 1.32} {'loss': 0.5295, 'learning_rate': 5.196008811902463e-06, 'epoch': 1.32} {'loss': 0.6192, 'learning_rate': 5.195721710818197e-06, 'epoch': 1.32} {'loss': 0.5508, 'learning_rate': 5.195434614882149e-06, 'epoch': 1.32} {'loss': 0.3841, 'learning_rate': 5.195147524094626e-06, 'epoch': 1.32} {'loss': 0.7052, 'learning_rate': 5.194860438455936e-06, 'epoch': 1.32} {'loss': 0.455, 'learning_rate': 5.194573357966386e-06, 'epoch': 1.32} {'loss': 0.5976, 'learning_rate': 5.194286282626284e-06, 'epoch': 1.32} {'loss': 0.6301, 'learning_rate': 5.193999212435944e-06, 'epoch': 1.32} {'loss': 0.5509, 'learning_rate': 5.193712147395662e-06, 'epoch': 1.32} {'loss': 0.5183, 'learning_rate': 5.1934250875057525e-06, 'epoch': 1.32} {'loss': 0.5327, 'learning_rate': 5.19313803276652e-06, 'epoch': 1.32} {'loss': 0.5363, 'learning_rate': 5.192850983178277e-06, 'epoch': 1.32} {'loss': 0.4631, 'learning_rate': 5.192563938741325e-06, 'epoch': 1.32} {'loss': 0.5992, 'learning_rate': 5.192276899455977e-06, 'epoch': 1.32} {'loss': 0.5456, 'learning_rate': 5.1919898653225395e-06, 'epoch': 1.32} {'loss': 0.6161, 'learning_rate': 5.1917028363413165e-06, 'epoch': 1.32} {'loss': 0.4881, 'learning_rate': 5.191415812512619e-06, 'epoch': 1.32} {'loss': 0.569, 'learning_rate': 5.1911287938367515e-06, 'epoch': 1.32} {'loss': 0.5157, 'learning_rate': 5.190841780314025e-06, 'epoch': 1.32} {'loss': 0.6481, 'learning_rate': 5.190554771944748e-06, 'epoch': 1.32} {'loss': 0.5998, 'learning_rate': 5.190267768729218e-06, 'epoch': 1.32} {'loss': 0.4601, 'learning_rate': 5.18998077066776e-06, 'epoch': 1.32} {'loss': 0.4852, 'learning_rate': 5.189693777760665e-06, 'epoch': 1.32} {'loss': 0.565, 'learning_rate': 5.189406790008249e-06, 'epoch': 1.32} {'loss': 0.5532, 'learning_rate': 5.189119807410818e-06, 'epoch': 1.32} {'loss': 0.5321, 'learning_rate': 5.1888328299686785e-06, 'epoch': 1.32} {'loss': 0.5558, 'learning_rate': 5.188545857682144e-06, 'epoch': 1.32} {'loss': 0.6291, 'learning_rate': 5.188258890551507e-06, 'epoch': 1.32} {'loss': 0.574, 'learning_rate': 5.187971928577094e-06, 'epoch': 1.32} {'loss': 0.5282, 'learning_rate': 5.187684971759199e-06, 'epoch': 1.32} {'loss': 0.5082, 'learning_rate': 5.187398020098134e-06, 'epoch': 1.32} {'loss': 0.3245, 'learning_rate': 5.187111073594207e-06, 'epoch': 1.32} {'loss': 0.5717, 'learning_rate': 5.186824132247726e-06, 'epoch': 1.32} {'loss': 0.5254, 'learning_rate': 5.1865371960589984e-06, 'epoch': 1.32} {'loss': 0.6526, 'learning_rate': 5.186250265028324e-06, 'epoch': 1.32} {'loss': 0.485, 'learning_rate': 5.185963339156025e-06, 'epoch': 1.32} {'loss': 0.5319, 'learning_rate': 5.185676418442397e-06, 'epoch': 1.32} {'loss': 0.5662, 'learning_rate': 5.18538950288775e-06, 'epoch': 1.32} {'loss': 0.4752, 'learning_rate': 5.185102592492398e-06, 'epoch': 1.32} {'loss': 0.3344, 'learning_rate': 5.184815687256635e-06, 'epoch': 1.32} {'loss': 0.4536, 'learning_rate': 5.184528787180784e-06, 'epoch': 1.32} {'loss': 0.5481, 'learning_rate': 5.1842418922651384e-06, 'epoch': 1.32} {'loss': 0.6857, 'learning_rate': 5.18395500251002e-06, 'epoch': 1.32} {'loss': 0.5785, 'learning_rate': 5.183668117915723e-06, 'epoch': 1.32} {'loss': 0.4246, 'learning_rate': 5.183381238482561e-06, 'epoch': 1.32} {'loss': 0.5697, 'learning_rate': 5.183094364210844e-06, 'epoch': 1.32} {'loss': 0.4773, 'learning_rate': 5.18280749510087e-06, 'epoch': 1.32} {'loss': 0.4789, 'learning_rate': 5.182520631152959e-06, 'epoch': 1.32} {'loss': 0.517, 'learning_rate': 5.182233772367404e-06, 'epoch': 1.32} {'loss': 0.3197, 'learning_rate': 5.181946918744529e-06, 'epoch': 1.32} {'loss': 0.5733, 'learning_rate': 5.1816600702846286e-06, 'epoch': 1.32} {'loss': 0.6631, 'learning_rate': 5.181373226988015e-06, 'epoch': 1.32} {'loss': 0.5349, 'learning_rate': 5.181086388854998e-06, 'epoch': 1.32} {'loss': 0.4383, 'learning_rate': 5.180799555885873e-06, 'epoch': 1.32} {'loss': 0.5871, 'learning_rate': 5.180512728080966e-06, 'epoch': 1.32} {'loss': 0.401, 'learning_rate': 5.180225905440566e-06, 'epoch': 1.32} {'loss': 0.4659, 'learning_rate': 5.179939087964996e-06, 'epoch': 1.32} {'loss': 0.4668, 'learning_rate': 5.179652275654554e-06, 'epoch': 1.32} {'loss': 0.5125, 'learning_rate': 5.179365468509548e-06, 'epoch': 1.32} {'loss': 0.4452, 'learning_rate': 5.179078666530293e-06, 'epoch': 1.32} {'loss': 0.5172, 'learning_rate': 5.178791869717081e-06, 'epoch': 1.32} {'loss': 0.5464, 'learning_rate': 5.1785050780702364e-06, 'epoch': 1.32} {'loss': 0.4452, 'learning_rate': 5.178218291590051e-06, 'epoch': 1.32} {'loss': 0.4097, 'learning_rate': 5.177931510276848e-06, 'epoch': 1.32} {'loss': 0.4734, 'learning_rate': 5.1776447341309225e-06, 'epoch': 1.32} {'loss': 0.6596, 'learning_rate': 5.177357963152585e-06, 'epoch': 1.32} {'loss': 0.5722, 'learning_rate': 5.177071197342149e-06, 'epoch': 1.32} {'loss': 0.423, 'learning_rate': 5.176784436699908e-06, 'epoch': 1.32} {'loss': 0.4451, 'learning_rate': 5.176497681226187e-06, 'epoch': 1.32} {'loss': 0.5319, 'learning_rate': 5.17621093092128e-06, 'epoch': 1.32} {'loss': 0.5315, 'learning_rate': 5.175924185785497e-06, 'epoch': 1.32} {'loss': 0.578, 'learning_rate': 5.175637445819146e-06, 'epoch': 1.32} {'loss': 0.7449, 'learning_rate': 5.175350711022536e-06, 'epoch': 1.32} {'loss': 0.5795, 'learning_rate': 5.175063981395978e-06, 'epoch': 1.32} {'loss': 0.5238, 'learning_rate': 5.174777256939765e-06, 'epoch': 1.32} {'loss': 0.5259, 'learning_rate': 5.174490537654222e-06, 'epoch': 1.32} {'loss': 0.6285, 'learning_rate': 5.174203823539645e-06, 'epoch': 1.32} {'loss': 0.5898, 'learning_rate': 5.173917114596343e-06, 'epoch': 1.32} {'loss': 0.5687, 'learning_rate': 5.1736304108246246e-06, 'epoch': 1.32} {'loss': 0.4604, 'learning_rate': 5.173343712224797e-06, 'epoch': 1.32} {'loss': 0.5091, 'learning_rate': 5.173057018797172e-06, 'epoch': 1.32} {'loss': 0.6073, 'learning_rate': 5.172770330542043e-06, 'epoch': 1.32} {'loss': 0.6326, 'learning_rate': 5.172483647459734e-06, 'epoch': 1.32} {'loss': 0.5514, 'learning_rate': 5.172196969550541e-06, 'epoch': 1.32} {'loss': 0.4421, 'learning_rate': 5.171910296814775e-06, 'epoch': 1.32} {'loss': 0.6307, 'learning_rate': 5.171623629252747e-06, 'epoch': 1.32} {'loss': 0.5431, 'learning_rate': 5.171336966864751e-06, 'epoch': 1.32} {'loss': 0.5574, 'learning_rate': 5.171050309651112e-06, 'epoch': 1.32} {'loss': 0.6025, 'learning_rate': 5.170763657612125e-06, 'epoch': 1.32} {'loss': 0.5237, 'learning_rate': 5.1704770107481e-06, 'epoch': 1.32} {'loss': 0.4893, 'learning_rate': 5.170190369059345e-06, 'epoch': 1.32} {'loss': 0.4607, 'learning_rate': 5.169903732546167e-06, 'epoch': 1.32} {'loss': 0.5566, 'learning_rate': 5.169617101208875e-06, 'epoch': 1.32} {'loss': 0.6108, 'learning_rate': 5.169330475047769e-06, 'epoch': 1.32} {'loss': 0.6334, 'learning_rate': 5.1690438540631675e-06, 'epoch': 1.32} {'loss': 0.5171, 'learning_rate': 5.168757238255368e-06, 'epoch': 1.32} {'loss': 0.6577, 'learning_rate': 5.168470627624682e-06, 'epoch': 1.32} {'loss': 0.4057, 'learning_rate': 5.168184022171416e-06, 'epoch': 1.32} {'loss': 0.7537, 'learning_rate': 5.167897421895875e-06, 'epoch': 1.32} {'loss': 0.4567, 'learning_rate': 5.167610826798375e-06, 'epoch': 1.32} {'loss': 0.5172, 'learning_rate': 5.167324236879206e-06, 'epoch': 1.32} {'loss': 0.3736, 'learning_rate': 5.167037652138694e-06, 'epoch': 1.32} {'loss': 0.3819, 'learning_rate': 5.166751072577132e-06, 'epoch': 1.32} {'loss': 0.5449, 'learning_rate': 5.166464498194834e-06, 'epoch': 1.32} {'loss': 0.522, 'learning_rate': 5.166177928992105e-06, 'epoch': 1.32} {'loss': 0.4818, 'learning_rate': 5.165891364969253e-06, 'epoch': 1.32} {'loss': 0.5627, 'learning_rate': 5.165604806126588e-06, 'epoch': 1.32} {'loss': 0.6213, 'learning_rate': 5.1653182524644104e-06, 'epoch': 1.32} {'loss': 0.4991, 'learning_rate': 5.16503170398303e-06, 'epoch': 1.32} {'loss': 0.5421, 'learning_rate': 5.164745160682756e-06, 'epoch': 1.32} {'loss': 0.5581, 'learning_rate': 5.164458622563893e-06, 'epoch': 1.32} {'loss': 0.5571, 'learning_rate': 5.164172089626749e-06, 'epoch': 1.32} {'loss': 0.609, 'learning_rate': 5.163885561871631e-06, 'epoch': 1.32} {'loss': 0.5329, 'learning_rate': 5.16359903929885e-06, 'epoch': 1.32} {'loss': 0.5556, 'learning_rate': 5.163312521908706e-06, 'epoch': 1.32} {'loss': 0.6475, 'learning_rate': 5.163026009701509e-06, 'epoch': 1.32} {'loss': 0.5281, 'learning_rate': 5.1627395026775654e-06, 'epoch': 1.32} {'loss': 0.3925, 'learning_rate': 5.162453000837182e-06, 'epoch': 1.32} {'loss': 0.5166, 'learning_rate': 5.162166504180668e-06, 'epoch': 1.32} {'loss': 0.5806, 'learning_rate': 5.161880012708329e-06, 'epoch': 1.32} {'loss': 0.5703, 'learning_rate': 5.161593526420477e-06, 'epoch': 1.32} {'loss': 0.5357, 'learning_rate': 5.1613070453174096e-06, 'epoch': 1.32} {'loss': 0.5924, 'learning_rate': 5.1610205693994385e-06, 'epoch': 1.32} {'loss': 0.5266, 'learning_rate': 5.160734098666871e-06, 'epoch': 1.32} {'loss': 0.5974, 'learning_rate': 5.160447633120014e-06, 'epoch': 1.32} {'loss': 0.4593, 'learning_rate': 5.160161172759173e-06, 'epoch': 1.32} {'loss': 0.5456, 'learning_rate': 5.159874717584661e-06, 'epoch': 1.32} {'loss': 0.501, 'learning_rate': 5.159588267596776e-06, 'epoch': 1.32} {'loss': 0.5565, 'learning_rate': 5.159301822795828e-06, 'epoch': 1.32} {'loss': 0.504, 'learning_rate': 5.159015383182127e-06, 'epoch': 1.32} {'loss': 0.5261, 'learning_rate': 5.158728948755976e-06, 'epoch': 1.32} {'loss': 0.4631, 'learning_rate': 5.158442519517685e-06, 'epoch': 1.32} {'loss': 0.499, 'learning_rate': 5.158156095467559e-06, 'epoch': 1.32} {'loss': 0.5647, 'learning_rate': 5.15786967660591e-06, 'epoch': 1.32} {'loss': 0.4879, 'learning_rate': 5.157583262933037e-06, 'epoch': 1.32} {'loss': 0.594, 'learning_rate': 5.15729685444925e-06, 'epoch': 1.32} {'loss': 0.5295, 'learning_rate': 5.157010451154858e-06, 'epoch': 1.32} {'loss': 0.5203, 'learning_rate': 5.156724053050165e-06, 'epoch': 1.32} {'loss': 0.507, 'learning_rate': 5.156437660135483e-06, 'epoch': 1.32} {'loss': 0.58, 'learning_rate': 5.156151272411108e-06, 'epoch': 1.32} {'loss': 0.6002, 'learning_rate': 5.155864889877362e-06, 'epoch': 1.32} {'loss': 0.6883, 'learning_rate': 5.155578512534541e-06, 'epoch': 1.32} {'loss': 0.6379, 'learning_rate': 5.155292140382952e-06, 'epoch': 1.32} {'loss': 0.5613, 'learning_rate': 5.155005773422908e-06, 'epoch': 1.32} {'loss': 0.5719, 'learning_rate': 5.154719411654712e-06, 'epoch': 1.32} {'loss': 0.4633, 'learning_rate': 5.1544330550786736e-06, 'epoch': 1.32} {'loss': 0.4637, 'learning_rate': 5.154146703695091e-06, 'epoch': 1.32} {'loss': 0.5644, 'learning_rate': 5.1538603575042844e-06, 'epoch': 1.32} {'loss': 0.4422, 'learning_rate': 5.153574016506551e-06, 'epoch': 1.32} {'loss': 0.5519, 'learning_rate': 5.153287680702199e-06, 'epoch': 1.32} {'loss': 0.6006, 'learning_rate': 5.153001350091538e-06, 'epoch': 1.32} {'loss': 0.6243, 'learning_rate': 5.152715024674874e-06, 'epoch': 1.32} {'loss': 0.4798, 'learning_rate': 5.152428704452517e-06, 'epoch': 1.32} {'loss': 0.5605, 'learning_rate': 5.152142389424761e-06, 'epoch': 1.32} {'loss': 0.5178, 'learning_rate': 5.1518560795919305e-06, 'epoch': 1.32} {'loss': 0.3933, 'learning_rate': 5.15156977495432e-06, 'epoch': 1.32} {'loss': 0.6155, 'learning_rate': 5.15128347551224e-06, 'epoch': 1.32} {'loss': 0.5702, 'learning_rate': 5.150997181266002e-06, 'epoch': 1.32} {'loss': 0.5638, 'learning_rate': 5.1507108922159e-06, 'epoch': 1.32} {'loss': 0.5055, 'learning_rate': 5.150424608362256e-06, 'epoch': 1.32} {'loss': 0.4394, 'learning_rate': 5.1501383297053655e-06, 'epoch': 1.32} {'loss': 0.5955, 'learning_rate': 5.1498520562455415e-06, 'epoch': 1.32} {'loss': 0.5498, 'learning_rate': 5.149565787983086e-06, 'epoch': 1.32} {'loss': 0.5709, 'learning_rate': 5.1492795249183114e-06, 'epoch': 1.32} {'loss': 0.5904, 'learning_rate': 5.148993267051523e-06, 'epoch': 1.32} {'loss': 0.4143, 'learning_rate': 5.148707014383021e-06, 'epoch': 1.32} {'loss': 0.6065, 'learning_rate': 5.1484207669131225e-06, 'epoch': 1.32} {'loss': 0.4656, 'learning_rate': 5.1481345246421265e-06, 'epoch': 1.32} {'loss': 0.4452, 'learning_rate': 5.1478482875703424e-06, 'epoch': 1.32} {'loss': 0.6026, 'learning_rate': 5.147562055698077e-06, 'epoch': 1.32} {'loss': 0.5283, 'learning_rate': 5.147275829025636e-06, 'epoch': 1.32} {'loss': 0.5377, 'learning_rate': 5.146989607553331e-06, 'epoch': 1.32} {'loss': 0.5822, 'learning_rate': 5.146703391281457e-06, 'epoch': 1.32} {'loss': 0.5846, 'learning_rate': 5.146417180210336e-06, 'epoch': 1.32} {'loss': 0.4655, 'learning_rate': 5.146130974340263e-06, 'epoch': 1.32} {'loss': 0.4892, 'learning_rate': 5.1458447736715485e-06, 'epoch': 1.32} {'loss': 0.6231, 'learning_rate': 5.145558578204504e-06, 'epoch': 1.32} {'loss': 0.602, 'learning_rate': 5.145272387939424e-06, 'epoch': 1.32} {'loss': 0.5606, 'learning_rate': 5.1449862028766296e-06, 'epoch': 1.32} {'loss': 0.592, 'learning_rate': 5.1447000230164145e-06, 'epoch': 1.32} {'loss': 0.5515, 'learning_rate': 5.144413848359098e-06, 'epoch': 1.32} {'loss': 0.5464, 'learning_rate': 5.144127678904978e-06, 'epoch': 1.32} {'loss': 0.4872, 'learning_rate': 5.143841514654362e-06, 'epoch': 1.32} {'loss': 0.6165, 'learning_rate': 5.143555355607562e-06, 'epoch': 1.32} {'loss': 0.5387, 'learning_rate': 5.143269201764873e-06, 'epoch': 1.32} {'loss': 0.5443, 'learning_rate': 5.142983053126618e-06, 'epoch': 1.32} {'loss': 0.5443, 'learning_rate': 5.142696909693086e-06, 'epoch': 1.33} {'loss': 0.453, 'learning_rate': 5.142410771464601e-06, 'epoch': 1.33} {'loss': 0.4926, 'learning_rate': 5.142124638441457e-06, 'epoch': 1.33} {'loss': 0.4979, 'learning_rate': 5.141838510623967e-06, 'epoch': 1.33} {'loss': 0.4261, 'learning_rate': 5.141552388012437e-06, 'epoch': 1.33} {'loss': 0.5349, 'learning_rate': 5.141266270607165e-06, 'epoch': 1.33} {'loss': 0.5511, 'learning_rate': 5.140980158408473e-06, 'epoch': 1.33} {'loss': 0.598, 'learning_rate': 5.140694051416651e-06, 'epoch': 1.33} {'loss': 0.67, 'learning_rate': 5.140407949632021e-06, 'epoch': 1.33} {'loss': 0.4441, 'learning_rate': 5.14012185305488e-06, 'epoch': 1.33} {'loss': 0.504, 'learning_rate': 5.139835761685537e-06, 'epoch': 1.33} {'loss': 0.4392, 'learning_rate': 5.139549675524301e-06, 'epoch': 1.33} {'loss': 0.5765, 'learning_rate': 5.139263594571471e-06, 'epoch': 1.33} {'loss': 0.5267, 'learning_rate': 5.138977518827364e-06, 'epoch': 1.33} {'loss': 0.4597, 'learning_rate': 5.1386914482922746e-06, 'epoch': 1.33} {'loss': 0.4572, 'learning_rate': 5.138405382966524e-06, 'epoch': 1.33} {'loss': 0.5869, 'learning_rate': 5.138119322850407e-06, 'epoch': 1.33} {'loss': 0.5298, 'learning_rate': 5.137833267944233e-06, 'epoch': 1.33} {'loss': 0.6382, 'learning_rate': 5.137547218248314e-06, 'epoch': 1.33} {'loss': 0.5198, 'learning_rate': 5.137261173762944e-06, 'epoch': 1.33} {'loss': 0.5006, 'learning_rate': 5.1369751344884465e-06, 'epoch': 1.33} {'loss': 0.6468, 'learning_rate': 5.13668910042511e-06, 'epoch': 1.33} {'loss': 0.5102, 'learning_rate': 5.1364030715732595e-06, 'epoch': 1.33} {'loss': 0.6236, 'learning_rate': 5.136117047933187e-06, 'epoch': 1.33} {'loss': 0.5543, 'learning_rate': 5.1358310295052025e-06, 'epoch': 1.33} {'loss': 0.6469, 'learning_rate': 5.13554501628962e-06, 'epoch': 1.33} {'loss': 0.5076, 'learning_rate': 5.135259008286733e-06, 'epoch': 1.33} {'loss': 0.632, 'learning_rate': 5.13497300549686e-06, 'epoch': 1.33} {'loss': 0.5118, 'learning_rate': 5.134687007920301e-06, 'epoch': 1.33} {'loss': 0.543, 'learning_rate': 5.134401015557363e-06, 'epoch': 1.33} {'loss': 0.5078, 'learning_rate': 5.134115028408353e-06, 'epoch': 1.33} {'loss': 0.5119, 'learning_rate': 5.13382904647358e-06, 'epoch': 1.33} {'loss': 0.6194, 'learning_rate': 5.133543069753351e-06, 'epoch': 1.33} {'loss': 0.5981, 'learning_rate': 5.133257098247961e-06, 'epoch': 1.33} {'loss': 0.4801, 'learning_rate': 5.132971131957734e-06, 'epoch': 1.33} {'loss': 0.4765, 'learning_rate': 5.132685170882964e-06, 'epoch': 1.33} {'loss': 0.5071, 'learning_rate': 5.13239921502396e-06, 'epoch': 1.33} {'loss': 0.7285, 'learning_rate': 5.132113264381031e-06, 'epoch': 1.33} {'loss': 0.4331, 'learning_rate': 5.131827318954481e-06, 'epoch': 1.33} {'loss': 0.5166, 'learning_rate': 5.131541378744622e-06, 'epoch': 1.33} {'loss': 0.4818, 'learning_rate': 5.1312554437517525e-06, 'epoch': 1.33} {'loss': 0.6239, 'learning_rate': 5.13096951397618e-06, 'epoch': 1.33} {'loss': 0.6752, 'learning_rate': 5.130683589418215e-06, 'epoch': 1.33} {'loss': 0.6251, 'learning_rate': 5.130397670078162e-06, 'epoch': 1.33} {'loss': 0.4551, 'learning_rate': 5.130111755956327e-06, 'epoch': 1.33} {'loss': 0.5925, 'learning_rate': 5.129825847053017e-06, 'epoch': 1.33} {'loss': 0.4978, 'learning_rate': 5.129539943368542e-06, 'epoch': 1.33} {'loss': 0.5854, 'learning_rate': 5.1292540449032005e-06, 'epoch': 1.33} {'loss': 0.5577, 'learning_rate': 5.128968151657303e-06, 'epoch': 1.33} {'loss': 0.577, 'learning_rate': 5.128682263631155e-06, 'epoch': 1.33} {'loss': 0.4117, 'learning_rate': 5.128396380825065e-06, 'epoch': 1.33} {'loss': 0.5563, 'learning_rate': 5.1281105032393365e-06, 'epoch': 1.33} {'loss': 0.5118, 'learning_rate': 5.127824630874279e-06, 'epoch': 1.33} {'loss': 0.5439, 'learning_rate': 5.1275387637302e-06, 'epoch': 1.33} {'loss': 0.5131, 'learning_rate': 5.127252901807398e-06, 'epoch': 1.33} {'loss': 0.4228, 'learning_rate': 5.126967045106186e-06, 'epoch': 1.33} {'loss': 0.6165, 'learning_rate': 5.126681193626868e-06, 'epoch': 1.33} {'loss': 0.4892, 'learning_rate': 5.126395347369752e-06, 'epoch': 1.33} {'loss': 0.4658, 'learning_rate': 5.126109506335145e-06, 'epoch': 1.33} {'loss': 0.4799, 'learning_rate': 5.125823670523348e-06, 'epoch': 1.33} {'loss': 0.5078, 'learning_rate': 5.125537839934673e-06, 'epoch': 1.33} {'loss': 0.6501, 'learning_rate': 5.125252014569423e-06, 'epoch': 1.33} {'loss': 0.4593, 'learning_rate': 5.124966194427905e-06, 'epoch': 1.33} {'loss': 0.5778, 'learning_rate': 5.124680379510426e-06, 'epoch': 1.33} {'loss': 0.4989, 'learning_rate': 5.1243945698172925e-06, 'epoch': 1.33} {'loss': 0.6774, 'learning_rate': 5.124108765348814e-06, 'epoch': 1.33} {'loss': 0.4981, 'learning_rate': 5.123822966105288e-06, 'epoch': 1.33} {'loss': 0.3877, 'learning_rate': 5.1235371720870275e-06, 'epoch': 1.33} {'loss': 0.4971, 'learning_rate': 5.1232513832943356e-06, 'epoch': 1.33} {'loss': 0.5968, 'learning_rate': 5.122965599727521e-06, 'epoch': 1.33} {'loss': 0.6336, 'learning_rate': 5.122679821386889e-06, 'epoch': 1.33} {'loss': 0.4733, 'learning_rate': 5.1223940482727445e-06, 'epoch': 1.33} {'loss': 0.4338, 'learning_rate': 5.122108280385399e-06, 'epoch': 1.33} {'loss': 0.453, 'learning_rate': 5.121822517725153e-06, 'epoch': 1.33} {'loss': 0.6813, 'learning_rate': 5.1215367602923114e-06, 'epoch': 1.33} {'loss': 0.5069, 'learning_rate': 5.121251008087186e-06, 'epoch': 1.33} {'loss': 0.5241, 'learning_rate': 5.120965261110079e-06, 'epoch': 1.33} {'loss': 0.5014, 'learning_rate': 5.120679519361299e-06, 'epoch': 1.33} {'loss': 0.6032, 'learning_rate': 5.120393782841155e-06, 'epoch': 1.33} {'loss': 0.4655, 'learning_rate': 5.1201080515499454e-06, 'epoch': 1.33} {'loss': 0.6178, 'learning_rate': 5.11982232548798e-06, 'epoch': 1.33} {'loss': 0.3666, 'learning_rate': 5.119536604655566e-06, 'epoch': 1.33} {'loss': 0.6096, 'learning_rate': 5.119250889053009e-06, 'epoch': 1.33} {'loss': 0.6086, 'learning_rate': 5.118965178680615e-06, 'epoch': 1.33} {'loss': 0.6087, 'learning_rate': 5.11867947353869e-06, 'epoch': 1.33} {'loss': 0.5074, 'learning_rate': 5.118393773627546e-06, 'epoch': 1.33} {'loss': 0.6599, 'learning_rate': 5.1181080789474775e-06, 'epoch': 1.33} {'loss': 0.5236, 'learning_rate': 5.117822389498799e-06, 'epoch': 1.33} {'loss': 0.5331, 'learning_rate': 5.117536705281812e-06, 'epoch': 1.33} {'loss': 0.5082, 'learning_rate': 5.117251026296828e-06, 'epoch': 1.33} {'loss': 0.3456, 'learning_rate': 5.1169653525441475e-06, 'epoch': 1.33} {'loss': 0.5156, 'learning_rate': 5.11667968402408e-06, 'epoch': 1.33} {'loss': 0.5553, 'learning_rate': 5.116394020736937e-06, 'epoch': 1.33} {'loss': 0.525, 'learning_rate': 5.116108362683012e-06, 'epoch': 1.33} {'loss': 0.4276, 'learning_rate': 5.115822709862619e-06, 'epoch': 1.33} {'loss': 0.4954, 'learning_rate': 5.115537062276063e-06, 'epoch': 1.33} {'loss': 0.6276, 'learning_rate': 5.115251419923649e-06, 'epoch': 1.33} {'loss': 0.5249, 'learning_rate': 5.114965782805688e-06, 'epoch': 1.33} {'loss': 0.605, 'learning_rate': 5.114680150922475e-06, 'epoch': 1.33} {'loss': 0.6164, 'learning_rate': 5.114394524274331e-06, 'epoch': 1.33} {'loss': 0.6083, 'learning_rate': 5.11410890286155e-06, 'epoch': 1.33} {'loss': 0.5316, 'learning_rate': 5.113823286684442e-06, 'epoch': 1.33} {'loss': 0.6678, 'learning_rate': 5.113537675743313e-06, 'epoch': 1.33} {'loss': 0.3772, 'learning_rate': 5.11325207003847e-06, 'epoch': 1.33} {'loss': 0.358, 'learning_rate': 5.112966469570222e-06, 'epoch': 1.33} {'loss': 0.4255, 'learning_rate': 5.112680874338865e-06, 'epoch': 1.33} {'loss': 0.4313, 'learning_rate': 5.112395284344718e-06, 'epoch': 1.33} {'loss': 0.6737, 'learning_rate': 5.112109699588077e-06, 'epoch': 1.33} {'loss': 0.5933, 'learning_rate': 5.111824120069251e-06, 'epoch': 1.33} {'loss': 0.6081, 'learning_rate': 5.111538545788548e-06, 'epoch': 1.33} {'loss': 0.6054, 'learning_rate': 5.111252976746272e-06, 'epoch': 1.33} {'loss': 0.4582, 'learning_rate': 5.110967412942733e-06, 'epoch': 1.33} {'loss': 0.5471, 'learning_rate': 5.110681854378227e-06, 'epoch': 1.33} {'loss': 0.5931, 'learning_rate': 5.110396301053074e-06, 'epoch': 1.33} {'loss': 0.4519, 'learning_rate': 5.110110752967568e-06, 'epoch': 1.33} {'loss': 0.4714, 'learning_rate': 5.1098252101220205e-06, 'epoch': 1.33} {'loss': 0.5604, 'learning_rate': 5.10953967251674e-06, 'epoch': 1.33} {'loss': 0.5638, 'learning_rate': 5.1092541401520225e-06, 'epoch': 1.33} {'loss': 0.5626, 'learning_rate': 5.108968613028187e-06, 'epoch': 1.33} {'loss': 0.4967, 'learning_rate': 5.108683091145525e-06, 'epoch': 1.33} {'loss': 0.4945, 'learning_rate': 5.10839757450436e-06, 'epoch': 1.33} {'loss': 0.5862, 'learning_rate': 5.108112063104984e-06, 'epoch': 1.33} {'loss': 0.5318, 'learning_rate': 5.107826556947707e-06, 'epoch': 1.33} {'loss': 0.5616, 'learning_rate': 5.10754105603284e-06, 'epoch': 1.33} {'loss': 0.4338, 'learning_rate': 5.107255560360676e-06, 'epoch': 1.33} {'loss': 0.4048, 'learning_rate': 5.1069700699315365e-06, 'epoch': 1.33} {'loss': 0.5957, 'learning_rate': 5.106684584745718e-06, 'epoch': 1.33} {'loss': 0.5669, 'learning_rate': 5.106399104803527e-06, 'epoch': 1.33} {'loss': 0.6534, 'learning_rate': 5.106113630105272e-06, 'epoch': 1.33} {'loss': 0.4944, 'learning_rate': 5.105828160651257e-06, 'epoch': 1.33} {'loss': 0.473, 'learning_rate': 5.105542696441793e-06, 'epoch': 1.33} {'loss': 0.5473, 'learning_rate': 5.105257237477175e-06, 'epoch': 1.33} {'loss': 0.4837, 'learning_rate': 5.104971783757722e-06, 'epoch': 1.33} {'loss': 0.6046, 'learning_rate': 5.10468633528373e-06, 'epoch': 1.33} {'loss': 0.5089, 'learning_rate': 5.1044008920555095e-06, 'epoch': 1.33} {'loss': 0.5053, 'learning_rate': 5.1041154540733636e-06, 'epoch': 1.33} {'loss': 0.615, 'learning_rate': 5.103830021337602e-06, 'epoch': 1.33} {'loss': 0.5118, 'learning_rate': 5.10354459384853e-06, 'epoch': 1.33} {'loss': 0.5535, 'learning_rate': 5.103259171606446e-06, 'epoch': 1.33} {'loss': 0.6161, 'learning_rate': 5.102973754611668e-06, 'epoch': 1.33} {'loss': 0.411, 'learning_rate': 5.1026883428644926e-06, 'epoch': 1.33} {'loss': 0.535, 'learning_rate': 5.10240293636523e-06, 'epoch': 1.33} {'loss': 0.5181, 'learning_rate': 5.102117535114186e-06, 'epoch': 1.33} {'loss': 0.5191, 'learning_rate': 5.101832139111659e-06, 'epoch': 1.33} {'loss': 0.4106, 'learning_rate': 5.101546748357969e-06, 'epoch': 1.33} {'loss': 0.5419, 'learning_rate': 5.101261362853404e-06, 'epoch': 1.33} {'loss': 0.5807, 'learning_rate': 5.1009759825982885e-06, 'epoch': 1.33} {'loss': 0.4927, 'learning_rate': 5.100690607592915e-06, 'epoch': 1.33} {'loss': 0.4989, 'learning_rate': 5.100405237837596e-06, 'epoch': 1.33} {'loss': 0.6979, 'learning_rate': 5.100119873332636e-06, 'epoch': 1.33} {'loss': 0.591, 'learning_rate': 5.099834514078333e-06, 'epoch': 1.33} {'loss': 0.4397, 'learning_rate': 5.099549160075008e-06, 'epoch': 1.33} {'loss': 0.6188, 'learning_rate': 5.09926381132295e-06, 'epoch': 1.33} {'loss': 0.5637, 'learning_rate': 5.098978467822482e-06, 'epoch': 1.33} {'loss': 0.6028, 'learning_rate': 5.098693129573895e-06, 'epoch': 1.33} {'loss': 0.5859, 'learning_rate': 5.098407796577503e-06, 'epoch': 1.33} {'loss': 0.6044, 'learning_rate': 5.098122468833612e-06, 'epoch': 1.33} {'loss': 0.5983, 'learning_rate': 5.097837146342517e-06, 'epoch': 1.33} {'loss': 0.583, 'learning_rate': 5.09755182910454e-06, 'epoch': 1.33} {'loss': 0.4942, 'learning_rate': 5.097266517119972e-06, 'epoch': 1.33} {'loss': 0.3061, 'learning_rate': 5.096981210389131e-06, 'epoch': 1.33} {'loss': 0.4589, 'learning_rate': 5.0966959089123144e-06, 'epoch': 1.33} {'loss': 0.4779, 'learning_rate': 5.096410612689833e-06, 'epoch': 1.33} {'loss': 0.4582, 'learning_rate': 5.096125321721991e-06, 'epoch': 1.33} {'loss': 0.6, 'learning_rate': 5.0958400360090865e-06, 'epoch': 1.33} {'loss': 0.5475, 'learning_rate': 5.09555475555144e-06, 'epoch': 1.33} {'loss': 0.4751, 'learning_rate': 5.095269480349346e-06, 'epoch': 1.33} {'loss': 0.5376, 'learning_rate': 5.094984210403111e-06, 'epoch': 1.33} {'loss': 0.5473, 'learning_rate': 5.0946989457130455e-06, 'epoch': 1.33} {'loss': 0.5, 'learning_rate': 5.094413686279452e-06, 'epoch': 1.33} {'loss': 0.5009, 'learning_rate': 5.094128432102641e-06, 'epoch': 1.33} {'loss': 0.6241, 'learning_rate': 5.093843183182907e-06, 'epoch': 1.33} {'loss': 0.5498, 'learning_rate': 5.09355793952057e-06, 'epoch': 1.33} {'loss': 0.61, 'learning_rate': 5.093272701115923e-06, 'epoch': 1.33} {'loss': 0.3376, 'learning_rate': 5.092987467969279e-06, 'epoch': 1.33} {'loss': 0.5179, 'learning_rate': 5.0927022400809425e-06, 'epoch': 1.33} {'loss': 0.5902, 'learning_rate': 5.092417017451217e-06, 'epoch': 1.33} {'loss': 0.6466, 'learning_rate': 5.092131800080414e-06, 'epoch': 1.33} {'loss': 0.539, 'learning_rate': 5.091846587968828e-06, 'epoch': 1.33} {'loss': 0.4405, 'learning_rate': 5.091561381116777e-06, 'epoch': 1.33} {'loss': 0.6334, 'learning_rate': 5.091276179524558e-06, 'epoch': 1.33} {'loss': 0.5213, 'learning_rate': 5.090990983192481e-06, 'epoch': 1.33} {'loss': 0.6191, 'learning_rate': 5.090705792120849e-06, 'epoch': 1.33} {'loss': 0.6218, 'learning_rate': 5.090420606309969e-06, 'epoch': 1.33} {'loss': 0.6204, 'learning_rate': 5.09013542576015e-06, 'epoch': 1.33} {'loss': 0.4676, 'learning_rate': 5.0898502504716905e-06, 'epoch': 1.33} {'loss': 0.5047, 'learning_rate': 5.089565080444899e-06, 'epoch': 1.33} {'loss': 0.3408, 'learning_rate': 5.089279915680083e-06, 'epoch': 1.33} {'loss': 0.6487, 'learning_rate': 5.088994756177546e-06, 'epoch': 1.33} {'loss': 0.5358, 'learning_rate': 5.088709601937594e-06, 'epoch': 1.33} {'loss': 0.5745, 'learning_rate': 5.088424452960533e-06, 'epoch': 1.33} {'loss': 0.5737, 'learning_rate': 5.088139309246673e-06, 'epoch': 1.33} {'loss': 0.387, 'learning_rate': 5.0878541707963105e-06, 'epoch': 1.33} {'loss': 0.617, 'learning_rate': 5.087569037609757e-06, 'epoch': 1.33} {'loss': 0.6131, 'learning_rate': 5.087283909687315e-06, 'epoch': 1.33} {'loss': 0.5386, 'learning_rate': 5.086998787029292e-06, 'epoch': 1.33} {'loss': 0.5029, 'learning_rate': 5.086713669635994e-06, 'epoch': 1.33} {'loss': 0.421, 'learning_rate': 5.086428557507725e-06, 'epoch': 1.33} {'loss': 0.5044, 'learning_rate': 5.086143450644795e-06, 'epoch': 1.33} {'loss': 0.5986, 'learning_rate': 5.085858349047502e-06, 'epoch': 1.33} {'loss': 0.4556, 'learning_rate': 5.085573252716156e-06, 'epoch': 1.33} {'loss': 0.5242, 'learning_rate': 5.085288161651061e-06, 'epoch': 1.33} {'loss': 0.509, 'learning_rate': 5.085003075852524e-06, 'epoch': 1.33} {'loss': 0.4751, 'learning_rate': 5.084717995320849e-06, 'epoch': 1.33} {'loss': 0.6731, 'learning_rate': 5.084432920056348e-06, 'epoch': 1.33} {'loss': 0.5785, 'learning_rate': 5.084147850059316e-06, 'epoch': 1.33} {'loss': 0.4749, 'learning_rate': 5.083862785330062e-06, 'epoch': 1.33} {'loss': 0.4594, 'learning_rate': 5.0835777258688935e-06, 'epoch': 1.33} {'loss': 0.523, 'learning_rate': 5.083292671676116e-06, 'epoch': 1.33} {'loss': 0.6952, 'learning_rate': 5.083007622752034e-06, 'epoch': 1.33} {'loss': 0.6493, 'learning_rate': 5.082722579096956e-06, 'epoch': 1.33} {'loss': 0.4449, 'learning_rate': 5.082437540711182e-06, 'epoch': 1.33} {'loss': 0.5717, 'learning_rate': 5.082152507595019e-06, 'epoch': 1.33} {'loss': 0.54, 'learning_rate': 5.081867479748774e-06, 'epoch': 1.33} {'loss': 0.4539, 'learning_rate': 5.0815824571727515e-06, 'epoch': 1.33} {'loss': 0.5678, 'learning_rate': 5.081297439867256e-06, 'epoch': 1.33} {'loss': 0.515, 'learning_rate': 5.0810124278325966e-06, 'epoch': 1.33} {'loss': 0.6944, 'learning_rate': 5.080727421069078e-06, 'epoch': 1.33} {'loss': 0.7111, 'learning_rate': 5.080442419577002e-06, 'epoch': 1.33} {'loss': 0.6084, 'learning_rate': 5.080157423356675e-06, 'epoch': 1.33} {'loss': 0.5265, 'learning_rate': 5.079872432408404e-06, 'epoch': 1.33} {'loss': 0.709, 'learning_rate': 5.079587446732494e-06, 'epoch': 1.33} {'loss': 0.6195, 'learning_rate': 5.0793024663292485e-06, 'epoch': 1.33} {'loss': 0.6211, 'learning_rate': 5.07901749119898e-06, 'epoch': 1.33} {'loss': 0.4793, 'learning_rate': 5.078732521341984e-06, 'epoch': 1.33} {'loss': 0.6351, 'learning_rate': 5.07844755675857e-06, 'epoch': 1.33} {'loss': 0.4097, 'learning_rate': 5.078162597449045e-06, 'epoch': 1.33} {'loss': 0.7392, 'learning_rate': 5.077877643413711e-06, 'epoch': 1.33} {'loss': 0.4913, 'learning_rate': 5.077592694652876e-06, 'epoch': 1.33} {'loss': 0.5189, 'learning_rate': 5.0773077511668455e-06, 'epoch': 1.33} {'loss': 0.6497, 'learning_rate': 5.0770228129559275e-06, 'epoch': 1.33} {'loss': 0.5334, 'learning_rate': 5.07673788002042e-06, 'epoch': 1.33} {'loss': 0.5323, 'learning_rate': 5.076452952360631e-06, 'epoch': 1.33} {'loss': 0.5972, 'learning_rate': 5.076168029976869e-06, 'epoch': 1.33} {'loss': 0.4789, 'learning_rate': 5.075883112869437e-06, 'epoch': 1.33} {'loss': 0.6046, 'learning_rate': 5.075598201038643e-06, 'epoch': 1.33} {'loss': 0.713, 'learning_rate': 5.075313294484784e-06, 'epoch': 1.33} {'loss': 0.4393, 'learning_rate': 5.0750283932081775e-06, 'epoch': 1.33} {'loss': 0.4843, 'learning_rate': 5.07474349720912e-06, 'epoch': 1.33} {'loss': 0.5586, 'learning_rate': 5.07445860648792e-06, 'epoch': 1.33} {'loss': 0.4737, 'learning_rate': 5.0741737210448795e-06, 'epoch': 1.33} {'loss': 0.6985, 'learning_rate': 5.073888840880308e-06, 'epoch': 1.33} {'loss': 0.541, 'learning_rate': 5.073603965994513e-06, 'epoch': 1.33} {'loss': 0.3314, 'learning_rate': 5.073319096387789e-06, 'epoch': 1.33} {'loss': 0.523, 'learning_rate': 5.073034232060455e-06, 'epoch': 1.33} {'loss': 0.4031, 'learning_rate': 5.072749373012806e-06, 'epoch': 1.33} {'loss': 0.547, 'learning_rate': 5.072464519245151e-06, 'epoch': 1.33} {'loss': 0.63, 'learning_rate': 5.072179670757795e-06, 'epoch': 1.33} {'loss': 0.583, 'learning_rate': 5.071894827551043e-06, 'epoch': 1.33} {'loss': 0.5609, 'learning_rate': 5.071609989625204e-06, 'epoch': 1.33} {'loss': 0.4994, 'learning_rate': 5.071325156980572e-06, 'epoch': 1.33} {'loss': 0.536, 'learning_rate': 5.071040329617468e-06, 'epoch': 1.33} {'loss': 0.6499, 'learning_rate': 5.070755507536186e-06, 'epoch': 1.33} {'loss': 0.5295, 'learning_rate': 5.070470690737032e-06, 'epoch': 1.33} {'loss': 0.4615, 'learning_rate': 5.0701858792203195e-06, 'epoch': 1.33} {'loss': 0.5895, 'learning_rate': 5.069901072986341e-06, 'epoch': 1.33} {'loss': 0.6067, 'learning_rate': 5.069616272035414e-06, 'epoch': 1.33} {'loss': 0.5379, 'learning_rate': 5.069331476367831e-06, 'epoch': 1.33} {'loss': 0.454, 'learning_rate': 5.0690466859839125e-06, 'epoch': 1.33} {'loss': 0.4647, 'learning_rate': 5.068761900883952e-06, 'epoch': 1.33} {'loss': 0.6625, 'learning_rate': 5.0684771210682575e-06, 'epoch': 1.33} {'loss': 0.5718, 'learning_rate': 5.068192346537138e-06, 'epoch': 1.33} {'loss': 0.5028, 'learning_rate': 5.067907577290889e-06, 'epoch': 1.33} {'loss': 0.5448, 'learning_rate': 5.06762281332983e-06, 'epoch': 1.33} {'loss': 0.5164, 'learning_rate': 5.067338054654249e-06, 'epoch': 1.33} {'loss': 0.5235, 'learning_rate': 5.067053301264471e-06, 'epoch': 1.33} {'loss': 0.4676, 'learning_rate': 5.066768553160785e-06, 'epoch': 1.33} {'loss': 0.4597, 'learning_rate': 5.066483810343501e-06, 'epoch': 1.33} {'loss': 0.6375, 'learning_rate': 5.06619907281293e-06, 'epoch': 1.33} {'loss': 0.4726, 'learning_rate': 5.0659143405693645e-06, 'epoch': 1.33} {'loss': 0.6477, 'learning_rate': 5.065629613613123e-06, 'epoch': 1.33} {'loss': 0.4813, 'learning_rate': 5.065344891944499e-06, 'epoch': 1.33} {'loss': 0.4792, 'learning_rate': 5.06506017556381e-06, 'epoch': 1.33} {'loss': 0.5974, 'learning_rate': 5.064775464471352e-06, 'epoch': 1.33} {'loss': 0.6511, 'learning_rate': 5.064490758667431e-06, 'epoch': 1.33} {'loss': 0.4907, 'learning_rate': 5.064206058152357e-06, 'epoch': 1.33} {'loss': 0.477, 'learning_rate': 5.063921362926425e-06, 'epoch': 1.33} {'loss': 0.458, 'learning_rate': 5.063636672989955e-06, 'epoch': 1.33} {'loss': 0.4434, 'learning_rate': 5.063351988343235e-06, 'epoch': 1.33} {'loss': 0.5672, 'learning_rate': 5.063067308986587e-06, 'epoch': 1.33} {'loss': 0.4306, 'learning_rate': 5.062782634920305e-06, 'epoch': 1.33} {'loss': 0.4128, 'learning_rate': 5.062497966144695e-06, 'epoch': 1.33} {'loss': 0.5725, 'learning_rate': 5.06221330266007e-06, 'epoch': 1.33} {'loss': 0.5194, 'learning_rate': 5.06192864446672e-06, 'epoch': 1.33} {'loss': 0.5681, 'learning_rate': 5.0616439915649676e-06, 'epoch': 1.33} {'loss': 0.6078, 'learning_rate': 5.061359343955106e-06, 'epoch': 1.33} {'loss': 0.6795, 'learning_rate': 5.0610747016374416e-06, 'epoch': 1.33} {'loss': 0.5214, 'learning_rate': 5.060790064612283e-06, 'epoch': 1.33} {'loss': 0.5567, 'learning_rate': 5.060505432879934e-06, 'epoch': 1.33} {'loss': 0.5221, 'learning_rate': 5.060220806440701e-06, 'epoch': 1.33} {'loss': 0.626, 'learning_rate': 5.0599361852948826e-06, 'epoch': 1.33} {'loss': 0.4709, 'learning_rate': 5.059651569442794e-06, 'epoch': 1.33} {'loss': 0.5069, 'learning_rate': 5.05936695888473e-06, 'epoch': 1.33} {'loss': 0.5493, 'learning_rate': 5.059082353621003e-06, 'epoch': 1.33} {'loss': 0.5339, 'learning_rate': 5.058797753651914e-06, 'epoch': 1.33} {'loss': 0.5659, 'learning_rate': 5.058513158977768e-06, 'epoch': 1.33} {'loss': 0.4449, 'learning_rate': 5.058228569598875e-06, 'epoch': 1.33} {'loss': 0.4265, 'learning_rate': 5.05794398551553e-06, 'epoch': 1.33} {'loss': 0.3777, 'learning_rate': 5.057659406728051e-06, 'epoch': 1.33} {'loss': 0.4857, 'learning_rate': 5.057374833236732e-06, 'epoch': 1.33} {'loss': 0.552, 'learning_rate': 5.057090265041883e-06, 'epoch': 1.33} {'loss': 0.5514, 'learning_rate': 5.056805702143811e-06, 'epoch': 1.33} {'loss': 0.4184, 'learning_rate': 5.0565211445428095e-06, 'epoch': 1.33} {'loss': 0.535, 'learning_rate': 5.056236592239201e-06, 'epoch': 1.33} {'loss': 0.6639, 'learning_rate': 5.055952045233272e-06, 'epoch': 1.33} {'loss': 0.5546, 'learning_rate': 5.055667503525345e-06, 'epoch': 1.33} {'loss': 0.5297, 'learning_rate': 5.055382967115713e-06, 'epoch': 1.33} {'loss': 0.5096, 'learning_rate': 5.055098436004684e-06, 'epoch': 1.33} {'loss': 0.5878, 'learning_rate': 5.054813910192566e-06, 'epoch': 1.33} {'loss': 0.5079, 'learning_rate': 5.054529389679655e-06, 'epoch': 1.33} {'loss': 0.5076, 'learning_rate': 5.054244874466269e-06, 'epoch': 1.33} {'loss': 0.5248, 'learning_rate': 5.053960364552703e-06, 'epoch': 1.33} {'loss': 0.5101, 'learning_rate': 5.053675859939266e-06, 'epoch': 1.33} {'loss': 0.491, 'learning_rate': 5.0533913606262595e-06, 'epoch': 1.33} {'loss': 0.4618, 'learning_rate': 5.053106866613991e-06, 'epoch': 1.33} {'loss': 0.4715, 'learning_rate': 5.05282237790277e-06, 'epoch': 1.33} {'loss': 0.5435, 'learning_rate': 5.052537894492888e-06, 'epoch': 1.33} {'loss': 0.6228, 'learning_rate': 5.052253416384665e-06, 'epoch': 1.33} {'loss': 0.5654, 'learning_rate': 5.051968943578396e-06, 'epoch': 1.33} {'loss': 0.6509, 'learning_rate': 5.05168447607439e-06, 'epoch': 1.33} {'loss': 0.6347, 'learning_rate': 5.051400013872949e-06, 'epoch': 1.33} {'loss': 0.4857, 'learning_rate': 5.05111555697438e-06, 'epoch': 1.33} {'loss': 0.56, 'learning_rate': 5.05083110537899e-06, 'epoch': 1.33} {'loss': 0.5443, 'learning_rate': 5.0505466590870785e-06, 'epoch': 1.33} {'loss': 0.4811, 'learning_rate': 5.0502622180989535e-06, 'epoch': 1.33} {'loss': 0.5926, 'learning_rate': 5.049977782414919e-06, 'epoch': 1.33} {'loss': 0.5325, 'learning_rate': 5.049693352035281e-06, 'epoch': 1.33} {'loss': 0.5761, 'learning_rate': 5.049408926960342e-06, 'epoch': 1.33} {'loss': 0.489, 'learning_rate': 5.0491245071904085e-06, 'epoch': 1.33} {'loss': 0.5121, 'learning_rate': 5.048840092725789e-06, 'epoch': 1.33} {'loss': 0.4254, 'learning_rate': 5.048555683566778e-06, 'epoch': 1.33} {'loss': 0.5583, 'learning_rate': 5.04827127971369e-06, 'epoch': 1.33} {'loss': 0.4978, 'learning_rate': 5.047986881166824e-06, 'epoch': 1.33} {'loss': 0.4871, 'learning_rate': 5.047702487926488e-06, 'epoch': 1.33} {'loss': 0.7526, 'learning_rate': 5.047418099992986e-06, 'epoch': 1.33} {'loss': 0.4633, 'learning_rate': 5.047133717366621e-06, 'epoch': 1.33} {'loss': 0.6042, 'learning_rate': 5.046849340047704e-06, 'epoch': 1.33} {'loss': 0.6612, 'learning_rate': 5.046564968036532e-06, 'epoch': 1.33} {'loss': 0.5774, 'learning_rate': 5.0462806013334105e-06, 'epoch': 1.33} {'loss': 0.6562, 'learning_rate': 5.045996239938649e-06, 'epoch': 1.33} {'loss': 0.4391, 'learning_rate': 5.045711883852549e-06, 'epoch': 1.33} {'loss': 0.4625, 'learning_rate': 5.045427533075415e-06, 'epoch': 1.33} {'loss': 0.4947, 'learning_rate': 5.0451431876075575e-06, 'epoch': 1.33} {'loss': 0.6008, 'learning_rate': 5.044858847449271e-06, 'epoch': 1.33} {'loss': 0.6414, 'learning_rate': 5.044574512600866e-06, 'epoch': 1.33} {'loss': 0.6014, 'learning_rate': 5.044290183062648e-06, 'epoch': 1.33} {'loss': 0.5156, 'learning_rate': 5.044005858834918e-06, 'epoch': 1.33} {'loss': 0.4741, 'learning_rate': 5.0437215399179855e-06, 'epoch': 1.33} {'loss': 0.5628, 'learning_rate': 5.043437226312151e-06, 'epoch': 1.33} {'loss': 0.5515, 'learning_rate': 5.043152918017725e-06, 'epoch': 1.33} {'loss': 0.4072, 'learning_rate': 5.0428686150350034e-06, 'epoch': 1.33} {'loss': 0.5362, 'learning_rate': 5.042584317364297e-06, 'epoch': 1.33} {'loss': 0.4913, 'learning_rate': 5.0423000250059085e-06, 'epoch': 1.33} {'loss': 0.5704, 'learning_rate': 5.042015737960143e-06, 'epoch': 1.33} {'loss': 0.5834, 'learning_rate': 5.041731456227306e-06, 'epoch': 1.33} {'loss': 0.5408, 'learning_rate': 5.041447179807699e-06, 'epoch': 1.33} {'loss': 0.487, 'learning_rate': 5.0411629087016345e-06, 'epoch': 1.33} {'loss': 0.6409, 'learning_rate': 5.040878642909407e-06, 'epoch': 1.33} {'loss': 0.5165, 'learning_rate': 5.040594382431325e-06, 'epoch': 1.33} {'loss': 0.5567, 'learning_rate': 5.040310127267696e-06, 'epoch': 1.33} {'loss': 0.5106, 'learning_rate': 5.04002587741882e-06, 'epoch': 1.33} {'loss': 0.5403, 'learning_rate': 5.039741632885009e-06, 'epoch': 1.33} {'loss': 0.575, 'learning_rate': 5.039457393666554e-06, 'epoch': 1.33} {'loss': 0.5311, 'learning_rate': 5.039173159763777e-06, 'epoch': 1.33} {'loss': 0.6019, 'learning_rate': 5.038888931176969e-06, 'epoch': 1.33} {'loss': 0.6165, 'learning_rate': 5.038604707906439e-06, 'epoch': 1.33} {'loss': 0.5905, 'learning_rate': 5.0383204899524926e-06, 'epoch': 1.33} {'loss': 0.4429, 'learning_rate': 5.0380362773154334e-06, 'epoch': 1.33} {'loss': 0.5542, 'learning_rate': 5.0377520699955694e-06, 'epoch': 1.33} {'loss': 0.4904, 'learning_rate': 5.037467867993199e-06, 'epoch': 1.33} {'loss': 0.5069, 'learning_rate': 5.0371836713086296e-06, 'epoch': 1.33} {'loss': 0.4675, 'learning_rate': 5.036899479942165e-06, 'epoch': 1.33} {'loss': 0.4587, 'learning_rate': 5.0366152938941115e-06, 'epoch': 1.33} {'loss': 0.5552, 'learning_rate': 5.036331113164772e-06, 'epoch': 1.33} {'loss': 0.6073, 'learning_rate': 5.0360469377544515e-06, 'epoch': 1.33} {'loss': 0.4473, 'learning_rate': 5.035762767663459e-06, 'epoch': 1.33} {'loss': 0.5733, 'learning_rate': 5.035478602892091e-06, 'epoch': 1.33} {'loss': 0.5312, 'learning_rate': 5.035194443440656e-06, 'epoch': 1.33} {'loss': 0.3975, 'learning_rate': 5.034910289309458e-06, 'epoch': 1.33} {'loss': 0.4664, 'learning_rate': 5.034626140498802e-06, 'epoch': 1.33} {'loss': 0.6334, 'learning_rate': 5.0343419970089955e-06, 'epoch': 1.33} {'loss': 0.4686, 'learning_rate': 5.034057858840332e-06, 'epoch': 1.33} {'loss': 0.5003, 'learning_rate': 5.033773725993132e-06, 'epoch': 1.33} {'loss': 0.4977, 'learning_rate': 5.033489598467687e-06, 'epoch': 1.33} {'loss': 0.4644, 'learning_rate': 5.033205476264307e-06, 'epoch': 1.33} {'loss': 0.4428, 'learning_rate': 5.032921359383296e-06, 'epoch': 1.33} {'loss': 0.533, 'learning_rate': 5.032637247824957e-06, 'epoch': 1.33} {'loss': 0.5613, 'learning_rate': 5.032353141589599e-06, 'epoch': 1.33} {'loss': 0.466, 'learning_rate': 5.032069040677516e-06, 'epoch': 1.33} {'loss': 0.6117, 'learning_rate': 5.031784945089026e-06, 'epoch': 1.33} {'loss': 0.5556, 'learning_rate': 5.031500854824425e-06, 'epoch': 1.33} {'loss': 0.5144, 'learning_rate': 5.031216769884019e-06, 'epoch': 1.33} {'loss': 0.6045, 'learning_rate': 5.030932690268112e-06, 'epoch': 1.33} {'loss': 0.5641, 'learning_rate': 5.03064861597701e-06, 'epoch': 1.33} {'loss': 0.5818, 'learning_rate': 5.030364547011019e-06, 'epoch': 1.33} {'loss': 0.6045, 'learning_rate': 5.0300804833704346e-06, 'epoch': 1.33} {'loss': 0.4334, 'learning_rate': 5.029796425055573e-06, 'epoch': 1.33} {'loss': 0.5477, 'learning_rate': 5.029512372066731e-06, 'epoch': 1.33} {'loss': 0.4366, 'learning_rate': 5.029228324404214e-06, 'epoch': 1.33} {'loss': 0.5796, 'learning_rate': 5.028944282068333e-06, 'epoch': 1.33} {'loss': 0.5215, 'learning_rate': 5.028660245059378e-06, 'epoch': 1.33} {'loss': 0.4109, 'learning_rate': 5.02837621337767e-06, 'epoch': 1.33} {'loss': 0.5181, 'learning_rate': 5.028092187023499e-06, 'epoch': 1.33} {'loss': 0.5781, 'learning_rate': 5.0278081659971825e-06, 'epoch': 1.33} {'loss': 0.442, 'learning_rate': 5.027524150299015e-06, 'epoch': 1.33} {'loss': 0.6286, 'learning_rate': 5.0272401399293035e-06, 'epoch': 1.33} {'loss': 0.5128, 'learning_rate': 5.026956134888357e-06, 'epoch': 1.33} {'loss': 0.6129, 'learning_rate': 5.026672135176469e-06, 'epoch': 1.33} {'loss': 0.5642, 'learning_rate': 5.0263881407939575e-06, 'epoch': 1.33} {'loss': 0.3858, 'learning_rate': 5.026104151741113e-06, 'epoch': 1.33} {'loss': 0.5523, 'learning_rate': 5.025820168018254e-06, 'epoch': 1.33} {'loss': 0.3909, 'learning_rate': 5.025536189625673e-06, 'epoch': 1.33} {'loss': 0.4145, 'learning_rate': 5.02525221656368e-06, 'epoch': 1.33} {'loss': 0.6148, 'learning_rate': 5.024968248832583e-06, 'epoch': 1.33} {'loss': 0.62, 'learning_rate': 5.024684286432673e-06, 'epoch': 1.33} {'loss': 0.6235, 'learning_rate': 5.0244003293642694e-06, 'epoch': 1.33} {'loss': 0.4577, 'learning_rate': 5.024116377627664e-06, 'epoch': 1.33} {'loss': 0.5862, 'learning_rate': 5.0238324312231725e-06, 'epoch': 1.33} {'loss': 0.557, 'learning_rate': 5.023548490151091e-06, 'epoch': 1.33} {'loss': 0.4159, 'learning_rate': 5.023264554411727e-06, 'epoch': 1.33} {'loss': 0.4338, 'learning_rate': 5.022980624005388e-06, 'epoch': 1.33} {'loss': 0.5712, 'learning_rate': 5.022696698932366e-06, 'epoch': 1.33} {'loss': 0.6383, 'learning_rate': 5.022412779192982e-06, 'epoch': 1.33} {'loss': 0.4546, 'learning_rate': 5.022128864787524e-06, 'epoch': 1.33} {'loss': 0.5273, 'learning_rate': 5.0218449557163125e-06, 'epoch': 1.33} {'loss': 0.4583, 'learning_rate': 5.02156105197964e-06, 'epoch': 1.33} {'loss': 0.6457, 'learning_rate': 5.021277153577813e-06, 'epoch': 1.33} {'loss': 0.501, 'learning_rate': 5.02099326051114e-06, 'epoch': 1.33} {'loss': 0.5529, 'learning_rate': 5.020709372779916e-06, 'epoch': 1.33} {'loss': 0.5091, 'learning_rate': 5.020425490384458e-06, 'epoch': 1.33} {'loss': 0.5475, 'learning_rate': 5.02014161332506e-06, 'epoch': 1.33} {'loss': 0.64, 'learning_rate': 5.01985774160203e-06, 'epoch': 1.33} {'loss': 0.3886, 'learning_rate': 5.019573875215672e-06, 'epoch': 1.33} {'loss': 0.5709, 'learning_rate': 5.0192900141662894e-06, 'epoch': 1.33} {'loss': 0.4971, 'learning_rate': 5.019006158454191e-06, 'epoch': 1.33} {'loss': 0.5668, 'learning_rate': 5.018722308079671e-06, 'epoch': 1.33} {'loss': 0.4087, 'learning_rate': 5.018438463043046e-06, 'epoch': 1.33} {'loss': 0.5645, 'learning_rate': 5.01815462334461e-06, 'epoch': 1.33} {'loss': 0.3142, 'learning_rate': 5.017870788984671e-06, 'epoch': 1.33} {'loss': 0.4125, 'learning_rate': 5.017586959963533e-06, 'epoch': 1.33} {'loss': 0.8464, 'learning_rate': 5.017303136281501e-06, 'epoch': 1.33} {'loss': 0.5259, 'learning_rate': 5.01701931793888e-06, 'epoch': 1.33} {'loss': 0.6499, 'learning_rate': 5.016735504935968e-06, 'epoch': 1.33} {'loss': 0.6943, 'learning_rate': 5.016451697273079e-06, 'epoch': 1.33} {'loss': 0.4774, 'learning_rate': 5.01616789495051e-06, 'epoch': 1.33} {'loss': 0.62, 'learning_rate': 5.015884097968565e-06, 'epoch': 1.33} {'loss': 0.6232, 'learning_rate': 5.01560030632755e-06, 'epoch': 1.33} {'loss': 0.5287, 'learning_rate': 5.015316520027771e-06, 'epoch': 1.33} {'loss': 0.59, 'learning_rate': 5.015032739069532e-06, 'epoch': 1.33} {'loss': 0.6463, 'learning_rate': 5.014748963453133e-06, 'epoch': 1.33} {'loss': 0.4567, 'learning_rate': 5.01446519317888e-06, 'epoch': 1.33} {'loss': 0.662, 'learning_rate': 5.014181428247078e-06, 'epoch': 1.33} {'loss': 0.5729, 'learning_rate': 5.01389766865803e-06, 'epoch': 1.33} {'loss': 0.509, 'learning_rate': 5.013613914412044e-06, 'epoch': 1.33} {'loss': 0.4455, 'learning_rate': 5.013330165509413e-06, 'epoch': 1.33} {'loss': 0.5103, 'learning_rate': 5.013046421950458e-06, 'epoch': 1.33} {'loss': 0.602, 'learning_rate': 5.012762683735469e-06, 'epoch': 1.33} {'loss': 0.6168, 'learning_rate': 5.012478950864755e-06, 'epoch': 1.33} {'loss': 0.375, 'learning_rate': 5.01219522333862e-06, 'epoch': 1.33} {'loss': 0.5894, 'learning_rate': 5.011911501157368e-06, 'epoch': 1.33} {'loss': 0.5323, 'learning_rate': 5.011627784321307e-06, 'epoch': 1.33} {'loss': 0.5824, 'learning_rate': 5.011344072830728e-06, 'epoch': 1.33} {'loss': 0.3906, 'learning_rate': 5.011060366685953e-06, 'epoch': 1.33} {'loss': 0.4638, 'learning_rate': 5.010776665887274e-06, 'epoch': 1.33} {'loss': 0.5627, 'learning_rate': 5.0104929704349966e-06, 'epoch': 1.33} {'loss': 0.5078, 'learning_rate': 5.010209280329428e-06, 'epoch': 1.33} {'loss': 0.5993, 'learning_rate': 5.0099255955708704e-06, 'epoch': 1.33} {'loss': 0.566, 'learning_rate': 5.009641916159631e-06, 'epoch': 1.33} {'loss': 0.6526, 'learning_rate': 5.009358242096006e-06, 'epoch': 1.33} {'loss': 0.5428, 'learning_rate': 5.009074573380305e-06, 'epoch': 1.33} {'loss': 0.4775, 'learning_rate': 5.0087909100128305e-06, 'epoch': 1.33} {'loss': 0.5474, 'learning_rate': 5.008507251993888e-06, 'epoch': 1.33} {'loss': 0.5918, 'learning_rate': 5.00822359932378e-06, 'epoch': 1.33} {'loss': 0.3828, 'learning_rate': 5.0079399520028105e-06, 'epoch': 1.33} {'loss': 0.4955, 'learning_rate': 5.007656310031288e-06, 'epoch': 1.33} {'loss': 0.4583, 'learning_rate': 5.007372673409508e-06, 'epoch': 1.33} {'loss': 0.7018, 'learning_rate': 5.007089042137781e-06, 'epoch': 1.33} {'loss': 0.4664, 'learning_rate': 5.006805416216407e-06, 'epoch': 1.33} {'loss': 0.6461, 'learning_rate': 5.006521795645691e-06, 'epoch': 1.33} {'loss': 0.5736, 'learning_rate': 5.006238180425939e-06, 'epoch': 1.33} {'loss': 0.5325, 'learning_rate': 5.005954570557452e-06, 'epoch': 1.33} {'loss': 0.4632, 'learning_rate': 5.005670966040541e-06, 'epoch': 1.33} {'loss': 0.5718, 'learning_rate': 5.0053873668755e-06, 'epoch': 1.34} {'loss': 0.4586, 'learning_rate': 5.005103773062636e-06, 'epoch': 1.34} {'loss': 0.4971, 'learning_rate': 5.004820184602255e-06, 'epoch': 1.34} {'loss': 0.4176, 'learning_rate': 5.004536601494661e-06, 'epoch': 1.34} {'loss': 0.6549, 'learning_rate': 5.004253023740155e-06, 'epoch': 1.34} {'loss': 0.6047, 'learning_rate': 5.003969451339048e-06, 'epoch': 1.34} {'loss': 0.6648, 'learning_rate': 5.0036858842916335e-06, 'epoch': 1.34} {'loss': 0.412, 'learning_rate': 5.003402322598222e-06, 'epoch': 1.34} {'loss': 0.462, 'learning_rate': 5.003118766259115e-06, 'epoch': 1.34} {'loss': 0.5117, 'learning_rate': 5.0028352152746175e-06, 'epoch': 1.34} {'loss': 0.6898, 'learning_rate': 5.002551669645033e-06, 'epoch': 1.34} {'loss': 0.7001, 'learning_rate': 5.002268129370665e-06, 'epoch': 1.34} {'loss': 0.6552, 'learning_rate': 5.001984594451823e-06, 'epoch': 1.34} {'loss': 0.4581, 'learning_rate': 5.0017010648888e-06, 'epoch': 1.34} {'loss': 0.3972, 'learning_rate': 5.001417540681908e-06, 'epoch': 1.34} {'loss': 0.4945, 'learning_rate': 5.001134021831445e-06, 'epoch': 1.34} {'loss': 0.5632, 'learning_rate': 5.00085050833772e-06, 'epoch': 1.34} {'loss': 0.5564, 'learning_rate': 5.000567000201039e-06, 'epoch': 1.34} {'loss': 0.4159, 'learning_rate': 5.000283497421693e-06, 'epoch': 1.34} {'loss': 0.5271, 'learning_rate': 5.000000000000003e-06, 'epoch': 1.34} {'loss': 0.5245, 'learning_rate': 4.99971650793626e-06, 'epoch': 1.34} {'loss': 0.5861, 'learning_rate': 4.999433021230772e-06, 'epoch': 1.34} {'loss': 0.5726, 'learning_rate': 4.999149539883842e-06, 'epoch': 1.34} {'loss': 0.5365, 'learning_rate': 4.998866063895775e-06, 'epoch': 1.34} {'loss': 0.5019, 'learning_rate': 4.9985825932668795e-06, 'epoch': 1.34} {'loss': 0.5395, 'learning_rate': 4.998299127997446e-06, 'epoch': 1.34} {'loss': 0.515, 'learning_rate': 4.998015668087793e-06, 'epoch': 1.34} {'loss': 0.4407, 'learning_rate': 4.997732213538215e-06, 'epoch': 1.34} {'loss': 0.4157, 'learning_rate': 4.997448764349019e-06, 'epoch': 1.34} {'loss': 0.4099, 'learning_rate': 4.997165320520507e-06, 'epoch': 1.34} {'loss': 0.5424, 'learning_rate': 4.996881882052984e-06, 'epoch': 1.34} {'loss': 0.572, 'learning_rate': 4.996598448946757e-06, 'epoch': 1.34} {'loss': 0.5858, 'learning_rate': 4.996315021202119e-06, 'epoch': 1.34} {'loss': 0.5832, 'learning_rate': 4.99603159881939e-06, 'epoch': 1.34} {'loss': 0.4011, 'learning_rate': 4.995748181798859e-06, 'epoch': 1.34} {'loss': 0.6093, 'learning_rate': 4.995464770140837e-06, 'epoch': 1.34} {'loss': 0.4793, 'learning_rate': 4.995181363845629e-06, 'epoch': 1.34} {'loss': 0.5469, 'learning_rate': 4.994897962913529e-06, 'epoch': 1.34} {'loss': 0.5626, 'learning_rate': 4.994614567344855e-06, 'epoch': 1.34} {'loss': 0.5622, 'learning_rate': 4.994331177139895e-06, 'epoch': 1.34} {'loss': 0.4621, 'learning_rate': 4.994047792298969e-06, 'epoch': 1.34} {'loss': 0.6225, 'learning_rate': 4.9937644128223695e-06, 'epoch': 1.34} {'loss': 0.4423, 'learning_rate': 4.993481038710403e-06, 'epoch': 1.34} {'loss': 0.4314, 'learning_rate': 4.993197669963377e-06, 'epoch': 1.34} {'loss': 0.6064, 'learning_rate': 4.992914306581583e-06, 'epoch': 1.34} {'loss': 0.6639, 'learning_rate': 4.9926309485653414e-06, 'epoch': 1.34} {'loss': 0.4806, 'learning_rate': 4.992347595914945e-06, 'epoch': 1.34} {'loss': 0.4904, 'learning_rate': 4.992064248630699e-06, 'epoch': 1.34} {'loss': 0.5819, 'learning_rate': 4.991780906712909e-06, 'epoch': 1.34} {'loss': 0.4965, 'learning_rate': 4.991497570161876e-06, 'epoch': 1.34} {'loss': 0.4629, 'learning_rate': 4.9912142389779105e-06, 'epoch': 1.34} {'loss': 0.5522, 'learning_rate': 4.990930913161304e-06, 'epoch': 1.34} {'loss': 0.4884, 'learning_rate': 4.990647592712373e-06, 'epoch': 1.34} {'loss': 0.4642, 'learning_rate': 4.9903642776314135e-06, 'epoch': 1.34} {'loss': 0.5213, 'learning_rate': 4.990080967918729e-06, 'epoch': 1.34} {'loss': 0.4636, 'learning_rate': 4.989797663574626e-06, 'epoch': 1.34} {'loss': 0.4572, 'learning_rate': 4.989514364599407e-06, 'epoch': 1.34} {'loss': 0.6153, 'learning_rate': 4.989231070993379e-06, 'epoch': 1.34} {'loss': 0.6376, 'learning_rate': 4.988947782756835e-06, 'epoch': 1.34} {'loss': 0.548, 'learning_rate': 4.988664499890092e-06, 'epoch': 1.34} {'loss': 0.4797, 'learning_rate': 4.9883812223934445e-06, 'epoch': 1.34} {'loss': 0.5583, 'learning_rate': 4.988097950267199e-06, 'epoch': 1.34} {'loss': 0.5492, 'learning_rate': 4.987814683511663e-06, 'epoch': 1.34} {'loss': 0.367, 'learning_rate': 4.987531422127128e-06, 'epoch': 1.34} {'loss': 0.5372, 'learning_rate': 4.987248166113913e-06, 'epoch': 1.34} {'loss': 0.611, 'learning_rate': 4.986964915472306e-06, 'epoch': 1.34} {'loss': 0.5309, 'learning_rate': 4.986681670202626e-06, 'epoch': 1.34} {'loss': 0.5534, 'learning_rate': 4.986398430305166e-06, 'epoch': 1.34} {'loss': 0.353, 'learning_rate': 4.986115195780232e-06, 'epoch': 1.34} {'loss': 0.4846, 'learning_rate': 4.985831966628133e-06, 'epoch': 1.34} {'loss': 0.4706, 'learning_rate': 4.985548742849159e-06, 'epoch': 1.34} {'loss': 0.5771, 'learning_rate': 4.9852655244436295e-06, 'epoch': 1.34} {'loss': 0.5505, 'learning_rate': 4.984982311411835e-06, 'epoch': 1.34} {'loss': 0.5034, 'learning_rate': 4.98469910375409e-06, 'epoch': 1.34} {'loss': 0.4546, 'learning_rate': 4.9844159014706895e-06, 'epoch': 1.34} {'loss': 0.5971, 'learning_rate': 4.984132704561941e-06, 'epoch': 1.34} {'loss': 0.575, 'learning_rate': 4.9838495130281486e-06, 'epoch': 1.34} {'loss': 0.5674, 'learning_rate': 4.983566326869608e-06, 'epoch': 1.34} {'loss': 0.5623, 'learning_rate': 4.983283146086636e-06, 'epoch': 1.34} {'loss': 0.5864, 'learning_rate': 4.982999970679522e-06, 'epoch': 1.34} {'loss': 0.5722, 'learning_rate': 4.982716800648583e-06, 'epoch': 1.34} {'loss': 0.6838, 'learning_rate': 4.982433635994113e-06, 'epoch': 1.34} {'loss': 0.6127, 'learning_rate': 4.982150476716418e-06, 'epoch': 1.34} {'loss': 0.4682, 'learning_rate': 4.981867322815804e-06, 'epoch': 1.34} {'loss': 0.5074, 'learning_rate': 4.981584174292566e-06, 'epoch': 1.34} {'loss': 0.4569, 'learning_rate': 4.981301031147021e-06, 'epoch': 1.34} {'loss': 0.5288, 'learning_rate': 4.981017893379456e-06, 'epoch': 1.34} {'loss': 0.3406, 'learning_rate': 4.980734760990192e-06, 'epoch': 1.34} {'loss': 0.6042, 'learning_rate': 4.980451633979521e-06, 'epoch': 1.34} {'loss': 0.4681, 'learning_rate': 4.980168512347747e-06, 'epoch': 1.34} {'loss': 0.686, 'learning_rate': 4.979885396095181e-06, 'epoch': 1.34} {'loss': 0.5583, 'learning_rate': 4.979602285222113e-06, 'epoch': 1.34} {'loss': 0.6209, 'learning_rate': 4.979319179728861e-06, 'epoch': 1.34} {'loss': 0.4623, 'learning_rate': 4.979036079615718e-06, 'epoch': 1.34} {'loss': 0.5609, 'learning_rate': 4.9787529848829906e-06, 'epoch': 1.34} {'loss': 0.4625, 'learning_rate': 4.978469895530984e-06, 'epoch': 1.34} {'loss': 0.6153, 'learning_rate': 4.9781868115599995e-06, 'epoch': 1.34} {'loss': 0.5146, 'learning_rate': 4.977903732970345e-06, 'epoch': 1.34} {'loss': 0.6159, 'learning_rate': 4.977620659762311e-06, 'epoch': 1.34} {'loss': 0.474, 'learning_rate': 4.977337591936219e-06, 'epoch': 1.34} {'loss': 0.5032, 'learning_rate': 4.977054529492359e-06, 'epoch': 1.34} {'loss': 0.6625, 'learning_rate': 4.9767714724310375e-06, 'epoch': 1.34} {'loss': 0.758, 'learning_rate': 4.97648842075256e-06, 'epoch': 1.34} {'loss': 0.5534, 'learning_rate': 4.976205374457228e-06, 'epoch': 1.34} {'loss': 0.5232, 'learning_rate': 4.975922333545349e-06, 'epoch': 1.34} {'loss': 0.6189, 'learning_rate': 4.975639298017219e-06, 'epoch': 1.34} {'loss': 0.5388, 'learning_rate': 4.975356267873145e-06, 'epoch': 1.34} {'loss': 0.5668, 'learning_rate': 4.975073243113431e-06, 'epoch': 1.34} {'loss': 0.7262, 'learning_rate': 4.974790223738378e-06, 'epoch': 1.34} {'loss': 0.5816, 'learning_rate': 4.9745072097482915e-06, 'epoch': 1.34} {'loss': 0.5966, 'learning_rate': 4.974224201143474e-06, 'epoch': 1.34} {'loss': 0.6156, 'learning_rate': 4.973941197924233e-06, 'epoch': 1.34} {'loss': 0.6035, 'learning_rate': 4.973658200090864e-06, 'epoch': 1.34} {'loss': 0.3331, 'learning_rate': 4.973375207643674e-06, 'epoch': 1.34} {'loss': 0.5483, 'learning_rate': 4.973092220582965e-06, 'epoch': 1.34} {'loss': 0.6067, 'learning_rate': 4.9728092389090424e-06, 'epoch': 1.34} {'loss': 0.5183, 'learning_rate': 4.972526262622208e-06, 'epoch': 1.34} {'loss': 0.5257, 'learning_rate': 4.972243291722766e-06, 'epoch': 1.34} {'loss': 0.5449, 'learning_rate': 4.9719603262110225e-06, 'epoch': 1.34} {'loss': 0.5653, 'learning_rate': 4.971677366087273e-06, 'epoch': 1.34} {'loss': 0.5012, 'learning_rate': 4.971394411351827e-06, 'epoch': 1.34} {'loss': 0.5018, 'learning_rate': 4.971111462004984e-06, 'epoch': 1.34} {'loss': 0.5256, 'learning_rate': 4.970828518047049e-06, 'epoch': 1.34} {'loss': 0.5133, 'learning_rate': 4.970545579478325e-06, 'epoch': 1.34} {'loss': 0.4364, 'learning_rate': 4.97026264629912e-06, 'epoch': 1.34} {'loss': 0.5515, 'learning_rate': 4.9699797185097285e-06, 'epoch': 1.34} {'loss': 0.4353, 'learning_rate': 4.969696796110457e-06, 'epoch': 1.34} {'loss': 0.4904, 'learning_rate': 4.96941387910161e-06, 'epoch': 1.34} {'loss': 0.4415, 'learning_rate': 4.9691309674834896e-06, 'epoch': 1.34} {'loss': 0.5199, 'learning_rate': 4.968848061256401e-06, 'epoch': 1.34} {'loss': 0.6641, 'learning_rate': 4.9685651604206476e-06, 'epoch': 1.34} {'loss': 0.5494, 'learning_rate': 4.968282264976529e-06, 'epoch': 1.34} {'loss': 0.5409, 'learning_rate': 4.967999374924349e-06, 'epoch': 1.34} {'loss': 0.4707, 'learning_rate': 4.96771649026441e-06, 'epoch': 1.34} {'loss': 0.5783, 'learning_rate': 4.96743361099702e-06, 'epoch': 1.34} {'loss': 0.5249, 'learning_rate': 4.967150737122477e-06, 'epoch': 1.34} {'loss': 0.6033, 'learning_rate': 4.966867868641088e-06, 'epoch': 1.34} {'loss': 0.4502, 'learning_rate': 4.966585005553156e-06, 'epoch': 1.34} {'loss': 0.6341, 'learning_rate': 4.96630214785898e-06, 'epoch': 1.34} {'loss': 0.6397, 'learning_rate': 4.966019295558866e-06, 'epoch': 1.34} {'loss': 0.5151, 'learning_rate': 4.965736448653116e-06, 'epoch': 1.34} {'loss': 0.5795, 'learning_rate': 4.965453607142033e-06, 'epoch': 1.34} {'loss': 0.6158, 'learning_rate': 4.965170771025922e-06, 'epoch': 1.34} {'loss': 0.4707, 'learning_rate': 4.964887940305089e-06, 'epoch': 1.34} {'loss': 0.5347, 'learning_rate': 4.9646051149798295e-06, 'epoch': 1.34} {'loss': 0.4907, 'learning_rate': 4.964322295050449e-06, 'epoch': 1.34} {'loss': 0.5106, 'learning_rate': 4.964039480517251e-06, 'epoch': 1.34} {'loss': 0.5063, 'learning_rate': 4.9637566713805404e-06, 'epoch': 1.34} {'loss': 0.5076, 'learning_rate': 4.963473867640619e-06, 'epoch': 1.34} {'loss': 0.52, 'learning_rate': 4.9631910692977895e-06, 'epoch': 1.34} {'loss': 0.4159, 'learning_rate': 4.962908276352359e-06, 'epoch': 1.34} {'loss': 0.4874, 'learning_rate': 4.962625488804624e-06, 'epoch': 1.34} {'loss': 0.5286, 'learning_rate': 4.96234270665489e-06, 'epoch': 1.34} {'loss': 0.5787, 'learning_rate': 4.96205992990346e-06, 'epoch': 1.34} {'loss': 0.4537, 'learning_rate': 4.961777158550638e-06, 'epoch': 1.34} {'loss': 0.4457, 'learning_rate': 4.961494392596726e-06, 'epoch': 1.34} {'loss': 0.6111, 'learning_rate': 4.961211632042029e-06, 'epoch': 1.34} {'loss': 0.5505, 'learning_rate': 4.96092887688685e-06, 'epoch': 1.34} {'loss': 0.4736, 'learning_rate': 4.960646127131489e-06, 'epoch': 1.34} {'loss': 0.5125, 'learning_rate': 4.9603633827762484e-06, 'epoch': 1.34} {'loss': 0.4311, 'learning_rate': 4.960080643821435e-06, 'epoch': 1.34} {'loss': 0.5137, 'learning_rate': 4.95979791026735e-06, 'epoch': 1.34} {'loss': 0.4306, 'learning_rate': 4.959515182114299e-06, 'epoch': 1.34} {'loss': 0.5175, 'learning_rate': 4.959232459362575e-06, 'epoch': 1.34} {'loss': 0.4391, 'learning_rate': 4.958949742012497e-06, 'epoch': 1.34} {'loss': 0.5805, 'learning_rate': 4.958667030064355e-06, 'epoch': 1.34} {'loss': 0.4848, 'learning_rate': 4.958384323518456e-06, 'epoch': 1.34} {'loss': 0.4504, 'learning_rate': 4.958101622375104e-06, 'epoch': 1.34} {'loss': 0.5426, 'learning_rate': 4.9578189266346e-06, 'epoch': 1.34} {'loss': 0.4187, 'learning_rate': 4.957536236297254e-06, 'epoch': 1.34} {'loss': 0.3128, 'learning_rate': 4.957253551363353e-06, 'epoch': 1.34} {'loss': 0.5708, 'learning_rate': 4.956970871833219e-06, 'epoch': 1.34} {'loss': 0.6022, 'learning_rate': 4.956688197707141e-06, 'epoch': 1.34} {'loss': 0.5919, 'learning_rate': 4.956405528985427e-06, 'epoch': 1.34} {'loss': 0.6426, 'learning_rate': 4.956122865668381e-06, 'epoch': 1.34} {'loss': 0.5339, 'learning_rate': 4.955840207756304e-06, 'epoch': 1.34} {'loss': 0.4877, 'learning_rate': 4.955557555249503e-06, 'epoch': 1.34} {'loss': 0.5928, 'learning_rate': 4.955274908148269e-06, 'epoch': 1.34} {'loss': 0.6411, 'learning_rate': 4.954992266452922e-06, 'epoch': 1.34} {'loss': 0.5894, 'learning_rate': 4.954709630163752e-06, 'epoch': 1.34} {'loss': 0.4376, 'learning_rate': 4.954426999281066e-06, 'epoch': 1.34} {'loss': 0.4095, 'learning_rate': 4.9541443738051705e-06, 'epoch': 1.34} {'loss': 0.5717, 'learning_rate': 4.953861753736357e-06, 'epoch': 1.34} {'loss': 0.3678, 'learning_rate': 4.953579139074945e-06, 'epoch': 1.34} {'loss': 0.6287, 'learning_rate': 4.953296529821219e-06, 'epoch': 1.34} {'loss': 0.4777, 'learning_rate': 4.953013925975499e-06, 'epoch': 1.34} {'loss': 0.5882, 'learning_rate': 4.9527313275380775e-06, 'epoch': 1.34} {'loss': 0.5782, 'learning_rate': 4.952448734509258e-06, 'epoch': 1.34} {'loss': 0.3441, 'learning_rate': 4.952166146889351e-06, 'epoch': 1.34} {'loss': 0.6476, 'learning_rate': 4.951883564678645e-06, 'epoch': 1.34} {'loss': 0.3921, 'learning_rate': 4.95160098787746e-06, 'epoch': 1.34} {'loss': 0.5705, 'learning_rate': 4.951318416486082e-06, 'epoch': 1.34} {'loss': 0.4474, 'learning_rate': 4.95103585050483e-06, 'epoch': 1.34} {'loss': 0.5867, 'learning_rate': 4.950753289933994e-06, 'epoch': 1.34} {'loss': 0.562, 'learning_rate': 4.950470734773881e-06, 'epoch': 1.34} {'loss': 0.4357, 'learning_rate': 4.9501881850248e-06, 'epoch': 1.34} {'loss': 0.6719, 'learning_rate': 4.949905640687039e-06, 'epoch': 1.34} {'loss': 0.473, 'learning_rate': 4.949623101760918e-06, 'epoch': 1.34} {'loss': 0.4902, 'learning_rate': 4.949340568246729e-06, 'epoch': 1.34} {'loss': 0.5085, 'learning_rate': 4.949058040144777e-06, 'epoch': 1.34} {'loss': 0.4539, 'learning_rate': 4.948775517455364e-06, 'epoch': 1.34} {'loss': 0.4533, 'learning_rate': 4.948493000178794e-06, 'epoch': 1.34} {'loss': 0.4035, 'learning_rate': 4.948210488315374e-06, 'epoch': 1.34} {'loss': 0.549, 'learning_rate': 4.947927981865396e-06, 'epoch': 1.34} {'loss': 0.7177, 'learning_rate': 4.9476454808291755e-06, 'epoch': 1.34} {'loss': 0.5065, 'learning_rate': 4.947362985207005e-06, 'epoch': 1.34} {'loss': 0.7547, 'learning_rate': 4.947080494999192e-06, 'epoch': 1.34} {'loss': 0.4596, 'learning_rate': 4.9467980102060365e-06, 'epoch': 1.34} {'loss': 0.4911, 'learning_rate': 4.9465155308278445e-06, 'epoch': 1.34} {'loss': 0.4797, 'learning_rate': 4.946233056864921e-06, 'epoch': 1.34} {'loss': 0.5515, 'learning_rate': 4.9459505883175565e-06, 'epoch': 1.34} {'loss': 0.6064, 'learning_rate': 4.9456681251860705e-06, 'epoch': 1.34} {'loss': 0.6417, 'learning_rate': 4.945385667470754e-06, 'epoch': 1.34} {'loss': 0.4492, 'learning_rate': 4.945103215171911e-06, 'epoch': 1.34} {'loss': 0.4869, 'learning_rate': 4.944820768289851e-06, 'epoch': 1.34} {'loss': 0.5935, 'learning_rate': 4.9445383268248646e-06, 'epoch': 1.34} {'loss': 0.5059, 'learning_rate': 4.944255890777269e-06, 'epoch': 1.34} {'loss': 0.5519, 'learning_rate': 4.943973460147352e-06, 'epoch': 1.34} {'loss': 0.4625, 'learning_rate': 4.94369103493543e-06, 'epoch': 1.34} {'loss': 0.6329, 'learning_rate': 4.943408615141798e-06, 'epoch': 1.34} {'loss': 0.5228, 'learning_rate': 4.943126200766759e-06, 'epoch': 1.34} {'loss': 0.5119, 'learning_rate': 4.9428437918106195e-06, 'epoch': 1.34} {'loss': 0.5019, 'learning_rate': 4.942561388273673e-06, 'epoch': 1.34} {'loss': 0.5667, 'learning_rate': 4.942278990156236e-06, 'epoch': 1.34} {'loss': 0.5319, 'learning_rate': 4.941996597458595e-06, 'epoch': 1.34} {'loss': 0.4972, 'learning_rate': 4.94171421018107e-06, 'epoch': 1.34} {'loss': 0.5917, 'learning_rate': 4.941431828323951e-06, 'epoch': 1.34} {'loss': 0.5189, 'learning_rate': 4.941149451887542e-06, 'epoch': 1.34} {'loss': 0.5268, 'learning_rate': 4.940867080872154e-06, 'epoch': 1.34} {'loss': 0.4036, 'learning_rate': 4.940584715278075e-06, 'epoch': 1.34} {'loss': 0.5274, 'learning_rate': 4.940302355105625e-06, 'epoch': 1.34} {'loss': 0.462, 'learning_rate': 4.940020000355092e-06, 'epoch': 1.34} {'loss': 0.4858, 'learning_rate': 4.9397376510267855e-06, 'epoch': 1.34} {'loss': 0.5947, 'learning_rate': 4.939455307121007e-06, 'epoch': 1.34} {'loss': 0.6273, 'learning_rate': 4.939172968638058e-06, 'epoch': 1.34} {'loss': 0.6099, 'learning_rate': 4.938890635578246e-06, 'epoch': 1.34} {'loss': 0.4194, 'learning_rate': 4.938608307941863e-06, 'epoch': 1.34} {'loss': 0.613, 'learning_rate': 4.9383259857292246e-06, 'epoch': 1.34} {'loss': 0.597, 'learning_rate': 4.938043668940623e-06, 'epoch': 1.34} {'loss': 0.654, 'learning_rate': 4.937761357576364e-06, 'epoch': 1.34} {'loss': 0.6186, 'learning_rate': 4.937479051636751e-06, 'epoch': 1.34} {'loss': 0.6763, 'learning_rate': 4.937196751122087e-06, 'epoch': 1.34} {'loss': 0.5697, 'learning_rate': 4.936914456032677e-06, 'epoch': 1.34} {'loss': 0.4748, 'learning_rate': 4.936632166368811e-06, 'epoch': 1.34} {'loss': 0.4982, 'learning_rate': 4.93634988213081e-06, 'epoch': 1.34} {'loss': 0.5413, 'learning_rate': 4.9360676033189625e-06, 'epoch': 1.34} {'loss': 0.5366, 'learning_rate': 4.935785329933576e-06, 'epoch': 1.34} {'loss': 0.6586, 'learning_rate': 4.935503061974952e-06, 'epoch': 1.34} {'loss': 0.6216, 'learning_rate': 4.935220799443394e-06, 'epoch': 1.34} {'loss': 0.5032, 'learning_rate': 4.934938542339208e-06, 'epoch': 1.34} {'loss': 0.5681, 'learning_rate': 4.934656290662688e-06, 'epoch': 1.34} {'loss': 0.5064, 'learning_rate': 4.9343740444141415e-06, 'epoch': 1.34} {'loss': 0.5527, 'learning_rate': 4.934091803593871e-06, 'epoch': 1.34} {'loss': 0.5747, 'learning_rate': 4.933809568202177e-06, 'epoch': 1.34} {'loss': 0.4921, 'learning_rate': 4.933527338239365e-06, 'epoch': 1.34} {'loss': 0.521, 'learning_rate': 4.933245113705734e-06, 'epoch': 1.34} {'loss': 0.7147, 'learning_rate': 4.932962894601593e-06, 'epoch': 1.34} {'loss': 0.3451, 'learning_rate': 4.9326806809272356e-06, 'epoch': 1.34} {'loss': 0.6321, 'learning_rate': 4.932398472682968e-06, 'epoch': 1.34} {'loss': 0.6413, 'learning_rate': 4.9321162698690924e-06, 'epoch': 1.34} {'loss': 0.5865, 'learning_rate': 4.931834072485913e-06, 'epoch': 1.34} {'loss': 0.5577, 'learning_rate': 4.93155188053373e-06, 'epoch': 1.34} {'loss': 0.4222, 'learning_rate': 4.931269694012847e-06, 'epoch': 1.34} {'loss': 0.6022, 'learning_rate': 4.9309875129235695e-06, 'epoch': 1.34} {'loss': 0.3856, 'learning_rate': 4.930705337266191e-06, 'epoch': 1.34} {'loss': 0.5928, 'learning_rate': 4.930423167041022e-06, 'epoch': 1.34} {'loss': 0.5342, 'learning_rate': 4.930141002248361e-06, 'epoch': 1.34} {'loss': 0.5638, 'learning_rate': 4.929858842888511e-06, 'epoch': 1.34} {'loss': 0.5395, 'learning_rate': 4.929576688961776e-06, 'epoch': 1.34} {'loss': 0.5094, 'learning_rate': 4.92929454046846e-06, 'epoch': 1.34} {'loss': 0.6149, 'learning_rate': 4.929012397408859e-06, 'epoch': 1.34} {'loss': 0.3298, 'learning_rate': 4.928730259783279e-06, 'epoch': 1.34} {'loss': 0.5314, 'learning_rate': 4.928448127592022e-06, 'epoch': 1.34} {'loss': 0.4943, 'learning_rate': 4.9281660008353905e-06, 'epoch': 1.34} {'loss': 0.5413, 'learning_rate': 4.927883879513688e-06, 'epoch': 1.34} {'loss': 0.616, 'learning_rate': 4.927601763627214e-06, 'epoch': 1.34} {'loss': 0.5679, 'learning_rate': 4.927319653176278e-06, 'epoch': 1.34} {'loss': 0.5528, 'learning_rate': 4.927037548161172e-06, 'epoch': 1.34} {'loss': 0.5905, 'learning_rate': 4.926755448582203e-06, 'epoch': 1.34} {'loss': 0.5082, 'learning_rate': 4.9264733544396735e-06, 'epoch': 1.34} {'loss': 0.5404, 'learning_rate': 4.926191265733886e-06, 'epoch': 1.34} {'loss': 0.5348, 'learning_rate': 4.925909182465146e-06, 'epoch': 1.34} {'loss': 0.5212, 'learning_rate': 4.925627104633749e-06, 'epoch': 1.34} {'loss': 0.624, 'learning_rate': 4.925345032240001e-06, 'epoch': 1.34} {'loss': 0.5514, 'learning_rate': 4.925062965284203e-06, 'epoch': 1.34} {'loss': 0.5018, 'learning_rate': 4.9247809037666585e-06, 'epoch': 1.34} {'loss': 0.5276, 'learning_rate': 4.9244988476876685e-06, 'epoch': 1.34} {'loss': 0.5492, 'learning_rate': 4.924216797047536e-06, 'epoch': 1.34} {'loss': 0.4387, 'learning_rate': 4.923934751846569e-06, 'epoch': 1.34} {'loss': 0.3514, 'learning_rate': 4.923652712085059e-06, 'epoch': 1.34} {'loss': 0.6253, 'learning_rate': 4.923370677763313e-06, 'epoch': 1.34} {'loss': 0.5739, 'learning_rate': 4.923088648881633e-06, 'epoch': 1.34} {'loss': 0.579, 'learning_rate': 4.922806625440323e-06, 'epoch': 1.34} {'loss': 0.4514, 'learning_rate': 4.922524607439683e-06, 'epoch': 1.34} {'loss': 0.5171, 'learning_rate': 4.922242594880017e-06, 'epoch': 1.34} {'loss': 0.6328, 'learning_rate': 4.921960587761629e-06, 'epoch': 1.34} {'loss': 0.5044, 'learning_rate': 4.921678586084816e-06, 'epoch': 1.34} {'loss': 0.5053, 'learning_rate': 4.921396589849882e-06, 'epoch': 1.34} {'loss': 0.7028, 'learning_rate': 4.921114599057131e-06, 'epoch': 1.34} {'loss': 0.5066, 'learning_rate': 4.9208326137068625e-06, 'epoch': 1.34} {'loss': 0.5167, 'learning_rate': 4.920550633799385e-06, 'epoch': 1.34} {'loss': 0.4377, 'learning_rate': 4.920268659334988e-06, 'epoch': 1.34} {'loss': 0.522, 'learning_rate': 4.919986690313989e-06, 'epoch': 1.34} {'loss': 0.4825, 'learning_rate': 4.919704726736681e-06, 'epoch': 1.34} {'loss': 0.462, 'learning_rate': 4.9194227686033656e-06, 'epoch': 1.34} {'loss': 0.4788, 'learning_rate': 4.919140815914347e-06, 'epoch': 1.34} {'loss': 0.5239, 'learning_rate': 4.918858868669929e-06, 'epoch': 1.34} {'loss': 0.3863, 'learning_rate': 4.9185769268704155e-06, 'epoch': 1.34} {'loss': 0.6647, 'learning_rate': 4.918294990516098e-06, 'epoch': 1.34} {'loss': 0.6724, 'learning_rate': 4.918013059607294e-06, 'epoch': 1.34} {'loss': 0.6497, 'learning_rate': 4.917731134144294e-06, 'epoch': 1.34} {'loss': 0.5397, 'learning_rate': 4.917449214127404e-06, 'epoch': 1.34} {'loss': 0.4277, 'learning_rate': 4.917167299556924e-06, 'epoch': 1.34} {'loss': 0.4939, 'learning_rate': 4.916885390433159e-06, 'epoch': 1.34} {'loss': 0.5374, 'learning_rate': 4.916603486756415e-06, 'epoch': 1.34} {'loss': 0.6043, 'learning_rate': 4.91632158852698e-06, 'epoch': 1.34} {'loss': 0.5726, 'learning_rate': 4.9160396957451736e-06, 'epoch': 1.34} {'loss': 0.5691, 'learning_rate': 4.915757808411285e-06, 'epoch': 1.34} {'loss': 0.4441, 'learning_rate': 4.915475926525623e-06, 'epoch': 1.34} {'loss': 0.6442, 'learning_rate': 4.915194050088489e-06, 'epoch': 1.34} {'loss': 0.4903, 'learning_rate': 4.9149121791001764e-06, 'epoch': 1.34} {'loss': 0.4804, 'learning_rate': 4.9146303135610014e-06, 'epoch': 1.34} {'loss': 0.4597, 'learning_rate': 4.914348453471253e-06, 'epoch': 1.34} {'loss': 0.58, 'learning_rate': 4.914066598831246e-06, 'epoch': 1.34} {'loss': 0.6147, 'learning_rate': 4.913784749641272e-06, 'epoch': 1.34} {'loss': 0.527, 'learning_rate': 4.913502905901637e-06, 'epoch': 1.34} {'loss': 0.5187, 'learning_rate': 4.9132210676126455e-06, 'epoch': 1.34} {'loss': 0.5294, 'learning_rate': 4.912939234774589e-06, 'epoch': 1.34} {'loss': 0.5417, 'learning_rate': 4.912657407387787e-06, 'epoch': 1.34} {'loss': 0.514, 'learning_rate': 4.912375585452523e-06, 'epoch': 1.34} {'loss': 0.5017, 'learning_rate': 4.912093768969114e-06, 'epoch': 1.34} {'loss': 0.6525, 'learning_rate': 4.911811957937853e-06, 'epoch': 1.34} {'loss': 0.528, 'learning_rate': 4.911530152359045e-06, 'epoch': 1.34} {'loss': 0.6124, 'learning_rate': 4.911248352232996e-06, 'epoch': 1.34} {'loss': 0.5038, 'learning_rate': 4.910966557559995e-06, 'epoch': 1.34} {'loss': 0.5325, 'learning_rate': 4.91068476834036e-06, 'epoch': 1.34} {'loss': 0.4648, 'learning_rate': 4.910402984574378e-06, 'epoch': 1.34} {'loss': 0.5551, 'learning_rate': 4.9101212062623675e-06, 'epoch': 1.34} {'loss': 0.494, 'learning_rate': 4.909839433404618e-06, 'epoch': 1.34} {'loss': 0.6236, 'learning_rate': 4.909557666001433e-06, 'epoch': 1.34} {'loss': 0.5525, 'learning_rate': 4.909275904053121e-06, 'epoch': 1.34} {'loss': 0.4702, 'learning_rate': 4.908994147559973e-06, 'epoch': 1.34} {'loss': 0.5375, 'learning_rate': 4.908712396522302e-06, 'epoch': 1.34} {'loss': 0.4416, 'learning_rate': 4.9084306509404e-06, 'epoch': 1.34} {'loss': 0.5737, 'learning_rate': 4.908148910814581e-06, 'epoch': 1.34} {'loss': 0.5076, 'learning_rate': 4.907867176145137e-06, 'epoch': 1.34} {'loss': 0.6241, 'learning_rate': 4.907585446932372e-06, 'epoch': 1.34} {'loss': 0.5442, 'learning_rate': 4.907303723176592e-06, 'epoch': 1.34} {'loss': 0.4454, 'learning_rate': 4.907022004878089e-06, 'epoch': 1.34} {'loss': 0.6017, 'learning_rate': 4.906740292037179e-06, 'epoch': 1.34} {'loss': 0.4159, 'learning_rate': 4.906458584654149e-06, 'epoch': 1.34} {'loss': 0.5844, 'learning_rate': 4.906176882729315e-06, 'epoch': 1.34} {'loss': 0.5036, 'learning_rate': 4.90589518626297e-06, 'epoch': 1.34} {'loss': 0.4416, 'learning_rate': 4.905613495255418e-06, 'epoch': 1.34} {'loss': 0.425, 'learning_rate': 4.905331809706963e-06, 'epoch': 1.34} {'loss': 0.5268, 'learning_rate': 4.905050129617898e-06, 'epoch': 1.34} {'loss': 0.4556, 'learning_rate': 4.904768454988541e-06, 'epoch': 1.34} {'loss': 0.6139, 'learning_rate': 4.904486785819179e-06, 'epoch': 1.34} {'loss': 0.6186, 'learning_rate': 4.9042051221101195e-06, 'epoch': 1.34} {'loss': 0.5515, 'learning_rate': 4.903923463861664e-06, 'epoch': 1.34} {'loss': 0.5151, 'learning_rate': 4.903641811074115e-06, 'epoch': 1.34} {'loss': 0.4911, 'learning_rate': 4.903360163747777e-06, 'epoch': 1.34} {'loss': 0.5644, 'learning_rate': 4.903078521882941e-06, 'epoch': 1.34} {'loss': 0.4906, 'learning_rate': 4.902796885479923e-06, 'epoch': 1.34} {'loss': 0.3855, 'learning_rate': 4.902515254539017e-06, 'epoch': 1.34} {'loss': 0.523, 'learning_rate': 4.902233629060524e-06, 'epoch': 1.34} {'loss': 0.5558, 'learning_rate': 4.9019520090447484e-06, 'epoch': 1.34} {'loss': 0.6929, 'learning_rate': 4.901670394491991e-06, 'epoch': 1.34} {'loss': 0.6443, 'learning_rate': 4.901388785402558e-06, 'epoch': 1.34} {'loss': 0.3829, 'learning_rate': 4.901107181776743e-06, 'epoch': 1.34} {'loss': 0.4872, 'learning_rate': 4.900825583614852e-06, 'epoch': 1.34} {'loss': 0.5424, 'learning_rate': 4.900543990917187e-06, 'epoch': 1.34} {'loss': 0.6675, 'learning_rate': 4.90026240368405e-06, 'epoch': 1.34} {'loss': 0.6824, 'learning_rate': 4.899980821915744e-06, 'epoch': 1.34} {'loss': 0.5616, 'learning_rate': 4.899699245612563e-06, 'epoch': 1.34} {'loss': 0.5958, 'learning_rate': 4.899417674774821e-06, 'epoch': 1.34} {'loss': 0.556, 'learning_rate': 4.89913610940281e-06, 'epoch': 1.34} {'loss': 0.5586, 'learning_rate': 4.898854549496836e-06, 'epoch': 1.34} {'loss': 0.6604, 'learning_rate': 4.898572995057198e-06, 'epoch': 1.34} {'loss': 0.443, 'learning_rate': 4.8982914460842e-06, 'epoch': 1.34} {'loss': 0.6024, 'learning_rate': 4.898009902578147e-06, 'epoch': 1.34} {'loss': 0.5751, 'learning_rate': 4.89772836453933e-06, 'epoch': 1.34} {'loss': 0.5334, 'learning_rate': 4.897446831968065e-06, 'epoch': 1.34} {'loss': 0.4684, 'learning_rate': 4.897165304864642e-06, 'epoch': 1.34} {'loss': 0.5182, 'learning_rate': 4.896883783229367e-06, 'epoch': 1.34} {'loss': 0.5597, 'learning_rate': 4.896602267062541e-06, 'epoch': 1.34} {'loss': 0.5732, 'learning_rate': 4.896320756364468e-06, 'epoch': 1.34} {'loss': 0.543, 'learning_rate': 4.89603925113545e-06, 'epoch': 1.34} {'loss': 0.6042, 'learning_rate': 4.895757751375784e-06, 'epoch': 1.34} {'loss': 0.5791, 'learning_rate': 4.895476257085773e-06, 'epoch': 1.34} {'loss': 0.3997, 'learning_rate': 4.895194768265721e-06, 'epoch': 1.34} {'loss': 0.4537, 'learning_rate': 4.894913284915928e-06, 'epoch': 1.34} {'loss': 0.5675, 'learning_rate': 4.894631807036696e-06, 'epoch': 1.34} {'loss': 0.6452, 'learning_rate': 4.894350334628327e-06, 'epoch': 1.34} {'loss': 0.5163, 'learning_rate': 4.8940688676911265e-06, 'epoch': 1.34} {'loss': 0.5171, 'learning_rate': 4.893787406225389e-06, 'epoch': 1.34} {'loss': 0.5523, 'learning_rate': 4.8935059502314175e-06, 'epoch': 1.34} {'loss': 0.402, 'learning_rate': 4.893224499709517e-06, 'epoch': 1.34} {'loss': 0.6257, 'learning_rate': 4.892943054659985e-06, 'epoch': 1.34} {'loss': 0.2824, 'learning_rate': 4.892661615083128e-06, 'epoch': 1.34} {'loss': 0.4865, 'learning_rate': 4.892380180979243e-06, 'epoch': 1.34} {'loss': 0.629, 'learning_rate': 4.892098752348639e-06, 'epoch': 1.34} {'loss': 0.6349, 'learning_rate': 4.891817329191608e-06, 'epoch': 1.34} {'loss': 0.578, 'learning_rate': 4.891535911508455e-06, 'epoch': 1.34} {'loss': 0.7394, 'learning_rate': 4.891254499299484e-06, 'epoch': 1.34} {'loss': 0.5713, 'learning_rate': 4.8909730925649935e-06, 'epoch': 1.34} {'loss': 0.4676, 'learning_rate': 4.890691691305286e-06, 'epoch': 1.34} {'loss': 0.5015, 'learning_rate': 4.890410295520668e-06, 'epoch': 1.34} {'loss': 0.4787, 'learning_rate': 4.890128905211433e-06, 'epoch': 1.34} {'loss': 0.5615, 'learning_rate': 4.889847520377886e-06, 'epoch': 1.34} {'loss': 0.3955, 'learning_rate': 4.889566141020328e-06, 'epoch': 1.34} {'loss': 0.5093, 'learning_rate': 4.889284767139062e-06, 'epoch': 1.34} {'loss': 0.4759, 'learning_rate': 4.889003398734388e-06, 'epoch': 1.34} {'loss': 0.5723, 'learning_rate': 4.888722035806608e-06, 'epoch': 1.34} {'loss': 0.512, 'learning_rate': 4.8884406783560275e-06, 'epoch': 1.34} {'loss': 0.5529, 'learning_rate': 4.888159326382942e-06, 'epoch': 1.34} {'loss': 0.7138, 'learning_rate': 4.887877979887653e-06, 'epoch': 1.34} {'loss': 0.4219, 'learning_rate': 4.8875966388704656e-06, 'epoch': 1.34} {'loss': 0.5318, 'learning_rate': 4.8873153033316785e-06, 'epoch': 1.34} {'loss': 0.5284, 'learning_rate': 4.8870339732715955e-06, 'epoch': 1.34} {'loss': 0.5545, 'learning_rate': 4.886752648690517e-06, 'epoch': 1.34} {'loss': 0.7248, 'learning_rate': 4.886471329588747e-06, 'epoch': 1.34} {'loss': 0.4351, 'learning_rate': 4.886190015966583e-06, 'epoch': 1.34} {'loss': 0.5287, 'learning_rate': 4.885908707824326e-06, 'epoch': 1.34} {'loss': 0.4683, 'learning_rate': 4.885627405162281e-06, 'epoch': 1.34} {'loss': 0.5839, 'learning_rate': 4.8853461079807465e-06, 'epoch': 1.34} {'loss': 0.4424, 'learning_rate': 4.885064816280029e-06, 'epoch': 1.34} {'loss': 0.5693, 'learning_rate': 4.884783530060419e-06, 'epoch': 1.34} {'loss': 0.4591, 'learning_rate': 4.884502249322234e-06, 'epoch': 1.34} {'loss': 0.5642, 'learning_rate': 4.884220974065761e-06, 'epoch': 1.34} {'loss': 0.5057, 'learning_rate': 4.883939704291307e-06, 'epoch': 1.34} {'loss': 0.5432, 'learning_rate': 4.8836584399991745e-06, 'epoch': 1.34} {'loss': 0.5633, 'learning_rate': 4.883377181189663e-06, 'epoch': 1.34} {'loss': 0.6051, 'learning_rate': 4.883095927863078e-06, 'epoch': 1.34} {'loss': 0.3883, 'learning_rate': 4.882814680019712e-06, 'epoch': 1.34} {'loss': 0.4532, 'learning_rate': 4.882533437659878e-06, 'epoch': 1.34} {'loss': 0.5415, 'learning_rate': 4.882252200783867e-06, 'epoch': 1.34} {'loss': 0.4862, 'learning_rate': 4.881970969391986e-06, 'epoch': 1.34} {'loss': 0.5429, 'learning_rate': 4.881689743484534e-06, 'epoch': 1.34} {'loss': 0.4902, 'learning_rate': 4.881408523061813e-06, 'epoch': 1.34} {'loss': 0.4295, 'learning_rate': 4.881127308124129e-06, 'epoch': 1.34} {'loss': 0.5799, 'learning_rate': 4.880846098671777e-06, 'epoch': 1.34} {'loss': 0.6556, 'learning_rate': 4.880564894705059e-06, 'epoch': 1.34} {'loss': 0.7341, 'learning_rate': 4.880283696224277e-06, 'epoch': 1.34} {'loss': 0.4689, 'learning_rate': 4.880002503229734e-06, 'epoch': 1.34} {'loss': 0.6192, 'learning_rate': 4.8797213157217335e-06, 'epoch': 1.34} {'loss': 0.5294, 'learning_rate': 4.8794401337005674e-06, 'epoch': 1.34} {'loss': 0.4475, 'learning_rate': 4.879158957166551e-06, 'epoch': 1.34} {'loss': 0.5827, 'learning_rate': 4.878877786119973e-06, 'epoch': 1.34} {'loss': 0.4837, 'learning_rate': 4.87859662056114e-06, 'epoch': 1.34} {'loss': 0.6276, 'learning_rate': 4.878315460490353e-06, 'epoch': 1.34} {'loss': 0.5336, 'learning_rate': 4.878034305907914e-06, 'epoch': 1.34} {'loss': 0.3801, 'learning_rate': 4.877753156814126e-06, 'epoch': 1.34} {'loss': 0.4345, 'learning_rate': 4.877472013209281e-06, 'epoch': 1.34} {'loss': 0.6051, 'learning_rate': 4.877190875093695e-06, 'epoch': 1.34} {'loss': 0.3681, 'learning_rate': 4.876909742467657e-06, 'epoch': 1.34} {'loss': 0.6493, 'learning_rate': 4.876628615331472e-06, 'epoch': 1.34} {'loss': 0.4772, 'learning_rate': 4.8763474936854475e-06, 'epoch': 1.34} {'loss': 0.5596, 'learning_rate': 4.87606637752987e-06, 'epoch': 1.34} {'loss': 0.5474, 'learning_rate': 4.8757852668650575e-06, 'epoch': 1.34} {'loss': 0.4662, 'learning_rate': 4.875504161691296e-06, 'epoch': 1.34} {'loss': 0.5369, 'learning_rate': 4.875223062008903e-06, 'epoch': 1.34} {'loss': 0.4635, 'learning_rate': 4.874941967818165e-06, 'epoch': 1.34} {'loss': 0.5352, 'learning_rate': 4.874660879119392e-06, 'epoch': 1.34} {'loss': 0.381, 'learning_rate': 4.874379795912884e-06, 'epoch': 1.34} {'loss': 0.5627, 'learning_rate': 4.8740987181989344e-06, 'epoch': 1.34} {'loss': 0.5325, 'learning_rate': 4.873817645977857e-06, 'epoch': 1.34} {'loss': 0.5679, 'learning_rate': 4.87353657924994e-06, 'epoch': 1.34} {'loss': 0.4822, 'learning_rate': 4.873255518015499e-06, 'epoch': 1.34} {'loss': 0.4249, 'learning_rate': 4.872974462274823e-06, 'epoch': 1.34} {'loss': 0.5062, 'learning_rate': 4.872693412028219e-06, 'epoch': 1.34} {'loss': 0.6727, 'learning_rate': 4.872412367275989e-06, 'epoch': 1.34} {'loss': 0.5764, 'learning_rate': 4.872131328018424e-06, 'epoch': 1.34} {'loss': 0.4573, 'learning_rate': 4.871850294255842e-06, 'epoch': 1.34} {'loss': 0.5883, 'learning_rate': 4.871569265988527e-06, 'epoch': 1.34} {'loss': 0.6341, 'learning_rate': 4.8712882432167965e-06, 'epoch': 1.34} {'loss': 0.5206, 'learning_rate': 4.871007225940939e-06, 'epoch': 1.34} {'loss': 0.5849, 'learning_rate': 4.870726214161261e-06, 'epoch': 1.34} {'loss': 0.6204, 'learning_rate': 4.870445207878066e-06, 'epoch': 1.34} {'loss': 0.5545, 'learning_rate': 4.870164207091645e-06, 'epoch': 1.34} {'loss': 0.6, 'learning_rate': 4.869883211802313e-06, 'epoch': 1.34} {'loss': 0.4686, 'learning_rate': 4.869602222010356e-06, 'epoch': 1.35} {'loss': 0.383, 'learning_rate': 4.869321237716093e-06, 'epoch': 1.35} {'loss': 0.4797, 'learning_rate': 4.8690402589198105e-06, 'epoch': 1.35} {'loss': 0.5048, 'learning_rate': 4.868759285621814e-06, 'epoch': 1.35} {'loss': 0.3711, 'learning_rate': 4.868478317822409e-06, 'epoch': 1.35} {'loss': 0.5355, 'learning_rate': 4.868197355521885e-06, 'epoch': 1.35} {'loss': 0.5481, 'learning_rate': 4.867916398720558e-06, 'epoch': 1.35} {'loss': 0.5005, 'learning_rate': 4.867635447418715e-06, 'epoch': 1.35} {'loss': 0.6331, 'learning_rate': 4.8673545016166715e-06, 'epoch': 1.35} {'loss': 0.4613, 'learning_rate': 4.867073561314716e-06, 'epoch': 1.35} {'loss': 0.6437, 'learning_rate': 4.866792626513155e-06, 'epoch': 1.35} {'loss': 0.5835, 'learning_rate': 4.866511697212293e-06, 'epoch': 1.35} {'loss': 0.6507, 'learning_rate': 4.866230773412419e-06, 'epoch': 1.35} {'loss': 0.426, 'learning_rate': 4.865949855113849e-06, 'epoch': 1.35} {'loss': 0.6061, 'learning_rate': 4.865668942316876e-06, 'epoch': 1.35} {'loss': 0.5802, 'learning_rate': 4.8653880350218e-06, 'epoch': 1.35} {'loss': 0.4005, 'learning_rate': 4.865107133228925e-06, 'epoch': 1.35} {'loss': 0.5929, 'learning_rate': 4.86482623693855e-06, 'epoch': 1.35} {'loss': 0.6116, 'learning_rate': 4.864545346150982e-06, 'epoch': 1.35} {'loss': 0.6113, 'learning_rate': 4.864264460866509e-06, 'epoch': 1.35} {'loss': 0.3753, 'learning_rate': 4.863983581085449e-06, 'epoch': 1.35} {'loss': 0.5006, 'learning_rate': 4.863702706808089e-06, 'epoch': 1.35} {'loss': 0.6144, 'learning_rate': 4.863421838034736e-06, 'epoch': 1.35} {'loss': 0.5902, 'learning_rate': 4.863140974765689e-06, 'epoch': 1.35} {'loss': 0.4737, 'learning_rate': 4.86286011700125e-06, 'epoch': 1.35} {'loss': 0.4853, 'learning_rate': 4.862579264741725e-06, 'epoch': 1.35} {'loss': 0.495, 'learning_rate': 4.862298417987401e-06, 'epoch': 1.35} {'loss': 0.6646, 'learning_rate': 4.862017576738597e-06, 'epoch': 1.35} {'loss': 0.5694, 'learning_rate': 4.8617367409956e-06, 'epoch': 1.35} {'loss': 0.5021, 'learning_rate': 4.8614559107587165e-06, 'epoch': 1.35} {'loss': 0.4999, 'learning_rate': 4.861175086028247e-06, 'epoch': 1.35} {'loss': 0.5033, 'learning_rate': 4.860894266804492e-06, 'epoch': 1.35} {'loss': 0.5122, 'learning_rate': 4.860613453087756e-06, 'epoch': 1.35} {'loss': 0.5818, 'learning_rate': 4.860332644878333e-06, 'epoch': 1.35} {'loss': 0.5732, 'learning_rate': 4.8600518421765275e-06, 'epoch': 1.35} {'loss': 0.7232, 'learning_rate': 4.85977104498264e-06, 'epoch': 1.35} {'loss': 0.592, 'learning_rate': 4.859490253296972e-06, 'epoch': 1.35} {'loss': 0.5529, 'learning_rate': 4.859209467119825e-06, 'epoch': 1.35} {'loss': 0.4346, 'learning_rate': 4.8589286864514985e-06, 'epoch': 1.35} {'loss': 0.6106, 'learning_rate': 4.858647911292298e-06, 'epoch': 1.35} {'loss': 0.6323, 'learning_rate': 4.858367141642516e-06, 'epoch': 1.35} {'loss': 0.5674, 'learning_rate': 4.858086377502457e-06, 'epoch': 1.35} {'loss': 0.629, 'learning_rate': 4.857805618872423e-06, 'epoch': 1.35} {'loss': 0.4017, 'learning_rate': 4.857524865752715e-06, 'epoch': 1.35} {'loss': 0.4327, 'learning_rate': 4.857244118143637e-06, 'epoch': 1.35} {'loss': 0.5557, 'learning_rate': 4.8569633760454784e-06, 'epoch': 1.35} {'loss': 0.5494, 'learning_rate': 4.856682639458554e-06, 'epoch': 1.35} {'loss': 0.4899, 'learning_rate': 4.856401908383156e-06, 'epoch': 1.35} {'loss': 0.4475, 'learning_rate': 4.856121182819587e-06, 'epoch': 1.35} {'loss': 0.7021, 'learning_rate': 4.8558404627681485e-06, 'epoch': 1.35} {'loss': 0.5373, 'learning_rate': 4.855559748229142e-06, 'epoch': 1.35} {'loss': 0.5106, 'learning_rate': 4.85527903920287e-06, 'epoch': 1.35} {'loss': 0.6411, 'learning_rate': 4.854998335689629e-06, 'epoch': 1.35} {'loss': 0.5056, 'learning_rate': 4.85471763768972e-06, 'epoch': 1.35} {'loss': 0.5668, 'learning_rate': 4.854436945203446e-06, 'epoch': 1.35} {'loss': 0.5726, 'learning_rate': 4.854156258231107e-06, 'epoch': 1.35} {'loss': 0.5734, 'learning_rate': 4.853875576773004e-06, 'epoch': 1.35} {'loss': 0.4746, 'learning_rate': 4.853594900829438e-06, 'epoch': 1.35} {'loss': 0.5218, 'learning_rate': 4.8533142304007134e-06, 'epoch': 1.35} {'loss': 0.4856, 'learning_rate': 4.853033565487123e-06, 'epoch': 1.35} {'loss': 0.5605, 'learning_rate': 4.852752906088972e-06, 'epoch': 1.35} {'loss': 0.5723, 'learning_rate': 4.85247225220656e-06, 'epoch': 1.35} {'loss': 0.6293, 'learning_rate': 4.85219160384019e-06, 'epoch': 1.35} {'loss': 0.5189, 'learning_rate': 4.85191096099016e-06, 'epoch': 1.35} {'loss': 0.57, 'learning_rate': 4.851630323656776e-06, 'epoch': 1.35} {'loss': 0.6433, 'learning_rate': 4.8513496918403325e-06, 'epoch': 1.35} {'loss': 0.4502, 'learning_rate': 4.851069065541131e-06, 'epoch': 1.35} {'loss': 0.5413, 'learning_rate': 4.8507884447594745e-06, 'epoch': 1.35} {'loss': 0.5504, 'learning_rate': 4.850507829495662e-06, 'epoch': 1.35} {'loss': 0.6333, 'learning_rate': 4.8502272197499955e-06, 'epoch': 1.35} {'loss': 0.5584, 'learning_rate': 4.849946615522776e-06, 'epoch': 1.35} {'loss': 0.5995, 'learning_rate': 4.849666016814307e-06, 'epoch': 1.35} {'loss': 0.469, 'learning_rate': 4.8493854236248815e-06, 'epoch': 1.35} {'loss': 0.6026, 'learning_rate': 4.849104835954804e-06, 'epoch': 1.35} {'loss': 0.6181, 'learning_rate': 4.848824253804377e-06, 'epoch': 1.35} {'loss': 0.5086, 'learning_rate': 4.8485436771738994e-06, 'epoch': 1.35} {'loss': 0.4738, 'learning_rate': 4.848263106063671e-06, 'epoch': 1.35} {'loss': 0.6581, 'learning_rate': 4.847982540473994e-06, 'epoch': 1.35} {'loss': 0.5377, 'learning_rate': 4.847701980405174e-06, 'epoch': 1.35} {'loss': 0.4317, 'learning_rate': 4.847421425857501e-06, 'epoch': 1.35} {'loss': 0.435, 'learning_rate': 4.847140876831281e-06, 'epoch': 1.35} {'loss': 0.4521, 'learning_rate': 4.846860333326815e-06, 'epoch': 1.35} {'loss': 0.5743, 'learning_rate': 4.8465797953444036e-06, 'epoch': 1.35} {'loss': 0.6383, 'learning_rate': 4.84629926288435e-06, 'epoch': 1.35} {'loss': 0.5145, 'learning_rate': 4.846018735946945e-06, 'epoch': 1.35} {'loss': 0.4743, 'learning_rate': 4.845738214532504e-06, 'epoch': 1.35} {'loss': 0.5988, 'learning_rate': 4.845457698641316e-06, 'epoch': 1.35} {'loss': 0.5327, 'learning_rate': 4.8451771882736844e-06, 'epoch': 1.35} {'loss': 0.6164, 'learning_rate': 4.8448966834299115e-06, 'epoch': 1.35} {'loss': 0.5563, 'learning_rate': 4.844616184110297e-06, 'epoch': 1.35} {'loss': 0.641, 'learning_rate': 4.844335690315144e-06, 'epoch': 1.35} {'loss': 0.5003, 'learning_rate': 4.844055202044744e-06, 'epoch': 1.35} {'loss': 0.4686, 'learning_rate': 4.843774719299412e-06, 'epoch': 1.35} {'loss': 0.4852, 'learning_rate': 4.843494242079438e-06, 'epoch': 1.35} {'loss': 0.4694, 'learning_rate': 4.843213770385123e-06, 'epoch': 1.35} {'loss': 0.5789, 'learning_rate': 4.842933304216771e-06, 'epoch': 1.35} {'loss': 0.5445, 'learning_rate': 4.842652843574681e-06, 'epoch': 1.35} {'loss': 0.5681, 'learning_rate': 4.8423723884591586e-06, 'epoch': 1.35} {'loss': 0.604, 'learning_rate': 4.842091938870492e-06, 'epoch': 1.35} {'loss': 0.5197, 'learning_rate': 4.8418114948089964e-06, 'epoch': 1.35} {'loss': 0.5637, 'learning_rate': 4.8415310562749614e-06, 'epoch': 1.35} {'loss': 0.5437, 'learning_rate': 4.841250623268693e-06, 'epoch': 1.35} {'loss': 0.4575, 'learning_rate': 4.840970195790492e-06, 'epoch': 1.35} {'loss': 0.7501, 'learning_rate': 4.840689773840651e-06, 'epoch': 1.35} {'loss': 0.4774, 'learning_rate': 4.840409357419483e-06, 'epoch': 1.35} {'loss': 0.5407, 'learning_rate': 4.840128946527275e-06, 'epoch': 1.35} {'loss': 0.4467, 'learning_rate': 4.839848541164343e-06, 'epoch': 1.35} {'loss': 0.2701, 'learning_rate': 4.839568141330974e-06, 'epoch': 1.35} {'loss': 0.43, 'learning_rate': 4.839287747027474e-06, 'epoch': 1.35} {'loss': 0.3804, 'learning_rate': 4.839007358254147e-06, 'epoch': 1.35} {'loss': 0.5699, 'learning_rate': 4.838726975011281e-06, 'epoch': 1.35} {'loss': 0.3812, 'learning_rate': 4.838446597299192e-06, 'epoch': 1.35} {'loss': 0.5658, 'learning_rate': 4.838166225118167e-06, 'epoch': 1.35} {'loss': 0.4849, 'learning_rate': 4.837885858468519e-06, 'epoch': 1.35} {'loss': 0.5653, 'learning_rate': 4.83760549735054e-06, 'epoch': 1.35} {'loss': 0.4722, 'learning_rate': 4.837325141764533e-06, 'epoch': 1.35} {'loss': 0.6072, 'learning_rate': 4.8370447917107995e-06, 'epoch': 1.35} {'loss': 0.5051, 'learning_rate': 4.836764447189632e-06, 'epoch': 1.35} {'loss': 0.6418, 'learning_rate': 4.836484108201346e-06, 'epoch': 1.35} {'loss': 0.4427, 'learning_rate': 4.836203774746228e-06, 'epoch': 1.35} {'loss': 0.4725, 'learning_rate': 4.835923446824585e-06, 'epoch': 1.35} {'loss': 0.6511, 'learning_rate': 4.835643124436717e-06, 'epoch': 1.35} {'loss': 0.5791, 'learning_rate': 4.835362807582922e-06, 'epoch': 1.35} {'loss': 0.4853, 'learning_rate': 4.835082496263506e-06, 'epoch': 1.35} {'loss': 0.6233, 'learning_rate': 4.834802190478757e-06, 'epoch': 1.35} {'loss': 0.52, 'learning_rate': 4.834521890228992e-06, 'epoch': 1.35} {'loss': 0.4463, 'learning_rate': 4.8342415955144984e-06, 'epoch': 1.35} {'loss': 0.598, 'learning_rate': 4.833961306335582e-06, 'epoch': 1.35} {'loss': 0.5888, 'learning_rate': 4.8336810226925426e-06, 'epoch': 1.35} {'loss': 0.7108, 'learning_rate': 4.833400744585679e-06, 'epoch': 1.35} {'loss': 0.5386, 'learning_rate': 4.833120472015297e-06, 'epoch': 1.35} {'loss': 0.5844, 'learning_rate': 4.832840204981686e-06, 'epoch': 1.35} {'loss': 0.3922, 'learning_rate': 4.83255994348516e-06, 'epoch': 1.35} {'loss': 0.511, 'learning_rate': 4.832279687526009e-06, 'epoch': 1.35} {'loss': 0.616, 'learning_rate': 4.831999437104537e-06, 'epoch': 1.35} {'loss': 0.5948, 'learning_rate': 4.831719192221047e-06, 'epoch': 1.35} {'loss': 0.7124, 'learning_rate': 4.8314389528758285e-06, 'epoch': 1.35} {'loss': 0.651, 'learning_rate': 4.831158719069198e-06, 'epoch': 1.35} {'loss': 0.5059, 'learning_rate': 4.830878490801439e-06, 'epoch': 1.35} {'loss': 0.5952, 'learning_rate': 4.8305982680728694e-06, 'epoch': 1.35} {'loss': 0.6048, 'learning_rate': 4.830318050883776e-06, 'epoch': 1.35} {'loss': 0.5589, 'learning_rate': 4.830037839234463e-06, 'epoch': 1.35} {'loss': 0.4585, 'learning_rate': 4.8297576331252345e-06, 'epoch': 1.35} {'loss': 0.5069, 'learning_rate': 4.829477432556381e-06, 'epoch': 1.35} {'loss': 0.6557, 'learning_rate': 4.829197237528216e-06, 'epoch': 1.35} {'loss': 0.3681, 'learning_rate': 4.828917048041024e-06, 'epoch': 1.35} {'loss': 0.616, 'learning_rate': 4.828636864095123e-06, 'epoch': 1.35} {'loss': 0.5294, 'learning_rate': 4.828356685690801e-06, 'epoch': 1.35} {'loss': 0.529, 'learning_rate': 4.82807651282836e-06, 'epoch': 1.35} {'loss': 0.63, 'learning_rate': 4.8277963455081075e-06, 'epoch': 1.35} {'loss': 0.4327, 'learning_rate': 4.8275161837303295e-06, 'epoch': 1.35} {'loss': 0.4988, 'learning_rate': 4.827236027495342e-06, 'epoch': 1.35} {'loss': 0.6638, 'learning_rate': 4.8269558768034355e-06, 'epoch': 1.35} {'loss': 0.5361, 'learning_rate': 4.826675731654911e-06, 'epoch': 1.35} {'loss': 0.483, 'learning_rate': 4.826395592050072e-06, 'epoch': 1.35} {'loss': 0.6379, 'learning_rate': 4.826115457989216e-06, 'epoch': 1.35} {'loss': 0.5061, 'learning_rate': 4.825835329472648e-06, 'epoch': 1.35} {'loss': 0.5252, 'learning_rate': 4.825555206500656e-06, 'epoch': 1.35} {'loss': 0.4525, 'learning_rate': 4.825275089073558e-06, 'epoch': 1.35} {'loss': 0.6368, 'learning_rate': 4.824994977191641e-06, 'epoch': 1.35} {'loss': 0.6328, 'learning_rate': 4.824714870855207e-06, 'epoch': 1.35} {'loss': 0.492, 'learning_rate': 4.82443477006456e-06, 'epoch': 1.35} {'loss': 0.516, 'learning_rate': 4.824154674819997e-06, 'epoch': 1.35} {'loss': 0.4329, 'learning_rate': 4.823874585121824e-06, 'epoch': 1.35} {'loss': 0.515, 'learning_rate': 4.8235945009703286e-06, 'epoch': 1.35} {'loss': 0.649, 'learning_rate': 4.823314422365827e-06, 'epoch': 1.35} {'loss': 0.4279, 'learning_rate': 4.823034349308607e-06, 'epoch': 1.35} {'loss': 0.538, 'learning_rate': 4.8227542817989734e-06, 'epoch': 1.35} {'loss': 0.5109, 'learning_rate': 4.822474219837226e-06, 'epoch': 1.35} {'loss': 0.4551, 'learning_rate': 4.822194163423663e-06, 'epoch': 1.35} {'loss': 0.5724, 'learning_rate': 4.821914112558592e-06, 'epoch': 1.35} {'loss': 0.483, 'learning_rate': 4.821634067242302e-06, 'epoch': 1.35} {'loss': 0.6071, 'learning_rate': 4.8213540274751e-06, 'epoch': 1.35} {'loss': 0.6084, 'learning_rate': 4.821073993257284e-06, 'epoch': 1.35} {'loss': 0.603, 'learning_rate': 4.820793964589154e-06, 'epoch': 1.35} {'loss': 0.5504, 'learning_rate': 4.8205139414710125e-06, 'epoch': 1.35} {'loss': 0.5855, 'learning_rate': 4.820233923903156e-06, 'epoch': 1.35} {'loss': 0.6446, 'learning_rate': 4.81995391188589e-06, 'epoch': 1.35} {'loss': 0.507, 'learning_rate': 4.819673905419509e-06, 'epoch': 1.35} {'loss': 0.5625, 'learning_rate': 4.819393904504314e-06, 'epoch': 1.35} {'loss': 0.5772, 'learning_rate': 4.8191139091406055e-06, 'epoch': 1.35} {'loss': 0.3752, 'learning_rate': 4.818833919328685e-06, 'epoch': 1.35} {'loss': 0.4447, 'learning_rate': 4.8185539350688504e-06, 'epoch': 1.35} {'loss': 0.5706, 'learning_rate': 4.818273956361404e-06, 'epoch': 1.35} {'loss': 0.6232, 'learning_rate': 4.817993983206648e-06, 'epoch': 1.35} {'loss': 0.4994, 'learning_rate': 4.817714015604875e-06, 'epoch': 1.35} {'loss': 0.5917, 'learning_rate': 4.81743405355639e-06, 'epoch': 1.35} {'loss': 0.5193, 'learning_rate': 4.817154097061491e-06, 'epoch': 1.35} {'loss': 0.5681, 'learning_rate': 4.816874146120481e-06, 'epoch': 1.35} {'loss': 0.5505, 'learning_rate': 4.816594200733657e-06, 'epoch': 1.35} {'loss': 0.6157, 'learning_rate': 4.816314260901324e-06, 'epoch': 1.35} {'loss': 0.5828, 'learning_rate': 4.816034326623774e-06, 'epoch': 1.35} {'loss': 0.5532, 'learning_rate': 4.815754397901311e-06, 'epoch': 1.35} {'loss': 0.595, 'learning_rate': 4.8154744747342355e-06, 'epoch': 1.35} {'loss': 0.5444, 'learning_rate': 4.8151945571228474e-06, 'epoch': 1.35} {'loss': 0.599, 'learning_rate': 4.814914645067446e-06, 'epoch': 1.35} {'loss': 0.6247, 'learning_rate': 4.814634738568331e-06, 'epoch': 1.35} {'loss': 0.5836, 'learning_rate': 4.814354837625808e-06, 'epoch': 1.35} {'loss': 0.5816, 'learning_rate': 4.814074942240167e-06, 'epoch': 1.35} {'loss': 0.6603, 'learning_rate': 4.813795052411713e-06, 'epoch': 1.35} {'loss': 0.4139, 'learning_rate': 4.813515168140745e-06, 'epoch': 1.35} {'loss': 0.6157, 'learning_rate': 4.813235289427565e-06, 'epoch': 1.35} {'loss': 0.5922, 'learning_rate': 4.81295541627247e-06, 'epoch': 1.35} {'loss': 0.5322, 'learning_rate': 4.812675548675766e-06, 'epoch': 1.35} {'loss': 0.4746, 'learning_rate': 4.812395686637744e-06, 'epoch': 1.35} {'loss': 0.5564, 'learning_rate': 4.812115830158709e-06, 'epoch': 1.35} {'loss': 0.4146, 'learning_rate': 4.81183597923896e-06, 'epoch': 1.35} {'loss': 0.3665, 'learning_rate': 4.811556133878797e-06, 'epoch': 1.35} {'loss': 0.5095, 'learning_rate': 4.81127629407852e-06, 'epoch': 1.35} {'loss': 0.5113, 'learning_rate': 4.8109964598384315e-06, 'epoch': 1.35} {'loss': 0.6813, 'learning_rate': 4.810716631158826e-06, 'epoch': 1.35} {'loss': 0.4389, 'learning_rate': 4.810436808040006e-06, 'epoch': 1.35} {'loss': 0.5641, 'learning_rate': 4.810156990482271e-06, 'epoch': 1.35} {'loss': 0.654, 'learning_rate': 4.809877178485921e-06, 'epoch': 1.35} {'loss': 0.5095, 'learning_rate': 4.809597372051256e-06, 'epoch': 1.35} {'loss': 0.5521, 'learning_rate': 4.809317571178577e-06, 'epoch': 1.35} {'loss': 0.5668, 'learning_rate': 4.809037775868185e-06, 'epoch': 1.35} {'loss': 0.4452, 'learning_rate': 4.808757986120375e-06, 'epoch': 1.35} {'loss': 0.6175, 'learning_rate': 4.808478201935448e-06, 'epoch': 1.35} {'loss': 0.5555, 'learning_rate': 4.808198423313706e-06, 'epoch': 1.35} {'loss': 0.3836, 'learning_rate': 4.807918650255447e-06, 'epoch': 1.35} {'loss': 0.4312, 'learning_rate': 4.807638882760973e-06, 'epoch': 1.35} {'loss': 0.425, 'learning_rate': 4.8073591208305826e-06, 'epoch': 1.35} {'loss': 0.4862, 'learning_rate': 4.807079364464578e-06, 'epoch': 1.35} {'loss': 0.5474, 'learning_rate': 4.806799613663254e-06, 'epoch': 1.35} {'loss': 0.5601, 'learning_rate': 4.806519868426913e-06, 'epoch': 1.35} {'loss': 0.5626, 'learning_rate': 4.806240128755855e-06, 'epoch': 1.35} {'loss': 0.4931, 'learning_rate': 4.8059603946503785e-06, 'epoch': 1.35} {'loss': 0.4866, 'learning_rate': 4.805680666110789e-06, 'epoch': 1.35} {'loss': 0.629, 'learning_rate': 4.805400943137373e-06, 'epoch': 1.35} {'loss': 0.5436, 'learning_rate': 4.805121225730447e-06, 'epoch': 1.35} {'loss': 0.5166, 'learning_rate': 4.804841513890298e-06, 'epoch': 1.35} {'loss': 0.4846, 'learning_rate': 4.804561807617231e-06, 'epoch': 1.35} {'loss': 0.5497, 'learning_rate': 4.804282106911543e-06, 'epoch': 1.35} {'loss': 0.4591, 'learning_rate': 4.804002411773537e-06, 'epoch': 1.35} {'loss': 0.5285, 'learning_rate': 4.803722722203515e-06, 'epoch': 1.35} {'loss': 0.5582, 'learning_rate': 4.8034430382017676e-06, 'epoch': 1.35} {'loss': 0.6011, 'learning_rate': 4.803163359768604e-06, 'epoch': 1.35} {'loss': 0.417, 'learning_rate': 4.802883686904318e-06, 'epoch': 1.35} {'loss': 0.6098, 'learning_rate': 4.802604019609211e-06, 'epoch': 1.35} {'loss': 0.4959, 'learning_rate': 4.802324357883587e-06, 'epoch': 1.35} {'loss': 0.5994, 'learning_rate': 4.802044701727734e-06, 'epoch': 1.35} {'loss': 0.428, 'learning_rate': 4.801765051141967e-06, 'epoch': 1.35} {'loss': 0.4958, 'learning_rate': 4.801485406126569e-06, 'epoch': 1.35} {'loss': 0.5885, 'learning_rate': 4.801205766681858e-06, 'epoch': 1.35} {'loss': 0.6137, 'learning_rate': 4.800926132808119e-06, 'epoch': 1.35} {'loss': 0.3359, 'learning_rate': 4.800646504505657e-06, 'epoch': 1.35} {'loss': 0.5436, 'learning_rate': 4.800366881774776e-06, 'epoch': 1.35} {'loss': 0.6514, 'learning_rate': 4.800087264615764e-06, 'epoch': 1.35} {'loss': 0.5116, 'learning_rate': 4.799807653028934e-06, 'epoch': 1.35} {'loss': 0.5304, 'learning_rate': 4.799528047014573e-06, 'epoch': 1.35} {'loss': 0.5431, 'learning_rate': 4.7992484465729936e-06, 'epoch': 1.35} {'loss': 0.4445, 'learning_rate': 4.7989688517044865e-06, 'epoch': 1.35} {'loss': 0.5509, 'learning_rate': 4.798689262409353e-06, 'epoch': 1.35} {'loss': 0.6807, 'learning_rate': 4.798409678687896e-06, 'epoch': 1.35} {'loss': 0.507, 'learning_rate': 4.798130100540407e-06, 'epoch': 1.35} {'loss': 0.4939, 'learning_rate': 4.797850527967197e-06, 'epoch': 1.35} {'loss': 0.5763, 'learning_rate': 4.7975709609685535e-06, 'epoch': 1.35} {'loss': 0.4105, 'learning_rate': 4.797291399544789e-06, 'epoch': 1.35} {'loss': 0.4133, 'learning_rate': 4.797011843696193e-06, 'epoch': 1.35} {'loss': 0.5525, 'learning_rate': 4.796732293423068e-06, 'epoch': 1.35} {'loss': 0.4787, 'learning_rate': 4.796452748725718e-06, 'epoch': 1.35} {'loss': 0.4569, 'learning_rate': 4.796173209604431e-06, 'epoch': 1.35} {'loss': 0.4703, 'learning_rate': 4.795893676059521e-06, 'epoch': 1.35} {'loss': 0.5217, 'learning_rate': 4.795614148091273e-06, 'epoch': 1.35} {'loss': 0.599, 'learning_rate': 4.7953346257000035e-06, 'epoch': 1.35} {'loss': 0.4521, 'learning_rate': 4.7950551088859976e-06, 'epoch': 1.35} {'loss': 0.4263, 'learning_rate': 4.794775597649559e-06, 'epoch': 1.35} {'loss': 0.4606, 'learning_rate': 4.794496091990994e-06, 'epoch': 1.35} {'loss': 0.517, 'learning_rate': 4.794216591910588e-06, 'epoch': 1.35} {'loss': 0.5444, 'learning_rate': 4.7939370974086554e-06, 'epoch': 1.35} {'loss': 0.5309, 'learning_rate': 4.793657608485486e-06, 'epoch': 1.35} {'loss': 0.6319, 'learning_rate': 4.793378125141382e-06, 'epoch': 1.35} {'loss': 0.5468, 'learning_rate': 4.793098647376644e-06, 'epoch': 1.35} {'loss': 0.5405, 'learning_rate': 4.79281917519157e-06, 'epoch': 1.35} {'loss': 0.4653, 'learning_rate': 4.792539708586464e-06, 'epoch': 1.35} {'loss': 0.5522, 'learning_rate': 4.792260247561614e-06, 'epoch': 1.35} {'loss': 0.5466, 'learning_rate': 4.791980792117336e-06, 'epoch': 1.35} {'loss': 0.6337, 'learning_rate': 4.791701342253916e-06, 'epoch': 1.35} {'loss': 0.4824, 'learning_rate': 4.7914218979716574e-06, 'epoch': 1.35} {'loss': 0.5124, 'learning_rate': 4.791142459270861e-06, 'epoch': 1.35} {'loss': 0.4862, 'learning_rate': 4.790863026151826e-06, 'epoch': 1.35} {'loss': 0.5401, 'learning_rate': 4.790583598614856e-06, 'epoch': 1.35} {'loss': 0.4785, 'learning_rate': 4.790304176660236e-06, 'epoch': 1.35} {'loss': 0.5395, 'learning_rate': 4.790024760288284e-06, 'epoch': 1.35} {'loss': 0.5095, 'learning_rate': 4.789745349499287e-06, 'epoch': 1.35} {'loss': 0.3734, 'learning_rate': 4.7894659442935475e-06, 'epoch': 1.35} {'loss': 0.494, 'learning_rate': 4.78918654467137e-06, 'epoch': 1.35} {'loss': 0.4756, 'learning_rate': 4.788907150633042e-06, 'epoch': 1.35} {'loss': 0.3324, 'learning_rate': 4.788627762178878e-06, 'epoch': 1.35} {'loss': 0.441, 'learning_rate': 4.788348379309161e-06, 'epoch': 1.35} {'loss': 0.4715, 'learning_rate': 4.788069002024207e-06, 'epoch': 1.35} {'loss': 0.6124, 'learning_rate': 4.787789630324304e-06, 'epoch': 1.35} {'loss': 0.5662, 'learning_rate': 4.787510264209756e-06, 'epoch': 1.35} {'loss': 0.4111, 'learning_rate': 4.7872309036808625e-06, 'epoch': 1.35} {'loss': 0.5004, 'learning_rate': 4.786951548737916e-06, 'epoch': 1.35} {'loss': 0.5277, 'learning_rate': 4.786672199381228e-06, 'epoch': 1.35} {'loss': 0.7024, 'learning_rate': 4.786392855611088e-06, 'epoch': 1.35} {'loss': 0.3878, 'learning_rate': 4.786113517427799e-06, 'epoch': 1.35} {'loss': 0.4657, 'learning_rate': 4.785834184831659e-06, 'epoch': 1.35} {'loss': 0.6112, 'learning_rate': 4.785554857822969e-06, 'epoch': 1.35} {'loss': 0.6605, 'learning_rate': 4.7852755364020306e-06, 'epoch': 1.35} {'loss': 0.6087, 'learning_rate': 4.7849962205691335e-06, 'epoch': 1.35} {'loss': 0.5029, 'learning_rate': 4.7847169103245905e-06, 'epoch': 1.35} {'loss': 0.6062, 'learning_rate': 4.78443760566869e-06, 'epoch': 1.35} {'loss': 0.6513, 'learning_rate': 4.7841583066017365e-06, 'epoch': 1.35} {'loss': 0.5229, 'learning_rate': 4.783879013124028e-06, 'epoch': 1.35} {'loss': 0.4978, 'learning_rate': 4.783599725235862e-06, 'epoch': 1.35} {'loss': 0.3284, 'learning_rate': 4.783320442937546e-06, 'epoch': 1.35} {'loss': 0.5238, 'learning_rate': 4.783041166229364e-06, 'epoch': 1.35} {'loss': 0.6673, 'learning_rate': 4.782761895111632e-06, 'epoch': 1.35} {'loss': 0.5604, 'learning_rate': 4.782482629584638e-06, 'epoch': 1.35} {'loss': 0.6261, 'learning_rate': 4.7822033696486845e-06, 'epoch': 1.35} {'loss': 0.5207, 'learning_rate': 4.781924115304071e-06, 'epoch': 1.35} {'loss': 0.7062, 'learning_rate': 4.7816448665510974e-06, 'epoch': 1.35} {'loss': 0.5973, 'learning_rate': 4.7813656233900654e-06, 'epoch': 1.35} {'loss': 0.4803, 'learning_rate': 4.781086385821268e-06, 'epoch': 1.35} {'loss': 0.4743, 'learning_rate': 4.780807153845006e-06, 'epoch': 1.35} {'loss': 0.451, 'learning_rate': 4.780527927461581e-06, 'epoch': 1.35} {'loss': 0.5127, 'learning_rate': 4.780248706671292e-06, 'epoch': 1.35} {'loss': 0.6276, 'learning_rate': 4.779969491474438e-06, 'epoch': 1.35} {'loss': 0.5621, 'learning_rate': 4.7796902818713165e-06, 'epoch': 1.35} {'loss': 0.3734, 'learning_rate': 4.779411077862233e-06, 'epoch': 1.35} {'loss': 0.4263, 'learning_rate': 4.779131879447477e-06, 'epoch': 1.35} {'loss': 0.5503, 'learning_rate': 4.778852686627353e-06, 'epoch': 1.35} {'loss': 0.4549, 'learning_rate': 4.778573499402159e-06, 'epoch': 1.35} {'loss': 0.6292, 'learning_rate': 4.778294317772196e-06, 'epoch': 1.35} {'loss': 0.555, 'learning_rate': 4.778015141737761e-06, 'epoch': 1.35} {'loss': 0.5572, 'learning_rate': 4.777735971299154e-06, 'epoch': 1.35} {'loss': 0.6145, 'learning_rate': 4.7774568064566785e-06, 'epoch': 1.35} {'loss': 0.6542, 'learning_rate': 4.777177647210625e-06, 'epoch': 1.35} {'loss': 0.5099, 'learning_rate': 4.776898493561297e-06, 'epoch': 1.35} {'loss': 0.3798, 'learning_rate': 4.776619345508995e-06, 'epoch': 1.35} {'loss': 0.5072, 'learning_rate': 4.776340203054015e-06, 'epoch': 1.35} {'loss': 0.4683, 'learning_rate': 4.776061066196659e-06, 'epoch': 1.35} {'loss': 0.59, 'learning_rate': 4.775781934937229e-06, 'epoch': 1.35} {'loss': 0.5991, 'learning_rate': 4.775502809276016e-06, 'epoch': 1.35} {'loss': 0.5082, 'learning_rate': 4.775223689213323e-06, 'epoch': 1.35} {'loss': 0.5549, 'learning_rate': 4.77494457474945e-06, 'epoch': 1.35} {'loss': 0.4439, 'learning_rate': 4.774665465884694e-06, 'epoch': 1.35} {'loss': 0.5467, 'learning_rate': 4.774386362619358e-06, 'epoch': 1.35} {'loss': 0.6355, 'learning_rate': 4.774107264953737e-06, 'epoch': 1.35} {'loss': 0.5216, 'learning_rate': 4.773828172888136e-06, 'epoch': 1.35} {'loss': 0.506, 'learning_rate': 4.773549086422846e-06, 'epoch': 1.35} {'loss': 0.4641, 'learning_rate': 4.773270005558169e-06, 'epoch': 1.35} {'loss': 0.4497, 'learning_rate': 4.772990930294406e-06, 'epoch': 1.35} {'loss': 0.4301, 'learning_rate': 4.7727118606318555e-06, 'epoch': 1.35} {'loss': 0.7303, 'learning_rate': 4.772432796570818e-06, 'epoch': 1.35} {'loss': 0.5538, 'learning_rate': 4.772153738111584e-06, 'epoch': 1.35} {'loss': 0.5715, 'learning_rate': 4.771874685254467e-06, 'epoch': 1.35} {'loss': 0.5745, 'learning_rate': 4.771595637999754e-06, 'epoch': 1.35} {'loss': 0.6018, 'learning_rate': 4.7713165963477485e-06, 'epoch': 1.35} {'loss': 0.5304, 'learning_rate': 4.771037560298749e-06, 'epoch': 1.35} {'loss': 0.6759, 'learning_rate': 4.7707585298530544e-06, 'epoch': 1.35} {'loss': 0.5353, 'learning_rate': 4.770479505010969e-06, 'epoch': 1.35} {'loss': 0.5977, 'learning_rate': 4.770200485772782e-06, 'epoch': 1.35} {'loss': 0.4238, 'learning_rate': 4.769921472138796e-06, 'epoch': 1.35} {'loss': 0.4871, 'learning_rate': 4.769642464109313e-06, 'epoch': 1.35} {'loss': 0.4933, 'learning_rate': 4.7693634616846296e-06, 'epoch': 1.35} {'loss': 0.4758, 'learning_rate': 4.7690844648650444e-06, 'epoch': 1.35} {'loss': 0.4812, 'learning_rate': 4.768805473650859e-06, 'epoch': 1.35} {'loss': 0.5379, 'learning_rate': 4.768526488042374e-06, 'epoch': 1.35} {'loss': 0.5122, 'learning_rate': 4.76824750803988e-06, 'epoch': 1.35} {'loss': 0.3653, 'learning_rate': 4.767968533643683e-06, 'epoch': 1.35} {'loss': 0.5947, 'learning_rate': 4.7676895648540785e-06, 'epoch': 1.35} {'loss': 0.6568, 'learning_rate': 4.767410601671367e-06, 'epoch': 1.35} {'loss': 0.7087, 'learning_rate': 4.767131644095852e-06, 'epoch': 1.35} {'loss': 0.3558, 'learning_rate': 4.766852692127819e-06, 'epoch': 1.35} {'loss': 0.5842, 'learning_rate': 4.766573745767584e-06, 'epoch': 1.35} {'loss': 0.502, 'learning_rate': 4.766294805015433e-06, 'epoch': 1.35} {'loss': 0.5402, 'learning_rate': 4.766015869871671e-06, 'epoch': 1.35} {'loss': 0.4265, 'learning_rate': 4.765736940336594e-06, 'epoch': 1.35} {'loss': 0.5787, 'learning_rate': 4.765458016410502e-06, 'epoch': 1.35} {'loss': 0.5657, 'learning_rate': 4.7651790980936995e-06, 'epoch': 1.35} {'loss': 0.4847, 'learning_rate': 4.7649001853864715e-06, 'epoch': 1.35} {'loss': 0.5947, 'learning_rate': 4.764621278289133e-06, 'epoch': 1.35} {'loss': 0.5065, 'learning_rate': 4.764342376801972e-06, 'epoch': 1.35} {'loss': 0.6141, 'learning_rate': 4.764063480925291e-06, 'epoch': 1.35} {'loss': 0.6041, 'learning_rate': 4.7637845906593874e-06, 'epoch': 1.35} {'loss': 0.4567, 'learning_rate': 4.763505706004562e-06, 'epoch': 1.35} {'loss': 0.5983, 'learning_rate': 4.763226826961116e-06, 'epoch': 1.35} {'loss': 0.5768, 'learning_rate': 4.7629479535293375e-06, 'epoch': 1.35} {'loss': 0.5346, 'learning_rate': 4.7626690857095414e-06, 'epoch': 1.35} {'loss': 0.5107, 'learning_rate': 4.7623902235020145e-06, 'epoch': 1.35} {'loss': 0.5954, 'learning_rate': 4.762111366907058e-06, 'epoch': 1.35} {'loss': 0.6107, 'learning_rate': 4.761832515924977e-06, 'epoch': 1.35} {'loss': 0.6628, 'learning_rate': 4.761553670556056e-06, 'epoch': 1.35} {'loss': 0.4642, 'learning_rate': 4.761274830800612e-06, 'epoch': 1.35} {'loss': 0.462, 'learning_rate': 4.760995996658927e-06, 'epoch': 1.35} {'loss': 0.6855, 'learning_rate': 4.760717168131314e-06, 'epoch': 1.35} {'loss': 0.5177, 'learning_rate': 4.760438345218063e-06, 'epoch': 1.35} {'loss': 0.5402, 'learning_rate': 4.7601595279194754e-06, 'epoch': 1.35} {'loss': 0.5655, 'learning_rate': 4.759880716235853e-06, 'epoch': 1.35} {'loss': 0.4342, 'learning_rate': 4.759601910167484e-06, 'epoch': 1.35} {'loss': 0.5241, 'learning_rate': 4.759323109714682e-06, 'epoch': 1.35} {'loss': 0.5816, 'learning_rate': 4.759044314877731e-06, 'epoch': 1.35} {'loss': 0.509, 'learning_rate': 4.758765525656945e-06, 'epoch': 1.35} {'loss': 0.5064, 'learning_rate': 4.758486742052609e-06, 'epoch': 1.35} {'loss': 0.4905, 'learning_rate': 4.758207964065029e-06, 'epoch': 1.35} {'loss': 0.4854, 'learning_rate': 4.7579291916945055e-06, 'epoch': 1.35} {'loss': 0.5665, 'learning_rate': 4.757650424941327e-06, 'epoch': 1.35} {'loss': 0.4909, 'learning_rate': 4.757371663805807e-06, 'epoch': 1.35} {'loss': 0.6746, 'learning_rate': 4.757092908288227e-06, 'epoch': 1.35} {'loss': 0.5312, 'learning_rate': 4.756814158388905e-06, 'epoch': 1.35} {'loss': 0.4382, 'learning_rate': 4.7565354141081255e-06, 'epoch': 1.35} {'loss': 0.5575, 'learning_rate': 4.756256675446192e-06, 'epoch': 1.35} {'loss': 0.4728, 'learning_rate': 4.755977942403405e-06, 'epoch': 1.35} {'loss': 0.678, 'learning_rate': 4.755699214980054e-06, 'epoch': 1.35} {'loss': 0.4194, 'learning_rate': 4.755420493176452e-06, 'epoch': 1.35} {'loss': 0.5433, 'learning_rate': 4.755141776992884e-06, 'epoch': 1.35} {'loss': 0.3806, 'learning_rate': 4.754863066429661e-06, 'epoch': 1.35} {'loss': 0.4197, 'learning_rate': 4.754584361487073e-06, 'epoch': 1.35} {'loss': 0.4108, 'learning_rate': 4.75430566216542e-06, 'epoch': 1.35} {'loss': 0.5687, 'learning_rate': 4.754026968465008e-06, 'epoch': 1.35} {'loss': 0.5917, 'learning_rate': 4.7537482803861205e-06, 'epoch': 1.35} {'loss': 0.5063, 'learning_rate': 4.753469597929072e-06, 'epoch': 1.35} {'loss': 0.5731, 'learning_rate': 4.753190921094148e-06, 'epoch': 1.35} {'loss': 0.5943, 'learning_rate': 4.75291224988166e-06, 'epoch': 1.35} {'loss': 0.7176, 'learning_rate': 4.752633584291897e-06, 'epoch': 1.35} {'loss': 0.4662, 'learning_rate': 4.752354924325161e-06, 'epoch': 1.35} {'loss': 0.6051, 'learning_rate': 4.7520762699817535e-06, 'epoch': 1.35} {'loss': 0.486, 'learning_rate': 4.751797621261963e-06, 'epoch': 1.35} {'loss': 0.5631, 'learning_rate': 4.751518978166102e-06, 'epoch': 1.35} {'loss': 0.5505, 'learning_rate': 4.751240340694458e-06, 'epoch': 1.35} {'loss': 0.5947, 'learning_rate': 4.750961708847335e-06, 'epoch': 1.35} {'loss': 0.5058, 'learning_rate': 4.750683082625029e-06, 'epoch': 1.35} {'loss': 0.6378, 'learning_rate': 4.750404462027841e-06, 'epoch': 1.35} {'loss': 0.689, 'learning_rate': 4.750125847056072e-06, 'epoch': 1.35} {'loss': 0.5532, 'learning_rate': 4.749847237710009e-06, 'epoch': 1.35} {'loss': 0.5638, 'learning_rate': 4.749568633989966e-06, 'epoch': 1.35} {'loss': 0.4671, 'learning_rate': 4.74929003589623e-06, 'epoch': 1.35} {'loss': 0.5862, 'learning_rate': 4.749011443429104e-06, 'epoch': 1.35} {'loss': 0.543, 'learning_rate': 4.748732856588887e-06, 'epoch': 1.35} {'loss': 0.4935, 'learning_rate': 4.748454275375876e-06, 'epoch': 1.35} {'loss': 0.4457, 'learning_rate': 4.748175699790374e-06, 'epoch': 1.35} {'loss': 0.5364, 'learning_rate': 4.7478971298326715e-06, 'epoch': 1.35} {'loss': 0.5252, 'learning_rate': 4.747618565503072e-06, 'epoch': 1.35} {'loss': 0.5961, 'learning_rate': 4.7473400068018725e-06, 'epoch': 1.35} {'loss': 0.6251, 'learning_rate': 4.747061453729374e-06, 'epoch': 1.35} {'loss': 0.4389, 'learning_rate': 4.7467829062858716e-06, 'epoch': 1.35} {'loss': 0.5254, 'learning_rate': 4.746504364471666e-06, 'epoch': 1.35} {'loss': 0.451, 'learning_rate': 4.746225828287057e-06, 'epoch': 1.35} {'loss': 0.6285, 'learning_rate': 4.745947297732341e-06, 'epoch': 1.35} {'loss': 0.6404, 'learning_rate': 4.7456687728078144e-06, 'epoch': 1.35} {'loss': 0.4218, 'learning_rate': 4.7453902535137785e-06, 'epoch': 1.35} {'loss': 0.5308, 'learning_rate': 4.745111739850531e-06, 'epoch': 1.35} {'loss': 0.6306, 'learning_rate': 4.744833231818374e-06, 'epoch': 1.35} {'loss': 0.5498, 'learning_rate': 4.7445547294175956e-06, 'epoch': 1.35} {'loss': 0.4313, 'learning_rate': 4.744276232648508e-06, 'epoch': 1.35} {'loss': 0.5808, 'learning_rate': 4.7439977415114e-06, 'epoch': 1.35} {'loss': 0.6811, 'learning_rate': 4.7437192560065725e-06, 'epoch': 1.35} {'loss': 0.6531, 'learning_rate': 4.743440776134324e-06, 'epoch': 1.35} {'loss': 0.4638, 'learning_rate': 4.743162301894952e-06, 'epoch': 1.35} {'loss': 0.4174, 'learning_rate': 4.742883833288762e-06, 'epoch': 1.35} {'loss': 0.4133, 'learning_rate': 4.7426053703160415e-06, 'epoch': 1.35} {'loss': 0.5124, 'learning_rate': 4.7423269129770945e-06, 'epoch': 1.35} {'loss': 0.5159, 'learning_rate': 4.742048461272217e-06, 'epoch': 1.35} {'loss': 0.5028, 'learning_rate': 4.741770015201711e-06, 'epoch': 1.35} {'loss': 0.5821, 'learning_rate': 4.741491574765873e-06, 'epoch': 1.35} {'loss': 0.5509, 'learning_rate': 4.741213139965001e-06, 'epoch': 1.35} {'loss': 0.4431, 'learning_rate': 4.740934710799396e-06, 'epoch': 1.35} {'loss': 0.5613, 'learning_rate': 4.740656287269353e-06, 'epoch': 1.35} {'loss': 0.6103, 'learning_rate': 4.740377869375169e-06, 'epoch': 1.35} {'loss': 0.6765, 'learning_rate': 4.740099457117147e-06, 'epoch': 1.35} {'loss': 0.7369, 'learning_rate': 4.739821050495581e-06, 'epoch': 1.35} {'loss': 0.4488, 'learning_rate': 4.739542649510773e-06, 'epoch': 1.35} {'loss': 0.5482, 'learning_rate': 4.73926425416302e-06, 'epoch': 1.35} {'loss': 0.4759, 'learning_rate': 4.738985864452623e-06, 'epoch': 1.35} {'loss': 0.4224, 'learning_rate': 4.738707480379874e-06, 'epoch': 1.35} {'loss': 0.5304, 'learning_rate': 4.738429101945074e-06, 'epoch': 1.35} {'loss': 0.5851, 'learning_rate': 4.738150729148524e-06, 'epoch': 1.35} {'loss': 0.5652, 'learning_rate': 4.7378723619905195e-06, 'epoch': 1.35} {'loss': 0.5441, 'learning_rate': 4.737594000471359e-06, 'epoch': 1.35} {'loss': 0.4989, 'learning_rate': 4.737315644591347e-06, 'epoch': 1.35} {'loss': 0.571, 'learning_rate': 4.737037294350771e-06, 'epoch': 1.35} {'loss': 0.586, 'learning_rate': 4.736758949749934e-06, 'epoch': 1.35} {'loss': 0.4756, 'learning_rate': 4.736480610789137e-06, 'epoch': 1.35} {'loss': 0.725, 'learning_rate': 4.7362022774686745e-06, 'epoch': 1.35} {'loss': 0.4737, 'learning_rate': 4.735923949788846e-06, 'epoch': 1.35} {'loss': 0.6072, 'learning_rate': 4.735645627749952e-06, 'epoch': 1.35} {'loss': 0.5352, 'learning_rate': 4.735367311352291e-06, 'epoch': 1.35} {'loss': 0.6048, 'learning_rate': 4.735089000596156e-06, 'epoch': 1.36} {'loss': 0.5809, 'learning_rate': 4.734810695481848e-06, 'epoch': 1.36} {'loss': 0.5215, 'learning_rate': 4.734532396009666e-06, 'epoch': 1.36} {'loss': 0.5209, 'learning_rate': 4.734254102179907e-06, 'epoch': 1.36} {'loss': 0.5142, 'learning_rate': 4.73397581399287e-06, 'epoch': 1.36} {'loss': 0.5363, 'learning_rate': 4.7336975314488535e-06, 'epoch': 1.36} {'loss': 0.5538, 'learning_rate': 4.733419254548159e-06, 'epoch': 1.36} {'loss': 0.6767, 'learning_rate': 4.733140983291078e-06, 'epoch': 1.36} {'loss': 0.571, 'learning_rate': 4.73286271767791e-06, 'epoch': 1.36} {'loss': 0.4842, 'learning_rate': 4.732584457708957e-06, 'epoch': 1.36} {'loss': 0.5295, 'learning_rate': 4.732306203384516e-06, 'epoch': 1.36} {'loss': 0.3562, 'learning_rate': 4.7320279547048866e-06, 'epoch': 1.36} {'loss': 0.5356, 'learning_rate': 4.731749711670357e-06, 'epoch': 1.36} {'loss': 0.5633, 'learning_rate': 4.73147147428124e-06, 'epoch': 1.36} {'loss': 0.4739, 'learning_rate': 4.731193242537824e-06, 'epoch': 1.36} {'loss': 0.4882, 'learning_rate': 4.730915016440411e-06, 'epoch': 1.36} {'loss': 0.5056, 'learning_rate': 4.730636795989296e-06, 'epoch': 1.36} {'loss': 0.4985, 'learning_rate': 4.730358581184781e-06, 'epoch': 1.36} {'loss': 0.5811, 'learning_rate': 4.7300803720271645e-06, 'epoch': 1.36} {'loss': 0.4627, 'learning_rate': 4.729802168516736e-06, 'epoch': 1.36} {'loss': 0.5637, 'learning_rate': 4.7295239706538075e-06, 'epoch': 1.36} {'loss': 0.4806, 'learning_rate': 4.729245778438666e-06, 'epoch': 1.36} {'loss': 0.4974, 'learning_rate': 4.728967591871614e-06, 'epoch': 1.36} {'loss': 0.5326, 'learning_rate': 4.728689410952948e-06, 'epoch': 1.36} {'loss': 0.602, 'learning_rate': 4.728411235682968e-06, 'epoch': 1.36} {'loss': 0.5923, 'learning_rate': 4.728133066061974e-06, 'epoch': 1.36} {'loss': 0.6276, 'learning_rate': 4.727854902090254e-06, 'epoch': 1.36} {'loss': 0.5024, 'learning_rate': 4.727576743768121e-06, 'epoch': 1.36} {'loss': 0.4719, 'learning_rate': 4.727298591095861e-06, 'epoch': 1.36} {'loss': 0.5798, 'learning_rate': 4.727020444073778e-06, 'epoch': 1.36} {'loss': 0.553, 'learning_rate': 4.726742302702171e-06, 'epoch': 1.36} {'loss': 0.49, 'learning_rate': 4.7264641669813285e-06, 'epoch': 1.36} {'loss': 0.4549, 'learning_rate': 4.726186036911563e-06, 'epoch': 1.36} {'loss': 0.5214, 'learning_rate': 4.72590791249316e-06, 'epoch': 1.36} {'loss': 0.5127, 'learning_rate': 4.725629793726425e-06, 'epoch': 1.36} {'loss': 0.5445, 'learning_rate': 4.725351680611653e-06, 'epoch': 1.36} {'loss': 0.6606, 'learning_rate': 4.725073573149143e-06, 'epoch': 1.36} {'loss': 0.4525, 'learning_rate': 4.7247954713391954e-06, 'epoch': 1.36} {'loss': 0.4615, 'learning_rate': 4.724517375182098e-06, 'epoch': 1.36} {'loss': 0.5788, 'learning_rate': 4.7242392846781644e-06, 'epoch': 1.36} {'loss': 0.5829, 'learning_rate': 4.723961199827681e-06, 'epoch': 1.36} {'loss': 0.3842, 'learning_rate': 4.72368312063095e-06, 'epoch': 1.36} {'loss': 0.4719, 'learning_rate': 4.723405047088269e-06, 'epoch': 1.36} {'loss': 0.6128, 'learning_rate': 4.723126979199933e-06, 'epoch': 1.36} {'loss': 0.4294, 'learning_rate': 4.722848916966249e-06, 'epoch': 1.36} {'loss': 0.4524, 'learning_rate': 4.722570860387501e-06, 'epoch': 1.36} {'loss': 0.4921, 'learning_rate': 4.7222928094640006e-06, 'epoch': 1.36} {'loss': 0.4924, 'learning_rate': 4.722014764196038e-06, 'epoch': 1.36} {'loss': 0.6356, 'learning_rate': 4.721736724583912e-06, 'epoch': 1.36} {'loss': 0.5153, 'learning_rate': 4.7214586906279245e-06, 'epoch': 1.36} {'loss': 0.6145, 'learning_rate': 4.721180662328364e-06, 'epoch': 1.36} {'loss': 0.4721, 'learning_rate': 4.720902639685542e-06, 'epoch': 1.36} {'loss': 0.5458, 'learning_rate': 4.720624622699742e-06, 'epoch': 1.36} {'loss': 0.5406, 'learning_rate': 4.720346611371277e-06, 'epoch': 1.36} {'loss': 0.6045, 'learning_rate': 4.720068605700432e-06, 'epoch': 1.36} {'loss': 0.4038, 'learning_rate': 4.719790605687511e-06, 'epoch': 1.36} {'loss': 0.5462, 'learning_rate': 4.719512611332815e-06, 'epoch': 1.36} {'loss': 0.4655, 'learning_rate': 4.71923462263663e-06, 'epoch': 1.36} {'loss': 0.6198, 'learning_rate': 4.718956639599269e-06, 'epoch': 1.36} {'loss': 0.4974, 'learning_rate': 4.718678662221016e-06, 'epoch': 1.36} {'loss': 0.5082, 'learning_rate': 4.7184006905021814e-06, 'epoch': 1.36} {'loss': 0.45, 'learning_rate': 4.718122724443055e-06, 'epoch': 1.36} {'loss': 0.4881, 'learning_rate': 4.717844764043935e-06, 'epoch': 1.36} {'loss': 0.4152, 'learning_rate': 4.717566809305126e-06, 'epoch': 1.36} {'loss': 0.5104, 'learning_rate': 4.717288860226914e-06, 'epoch': 1.36} {'loss': 0.6043, 'learning_rate': 4.71701091680961e-06, 'epoch': 1.36} {'loss': 0.4673, 'learning_rate': 4.716732979053499e-06, 'epoch': 1.36} {'loss': 0.3708, 'learning_rate': 4.716455046958893e-06, 'epoch': 1.36} {'loss': 0.56, 'learning_rate': 4.7161771205260785e-06, 'epoch': 1.36} {'loss': 0.4924, 'learning_rate': 4.715899199755356e-06, 'epoch': 1.36} {'loss': 0.5651, 'learning_rate': 4.71562128464703e-06, 'epoch': 1.36} {'loss': 0.5963, 'learning_rate': 4.715343375201384e-06, 'epoch': 1.36} {'loss': 0.5724, 'learning_rate': 4.715065471418731e-06, 'epoch': 1.36} {'loss': 0.6219, 'learning_rate': 4.714787573299357e-06, 'epoch': 1.36} {'loss': 0.4805, 'learning_rate': 4.714509680843572e-06, 'epoch': 1.36} {'loss': 0.5562, 'learning_rate': 4.7142317940516635e-06, 'epoch': 1.36} {'loss': 0.5162, 'learning_rate': 4.713953912923932e-06, 'epoch': 1.36} {'loss': 0.7071, 'learning_rate': 4.71367603746068e-06, 'epoch': 1.36} {'loss': 0.6087, 'learning_rate': 4.713398167662193e-06, 'epoch': 1.36} {'loss': 0.5262, 'learning_rate': 4.713120303528785e-06, 'epoch': 1.36} {'loss': 0.5431, 'learning_rate': 4.712842445060742e-06, 'epoch': 1.36} {'loss': 0.592, 'learning_rate': 4.712564592258366e-06, 'epoch': 1.36} {'loss': 0.5601, 'learning_rate': 4.712286745121954e-06, 'epoch': 1.36} {'loss': 0.5074, 'learning_rate': 4.7120089036518034e-06, 'epoch': 1.36} {'loss': 0.5768, 'learning_rate': 4.711731067848217e-06, 'epoch': 1.36} {'loss': 0.5554, 'learning_rate': 4.711453237711481e-06, 'epoch': 1.36} {'loss': 0.4973, 'learning_rate': 4.711175413241907e-06, 'epoch': 1.36} {'loss': 0.3139, 'learning_rate': 4.710897594439782e-06, 'epoch': 1.36} {'loss': 0.5347, 'learning_rate': 4.710619781305408e-06, 'epoch': 1.36} {'loss': 0.4948, 'learning_rate': 4.710341973839082e-06, 'epoch': 1.36} {'loss': 0.501, 'learning_rate': 4.710064172041102e-06, 'epoch': 1.36} {'loss': 0.5178, 'learning_rate': 4.70978637591177e-06, 'epoch': 1.36} {'loss': 0.5933, 'learning_rate': 4.709508585451371e-06, 'epoch': 1.36} {'loss': 0.4418, 'learning_rate': 4.7092308006602195e-06, 'epoch': 1.36} {'loss': 0.5272, 'learning_rate': 4.7089530215386e-06, 'epoch': 1.36} {'loss': 0.6144, 'learning_rate': 4.7086752480868144e-06, 'epoch': 1.36} {'loss': 0.6188, 'learning_rate': 4.708397480305162e-06, 'epoch': 1.36} {'loss': 0.5621, 'learning_rate': 4.70811971819394e-06, 'epoch': 1.36} {'loss': 0.5533, 'learning_rate': 4.707841961753448e-06, 'epoch': 1.36} {'loss': 0.6429, 'learning_rate': 4.707564210983977e-06, 'epoch': 1.36} {'loss': 0.647, 'learning_rate': 4.707286465885829e-06, 'epoch': 1.36} {'loss': 0.5111, 'learning_rate': 4.707008726459302e-06, 'epoch': 1.36} {'loss': 0.6184, 'learning_rate': 4.7067309927046916e-06, 'epoch': 1.36} {'loss': 0.5827, 'learning_rate': 4.706453264622297e-06, 'epoch': 1.36} {'loss': 0.5934, 'learning_rate': 4.706175542212416e-06, 'epoch': 1.36} {'loss': 0.5836, 'learning_rate': 4.705897825475348e-06, 'epoch': 1.36} {'loss': 0.5611, 'learning_rate': 4.705620114411386e-06, 'epoch': 1.36} {'loss': 0.4809, 'learning_rate': 4.70534240902083e-06, 'epoch': 1.36} {'loss': 0.4416, 'learning_rate': 4.705064709303977e-06, 'epoch': 1.36} {'loss': 0.6178, 'learning_rate': 4.704787015261125e-06, 'epoch': 1.36} {'loss': 0.5352, 'learning_rate': 4.704509326892573e-06, 'epoch': 1.36} {'loss': 0.5147, 'learning_rate': 4.704231644198615e-06, 'epoch': 1.36} {'loss': 0.4589, 'learning_rate': 4.7039539671795555e-06, 'epoch': 1.36} {'loss': 0.5778, 'learning_rate': 4.703676295835683e-06, 'epoch': 1.36} {'loss': 0.5308, 'learning_rate': 4.703398630167301e-06, 'epoch': 1.36} {'loss': 0.6073, 'learning_rate': 4.7031209701747035e-06, 'epoch': 1.36} {'loss': 0.6037, 'learning_rate': 4.702843315858191e-06, 'epoch': 1.36} {'loss': 0.5596, 'learning_rate': 4.702565667218063e-06, 'epoch': 1.36} {'loss': 0.568, 'learning_rate': 4.702288024254611e-06, 'epoch': 1.36} {'loss': 0.4808, 'learning_rate': 4.702010386968135e-06, 'epoch': 1.36} {'loss': 0.5006, 'learning_rate': 4.701732755358934e-06, 'epoch': 1.36} {'loss': 0.5312, 'learning_rate': 4.7014551294273035e-06, 'epoch': 1.36} {'loss': 0.2739, 'learning_rate': 4.701177509173543e-06, 'epoch': 1.36} {'loss': 0.5506, 'learning_rate': 4.7008998945979485e-06, 'epoch': 1.36} {'loss': 0.4267, 'learning_rate': 4.700622285700822e-06, 'epoch': 1.36} {'loss': 0.5987, 'learning_rate': 4.700344682482453e-06, 'epoch': 1.36} {'loss': 0.6674, 'learning_rate': 4.700067084943143e-06, 'epoch': 1.36} {'loss': 0.5184, 'learning_rate': 4.69978949308319e-06, 'epoch': 1.36} {'loss': 0.4133, 'learning_rate': 4.699511906902891e-06, 'epoch': 1.36} {'loss': 0.6307, 'learning_rate': 4.699234326402542e-06, 'epoch': 1.36} {'loss': 0.4394, 'learning_rate': 4.698956751582447e-06, 'epoch': 1.36} {'loss': 0.6318, 'learning_rate': 4.698679182442894e-06, 'epoch': 1.36} {'loss': 0.6387, 'learning_rate': 4.698401618984184e-06, 'epoch': 1.36} {'loss': 0.5682, 'learning_rate': 4.698124061206616e-06, 'epoch': 1.36} {'loss': 0.5396, 'learning_rate': 4.697846509110486e-06, 'epoch': 1.36} {'loss': 0.4144, 'learning_rate': 4.697568962696093e-06, 'epoch': 1.36} {'loss': 0.5907, 'learning_rate': 4.697291421963733e-06, 'epoch': 1.36} {'loss': 0.4713, 'learning_rate': 4.697013886913707e-06, 'epoch': 1.36} {'loss': 0.5003, 'learning_rate': 4.6967363575463065e-06, 'epoch': 1.36} {'loss': 0.4486, 'learning_rate': 4.696458833861831e-06, 'epoch': 1.36} {'loss': 0.3065, 'learning_rate': 4.696181315860579e-06, 'epoch': 1.36} {'loss': 0.5777, 'learning_rate': 4.695903803542847e-06, 'epoch': 1.36} {'loss': 0.5664, 'learning_rate': 4.6956262969089325e-06, 'epoch': 1.36} {'loss': 0.4774, 'learning_rate': 4.695348795959133e-06, 'epoch': 1.36} {'loss': 0.4865, 'learning_rate': 4.695071300693751e-06, 'epoch': 1.36} {'loss': 0.489, 'learning_rate': 4.694793811113074e-06, 'epoch': 1.36} {'loss': 0.6137, 'learning_rate': 4.6945163272174056e-06, 'epoch': 1.36} {'loss': 0.6183, 'learning_rate': 4.694238849007041e-06, 'epoch': 1.36} {'loss': 0.4669, 'learning_rate': 4.693961376482278e-06, 'epoch': 1.36} {'loss': 0.4519, 'learning_rate': 4.6936839096434185e-06, 'epoch': 1.36} {'loss': 0.5364, 'learning_rate': 4.693406448490748e-06, 'epoch': 1.36} {'loss': 0.596, 'learning_rate': 4.69312899302458e-06, 'epoch': 1.36} {'loss': 0.5458, 'learning_rate': 4.692851543245197e-06, 'epoch': 1.36} {'loss': 0.5684, 'learning_rate': 4.692574099152905e-06, 'epoch': 1.36} {'loss': 0.5928, 'learning_rate': 4.692296660747997e-06, 'epoch': 1.36} {'loss': 0.4564, 'learning_rate': 4.692019228030773e-06, 'epoch': 1.36} {'loss': 0.591, 'learning_rate': 4.691741801001534e-06, 'epoch': 1.36} {'loss': 0.546, 'learning_rate': 4.691464379660564e-06, 'epoch': 1.36} {'loss': 0.5214, 'learning_rate': 4.691186964008178e-06, 'epoch': 1.36} {'loss': 0.4912, 'learning_rate': 4.690909554044659e-06, 'epoch': 1.36} {'loss': 0.6474, 'learning_rate': 4.69063214977031e-06, 'epoch': 1.36} {'loss': 0.5214, 'learning_rate': 4.690354751185429e-06, 'epoch': 1.36} {'loss': 0.5212, 'learning_rate': 4.69007735829031e-06, 'epoch': 1.36} {'loss': 0.4442, 'learning_rate': 4.689799971085257e-06, 'epoch': 1.36} {'loss': 0.5758, 'learning_rate': 4.6895225895705566e-06, 'epoch': 1.36} {'loss': 0.3617, 'learning_rate': 4.6892452137465184e-06, 'epoch': 1.36} {'loss': 0.5234, 'learning_rate': 4.688967843613429e-06, 'epoch': 1.36} {'loss': 0.5325, 'learning_rate': 4.688690479171591e-06, 'epoch': 1.36} {'loss': 0.4414, 'learning_rate': 4.688413120421303e-06, 'epoch': 1.36} {'loss': 0.5335, 'learning_rate': 4.688135767362853e-06, 'epoch': 1.36} {'loss': 0.5379, 'learning_rate': 4.6878584199965526e-06, 'epoch': 1.36} {'loss': 0.6029, 'learning_rate': 4.687581078322683e-06, 'epoch': 1.36} {'loss': 0.5129, 'learning_rate': 4.687303742341558e-06, 'epoch': 1.36} {'loss': 0.5069, 'learning_rate': 4.687026412053463e-06, 'epoch': 1.36} {'loss': 0.5969, 'learning_rate': 4.686749087458698e-06, 'epoch': 1.36} {'loss': 0.5291, 'learning_rate': 4.686471768557565e-06, 'epoch': 1.36} {'loss': 0.455, 'learning_rate': 4.686194455350351e-06, 'epoch': 1.36} {'loss': 0.5173, 'learning_rate': 4.685917147837364e-06, 'epoch': 1.36} {'loss': 0.5237, 'learning_rate': 4.68563984601889e-06, 'epoch': 1.36} {'loss': 0.5371, 'learning_rate': 4.685362549895241e-06, 'epoch': 1.36} {'loss': 0.4948, 'learning_rate': 4.685085259466701e-06, 'epoch': 1.36} {'loss': 0.5991, 'learning_rate': 4.684807974733572e-06, 'epoch': 1.36} {'loss': 0.5697, 'learning_rate': 4.684530695696154e-06, 'epoch': 1.36} {'loss': 0.578, 'learning_rate': 4.684253422354736e-06, 'epoch': 1.36} {'loss': 0.4991, 'learning_rate': 4.683976154709625e-06, 'epoch': 1.36} {'loss': 0.4711, 'learning_rate': 4.683698892761107e-06, 'epoch': 1.36} {'loss': 0.5338, 'learning_rate': 4.683421636509493e-06, 'epoch': 1.36} {'loss': 0.5402, 'learning_rate': 4.68314438595507e-06, 'epoch': 1.36} {'loss': 0.6823, 'learning_rate': 4.682867141098136e-06, 'epoch': 1.36} {'loss': 0.5091, 'learning_rate': 4.682589901938994e-06, 'epoch': 1.36} {'loss': 0.3769, 'learning_rate': 4.68231266847793e-06, 'epoch': 1.36} {'loss': 0.6781, 'learning_rate': 4.682035440715253e-06, 'epoch': 1.36} {'loss': 0.453, 'learning_rate': 4.6817582186512545e-06, 'epoch': 1.36} {'loss': 0.5739, 'learning_rate': 4.68148100228623e-06, 'epoch': 1.36} {'loss': 0.6207, 'learning_rate': 4.681203791620479e-06, 'epoch': 1.36} {'loss': 0.5136, 'learning_rate': 4.680926586654298e-06, 'epoch': 1.36} {'loss': 0.5357, 'learning_rate': 4.680649387387989e-06, 'epoch': 1.36} {'loss': 0.5904, 'learning_rate': 4.680372193821836e-06, 'epoch': 1.36} {'loss': 0.5605, 'learning_rate': 4.680095005956153e-06, 'epoch': 1.36} {'loss': 0.5067, 'learning_rate': 4.679817823791223e-06, 'epoch': 1.36} {'loss': 0.5856, 'learning_rate': 4.679540647327348e-06, 'epoch': 1.36} {'loss': 0.6158, 'learning_rate': 4.679263476564827e-06, 'epoch': 1.36} {'loss': 0.4201, 'learning_rate': 4.6789863115039545e-06, 'epoch': 1.36} {'loss': 0.6006, 'learning_rate': 4.678709152145033e-06, 'epoch': 1.36} {'loss': 0.4791, 'learning_rate': 4.678431998488346e-06, 'epoch': 1.36} {'loss': 0.5973, 'learning_rate': 4.678154850534209e-06, 'epoch': 1.36} {'loss': 0.663, 'learning_rate': 4.6778777082829045e-06, 'epoch': 1.36} {'loss': 0.4813, 'learning_rate': 4.677600571734734e-06, 'epoch': 1.36} {'loss': 0.5676, 'learning_rate': 4.677323440889999e-06, 'epoch': 1.36} {'loss': 0.4615, 'learning_rate': 4.6770463157489845e-06, 'epoch': 1.36} {'loss': 0.4448, 'learning_rate': 4.676769196312003e-06, 'epoch': 1.36} {'loss': 0.4022, 'learning_rate': 4.6764920825793366e-06, 'epoch': 1.36} {'loss': 0.6648, 'learning_rate': 4.676214974551296e-06, 'epoch': 1.36} {'loss': 0.5385, 'learning_rate': 4.675937872228169e-06, 'epoch': 1.36} {'loss': 0.5222, 'learning_rate': 4.675660775610255e-06, 'epoch': 1.36} {'loss': 0.3472, 'learning_rate': 4.675383684697854e-06, 'epoch': 1.36} {'loss': 0.5842, 'learning_rate': 4.675106599491252e-06, 'epoch': 1.36} {'loss': 0.4027, 'learning_rate': 4.674829519990763e-06, 'epoch': 1.36} {'loss': 0.4487, 'learning_rate': 4.674552446196671e-06, 'epoch': 1.36} {'loss': 0.4813, 'learning_rate': 4.674275378109275e-06, 'epoch': 1.36} {'loss': 0.5875, 'learning_rate': 4.673998315728875e-06, 'epoch': 1.36} {'loss': 0.5623, 'learning_rate': 4.673721259055766e-06, 'epoch': 1.36} {'loss': 0.477, 'learning_rate': 4.673444208090248e-06, 'epoch': 1.36} {'loss': 0.6105, 'learning_rate': 4.67316716283261e-06, 'epoch': 1.36} {'loss': 0.4482, 'learning_rate': 4.67289012328316e-06, 'epoch': 1.36} {'loss': 0.5579, 'learning_rate': 4.672613089442186e-06, 'epoch': 1.36} {'loss': 0.5571, 'learning_rate': 4.672336061309987e-06, 'epoch': 1.36} {'loss': 0.4427, 'learning_rate': 4.6720590388868625e-06, 'epoch': 1.36} {'loss': 0.6365, 'learning_rate': 4.6717820221731065e-06, 'epoch': 1.36} {'loss': 0.4533, 'learning_rate': 4.671505011169022e-06, 'epoch': 1.36} {'loss': 0.5207, 'learning_rate': 4.671228005874892e-06, 'epoch': 1.36} {'loss': 0.5467, 'learning_rate': 4.670951006291029e-06, 'epoch': 1.36} {'loss': 0.4935, 'learning_rate': 4.67067401241772e-06, 'epoch': 1.36} {'loss': 0.5997, 'learning_rate': 4.670397024255266e-06, 'epoch': 1.36} {'loss': 0.5756, 'learning_rate': 4.67012004180396e-06, 'epoch': 1.36} {'loss': 0.661, 'learning_rate': 4.669843065064104e-06, 'epoch': 1.36} {'loss': 0.2862, 'learning_rate': 4.669566094035994e-06, 'epoch': 1.36} {'loss': 0.5852, 'learning_rate': 4.669289128719923e-06, 'epoch': 1.36} {'loss': 0.4556, 'learning_rate': 4.669012169116189e-06, 'epoch': 1.36} {'loss': 0.6584, 'learning_rate': 4.66873521522509e-06, 'epoch': 1.36} {'loss': 0.6109, 'learning_rate': 4.668458267046921e-06, 'epoch': 1.36} {'loss': 0.4452, 'learning_rate': 4.668181324581982e-06, 'epoch': 1.36} {'loss': 0.4783, 'learning_rate': 4.667904387830566e-06, 'epoch': 1.36} {'loss': 0.5959, 'learning_rate': 4.667627456792977e-06, 'epoch': 1.36} {'loss': 0.4752, 'learning_rate': 4.6673505314695025e-06, 'epoch': 1.36} {'loss': 0.5379, 'learning_rate': 4.667073611860443e-06, 'epoch': 1.36} {'loss': 0.588, 'learning_rate': 4.666796697966096e-06, 'epoch': 1.36} {'loss': 0.4192, 'learning_rate': 4.666519789786756e-06, 'epoch': 1.36} {'loss': 0.4789, 'learning_rate': 4.666242887322723e-06, 'epoch': 1.36} {'loss': 0.3366, 'learning_rate': 4.665965990574291e-06, 'epoch': 1.36} {'loss': 0.4327, 'learning_rate': 4.6656890995417636e-06, 'epoch': 1.36} {'loss': 0.5435, 'learning_rate': 4.665412214225427e-06, 'epoch': 1.36} {'loss': 0.4319, 'learning_rate': 4.665135334625582e-06, 'epoch': 1.36} {'loss': 0.5925, 'learning_rate': 4.6648584607425265e-06, 'epoch': 1.36} {'loss': 0.6374, 'learning_rate': 4.664581592576556e-06, 'epoch': 1.36} {'loss': 0.6121, 'learning_rate': 4.6643047301279684e-06, 'epoch': 1.36} {'loss': 0.4874, 'learning_rate': 4.664027873397065e-06, 'epoch': 1.36} {'loss': 0.6613, 'learning_rate': 4.663751022384131e-06, 'epoch': 1.36} {'loss': 0.5872, 'learning_rate': 4.6634741770894705e-06, 'epoch': 1.36} {'loss': 0.6303, 'learning_rate': 4.6631973375133795e-06, 'epoch': 1.36} {'loss': 0.5101, 'learning_rate': 4.662920503656154e-06, 'epoch': 1.36} {'loss': 0.4379, 'learning_rate': 4.662643675518091e-06, 'epoch': 1.36} {'loss': 0.5127, 'learning_rate': 4.662366853099487e-06, 'epoch': 1.36} {'loss': 0.4767, 'learning_rate': 4.662090036400643e-06, 'epoch': 1.36} {'loss': 0.591, 'learning_rate': 4.661813225421846e-06, 'epoch': 1.36} {'loss': 0.5913, 'learning_rate': 4.661536420163399e-06, 'epoch': 1.36} {'loss': 0.6337, 'learning_rate': 4.661259620625598e-06, 'epoch': 1.36} {'loss': 0.6302, 'learning_rate': 4.660982826808738e-06, 'epoch': 1.36} {'loss': 0.493, 'learning_rate': 4.660706038713117e-06, 'epoch': 1.36} {'loss': 0.7106, 'learning_rate': 4.660429256339032e-06, 'epoch': 1.36} {'loss': 0.4668, 'learning_rate': 4.660152479686783e-06, 'epoch': 1.36} {'loss': 0.5866, 'learning_rate': 4.659875708756657e-06, 'epoch': 1.36} {'loss': 0.6132, 'learning_rate': 4.659598943548957e-06, 'epoch': 1.36} {'loss': 0.4242, 'learning_rate': 4.65932218406398e-06, 'epoch': 1.36} {'loss': 0.5663, 'learning_rate': 4.65904543030202e-06, 'epoch': 1.36} {'loss': 0.6688, 'learning_rate': 4.65876868226338e-06, 'epoch': 1.36} {'loss': 0.4914, 'learning_rate': 4.658491939948347e-06, 'epoch': 1.36} {'loss': 0.4783, 'learning_rate': 4.65821520335722e-06, 'epoch': 1.36} {'loss': 0.6386, 'learning_rate': 4.6579384724903e-06, 'epoch': 1.36} {'loss': 0.4983, 'learning_rate': 4.65766174734788e-06, 'epoch': 1.36} {'loss': 0.5872, 'learning_rate': 4.657385027930258e-06, 'epoch': 1.36} {'loss': 0.4794, 'learning_rate': 4.65710831423773e-06, 'epoch': 1.36} {'loss': 0.7131, 'learning_rate': 4.656831606270596e-06, 'epoch': 1.36} {'loss': 0.5648, 'learning_rate': 4.656554904029147e-06, 'epoch': 1.36} {'loss': 0.4807, 'learning_rate': 4.656278207513681e-06, 'epoch': 1.36} {'loss': 0.5367, 'learning_rate': 4.656001516724494e-06, 'epoch': 1.36} {'loss': 0.5368, 'learning_rate': 4.655724831661885e-06, 'epoch': 1.36} {'loss': 0.4219, 'learning_rate': 4.655448152326149e-06, 'epoch': 1.36} {'loss': 0.4969, 'learning_rate': 4.655171478717582e-06, 'epoch': 1.36} {'loss': 0.5158, 'learning_rate': 4.654894810836485e-06, 'epoch': 1.36} {'loss': 0.4748, 'learning_rate': 4.654618148683148e-06, 'epoch': 1.36} {'loss': 0.4928, 'learning_rate': 4.654341492257869e-06, 'epoch': 1.36} {'loss': 0.5167, 'learning_rate': 4.654064841560946e-06, 'epoch': 1.36} {'loss': 0.5423, 'learning_rate': 4.653788196592674e-06, 'epoch': 1.36} {'loss': 0.5913, 'learning_rate': 4.653511557353355e-06, 'epoch': 1.36} {'loss': 0.5857, 'learning_rate': 4.653234923843274e-06, 'epoch': 1.36} {'loss': 0.5777, 'learning_rate': 4.652958296062742e-06, 'epoch': 1.36} {'loss': 0.6076, 'learning_rate': 4.652681674012043e-06, 'epoch': 1.36} {'loss': 0.5157, 'learning_rate': 4.6524050576914785e-06, 'epoch': 1.36} {'loss': 0.4486, 'learning_rate': 4.652128447101345e-06, 'epoch': 1.36} {'loss': 0.5451, 'learning_rate': 4.651851842241938e-06, 'epoch': 1.36} {'loss': 0.4867, 'learning_rate': 4.651575243113559e-06, 'epoch': 1.36} {'loss': 0.442, 'learning_rate': 4.651298649716491e-06, 'epoch': 1.36} {'loss': 0.432, 'learning_rate': 4.651022062051048e-06, 'epoch': 1.36} {'loss': 0.4554, 'learning_rate': 4.650745480117513e-06, 'epoch': 1.36} {'loss': 0.6465, 'learning_rate': 4.650468903916187e-06, 'epoch': 1.36} {'loss': 0.599, 'learning_rate': 4.650192333447372e-06, 'epoch': 1.36} {'loss': 0.6536, 'learning_rate': 4.649915768711349e-06, 'epoch': 1.36} {'loss': 0.4265, 'learning_rate': 4.649639209708433e-06, 'epoch': 1.36} {'loss': 0.6008, 'learning_rate': 4.649362656438904e-06, 'epoch': 1.36} {'loss': 0.3975, 'learning_rate': 4.649086108903073e-06, 'epoch': 1.36} {'loss': 0.5156, 'learning_rate': 4.648809567101225e-06, 'epoch': 1.36} {'loss': 0.5114, 'learning_rate': 4.648533031033661e-06, 'epoch': 1.36} {'loss': 0.5732, 'learning_rate': 4.648256500700679e-06, 'epoch': 1.36} {'loss': 0.6138, 'learning_rate': 4.647979976102568e-06, 'epoch': 1.36} {'loss': 0.625, 'learning_rate': 4.647703457239636e-06, 'epoch': 1.36} {'loss': 0.5249, 'learning_rate': 4.647426944112166e-06, 'epoch': 1.36} {'loss': 0.5396, 'learning_rate': 4.647150436720468e-06, 'epoch': 1.36} {'loss': 0.4045, 'learning_rate': 4.646873935064827e-06, 'epoch': 1.36} {'loss': 0.671, 'learning_rate': 4.646597439145545e-06, 'epoch': 1.36} {'loss': 0.5976, 'learning_rate': 4.64632094896292e-06, 'epoch': 1.36} {'loss': 0.5634, 'learning_rate': 4.6460444645172386e-06, 'epoch': 1.36} {'loss': 0.4788, 'learning_rate': 4.645767985808811e-06, 'epoch': 1.36} {'loss': 0.6058, 'learning_rate': 4.645491512837918e-06, 'epoch': 1.36} {'loss': 0.4051, 'learning_rate': 4.645215045604872e-06, 'epoch': 1.36} {'loss': 0.5831, 'learning_rate': 4.644938584109958e-06, 'epoch': 1.36} {'loss': 0.6439, 'learning_rate': 4.644662128353476e-06, 'epoch': 1.36} {'loss': 0.5844, 'learning_rate': 4.644385678335725e-06, 'epoch': 1.36} {'loss': 0.5577, 'learning_rate': 4.6441092340569905e-06, 'epoch': 1.36} {'loss': 0.4556, 'learning_rate': 4.643832795517583e-06, 'epoch': 1.36} {'loss': 0.5762, 'learning_rate': 4.643556362717786e-06, 'epoch': 1.36} {'loss': 0.6324, 'learning_rate': 4.643279935657908e-06, 'epoch': 1.36} {'loss': 0.6097, 'learning_rate': 4.6430035143382364e-06, 'epoch': 1.36} {'loss': 0.4702, 'learning_rate': 4.64272709875907e-06, 'epoch': 1.36} {'loss': 0.5644, 'learning_rate': 4.642450688920709e-06, 'epoch': 1.36} {'loss': 0.4928, 'learning_rate': 4.642174284823438e-06, 'epoch': 1.36} {'loss': 0.4968, 'learning_rate': 4.641897886467568e-06, 'epoch': 1.36} {'loss': 0.524, 'learning_rate': 4.64162149385338e-06, 'epoch': 1.36} {'loss': 0.336, 'learning_rate': 4.641345106981187e-06, 'epoch': 1.36} {'loss': 0.4966, 'learning_rate': 4.641068725851271e-06, 'epoch': 1.36} {'loss': 0.4633, 'learning_rate': 4.640792350463935e-06, 'epoch': 1.36} {'loss': 0.5707, 'learning_rate': 4.640515980819476e-06, 'epoch': 1.36} {'loss': 0.3731, 'learning_rate': 4.640239616918182e-06, 'epoch': 1.36} {'loss': 0.5506, 'learning_rate': 4.639963258760362e-06, 'epoch': 1.36} {'loss': 0.5636, 'learning_rate': 4.6396869063463005e-06, 'epoch': 1.36} {'loss': 0.5383, 'learning_rate': 4.639410559676298e-06, 'epoch': 1.36} {'loss': 0.3426, 'learning_rate': 4.639134218750653e-06, 'epoch': 1.36} {'loss': 0.4398, 'learning_rate': 4.638857883569657e-06, 'epoch': 1.36} {'loss': 0.4968, 'learning_rate': 4.638581554133614e-06, 'epoch': 1.36} {'loss': 0.5329, 'learning_rate': 4.6383052304428075e-06, 'epoch': 1.36} {'loss': 0.4658, 'learning_rate': 4.638028912497547e-06, 'epoch': 1.36} {'loss': 0.5637, 'learning_rate': 4.63775260029812e-06, 'epoch': 1.36} {'loss': 0.6124, 'learning_rate': 4.637476293844825e-06, 'epoch': 1.36} {'loss': 0.6149, 'learning_rate': 4.637199993137958e-06, 'epoch': 1.36} {'loss': 0.4393, 'learning_rate': 4.636923698177814e-06, 'epoch': 1.36} {'loss': 0.5707, 'learning_rate': 4.636647408964695e-06, 'epoch': 1.36} {'loss': 0.5222, 'learning_rate': 4.636371125498885e-06, 'epoch': 1.36} {'loss': 0.7298, 'learning_rate': 4.636094847780696e-06, 'epoch': 1.36} {'loss': 0.5532, 'learning_rate': 4.6358185758104105e-06, 'epoch': 1.36} {'loss': 0.5519, 'learning_rate': 4.635542309588329e-06, 'epoch': 1.36} {'loss': 0.5217, 'learning_rate': 4.635266049114753e-06, 'epoch': 1.36} {'loss': 0.6777, 'learning_rate': 4.634989794389964e-06, 'epoch': 1.36} {'loss': 0.471, 'learning_rate': 4.634713545414278e-06, 'epoch': 1.36} {'loss': 0.5339, 'learning_rate': 4.634437302187975e-06, 'epoch': 1.36} {'loss': 0.387, 'learning_rate': 4.6341610647113576e-06, 'epoch': 1.36} {'loss': 0.5089, 'learning_rate': 4.6338848329847205e-06, 'epoch': 1.36} {'loss': 0.6461, 'learning_rate': 4.633608607008361e-06, 'epoch': 1.36} {'loss': 0.4972, 'learning_rate': 4.633332386782578e-06, 'epoch': 1.36} {'loss': 0.4715, 'learning_rate': 4.633056172307655e-06, 'epoch': 1.36} {'loss': 0.4747, 'learning_rate': 4.632779963583904e-06, 'epoch': 1.36} {'loss': 0.5044, 'learning_rate': 4.6325037606116105e-06, 'epoch': 1.36} {'loss': 0.4877, 'learning_rate': 4.632227563391074e-06, 'epoch': 1.36} {'loss': 0.6097, 'learning_rate': 4.631951371922591e-06, 'epoch': 1.36} {'loss': 0.5358, 'learning_rate': 4.631675186206455e-06, 'epoch': 1.36} {'loss': 0.5031, 'learning_rate': 4.631399006242968e-06, 'epoch': 1.36} {'loss': 0.4923, 'learning_rate': 4.6311228320324145e-06, 'epoch': 1.36} {'loss': 0.493, 'learning_rate': 4.630846663575103e-06, 'epoch': 1.36} {'loss': 0.6333, 'learning_rate': 4.630570500871322e-06, 'epoch': 1.36} {'loss': 0.6608, 'learning_rate': 4.630294343921368e-06, 'epoch': 1.36} {'loss': 0.4011, 'learning_rate': 4.630018192725539e-06, 'epoch': 1.36} {'loss': 0.4639, 'learning_rate': 4.629742047284132e-06, 'epoch': 1.36} {'loss': 0.4509, 'learning_rate': 4.629465907597442e-06, 'epoch': 1.36} {'loss': 0.4058, 'learning_rate': 4.629189773665762e-06, 'epoch': 1.36} {'loss': 0.5224, 'learning_rate': 4.628913645489389e-06, 'epoch': 1.36} {'loss': 0.5815, 'learning_rate': 4.62863752306862e-06, 'epoch': 1.36} {'loss': 0.5184, 'learning_rate': 4.6283614064037505e-06, 'epoch': 1.36} {'loss': 0.5257, 'learning_rate': 4.6280852954950775e-06, 'epoch': 1.36} {'loss': 0.5573, 'learning_rate': 4.627809190342895e-06, 'epoch': 1.36} {'loss': 0.4245, 'learning_rate': 4.6275330909475035e-06, 'epoch': 1.36} {'loss': 0.5387, 'learning_rate': 4.627256997309192e-06, 'epoch': 1.36} {'loss': 0.4785, 'learning_rate': 4.626980909428259e-06, 'epoch': 1.36} {'loss': 0.5337, 'learning_rate': 4.626704827305002e-06, 'epoch': 1.36} {'loss': 0.5428, 'learning_rate': 4.626428750939714e-06, 'epoch': 1.36} {'loss': 0.3738, 'learning_rate': 4.6261526803326935e-06, 'epoch': 1.36} {'loss': 0.5106, 'learning_rate': 4.625876615484239e-06, 'epoch': 1.36} {'loss': 0.4924, 'learning_rate': 4.62560055639464e-06, 'epoch': 1.36} {'loss': 0.5705, 'learning_rate': 4.625324503064195e-06, 'epoch': 1.36} {'loss': 0.4465, 'learning_rate': 4.625048455493198e-06, 'epoch': 1.36} {'loss': 0.4812, 'learning_rate': 4.624772413681949e-06, 'epoch': 1.36} {'loss': 0.5344, 'learning_rate': 4.624496377630739e-06, 'epoch': 1.36} {'loss': 0.4491, 'learning_rate': 4.6242203473398685e-06, 'epoch': 1.36} {'loss': 0.4437, 'learning_rate': 4.6239443228096334e-06, 'epoch': 1.36} {'loss': 0.6682, 'learning_rate': 4.623668304040325e-06, 'epoch': 1.36} {'loss': 0.5669, 'learning_rate': 4.62339229103224e-06, 'epoch': 1.36} {'loss': 0.6058, 'learning_rate': 4.623116283785676e-06, 'epoch': 1.36} {'loss': 0.5193, 'learning_rate': 4.622840282300927e-06, 'epoch': 1.36} {'loss': 0.6347, 'learning_rate': 4.622564286578291e-06, 'epoch': 1.36} {'loss': 0.4835, 'learning_rate': 4.6222882966180635e-06, 'epoch': 1.36} {'loss': 0.5986, 'learning_rate': 4.6220123124205414e-06, 'epoch': 1.36} {'loss': 0.4771, 'learning_rate': 4.621736333986016e-06, 'epoch': 1.36} {'loss': 0.5167, 'learning_rate': 4.621460361314786e-06, 'epoch': 1.36} {'loss': 0.637, 'learning_rate': 4.621184394407146e-06, 'epoch': 1.36} {'loss': 0.6413, 'learning_rate': 4.620908433263391e-06, 'epoch': 1.36} {'loss': 0.5531, 'learning_rate': 4.620632477883824e-06, 'epoch': 1.36} {'loss': 0.6187, 'learning_rate': 4.620356528268727e-06, 'epoch': 1.36} {'loss': 0.614, 'learning_rate': 4.62008058441841e-06, 'epoch': 1.36} {'loss': 0.6172, 'learning_rate': 4.61980464633316e-06, 'epoch': 1.36} {'loss': 0.5456, 'learning_rate': 4.619528714013272e-06, 'epoch': 1.36} {'loss': 0.5989, 'learning_rate': 4.619252787459048e-06, 'epoch': 1.36} {'loss': 0.5722, 'learning_rate': 4.618976866670778e-06, 'epoch': 1.36} {'loss': 0.3833, 'learning_rate': 4.618700951648765e-06, 'epoch': 1.36} {'loss': 0.4959, 'learning_rate': 4.618425042393291e-06, 'epoch': 1.36} {'loss': 0.4319, 'learning_rate': 4.6181491389046685e-06, 'epoch': 1.36} {'loss': 0.4202, 'learning_rate': 4.61787324118318e-06, 'epoch': 1.36} {'loss': 0.4075, 'learning_rate': 4.617597349229128e-06, 'epoch': 1.36} {'loss': 0.5537, 'learning_rate': 4.617321463042805e-06, 'epoch': 1.36} {'loss': 0.5444, 'learning_rate': 4.6170455826245085e-06, 'epoch': 1.36} {'loss': 0.5995, 'learning_rate': 4.616769707974537e-06, 'epoch': 1.36} {'loss': 0.5811, 'learning_rate': 4.616493839093179e-06, 'epoch': 1.36} {'loss': 0.5076, 'learning_rate': 4.616217975980733e-06, 'epoch': 1.36} {'loss': 0.5546, 'learning_rate': 4.615942118637496e-06, 'epoch': 1.36} {'loss': 0.5093, 'learning_rate': 4.615666267063763e-06, 'epoch': 1.36} {'loss': 0.563, 'learning_rate': 4.615390421259833e-06, 'epoch': 1.36} {'loss': 0.6893, 'learning_rate': 4.615114581225991e-06, 'epoch': 1.36} {'loss': 0.725, 'learning_rate': 4.614838746962548e-06, 'epoch': 1.36} {'loss': 0.6142, 'learning_rate': 4.614562918469786e-06, 'epoch': 1.36} {'loss': 0.4328, 'learning_rate': 4.614287095748007e-06, 'epoch': 1.36} {'loss': 0.554, 'learning_rate': 4.614011278797504e-06, 'epoch': 1.36} {'loss': 0.4427, 'learning_rate': 4.613735467618577e-06, 'epoch': 1.36} {'loss': 0.575, 'learning_rate': 4.613459662211519e-06, 'epoch': 1.36} {'loss': 0.4401, 'learning_rate': 4.613183862576619e-06, 'epoch': 1.36} {'loss': 0.5844, 'learning_rate': 4.612908068714187e-06, 'epoch': 1.36} {'loss': 0.5122, 'learning_rate': 4.6126322806245046e-06, 'epoch': 1.36} {'loss': 0.5262, 'learning_rate': 4.612356498307875e-06, 'epoch': 1.36} {'loss': 0.5777, 'learning_rate': 4.6120807217645905e-06, 'epoch': 1.36} {'loss': 0.5853, 'learning_rate': 4.611804950994948e-06, 'epoch': 1.36} {'loss': 0.5483, 'learning_rate': 4.6115291859992474e-06, 'epoch': 1.36} {'loss': 0.4541, 'learning_rate': 4.611253426777771e-06, 'epoch': 1.36} {'loss': 0.451, 'learning_rate': 4.610977673330831e-06, 'epoch': 1.36} {'loss': 0.5115, 'learning_rate': 4.61070192565871e-06, 'epoch': 1.36} {'loss': 0.4717, 'learning_rate': 4.610426183761709e-06, 'epoch': 1.36} {'loss': 0.5439, 'learning_rate': 4.610150447640127e-06, 'epoch': 1.36} {'loss': 0.6217, 'learning_rate': 4.609874717294247e-06, 'epoch': 1.36} {'loss': 0.503, 'learning_rate': 4.609598992724381e-06, 'epoch': 1.36} {'loss': 0.4327, 'learning_rate': 4.609323273930808e-06, 'epoch': 1.36} {'loss': 0.5564, 'learning_rate': 4.609047560913839e-06, 'epoch': 1.36} {'loss': 0.6306, 'learning_rate': 4.608771853673761e-06, 'epoch': 1.36} {'loss': 0.6175, 'learning_rate': 4.608496152210868e-06, 'epoch': 1.36} {'loss': 0.5896, 'learning_rate': 4.608220456525461e-06, 'epoch': 1.36} {'loss': 0.4247, 'learning_rate': 4.607944766617825e-06, 'epoch': 1.36} {'loss': 0.4136, 'learning_rate': 4.607669082488273e-06, 'epoch': 1.36} {'loss': 0.5277, 'learning_rate': 4.607393404137081e-06, 'epoch': 1.36} {'loss': 0.5258, 'learning_rate': 4.607117731564561e-06, 'epoch': 1.36} {'loss': 0.6495, 'learning_rate': 4.606842064770998e-06, 'epoch': 1.36} {'loss': 0.5678, 'learning_rate': 4.6065664037566895e-06, 'epoch': 1.36} {'loss': 0.5231, 'learning_rate': 4.606290748521937e-06, 'epoch': 1.36} {'loss': 0.6684, 'learning_rate': 4.606015099067022e-06, 'epoch': 1.36} {'loss': 0.5648, 'learning_rate': 4.605739455392256e-06, 'epoch': 1.36} {'loss': 0.4924, 'learning_rate': 4.605463817497921e-06, 'epoch': 1.36} {'loss': 0.4587, 'learning_rate': 4.605188185384325e-06, 'epoch': 1.36} {'loss': 0.7229, 'learning_rate': 4.604912559051753e-06, 'epoch': 1.36} {'loss': 0.5206, 'learning_rate': 4.604636938500505e-06, 'epoch': 1.36} {'loss': 0.4909, 'learning_rate': 4.604361323730878e-06, 'epoch': 1.36} {'loss': 0.7167, 'learning_rate': 4.604085714743158e-06, 'epoch': 1.36} {'loss': 0.4977, 'learning_rate': 4.603810111537654e-06, 'epoch': 1.36} {'loss': 0.5053, 'learning_rate': 4.603534514114648e-06, 'epoch': 1.36} {'loss': 0.4184, 'learning_rate': 4.60325892247445e-06, 'epoch': 1.36} {'loss': 0.5226, 'learning_rate': 4.602983336617342e-06, 'epoch': 1.36} {'loss': 0.4943, 'learning_rate': 4.602707756543624e-06, 'epoch': 1.36} {'loss': 0.4188, 'learning_rate': 4.602432182253597e-06, 'epoch': 1.36} {'loss': 0.5795, 'learning_rate': 4.602156613747543e-06, 'epoch': 1.36} {'loss': 0.6127, 'learning_rate': 4.601881051025772e-06, 'epoch': 1.36} {'loss': 0.549, 'learning_rate': 4.601605494088569e-06, 'epoch': 1.37} {'loss': 0.4815, 'learning_rate': 4.601329942936235e-06, 'epoch': 1.37} {'loss': 0.5766, 'learning_rate': 4.601054397569062e-06, 'epoch': 1.37} {'loss': 0.3977, 'learning_rate': 4.6007788579873456e-06, 'epoch': 1.37} {'loss': 0.6828, 'learning_rate': 4.600503324191386e-06, 'epoch': 1.37} {'loss': 0.5188, 'learning_rate': 4.6002277961814675e-06, 'epoch': 1.37} {'loss': 0.4958, 'learning_rate': 4.599952273957899e-06, 'epoch': 1.37} {'loss': 0.4988, 'learning_rate': 4.599676757520966e-06, 'epoch': 1.37} {'loss': 0.4542, 'learning_rate': 4.599401246870967e-06, 'epoch': 1.37} {'loss': 0.5298, 'learning_rate': 4.599125742008197e-06, 'epoch': 1.37} {'loss': 0.558, 'learning_rate': 4.598850242932951e-06, 'epoch': 1.37} {'loss': 0.5375, 'learning_rate': 4.598574749645528e-06, 'epoch': 1.37} {'loss': 0.4712, 'learning_rate': 4.598299262146212e-06, 'epoch': 1.37} {'loss': 0.5555, 'learning_rate': 4.598023780435313e-06, 'epoch': 1.37} {'loss': 0.5833, 'learning_rate': 4.597748304513116e-06, 'epoch': 1.37} {'loss': 0.5533, 'learning_rate': 4.5974728343799205e-06, 'epoch': 1.37} {'loss': 0.497, 'learning_rate': 4.597197370036019e-06, 'epoch': 1.37} {'loss': 0.6584, 'learning_rate': 4.596921911481708e-06, 'epoch': 1.37} {'loss': 0.4171, 'learning_rate': 4.596646458717287e-06, 'epoch': 1.37} {'loss': 0.5538, 'learning_rate': 4.5963710117430424e-06, 'epoch': 1.37} {'loss': 0.6147, 'learning_rate': 4.596095570559274e-06, 'epoch': 1.37} {'loss': 0.569, 'learning_rate': 4.595820135166279e-06, 'epoch': 1.37} {'loss': 0.6199, 'learning_rate': 4.5955447055643486e-06, 'epoch': 1.37} {'loss': 0.5335, 'learning_rate': 4.59526928175378e-06, 'epoch': 1.37} {'loss': 0.541, 'learning_rate': 4.594993863734869e-06, 'epoch': 1.37} {'loss': 0.5952, 'learning_rate': 4.5947184515079135e-06, 'epoch': 1.37} {'loss': 0.3657, 'learning_rate': 4.594443045073201e-06, 'epoch': 1.37} {'loss': 0.6169, 'learning_rate': 4.5941676444310304e-06, 'epoch': 1.37} {'loss': 0.6798, 'learning_rate': 4.593892249581698e-06, 'epoch': 1.37} {'loss': 0.7335, 'learning_rate': 4.593616860525497e-06, 'epoch': 1.37} {'loss': 0.5945, 'learning_rate': 4.5933414772627235e-06, 'epoch': 1.37} {'loss': 0.4256, 'learning_rate': 4.5930660997936725e-06, 'epoch': 1.37} {'loss': 0.5903, 'learning_rate': 4.592790728118644e-06, 'epoch': 1.37} {'loss': 0.5203, 'learning_rate': 4.592515362237924e-06, 'epoch': 1.37} {'loss': 0.4673, 'learning_rate': 4.592240002151811e-06, 'epoch': 1.37} {'loss': 0.4603, 'learning_rate': 4.591964647860602e-06, 'epoch': 1.37} {'loss': 0.624, 'learning_rate': 4.59168929936459e-06, 'epoch': 1.37} {'loss': 0.4959, 'learning_rate': 4.5914139566640755e-06, 'epoch': 1.37} {'loss': 0.5132, 'learning_rate': 4.591138619759345e-06, 'epoch': 1.37} {'loss': 0.5498, 'learning_rate': 4.5908632886506985e-06, 'epoch': 1.37} {'loss': 0.6821, 'learning_rate': 4.59058796333843e-06, 'epoch': 1.37} {'loss': 0.5788, 'learning_rate': 4.590312643822834e-06, 'epoch': 1.37} {'loss': 0.6095, 'learning_rate': 4.590037330104207e-06, 'epoch': 1.37} {'loss': 0.2929, 'learning_rate': 4.589762022182842e-06, 'epoch': 1.37} {'loss': 0.5282, 'learning_rate': 4.58948672005904e-06, 'epoch': 1.37} {'loss': 0.5502, 'learning_rate': 4.589211423733087e-06, 'epoch': 1.37} {'loss': 0.4951, 'learning_rate': 4.5889361332052826e-06, 'epoch': 1.37} {'loss': 0.627, 'learning_rate': 4.5886608484759225e-06, 'epoch': 1.37} {'loss': 0.5306, 'learning_rate': 4.588385569545299e-06, 'epoch': 1.37} {'loss': 0.4206, 'learning_rate': 4.588110296413711e-06, 'epoch': 1.37} {'loss': 0.5444, 'learning_rate': 4.587835029081449e-06, 'epoch': 1.37} {'loss': 0.5244, 'learning_rate': 4.587559767548815e-06, 'epoch': 1.37} {'loss': 0.6125, 'learning_rate': 4.5872845118160954e-06, 'epoch': 1.37} {'loss': 0.5205, 'learning_rate': 4.587009261883589e-06, 'epoch': 1.37} {'loss': 0.5095, 'learning_rate': 4.586734017751591e-06, 'epoch': 1.37} {'loss': 0.5241, 'learning_rate': 4.586458779420395e-06, 'epoch': 1.37} {'loss': 0.6396, 'learning_rate': 4.586183546890298e-06, 'epoch': 1.37} {'loss': 0.5527, 'learning_rate': 4.585908320161599e-06, 'epoch': 1.37} {'loss': 0.5024, 'learning_rate': 4.585633099234582e-06, 'epoch': 1.37} {'loss': 0.5328, 'learning_rate': 4.585357884109548e-06, 'epoch': 1.37} {'loss': 0.5449, 'learning_rate': 4.585082674786793e-06, 'epoch': 1.37} {'loss': 0.5785, 'learning_rate': 4.584807471266609e-06, 'epoch': 1.37} {'loss': 0.4729, 'learning_rate': 4.584532273549294e-06, 'epoch': 1.37} {'loss': 0.4887, 'learning_rate': 4.584257081635141e-06, 'epoch': 1.37} {'loss': 0.4653, 'learning_rate': 4.583981895524449e-06, 'epoch': 1.37} {'loss': 0.4999, 'learning_rate': 4.583706715217504e-06, 'epoch': 1.37} {'loss': 0.5928, 'learning_rate': 4.583431540714608e-06, 'epoch': 1.37} {'loss': 0.4158, 'learning_rate': 4.583156372016053e-06, 'epoch': 1.37} {'loss': 0.6179, 'learning_rate': 4.582881209122135e-06, 'epoch': 1.37} {'loss': 0.51, 'learning_rate': 4.58260605203315e-06, 'epoch': 1.37} {'loss': 0.5367, 'learning_rate': 4.5823309007493895e-06, 'epoch': 1.37} {'loss': 0.6447, 'learning_rate': 4.582055755271157e-06, 'epoch': 1.37} {'loss': 0.7747, 'learning_rate': 4.581780615598734e-06, 'epoch': 1.37} {'loss': 0.4728, 'learning_rate': 4.5815054817324234e-06, 'epoch': 1.37} {'loss': 0.5365, 'learning_rate': 4.5812303536725185e-06, 'epoch': 1.37} {'loss': 0.4427, 'learning_rate': 4.580955231419315e-06, 'epoch': 1.37} {'loss': 0.6251, 'learning_rate': 4.580680114973111e-06, 'epoch': 1.37} {'loss': 0.5023, 'learning_rate': 4.5804050043341885e-06, 'epoch': 1.37} {'loss': 0.4171, 'learning_rate': 4.5801298995028595e-06, 'epoch': 1.37} {'loss': 0.6439, 'learning_rate': 4.579854800479407e-06, 'epoch': 1.37} {'loss': 0.4662, 'learning_rate': 4.579579707264129e-06, 'epoch': 1.37} {'loss': 0.4912, 'learning_rate': 4.57930461985732e-06, 'epoch': 1.37} {'loss': 0.5586, 'learning_rate': 4.579029538259275e-06, 'epoch': 1.37} {'loss': 0.5798, 'learning_rate': 4.578754462470294e-06, 'epoch': 1.37} {'loss': 0.5737, 'learning_rate': 4.57847939249066e-06, 'epoch': 1.37} {'loss': 0.5059, 'learning_rate': 4.578204328320681e-06, 'epoch': 1.37} {'loss': 0.4419, 'learning_rate': 4.577929269960641e-06, 'epoch': 1.37} {'loss': 0.6287, 'learning_rate': 4.577654217410841e-06, 'epoch': 1.37} {'loss': 0.5232, 'learning_rate': 4.577379170671576e-06, 'epoch': 1.37} {'loss': 0.441, 'learning_rate': 4.577104129743133e-06, 'epoch': 1.37} {'loss': 0.4186, 'learning_rate': 4.576829094625819e-06, 'epoch': 1.37} {'loss': 0.6582, 'learning_rate': 4.576554065319913e-06, 'epoch': 1.37} {'loss': 0.488, 'learning_rate': 4.576279041825729e-06, 'epoch': 1.37} {'loss': 0.5804, 'learning_rate': 4.576004024143546e-06, 'epoch': 1.37} {'loss': 0.5902, 'learning_rate': 4.575729012273664e-06, 'epoch': 1.37} {'loss': 0.5829, 'learning_rate': 4.575454006216382e-06, 'epoch': 1.37} {'loss': 0.5519, 'learning_rate': 4.575179005971984e-06, 'epoch': 1.37} {'loss': 0.3903, 'learning_rate': 4.574904011540778e-06, 'epoch': 1.37} {'loss': 0.4056, 'learning_rate': 4.574629022923045e-06, 'epoch': 1.37} {'loss': 0.53, 'learning_rate': 4.5743540401190944e-06, 'epoch': 1.37} {'loss': 0.4444, 'learning_rate': 4.574079063129209e-06, 'epoch': 1.37} {'loss': 0.4045, 'learning_rate': 4.573804091953688e-06, 'epoch': 1.37} {'loss': 0.4734, 'learning_rate': 4.5735291265928285e-06, 'epoch': 1.37} {'loss': 0.5137, 'learning_rate': 4.573254167046916e-06, 'epoch': 1.37} {'loss': 0.5029, 'learning_rate': 4.5729792133162575e-06, 'epoch': 1.37} {'loss': 0.6021, 'learning_rate': 4.572704265401139e-06, 'epoch': 1.37} {'loss': 0.5974, 'learning_rate': 4.5724293233018565e-06, 'epoch': 1.37} {'loss': 0.6266, 'learning_rate': 4.5721543870187066e-06, 'epoch': 1.37} {'loss': 0.5491, 'learning_rate': 4.571879456551983e-06, 'epoch': 1.37} {'loss': 0.5317, 'learning_rate': 4.571604531901985e-06, 'epoch': 1.37} {'loss': 0.5321, 'learning_rate': 4.5713296130689946e-06, 'epoch': 1.37} {'loss': 0.6456, 'learning_rate': 4.571054700053322e-06, 'epoch': 1.37} {'loss': 0.6648, 'learning_rate': 4.57077979285525e-06, 'epoch': 1.37} {'loss': 0.4752, 'learning_rate': 4.5705048914750785e-06, 'epoch': 1.37} {'loss': 0.5709, 'learning_rate': 4.5702299959131e-06, 'epoch': 1.37} {'loss': 0.629, 'learning_rate': 4.5699551061696114e-06, 'epoch': 1.37} {'loss': 0.5854, 'learning_rate': 4.569680222244909e-06, 'epoch': 1.37} {'loss': 0.5122, 'learning_rate': 4.569405344139277e-06, 'epoch': 1.37} {'loss': 0.4803, 'learning_rate': 4.569130471853025e-06, 'epoch': 1.37} {'loss': 0.5025, 'learning_rate': 4.568855605386435e-06, 'epoch': 1.37} {'loss': 0.5413, 'learning_rate': 4.568580744739808e-06, 'epoch': 1.37} {'loss': 0.5365, 'learning_rate': 4.568305889913439e-06, 'epoch': 1.37} {'loss': 0.4884, 'learning_rate': 4.5680310409076145e-06, 'epoch': 1.37} {'loss': 0.4794, 'learning_rate': 4.567756197722642e-06, 'epoch': 1.37} {'loss': 0.359, 'learning_rate': 4.567481360358801e-06, 'epoch': 1.37} {'loss': 0.4766, 'learning_rate': 4.567206528816403e-06, 'epoch': 1.37} {'loss': 0.566, 'learning_rate': 4.566931703095728e-06, 'epoch': 1.37} {'loss': 0.5483, 'learning_rate': 4.566656883197077e-06, 'epoch': 1.37} {'loss': 0.5611, 'learning_rate': 4.566382069120747e-06, 'epoch': 1.37} {'loss': 0.7451, 'learning_rate': 4.566107260867022e-06, 'epoch': 1.37} {'loss': 0.5578, 'learning_rate': 4.56583245843621e-06, 'epoch': 1.37} {'loss': 0.5243, 'learning_rate': 4.565557661828593e-06, 'epoch': 1.37} {'loss': 0.5013, 'learning_rate': 4.565282871044477e-06, 'epoch': 1.37} {'loss': 0.6048, 'learning_rate': 4.565008086084149e-06, 'epoch': 1.37} {'loss': 0.5151, 'learning_rate': 4.564733306947905e-06, 'epoch': 1.37} {'loss': 0.5667, 'learning_rate': 4.5644585336360425e-06, 'epoch': 1.37} {'loss': 0.5404, 'learning_rate': 4.564183766148847e-06, 'epoch': 1.37} {'loss': 0.4646, 'learning_rate': 4.563909004486626e-06, 'epoch': 1.37} {'loss': 0.7077, 'learning_rate': 4.56363424864966e-06, 'epoch': 1.37} {'loss': 0.4596, 'learning_rate': 4.563359498638258e-06, 'epoch': 1.37} {'loss': 0.5831, 'learning_rate': 4.563084754452703e-06, 'epoch': 1.37} {'loss': 0.4507, 'learning_rate': 4.562810016093293e-06, 'epoch': 1.37} {'loss': 0.5804, 'learning_rate': 4.562535283560328e-06, 'epoch': 1.37} {'loss': 0.4621, 'learning_rate': 4.562260556854088e-06, 'epoch': 1.37} {'loss': 0.6318, 'learning_rate': 4.561985835974885e-06, 'epoch': 1.37} {'loss': 0.5823, 'learning_rate': 4.561711120923001e-06, 'epoch': 1.37} {'loss': 0.4719, 'learning_rate': 4.5614364116987345e-06, 'epoch': 1.37} {'loss': 0.507, 'learning_rate': 4.56116170830238e-06, 'epoch': 1.37} {'loss': 0.5559, 'learning_rate': 4.560887010734231e-06, 'epoch': 1.37} {'loss': 0.6019, 'learning_rate': 4.560612318994586e-06, 'epoch': 1.37} {'loss': 0.4996, 'learning_rate': 4.56033763308373e-06, 'epoch': 1.37} {'loss': 0.6382, 'learning_rate': 4.560062953001969e-06, 'epoch': 1.37} {'loss': 0.4949, 'learning_rate': 4.5597882787495886e-06, 'epoch': 1.37} {'loss': 0.4679, 'learning_rate': 4.5595136103268854e-06, 'epoch': 1.37} {'loss': 0.5452, 'learning_rate': 4.559238947734155e-06, 'epoch': 1.37} {'loss': 0.6547, 'learning_rate': 4.558964290971691e-06, 'epoch': 1.37} {'loss': 0.4101, 'learning_rate': 4.558689640039792e-06, 'epoch': 1.37} {'loss': 0.5982, 'learning_rate': 4.558414994938741e-06, 'epoch': 1.37} {'loss': 0.5358, 'learning_rate': 4.558140355668846e-06, 'epoch': 1.37} {'loss': 0.5116, 'learning_rate': 4.55786572223039e-06, 'epoch': 1.37} {'loss': 0.3992, 'learning_rate': 4.557591094623673e-06, 'epoch': 1.37} {'loss': 0.4482, 'learning_rate': 4.55731647284899e-06, 'epoch': 1.37} {'loss': 0.5729, 'learning_rate': 4.557041856906632e-06, 'epoch': 1.37} {'loss': 0.5557, 'learning_rate': 4.556767246796898e-06, 'epoch': 1.37} {'loss': 0.3396, 'learning_rate': 4.556492642520077e-06, 'epoch': 1.37} {'loss': 0.4694, 'learning_rate': 4.5562180440764645e-06, 'epoch': 1.37} {'loss': 0.4778, 'learning_rate': 4.555943451466356e-06, 'epoch': 1.37} {'loss': 0.5785, 'learning_rate': 4.555668864690046e-06, 'epoch': 1.37} {'loss': 0.6176, 'learning_rate': 4.555394283747827e-06, 'epoch': 1.37} {'loss': 0.5326, 'learning_rate': 4.555119708639996e-06, 'epoch': 1.37} {'loss': 0.5876, 'learning_rate': 4.554845139366848e-06, 'epoch': 1.37} {'loss': 0.5226, 'learning_rate': 4.554570575928672e-06, 'epoch': 1.37} {'loss': 0.4999, 'learning_rate': 4.554296018325764e-06, 'epoch': 1.37} {'loss': 0.5916, 'learning_rate': 4.5540214665584205e-06, 'epoch': 1.37} {'loss': 0.5441, 'learning_rate': 4.553746920626933e-06, 'epoch': 1.37} {'loss': 0.4471, 'learning_rate': 4.5534723805315994e-06, 'epoch': 1.37} {'loss': 0.4561, 'learning_rate': 4.553197846272715e-06, 'epoch': 1.37} {'loss': 0.605, 'learning_rate': 4.552923317850565e-06, 'epoch': 1.37} {'loss': 0.431, 'learning_rate': 4.552648795265451e-06, 'epoch': 1.37} {'loss': 0.6038, 'learning_rate': 4.552374278517665e-06, 'epoch': 1.37} {'loss': 0.457, 'learning_rate': 4.552099767607502e-06, 'epoch': 1.37} {'loss': 0.5751, 'learning_rate': 4.551825262535255e-06, 'epoch': 1.37} {'loss': 0.5065, 'learning_rate': 4.55155076330122e-06, 'epoch': 1.37} {'loss': 0.4223, 'learning_rate': 4.5512762699056935e-06, 'epoch': 1.37} {'loss': 0.5495, 'learning_rate': 4.5510017823489615e-06, 'epoch': 1.37} {'loss': 0.4676, 'learning_rate': 4.550727300631325e-06, 'epoch': 1.37} {'loss': 0.3625, 'learning_rate': 4.550452824753074e-06, 'epoch': 1.37} {'loss': 0.4989, 'learning_rate': 4.5501783547145054e-06, 'epoch': 1.37} {'loss': 0.5866, 'learning_rate': 4.549903890515913e-06, 'epoch': 1.37} {'loss': 0.5501, 'learning_rate': 4.549629432157594e-06, 'epoch': 1.37} {'loss': 0.5488, 'learning_rate': 4.549354979639835e-06, 'epoch': 1.37} {'loss': 0.5121, 'learning_rate': 4.549080532962934e-06, 'epoch': 1.37} {'loss': 0.5152, 'learning_rate': 4.548806092127185e-06, 'epoch': 1.37} {'loss': 0.5091, 'learning_rate': 4.548531657132883e-06, 'epoch': 1.37} {'loss': 0.4636, 'learning_rate': 4.5482572279803205e-06, 'epoch': 1.37} {'loss': 0.5052, 'learning_rate': 4.5479828046697974e-06, 'epoch': 1.37} {'loss': 0.6119, 'learning_rate': 4.547708387201598e-06, 'epoch': 1.37} {'loss': 0.6054, 'learning_rate': 4.547433975576021e-06, 'epoch': 1.37} {'loss': 0.5273, 'learning_rate': 4.547159569793361e-06, 'epoch': 1.37} {'loss': 0.5042, 'learning_rate': 4.546885169853912e-06, 'epoch': 1.37} {'loss': 0.5322, 'learning_rate': 4.546610775757968e-06, 'epoch': 1.37} {'loss': 0.4747, 'learning_rate': 4.546336387505822e-06, 'epoch': 1.37} {'loss': 0.5129, 'learning_rate': 4.546062005097772e-06, 'epoch': 1.37} {'loss': 0.4241, 'learning_rate': 4.545787628534106e-06, 'epoch': 1.37} {'loss': 0.4309, 'learning_rate': 4.545513257815121e-06, 'epoch': 1.37} {'loss': 0.6074, 'learning_rate': 4.5452388929411105e-06, 'epoch': 1.37} {'loss': 0.5822, 'learning_rate': 4.544964533912369e-06, 'epoch': 1.37} {'loss': 0.5468, 'learning_rate': 4.54469018072919e-06, 'epoch': 1.37} {'loss': 0.5639, 'learning_rate': 4.544415833391869e-06, 'epoch': 1.37} {'loss': 0.4649, 'learning_rate': 4.544141491900701e-06, 'epoch': 1.37} {'loss': 0.4712, 'learning_rate': 4.543867156255975e-06, 'epoch': 1.37} {'loss': 0.5464, 'learning_rate': 4.5435928264579865e-06, 'epoch': 1.37} {'loss': 0.5332, 'learning_rate': 4.543318502507033e-06, 'epoch': 1.37} {'loss': 0.5499, 'learning_rate': 4.543044184403404e-06, 'epoch': 1.37} {'loss': 0.4344, 'learning_rate': 4.5427698721474e-06, 'epoch': 1.37} {'loss': 0.5595, 'learning_rate': 4.542495565739305e-06, 'epoch': 1.37} {'loss': 0.5583, 'learning_rate': 4.542221265179424e-06, 'epoch': 1.37} {'loss': 0.6509, 'learning_rate': 4.541946970468042e-06, 'epoch': 1.37} {'loss': 0.5491, 'learning_rate': 4.541672681605457e-06, 'epoch': 1.37} {'loss': 0.4969, 'learning_rate': 4.541398398591962e-06, 'epoch': 1.37} {'loss': 0.507, 'learning_rate': 4.541124121427851e-06, 'epoch': 1.37} {'loss': 0.6302, 'learning_rate': 4.540849850113423e-06, 'epoch': 1.37} {'loss': 0.5999, 'learning_rate': 4.540575584648958e-06, 'epoch': 1.37} {'loss': 0.3356, 'learning_rate': 4.540301325034768e-06, 'epoch': 1.37} {'loss': 0.5731, 'learning_rate': 4.540027071271134e-06, 'epoch': 1.37} {'loss': 0.7289, 'learning_rate': 4.539752823358353e-06, 'epoch': 1.37} {'loss': 0.5567, 'learning_rate': 4.53947858129672e-06, 'epoch': 1.37} {'loss': 0.4607, 'learning_rate': 4.539204345086528e-06, 'epoch': 1.37} {'loss': 0.6015, 'learning_rate': 4.538930114728076e-06, 'epoch': 1.37} {'loss': 0.79, 'learning_rate': 4.538655890221646e-06, 'epoch': 1.37} {'loss': 0.3548, 'learning_rate': 4.5383816715675465e-06, 'epoch': 1.37} {'loss': 0.5844, 'learning_rate': 4.53810745876606e-06, 'epoch': 1.37} {'loss': 0.6561, 'learning_rate': 4.537833251817484e-06, 'epoch': 1.37} {'loss': 0.4337, 'learning_rate': 4.537559050722117e-06, 'epoch': 1.37} {'loss': 0.4464, 'learning_rate': 4.537284855480241e-06, 'epoch': 1.37} {'loss': 0.6427, 'learning_rate': 4.537010666092164e-06, 'epoch': 1.37} {'loss': 0.5516, 'learning_rate': 4.536736482558166e-06, 'epoch': 1.37} {'loss': 0.5802, 'learning_rate': 4.536462304878555e-06, 'epoch': 1.37} {'loss': 0.5825, 'learning_rate': 4.536188133053615e-06, 'epoch': 1.37} {'loss': 0.5214, 'learning_rate': 4.535913967083642e-06, 'epoch': 1.37} {'loss': 0.6002, 'learning_rate': 4.5356398069689346e-06, 'epoch': 1.37} {'loss': 0.4626, 'learning_rate': 4.535365652709775e-06, 'epoch': 1.37} {'loss': 0.4192, 'learning_rate': 4.535091504306471e-06, 'epoch': 1.37} {'loss': 0.5105, 'learning_rate': 4.5348173617593015e-06, 'epoch': 1.37} {'loss': 0.4902, 'learning_rate': 4.5345432250685774e-06, 'epoch': 1.37} {'loss': 0.4617, 'learning_rate': 4.534269094234579e-06, 'epoch': 1.37} {'loss': 0.5856, 'learning_rate': 4.5339949692576056e-06, 'epoch': 1.37} {'loss': 0.5231, 'learning_rate': 4.533720850137952e-06, 'epoch': 1.37} {'loss': 0.3891, 'learning_rate': 4.533446736875904e-06, 'epoch': 1.37} {'loss': 0.6441, 'learning_rate': 4.533172629471768e-06, 'epoch': 1.37} {'loss': 0.7221, 'learning_rate': 4.532898527925823e-06, 'epoch': 1.37} {'loss': 0.4256, 'learning_rate': 4.53262443223838e-06, 'epoch': 1.37} {'loss': 0.5201, 'learning_rate': 4.532350342409717e-06, 'epoch': 1.37} {'loss': 0.4303, 'learning_rate': 4.5320762584401355e-06, 'epoch': 1.37} {'loss': 0.427, 'learning_rate': 4.5318021803299314e-06, 'epoch': 1.37} {'loss': 0.5832, 'learning_rate': 4.531528108079387e-06, 'epoch': 1.37} {'loss': 0.6157, 'learning_rate': 4.531254041688812e-06, 'epoch': 1.37} {'loss': 0.5506, 'learning_rate': 4.530979981158488e-06, 'epoch': 1.37} {'loss': 0.504, 'learning_rate': 4.530705926488712e-06, 'epoch': 1.37} {'loss': 0.4373, 'learning_rate': 4.530431877679779e-06, 'epoch': 1.37} {'loss': 0.4837, 'learning_rate': 4.530157834731981e-06, 'epoch': 1.37} {'loss': 0.4721, 'learning_rate': 4.529883797645617e-06, 'epoch': 1.37} {'loss': 0.564, 'learning_rate': 4.5296097664209685e-06, 'epoch': 1.37} {'loss': 0.5693, 'learning_rate': 4.5293357410583436e-06, 'epoch': 1.37} {'loss': 0.5308, 'learning_rate': 4.529061721558027e-06, 'epoch': 1.37} {'loss': 0.48, 'learning_rate': 4.528787707920313e-06, 'epoch': 1.37} {'loss': 0.5053, 'learning_rate': 4.528513700145498e-06, 'epoch': 1.37} {'loss': 0.5076, 'learning_rate': 4.528239698233874e-06, 'epoch': 1.37} {'loss': 0.3949, 'learning_rate': 4.527965702185738e-06, 'epoch': 1.37} {'loss': 0.5718, 'learning_rate': 4.527691712001374e-06, 'epoch': 1.37} {'loss': 0.4398, 'learning_rate': 4.52741772768109e-06, 'epoch': 1.37} {'loss': 0.5271, 'learning_rate': 4.527143749225168e-06, 'epoch': 1.37} {'loss': 0.526, 'learning_rate': 4.5268697766339045e-06, 'epoch': 1.37} {'loss': 0.4812, 'learning_rate': 4.5265958099075945e-06, 'epoch': 1.37} {'loss': 0.6124, 'learning_rate': 4.526321849046531e-06, 'epoch': 1.37} {'loss': 0.5844, 'learning_rate': 4.526047894051012e-06, 'epoch': 1.37} {'loss': 0.3487, 'learning_rate': 4.525773944921319e-06, 'epoch': 1.37} {'loss': 0.5508, 'learning_rate': 4.525500001657761e-06, 'epoch': 1.37} {'loss': 0.6736, 'learning_rate': 4.525226064260619e-06, 'epoch': 1.37} {'loss': 0.3714, 'learning_rate': 4.524952132730193e-06, 'epoch': 1.37} {'loss': 0.6691, 'learning_rate': 4.524678207066777e-06, 'epoch': 1.37} {'loss': 0.3428, 'learning_rate': 4.524404287270656e-06, 'epoch': 1.37} {'loss': 0.4343, 'learning_rate': 4.524130373342137e-06, 'epoch': 1.37} {'loss': 0.5501, 'learning_rate': 4.523856465281503e-06, 'epoch': 1.37} {'loss': 0.618, 'learning_rate': 4.523582563089052e-06, 'epoch': 1.37} {'loss': 0.4452, 'learning_rate': 4.523308666765075e-06, 'epoch': 1.37} {'loss': 0.6582, 'learning_rate': 4.523034776309868e-06, 'epoch': 1.37} {'loss': 0.4599, 'learning_rate': 4.522760891723728e-06, 'epoch': 1.37} {'loss': 0.4769, 'learning_rate': 4.522487013006935e-06, 'epoch': 1.37} {'loss': 0.6984, 'learning_rate': 4.5222131401598e-06, 'epoch': 1.37} {'loss': 0.499, 'learning_rate': 4.521939273182604e-06, 'epoch': 1.37} {'loss': 0.6534, 'learning_rate': 4.521665412075644e-06, 'epoch': 1.37} {'loss': 0.711, 'learning_rate': 4.521391556839214e-06, 'epoch': 1.37} {'loss': 0.7566, 'learning_rate': 4.521117707473608e-06, 'epoch': 1.37} {'loss': 0.4339, 'learning_rate': 4.520843863979123e-06, 'epoch': 1.37} {'loss': 0.6595, 'learning_rate': 4.52057002635604e-06, 'epoch': 1.37} {'loss': 0.63, 'learning_rate': 4.520296194604669e-06, 'epoch': 1.37} {'loss': 0.4864, 'learning_rate': 4.520022368725291e-06, 'epoch': 1.37} {'loss': 0.5594, 'learning_rate': 4.519748548718204e-06, 'epoch': 1.37} {'loss': 0.5627, 'learning_rate': 4.5194747345836994e-06, 'epoch': 1.37} {'loss': 0.6253, 'learning_rate': 4.519200926322074e-06, 'epoch': 1.37} {'loss': 0.6648, 'learning_rate': 4.518927123933623e-06, 'epoch': 1.37} {'loss': 0.3871, 'learning_rate': 4.518653327418633e-06, 'epoch': 1.37} {'loss': 0.5672, 'learning_rate': 4.518379536777399e-06, 'epoch': 1.37} {'loss': 0.5818, 'learning_rate': 4.5181057520102174e-06, 'epoch': 1.37} {'loss': 0.5784, 'learning_rate': 4.51783197311738e-06, 'epoch': 1.37} {'loss': 0.6626, 'learning_rate': 4.5175582000991805e-06, 'epoch': 1.37} {'loss': 0.6148, 'learning_rate': 4.517284432955912e-06, 'epoch': 1.37} {'loss': 0.4488, 'learning_rate': 4.517010671687872e-06, 'epoch': 1.37} {'loss': 0.5863, 'learning_rate': 4.516736916295346e-06, 'epoch': 1.37} {'loss': 0.5034, 'learning_rate': 4.516463166778632e-06, 'epoch': 1.37} {'loss': 0.4243, 'learning_rate': 4.516189423138021e-06, 'epoch': 1.37} {'loss': 0.515, 'learning_rate': 4.5159156853738095e-06, 'epoch': 1.37} {'loss': 0.4402, 'learning_rate': 4.515641953486288e-06, 'epoch': 1.37} {'loss': 0.5753, 'learning_rate': 4.515368227475753e-06, 'epoch': 1.37} {'loss': 0.5325, 'learning_rate': 4.515094507342498e-06, 'epoch': 1.37} {'loss': 0.5214, 'learning_rate': 4.5148207930868114e-06, 'epoch': 1.37} {'loss': 0.5525, 'learning_rate': 4.514547084708989e-06, 'epoch': 1.37} {'loss': 0.46, 'learning_rate': 4.514273382209325e-06, 'epoch': 1.37} {'loss': 0.5372, 'learning_rate': 4.513999685588112e-06, 'epoch': 1.37} {'loss': 0.5416, 'learning_rate': 4.5137259948456435e-06, 'epoch': 1.37} {'loss': 0.5737, 'learning_rate': 4.513452309982216e-06, 'epoch': 1.37} {'loss': 0.5748, 'learning_rate': 4.5131786309981166e-06, 'epoch': 1.37} {'loss': 0.6321, 'learning_rate': 4.5129049578936415e-06, 'epoch': 1.37} {'loss': 0.5616, 'learning_rate': 4.512631290669083e-06, 'epoch': 1.37} {'loss': 0.5144, 'learning_rate': 4.512357629324736e-06, 'epoch': 1.37} {'loss': 0.5498, 'learning_rate': 4.512083973860893e-06, 'epoch': 1.37} {'loss': 0.6212, 'learning_rate': 4.511810324277847e-06, 'epoch': 1.37} {'loss': 0.5814, 'learning_rate': 4.511536680575895e-06, 'epoch': 1.37} {'loss': 0.4899, 'learning_rate': 4.511263042755324e-06, 'epoch': 1.37} {'loss': 0.5675, 'learning_rate': 4.51098941081643e-06, 'epoch': 1.37} {'loss': 0.4841, 'learning_rate': 4.510715784759506e-06, 'epoch': 1.37} {'loss': 0.5582, 'learning_rate': 4.510442164584845e-06, 'epoch': 1.37} {'loss': 0.6864, 'learning_rate': 4.5101685502927414e-06, 'epoch': 1.37} {'loss': 0.5851, 'learning_rate': 4.509894941883488e-06, 'epoch': 1.37} {'loss': 0.5651, 'learning_rate': 4.5096213393573806e-06, 'epoch': 1.37} {'loss': 0.4576, 'learning_rate': 4.509347742714706e-06, 'epoch': 1.37} {'loss': 0.5869, 'learning_rate': 4.509074151955761e-06, 'epoch': 1.37} {'loss': 0.5116, 'learning_rate': 4.508800567080839e-06, 'epoch': 1.37} {'loss': 0.6702, 'learning_rate': 4.508526988090231e-06, 'epoch': 1.37} {'loss': 0.6077, 'learning_rate': 4.508253414984237e-06, 'epoch': 1.37} {'loss': 0.4018, 'learning_rate': 4.507979847763139e-06, 'epoch': 1.37} {'loss': 0.5558, 'learning_rate': 4.507706286427241e-06, 'epoch': 1.37} {'loss': 0.5402, 'learning_rate': 4.50743273097683e-06, 'epoch': 1.37} {'loss': 0.5958, 'learning_rate': 4.507159181412199e-06, 'epoch': 1.37} {'loss': 0.6032, 'learning_rate': 4.5068856377336435e-06, 'epoch': 1.37} {'loss': 0.598, 'learning_rate': 4.506612099941456e-06, 'epoch': 1.37} {'loss': 0.4813, 'learning_rate': 4.5063385680359325e-06, 'epoch': 1.37} {'loss': 0.5525, 'learning_rate': 4.50606504201736e-06, 'epoch': 1.37} {'loss': 0.5768, 'learning_rate': 4.505791521886035e-06, 'epoch': 1.37} {'loss': 0.6059, 'learning_rate': 4.505518007642249e-06, 'epoch': 1.37} {'loss': 0.4585, 'learning_rate': 4.505244499286297e-06, 'epoch': 1.37} {'loss': 0.6995, 'learning_rate': 4.5049709968184755e-06, 'epoch': 1.37} {'loss': 0.4631, 'learning_rate': 4.504697500239066e-06, 'epoch': 1.37} {'loss': 0.5849, 'learning_rate': 4.504424009548376e-06, 'epoch': 1.37} {'loss': 0.5134, 'learning_rate': 4.504150524746688e-06, 'epoch': 1.37} {'loss': 0.525, 'learning_rate': 4.503877045834299e-06, 'epoch': 1.37} {'loss': 0.489, 'learning_rate': 4.503603572811501e-06, 'epoch': 1.37} {'loss': 0.4831, 'learning_rate': 4.503330105678589e-06, 'epoch': 1.37} {'loss': 0.5832, 'learning_rate': 4.5030566444358594e-06, 'epoch': 1.37} {'loss': 0.5884, 'learning_rate': 4.502783189083591e-06, 'epoch': 1.37} {'loss': 0.482, 'learning_rate': 4.502509739622095e-06, 'epoch': 1.37} {'loss': 0.5158, 'learning_rate': 4.502236296051653e-06, 'epoch': 1.37} {'loss': 0.6356, 'learning_rate': 4.501962858372561e-06, 'epoch': 1.37} {'loss': 0.5243, 'learning_rate': 4.501689426585111e-06, 'epoch': 1.37} {'loss': 0.4061, 'learning_rate': 4.501416000689598e-06, 'epoch': 1.37} {'loss': 0.4497, 'learning_rate': 4.501142580686318e-06, 'epoch': 1.37} {'loss': 0.5279, 'learning_rate': 4.500869166575551e-06, 'epoch': 1.37} {'loss': 0.5289, 'learning_rate': 4.500595758357607e-06, 'epoch': 1.37} {'loss': 0.4503, 'learning_rate': 4.500322356032768e-06, 'epoch': 1.37} {'loss': 0.5651, 'learning_rate': 4.500048959601329e-06, 'epoch': 1.37} {'loss': 0.6511, 'learning_rate': 4.499775569063588e-06, 'epoch': 1.37} {'loss': 0.5422, 'learning_rate': 4.499502184419827e-06, 'epoch': 1.37} {'loss': 0.5273, 'learning_rate': 4.499228805670352e-06, 'epoch': 1.37} {'loss': 0.6041, 'learning_rate': 4.498955432815445e-06, 'epoch': 1.37} {'loss': 0.5305, 'learning_rate': 4.498682065855409e-06, 'epoch': 1.37} {'loss': 0.431, 'learning_rate': 4.498408704790529e-06, 'epoch': 1.37} {'loss': 0.5744, 'learning_rate': 4.4981353496211e-06, 'epoch': 1.37} {'loss': 0.4739, 'learning_rate': 4.497862000347419e-06, 'epoch': 1.37} {'loss': 0.6043, 'learning_rate': 4.497588656969768e-06, 'epoch': 1.37} {'loss': 0.5766, 'learning_rate': 4.497315319488455e-06, 'epoch': 1.37} {'loss': 0.5647, 'learning_rate': 4.497041987903758e-06, 'epoch': 1.37} {'loss': 0.4273, 'learning_rate': 4.496768662215986e-06, 'epoch': 1.37} {'loss': 0.5673, 'learning_rate': 4.4964953424254175e-06, 'epoch': 1.37} {'loss': 0.6972, 'learning_rate': 4.496222028532352e-06, 'epoch': 1.37} {'loss': 0.4676, 'learning_rate': 4.495948720537084e-06, 'epoch': 1.37} {'loss': 0.3891, 'learning_rate': 4.495675418439898e-06, 'epoch': 1.37} {'loss': 0.5405, 'learning_rate': 4.495402122241098e-06, 'epoch': 1.37} {'loss': 0.533, 'learning_rate': 4.495128831940965e-06, 'epoch': 1.37} {'loss': 0.3948, 'learning_rate': 4.494855547539806e-06, 'epoch': 1.37} {'loss': 0.4081, 'learning_rate': 4.494582269037901e-06, 'epoch': 1.37} {'loss': 0.532, 'learning_rate': 4.49430899643555e-06, 'epoch': 1.37} {'loss': 0.5138, 'learning_rate': 4.494035729733046e-06, 'epoch': 1.37} {'loss': 0.5648, 'learning_rate': 4.493762468930674e-06, 'epoch': 1.37} {'loss': 0.5491, 'learning_rate': 4.493489214028738e-06, 'epoch': 1.37} {'loss': 0.5908, 'learning_rate': 4.493215965027519e-06, 'epoch': 1.37} {'loss': 0.5099, 'learning_rate': 4.4929427219273224e-06, 'epoch': 1.37} {'loss': 0.5994, 'learning_rate': 4.492669484728432e-06, 'epoch': 1.37} {'loss': 0.6043, 'learning_rate': 4.492396253431144e-06, 'epoch': 1.37} {'loss': 0.463, 'learning_rate': 4.492123028035753e-06, 'epoch': 1.37} {'loss': 0.5269, 'learning_rate': 4.4918498085425426e-06, 'epoch': 1.37} {'loss': 0.5356, 'learning_rate': 4.4915765949518185e-06, 'epoch': 1.37} {'loss': 0.4849, 'learning_rate': 4.491303387263861e-06, 'epoch': 1.37} {'loss': 0.5303, 'learning_rate': 4.491030185478976e-06, 'epoch': 1.37} {'loss': 0.3865, 'learning_rate': 4.490756989597445e-06, 'epoch': 1.37} {'loss': 0.584, 'learning_rate': 4.490483799619566e-06, 'epoch': 1.37} {'loss': 0.5622, 'learning_rate': 4.490210615545635e-06, 'epoch': 1.37} {'loss': 0.4607, 'learning_rate': 4.489937437375933e-06, 'epoch': 1.37} {'loss': 0.4596, 'learning_rate': 4.489664265110767e-06, 'epoch': 1.37} {'loss': 0.5131, 'learning_rate': 4.48939109875042e-06, 'epoch': 1.37} {'loss': 0.2528, 'learning_rate': 4.489117938295188e-06, 'epoch': 1.37} {'loss': 0.5722, 'learning_rate': 4.488844783745363e-06, 'epoch': 1.37} {'loss': 0.6377, 'learning_rate': 4.4885716351012385e-06, 'epoch': 1.37} {'loss': 0.4765, 'learning_rate': 4.48829849236311e-06, 'epoch': 1.37} {'loss': 0.557, 'learning_rate': 4.4880253555312606e-06, 'epoch': 1.37} {'loss': 0.4754, 'learning_rate': 4.487752224605997e-06, 'epoch': 1.37} {'loss': 0.4908, 'learning_rate': 4.4874790995876e-06, 'epoch': 1.37} {'loss': 0.5657, 'learning_rate': 4.487205980476367e-06, 'epoch': 1.37} {'loss': 0.5861, 'learning_rate': 4.48693286727259e-06, 'epoch': 1.37} {'loss': 0.514, 'learning_rate': 4.486659759976563e-06, 'epoch': 1.37} {'loss': 0.6017, 'learning_rate': 4.48638665858858e-06, 'epoch': 1.37} {'loss': 0.464, 'learning_rate': 4.4861135631089245e-06, 'epoch': 1.37} {'loss': 0.5787, 'learning_rate': 4.485840473537903e-06, 'epoch': 1.37} {'loss': 0.4187, 'learning_rate': 4.485567389875799e-06, 'epoch': 1.37} {'loss': 0.4314, 'learning_rate': 4.485294312122905e-06, 'epoch': 1.37} {'loss': 0.4143, 'learning_rate': 4.485021240279518e-06, 'epoch': 1.37} {'loss': 0.443, 'learning_rate': 4.4847481743459275e-06, 'epoch': 1.37} {'loss': 0.5878, 'learning_rate': 4.484475114322431e-06, 'epoch': 1.37} {'loss': 0.5769, 'learning_rate': 4.4842020602093125e-06, 'epoch': 1.37} {'loss': 0.5942, 'learning_rate': 4.483929012006871e-06, 'epoch': 1.37} {'loss': 0.4752, 'learning_rate': 4.483655969715396e-06, 'epoch': 1.37} {'loss': 0.4463, 'learning_rate': 4.483382933335182e-06, 'epoch': 1.37} {'loss': 0.4893, 'learning_rate': 4.483109902866526e-06, 'epoch': 1.37} {'loss': 0.5939, 'learning_rate': 4.482836878309706e-06, 'epoch': 1.37} {'loss': 0.5982, 'learning_rate': 4.482563859665033e-06, 'epoch': 1.37} {'loss': 0.5095, 'learning_rate': 4.482290846932788e-06, 'epoch': 1.37} {'loss': 0.4854, 'learning_rate': 4.482017840113264e-06, 'epoch': 1.37} {'loss': 0.5827, 'learning_rate': 4.481744839206758e-06, 'epoch': 1.37} {'loss': 0.3486, 'learning_rate': 4.48147184421356e-06, 'epoch': 1.37} {'loss': 0.5868, 'learning_rate': 4.481198855133966e-06, 'epoch': 1.37} {'loss': 0.4941, 'learning_rate': 4.480925871968258e-06, 'epoch': 1.37} {'loss': 0.4363, 'learning_rate': 4.480652894716744e-06, 'epoch': 1.37} {'loss': 0.4334, 'learning_rate': 4.480379923379705e-06, 'epoch': 1.37} {'loss': 0.5658, 'learning_rate': 4.480106957957437e-06, 'epoch': 1.37} {'loss': 0.4031, 'learning_rate': 4.4798339984502325e-06, 'epoch': 1.37} {'loss': 0.509, 'learning_rate': 4.479561044858384e-06, 'epoch': 1.37} {'loss': 0.5476, 'learning_rate': 4.479288097182188e-06, 'epoch': 1.37} {'loss': 0.5499, 'learning_rate': 4.47901515542193e-06, 'epoch': 1.37} {'loss': 0.5706, 'learning_rate': 4.478742219577904e-06, 'epoch': 1.37} {'loss': 0.5807, 'learning_rate': 4.4784692896504055e-06, 'epoch': 1.37} {'loss': 0.4965, 'learning_rate': 4.478196365639724e-06, 'epoch': 1.37} {'loss': 0.5376, 'learning_rate': 4.477923447546155e-06, 'epoch': 1.37} {'loss': 0.5985, 'learning_rate': 4.477650535369988e-06, 'epoch': 1.37} {'loss': 0.5359, 'learning_rate': 4.477377629111523e-06, 'epoch': 1.37} {'loss': 0.4715, 'learning_rate': 4.47710472877104e-06, 'epoch': 1.37} {'loss': 0.4974, 'learning_rate': 4.476831834348838e-06, 'epoch': 1.37} {'loss': 0.6344, 'learning_rate': 4.476558945845211e-06, 'epoch': 1.37} {'loss': 0.4679, 'learning_rate': 4.476286063260448e-06, 'epoch': 1.37} {'loss': 0.5967, 'learning_rate': 4.4760131865948435e-06, 'epoch': 1.37} {'loss': 0.6377, 'learning_rate': 4.475740315848693e-06, 'epoch': 1.37} {'loss': 0.4322, 'learning_rate': 4.475467451022282e-06, 'epoch': 1.37} {'loss': 0.5501, 'learning_rate': 4.475194592115905e-06, 'epoch': 1.37} {'loss': 0.6345, 'learning_rate': 4.474921739129858e-06, 'epoch': 1.37} {'loss': 0.5862, 'learning_rate': 4.474648892064429e-06, 'epoch': 1.37} {'loss': 0.5784, 'learning_rate': 4.474376050919914e-06, 'epoch': 1.37} {'loss': 0.6934, 'learning_rate': 4.474103215696603e-06, 'epoch': 1.37} {'loss': 0.4929, 'learning_rate': 4.473830386394793e-06, 'epoch': 1.37} {'loss': 0.5104, 'learning_rate': 4.473557563014767e-06, 'epoch': 1.37} {'loss': 0.4126, 'learning_rate': 4.473284745556825e-06, 'epoch': 1.37} {'loss': 0.6142, 'learning_rate': 4.473011934021258e-06, 'epoch': 1.37} {'loss': 0.4821, 'learning_rate': 4.4727391284083555e-06, 'epoch': 1.37} {'loss': 0.5309, 'learning_rate': 4.4724663287184125e-06, 'epoch': 1.37} {'loss': 0.6271, 'learning_rate': 4.472193534951721e-06, 'epoch': 1.37} {'loss': 0.4623, 'learning_rate': 4.471920747108577e-06, 'epoch': 1.37} {'loss': 0.5551, 'learning_rate': 4.471647965189264e-06, 'epoch': 1.37} {'loss': 0.5346, 'learning_rate': 4.47137518919408e-06, 'epoch': 1.37} {'loss': 0.6529, 'learning_rate': 4.471102419123317e-06, 'epoch': 1.37} {'loss': 0.5502, 'learning_rate': 4.470829654977266e-06, 'epoch': 1.37} {'loss': 0.4882, 'learning_rate': 4.470556896756223e-06, 'epoch': 1.37} {'loss': 0.5479, 'learning_rate': 4.470284144460472e-06, 'epoch': 1.37} {'loss': 0.4591, 'learning_rate': 4.470011398090316e-06, 'epoch': 1.37} {'loss': 0.5827, 'learning_rate': 4.4697386576460385e-06, 'epoch': 1.38} {'loss': 0.353, 'learning_rate': 4.469465923127937e-06, 'epoch': 1.38} {'loss': 0.6444, 'learning_rate': 4.4691931945363e-06, 'epoch': 1.38} {'loss': 0.4355, 'learning_rate': 4.468920471871423e-06, 'epoch': 1.38} {'loss': 0.4354, 'learning_rate': 4.4686477551335995e-06, 'epoch': 1.38} {'loss': 0.6211, 'learning_rate': 4.4683750443231125e-06, 'epoch': 1.38} {'loss': 0.3936, 'learning_rate': 4.468102339440268e-06, 'epoch': 1.38} {'loss': 0.56, 'learning_rate': 4.467829640485347e-06, 'epoch': 1.38} {'loss': 0.5833, 'learning_rate': 4.467556947458646e-06, 'epoch': 1.38} {'loss': 0.46, 'learning_rate': 4.467284260360458e-06, 'epoch': 1.38} {'loss': 0.544, 'learning_rate': 4.467011579191074e-06, 'epoch': 1.38} {'loss': 0.5122, 'learning_rate': 4.4667389039507895e-06, 'epoch': 1.38} {'loss': 0.4819, 'learning_rate': 4.4664662346398864e-06, 'epoch': 1.38} {'loss': 0.3922, 'learning_rate': 4.466193571258672e-06, 'epoch': 1.38} {'loss': 0.6363, 'learning_rate': 4.465920913807426e-06, 'epoch': 1.38} {'loss': 0.583, 'learning_rate': 4.465648262286447e-06, 'epoch': 1.38} {'loss': 0.591, 'learning_rate': 4.465375616696028e-06, 'epoch': 1.38} {'loss': 0.6227, 'learning_rate': 4.46510297703645e-06, 'epoch': 1.38} {'loss': 0.5851, 'learning_rate': 4.464830343308023e-06, 'epoch': 1.38} {'loss': 0.5292, 'learning_rate': 4.464557715511026e-06, 'epoch': 1.38} {'loss': 0.6936, 'learning_rate': 4.464285093645754e-06, 'epoch': 1.38} {'loss': 0.511, 'learning_rate': 4.464012477712501e-06, 'epoch': 1.38} {'loss': 0.5161, 'learning_rate': 4.463739867711558e-06, 'epoch': 1.38} {'loss': 0.5164, 'learning_rate': 4.463467263643221e-06, 'epoch': 1.38} {'loss': 0.4664, 'learning_rate': 4.46319466550777e-06, 'epoch': 1.38} {'loss': 0.4247, 'learning_rate': 4.4629220733055155e-06, 'epoch': 1.38} {'loss': 0.4829, 'learning_rate': 4.462649487036734e-06, 'epoch': 1.38} {'loss': 0.486, 'learning_rate': 4.462376906701724e-06, 'epoch': 1.38} {'loss': 0.5675, 'learning_rate': 4.462104332300777e-06, 'epoch': 1.38} {'loss': 0.5196, 'learning_rate': 4.4618317638341855e-06, 'epoch': 1.38} {'loss': 0.4101, 'learning_rate': 4.4615592013022445e-06, 'epoch': 1.38} {'loss': 0.642, 'learning_rate': 4.461286644705235e-06, 'epoch': 1.38} {'loss': 0.5975, 'learning_rate': 4.4610140940434645e-06, 'epoch': 1.38} {'loss': 0.4823, 'learning_rate': 4.460741549317213e-06, 'epoch': 1.38} {'loss': 0.5353, 'learning_rate': 4.460469010526778e-06, 'epoch': 1.38} {'loss': 0.4069, 'learning_rate': 4.4601964776724534e-06, 'epoch': 1.38} {'loss': 0.5347, 'learning_rate': 4.459923950754521e-06, 'epoch': 1.38} {'loss': 0.4636, 'learning_rate': 4.4596514297732874e-06, 'epoch': 1.38} {'loss': 0.5031, 'learning_rate': 4.45937891472903e-06, 'epoch': 1.38} {'loss': 0.5599, 'learning_rate': 4.4591064056220555e-06, 'epoch': 1.38} {'loss': 0.3259, 'learning_rate': 4.458833902452645e-06, 'epoch': 1.38} {'loss': 0.4954, 'learning_rate': 4.458561405221095e-06, 'epoch': 1.38} {'loss': 0.4475, 'learning_rate': 4.4582889139276985e-06, 'epoch': 1.38} {'loss': 0.6775, 'learning_rate': 4.458016428572739e-06, 'epoch': 1.38} {'loss': 0.4461, 'learning_rate': 4.457743949156522e-06, 'epoch': 1.38} {'loss': 0.585, 'learning_rate': 4.4574714756793256e-06, 'epoch': 1.38} {'loss': 0.4264, 'learning_rate': 4.457199008141457e-06, 'epoch': 1.38} {'loss': 0.5053, 'learning_rate': 4.4569265465431955e-06, 'epoch': 1.38} {'loss': 0.4554, 'learning_rate': 4.456654090884838e-06, 'epoch': 1.38} {'loss': 0.5856, 'learning_rate': 4.456381641166678e-06, 'epoch': 1.38} {'loss': 0.5863, 'learning_rate': 4.4561091973890005e-06, 'epoch': 1.38} {'loss': 0.6232, 'learning_rate': 4.455836759552108e-06, 'epoch': 1.38} {'loss': 0.518, 'learning_rate': 4.4555643276562795e-06, 'epoch': 1.38} {'loss': 0.4371, 'learning_rate': 4.455291901701822e-06, 'epoch': 1.38} {'loss': 0.581, 'learning_rate': 4.455019481689016e-06, 'epoch': 1.38} {'loss': 0.6952, 'learning_rate': 4.454747067618157e-06, 'epoch': 1.38} {'loss': 0.6462, 'learning_rate': 4.45447465948954e-06, 'epoch': 1.38} {'loss': 0.4112, 'learning_rate': 4.454202257303448e-06, 'epoch': 1.38} {'loss': 0.4307, 'learning_rate': 4.4539298610601855e-06, 'epoch': 1.38} {'loss': 0.39, 'learning_rate': 4.45365747076003e-06, 'epoch': 1.38} {'loss': 0.5792, 'learning_rate': 4.453385086403289e-06, 'epoch': 1.38} {'loss': 0.4792, 'learning_rate': 4.453112707990243e-06, 'epoch': 1.38} {'loss': 0.5967, 'learning_rate': 4.452840335521187e-06, 'epoch': 1.38} {'loss': 0.6364, 'learning_rate': 4.452567968996416e-06, 'epoch': 1.38} {'loss': 0.444, 'learning_rate': 4.452295608416214e-06, 'epoch': 1.38} {'loss': 0.5002, 'learning_rate': 4.452023253780884e-06, 'epoch': 1.38} {'loss': 0.5329, 'learning_rate': 4.4517509050907075e-06, 'epoch': 1.38} {'loss': 0.7158, 'learning_rate': 4.451478562345981e-06, 'epoch': 1.38} {'loss': 0.602, 'learning_rate': 4.451206225546997e-06, 'epoch': 1.38} {'loss': 0.4902, 'learning_rate': 4.450933894694045e-06, 'epoch': 1.38} {'loss': 0.5745, 'learning_rate': 4.450661569787422e-06, 'epoch': 1.38} {'loss': 0.5322, 'learning_rate': 4.450389250827409e-06, 'epoch': 1.38} {'loss': 0.4525, 'learning_rate': 4.450116937814313e-06, 'epoch': 1.38} {'loss': 0.6907, 'learning_rate': 4.449844630748413e-06, 'epoch': 1.38} {'loss': 0.5143, 'learning_rate': 4.449572329630007e-06, 'epoch': 1.38} {'loss': 0.4285, 'learning_rate': 4.449300034459383e-06, 'epoch': 1.38} {'loss': 0.5853, 'learning_rate': 4.449027745236836e-06, 'epoch': 1.38} {'loss': 0.4762, 'learning_rate': 4.4487554619626595e-06, 'epoch': 1.38} {'loss': 0.6349, 'learning_rate': 4.4484831846371355e-06, 'epoch': 1.38} {'loss': 0.6523, 'learning_rate': 4.448210913260571e-06, 'epoch': 1.38} {'loss': 0.4308, 'learning_rate': 4.447938647833245e-06, 'epoch': 1.38} {'loss': 0.3415, 'learning_rate': 4.447666388355455e-06, 'epoch': 1.38} {'loss': 0.477, 'learning_rate': 4.447394134827492e-06, 'epoch': 1.38} {'loss': 0.5649, 'learning_rate': 4.447121887249646e-06, 'epoch': 1.38} {'loss': 0.4986, 'learning_rate': 4.446849645622213e-06, 'epoch': 1.38} {'loss': 0.5277, 'learning_rate': 4.44657740994548e-06, 'epoch': 1.38} {'loss': 0.5324, 'learning_rate': 4.44630518021974e-06, 'epoch': 1.38} {'loss': 0.5522, 'learning_rate': 4.446032956445284e-06, 'epoch': 1.38} {'loss': 0.5904, 'learning_rate': 4.445760738622407e-06, 'epoch': 1.38} {'loss': 0.4511, 'learning_rate': 4.445488526751397e-06, 'epoch': 1.38} {'loss': 0.5243, 'learning_rate': 4.445216320832548e-06, 'epoch': 1.38} {'loss': 0.3264, 'learning_rate': 4.444944120866155e-06, 'epoch': 1.38} {'loss': 0.4865, 'learning_rate': 4.444671926852502e-06, 'epoch': 1.38} {'loss': 0.556, 'learning_rate': 4.444399738791883e-06, 'epoch': 1.38} {'loss': 0.5425, 'learning_rate': 4.444127556684593e-06, 'epoch': 1.38} {'loss': 0.5448, 'learning_rate': 4.443855380530921e-06, 'epoch': 1.38} {'loss': 0.532, 'learning_rate': 4.44358321033116e-06, 'epoch': 1.38} {'loss': 0.4912, 'learning_rate': 4.443311046085601e-06, 'epoch': 1.38} {'loss': 0.4325, 'learning_rate': 4.443038887794539e-06, 'epoch': 1.38} {'loss': 0.5302, 'learning_rate': 4.4427667354582586e-06, 'epoch': 1.38} {'loss': 0.6911, 'learning_rate': 4.442494589077055e-06, 'epoch': 1.38} {'loss': 0.5173, 'learning_rate': 4.4422224486512215e-06, 'epoch': 1.38} {'loss': 0.4989, 'learning_rate': 4.441950314181046e-06, 'epoch': 1.38} {'loss': 0.6432, 'learning_rate': 4.4416781856668234e-06, 'epoch': 1.38} {'loss': 0.5942, 'learning_rate': 4.441406063108849e-06, 'epoch': 1.38} {'loss': 0.4187, 'learning_rate': 4.441133946507405e-06, 'epoch': 1.38} {'loss': 0.6601, 'learning_rate': 4.440861835862788e-06, 'epoch': 1.38} {'loss': 0.4999, 'learning_rate': 4.440589731175289e-06, 'epoch': 1.38} {'loss': 0.5364, 'learning_rate': 4.440317632445201e-06, 'epoch': 1.38} {'loss': 0.7185, 'learning_rate': 4.440045539672813e-06, 'epoch': 1.38} {'loss': 0.5648, 'learning_rate': 4.439773452858421e-06, 'epoch': 1.38} {'loss': 0.3667, 'learning_rate': 4.4395013720023115e-06, 'epoch': 1.38} {'loss': 0.56, 'learning_rate': 4.439229297104778e-06, 'epoch': 1.38} {'loss': 0.6565, 'learning_rate': 4.438957228166112e-06, 'epoch': 1.38} {'loss': 0.5301, 'learning_rate': 4.4386851651866046e-06, 'epoch': 1.38} {'loss': 0.5482, 'learning_rate': 4.438413108166548e-06, 'epoch': 1.38} {'loss': 0.5181, 'learning_rate': 4.438141057106234e-06, 'epoch': 1.38} {'loss': 0.6099, 'learning_rate': 4.437869012005959e-06, 'epoch': 1.38} {'loss': 0.4692, 'learning_rate': 4.437596972866004e-06, 'epoch': 1.38} {'loss': 0.6554, 'learning_rate': 4.4373249396866665e-06, 'epoch': 1.38} {'loss': 0.5597, 'learning_rate': 4.437052912468237e-06, 'epoch': 1.38} {'loss': 0.6516, 'learning_rate': 4.436780891211008e-06, 'epoch': 1.38} {'loss': 0.442, 'learning_rate': 4.43650887591527e-06, 'epoch': 1.38} {'loss': 0.52, 'learning_rate': 4.436236866581318e-06, 'epoch': 1.38} {'loss': 0.4393, 'learning_rate': 4.435964863209438e-06, 'epoch': 1.38} {'loss': 0.6857, 'learning_rate': 4.435692865799923e-06, 'epoch': 1.38} {'loss': 0.5956, 'learning_rate': 4.4354208743530646e-06, 'epoch': 1.38} {'loss': 0.5616, 'learning_rate': 4.435148888869156e-06, 'epoch': 1.38} {'loss': 0.5159, 'learning_rate': 4.434876909348488e-06, 'epoch': 1.38} {'loss': 0.564, 'learning_rate': 4.434604935791351e-06, 'epoch': 1.38} {'loss': 0.4975, 'learning_rate': 4.434332968198041e-06, 'epoch': 1.38} {'loss': 0.6002, 'learning_rate': 4.434061006568842e-06, 'epoch': 1.38} {'loss': 0.6362, 'learning_rate': 4.433789050904048e-06, 'epoch': 1.38} {'loss': 0.503, 'learning_rate': 4.433517101203952e-06, 'epoch': 1.38} {'loss': 0.6196, 'learning_rate': 4.433245157468845e-06, 'epoch': 1.38} {'loss': 0.5399, 'learning_rate': 4.432973219699018e-06, 'epoch': 1.38} {'loss': 0.4042, 'learning_rate': 4.4327012878947625e-06, 'epoch': 1.38} {'loss': 0.5567, 'learning_rate': 4.432429362056375e-06, 'epoch': 1.38} {'loss': 0.4505, 'learning_rate': 4.4321574421841374e-06, 'epoch': 1.38} {'loss': 0.5729, 'learning_rate': 4.431885528278346e-06, 'epoch': 1.38} {'loss': 0.5644, 'learning_rate': 4.431613620339291e-06, 'epoch': 1.38} {'loss': 0.7333, 'learning_rate': 4.431341718367264e-06, 'epoch': 1.38} {'loss': 0.5457, 'learning_rate': 4.431069822362563e-06, 'epoch': 1.38} {'loss': 0.6329, 'learning_rate': 4.430797932325464e-06, 'epoch': 1.38} {'loss': 0.4803, 'learning_rate': 4.430526048256275e-06, 'epoch': 1.38} {'loss': 0.3985, 'learning_rate': 4.430254170155277e-06, 'epoch': 1.38} {'loss': 0.5286, 'learning_rate': 4.429982298022765e-06, 'epoch': 1.38} {'loss': 0.5564, 'learning_rate': 4.429710431859029e-06, 'epoch': 1.38} {'loss': 0.6165, 'learning_rate': 4.429438571664361e-06, 'epoch': 1.38} {'loss': 0.5422, 'learning_rate': 4.4291667174390555e-06, 'epoch': 1.38} {'loss': 0.5728, 'learning_rate': 4.4288948691833945e-06, 'epoch': 1.38} {'loss': 0.6922, 'learning_rate': 4.428623026897682e-06, 'epoch': 1.38} {'loss': 0.5138, 'learning_rate': 4.428351190582199e-06, 'epoch': 1.38} {'loss': 0.5478, 'learning_rate': 4.428079360237241e-06, 'epoch': 1.38} {'loss': 0.5654, 'learning_rate': 4.427807535863102e-06, 'epoch': 1.38} {'loss': 0.6797, 'learning_rate': 4.427535717460063e-06, 'epoch': 1.38} {'loss': 0.4588, 'learning_rate': 4.4272639050284304e-06, 'epoch': 1.38} {'loss': 0.4962, 'learning_rate': 4.426992098568479e-06, 'epoch': 1.38} {'loss': 0.4703, 'learning_rate': 4.4267202980805165e-06, 'epoch': 1.38} {'loss': 0.4742, 'learning_rate': 4.426448503564823e-06, 'epoch': 1.38} {'loss': 0.4308, 'learning_rate': 4.426176715021693e-06, 'epoch': 1.38} {'loss': 0.4895, 'learning_rate': 4.42590493245142e-06, 'epoch': 1.38} {'loss': 0.4991, 'learning_rate': 4.4256331558542875e-06, 'epoch': 1.38} {'loss': 0.5762, 'learning_rate': 4.425361385230599e-06, 'epoch': 1.38} {'loss': 0.5695, 'learning_rate': 4.42508962058063e-06, 'epoch': 1.38} {'loss': 0.3719, 'learning_rate': 4.42481786190469e-06, 'epoch': 1.38} {'loss': 0.493, 'learning_rate': 4.424546109203056e-06, 'epoch': 1.38} {'loss': 0.5039, 'learning_rate': 4.424274362476024e-06, 'epoch': 1.38} {'loss': 0.6616, 'learning_rate': 4.42400262172389e-06, 'epoch': 1.38} {'loss': 0.5266, 'learning_rate': 4.423730886946933e-06, 'epoch': 1.38} {'loss': 0.4893, 'learning_rate': 4.423459158145458e-06, 'epoch': 1.38} {'loss': 0.6306, 'learning_rate': 4.423187435319744e-06, 'epoch': 1.38} {'loss': 0.5534, 'learning_rate': 4.422915718470093e-06, 'epoch': 1.38} {'loss': 0.4685, 'learning_rate': 4.422644007596789e-06, 'epoch': 1.38} {'loss': 0.5814, 'learning_rate': 4.422372302700125e-06, 'epoch': 1.38} {'loss': 0.275, 'learning_rate': 4.422100603780397e-06, 'epoch': 1.38} {'loss': 0.5145, 'learning_rate': 4.421828910837883e-06, 'epoch': 1.38} {'loss': 0.5993, 'learning_rate': 4.421557223872891e-06, 'epoch': 1.38} {'loss': 0.5559, 'learning_rate': 4.421285542885701e-06, 'epoch': 1.38} {'loss': 0.6907, 'learning_rate': 4.421013867876605e-06, 'epoch': 1.38} {'loss': 0.5454, 'learning_rate': 4.420742198845898e-06, 'epoch': 1.38} {'loss': 0.4165, 'learning_rate': 4.420470535793867e-06, 'epoch': 1.38} {'loss': 0.522, 'learning_rate': 4.4201988787208115e-06, 'epoch': 1.38} {'loss': 0.3873, 'learning_rate': 4.419927227627008e-06, 'epoch': 1.38} {'loss': 0.6823, 'learning_rate': 4.419655582512764e-06, 'epoch': 1.38} {'loss': 0.6047, 'learning_rate': 4.419383943378358e-06, 'epoch': 1.38} {'loss': 0.4735, 'learning_rate': 4.4191123102240865e-06, 'epoch': 1.38} {'loss': 0.5837, 'learning_rate': 4.41884068305024e-06, 'epoch': 1.38} {'loss': 0.4094, 'learning_rate': 4.41856906185711e-06, 'epoch': 1.38} {'loss': 0.5994, 'learning_rate': 4.418297446644989e-06, 'epoch': 1.38} {'loss': 0.4571, 'learning_rate': 4.4180258374141605e-06, 'epoch': 1.38} {'loss': 0.4712, 'learning_rate': 4.417754234164927e-06, 'epoch': 1.38} {'loss': 0.6292, 'learning_rate': 4.417482636897571e-06, 'epoch': 1.38} {'loss': 0.43, 'learning_rate': 4.417211045612386e-06, 'epoch': 1.38} {'loss': 0.5237, 'learning_rate': 4.416939460309667e-06, 'epoch': 1.38} {'loss': 0.6482, 'learning_rate': 4.4166678809896936e-06, 'epoch': 1.38} {'loss': 0.4913, 'learning_rate': 4.416396307652772e-06, 'epoch': 1.38} {'loss': 0.6392, 'learning_rate': 4.416124740299178e-06, 'epoch': 1.38} {'loss': 0.5367, 'learning_rate': 4.415853178929218e-06, 'epoch': 1.38} {'loss': 0.6501, 'learning_rate': 4.415581623543171e-06, 'epoch': 1.38} {'loss': 0.6128, 'learning_rate': 4.415310074141333e-06, 'epoch': 1.38} {'loss': 0.5788, 'learning_rate': 4.415038530723999e-06, 'epoch': 1.38} {'loss': 0.5085, 'learning_rate': 4.414766993291446e-06, 'epoch': 1.38} {'loss': 0.693, 'learning_rate': 4.414495461843983e-06, 'epoch': 1.38} {'loss': 0.5098, 'learning_rate': 4.4142239363818836e-06, 'epoch': 1.38} {'loss': 0.5602, 'learning_rate': 4.413952416905456e-06, 'epoch': 1.38} {'loss': 0.6684, 'learning_rate': 4.413680903414979e-06, 'epoch': 1.38} {'loss': 0.5835, 'learning_rate': 4.413409395910746e-06, 'epoch': 1.38} {'loss': 0.3831, 'learning_rate': 4.4131378943930535e-06, 'epoch': 1.38} {'loss': 0.6701, 'learning_rate': 4.4128663988621804e-06, 'epoch': 1.38} {'loss': 0.5236, 'learning_rate': 4.412594909318432e-06, 'epoch': 1.38} {'loss': 0.5389, 'learning_rate': 4.41232342576209e-06, 'epoch': 1.38} {'loss': 0.4291, 'learning_rate': 4.4120519481934465e-06, 'epoch': 1.38} {'loss': 0.6117, 'learning_rate': 4.411780476612795e-06, 'epoch': 1.38} {'loss': 0.6083, 'learning_rate': 4.411509011020424e-06, 'epoch': 1.38} {'loss': 0.3178, 'learning_rate': 4.41123755141663e-06, 'epoch': 1.38} {'loss': 0.4164, 'learning_rate': 4.410966097801691e-06, 'epoch': 1.38} {'loss': 0.4292, 'learning_rate': 4.410694650175914e-06, 'epoch': 1.38} {'loss': 0.3072, 'learning_rate': 4.410423208539578e-06, 'epoch': 1.38} {'loss': 0.5883, 'learning_rate': 4.410151772892979e-06, 'epoch': 1.38} {'loss': 0.4196, 'learning_rate': 4.409880343236407e-06, 'epoch': 1.38} {'loss': 0.538, 'learning_rate': 4.409608919570152e-06, 'epoch': 1.38} {'loss': 0.5149, 'learning_rate': 4.40933750189451e-06, 'epoch': 1.38} {'loss': 0.5747, 'learning_rate': 4.4090660902097595e-06, 'epoch': 1.38} {'loss': 0.6998, 'learning_rate': 4.408794684516206e-06, 'epoch': 1.38} {'loss': 0.5551, 'learning_rate': 4.408523284814131e-06, 'epoch': 1.38} {'loss': 0.5167, 'learning_rate': 4.408251891103828e-06, 'epoch': 1.38} {'loss': 0.4772, 'learning_rate': 4.407980503385588e-06, 'epoch': 1.38} {'loss': 0.6024, 'learning_rate': 4.407709121659701e-06, 'epoch': 1.38} {'loss': 0.498, 'learning_rate': 4.407437745926461e-06, 'epoch': 1.38} {'loss': 0.4154, 'learning_rate': 4.407166376186155e-06, 'epoch': 1.38} {'loss': 0.5117, 'learning_rate': 4.406895012439074e-06, 'epoch': 1.38} {'loss': 0.4009, 'learning_rate': 4.406623654685509e-06, 'epoch': 1.38} {'loss': 0.5587, 'learning_rate': 4.406352302925753e-06, 'epoch': 1.38} {'loss': 0.4293, 'learning_rate': 4.406080957160094e-06, 'epoch': 1.38} {'loss': 0.6397, 'learning_rate': 4.405809617388824e-06, 'epoch': 1.38} {'loss': 0.5048, 'learning_rate': 4.4055382836122384e-06, 'epoch': 1.38} {'loss': 0.5661, 'learning_rate': 4.4052669558306205e-06, 'epoch': 1.38} {'loss': 0.5387, 'learning_rate': 4.404995634044262e-06, 'epoch': 1.38} {'loss': 0.6364, 'learning_rate': 4.404724318253458e-06, 'epoch': 1.38} {'loss': 0.4658, 'learning_rate': 4.404453008458496e-06, 'epoch': 1.38} {'loss': 0.5994, 'learning_rate': 4.4041817046596665e-06, 'epoch': 1.38} {'loss': 0.62, 'learning_rate': 4.403910406857266e-06, 'epoch': 1.38} {'loss': 0.5672, 'learning_rate': 4.403639115051577e-06, 'epoch': 1.38} {'loss': 0.4861, 'learning_rate': 4.403367829242894e-06, 'epoch': 1.38} {'loss': 0.5305, 'learning_rate': 4.403096549431507e-06, 'epoch': 1.38} {'loss': 0.5017, 'learning_rate': 4.402825275617707e-06, 'epoch': 1.38} {'loss': 0.5391, 'learning_rate': 4.402554007801785e-06, 'epoch': 1.38} {'loss': 0.4784, 'learning_rate': 4.402282745984031e-06, 'epoch': 1.38} {'loss': 0.5827, 'learning_rate': 4.4020114901647415e-06, 'epoch': 1.38} {'loss': 0.3708, 'learning_rate': 4.401740240344198e-06, 'epoch': 1.38} {'loss': 0.471, 'learning_rate': 4.401468996522695e-06, 'epoch': 1.38} {'loss': 0.4532, 'learning_rate': 4.401197758700522e-06, 'epoch': 1.38} {'loss': 0.6524, 'learning_rate': 4.400926526877971e-06, 'epoch': 1.38} {'loss': 0.5098, 'learning_rate': 4.400655301055333e-06, 'epoch': 1.38} {'loss': 0.5132, 'learning_rate': 4.400384081232899e-06, 'epoch': 1.38} {'loss': 0.5474, 'learning_rate': 4.400112867410962e-06, 'epoch': 1.38} {'loss': 0.6381, 'learning_rate': 4.399841659589806e-06, 'epoch': 1.38} {'loss': 0.4199, 'learning_rate': 4.399570457769725e-06, 'epoch': 1.38} {'loss': 0.3748, 'learning_rate': 4.39929926195101e-06, 'epoch': 1.38} {'loss': 0.6433, 'learning_rate': 4.3990280721339506e-06, 'epoch': 1.38} {'loss': 0.5533, 'learning_rate': 4.398756888318842e-06, 'epoch': 1.38} {'loss': 0.6081, 'learning_rate': 4.398485710505969e-06, 'epoch': 1.38} {'loss': 0.4952, 'learning_rate': 4.398214538695622e-06, 'epoch': 1.38} {'loss': 0.5126, 'learning_rate': 4.397943372888094e-06, 'epoch': 1.38} {'loss': 0.5831, 'learning_rate': 4.397672213083676e-06, 'epoch': 1.38} {'loss': 0.5087, 'learning_rate': 4.397401059282658e-06, 'epoch': 1.38} {'loss': 0.6335, 'learning_rate': 4.397129911485329e-06, 'epoch': 1.38} {'loss': 0.3213, 'learning_rate': 4.396858769691986e-06, 'epoch': 1.38} {'loss': 0.4894, 'learning_rate': 4.39658763390291e-06, 'epoch': 1.38} {'loss': 0.7047, 'learning_rate': 4.396316504118396e-06, 'epoch': 1.38} {'loss': 0.63, 'learning_rate': 4.396045380338736e-06, 'epoch': 1.38} {'loss': 0.4872, 'learning_rate': 4.395774262564218e-06, 'epoch': 1.38} {'loss': 0.3097, 'learning_rate': 4.395503150795134e-06, 'epoch': 1.38} {'loss': 0.4609, 'learning_rate': 4.395232045031774e-06, 'epoch': 1.38} {'loss': 0.5461, 'learning_rate': 4.394960945274433e-06, 'epoch': 1.38} {'loss': 0.4657, 'learning_rate': 4.394689851523394e-06, 'epoch': 1.38} {'loss': 0.6159, 'learning_rate': 4.3944187637789495e-06, 'epoch': 1.38} {'loss': 0.5118, 'learning_rate': 4.394147682041392e-06, 'epoch': 1.38} {'loss': 0.4486, 'learning_rate': 4.393876606311011e-06, 'epoch': 1.38} {'loss': 0.4964, 'learning_rate': 4.3936055365881e-06, 'epoch': 1.38} {'loss': 0.5631, 'learning_rate': 4.393334472872941e-06, 'epoch': 1.38} {'loss': 0.5128, 'learning_rate': 4.393063415165836e-06, 'epoch': 1.38} {'loss': 0.4523, 'learning_rate': 4.392792363467067e-06, 'epoch': 1.38} {'loss': 0.457, 'learning_rate': 4.392521317776927e-06, 'epoch': 1.38} {'loss': 0.5654, 'learning_rate': 4.392250278095705e-06, 'epoch': 1.38} {'loss': 0.5187, 'learning_rate': 4.3919792444236945e-06, 'epoch': 1.38} {'loss': 0.5329, 'learning_rate': 4.391708216761188e-06, 'epoch': 1.38} {'loss': 0.6448, 'learning_rate': 4.391437195108465e-06, 'epoch': 1.38} {'loss': 0.4206, 'learning_rate': 4.39116617946583e-06, 'epoch': 1.38} {'loss': 0.4787, 'learning_rate': 4.390895169833562e-06, 'epoch': 1.38} {'loss': 0.4736, 'learning_rate': 4.390624166211958e-06, 'epoch': 1.38} {'loss': 0.6238, 'learning_rate': 4.390353168601306e-06, 'epoch': 1.38} {'loss': 0.5577, 'learning_rate': 4.390082177001896e-06, 'epoch': 1.38} {'loss': 0.625, 'learning_rate': 4.389811191414024e-06, 'epoch': 1.38} {'loss': 0.459, 'learning_rate': 4.389540211837968e-06, 'epoch': 1.38} {'loss': 0.606, 'learning_rate': 4.389269238274033e-06, 'epoch': 1.38} {'loss': 0.5136, 'learning_rate': 4.3889982707224985e-06, 'epoch': 1.38} {'loss': 0.5217, 'learning_rate': 4.38872730918366e-06, 'epoch': 1.38} {'loss': 0.512, 'learning_rate': 4.388456353657809e-06, 'epoch': 1.38} {'loss': 0.444, 'learning_rate': 4.388185404145228e-06, 'epoch': 1.38} {'loss': 0.5971, 'learning_rate': 4.387914460646219e-06, 'epoch': 1.38} {'loss': 0.5279, 'learning_rate': 4.387643523161058e-06, 'epoch': 1.38} {'loss': 0.5633, 'learning_rate': 4.387372591690052e-06, 'epoch': 1.38} {'loss': 0.4506, 'learning_rate': 4.3871016662334785e-06, 'epoch': 1.38} {'loss': 0.4662, 'learning_rate': 4.386830746791632e-06, 'epoch': 1.38} {'loss': 0.6307, 'learning_rate': 4.386559833364808e-06, 'epoch': 1.38} {'loss': 0.6494, 'learning_rate': 4.386288925953284e-06, 'epoch': 1.38} {'loss': 0.6011, 'learning_rate': 4.386018024557365e-06, 'epoch': 1.38} {'loss': 0.5513, 'learning_rate': 4.385747129177327e-06, 'epoch': 1.38} {'loss': 0.6286, 'learning_rate': 4.385476239813474e-06, 'epoch': 1.38} {'loss': 0.4193, 'learning_rate': 4.385205356466088e-06, 'epoch': 1.38} {'loss': 0.4729, 'learning_rate': 4.38493447913546e-06, 'epoch': 1.38} {'loss': 0.6757, 'learning_rate': 4.384663607821887e-06, 'epoch': 1.38} {'loss': 0.4443, 'learning_rate': 4.384392742525644e-06, 'epoch': 1.38} {'loss': 0.4971, 'learning_rate': 4.38412188324704e-06, 'epoch': 1.38} {'loss': 0.5673, 'learning_rate': 4.383851029986348e-06, 'epoch': 1.38} {'loss': 0.5215, 'learning_rate': 4.383580182743874e-06, 'epoch': 1.38} {'loss': 0.4212, 'learning_rate': 4.383309341519898e-06, 'epoch': 1.38} {'loss': 0.5619, 'learning_rate': 4.383038506314712e-06, 'epoch': 1.38} {'loss': 0.5536, 'learning_rate': 4.382767677128611e-06, 'epoch': 1.38} {'loss': 0.491, 'learning_rate': 4.382496853961874e-06, 'epoch': 1.38} {'loss': 0.5042, 'learning_rate': 4.382226036814806e-06, 'epoch': 1.38} {'loss': 0.6719, 'learning_rate': 4.381955225687683e-06, 'epoch': 1.38} {'loss': 0.5187, 'learning_rate': 4.381684420580809e-06, 'epoch': 1.38} {'loss': 0.6035, 'learning_rate': 4.381413621494463e-06, 'epoch': 1.38} {'loss': 0.6065, 'learning_rate': 4.381142828428941e-06, 'epoch': 1.38} {'loss': 0.5784, 'learning_rate': 4.380872041384534e-06, 'epoch': 1.38} {'loss': 0.6481, 'learning_rate': 4.380601260361523e-06, 'epoch': 1.38} {'loss': 0.6293, 'learning_rate': 4.380330485360212e-06, 'epoch': 1.38} {'loss': 0.5156, 'learning_rate': 4.380059716380881e-06, 'epoch': 1.38} {'loss': 0.7073, 'learning_rate': 4.379788953423822e-06, 'epoch': 1.38} {'loss': 0.5963, 'learning_rate': 4.379518196489327e-06, 'epoch': 1.38} {'loss': 0.532, 'learning_rate': 4.379247445577685e-06, 'epoch': 1.38} {'loss': 0.4687, 'learning_rate': 4.378976700689192e-06, 'epoch': 1.38} {'loss': 0.4279, 'learning_rate': 4.378705961824125e-06, 'epoch': 1.38} {'loss': 0.6193, 'learning_rate': 4.378435228982788e-06, 'epoch': 1.38} {'loss': 0.5915, 'learning_rate': 4.378164502165463e-06, 'epoch': 1.38} {'loss': 0.5365, 'learning_rate': 4.377893781372441e-06, 'epoch': 1.38} {'loss': 0.5139, 'learning_rate': 4.377623066604013e-06, 'epoch': 1.38} {'loss': 0.5208, 'learning_rate': 4.377352357860469e-06, 'epoch': 1.38} {'loss': 0.4138, 'learning_rate': 4.377081655142105e-06, 'epoch': 1.38} {'loss': 0.5855, 'learning_rate': 4.376810958449197e-06, 'epoch': 1.38} {'loss': 0.4118, 'learning_rate': 4.37654026778205e-06, 'epoch': 1.38} {'loss': 0.417, 'learning_rate': 4.376269583140945e-06, 'epoch': 1.38} {'loss': 0.6918, 'learning_rate': 4.3759989045261755e-06, 'epoch': 1.38} {'loss': 0.525, 'learning_rate': 4.375728231938029e-06, 'epoch': 1.38} {'loss': 0.5056, 'learning_rate': 4.375457565376798e-06, 'epoch': 1.38} {'loss': 0.5456, 'learning_rate': 4.375186904842777e-06, 'epoch': 1.38} {'loss': 0.51, 'learning_rate': 4.3749162503362455e-06, 'epoch': 1.38} {'loss': 0.3875, 'learning_rate': 4.374645601857499e-06, 'epoch': 1.38} {'loss': 0.737, 'learning_rate': 4.3743749594068286e-06, 'epoch': 1.38} {'loss': 0.4713, 'learning_rate': 4.374104322984523e-06, 'epoch': 1.38} {'loss': 0.6589, 'learning_rate': 4.373833692590874e-06, 'epoch': 1.38} {'loss': 0.4584, 'learning_rate': 4.373563068226164e-06, 'epoch': 1.38} {'loss': 0.6115, 'learning_rate': 4.373292449890697e-06, 'epoch': 1.38} {'loss': 0.6459, 'learning_rate': 4.373021837584751e-06, 'epoch': 1.38} {'loss': 0.3962, 'learning_rate': 4.3727512313086195e-06, 'epoch': 1.38} {'loss': 0.5548, 'learning_rate': 4.372480631062593e-06, 'epoch': 1.38} {'loss': 0.5959, 'learning_rate': 4.3722100368469625e-06, 'epoch': 1.38} {'loss': 0.625, 'learning_rate': 4.371939448662019e-06, 'epoch': 1.38} {'loss': 0.5547, 'learning_rate': 4.371668866508044e-06, 'epoch': 1.38} {'loss': 0.5509, 'learning_rate': 4.371398290385341e-06, 'epoch': 1.38} {'loss': 0.65, 'learning_rate': 4.371127720294189e-06, 'epoch': 1.38} {'loss': 0.5465, 'learning_rate': 4.370857156234881e-06, 'epoch': 1.38} {'loss': 0.3527, 'learning_rate': 4.370586598207709e-06, 'epoch': 1.38} {'loss': 0.4506, 'learning_rate': 4.3703160462129605e-06, 'epoch': 1.38} {'loss': 0.4783, 'learning_rate': 4.37004550025093e-06, 'epoch': 1.38} {'loss': 0.4937, 'learning_rate': 4.369774960321901e-06, 'epoch': 1.38} {'loss': 0.5281, 'learning_rate': 4.369504426426165e-06, 'epoch': 1.38} {'loss': 0.6191, 'learning_rate': 4.369233898564015e-06, 'epoch': 1.38} {'loss': 0.5806, 'learning_rate': 4.368963376735737e-06, 'epoch': 1.38} {'loss': 0.4117, 'learning_rate': 4.3686928609416255e-06, 'epoch': 1.38} {'loss': 0.5845, 'learning_rate': 4.368422351181967e-06, 'epoch': 1.38} {'loss': 0.4185, 'learning_rate': 4.368151847457055e-06, 'epoch': 1.38} {'loss': 0.5089, 'learning_rate': 4.367881349767173e-06, 'epoch': 1.38} {'loss': 0.5106, 'learning_rate': 4.367610858112615e-06, 'epoch': 1.38} {'loss': 0.6734, 'learning_rate': 4.36734037249367e-06, 'epoch': 1.38} {'loss': 0.4636, 'learning_rate': 4.367069892910628e-06, 'epoch': 1.38} {'loss': 0.5507, 'learning_rate': 4.3667994193637794e-06, 'epoch': 1.38} {'loss': 0.584, 'learning_rate': 4.366528951853414e-06, 'epoch': 1.38} {'loss': 0.371, 'learning_rate': 4.366258490379825e-06, 'epoch': 1.38} {'loss': 0.5844, 'learning_rate': 4.365988034943294e-06, 'epoch': 1.38} {'loss': 0.6492, 'learning_rate': 4.365717585544115e-06, 'epoch': 1.38} {'loss': 0.5734, 'learning_rate': 4.3654471421825795e-06, 'epoch': 1.38} {'loss': 0.4305, 'learning_rate': 4.365176704858975e-06, 'epoch': 1.38} {'loss': 0.5819, 'learning_rate': 4.364906273573593e-06, 'epoch': 1.38} {'loss': 0.4313, 'learning_rate': 4.3646358483267244e-06, 'epoch': 1.38} {'loss': 0.5083, 'learning_rate': 4.364365429118656e-06, 'epoch': 1.38} {'loss': 0.5087, 'learning_rate': 4.364095015949676e-06, 'epoch': 1.38} {'loss': 0.5505, 'learning_rate': 4.363824608820079e-06, 'epoch': 1.38} {'loss': 0.6313, 'learning_rate': 4.363554207730152e-06, 'epoch': 1.38} {'loss': 0.5016, 'learning_rate': 4.363283812680185e-06, 'epoch': 1.38} {'loss': 0.5331, 'learning_rate': 4.363013423670468e-06, 'epoch': 1.38} {'loss': 0.6607, 'learning_rate': 4.362743040701295e-06, 'epoch': 1.38} {'loss': 0.6413, 'learning_rate': 4.362472663772949e-06, 'epoch': 1.38} {'loss': 0.4386, 'learning_rate': 4.362202292885721e-06, 'epoch': 1.38} {'loss': 0.6329, 'learning_rate': 4.361931928039902e-06, 'epoch': 1.38} {'loss': 0.5698, 'learning_rate': 4.3616615692357826e-06, 'epoch': 1.38} {'loss': 0.4875, 'learning_rate': 4.3613912164736504e-06, 'epoch': 1.38} {'loss': 0.4743, 'learning_rate': 4.361120869753797e-06, 'epoch': 1.38} {'loss': 0.5748, 'learning_rate': 4.360850529076517e-06, 'epoch': 1.38} {'loss': 0.5522, 'learning_rate': 4.360580194442089e-06, 'epoch': 1.38} {'loss': 0.5328, 'learning_rate': 4.360309865850809e-06, 'epoch': 1.38} {'loss': 0.5075, 'learning_rate': 4.360039543302965e-06, 'epoch': 1.38} {'loss': 0.516, 'learning_rate': 4.359769226798849e-06, 'epoch': 1.38} {'loss': 0.6232, 'learning_rate': 4.3594989163387524e-06, 'epoch': 1.38} {'loss': 0.4221, 'learning_rate': 4.3592286119229545e-06, 'epoch': 1.38} {'loss': 0.5717, 'learning_rate': 4.35895831355176e-06, 'epoch': 1.38} {'loss': 0.4927, 'learning_rate': 4.358688021225447e-06, 'epoch': 1.38} {'loss': 0.5387, 'learning_rate': 4.358417734944308e-06, 'epoch': 1.38} {'loss': 0.5295, 'learning_rate': 4.358147454708635e-06, 'epoch': 1.38} {'loss': 0.571, 'learning_rate': 4.3578771805187146e-06, 'epoch': 1.38} {'loss': 0.4541, 'learning_rate': 4.3576069123748435e-06, 'epoch': 1.38} {'loss': 0.5978, 'learning_rate': 4.357336650277297e-06, 'epoch': 1.38} {'loss': 0.6098, 'learning_rate': 4.3570663942263814e-06, 'epoch': 1.38} {'loss': 0.4737, 'learning_rate': 4.356796144222375e-06, 'epoch': 1.38} {'loss': 0.6475, 'learning_rate': 4.35652590026557e-06, 'epoch': 1.38} {'loss': 0.6121, 'learning_rate': 4.356255662356262e-06, 'epoch': 1.38} {'loss': 0.6591, 'learning_rate': 4.355985430494727e-06, 'epoch': 1.38} {'loss': 0.5207, 'learning_rate': 4.355715204681271e-06, 'epoch': 1.38} {'loss': 0.5244, 'learning_rate': 4.3554449849161716e-06, 'epoch': 1.38} {'loss': 0.6177, 'learning_rate': 4.355174771199723e-06, 'epoch': 1.38} {'loss': 0.5327, 'learning_rate': 4.354904563532213e-06, 'epoch': 1.38} {'loss': 0.5682, 'learning_rate': 4.354634361913933e-06, 'epoch': 1.38} {'loss': 0.5771, 'learning_rate': 4.354364166345175e-06, 'epoch': 1.38} {'loss': 0.5059, 'learning_rate': 4.354093976826218e-06, 'epoch': 1.38} {'loss': 0.566, 'learning_rate': 4.3538237933573665e-06, 'epoch': 1.38} {'loss': 0.5975, 'learning_rate': 4.353553615938899e-06, 'epoch': 1.38} {'loss': 0.4685, 'learning_rate': 4.353283444571108e-06, 'epoch': 1.38} {'loss': 0.6145, 'learning_rate': 4.353013279254284e-06, 'epoch': 1.38} {'loss': 0.6617, 'learning_rate': 4.3527431199887145e-06, 'epoch': 1.38} {'loss': 0.499, 'learning_rate': 4.352472966774695e-06, 'epoch': 1.38} {'loss': 0.4227, 'learning_rate': 4.3522028196125045e-06, 'epoch': 1.38} {'loss': 0.6195, 'learning_rate': 4.351932678502444e-06, 'epoch': 1.38} {'loss': 0.5155, 'learning_rate': 4.351662543444794e-06, 'epoch': 1.38} {'loss': 0.4961, 'learning_rate': 4.3513924144398475e-06, 'epoch': 1.38} {'loss': 0.5543, 'learning_rate': 4.351122291487898e-06, 'epoch': 1.38} {'loss': 0.5197, 'learning_rate': 4.350852174589223e-06, 'epoch': 1.38} {'loss': 0.5304, 'learning_rate': 4.350582063744126e-06, 'epoch': 1.38} {'loss': 0.3984, 'learning_rate': 4.350311958952885e-06, 'epoch': 1.38} {'loss': 0.6529, 'learning_rate': 4.350041860215802e-06, 'epoch': 1.38} {'loss': 0.5736, 'learning_rate': 4.349771767533154e-06, 'epoch': 1.38} {'loss': 0.4373, 'learning_rate': 4.349501680905236e-06, 'epoch': 1.38} {'loss': 0.6965, 'learning_rate': 4.34923160033234e-06, 'epoch': 1.38} {'loss': 0.5581, 'learning_rate': 4.348961525814745e-06, 'epoch': 1.38} {'loss': 0.5677, 'learning_rate': 4.348691457352756e-06, 'epoch': 1.38} {'loss': 0.4229, 'learning_rate': 4.348421394946647e-06, 'epoch': 1.38} {'loss': 0.6017, 'learning_rate': 4.348151338596721e-06, 'epoch': 1.38} {'loss': 0.542, 'learning_rate': 4.347881288303258e-06, 'epoch': 1.38} {'loss': 0.4751, 'learning_rate': 4.34761124406655e-06, 'epoch': 1.38} {'loss': 0.4872, 'learning_rate': 4.34734120588689e-06, 'epoch': 1.38} {'loss': 0.544, 'learning_rate': 4.347071173764558e-06, 'epoch': 1.38} {'loss': 0.5179, 'learning_rate': 4.346801147699856e-06, 'epoch': 1.38} {'loss': 0.4557, 'learning_rate': 4.346531127693059e-06, 'epoch': 1.38} {'loss': 0.7063, 'learning_rate': 4.346261113744472e-06, 'epoch': 1.38} {'loss': 0.4389, 'learning_rate': 4.345991105854372e-06, 'epoch': 1.38} {'loss': 0.4892, 'learning_rate': 4.345721104023054e-06, 'epoch': 1.38} {'loss': 0.5528, 'learning_rate': 4.34545110825081e-06, 'epoch': 1.38} {'loss': 0.42, 'learning_rate': 4.345181118537917e-06, 'epoch': 1.38} {'loss': 0.4817, 'learning_rate': 4.344911134884681e-06, 'epoch': 1.38} {'loss': 0.4582, 'learning_rate': 4.344641157291376e-06, 'epoch': 1.38} {'loss': 0.5079, 'learning_rate': 4.344371185758305e-06, 'epoch': 1.38} {'loss': 0.5209, 'learning_rate': 4.344101220285747e-06, 'epoch': 1.38} {'loss': 0.4294, 'learning_rate': 4.343831260873995e-06, 'epoch': 1.38} {'loss': 0.6068, 'learning_rate': 4.343561307523343e-06, 'epoch': 1.38} {'loss': 0.4386, 'learning_rate': 4.343291360234068e-06, 'epoch': 1.38} {'loss': 0.4864, 'learning_rate': 4.3430214190064735e-06, 'epoch': 1.38} {'loss': 0.5252, 'learning_rate': 4.342751483840835e-06, 'epoch': 1.38} {'loss': 0.5473, 'learning_rate': 4.342481554737456e-06, 'epoch': 1.38} {'loss': 0.4427, 'learning_rate': 4.342211631696616e-06, 'epoch': 1.38} {'loss': 0.6718, 'learning_rate': 4.341941714718605e-06, 'epoch': 1.38} {'loss': 0.4904, 'learning_rate': 4.34167180380372e-06, 'epoch': 1.38} {'loss': 0.4997, 'learning_rate': 4.341401898952236e-06, 'epoch': 1.38} {'loss': 0.559, 'learning_rate': 4.341132000164457e-06, 'epoch': 1.38} {'loss': 0.5789, 'learning_rate': 4.340862107440663e-06, 'epoch': 1.38} {'loss': 0.5161, 'learning_rate': 4.340592220781145e-06, 'epoch': 1.38} {'loss': 0.619, 'learning_rate': 4.340322340186195e-06, 'epoch': 1.38} {'loss': 0.5473, 'learning_rate': 4.340052465656101e-06, 'epoch': 1.38} {'loss': 0.493, 'learning_rate': 4.339782597191153e-06, 'epoch': 1.38} {'loss': 0.502, 'learning_rate': 4.339512734791632e-06, 'epoch': 1.38} {'loss': 0.5093, 'learning_rate': 4.339242878457842e-06, 'epoch': 1.39} {'loss': 0.4967, 'learning_rate': 4.33897302819006e-06, 'epoch': 1.39} {'loss': 0.5913, 'learning_rate': 4.33870318398858e-06, 'epoch': 1.39} {'loss': 0.5314, 'learning_rate': 4.33843334585369e-06, 'epoch': 1.39} {'loss': 0.7255, 'learning_rate': 4.33816351378568e-06, 'epoch': 1.39} {'loss': 0.6329, 'learning_rate': 4.337893687784842e-06, 'epoch': 1.39} {'loss': 0.4675, 'learning_rate': 4.3376238678514545e-06, 'epoch': 1.39} {'loss': 0.5803, 'learning_rate': 4.337354053985823e-06, 'epoch': 1.39} {'loss': 0.5454, 'learning_rate': 4.337084246188222e-06, 'epoch': 1.39} {'loss': 0.5924, 'learning_rate': 4.336814444458948e-06, 'epoch': 1.39} {'loss': 0.484, 'learning_rate': 4.336544648798286e-06, 'epoch': 1.39} {'loss': 0.4173, 'learning_rate': 4.336274859206531e-06, 'epoch': 1.39} {'loss': 0.5913, 'learning_rate': 4.33600507568397e-06, 'epoch': 1.39} {'loss': 0.6404, 'learning_rate': 4.335735298230887e-06, 'epoch': 1.39} {'loss': 0.5842, 'learning_rate': 4.335465526847575e-06, 'epoch': 1.39} {'loss': 0.6083, 'learning_rate': 4.335195761534324e-06, 'epoch': 1.39} {'loss': 0.5706, 'learning_rate': 4.3349260022914216e-06, 'epoch': 1.39} {'loss': 0.3639, 'learning_rate': 4.3346562491191566e-06, 'epoch': 1.39} {'loss': 0.6136, 'learning_rate': 4.33438650201782e-06, 'epoch': 1.39} {'loss': 0.5208, 'learning_rate': 4.334116760987702e-06, 'epoch': 1.39} {'loss': 0.5165, 'learning_rate': 4.333847026029086e-06, 'epoch': 1.39} {'loss': 0.6302, 'learning_rate': 4.3335772971422656e-06, 'epoch': 1.39} {'loss': 0.5088, 'learning_rate': 4.3333075743275276e-06, 'epoch': 1.39} {'loss': 0.4956, 'learning_rate': 4.333037857585162e-06, 'epoch': 1.39} {'loss': 0.5601, 'learning_rate': 4.33276814691546e-06, 'epoch': 1.39} {'loss': 0.5222, 'learning_rate': 4.332498442318707e-06, 'epoch': 1.39} {'loss': 0.5075, 'learning_rate': 4.332228743795192e-06, 'epoch': 1.39} {'loss': 0.5274, 'learning_rate': 4.331959051345207e-06, 'epoch': 1.39} {'loss': 0.5481, 'learning_rate': 4.331689364969038e-06, 'epoch': 1.39} {'loss': 0.5971, 'learning_rate': 4.331419684666975e-06, 'epoch': 1.39} {'loss': 0.4952, 'learning_rate': 4.331150010439309e-06, 'epoch': 1.39} {'loss': 0.5824, 'learning_rate': 4.330880342286331e-06, 'epoch': 1.39} {'loss': 0.5637, 'learning_rate': 4.330610680208321e-06, 'epoch': 1.39} {'loss': 0.4496, 'learning_rate': 4.330341024205575e-06, 'epoch': 1.39} {'loss': 0.4066, 'learning_rate': 4.33007137427838e-06, 'epoch': 1.39} {'loss': 0.5052, 'learning_rate': 4.329801730427025e-06, 'epoch': 1.39} {'loss': 0.4866, 'learning_rate': 4.329532092651799e-06, 'epoch': 1.39} {'loss': 0.481, 'learning_rate': 4.329262460952991e-06, 'epoch': 1.39} {'loss': 0.5096, 'learning_rate': 4.328992835330894e-06, 'epoch': 1.39} {'loss': 0.4758, 'learning_rate': 4.3287232157857905e-06, 'epoch': 1.39} {'loss': 0.6044, 'learning_rate': 4.3284536023179704e-06, 'epoch': 1.39} {'loss': 0.6376, 'learning_rate': 4.328183994927725e-06, 'epoch': 1.39} {'loss': 0.4517, 'learning_rate': 4.327914393615342e-06, 'epoch': 1.39} {'loss': 0.5353, 'learning_rate': 4.3276447983811106e-06, 'epoch': 1.39} {'loss': 0.6599, 'learning_rate': 4.327375209225324e-06, 'epoch': 1.39} {'loss': 0.515, 'learning_rate': 4.3271056261482624e-06, 'epoch': 1.39} {'loss': 0.5219, 'learning_rate': 4.326836049150219e-06, 'epoch': 1.39} {'loss': 0.3384, 'learning_rate': 4.326566478231483e-06, 'epoch': 1.39} {'loss': 0.5181, 'learning_rate': 4.326296913392344e-06, 'epoch': 1.39} {'loss': 0.4452, 'learning_rate': 4.326027354633089e-06, 'epoch': 1.39} {'loss': 0.4582, 'learning_rate': 4.325757801954008e-06, 'epoch': 1.39} {'loss': 0.4531, 'learning_rate': 4.325488255355394e-06, 'epoch': 1.39} {'loss': 0.4915, 'learning_rate': 4.325218714837527e-06, 'epoch': 1.39} {'loss': 0.6189, 'learning_rate': 4.324949180400701e-06, 'epoch': 1.39} {'loss': 0.4179, 'learning_rate': 4.3246796520452025e-06, 'epoch': 1.39} {'loss': 0.4977, 'learning_rate': 4.324410129771324e-06, 'epoch': 1.39} {'loss': 0.4938, 'learning_rate': 4.3241406135793516e-06, 'epoch': 1.39} {'loss': 0.4918, 'learning_rate': 4.323871103469575e-06, 'epoch': 1.39} {'loss': 0.5728, 'learning_rate': 4.323601599442285e-06, 'epoch': 1.39} {'loss': 0.7289, 'learning_rate': 4.323332101497767e-06, 'epoch': 1.39} {'loss': 0.6376, 'learning_rate': 4.323062609636309e-06, 'epoch': 1.39} {'loss': 0.4696, 'learning_rate': 4.322793123858203e-06, 'epoch': 1.39} {'loss': 0.5959, 'learning_rate': 4.322523644163736e-06, 'epoch': 1.39} {'loss': 0.4941, 'learning_rate': 4.3222541705532e-06, 'epoch': 1.39} {'loss': 0.5279, 'learning_rate': 4.321984703026876e-06, 'epoch': 1.39} {'loss': 0.5626, 'learning_rate': 4.321715241585064e-06, 'epoch': 1.39} {'loss': 0.4811, 'learning_rate': 4.321445786228042e-06, 'epoch': 1.39} {'loss': 0.6144, 'learning_rate': 4.321176336956105e-06, 'epoch': 1.39} {'loss': 0.4315, 'learning_rate': 4.3209068937695395e-06, 'epoch': 1.39} {'loss': 0.3702, 'learning_rate': 4.320637456668635e-06, 'epoch': 1.39} {'loss': 0.4719, 'learning_rate': 4.320368025653684e-06, 'epoch': 1.39} {'loss': 0.5472, 'learning_rate': 4.320098600724963e-06, 'epoch': 1.39} {'loss': 0.6647, 'learning_rate': 4.3198291818827765e-06, 'epoch': 1.39} {'loss': 0.3636, 'learning_rate': 4.319559769127402e-06, 'epoch': 1.39} {'loss': 0.4777, 'learning_rate': 4.319290362459133e-06, 'epoch': 1.39} {'loss': 0.5136, 'learning_rate': 4.319020961878256e-06, 'epoch': 1.39} {'loss': 0.5954, 'learning_rate': 4.318751567385061e-06, 'epoch': 1.39} {'loss': 0.5832, 'learning_rate': 4.318482178979841e-06, 'epoch': 1.39} {'loss': 0.4842, 'learning_rate': 4.318212796662872e-06, 'epoch': 1.39} {'loss': 0.482, 'learning_rate': 4.317943420434459e-06, 'epoch': 1.39} {'loss': 0.5809, 'learning_rate': 4.317674050294877e-06, 'epoch': 1.39} {'loss': 0.6136, 'learning_rate': 4.3174046862444205e-06, 'epoch': 1.39} {'loss': 0.5659, 'learning_rate': 4.3171353282833825e-06, 'epoch': 1.39} {'loss': 0.4587, 'learning_rate': 4.316865976412039e-06, 'epoch': 1.39} {'loss': 0.4696, 'learning_rate': 4.316596630630694e-06, 'epoch': 1.39} {'loss': 0.5165, 'learning_rate': 4.3163272909396215e-06, 'epoch': 1.39} {'loss': 0.569, 'learning_rate': 4.316057957339124e-06, 'epoch': 1.39} {'loss': 0.6277, 'learning_rate': 4.31578862982948e-06, 'epoch': 1.39} {'loss': 0.5575, 'learning_rate': 4.315519308410983e-06, 'epoch': 1.39} {'loss': 0.4726, 'learning_rate': 4.315249993083922e-06, 'epoch': 1.39} {'loss': 0.4659, 'learning_rate': 4.314980683848577e-06, 'epoch': 1.39} {'loss': 0.5996, 'learning_rate': 4.3147113807052495e-06, 'epoch': 1.39} {'loss': 0.6246, 'learning_rate': 4.31444208365422e-06, 'epoch': 1.39} {'loss': 0.6152, 'learning_rate': 4.314172792695778e-06, 'epoch': 1.39} {'loss': 0.5853, 'learning_rate': 4.313903507830213e-06, 'epoch': 1.39} {'loss': 0.499, 'learning_rate': 4.3136342290578134e-06, 'epoch': 1.39} {'loss': 0.5882, 'learning_rate': 4.313364956378872e-06, 'epoch': 1.39} {'loss': 0.6213, 'learning_rate': 4.313095689793666e-06, 'epoch': 1.39} {'loss': 0.5535, 'learning_rate': 4.312826429302499e-06, 'epoch': 1.39} {'loss': 0.5809, 'learning_rate': 4.3125571749056475e-06, 'epoch': 1.39} {'loss': 0.4992, 'learning_rate': 4.312287926603405e-06, 'epoch': 1.39} {'loss': 0.5108, 'learning_rate': 4.312018684396059e-06, 'epoch': 1.39} {'loss': 0.5403, 'learning_rate': 4.311749448283897e-06, 'epoch': 1.39} {'loss': 0.5424, 'learning_rate': 4.3114802182672145e-06, 'epoch': 1.39} {'loss': 0.5483, 'learning_rate': 4.311210994346285e-06, 'epoch': 1.39} {'loss': 0.5944, 'learning_rate': 4.310941776521415e-06, 'epoch': 1.39} {'loss': 0.4966, 'learning_rate': 4.310672564792881e-06, 'epoch': 1.39} {'loss': 0.592, 'learning_rate': 4.310403359160975e-06, 'epoch': 1.39} {'loss': 0.3607, 'learning_rate': 4.310134159625988e-06, 'epoch': 1.39} {'loss': 0.5743, 'learning_rate': 4.309864966188198e-06, 'epoch': 1.39} {'loss': 0.6546, 'learning_rate': 4.30959577884791e-06, 'epoch': 1.39} {'loss': 0.6893, 'learning_rate': 4.309326597605397e-06, 'epoch': 1.39} {'loss': 0.5531, 'learning_rate': 4.3090574224609594e-06, 'epoch': 1.39} {'loss': 0.5239, 'learning_rate': 4.308788253414878e-06, 'epoch': 1.39} {'loss': 0.4287, 'learning_rate': 4.3085190904674435e-06, 'epoch': 1.39} {'loss': 0.5029, 'learning_rate': 4.308249933618948e-06, 'epoch': 1.39} {'loss': 0.4824, 'learning_rate': 4.307980782869668e-06, 'epoch': 1.39} {'loss': 0.4897, 'learning_rate': 4.307711638219909e-06, 'epoch': 1.39} {'loss': 0.5087, 'learning_rate': 4.3074424996699435e-06, 'epoch': 1.39} {'loss': 0.5326, 'learning_rate': 4.307173367220074e-06, 'epoch': 1.39} {'loss': 0.673, 'learning_rate': 4.306904240870578e-06, 'epoch': 1.39} {'loss': 0.5033, 'learning_rate': 4.306635120621749e-06, 'epoch': 1.39} {'loss': 0.4559, 'learning_rate': 4.306366006473877e-06, 'epoch': 1.39} {'loss': 0.4569, 'learning_rate': 4.3060968984272414e-06, 'epoch': 1.39} {'loss': 0.5911, 'learning_rate': 4.305827796482144e-06, 'epoch': 1.39} {'loss': 0.521, 'learning_rate': 4.305558700638858e-06, 'epoch': 1.39} {'loss': 0.6104, 'learning_rate': 4.3052896108976875e-06, 'epoch': 1.39} {'loss': 0.5377, 'learning_rate': 4.30502052725891e-06, 'epoch': 1.39} {'loss': 0.5027, 'learning_rate': 4.304751449722816e-06, 'epoch': 1.39} {'loss': 0.5697, 'learning_rate': 4.304482378289699e-06, 'epoch': 1.39} {'loss': 0.5501, 'learning_rate': 4.304213312959836e-06, 'epoch': 1.39} {'loss': 0.4965, 'learning_rate': 4.30394425373353e-06, 'epoch': 1.39} {'loss': 0.578, 'learning_rate': 4.303675200611057e-06, 'epoch': 1.39} {'loss': 0.7284, 'learning_rate': 4.303406153592712e-06, 'epoch': 1.39} {'loss': 0.6807, 'learning_rate': 4.30313711267878e-06, 'epoch': 1.39} {'loss': 0.6357, 'learning_rate': 4.3028680778695505e-06, 'epoch': 1.39} {'loss': 0.4353, 'learning_rate': 4.302599049165317e-06, 'epoch': 1.39} {'loss': 0.5437, 'learning_rate': 4.302330026566355e-06, 'epoch': 1.39} {'loss': 0.5246, 'learning_rate': 4.302061010072967e-06, 'epoch': 1.39} {'loss': 0.4931, 'learning_rate': 4.301791999685433e-06, 'epoch': 1.39} {'loss': 0.6786, 'learning_rate': 4.301522995404043e-06, 'epoch': 1.39} {'loss': 0.3961, 'learning_rate': 4.301253997229085e-06, 'epoch': 1.39} {'loss': 0.6468, 'learning_rate': 4.300985005160847e-06, 'epoch': 1.39} {'loss': 0.459, 'learning_rate': 4.300716019199621e-06, 'epoch': 1.39} {'loss': 0.4133, 'learning_rate': 4.3004470393456864e-06, 'epoch': 1.39} {'loss': 0.73, 'learning_rate': 4.300178065599344e-06, 'epoch': 1.39} {'loss': 0.4813, 'learning_rate': 4.299909097960871e-06, 'epoch': 1.39} {'loss': 0.4997, 'learning_rate': 4.299640136430561e-06, 'epoch': 1.39} {'loss': 0.5982, 'learning_rate': 4.2993711810087e-06, 'epoch': 1.39} {'loss': 0.6563, 'learning_rate': 4.299102231695579e-06, 'epoch': 1.39} {'loss': 0.6371, 'learning_rate': 4.2988332884914865e-06, 'epoch': 1.39} {'loss': 0.7398, 'learning_rate': 4.298564351396706e-06, 'epoch': 1.39} {'loss': 0.3549, 'learning_rate': 4.298295420411528e-06, 'epoch': 1.39} {'loss': 0.669, 'learning_rate': 4.298026495536241e-06, 'epoch': 1.39} {'loss': 0.4325, 'learning_rate': 4.297757576771132e-06, 'epoch': 1.39} {'loss': 0.5768, 'learning_rate': 4.297488664116493e-06, 'epoch': 1.39} {'loss': 0.5483, 'learning_rate': 4.2972197575726075e-06, 'epoch': 1.39} {'loss': 0.5538, 'learning_rate': 4.29695085713977e-06, 'epoch': 1.39} {'loss': 0.4846, 'learning_rate': 4.296681962818261e-06, 'epoch': 1.39} {'loss': 0.6512, 'learning_rate': 4.296413074608372e-06, 'epoch': 1.39} {'loss': 0.5619, 'learning_rate': 4.296144192510391e-06, 'epoch': 1.39} {'loss': 0.553, 'learning_rate': 4.295875316524606e-06, 'epoch': 1.39} {'loss': 0.4371, 'learning_rate': 4.2956064466513055e-06, 'epoch': 1.39} {'loss': 0.6476, 'learning_rate': 4.295337582890778e-06, 'epoch': 1.39} {'loss': 0.4793, 'learning_rate': 4.295068725243315e-06, 'epoch': 1.39} {'loss': 0.5359, 'learning_rate': 4.294799873709197e-06, 'epoch': 1.39} {'loss': 0.4876, 'learning_rate': 4.294531028288715e-06, 'epoch': 1.39} {'loss': 0.4129, 'learning_rate': 4.294262188982159e-06, 'epoch': 1.39} {'loss': 0.5892, 'learning_rate': 4.293993355789815e-06, 'epoch': 1.39} {'loss': 0.5381, 'learning_rate': 4.293724528711974e-06, 'epoch': 1.39} {'loss': 0.3905, 'learning_rate': 4.293455707748924e-06, 'epoch': 1.39} {'loss': 0.5387, 'learning_rate': 4.2931868929009476e-06, 'epoch': 1.39} {'loss': 0.6023, 'learning_rate': 4.292918084168337e-06, 'epoch': 1.39} {'loss': 0.4865, 'learning_rate': 4.29264928155138e-06, 'epoch': 1.39} {'loss': 0.4904, 'learning_rate': 4.292380485050365e-06, 'epoch': 1.39} {'loss': 0.4569, 'learning_rate': 4.292111694665578e-06, 'epoch': 1.39} {'loss': 0.3705, 'learning_rate': 4.2918429103973094e-06, 'epoch': 1.39} {'loss': 0.6495, 'learning_rate': 4.291574132245849e-06, 'epoch': 1.39} {'loss': 0.468, 'learning_rate': 4.291305360211479e-06, 'epoch': 1.39} {'loss': 0.4836, 'learning_rate': 4.291036594294492e-06, 'epoch': 1.39} {'loss': 0.6156, 'learning_rate': 4.290767834495173e-06, 'epoch': 1.39} {'loss': 0.7751, 'learning_rate': 4.290499080813812e-06, 'epoch': 1.39} {'loss': 0.5017, 'learning_rate': 4.290230333250697e-06, 'epoch': 1.39} {'loss': 0.4015, 'learning_rate': 4.2899615918061176e-06, 'epoch': 1.39} {'loss': 0.5249, 'learning_rate': 4.289692856480358e-06, 'epoch': 1.39} {'loss': 0.5666, 'learning_rate': 4.289424127273707e-06, 'epoch': 1.39} {'loss': 0.5485, 'learning_rate': 4.289155404186454e-06, 'epoch': 1.39} {'loss': 0.5379, 'learning_rate': 4.288886687218885e-06, 'epoch': 1.39} {'loss': 0.4125, 'learning_rate': 4.28861797637129e-06, 'epoch': 1.39} {'loss': 0.5206, 'learning_rate': 4.28834927164396e-06, 'epoch': 1.39} {'loss': 0.5401, 'learning_rate': 4.2880805730371765e-06, 'epoch': 1.39} {'loss': 0.669, 'learning_rate': 4.287811880551229e-06, 'epoch': 1.39} {'loss': 0.5009, 'learning_rate': 4.287543194186408e-06, 'epoch': 1.39} {'loss': 0.6157, 'learning_rate': 4.287274513942999e-06, 'epoch': 1.39} {'loss': 0.6356, 'learning_rate': 4.287005839821291e-06, 'epoch': 1.39} {'loss': 0.481, 'learning_rate': 4.286737171821572e-06, 'epoch': 1.39} {'loss': 0.5607, 'learning_rate': 4.286468509944134e-06, 'epoch': 1.39} {'loss': 0.4773, 'learning_rate': 4.286199854189255e-06, 'epoch': 1.39} {'loss': 0.4595, 'learning_rate': 4.285931204557231e-06, 'epoch': 1.39} {'loss': 0.53, 'learning_rate': 4.285662561048347e-06, 'epoch': 1.39} {'loss': 0.5495, 'learning_rate': 4.28539392366289e-06, 'epoch': 1.39} {'loss': 0.5706, 'learning_rate': 4.2851252924011545e-06, 'epoch': 1.39} {'loss': 0.7322, 'learning_rate': 4.284856667263415e-06, 'epoch': 1.39} {'loss': 0.6039, 'learning_rate': 4.284588048249975e-06, 'epoch': 1.39} {'loss': 0.4781, 'learning_rate': 4.28431943536111e-06, 'epoch': 1.39} {'loss': 0.6145, 'learning_rate': 4.284050828597113e-06, 'epoch': 1.39} {'loss': 0.5721, 'learning_rate': 4.283782227958272e-06, 'epoch': 1.39} {'loss': 0.6303, 'learning_rate': 4.283513633444873e-06, 'epoch': 1.39} {'loss': 0.4247, 'learning_rate': 4.283245045057211e-06, 'epoch': 1.39} {'loss': 0.5239, 'learning_rate': 4.2829764627955595e-06, 'epoch': 1.39} {'loss': 0.4931, 'learning_rate': 4.282707886660221e-06, 'epoch': 1.39} {'loss': 0.6137, 'learning_rate': 4.282439316651474e-06, 'epoch': 1.39} {'loss': 0.5376, 'learning_rate': 4.28217075276961e-06, 'epoch': 1.39} {'loss': 0.4714, 'learning_rate': 4.281902195014916e-06, 'epoch': 1.39} {'loss': 0.6197, 'learning_rate': 4.281633643387679e-06, 'epoch': 1.39} {'loss': 0.5954, 'learning_rate': 4.281365097888193e-06, 'epoch': 1.39} {'loss': 0.5542, 'learning_rate': 4.281096558516731e-06, 'epoch': 1.39} {'loss': 0.7259, 'learning_rate': 4.280828025273599e-06, 'epoch': 1.39} {'loss': 0.5762, 'learning_rate': 4.2805594981590715e-06, 'epoch': 1.39} {'loss': 0.3924, 'learning_rate': 4.280290977173441e-06, 'epoch': 1.39} {'loss': 0.4751, 'learning_rate': 4.280022462316999e-06, 'epoch': 1.39} {'loss': 0.4546, 'learning_rate': 4.279753953590021e-06, 'epoch': 1.39} {'loss': 0.7537, 'learning_rate': 4.2794854509928105e-06, 'epoch': 1.39} {'loss': 0.6151, 'learning_rate': 4.2792169545256415e-06, 'epoch': 1.39} {'loss': 0.5302, 'learning_rate': 4.278948464188813e-06, 'epoch': 1.39} {'loss': 0.5592, 'learning_rate': 4.278679979982606e-06, 'epoch': 1.39} {'loss': 0.5464, 'learning_rate': 4.278411501907309e-06, 'epoch': 1.39} {'loss': 0.4876, 'learning_rate': 4.278143029963214e-06, 'epoch': 1.39} {'loss': 0.4913, 'learning_rate': 4.277874564150598e-06, 'epoch': 1.39} {'loss': 0.3198, 'learning_rate': 4.277606104469762e-06, 'epoch': 1.39} {'loss': 0.5559, 'learning_rate': 4.277337650920982e-06, 'epoch': 1.39} {'loss': 0.4608, 'learning_rate': 4.277069203504558e-06, 'epoch': 1.39} {'loss': 0.5233, 'learning_rate': 4.2768007622207676e-06, 'epoch': 1.39} {'loss': 0.5831, 'learning_rate': 4.276532327069901e-06, 'epoch': 1.39} {'loss': 0.5343, 'learning_rate': 4.276263898052251e-06, 'epoch': 1.39} {'loss': 0.5354, 'learning_rate': 4.275995475168092e-06, 'epoch': 1.39} {'loss': 0.5091, 'learning_rate': 4.275727058417729e-06, 'epoch': 1.39} {'loss': 0.5589, 'learning_rate': 4.275458647801433e-06, 'epoch': 1.39} {'loss': 0.5308, 'learning_rate': 4.275190243319508e-06, 'epoch': 1.39} {'loss': 0.4553, 'learning_rate': 4.27492184497223e-06, 'epoch': 1.39} {'loss': 0.6276, 'learning_rate': 4.274653452759889e-06, 'epoch': 1.39} {'loss': 0.536, 'learning_rate': 4.274385066682777e-06, 'epoch': 1.39} {'loss': 0.4234, 'learning_rate': 4.274116686741172e-06, 'epoch': 1.39} {'loss': 0.5252, 'learning_rate': 4.273848312935374e-06, 'epoch': 1.39} {'loss': 0.5537, 'learning_rate': 4.273579945265658e-06, 'epoch': 1.39} {'loss': 0.6306, 'learning_rate': 4.273311583732325e-06, 'epoch': 1.39} {'loss': 0.4704, 'learning_rate': 4.2730432283356505e-06, 'epoch': 1.39} {'loss': 0.5591, 'learning_rate': 4.272774879075928e-06, 'epoch': 1.39} {'loss': 0.5037, 'learning_rate': 4.272506535953448e-06, 'epoch': 1.39} {'loss': 0.4406, 'learning_rate': 4.272238198968487e-06, 'epoch': 1.39} {'loss': 0.4509, 'learning_rate': 4.271969868121347e-06, 'epoch': 1.39} {'loss': 0.5522, 'learning_rate': 4.271701543412305e-06, 'epoch': 1.39} {'loss': 0.6123, 'learning_rate': 4.27143322484165e-06, 'epoch': 1.39} {'loss': 0.3956, 'learning_rate': 4.271164912409673e-06, 'epoch': 1.39} {'loss': 0.4249, 'learning_rate': 4.27089660611666e-06, 'epoch': 1.39} {'loss': 0.3507, 'learning_rate': 4.2706283059629e-06, 'epoch': 1.39} {'loss': 0.384, 'learning_rate': 4.270360011948674e-06, 'epoch': 1.39} {'loss': 0.5924, 'learning_rate': 4.2700917240742814e-06, 'epoch': 1.39} {'loss': 0.6926, 'learning_rate': 4.269823442339998e-06, 'epoch': 1.39} {'loss': 0.454, 'learning_rate': 4.2695551667461165e-06, 'epoch': 1.39} {'loss': 0.4525, 'learning_rate': 4.269286897292924e-06, 'epoch': 1.39} {'loss': 0.5266, 'learning_rate': 4.269018633980707e-06, 'epoch': 1.39} {'loss': 0.5751, 'learning_rate': 4.268750376809757e-06, 'epoch': 1.39} {'loss': 0.5469, 'learning_rate': 4.268482125780352e-06, 'epoch': 1.39} {'loss': 0.6176, 'learning_rate': 4.2682138808927935e-06, 'epoch': 1.39} {'loss': 0.5841, 'learning_rate': 4.267945642147356e-06, 'epoch': 1.39} {'loss': 0.6857, 'learning_rate': 4.267677409544334e-06, 'epoch': 1.39} {'loss': 0.6314, 'learning_rate': 4.267409183084015e-06, 'epoch': 1.39} {'loss': 0.6417, 'learning_rate': 4.267140962766678e-06, 'epoch': 1.39} {'loss': 0.4458, 'learning_rate': 4.2668727485926245e-06, 'epoch': 1.39} {'loss': 0.5882, 'learning_rate': 4.266604540562126e-06, 'epoch': 1.39} {'loss': 0.5246, 'learning_rate': 4.266336338675486e-06, 'epoch': 1.39} {'loss': 0.4428, 'learning_rate': 4.266068142932981e-06, 'epoch': 1.39} {'loss': 0.5074, 'learning_rate': 4.265799953334901e-06, 'epoch': 1.39} {'loss': 0.5143, 'learning_rate': 4.265531769881536e-06, 'epoch': 1.39} {'loss': 0.5528, 'learning_rate': 4.2652635925731666e-06, 'epoch': 1.39} {'loss': 0.5833, 'learning_rate': 4.264995421410091e-06, 'epoch': 1.39} {'loss': 0.6437, 'learning_rate': 4.264727256392587e-06, 'epoch': 1.39} {'loss': 0.5664, 'learning_rate': 4.2644590975209445e-06, 'epoch': 1.39} {'loss': 0.511, 'learning_rate': 4.264190944795452e-06, 'epoch': 1.39} {'loss': 0.4855, 'learning_rate': 4.263922798216398e-06, 'epoch': 1.39} {'loss': 0.6642, 'learning_rate': 4.263654657784071e-06, 'epoch': 1.39} {'loss': 0.5228, 'learning_rate': 4.263386523498748e-06, 'epoch': 1.39} {'loss': 0.5154, 'learning_rate': 4.2631183953607325e-06, 'epoch': 1.39} {'loss': 0.4609, 'learning_rate': 4.262850273370299e-06, 'epoch': 1.39} {'loss': 0.5894, 'learning_rate': 4.26258215752774e-06, 'epoch': 1.39} {'loss': 0.5563, 'learning_rate': 4.262314047833341e-06, 'epoch': 1.39} {'loss': 0.514, 'learning_rate': 4.2620459442873905e-06, 'epoch': 1.39} {'loss': 0.5077, 'learning_rate': 4.261777846890179e-06, 'epoch': 1.39} {'loss': 0.4148, 'learning_rate': 4.261509755641988e-06, 'epoch': 1.39} {'loss': 0.3948, 'learning_rate': 4.261241670543107e-06, 'epoch': 1.39} {'loss': 0.527, 'learning_rate': 4.2609735915938234e-06, 'epoch': 1.39} {'loss': 0.5198, 'learning_rate': 4.260705518794425e-06, 'epoch': 1.39} {'loss': 0.4645, 'learning_rate': 4.260437452145197e-06, 'epoch': 1.39} {'loss': 0.6225, 'learning_rate': 4.260169391646429e-06, 'epoch': 1.39} {'loss': 0.5232, 'learning_rate': 4.259901337298412e-06, 'epoch': 1.39} {'loss': 0.5206, 'learning_rate': 4.259633289101424e-06, 'epoch': 1.39} {'loss': 0.4495, 'learning_rate': 4.2593652470557586e-06, 'epoch': 1.39} {'loss': 0.5287, 'learning_rate': 4.2590972111617e-06, 'epoch': 1.39} {'loss': 0.5232, 'learning_rate': 4.2588291814195385e-06, 'epoch': 1.39} {'loss': 0.457, 'learning_rate': 4.2585611578295584e-06, 'epoch': 1.39} {'loss': 0.5919, 'learning_rate': 4.258293140392048e-06, 'epoch': 1.39} {'loss': 0.4918, 'learning_rate': 4.258025129107299e-06, 'epoch': 1.39} {'loss': 0.5776, 'learning_rate': 4.25775712397559e-06, 'epoch': 1.39} {'loss': 0.5745, 'learning_rate': 4.257489124997214e-06, 'epoch': 1.39} {'loss': 0.5869, 'learning_rate': 4.2572211321724556e-06, 'epoch': 1.39} {'loss': 0.556, 'learning_rate': 4.256953145501603e-06, 'epoch': 1.39} {'loss': 0.4991, 'learning_rate': 4.256685164984944e-06, 'epoch': 1.39} {'loss': 0.5016, 'learning_rate': 4.256417190622768e-06, 'epoch': 1.39} {'loss': 0.4035, 'learning_rate': 4.256149222415357e-06, 'epoch': 1.39} {'loss': 0.4026, 'learning_rate': 4.255881260362998e-06, 'epoch': 1.39} {'loss': 0.5101, 'learning_rate': 4.255613304465983e-06, 'epoch': 1.39} {'loss': 0.5588, 'learning_rate': 4.2553453547245974e-06, 'epoch': 1.39} {'loss': 0.4262, 'learning_rate': 4.255077411139126e-06, 'epoch': 1.39} {'loss': 0.3807, 'learning_rate': 4.254809473709858e-06, 'epoch': 1.39} {'loss': 0.519, 'learning_rate': 4.254541542437084e-06, 'epoch': 1.39} {'loss': 0.5499, 'learning_rate': 4.254273617321084e-06, 'epoch': 1.39} {'loss': 0.5764, 'learning_rate': 4.254005698362148e-06, 'epoch': 1.39} {'loss': 0.5012, 'learning_rate': 4.253737785560564e-06, 'epoch': 1.39} {'loss': 0.5042, 'learning_rate': 4.253469878916617e-06, 'epoch': 1.39} {'loss': 0.5443, 'learning_rate': 4.253201978430598e-06, 'epoch': 1.39} {'loss': 0.4988, 'learning_rate': 4.25293408410279e-06, 'epoch': 1.39} {'loss': 0.4844, 'learning_rate': 4.252666195933486e-06, 'epoch': 1.39} {'loss': 0.4717, 'learning_rate': 4.2523983139229655e-06, 'epoch': 1.39} {'loss': 0.5854, 'learning_rate': 4.252130438071519e-06, 'epoch': 1.39} {'loss': 0.5209, 'learning_rate': 4.251862568379433e-06, 'epoch': 1.39} {'loss': 0.5606, 'learning_rate': 4.251594704846996e-06, 'epoch': 1.39} {'loss': 0.5259, 'learning_rate': 4.251326847474498e-06, 'epoch': 1.39} {'loss': 0.7005, 'learning_rate': 4.251058996262213e-06, 'epoch': 1.39} {'loss': 0.5846, 'learning_rate': 4.250791151210445e-06, 'epoch': 1.39} {'loss': 0.5118, 'learning_rate': 4.25052331231947e-06, 'epoch': 1.39} {'loss': 0.4985, 'learning_rate': 4.250255479589579e-06, 'epoch': 1.39} {'loss': 0.4915, 'learning_rate': 4.249987653021057e-06, 'epoch': 1.39} {'loss': 0.623, 'learning_rate': 4.249719832614193e-06, 'epoch': 1.39} {'loss': 0.5429, 'learning_rate': 4.249452018369276e-06, 'epoch': 1.39} {'loss': 0.5921, 'learning_rate': 4.249184210286587e-06, 'epoch': 1.39} {'loss': 0.5307, 'learning_rate': 4.248916408366416e-06, 'epoch': 1.39} {'loss': 0.5551, 'learning_rate': 4.24864861260905e-06, 'epoch': 1.39} {'loss': 0.6123, 'learning_rate': 4.248380823014777e-06, 'epoch': 1.39} {'loss': 0.4359, 'learning_rate': 4.248113039583882e-06, 'epoch': 1.39} {'loss': 0.4682, 'learning_rate': 4.247845262316653e-06, 'epoch': 1.39} {'loss': 0.5773, 'learning_rate': 4.2475774912133816e-06, 'epoch': 1.39} {'loss': 0.5818, 'learning_rate': 4.247309726274345e-06, 'epoch': 1.39} {'loss': 0.5608, 'learning_rate': 4.247041967499837e-06, 'epoch': 1.39} {'loss': 0.4676, 'learning_rate': 4.246774214890142e-06, 'epoch': 1.39} {'loss': 0.4561, 'learning_rate': 4.246506468445548e-06, 'epoch': 1.39} {'loss': 0.4058, 'learning_rate': 4.2462387281663445e-06, 'epoch': 1.39} {'loss': 0.4422, 'learning_rate': 4.245970994052808e-06, 'epoch': 1.39} {'loss': 0.5013, 'learning_rate': 4.245703266105241e-06, 'epoch': 1.39} {'loss': 0.4811, 'learning_rate': 4.245435544323919e-06, 'epoch': 1.39} {'loss': 0.5711, 'learning_rate': 4.245167828709131e-06, 'epoch': 1.39} {'loss': 0.6061, 'learning_rate': 4.2449001192611664e-06, 'epoch': 1.39} {'loss': 0.663, 'learning_rate': 4.24463241598031e-06, 'epoch': 1.39} {'loss': 0.4991, 'learning_rate': 4.244364718866853e-06, 'epoch': 1.39} {'loss': 0.521, 'learning_rate': 4.244097027921071e-06, 'epoch': 1.39} {'loss': 0.525, 'learning_rate': 4.2438293431432665e-06, 'epoch': 1.39} {'loss': 0.4712, 'learning_rate': 4.243561664533715e-06, 'epoch': 1.39} {'loss': 0.4588, 'learning_rate': 4.243293992092706e-06, 'epoch': 1.39} {'loss': 0.5481, 'learning_rate': 4.243026325820527e-06, 'epoch': 1.39} {'loss': 0.5497, 'learning_rate': 4.2427586657174654e-06, 'epoch': 1.39} {'loss': 0.4239, 'learning_rate': 4.242491011783811e-06, 'epoch': 1.39} {'loss': 0.6284, 'learning_rate': 4.24222336401984e-06, 'epoch': 1.39} {'loss': 0.6711, 'learning_rate': 4.241955722425855e-06, 'epoch': 1.39} {'loss': 0.4944, 'learning_rate': 4.241688087002128e-06, 'epoch': 1.39} {'loss': 0.5551, 'learning_rate': 4.241420457748952e-06, 'epoch': 1.39} {'loss': 0.4661, 'learning_rate': 4.24115283466662e-06, 'epoch': 1.39} {'loss': 0.6088, 'learning_rate': 4.240885217755403e-06, 'epoch': 1.39} {'loss': 0.6118, 'learning_rate': 4.240617607015605e-06, 'epoch': 1.39} {'loss': 0.5329, 'learning_rate': 4.2403500024474974e-06, 'epoch': 1.39} {'loss': 0.4062, 'learning_rate': 4.240082404051382e-06, 'epoch': 1.39} {'loss': 0.4175, 'learning_rate': 4.239814811827535e-06, 'epoch': 1.39} {'loss': 0.5477, 'learning_rate': 4.239547225776247e-06, 'epoch': 1.39} {'loss': 0.5893, 'learning_rate': 4.239279645897807e-06, 'epoch': 1.39} {'loss': 0.491, 'learning_rate': 4.239012072192491e-06, 'epoch': 1.39} {'loss': 0.4887, 'learning_rate': 4.238744504660601e-06, 'epoch': 1.39} {'loss': 0.635, 'learning_rate': 4.2384769433024095e-06, 'epoch': 1.39} {'loss': 0.4864, 'learning_rate': 4.238209388118217e-06, 'epoch': 1.39} {'loss': 0.4947, 'learning_rate': 4.2379418391082995e-06, 'epoch': 1.39} {'loss': 0.4972, 'learning_rate': 4.237674296272947e-06, 'epoch': 1.39} {'loss': 0.4837, 'learning_rate': 4.237406759612451e-06, 'epoch': 1.39} {'loss': 0.5324, 'learning_rate': 4.237139229127087e-06, 'epoch': 1.39} {'loss': 0.5324, 'learning_rate': 4.236871704817154e-06, 'epoch': 1.39} {'loss': 0.5906, 'learning_rate': 4.236604186682926e-06, 'epoch': 1.39} {'loss': 0.6473, 'learning_rate': 4.236336674724705e-06, 'epoch': 1.39} {'loss': 0.5238, 'learning_rate': 4.236069168942765e-06, 'epoch': 1.39} {'loss': 0.6901, 'learning_rate': 4.235801669337398e-06, 'epoch': 1.39} {'loss': 0.5053, 'learning_rate': 4.235534175908893e-06, 'epoch': 1.39} {'loss': 0.5097, 'learning_rate': 4.2352666886575265e-06, 'epoch': 1.39} {'loss': 0.513, 'learning_rate': 4.234999207583599e-06, 'epoch': 1.39} {'loss': 0.6901, 'learning_rate': 4.234731732687382e-06, 'epoch': 1.39} {'loss': 0.5215, 'learning_rate': 4.234464263969179e-06, 'epoch': 1.39} {'loss': 0.5166, 'learning_rate': 4.234196801429263e-06, 'epoch': 1.39} {'loss': 0.459, 'learning_rate': 4.233929345067926e-06, 'epoch': 1.39} {'loss': 0.4857, 'learning_rate': 4.233661894885459e-06, 'epoch': 1.39} {'loss': 0.4597, 'learning_rate': 4.233394450882136e-06, 'epoch': 1.39} {'loss': 0.5531, 'learning_rate': 4.233127013058257e-06, 'epoch': 1.39} {'loss': 0.4122, 'learning_rate': 4.2328595814141e-06, 'epoch': 1.39} {'loss': 0.5754, 'learning_rate': 4.232592155949955e-06, 'epoch': 1.39} {'loss': 0.6736, 'learning_rate': 4.232324736666108e-06, 'epoch': 1.39} {'loss': 0.5857, 'learning_rate': 4.232057323562846e-06, 'epoch': 1.39} {'loss': 0.6869, 'learning_rate': 4.231789916640458e-06, 'epoch': 1.39} {'loss': 0.7554, 'learning_rate': 4.23152251589922e-06, 'epoch': 1.39} {'loss': 0.4837, 'learning_rate': 4.231255121339435e-06, 'epoch': 1.39} {'loss': 0.4411, 'learning_rate': 4.230987732961375e-06, 'epoch': 1.39} {'loss': 0.5257, 'learning_rate': 4.230720350765335e-06, 'epoch': 1.39} {'loss': 0.6636, 'learning_rate': 4.230452974751598e-06, 'epoch': 1.39} {'loss': 0.6076, 'learning_rate': 4.23018560492045e-06, 'epoch': 1.39} {'loss': 0.3833, 'learning_rate': 4.229918241272184e-06, 'epoch': 1.39} {'loss': 0.4627, 'learning_rate': 4.2296508838070735e-06, 'epoch': 1.39} {'loss': 0.6089, 'learning_rate': 4.229383532525419e-06, 'epoch': 1.39} {'loss': 0.5178, 'learning_rate': 4.2291161874275e-06, 'epoch': 1.39} {'loss': 0.5624, 'learning_rate': 4.228848848513601e-06, 'epoch': 1.39} {'loss': 0.584, 'learning_rate': 4.228581515784014e-06, 'epoch': 1.39} {'loss': 0.4923, 'learning_rate': 4.228314189239021e-06, 'epoch': 1.39} {'loss': 0.4432, 'learning_rate': 4.228046868878915e-06, 'epoch': 1.39} {'loss': 0.4209, 'learning_rate': 4.227779554703972e-06, 'epoch': 1.39} {'loss': 0.4664, 'learning_rate': 4.227512246714487e-06, 'epoch': 1.39} {'loss': 0.4516, 'learning_rate': 4.227244944910741e-06, 'epoch': 1.39} {'loss': 0.5179, 'learning_rate': 4.226977649293025e-06, 'epoch': 1.39} {'loss': 0.4771, 'learning_rate': 4.226710359861624e-06, 'epoch': 1.39} {'loss': 0.618, 'learning_rate': 4.226443076616822e-06, 'epoch': 1.39} {'loss': 0.5786, 'learning_rate': 4.226175799558912e-06, 'epoch': 1.39} {'loss': 0.6048, 'learning_rate': 4.22590852868817e-06, 'epoch': 1.39} {'loss': 0.6162, 'learning_rate': 4.225641264004891e-06, 'epoch': 1.39} {'loss': 0.4767, 'learning_rate': 4.225374005509357e-06, 'epoch': 1.39} {'loss': 0.5572, 'learning_rate': 4.225106753201857e-06, 'epoch': 1.39} {'loss': 0.573, 'learning_rate': 4.22483950708268e-06, 'epoch': 1.39} {'loss': 0.5172, 'learning_rate': 4.2245722671521005e-06, 'epoch': 1.39} {'loss': 0.5604, 'learning_rate': 4.224305033410421e-06, 'epoch': 1.39} {'loss': 0.5481, 'learning_rate': 4.224037805857916e-06, 'epoch': 1.39} {'loss': 0.5884, 'learning_rate': 4.223770584494877e-06, 'epoch': 1.39} {'loss': 0.6133, 'learning_rate': 4.223503369321586e-06, 'epoch': 1.39} {'loss': 0.55, 'learning_rate': 4.223236160338335e-06, 'epoch': 1.39} {'loss': 0.599, 'learning_rate': 4.222968957545411e-06, 'epoch': 1.39} {'loss': 0.4475, 'learning_rate': 4.222701760943094e-06, 'epoch': 1.39} {'loss': 0.5072, 'learning_rate': 4.222434570531673e-06, 'epoch': 1.39} {'loss': 0.5065, 'learning_rate': 4.222167386311435e-06, 'epoch': 1.39} {'loss': 0.6409, 'learning_rate': 4.221900208282665e-06, 'epoch': 1.39} {'loss': 0.4477, 'learning_rate': 4.221633036445652e-06, 'epoch': 1.39} {'loss': 0.4173, 'learning_rate': 4.22136587080068e-06, 'epoch': 1.39} {'loss': 0.6918, 'learning_rate': 4.221098711348041e-06, 'epoch': 1.39} {'loss': 0.4982, 'learning_rate': 4.220831558088011e-06, 'epoch': 1.39} {'loss': 0.527, 'learning_rate': 4.220564411020882e-06, 'epoch': 1.39} {'loss': 0.6204, 'learning_rate': 4.220297270146939e-06, 'epoch': 1.39} {'loss': 0.6151, 'learning_rate': 4.220030135466471e-06, 'epoch': 1.39} {'loss': 0.5022, 'learning_rate': 4.219763006979761e-06, 'epoch': 1.39} {'loss': 0.628, 'learning_rate': 4.219495884687097e-06, 'epoch': 1.39} {'loss': 0.4358, 'learning_rate': 4.219228768588769e-06, 'epoch': 1.39} {'loss': 0.4861, 'learning_rate': 4.218961658685054e-06, 'epoch': 1.39} {'loss': 0.4153, 'learning_rate': 4.218694554976245e-06, 'epoch': 1.39} {'loss': 0.5097, 'learning_rate': 4.218427457462626e-06, 'epoch': 1.39} {'loss': 0.6377, 'learning_rate': 4.218160366144484e-06, 'epoch': 1.39} {'loss': 0.5917, 'learning_rate': 4.217893281022105e-06, 'epoch': 1.39} {'loss': 0.5117, 'learning_rate': 4.217626202095778e-06, 'epoch': 1.39} {'loss': 0.5778, 'learning_rate': 4.2173591293657835e-06, 'epoch': 1.39} {'loss': 0.616, 'learning_rate': 4.217092062832411e-06, 'epoch': 1.39} {'loss': 0.5088, 'learning_rate': 4.216825002495945e-06, 'epoch': 1.39} {'loss': 0.5375, 'learning_rate': 4.2165579483566745e-06, 'epoch': 1.39} {'loss': 0.3661, 'learning_rate': 4.216290900414884e-06, 'epoch': 1.39} {'loss': 0.5751, 'learning_rate': 4.216023858670859e-06, 'epoch': 1.39} {'loss': 0.5289, 'learning_rate': 4.21575682312489e-06, 'epoch': 1.39} {'loss': 0.4609, 'learning_rate': 4.215489793777256e-06, 'epoch': 1.39} {'loss': 0.5129, 'learning_rate': 4.215222770628248e-06, 'epoch': 1.39} {'loss': 0.4174, 'learning_rate': 4.214955753678151e-06, 'epoch': 1.39} {'loss': 0.6429, 'learning_rate': 4.214688742927248e-06, 'epoch': 1.39} {'loss': 0.4409, 'learning_rate': 4.214421738375834e-06, 'epoch': 1.39} {'loss': 0.516, 'learning_rate': 4.214154740024184e-06, 'epoch': 1.39} {'loss': 0.6228, 'learning_rate': 4.213887747872594e-06, 'epoch': 1.39} {'loss': 0.7373, 'learning_rate': 4.213620761921342e-06, 'epoch': 1.39} {'loss': 0.5, 'learning_rate': 4.213353782170718e-06, 'epoch': 1.39} {'loss': 0.5683, 'learning_rate': 4.213086808621007e-06, 'epoch': 1.39} {'loss': 0.6746, 'learning_rate': 4.212819841272497e-06, 'epoch': 1.39} {'loss': 0.5119, 'learning_rate': 4.212552880125476e-06, 'epoch': 1.39} {'loss': 0.3664, 'learning_rate': 4.212285925180221e-06, 'epoch': 1.39} {'loss': 0.5907, 'learning_rate': 4.212018976437029e-06, 'epoch': 1.39} {'loss': 0.6005, 'learning_rate': 4.211752033896178e-06, 'epoch': 1.39} {'loss': 0.4602, 'learning_rate': 4.211485097557958e-06, 'epoch': 1.39} {'loss': 0.5991, 'learning_rate': 4.211218167422654e-06, 'epoch': 1.39} {'loss': 0.4826, 'learning_rate': 4.210951243490552e-06, 'epoch': 1.39} {'loss': 0.5448, 'learning_rate': 4.210684325761941e-06, 'epoch': 1.39} {'loss': 0.6406, 'learning_rate': 4.210417414237098e-06, 'epoch': 1.39} {'loss': 0.5887, 'learning_rate': 4.210150508916323e-06, 'epoch': 1.39} {'loss': 0.4859, 'learning_rate': 4.20988360979989e-06, 'epoch': 1.4} {'loss': 0.4184, 'learning_rate': 4.209616716888088e-06, 'epoch': 1.4} {'loss': 0.4748, 'learning_rate': 4.209349830181209e-06, 'epoch': 1.4} {'loss': 0.5676, 'learning_rate': 4.209082949679528e-06, 'epoch': 1.4} {'loss': 0.4119, 'learning_rate': 4.208816075383344e-06, 'epoch': 1.4} {'loss': 0.4871, 'learning_rate': 4.208549207292929e-06, 'epoch': 1.4} {'loss': 0.6455, 'learning_rate': 4.208282345408583e-06, 'epoch': 1.4} {'loss': 0.5028, 'learning_rate': 4.208015489730583e-06, 'epoch': 1.4} {'loss': 0.5498, 'learning_rate': 4.207748640259215e-06, 'epoch': 1.4} {'loss': 0.4807, 'learning_rate': 4.207481796994772e-06, 'epoch': 1.4} {'loss': 0.3877, 'learning_rate': 4.207214959937528e-06, 'epoch': 1.4} {'loss': 0.6067, 'learning_rate': 4.206948129087782e-06, 'epoch': 1.4} {'loss': 0.4505, 'learning_rate': 4.206681304445812e-06, 'epoch': 1.4} {'loss': 0.5758, 'learning_rate': 4.2064144860119045e-06, 'epoch': 1.4} {'loss': 0.4689, 'learning_rate': 4.206147673786347e-06, 'epoch': 1.4} {'loss': 0.4384, 'learning_rate': 4.205880867769426e-06, 'epoch': 1.4} {'loss': 0.5532, 'learning_rate': 4.20561406796143e-06, 'epoch': 1.4} {'loss': 0.5927, 'learning_rate': 4.205347274362633e-06, 'epoch': 1.4} {'loss': 0.6219, 'learning_rate': 4.205080486973339e-06, 'epoch': 1.4} {'loss': 0.4927, 'learning_rate': 4.204813705793819e-06, 'epoch': 1.4} {'loss': 0.4416, 'learning_rate': 4.204546930824364e-06, 'epoch': 1.4} {'loss': 0.6877, 'learning_rate': 4.204280162065261e-06, 'epoch': 1.4} {'loss': 0.455, 'learning_rate': 4.204013399516794e-06, 'epoch': 1.4} {'loss': 0.6619, 'learning_rate': 4.203746643179254e-06, 'epoch': 1.4} {'loss': 0.53, 'learning_rate': 4.203479893052915e-06, 'epoch': 1.4} {'loss': 0.4563, 'learning_rate': 4.203213149138078e-06, 'epoch': 1.4} {'loss': 0.4717, 'learning_rate': 4.202946411435017e-06, 'epoch': 1.4} {'loss': 0.5479, 'learning_rate': 4.2026796799440226e-06, 'epoch': 1.4} {'loss': 0.4813, 'learning_rate': 4.202412954665385e-06, 'epoch': 1.4} {'loss': 0.4027, 'learning_rate': 4.202146235599376e-06, 'epoch': 1.4} {'loss': 0.5285, 'learning_rate': 4.201879522746298e-06, 'epoch': 1.4} {'loss': 0.6767, 'learning_rate': 4.2016128161064225e-06, 'epoch': 1.4} {'loss': 0.6469, 'learning_rate': 4.201346115680051e-06, 'epoch': 1.4} {'loss': 0.5164, 'learning_rate': 4.2010794214674556e-06, 'epoch': 1.4} {'loss': 0.5957, 'learning_rate': 4.200812733468927e-06, 'epoch': 1.4} {'loss': 0.7054, 'learning_rate': 4.200546051684754e-06, 'epoch': 1.4} {'loss': 0.5735, 'learning_rate': 4.2002793761152126e-06, 'epoch': 1.4} {'loss': 0.7534, 'learning_rate': 4.200012706760603e-06, 'epoch': 1.4} {'loss': 0.709, 'learning_rate': 4.199746043621195e-06, 'epoch': 1.4} {'loss': 0.473, 'learning_rate': 4.199479386697291e-06, 'epoch': 1.4} {'loss': 0.6343, 'learning_rate': 4.199212735989165e-06, 'epoch': 1.4} {'loss': 0.5954, 'learning_rate': 4.198946091497105e-06, 'epoch': 1.4} {'loss': 0.4284, 'learning_rate': 4.198679453221402e-06, 'epoch': 1.4} {'loss': 0.5456, 'learning_rate': 4.19841282116233e-06, 'epoch': 1.4} {'loss': 0.5216, 'learning_rate': 4.19814619532019e-06, 'epoch': 1.4} {'loss': 0.3867, 'learning_rate': 4.197879575695252e-06, 'epoch': 1.4} {'loss': 0.619, 'learning_rate': 4.197612962287817e-06, 'epoch': 1.4} {'loss': 0.6328, 'learning_rate': 4.197346355098161e-06, 'epoch': 1.4} {'loss': 0.5724, 'learning_rate': 4.1970797541265705e-06, 'epoch': 1.4} {'loss': 0.5202, 'learning_rate': 4.196813159373338e-06, 'epoch': 1.4} {'loss': 0.6648, 'learning_rate': 4.196546570838735e-06, 'epoch': 1.4} {'loss': 0.4703, 'learning_rate': 4.196279988523065e-06, 'epoch': 1.4} {'loss': 0.3837, 'learning_rate': 4.196013412426596e-06, 'epoch': 1.4} {'loss': 0.574, 'learning_rate': 4.195746842549631e-06, 'epoch': 1.4} {'loss': 0.5225, 'learning_rate': 4.195480278892443e-06, 'epoch': 1.4} {'loss': 0.5268, 'learning_rate': 4.195213721455323e-06, 'epoch': 1.4} {'loss': 0.4228, 'learning_rate': 4.194947170238557e-06, 'epoch': 1.4} {'loss': 0.5141, 'learning_rate': 4.194680625242422e-06, 'epoch': 1.4} {'loss': 0.5134, 'learning_rate': 4.194414086467219e-06, 'epoch': 1.4} {'loss': 0.5958, 'learning_rate': 4.194147553913221e-06, 'epoch': 1.4} {'loss': 0.4763, 'learning_rate': 4.193881027580719e-06, 'epoch': 1.4} {'loss': 0.5802, 'learning_rate': 4.193614507469997e-06, 'epoch': 1.4} {'loss': 0.6071, 'learning_rate': 4.19334799358134e-06, 'epoch': 1.4} {'loss': 0.4096, 'learning_rate': 4.193081485915039e-06, 'epoch': 1.4} {'loss': 0.5256, 'learning_rate': 4.192814984471368e-06, 'epoch': 1.4} {'loss': 0.4923, 'learning_rate': 4.192548489250627e-06, 'epoch': 1.4} {'loss': 0.551, 'learning_rate': 4.192282000253091e-06, 'epoch': 1.4} {'loss': 0.3681, 'learning_rate': 4.19201551747905e-06, 'epoch': 1.4} {'loss': 0.4959, 'learning_rate': 4.191749040928788e-06, 'epoch': 1.4} {'loss': 0.3876, 'learning_rate': 4.191482570602591e-06, 'epoch': 1.4} {'loss': 0.6599, 'learning_rate': 4.1912161065007485e-06, 'epoch': 1.4} {'loss': 0.4632, 'learning_rate': 4.190949648623538e-06, 'epoch': 1.4} {'loss': 0.5204, 'learning_rate': 4.1906831969712495e-06, 'epoch': 1.4} {'loss': 0.4089, 'learning_rate': 4.190416751544169e-06, 'epoch': 1.4} {'loss': 0.4392, 'learning_rate': 4.19015031234258e-06, 'epoch': 1.4} {'loss': 0.4033, 'learning_rate': 4.1898838793667695e-06, 'epoch': 1.4} {'loss': 0.3914, 'learning_rate': 4.189617452617023e-06, 'epoch': 1.4} {'loss': 0.5041, 'learning_rate': 4.1893510320936305e-06, 'epoch': 1.4} {'loss': 0.5928, 'learning_rate': 4.189084617796868e-06, 'epoch': 1.4} {'loss': 0.5862, 'learning_rate': 4.188818209727026e-06, 'epoch': 1.4} {'loss': 0.369, 'learning_rate': 4.18855180788439e-06, 'epoch': 1.4} {'loss': 0.492, 'learning_rate': 4.188285412269245e-06, 'epoch': 1.4} {'loss': 0.6667, 'learning_rate': 4.1880190228818775e-06, 'epoch': 1.4} {'loss': 0.6024, 'learning_rate': 4.1877526397225706e-06, 'epoch': 1.4} {'loss': 0.6871, 'learning_rate': 4.187486262791617e-06, 'epoch': 1.4} {'loss': 0.5651, 'learning_rate': 4.187219892089292e-06, 'epoch': 1.4} {'loss': 0.5558, 'learning_rate': 4.186953527615885e-06, 'epoch': 1.4} {'loss': 0.4365, 'learning_rate': 4.186687169371682e-06, 'epoch': 1.4} {'loss': 0.5502, 'learning_rate': 4.186420817356968e-06, 'epoch': 1.4} {'loss': 0.513, 'learning_rate': 4.1861544715720305e-06, 'epoch': 1.4} {'loss': 0.4525, 'learning_rate': 4.1858881320171556e-06, 'epoch': 1.4} {'loss': 0.5795, 'learning_rate': 4.185621798692623e-06, 'epoch': 1.4} {'loss': 0.5067, 'learning_rate': 4.185355471598721e-06, 'epoch': 1.4} {'loss': 0.6814, 'learning_rate': 4.185089150735736e-06, 'epoch': 1.4} {'loss': 0.59, 'learning_rate': 4.1848228361039525e-06, 'epoch': 1.4} {'loss': 0.4835, 'learning_rate': 4.184556527703656e-06, 'epoch': 1.4} {'loss': 0.4966, 'learning_rate': 4.184290225535136e-06, 'epoch': 1.4} {'loss': 0.5624, 'learning_rate': 4.184023929598669e-06, 'epoch': 1.4} {'loss': 0.6, 'learning_rate': 4.183757639894548e-06, 'epoch': 1.4} {'loss': 0.4769, 'learning_rate': 4.183491356423054e-06, 'epoch': 1.4} {'loss': 0.5004, 'learning_rate': 4.1832250791844745e-06, 'epoch': 1.4} {'loss': 0.494, 'learning_rate': 4.1829588081790925e-06, 'epoch': 1.4} {'loss': 0.434, 'learning_rate': 4.182692543407197e-06, 'epoch': 1.4} {'loss': 0.3952, 'learning_rate': 4.182426284869075e-06, 'epoch': 1.4} {'loss': 0.5335, 'learning_rate': 4.182160032565005e-06, 'epoch': 1.4} {'loss': 0.4677, 'learning_rate': 4.181893786495274e-06, 'epoch': 1.4} {'loss': 0.4274, 'learning_rate': 4.18162754666017e-06, 'epoch': 1.4} {'loss': 0.4321, 'learning_rate': 4.181361313059978e-06, 'epoch': 1.4} {'loss': 0.4234, 'learning_rate': 4.1810950856949816e-06, 'epoch': 1.4} {'loss': 0.7338, 'learning_rate': 4.18082886456547e-06, 'epoch': 1.4} {'loss': 0.5912, 'learning_rate': 4.180562649671723e-06, 'epoch': 1.4} {'loss': 0.4776, 'learning_rate': 4.180296441014028e-06, 'epoch': 1.4} {'loss': 0.5938, 'learning_rate': 4.18003023859267e-06, 'epoch': 1.4} {'loss': 0.5621, 'learning_rate': 4.179764042407935e-06, 'epoch': 1.4} {'loss': 0.5948, 'learning_rate': 4.179497852460109e-06, 'epoch': 1.4} {'loss': 0.5921, 'learning_rate': 4.179231668749476e-06, 'epoch': 1.4} {'loss': 0.533, 'learning_rate': 4.1789654912763254e-06, 'epoch': 1.4} {'loss': 0.4258, 'learning_rate': 4.178699320040935e-06, 'epoch': 1.4} {'loss': 0.5878, 'learning_rate': 4.178433155043593e-06, 'epoch': 1.4} {'loss': 0.5531, 'learning_rate': 4.178166996284586e-06, 'epoch': 1.4} {'loss': 0.4797, 'learning_rate': 4.177900843764199e-06, 'epoch': 1.4} {'loss': 0.5694, 'learning_rate': 4.177634697482715e-06, 'epoch': 1.4} {'loss': 0.5278, 'learning_rate': 4.177368557440422e-06, 'epoch': 1.4} {'loss': 0.5727, 'learning_rate': 4.177102423637608e-06, 'epoch': 1.4} {'loss': 0.5821, 'learning_rate': 4.17683629607455e-06, 'epoch': 1.4} {'loss': 0.5129, 'learning_rate': 4.176570174751539e-06, 'epoch': 1.4} {'loss': 0.5488, 'learning_rate': 4.176304059668858e-06, 'epoch': 1.4} {'loss': 0.6475, 'learning_rate': 4.1760379508267915e-06, 'epoch': 1.4} {'loss': 0.5547, 'learning_rate': 4.17577184822563e-06, 'epoch': 1.4} {'loss': 0.5115, 'learning_rate': 4.1755057518656485e-06, 'epoch': 1.4} {'loss': 0.5389, 'learning_rate': 4.175239661747145e-06, 'epoch': 1.4} {'loss': 0.4623, 'learning_rate': 4.174973577870393e-06, 'epoch': 1.4} {'loss': 0.5385, 'learning_rate': 4.174707500235684e-06, 'epoch': 1.4} {'loss': 0.4353, 'learning_rate': 4.174441428843302e-06, 'epoch': 1.4} {'loss': 0.5252, 'learning_rate': 4.174175363693531e-06, 'epoch': 1.4} {'loss': 0.6321, 'learning_rate': 4.1739093047866605e-06, 'epoch': 1.4} {'loss': 0.5733, 'learning_rate': 4.173643252122965e-06, 'epoch': 1.4} {'loss': 0.5006, 'learning_rate': 4.173377205702744e-06, 'epoch': 1.4} {'loss': 0.5611, 'learning_rate': 4.173111165526271e-06, 'epoch': 1.4} {'loss': 0.4529, 'learning_rate': 4.172845131593837e-06, 'epoch': 1.4} {'loss': 0.4186, 'learning_rate': 4.172579103905724e-06, 'epoch': 1.4} {'loss': 0.5246, 'learning_rate': 4.172313082462218e-06, 'epoch': 1.4} {'loss': 0.4107, 'learning_rate': 4.172047067263609e-06, 'epoch': 1.4} {'loss': 0.4708, 'learning_rate': 4.17178105831017e-06, 'epoch': 1.4} {'loss': 0.4171, 'learning_rate': 4.171515055602201e-06, 'epoch': 1.4} {'loss': 0.4513, 'learning_rate': 4.171249059139976e-06, 'epoch': 1.4} {'loss': 0.5673, 'learning_rate': 4.170983068923783e-06, 'epoch': 1.4} {'loss': 0.4772, 'learning_rate': 4.170717084953913e-06, 'epoch': 1.4} {'loss': 0.5065, 'learning_rate': 4.170451107230637e-06, 'epoch': 1.4} {'loss': 0.6231, 'learning_rate': 4.170185135754257e-06, 'epoch': 1.4} {'loss': 0.6139, 'learning_rate': 4.169919170525042e-06, 'epoch': 1.4} {'loss': 0.5498, 'learning_rate': 4.169653211543292e-06, 'epoch': 1.4} {'loss': 0.5322, 'learning_rate': 4.169387258809281e-06, 'epoch': 1.4} {'loss': 0.5309, 'learning_rate': 4.169121312323299e-06, 'epoch': 1.4} {'loss': 0.6058, 'learning_rate': 4.168855372085632e-06, 'epoch': 1.4} {'loss': 0.5437, 'learning_rate': 4.168589438096556e-06, 'epoch': 1.4} {'loss': 0.498, 'learning_rate': 4.16832351035637e-06, 'epoch': 1.4} {'loss': 0.4901, 'learning_rate': 4.168057588865345e-06, 'epoch': 1.4} {'loss': 0.5028, 'learning_rate': 4.167791673623779e-06, 'epoch': 1.4} {'loss': 0.4527, 'learning_rate': 4.167525764631948e-06, 'epoch': 1.4} {'loss': 0.5832, 'learning_rate': 4.167259861890138e-06, 'epoch': 1.4} {'loss': 0.5598, 'learning_rate': 4.16699396539864e-06, 'epoch': 1.4} {'loss': 0.6553, 'learning_rate': 4.1667280751577274e-06, 'epoch': 1.4} {'loss': 0.5108, 'learning_rate': 4.166462191167699e-06, 'epoch': 1.4} {'loss': 0.6791, 'learning_rate': 4.1661963134288304e-06, 'epoch': 1.4} {'loss': 0.4348, 'learning_rate': 4.1659304419414085e-06, 'epoch': 1.4} {'loss': 0.5578, 'learning_rate': 4.165664576705718e-06, 'epoch': 1.4} {'loss': 0.5544, 'learning_rate': 4.165398717722044e-06, 'epoch': 1.4} {'loss': 0.4112, 'learning_rate': 4.165132864990676e-06, 'epoch': 1.4} {'loss': 0.3923, 'learning_rate': 4.164867018511889e-06, 'epoch': 1.4} {'loss': 0.4036, 'learning_rate': 4.164601178285979e-06, 'epoch': 1.4} {'loss': 0.4618, 'learning_rate': 4.164335344313223e-06, 'epoch': 1.4} {'loss': 0.4415, 'learning_rate': 4.164069516593909e-06, 'epoch': 1.4} {'loss': 0.6196, 'learning_rate': 4.163803695128319e-06, 'epoch': 1.4} {'loss': 0.517, 'learning_rate': 4.163537879916741e-06, 'epoch': 1.4} {'loss': 0.4596, 'learning_rate': 4.163272070959463e-06, 'epoch': 1.4} {'loss': 0.5518, 'learning_rate': 4.163006268256759e-06, 'epoch': 1.4} {'loss': 0.5952, 'learning_rate': 4.162740471808927e-06, 'epoch': 1.4} {'loss': 0.545, 'learning_rate': 4.162474681616242e-06, 'epoch': 1.4} {'loss': 0.5689, 'learning_rate': 4.162208897678992e-06, 'epoch': 1.4} {'loss': 0.536, 'learning_rate': 4.161943119997466e-06, 'epoch': 1.4} {'loss': 0.5884, 'learning_rate': 4.161677348571938e-06, 'epoch': 1.4} {'loss': 0.417, 'learning_rate': 4.161411583402707e-06, 'epoch': 1.4} {'loss': 0.3967, 'learning_rate': 4.1611458244900425e-06, 'epoch': 1.4} {'loss': 0.4239, 'learning_rate': 4.160880071834245e-06, 'epoch': 1.4} {'loss': 0.5932, 'learning_rate': 4.1606143254355865e-06, 'epoch': 1.4} {'loss': 0.7122, 'learning_rate': 4.1603485852943585e-06, 'epoch': 1.4} {'loss': 0.4796, 'learning_rate': 4.160082851410847e-06, 'epoch': 1.4} {'loss': 0.4569, 'learning_rate': 4.1598171237853265e-06, 'epoch': 1.4} {'loss': 0.5995, 'learning_rate': 4.159551402418096e-06, 'epoch': 1.4} {'loss': 0.459, 'learning_rate': 4.159285687309427e-06, 'epoch': 1.4} {'loss': 0.465, 'learning_rate': 4.159019978459618e-06, 'epoch': 1.4} {'loss': 0.5376, 'learning_rate': 4.158754275868942e-06, 'epoch': 1.4} {'loss': 0.5288, 'learning_rate': 4.1584885795376875e-06, 'epoch': 1.4} {'loss': 0.6223, 'learning_rate': 4.158222889466144e-06, 'epoch': 1.4} {'loss': 0.5087, 'learning_rate': 4.157957205654584e-06, 'epoch': 1.4} {'loss': 0.6044, 'learning_rate': 4.157691528103307e-06, 'epoch': 1.4} {'loss': 0.4795, 'learning_rate': 4.157425856812588e-06, 'epoch': 1.4} {'loss': 0.5814, 'learning_rate': 4.157160191782715e-06, 'epoch': 1.4} {'loss': 0.595, 'learning_rate': 4.156894533013972e-06, 'epoch': 1.4} {'loss': 0.6372, 'learning_rate': 4.156628880506643e-06, 'epoch': 1.4} {'loss': 0.5931, 'learning_rate': 4.156363234261018e-06, 'epoch': 1.4} {'loss': 0.5521, 'learning_rate': 4.15609759427737e-06, 'epoch': 1.4} {'loss': 0.4756, 'learning_rate': 4.155831960555998e-06, 'epoch': 1.4} {'loss': 0.5107, 'learning_rate': 4.155566333097175e-06, 'epoch': 1.4} {'loss': 0.6564, 'learning_rate': 4.155300711901191e-06, 'epoch': 1.4} {'loss': 0.4398, 'learning_rate': 4.155035096968331e-06, 'epoch': 1.4} {'loss': 0.6038, 'learning_rate': 4.154769488298876e-06, 'epoch': 1.4} {'loss': 0.5161, 'learning_rate': 4.1545038858931185e-06, 'epoch': 1.4} {'loss': 0.3943, 'learning_rate': 4.15423828975133e-06, 'epoch': 1.4} {'loss': 0.5751, 'learning_rate': 4.153972699873809e-06, 'epoch': 1.4} {'loss': 0.497, 'learning_rate': 4.153707116260831e-06, 'epoch': 1.4} {'loss': 0.4925, 'learning_rate': 4.153441538912684e-06, 'epoch': 1.4} {'loss': 0.5223, 'learning_rate': 4.153175967829653e-06, 'epoch': 1.4} {'loss': 0.4804, 'learning_rate': 4.15291040301202e-06, 'epoch': 1.4} {'loss': 0.5912, 'learning_rate': 4.152644844460074e-06, 'epoch': 1.4} {'loss': 0.3951, 'learning_rate': 4.152379292174095e-06, 'epoch': 1.4} {'loss': 0.344, 'learning_rate': 4.1521137461543685e-06, 'epoch': 1.4} {'loss': 0.5148, 'learning_rate': 4.15184820640118e-06, 'epoch': 1.4} {'loss': 0.6052, 'learning_rate': 4.151582672914814e-06, 'epoch': 1.4} {'loss': 0.48, 'learning_rate': 4.151317145695556e-06, 'epoch': 1.4} {'loss': 0.4726, 'learning_rate': 4.151051624743688e-06, 'epoch': 1.4} {'loss': 0.5277, 'learning_rate': 4.150786110059501e-06, 'epoch': 1.4} {'loss': 0.5264, 'learning_rate': 4.15052060164327e-06, 'epoch': 1.4} {'loss': 0.572, 'learning_rate': 4.150255099495284e-06, 'epoch': 1.4} {'loss': 0.6191, 'learning_rate': 4.149989603615828e-06, 'epoch': 1.4} {'loss': 0.4651, 'learning_rate': 4.149724114005187e-06, 'epoch': 1.4} {'loss': 0.5473, 'learning_rate': 4.149458630663644e-06, 'epoch': 1.4} {'loss': 0.4694, 'learning_rate': 4.149193153591484e-06, 'epoch': 1.4} {'loss': 0.4486, 'learning_rate': 4.148927682788995e-06, 'epoch': 1.4} {'loss': 0.5997, 'learning_rate': 4.148662218256455e-06, 'epoch': 1.4} {'loss': 0.4821, 'learning_rate': 4.148396759994151e-06, 'epoch': 1.4} {'loss': 0.4096, 'learning_rate': 4.148131308002369e-06, 'epoch': 1.4} {'loss': 0.6705, 'learning_rate': 4.147865862281392e-06, 'epoch': 1.4} {'loss': 0.4964, 'learning_rate': 4.147600422831503e-06, 'epoch': 1.4} {'loss': 0.7036, 'learning_rate': 4.1473349896529945e-06, 'epoch': 1.4} {'loss': 0.5301, 'learning_rate': 4.14706956274614e-06, 'epoch': 1.4} {'loss': 0.5689, 'learning_rate': 4.14680414211123e-06, 'epoch': 1.4} {'loss': 0.518, 'learning_rate': 4.1465387277485455e-06, 'epoch': 1.4} {'loss': 0.671, 'learning_rate': 4.146273319658375e-06, 'epoch': 1.4} {'loss': 0.4739, 'learning_rate': 4.146007917840999e-06, 'epoch': 1.4} {'loss': 0.5016, 'learning_rate': 4.145742522296706e-06, 'epoch': 1.4} {'loss': 0.5507, 'learning_rate': 4.1454771330257815e-06, 'epoch': 1.4} {'loss': 0.593, 'learning_rate': 4.145211750028503e-06, 'epoch': 1.4} {'loss': 0.5705, 'learning_rate': 4.1449463733051575e-06, 'epoch': 1.4} {'loss': 0.5884, 'learning_rate': 4.14468100285603e-06, 'epoch': 1.4} {'loss': 0.5571, 'learning_rate': 4.144415638681407e-06, 'epoch': 1.4} {'loss': 0.5726, 'learning_rate': 4.14415028078157e-06, 'epoch': 1.4} {'loss': 0.5677, 'learning_rate': 4.143884929156805e-06, 'epoch': 1.4} {'loss': 0.496, 'learning_rate': 4.1436195838074e-06, 'epoch': 1.4} {'loss': 0.6133, 'learning_rate': 4.143354244733631e-06, 'epoch': 1.4} {'loss': 0.5901, 'learning_rate': 4.143088911935786e-06, 'epoch': 1.4} {'loss': 0.4608, 'learning_rate': 4.142823585414151e-06, 'epoch': 1.4} {'loss': 0.4392, 'learning_rate': 4.142558265169008e-06, 'epoch': 1.4} {'loss': 0.3932, 'learning_rate': 4.142292951200646e-06, 'epoch': 1.4} {'loss': 0.5461, 'learning_rate': 4.142027643509343e-06, 'epoch': 1.4} {'loss': 0.6048, 'learning_rate': 4.141762342095386e-06, 'epoch': 1.4} {'loss': 0.5826, 'learning_rate': 4.141497046959059e-06, 'epoch': 1.4} {'loss': 0.5428, 'learning_rate': 4.141231758100647e-06, 'epoch': 1.4} {'loss': 0.6133, 'learning_rate': 4.1409664755204334e-06, 'epoch': 1.4} {'loss': 0.5148, 'learning_rate': 4.140701199218704e-06, 'epoch': 1.4} {'loss': 0.5358, 'learning_rate': 4.1404359291957455e-06, 'epoch': 1.4} {'loss': 0.5241, 'learning_rate': 4.140170665451835e-06, 'epoch': 1.4} {'loss': 0.424, 'learning_rate': 4.13990540798726e-06, 'epoch': 1.4} {'loss': 0.5371, 'learning_rate': 4.139640156802306e-06, 'epoch': 1.4} {'loss': 0.5501, 'learning_rate': 4.139374911897256e-06, 'epoch': 1.4} {'loss': 0.5334, 'learning_rate': 4.139109673272398e-06, 'epoch': 1.4} {'loss': 0.5733, 'learning_rate': 4.138844440928006e-06, 'epoch': 1.4} {'loss': 0.4159, 'learning_rate': 4.138579214864379e-06, 'epoch': 1.4} {'loss': 0.46, 'learning_rate': 4.138313995081789e-06, 'epoch': 1.4} {'loss': 0.6045, 'learning_rate': 4.138048781580526e-06, 'epoch': 1.4} {'loss': 0.6255, 'learning_rate': 4.137783574360871e-06, 'epoch': 1.4} {'loss': 0.5775, 'learning_rate': 4.137518373423111e-06, 'epoch': 1.4} {'loss': 0.5344, 'learning_rate': 4.137253178767533e-06, 'epoch': 1.4} {'loss': 0.4789, 'learning_rate': 4.13698799039441e-06, 'epoch': 1.4} {'loss': 0.4732, 'learning_rate': 4.13672280830404e-06, 'epoch': 1.4} {'loss': 0.5537, 'learning_rate': 4.136457632496697e-06, 'epoch': 1.4} {'loss': 0.6555, 'learning_rate': 4.13619246297267e-06, 'epoch': 1.4} {'loss': 0.4554, 'learning_rate': 4.135927299732242e-06, 'epoch': 1.4} {'loss': 0.5099, 'learning_rate': 4.135662142775696e-06, 'epoch': 1.4} {'loss': 0.5868, 'learning_rate': 4.135396992103322e-06, 'epoch': 1.4} {'loss': 0.6279, 'learning_rate': 4.135131847715391e-06, 'epoch': 1.4} {'loss': 0.5498, 'learning_rate': 4.134866709612204e-06, 'epoch': 1.4} {'loss': 0.4614, 'learning_rate': 4.134601577794033e-06, 'epoch': 1.4} {'loss': 0.4797, 'learning_rate': 4.134336452261165e-06, 'epoch': 1.4} {'loss': 0.5279, 'learning_rate': 4.13407133301389e-06, 'epoch': 1.4} {'loss': 0.4699, 'learning_rate': 4.133806220052477e-06, 'epoch': 1.4} {'loss': 0.6299, 'learning_rate': 4.133541113377229e-06, 'epoch': 1.4} {'loss': 0.6107, 'learning_rate': 4.133276012988415e-06, 'epoch': 1.4} {'loss': 0.5047, 'learning_rate': 4.133010918886331e-06, 'epoch': 1.4} {'loss': 0.5166, 'learning_rate': 4.1327458310712534e-06, 'epoch': 1.4} {'loss': 0.5632, 'learning_rate': 4.132480749543466e-06, 'epoch': 1.4} {'loss': 0.5561, 'learning_rate': 4.1322156743032606e-06, 'epoch': 1.4} {'loss': 0.5469, 'learning_rate': 4.131950605350907e-06, 'epoch': 1.4} {'loss': 0.5421, 'learning_rate': 4.131685542686705e-06, 'epoch': 1.4} {'loss': 0.7202, 'learning_rate': 4.131420486310925e-06, 'epoch': 1.4} {'loss': 0.5844, 'learning_rate': 4.131155436223866e-06, 'epoch': 1.4} {'loss': 0.6343, 'learning_rate': 4.130890392425798e-06, 'epoch': 1.4} {'loss': 0.5104, 'learning_rate': 4.130625354917012e-06, 'epoch': 1.4} {'loss': 0.3658, 'learning_rate': 4.130360323697794e-06, 'epoch': 1.4} {'loss': 0.5447, 'learning_rate': 4.1300952987684174e-06, 'epoch': 1.4} {'loss': 0.5962, 'learning_rate': 4.129830280129181e-06, 'epoch': 1.4} {'loss': 0.689, 'learning_rate': 4.129565267780353e-06, 'epoch': 1.4} {'loss': 0.5359, 'learning_rate': 4.129300261722234e-06, 'epoch': 1.4} {'loss': 0.3176, 'learning_rate': 4.129035261955095e-06, 'epoch': 1.4} {'loss': 0.5848, 'learning_rate': 4.128770268479226e-06, 'epoch': 1.4} {'loss': 0.5242, 'learning_rate': 4.128505281294912e-06, 'epoch': 1.4} {'loss': 0.4719, 'learning_rate': 4.128240300402428e-06, 'epoch': 1.4} {'loss': 0.53, 'learning_rate': 4.127975325802072e-06, 'epoch': 1.4} {'loss': 0.4184, 'learning_rate': 4.127710357494112e-06, 'epoch': 1.4} {'loss': 0.5861, 'learning_rate': 4.127445395478848e-06, 'epoch': 1.4} {'loss': 0.7585, 'learning_rate': 4.127180439756553e-06, 'epoch': 1.4} {'loss': 0.5524, 'learning_rate': 4.126915490327514e-06, 'epoch': 1.4} {'loss': 0.4449, 'learning_rate': 4.126650547192019e-06, 'epoch': 1.4} {'loss': 0.6138, 'learning_rate': 4.1263856103503406e-06, 'epoch': 1.4} {'loss': 0.6073, 'learning_rate': 4.1261206798027775e-06, 'epoch': 1.4} {'loss': 0.74, 'learning_rate': 4.125855755549599e-06, 'epoch': 1.4} {'loss': 0.4705, 'learning_rate': 4.125590837591103e-06, 'epoch': 1.4} {'loss': 0.3594, 'learning_rate': 4.125325925927564e-06, 'epoch': 1.4} {'loss': 0.5854, 'learning_rate': 4.125061020559268e-06, 'epoch': 1.4} {'loss': 0.6767, 'learning_rate': 4.1247961214865015e-06, 'epoch': 1.4} {'loss': 0.4664, 'learning_rate': 4.12453122870954e-06, 'epoch': 1.4} {'loss': 0.6845, 'learning_rate': 4.1242663422286825e-06, 'epoch': 1.4} {'loss': 0.6201, 'learning_rate': 4.1240014620441984e-06, 'epoch': 1.4} {'loss': 0.5976, 'learning_rate': 4.1237365881563785e-06, 'epoch': 1.4} {'loss': 0.657, 'learning_rate': 4.123471720565504e-06, 'epoch': 1.4} {'loss': 0.4215, 'learning_rate': 4.12320685927186e-06, 'epoch': 1.4} {'loss': 0.3668, 'learning_rate': 4.122942004275734e-06, 'epoch': 1.4} {'loss': 0.552, 'learning_rate': 4.122677155577399e-06, 'epoch': 1.4} {'loss': 0.5867, 'learning_rate': 4.122412313177153e-06, 'epoch': 1.4} {'loss': 0.5025, 'learning_rate': 4.12214747707527e-06, 'epoch': 1.4} {'loss': 0.4301, 'learning_rate': 4.121882647272035e-06, 'epoch': 1.4} {'loss': 0.4302, 'learning_rate': 4.121617823767734e-06, 'epoch': 1.4} {'loss': 0.6188, 'learning_rate': 4.121353006562651e-06, 'epoch': 1.4} {'loss': 0.5674, 'learning_rate': 4.121088195657071e-06, 'epoch': 1.4} {'loss': 0.488, 'learning_rate': 4.120823391051269e-06, 'epoch': 1.4} {'loss': 0.5322, 'learning_rate': 4.120558592745543e-06, 'epoch': 1.4} {'loss': 0.5582, 'learning_rate': 4.120293800740164e-06, 'epoch': 1.4} {'loss': 0.5683, 'learning_rate': 4.1200290150354215e-06, 'epoch': 1.4} {'loss': 0.6158, 'learning_rate': 4.1197642356316036e-06, 'epoch': 1.4} {'loss': 0.6782, 'learning_rate': 4.119499462528981e-06, 'epoch': 1.4} {'loss': 0.4115, 'learning_rate': 4.119234695727852e-06, 'epoch': 1.4} {'loss': 0.6284, 'learning_rate': 4.11896993522849e-06, 'epoch': 1.4} {'loss': 0.4825, 'learning_rate': 4.118705181031184e-06, 'epoch': 1.4} {'loss': 0.4416, 'learning_rate': 4.118440433136215e-06, 'epoch': 1.4} {'loss': 0.4547, 'learning_rate': 4.118175691543869e-06, 'epoch': 1.4} {'loss': 0.5274, 'learning_rate': 4.11791095625443e-06, 'epoch': 1.4} {'loss': 0.4663, 'learning_rate': 4.117646227268176e-06, 'epoch': 1.4} {'loss': 0.4313, 'learning_rate': 4.1173815045854e-06, 'epoch': 1.4} {'loss': 0.5221, 'learning_rate': 4.117116788206378e-06, 'epoch': 1.4} {'loss': 0.5599, 'learning_rate': 4.116852078131397e-06, 'epoch': 1.4} {'loss': 0.5274, 'learning_rate': 4.1165873743607385e-06, 'epoch': 1.4} {'loss': 0.5834, 'learning_rate': 4.116322676894688e-06, 'epoch': 1.4} {'loss': 0.442, 'learning_rate': 4.116057985733534e-06, 'epoch': 1.4} {'loss': 0.4471, 'learning_rate': 4.115793300877549e-06, 'epoch': 1.4} {'loss': 0.5836, 'learning_rate': 4.115528622327024e-06, 'epoch': 1.4} {'loss': 0.5141, 'learning_rate': 4.115263950082241e-06, 'epoch': 1.4} {'loss': 0.4375, 'learning_rate': 4.114999284143484e-06, 'epoch': 1.4} {'loss': 0.5322, 'learning_rate': 4.114734624511035e-06, 'epoch': 1.4} {'loss': 0.6854, 'learning_rate': 4.11446997118518e-06, 'epoch': 1.4} {'loss': 0.5161, 'learning_rate': 4.114205324166206e-06, 'epoch': 1.4} {'loss': 0.3976, 'learning_rate': 4.1139406834543874e-06, 'epoch': 1.4} {'loss': 0.6385, 'learning_rate': 4.113676049050013e-06, 'epoch': 1.4} {'loss': 0.5385, 'learning_rate': 4.113411420953366e-06, 'epoch': 1.4} {'loss': 0.5192, 'learning_rate': 4.11314679916473e-06, 'epoch': 1.4} {'loss': 0.3094, 'learning_rate': 4.112882183684389e-06, 'epoch': 1.4} {'loss': 0.5725, 'learning_rate': 4.112617574512625e-06, 'epoch': 1.4} {'loss': 0.5355, 'learning_rate': 4.112352971649728e-06, 'epoch': 1.4} {'loss': 0.6459, 'learning_rate': 4.11208837509597e-06, 'epoch': 1.4} {'loss': 0.6173, 'learning_rate': 4.1118237848516426e-06, 'epoch': 1.4} {'loss': 0.4998, 'learning_rate': 4.111559200917028e-06, 'epoch': 1.4} {'loss': 0.5308, 'learning_rate': 4.111294623292408e-06, 'epoch': 1.4} {'loss': 0.5263, 'learning_rate': 4.111030051978068e-06, 'epoch': 1.4} {'loss': 0.5136, 'learning_rate': 4.110765486974293e-06, 'epoch': 1.4} {'loss': 0.2924, 'learning_rate': 4.110500928281362e-06, 'epoch': 1.4} {'loss': 0.4753, 'learning_rate': 4.110236375899561e-06, 'epoch': 1.4} {'loss': 0.5024, 'learning_rate': 4.109971829829172e-06, 'epoch': 1.4} {'loss': 0.5446, 'learning_rate': 4.109707290070481e-06, 'epoch': 1.4} {'loss': 0.6363, 'learning_rate': 4.109442756623769e-06, 'epoch': 1.4} {'loss': 0.4441, 'learning_rate': 4.1091782294893226e-06, 'epoch': 1.4} {'loss': 0.4818, 'learning_rate': 4.1089137086674255e-06, 'epoch': 1.4} {'loss': 0.5405, 'learning_rate': 4.1086491941583565e-06, 'epoch': 1.4} {'loss': 0.5044, 'learning_rate': 4.108384685962401e-06, 'epoch': 1.4} {'loss': 0.5494, 'learning_rate': 4.108120184079843e-06, 'epoch': 1.4} {'loss': 0.4479, 'learning_rate': 4.107855688510967e-06, 'epoch': 1.4} {'loss': 0.599, 'learning_rate': 4.107591199256053e-06, 'epoch': 1.4} {'loss': 0.5591, 'learning_rate': 4.10732671631539e-06, 'epoch': 1.4} {'loss': 0.5276, 'learning_rate': 4.107062239689259e-06, 'epoch': 1.4} {'loss': 0.3459, 'learning_rate': 4.10679776937794e-06, 'epoch': 1.4} {'loss': 0.4674, 'learning_rate': 4.10653330538172e-06, 'epoch': 1.4} {'loss': 0.5893, 'learning_rate': 4.106268847700882e-06, 'epoch': 1.4} {'loss': 0.6793, 'learning_rate': 4.106004396335707e-06, 'epoch': 1.4} {'loss': 0.5039, 'learning_rate': 4.1057399512864844e-06, 'epoch': 1.4} {'loss': 0.4435, 'learning_rate': 4.105475512553487e-06, 'epoch': 1.4} {'loss': 0.4329, 'learning_rate': 4.1052110801370114e-06, 'epoch': 1.4} {'loss': 0.6174, 'learning_rate': 4.104946654037331e-06, 'epoch': 1.4} {'loss': 0.5909, 'learning_rate': 4.104682234254731e-06, 'epoch': 1.4} {'loss': 0.3928, 'learning_rate': 4.104417820789497e-06, 'epoch': 1.4} {'loss': 0.6029, 'learning_rate': 4.104153413641911e-06, 'epoch': 1.4} {'loss': 0.4405, 'learning_rate': 4.103889012812261e-06, 'epoch': 1.4} {'loss': 0.4763, 'learning_rate': 4.103624618300819e-06, 'epoch': 1.4} {'loss': 0.5068, 'learning_rate': 4.103360230107881e-06, 'epoch': 1.4} {'loss': 0.5197, 'learning_rate': 4.1030958482337226e-06, 'epoch': 1.4} {'loss': 0.438, 'learning_rate': 4.102831472678629e-06, 'epoch': 1.4} {'loss': 0.3636, 'learning_rate': 4.102567103442884e-06, 'epoch': 1.4} {'loss': 0.4237, 'learning_rate': 4.1023027405267705e-06, 'epoch': 1.4} {'loss': 0.5105, 'learning_rate': 4.102038383930575e-06, 'epoch': 1.4} {'loss': 0.7039, 'learning_rate': 4.101774033654574e-06, 'epoch': 1.4} {'loss': 0.6242, 'learning_rate': 4.101509689699055e-06, 'epoch': 1.4} {'loss': 0.466, 'learning_rate': 4.1012453520643e-06, 'epoch': 1.4} {'loss': 0.4018, 'learning_rate': 4.100981020750594e-06, 'epoch': 1.4} {'loss': 0.3514, 'learning_rate': 4.100716695758222e-06, 'epoch': 1.4} {'loss': 0.5579, 'learning_rate': 4.100452377087458e-06, 'epoch': 1.4} {'loss': 0.4268, 'learning_rate': 4.100188064738598e-06, 'epoch': 1.4} {'loss': 0.5091, 'learning_rate': 4.099923758711917e-06, 'epoch': 1.4} {'loss': 0.66, 'learning_rate': 4.099659459007699e-06, 'epoch': 1.4} {'loss': 0.5547, 'learning_rate': 4.099395165626229e-06, 'epoch': 1.4} {'loss': 0.4806, 'learning_rate': 4.099130878567789e-06, 'epoch': 1.4} {'loss': 0.6189, 'learning_rate': 4.098866597832666e-06, 'epoch': 1.4} {'loss': 0.5434, 'learning_rate': 4.098602323421134e-06, 'epoch': 1.4} {'loss': 0.6728, 'learning_rate': 4.0983380553334895e-06, 'epoch': 1.4} {'loss': 0.4294, 'learning_rate': 4.098073793570004e-06, 'epoch': 1.4} {'loss': 0.5284, 'learning_rate': 4.097809538130965e-06, 'epoch': 1.4} {'loss': 0.4798, 'learning_rate': 4.0975452890166565e-06, 'epoch': 1.4} {'loss': 0.5827, 'learning_rate': 4.09728104622736e-06, 'epoch': 1.4} {'loss': 0.3693, 'learning_rate': 4.097016809763364e-06, 'epoch': 1.4} {'loss': 0.487, 'learning_rate': 4.09675257962494e-06, 'epoch': 1.4} {'loss': 0.4857, 'learning_rate': 4.096488355812387e-06, 'epoch': 1.4} {'loss': 0.4693, 'learning_rate': 4.096224138325974e-06, 'epoch': 1.4} {'loss': 0.5496, 'learning_rate': 4.09595992716599e-06, 'epoch': 1.4} {'loss': 0.5382, 'learning_rate': 4.095695722332722e-06, 'epoch': 1.4} {'loss': 0.5618, 'learning_rate': 4.095431523826441e-06, 'epoch': 1.4} {'loss': 0.4666, 'learning_rate': 4.095167331647446e-06, 'epoch': 1.4} {'loss': 0.4659, 'learning_rate': 4.0949031457960045e-06, 'epoch': 1.4} {'loss': 0.5667, 'learning_rate': 4.094638966272414e-06, 'epoch': 1.4} {'loss': 0.5555, 'learning_rate': 4.094374793076948e-06, 'epoch': 1.4} {'loss': 0.5144, 'learning_rate': 4.094110626209893e-06, 'epoch': 1.4} {'loss': 0.5138, 'learning_rate': 4.093846465671534e-06, 'epoch': 1.4} {'loss': 0.5787, 'learning_rate': 4.0935823114621445e-06, 'epoch': 1.4} {'loss': 0.4316, 'learning_rate': 4.093318163582022e-06, 'epoch': 1.4} {'loss': 0.6437, 'learning_rate': 4.093054022031435e-06, 'epoch': 1.4} {'loss': 0.4219, 'learning_rate': 4.092789886810681e-06, 'epoch': 1.4} {'loss': 0.6291, 'learning_rate': 4.0925257579200315e-06, 'epoch': 1.4} {'loss': 0.6218, 'learning_rate': 4.092261635359775e-06, 'epoch': 1.4} {'loss': 0.5758, 'learning_rate': 4.0919975191301965e-06, 'epoch': 1.4} {'loss': 0.5326, 'learning_rate': 4.091733409231568e-06, 'epoch': 1.4} {'loss': 0.4369, 'learning_rate': 4.091469305664189e-06, 'epoch': 1.4} {'loss': 0.573, 'learning_rate': 4.091205208428326e-06, 'epoch': 1.4} {'loss': 0.53, 'learning_rate': 4.090941117524278e-06, 'epoch': 1.4} {'loss': 0.4667, 'learning_rate': 4.090677032952315e-06, 'epoch': 1.4} {'loss': 0.4534, 'learning_rate': 4.090412954712725e-06, 'epoch': 1.4} {'loss': 0.4954, 'learning_rate': 4.090148882805794e-06, 'epoch': 1.4} {'loss': 0.5509, 'learning_rate': 4.089884817231796e-06, 'epoch': 1.4} {'loss': 0.5197, 'learning_rate': 4.0896207579910264e-06, 'epoch': 1.4} {'loss': 0.5106, 'learning_rate': 4.089356705083755e-06, 'epoch': 1.4} {'loss': 0.5167, 'learning_rate': 4.089092658510278e-06, 'epoch': 1.4} {'loss': 0.577, 'learning_rate': 4.088828618270868e-06, 'epoch': 1.4} {'loss': 0.5214, 'learning_rate': 4.088564584365812e-06, 'epoch': 1.4} {'loss': 0.4262, 'learning_rate': 4.088300556795396e-06, 'epoch': 1.4} {'loss': 0.5653, 'learning_rate': 4.088036535559892e-06, 'epoch': 1.4} {'loss': 0.6261, 'learning_rate': 4.0877725206595984e-06, 'epoch': 1.4} {'loss': 0.673, 'learning_rate': 4.087508512094785e-06, 'epoch': 1.4} {'loss': 0.5699, 'learning_rate': 4.087244509865742e-06, 'epoch': 1.4} {'loss': 0.5801, 'learning_rate': 4.0869805139727495e-06, 'epoch': 1.4} {'loss': 0.5875, 'learning_rate': 4.08671652441609e-06, 'epoch': 1.4} {'loss': 0.6224, 'learning_rate': 4.086452541196052e-06, 'epoch': 1.4} {'loss': 0.6044, 'learning_rate': 4.086188564312906e-06, 'epoch': 1.4} {'loss': 0.5076, 'learning_rate': 4.085924593766951e-06, 'epoch': 1.4} {'loss': 0.4314, 'learning_rate': 4.085660629558456e-06, 'epoch': 1.4} {'loss': 0.635, 'learning_rate': 4.085396671687711e-06, 'epoch': 1.4} {'loss': 0.5305, 'learning_rate': 4.085132720154999e-06, 'epoch': 1.4} {'loss': 0.6951, 'learning_rate': 4.084868774960597e-06, 'epoch': 1.4} {'loss': 0.7753, 'learning_rate': 4.084604836104798e-06, 'epoch': 1.4} {'loss': 0.4025, 'learning_rate': 4.084340903587872e-06, 'epoch': 1.4} {'loss': 0.5806, 'learning_rate': 4.084076977410115e-06, 'epoch': 1.4} {'loss': 0.4708, 'learning_rate': 4.083813057571801e-06, 'epoch': 1.4} {'loss': 0.5204, 'learning_rate': 4.083549144073214e-06, 'epoch': 1.4} {'loss': 0.4605, 'learning_rate': 4.083285236914638e-06, 'epoch': 1.4} {'loss': 0.5527, 'learning_rate': 4.083021336096357e-06, 'epoch': 1.4} {'loss': 0.5316, 'learning_rate': 4.082757441618655e-06, 'epoch': 1.4} {'loss': 0.5373, 'learning_rate': 4.08249355348181e-06, 'epoch': 1.4} {'loss': 0.4102, 'learning_rate': 4.082229671686106e-06, 'epoch': 1.41} {'loss': 0.5101, 'learning_rate': 4.081965796231828e-06, 'epoch': 1.41} {'loss': 0.3439, 'learning_rate': 4.081701927119258e-06, 'epoch': 1.41} {'loss': 0.5429, 'learning_rate': 4.081438064348677e-06, 'epoch': 1.41} {'loss': 0.6532, 'learning_rate': 4.081174207920371e-06, 'epoch': 1.41} {'loss': 0.5039, 'learning_rate': 4.080910357834624e-06, 'epoch': 1.41} {'loss': 0.5248, 'learning_rate': 4.080646514091712e-06, 'epoch': 1.41} {'loss': 0.4577, 'learning_rate': 4.080382676691922e-06, 'epoch': 1.41} {'loss': 0.5088, 'learning_rate': 4.080118845635535e-06, 'epoch': 1.41} {'loss': 0.4587, 'learning_rate': 4.079855020922837e-06, 'epoch': 1.41} {'loss': 0.5286, 'learning_rate': 4.079591202554111e-06, 'epoch': 1.41} {'loss': 0.5131, 'learning_rate': 4.079327390529631e-06, 'epoch': 1.41} {'loss': 0.4862, 'learning_rate': 4.0790635848496914e-06, 'epoch': 1.41} {'loss': 0.5099, 'learning_rate': 4.078799785514568e-06, 'epoch': 1.41} {'loss': 0.6559, 'learning_rate': 4.078535992524544e-06, 'epoch': 1.41} {'loss': 0.5594, 'learning_rate': 4.078272205879903e-06, 'epoch': 1.41} {'loss': 0.5789, 'learning_rate': 4.078008425580928e-06, 'epoch': 1.41} {'loss': 0.4048, 'learning_rate': 4.077744651627907e-06, 'epoch': 1.41} {'loss': 0.4903, 'learning_rate': 4.07748088402111e-06, 'epoch': 1.41} {'loss': 0.5048, 'learning_rate': 4.077217122760829e-06, 'epoch': 1.41} {'loss': 0.5155, 'learning_rate': 4.076953367847344e-06, 'epoch': 1.41} {'loss': 0.5104, 'learning_rate': 4.076689619280938e-06, 'epoch': 1.41} {'loss': 0.6035, 'learning_rate': 4.076425877061894e-06, 'epoch': 1.41} {'loss': 0.6574, 'learning_rate': 4.076162141190494e-06, 'epoch': 1.41} {'loss': 0.5331, 'learning_rate': 4.0758984116670245e-06, 'epoch': 1.41} {'loss': 0.5229, 'learning_rate': 4.075634688491761e-06, 'epoch': 1.41} {'loss': 0.4955, 'learning_rate': 4.075370971664989e-06, 'epoch': 1.41} {'loss': 0.5109, 'learning_rate': 4.075107261186992e-06, 'epoch': 1.41} {'loss': 0.6672, 'learning_rate': 4.074843557058054e-06, 'epoch': 1.41} {'loss': 0.6189, 'learning_rate': 4.074579859278453e-06, 'epoch': 1.41} {'loss': 0.5603, 'learning_rate': 4.074316167848476e-06, 'epoch': 1.41} {'loss': 0.4481, 'learning_rate': 4.074052482768408e-06, 'epoch': 1.41} {'loss': 0.3513, 'learning_rate': 4.073788804038524e-06, 'epoch': 1.41} {'loss': 0.6107, 'learning_rate': 4.073525131659111e-06, 'epoch': 1.41} {'loss': 0.4894, 'learning_rate': 4.073261465630449e-06, 'epoch': 1.41} {'loss': 0.4977, 'learning_rate': 4.072997805952823e-06, 'epoch': 1.41} {'loss': 0.5103, 'learning_rate': 4.072734152626514e-06, 'epoch': 1.41} {'loss': 0.3871, 'learning_rate': 4.07247050565181e-06, 'epoch': 1.41} {'loss': 0.3207, 'learning_rate': 4.072206865028985e-06, 'epoch': 1.41} {'loss': 0.4197, 'learning_rate': 4.071943230758325e-06, 'epoch': 1.41} {'loss': 0.4703, 'learning_rate': 4.0716796028401125e-06, 'epoch': 1.41} {'loss': 0.4755, 'learning_rate': 4.071415981274631e-06, 'epoch': 1.41} {'loss': 0.443, 'learning_rate': 4.071152366062163e-06, 'epoch': 1.41} {'loss': 0.5897, 'learning_rate': 4.07088875720299e-06, 'epoch': 1.41} {'loss': 0.4839, 'learning_rate': 4.070625154697397e-06, 'epoch': 1.41} {'loss': 0.5895, 'learning_rate': 4.0703615585456626e-06, 'epoch': 1.41} {'loss': 0.262, 'learning_rate': 4.07009796874807e-06, 'epoch': 1.41} {'loss': 0.4245, 'learning_rate': 4.069834385304902e-06, 'epoch': 1.41} {'loss': 0.5855, 'learning_rate': 4.069570808216443e-06, 'epoch': 1.41} {'loss': 0.5019, 'learning_rate': 4.0693072374829765e-06, 'epoch': 1.41} {'loss': 0.5183, 'learning_rate': 4.069043673104777e-06, 'epoch': 1.41} {'loss': 0.3774, 'learning_rate': 4.068780115082138e-06, 'epoch': 1.41} {'loss': 0.5316, 'learning_rate': 4.068516563415334e-06, 'epoch': 1.41} {'loss': 0.4963, 'learning_rate': 4.06825301810465e-06, 'epoch': 1.41} {'loss': 0.6027, 'learning_rate': 4.067989479150367e-06, 'epoch': 1.41} {'loss': 0.4434, 'learning_rate': 4.067725946552769e-06, 'epoch': 1.41} {'loss': 0.5421, 'learning_rate': 4.067462420312143e-06, 'epoch': 1.41} {'loss': 0.6135, 'learning_rate': 4.067198900428758e-06, 'epoch': 1.41} {'loss': 0.4947, 'learning_rate': 4.066935386902913e-06, 'epoch': 1.41} {'loss': 0.584, 'learning_rate': 4.066671879734878e-06, 'epoch': 1.41} {'loss': 0.5239, 'learning_rate': 4.06640837892494e-06, 'epoch': 1.41} {'loss': 0.4524, 'learning_rate': 4.06614488447338e-06, 'epoch': 1.41} {'loss': 0.5441, 'learning_rate': 4.065881396380482e-06, 'epoch': 1.41} {'loss': 0.6519, 'learning_rate': 4.065617914646531e-06, 'epoch': 1.41} {'loss': 0.4901, 'learning_rate': 4.065354439271799e-06, 'epoch': 1.41} {'loss': 0.6065, 'learning_rate': 4.065090970256582e-06, 'epoch': 1.41} {'loss': 0.4978, 'learning_rate': 4.064827507601153e-06, 'epoch': 1.41} {'loss': 0.5374, 'learning_rate': 4.064564051305797e-06, 'epoch': 1.41} {'loss': 0.5364, 'learning_rate': 4.064300601370799e-06, 'epoch': 1.41} {'loss': 0.4431, 'learning_rate': 4.0640371577964324e-06, 'epoch': 1.41} {'loss': 0.5234, 'learning_rate': 4.063773720582992e-06, 'epoch': 1.41} {'loss': 0.6159, 'learning_rate': 4.063510289730748e-06, 'epoch': 1.41} {'loss': 0.5659, 'learning_rate': 4.0632468652399945e-06, 'epoch': 1.41} {'loss': 0.578, 'learning_rate': 4.062983447111004e-06, 'epoch': 1.41} {'loss': 0.3379, 'learning_rate': 4.062720035344063e-06, 'epoch': 1.41} {'loss': 0.4213, 'learning_rate': 4.0624566299394576e-06, 'epoch': 1.41} {'loss': 0.5089, 'learning_rate': 4.0621932308974586e-06, 'epoch': 1.41} {'loss': 0.3965, 'learning_rate': 4.061929838218362e-06, 'epoch': 1.41} {'loss': 0.6082, 'learning_rate': 4.0616664519024365e-06, 'epoch': 1.41} {'loss': 0.4346, 'learning_rate': 4.061403071949978e-06, 'epoch': 1.41} {'loss': 0.5033, 'learning_rate': 4.061139698361259e-06, 'epoch': 1.41} {'loss': 0.4729, 'learning_rate': 4.0608763311365664e-06, 'epoch': 1.41} {'loss': 0.4944, 'learning_rate': 4.060612970276182e-06, 'epoch': 1.41} {'loss': 0.4868, 'learning_rate': 4.060349615780382e-06, 'epoch': 1.41} {'loss': 0.6031, 'learning_rate': 4.060086267649458e-06, 'epoch': 1.41} {'loss': 0.6167, 'learning_rate': 4.0598229258836855e-06, 'epoch': 1.41} {'loss': 0.6734, 'learning_rate': 4.0595595904833486e-06, 'epoch': 1.41} {'loss': 0.6365, 'learning_rate': 4.059296261448731e-06, 'epoch': 1.41} {'loss': 0.5068, 'learning_rate': 4.059032938780112e-06, 'epoch': 1.41} {'loss': 0.4388, 'learning_rate': 4.058769622477779e-06, 'epoch': 1.41} {'loss': 0.621, 'learning_rate': 4.058506312542005e-06, 'epoch': 1.41} {'loss': 0.517, 'learning_rate': 4.058243008973083e-06, 'epoch': 1.41} {'loss': 0.4709, 'learning_rate': 4.057979711771287e-06, 'epoch': 1.41} {'loss': 0.6026, 'learning_rate': 4.057716420936902e-06, 'epoch': 1.41} {'loss': 0.5428, 'learning_rate': 4.057453136470211e-06, 'epoch': 1.41} {'loss': 0.519, 'learning_rate': 4.057189858371495e-06, 'epoch': 1.41} {'loss': 0.6631, 'learning_rate': 4.05692658664104e-06, 'epoch': 1.41} {'loss': 0.4773, 'learning_rate': 4.056663321279116e-06, 'epoch': 1.41} {'loss': 0.533, 'learning_rate': 4.056400062286022e-06, 'epoch': 1.41} {'loss': 0.6968, 'learning_rate': 4.056136809662029e-06, 'epoch': 1.41} {'loss': 0.5179, 'learning_rate': 4.055873563407421e-06, 'epoch': 1.41} {'loss': 0.5554, 'learning_rate': 4.055610323522484e-06, 'epoch': 1.41} {'loss': 0.4092, 'learning_rate': 4.055347090007491e-06, 'epoch': 1.41} {'loss': 0.4908, 'learning_rate': 4.0550838628627366e-06, 'epoch': 1.41} {'loss': 0.4788, 'learning_rate': 4.054820642088489e-06, 'epoch': 1.41} {'loss': 0.5797, 'learning_rate': 4.054557427685046e-06, 'epoch': 1.41} {'loss': 0.4986, 'learning_rate': 4.054294219652677e-06, 'epoch': 1.41} {'loss': 0.486, 'learning_rate': 4.054031017991669e-06, 'epoch': 1.41} {'loss': 0.5068, 'learning_rate': 4.053767822702306e-06, 'epoch': 1.41} {'loss': 0.5859, 'learning_rate': 4.05350463378486e-06, 'epoch': 1.41} {'loss': 0.527, 'learning_rate': 4.053241451239629e-06, 'epoch': 1.41} {'loss': 0.4638, 'learning_rate': 4.0529782750668775e-06, 'epoch': 1.41} {'loss': 0.5619, 'learning_rate': 4.052715105266905e-06, 'epoch': 1.41} {'loss': 0.4713, 'learning_rate': 4.052451941839982e-06, 'epoch': 1.41} {'loss': 0.5108, 'learning_rate': 4.052188784786393e-06, 'epoch': 1.41} {'loss': 0.5416, 'learning_rate': 4.051925634106424e-06, 'epoch': 1.41} {'loss': 0.4504, 'learning_rate': 4.0516624898003465e-06, 'epoch': 1.41} {'loss': 0.3888, 'learning_rate': 4.051399351868456e-06, 'epoch': 1.41} {'loss': 0.6356, 'learning_rate': 4.051136220311022e-06, 'epoch': 1.41} {'loss': 0.4689, 'learning_rate': 4.050873095128338e-06, 'epoch': 1.41} {'loss': 0.5312, 'learning_rate': 4.050609976320679e-06, 'epoch': 1.41} {'loss': 0.6267, 'learning_rate': 4.050346863888327e-06, 'epoch': 1.41} {'loss': 0.596, 'learning_rate': 4.0500837578315685e-06, 'epoch': 1.41} {'loss': 0.5354, 'learning_rate': 4.049820658150676e-06, 'epoch': 1.41} {'loss': 0.6015, 'learning_rate': 4.049557564845944e-06, 'epoch': 1.41} {'loss': 0.5029, 'learning_rate': 4.0492944779176455e-06, 'epoch': 1.41} {'loss': 0.5981, 'learning_rate': 4.049031397366065e-06, 'epoch': 1.41} {'loss': 0.5537, 'learning_rate': 4.048768323191484e-06, 'epoch': 1.41} {'loss': 0.5866, 'learning_rate': 4.048505255394185e-06, 'epoch': 1.41} {'loss': 0.4571, 'learning_rate': 4.0482421939744535e-06, 'epoch': 1.41} {'loss': 0.5516, 'learning_rate': 4.04797913893256e-06, 'epoch': 1.41} {'loss': 0.4458, 'learning_rate': 4.047716090268802e-06, 'epoch': 1.41} {'loss': 0.6076, 'learning_rate': 4.0474530479834495e-06, 'epoch': 1.41} {'loss': 0.5224, 'learning_rate': 4.047190012076788e-06, 'epoch': 1.41} {'loss': 0.6056, 'learning_rate': 4.0469269825491e-06, 'epoch': 1.41} {'loss': 0.5147, 'learning_rate': 4.046663959400666e-06, 'epoch': 1.41} {'loss': 0.5646, 'learning_rate': 4.046400942631774e-06, 'epoch': 1.41} {'loss': 0.4409, 'learning_rate': 4.046137932242696e-06, 'epoch': 1.41} {'loss': 0.4914, 'learning_rate': 4.0458749282337195e-06, 'epoch': 1.41} {'loss': 0.4826, 'learning_rate': 4.045611930605126e-06, 'epoch': 1.41} {'loss': 0.5636, 'learning_rate': 4.045348939357195e-06, 'epoch': 1.41} {'loss': 0.5184, 'learning_rate': 4.045085954490211e-06, 'epoch': 1.41} {'loss': 0.6054, 'learning_rate': 4.0448229760044555e-06, 'epoch': 1.41} {'loss': 0.5546, 'learning_rate': 4.044560003900212e-06, 'epoch': 1.41} {'loss': 0.5274, 'learning_rate': 4.044297038177757e-06, 'epoch': 1.41} {'loss': 0.538, 'learning_rate': 4.044034078837374e-06, 'epoch': 1.41} {'loss': 0.474, 'learning_rate': 4.043771125879348e-06, 'epoch': 1.41} {'loss': 0.5682, 'learning_rate': 4.043508179303957e-06, 'epoch': 1.41} {'loss': 0.4789, 'learning_rate': 4.0432452391114865e-06, 'epoch': 1.41} {'loss': 0.5349, 'learning_rate': 4.042982305302215e-06, 'epoch': 1.41} {'loss': 0.5408, 'learning_rate': 4.042719377876431e-06, 'epoch': 1.41} {'loss': 0.4293, 'learning_rate': 4.042456456834405e-06, 'epoch': 1.41} {'loss': 0.6314, 'learning_rate': 4.042193542176426e-06, 'epoch': 1.41} {'loss': 0.4719, 'learning_rate': 4.0419306339027735e-06, 'epoch': 1.41} {'loss': 0.4328, 'learning_rate': 4.041667732013731e-06, 'epoch': 1.41} {'loss': 0.4124, 'learning_rate': 4.0414048365095786e-06, 'epoch': 1.41} {'loss': 0.5245, 'learning_rate': 4.0411419473906024e-06, 'epoch': 1.41} {'loss': 0.6962, 'learning_rate': 4.0408790646570765e-06, 'epoch': 1.41} {'loss': 0.5655, 'learning_rate': 4.040616188309286e-06, 'epoch': 1.41} {'loss': 0.4576, 'learning_rate': 4.040353318347515e-06, 'epoch': 1.41} {'loss': 0.6114, 'learning_rate': 4.040090454772042e-06, 'epoch': 1.41} {'loss': 0.4961, 'learning_rate': 4.03982759758315e-06, 'epoch': 1.41} {'loss': 0.6368, 'learning_rate': 4.039564746781122e-06, 'epoch': 1.41} {'loss': 0.5325, 'learning_rate': 4.039301902366241e-06, 'epoch': 1.41} {'loss': 0.5475, 'learning_rate': 4.039039064338782e-06, 'epoch': 1.41} {'loss': 0.4665, 'learning_rate': 4.038776232699031e-06, 'epoch': 1.41} {'loss': 0.6162, 'learning_rate': 4.0385134074472685e-06, 'epoch': 1.41} {'loss': 0.4688, 'learning_rate': 4.038250588583778e-06, 'epoch': 1.41} {'loss': 0.6434, 'learning_rate': 4.03798777610884e-06, 'epoch': 1.41} {'loss': 0.6486, 'learning_rate': 4.0377249700227395e-06, 'epoch': 1.41} {'loss': 0.6718, 'learning_rate': 4.037462170325751e-06, 'epoch': 1.41} {'loss': 0.5015, 'learning_rate': 4.03719937701816e-06, 'epoch': 1.41} {'loss': 0.5286, 'learning_rate': 4.036936590100249e-06, 'epoch': 1.41} {'loss': 0.5459, 'learning_rate': 4.036673809572298e-06, 'epoch': 1.41} {'loss': 0.3813, 'learning_rate': 4.03641103543459e-06, 'epoch': 1.41} {'loss': 0.5569, 'learning_rate': 4.036148267687407e-06, 'epoch': 1.41} {'loss': 0.5754, 'learning_rate': 4.0358855063310284e-06, 'epoch': 1.41} {'loss': 0.3351, 'learning_rate': 4.035622751365735e-06, 'epoch': 1.41} {'loss': 0.4403, 'learning_rate': 4.035360002791811e-06, 'epoch': 1.41} {'loss': 0.4767, 'learning_rate': 4.035097260609537e-06, 'epoch': 1.41} {'loss': 0.5664, 'learning_rate': 4.034834524819195e-06, 'epoch': 1.41} {'loss': 0.5886, 'learning_rate': 4.034571795421066e-06, 'epoch': 1.41} {'loss': 0.4115, 'learning_rate': 4.034309072415435e-06, 'epoch': 1.41} {'loss': 0.6369, 'learning_rate': 4.034046355802578e-06, 'epoch': 1.41} {'loss': 0.4381, 'learning_rate': 4.033783645582777e-06, 'epoch': 1.41} {'loss': 0.5081, 'learning_rate': 4.033520941756316e-06, 'epoch': 1.41} {'loss': 0.4424, 'learning_rate': 4.033258244323476e-06, 'epoch': 1.41} {'loss': 0.602, 'learning_rate': 4.0329955532845375e-06, 'epoch': 1.41} {'loss': 0.5276, 'learning_rate': 4.032732868639784e-06, 'epoch': 1.41} {'loss': 0.427, 'learning_rate': 4.032470190389499e-06, 'epoch': 1.41} {'loss': 0.5396, 'learning_rate': 4.032207518533957e-06, 'epoch': 1.41} {'loss': 0.3495, 'learning_rate': 4.031944853073443e-06, 'epoch': 1.41} {'loss': 0.5495, 'learning_rate': 4.031682194008239e-06, 'epoch': 1.41} {'loss': 0.481, 'learning_rate': 4.031419541338626e-06, 'epoch': 1.41} {'loss': 0.5579, 'learning_rate': 4.031156895064889e-06, 'epoch': 1.41} {'loss': 0.5169, 'learning_rate': 4.0308942551873e-06, 'epoch': 1.41} {'loss': 0.5277, 'learning_rate': 4.030631621706154e-06, 'epoch': 1.41} {'loss': 0.6186, 'learning_rate': 4.030368994621719e-06, 'epoch': 1.41} {'loss': 0.5459, 'learning_rate': 4.030106373934285e-06, 'epoch': 1.41} {'loss': 0.5925, 'learning_rate': 4.0298437596441296e-06, 'epoch': 1.41} {'loss': 0.6257, 'learning_rate': 4.029581151751536e-06, 'epoch': 1.41} {'loss': 0.5504, 'learning_rate': 4.029318550256788e-06, 'epoch': 1.41} {'loss': 0.4902, 'learning_rate': 4.0290559551601575e-06, 'epoch': 1.41} {'loss': 0.6057, 'learning_rate': 4.02879336646194e-06, 'epoch': 1.41} {'loss': 0.5021, 'learning_rate': 4.0285307841624045e-06, 'epoch': 1.41} {'loss': 0.7103, 'learning_rate': 4.028268208261837e-06, 'epoch': 1.41} {'loss': 0.5456, 'learning_rate': 4.02800563876052e-06, 'epoch': 1.41} {'loss': 0.5459, 'learning_rate': 4.027743075658734e-06, 'epoch': 1.41} {'loss': 0.5992, 'learning_rate': 4.027480518956764e-06, 'epoch': 1.41} {'loss': 0.5877, 'learning_rate': 4.02721796865488e-06, 'epoch': 1.41} {'loss': 0.5015, 'learning_rate': 4.02695542475338e-06, 'epoch': 1.41} {'loss': 0.5122, 'learning_rate': 4.02669288725253e-06, 'epoch': 1.41} {'loss': 0.4619, 'learning_rate': 4.02643035615262e-06, 'epoch': 1.41} {'loss': 0.4449, 'learning_rate': 4.026167831453931e-06, 'epoch': 1.41} {'loss': 0.4808, 'learning_rate': 4.025905313156735e-06, 'epoch': 1.41} {'loss': 0.6037, 'learning_rate': 4.025642801261329e-06, 'epoch': 1.41} {'loss': 0.6555, 'learning_rate': 4.025380295767979e-06, 'epoch': 1.41} {'loss': 0.5025, 'learning_rate': 4.02511779667698e-06, 'epoch': 1.41} {'loss': 0.5204, 'learning_rate': 4.024855303988602e-06, 'epoch': 1.41} {'loss': 0.6145, 'learning_rate': 4.0245928177031314e-06, 'epoch': 1.41} {'loss': 0.5558, 'learning_rate': 4.024330337820853e-06, 'epoch': 1.41} {'loss': 0.491, 'learning_rate': 4.024067864342036e-06, 'epoch': 1.41} {'loss': 0.4771, 'learning_rate': 4.0238053972669775e-06, 'epoch': 1.41} {'loss': 0.5295, 'learning_rate': 4.023542936595943e-06, 'epoch': 1.41} {'loss': 0.6968, 'learning_rate': 4.023280482329229e-06, 'epoch': 1.41} {'loss': 0.5376, 'learning_rate': 4.023018034467107e-06, 'epoch': 1.41} {'loss': 0.4094, 'learning_rate': 4.0227555930098595e-06, 'epoch': 1.41} {'loss': 0.4359, 'learning_rate': 4.022493157957773e-06, 'epoch': 1.41} {'loss': 0.4661, 'learning_rate': 4.022230729311117e-06, 'epoch': 1.41} {'loss': 0.5591, 'learning_rate': 4.021968307070188e-06, 'epoch': 1.41} {'loss': 0.6333, 'learning_rate': 4.021705891235251e-06, 'epoch': 1.41} {'loss': 0.6085, 'learning_rate': 4.021443481806604e-06, 'epoch': 1.41} {'loss': 0.4765, 'learning_rate': 4.021181078784516e-06, 'epoch': 1.41} {'loss': 0.4689, 'learning_rate': 4.0209186821692725e-06, 'epoch': 1.41} {'loss': 0.4856, 'learning_rate': 4.020656291961158e-06, 'epoch': 1.41} {'loss': 0.6617, 'learning_rate': 4.0203939081604424e-06, 'epoch': 1.41} {'loss': 0.4338, 'learning_rate': 4.020131530767422e-06, 'epoch': 1.41} {'loss': 0.4472, 'learning_rate': 4.019869159782366e-06, 'epoch': 1.41} {'loss': 0.4341, 'learning_rate': 4.01960679520556e-06, 'epoch': 1.41} {'loss': 0.5355, 'learning_rate': 4.0193444370372855e-06, 'epoch': 1.41} {'loss': 0.4788, 'learning_rate': 4.019082085277824e-06, 'epoch': 1.41} {'loss': 0.6317, 'learning_rate': 4.018819739927458e-06, 'epoch': 1.41} {'loss': 0.5775, 'learning_rate': 4.018557400986459e-06, 'epoch': 1.41} {'loss': 0.7058, 'learning_rate': 4.018295068455125e-06, 'epoch': 1.41} {'loss': 0.5015, 'learning_rate': 4.0180327423337215e-06, 'epoch': 1.41} {'loss': 0.6029, 'learning_rate': 4.017770422622537e-06, 'epoch': 1.41} {'loss': 0.5556, 'learning_rate': 4.017508109321853e-06, 'epoch': 1.41} {'loss': 0.6116, 'learning_rate': 4.017245802431947e-06, 'epoch': 1.41} {'loss': 0.4338, 'learning_rate': 4.016983501953105e-06, 'epoch': 1.41} {'loss': 0.4448, 'learning_rate': 4.0167212078856e-06, 'epoch': 1.41} {'loss': 0.5508, 'learning_rate': 4.016458920229724e-06, 'epoch': 1.41} {'loss': 0.5717, 'learning_rate': 4.0161966389857495e-06, 'epoch': 1.41} {'loss': 0.553, 'learning_rate': 4.015934364153961e-06, 'epoch': 1.41} {'loss': 0.4434, 'learning_rate': 4.0156720957346415e-06, 'epoch': 1.41} {'loss': 0.5304, 'learning_rate': 4.015409833728063e-06, 'epoch': 1.41} {'loss': 0.4818, 'learning_rate': 4.015147578134519e-06, 'epoch': 1.41} {'loss': 0.6506, 'learning_rate': 4.014885328954279e-06, 'epoch': 1.41} {'loss': 0.4948, 'learning_rate': 4.014623086187635e-06, 'epoch': 1.41} {'loss': 0.5615, 'learning_rate': 4.014360849834861e-06, 'epoch': 1.41} {'loss': 0.5446, 'learning_rate': 4.014098619896238e-06, 'epoch': 1.41} {'loss': 0.6664, 'learning_rate': 4.013836396372053e-06, 'epoch': 1.41} {'loss': 0.4358, 'learning_rate': 4.013574179262575e-06, 'epoch': 1.41} {'loss': 0.4906, 'learning_rate': 4.013311968568099e-06, 'epoch': 1.41} {'loss': 0.621, 'learning_rate': 4.013049764288897e-06, 'epoch': 1.41} {'loss': 0.773, 'learning_rate': 4.012787566425253e-06, 'epoch': 1.41} {'loss': 0.4725, 'learning_rate': 4.0125253749774464e-06, 'epoch': 1.41} {'loss': 0.508, 'learning_rate': 4.012263189945759e-06, 'epoch': 1.41} {'loss': 0.5545, 'learning_rate': 4.012001011330476e-06, 'epoch': 1.41} {'loss': 0.5912, 'learning_rate': 4.011738839131868e-06, 'epoch': 1.41} {'loss': 0.5309, 'learning_rate': 4.011476673350229e-06, 'epoch': 1.41} {'loss': 0.6547, 'learning_rate': 4.01121451398583e-06, 'epoch': 1.41} {'loss': 0.5926, 'learning_rate': 4.010952361038955e-06, 'epoch': 1.41} {'loss': 0.6602, 'learning_rate': 4.010690214509883e-06, 'epoch': 1.41} {'loss': 0.4425, 'learning_rate': 4.0104280743989e-06, 'epoch': 1.41} {'loss': 0.5574, 'learning_rate': 4.010165940706286e-06, 'epoch': 1.41} {'loss': 0.6209, 'learning_rate': 4.0099038134323134e-06, 'epoch': 1.41} {'loss': 0.6229, 'learning_rate': 4.009641692577276e-06, 'epoch': 1.41} {'loss': 0.5499, 'learning_rate': 4.009379578141445e-06, 'epoch': 1.41} {'loss': 0.6884, 'learning_rate': 4.0091174701251046e-06, 'epoch': 1.41} {'loss': 0.4563, 'learning_rate': 4.008855368528535e-06, 'epoch': 1.41} {'loss': 0.5373, 'learning_rate': 4.008593273352017e-06, 'epoch': 1.41} {'loss': 0.4033, 'learning_rate': 4.0083311845958376e-06, 'epoch': 1.41} {'loss': 0.4621, 'learning_rate': 4.008069102260267e-06, 'epoch': 1.41} {'loss': 0.6151, 'learning_rate': 4.007807026345592e-06, 'epoch': 1.41} {'loss': 0.5133, 'learning_rate': 4.007544956852092e-06, 'epoch': 1.41} {'loss': 0.6589, 'learning_rate': 4.007282893780048e-06, 'epoch': 1.41} {'loss': 0.3621, 'learning_rate': 4.007020837129743e-06, 'epoch': 1.41} {'loss': 0.7015, 'learning_rate': 4.0067587869014545e-06, 'epoch': 1.41} {'loss': 0.6098, 'learning_rate': 4.0064967430954685e-06, 'epoch': 1.41} {'loss': 0.5392, 'learning_rate': 4.006234705712059e-06, 'epoch': 1.41} {'loss': 0.5382, 'learning_rate': 4.0059726747515105e-06, 'epoch': 1.41} {'loss': 0.3968, 'learning_rate': 4.005710650214103e-06, 'epoch': 1.41} {'loss': 0.6015, 'learning_rate': 4.005448632100118e-06, 'epoch': 1.41} {'loss': 0.5744, 'learning_rate': 4.005186620409835e-06, 'epoch': 1.41} {'loss': 0.5374, 'learning_rate': 4.004924615143535e-06, 'epoch': 1.41} {'loss': 0.3797, 'learning_rate': 4.004662616301504e-06, 'epoch': 1.41} {'loss': 0.629, 'learning_rate': 4.004400623884014e-06, 'epoch': 1.41} {'loss': 0.4511, 'learning_rate': 4.00413863789135e-06, 'epoch': 1.41} {'loss': 0.5882, 'learning_rate': 4.003876658323793e-06, 'epoch': 1.41} {'loss': 0.4813, 'learning_rate': 4.003614685181622e-06, 'epoch': 1.41} {'loss': 0.5851, 'learning_rate': 4.003352718465121e-06, 'epoch': 1.41} {'loss': 0.516, 'learning_rate': 4.003090758174571e-06, 'epoch': 1.41} {'loss': 0.5404, 'learning_rate': 4.002828804310248e-06, 'epoch': 1.41} {'loss': 0.4406, 'learning_rate': 4.002566856872435e-06, 'epoch': 1.41} {'loss': 0.458, 'learning_rate': 4.002304915861412e-06, 'epoch': 1.41} {'loss': 0.6166, 'learning_rate': 4.002042981277462e-06, 'epoch': 1.41} {'loss': 0.5947, 'learning_rate': 4.001781053120863e-06, 'epoch': 1.41} {'loss': 0.5303, 'learning_rate': 4.001519131391897e-06, 'epoch': 1.41} {'loss': 0.602, 'learning_rate': 4.001257216090849e-06, 'epoch': 1.41} {'loss': 0.5514, 'learning_rate': 4.000995307217992e-06, 'epoch': 1.41} {'loss': 0.5044, 'learning_rate': 4.000733404773609e-06, 'epoch': 1.41} {'loss': 0.5529, 'learning_rate': 4.0004715087579815e-06, 'epoch': 1.41} {'loss': 0.5446, 'learning_rate': 4.000209619171391e-06, 'epoch': 1.41} {'loss': 0.4713, 'learning_rate': 3.999947736014122e-06, 'epoch': 1.41} {'loss': 0.5868, 'learning_rate': 3.999685859286441e-06, 'epoch': 1.41} {'loss': 0.4701, 'learning_rate': 3.999423988988646e-06, 'epoch': 1.41} {'loss': 0.5376, 'learning_rate': 3.9991621251210075e-06, 'epoch': 1.41} {'loss': 0.4624, 'learning_rate': 3.998900267683807e-06, 'epoch': 1.41} {'loss': 0.5753, 'learning_rate': 3.998638416677327e-06, 'epoch': 1.41} {'loss': 0.6366, 'learning_rate': 3.998376572101849e-06, 'epoch': 1.41} {'loss': 0.5684, 'learning_rate': 3.998114733957653e-06, 'epoch': 1.41} {'loss': 0.4152, 'learning_rate': 3.997852902245014e-06, 'epoch': 1.41} {'loss': 0.6623, 'learning_rate': 3.997591076964223e-06, 'epoch': 1.41} {'loss': 0.4923, 'learning_rate': 3.997329258115552e-06, 'epoch': 1.41} {'loss': 0.631, 'learning_rate': 3.997067445699284e-06, 'epoch': 1.41} {'loss': 0.5629, 'learning_rate': 3.996805639715701e-06, 'epoch': 1.41} {'loss': 0.4376, 'learning_rate': 3.996543840165081e-06, 'epoch': 1.41} {'loss': 0.5261, 'learning_rate': 3.996282047047712e-06, 'epoch': 1.41} {'loss': 0.528, 'learning_rate': 3.996020260363863e-06, 'epoch': 1.41} {'loss': 0.6103, 'learning_rate': 3.995758480113822e-06, 'epoch': 1.41} {'loss': 0.4832, 'learning_rate': 3.995496706297866e-06, 'epoch': 1.41} {'loss': 0.4707, 'learning_rate': 3.9952349389162785e-06, 'epoch': 1.41} {'loss': 0.5092, 'learning_rate': 3.9949731779693406e-06, 'epoch': 1.41} {'loss': 0.7002, 'learning_rate': 3.994711423457325e-06, 'epoch': 1.41} {'loss': 0.5082, 'learning_rate': 3.9944496753805254e-06, 'epoch': 1.41} {'loss': 0.5472, 'learning_rate': 3.994187933739211e-06, 'epoch': 1.41} {'loss': 0.5809, 'learning_rate': 3.993926198533667e-06, 'epoch': 1.41} {'loss': 0.4554, 'learning_rate': 3.993664469764171e-06, 'epoch': 1.41} {'loss': 0.4349, 'learning_rate': 3.993402747431008e-06, 'epoch': 1.41} {'loss': 0.5043, 'learning_rate': 3.9931410315344585e-06, 'epoch': 1.41} {'loss': 0.4632, 'learning_rate': 3.992879322074794e-06, 'epoch': 1.41} {'loss': 0.5009, 'learning_rate': 3.992617619052308e-06, 'epoch': 1.41} {'loss': 0.5788, 'learning_rate': 3.992355922467272e-06, 'epoch': 1.41} {'loss': 0.4528, 'learning_rate': 3.992094232319967e-06, 'epoch': 1.41} {'loss': 0.5763, 'learning_rate': 3.991832548610676e-06, 'epoch': 1.41} {'loss': 0.5128, 'learning_rate': 3.9915708713396805e-06, 'epoch': 1.41} {'loss': 0.5137, 'learning_rate': 3.991309200507261e-06, 'epoch': 1.41} {'loss': 0.3805, 'learning_rate': 3.991047536113689e-06, 'epoch': 1.41} {'loss': 0.5617, 'learning_rate': 3.990785878159259e-06, 'epoch': 1.41} {'loss': 0.6662, 'learning_rate': 3.990524226644241e-06, 'epoch': 1.41} {'loss': 0.4721, 'learning_rate': 3.990262581568919e-06, 'epoch': 1.41} {'loss': 0.414, 'learning_rate': 3.990000942933576e-06, 'epoch': 1.41} {'loss': 0.4624, 'learning_rate': 3.989739310738482e-06, 'epoch': 1.41} {'loss': 0.5499, 'learning_rate': 3.9894776849839326e-06, 'epoch': 1.41} {'loss': 0.46, 'learning_rate': 3.989216065670193e-06, 'epoch': 1.41} {'loss': 0.5717, 'learning_rate': 3.9889544527975575e-06, 'epoch': 1.41} {'loss': 0.4308, 'learning_rate': 3.988692846366298e-06, 'epoch': 1.41} {'loss': 0.5161, 'learning_rate': 3.988431246376695e-06, 'epoch': 1.41} {'loss': 0.4432, 'learning_rate': 3.988169652829033e-06, 'epoch': 1.41} {'loss': 0.5498, 'learning_rate': 3.987908065723586e-06, 'epoch': 1.41} {'loss': 0.3821, 'learning_rate': 3.987646485060643e-06, 'epoch': 1.41} {'loss': 0.4723, 'learning_rate': 3.9873849108404725e-06, 'epoch': 1.41} {'loss': 0.5771, 'learning_rate': 3.987123343063369e-06, 'epoch': 1.41} {'loss': 0.5099, 'learning_rate': 3.986861781729603e-06, 'epoch': 1.41} {'loss': 0.4803, 'learning_rate': 3.986600226839455e-06, 'epoch': 1.41} {'loss': 0.6336, 'learning_rate': 3.986338678393213e-06, 'epoch': 1.41} {'loss': 0.487, 'learning_rate': 3.9860771363911445e-06, 'epoch': 1.41} {'loss': 0.7184, 'learning_rate': 3.985815600833545e-06, 'epoch': 1.41} {'loss': 0.6142, 'learning_rate': 3.985554071720679e-06, 'epoch': 1.41} {'loss': 0.6217, 'learning_rate': 3.985292549052842e-06, 'epoch': 1.41} {'loss': 0.4726, 'learning_rate': 3.985031032830302e-06, 'epoch': 1.41} {'loss': 0.5132, 'learning_rate': 3.984769523053345e-06, 'epoch': 1.41} {'loss': 0.4874, 'learning_rate': 3.984508019722254e-06, 'epoch': 1.41} {'loss': 0.5924, 'learning_rate': 3.984246522837299e-06, 'epoch': 1.41} {'loss': 0.5489, 'learning_rate': 3.983985032398773e-06, 'epoch': 1.41} {'loss': 0.5812, 'learning_rate': 3.983723548406943e-06, 'epoch': 1.41} {'loss': 0.4316, 'learning_rate': 3.983462070862104e-06, 'epoch': 1.41} {'loss': 0.4875, 'learning_rate': 3.983200599764525e-06, 'epoch': 1.41} {'loss': 0.5819, 'learning_rate': 3.982939135114489e-06, 'epoch': 1.41} {'loss': 0.6334, 'learning_rate': 3.98267767691228e-06, 'epoch': 1.41} {'loss': 0.6055, 'learning_rate': 3.982416225158169e-06, 'epoch': 1.41} {'loss': 0.4593, 'learning_rate': 3.982154779852448e-06, 'epoch': 1.41} {'loss': 0.5078, 'learning_rate': 3.981893340995386e-06, 'epoch': 1.41} {'loss': 0.5231, 'learning_rate': 3.981631908587274e-06, 'epoch': 1.41} {'loss': 0.6013, 'learning_rate': 3.981370482628382e-06, 'epoch': 1.41} {'loss': 0.6901, 'learning_rate': 3.981109063118997e-06, 'epoch': 1.41} {'loss': 0.529, 'learning_rate': 3.9808476500594e-06, 'epoch': 1.41} {'loss': 0.6283, 'learning_rate': 3.98058624344986e-06, 'epoch': 1.41} {'loss': 0.4835, 'learning_rate': 3.980324843290672e-06, 'epoch': 1.41} {'loss': 0.5588, 'learning_rate': 3.9800634495821065e-06, 'epoch': 1.41} {'loss': 0.5228, 'learning_rate': 3.979802062324447e-06, 'epoch': 1.41} {'loss': 0.4832, 'learning_rate': 3.979540681517972e-06, 'epoch': 1.41} {'loss': 0.4652, 'learning_rate': 3.979279307162963e-06, 'epoch': 1.41} {'loss': 0.4687, 'learning_rate': 3.979017939259703e-06, 'epoch': 1.41} {'loss': 0.4038, 'learning_rate': 3.978756577808461e-06, 'epoch': 1.41} {'loss': 0.5655, 'learning_rate': 3.978495222809533e-06, 'epoch': 1.41} {'loss': 0.6417, 'learning_rate': 3.978233874263187e-06, 'epoch': 1.41} {'loss': 0.5784, 'learning_rate': 3.977972532169706e-06, 'epoch': 1.41} {'loss': 0.5748, 'learning_rate': 3.9777111965293715e-06, 'epoch': 1.41} {'loss': 0.5289, 'learning_rate': 3.977449867342463e-06, 'epoch': 1.41} {'loss': 0.4487, 'learning_rate': 3.977188544609264e-06, 'epoch': 1.41} {'loss': 0.5214, 'learning_rate': 3.976927228330047e-06, 'epoch': 1.41} {'loss': 0.4527, 'learning_rate': 3.976665918505097e-06, 'epoch': 1.41} {'loss': 0.5171, 'learning_rate': 3.9764046151346936e-06, 'epoch': 1.41} {'loss': 0.5042, 'learning_rate': 3.976143318219115e-06, 'epoch': 1.41} {'loss': 0.5374, 'learning_rate': 3.975882027758643e-06, 'epoch': 1.41} {'loss': 0.5537, 'learning_rate': 3.975620743753558e-06, 'epoch': 1.41} {'loss': 0.5607, 'learning_rate': 3.975359466204142e-06, 'epoch': 1.41} {'loss': 0.4902, 'learning_rate': 3.975098195110668e-06, 'epoch': 1.41} {'loss': 0.3904, 'learning_rate': 3.97483693047342e-06, 'epoch': 1.41} {'loss': 0.4636, 'learning_rate': 3.9745756722926786e-06, 'epoch': 1.41} {'loss': 0.6068, 'learning_rate': 3.974314420568724e-06, 'epoch': 1.41} {'loss': 0.4544, 'learning_rate': 3.9740531753018375e-06, 'epoch': 1.41} {'loss': 0.4015, 'learning_rate': 3.973791936492289e-06, 'epoch': 1.41} {'loss': 0.3899, 'learning_rate': 3.973530704140376e-06, 'epoch': 1.41} {'loss': 0.5287, 'learning_rate': 3.973269478246363e-06, 'epoch': 1.41} {'loss': 0.3995, 'learning_rate': 3.973008258810537e-06, 'epoch': 1.41} {'loss': 0.4543, 'learning_rate': 3.972747045833176e-06, 'epoch': 1.41} {'loss': 0.5736, 'learning_rate': 3.972485839314561e-06, 'epoch': 1.41} {'loss': 0.5219, 'learning_rate': 3.972224639254975e-06, 'epoch': 1.41} {'loss': 0.6037, 'learning_rate': 3.971963445654691e-06, 'epoch': 1.41} {'loss': 0.6223, 'learning_rate': 3.9717022585139906e-06, 'epoch': 1.41} {'loss': 0.5334, 'learning_rate': 3.971441077833157e-06, 'epoch': 1.41} {'loss': 0.4903, 'learning_rate': 3.971179903612467e-06, 'epoch': 1.41} {'loss': 0.4881, 'learning_rate': 3.9709187358522035e-06, 'epoch': 1.41} {'loss': 0.4414, 'learning_rate': 3.9706575745526445e-06, 'epoch': 1.41} {'loss': 0.5032, 'learning_rate': 3.970396419714073e-06, 'epoch': 1.41} {'loss': 0.6226, 'learning_rate': 3.9701352713367626e-06, 'epoch': 1.41} {'loss': 0.6012, 'learning_rate': 3.969874129420996e-06, 'epoch': 1.41} {'loss': 0.6334, 'learning_rate': 3.969612993967055e-06, 'epoch': 1.41} {'loss': 0.5139, 'learning_rate': 3.969351864975216e-06, 'epoch': 1.41} {'loss': 0.5929, 'learning_rate': 3.9690907424457624e-06, 'epoch': 1.41} {'loss': 0.5585, 'learning_rate': 3.9688296263789716e-06, 'epoch': 1.41} {'loss': 0.4383, 'learning_rate': 3.968568516775128e-06, 'epoch': 1.41} {'loss': 0.5724, 'learning_rate': 3.968307413634503e-06, 'epoch': 1.41} {'loss': 0.4725, 'learning_rate': 3.9680463169573825e-06, 'epoch': 1.41} {'loss': 0.395, 'learning_rate': 3.967785226744044e-06, 'epoch': 1.41} {'loss': 0.5397, 'learning_rate': 3.9675241429947684e-06, 'epoch': 1.41} {'loss': 0.6292, 'learning_rate': 3.967263065709835e-06, 'epoch': 1.41} {'loss': 0.6356, 'learning_rate': 3.967001994889527e-06, 'epoch': 1.41} {'loss': 0.5561, 'learning_rate': 3.9667409305341175e-06, 'epoch': 1.41} {'loss': 0.5052, 'learning_rate': 3.966479872643891e-06, 'epoch': 1.41} {'loss': 0.3843, 'learning_rate': 3.966218821219123e-06, 'epoch': 1.41} {'loss': 0.3218, 'learning_rate': 3.965957776260098e-06, 'epoch': 1.41} {'loss': 0.4206, 'learning_rate': 3.965696737767094e-06, 'epoch': 1.41} {'loss': 0.5776, 'learning_rate': 3.96543570574039e-06, 'epoch': 1.41} {'loss': 0.5771, 'learning_rate': 3.96517468018027e-06, 'epoch': 1.41} {'loss': 0.4936, 'learning_rate': 3.964913661087007e-06, 'epoch': 1.41} {'loss': 0.5476, 'learning_rate': 3.964652648460883e-06, 'epoch': 1.41} {'loss': 0.4377, 'learning_rate': 3.964391642302178e-06, 'epoch': 1.41} {'loss': 0.4932, 'learning_rate': 3.964130642611172e-06, 'epoch': 1.41} {'loss': 0.5519, 'learning_rate': 3.963869649388146e-06, 'epoch': 1.41} {'loss': 0.6195, 'learning_rate': 3.963608662633378e-06, 'epoch': 1.41} {'loss': 0.3086, 'learning_rate': 3.963347682347152e-06, 'epoch': 1.41} {'loss': 0.5186, 'learning_rate': 3.963086708529739e-06, 'epoch': 1.41} {'loss': 0.6086, 'learning_rate': 3.962825741181426e-06, 'epoch': 1.41} {'loss': 0.6395, 'learning_rate': 3.962564780302487e-06, 'epoch': 1.41} {'loss': 0.6057, 'learning_rate': 3.962303825893206e-06, 'epoch': 1.41} {'loss': 0.501, 'learning_rate': 3.962042877953866e-06, 'epoch': 1.41} {'loss': 0.5227, 'learning_rate': 3.961781936484733e-06, 'epoch': 1.41} {'loss': 0.4792, 'learning_rate': 3.961521001486104e-06, 'epoch': 1.41} {'loss': 0.5379, 'learning_rate': 3.961260072958246e-06, 'epoch': 1.41} {'loss': 0.5124, 'learning_rate': 3.960999150901444e-06, 'epoch': 1.41} {'loss': 0.5691, 'learning_rate': 3.960738235315976e-06, 'epoch': 1.41} {'loss': 0.4594, 'learning_rate': 3.960477326202121e-06, 'epoch': 1.41} {'loss': 0.5474, 'learning_rate': 3.960216423560165e-06, 'epoch': 1.41} {'loss': 0.3897, 'learning_rate': 3.959955527390373e-06, 'epoch': 1.41} {'loss': 0.6773, 'learning_rate': 3.9596946376930435e-06, 'epoch': 1.41} {'loss': 0.3432, 'learning_rate': 3.9594337544684406e-06, 'epoch': 1.41} {'loss': 0.6427, 'learning_rate': 3.959172877716851e-06, 'epoch': 1.41} {'loss': 0.4853, 'learning_rate': 3.9589120074385525e-06, 'epoch': 1.41} {'loss': 0.4532, 'learning_rate': 3.958651143633824e-06, 'epoch': 1.41} {'loss': 0.5709, 'learning_rate': 3.958390286302951e-06, 'epoch': 1.41} {'loss': 0.5233, 'learning_rate': 3.9581294354462e-06, 'epoch': 1.41} {'loss': 0.5083, 'learning_rate': 3.957868591063866e-06, 'epoch': 1.41} {'loss': 0.4028, 'learning_rate': 3.957607753156217e-06, 'epoch': 1.41} {'loss': 0.4172, 'learning_rate': 3.9573469217235386e-06, 'epoch': 1.41} {'loss': 0.6169, 'learning_rate': 3.957086096766111e-06, 'epoch': 1.41} {'loss': 0.6075, 'learning_rate': 3.956825278284203e-06, 'epoch': 1.41} {'loss': 0.5736, 'learning_rate': 3.95656446627811e-06, 'epoch': 1.41} {'loss': 0.5297, 'learning_rate': 3.9563036607481e-06, 'epoch': 1.41} {'loss': 0.5423, 'learning_rate': 3.9560428616944555e-06, 'epoch': 1.41} {'loss': 0.3881, 'learning_rate': 3.955782069117458e-06, 'epoch': 1.42} {'loss': 0.541, 'learning_rate': 3.9555212830173835e-06, 'epoch': 1.42} {'loss': 0.5612, 'learning_rate': 3.955260503394519e-06, 'epoch': 1.42} {'loss': 0.4233, 'learning_rate': 3.954999730249131e-06, 'epoch': 1.42} {'loss': 0.4947, 'learning_rate': 3.954738963581512e-06, 'epoch': 1.42} {'loss': 0.6226, 'learning_rate': 3.954478203391934e-06, 'epoch': 1.42} {'loss': 0.4958, 'learning_rate': 3.954217449680678e-06, 'epoch': 1.42} {'loss': 0.5789, 'learning_rate': 3.953956702448023e-06, 'epoch': 1.42} {'loss': 0.4305, 'learning_rate': 3.953695961694249e-06, 'epoch': 1.42} {'loss': 0.5958, 'learning_rate': 3.95343522741964e-06, 'epoch': 1.42} {'loss': 0.5406, 'learning_rate': 3.953174499624463e-06, 'epoch': 1.42} {'loss': 0.6333, 'learning_rate': 3.9529137783090125e-06, 'epoch': 1.42} {'loss': 0.665, 'learning_rate': 3.9526530634735574e-06, 'epoch': 1.42} {'loss': 0.5382, 'learning_rate': 3.95239235511838e-06, 'epoch': 1.42} {'loss': 0.5761, 'learning_rate': 3.9521316532437636e-06, 'epoch': 1.42} {'loss': 0.4719, 'learning_rate': 3.951870957849977e-06, 'epoch': 1.42} {'loss': 0.6192, 'learning_rate': 3.951610268937314e-06, 'epoch': 1.42} {'loss': 0.5201, 'learning_rate': 3.951349586506038e-06, 'epoch': 1.42} {'loss': 0.6952, 'learning_rate': 3.9510889105564456e-06, 'epoch': 1.42} {'loss': 0.6119, 'learning_rate': 3.9508282410888036e-06, 'epoch': 1.42} {'loss': 0.5869, 'learning_rate': 3.950567578103394e-06, 'epoch': 1.42} {'loss': 0.4961, 'learning_rate': 3.950306921600501e-06, 'epoch': 1.42} {'loss': 0.5373, 'learning_rate': 3.950046271580393e-06, 'epoch': 1.42} {'loss': 0.5807, 'learning_rate': 3.949785628043365e-06, 'epoch': 1.42} {'loss': 0.5885, 'learning_rate': 3.9495249909896795e-06, 'epoch': 1.42} {'loss': 0.479, 'learning_rate': 3.949264360419631e-06, 'epoch': 1.42} {'loss': 0.7324, 'learning_rate': 3.94900373633349e-06, 'epoch': 1.42} {'loss': 0.6341, 'learning_rate': 3.9487431187315365e-06, 'epoch': 1.42} {'loss': 0.4276, 'learning_rate': 3.948482507614053e-06, 'epoch': 1.42} {'loss': 0.5317, 'learning_rate': 3.948221902981312e-06, 'epoch': 1.42} {'loss': 0.5925, 'learning_rate': 3.947961304833603e-06, 'epoch': 1.42} {'loss': 0.5539, 'learning_rate': 3.947700713171193e-06, 'epoch': 1.42} {'loss': 0.4628, 'learning_rate': 3.947440127994375e-06, 'epoch': 1.42} {'loss': 0.5819, 'learning_rate': 3.9471795493034185e-06, 'epoch': 1.42} {'loss': 0.3386, 'learning_rate': 3.946918977098604e-06, 'epoch': 1.42} {'loss': 0.5673, 'learning_rate': 3.946658411380217e-06, 'epoch': 1.42} {'loss': 0.6289, 'learning_rate': 3.946397852148523e-06, 'epoch': 1.42} {'loss': 0.5031, 'learning_rate': 3.946137299403818e-06, 'epoch': 1.42} {'loss': 0.5029, 'learning_rate': 3.945876753146367e-06, 'epoch': 1.42} {'loss': 0.5043, 'learning_rate': 3.945616213376462e-06, 'epoch': 1.42} {'loss': 0.5589, 'learning_rate': 3.945355680094372e-06, 'epoch': 1.42} {'loss': 0.5483, 'learning_rate': 3.94509515330038e-06, 'epoch': 1.42} {'loss': 0.5284, 'learning_rate': 3.944834632994768e-06, 'epoch': 1.42} {'loss': 0.4854, 'learning_rate': 3.944574119177807e-06, 'epoch': 1.42} {'loss': 0.4412, 'learning_rate': 3.944313611849786e-06, 'epoch': 1.42} {'loss': 0.4211, 'learning_rate': 3.944053111010977e-06, 'epoch': 1.42} {'loss': 0.6167, 'learning_rate': 3.943792616661662e-06, 'epoch': 1.42} {'loss': 0.6028, 'learning_rate': 3.94353212880212e-06, 'epoch': 1.42} {'loss': 0.5173, 'learning_rate': 3.943271647432629e-06, 'epoch': 1.42} {'loss': 0.7005, 'learning_rate': 3.943011172553474e-06, 'epoch': 1.42} {'loss': 0.5917, 'learning_rate': 3.94275070416492e-06, 'epoch': 1.42} {'loss': 0.5783, 'learning_rate': 3.942490242267264e-06, 'epoch': 1.42} {'loss': 0.5268, 'learning_rate': 3.942229786860773e-06, 'epoch': 1.42} {'loss': 0.5565, 'learning_rate': 3.941969337945729e-06, 'epoch': 1.42} {'loss': 0.4816, 'learning_rate': 3.9417088955224115e-06, 'epoch': 1.42} {'loss': 0.5399, 'learning_rate': 3.941448459591099e-06, 'epoch': 1.42} {'loss': 0.5665, 'learning_rate': 3.941188030152077e-06, 'epoch': 1.42} {'loss': 0.5743, 'learning_rate': 3.94092760720561e-06, 'epoch': 1.42} {'loss': 0.5563, 'learning_rate': 3.940667190751994e-06, 'epoch': 1.42} {'loss': 0.5158, 'learning_rate': 3.9404067807914956e-06, 'epoch': 1.42} {'loss': 0.6542, 'learning_rate': 3.940146377324399e-06, 'epoch': 1.42} {'loss': 0.4294, 'learning_rate': 3.939885980350982e-06, 'epoch': 1.42} {'loss': 0.5576, 'learning_rate': 3.939625589871524e-06, 'epoch': 1.42} {'loss': 0.5168, 'learning_rate': 3.939365205886309e-06, 'epoch': 1.42} {'loss': 0.4699, 'learning_rate': 3.939104828395605e-06, 'epoch': 1.42} {'loss': 0.5145, 'learning_rate': 3.9388444573997e-06, 'epoch': 1.42} {'loss': 0.5722, 'learning_rate': 3.93858409289887e-06, 'epoch': 1.42} {'loss': 0.4328, 'learning_rate': 3.938323734893392e-06, 'epoch': 1.42} {'loss': 0.4992, 'learning_rate': 3.938063383383549e-06, 'epoch': 1.42} {'loss': 0.5985, 'learning_rate': 3.937803038369617e-06, 'epoch': 1.42} {'loss': 0.4843, 'learning_rate': 3.9375426998518805e-06, 'epoch': 1.42} {'loss': 0.5262, 'learning_rate': 3.937282367830611e-06, 'epoch': 1.42} {'loss': 0.4375, 'learning_rate': 3.9370220423060905e-06, 'epoch': 1.42} {'loss': 0.6805, 'learning_rate': 3.936761723278598e-06, 'epoch': 1.42} {'loss': 0.5405, 'learning_rate': 3.936501410748412e-06, 'epoch': 1.42} {'loss': 0.5601, 'learning_rate': 3.936241104715812e-06, 'epoch': 1.42} {'loss': 0.5704, 'learning_rate': 3.935980805181078e-06, 'epoch': 1.42} {'loss': 0.5266, 'learning_rate': 3.93572051214449e-06, 'epoch': 1.42} {'loss': 0.5544, 'learning_rate': 3.935460225606322e-06, 'epoch': 1.42} {'loss': 0.5521, 'learning_rate': 3.935199945566857e-06, 'epoch': 1.42} {'loss': 0.5696, 'learning_rate': 3.934939672026371e-06, 'epoch': 1.42} {'loss': 0.5801, 'learning_rate': 3.934679404985144e-06, 'epoch': 1.42} {'loss': 0.4858, 'learning_rate': 3.934419144443461e-06, 'epoch': 1.42} {'loss': 0.5429, 'learning_rate': 3.93415889040159e-06, 'epoch': 1.42} {'loss': 0.3764, 'learning_rate': 3.933898642859816e-06, 'epoch': 1.42} {'loss': 0.534, 'learning_rate': 3.933638401818417e-06, 'epoch': 1.42} {'loss': 0.5793, 'learning_rate': 3.933378167277673e-06, 'epoch': 1.42} {'loss': 0.4806, 'learning_rate': 3.933117939237861e-06, 'epoch': 1.42} {'loss': 0.5768, 'learning_rate': 3.93285771769926e-06, 'epoch': 1.42} {'loss': 0.5284, 'learning_rate': 3.9325975026621535e-06, 'epoch': 1.42} {'loss': 0.506, 'learning_rate': 3.932337294126812e-06, 'epoch': 1.42} {'loss': 0.5381, 'learning_rate': 3.93207709209352e-06, 'epoch': 1.42} {'loss': 0.6226, 'learning_rate': 3.931816896562556e-06, 'epoch': 1.42} {'loss': 0.5331, 'learning_rate': 3.931556707534196e-06, 'epoch': 1.42} {'loss': 0.4319, 'learning_rate': 3.931296525008721e-06, 'epoch': 1.42} {'loss': 0.4496, 'learning_rate': 3.931036348986413e-06, 'epoch': 1.42} {'loss': 0.5524, 'learning_rate': 3.930776179467545e-06, 'epoch': 1.42} {'loss': 0.5046, 'learning_rate': 3.930516016452397e-06, 'epoch': 1.42} {'loss': 0.5622, 'learning_rate': 3.93025585994125e-06, 'epoch': 1.42} {'loss': 0.4477, 'learning_rate': 3.92999570993438e-06, 'epoch': 1.42} {'loss': 0.5582, 'learning_rate': 3.929735566432069e-06, 'epoch': 1.42} {'loss': 0.6283, 'learning_rate': 3.929475429434593e-06, 'epoch': 1.42} {'loss': 0.6573, 'learning_rate': 3.929215298942236e-06, 'epoch': 1.42} {'loss': 0.5485, 'learning_rate': 3.928955174955269e-06, 'epoch': 1.42} {'loss': 0.5999, 'learning_rate': 3.928695057473975e-06, 'epoch': 1.42} {'loss': 0.4981, 'learning_rate': 3.928434946498631e-06, 'epoch': 1.42} {'loss': 0.5135, 'learning_rate': 3.928174842029518e-06, 'epoch': 1.42} {'loss': 0.5202, 'learning_rate': 3.927914744066914e-06, 'epoch': 1.42} {'loss': 0.4934, 'learning_rate': 3.927654652611097e-06, 'epoch': 1.42} {'loss': 0.5, 'learning_rate': 3.92739456766235e-06, 'epoch': 1.42} {'loss': 0.5844, 'learning_rate': 3.927134489220944e-06, 'epoch': 1.42} {'loss': 0.49, 'learning_rate': 3.9268744172871606e-06, 'epoch': 1.42} {'loss': 0.4649, 'learning_rate': 3.926614351861281e-06, 'epoch': 1.42} {'loss': 0.5069, 'learning_rate': 3.926354292943582e-06, 'epoch': 1.42} {'loss': 0.5742, 'learning_rate': 3.926094240534345e-06, 'epoch': 1.42} {'loss': 0.4846, 'learning_rate': 3.92583419463384e-06, 'epoch': 1.42} {'loss': 0.4057, 'learning_rate': 3.925574155242358e-06, 'epoch': 1.42} {'loss': 0.5627, 'learning_rate': 3.925314122360169e-06, 'epoch': 1.42} {'loss': 0.5091, 'learning_rate': 3.925054095987554e-06, 'epoch': 1.42} {'loss': 0.508, 'learning_rate': 3.924794076124792e-06, 'epoch': 1.42} {'loss': 0.4613, 'learning_rate': 3.924534062772161e-06, 'epoch': 1.42} {'loss': 0.4747, 'learning_rate': 3.924274055929943e-06, 'epoch': 1.42} {'loss': 0.5949, 'learning_rate': 3.9240140555984075e-06, 'epoch': 1.42} {'loss': 0.6092, 'learning_rate': 3.923754061777846e-06, 'epoch': 1.42} {'loss': 0.4625, 'learning_rate': 3.923494074468528e-06, 'epoch': 1.42} {'loss': 0.3183, 'learning_rate': 3.923234093670734e-06, 'epoch': 1.42} {'loss': 0.5915, 'learning_rate': 3.922974119384743e-06, 'epoch': 1.42} {'loss': 0.6209, 'learning_rate': 3.922714151610833e-06, 'epoch': 1.42} {'loss': 0.61, 'learning_rate': 3.922454190349288e-06, 'epoch': 1.42} {'loss': 0.6469, 'learning_rate': 3.9221942356003726e-06, 'epoch': 1.42} {'loss': 0.5593, 'learning_rate': 3.921934287364384e-06, 'epoch': 1.42} {'loss': 0.6737, 'learning_rate': 3.921674345641587e-06, 'epoch': 1.42} {'loss': 0.4373, 'learning_rate': 3.921414410432265e-06, 'epoch': 1.42} {'loss': 0.4133, 'learning_rate': 3.9211544817366995e-06, 'epoch': 1.42} {'loss': 0.4805, 'learning_rate': 3.920894559555158e-06, 'epoch': 1.42} {'loss': 0.4635, 'learning_rate': 3.920634643887934e-06, 'epoch': 1.42} {'loss': 0.5259, 'learning_rate': 3.920374734735291e-06, 'epoch': 1.42} {'loss': 0.5642, 'learning_rate': 3.9201148320975235e-06, 'epoch': 1.42} {'loss': 0.4247, 'learning_rate': 3.9198549359748986e-06, 'epoch': 1.42} {'loss': 0.5335, 'learning_rate': 3.919595046367697e-06, 'epoch': 1.42} {'loss': 0.4998, 'learning_rate': 3.919335163276201e-06, 'epoch': 1.42} {'loss': 0.4443, 'learning_rate': 3.91907528670068e-06, 'epoch': 1.42} {'loss': 0.5886, 'learning_rate': 3.918815416641425e-06, 'epoch': 1.42} {'loss': 0.5982, 'learning_rate': 3.9185555530987014e-06, 'epoch': 1.42} {'loss': 0.4646, 'learning_rate': 3.918295696072802e-06, 'epoch': 1.42} {'loss': 0.5446, 'learning_rate': 3.918035845563993e-06, 'epoch': 1.42} {'loss': 0.5711, 'learning_rate': 3.917776001572558e-06, 'epoch': 1.42} {'loss': 0.5097, 'learning_rate': 3.91751616409878e-06, 'epoch': 1.42} {'loss': 0.6792, 'learning_rate': 3.917256333142924e-06, 'epoch': 1.42} {'loss': 0.4884, 'learning_rate': 3.916996508705284e-06, 'epoch': 1.42} {'loss': 0.4374, 'learning_rate': 3.916736690786124e-06, 'epoch': 1.42} {'loss': 0.3862, 'learning_rate': 3.9164768793857365e-06, 'epoch': 1.42} {'loss': 0.6075, 'learning_rate': 3.91621707450439e-06, 'epoch': 1.42} {'loss': 0.3954, 'learning_rate': 3.915957276142367e-06, 'epoch': 1.42} {'loss': 0.4649, 'learning_rate': 3.915697484299947e-06, 'epoch': 1.42} {'loss': 0.5466, 'learning_rate': 3.9154376989774e-06, 'epoch': 1.42} {'loss': 0.4811, 'learning_rate': 3.915177920175017e-06, 'epoch': 1.42} {'loss': 0.5775, 'learning_rate': 3.914918147893068e-06, 'epoch': 1.42} {'loss': 0.5909, 'learning_rate': 3.914658382131832e-06, 'epoch': 1.42} {'loss': 0.52, 'learning_rate': 3.914398622891589e-06, 'epoch': 1.42} {'loss': 0.4459, 'learning_rate': 3.914138870172617e-06, 'epoch': 1.42} {'loss': 0.616, 'learning_rate': 3.913879123975198e-06, 'epoch': 1.42} {'loss': 0.5594, 'learning_rate': 3.913619384299601e-06, 'epoch': 1.42} {'loss': 0.6545, 'learning_rate': 3.913359651146116e-06, 'epoch': 1.42} {'loss': 0.5425, 'learning_rate': 3.913099924515011e-06, 'epoch': 1.42} {'loss': 0.5724, 'learning_rate': 3.9128402044065705e-06, 'epoch': 1.42} {'loss': 0.3998, 'learning_rate': 3.91258049082107e-06, 'epoch': 1.42} {'loss': 0.5897, 'learning_rate': 3.91232078375879e-06, 'epoch': 1.42} {'loss': 0.6486, 'learning_rate': 3.9120610832200115e-06, 'epoch': 1.42} {'loss': 0.5529, 'learning_rate': 3.911801389205001e-06, 'epoch': 1.42} {'loss': 0.5216, 'learning_rate': 3.911541701714052e-06, 'epoch': 1.42} {'loss': 0.5522, 'learning_rate': 3.911282020747433e-06, 'epoch': 1.42} {'loss': 0.5235, 'learning_rate': 3.911022346305423e-06, 'epoch': 1.42} {'loss': 0.4364, 'learning_rate': 3.910762678388306e-06, 'epoch': 1.42} {'loss': 0.5317, 'learning_rate': 3.910503016996351e-06, 'epoch': 1.42} {'loss': 0.4598, 'learning_rate': 3.910243362129847e-06, 'epoch': 1.42} {'loss': 0.497, 'learning_rate': 3.9099837137890615e-06, 'epoch': 1.42} {'loss': 0.5975, 'learning_rate': 3.909724071974285e-06, 'epoch': 1.42} {'loss': 0.5164, 'learning_rate': 3.909464436685784e-06, 'epoch': 1.42} {'loss': 0.6318, 'learning_rate': 3.909204807923842e-06, 'epoch': 1.42} {'loss': 0.4392, 'learning_rate': 3.908945185688741e-06, 'epoch': 1.42} {'loss': 0.551, 'learning_rate': 3.908685569980747e-06, 'epoch': 1.42} {'loss': 0.4365, 'learning_rate': 3.908425960800153e-06, 'epoch': 1.42} {'loss': 0.4994, 'learning_rate': 3.908166358147227e-06, 'epoch': 1.42} {'loss': 0.5025, 'learning_rate': 3.907906762022251e-06, 'epoch': 1.42} {'loss': 0.4944, 'learning_rate': 3.907647172425503e-06, 'epoch': 1.42} {'loss': 0.5028, 'learning_rate': 3.907387589357261e-06, 'epoch': 1.42} {'loss': 0.725, 'learning_rate': 3.907128012817806e-06, 'epoch': 1.42} {'loss': 0.5067, 'learning_rate': 3.9068684428074065e-06, 'epoch': 1.42} {'loss': 0.3626, 'learning_rate': 3.906608879326355e-06, 'epoch': 1.42} {'loss': 0.5137, 'learning_rate': 3.906349322374917e-06, 'epoch': 1.42} {'loss': 0.5246, 'learning_rate': 3.906089771953377e-06, 'epoch': 1.42} {'loss': 0.6358, 'learning_rate': 3.905830228062011e-06, 'epoch': 1.42} {'loss': 0.511, 'learning_rate': 3.905570690701099e-06, 'epoch': 1.42} {'loss': 0.5601, 'learning_rate': 3.90531115987092e-06, 'epoch': 1.42} {'loss': 0.5895, 'learning_rate': 3.905051635571745e-06, 'epoch': 1.42} {'loss': 0.6026, 'learning_rate': 3.904792117803863e-06, 'epoch': 1.42} {'loss': 0.4984, 'learning_rate': 3.904532606567544e-06, 'epoch': 1.42} {'loss': 0.5193, 'learning_rate': 3.904273101863068e-06, 'epoch': 1.42} {'loss': 0.4706, 'learning_rate': 3.904013603690713e-06, 'epoch': 1.42} {'loss': 0.4262, 'learning_rate': 3.903754112050757e-06, 'epoch': 1.42} {'loss': 0.47, 'learning_rate': 3.9034946269434835e-06, 'epoch': 1.42} {'loss': 0.4026, 'learning_rate': 3.9032351483691626e-06, 'epoch': 1.42} {'loss': 0.5657, 'learning_rate': 3.902975676328074e-06, 'epoch': 1.42} {'loss': 0.5887, 'learning_rate': 3.902716210820499e-06, 'epoch': 1.42} {'loss': 0.6113, 'learning_rate': 3.902456751846712e-06, 'epoch': 1.42} {'loss': 0.5381, 'learning_rate': 3.9021972994069935e-06, 'epoch': 1.42} {'loss': 0.4493, 'learning_rate': 3.901937853501622e-06, 'epoch': 1.42} {'loss': 0.5347, 'learning_rate': 3.901678414130877e-06, 'epoch': 1.42} {'loss': 0.5436, 'learning_rate': 3.901418981295031e-06, 'epoch': 1.42} {'loss': 0.481, 'learning_rate': 3.901159554994364e-06, 'epoch': 1.42} {'loss': 0.5203, 'learning_rate': 3.900900135229157e-06, 'epoch': 1.42} {'loss': 0.5731, 'learning_rate': 3.900640721999684e-06, 'epoch': 1.42} {'loss': 0.6752, 'learning_rate': 3.900381315306225e-06, 'epoch': 1.42} {'loss': 0.5849, 'learning_rate': 3.9001219151490584e-06, 'epoch': 1.42} {'loss': 0.5704, 'learning_rate': 3.899862521528466e-06, 'epoch': 1.42} {'loss': 0.5169, 'learning_rate': 3.899603134444717e-06, 'epoch': 1.42} {'loss': 0.5447, 'learning_rate': 3.899343753898095e-06, 'epoch': 1.42} {'loss': 0.3831, 'learning_rate': 3.899084379888875e-06, 'epoch': 1.42} {'loss': 0.5971, 'learning_rate': 3.8988250124173386e-06, 'epoch': 1.42} {'loss': 0.4349, 'learning_rate': 3.898565651483761e-06, 'epoch': 1.42} {'loss': 0.5374, 'learning_rate': 3.898306297088424e-06, 'epoch': 1.42} {'loss': 0.4346, 'learning_rate': 3.8980469492316e-06, 'epoch': 1.42} {'loss': 0.5724, 'learning_rate': 3.897787607913569e-06, 'epoch': 1.42} {'loss': 0.5222, 'learning_rate': 3.897528273134609e-06, 'epoch': 1.42} {'loss': 0.5881, 'learning_rate': 3.897268944894999e-06, 'epoch': 1.42} {'loss': 0.5112, 'learning_rate': 3.897009623195015e-06, 'epoch': 1.42} {'loss': 0.5782, 'learning_rate': 3.896750308034937e-06, 'epoch': 1.42} {'loss': 0.5699, 'learning_rate': 3.896490999415046e-06, 'epoch': 1.42} {'loss': 0.3657, 'learning_rate': 3.896231697335611e-06, 'epoch': 1.42} {'loss': 0.6064, 'learning_rate': 3.895972401796915e-06, 'epoch': 1.42} {'loss': 0.6073, 'learning_rate': 3.895713112799236e-06, 'epoch': 1.42} {'loss': 0.4549, 'learning_rate': 3.89545383034285e-06, 'epoch': 1.42} {'loss': 0.615, 'learning_rate': 3.895194554428037e-06, 'epoch': 1.42} {'loss': 0.6289, 'learning_rate': 3.894935285055074e-06, 'epoch': 1.42} {'loss': 0.3365, 'learning_rate': 3.894676022224242e-06, 'epoch': 1.42} {'loss': 0.4921, 'learning_rate': 3.894416765935813e-06, 'epoch': 1.42} {'loss': 0.5103, 'learning_rate': 3.894157516190067e-06, 'epoch': 1.42} {'loss': 0.5132, 'learning_rate': 3.893898272987282e-06, 'epoch': 1.42} {'loss': 0.5156, 'learning_rate': 3.8936390363277365e-06, 'epoch': 1.42} {'loss': 0.6011, 'learning_rate': 3.893379806211712e-06, 'epoch': 1.42} {'loss': 0.5487, 'learning_rate': 3.893120582639478e-06, 'epoch': 1.42} {'loss': 0.6815, 'learning_rate': 3.892861365611317e-06, 'epoch': 1.42} {'loss': 0.4694, 'learning_rate': 3.892602155127505e-06, 'epoch': 1.42} {'loss': 0.5415, 'learning_rate': 3.892342951188323e-06, 'epoch': 1.42} {'loss': 0.3809, 'learning_rate': 3.8920837537940445e-06, 'epoch': 1.42} {'loss': 0.5469, 'learning_rate': 3.891824562944951e-06, 'epoch': 1.42} {'loss': 0.5783, 'learning_rate': 3.891565378641322e-06, 'epoch': 1.42} {'loss': 0.564, 'learning_rate': 3.891306200883429e-06, 'epoch': 1.42} {'loss': 0.3734, 'learning_rate': 3.891047029671552e-06, 'epoch': 1.42} {'loss': 0.6336, 'learning_rate': 3.8907878650059695e-06, 'epoch': 1.42} {'loss': 0.524, 'learning_rate': 3.890528706886959e-06, 'epoch': 1.42} {'loss': 0.5216, 'learning_rate': 3.890269555314799e-06, 'epoch': 1.42} {'loss': 0.4063, 'learning_rate': 3.890010410289766e-06, 'epoch': 1.42} {'loss': 0.5253, 'learning_rate': 3.889751271812142e-06, 'epoch': 1.42} {'loss': 0.5648, 'learning_rate': 3.8894921398821985e-06, 'epoch': 1.42} {'loss': 0.579, 'learning_rate': 3.889233014500214e-06, 'epoch': 1.42} {'loss': 0.5158, 'learning_rate': 3.8889738956664695e-06, 'epoch': 1.42} {'loss': 0.4116, 'learning_rate': 3.88871478338124e-06, 'epoch': 1.42} {'loss': 0.5943, 'learning_rate': 3.888455677644808e-06, 'epoch': 1.42} {'loss': 0.4717, 'learning_rate': 3.8881965784574405e-06, 'epoch': 1.42} {'loss': 0.4689, 'learning_rate': 3.887937485819428e-06, 'epoch': 1.42} {'loss': 0.5415, 'learning_rate': 3.8876783997310396e-06, 'epoch': 1.42} {'loss': 0.6235, 'learning_rate': 3.887419320192556e-06, 'epoch': 1.42} {'loss': 0.5604, 'learning_rate': 3.887160247204254e-06, 'epoch': 1.42} {'loss': 0.5607, 'learning_rate': 3.88690118076641e-06, 'epoch': 1.42} {'loss': 0.5821, 'learning_rate': 3.886642120879308e-06, 'epoch': 1.42} {'loss': 0.513, 'learning_rate': 3.8863830675432135e-06, 'epoch': 1.42} {'loss': 0.3966, 'learning_rate': 3.886124020758418e-06, 'epoch': 1.42} {'loss': 0.5586, 'learning_rate': 3.885864980525189e-06, 'epoch': 1.42} {'loss': 0.5782, 'learning_rate': 3.885605946843808e-06, 'epoch': 1.42} {'loss': 0.4746, 'learning_rate': 3.885346919714552e-06, 'epoch': 1.42} {'loss': 0.4453, 'learning_rate': 3.8850878991376985e-06, 'epoch': 1.42} {'loss': 0.4969, 'learning_rate': 3.884828885113529e-06, 'epoch': 1.42} {'loss': 0.4703, 'learning_rate': 3.884569877642309e-06, 'epoch': 1.42} {'loss': 0.4161, 'learning_rate': 3.884310876724333e-06, 'epoch': 1.42} {'loss': 0.5165, 'learning_rate': 3.884051882359865e-06, 'epoch': 1.42} {'loss': 0.411, 'learning_rate': 3.883792894549189e-06, 'epoch': 1.42} {'loss': 0.579, 'learning_rate': 3.883533913292583e-06, 'epoch': 1.42} {'loss': 0.4877, 'learning_rate': 3.883274938590316e-06, 'epoch': 1.42} {'loss': 0.6305, 'learning_rate': 3.883015970442678e-06, 'epoch': 1.42} {'loss': 0.4542, 'learning_rate': 3.882757008849936e-06, 'epoch': 1.42} {'loss': 0.5443, 'learning_rate': 3.882498053812377e-06, 'epoch': 1.42} {'loss': 0.47, 'learning_rate': 3.88223910533027e-06, 'epoch': 1.42} {'loss': 0.4911, 'learning_rate': 3.881980163403897e-06, 'epoch': 1.42} {'loss': 0.5863, 'learning_rate': 3.881721228033537e-06, 'epoch': 1.42} {'loss': 0.4521, 'learning_rate': 3.8814622992194575e-06, 'epoch': 1.42} {'loss': 0.4603, 'learning_rate': 3.881203376961951e-06, 'epoch': 1.42} {'loss': 0.5214, 'learning_rate': 3.88094446126128e-06, 'epoch': 1.42} {'loss': 0.4392, 'learning_rate': 3.880685552117737e-06, 'epoch': 1.42} {'loss': 0.7296, 'learning_rate': 3.880426649531588e-06, 'epoch': 1.42} {'loss': 0.5392, 'learning_rate': 3.880167753503115e-06, 'epoch': 1.42} {'loss': 0.5464, 'learning_rate': 3.879908864032596e-06, 'epoch': 1.42} {'loss': 0.3751, 'learning_rate': 3.8796499811203016e-06, 'epoch': 1.42} {'loss': 0.5025, 'learning_rate': 3.879391104766521e-06, 'epoch': 1.42} {'loss': 0.4669, 'learning_rate': 3.8791322349715185e-06, 'epoch': 1.42} {'loss': 0.5432, 'learning_rate': 3.878873371735585e-06, 'epoch': 1.42} {'loss': 0.4408, 'learning_rate': 3.878614515058988e-06, 'epoch': 1.42} {'loss': 0.5597, 'learning_rate': 3.878355664942008e-06, 'epoch': 1.42} {'loss': 0.5753, 'learning_rate': 3.878096821384926e-06, 'epoch': 1.42} {'loss': 0.677, 'learning_rate': 3.877837984388009e-06, 'epoch': 1.42} {'loss': 0.6152, 'learning_rate': 3.8775791539515475e-06, 'epoch': 1.42} {'loss': 0.5047, 'learning_rate': 3.877320330075805e-06, 'epoch': 1.42} {'loss': 0.4523, 'learning_rate': 3.877061512761074e-06, 'epoch': 1.42} {'loss': 0.5059, 'learning_rate': 3.876802702007621e-06, 'epoch': 1.42} {'loss': 0.5482, 'learning_rate': 3.876543897815728e-06, 'epoch': 1.42} {'loss': 0.5182, 'learning_rate': 3.876285100185672e-06, 'epoch': 1.42} {'loss': 0.5599, 'learning_rate': 3.8760263091177235e-06, 'epoch': 1.42} {'loss': 0.5589, 'learning_rate': 3.875767524612172e-06, 'epoch': 1.42} {'loss': 0.4028, 'learning_rate': 3.875508746669285e-06, 'epoch': 1.42} {'loss': 0.4846, 'learning_rate': 3.8752499752893425e-06, 'epoch': 1.42} {'loss': 0.5989, 'learning_rate': 3.874991210472624e-06, 'epoch': 1.42} {'loss': 0.4438, 'learning_rate': 3.874732452219404e-06, 'epoch': 1.42} {'loss': 0.5374, 'learning_rate': 3.874473700529965e-06, 'epoch': 1.42} {'loss': 0.4157, 'learning_rate': 3.874214955404573e-06, 'epoch': 1.42} {'loss': 0.4685, 'learning_rate': 3.8739562168435195e-06, 'epoch': 1.42} {'loss': 0.5833, 'learning_rate': 3.873697484847071e-06, 'epoch': 1.42} {'loss': 0.5876, 'learning_rate': 3.873438759415508e-06, 'epoch': 1.42} {'loss': 0.4236, 'learning_rate': 3.87318004054911e-06, 'epoch': 1.42} {'loss': 0.6936, 'learning_rate': 3.872921328248153e-06, 'epoch': 1.42} {'loss': 0.4, 'learning_rate': 3.872662622512916e-06, 'epoch': 1.42} {'loss': 0.6563, 'learning_rate': 3.872403923343667e-06, 'epoch': 1.42} {'loss': 0.7701, 'learning_rate': 3.872145230740697e-06, 'epoch': 1.42} {'loss': 0.5709, 'learning_rate': 3.8718865447042745e-06, 'epoch': 1.42} {'loss': 0.5291, 'learning_rate': 3.871627865234677e-06, 'epoch': 1.42} {'loss': 0.4388, 'learning_rate': 3.871369192332188e-06, 'epoch': 1.42} {'loss': 0.4953, 'learning_rate': 3.871110525997073e-06, 'epoch': 1.42} {'loss': 0.461, 'learning_rate': 3.870851866229622e-06, 'epoch': 1.42} {'loss': 0.4564, 'learning_rate': 3.870593213030104e-06, 'epoch': 1.42} {'loss': 0.5981, 'learning_rate': 3.870334566398798e-06, 'epoch': 1.42} {'loss': 0.446, 'learning_rate': 3.870075926335982e-06, 'epoch': 1.42} {'loss': 0.6091, 'learning_rate': 3.869817292841933e-06, 'epoch': 1.42} {'loss': 0.6214, 'learning_rate': 3.8695586659169314e-06, 'epoch': 1.42} {'loss': 0.4835, 'learning_rate': 3.869300045561244e-06, 'epoch': 1.42} {'loss': 0.6072, 'learning_rate': 3.869041431775162e-06, 'epoch': 1.42} {'loss': 0.7119, 'learning_rate': 3.8687828245589525e-06, 'epoch': 1.42} {'loss': 0.5141, 'learning_rate': 3.8685242239128955e-06, 'epoch': 1.42} {'loss': 0.3368, 'learning_rate': 3.868265629837267e-06, 'epoch': 1.42} {'loss': 0.5519, 'learning_rate': 3.868007042332346e-06, 'epoch': 1.42} {'loss': 0.4971, 'learning_rate': 3.867748461398413e-06, 'epoch': 1.42} {'loss': 0.597, 'learning_rate': 3.867489887035732e-06, 'epoch': 1.42} {'loss': 0.5065, 'learning_rate': 3.867231319244598e-06, 'epoch': 1.42} {'loss': 0.3968, 'learning_rate': 3.8669727580252755e-06, 'epoch': 1.42} {'loss': 0.4413, 'learning_rate': 3.866714203378045e-06, 'epoch': 1.42} {'loss': 0.5989, 'learning_rate': 3.866455655303184e-06, 'epoch': 1.42} {'loss': 0.4982, 'learning_rate': 3.866197113800969e-06, 'epoch': 1.42} {'loss': 0.5494, 'learning_rate': 3.8659385788716804e-06, 'epoch': 1.42} {'loss': 0.4792, 'learning_rate': 3.86568005051559e-06, 'epoch': 1.42} {'loss': 0.4672, 'learning_rate': 3.865421528732975e-06, 'epoch': 1.42} {'loss': 0.5763, 'learning_rate': 3.865163013524117e-06, 'epoch': 1.42} {'loss': 0.5683, 'learning_rate': 3.86490450488929e-06, 'epoch': 1.42} {'loss': 0.5268, 'learning_rate': 3.86464600282877e-06, 'epoch': 1.42} {'loss': 0.6668, 'learning_rate': 3.864387507342837e-06, 'epoch': 1.42} {'loss': 0.6734, 'learning_rate': 3.864129018431769e-06, 'epoch': 1.42} {'loss': 0.5837, 'learning_rate': 3.863870536095839e-06, 'epoch': 1.42} {'loss': 0.4102, 'learning_rate': 3.863612060335323e-06, 'epoch': 1.42} {'loss': 0.7042, 'learning_rate': 3.8633535911505025e-06, 'epoch': 1.42} {'loss': 0.4988, 'learning_rate': 3.863095128541652e-06, 'epoch': 1.42} {'loss': 0.508, 'learning_rate': 3.862836672509048e-06, 'epoch': 1.42} {'loss': 0.5903, 'learning_rate': 3.86257822305297e-06, 'epoch': 1.42} {'loss': 0.5441, 'learning_rate': 3.8623197801736956e-06, 'epoch': 1.42} {'loss': 0.5098, 'learning_rate': 3.862061343871496e-06, 'epoch': 1.42} {'loss': 0.6493, 'learning_rate': 3.861802914146652e-06, 'epoch': 1.42} {'loss': 0.486, 'learning_rate': 3.86154449099944e-06, 'epoch': 1.42} {'loss': 0.3933, 'learning_rate': 3.861286074430138e-06, 'epoch': 1.42} {'loss': 0.4877, 'learning_rate': 3.861027664439021e-06, 'epoch': 1.42} {'loss': 0.7146, 'learning_rate': 3.86076926102637e-06, 'epoch': 1.42} {'loss': 0.518, 'learning_rate': 3.860510864192457e-06, 'epoch': 1.42} {'loss': 0.4307, 'learning_rate': 3.860252473937559e-06, 'epoch': 1.42} {'loss': 0.5655, 'learning_rate': 3.859994090261956e-06, 'epoch': 1.42} {'loss': 0.598, 'learning_rate': 3.859735713165923e-06, 'epoch': 1.42} {'loss': 0.5193, 'learning_rate': 3.859477342649738e-06, 'epoch': 1.42} {'loss': 0.5713, 'learning_rate': 3.8592189787136755e-06, 'epoch': 1.42} {'loss': 0.515, 'learning_rate': 3.858960621358019e-06, 'epoch': 1.42} {'loss': 0.4863, 'learning_rate': 3.8587022705830365e-06, 'epoch': 1.42} {'loss': 0.4432, 'learning_rate': 3.85844392638901e-06, 'epoch': 1.42} {'loss': 0.4904, 'learning_rate': 3.858185588776213e-06, 'epoch': 1.42} {'loss': 0.5641, 'learning_rate': 3.857927257744926e-06, 'epoch': 1.42} {'loss': 0.6813, 'learning_rate': 3.8576689332954275e-06, 'epoch': 1.42} {'loss': 0.5361, 'learning_rate': 3.8574106154279835e-06, 'epoch': 1.42} {'loss': 0.4842, 'learning_rate': 3.857152304142886e-06, 'epoch': 1.42} {'loss': 0.4368, 'learning_rate': 3.856893999440401e-06, 'epoch': 1.42} {'loss': 0.629, 'learning_rate': 3.856635701320808e-06, 'epoch': 1.42} {'loss': 0.5621, 'learning_rate': 3.856377409784384e-06, 'epoch': 1.42} {'loss': 0.5933, 'learning_rate': 3.856119124831407e-06, 'epoch': 1.42} {'loss': 0.5788, 'learning_rate': 3.855860846462156e-06, 'epoch': 1.42} {'loss': 0.6089, 'learning_rate': 3.855602574676897e-06, 'epoch': 1.42} {'loss': 0.6011, 'learning_rate': 3.855344309475922e-06, 'epoch': 1.42} {'loss': 0.5513, 'learning_rate': 3.855086050859498e-06, 'epoch': 1.42} {'loss': 0.4578, 'learning_rate': 3.854827798827903e-06, 'epoch': 1.42} {'loss': 0.3982, 'learning_rate': 3.854569553381413e-06, 'epoch': 1.42} {'loss': 0.482, 'learning_rate': 3.8543113145203085e-06, 'epoch': 1.42} {'loss': 0.5877, 'learning_rate': 3.854053082244866e-06, 'epoch': 1.42} {'loss': 0.4718, 'learning_rate': 3.853794856555354e-06, 'epoch': 1.42} {'loss': 0.4955, 'learning_rate': 3.8535366374520634e-06, 'epoch': 1.42} {'loss': 0.366, 'learning_rate': 3.853278424935259e-06, 'epoch': 1.42} {'loss': 0.4429, 'learning_rate': 3.853020219005221e-06, 'epoch': 1.42} {'loss': 0.5232, 'learning_rate': 3.852762019662231e-06, 'epoch': 1.42} {'loss': 0.4968, 'learning_rate': 3.852503826906553e-06, 'epoch': 1.42} {'loss': 0.5364, 'learning_rate': 3.85224564073848e-06, 'epoch': 1.42} {'loss': 0.6179, 'learning_rate': 3.8519874611582764e-06, 'epoch': 1.42} {'loss': 0.4157, 'learning_rate': 3.851729288166224e-06, 'epoch': 1.42} {'loss': 0.666, 'learning_rate': 3.851471121762597e-06, 'epoch': 1.42} {'loss': 0.5768, 'learning_rate': 3.851212961947676e-06, 'epoch': 1.42} {'loss': 0.3412, 'learning_rate': 3.850954808721738e-06, 'epoch': 1.42} {'loss': 0.415, 'learning_rate': 3.850696662085049e-06, 'epoch': 1.42} {'loss': 0.4977, 'learning_rate': 3.8504385220379015e-06, 'epoch': 1.42} {'loss': 0.6429, 'learning_rate': 3.85018038858056e-06, 'epoch': 1.42} {'loss': 0.6034, 'learning_rate': 3.8499222617133054e-06, 'epoch': 1.42} {'loss': 0.6784, 'learning_rate': 3.849664141436414e-06, 'epoch': 1.42} {'loss': 0.5738, 'learning_rate': 3.849406027750164e-06, 'epoch': 1.42} {'loss': 0.4579, 'learning_rate': 3.849147920654832e-06, 'epoch': 1.42} {'loss': 0.5203, 'learning_rate': 3.848889820150688e-06, 'epoch': 1.42} {'loss': 0.4335, 'learning_rate': 3.848631726238019e-06, 'epoch': 1.42} {'loss': 0.5937, 'learning_rate': 3.848373638917093e-06, 'epoch': 1.42} {'loss': 0.5259, 'learning_rate': 3.848115558188192e-06, 'epoch': 1.42} {'loss': 0.4283, 'learning_rate': 3.8478574840515915e-06, 'epoch': 1.42} {'loss': 0.5631, 'learning_rate': 3.8475994165075614e-06, 'epoch': 1.42} {'loss': 0.4854, 'learning_rate': 3.84734135555639e-06, 'epoch': 1.42} {'loss': 0.5387, 'learning_rate': 3.847083301198341e-06, 'epoch': 1.42} {'loss': 0.4476, 'learning_rate': 3.846825253433705e-06, 'epoch': 1.42} {'loss': 0.5765, 'learning_rate': 3.846567212262746e-06, 'epoch': 1.42} {'loss': 0.4618, 'learning_rate': 3.846309177685747e-06, 'epoch': 1.42} {'loss': 0.61, 'learning_rate': 3.8460511497029866e-06, 'epoch': 1.42} {'loss': 0.5235, 'learning_rate': 3.845793128314731e-06, 'epoch': 1.42} {'loss': 0.4225, 'learning_rate': 3.84553511352127e-06, 'epoch': 1.42} {'loss': 0.5572, 'learning_rate': 3.845277105322867e-06, 'epoch': 1.42} {'loss': 0.4673, 'learning_rate': 3.845019103719811e-06, 'epoch': 1.42} {'loss': 0.567, 'learning_rate': 3.844761108712371e-06, 'epoch': 1.42} {'loss': 0.6176, 'learning_rate': 3.844503120300823e-06, 'epoch': 1.42} {'loss': 0.5024, 'learning_rate': 3.8442451384854494e-06, 'epoch': 1.42} {'loss': 0.6113, 'learning_rate': 3.843987163266516e-06, 'epoch': 1.42} {'loss': 0.5243, 'learning_rate': 3.843729194644313e-06, 'epoch': 1.42} {'loss': 0.5129, 'learning_rate': 3.8434712326191035e-06, 'epoch': 1.42} {'loss': 0.5113, 'learning_rate': 3.843213277191177e-06, 'epoch': 1.42} {'loss': 0.5507, 'learning_rate': 3.842955328360799e-06, 'epoch': 1.42} {'loss': 0.5424, 'learning_rate': 3.84269738612825e-06, 'epoch': 1.42} {'loss': 0.5904, 'learning_rate': 3.8424394504938105e-06, 'epoch': 1.42} {'loss': 0.4608, 'learning_rate': 3.8421815214577455e-06, 'epoch': 1.42} {'loss': 0.3979, 'learning_rate': 3.841923599020346e-06, 'epoch': 1.42} {'loss': 0.62, 'learning_rate': 3.841665683181874e-06, 'epoch': 1.42} {'loss': 0.4961, 'learning_rate': 3.84140777394262e-06, 'epoch': 1.42} {'loss': 0.5143, 'learning_rate': 3.84114987130285e-06, 'epoch': 1.42} {'loss': 0.461, 'learning_rate': 3.840891975262845e-06, 'epoch': 1.42} {'loss': 0.5604, 'learning_rate': 3.8406340858228815e-06, 'epoch': 1.42} {'loss': 0.6347, 'learning_rate': 3.8403762029832295e-06, 'epoch': 1.42} {'loss': 0.4537, 'learning_rate': 3.8401183267441765e-06, 'epoch': 1.42} {'loss': 0.5077, 'learning_rate': 3.839860457105985e-06, 'epoch': 1.42} {'loss': 0.388, 'learning_rate': 3.839602594068947e-06, 'epoch': 1.42} {'loss': 0.5711, 'learning_rate': 3.839344737633327e-06, 'epoch': 1.42} {'loss': 0.5459, 'learning_rate': 3.839086887799405e-06, 'epoch': 1.42} {'loss': 0.5361, 'learning_rate': 3.8388290445674616e-06, 'epoch': 1.42} {'loss': 0.5472, 'learning_rate': 3.838571207937761e-06, 'epoch': 1.42} {'loss': 0.4552, 'learning_rate': 3.838313377910594e-06, 'epoch': 1.42} {'loss': 0.5628, 'learning_rate': 3.838055554486228e-06, 'epoch': 1.42} {'loss': 0.4749, 'learning_rate': 3.837797737664941e-06, 'epoch': 1.42} {'loss': 0.3485, 'learning_rate': 3.83753992744701e-06, 'epoch': 1.42} {'loss': 0.5252, 'learning_rate': 3.8372821238327115e-06, 'epoch': 1.42} {'loss': 0.4804, 'learning_rate': 3.837024326822325e-06, 'epoch': 1.42} {'loss': 0.4995, 'learning_rate': 3.836766536416117e-06, 'epoch': 1.42} {'loss': 0.6444, 'learning_rate': 3.836508752614375e-06, 'epoch': 1.42} {'loss': 0.5272, 'learning_rate': 3.8362509754173684e-06, 'epoch': 1.42} {'loss': 0.5134, 'learning_rate': 3.835993204825373e-06, 'epoch': 1.42} {'loss': 0.6075, 'learning_rate': 3.8357354408386695e-06, 'epoch': 1.42} {'loss': 0.4591, 'learning_rate': 3.83547768345753e-06, 'epoch': 1.42} {'loss': 0.3848, 'learning_rate': 3.8352199326822385e-06, 'epoch': 1.42} {'loss': 0.479, 'learning_rate': 3.834962188513059e-06, 'epoch': 1.42} {'loss': 0.5259, 'learning_rate': 3.834704450950275e-06, 'epoch': 1.42} {'loss': 0.4578, 'learning_rate': 3.834446719994162e-06, 'epoch': 1.42} {'loss': 0.4323, 'learning_rate': 3.834188995644997e-06, 'epoch': 1.42} {'loss': 0.6462, 'learning_rate': 3.833931277903052e-06, 'epoch': 1.42} {'loss': 0.6989, 'learning_rate': 3.833673566768607e-06, 'epoch': 1.42} {'loss': 0.4532, 'learning_rate': 3.833415862241943e-06, 'epoch': 1.42} {'loss': 0.5197, 'learning_rate': 3.8331581643233255e-06, 'epoch': 1.42} {'loss': 0.5261, 'learning_rate': 3.832900473013035e-06, 'epoch': 1.42} {'loss': 0.4054, 'learning_rate': 3.832642788311349e-06, 'epoch': 1.42} {'loss': 0.561, 'learning_rate': 3.8323851102185425e-06, 'epoch': 1.42} {'loss': 0.5175, 'learning_rate': 3.8321274387348925e-06, 'epoch': 1.42} {'loss': 0.6453, 'learning_rate': 3.8318697738606745e-06, 'epoch': 1.42} {'loss': 0.5796, 'learning_rate': 3.831612115596168e-06, 'epoch': 1.42} {'loss': 0.4748, 'learning_rate': 3.831354463941643e-06, 'epoch': 1.42} {'loss': 0.4563, 'learning_rate': 3.831096818897378e-06, 'epoch': 1.43} {'loss': 0.5288, 'learning_rate': 3.830839180463649e-06, 'epoch': 1.43} {'loss': 0.5696, 'learning_rate': 3.830581548640734e-06, 'epoch': 1.43} {'loss': 0.5861, 'learning_rate': 3.8303239234289104e-06, 'epoch': 1.43} {'loss': 0.4357, 'learning_rate': 3.830066304828447e-06, 'epoch': 1.43} {'loss': 0.6768, 'learning_rate': 3.829808692839626e-06, 'epoch': 1.43} {'loss': 0.5504, 'learning_rate': 3.82955108746272e-06, 'epoch': 1.43} {'loss': 0.5494, 'learning_rate': 3.829293488698009e-06, 'epoch': 1.43} {'loss': 0.6579, 'learning_rate': 3.829035896545766e-06, 'epoch': 1.43} {'loss': 0.5738, 'learning_rate': 3.828778311006269e-06, 'epoch': 1.43} {'loss': 0.5725, 'learning_rate': 3.828520732079796e-06, 'epoch': 1.43} {'loss': 0.4978, 'learning_rate': 3.828263159766615e-06, 'epoch': 1.43} {'loss': 0.6643, 'learning_rate': 3.828005594067009e-06, 'epoch': 1.43} {'loss': 0.5731, 'learning_rate': 3.8277480349812514e-06, 'epoch': 1.43} {'loss': 0.4357, 'learning_rate': 3.827490482509619e-06, 'epoch': 1.43} {'loss': 0.5203, 'learning_rate': 3.827232936652388e-06, 'epoch': 1.43} {'loss': 0.7005, 'learning_rate': 3.826975397409833e-06, 'epoch': 1.43} {'loss': 0.5487, 'learning_rate': 3.826717864782235e-06, 'epoch': 1.43} {'loss': 0.5485, 'learning_rate': 3.826460338769863e-06, 'epoch': 1.43} {'loss': 0.5764, 'learning_rate': 3.826202819372995e-06, 'epoch': 1.43} {'loss': 0.6211, 'learning_rate': 3.825945306591908e-06, 'epoch': 1.43} {'loss': 0.347, 'learning_rate': 3.825687800426879e-06, 'epoch': 1.43} {'loss': 0.6389, 'learning_rate': 3.825430300878181e-06, 'epoch': 1.43} {'loss': 0.6117, 'learning_rate': 3.825172807946097e-06, 'epoch': 1.43} {'loss': 0.6758, 'learning_rate': 3.8249153216308934e-06, 'epoch': 1.43} {'loss': 0.6526, 'learning_rate': 3.824657841932851e-06, 'epoch': 1.43} {'loss': 0.5421, 'learning_rate': 3.824400368852244e-06, 'epoch': 1.43} {'loss': 0.5499, 'learning_rate': 3.824142902389349e-06, 'epoch': 1.43} {'loss': 0.3834, 'learning_rate': 3.823885442544443e-06, 'epoch': 1.43} {'loss': 0.566, 'learning_rate': 3.823627989317802e-06, 'epoch': 1.43} {'loss': 0.4275, 'learning_rate': 3.823370542709703e-06, 'epoch': 1.43} {'loss': 0.4464, 'learning_rate': 3.823113102720419e-06, 'epoch': 1.43} {'loss': 0.5882, 'learning_rate': 3.822855669350224e-06, 'epoch': 1.43} {'loss': 0.4921, 'learning_rate': 3.822598242599398e-06, 'epoch': 1.43} {'loss': 0.5773, 'learning_rate': 3.822340822468214e-06, 'epoch': 1.43} {'loss': 0.3533, 'learning_rate': 3.822083408956952e-06, 'epoch': 1.43} {'loss': 0.3678, 'learning_rate': 3.8218260020658836e-06, 'epoch': 1.43} {'loss': 0.4387, 'learning_rate': 3.82156860179529e-06, 'epoch': 1.43} {'loss': 0.3851, 'learning_rate': 3.82131120814544e-06, 'epoch': 1.43} {'loss': 0.601, 'learning_rate': 3.8210538211166125e-06, 'epoch': 1.43} {'loss': 0.5118, 'learning_rate': 3.820796440709084e-06, 'epoch': 1.43} {'loss': 0.5963, 'learning_rate': 3.820539066923129e-06, 'epoch': 1.43} {'loss': 0.609, 'learning_rate': 3.820281699759027e-06, 'epoch': 1.43} {'loss': 0.4808, 'learning_rate': 3.8200243392170456e-06, 'epoch': 1.43} {'loss': 0.5439, 'learning_rate': 3.8197669852974714e-06, 'epoch': 1.43} {'loss': 0.4221, 'learning_rate': 3.819509638000573e-06, 'epoch': 1.43} {'loss': 0.4942, 'learning_rate': 3.819252297326627e-06, 'epoch': 1.43} {'loss': 0.4811, 'learning_rate': 3.818994963275909e-06, 'epoch': 1.43} {'loss': 0.486, 'learning_rate': 3.818737635848697e-06, 'epoch': 1.43} {'loss': 0.4916, 'learning_rate': 3.818480315045269e-06, 'epoch': 1.43} {'loss': 0.4523, 'learning_rate': 3.818223000865889e-06, 'epoch': 1.43} {'loss': 0.5051, 'learning_rate': 3.817965693310849e-06, 'epoch': 1.43} {'loss': 0.4814, 'learning_rate': 3.817708392380413e-06, 'epoch': 1.43} {'loss': 0.5387, 'learning_rate': 3.817451098074861e-06, 'epoch': 1.43} {'loss': 0.5345, 'learning_rate': 3.817193810394467e-06, 'epoch': 1.43} {'loss': 0.4855, 'learning_rate': 3.816936529339509e-06, 'epoch': 1.43} {'loss': 0.4536, 'learning_rate': 3.8166792549102645e-06, 'epoch': 1.43} {'loss': 0.4695, 'learning_rate': 3.8164219871069996e-06, 'epoch': 1.43} {'loss': 0.4145, 'learning_rate': 3.816164725930004e-06, 'epoch': 1.43} {'loss': 0.5716, 'learning_rate': 3.815907471379542e-06, 'epoch': 1.43} {'loss': 0.5223, 'learning_rate': 3.815650223455893e-06, 'epoch': 1.43} {'loss': 0.4433, 'learning_rate': 3.815392982159336e-06, 'epoch': 1.43} {'loss': 0.6396, 'learning_rate': 3.815135747490138e-06, 'epoch': 1.43} {'loss': 0.5307, 'learning_rate': 3.814878519448586e-06, 'epoch': 1.43} {'loss': 0.7067, 'learning_rate': 3.8146212980349438e-06, 'epoch': 1.43} {'loss': 0.5519, 'learning_rate': 3.8143640832495e-06, 'epoch': 1.43} {'loss': 0.4839, 'learning_rate': 3.8141068750925194e-06, 'epoch': 1.43} {'loss': 0.5257, 'learning_rate': 3.8138496735642814e-06, 'epoch': 1.43} {'loss': 0.5782, 'learning_rate': 3.813592478665067e-06, 'epoch': 1.43} {'loss': 0.5222, 'learning_rate': 3.813335290395138e-06, 'epoch': 1.43} {'loss': 0.5788, 'learning_rate': 3.813078108754786e-06, 'epoch': 1.43} {'loss': 0.5988, 'learning_rate': 3.8128209337442757e-06, 'epoch': 1.43} {'loss': 0.5765, 'learning_rate': 3.8125637653638857e-06, 'epoch': 1.43} {'loss': 0.5168, 'learning_rate': 3.8123066036138933e-06, 'epoch': 1.43} {'loss': 0.4626, 'learning_rate': 3.8120494484945714e-06, 'epoch': 1.43} {'loss': 0.5075, 'learning_rate': 3.8117923000062017e-06, 'epoch': 1.43} {'loss': 0.4021, 'learning_rate': 3.811535158149048e-06, 'epoch': 1.43} {'loss': 0.4395, 'learning_rate': 3.8112780229233993e-06, 'epoch': 1.43} {'loss': 0.4905, 'learning_rate': 3.8110208943295214e-06, 'epoch': 1.43} {'loss': 0.6186, 'learning_rate': 3.810763772367694e-06, 'epoch': 1.43} {'loss': 0.5186, 'learning_rate': 3.810506657038191e-06, 'epoch': 1.43} {'loss': 0.3954, 'learning_rate': 3.8102495483412883e-06, 'epoch': 1.43} {'loss': 0.4766, 'learning_rate': 3.8099924462772664e-06, 'epoch': 1.43} {'loss': 0.4118, 'learning_rate': 3.8097353508463886e-06, 'epoch': 1.43} {'loss': 0.4775, 'learning_rate': 3.8094782620489456e-06, 'epoch': 1.43} {'loss': 0.4333, 'learning_rate': 3.809221179885202e-06, 'epoch': 1.43} {'loss': 0.3682, 'learning_rate': 3.808964104355436e-06, 'epoch': 1.43} {'loss': 0.4782, 'learning_rate': 3.8087070354599277e-06, 'epoch': 1.43} {'loss': 0.4774, 'learning_rate': 3.808449973198941e-06, 'epoch': 1.43} {'loss': 0.5951, 'learning_rate': 3.808192917572766e-06, 'epoch': 1.43} {'loss': 0.4425, 'learning_rate': 3.807935868581665e-06, 'epoch': 1.43} {'loss': 0.6223, 'learning_rate': 3.8076788262259258e-06, 'epoch': 1.43} {'loss': 0.4992, 'learning_rate': 3.8074217905058153e-06, 'epoch': 1.43} {'loss': 0.3895, 'learning_rate': 3.80716476142161e-06, 'epoch': 1.43} {'loss': 0.51, 'learning_rate': 3.806907738973591e-06, 'epoch': 1.43} {'loss': 0.5446, 'learning_rate': 3.806650723162021e-06, 'epoch': 1.43} {'loss': 0.5365, 'learning_rate': 3.806393713987192e-06, 'epoch': 1.43} {'loss': 0.5966, 'learning_rate': 3.806136711449363e-06, 'epoch': 1.43} {'loss': 0.4786, 'learning_rate': 3.8058797155488257e-06, 'epoch': 1.43} {'loss': 0.5715, 'learning_rate': 3.8056227262858437e-06, 'epoch': 1.43} {'loss': 0.4174, 'learning_rate': 3.805365743660695e-06, 'epoch': 1.43} {'loss': 0.6042, 'learning_rate': 3.805108767673661e-06, 'epoch': 1.43} {'loss': 0.4927, 'learning_rate': 3.8048517983250045e-06, 'epoch': 1.43} {'loss': 0.6484, 'learning_rate': 3.804594835615014e-06, 'epoch': 1.43} {'loss': 0.4886, 'learning_rate': 3.8043378795439544e-06, 'epoch': 1.43} {'loss': 0.4961, 'learning_rate': 3.804080930112112e-06, 'epoch': 1.43} {'loss': 0.6492, 'learning_rate': 3.8038239873197526e-06, 'epoch': 1.43} {'loss': 0.548, 'learning_rate': 3.803567051167155e-06, 'epoch': 1.43} {'loss': 0.6252, 'learning_rate': 3.8033101216545988e-06, 'epoch': 1.43} {'loss': 0.4523, 'learning_rate': 3.803053198782347e-06, 'epoch': 1.43} {'loss': 0.5455, 'learning_rate': 3.8027962825506905e-06, 'epoch': 1.43} {'loss': 0.4665, 'learning_rate': 3.8025393729598934e-06, 'epoch': 1.43} {'loss': 0.4724, 'learning_rate': 3.8022824700102357e-06, 'epoch': 1.43} {'loss': 0.5568, 'learning_rate': 3.8020255737019905e-06, 'epoch': 1.43} {'loss': 0.4937, 'learning_rate': 3.8017686840354353e-06, 'epoch': 1.43} {'loss': 0.558, 'learning_rate': 3.8015118010108465e-06, 'epoch': 1.43} {'loss': 0.4935, 'learning_rate': 3.801254924628491e-06, 'epoch': 1.43} {'loss': 0.5279, 'learning_rate': 3.8009980548886583e-06, 'epoch': 1.43} {'loss': 0.5044, 'learning_rate': 3.8007411917916102e-06, 'epoch': 1.43} {'loss': 0.5265, 'learning_rate': 3.8004843353376298e-06, 'epoch': 1.43} {'loss': 0.5616, 'learning_rate': 3.8002274855269884e-06, 'epoch': 1.43} {'loss': 0.6447, 'learning_rate': 3.7999706423599624e-06, 'epoch': 1.43} {'loss': 0.3857, 'learning_rate': 3.799713805836832e-06, 'epoch': 1.43} {'loss': 0.6069, 'learning_rate': 3.7994569759578605e-06, 'epoch': 1.43} {'loss': 0.5087, 'learning_rate': 3.799200152723338e-06, 'epoch': 1.43} {'loss': 0.3201, 'learning_rate': 3.7989433361335282e-06, 'epoch': 1.43} {'loss': 0.5453, 'learning_rate': 3.7986865261887094e-06, 'epoch': 1.43} {'loss': 0.6919, 'learning_rate': 3.798429722889159e-06, 'epoch': 1.43} {'loss': 0.4274, 'learning_rate': 3.798172926235151e-06, 'epoch': 1.43} {'loss': 0.6204, 'learning_rate': 3.7979161362269635e-06, 'epoch': 1.43} {'loss': 0.4973, 'learning_rate': 3.7976593528648643e-06, 'epoch': 1.43} {'loss': 0.5997, 'learning_rate': 3.797402576149134e-06, 'epoch': 1.43} {'loss': 0.5547, 'learning_rate': 3.797145806080046e-06, 'epoch': 1.43} {'loss': 0.6105, 'learning_rate': 3.7968890426578764e-06, 'epoch': 1.43} {'loss': 0.5791, 'learning_rate': 3.796632285882901e-06, 'epoch': 1.43} {'loss': 0.5594, 'learning_rate': 3.796375535755392e-06, 'epoch': 1.43} {'loss': 0.4983, 'learning_rate': 3.7961187922756317e-06, 'epoch': 1.43} {'loss': 0.3797, 'learning_rate': 3.795862055443885e-06, 'epoch': 1.43} {'loss': 0.4046, 'learning_rate': 3.795605325260434e-06, 'epoch': 1.43} {'loss': 0.5519, 'learning_rate': 3.79534860172555e-06, 'epoch': 1.43} {'loss': 0.4845, 'learning_rate': 3.7950918848395114e-06, 'epoch': 1.43} {'loss': 0.4593, 'learning_rate': 3.7948351746025915e-06, 'epoch': 1.43} {'loss': 0.5506, 'learning_rate': 3.7945784710150657e-06, 'epoch': 1.43} {'loss': 0.4578, 'learning_rate': 3.794321774077212e-06, 'epoch': 1.43} {'loss': 0.5533, 'learning_rate': 3.7940650837893e-06, 'epoch': 1.43} {'loss': 0.6423, 'learning_rate': 3.7938084001516074e-06, 'epoch': 1.43} {'loss': 0.5367, 'learning_rate': 3.793551723164408e-06, 'epoch': 1.43} {'loss': 0.4069, 'learning_rate': 3.79329505282798e-06, 'epoch': 1.43} {'loss': 0.656, 'learning_rate': 3.7930383891425948e-06, 'epoch': 1.43} {'loss': 0.5893, 'learning_rate': 3.7927817321085334e-06, 'epoch': 1.43} {'loss': 0.606, 'learning_rate': 3.792525081726063e-06, 'epoch': 1.43} {'loss': 0.5938, 'learning_rate': 3.792268437995462e-06, 'epoch': 1.43} {'loss': 0.4603, 'learning_rate': 3.792011800917007e-06, 'epoch': 1.43} {'loss': 0.4934, 'learning_rate': 3.7917551704909704e-06, 'epoch': 1.43} {'loss': 0.4361, 'learning_rate': 3.7914985467176292e-06, 'epoch': 1.43} {'loss': 0.5774, 'learning_rate': 3.79124192959726e-06, 'epoch': 1.43} {'loss': 0.5249, 'learning_rate': 3.7909853191301326e-06, 'epoch': 1.43} {'loss': 0.5185, 'learning_rate': 3.7907287153165253e-06, 'epoch': 1.43} {'loss': 0.5967, 'learning_rate': 3.7904721181567115e-06, 'epoch': 1.43} {'loss': 0.4388, 'learning_rate': 3.790215527650968e-06, 'epoch': 1.43} {'loss': 0.455, 'learning_rate': 3.7899589437995686e-06, 'epoch': 1.43} {'loss': 0.4262, 'learning_rate': 3.7897023666027933e-06, 'epoch': 1.43} {'loss': 0.5328, 'learning_rate': 3.789445796060908e-06, 'epoch': 1.43} {'loss': 0.4753, 'learning_rate': 3.789189232174192e-06, 'epoch': 1.43} {'loss': 0.4547, 'learning_rate': 3.7889326749429213e-06, 'epoch': 1.43} {'loss': 0.6209, 'learning_rate': 3.788676124367369e-06, 'epoch': 1.43} {'loss': 0.5137, 'learning_rate': 3.788419580447811e-06, 'epoch': 1.43} {'loss': 0.5737, 'learning_rate': 3.7881630431845218e-06, 'epoch': 1.43} {'loss': 0.4482, 'learning_rate': 3.7879065125777803e-06, 'epoch': 1.43} {'loss': 0.6035, 'learning_rate': 3.787649988627854e-06, 'epoch': 1.43} {'loss': 0.4967, 'learning_rate': 3.7873934713350215e-06, 'epoch': 1.43} {'loss': 0.4352, 'learning_rate': 3.787136960699557e-06, 'epoch': 1.43} {'loss': 0.4611, 'learning_rate': 3.7868804567217364e-06, 'epoch': 1.43} {'loss': 0.5341, 'learning_rate': 3.786623959401835e-06, 'epoch': 1.43} {'loss': 0.5745, 'learning_rate': 3.7863674687401264e-06, 'epoch': 1.43} {'loss': 0.5084, 'learning_rate': 3.7861109847368883e-06, 'epoch': 1.43} {'loss': 0.3649, 'learning_rate': 3.7858545073923913e-06, 'epoch': 1.43} {'loss': 0.3551, 'learning_rate': 3.785598036706911e-06, 'epoch': 1.43} {'loss': 0.5562, 'learning_rate': 3.785341572680723e-06, 'epoch': 1.43} {'loss': 0.537, 'learning_rate': 3.7850851153141034e-06, 'epoch': 1.43} {'loss': 0.6763, 'learning_rate': 3.7848286646073285e-06, 'epoch': 1.43} {'loss': 0.4394, 'learning_rate': 3.784572220560665e-06, 'epoch': 1.43} {'loss': 0.4624, 'learning_rate': 3.784315783174399e-06, 'epoch': 1.43} {'loss': 0.7719, 'learning_rate': 3.784059352448797e-06, 'epoch': 1.43} {'loss': 0.5316, 'learning_rate': 3.783802928384136e-06, 'epoch': 1.43} {'loss': 0.6262, 'learning_rate': 3.783546510980691e-06, 'epoch': 1.43} {'loss': 0.3666, 'learning_rate': 3.783290100238738e-06, 'epoch': 1.43} {'loss': 0.4611, 'learning_rate': 3.7830336961585534e-06, 'epoch': 1.43} {'loss': 0.6087, 'learning_rate': 3.782777298740402e-06, 'epoch': 1.43} {'loss': 0.5404, 'learning_rate': 3.7825209079845737e-06, 'epoch': 1.43} {'loss': 0.466, 'learning_rate': 3.7822645238913314e-06, 'epoch': 1.43} {'loss': 0.5383, 'learning_rate': 3.7820081464609537e-06, 'epoch': 1.43} {'loss': 0.4871, 'learning_rate': 3.781751775693716e-06, 'epoch': 1.43} {'loss': 0.4194, 'learning_rate': 3.7814954115898916e-06, 'epoch': 1.43} {'loss': 0.6002, 'learning_rate': 3.7812390541497613e-06, 'epoch': 1.43} {'loss': 0.5605, 'learning_rate': 3.780982703373586e-06, 'epoch': 1.43} {'loss': 0.4012, 'learning_rate': 3.780726359261657e-06, 'epoch': 1.43} {'loss': 0.6463, 'learning_rate': 3.7804700218142363e-06, 'epoch': 1.43} {'loss': 0.4757, 'learning_rate': 3.7802136910316045e-06, 'epoch': 1.43} {'loss': 0.4664, 'learning_rate': 3.7799573669140387e-06, 'epoch': 1.43} {'loss': 0.7236, 'learning_rate': 3.7797010494618027e-06, 'epoch': 1.43} {'loss': 0.5521, 'learning_rate': 3.7794447386751853e-06, 'epoch': 1.43} {'loss': 0.6617, 'learning_rate': 3.7791884345544474e-06, 'epoch': 1.43} {'loss': 0.5646, 'learning_rate': 3.778932137099878e-06, 'epoch': 1.43} {'loss': 0.4378, 'learning_rate': 3.778675846311739e-06, 'epoch': 1.43} {'loss': 0.4658, 'learning_rate': 3.778419562190312e-06, 'epoch': 1.43} {'loss': 0.5909, 'learning_rate': 3.778163284735873e-06, 'epoch': 1.43} {'loss': 0.6437, 'learning_rate': 3.7779070139486873e-06, 'epoch': 1.43} {'loss': 0.4957, 'learning_rate': 3.7776507498290418e-06, 'epoch': 1.43} {'loss': 0.5971, 'learning_rate': 3.777394492377199e-06, 'epoch': 1.43} {'loss': 0.5883, 'learning_rate': 3.7771382415934456e-06, 'epoch': 1.43} {'loss': 0.535, 'learning_rate': 3.7768819974780468e-06, 'epoch': 1.43} {'loss': 0.5378, 'learning_rate': 3.7766257600312816e-06, 'epoch': 1.43} {'loss': 0.5722, 'learning_rate': 3.776369529253426e-06, 'epoch': 1.43} {'loss': 0.5008, 'learning_rate': 3.776113305144746e-06, 'epoch': 1.43} {'loss': 0.4355, 'learning_rate': 3.775857087705529e-06, 'epoch': 1.43} {'loss': 0.5247, 'learning_rate': 3.7756008769360363e-06, 'epoch': 1.43} {'loss': 0.5227, 'learning_rate': 3.7753446728365564e-06, 'epoch': 1.43} {'loss': 0.4416, 'learning_rate': 3.775088475407351e-06, 'epoch': 1.43} {'loss': 0.5232, 'learning_rate': 3.774832284648702e-06, 'epoch': 1.43} {'loss': 0.394, 'learning_rate': 3.774576100560885e-06, 'epoch': 1.43} {'loss': 0.6214, 'learning_rate': 3.774319923144165e-06, 'epoch': 1.43} {'loss': 0.5364, 'learning_rate': 3.7740637523988287e-06, 'epoch': 1.43} {'loss': 0.4816, 'learning_rate': 3.77380758832514e-06, 'epoch': 1.43} {'loss': 0.4149, 'learning_rate': 3.7735514309233845e-06, 'epoch': 1.43} {'loss': 0.5837, 'learning_rate': 3.773295280193827e-06, 'epoch': 1.43} {'loss': 0.5339, 'learning_rate': 3.7730391361367456e-06, 'epoch': 1.43} {'loss': 0.5655, 'learning_rate': 3.7727829987524177e-06, 'epoch': 1.43} {'loss': 0.3918, 'learning_rate': 3.7725268680411086e-06, 'epoch': 1.43} {'loss': 0.5882, 'learning_rate': 3.7722707440031057e-06, 'epoch': 1.43} {'loss': 0.5547, 'learning_rate': 3.772014626638674e-06, 'epoch': 1.43} {'loss': 0.6676, 'learning_rate': 3.7717585159480895e-06, 'epoch': 1.43} {'loss': 0.5258, 'learning_rate': 3.771502411931629e-06, 'epoch': 1.43} {'loss': 0.5567, 'learning_rate': 3.7712463145895663e-06, 'epoch': 1.43} {'loss': 0.5891, 'learning_rate': 3.7709902239221772e-06, 'epoch': 1.43} {'loss': 0.5126, 'learning_rate': 3.770734139929728e-06, 'epoch': 1.43} {'loss': 0.5869, 'learning_rate': 3.770478062612507e-06, 'epoch': 1.43} {'loss': 0.5349, 'learning_rate': 3.770221991970777e-06, 'epoch': 1.43} {'loss': 0.434, 'learning_rate': 3.769965928004816e-06, 'epoch': 1.43} {'loss': 0.6291, 'learning_rate': 3.7697098707148993e-06, 'epoch': 1.43} {'loss': 0.5367, 'learning_rate': 3.7694538201013008e-06, 'epoch': 1.43} {'loss': 0.5839, 'learning_rate': 3.7691977761642984e-06, 'epoch': 1.43} {'loss': 0.5692, 'learning_rate': 3.7689417389041548e-06, 'epoch': 1.43} {'loss': 0.5665, 'learning_rate': 3.7686857083211613e-06, 'epoch': 1.43} {'loss': 0.7042, 'learning_rate': 3.768429684415579e-06, 'epoch': 1.43} {'loss': 0.5573, 'learning_rate': 3.768173667187687e-06, 'epoch': 1.43} {'loss': 0.4783, 'learning_rate': 3.767917656637763e-06, 'epoch': 1.43} {'loss': 0.5011, 'learning_rate': 3.7676616527660703e-06, 'epoch': 1.43} {'loss': 0.5544, 'learning_rate': 3.767405655572898e-06, 'epoch': 1.43} {'loss': 0.5045, 'learning_rate': 3.767149665058509e-06, 'epoch': 1.43} {'loss': 0.4893, 'learning_rate': 3.7668936812231827e-06, 'epoch': 1.43} {'loss': 0.6219, 'learning_rate': 3.766637704067191e-06, 'epoch': 1.43} {'loss': 0.5362, 'learning_rate': 3.7663817335908103e-06, 'epoch': 1.43} {'loss': 0.6313, 'learning_rate': 3.7661257697943187e-06, 'epoch': 1.43} {'loss': 0.4366, 'learning_rate': 3.765869812677978e-06, 'epoch': 1.43} {'loss': 0.6277, 'learning_rate': 3.7656138622420766e-06, 'epoch': 1.43} {'loss': 0.6558, 'learning_rate': 3.7653579184868805e-06, 'epoch': 1.43} {'loss': 0.5145, 'learning_rate': 3.7651019814126656e-06, 'epoch': 1.43} {'loss': 0.5582, 'learning_rate': 3.7648460510197073e-06, 'epoch': 1.43} {'loss': 0.4933, 'learning_rate': 3.7645901273082787e-06, 'epoch': 1.43} {'loss': 0.4856, 'learning_rate': 3.7643342102786572e-06, 'epoch': 1.43} {'loss': 0.5834, 'learning_rate': 3.764078299931109e-06, 'epoch': 1.43} {'loss': 0.4673, 'learning_rate': 3.7638223962659194e-06, 'epoch': 1.43} {'loss': 0.544, 'learning_rate': 3.763566499283354e-06, 'epoch': 1.43} {'loss': 0.5977, 'learning_rate': 3.7633106089836903e-06, 'epoch': 1.43} {'loss': 0.3467, 'learning_rate': 3.763054725367201e-06, 'epoch': 1.43} {'loss': 0.5357, 'learning_rate': 3.7627988484341627e-06, 'epoch': 1.43} {'loss': 0.5742, 'learning_rate': 3.762542978184851e-06, 'epoch': 1.43} {'loss': 0.6435, 'learning_rate': 3.762287114619535e-06, 'epoch': 1.43} {'loss': 0.5054, 'learning_rate': 3.762031257738491e-06, 'epoch': 1.43} {'loss': 0.4817, 'learning_rate': 3.761775407541993e-06, 'epoch': 1.43} {'loss': 0.4911, 'learning_rate': 3.761519564030316e-06, 'epoch': 1.43} {'loss': 0.4852, 'learning_rate': 3.761263727203733e-06, 'epoch': 1.43} {'loss': 0.5192, 'learning_rate': 3.7610078970625206e-06, 'epoch': 1.43} {'loss': 0.593, 'learning_rate': 3.7607520736069535e-06, 'epoch': 1.43} {'loss': 0.5453, 'learning_rate': 3.7604962568373016e-06, 'epoch': 1.43} {'loss': 0.4236, 'learning_rate': 3.76024044675384e-06, 'epoch': 1.43} {'loss': 0.6617, 'learning_rate': 3.7599846433568443e-06, 'epoch': 1.43} {'loss': 0.4749, 'learning_rate': 3.7597288466465877e-06, 'epoch': 1.43} {'loss': 0.5897, 'learning_rate': 3.759473056623345e-06, 'epoch': 1.43} {'loss': 0.4758, 'learning_rate': 3.759217273287391e-06, 'epoch': 1.43} {'loss': 0.5799, 'learning_rate': 3.758961496639002e-06, 'epoch': 1.43} {'loss': 0.5042, 'learning_rate': 3.7587057266784454e-06, 'epoch': 1.43} {'loss': 0.4449, 'learning_rate': 3.758449963405999e-06, 'epoch': 1.43} {'loss': 0.5978, 'learning_rate': 3.758194206821937e-06, 'epoch': 1.43} {'loss': 0.4912, 'learning_rate': 3.757938456926533e-06, 'epoch': 1.43} {'loss': 0.5344, 'learning_rate': 3.757682713720061e-06, 'epoch': 1.43} {'loss': 0.5713, 'learning_rate': 3.7574269772027993e-06, 'epoch': 1.43} {'loss': 0.5619, 'learning_rate': 3.7571712473750143e-06, 'epoch': 1.43} {'loss': 0.4253, 'learning_rate': 3.7569155242369837e-06, 'epoch': 1.43} {'loss': 0.4919, 'learning_rate': 3.7566598077889828e-06, 'epoch': 1.43} {'loss': 0.5764, 'learning_rate': 3.7564040980312835e-06, 'epoch': 1.43} {'loss': 0.7253, 'learning_rate': 3.7561483949641597e-06, 'epoch': 1.43} {'loss': 0.4937, 'learning_rate': 3.7558926985878873e-06, 'epoch': 1.43} {'loss': 0.4926, 'learning_rate': 3.7556370089027437e-06, 'epoch': 1.43} {'loss': 0.5554, 'learning_rate': 3.7553813259089942e-06, 'epoch': 1.43} {'loss': 0.3977, 'learning_rate': 3.7551256496069178e-06, 'epoch': 1.43} {'loss': 0.575, 'learning_rate': 3.754869979996787e-06, 'epoch': 1.43} {'loss': 0.5191, 'learning_rate': 3.754614317078877e-06, 'epoch': 1.43} {'loss': 0.6406, 'learning_rate': 3.7543586608534623e-06, 'epoch': 1.43} {'loss': 0.4193, 'learning_rate': 3.7541030113208156e-06, 'epoch': 1.43} {'loss': 0.5333, 'learning_rate': 3.753847368481215e-06, 'epoch': 1.43} {'loss': 0.5605, 'learning_rate': 3.7535917323349257e-06, 'epoch': 1.43} {'loss': 0.4605, 'learning_rate': 3.753336102882228e-06, 'epoch': 1.43} {'loss': 0.3893, 'learning_rate': 3.7530804801233945e-06, 'epoch': 1.43} {'loss': 0.5829, 'learning_rate': 3.7528248640586984e-06, 'epoch': 1.43} {'loss': 0.5027, 'learning_rate': 3.7525692546884183e-06, 'epoch': 1.43} {'loss': 0.3169, 'learning_rate': 3.752313652012817e-06, 'epoch': 1.43} {'loss': 0.5445, 'learning_rate': 3.752058056032183e-06, 'epoch': 1.43} {'loss': 0.5166, 'learning_rate': 3.7518024667467778e-06, 'epoch': 1.43} {'loss': 0.5751, 'learning_rate': 3.7515468841568813e-06, 'epoch': 1.43} {'loss': 0.5276, 'learning_rate': 3.7512913082627668e-06, 'epoch': 1.43} {'loss': 0.4454, 'learning_rate': 3.751035739064707e-06, 'epoch': 1.43} {'loss': 0.6153, 'learning_rate': 3.7507801765629794e-06, 'epoch': 1.43} {'loss': 0.4802, 'learning_rate': 3.7505246207578517e-06, 'epoch': 1.43} {'loss': 0.644, 'learning_rate': 3.7502690716496e-06, 'epoch': 1.43} {'loss': 0.3812, 'learning_rate': 3.750013529238501e-06, 'epoch': 1.43} {'loss': 0.522, 'learning_rate': 3.749757993524825e-06, 'epoch': 1.43} {'loss': 0.5422, 'learning_rate': 3.7495024645088486e-06, 'epoch': 1.43} {'loss': 0.5355, 'learning_rate': 3.749246942190844e-06, 'epoch': 1.43} {'loss': 0.5438, 'learning_rate': 3.748991426571088e-06, 'epoch': 1.43} {'loss': 0.5592, 'learning_rate': 3.7487359176498496e-06, 'epoch': 1.43} {'loss': 0.6517, 'learning_rate': 3.7484804154274048e-06, 'epoch': 1.43} {'loss': 0.3978, 'learning_rate': 3.7482249199040267e-06, 'epoch': 1.43} {'loss': 0.4802, 'learning_rate': 3.747969431079991e-06, 'epoch': 1.43} {'loss': 0.6764, 'learning_rate': 3.7477139489555725e-06, 'epoch': 1.43} {'loss': 0.5109, 'learning_rate': 3.7474584735310373e-06, 'epoch': 1.43} {'loss': 0.4142, 'learning_rate': 3.747203004806671e-06, 'epoch': 1.43} {'loss': 0.5614, 'learning_rate': 3.746947542782737e-06, 'epoch': 1.43} {'loss': 0.5217, 'learning_rate': 3.7466920874595135e-06, 'epoch': 1.43} {'loss': 0.6335, 'learning_rate': 3.7464366388372742e-06, 'epoch': 1.43} {'loss': 0.4178, 'learning_rate': 3.746181196916292e-06, 'epoch': 1.43} {'loss': 0.4405, 'learning_rate': 3.745925761696845e-06, 'epoch': 1.43} {'loss': 0.5946, 'learning_rate': 3.7456703331791956e-06, 'epoch': 1.43} {'loss': 0.5003, 'learning_rate': 3.745414911363632e-06, 'epoch': 1.43} {'loss': 0.6361, 'learning_rate': 3.7451594962504166e-06, 'epoch': 1.43} {'loss': 0.6125, 'learning_rate': 3.744904087839828e-06, 'epoch': 1.43} {'loss': 0.578, 'learning_rate': 3.744648686132143e-06, 'epoch': 1.43} {'loss': 0.5988, 'learning_rate': 3.7443932911276237e-06, 'epoch': 1.43} {'loss': 0.5885, 'learning_rate': 3.74413790282656e-06, 'epoch': 1.43} {'loss': 0.5702, 'learning_rate': 3.7438825212292095e-06, 'epoch': 1.43} {'loss': 0.5936, 'learning_rate': 3.7436271463358596e-06, 'epoch': 1.43} {'loss': 0.5805, 'learning_rate': 3.743371778146776e-06, 'epoch': 1.43} {'loss': 0.6114, 'learning_rate': 3.7431164166622324e-06, 'epoch': 1.43} {'loss': 0.5574, 'learning_rate': 3.742861061882509e-06, 'epoch': 1.43} {'loss': 0.4447, 'learning_rate': 3.7426057138078677e-06, 'epoch': 1.43} {'loss': 0.5485, 'learning_rate': 3.7423503724385957e-06, 'epoch': 1.43} {'loss': 0.4438, 'learning_rate': 3.7420950377749532e-06, 'epoch': 1.43} {'loss': 0.5145, 'learning_rate': 3.7418397098172287e-06, 'epoch': 1.43} {'loss': 0.5061, 'learning_rate': 3.7415843885656833e-06, 'epoch': 1.43} {'loss': 0.6206, 'learning_rate': 3.741329074020594e-06, 'epoch': 1.43} {'loss': 0.6569, 'learning_rate': 3.7410737661822404e-06, 'epoch': 1.43} {'loss': 0.4601, 'learning_rate': 3.740818465050884e-06, 'epoch': 1.43} {'loss': 0.5416, 'learning_rate': 3.740563170626813e-06, 'epoch': 1.43} {'loss': 0.5487, 'learning_rate': 3.7403078829102856e-06, 'epoch': 1.43} {'loss': 0.7692, 'learning_rate': 3.7400526019015902e-06, 'epoch': 1.43} {'loss': 0.5619, 'learning_rate': 3.7397973276009914e-06, 'epoch': 1.43} {'loss': 0.6256, 'learning_rate': 3.739542060008763e-06, 'epoch': 1.43} {'loss': 0.544, 'learning_rate': 3.7392867991251847e-06, 'epoch': 1.43} {'loss': 0.403, 'learning_rate': 3.739031544950519e-06, 'epoch': 1.43} {'loss': 0.5925, 'learning_rate': 3.738776297485053e-06, 'epoch': 1.43} {'loss': 0.6843, 'learning_rate': 3.7385210567290455e-06, 'epoch': 1.43} {'loss': 0.5252, 'learning_rate': 3.738265822682785e-06, 'epoch': 1.43} {'loss': 0.4801, 'learning_rate': 3.738010595346534e-06, 'epoch': 1.43} {'loss': 0.4836, 'learning_rate': 3.7377553747205706e-06, 'epoch': 1.43} {'loss': 0.7067, 'learning_rate': 3.737500160805171e-06, 'epoch': 1.43} {'loss': 0.2761, 'learning_rate': 3.7372449536005983e-06, 'epoch': 1.43} {'loss': 0.3933, 'learning_rate': 3.73698975310714e-06, 'epoch': 1.43} {'loss': 0.53, 'learning_rate': 3.7367345593250547e-06, 'epoch': 1.43} {'loss': 0.6941, 'learning_rate': 3.736479372254631e-06, 'epoch': 1.43} {'loss': 0.6405, 'learning_rate': 3.7362241918961305e-06, 'epoch': 1.43} {'loss': 0.4868, 'learning_rate': 3.735969018249833e-06, 'epoch': 1.43} {'loss': 0.6768, 'learning_rate': 3.735713851316012e-06, 'epoch': 1.43} {'loss': 0.4306, 'learning_rate': 3.735458691094933e-06, 'epoch': 1.43} {'loss': 0.5167, 'learning_rate': 3.7352035375868823e-06, 'epoch': 1.43} {'loss': 0.3956, 'learning_rate': 3.7349483907921223e-06, 'epoch': 1.43} {'loss': 0.447, 'learning_rate': 3.734693250710931e-06, 'epoch': 1.43} {'loss': 0.6754, 'learning_rate': 3.734438117343582e-06, 'epoch': 1.43} {'loss': 0.5906, 'learning_rate': 3.734182990690347e-06, 'epoch': 1.43} {'loss': 0.4691, 'learning_rate': 3.7339278707515038e-06, 'epoch': 1.43} {'loss': 0.4931, 'learning_rate': 3.733672757527316e-06, 'epoch': 1.43} {'loss': 0.5532, 'learning_rate': 3.733417651018071e-06, 'epoch': 1.43} {'loss': 0.4857, 'learning_rate': 3.73316255122403e-06, 'epoch': 1.43} {'loss': 0.5239, 'learning_rate': 3.7329074581454716e-06, 'epoch': 1.43} {'loss': 0.6613, 'learning_rate': 3.7326523717826677e-06, 'epoch': 1.43} {'loss': 0.5318, 'learning_rate': 3.7323972921358933e-06, 'epoch': 1.43} {'loss': 0.6755, 'learning_rate': 3.7321422192054235e-06, 'epoch': 1.43} {'loss': 0.5885, 'learning_rate': 3.7318871529915234e-06, 'epoch': 1.43} {'loss': 0.5552, 'learning_rate': 3.731632093494478e-06, 'epoch': 1.43} {'loss': 0.4937, 'learning_rate': 3.731377040714551e-06, 'epoch': 1.43} {'loss': 0.4654, 'learning_rate': 3.7311219946520194e-06, 'epoch': 1.43} {'loss': 0.5918, 'learning_rate': 3.7308669553071564e-06, 'epoch': 1.43} {'loss': 0.5276, 'learning_rate': 3.7306119226802362e-06, 'epoch': 1.43} {'loss': 0.5787, 'learning_rate': 3.7303568967715333e-06, 'epoch': 1.43} {'loss': 0.4837, 'learning_rate': 3.7301018775813158e-06, 'epoch': 1.43} {'loss': 0.4731, 'learning_rate': 3.7298468651098605e-06, 'epoch': 1.43} {'loss': 0.5605, 'learning_rate': 3.72959185935744e-06, 'epoch': 1.43} {'loss': 0.6381, 'learning_rate': 3.7293368603243275e-06, 'epoch': 1.43} {'loss': 0.5401, 'learning_rate': 3.7290818680108e-06, 'epoch': 1.43} {'loss': 0.5147, 'learning_rate': 3.72882688241712e-06, 'epoch': 1.43} {'loss': 0.6006, 'learning_rate': 3.7285719035435754e-06, 'epoch': 1.43} {'loss': 0.4597, 'learning_rate': 3.728316931390429e-06, 'epoch': 1.43} {'loss': 0.4852, 'learning_rate': 3.7280619659579565e-06, 'epoch': 1.43} {'loss': 0.6394, 'learning_rate': 3.7278070072464313e-06, 'epoch': 1.43} {'loss': 0.6692, 'learning_rate': 3.7275520552561275e-06, 'epoch': 1.43} {'loss': 0.379, 'learning_rate': 3.7272971099873214e-06, 'epoch': 1.43} {'loss': 0.4473, 'learning_rate': 3.727042171440276e-06, 'epoch': 1.43} {'loss': 0.5981, 'learning_rate': 3.726787239615277e-06, 'epoch': 1.43} {'loss': 0.4827, 'learning_rate': 3.7265323145125887e-06, 'epoch': 1.43} {'loss': 0.4558, 'learning_rate': 3.7262773961324874e-06, 'epoch': 1.43} {'loss': 0.5739, 'learning_rate': 3.726022484475246e-06, 'epoch': 1.43} {'loss': 0.4976, 'learning_rate': 3.7257675795411374e-06, 'epoch': 1.43} {'loss': 0.4681, 'learning_rate': 3.725512681330439e-06, 'epoch': 1.43} {'loss': 0.4424, 'learning_rate': 3.725257789843416e-06, 'epoch': 1.43} {'loss': 0.6, 'learning_rate': 3.725002905080347e-06, 'epoch': 1.43} {'loss': 0.5484, 'learning_rate': 3.7247480270415024e-06, 'epoch': 1.43} {'loss': 0.4082, 'learning_rate': 3.724493155727157e-06, 'epoch': 1.43} {'loss': 0.6649, 'learning_rate': 3.724238291137584e-06, 'epoch': 1.43} {'loss': 0.5451, 'learning_rate': 3.723983433273056e-06, 'epoch': 1.43} {'loss': 0.5216, 'learning_rate': 3.72372858213385e-06, 'epoch': 1.43} {'loss': 0.4142, 'learning_rate': 3.72347373772023e-06, 'epoch': 1.43} {'loss': 0.4525, 'learning_rate': 3.723218900032476e-06, 'epoch': 1.43} {'loss': 0.5021, 'learning_rate': 3.722964069070859e-06, 'epoch': 1.43} {'loss': 0.53, 'learning_rate': 3.7227092448356527e-06, 'epoch': 1.43} {'loss': 0.4987, 'learning_rate': 3.72245442732713e-06, 'epoch': 1.43} {'loss': 0.4691, 'learning_rate': 3.7221996165455676e-06, 'epoch': 1.43} {'loss': 0.5671, 'learning_rate': 3.7219448124912315e-06, 'epoch': 1.43} {'loss': 0.5006, 'learning_rate': 3.7216900151643974e-06, 'epoch': 1.43} {'loss': 0.5798, 'learning_rate': 3.7214352245653406e-06, 'epoch': 1.43} {'loss': 0.4305, 'learning_rate': 3.721180440694331e-06, 'epoch': 1.43} {'loss': 0.5579, 'learning_rate': 3.7209256635516444e-06, 'epoch': 1.43} {'loss': 0.4996, 'learning_rate': 3.720670893137552e-06, 'epoch': 1.43} {'loss': 0.3863, 'learning_rate': 3.720416129452331e-06, 'epoch': 1.43} {'loss': 0.5447, 'learning_rate': 3.7201613724962483e-06, 'epoch': 1.43} {'loss': 0.4966, 'learning_rate': 3.719906622269578e-06, 'epoch': 1.43} {'loss': 0.4328, 'learning_rate': 3.7196518787725956e-06, 'epoch': 1.43} {'loss': 0.4273, 'learning_rate': 3.719397142005573e-06, 'epoch': 1.43} {'loss': 0.4811, 'learning_rate': 3.7191424119687824e-06, 'epoch': 1.43} {'loss': 0.6036, 'learning_rate': 3.7188876886624982e-06, 'epoch': 1.43} {'loss': 0.4529, 'learning_rate': 3.7186329720869962e-06, 'epoch': 1.43} {'loss': 0.6769, 'learning_rate': 3.7183782622425423e-06, 'epoch': 1.43} {'loss': 0.5278, 'learning_rate': 3.718123559129413e-06, 'epoch': 1.43} {'loss': 0.3557, 'learning_rate': 3.717868862747882e-06, 'epoch': 1.43} {'loss': 0.4845, 'learning_rate': 3.7176141730982205e-06, 'epoch': 1.43} {'loss': 0.5388, 'learning_rate': 3.7173594901807064e-06, 'epoch': 1.43} {'loss': 0.3699, 'learning_rate': 3.7171048139956025e-06, 'epoch': 1.43} {'loss': 0.4838, 'learning_rate': 3.7168501445431937e-06, 'epoch': 1.43} {'loss': 0.5101, 'learning_rate': 3.716595481823744e-06, 'epoch': 1.43} {'loss': 0.539, 'learning_rate': 3.716340825837529e-06, 'epoch': 1.43} {'loss': 0.5643, 'learning_rate': 3.716086176584822e-06, 'epoch': 1.43} {'loss': 0.4294, 'learning_rate': 3.7158315340658957e-06, 'epoch': 1.43} {'loss': 0.5621, 'learning_rate': 3.715576898281027e-06, 'epoch': 1.43} {'loss': 0.4737, 'learning_rate': 3.715322269230478e-06, 'epoch': 1.43} {'loss': 0.4977, 'learning_rate': 3.715067646914535e-06, 'epoch': 1.43} {'loss': 0.5747, 'learning_rate': 3.7148130313334607e-06, 'epoch': 1.43} {'loss': 0.4934, 'learning_rate': 3.714558422487532e-06, 'epoch': 1.43} {'loss': 0.563, 'learning_rate': 3.7143038203770208e-06, 'epoch': 1.43} {'loss': 0.5019, 'learning_rate': 3.7140492250022007e-06, 'epoch': 1.43} {'loss': 0.6581, 'learning_rate': 3.713794636363347e-06, 'epoch': 1.43} {'loss': 0.4742, 'learning_rate': 3.7135400544607236e-06, 'epoch': 1.43} {'loss': 0.4919, 'learning_rate': 3.713285479294616e-06, 'epoch': 1.43} {'loss': 0.467, 'learning_rate': 3.7130309108652873e-06, 'epoch': 1.43} {'loss': 0.4811, 'learning_rate': 3.7127763491730127e-06, 'epoch': 1.43} {'loss': 0.495, 'learning_rate': 3.712521794218069e-06, 'epoch': 1.43} {'loss': 0.505, 'learning_rate': 3.7122672460007204e-06, 'epoch': 1.43} {'loss': 0.4407, 'learning_rate': 3.7120127045212506e-06, 'epoch': 1.43} {'loss': 0.6018, 'learning_rate': 3.71175816977992e-06, 'epoch': 1.43} {'loss': 0.384, 'learning_rate': 3.7115036417770146e-06, 'epoch': 1.43} {'loss': 0.4411, 'learning_rate': 3.7112491205127976e-06, 'epoch': 1.43} {'loss': 0.4565, 'learning_rate': 3.7109946059875446e-06, 'epoch': 1.43} {'loss': 0.5845, 'learning_rate': 3.710740098201532e-06, 'epoch': 1.43} {'loss': 0.6895, 'learning_rate': 3.7104855971550223e-06, 'epoch': 1.43} {'loss': 0.6297, 'learning_rate': 3.710231102848302e-06, 'epoch': 1.43} {'loss': 0.5429, 'learning_rate': 3.709976615281633e-06, 'epoch': 1.43} {'loss': 0.6352, 'learning_rate': 3.7097221344552915e-06, 'epoch': 1.43} {'loss': 0.6856, 'learning_rate': 3.7094676603695514e-06, 'epoch': 1.43} {'loss': 0.5049, 'learning_rate': 3.7092131930246833e-06, 'epoch': 1.43} {'loss': 0.6106, 'learning_rate': 3.7089587324209654e-06, 'epoch': 1.43} {'loss': 0.3622, 'learning_rate': 3.708704278558658e-06, 'epoch': 1.43} {'loss': 0.582, 'learning_rate': 3.708449831438049e-06, 'epoch': 1.43} {'loss': 0.5909, 'learning_rate': 3.7081953910594014e-06, 'epoch': 1.43} {'loss': 0.5651, 'learning_rate': 3.7079409574229895e-06, 'epoch': 1.44} {'loss': 0.6617, 'learning_rate': 3.707686530529088e-06, 'epoch': 1.44} {'loss': 0.5056, 'learning_rate': 3.7074321103779665e-06, 'epoch': 1.44} {'loss': 0.5751, 'learning_rate': 3.707177696969904e-06, 'epoch': 1.44} {'loss': 0.6761, 'learning_rate': 3.706923290305161e-06, 'epoch': 1.44} {'loss': 0.5972, 'learning_rate': 3.7066688903840253e-06, 'epoch': 1.44} {'loss': 0.538, 'learning_rate': 3.706414497206757e-06, 'epoch': 1.44} {'loss': 0.4746, 'learning_rate': 3.7061601107736355e-06, 'epoch': 1.44} {'loss': 0.5017, 'learning_rate': 3.7059057310849334e-06, 'epoch': 1.44} {'loss': 0.5865, 'learning_rate': 3.705651358140916e-06, 'epoch': 1.44} {'loss': 0.6047, 'learning_rate': 3.7053969919418662e-06, 'epoch': 1.44} {'loss': 0.4327, 'learning_rate': 3.705142632488047e-06, 'epoch': 1.44} {'loss': 0.5332, 'learning_rate': 3.7048882797797415e-06, 'epoch': 1.44} {'loss': 0.5196, 'learning_rate': 3.704633933817212e-06, 'epoch': 1.44} {'loss': 0.4335, 'learning_rate': 3.7043795946007365e-06, 'epoch': 1.44} {'loss': 0.3691, 'learning_rate': 3.7041252621305902e-06, 'epoch': 1.44} {'loss': 0.6368, 'learning_rate': 3.7038709364070347e-06, 'epoch': 1.44} {'loss': 0.6481, 'learning_rate': 3.7036166174303554e-06, 'epoch': 1.44} {'loss': 0.4392, 'learning_rate': 3.7033623052008137e-06, 'epoch': 1.44} {'loss': 0.3565, 'learning_rate': 3.703107999718695e-06, 'epoch': 1.44} {'loss': 0.5649, 'learning_rate': 3.702853700984259e-06, 'epoch': 1.44} {'loss': 0.5867, 'learning_rate': 3.7025994089977856e-06, 'epoch': 1.44} {'loss': 0.5987, 'learning_rate': 3.7023451237595476e-06, 'epoch': 1.44} {'loss': 0.5995, 'learning_rate': 3.7020908452698078e-06, 'epoch': 1.44} {'loss': 0.5058, 'learning_rate': 3.701836573528854e-06, 'epoch': 1.44} {'loss': 0.5646, 'learning_rate': 3.701582308536944e-06, 'epoch': 1.44} {'loss': 0.6359, 'learning_rate': 3.7013280502943638e-06, 'epoch': 1.44} {'loss': 0.6565, 'learning_rate': 3.7010737988013745e-06, 'epoch': 1.44} {'loss': 0.5784, 'learning_rate': 3.700819554058255e-06, 'epoch': 1.44} {'loss': 0.465, 'learning_rate': 3.7005653160652776e-06, 'epoch': 1.44} {'loss': 0.5988, 'learning_rate': 3.7003110848227074e-06, 'epoch': 1.44} {'loss': 0.4345, 'learning_rate': 3.7000568603308284e-06, 'epoch': 1.44} {'loss': 0.5764, 'learning_rate': 3.699802642589905e-06, 'epoch': 1.44} {'loss': 0.5199, 'learning_rate': 3.6995484316002096e-06, 'epoch': 1.44} {'loss': 0.5261, 'learning_rate': 3.699294227362018e-06, 'epoch': 1.44} {'loss': 0.527, 'learning_rate': 3.699040029875601e-06, 'epoch': 1.44} {'loss': 0.464, 'learning_rate': 3.6987858391412356e-06, 'epoch': 1.44} {'loss': 0.2879, 'learning_rate': 3.698531655159182e-06, 'epoch': 1.44} {'loss': 0.595, 'learning_rate': 3.698277477929728e-06, 'epoch': 1.44} {'loss': 0.536, 'learning_rate': 3.6980233074531346e-06, 'epoch': 1.44} {'loss': 0.5456, 'learning_rate': 3.697769143729678e-06, 'epoch': 1.44} {'loss': 0.4607, 'learning_rate': 3.6975149867596307e-06, 'epoch': 1.44} {'loss': 0.4756, 'learning_rate': 3.697260836543265e-06, 'epoch': 1.44} {'loss': 0.4739, 'learning_rate': 3.697006693080857e-06, 'epoch': 1.44} {'loss': 0.4402, 'learning_rate': 3.696752556372667e-06, 'epoch': 1.44} {'loss': 0.5453, 'learning_rate': 3.696498426418983e-06, 'epoch': 1.44} {'loss': 0.551, 'learning_rate': 3.696244303220067e-06, 'epoch': 1.44} {'loss': 0.5846, 'learning_rate': 3.695990186776194e-06, 'epoch': 1.44} {'loss': 0.4909, 'learning_rate': 3.695736077087636e-06, 'epoch': 1.44} {'loss': 0.3874, 'learning_rate': 3.6954819741546666e-06, 'epoch': 1.44} {'loss': 0.6395, 'learning_rate': 3.6952278779775595e-06, 'epoch': 1.44} {'loss': 0.4842, 'learning_rate': 3.694973788556583e-06, 'epoch': 1.44} {'loss': 0.6678, 'learning_rate': 3.69471970589201e-06, 'epoch': 1.44} {'loss': 0.5758, 'learning_rate': 3.6944656299841143e-06, 'epoch': 1.44} {'loss': 0.4705, 'learning_rate': 3.6942115608331676e-06, 'epoch': 1.44} {'loss': 0.5049, 'learning_rate': 3.6939574984394423e-06, 'epoch': 1.44} {'loss': 0.6077, 'learning_rate': 3.6937034428032103e-06, 'epoch': 1.44} {'loss': 0.6206, 'learning_rate': 3.6934493939247486e-06, 'epoch': 1.44} {'loss': 0.4462, 'learning_rate': 3.6931953518043207e-06, 'epoch': 1.44} {'loss': 0.4799, 'learning_rate': 3.6929413164422043e-06, 'epoch': 1.44} {'loss': 0.5298, 'learning_rate': 3.6926872878386697e-06, 'epoch': 1.44} {'loss': 0.4302, 'learning_rate': 3.69243326599399e-06, 'epoch': 1.44} {'loss': 0.5626, 'learning_rate': 3.6921792509084376e-06, 'epoch': 1.44} {'loss': 0.483, 'learning_rate': 3.691925242582285e-06, 'epoch': 1.44} {'loss': 0.5239, 'learning_rate': 3.6916712410158064e-06, 'epoch': 1.44} {'loss': 0.5077, 'learning_rate': 3.691417246209268e-06, 'epoch': 1.44} {'loss': 0.493, 'learning_rate': 3.6911632581629452e-06, 'epoch': 1.44} {'loss': 0.5055, 'learning_rate': 3.6909092768771114e-06, 'epoch': 1.44} {'loss': 0.5493, 'learning_rate': 3.6906553023520374e-06, 'epoch': 1.44} {'loss': 0.6085, 'learning_rate': 3.6904013345879953e-06, 'epoch': 1.44} {'loss': 0.6328, 'learning_rate': 3.690147373585261e-06, 'epoch': 1.44} {'loss': 0.703, 'learning_rate': 3.6898934193441003e-06, 'epoch': 1.44} {'loss': 0.4657, 'learning_rate': 3.6896394718647875e-06, 'epoch': 1.44} {'loss': 0.4592, 'learning_rate': 3.6893855311475967e-06, 'epoch': 1.44} {'loss': 0.5868, 'learning_rate': 3.689131597192799e-06, 'epoch': 1.44} {'loss': 0.5519, 'learning_rate': 3.6888776700006646e-06, 'epoch': 1.44} {'loss': 0.4956, 'learning_rate': 3.6886237495714726e-06, 'epoch': 1.44} {'loss': 0.5178, 'learning_rate': 3.6883698359054855e-06, 'epoch': 1.44} {'loss': 0.6607, 'learning_rate': 3.68811592900298e-06, 'epoch': 1.44} {'loss': 0.5274, 'learning_rate': 3.6878620288642288e-06, 'epoch': 1.44} {'loss': 0.5537, 'learning_rate': 3.687608135489502e-06, 'epoch': 1.44} {'loss': 0.4974, 'learning_rate': 3.6873542488790725e-06, 'epoch': 1.44} {'loss': 0.5442, 'learning_rate': 3.687100369033214e-06, 'epoch': 1.44} {'loss': 0.7361, 'learning_rate': 3.6868464959522e-06, 'epoch': 1.44} {'loss': 0.5457, 'learning_rate': 3.6865926296362965e-06, 'epoch': 1.44} {'loss': 0.496, 'learning_rate': 3.686338770085779e-06, 'epoch': 1.44} {'loss': 0.4499, 'learning_rate': 3.686084917300918e-06, 'epoch': 1.44} {'loss': 0.4546, 'learning_rate': 3.685831071281989e-06, 'epoch': 1.44} {'loss': 0.5162, 'learning_rate': 3.6855772320292602e-06, 'epoch': 1.44} {'loss': 0.5034, 'learning_rate': 3.6853233995430095e-06, 'epoch': 1.44} {'loss': 0.5333, 'learning_rate': 3.685069573823501e-06, 'epoch': 1.44} {'loss': 0.4172, 'learning_rate': 3.684815754871011e-06, 'epoch': 1.44} {'loss': 0.4218, 'learning_rate': 3.6845619426858105e-06, 'epoch': 1.44} {'loss': 0.5456, 'learning_rate': 3.684308137268171e-06, 'epoch': 1.44} {'loss': 0.5115, 'learning_rate': 3.684054338618367e-06, 'epoch': 1.44} {'loss': 0.4835, 'learning_rate': 3.683800546736668e-06, 'epoch': 1.44} {'loss': 0.5747, 'learning_rate': 3.68354676162335e-06, 'epoch': 1.44} {'loss': 0.6137, 'learning_rate': 3.683292983278679e-06, 'epoch': 1.44} {'loss': 0.5271, 'learning_rate': 3.683039211702929e-06, 'epoch': 1.44} {'loss': 0.4688, 'learning_rate': 3.682785446896373e-06, 'epoch': 1.44} {'loss': 0.5523, 'learning_rate': 3.682531688859282e-06, 'epoch': 1.44} {'loss': 0.6058, 'learning_rate': 3.6822779375919293e-06, 'epoch': 1.44} {'loss': 0.5992, 'learning_rate': 3.6820241930945857e-06, 'epoch': 1.44} {'loss': 0.5559, 'learning_rate': 3.681770455367526e-06, 'epoch': 1.44} {'loss': 0.671, 'learning_rate': 3.681516724411017e-06, 'epoch': 1.44} {'loss': 0.5658, 'learning_rate': 3.6812630002253335e-06, 'epoch': 1.44} {'loss': 0.4748, 'learning_rate': 3.6810092828107456e-06, 'epoch': 1.44} {'loss': 0.6228, 'learning_rate': 3.680755572167528e-06, 'epoch': 1.44} {'loss': 0.5378, 'learning_rate': 3.6805018682959535e-06, 'epoch': 1.44} {'loss': 0.4463, 'learning_rate': 3.6802481711962858e-06, 'epoch': 1.44} {'loss': 0.519, 'learning_rate': 3.679994480868809e-06, 'epoch': 1.44} {'loss': 0.6661, 'learning_rate': 3.6797407973137844e-06, 'epoch': 1.44} {'loss': 0.5078, 'learning_rate': 3.6794871205314886e-06, 'epoch': 1.44} {'loss': 0.6235, 'learning_rate': 3.6792334505221927e-06, 'epoch': 1.44} {'loss': 0.451, 'learning_rate': 3.6789797872861687e-06, 'epoch': 1.44} {'loss': 0.6255, 'learning_rate': 3.6787261308236923e-06, 'epoch': 1.44} {'loss': 0.5238, 'learning_rate': 3.6784724811350234e-06, 'epoch': 1.44} {'loss': 0.4856, 'learning_rate': 3.6782188382204498e-06, 'epoch': 1.44} {'loss': 0.4703, 'learning_rate': 3.6779652020802313e-06, 'epoch': 1.44} {'loss': 0.5398, 'learning_rate': 3.677711572714644e-06, 'epoch': 1.44} {'loss': 0.6115, 'learning_rate': 3.6774579501239625e-06, 'epoch': 1.44} {'loss': 0.7458, 'learning_rate': 3.6772043343084483e-06, 'epoch': 1.44} {'loss': 0.4707, 'learning_rate': 3.676950725268388e-06, 'epoch': 1.44} {'loss': 0.5552, 'learning_rate': 3.6766971230040384e-06, 'epoch': 1.44} {'loss': 0.4936, 'learning_rate': 3.676443527515685e-06, 'epoch': 1.44} {'loss': 0.3419, 'learning_rate': 3.6761899388035905e-06, 'epoch': 1.44} {'loss': 0.6399, 'learning_rate': 3.6759363568680283e-06, 'epoch': 1.44} {'loss': 0.4986, 'learning_rate': 3.6756827817092744e-06, 'epoch': 1.44} {'loss': 0.4881, 'learning_rate': 3.6754292133275917e-06, 'epoch': 1.44} {'loss': 0.5699, 'learning_rate': 3.6751756517232627e-06, 'epoch': 1.44} {'loss': 0.5153, 'learning_rate': 3.6749220968965482e-06, 'epoch': 1.44} {'loss': 0.5404, 'learning_rate': 3.6746685488477317e-06, 'epoch': 1.44} {'loss': 0.4237, 'learning_rate': 3.6744150075770758e-06, 'epoch': 1.44} {'loss': 0.5255, 'learning_rate': 3.674161473084855e-06, 'epoch': 1.44} {'loss': 0.4254, 'learning_rate': 3.6739079453713443e-06, 'epoch': 1.44} {'loss': 0.4604, 'learning_rate': 3.6736544244368055e-06, 'epoch': 1.44} {'loss': 0.5303, 'learning_rate': 3.6734009102815237e-06, 'epoch': 1.44} {'loss': 0.5325, 'learning_rate': 3.673147402905758e-06, 'epoch': 1.44} {'loss': 0.4609, 'learning_rate': 3.672893902309791e-06, 'epoch': 1.44} {'loss': 0.5031, 'learning_rate': 3.672640408493887e-06, 'epoch': 1.44} {'loss': 0.5807, 'learning_rate': 3.67238692145832e-06, 'epoch': 1.44} {'loss': 0.6157, 'learning_rate': 3.6721334412033638e-06, 'epoch': 1.44} {'loss': 0.582, 'learning_rate': 3.6718799677292816e-06, 'epoch': 1.44} {'loss': 0.6123, 'learning_rate': 3.6716265010363585e-06, 'epoch': 1.44} {'loss': 0.5144, 'learning_rate': 3.671373041124855e-06, 'epoch': 1.44} {'loss': 0.4442, 'learning_rate': 3.6711195879950455e-06, 'epoch': 1.44} {'loss': 0.5339, 'learning_rate': 3.6708661416472037e-06, 'epoch': 1.44} {'loss': 0.5974, 'learning_rate': 3.6706127020815995e-06, 'epoch': 1.44} {'loss': 0.5897, 'learning_rate': 3.6703592692985092e-06, 'epoch': 1.44} {'loss': 0.4033, 'learning_rate': 3.670105843298193e-06, 'epoch': 1.44} {'loss': 0.4465, 'learning_rate': 3.6698524240809365e-06, 'epoch': 1.44} {'loss': 0.5122, 'learning_rate': 3.6695990116470013e-06, 'epoch': 1.44} {'loss': 0.3984, 'learning_rate': 3.6693456059966616e-06, 'epoch': 1.44} {'loss': 0.4621, 'learning_rate': 3.6690922071301893e-06, 'epoch': 1.44} {'loss': 0.5135, 'learning_rate': 3.668838815047857e-06, 'epoch': 1.44} {'loss': 0.5333, 'learning_rate': 3.668585429749938e-06, 'epoch': 1.44} {'loss': 0.703, 'learning_rate': 3.668332051236695e-06, 'epoch': 1.44} {'loss': 0.4762, 'learning_rate': 3.6680786795084124e-06, 'epoch': 1.44} {'loss': 0.488, 'learning_rate': 3.667825314565351e-06, 'epoch': 1.44} {'loss': 0.5038, 'learning_rate': 3.667571956407786e-06, 'epoch': 1.44} {'loss': 0.5198, 'learning_rate': 3.667318605035993e-06, 'epoch': 1.44} {'loss': 0.5608, 'learning_rate': 3.6670652604502334e-06, 'epoch': 1.44} {'loss': 0.5717, 'learning_rate': 3.6668119226507915e-06, 'epoch': 1.44} {'loss': 0.6598, 'learning_rate': 3.6665585916379255e-06, 'epoch': 1.44} {'loss': 0.591, 'learning_rate': 3.6663052674119203e-06, 'epoch': 1.44} {'loss': 0.4473, 'learning_rate': 3.6660519499730376e-06, 'epoch': 1.44} {'loss': 0.4904, 'learning_rate': 3.6657986393215506e-06, 'epoch': 1.44} {'loss': 0.6121, 'learning_rate': 3.6655453354577363e-06, 'epoch': 1.44} {'loss': 0.4512, 'learning_rate': 3.6652920383818556e-06, 'epoch': 1.44} {'loss': 0.4239, 'learning_rate': 3.6650387480941918e-06, 'epoch': 1.44} {'loss': 0.6058, 'learning_rate': 3.6647854645950053e-06, 'epoch': 1.44} {'loss': 0.4054, 'learning_rate': 3.6645321878845787e-06, 'epoch': 1.44} {'loss': 0.4475, 'learning_rate': 3.6642789179631754e-06, 'epoch': 1.44} {'loss': 0.4425, 'learning_rate': 3.664025654831068e-06, 'epoch': 1.44} {'loss': 0.5279, 'learning_rate': 3.663772398488533e-06, 'epoch': 1.44} {'loss': 0.532, 'learning_rate': 3.66351914893583e-06, 'epoch': 1.44} {'loss': 0.6348, 'learning_rate': 3.6632659061732457e-06, 'epoch': 1.44} {'loss': 0.3584, 'learning_rate': 3.6630126702010406e-06, 'epoch': 1.44} {'loss': 0.424, 'learning_rate': 3.66275944101949e-06, 'epoch': 1.44} {'loss': 0.4574, 'learning_rate': 3.662506218628863e-06, 'epoch': 1.44} {'loss': 0.4844, 'learning_rate': 3.6622530030294335e-06, 'epoch': 1.44} {'loss': 0.5826, 'learning_rate': 3.661999794221476e-06, 'epoch': 1.44} {'loss': 0.5328, 'learning_rate': 3.6617465922052497e-06, 'epoch': 1.44} {'loss': 0.6408, 'learning_rate': 3.661493396981042e-06, 'epoch': 1.44} {'loss': 0.6605, 'learning_rate': 3.6612402085491115e-06, 'epoch': 1.44} {'loss': 0.6602, 'learning_rate': 3.660987026909735e-06, 'epoch': 1.44} {'loss': 0.5633, 'learning_rate': 3.660733852063183e-06, 'epoch': 1.44} {'loss': 0.3164, 'learning_rate': 3.6604806840097262e-06, 'epoch': 1.44} {'loss': 0.4856, 'learning_rate': 3.660227522749641e-06, 'epoch': 1.44} {'loss': 0.52, 'learning_rate': 3.6599743682831867e-06, 'epoch': 1.44} {'loss': 0.5556, 'learning_rate': 3.659721220610649e-06, 'epoch': 1.44} {'loss': 0.5098, 'learning_rate': 3.659468079732289e-06, 'epoch': 1.44} {'loss': 0.4718, 'learning_rate': 3.6592149456483804e-06, 'epoch': 1.44} {'loss': 0.5475, 'learning_rate': 3.658961818359197e-06, 'epoch': 1.44} {'loss': 0.4929, 'learning_rate': 3.6587086978650065e-06, 'epoch': 1.44} {'loss': 0.4964, 'learning_rate': 3.6584555841660862e-06, 'epoch': 1.44} {'loss': 0.4639, 'learning_rate': 3.6582024772627e-06, 'epoch': 1.44} {'loss': 0.4653, 'learning_rate': 3.6579493771551223e-06, 'epoch': 1.44} {'loss': 0.5435, 'learning_rate': 3.6576962838436235e-06, 'epoch': 1.44} {'loss': 0.5184, 'learning_rate': 3.6574431973284762e-06, 'epoch': 1.44} {'loss': 0.5782, 'learning_rate': 3.65719011760995e-06, 'epoch': 1.44} {'loss': 0.5029, 'learning_rate': 3.656937044688318e-06, 'epoch': 1.44} {'loss': 0.4861, 'learning_rate': 3.6566839785638544e-06, 'epoch': 1.44} {'loss': 0.6109, 'learning_rate': 3.656430919236822e-06, 'epoch': 1.44} {'loss': 0.4934, 'learning_rate': 3.6561778667074963e-06, 'epoch': 1.44} {'loss': 0.5479, 'learning_rate': 3.655924820976149e-06, 'epoch': 1.44} {'loss': 0.4432, 'learning_rate': 3.655671782043051e-06, 'epoch': 1.44} {'loss': 0.5902, 'learning_rate': 3.6554187499084724e-06, 'epoch': 1.44} {'loss': 0.601, 'learning_rate': 3.6551657245726903e-06, 'epoch': 1.44} {'loss': 0.5976, 'learning_rate': 3.6549127060359655e-06, 'epoch': 1.44} {'loss': 0.479, 'learning_rate': 3.6546596942985758e-06, 'epoch': 1.44} {'loss': 0.499, 'learning_rate': 3.65440668936079e-06, 'epoch': 1.44} {'loss': 0.5603, 'learning_rate': 3.6541536912228814e-06, 'epoch': 1.44} {'loss': 0.5292, 'learning_rate': 3.653900699885119e-06, 'epoch': 1.44} {'loss': 0.5075, 'learning_rate': 3.6536477153477744e-06, 'epoch': 1.44} {'loss': 0.5678, 'learning_rate': 3.6533947376111236e-06, 'epoch': 1.44} {'loss': 0.5729, 'learning_rate': 3.6531417666754286e-06, 'epoch': 1.44} {'loss': 0.5013, 'learning_rate': 3.652888802540966e-06, 'epoch': 1.44} {'loss': 0.6408, 'learning_rate': 3.6526358452080045e-06, 'epoch': 1.44} {'loss': 0.5538, 'learning_rate': 3.6523828946768182e-06, 'epoch': 1.44} {'loss': 0.5309, 'learning_rate': 3.652129950947676e-06, 'epoch': 1.44} {'loss': 0.5625, 'learning_rate': 3.6518770140208493e-06, 'epoch': 1.44} {'loss': 0.4952, 'learning_rate': 3.651624083896612e-06, 'epoch': 1.44} {'loss': 0.5374, 'learning_rate': 3.65137116057523e-06, 'epoch': 1.44} {'loss': 0.5563, 'learning_rate': 3.651118244056977e-06, 'epoch': 1.44} {'loss': 0.4899, 'learning_rate': 3.650865334342123e-06, 'epoch': 1.44} {'loss': 0.4495, 'learning_rate': 3.650612431430941e-06, 'epoch': 1.44} {'loss': 0.4165, 'learning_rate': 3.650359535323703e-06, 'epoch': 1.44} {'loss': 0.4231, 'learning_rate': 3.6501066460206746e-06, 'epoch': 1.44} {'loss': 0.4545, 'learning_rate': 3.649853763522131e-06, 'epoch': 1.44} {'loss': 0.472, 'learning_rate': 3.6496008878283416e-06, 'epoch': 1.44} {'loss': 0.59, 'learning_rate': 3.649348018939578e-06, 'epoch': 1.44} {'loss': 0.5346, 'learning_rate': 3.6490951568561116e-06, 'epoch': 1.44} {'loss': 0.3599, 'learning_rate': 3.6488423015782128e-06, 'epoch': 1.44} {'loss': 0.3988, 'learning_rate': 3.648589453106155e-06, 'epoch': 1.44} {'loss': 0.5359, 'learning_rate': 3.6483366114402054e-06, 'epoch': 1.44} {'loss': 0.508, 'learning_rate': 3.648083776580634e-06, 'epoch': 1.44} {'loss': 0.4928, 'learning_rate': 3.6478309485277164e-06, 'epoch': 1.44} {'loss': 0.3509, 'learning_rate': 3.64757812728172e-06, 'epoch': 1.44} {'loss': 0.395, 'learning_rate': 3.6473253128429178e-06, 'epoch': 1.44} {'loss': 0.5408, 'learning_rate': 3.6470725052115785e-06, 'epoch': 1.44} {'loss': 0.7162, 'learning_rate': 3.6468197043879795e-06, 'epoch': 1.44} {'loss': 0.4136, 'learning_rate': 3.6465669103723823e-06, 'epoch': 1.44} {'loss': 0.4823, 'learning_rate': 3.6463141231650624e-06, 'epoch': 1.44} {'loss': 0.4637, 'learning_rate': 3.6460613427662894e-06, 'epoch': 1.44} {'loss': 0.5826, 'learning_rate': 3.6458085691763365e-06, 'epoch': 1.44} {'loss': 0.4734, 'learning_rate': 3.645555802395476e-06, 'epoch': 1.44} {'loss': 0.6331, 'learning_rate': 3.6453030424239687e-06, 'epoch': 1.44} {'loss': 0.5389, 'learning_rate': 3.645050289262101e-06, 'epoch': 1.44} {'loss': 0.7472, 'learning_rate': 3.64479754291013e-06, 'epoch': 1.44} {'loss': 0.5668, 'learning_rate': 3.644544803368334e-06, 'epoch': 1.44} {'loss': 0.6061, 'learning_rate': 3.6442920706369813e-06, 'epoch': 1.44} {'loss': 0.4828, 'learning_rate': 3.6440393447163423e-06, 'epoch': 1.44} {'loss': 0.5286, 'learning_rate': 3.6437866256066935e-06, 'epoch': 1.44} {'loss': 0.5174, 'learning_rate': 3.6435339133082938e-06, 'epoch': 1.44} {'loss': 0.4171, 'learning_rate': 3.6432812078214276e-06, 'epoch': 1.44} {'loss': 0.5494, 'learning_rate': 3.643028509146356e-06, 'epoch': 1.44} {'loss': 0.5491, 'learning_rate': 3.6427758172833528e-06, 'epoch': 1.44} {'loss': 0.6196, 'learning_rate': 3.642523132232689e-06, 'epoch': 1.44} {'loss': 0.5793, 'learning_rate': 3.642270453994636e-06, 'epoch': 1.44} {'loss': 0.4434, 'learning_rate': 3.642017782569468e-06, 'epoch': 1.44} {'loss': 0.5976, 'learning_rate': 3.641765117957444e-06, 'epoch': 1.44} {'loss': 0.4766, 'learning_rate': 3.64151246015885e-06, 'epoch': 1.44} {'loss': 0.6487, 'learning_rate': 3.641259809173946e-06, 'epoch': 1.44} {'loss': 0.5921, 'learning_rate': 3.6410071650030053e-06, 'epoch': 1.44} {'loss': 0.5532, 'learning_rate': 3.640754527646303e-06, 'epoch': 1.44} {'loss': 0.5204, 'learning_rate': 3.6405018971040996e-06, 'epoch': 1.44} {'loss': 0.4759, 'learning_rate': 3.640249273376679e-06, 'epoch': 1.44} {'loss': 0.5378, 'learning_rate': 3.6399966564642986e-06, 'epoch': 1.44} {'loss': 0.6566, 'learning_rate': 3.639744046367243e-06, 'epoch': 1.44} {'loss': 0.6016, 'learning_rate': 3.639491443085772e-06, 'epoch': 1.44} {'loss': 0.6277, 'learning_rate': 3.63923884662016e-06, 'epoch': 1.44} {'loss': 0.6183, 'learning_rate': 3.6389862569706815e-06, 'epoch': 1.44} {'loss': 0.4664, 'learning_rate': 3.638733674137596e-06, 'epoch': 1.44} {'loss': 0.3977, 'learning_rate': 3.638481098121188e-06, 'epoch': 1.44} {'loss': 0.6518, 'learning_rate': 3.6382285289217157e-06, 'epoch': 1.44} {'loss': 0.4433, 'learning_rate': 3.637975966539461e-06, 'epoch': 1.44} {'loss': 0.3977, 'learning_rate': 3.637723410974687e-06, 'epoch': 1.44} {'loss': 0.5136, 'learning_rate': 3.6374708622276667e-06, 'epoch': 1.44} {'loss': 0.6031, 'learning_rate': 3.6372183202986745e-06, 'epoch': 1.44} {'loss': 0.5223, 'learning_rate': 3.6369657851879693e-06, 'epoch': 1.44} {'loss': 0.6096, 'learning_rate': 3.6367132568958365e-06, 'epoch': 1.44} {'loss': 0.542, 'learning_rate': 3.6364607354225333e-06, 'epoch': 1.44} {'loss': 0.7014, 'learning_rate': 3.6362082207683438e-06, 'epoch': 1.44} {'loss': 0.5036, 'learning_rate': 3.6359557129335276e-06, 'epoch': 1.44} {'loss': 0.5215, 'learning_rate': 3.6357032119183587e-06, 'epoch': 1.44} {'loss': 0.5214, 'learning_rate': 3.6354507177231125e-06, 'epoch': 1.44} {'loss': 0.6116, 'learning_rate': 3.635198230348048e-06, 'epoch': 1.44} {'loss': 0.5735, 'learning_rate': 3.6349457497934513e-06, 'epoch': 1.44} {'loss': 0.4023, 'learning_rate': 3.6346932760595763e-06, 'epoch': 1.44} {'loss': 0.5328, 'learning_rate': 3.63444080914671e-06, 'epoch': 1.44} {'loss': 0.5964, 'learning_rate': 3.63418834905511e-06, 'epoch': 1.44} {'loss': 0.4851, 'learning_rate': 3.6339358957850525e-06, 'epoch': 1.44} {'loss': 0.4642, 'learning_rate': 3.6336834493368113e-06, 'epoch': 1.44} {'loss': 0.5277, 'learning_rate': 3.633431009710645e-06, 'epoch': 1.44} {'loss': 0.3841, 'learning_rate': 3.6331785769068394e-06, 'epoch': 1.44} {'loss': 0.5317, 'learning_rate': 3.6329261509256543e-06, 'epoch': 1.44} {'loss': 0.6081, 'learning_rate': 3.6326737317673632e-06, 'epoch': 1.44} {'loss': 0.5411, 'learning_rate': 3.6324213194322368e-06, 'epoch': 1.44} {'loss': 0.5876, 'learning_rate': 3.6321689139205464e-06, 'epoch': 1.44} {'loss': 0.4508, 'learning_rate': 3.631916515232564e-06, 'epoch': 1.44} {'loss': 0.5496, 'learning_rate': 3.631664123368551e-06, 'epoch': 1.44} {'loss': 0.5393, 'learning_rate': 3.631411738328793e-06, 'epoch': 1.44} {'loss': 0.7642, 'learning_rate': 3.6311593601135473e-06, 'epoch': 1.44} {'loss': 0.5496, 'learning_rate': 3.6309069887230898e-06, 'epoch': 1.44} {'loss': 0.4936, 'learning_rate': 3.63065462415769e-06, 'epoch': 1.44} {'loss': 0.3269, 'learning_rate': 3.6304022664176185e-06, 'epoch': 1.44} {'loss': 0.5344, 'learning_rate': 3.6301499155031495e-06, 'epoch': 1.44} {'loss': 0.4979, 'learning_rate': 3.6298975714145434e-06, 'epoch': 1.44} {'loss': 0.5405, 'learning_rate': 3.6296452341520826e-06, 'epoch': 1.44} {'loss': 0.5585, 'learning_rate': 3.62939290371603e-06, 'epoch': 1.44} {'loss': 0.6765, 'learning_rate': 3.629140580106657e-06, 'epoch': 1.44} {'loss': 0.4955, 'learning_rate': 3.628888263324235e-06, 'epoch': 1.44} {'loss': 0.6023, 'learning_rate': 3.628635953369034e-06, 'epoch': 1.44} {'loss': 0.5713, 'learning_rate': 3.628383650241328e-06, 'epoch': 1.44} {'loss': 0.5558, 'learning_rate': 3.628131353941382e-06, 'epoch': 1.44} {'loss': 0.409, 'learning_rate': 3.627879064469467e-06, 'epoch': 1.44} {'loss': 0.4827, 'learning_rate': 3.627626781825855e-06, 'epoch': 1.44} {'loss': 0.5247, 'learning_rate': 3.6273745060108156e-06, 'epoch': 1.44} {'loss': 0.5544, 'learning_rate': 3.627122237024624e-06, 'epoch': 1.44} {'loss': 0.4158, 'learning_rate': 3.6268699748675384e-06, 'epoch': 1.44} {'loss': 0.5635, 'learning_rate': 3.6266177195398443e-06, 'epoch': 1.44} {'loss': 0.5695, 'learning_rate': 3.6263654710418006e-06, 'epoch': 1.44} {'loss': 0.4608, 'learning_rate': 3.626113229373681e-06, 'epoch': 1.44} {'loss': 0.4718, 'learning_rate': 3.625860994535758e-06, 'epoch': 1.44} {'loss': 0.5326, 'learning_rate': 3.625608766528299e-06, 'epoch': 1.44} {'loss': 0.5444, 'learning_rate': 3.6253565453515795e-06, 'epoch': 1.44} {'loss': 0.4568, 'learning_rate': 3.625104331005859e-06, 'epoch': 1.44} {'loss': 0.4554, 'learning_rate': 3.6248521234914204e-06, 'epoch': 1.44} {'loss': 0.5035, 'learning_rate': 3.624599922808526e-06, 'epoch': 1.44} {'loss': 0.6427, 'learning_rate': 3.624347728957448e-06, 'epoch': 1.44} {'loss': 0.5463, 'learning_rate': 3.624095541938456e-06, 'epoch': 1.44} {'loss': 0.5372, 'learning_rate': 3.623843361751822e-06, 'epoch': 1.44} {'loss': 0.4305, 'learning_rate': 3.623591188397818e-06, 'epoch': 1.44} {'loss': 0.5717, 'learning_rate': 3.6233390218767084e-06, 'epoch': 1.44} {'loss': 0.5244, 'learning_rate': 3.6230868621887673e-06, 'epoch': 1.44} {'loss': 0.5205, 'learning_rate': 3.6228347093342632e-06, 'epoch': 1.44} {'loss': 0.3125, 'learning_rate': 3.622582563313467e-06, 'epoch': 1.44} {'loss': 0.4436, 'learning_rate': 3.62233042412665e-06, 'epoch': 1.44} {'loss': 0.4805, 'learning_rate': 3.6220782917740815e-06, 'epoch': 1.44} {'loss': 0.4722, 'learning_rate': 3.621826166256035e-06, 'epoch': 1.44} {'loss': 0.6226, 'learning_rate': 3.6215740475727744e-06, 'epoch': 1.44} {'loss': 0.6303, 'learning_rate': 3.6213219357245723e-06, 'epoch': 1.44} {'loss': 0.6337, 'learning_rate': 3.6210698307117e-06, 'epoch': 1.44} {'loss': 0.4752, 'learning_rate': 3.6208177325344275e-06, 'epoch': 1.44} {'loss': 0.5911, 'learning_rate': 3.6205656411930234e-06, 'epoch': 1.44} {'loss': 0.446, 'learning_rate': 3.620313556687759e-06, 'epoch': 1.44} {'loss': 0.5362, 'learning_rate': 3.6200614790189083e-06, 'epoch': 1.44} {'loss': 0.4404, 'learning_rate': 3.6198094081867342e-06, 'epoch': 1.44} {'loss': 0.5432, 'learning_rate': 3.61955734419151e-06, 'epoch': 1.44} {'loss': 0.6282, 'learning_rate': 3.6193052870335065e-06, 'epoch': 1.44} {'loss': 0.4883, 'learning_rate': 3.6190532367129925e-06, 'epoch': 1.44} {'loss': 0.4394, 'learning_rate': 3.618801193230239e-06, 'epoch': 1.44} {'loss': 0.5486, 'learning_rate': 3.61854915658552e-06, 'epoch': 1.44} {'loss': 0.6547, 'learning_rate': 3.618297126779098e-06, 'epoch': 1.44} {'loss': 0.3966, 'learning_rate': 3.6180451038112464e-06, 'epoch': 1.44} {'loss': 0.4843, 'learning_rate': 3.6177930876822354e-06, 'epoch': 1.44} {'loss': 0.5081, 'learning_rate': 3.617541078392335e-06, 'epoch': 1.44} {'loss': 0.7176, 'learning_rate': 3.6172890759418155e-06, 'epoch': 1.44} {'loss': 0.539, 'learning_rate': 3.6170370803309473e-06, 'epoch': 1.44} {'loss': 0.6039, 'learning_rate': 3.616785091560003e-06, 'epoch': 1.44} {'loss': 0.4616, 'learning_rate': 3.6165331096292465e-06, 'epoch': 1.44} {'loss': 0.5826, 'learning_rate': 3.6162811345389505e-06, 'epoch': 1.44} {'loss': 0.4775, 'learning_rate': 3.6160291662893853e-06, 'epoch': 1.44} {'loss': 0.7184, 'learning_rate': 3.6157772048808216e-06, 'epoch': 1.44} {'loss': 0.5131, 'learning_rate': 3.6155252503135287e-06, 'epoch': 1.44} {'loss': 0.4628, 'learning_rate': 3.6152733025877763e-06, 'epoch': 1.44} {'loss': 0.4605, 'learning_rate': 3.6150213617038378e-06, 'epoch': 1.44} {'loss': 0.441, 'learning_rate': 3.6147694276619773e-06, 'epoch': 1.44} {'loss': 0.5809, 'learning_rate': 3.614517500462468e-06, 'epoch': 1.44} {'loss': 0.5046, 'learning_rate': 3.614265580105579e-06, 'epoch': 1.44} {'loss': 0.442, 'learning_rate': 3.6140136665915816e-06, 'epoch': 1.44} {'loss': 0.4279, 'learning_rate': 3.6137617599207476e-06, 'epoch': 1.44} {'loss': 0.4356, 'learning_rate': 3.6135098600933384e-06, 'epoch': 1.44} {'loss': 0.4748, 'learning_rate': 3.6132579671096356e-06, 'epoch': 1.44} {'loss': 0.6156, 'learning_rate': 3.6130060809698997e-06, 'epoch': 1.44} {'loss': 0.546, 'learning_rate': 3.6127542016744057e-06, 'epoch': 1.44} {'loss': 0.4367, 'learning_rate': 3.6125023292234206e-06, 'epoch': 1.44} {'loss': 0.6574, 'learning_rate': 3.612250463617216e-06, 'epoch': 1.44} {'loss': 0.5982, 'learning_rate': 3.611998604856065e-06, 'epoch': 1.44} {'loss': 0.4546, 'learning_rate': 3.6117467529402284e-06, 'epoch': 1.44} {'loss': 0.5067, 'learning_rate': 3.6114949078699866e-06, 'epoch': 1.44} {'loss': 0.4108, 'learning_rate': 3.6112430696456023e-06, 'epoch': 1.44} {'loss': 0.5402, 'learning_rate': 3.6109912382673486e-06, 'epoch': 1.44} {'loss': 0.5562, 'learning_rate': 3.6107394137354966e-06, 'epoch': 1.44} {'loss': 0.5442, 'learning_rate': 3.6104875960503073e-06, 'epoch': 1.44} {'loss': 0.4857, 'learning_rate': 3.610235785212064e-06, 'epoch': 1.44} {'loss': 0.6624, 'learning_rate': 3.609983981221027e-06, 'epoch': 1.44} {'loss': 0.5993, 'learning_rate': 3.609732184077468e-06, 'epoch': 1.44} {'loss': 0.4589, 'learning_rate': 3.609480393781658e-06, 'epoch': 1.44} {'loss': 0.4677, 'learning_rate': 3.609228610333867e-06, 'epoch': 1.44} {'loss': 0.5322, 'learning_rate': 3.6089768337343668e-06, 'epoch': 1.44} {'loss': 0.477, 'learning_rate': 3.6087250639834195e-06, 'epoch': 1.44} {'loss': 0.366, 'learning_rate': 3.6084733010813057e-06, 'epoch': 1.44} {'loss': 0.6363, 'learning_rate': 3.6082215450282864e-06, 'epoch': 1.44} {'loss': 0.4722, 'learning_rate': 3.607969795824634e-06, 'epoch': 1.44} {'loss': 0.738, 'learning_rate': 3.6077180534706203e-06, 'epoch': 1.44} {'loss': 0.4954, 'learning_rate': 3.6074663179665127e-06, 'epoch': 1.44} {'loss': 0.5504, 'learning_rate': 3.6072145893125855e-06, 'epoch': 1.44} {'loss': 0.5667, 'learning_rate': 3.6069628675090986e-06, 'epoch': 1.44} {'loss': 0.4943, 'learning_rate': 3.6067111525563337e-06, 'epoch': 1.44} {'loss': 0.5949, 'learning_rate': 3.606459444454552e-06, 'epoch': 1.44} {'loss': 0.661, 'learning_rate': 3.6062077432040266e-06, 'epoch': 1.44} {'loss': 0.513, 'learning_rate': 3.6059560488050295e-06, 'epoch': 1.44} {'loss': 0.5285, 'learning_rate': 3.6057043612578213e-06, 'epoch': 1.44} {'loss': 0.4415, 'learning_rate': 3.6054526805626843e-06, 'epoch': 1.44} {'loss': 0.6949, 'learning_rate': 3.605201006719875e-06, 'epoch': 1.44} {'loss': 0.518, 'learning_rate': 3.6049493397296765e-06, 'epoch': 1.44} {'loss': 0.6472, 'learning_rate': 3.6046976795923493e-06, 'epoch': 1.44} {'loss': 0.6515, 'learning_rate': 3.604446026308165e-06, 'epoch': 1.44} {'loss': 0.6038, 'learning_rate': 3.604194379877398e-06, 'epoch': 1.44} {'loss': 0.641, 'learning_rate': 3.603942740300307e-06, 'epoch': 1.44} {'loss': 0.527, 'learning_rate': 3.6036911075771762e-06, 'epoch': 1.44} {'loss': 0.5642, 'learning_rate': 3.6034394817082598e-06, 'epoch': 1.44} {'loss': 0.5568, 'learning_rate': 3.6031878626938423e-06, 'epoch': 1.44} {'loss': 0.6696, 'learning_rate': 3.6029362505341837e-06, 'epoch': 1.44} {'loss': 0.5629, 'learning_rate': 3.602684645229555e-06, 'epoch': 1.44} {'loss': 0.5374, 'learning_rate': 3.6024330467802315e-06, 'epoch': 1.44} {'loss': 0.4459, 'learning_rate': 3.602181455186472e-06, 'epoch': 1.44} {'loss': 0.5153, 'learning_rate': 3.6019298704485585e-06, 'epoch': 1.44} {'loss': 0.5377, 'learning_rate': 3.6016782925667483e-06, 'epoch': 1.44} {'loss': 0.533, 'learning_rate': 3.6014267215413233e-06, 'epoch': 1.44} {'loss': 0.4485, 'learning_rate': 3.601175157372544e-06, 'epoch': 1.44} {'loss': 0.4451, 'learning_rate': 3.600923600060683e-06, 'epoch': 1.44} {'loss': 0.4378, 'learning_rate': 3.6006720496060134e-06, 'epoch': 1.44} {'loss': 0.5338, 'learning_rate': 3.600420506008795e-06, 'epoch': 1.44} {'loss': 0.6346, 'learning_rate': 3.6001689692693097e-06, 'epoch': 1.44} {'loss': 0.6024, 'learning_rate': 3.5999174393878143e-06, 'epoch': 1.44} {'loss': 0.5911, 'learning_rate': 3.599665916364592e-06, 'epoch': 1.44} {'loss': 0.4777, 'learning_rate': 3.5994144001999023e-06, 'epoch': 1.44} {'loss': 0.5507, 'learning_rate': 3.5991628908940166e-06, 'epoch': 1.44} {'loss': 0.6088, 'learning_rate': 3.5989113884472103e-06, 'epoch': 1.44} {'loss': 0.6096, 'learning_rate': 3.5986598928597403e-06, 'epoch': 1.44} {'loss': 0.6485, 'learning_rate': 3.5984084041318925e-06, 'epoch': 1.44} {'loss': 0.5445, 'learning_rate': 3.598156922263919e-06, 'epoch': 1.44} {'loss': 0.5444, 'learning_rate': 3.5979054472561058e-06, 'epoch': 1.44} {'loss': 0.4099, 'learning_rate': 3.597653979108712e-06, 'epoch': 1.44} {'loss': 0.5005, 'learning_rate': 3.5974025178220084e-06, 'epoch': 1.44} {'loss': 0.5449, 'learning_rate': 3.5971510633962705e-06, 'epoch': 1.44} {'loss': 0.4677, 'learning_rate': 3.596899615831756e-06, 'epoch': 1.44} {'loss': 0.4336, 'learning_rate': 3.5966481751287485e-06, 'epoch': 1.44} {'loss': 0.58, 'learning_rate': 3.5963967412875066e-06, 'epoch': 1.44} {'loss': 0.6088, 'learning_rate': 3.5961453143083035e-06, 'epoch': 1.44} {'loss': 0.4493, 'learning_rate': 3.595893894191409e-06, 'epoch': 1.44} {'loss': 0.6575, 'learning_rate': 3.5956424809370915e-06, 'epoch': 1.44} {'loss': 0.5606, 'learning_rate': 3.5953910745456255e-06, 'epoch': 1.44} {'loss': 0.4907, 'learning_rate': 3.5951396750172686e-06, 'epoch': 1.44} {'loss': 0.5076, 'learning_rate': 3.5948882823523044e-06, 'epoch': 1.44} {'loss': 0.5276, 'learning_rate': 3.5946368965509927e-06, 'epoch': 1.44} {'loss': 0.6504, 'learning_rate': 3.5943855176136044e-06, 'epoch': 1.44} {'loss': 0.3301, 'learning_rate': 3.594134145540411e-06, 'epoch': 1.44} {'loss': 0.5519, 'learning_rate': 3.593882780331681e-06, 'epoch': 1.44} {'loss': 0.4614, 'learning_rate': 3.5936314219876876e-06, 'epoch': 1.44} {'loss': 0.558, 'learning_rate': 3.5933800705086896e-06, 'epoch': 1.44} {'loss': 0.4256, 'learning_rate': 3.593128725894969e-06, 'epoch': 1.44} {'loss': 0.5104, 'learning_rate': 3.592877388146786e-06, 'epoch': 1.44} {'loss': 0.402, 'learning_rate': 3.5926260572644133e-06, 'epoch': 1.44} {'loss': 0.478, 'learning_rate': 3.5923747332481208e-06, 'epoch': 1.44} {'loss': 0.6236, 'learning_rate': 3.5921234160981767e-06, 'epoch': 1.44} {'loss': 0.4664, 'learning_rate': 3.591872105814853e-06, 'epoch': 1.44} {'loss': 0.559, 'learning_rate': 3.5916208023984146e-06, 'epoch': 1.44} {'loss': 0.5089, 'learning_rate': 3.5913695058491326e-06, 'epoch': 1.44} {'loss': 0.5274, 'learning_rate': 3.5911182161672765e-06, 'epoch': 1.44} {'loss': 0.4506, 'learning_rate': 3.5908669333531153e-06, 'epoch': 1.44} {'loss': 0.527, 'learning_rate': 3.5906156574069196e-06, 'epoch': 1.44} {'loss': 0.3724, 'learning_rate': 3.5903643883289575e-06, 'epoch': 1.44} {'loss': 0.5084, 'learning_rate': 3.5901131261195012e-06, 'epoch': 1.44} {'loss': 0.3601, 'learning_rate': 3.5898618707788134e-06, 'epoch': 1.44} {'loss': 0.5596, 'learning_rate': 3.589610622307168e-06, 'epoch': 1.44} {'loss': 0.4297, 'learning_rate': 3.5893593807048334e-06, 'epoch': 1.44} {'loss': 0.4066, 'learning_rate': 3.589108145972079e-06, 'epoch': 1.44} {'loss': 0.5658, 'learning_rate': 3.588856918109177e-06, 'epoch': 1.44} {'loss': 0.6005, 'learning_rate': 3.588605697116386e-06, 'epoch': 1.44} {'loss': 0.4599, 'learning_rate': 3.588354482993991e-06, 'epoch': 1.44} {'loss': 0.5785, 'learning_rate': 3.5881032757422475e-06, 'epoch': 1.44} {'loss': 0.6156, 'learning_rate': 3.587852075361431e-06, 'epoch': 1.44} {'loss': 0.5481, 'learning_rate': 3.5876008818518105e-06, 'epoch': 1.44} {'loss': 0.4156, 'learning_rate': 3.5873496952136534e-06, 'epoch': 1.44} {'loss': 0.446, 'learning_rate': 3.5870985154472335e-06, 'epoch': 1.44} {'loss': 0.4331, 'learning_rate': 3.5868473425528128e-06, 'epoch': 1.44} {'loss': 0.5777, 'learning_rate': 3.5865961765306647e-06, 'epoch': 1.44} {'loss': 0.4517, 'learning_rate': 3.5863450173810564e-06, 'epoch': 1.44} {'loss': 0.695, 'learning_rate': 3.58609386510426e-06, 'epoch': 1.45} {'loss': 0.429, 'learning_rate': 3.5858427197005417e-06, 'epoch': 1.45} {'loss': 0.5849, 'learning_rate': 3.5855915811701713e-06, 'epoch': 1.45} {'loss': 0.5765, 'learning_rate': 3.585340449513424e-06, 'epoch': 1.45} {'loss': 0.5581, 'learning_rate': 3.5850893247305575e-06, 'epoch': 1.45} {'loss': 0.4103, 'learning_rate': 3.584838206821848e-06, 'epoch': 1.45} {'loss': 0.6464, 'learning_rate': 3.584587095787564e-06, 'epoch': 1.45} {'loss': 0.5676, 'learning_rate': 3.584335991627973e-06, 'epoch': 1.45} {'loss': 0.5266, 'learning_rate': 3.584084894343345e-06, 'epoch': 1.45} {'loss': 0.3935, 'learning_rate': 3.5838338039339527e-06, 'epoch': 1.45} {'loss': 0.5246, 'learning_rate': 3.583582720400058e-06, 'epoch': 1.45} {'loss': 0.5199, 'learning_rate': 3.583331643741934e-06, 'epoch': 1.45} {'loss': 0.479, 'learning_rate': 3.5830805739598486e-06, 'epoch': 1.45} {'loss': 0.4496, 'learning_rate': 3.5828295110540723e-06, 'epoch': 1.45} {'loss': 0.6569, 'learning_rate': 3.5825784550248732e-06, 'epoch': 1.45} {'loss': 0.5515, 'learning_rate': 3.58232740587252e-06, 'epoch': 1.45} {'loss': 0.492, 'learning_rate': 3.5820763635972856e-06, 'epoch': 1.45} {'loss': 0.5296, 'learning_rate': 3.581825328199433e-06, 'epoch': 1.45} {'loss': 0.4976, 'learning_rate': 3.5815742996792334e-06, 'epoch': 1.45} {'loss': 0.4699, 'learning_rate': 3.5813232780369555e-06, 'epoch': 1.45} {'loss': 0.4884, 'learning_rate': 3.58107226327287e-06, 'epoch': 1.45} {'loss': 0.5008, 'learning_rate': 3.5808212553872446e-06, 'epoch': 1.45} {'loss': 0.52, 'learning_rate': 3.580570254380349e-06, 'epoch': 1.45} {'loss': 0.4844, 'learning_rate': 3.580319260252455e-06, 'epoch': 1.45} {'loss': 0.5817, 'learning_rate': 3.580068273003825e-06, 'epoch': 1.45} {'loss': 0.5694, 'learning_rate': 3.579817292634731e-06, 'epoch': 1.45} {'loss': 0.4714, 'learning_rate': 3.5795663191454422e-06, 'epoch': 1.45} {'loss': 0.4763, 'learning_rate': 3.5793153525362277e-06, 'epoch': 1.45} {'loss': 0.4674, 'learning_rate': 3.57906439280736e-06, 'epoch': 1.45} {'loss': 0.6397, 'learning_rate': 3.5788134399590968e-06, 'epoch': 1.45} {'loss': 0.4886, 'learning_rate': 3.578562493991722e-06, 'epoch': 1.45} {'loss': 0.5873, 'learning_rate': 3.5783115549054925e-06, 'epoch': 1.45} {'loss': 0.6077, 'learning_rate': 3.578060622700683e-06, 'epoch': 1.45} {'loss': 0.6161, 'learning_rate': 3.5778096973775613e-06, 'epoch': 1.45} {'loss': 0.5298, 'learning_rate': 3.5775587789363954e-06, 'epoch': 1.45} {'loss': 0.4945, 'learning_rate': 3.5773078673774585e-06, 'epoch': 1.45} {'loss': 0.4244, 'learning_rate': 3.5770569627010087e-06, 'epoch': 1.45} {'loss': 0.5346, 'learning_rate': 3.57680606490733e-06, 'epoch': 1.45} {'loss': 0.4408, 'learning_rate': 3.576555173996679e-06, 'epoch': 1.45} {'loss': 0.5753, 'learning_rate': 3.576304289969329e-06, 'epoch': 1.45} {'loss': 0.3873, 'learning_rate': 3.5760534128255487e-06, 'epoch': 1.45} {'loss': 0.6747, 'learning_rate': 3.5758025425656073e-06, 'epoch': 1.45} {'loss': 0.3474, 'learning_rate': 3.575551679189776e-06, 'epoch': 1.45} {'loss': 0.4433, 'learning_rate': 3.5753008226983153e-06, 'epoch': 1.45} {'loss': 0.6315, 'learning_rate': 3.575049973091506e-06, 'epoch': 1.45} {'loss': 0.4141, 'learning_rate': 3.5747991303696063e-06, 'epoch': 1.45} {'loss': 0.6189, 'learning_rate': 3.5745482945328903e-06, 'epoch': 1.45} {'loss': 0.6243, 'learning_rate': 3.5742974655816286e-06, 'epoch': 1.45} {'loss': 0.5416, 'learning_rate': 3.57404664351608e-06, 'epoch': 1.45} {'loss': 0.4129, 'learning_rate': 3.573795828336528e-06, 'epoch': 1.45} {'loss': 0.4573, 'learning_rate': 3.5735450200432266e-06, 'epoch': 1.45} {'loss': 0.4518, 'learning_rate': 3.573294218636458e-06, 'epoch': 1.45} {'loss': 0.5376, 'learning_rate': 3.5730434241164826e-06, 'epoch': 1.45} {'loss': 0.4681, 'learning_rate': 3.5727926364835706e-06, 'epoch': 1.45} {'loss': 0.4398, 'learning_rate': 3.5725418557379944e-06, 'epoch': 1.45} {'loss': 0.5632, 'learning_rate': 3.572291081880013e-06, 'epoch': 1.45} {'loss': 0.6429, 'learning_rate': 3.5720403149099092e-06, 'epoch': 1.45} {'loss': 0.662, 'learning_rate': 3.5717895548279402e-06, 'epoch': 1.45} {'loss': 0.6511, 'learning_rate': 3.571538801634379e-06, 'epoch': 1.45} {'loss': 0.5314, 'learning_rate': 3.571288055329495e-06, 'epoch': 1.45} {'loss': 0.5789, 'learning_rate': 3.571037315913555e-06, 'epoch': 1.45} {'loss': 0.4247, 'learning_rate': 3.5707865833868326e-06, 'epoch': 1.45} {'loss': 0.5461, 'learning_rate': 3.5705358577495864e-06, 'epoch': 1.45} {'loss': 0.5972, 'learning_rate': 3.5702851390020976e-06, 'epoch': 1.45} {'loss': 0.3679, 'learning_rate': 3.570034427144625e-06, 'epoch': 1.45} {'loss': 0.4709, 'learning_rate': 3.5697837221774413e-06, 'epoch': 1.45} {'loss': 0.5608, 'learning_rate': 3.569533024100814e-06, 'epoch': 1.45} {'loss': 0.6122, 'learning_rate': 3.569282332915013e-06, 'epoch': 1.45} {'loss': 0.5903, 'learning_rate': 3.5690316486203103e-06, 'epoch': 1.45} {'loss': 0.4921, 'learning_rate': 3.568780971216963e-06, 'epoch': 1.45} {'loss': 0.6732, 'learning_rate': 3.568530300705254e-06, 'epoch': 1.45} {'loss': 0.4777, 'learning_rate': 3.5682796370854423e-06, 'epoch': 1.45} {'loss': 0.4264, 'learning_rate': 3.5680289803577995e-06, 'epoch': 1.45} {'loss': 0.525, 'learning_rate': 3.5677783305225943e-06, 'epoch': 1.45} {'loss': 0.4719, 'learning_rate': 3.5675276875800946e-06, 'epoch': 1.45} {'loss': 0.6591, 'learning_rate': 3.5672770515305734e-06, 'epoch': 1.45} {'loss': 0.2462, 'learning_rate': 3.567026422374289e-06, 'epoch': 1.45} {'loss': 0.5857, 'learning_rate': 3.5667758001115227e-06, 'epoch': 1.45} {'loss': 0.4108, 'learning_rate': 3.566525184742533e-06, 'epoch': 1.45} {'loss': 0.4974, 'learning_rate': 3.566274576267593e-06, 'epoch': 1.45} {'loss': 0.6544, 'learning_rate': 3.566023974686973e-06, 'epoch': 1.45} {'loss': 0.5389, 'learning_rate': 3.5657733800009332e-06, 'epoch': 1.45} {'loss': 0.6225, 'learning_rate': 3.5655227922097534e-06, 'epoch': 1.45} {'loss': 0.5626, 'learning_rate': 3.5652722113136915e-06, 'epoch': 1.45} {'loss': 0.5743, 'learning_rate': 3.5650216373130276e-06, 'epoch': 1.45} {'loss': 0.6416, 'learning_rate': 3.5647710702080195e-06, 'epoch': 1.45} {'loss': 0.6129, 'learning_rate': 3.56452050999894e-06, 'epoch': 1.45} {'loss': 0.5292, 'learning_rate': 3.5642699566860617e-06, 'epoch': 1.45} {'loss': 0.4973, 'learning_rate': 3.5640194102696423e-06, 'epoch': 1.45} {'loss': 0.4697, 'learning_rate': 3.563768870749964e-06, 'epoch': 1.45} {'loss': 0.3914, 'learning_rate': 3.5635183381272808e-06, 'epoch': 1.45} {'loss': 0.5216, 'learning_rate': 3.5632678124018747e-06, 'epoch': 1.45} {'loss': 0.6529, 'learning_rate': 3.563017293574006e-06, 'epoch': 1.45} {'loss': 0.4271, 'learning_rate': 3.562766781643945e-06, 'epoch': 1.45} {'loss': 0.6198, 'learning_rate': 3.5625162766119635e-06, 'epoch': 1.45} {'loss': 0.5685, 'learning_rate': 3.562265778478321e-06, 'epoch': 1.45} {'loss': 0.3675, 'learning_rate': 3.562015287243298e-06, 'epoch': 1.45} {'loss': 0.618, 'learning_rate': 3.5617648029071527e-06, 'epoch': 1.45} {'loss': 0.597, 'learning_rate': 3.561514325470158e-06, 'epoch': 1.45} {'loss': 0.5207, 'learning_rate': 3.561263854932581e-06, 'epoch': 1.45} {'loss': 0.5669, 'learning_rate': 3.561013391294692e-06, 'epoch': 1.45} {'loss': 0.3981, 'learning_rate': 3.5607629345567606e-06, 'epoch': 1.45} {'loss': 0.6224, 'learning_rate': 3.5605124847190476e-06, 'epoch': 1.45} {'loss': 0.4658, 'learning_rate': 3.5602620417818325e-06, 'epoch': 1.45} {'loss': 0.4891, 'learning_rate': 3.5600116057453736e-06, 'epoch': 1.45} {'loss': 0.4688, 'learning_rate': 3.559761176609945e-06, 'epoch': 1.45} {'loss': 0.403, 'learning_rate': 3.5595107543758135e-06, 'epoch': 1.45} {'loss': 0.4828, 'learning_rate': 3.5592603390432467e-06, 'epoch': 1.45} {'loss': 0.4848, 'learning_rate': 3.559009930612517e-06, 'epoch': 1.45} {'loss': 0.5083, 'learning_rate': 3.558759529083884e-06, 'epoch': 1.45} {'loss': 0.5808, 'learning_rate': 3.558509134457627e-06, 'epoch': 1.45} {'loss': 0.4618, 'learning_rate': 3.5582587467340057e-06, 'epoch': 1.45} {'loss': 0.5281, 'learning_rate': 3.5580083659132923e-06, 'epoch': 1.45} {'loss': 0.5507, 'learning_rate': 3.557757991995754e-06, 'epoch': 1.45} {'loss': 0.6537, 'learning_rate': 3.5575076249816586e-06, 'epoch': 1.45} {'loss': 0.4206, 'learning_rate': 3.55725726487128e-06, 'epoch': 1.45} {'loss': 0.5016, 'learning_rate': 3.5570069116648774e-06, 'epoch': 1.45} {'loss': 0.5252, 'learning_rate': 3.5567565653627244e-06, 'epoch': 1.45} {'loss': 0.5633, 'learning_rate': 3.5565062259650875e-06, 'epoch': 1.45} {'loss': 0.5186, 'learning_rate': 3.556255893472236e-06, 'epoch': 1.45} {'loss': 0.7046, 'learning_rate': 3.5560055678844374e-06, 'epoch': 1.45} {'loss': 0.5744, 'learning_rate': 3.5557552492019607e-06, 'epoch': 1.45} {'loss': 0.4931, 'learning_rate': 3.5555049374250772e-06, 'epoch': 1.45} {'loss': 0.5278, 'learning_rate': 3.555254632554049e-06, 'epoch': 1.45} {'loss': 0.4724, 'learning_rate': 3.5550043345891463e-06, 'epoch': 1.45} {'loss': 0.3025, 'learning_rate': 3.5547540435306396e-06, 'epoch': 1.45} {'loss': 0.6522, 'learning_rate': 3.5545037593787933e-06, 'epoch': 1.45} {'loss': 0.4665, 'learning_rate': 3.5542534821338804e-06, 'epoch': 1.45} {'loss': 0.4811, 'learning_rate': 3.5540032117961653e-06, 'epoch': 1.45} {'loss': 0.5081, 'learning_rate': 3.5537529483659205e-06, 'epoch': 1.45} {'loss': 0.5541, 'learning_rate': 3.553502691843409e-06, 'epoch': 1.45} {'loss': 0.5002, 'learning_rate': 3.5532524422289005e-06, 'epoch': 1.45} {'loss': 0.5464, 'learning_rate': 3.553002199522665e-06, 'epoch': 1.45} {'loss': 0.5895, 'learning_rate': 3.5527519637249675e-06, 'epoch': 1.45} {'loss': 0.5602, 'learning_rate': 3.55250173483608e-06, 'epoch': 1.45} {'loss': 0.6699, 'learning_rate': 3.5522515128562717e-06, 'epoch': 1.45} {'loss': 0.4855, 'learning_rate': 3.5520012977858043e-06, 'epoch': 1.45} {'loss': 0.5475, 'learning_rate': 3.5517510896249485e-06, 'epoch': 1.45} {'loss': 0.5608, 'learning_rate': 3.5515008883739744e-06, 'epoch': 1.45} {'loss': 0.4843, 'learning_rate': 3.5512506940331493e-06, 'epoch': 1.45} {'loss': 0.6482, 'learning_rate': 3.551000506602741e-06, 'epoch': 1.45} {'loss': 0.5733, 'learning_rate': 3.5507503260830177e-06, 'epoch': 1.45} {'loss': 0.617, 'learning_rate': 3.550500152474251e-06, 'epoch': 1.45} {'loss': 0.5004, 'learning_rate': 3.5502499857767015e-06, 'epoch': 1.45} {'loss': 0.4986, 'learning_rate': 3.549999825990642e-06, 'epoch': 1.45} {'loss': 0.4894, 'learning_rate': 3.5497496731163393e-06, 'epoch': 1.45} {'loss': 0.522, 'learning_rate': 3.5494995271540623e-06, 'epoch': 1.45} {'loss': 0.5213, 'learning_rate': 3.5492493881040777e-06, 'epoch': 1.45} {'loss': 0.6752, 'learning_rate': 3.5489992559666596e-06, 'epoch': 1.45} {'loss': 0.5127, 'learning_rate': 3.5487491307420675e-06, 'epoch': 1.45} {'loss': 0.5075, 'learning_rate': 3.5484990124305716e-06, 'epoch': 1.45} {'loss': 0.5427, 'learning_rate': 3.5482489010324426e-06, 'epoch': 1.45} {'loss': 0.4668, 'learning_rate': 3.547998796547947e-06, 'epoch': 1.45} {'loss': 0.6853, 'learning_rate': 3.5477486989773525e-06, 'epoch': 1.45} {'loss': 0.4415, 'learning_rate': 3.5474986083209306e-06, 'epoch': 1.45} {'loss': 0.4292, 'learning_rate': 3.5472485245789436e-06, 'epoch': 1.45} {'loss': 0.5865, 'learning_rate': 3.5469984477516626e-06, 'epoch': 1.45} {'loss': 0.383, 'learning_rate': 3.546748377839354e-06, 'epoch': 1.45} {'loss': 0.534, 'learning_rate': 3.546498314842288e-06, 'epoch': 1.45} {'loss': 0.5931, 'learning_rate': 3.5462482587607317e-06, 'epoch': 1.45} {'loss': 0.6764, 'learning_rate': 3.545998209594952e-06, 'epoch': 1.45} {'loss': 0.7061, 'learning_rate': 3.545748167345222e-06, 'epoch': 1.45} {'loss': 0.5958, 'learning_rate': 3.545498132011801e-06, 'epoch': 1.45} {'loss': 0.562, 'learning_rate': 3.5452481035949628e-06, 'epoch': 1.45} {'loss': 0.6408, 'learning_rate': 3.5449980820949727e-06, 'epoch': 1.45} {'loss': 0.5072, 'learning_rate': 3.5447480675120993e-06, 'epoch': 1.45} {'loss': 0.5716, 'learning_rate': 3.5444980598466115e-06, 'epoch': 1.45} {'loss': 0.4589, 'learning_rate': 3.544248059098777e-06, 'epoch': 1.45} {'loss': 0.609, 'learning_rate': 3.5439980652688664e-06, 'epoch': 1.45} {'loss': 0.4599, 'learning_rate': 3.543748078357141e-06, 'epoch': 1.45} {'loss': 0.4642, 'learning_rate': 3.543498098363873e-06, 'epoch': 1.45} {'loss': 0.4776, 'learning_rate': 3.5432481252893293e-06, 'epoch': 1.45} {'loss': 0.3848, 'learning_rate': 3.542998159133777e-06, 'epoch': 1.45} {'loss': 0.4905, 'learning_rate': 3.54274819989749e-06, 'epoch': 1.45} {'loss': 0.555, 'learning_rate': 3.5424982475807233e-06, 'epoch': 1.45} {'loss': 0.6265, 'learning_rate': 3.5422483021837594e-06, 'epoch': 1.45} {'loss': 0.4714, 'learning_rate': 3.5419983637068556e-06, 'epoch': 1.45} {'loss': 0.5124, 'learning_rate': 3.541748432150284e-06, 'epoch': 1.45} {'loss': 0.4722, 'learning_rate': 3.5414985075143117e-06, 'epoch': 1.45} {'loss': 0.4854, 'learning_rate': 3.5412485897992065e-06, 'epoch': 1.45} {'loss': 0.4962, 'learning_rate': 3.5409986790052398e-06, 'epoch': 1.45} {'loss': 0.4723, 'learning_rate': 3.5407487751326698e-06, 'epoch': 1.45} {'loss': 0.5636, 'learning_rate': 3.540498878181776e-06, 'epoch': 1.45} {'loss': 0.5219, 'learning_rate': 3.540248988152818e-06, 'epoch': 1.45} {'loss': 0.5143, 'learning_rate': 3.539999105046066e-06, 'epoch': 1.45} {'loss': 0.5875, 'learning_rate': 3.5397492288617917e-06, 'epoch': 1.45} {'loss': 0.5497, 'learning_rate': 3.5394993596002525e-06, 'epoch': 1.45} {'loss': 0.5429, 'learning_rate': 3.5392494972617296e-06, 'epoch': 1.45} {'loss': 0.5952, 'learning_rate': 3.5389996418464766e-06, 'epoch': 1.45} {'loss': 0.6115, 'learning_rate': 3.5387497933547766e-06, 'epoch': 1.45} {'loss': 0.5594, 'learning_rate': 3.5384999517868847e-06, 'epoch': 1.45} {'loss': 0.4074, 'learning_rate': 3.538250117143074e-06, 'epoch': 1.45} {'loss': 0.5921, 'learning_rate': 3.5380002894236142e-06, 'epoch': 1.45} {'loss': 0.4496, 'learning_rate': 3.5377504686287646e-06, 'epoch': 1.45} {'loss': 0.3407, 'learning_rate': 3.5375006547588044e-06, 'epoch': 1.45} {'loss': 0.4444, 'learning_rate': 3.537250847813989e-06, 'epoch': 1.45} {'loss': 0.6356, 'learning_rate': 3.5370010477946006e-06, 'epoch': 1.45} {'loss': 0.7354, 'learning_rate': 3.536751254700894e-06, 'epoch': 1.45} {'loss': 0.616, 'learning_rate': 3.536501468533142e-06, 'epoch': 1.45} {'loss': 0.5526, 'learning_rate': 3.5362516892916156e-06, 'epoch': 1.45} {'loss': 0.6319, 'learning_rate': 3.5360019169765725e-06, 'epoch': 1.45} {'loss': 0.5025, 'learning_rate': 3.535752151588293e-06, 'epoch': 1.45} {'loss': 0.6573, 'learning_rate': 3.5355023931270316e-06, 'epoch': 1.45} {'loss': 0.4934, 'learning_rate': 3.535252641593071e-06, 'epoch': 1.45} {'loss': 0.4839, 'learning_rate': 3.535002896986666e-06, 'epoch': 1.45} {'loss': 0.37, 'learning_rate': 3.534753159308089e-06, 'epoch': 1.45} {'loss': 0.5645, 'learning_rate': 3.5345034285576106e-06, 'epoch': 1.45} {'loss': 0.5918, 'learning_rate': 3.5342537047354897e-06, 'epoch': 1.45} {'loss': 0.4741, 'learning_rate': 3.534003987842005e-06, 'epoch': 1.45} {'loss': 0.6102, 'learning_rate': 3.5337542778774126e-06, 'epoch': 1.45} {'loss': 0.5702, 'learning_rate': 3.5335045748419927e-06, 'epoch': 1.45} {'loss': 0.4651, 'learning_rate': 3.533254878736003e-06, 'epoch': 1.45} {'loss': 0.6838, 'learning_rate': 3.533005189559715e-06, 'epoch': 1.45} {'loss': 0.4724, 'learning_rate': 3.532755507313398e-06, 'epoch': 1.45} {'loss': 0.5774, 'learning_rate': 3.5325058319973103e-06, 'epoch': 1.45} {'loss': 0.4834, 'learning_rate': 3.5322561636117335e-06, 'epoch': 1.45} {'loss': 0.5159, 'learning_rate': 3.532006502156925e-06, 'epoch': 1.45} {'loss': 0.5836, 'learning_rate': 3.5317568476331555e-06, 'epoch': 1.45} {'loss': 0.4131, 'learning_rate': 3.5315072000406913e-06, 'epoch': 1.45} {'loss': 0.491, 'learning_rate': 3.5312575593798014e-06, 'epoch': 1.45} {'loss': 0.7057, 'learning_rate': 3.5310079256507568e-06, 'epoch': 1.45} {'loss': 0.4938, 'learning_rate': 3.5307582988538137e-06, 'epoch': 1.45} {'loss': 0.5748, 'learning_rate': 3.530508678989253e-06, 'epoch': 1.45} {'loss': 0.4758, 'learning_rate': 3.5302590660573342e-06, 'epoch': 1.45} {'loss': 0.4452, 'learning_rate': 3.5300094600583255e-06, 'epoch': 1.45} {'loss': 0.602, 'learning_rate': 3.5297598609924966e-06, 'epoch': 1.45} {'loss': 0.5258, 'learning_rate': 3.5295102688601135e-06, 'epoch': 1.45} {'loss': 0.6051, 'learning_rate': 3.529260683661447e-06, 'epoch': 1.45} {'loss': 0.5577, 'learning_rate': 3.5290111053967557e-06, 'epoch': 1.45} {'loss': 0.4349, 'learning_rate': 3.5287615340663206e-06, 'epoch': 1.45} {'loss': 0.5223, 'learning_rate': 3.5285119696703972e-06, 'epoch': 1.45} {'loss': 0.4906, 'learning_rate': 3.5282624122092567e-06, 'epoch': 1.45} {'loss': 0.5858, 'learning_rate': 3.528012861683172e-06, 'epoch': 1.45} {'loss': 0.5294, 'learning_rate': 3.527763318092398e-06, 'epoch': 1.45} {'loss': 0.6675, 'learning_rate': 3.5275137814372164e-06, 'epoch': 1.45} {'loss': 0.5842, 'learning_rate': 3.5272642517178813e-06, 'epoch': 1.45} {'loss': 0.6459, 'learning_rate': 3.5270147289346732e-06, 'epoch': 1.45} {'loss': 0.6174, 'learning_rate': 3.5267652130878506e-06, 'epoch': 1.45} {'loss': 0.5632, 'learning_rate': 3.526515704177683e-06, 'epoch': 1.45} {'loss': 0.5852, 'learning_rate': 3.5262662022044416e-06, 'epoch': 1.45} {'loss': 0.6654, 'learning_rate': 3.5260167071683825e-06, 'epoch': 1.45} {'loss': 0.4107, 'learning_rate': 3.5257672190697887e-06, 'epoch': 1.45} {'loss': 0.5457, 'learning_rate': 3.5255177379089157e-06, 'epoch': 1.45} {'loss': 0.5823, 'learning_rate': 3.5252682636860345e-06, 'epoch': 1.45} {'loss': 0.6845, 'learning_rate': 3.5250187964014137e-06, 'epoch': 1.45} {'loss': 0.5141, 'learning_rate': 3.524769336055319e-06, 'epoch': 1.45} {'loss': 0.5923, 'learning_rate': 3.524519882648022e-06, 'epoch': 1.45} {'loss': 0.4523, 'learning_rate': 3.5242704361797796e-06, 'epoch': 1.45} {'loss': 0.4938, 'learning_rate': 3.524020996650872e-06, 'epoch': 1.45} {'loss': 0.5065, 'learning_rate': 3.523771564061558e-06, 'epoch': 1.45} {'loss': 0.3974, 'learning_rate': 3.5235221384121064e-06, 'epoch': 1.45} {'loss': 0.384, 'learning_rate': 3.5232727197027862e-06, 'epoch': 1.45} {'loss': 0.4297, 'learning_rate': 3.523023307933864e-06, 'epoch': 1.45} {'loss': 0.5724, 'learning_rate': 3.5227739031056096e-06, 'epoch': 1.45} {'loss': 0.4136, 'learning_rate': 3.5225245052182812e-06, 'epoch': 1.45} {'loss': 0.5557, 'learning_rate': 3.5222751142721587e-06, 'epoch': 1.45} {'loss': 0.6005, 'learning_rate': 3.5220257302674996e-06, 'epoch': 1.45} {'loss': 0.4934, 'learning_rate': 3.521776353204576e-06, 'epoch': 1.45} {'loss': 0.4435, 'learning_rate': 3.521526983083652e-06, 'epoch': 1.45} {'loss': 0.6294, 'learning_rate': 3.521277619904997e-06, 'epoch': 1.45} {'loss': 0.6331, 'learning_rate': 3.521028263668882e-06, 'epoch': 1.45} {'loss': 0.4981, 'learning_rate': 3.5207789143755657e-06, 'epoch': 1.45} {'loss': 0.612, 'learning_rate': 3.5205295720253196e-06, 'epoch': 1.45} {'loss': 0.5655, 'learning_rate': 3.520280236618412e-06, 'epoch': 1.45} {'loss': 0.492, 'learning_rate': 3.5200309081551075e-06, 'epoch': 1.45} {'loss': 0.513, 'learning_rate': 3.5197815866356754e-06, 'epoch': 1.45} {'loss': 0.6133, 'learning_rate': 3.519532272060382e-06, 'epoch': 1.45} {'loss': 0.6334, 'learning_rate': 3.519282964429499e-06, 'epoch': 1.45} {'loss': 0.5228, 'learning_rate': 3.5190336637432845e-06, 'epoch': 1.45} {'loss': 0.4988, 'learning_rate': 3.5187843700020108e-06, 'epoch': 1.45} {'loss': 0.5609, 'learning_rate': 3.5185350832059452e-06, 'epoch': 1.45} {'loss': 0.4733, 'learning_rate': 3.5182858033553537e-06, 'epoch': 1.45} {'loss': 0.598, 'learning_rate': 3.5180365304505036e-06, 'epoch': 1.45} {'loss': 0.4866, 'learning_rate': 3.5177872644916666e-06, 'epoch': 1.45} {'loss': 0.4063, 'learning_rate': 3.517538005479102e-06, 'epoch': 1.45} {'loss': 0.4103, 'learning_rate': 3.5172887534130805e-06, 'epoch': 1.45} {'loss': 0.5197, 'learning_rate': 3.517039508293869e-06, 'epoch': 1.45} {'loss': 0.4689, 'learning_rate': 3.5167902701217347e-06, 'epoch': 1.45} {'loss': 0.561, 'learning_rate': 3.5165410388969445e-06, 'epoch': 1.45} {'loss': 0.3955, 'learning_rate': 3.5162918146197667e-06, 'epoch': 1.45} {'loss': 0.4545, 'learning_rate': 3.5160425972904698e-06, 'epoch': 1.45} {'loss': 0.5423, 'learning_rate': 3.515793386909315e-06, 'epoch': 1.45} {'loss': 0.5135, 'learning_rate': 3.5155441834765745e-06, 'epoch': 1.45} {'loss': 0.4887, 'learning_rate': 3.5152949869925124e-06, 'epoch': 1.45} {'loss': 0.4795, 'learning_rate': 3.515045797457397e-06, 'epoch': 1.45} {'loss': 0.4996, 'learning_rate': 3.5147966148714953e-06, 'epoch': 1.45} {'loss': 0.4589, 'learning_rate': 3.5145474392350743e-06, 'epoch': 1.45} {'loss': 0.5205, 'learning_rate': 3.5142982705484054e-06, 'epoch': 1.45} {'loss': 0.6901, 'learning_rate': 3.514049108811747e-06, 'epoch': 1.45} {'loss': 0.5325, 'learning_rate': 3.513799954025371e-06, 'epoch': 1.45} {'loss': 0.4352, 'learning_rate': 3.513550806189543e-06, 'epoch': 1.45} {'loss': 0.556, 'learning_rate': 3.5133016653045303e-06, 'epoch': 1.45} {'loss': 0.4496, 'learning_rate': 3.5130525313706054e-06, 'epoch': 1.45} {'loss': 0.4493, 'learning_rate': 3.512803404388022e-06, 'epoch': 1.45} {'loss': 0.5903, 'learning_rate': 3.5125542843570627e-06, 'epoch': 1.45} {'loss': 0.6745, 'learning_rate': 3.512305171277983e-06, 'epoch': 1.45} {'loss': 0.4374, 'learning_rate': 3.5120560651510548e-06, 'epoch': 1.45} {'loss': 0.5273, 'learning_rate': 3.511806965976543e-06, 'epoch': 1.45} {'loss': 0.5326, 'learning_rate': 3.511557873754716e-06, 'epoch': 1.45} {'loss': 0.4887, 'learning_rate': 3.5113087884858444e-06, 'epoch': 1.45} {'loss': 0.5991, 'learning_rate': 3.511059710170187e-06, 'epoch': 1.45} {'loss': 0.6224, 'learning_rate': 3.5108106388080154e-06, 'epoch': 1.45} {'loss': 0.5531, 'learning_rate': 3.510561574399596e-06, 'epoch': 1.45} {'loss': 0.5274, 'learning_rate': 3.5103125169451945e-06, 'epoch': 1.45} {'loss': 0.5874, 'learning_rate': 3.5100634664450793e-06, 'epoch': 1.45} {'loss': 0.4343, 'learning_rate': 3.509814422899518e-06, 'epoch': 1.45} {'loss': 0.6191, 'learning_rate': 3.5095653863087785e-06, 'epoch': 1.45} {'loss': 0.6103, 'learning_rate': 3.5093163566731227e-06, 'epoch': 1.45} {'loss': 0.4467, 'learning_rate': 3.5090673339928196e-06, 'epoch': 1.45} {'loss': 0.6086, 'learning_rate': 3.5088183182681367e-06, 'epoch': 1.45} {'loss': 0.5071, 'learning_rate': 3.5085693094993413e-06, 'epoch': 1.45} {'loss': 0.4829, 'learning_rate': 3.5083203076867023e-06, 'epoch': 1.45} {'loss': 0.5488, 'learning_rate': 3.508071312830479e-06, 'epoch': 1.45} {'loss': 0.7393, 'learning_rate': 3.5078223249309483e-06, 'epoch': 1.45} {'loss': 0.5284, 'learning_rate': 3.5075733439883698e-06, 'epoch': 1.45} {'loss': 0.4779, 'learning_rate': 3.507324370003011e-06, 'epoch': 1.45} {'loss': 0.6172, 'learning_rate': 3.507075402975141e-06, 'epoch': 1.45} {'loss': 0.5347, 'learning_rate': 3.506826442905026e-06, 'epoch': 1.45} {'loss': 0.5224, 'learning_rate': 3.506577489792935e-06, 'epoch': 1.45} {'loss': 0.4382, 'learning_rate': 3.506328543639126e-06, 'epoch': 1.45} {'loss': 0.3522, 'learning_rate': 3.5060796044438795e-06, 'epoch': 1.45} {'loss': 0.4088, 'learning_rate': 3.505830672207451e-06, 'epoch': 1.45} {'loss': 0.489, 'learning_rate': 3.50558174693011e-06, 'epoch': 1.45} {'loss': 0.4934, 'learning_rate': 3.505332828612126e-06, 'epoch': 1.45} {'loss': 0.4446, 'learning_rate': 3.505083917253763e-06, 'epoch': 1.45} {'loss': 0.5112, 'learning_rate': 3.504835012855292e-06, 'epoch': 1.45} {'loss': 0.5246, 'learning_rate': 3.50458611541697e-06, 'epoch': 1.45} {'loss': 0.3633, 'learning_rate': 3.5043372249390783e-06, 'epoch': 1.45} {'loss': 0.3944, 'learning_rate': 3.5040883414218707e-06, 'epoch': 1.45} {'loss': 0.5678, 'learning_rate': 3.503839464865619e-06, 'epoch': 1.45} {'loss': 0.5814, 'learning_rate': 3.503590595270593e-06, 'epoch': 1.45} {'loss': 0.5353, 'learning_rate': 3.503341732637049e-06, 'epoch': 1.45} {'loss': 0.5354, 'learning_rate': 3.5030928769652685e-06, 'epoch': 1.45} {'loss': 0.4664, 'learning_rate': 3.502844028255502e-06, 'epoch': 1.45} {'loss': 0.5544, 'learning_rate': 3.5025951865080333e-06, 'epoch': 1.45} {'loss': 0.6118, 'learning_rate': 3.502346351723115e-06, 'epoch': 1.45} {'loss': 0.4776, 'learning_rate': 3.50209752390102e-06, 'epoch': 1.45} {'loss': 0.5212, 'learning_rate': 3.501848703042017e-06, 'epoch': 1.45} {'loss': 0.5773, 'learning_rate': 3.501599889146363e-06, 'epoch': 1.45} {'loss': 0.4708, 'learning_rate': 3.501351082214338e-06, 'epoch': 1.45} {'loss': 0.5691, 'learning_rate': 3.501102282246195e-06, 'epoch': 1.45} {'loss': 0.5068, 'learning_rate': 3.500853489242214e-06, 'epoch': 1.45} {'loss': 0.5437, 'learning_rate': 3.5006047032026524e-06, 'epoch': 1.45} {'loss': 0.4464, 'learning_rate': 3.5003559241277798e-06, 'epoch': 1.45} {'loss': 0.5903, 'learning_rate': 3.500107152017864e-06, 'epoch': 1.45} {'loss': 0.5652, 'learning_rate': 3.499858386873165e-06, 'epoch': 1.45} {'loss': 0.4998, 'learning_rate': 3.4996096286939607e-06, 'epoch': 1.45} {'loss': 0.587, 'learning_rate': 3.499360877480504e-06, 'epoch': 1.45} {'loss': 0.6924, 'learning_rate': 3.4991121332330767e-06, 'epoch': 1.45} {'loss': 0.5825, 'learning_rate': 3.4988633959519337e-06, 'epoch': 1.45} {'loss': 0.5107, 'learning_rate': 3.4986146656373444e-06, 'epoch': 1.45} {'loss': 0.5015, 'learning_rate': 3.4983659422895812e-06, 'epoch': 1.45} {'loss': 0.4913, 'learning_rate': 3.498117225908898e-06, 'epoch': 1.45} {'loss': 0.5556, 'learning_rate': 3.4978685164955763e-06, 'epoch': 1.45} {'loss': 0.4715, 'learning_rate': 3.4976198140498672e-06, 'epoch': 1.45} {'loss': 0.5146, 'learning_rate': 3.4973711185720537e-06, 'epoch': 1.45} {'loss': 0.6605, 'learning_rate': 3.4971224300623897e-06, 'epoch': 1.45} {'loss': 0.4694, 'learning_rate': 3.496873748521146e-06, 'epoch': 1.45} {'loss': 0.6339, 'learning_rate': 3.496625073948593e-06, 'epoch': 1.45} {'loss': 0.5667, 'learning_rate': 3.4963764063449858e-06, 'epoch': 1.45} {'loss': 0.6259, 'learning_rate': 3.4961277457106056e-06, 'epoch': 1.45} {'loss': 0.4368, 'learning_rate': 3.4958790920457074e-06, 'epoch': 1.45} {'loss': 0.591, 'learning_rate': 3.4956304453505618e-06, 'epoch': 1.45} {'loss': 0.568, 'learning_rate': 3.4953818056254364e-06, 'epoch': 1.45} {'loss': 0.573, 'learning_rate': 3.495133172870595e-06, 'epoch': 1.45} {'loss': 0.54, 'learning_rate': 3.4948845470863103e-06, 'epoch': 1.45} {'loss': 0.5389, 'learning_rate': 3.494635928272836e-06, 'epoch': 1.45} {'loss': 0.548, 'learning_rate': 3.494387316430454e-06, 'epoch': 1.45} {'loss': 0.4945, 'learning_rate': 3.4941387115594196e-06, 'epoch': 1.45} {'loss': 0.5786, 'learning_rate': 3.4938901136600023e-06, 'epoch': 1.45} {'loss': 0.4555, 'learning_rate': 3.4936415227324696e-06, 'epoch': 1.45} {'loss': 0.4953, 'learning_rate': 3.493392938777087e-06, 'epoch': 1.45} {'loss': 0.626, 'learning_rate': 3.4931443617941242e-06, 'epoch': 1.45} {'loss': 0.4908, 'learning_rate': 3.492895791783838e-06, 'epoch': 1.45} {'loss': 0.471, 'learning_rate': 3.4926472287465075e-06, 'epoch': 1.45} {'loss': 0.5803, 'learning_rate': 3.49239867268239e-06, 'epoch': 1.45} {'loss': 0.5357, 'learning_rate': 3.4921501235917552e-06, 'epoch': 1.45} {'loss': 0.5889, 'learning_rate': 3.491901581474868e-06, 'epoch': 1.45} {'loss': 0.5127, 'learning_rate': 3.4916530463319964e-06, 'epoch': 1.45} {'loss': 0.5775, 'learning_rate': 3.491404518163408e-06, 'epoch': 1.45} {'loss': 0.546, 'learning_rate': 3.4911559969693654e-06, 'epoch': 1.45} {'loss': 0.4284, 'learning_rate': 3.4909074827501355e-06, 'epoch': 1.45} {'loss': 0.5635, 'learning_rate': 3.490658975505986e-06, 'epoch': 1.45} {'loss': 0.4554, 'learning_rate': 3.4904104752371824e-06, 'epoch': 1.45} {'loss': 0.5157, 'learning_rate': 3.4901619819439925e-06, 'epoch': 1.45} {'loss': 0.4133, 'learning_rate': 3.4899134956266813e-06, 'epoch': 1.45} {'loss': 0.6401, 'learning_rate': 3.4896650162855182e-06, 'epoch': 1.45} {'loss': 0.6129, 'learning_rate': 3.4894165439207638e-06, 'epoch': 1.45} {'loss': 0.5805, 'learning_rate': 3.4891680785326876e-06, 'epoch': 1.45} {'loss': 0.6878, 'learning_rate': 3.488919620121555e-06, 'epoch': 1.45} {'loss': 0.3823, 'learning_rate': 3.4886711686876317e-06, 'epoch': 1.45} {'loss': 0.6189, 'learning_rate': 3.4884227242311898e-06, 'epoch': 1.45} {'loss': 0.5534, 'learning_rate': 3.4881742867524838e-06, 'epoch': 1.45} {'loss': 0.5508, 'learning_rate': 3.4879258562517927e-06, 'epoch': 1.45} {'loss': 0.5588, 'learning_rate': 3.4876774327293737e-06, 'epoch': 1.45} {'loss': 0.5861, 'learning_rate': 3.487429016185496e-06, 'epoch': 1.45} {'loss': 0.3581, 'learning_rate': 3.4871806066204262e-06, 'epoch': 1.45} {'loss': 0.644, 'learning_rate': 3.48693220403443e-06, 'epoch': 1.45} {'loss': 0.5813, 'learning_rate': 3.4866838084277763e-06, 'epoch': 1.45} {'loss': 0.6907, 'learning_rate': 3.4864354198007265e-06, 'epoch': 1.45} {'loss': 0.489, 'learning_rate': 3.486187038153549e-06, 'epoch': 1.45} {'loss': 0.6309, 'learning_rate': 3.48593866348651e-06, 'epoch': 1.45} {'loss': 0.4527, 'learning_rate': 3.4856902957998752e-06, 'epoch': 1.45} {'loss': 0.5549, 'learning_rate': 3.4854419350939117e-06, 'epoch': 1.45} {'loss': 0.4128, 'learning_rate': 3.4851935813688854e-06, 'epoch': 1.45} {'loss': 0.4567, 'learning_rate': 3.4849452346250644e-06, 'epoch': 1.45} {'loss': 0.496, 'learning_rate': 3.48469689486271e-06, 'epoch': 1.45} {'loss': 0.4671, 'learning_rate': 3.4844485620820913e-06, 'epoch': 1.45} {'loss': 0.5988, 'learning_rate': 3.4842002362834727e-06, 'epoch': 1.45} {'loss': 0.4883, 'learning_rate': 3.4839519174671234e-06, 'epoch': 1.45} {'loss': 0.5659, 'learning_rate': 3.4837036056333063e-06, 'epoch': 1.45} {'loss': 0.5639, 'learning_rate': 3.483455300782289e-06, 'epoch': 1.45} {'loss': 0.5621, 'learning_rate': 3.4832070029143417e-06, 'epoch': 1.45} {'loss': 0.491, 'learning_rate': 3.4829587120297225e-06, 'epoch': 1.45} {'loss': 0.552, 'learning_rate': 3.482710428128702e-06, 'epoch': 1.45} {'loss': 0.5179, 'learning_rate': 3.482462151211544e-06, 'epoch': 1.45} {'loss': 0.5982, 'learning_rate': 3.482213881278517e-06, 'epoch': 1.45} {'loss': 0.6433, 'learning_rate': 3.4819656183298857e-06, 'epoch': 1.45} {'loss': 0.4295, 'learning_rate': 3.4817173623659196e-06, 'epoch': 1.45} {'loss': 0.5653, 'learning_rate': 3.4814691133868795e-06, 'epoch': 1.45} {'loss': 0.4868, 'learning_rate': 3.481220871393033e-06, 'epoch': 1.45} {'loss': 0.3895, 'learning_rate': 3.480972636384646e-06, 'epoch': 1.45} {'loss': 0.6764, 'learning_rate': 3.4807244083619863e-06, 'epoch': 1.45} {'loss': 0.4431, 'learning_rate': 3.480476187325318e-06, 'epoch': 1.45} {'loss': 0.5, 'learning_rate': 3.480227973274908e-06, 'epoch': 1.45} {'loss': 0.4334, 'learning_rate': 3.4799797662110258e-06, 'epoch': 1.45} {'loss': 0.5224, 'learning_rate': 3.4797315661339293e-06, 'epoch': 1.45} {'loss': 0.6033, 'learning_rate': 3.4794833730438903e-06, 'epoch': 1.45} {'loss': 0.4542, 'learning_rate': 3.4792351869411735e-06, 'epoch': 1.45} {'loss': 0.5122, 'learning_rate': 3.4789870078260435e-06, 'epoch': 1.45} {'loss': 0.497, 'learning_rate': 3.4787388356987685e-06, 'epoch': 1.45} {'loss': 0.3725, 'learning_rate': 3.478490670559613e-06, 'epoch': 1.45} {'loss': 0.6513, 'learning_rate': 3.478242512408847e-06, 'epoch': 1.45} {'loss': 0.556, 'learning_rate': 3.4779943612467294e-06, 'epoch': 1.45} {'loss': 0.5696, 'learning_rate': 3.477746217073529e-06, 'epoch': 1.45} {'loss': 0.6038, 'learning_rate': 3.4774980798895117e-06, 'epoch': 1.45} {'loss': 0.4962, 'learning_rate': 3.4772499496949454e-06, 'epoch': 1.45} {'loss': 0.4393, 'learning_rate': 3.4770018264900975e-06, 'epoch': 1.45} {'loss': 0.4695, 'learning_rate': 3.4767537102752238e-06, 'epoch': 1.45} {'loss': 0.5022, 'learning_rate': 3.476505601050604e-06, 'epoch': 1.45} {'loss': 0.5858, 'learning_rate': 3.476257498816493e-06, 'epoch': 1.45} {'loss': 0.5223, 'learning_rate': 3.4760094035731615e-06, 'epoch': 1.45} {'loss': 0.3986, 'learning_rate': 3.4757613153208758e-06, 'epoch': 1.45} {'loss': 0.4727, 'learning_rate': 3.4755132340598996e-06, 'epoch': 1.45} {'loss': 0.5569, 'learning_rate': 3.4752651597905027e-06, 'epoch': 1.45} {'loss': 0.4777, 'learning_rate': 3.4750170925129423e-06, 'epoch': 1.45} {'loss': 0.4248, 'learning_rate': 3.4747690322274974e-06, 'epoch': 1.45} {'loss': 0.6478, 'learning_rate': 3.4745209789344214e-06, 'epoch': 1.45} {'loss': 0.5085, 'learning_rate': 3.4742729326339864e-06, 'epoch': 1.45} {'loss': 0.5542, 'learning_rate': 3.4740248933264597e-06, 'epoch': 1.45} {'loss': 0.6342, 'learning_rate': 3.473776861012098e-06, 'epoch': 1.45} {'loss': 0.5281, 'learning_rate': 3.47352883569118e-06, 'epoch': 1.45} {'loss': 0.4505, 'learning_rate': 3.473280817363958e-06, 'epoch': 1.45} {'loss': 0.5529, 'learning_rate': 3.4730328060307115e-06, 'epoch': 1.45} {'loss': 0.511, 'learning_rate': 3.4727848016916954e-06, 'epoch': 1.45} {'loss': 0.6346, 'learning_rate': 3.472536804347181e-06, 'epoch': 1.45} {'loss': 0.5254, 'learning_rate': 3.4722888139974352e-06, 'epoch': 1.45} {'loss': 0.6033, 'learning_rate': 3.4720408306427134e-06, 'epoch': 1.45} {'loss': 0.4459, 'learning_rate': 3.471792854283297e-06, 'epoch': 1.45} {'loss': 0.4989, 'learning_rate': 3.4715448849194398e-06, 'epoch': 1.45} {'loss': 0.5579, 'learning_rate': 3.4712969225514114e-06, 'epoch': 1.45} {'loss': 0.5053, 'learning_rate': 3.471048967179479e-06, 'epoch': 1.45} {'loss': 0.6323, 'learning_rate': 3.4708010188039054e-06, 'epoch': 1.45} {'loss': 0.5244, 'learning_rate': 3.4705530774249617e-06, 'epoch': 1.45} {'loss': 0.6389, 'learning_rate': 3.4703051430429024e-06, 'epoch': 1.45} {'loss': 0.5935, 'learning_rate': 3.470057215658008e-06, 'epoch': 1.45} {'loss': 0.4267, 'learning_rate': 3.469809295270533e-06, 'epoch': 1.45} {'loss': 0.5015, 'learning_rate': 3.469561381880746e-06, 'epoch': 1.45} {'loss': 0.4787, 'learning_rate': 3.4693134754889144e-06, 'epoch': 1.45} {'loss': 0.5356, 'learning_rate': 3.469065576095303e-06, 'epoch': 1.45} {'loss': 0.403, 'learning_rate': 3.4688176837001795e-06, 'epoch': 1.45} {'loss': 0.6275, 'learning_rate': 3.4685697983038015e-06, 'epoch': 1.45} {'loss': 0.4551, 'learning_rate': 3.4683219199064467e-06, 'epoch': 1.45} {'loss': 0.4818, 'learning_rate': 3.468074048508372e-06, 'epoch': 1.45} {'loss': 0.5049, 'learning_rate': 3.4678261841098447e-06, 'epoch': 1.45} {'loss': 0.4607, 'learning_rate': 3.467578326711135e-06, 'epoch': 1.45} {'loss': 0.6848, 'learning_rate': 3.467330476312497e-06, 'epoch': 1.45} {'loss': 0.4612, 'learning_rate': 3.4670826329142115e-06, 'epoch': 1.45} {'loss': 0.6068, 'learning_rate': 3.4668347965165304e-06, 'epoch': 1.45} {'loss': 0.5172, 'learning_rate': 3.4665869671197317e-06, 'epoch': 1.45} {'loss': 0.5509, 'learning_rate': 3.466339144724071e-06, 'epoch': 1.45} {'loss': 0.5616, 'learning_rate': 3.466091329329818e-06, 'epoch': 1.46} {'loss': 0.4268, 'learning_rate': 3.465843520937241e-06, 'epoch': 1.46} {'loss': 0.4097, 'learning_rate': 3.465595719546596e-06, 'epoch': 1.46} {'loss': 0.5602, 'learning_rate': 3.465347925158161e-06, 'epoch': 1.46} {'loss': 0.5804, 'learning_rate': 3.465100137772189e-06, 'epoch': 1.46} {'loss': 0.5618, 'learning_rate': 3.464852357388959e-06, 'epoch': 1.46} {'loss': 0.6346, 'learning_rate': 3.4646045840087273e-06, 'epoch': 1.46} {'loss': 0.4411, 'learning_rate': 3.4643568176317597e-06, 'epoch': 1.46} {'loss': 0.602, 'learning_rate': 3.464109058258328e-06, 'epoch': 1.46} {'loss': 0.5841, 'learning_rate': 3.463861305888686e-06, 'epoch': 1.46} {'loss': 0.5039, 'learning_rate': 3.4636135605231147e-06, 'epoch': 1.46} {'loss': 0.4681, 'learning_rate': 3.4633658221618626e-06, 'epoch': 1.46} {'loss': 0.4572, 'learning_rate': 3.463118090805212e-06, 'epoch': 1.46} {'loss': 0.6829, 'learning_rate': 3.462870366453417e-06, 'epoch': 1.46} {'loss': 0.5634, 'learning_rate': 3.462622649106746e-06, 'epoch': 1.46} {'loss': 0.357, 'learning_rate': 3.462374938765469e-06, 'epoch': 1.46} {'loss': 0.5308, 'learning_rate': 3.4621272354298396e-06, 'epoch': 1.46} {'loss': 0.4612, 'learning_rate': 3.461879539100138e-06, 'epoch': 1.46} {'loss': 0.4799, 'learning_rate': 3.4616318497766164e-06, 'epoch': 1.46} {'loss': 0.5797, 'learning_rate': 3.461384167459553e-06, 'epoch': 1.46} {'loss': 0.4432, 'learning_rate': 3.461136492149202e-06, 'epoch': 1.46} {'loss': 0.5094, 'learning_rate': 3.460888823845835e-06, 'epoch': 1.46} {'loss': 0.5072, 'learning_rate': 3.4606411625497184e-06, 'epoch': 1.46} {'loss': 0.5531, 'learning_rate': 3.4603935082611086e-06, 'epoch': 1.46} {'loss': 0.533, 'learning_rate': 3.460145860980284e-06, 'epoch': 1.46} {'loss': 0.5979, 'learning_rate': 3.4598982207074995e-06, 'epoch': 1.46} {'loss': 0.4903, 'learning_rate': 3.4596505874430254e-06, 'epoch': 1.46} {'loss': 0.5717, 'learning_rate': 3.4594029611871247e-06, 'epoch': 1.46} {'loss': 0.4177, 'learning_rate': 3.4591553419400646e-06, 'epoch': 1.46} {'loss': 0.5152, 'learning_rate': 3.4589077297021132e-06, 'epoch': 1.46} {'loss': 0.5612, 'learning_rate': 3.4586601244735264e-06, 'epoch': 1.46} {'loss': 0.6528, 'learning_rate': 3.4584125262545822e-06, 'epoch': 1.46} {'loss': 0.486, 'learning_rate': 3.458164935045536e-06, 'epoch': 1.46} {'loss': 0.4894, 'learning_rate': 3.4579173508466556e-06, 'epoch': 1.46} {'loss': 0.7138, 'learning_rate': 3.4576697736582076e-06, 'epoch': 1.46} {'loss': 0.4495, 'learning_rate': 3.457422203480458e-06, 'epoch': 1.46} {'loss': 0.4866, 'learning_rate': 3.457174640313673e-06, 'epoch': 1.46} {'loss': 0.4553, 'learning_rate': 3.4569270841581104e-06, 'epoch': 1.46} {'loss': 0.5009, 'learning_rate': 3.456679535014047e-06, 'epoch': 1.46} {'loss': 0.5152, 'learning_rate': 3.4564319928817393e-06, 'epoch': 1.46} {'loss': 0.5239, 'learning_rate': 3.4561844577614546e-06, 'epoch': 1.46} {'loss': 0.5484, 'learning_rate': 3.4559369296534582e-06, 'epoch': 1.46} {'loss': 0.5811, 'learning_rate': 3.455689408558017e-06, 'epoch': 1.46} {'loss': 0.5958, 'learning_rate': 3.4554418944753986e-06, 'epoch': 1.46} {'loss': 0.5309, 'learning_rate': 3.4551943874058614e-06, 'epoch': 1.46} {'loss': 0.5552, 'learning_rate': 3.4549468873496748e-06, 'epoch': 1.46} {'loss': 0.4592, 'learning_rate': 3.4546993943071027e-06, 'epoch': 1.46} {'loss': 0.5986, 'learning_rate': 3.454451908278411e-06, 'epoch': 1.46} {'loss': 0.6621, 'learning_rate': 3.4542044292638645e-06, 'epoch': 1.46} {'loss': 0.5574, 'learning_rate': 3.4539569572637287e-06, 'epoch': 1.46} {'loss': 0.5776, 'learning_rate': 3.4537094922782734e-06, 'epoch': 1.46} {'loss': 0.6006, 'learning_rate': 3.453462034307754e-06, 'epoch': 1.46} {'loss': 0.6044, 'learning_rate': 3.4532145833524422e-06, 'epoch': 1.46} {'loss': 0.5531, 'learning_rate': 3.4529671394126017e-06, 'epoch': 1.46} {'loss': 0.6513, 'learning_rate': 3.452719702488497e-06, 'epoch': 1.46} {'loss': 0.6393, 'learning_rate': 3.452472272580395e-06, 'epoch': 1.46} {'loss': 0.4298, 'learning_rate': 3.4522248496885637e-06, 'epoch': 1.46} {'loss': 0.4038, 'learning_rate': 3.4519774338132604e-06, 'epoch': 1.46} {'loss': 0.6917, 'learning_rate': 3.4517300249547535e-06, 'epoch': 1.46} {'loss': 0.5913, 'learning_rate': 3.4514826231133102e-06, 'epoch': 1.46} {'loss': 0.4388, 'learning_rate': 3.4512352282891935e-06, 'epoch': 1.46} {'loss': 0.4158, 'learning_rate': 3.4509878404826703e-06, 'epoch': 1.46} {'loss': 0.4102, 'learning_rate': 3.4507404596940073e-06, 'epoch': 1.46} {'loss': 0.4004, 'learning_rate': 3.450493085923463e-06, 'epoch': 1.46} {'loss': 0.514, 'learning_rate': 3.4502457191713077e-06, 'epoch': 1.46} {'loss': 0.4115, 'learning_rate': 3.449998359437805e-06, 'epoch': 1.46} {'loss': 0.5955, 'learning_rate': 3.44975100672322e-06, 'epoch': 1.46} {'loss': 0.593, 'learning_rate': 3.4495036610278176e-06, 'epoch': 1.46} {'loss': 0.667, 'learning_rate': 3.4492563223518637e-06, 'epoch': 1.46} {'loss': 0.5766, 'learning_rate': 3.449008990695626e-06, 'epoch': 1.46} {'loss': 0.6655, 'learning_rate': 3.448761666059364e-06, 'epoch': 1.46} {'loss': 0.524, 'learning_rate': 3.4485143484433435e-06, 'epoch': 1.46} {'loss': 0.6307, 'learning_rate': 3.4482670378478324e-06, 'epoch': 1.46} {'loss': 0.474, 'learning_rate': 3.448019734273095e-06, 'epoch': 1.46} {'loss': 0.6329, 'learning_rate': 3.4477724377193945e-06, 'epoch': 1.46} {'loss': 0.6038, 'learning_rate': 3.447525148187001e-06, 'epoch': 1.46} {'loss': 0.4926, 'learning_rate': 3.447277865676173e-06, 'epoch': 1.46} {'loss': 0.5559, 'learning_rate': 3.447030590187177e-06, 'epoch': 1.46} {'loss': 0.4716, 'learning_rate': 3.4467833217202797e-06, 'epoch': 1.46} {'loss': 0.4552, 'learning_rate': 3.446536060275746e-06, 'epoch': 1.46} {'loss': 0.5247, 'learning_rate': 3.44628880585384e-06, 'epoch': 1.46} {'loss': 0.5355, 'learning_rate': 3.446041558454827e-06, 'epoch': 1.46} {'loss': 0.5339, 'learning_rate': 3.4457943180789753e-06, 'epoch': 1.46} {'loss': 0.4253, 'learning_rate': 3.4455470847265438e-06, 'epoch': 1.46} {'loss': 0.5582, 'learning_rate': 3.4452998583977993e-06, 'epoch': 1.46} {'loss': 0.5717, 'learning_rate': 3.4450526390930086e-06, 'epoch': 1.46} {'loss': 0.5593, 'learning_rate': 3.4448054268124342e-06, 'epoch': 1.46} {'loss': 0.4621, 'learning_rate': 3.4445582215563435e-06, 'epoch': 1.46} {'loss': 0.6264, 'learning_rate': 3.444311023325e-06, 'epoch': 1.46} {'loss': 0.5154, 'learning_rate': 3.4440638321186726e-06, 'epoch': 1.46} {'loss': 0.6239, 'learning_rate': 3.4438166479376188e-06, 'epoch': 1.46} {'loss': 0.5126, 'learning_rate': 3.4435694707821065e-06, 'epoch': 1.46} {'loss': 0.5076, 'learning_rate': 3.443322300652403e-06, 'epoch': 1.46} {'loss': 0.4627, 'learning_rate': 3.4430751375487702e-06, 'epoch': 1.46} {'loss': 0.5294, 'learning_rate': 3.4428279814714772e-06, 'epoch': 1.46} {'loss': 0.541, 'learning_rate': 3.44258083242078e-06, 'epoch': 1.46} {'loss': 0.6148, 'learning_rate': 3.442333690396956e-06, 'epoch': 1.46} {'loss': 0.552, 'learning_rate': 3.4420865554002604e-06, 'epoch': 1.46} {'loss': 0.5096, 'learning_rate': 3.4418394274309596e-06, 'epoch': 1.46} {'loss': 0.4714, 'learning_rate': 3.441592306489321e-06, 'epoch': 1.46} {'loss': 0.6026, 'learning_rate': 3.4413451925756068e-06, 'epoch': 1.46} {'loss': 0.4104, 'learning_rate': 3.4410980856900876e-06, 'epoch': 1.46} {'loss': 0.6323, 'learning_rate': 3.440850985833016e-06, 'epoch': 1.46} {'loss': 0.6483, 'learning_rate': 3.4406038930046724e-06, 'epoch': 1.46} {'loss': 0.3671, 'learning_rate': 3.4403568072053105e-06, 'epoch': 1.46} {'loss': 0.659, 'learning_rate': 3.440109728435198e-06, 'epoch': 1.46} {'loss': 0.5296, 'learning_rate': 3.4398626566946004e-06, 'epoch': 1.46} {'loss': 0.5142, 'learning_rate': 3.4396155919837813e-06, 'epoch': 1.46} {'loss': 0.5953, 'learning_rate': 3.439368534303009e-06, 'epoch': 1.46} {'loss': 0.6455, 'learning_rate': 3.43912148365254e-06, 'epoch': 1.46} {'loss': 0.5743, 'learning_rate': 3.4388744400326513e-06, 'epoch': 1.46} {'loss': 0.641, 'learning_rate': 3.4386274034435962e-06, 'epoch': 1.46} {'loss': 0.4299, 'learning_rate': 3.4383803738856448e-06, 'epoch': 1.46} {'loss': 0.4383, 'learning_rate': 3.438133351359064e-06, 'epoch': 1.46} {'loss': 0.4952, 'learning_rate': 3.4378863358641102e-06, 'epoch': 1.46} {'loss': 0.5694, 'learning_rate': 3.437639327401059e-06, 'epoch': 1.46} {'loss': 0.3458, 'learning_rate': 3.4373923259701626e-06, 'epoch': 1.46} {'loss': 0.5689, 'learning_rate': 3.4371453315716997e-06, 'epoch': 1.46} {'loss': 0.4553, 'learning_rate': 3.4368983442059243e-06, 'epoch': 1.46} {'loss': 0.4845, 'learning_rate': 3.436651363873106e-06, 'epoch': 1.46} {'loss': 0.5563, 'learning_rate': 3.43640439057351e-06, 'epoch': 1.46} {'loss': 0.4565, 'learning_rate': 3.4361574243073924e-06, 'epoch': 1.46} {'loss': 0.604, 'learning_rate': 3.435910465075032e-06, 'epoch': 1.46} {'loss': 0.5533, 'learning_rate': 3.4356635128766793e-06, 'epoch': 1.46} {'loss': 0.5059, 'learning_rate': 3.4354165677126116e-06, 'epoch': 1.46} {'loss': 0.3453, 'learning_rate': 3.4351696295830848e-06, 'epoch': 1.46} {'loss': 0.6558, 'learning_rate': 3.4349226984883665e-06, 'epoch': 1.46} {'loss': 0.49, 'learning_rate': 3.434675774428724e-06, 'epoch': 1.46} {'loss': 0.4851, 'learning_rate': 3.4344288574044117e-06, 'epoch': 1.46} {'loss': 0.67, 'learning_rate': 3.434181947415709e-06, 'epoch': 1.46} {'loss': 0.4253, 'learning_rate': 3.4339350444628695e-06, 'epoch': 1.46} {'loss': 0.5835, 'learning_rate': 3.4336881485461614e-06, 'epoch': 1.46} {'loss': 0.6454, 'learning_rate': 3.4334412596658482e-06, 'epoch': 1.46} {'loss': 0.4341, 'learning_rate': 3.4331943778221952e-06, 'epoch': 1.46} {'loss': 0.5927, 'learning_rate': 3.4329475030154726e-06, 'epoch': 1.46} {'loss': 0.493, 'learning_rate': 3.43270063524593e-06, 'epoch': 1.46} {'loss': 0.6266, 'learning_rate': 3.4324537745138496e-06, 'epoch': 1.46} {'loss': 0.4905, 'learning_rate': 3.432206920819484e-06, 'epoch': 1.46} {'loss': 0.4737, 'learning_rate': 3.4319600741631023e-06, 'epoch': 1.46} {'loss': 0.5121, 'learning_rate': 3.431713234544968e-06, 'epoch': 1.46} {'loss': 0.4095, 'learning_rate': 3.4314664019653453e-06, 'epoch': 1.46} {'loss': 0.464, 'learning_rate': 3.4312195764245026e-06, 'epoch': 1.46} {'loss': 0.5135, 'learning_rate': 3.4309727579226938e-06, 'epoch': 1.46} {'loss': 0.5087, 'learning_rate': 3.4307259464601984e-06, 'epoch': 1.46} {'loss': 0.3528, 'learning_rate': 3.4304791420372686e-06, 'epoch': 1.46} {'loss': 0.4933, 'learning_rate': 3.430232344654174e-06, 'epoch': 1.46} {'loss': 0.5386, 'learning_rate': 3.429985554311178e-06, 'epoch': 1.46} {'loss': 0.4509, 'learning_rate': 3.4297387710085462e-06, 'epoch': 1.46} {'loss': 0.5371, 'learning_rate': 3.4294919947465443e-06, 'epoch': 1.46} {'loss': 0.4973, 'learning_rate': 3.4292452255254295e-06, 'epoch': 1.46} {'loss': 0.5272, 'learning_rate': 3.428998463345478e-06, 'epoch': 1.46} {'loss': 0.4137, 'learning_rate': 3.428751708206943e-06, 'epoch': 1.46} {'loss': 0.6554, 'learning_rate': 3.428504960110095e-06, 'epoch': 1.46} {'loss': 0.5077, 'learning_rate': 3.4282582190551995e-06, 'epoch': 1.46} {'loss': 0.4577, 'learning_rate': 3.4280114850425127e-06, 'epoch': 1.46} {'loss': 0.4251, 'learning_rate': 3.4277647580723107e-06, 'epoch': 1.46} {'loss': 0.454, 'learning_rate': 3.427518038144846e-06, 'epoch': 1.46} {'loss': 0.2801, 'learning_rate': 3.427271325260395e-06, 'epoch': 1.46} {'loss': 0.4836, 'learning_rate': 3.4270246194192123e-06, 'epoch': 1.46} {'loss': 0.5433, 'learning_rate': 3.4267779206215667e-06, 'epoch': 1.46} {'loss': 0.4524, 'learning_rate': 3.4265312288677255e-06, 'epoch': 1.46} {'loss': 0.5171, 'learning_rate': 3.426284544157942e-06, 'epoch': 1.46} {'loss': 0.6586, 'learning_rate': 3.4260378664924944e-06, 'epoch': 1.46} {'loss': 0.5098, 'learning_rate': 3.4257911958716374e-06, 'epoch': 1.46} {'loss': 0.494, 'learning_rate': 3.4255445322956393e-06, 'epoch': 1.46} {'loss': 0.5455, 'learning_rate': 3.4252978757647624e-06, 'epoch': 1.46} {'loss': 0.5971, 'learning_rate': 3.4250512262792735e-06, 'epoch': 1.46} {'loss': 0.5336, 'learning_rate': 3.424804583839437e-06, 'epoch': 1.46} {'loss': 0.4312, 'learning_rate': 3.4245579484455115e-06, 'epoch': 1.46} {'loss': 0.5604, 'learning_rate': 3.424311320097771e-06, 'epoch': 1.46} {'loss': 0.6499, 'learning_rate': 3.424064698796471e-06, 'epoch': 1.46} {'loss': 0.4019, 'learning_rate': 3.42381808454188e-06, 'epoch': 1.46} {'loss': 0.3926, 'learning_rate': 3.423571477334261e-06, 'epoch': 1.46} {'loss': 0.4883, 'learning_rate': 3.423324877173878e-06, 'epoch': 1.46} {'loss': 0.5088, 'learning_rate': 3.423078284061e-06, 'epoch': 1.46} {'loss': 0.5902, 'learning_rate': 3.422831697995881e-06, 'epoch': 1.46} {'loss': 0.5316, 'learning_rate': 3.4225851189787975e-06, 'epoch': 1.46} {'loss': 0.5687, 'learning_rate': 3.4223385470100047e-06, 'epoch': 1.46} {'loss': 0.5421, 'learning_rate': 3.4220919820897704e-06, 'epoch': 1.46} {'loss': 0.4607, 'learning_rate': 3.4218454242183575e-06, 'epoch': 1.46} {'loss': 0.416, 'learning_rate': 3.4215988733960303e-06, 'epoch': 1.46} {'loss': 0.5797, 'learning_rate': 3.4213523296230577e-06, 'epoch': 1.46} {'loss': 0.4496, 'learning_rate': 3.421105792899696e-06, 'epoch': 1.46} {'loss': 0.5943, 'learning_rate': 3.420859263226214e-06, 'epoch': 1.46} {'loss': 0.5303, 'learning_rate': 3.4206127406028744e-06, 'epoch': 1.46} {'loss': 0.6341, 'learning_rate': 3.420366225029943e-06, 'epoch': 1.46} {'loss': 0.5545, 'learning_rate': 3.4201197165076828e-06, 'epoch': 1.46} {'loss': 0.5144, 'learning_rate': 3.4198732150363576e-06, 'epoch': 1.46} {'loss': 0.4993, 'learning_rate': 3.4196267206162357e-06, 'epoch': 1.46} {'loss': 0.5661, 'learning_rate': 3.4193802332475746e-06, 'epoch': 1.46} {'loss': 0.6518, 'learning_rate': 3.419133752930641e-06, 'epoch': 1.46} {'loss': 0.5089, 'learning_rate': 3.4188872796657003e-06, 'epoch': 1.46} {'loss': 0.6577, 'learning_rate': 3.4186408134530147e-06, 'epoch': 1.46} {'loss': 0.6499, 'learning_rate': 3.41839435429285e-06, 'epoch': 1.46} {'loss': 0.564, 'learning_rate': 3.4181479021854704e-06, 'epoch': 1.46} {'loss': 0.4207, 'learning_rate': 3.417901457131142e-06, 'epoch': 1.46} {'loss': 0.5791, 'learning_rate': 3.417655019130124e-06, 'epoch': 1.46} {'loss': 0.6869, 'learning_rate': 3.417408588182681e-06, 'epoch': 1.46} {'loss': 0.5491, 'learning_rate': 3.4171621642890805e-06, 'epoch': 1.46} {'loss': 0.5319, 'learning_rate': 3.416915747449584e-06, 'epoch': 1.46} {'loss': 0.525, 'learning_rate': 3.4166693376644566e-06, 'epoch': 1.46} {'loss': 0.5271, 'learning_rate': 3.416422934933965e-06, 'epoch': 1.46} {'loss': 0.5534, 'learning_rate': 3.416176539258368e-06, 'epoch': 1.46} {'loss': 0.522, 'learning_rate': 3.4159301506379315e-06, 'epoch': 1.46} {'loss': 0.515, 'learning_rate': 3.4156837690729207e-06, 'epoch': 1.46} {'loss': 0.427, 'learning_rate': 3.415437394563598e-06, 'epoch': 1.46} {'loss': 0.3958, 'learning_rate': 3.4151910271102296e-06, 'epoch': 1.46} {'loss': 0.5635, 'learning_rate': 3.414944666713077e-06, 'epoch': 1.46} {'loss': 0.642, 'learning_rate': 3.4146983133724097e-06, 'epoch': 1.46} {'loss': 0.5286, 'learning_rate': 3.4144519670884845e-06, 'epoch': 1.46} {'loss': 0.528, 'learning_rate': 3.4142056278615677e-06, 'epoch': 1.46} {'loss': 0.5567, 'learning_rate': 3.4139592956919244e-06, 'epoch': 1.46} {'loss': 0.6286, 'learning_rate': 3.4137129705798176e-06, 'epoch': 1.46} {'loss': 0.5413, 'learning_rate': 3.413466652525512e-06, 'epoch': 1.46} {'loss': 0.4576, 'learning_rate': 3.413220341529272e-06, 'epoch': 1.46} {'loss': 0.4625, 'learning_rate': 3.412974037591363e-06, 'epoch': 1.46} {'loss': 0.5051, 'learning_rate': 3.4127277407120453e-06, 'epoch': 1.46} {'loss': 0.6398, 'learning_rate': 3.412481450891583e-06, 'epoch': 1.46} {'loss': 0.42, 'learning_rate': 3.4122351681302413e-06, 'epoch': 1.46} {'loss': 0.5216, 'learning_rate': 3.4119888924282853e-06, 'epoch': 1.46} {'loss': 0.5704, 'learning_rate': 3.4117426237859797e-06, 'epoch': 1.46} {'loss': 0.4845, 'learning_rate': 3.411496362203585e-06, 'epoch': 1.46} {'loss': 0.6213, 'learning_rate': 3.4112501076813654e-06, 'epoch': 1.46} {'loss': 0.4873, 'learning_rate': 3.411003860219586e-06, 'epoch': 1.46} {'loss': 0.4871, 'learning_rate': 3.41075761981851e-06, 'epoch': 1.46} {'loss': 0.6268, 'learning_rate': 3.4105113864784036e-06, 'epoch': 1.46} {'loss': 0.5324, 'learning_rate': 3.4102651601995275e-06, 'epoch': 1.46} {'loss': 0.4728, 'learning_rate': 3.4100189409821504e-06, 'epoch': 1.46} {'loss': 0.493, 'learning_rate': 3.4097727288265302e-06, 'epoch': 1.46} {'loss': 0.5449, 'learning_rate': 3.4095265237329333e-06, 'epoch': 1.46} {'loss': 0.4349, 'learning_rate': 3.409280325701624e-06, 'epoch': 1.46} {'loss': 0.2759, 'learning_rate': 3.409034134732865e-06, 'epoch': 1.46} {'loss': 0.5195, 'learning_rate': 3.408787950826924e-06, 'epoch': 1.46} {'loss': 0.5006, 'learning_rate': 3.4085417739840552e-06, 'epoch': 1.46} {'loss': 0.443, 'learning_rate': 3.4082956042045358e-06, 'epoch': 1.46} {'loss': 0.4527, 'learning_rate': 3.4080494414886176e-06, 'epoch': 1.46} {'loss': 0.5162, 'learning_rate': 3.407803285836572e-06, 'epoch': 1.46} {'loss': 0.4685, 'learning_rate': 3.4075571372486584e-06, 'epoch': 1.46} {'loss': 0.5218, 'learning_rate': 3.4073109957251425e-06, 'epoch': 1.46} {'loss': 0.6122, 'learning_rate': 3.4070648612662914e-06, 'epoch': 1.46} {'loss': 0.4739, 'learning_rate': 3.406818733872359e-06, 'epoch': 1.46} {'loss': 0.499, 'learning_rate': 3.4065726135436217e-06, 'epoch': 1.46} {'loss': 0.4842, 'learning_rate': 3.4063265002803335e-06, 'epoch': 1.46} {'loss': 0.4844, 'learning_rate': 3.4060803940827624e-06, 'epoch': 1.46} {'loss': 0.6129, 'learning_rate': 3.4058342949511703e-06, 'epoch': 1.46} {'loss': 0.4759, 'learning_rate': 3.4055882028858222e-06, 'epoch': 1.46} {'loss': 0.4491, 'learning_rate': 3.405342117886985e-06, 'epoch': 1.46} {'loss': 0.5434, 'learning_rate': 3.4050960399549127e-06, 'epoch': 1.46} {'loss': 0.5116, 'learning_rate': 3.4048499690898807e-06, 'epoch': 1.46} {'loss': 0.4571, 'learning_rate': 3.4046039052921455e-06, 'epoch': 1.46} {'loss': 0.5237, 'learning_rate': 3.404357848561971e-06, 'epoch': 1.46} {'loss': 0.6451, 'learning_rate': 3.4041117988996265e-06, 'epoch': 1.46} {'loss': 0.4894, 'learning_rate': 3.4038657563053647e-06, 'epoch': 1.46} {'loss': 0.5366, 'learning_rate': 3.403619720779462e-06, 'epoch': 1.46} {'loss': 0.6376, 'learning_rate': 3.4033736923221704e-06, 'epoch': 1.46} {'loss': 0.6006, 'learning_rate': 3.4031276709337656e-06, 'epoch': 1.46} {'loss': 0.368, 'learning_rate': 3.4028816566145017e-06, 'epoch': 1.46} {'loss': 0.4894, 'learning_rate': 3.4026356493646463e-06, 'epoch': 1.46} {'loss': 0.5949, 'learning_rate': 3.402389649184464e-06, 'epoch': 1.46} {'loss': 0.6212, 'learning_rate': 3.4021436560742106e-06, 'epoch': 1.46} {'loss': 0.5278, 'learning_rate': 3.401897670034163e-06, 'epoch': 1.46} {'loss': 0.4647, 'learning_rate': 3.4016516910645703e-06, 'epoch': 1.46} {'loss': 0.5333, 'learning_rate': 3.40140571916571e-06, 'epoch': 1.46} {'loss': 0.4887, 'learning_rate': 3.401159754337836e-06, 'epoch': 1.46} {'loss': 0.5361, 'learning_rate': 3.4009137965812145e-06, 'epoch': 1.46} {'loss': 0.4224, 'learning_rate': 3.400667845896114e-06, 'epoch': 1.46} {'loss': 0.5441, 'learning_rate': 3.4004219022827855e-06, 'epoch': 1.46} {'loss': 0.5052, 'learning_rate': 3.400175965741508e-06, 'epoch': 1.46} {'loss': 0.6291, 'learning_rate': 3.3999300362725307e-06, 'epoch': 1.46} {'loss': 0.5129, 'learning_rate': 3.3996841138761303e-06, 'epoch': 1.46} {'loss': 0.5263, 'learning_rate': 3.3994381985525614e-06, 'epoch': 1.46} {'loss': 0.5792, 'learning_rate': 3.3991922903020903e-06, 'epoch': 1.46} {'loss': 0.5282, 'learning_rate': 3.398946389124983e-06, 'epoch': 1.46} {'loss': 0.5419, 'learning_rate': 3.3987004950214943e-06, 'epoch': 1.46} {'loss': 0.506, 'learning_rate': 3.3984546079919e-06, 'epoch': 1.46} {'loss': 0.4784, 'learning_rate': 3.398208728036452e-06, 'epoch': 1.46} {'loss': 0.4928, 'learning_rate': 3.3979628551554246e-06, 'epoch': 1.46} {'loss': 0.6, 'learning_rate': 3.3977169893490727e-06, 'epoch': 1.46} {'loss': 0.3136, 'learning_rate': 3.3974711306176634e-06, 'epoch': 1.46} {'loss': 0.4722, 'learning_rate': 3.3972252789614623e-06, 'epoch': 1.46} {'loss': 0.5115, 'learning_rate': 3.396979434380724e-06, 'epoch': 1.46} {'loss': 0.3961, 'learning_rate': 3.3967335968757253e-06, 'epoch': 1.46} {'loss': 0.5896, 'learning_rate': 3.3964877664467153e-06, 'epoch': 1.46} {'loss': 0.5674, 'learning_rate': 3.396241943093972e-06, 'epoch': 1.46} {'loss': 0.4405, 'learning_rate': 3.3959961268177475e-06, 'epoch': 1.46} {'loss': 0.4806, 'learning_rate': 3.3957503176183093e-06, 'epoch': 1.46} {'loss': 0.4212, 'learning_rate': 3.395504515495924e-06, 'epoch': 1.46} {'loss': 0.55, 'learning_rate': 3.3952587204508457e-06, 'epoch': 1.46} {'loss': 0.5498, 'learning_rate': 3.395012932483349e-06, 'epoch': 1.46} {'loss': 0.4695, 'learning_rate': 3.3947671515936897e-06, 'epoch': 1.46} {'loss': 0.552, 'learning_rate': 3.394521377782134e-06, 'epoch': 1.46} {'loss': 0.3773, 'learning_rate': 3.3942756110489437e-06, 'epoch': 1.46} {'loss': 0.4222, 'learning_rate': 3.394029851394385e-06, 'epoch': 1.46} {'loss': 0.5733, 'learning_rate': 3.393784098818721e-06, 'epoch': 1.46} {'loss': 0.5191, 'learning_rate': 3.393538353322208e-06, 'epoch': 1.46} {'loss': 0.406, 'learning_rate': 3.3932926149051215e-06, 'epoch': 1.46} {'loss': 0.4945, 'learning_rate': 3.3930468835677144e-06, 'epoch': 1.46} {'loss': 0.4087, 'learning_rate': 3.392801159310255e-06, 'epoch': 1.46} {'loss': 0.5864, 'learning_rate': 3.3925554421330044e-06, 'epoch': 1.46} {'loss': 0.5545, 'learning_rate': 3.3923097320362274e-06, 'epoch': 1.46} {'loss': 0.4793, 'learning_rate': 3.3920640290201903e-06, 'epoch': 1.46} {'loss': 0.5154, 'learning_rate': 3.391818333085146e-06, 'epoch': 1.46} {'loss': 0.5486, 'learning_rate': 3.3915726442313714e-06, 'epoch': 1.46} {'loss': 0.6036, 'learning_rate': 3.3913269624591205e-06, 'epoch': 1.46} {'loss': 0.6132, 'learning_rate': 3.3910812877686583e-06, 'epoch': 1.46} {'loss': 0.5007, 'learning_rate': 3.3908356201602534e-06, 'epoch': 1.46} {'loss': 0.4421, 'learning_rate': 3.3905899596341574e-06, 'epoch': 1.46} {'loss': 0.5671, 'learning_rate': 3.390344306190647e-06, 'epoch': 1.46} {'loss': 0.5523, 'learning_rate': 3.390098659829977e-06, 'epoch': 1.46} {'loss': 0.5099, 'learning_rate': 3.3898530205524118e-06, 'epoch': 1.46} {'loss': 0.5752, 'learning_rate': 3.389607388358216e-06, 'epoch': 1.46} {'loss': 0.5219, 'learning_rate': 3.389361763247653e-06, 'epoch': 1.46} {'loss': 0.6875, 'learning_rate': 3.3891161452209874e-06, 'epoch': 1.46} {'loss': 0.4951, 'learning_rate': 3.3888705342784755e-06, 'epoch': 1.46} {'loss': 0.5088, 'learning_rate': 3.388624930420391e-06, 'epoch': 1.46} {'loss': 0.5568, 'learning_rate': 3.3883793336469895e-06, 'epoch': 1.46} {'loss': 0.5028, 'learning_rate': 3.388133743958536e-06, 'epoch': 1.46} {'loss': 0.401, 'learning_rate': 3.3878881613552926e-06, 'epoch': 1.46} {'loss': 0.4441, 'learning_rate': 3.387642585837525e-06, 'epoch': 1.46} {'loss': 0.4689, 'learning_rate': 3.3873970174054993e-06, 'epoch': 1.46} {'loss': 0.4204, 'learning_rate': 3.38715145605947e-06, 'epoch': 1.46} {'loss': 0.4765, 'learning_rate': 3.3869059017997052e-06, 'epoch': 1.46} {'loss': 0.4277, 'learning_rate': 3.3866603546264665e-06, 'epoch': 1.46} {'loss': 0.5902, 'learning_rate': 3.3864148145400187e-06, 'epoch': 1.46} {'loss': 0.5419, 'learning_rate': 3.3861692815406257e-06, 'epoch': 1.46} {'loss': 0.5589, 'learning_rate': 3.3859237556285475e-06, 'epoch': 1.46} {'loss': 0.6034, 'learning_rate': 3.385678236804053e-06, 'epoch': 1.46} {'loss': 0.5068, 'learning_rate': 3.385432725067398e-06, 'epoch': 1.46} {'loss': 0.4885, 'learning_rate': 3.3851872204188485e-06, 'epoch': 1.46} {'loss': 0.5321, 'learning_rate': 3.384941722858669e-06, 'epoch': 1.46} {'loss': 0.4551, 'learning_rate': 3.38469623238712e-06, 'epoch': 1.46} {'loss': 0.4196, 'learning_rate': 3.3844507490044663e-06, 'epoch': 1.46} {'loss': 0.5378, 'learning_rate': 3.384205272710972e-06, 'epoch': 1.46} {'loss': 0.561, 'learning_rate': 3.383959803506901e-06, 'epoch': 1.46} {'loss': 0.5842, 'learning_rate': 3.383714341392511e-06, 'epoch': 1.46} {'loss': 0.5862, 'learning_rate': 3.3834688863680687e-06, 'epoch': 1.46} {'loss': 0.428, 'learning_rate': 3.3832234384338356e-06, 'epoch': 1.46} {'loss': 0.4446, 'learning_rate': 3.3829779975900768e-06, 'epoch': 1.46} {'loss': 0.6015, 'learning_rate': 3.3827325638370544e-06, 'epoch': 1.46} {'loss': 0.4234, 'learning_rate': 3.3824871371750343e-06, 'epoch': 1.46} {'loss': 0.302, 'learning_rate': 3.3822417176042733e-06, 'epoch': 1.46} {'loss': 0.5149, 'learning_rate': 3.381996305125037e-06, 'epoch': 1.46} {'loss': 0.5282, 'learning_rate': 3.3817508997375893e-06, 'epoch': 1.46} {'loss': 0.5648, 'learning_rate': 3.3815055014421936e-06, 'epoch': 1.46} {'loss': 0.4986, 'learning_rate': 3.3812601102391107e-06, 'epoch': 1.46} {'loss': 0.5489, 'learning_rate': 3.3810147261286065e-06, 'epoch': 1.46} {'loss': 0.5598, 'learning_rate': 3.380769349110945e-06, 'epoch': 1.46} {'loss': 0.6659, 'learning_rate': 3.380523979186383e-06, 'epoch': 1.46} {'loss': 0.5091, 'learning_rate': 3.380278616355187e-06, 'epoch': 1.46} {'loss': 0.5531, 'learning_rate': 3.38003326061762e-06, 'epoch': 1.46} {'loss': 0.513, 'learning_rate': 3.3797879119739453e-06, 'epoch': 1.46} {'loss': 0.7008, 'learning_rate': 3.3795425704244254e-06, 'epoch': 1.46} {'loss': 0.6042, 'learning_rate': 3.3792972359693223e-06, 'epoch': 1.46} {'loss': 0.7041, 'learning_rate': 3.3790519086089036e-06, 'epoch': 1.46} {'loss': 0.5588, 'learning_rate': 3.378806588343425e-06, 'epoch': 1.46} {'loss': 0.428, 'learning_rate': 3.3785612751731534e-06, 'epoch': 1.46} {'loss': 0.311, 'learning_rate': 3.3783159690983504e-06, 'epoch': 1.46} {'loss': 0.5549, 'learning_rate': 3.3780706701192788e-06, 'epoch': 1.46} {'loss': 0.6104, 'learning_rate': 3.377825378236207e-06, 'epoch': 1.46} {'loss': 0.4567, 'learning_rate': 3.377580093449385e-06, 'epoch': 1.46} {'loss': 0.6302, 'learning_rate': 3.3773348157590915e-06, 'epoch': 1.46} {'loss': 0.516, 'learning_rate': 3.377089545165577e-06, 'epoch': 1.46} {'loss': 0.4552, 'learning_rate': 3.3768442816691095e-06, 'epoch': 1.46} {'loss': 0.5858, 'learning_rate': 3.376599025269951e-06, 'epoch': 1.46} {'loss': 0.6073, 'learning_rate': 3.376353775968364e-06, 'epoch': 1.46} {'loss': 0.542, 'learning_rate': 3.376108533764616e-06, 'epoch': 1.46} {'loss': 0.5231, 'learning_rate': 3.375863298658958e-06, 'epoch': 1.46} {'loss': 0.4475, 'learning_rate': 3.3756180706516674e-06, 'epoch': 1.46} {'loss': 0.5316, 'learning_rate': 3.375372849742996e-06, 'epoch': 1.46} {'loss': 0.6429, 'learning_rate': 3.375127635933211e-06, 'epoch': 1.46} {'loss': 0.4692, 'learning_rate': 3.3748824292225746e-06, 'epoch': 1.46} {'loss': 0.5214, 'learning_rate': 3.3746372296113504e-06, 'epoch': 1.46} {'loss': 0.3739, 'learning_rate': 3.374392037099803e-06, 'epoch': 1.46} {'loss': 0.547, 'learning_rate': 3.374146851688189e-06, 'epoch': 1.46} {'loss': 0.5088, 'learning_rate': 3.3739016733767747e-06, 'epoch': 1.46} {'loss': 0.4069, 'learning_rate': 3.373656502165823e-06, 'epoch': 1.46} {'loss': 0.4881, 'learning_rate': 3.3734113380555967e-06, 'epoch': 1.46} {'loss': 0.5446, 'learning_rate': 3.3731661810463613e-06, 'epoch': 1.46} {'loss': 0.6029, 'learning_rate': 3.3729210311383697e-06, 'epoch': 1.46} {'loss': 0.458, 'learning_rate': 3.3726758883318977e-06, 'epoch': 1.46} {'loss': 0.4287, 'learning_rate': 3.3724307526271994e-06, 'epoch': 1.46} {'loss': 0.6848, 'learning_rate': 3.3721856240245386e-06, 'epoch': 1.46} {'loss': 0.5114, 'learning_rate': 3.371940502524179e-06, 'epoch': 1.46} {'loss': 0.4566, 'learning_rate': 3.3716953881263846e-06, 'epoch': 1.46} {'loss': 0.5183, 'learning_rate': 3.37145028083142e-06, 'epoch': 1.46} {'loss': 0.5025, 'learning_rate': 3.3712051806395363e-06, 'epoch': 1.46} {'loss': 0.4838, 'learning_rate': 3.370960087551013e-06, 'epoch': 1.46} {'loss': 0.5883, 'learning_rate': 3.3707150015661004e-06, 'epoch': 1.46} {'loss': 0.5237, 'learning_rate': 3.3704699226850647e-06, 'epoch': 1.46} {'loss': 0.5872, 'learning_rate': 3.3702248509081693e-06, 'epoch': 1.46} {'loss': 0.6, 'learning_rate': 3.369979786235675e-06, 'epoch': 1.46} {'loss': 0.5356, 'learning_rate': 3.3697347286678506e-06, 'epoch': 1.46} {'loss': 0.609, 'learning_rate': 3.369489678204947e-06, 'epoch': 1.46} {'loss': 0.5239, 'learning_rate': 3.3692446348472407e-06, 'epoch': 1.46} {'loss': 0.4859, 'learning_rate': 3.368999598594983e-06, 'epoch': 1.46} {'loss': 0.4139, 'learning_rate': 3.3687545694484414e-06, 'epoch': 1.46} {'loss': 0.5085, 'learning_rate': 3.36850954740788e-06, 'epoch': 1.46} {'loss': 0.4592, 'learning_rate': 3.368264532473553e-06, 'epoch': 1.46} {'loss': 0.6202, 'learning_rate': 3.368019524645737e-06, 'epoch': 1.46} {'loss': 0.6664, 'learning_rate': 3.3677745239246785e-06, 'epoch': 1.46} {'loss': 0.5748, 'learning_rate': 3.367529530310655e-06, 'epoch': 1.46} {'loss': 0.5171, 'learning_rate': 3.3672845438039193e-06, 'epoch': 1.46} {'loss': 0.5241, 'learning_rate': 3.367039564404737e-06, 'epoch': 1.46} {'loss': 0.5344, 'learning_rate': 3.3667945921133736e-06, 'epoch': 1.46} {'loss': 0.4497, 'learning_rate': 3.3665496269300812e-06, 'epoch': 1.46} {'loss': 0.5146, 'learning_rate': 3.366304668855137e-06, 'epoch': 1.46} {'loss': 0.4429, 'learning_rate': 3.36605971788879e-06, 'epoch': 1.46} {'loss': 0.529, 'learning_rate': 3.365814774031314e-06, 'epoch': 1.46} {'loss': 0.4639, 'learning_rate': 3.365569837282964e-06, 'epoch': 1.46} {'loss': 0.6055, 'learning_rate': 3.3653249076440043e-06, 'epoch': 1.46} {'loss': 0.5057, 'learning_rate': 3.365079985114701e-06, 'epoch': 1.46} {'loss': 0.5803, 'learning_rate': 3.364835069695307e-06, 'epoch': 1.46} {'loss': 0.4319, 'learning_rate': 3.3645901613860977e-06, 'epoch': 1.46} {'loss': 0.551, 'learning_rate': 3.3643452601873217e-06, 'epoch': 1.46} {'loss': 0.5048, 'learning_rate': 3.3641003660992557e-06, 'epoch': 1.46} {'loss': 0.5987, 'learning_rate': 3.3638554791221524e-06, 'epoch': 1.46} {'loss': 0.6046, 'learning_rate': 3.363610599256276e-06, 'epoch': 1.46} {'loss': 0.4289, 'learning_rate': 3.3633657265018927e-06, 'epoch': 1.46} {'loss': 0.4921, 'learning_rate': 3.363120860859257e-06, 'epoch': 1.46} {'loss': 0.4762, 'learning_rate': 3.362876002328641e-06, 'epoch': 1.46} {'loss': 0.4632, 'learning_rate': 3.3626311509102973e-06, 'epoch': 1.46} {'loss': 0.4536, 'learning_rate': 3.3623863066044993e-06, 'epoch': 1.46} {'loss': 0.6238, 'learning_rate': 3.362141469411501e-06, 'epoch': 1.46} {'loss': 0.5787, 'learning_rate': 3.3618966393315665e-06, 'epoch': 1.46} {'loss': 0.506, 'learning_rate': 3.3616518163649616e-06, 'epoch': 1.46} {'loss': 0.6333, 'learning_rate': 3.3614070005119405e-06, 'epoch': 1.46} {'loss': 0.5863, 'learning_rate': 3.3611621917727764e-06, 'epoch': 1.46} {'loss': 0.5288, 'learning_rate': 3.3609173901477243e-06, 'epoch': 1.46} {'loss': 0.6625, 'learning_rate': 3.3606725956370476e-06, 'epoch': 1.46} {'loss': 0.4753, 'learning_rate': 3.360427808241009e-06, 'epoch': 1.46} {'loss': 0.4009, 'learning_rate': 3.3601830279598725e-06, 'epoch': 1.46} {'loss': 0.5509, 'learning_rate': 3.359938254793902e-06, 'epoch': 1.46} {'loss': 0.5772, 'learning_rate': 3.3596934887433496e-06, 'epoch': 1.46} {'loss': 0.4966, 'learning_rate': 3.359448729808492e-06, 'epoch': 1.46} {'loss': 0.522, 'learning_rate': 3.3592039779895813e-06, 'epoch': 1.46} {'loss': 0.5071, 'learning_rate': 3.3589592332868826e-06, 'epoch': 1.46} {'loss': 0.462, 'learning_rate': 3.358714495700659e-06, 'epoch': 1.46} {'loss': 0.4213, 'learning_rate': 3.3584697652311714e-06, 'epoch': 1.46} {'loss': 0.439, 'learning_rate': 3.3582250418786865e-06, 'epoch': 1.46} {'loss': 0.5589, 'learning_rate': 3.3579803256434574e-06, 'epoch': 1.46} {'loss': 0.6162, 'learning_rate': 3.357735616525757e-06, 'epoch': 1.46} {'loss': 0.4558, 'learning_rate': 3.3574909145258392e-06, 'epoch': 1.46} {'loss': 0.4747, 'learning_rate': 3.35724621964397e-06, 'epoch': 1.46} {'loss': 0.5727, 'learning_rate': 3.3570015318804115e-06, 'epoch': 1.46} {'loss': 0.4146, 'learning_rate': 3.3567568512354244e-06, 'epoch': 1.46} {'loss': 0.5224, 'learning_rate': 3.3565121777092757e-06, 'epoch': 1.46} {'loss': 0.4298, 'learning_rate': 3.3562675113022204e-06, 'epoch': 1.46} {'loss': 0.7285, 'learning_rate': 3.3560228520145245e-06, 'epoch': 1.46} {'loss': 0.5086, 'learning_rate': 3.35577819984645e-06, 'epoch': 1.46} {'loss': 0.5576, 'learning_rate': 3.355533554798258e-06, 'epoch': 1.46} {'loss': 0.494, 'learning_rate': 3.355288916870212e-06, 'epoch': 1.46} {'loss': 0.5168, 'learning_rate': 3.3550442860625733e-06, 'epoch': 1.46} {'loss': 0.6273, 'learning_rate': 3.3547996623756073e-06, 'epoch': 1.46} {'loss': 0.616, 'learning_rate': 3.354555045809571e-06, 'epoch': 1.46} {'loss': 0.5976, 'learning_rate': 3.354310436364728e-06, 'epoch': 1.46} {'loss': 0.5122, 'learning_rate': 3.3540658340413413e-06, 'epoch': 1.46} {'loss': 0.6372, 'learning_rate': 3.353821238839673e-06, 'epoch': 1.46} {'loss': 0.7825, 'learning_rate': 3.3535766507599852e-06, 'epoch': 1.46} {'loss': 0.6369, 'learning_rate': 3.3533320698025395e-06, 'epoch': 1.46} {'loss': 0.4403, 'learning_rate': 3.353087495967602e-06, 'epoch': 1.46} {'loss': 0.459, 'learning_rate': 3.3528429292554275e-06, 'epoch': 1.46} {'loss': 0.5457, 'learning_rate': 3.3525983696662823e-06, 'epoch': 1.46} {'loss': 0.5787, 'learning_rate': 3.352353817200428e-06, 'epoch': 1.46} {'loss': 0.5949, 'learning_rate': 3.352109271858126e-06, 'epoch': 1.46} {'loss': 0.5065, 'learning_rate': 3.3518647336396428e-06, 'epoch': 1.46} {'loss': 0.442, 'learning_rate': 3.3516202025452326e-06, 'epoch': 1.46} {'loss': 0.3085, 'learning_rate': 3.3513756785751615e-06, 'epoch': 1.46} {'loss': 0.5742, 'learning_rate': 3.3511311617296916e-06, 'epoch': 1.46} {'loss': 0.6063, 'learning_rate': 3.3508866520090855e-06, 'epoch': 1.46} {'loss': 0.5897, 'learning_rate': 3.3506421494136033e-06, 'epoch': 1.46} {'loss': 0.5494, 'learning_rate': 3.350397653943509e-06, 'epoch': 1.46} {'loss': 0.508, 'learning_rate': 3.350153165599066e-06, 'epoch': 1.46} {'loss': 0.4081, 'learning_rate': 3.3499086843805317e-06, 'epoch': 1.46} {'loss': 0.4686, 'learning_rate': 3.3496642102881706e-06, 'epoch': 1.46} {'loss': 0.4613, 'learning_rate': 3.349419743322244e-06, 'epoch': 1.46} {'loss': 0.4766, 'learning_rate': 3.349175283483015e-06, 'epoch': 1.46} {'loss': 0.4653, 'learning_rate': 3.3489308307707446e-06, 'epoch': 1.46} {'loss': 0.4293, 'learning_rate': 3.3486863851856945e-06, 'epoch': 1.46} {'loss': 0.3753, 'learning_rate': 3.3484419467281314e-06, 'epoch': 1.46} {'loss': 0.5211, 'learning_rate': 3.348197515398309e-06, 'epoch': 1.46} {'loss': 0.3784, 'learning_rate': 3.347953091196494e-06, 'epoch': 1.46} {'loss': 0.4774, 'learning_rate': 3.347708674122948e-06, 'epoch': 1.47} {'loss': 0.6822, 'learning_rate': 3.347464264177932e-06, 'epoch': 1.47} {'loss': 0.4938, 'learning_rate': 3.347219861361709e-06, 'epoch': 1.47} {'loss': 0.4567, 'learning_rate': 3.3469754656745425e-06, 'epoch': 1.47} {'loss': 0.584, 'learning_rate': 3.3467310771166894e-06, 'epoch': 1.47} {'loss': 0.5588, 'learning_rate': 3.3464866956884156e-06, 'epoch': 1.47} {'loss': 0.553, 'learning_rate': 3.3462423213899807e-06, 'epoch': 1.47} {'loss': 0.5772, 'learning_rate': 3.345997954221648e-06, 'epoch': 1.47} {'loss': 0.3295, 'learning_rate': 3.3457535941836785e-06, 'epoch': 1.47} {'loss': 0.5397, 'learning_rate': 3.3455092412763355e-06, 'epoch': 1.47} {'loss': 0.5674, 'learning_rate': 3.3452648954998822e-06, 'epoch': 1.47} {'loss': 0.5757, 'learning_rate': 3.3450205568545755e-06, 'epoch': 1.47} {'loss': 0.4121, 'learning_rate': 3.3447762253406802e-06, 'epoch': 1.47} {'loss': 0.6058, 'learning_rate': 3.3445319009584576e-06, 'epoch': 1.47} {'loss': 0.4113, 'learning_rate': 3.3442875837081702e-06, 'epoch': 1.47} {'loss': 0.58, 'learning_rate': 3.344043273590082e-06, 'epoch': 1.47} {'loss': 0.6098, 'learning_rate': 3.343798970604446e-06, 'epoch': 1.47} {'loss': 0.6288, 'learning_rate': 3.343554674751537e-06, 'epoch': 1.47} {'loss': 0.5848, 'learning_rate': 3.3433103860316054e-06, 'epoch': 1.47} {'loss': 0.5537, 'learning_rate': 3.3430661044449185e-06, 'epoch': 1.47} {'loss': 0.5162, 'learning_rate': 3.342821829991737e-06, 'epoch': 1.47} {'loss': 0.5512, 'learning_rate': 3.3425775626723224e-06, 'epoch': 1.47} {'loss': 0.5572, 'learning_rate': 3.342333302486941e-06, 'epoch': 1.47} {'loss': 0.5136, 'learning_rate': 3.3420890494358426e-06, 'epoch': 1.47} {'loss': 0.519, 'learning_rate': 3.341844803519304e-06, 'epoch': 1.47} {'loss': 0.7282, 'learning_rate': 3.341600564737576e-06, 'epoch': 1.47} {'loss': 0.5394, 'learning_rate': 3.341356333090925e-06, 'epoch': 1.47} {'loss': 0.5515, 'learning_rate': 3.3411121085796106e-06, 'epoch': 1.47} {'loss': 0.6975, 'learning_rate': 3.340867891203895e-06, 'epoch': 1.47} {'loss': 0.5287, 'learning_rate': 3.340623680964045e-06, 'epoch': 1.47} {'loss': 0.4656, 'learning_rate': 3.3403794778603104e-06, 'epoch': 1.47} {'loss': 0.4326, 'learning_rate': 3.340135281892968e-06, 'epoch': 1.47} {'loss': 0.5207, 'learning_rate': 3.3398910930622673e-06, 'epoch': 1.47} {'loss': 0.7692, 'learning_rate': 3.3396469113684748e-06, 'epoch': 1.47} {'loss': 0.4986, 'learning_rate': 3.3394027368118543e-06, 'epoch': 1.47} {'loss': 0.4964, 'learning_rate': 3.33915856939266e-06, 'epoch': 1.47} {'loss': 0.4385, 'learning_rate': 3.3389144091111637e-06, 'epoch': 1.47} {'loss': 0.4294, 'learning_rate': 3.3386702559676154e-06, 'epoch': 1.47} {'loss': 0.632, 'learning_rate': 3.3384261099622894e-06, 'epoch': 1.47} {'loss': 0.4236, 'learning_rate': 3.338181971095439e-06, 'epoch': 1.47} {'loss': 0.3856, 'learning_rate': 3.337937839367327e-06, 'epoch': 1.47} {'loss': 0.4938, 'learning_rate': 3.3376937147782197e-06, 'epoch': 1.47} {'loss': 0.6085, 'learning_rate': 3.3374495973283682e-06, 'epoch': 1.47} {'loss': 0.4136, 'learning_rate': 3.337205487018047e-06, 'epoch': 1.47} {'loss': 0.6374, 'learning_rate': 3.3369613838475045e-06, 'epoch': 1.47} {'loss': 0.5306, 'learning_rate': 3.336717287817016e-06, 'epoch': 1.47} {'loss': 0.4344, 'learning_rate': 3.336473198926834e-06, 'epoch': 1.47} {'loss': 0.5121, 'learning_rate': 3.336229117177222e-06, 'epoch': 1.47} {'loss': 0.5431, 'learning_rate': 3.3359850425684447e-06, 'epoch': 1.47} {'loss': 0.4955, 'learning_rate': 3.335740975100755e-06, 'epoch': 1.47} {'loss': 0.4899, 'learning_rate': 3.3354969147744267e-06, 'epoch': 1.47} {'loss': 0.5789, 'learning_rate': 3.3352528615897116e-06, 'epoch': 1.47} {'loss': 0.5705, 'learning_rate': 3.335008815546874e-06, 'epoch': 1.47} {'loss': 0.5204, 'learning_rate': 3.3347647766461764e-06, 'epoch': 1.47} {'loss': 0.3306, 'learning_rate': 3.33452074488788e-06, 'epoch': 1.47} {'loss': 0.5279, 'learning_rate': 3.33427672027225e-06, 'epoch': 1.47} {'loss': 0.5419, 'learning_rate': 3.334032702799537e-06, 'epoch': 1.47} {'loss': 0.5088, 'learning_rate': 3.333788692470017e-06, 'epoch': 1.47} {'loss': 0.5945, 'learning_rate': 3.3335446892839396e-06, 'epoch': 1.47} {'loss': 0.5715, 'learning_rate': 3.333300693241571e-06, 'epoch': 1.47} {'loss': 0.4238, 'learning_rate': 3.333056704343173e-06, 'epoch': 1.47} {'loss': 0.6052, 'learning_rate': 3.3328127225890062e-06, 'epoch': 1.47} {'loss': 0.5655, 'learning_rate': 3.3325687479793356e-06, 'epoch': 1.47} {'loss': 0.558, 'learning_rate': 3.332324780514412e-06, 'epoch': 1.47} {'loss': 0.3989, 'learning_rate': 3.332080820194512e-06, 'epoch': 1.47} {'loss': 0.4905, 'learning_rate': 3.3318368670198854e-06, 'epoch': 1.47} {'loss': 0.3797, 'learning_rate': 3.331592920990797e-06, 'epoch': 1.47} {'loss': 0.4267, 'learning_rate': 3.331348982107513e-06, 'epoch': 1.47} {'loss': 0.7417, 'learning_rate': 3.3311050503702822e-06, 'epoch': 1.47} {'loss': 0.486, 'learning_rate': 3.330861125779382e-06, 'epoch': 1.47} {'loss': 0.5038, 'learning_rate': 3.3306172083350596e-06, 'epoch': 1.47} {'loss': 0.5124, 'learning_rate': 3.330373298037589e-06, 'epoch': 1.47} {'loss': 0.4671, 'learning_rate': 3.3301293948872228e-06, 'epoch': 1.47} {'loss': 0.492, 'learning_rate': 3.3298854988842243e-06, 'epoch': 1.47} {'loss': 0.6318, 'learning_rate': 3.3296416100288586e-06, 'epoch': 1.47} {'loss': 0.5759, 'learning_rate': 3.3293977283213775e-06, 'epoch': 1.47} {'loss': 0.4156, 'learning_rate': 3.329153853762056e-06, 'epoch': 1.47} {'loss': 0.6514, 'learning_rate': 3.328909986351141e-06, 'epoch': 1.47} {'loss': 0.5414, 'learning_rate': 3.3286661260889077e-06, 'epoch': 1.47} {'loss': 0.6201, 'learning_rate': 3.3284222729756076e-06, 'epoch': 1.47} {'loss': 0.4811, 'learning_rate': 3.3281784270115048e-06, 'epoch': 1.47} {'loss': 0.6249, 'learning_rate': 3.327934588196865e-06, 'epoch': 1.47} {'loss': 0.5424, 'learning_rate': 3.3276907565319382e-06, 'epoch': 1.47} {'loss': 0.5744, 'learning_rate': 3.327446932017e-06, 'epoch': 1.47} {'loss': 0.4114, 'learning_rate': 3.3272031146522977e-06, 'epoch': 1.47} {'loss': 0.4326, 'learning_rate': 3.3269593044381065e-06, 'epoch': 1.47} {'loss': 0.4555, 'learning_rate': 3.3267155013746766e-06, 'epoch': 1.47} {'loss': 0.5932, 'learning_rate': 3.326471705462274e-06, 'epoch': 1.47} {'loss': 0.5465, 'learning_rate': 3.3262279167011625e-06, 'epoch': 1.47} {'loss': 0.6649, 'learning_rate': 3.3259841350915945e-06, 'epoch': 1.47} {'loss': 0.5867, 'learning_rate': 3.3257403606338424e-06, 'epoch': 1.47} {'loss': 0.4836, 'learning_rate': 3.325496593328158e-06, 'epoch': 1.47} {'loss': 0.4424, 'learning_rate': 3.3252528331748078e-06, 'epoch': 1.47} {'loss': 0.5659, 'learning_rate': 3.3250090801740507e-06, 'epoch': 1.47} {'loss': 0.4834, 'learning_rate': 3.324765334326149e-06, 'epoch': 1.47} {'loss': 0.4489, 'learning_rate': 3.324521595631367e-06, 'epoch': 1.47} {'loss': 0.4966, 'learning_rate': 3.3242778640899564e-06, 'epoch': 1.47} {'loss': 0.4651, 'learning_rate': 3.3240341397021913e-06, 'epoch': 1.47} {'loss': 0.4686, 'learning_rate': 3.3237904224683216e-06, 'epoch': 1.47} {'loss': 0.5153, 'learning_rate': 3.3235467123886145e-06, 'epoch': 1.47} {'loss': 0.569, 'learning_rate': 3.323303009463329e-06, 'epoch': 1.47} {'loss': 0.5955, 'learning_rate': 3.323059313692727e-06, 'epoch': 1.47} {'loss': 0.4948, 'learning_rate': 3.322815625077073e-06, 'epoch': 1.47} {'loss': 0.5595, 'learning_rate': 3.322571943616618e-06, 'epoch': 1.47} {'loss': 0.4983, 'learning_rate': 3.3223282693116364e-06, 'epoch': 1.47} {'loss': 0.5381, 'learning_rate': 3.3220846021623798e-06, 'epoch': 1.47} {'loss': 0.5861, 'learning_rate': 3.321840942169111e-06, 'epoch': 1.47} {'loss': 0.5802, 'learning_rate': 3.3215972893320936e-06, 'epoch': 1.47} {'loss': 0.583, 'learning_rate': 3.321353643651588e-06, 'epoch': 1.47} {'loss': 0.3988, 'learning_rate': 3.3211100051278567e-06, 'epoch': 1.47} {'loss': 0.5945, 'learning_rate': 3.320866373761156e-06, 'epoch': 1.47} {'loss': 0.4746, 'learning_rate': 3.3206227495517508e-06, 'epoch': 1.47} {'loss': 0.4519, 'learning_rate': 3.3203791324999003e-06, 'epoch': 1.47} {'loss': 0.5048, 'learning_rate': 3.3201355226058662e-06, 'epoch': 1.47} {'loss': 0.5025, 'learning_rate': 3.31989191986991e-06, 'epoch': 1.47} {'loss': 0.7955, 'learning_rate': 3.3196483242922915e-06, 'epoch': 1.47} {'loss': 0.3215, 'learning_rate': 3.3194047358732773e-06, 'epoch': 1.47} {'loss': 0.4861, 'learning_rate': 3.319161154613121e-06, 'epoch': 1.47} {'loss': 0.4791, 'learning_rate': 3.3189175805120856e-06, 'epoch': 1.47} {'loss': 0.4041, 'learning_rate': 3.3186740135704332e-06, 'epoch': 1.47} {'loss': 0.4141, 'learning_rate': 3.3184304537884247e-06, 'epoch': 1.47} {'loss': 0.5748, 'learning_rate': 3.3181869011663213e-06, 'epoch': 1.47} {'loss': 0.564, 'learning_rate': 3.3179433557043874e-06, 'epoch': 1.47} {'loss': 0.5829, 'learning_rate': 3.3176998174028752e-06, 'epoch': 1.47} {'loss': 0.5955, 'learning_rate': 3.3174562862620517e-06, 'epoch': 1.47} {'loss': 0.5157, 'learning_rate': 3.317212762282178e-06, 'epoch': 1.47} {'loss': 0.399, 'learning_rate': 3.316969245463513e-06, 'epoch': 1.47} {'loss': 0.6276, 'learning_rate': 3.316725735806319e-06, 'epoch': 1.47} {'loss': 0.5153, 'learning_rate': 3.3164822333108558e-06, 'epoch': 1.47} {'loss': 0.5692, 'learning_rate': 3.3162387379773887e-06, 'epoch': 1.47} {'loss': 0.5617, 'learning_rate': 3.315995249806172e-06, 'epoch': 1.47} {'loss': 0.417, 'learning_rate': 3.3157517687974693e-06, 'epoch': 1.47} {'loss': 0.4451, 'learning_rate': 3.3155082949515425e-06, 'epoch': 1.47} {'loss': 0.4635, 'learning_rate': 3.315264828268652e-06, 'epoch': 1.47} {'loss': 0.4331, 'learning_rate': 3.3150213687490584e-06, 'epoch': 1.47} {'loss': 0.5165, 'learning_rate': 3.314777916393025e-06, 'epoch': 1.47} {'loss': 0.4858, 'learning_rate': 3.3145344712008086e-06, 'epoch': 1.47} {'loss': 0.43, 'learning_rate': 3.314291033172671e-06, 'epoch': 1.47} {'loss': 0.5204, 'learning_rate': 3.314047602308874e-06, 'epoch': 1.47} {'loss': 0.3189, 'learning_rate': 3.3138041786096787e-06, 'epoch': 1.47} {'loss': 0.4753, 'learning_rate': 3.3135607620753462e-06, 'epoch': 1.47} {'loss': 0.486, 'learning_rate': 3.313317352706139e-06, 'epoch': 1.47} {'loss': 0.5443, 'learning_rate': 3.3130739505023137e-06, 'epoch': 1.47} {'loss': 0.6041, 'learning_rate': 3.312830555464133e-06, 'epoch': 1.47} {'loss': 0.5377, 'learning_rate': 3.312587167591856e-06, 'epoch': 1.47} {'loss': 0.5105, 'learning_rate': 3.3123437868857477e-06, 'epoch': 1.47} {'loss': 0.3707, 'learning_rate': 3.3121004133460656e-06, 'epoch': 1.47} {'loss': 0.5007, 'learning_rate': 3.3118570469730717e-06, 'epoch': 1.47} {'loss': 0.5523, 'learning_rate': 3.3116136877670302e-06, 'epoch': 1.47} {'loss': 0.5781, 'learning_rate': 3.3113703357281945e-06, 'epoch': 1.47} {'loss': 0.4604, 'learning_rate': 3.31112699085683e-06, 'epoch': 1.47} {'loss': 0.6006, 'learning_rate': 3.3108836531531963e-06, 'epoch': 1.47} {'loss': 0.5821, 'learning_rate': 3.3106403226175544e-06, 'epoch': 1.47} {'loss': 0.4507, 'learning_rate': 3.310396999250165e-06, 'epoch': 1.47} {'loss': 0.4737, 'learning_rate': 3.310153683051288e-06, 'epoch': 1.47} {'loss': 0.6121, 'learning_rate': 3.3099103740211902e-06, 'epoch': 1.47} {'loss': 0.4356, 'learning_rate': 3.3096670721601234e-06, 'epoch': 1.47} {'loss': 0.5035, 'learning_rate': 3.3094237774683514e-06, 'epoch': 1.47} {'loss': 0.5066, 'learning_rate': 3.3091804899461365e-06, 'epoch': 1.47} {'loss': 0.5721, 'learning_rate': 3.308937209593738e-06, 'epoch': 1.47} {'loss': 0.5117, 'learning_rate': 3.308693936411421e-06, 'epoch': 1.47} {'loss': 0.4813, 'learning_rate': 3.3084506703994355e-06, 'epoch': 1.47} {'loss': 0.538, 'learning_rate': 3.308207411558055e-06, 'epoch': 1.47} {'loss': 0.6096, 'learning_rate': 3.307964159887532e-06, 'epoch': 1.47} {'loss': 0.4429, 'learning_rate': 3.3077209153881294e-06, 'epoch': 1.47} {'loss': 0.3086, 'learning_rate': 3.3074776780601082e-06, 'epoch': 1.47} {'loss': 0.5636, 'learning_rate': 3.307234447903728e-06, 'epoch': 1.47} {'loss': 0.4592, 'learning_rate': 3.3069912249192524e-06, 'epoch': 1.47} {'loss': 0.4399, 'learning_rate': 3.306748009106935e-06, 'epoch': 1.47} {'loss': 0.4772, 'learning_rate': 3.3065048004670473e-06, 'epoch': 1.47} {'loss': 0.4524, 'learning_rate': 3.3062615989998405e-06, 'epoch': 1.47} {'loss': 0.357, 'learning_rate': 3.3060184047055776e-06, 'epoch': 1.47} {'loss': 0.558, 'learning_rate': 3.3057752175845213e-06, 'epoch': 1.47} {'loss': 0.6144, 'learning_rate': 3.3055320376369302e-06, 'epoch': 1.47} {'loss': 0.6063, 'learning_rate': 3.30528886486307e-06, 'epoch': 1.47} {'loss': 0.5653, 'learning_rate': 3.3050456992631896e-06, 'epoch': 1.47} {'loss': 0.5711, 'learning_rate': 3.304802540837564e-06, 'epoch': 1.47} {'loss': 0.5028, 'learning_rate': 3.3045593895864437e-06, 'epoch': 1.47} {'loss': 0.4648, 'learning_rate': 3.304316245510092e-06, 'epoch': 1.47} {'loss': 0.4279, 'learning_rate': 3.304073108608773e-06, 'epoch': 1.47} {'loss': 0.5645, 'learning_rate': 3.3038299788827376e-06, 'epoch': 1.47} {'loss': 0.6069, 'learning_rate': 3.3035868563322595e-06, 'epoch': 1.47} {'loss': 0.5399, 'learning_rate': 3.303343740957585e-06, 'epoch': 1.47} {'loss': 0.5483, 'learning_rate': 3.303100632758989e-06, 'epoch': 1.47} {'loss': 0.5482, 'learning_rate': 3.3028575317367217e-06, 'epoch': 1.47} {'loss': 0.7097, 'learning_rate': 3.3026144378910474e-06, 'epoch': 1.47} {'loss': 0.5172, 'learning_rate': 3.30237135122223e-06, 'epoch': 1.47} {'loss': 0.4963, 'learning_rate': 3.302128271730519e-06, 'epoch': 1.47} {'loss': 0.541, 'learning_rate': 3.3018851994161895e-06, 'epoch': 1.47} {'loss': 0.5659, 'learning_rate': 3.301642134279487e-06, 'epoch': 1.47} {'loss': 0.5282, 'learning_rate': 3.301399076320686e-06, 'epoch': 1.47} {'loss': 0.5922, 'learning_rate': 3.3011560255400376e-06, 'epoch': 1.47} {'loss': 0.5223, 'learning_rate': 3.300912981937805e-06, 'epoch': 1.47} {'loss': 0.3459, 'learning_rate': 3.300669945514252e-06, 'epoch': 1.47} {'loss': 0.494, 'learning_rate': 3.300426916269629e-06, 'epoch': 1.47} {'loss': 0.479, 'learning_rate': 3.3001838942042107e-06, 'epoch': 1.47} {'loss': 0.355, 'learning_rate': 3.299940879318242e-06, 'epoch': 1.47} {'loss': 0.4698, 'learning_rate': 3.299697871612e-06, 'epoch': 1.47} {'loss': 0.4329, 'learning_rate': 3.299454871085731e-06, 'epoch': 1.47} {'loss': 0.4848, 'learning_rate': 3.299211877739702e-06, 'epoch': 1.47} {'loss': 0.6891, 'learning_rate': 3.2989688915741757e-06, 'epoch': 1.47} {'loss': 0.5618, 'learning_rate': 3.298725912589402e-06, 'epoch': 1.47} {'loss': 0.5277, 'learning_rate': 3.2984829407856555e-06, 'epoch': 1.47} {'loss': 0.6583, 'learning_rate': 3.2982399761631858e-06, 'epoch': 1.47} {'loss': 0.4644, 'learning_rate': 3.2979970187222565e-06, 'epoch': 1.47} {'loss': 0.5754, 'learning_rate': 3.2977540684631282e-06, 'epoch': 1.47} {'loss': 0.4077, 'learning_rate': 3.2975111253860613e-06, 'epoch': 1.47} {'loss': 0.5381, 'learning_rate': 3.2972681894913205e-06, 'epoch': 1.47} {'loss': 0.4574, 'learning_rate': 3.2970252607791544e-06, 'epoch': 1.47} {'loss': 0.6395, 'learning_rate': 3.296782339249838e-06, 'epoch': 1.47} {'loss': 0.4248, 'learning_rate': 3.29653942490362e-06, 'epoch': 1.47} {'loss': 0.4521, 'learning_rate': 3.2962965177407647e-06, 'epoch': 1.47} {'loss': 0.5539, 'learning_rate': 3.296053617761534e-06, 'epoch': 1.47} {'loss': 0.4471, 'learning_rate': 3.2958107249661866e-06, 'epoch': 1.47} {'loss': 0.5108, 'learning_rate': 3.295567839354986e-06, 'epoch': 1.47} {'loss': 0.5239, 'learning_rate': 3.2953249609281833e-06, 'epoch': 1.47} {'loss': 0.4418, 'learning_rate': 3.2950820896860515e-06, 'epoch': 1.47} {'loss': 0.5098, 'learning_rate': 3.2948392256288407e-06, 'epoch': 1.47} {'loss': 0.4708, 'learning_rate': 3.294596368756815e-06, 'epoch': 1.47} {'loss': 0.5329, 'learning_rate': 3.2943535190702358e-06, 'epoch': 1.47} {'loss': 0.4271, 'learning_rate': 3.294110676569361e-06, 'epoch': 1.47} {'loss': 0.4466, 'learning_rate': 3.2938678412544547e-06, 'epoch': 1.47} {'loss': 0.5902, 'learning_rate': 3.2936250131257684e-06, 'epoch': 1.47} {'loss': 0.4876, 'learning_rate': 3.293382192183574e-06, 'epoch': 1.47} {'loss': 0.2862, 'learning_rate': 3.293139378428123e-06, 'epoch': 1.47} {'loss': 0.6011, 'learning_rate': 3.2928965718596785e-06, 'epoch': 1.47} {'loss': 0.5535, 'learning_rate': 3.2926537724785044e-06, 'epoch': 1.47} {'loss': 0.4926, 'learning_rate': 3.2924109802848504e-06, 'epoch': 1.47} {'loss': 0.5012, 'learning_rate': 3.2921681952789897e-06, 'epoch': 1.47} {'loss': 0.6601, 'learning_rate': 3.2919254174611726e-06, 'epoch': 1.47} {'loss': 0.3918, 'learning_rate': 3.2916826468316632e-06, 'epoch': 1.47} {'loss': 0.2985, 'learning_rate': 3.2914398833907214e-06, 'epoch': 1.47} {'loss': 0.4905, 'learning_rate': 3.291197127138608e-06, 'epoch': 1.47} {'loss': 0.5516, 'learning_rate': 3.290954378075585e-06, 'epoch': 1.47} {'loss': 0.495, 'learning_rate': 3.290711636201903e-06, 'epoch': 1.47} {'loss': 0.6123, 'learning_rate': 3.290468901517836e-06, 'epoch': 1.47} {'loss': 0.5582, 'learning_rate': 3.290226174023633e-06, 'epoch': 1.47} {'loss': 0.5453, 'learning_rate': 3.2899834537195594e-06, 'epoch': 1.47} {'loss': 0.5629, 'learning_rate': 3.2897407406058734e-06, 'epoch': 1.47} {'loss': 0.5402, 'learning_rate': 3.2894980346828363e-06, 'epoch': 1.47} {'loss': 0.5081, 'learning_rate': 3.2892553359507105e-06, 'epoch': 1.47} {'loss': 0.5123, 'learning_rate': 3.2890126444097483e-06, 'epoch': 1.47} {'loss': 0.4697, 'learning_rate': 3.28876996006022e-06, 'epoch': 1.47} {'loss': 0.5697, 'learning_rate': 3.2885272829023764e-06, 'epoch': 1.47} {'loss': 0.6032, 'learning_rate': 3.288284612936483e-06, 'epoch': 1.47} {'loss': 0.7185, 'learning_rate': 3.288041950162798e-06, 'epoch': 1.47} {'loss': 0.4969, 'learning_rate': 3.2877992945815807e-06, 'epoch': 1.47} {'loss': 0.5057, 'learning_rate': 3.2875566461930974e-06, 'epoch': 1.47} {'loss': 0.6082, 'learning_rate': 3.2873140049975984e-06, 'epoch': 1.47} {'loss': 0.4935, 'learning_rate': 3.2870713709953484e-06, 'epoch': 1.47} {'loss': 0.5722, 'learning_rate': 3.2868287441866074e-06, 'epoch': 1.47} {'loss': 0.6495, 'learning_rate': 3.286586124571636e-06, 'epoch': 1.47} {'loss': 0.3172, 'learning_rate': 3.2863435121506927e-06, 'epoch': 1.47} {'loss': 0.5633, 'learning_rate': 3.286100906924039e-06, 'epoch': 1.47} {'loss': 0.4819, 'learning_rate': 3.2858583088919373e-06, 'epoch': 1.47} {'loss': 0.4682, 'learning_rate': 3.28561571805464e-06, 'epoch': 1.47} {'loss': 0.6443, 'learning_rate': 3.285373134412413e-06, 'epoch': 1.47} {'loss': 0.6459, 'learning_rate': 3.2851305579655137e-06, 'epoch': 1.47} {'loss': 0.5034, 'learning_rate': 3.284887988714204e-06, 'epoch': 1.47} {'loss': 0.5808, 'learning_rate': 3.2846454266587414e-06, 'epoch': 1.47} {'loss': 0.6035, 'learning_rate': 3.284402871799388e-06, 'epoch': 1.47} {'loss': 0.4618, 'learning_rate': 3.2841603241364074e-06, 'epoch': 1.47} {'loss': 0.4987, 'learning_rate': 3.2839177836700508e-06, 'epoch': 1.47} {'loss': 0.5215, 'learning_rate': 3.2836752504005833e-06, 'epoch': 1.47} {'loss': 0.6392, 'learning_rate': 3.283432724328263e-06, 'epoch': 1.47} {'loss': 0.5372, 'learning_rate': 3.2831902054533504e-06, 'epoch': 1.47} {'loss': 0.4054, 'learning_rate': 3.2829476937761063e-06, 'epoch': 1.47} {'loss': 0.5447, 'learning_rate': 3.282705189296793e-06, 'epoch': 1.47} {'loss': 0.4808, 'learning_rate': 3.2824626920156656e-06, 'epoch': 1.47} {'loss': 0.4787, 'learning_rate': 3.282220201932984e-06, 'epoch': 1.47} {'loss': 0.5631, 'learning_rate': 3.281977719049011e-06, 'epoch': 1.47} {'loss': 0.5577, 'learning_rate': 3.281735243364004e-06, 'epoch': 1.47} {'loss': 0.5687, 'learning_rate': 3.281492774878224e-06, 'epoch': 1.47} {'loss': 0.3387, 'learning_rate': 3.2812503135919315e-06, 'epoch': 1.47} {'loss': 0.4675, 'learning_rate': 3.2810078595053897e-06, 'epoch': 1.47} {'loss': 0.5427, 'learning_rate': 3.28076541261885e-06, 'epoch': 1.47} {'loss': 0.527, 'learning_rate': 3.280522972932577e-06, 'epoch': 1.47} {'loss': 0.5042, 'learning_rate': 3.280280540446831e-06, 'epoch': 1.47} {'loss': 0.4074, 'learning_rate': 3.2800381151618687e-06, 'epoch': 1.47} {'loss': 0.4594, 'learning_rate': 3.2797956970779544e-06, 'epoch': 1.47} {'loss': 0.6062, 'learning_rate': 3.2795532861953437e-06, 'epoch': 1.47} {'loss': 0.5349, 'learning_rate': 3.2793108825143027e-06, 'epoch': 1.47} {'loss': 0.7134, 'learning_rate': 3.279068486035083e-06, 'epoch': 1.47} {'loss': 0.666, 'learning_rate': 3.2788260967579476e-06, 'epoch': 1.47} {'loss': 0.5679, 'learning_rate': 3.2785837146831577e-06, 'epoch': 1.47} {'loss': 0.5808, 'learning_rate': 3.278341339810971e-06, 'epoch': 1.47} {'loss': 0.6113, 'learning_rate': 3.2780989721416524e-06, 'epoch': 1.47} {'loss': 0.542, 'learning_rate': 3.2778566116754497e-06, 'epoch': 1.47} {'loss': 0.4774, 'learning_rate': 3.277614258412638e-06, 'epoch': 1.47} {'loss': 0.6245, 'learning_rate': 3.2773719123534655e-06, 'epoch': 1.47} {'loss': 0.393, 'learning_rate': 3.2771295734981955e-06, 'epoch': 1.47} {'loss': 0.5509, 'learning_rate': 3.2768872418470885e-06, 'epoch': 1.47} {'loss': 0.5877, 'learning_rate': 3.2766449174004034e-06, 'epoch': 1.47} {'loss': 0.5108, 'learning_rate': 3.276402600158404e-06, 'epoch': 1.47} {'loss': 0.5464, 'learning_rate': 3.276160290121342e-06, 'epoch': 1.47} {'loss': 0.5991, 'learning_rate': 3.2759179872894807e-06, 'epoch': 1.47} {'loss': 0.6102, 'learning_rate': 3.2756756916630805e-06, 'epoch': 1.47} {'loss': 0.5637, 'learning_rate': 3.275433403242402e-06, 'epoch': 1.47} {'loss': 0.7034, 'learning_rate': 3.2751911220277054e-06, 'epoch': 1.47} {'loss': 0.4513, 'learning_rate': 3.274948848019243e-06, 'epoch': 1.47} {'loss': 0.3894, 'learning_rate': 3.274706581217285e-06, 'epoch': 1.47} {'loss': 0.596, 'learning_rate': 3.274464321622083e-06, 'epoch': 1.47} {'loss': 0.6047, 'learning_rate': 3.2742220692339e-06, 'epoch': 1.47} {'loss': 0.4615, 'learning_rate': 3.273979824052995e-06, 'epoch': 1.47} {'loss': 0.6205, 'learning_rate': 3.2737375860796273e-06, 'epoch': 1.47} {'loss': 0.496, 'learning_rate': 3.27349535531406e-06, 'epoch': 1.47} {'loss': 0.6114, 'learning_rate': 3.273253131756544e-06, 'epoch': 1.47} {'loss': 0.5513, 'learning_rate': 3.273010915407351e-06, 'epoch': 1.47} {'loss': 0.4636, 'learning_rate': 3.272768706266729e-06, 'epoch': 1.47} {'loss': 0.7554, 'learning_rate': 3.272526504334944e-06, 'epoch': 1.47} {'loss': 0.5631, 'learning_rate': 3.2722843096122538e-06, 'epoch': 1.47} {'loss': 0.5776, 'learning_rate': 3.2720421220989172e-06, 'epoch': 1.47} {'loss': 0.544, 'learning_rate': 3.2717999417951995e-06, 'epoch': 1.47} {'loss': 0.6076, 'learning_rate': 3.2715577687013478e-06, 'epoch': 1.47} {'loss': 0.4655, 'learning_rate': 3.2713156028176362e-06, 'epoch': 1.47} {'loss': 0.5051, 'learning_rate': 3.271073444144314e-06, 'epoch': 1.47} {'loss': 0.6021, 'learning_rate': 3.2708312926816444e-06, 'epoch': 1.47} {'loss': 0.6011, 'learning_rate': 3.2705891484298892e-06, 'epoch': 1.47} {'loss': 0.513, 'learning_rate': 3.270347011389298e-06, 'epoch': 1.47} {'loss': 0.4947, 'learning_rate': 3.2701048815601442e-06, 'epoch': 1.47} {'loss': 0.6093, 'learning_rate': 3.2698627589426736e-06, 'epoch': 1.47} {'loss': 0.4989, 'learning_rate': 3.2696206435371604e-06, 'epoch': 1.47} {'loss': 0.6465, 'learning_rate': 3.269378535343851e-06, 'epoch': 1.47} {'loss': 0.4451, 'learning_rate': 3.2691364343630116e-06, 'epoch': 1.47} {'loss': 0.3733, 'learning_rate': 3.2688943405949025e-06, 'epoch': 1.47} {'loss': 0.5141, 'learning_rate': 3.2686522540397737e-06, 'epoch': 1.47} {'loss': 0.5799, 'learning_rate': 3.268410174697899e-06, 'epoch': 1.47} {'loss': 0.4527, 'learning_rate': 3.2681681025695234e-06, 'epoch': 1.47} {'loss': 0.5941, 'learning_rate': 3.2679260376549195e-06, 'epoch': 1.47} {'loss': 0.5278, 'learning_rate': 3.267683979954337e-06, 'epoch': 1.47} {'loss': 0.5752, 'learning_rate': 3.2674419294680393e-06, 'epoch': 1.47} {'loss': 0.3971, 'learning_rate': 3.2671998861962885e-06, 'epoch': 1.47} {'loss': 0.538, 'learning_rate': 3.266957850139334e-06, 'epoch': 1.47} {'loss': 0.6233, 'learning_rate': 3.2667158212974493e-06, 'epoch': 1.47} {'loss': 0.5953, 'learning_rate': 3.2664737996708784e-06, 'epoch': 1.47} {'loss': 0.5852, 'learning_rate': 3.2662317852598957e-06, 'epoch': 1.47} {'loss': 0.516, 'learning_rate': 3.26598977806475e-06, 'epoch': 1.47} {'loss': 0.4883, 'learning_rate': 3.265747778085704e-06, 'epoch': 1.47} {'loss': 0.5791, 'learning_rate': 3.265505785323021e-06, 'epoch': 1.47} {'loss': 0.7785, 'learning_rate': 3.2652637997769486e-06, 'epoch': 1.47} {'loss': 0.6099, 'learning_rate': 3.2650218214477615e-06, 'epoch': 1.47} {'loss': 0.6002, 'learning_rate': 3.264779850335704e-06, 'epoch': 1.47} {'loss': 0.5443, 'learning_rate': 3.2645378864410503e-06, 'epoch': 1.47} {'loss': 0.532, 'learning_rate': 3.2642959297640476e-06, 'epoch': 1.47} {'loss': 0.6076, 'learning_rate': 3.264053980304961e-06, 'epoch': 1.47} {'loss': 0.3473, 'learning_rate': 3.2638120380640516e-06, 'epoch': 1.47} {'loss': 0.4806, 'learning_rate': 3.2635701030415678e-06, 'epoch': 1.47} {'loss': 0.4375, 'learning_rate': 3.263328175237784e-06, 'epoch': 1.47} {'loss': 0.5034, 'learning_rate': 3.2630862546529464e-06, 'epoch': 1.47} {'loss': 0.5236, 'learning_rate': 3.2628443412873256e-06, 'epoch': 1.47} {'loss': 0.6112, 'learning_rate': 3.2626024351411724e-06, 'epoch': 1.47} {'loss': 0.4623, 'learning_rate': 3.262360536214748e-06, 'epoch': 1.47} {'loss': 0.607, 'learning_rate': 3.2621186445083163e-06, 'epoch': 1.47} {'loss': 0.5344, 'learning_rate': 3.261876760022126e-06, 'epoch': 1.47} {'loss': 0.6331, 'learning_rate': 3.261634882756449e-06, 'epoch': 1.47} {'loss': 0.5889, 'learning_rate': 3.2613930127115355e-06, 'epoch': 1.47} {'loss': 0.5573, 'learning_rate': 3.261151149887647e-06, 'epoch': 1.47} {'loss': 0.5387, 'learning_rate': 3.260909294285044e-06, 'epoch': 1.47} {'loss': 0.5612, 'learning_rate': 3.2606674459039844e-06, 'epoch': 1.47} {'loss': 0.4587, 'learning_rate': 3.2604256047447316e-06, 'epoch': 1.47} {'loss': 0.394, 'learning_rate': 3.2601837708075345e-06, 'epoch': 1.47} {'loss': 0.4733, 'learning_rate': 3.259941944092665e-06, 'epoch': 1.47} {'loss': 0.6833, 'learning_rate': 3.2597001246003735e-06, 'epoch': 1.47} {'loss': 0.3888, 'learning_rate': 3.259458312330921e-06, 'epoch': 1.47} {'loss': 0.6421, 'learning_rate': 3.259216507284567e-06, 'epoch': 1.47} {'loss': 0.5339, 'learning_rate': 3.258974709461571e-06, 'epoch': 1.47} {'loss': 0.4116, 'learning_rate': 3.2587329188621965e-06, 'epoch': 1.47} {'loss': 0.5065, 'learning_rate': 3.25849113548669e-06, 'epoch': 1.47} {'loss': 0.4938, 'learning_rate': 3.258249359335326e-06, 'epoch': 1.47} {'loss': 0.6366, 'learning_rate': 3.258007590408353e-06, 'epoch': 1.47} {'loss': 0.5442, 'learning_rate': 3.2577658287060334e-06, 'epoch': 1.47} {'loss': 0.4968, 'learning_rate': 3.257524074228626e-06, 'epoch': 1.47} {'loss': 0.4978, 'learning_rate': 3.25728232697639e-06, 'epoch': 1.47} {'loss': 0.5642, 'learning_rate': 3.257040586949588e-06, 'epoch': 1.47} {'loss': 0.3922, 'learning_rate': 3.2567988541484728e-06, 'epoch': 1.47} {'loss': 0.5615, 'learning_rate': 3.2565571285733056e-06, 'epoch': 1.47} {'loss': 0.5485, 'learning_rate': 3.2563154102243467e-06, 'epoch': 1.47} {'loss': 0.4221, 'learning_rate': 3.2560736991018536e-06, 'epoch': 1.47} {'loss': 0.6888, 'learning_rate': 3.2558319952060903e-06, 'epoch': 1.47} {'loss': 0.4991, 'learning_rate': 3.2555902985373043e-06, 'epoch': 1.47} {'loss': 0.4684, 'learning_rate': 3.25534860909577e-06, 'epoch': 1.47} {'loss': 0.5442, 'learning_rate': 3.2551069268817337e-06, 'epoch': 1.47} {'loss': 0.6164, 'learning_rate': 3.2548652518954593e-06, 'epoch': 1.47} {'loss': 0.5937, 'learning_rate': 3.2546235841372064e-06, 'epoch': 1.47} {'loss': 0.5729, 'learning_rate': 3.2543819236072327e-06, 'epoch': 1.47} {'loss': 0.5273, 'learning_rate': 3.2541402703058e-06, 'epoch': 1.47} {'loss': 0.5312, 'learning_rate': 3.2538986242331627e-06, 'epoch': 1.47} {'loss': 0.5865, 'learning_rate': 3.253656985389582e-06, 'epoch': 1.47} {'loss': 0.5225, 'learning_rate': 3.2534153537753157e-06, 'epoch': 1.47} {'loss': 0.6646, 'learning_rate': 3.2531737293906253e-06, 'epoch': 1.47} {'loss': 0.4957, 'learning_rate': 3.252932112235767e-06, 'epoch': 1.47} {'loss': 0.5189, 'learning_rate': 3.252690502311001e-06, 'epoch': 1.47} {'loss': 0.5757, 'learning_rate': 3.252448899616589e-06, 'epoch': 1.47} {'loss': 0.5755, 'learning_rate': 3.2522073041527846e-06, 'epoch': 1.47} {'loss': 0.489, 'learning_rate': 3.251965715919849e-06, 'epoch': 1.47} {'loss': 0.5114, 'learning_rate': 3.251724134918041e-06, 'epoch': 1.47} {'loss': 0.6077, 'learning_rate': 3.25148256114762e-06, 'epoch': 1.47} {'loss': 0.5185, 'learning_rate': 3.251240994608844e-06, 'epoch': 1.47} {'loss': 0.702, 'learning_rate': 3.2509994353019724e-06, 'epoch': 1.47} {'loss': 0.5831, 'learning_rate': 3.2507578832272666e-06, 'epoch': 1.47} {'loss': 0.6001, 'learning_rate': 3.2505163383849814e-06, 'epoch': 1.47} {'loss': 0.4647, 'learning_rate': 3.2502748007753758e-06, 'epoch': 1.47} {'loss': 0.6056, 'learning_rate': 3.2500332703987103e-06, 'epoch': 1.47} {'loss': 0.403, 'learning_rate': 3.2497917472552432e-06, 'epoch': 1.47} {'loss': 0.5443, 'learning_rate': 3.2495502313452343e-06, 'epoch': 1.47} {'loss': 0.5423, 'learning_rate': 3.2493087226689447e-06, 'epoch': 1.47} {'loss': 0.4277, 'learning_rate': 3.249067221226626e-06, 'epoch': 1.47} {'loss': 0.6091, 'learning_rate': 3.2488257270185407e-06, 'epoch': 1.47} {'loss': 0.4754, 'learning_rate': 3.2485842400449496e-06, 'epoch': 1.47} {'loss': 0.6975, 'learning_rate': 3.2483427603061092e-06, 'epoch': 1.47} {'loss': 0.5457, 'learning_rate': 3.248101287802278e-06, 'epoch': 1.47} {'loss': 0.4363, 'learning_rate': 3.2478598225337167e-06, 'epoch': 1.47} {'loss': 0.6406, 'learning_rate': 3.247618364500685e-06, 'epoch': 1.47} {'loss': 0.434, 'learning_rate': 3.2473769137034384e-06, 'epoch': 1.47} {'loss': 0.5319, 'learning_rate': 3.2471354701422354e-06, 'epoch': 1.47} {'loss': 0.4389, 'learning_rate': 3.2468940338173373e-06, 'epoch': 1.47} {'loss': 0.5395, 'learning_rate': 3.2466526047290004e-06, 'epoch': 1.47} {'loss': 0.4683, 'learning_rate': 3.246411182877486e-06, 'epoch': 1.47} {'loss': 0.5522, 'learning_rate': 3.246169768263051e-06, 'epoch': 1.47} {'loss': 0.3678, 'learning_rate': 3.245928360885958e-06, 'epoch': 1.47} {'loss': 0.5108, 'learning_rate': 3.245686960746459e-06, 'epoch': 1.47} {'loss': 0.3965, 'learning_rate': 3.245445567844816e-06, 'epoch': 1.47} {'loss': 0.5994, 'learning_rate': 3.2452041821812875e-06, 'epoch': 1.47} {'loss': 0.5824, 'learning_rate': 3.2449628037561333e-06, 'epoch': 1.47} {'loss': 0.5495, 'learning_rate': 3.244721432569613e-06, 'epoch': 1.47} {'loss': 0.4155, 'learning_rate': 3.244480068621978e-06, 'epoch': 1.47} {'loss': 0.4272, 'learning_rate': 3.244238711913499e-06, 'epoch': 1.47} {'loss': 0.5269, 'learning_rate': 3.2439973624444244e-06, 'epoch': 1.47} {'loss': 0.5924, 'learning_rate': 3.2437560202150154e-06, 'epoch': 1.47} {'loss': 0.4435, 'learning_rate': 3.243514685225533e-06, 'epoch': 1.47} {'loss': 0.4667, 'learning_rate': 3.243273357476233e-06, 'epoch': 1.47} {'loss': 0.4587, 'learning_rate': 3.2430320369673797e-06, 'epoch': 1.47} {'loss': 0.4424, 'learning_rate': 3.2427907236992206e-06, 'epoch': 1.47} {'loss': 0.5641, 'learning_rate': 3.2425494176720286e-06, 'epoch': 1.47} {'loss': 0.4656, 'learning_rate': 3.2423081188860505e-06, 'epoch': 1.47} {'loss': 0.6104, 'learning_rate': 3.242066827341549e-06, 'epoch': 1.47} {'loss': 0.4415, 'learning_rate': 3.2418255430387836e-06, 'epoch': 1.47} {'loss': 0.4641, 'learning_rate': 3.2415842659780118e-06, 'epoch': 1.47} {'loss': 0.4343, 'learning_rate': 3.2413429961594954e-06, 'epoch': 1.47} {'loss': 0.5605, 'learning_rate': 3.2411017335834837e-06, 'epoch': 1.47} {'loss': 0.5923, 'learning_rate': 3.2408604782502484e-06, 'epoch': 1.47} {'loss': 0.529, 'learning_rate': 3.240619230160037e-06, 'epoch': 1.47} {'loss': 0.5883, 'learning_rate': 3.2403779893131125e-06, 'epoch': 1.47} {'loss': 0.506, 'learning_rate': 3.2401367557097362e-06, 'epoch': 1.47} {'loss': 0.4964, 'learning_rate': 3.2398955293501578e-06, 'epoch': 1.47} {'loss': 0.4911, 'learning_rate': 3.2396543102346478e-06, 'epoch': 1.47} {'loss': 0.6108, 'learning_rate': 3.2394130983634544e-06, 'epoch': 1.47} {'loss': 0.4791, 'learning_rate': 3.2391718937368397e-06, 'epoch': 1.47} {'loss': 0.6992, 'learning_rate': 3.238930696355064e-06, 'epoch': 1.47} {'loss': 0.6117, 'learning_rate': 3.238689506218383e-06, 'epoch': 1.47} {'loss': 0.4823, 'learning_rate': 3.2384483233270604e-06, 'epoch': 1.47} {'loss': 0.4941, 'learning_rate': 3.2382071476813435e-06, 'epoch': 1.47} {'loss': 0.5561, 'learning_rate': 3.2379659792815056e-06, 'epoch': 1.47} {'loss': 0.5859, 'learning_rate': 3.237724818127793e-06, 'epoch': 1.47} {'loss': 0.4335, 'learning_rate': 3.23748366422047e-06, 'epoch': 1.47} {'loss': 0.553, 'learning_rate': 3.2372425175597923e-06, 'epoch': 1.47} {'loss': 0.5456, 'learning_rate': 3.2370013781460207e-06, 'epoch': 1.47} {'loss': 0.5515, 'learning_rate': 3.2367602459794146e-06, 'epoch': 1.47} {'loss': 0.5556, 'learning_rate': 3.236519121060224e-06, 'epoch': 1.47} {'loss': 0.5001, 'learning_rate': 3.236278003388721e-06, 'epoch': 1.47} {'loss': 0.5883, 'learning_rate': 3.236036892965153e-06, 'epoch': 1.47} {'loss': 0.6566, 'learning_rate': 3.235795789789782e-06, 'epoch': 1.47} {'loss': 0.3071, 'learning_rate': 3.235554693862869e-06, 'epoch': 1.47} {'loss': 0.7002, 'learning_rate': 3.2353136051846632e-06, 'epoch': 1.47} {'loss': 0.6253, 'learning_rate': 3.2350725237554358e-06, 'epoch': 1.47} {'loss': 0.5366, 'learning_rate': 3.234831449575433e-06, 'epoch': 1.47} {'loss': 0.6297, 'learning_rate': 3.2345903826449253e-06, 'epoch': 1.47} {'loss': 0.6536, 'learning_rate': 3.2343493229641607e-06, 'epoch': 1.47} {'loss': 0.5161, 'learning_rate': 3.2341082705334027e-06, 'epoch': 1.47} {'loss': 0.4919, 'learning_rate': 3.23386722535291e-06, 'epoch': 1.47} {'loss': 0.5754, 'learning_rate': 3.2336261874229334e-06, 'epoch': 1.47} {'loss': 0.5984, 'learning_rate': 3.2333851567437447e-06, 'epoch': 1.47} {'loss': 0.4814, 'learning_rate': 3.2331441333155866e-06, 'epoch': 1.47} {'loss': 0.6032, 'learning_rate': 3.2329031171387315e-06, 'epoch': 1.47} {'loss': 0.5751, 'learning_rate': 3.232662108213429e-06, 'epoch': 1.47} {'loss': 0.3643, 'learning_rate': 3.23242110653994e-06, 'epoch': 1.47} {'loss': 0.4864, 'learning_rate': 3.2321801121185258e-06, 'epoch': 1.47} {'loss': 0.4104, 'learning_rate': 3.2319391249494345e-06, 'epoch': 1.47} {'loss': 0.588, 'learning_rate': 3.231698145032939e-06, 'epoch': 1.47} {'loss': 0.6668, 'learning_rate': 3.231457172369282e-06, 'epoch': 1.47} {'loss': 0.465, 'learning_rate': 3.231216206958736e-06, 'epoch': 1.47} {'loss': 0.484, 'learning_rate': 3.23097524880155e-06, 'epoch': 1.47} {'loss': 0.6463, 'learning_rate': 3.230734297897985e-06, 'epoch': 1.48} {'loss': 0.4732, 'learning_rate': 3.230493354248302e-06, 'epoch': 1.48} {'loss': 0.5967, 'learning_rate': 3.2302524178527507e-06, 'epoch': 1.48} {'loss': 0.4213, 'learning_rate': 3.2300114887116006e-06, 'epoch': 1.48} {'loss': 0.403, 'learning_rate': 3.229770566825098e-06, 'epoch': 1.48} {'loss': 0.4632, 'learning_rate': 3.2295296521935137e-06, 'epoch': 1.48} {'loss': 0.5219, 'learning_rate': 3.2292887448170962e-06, 'epoch': 1.48} {'loss': 0.5488, 'learning_rate': 3.229047844696107e-06, 'epoch': 1.48} {'loss': 0.6533, 'learning_rate': 3.2288069518308074e-06, 'epoch': 1.48} {'loss': 0.5885, 'learning_rate': 3.2285660662214456e-06, 'epoch': 1.48} {'loss': 0.6679, 'learning_rate': 3.228325187868293e-06, 'epoch': 1.48} {'loss': 0.3363, 'learning_rate': 3.2280843167715982e-06, 'epoch': 1.48} {'loss': 0.6093, 'learning_rate': 3.2278434529316226e-06, 'epoch': 1.48} {'loss': 0.4279, 'learning_rate': 3.2276025963486234e-06, 'epoch': 1.48} {'loss': 0.583, 'learning_rate': 3.227361747022859e-06, 'epoch': 1.48} {'loss': 0.5465, 'learning_rate': 3.2271209049545913e-06, 'epoch': 1.48} {'loss': 0.5758, 'learning_rate': 3.2268800701440683e-06, 'epoch': 1.48} {'loss': 0.5626, 'learning_rate': 3.2266392425915615e-06, 'epoch': 1.48} {'loss': 0.5302, 'learning_rate': 3.2263984222973176e-06, 'epoch': 1.48} {'loss': 0.5176, 'learning_rate': 3.226157609261601e-06, 'epoch': 1.48} {'loss': 0.4046, 'learning_rate': 3.2259168034846667e-06, 'epoch': 1.48} {'loss': 0.5244, 'learning_rate': 3.2256760049667747e-06, 'epoch': 1.48} {'loss': 0.5149, 'learning_rate': 3.2254352137081846e-06, 'epoch': 1.48} {'loss': 0.4975, 'learning_rate': 3.2251944297091454e-06, 'epoch': 1.48} {'loss': 0.4418, 'learning_rate': 3.22495365296993e-06, 'epoch': 1.48} {'loss': 0.5555, 'learning_rate': 3.2247128834907837e-06, 'epoch': 1.48} {'loss': 0.5343, 'learning_rate': 3.224472121271969e-06, 'epoch': 1.48} {'loss': 0.6472, 'learning_rate': 3.2242313663137436e-06, 'epoch': 1.48} {'loss': 0.5317, 'learning_rate': 3.2239906186163673e-06, 'epoch': 1.48} {'loss': 0.5771, 'learning_rate': 3.223749878180099e-06, 'epoch': 1.48} {'loss': 0.6313, 'learning_rate': 3.2235091450051912e-06, 'epoch': 1.48} {'loss': 0.5361, 'learning_rate': 3.223268419091905e-06, 'epoch': 1.48} {'loss': 0.4102, 'learning_rate': 3.2230277004404974e-06, 'epoch': 1.48} {'loss': 0.4994, 'learning_rate': 3.2227869890512286e-06, 'epoch': 1.48} {'loss': 0.5563, 'learning_rate': 3.222546284924355e-06, 'epoch': 1.48} {'loss': 0.5265, 'learning_rate': 3.222305588060134e-06, 'epoch': 1.48} {'loss': 0.6191, 'learning_rate': 3.222064898458829e-06, 'epoch': 1.48} {'loss': 0.5227, 'learning_rate': 3.221824216120688e-06, 'epoch': 1.48} {'loss': 0.7057, 'learning_rate': 3.221583541045975e-06, 'epoch': 1.48} {'loss': 0.4474, 'learning_rate': 3.2213428732349474e-06, 'epoch': 1.48} {'loss': 0.5173, 'learning_rate': 3.2211022126878623e-06, 'epoch': 1.48} {'loss': 0.6133, 'learning_rate': 3.2208615594049787e-06, 'epoch': 1.48} {'loss': 0.4741, 'learning_rate': 3.220620913386553e-06, 'epoch': 1.48} {'loss': 0.523, 'learning_rate': 3.220380274632847e-06, 'epoch': 1.48} {'loss': 0.476, 'learning_rate': 3.2201396431441123e-06, 'epoch': 1.48} {'loss': 0.6453, 'learning_rate': 3.2198990189206104e-06, 'epoch': 1.48} {'loss': 0.4482, 'learning_rate': 3.2196584019625988e-06, 'epoch': 1.48} {'loss': 0.6167, 'learning_rate': 3.219417792270334e-06, 'epoch': 1.48} {'loss': 0.4261, 'learning_rate': 3.219177189844076e-06, 'epoch': 1.48} {'loss': 0.5018, 'learning_rate': 3.2189365946840856e-06, 'epoch': 1.48} {'loss': 0.5477, 'learning_rate': 3.2186960067906116e-06, 'epoch': 1.48} {'loss': 0.5762, 'learning_rate': 3.218455426163918e-06, 'epoch': 1.48} {'loss': 0.4849, 'learning_rate': 3.2182148528042612e-06, 'epoch': 1.48} {'loss': 0.4431, 'learning_rate': 3.217974286711899e-06, 'epoch': 1.48} {'loss': 0.5816, 'learning_rate': 3.21773372788709e-06, 'epoch': 1.48} {'loss': 0.4909, 'learning_rate': 3.2174931763300954e-06, 'epoch': 1.48} {'loss': 0.464, 'learning_rate': 3.2172526320411647e-06, 'epoch': 1.48} {'loss': 0.4586, 'learning_rate': 3.21701209502056e-06, 'epoch': 1.48} {'loss': 0.5049, 'learning_rate': 3.2167715652685394e-06, 'epoch': 1.48} {'loss': 0.3373, 'learning_rate': 3.2165310427853603e-06, 'epoch': 1.48} {'loss': 0.6294, 'learning_rate': 3.2162905275712797e-06, 'epoch': 1.48} {'loss': 0.6835, 'learning_rate': 3.2160500196265567e-06, 'epoch': 1.48} {'loss': 0.4932, 'learning_rate': 3.2158095189514516e-06, 'epoch': 1.48} {'loss': 0.6097, 'learning_rate': 3.215569025546216e-06, 'epoch': 1.48} {'loss': 0.6087, 'learning_rate': 3.21532853941111e-06, 'epoch': 1.48} {'loss': 0.6071, 'learning_rate': 3.215088060546392e-06, 'epoch': 1.48} {'loss': 0.6812, 'learning_rate': 3.214847588952319e-06, 'epoch': 1.48} {'loss': 0.4468, 'learning_rate': 3.21460712462915e-06, 'epoch': 1.48} {'loss': 0.4743, 'learning_rate': 3.2143666675771445e-06, 'epoch': 1.48} {'loss': 0.4525, 'learning_rate': 3.214126217796555e-06, 'epoch': 1.48} {'loss': 0.4797, 'learning_rate': 3.2138857752876405e-06, 'epoch': 1.48} {'loss': 0.5694, 'learning_rate': 3.2136453400506616e-06, 'epoch': 1.48} {'loss': 0.3953, 'learning_rate': 3.2134049120858735e-06, 'epoch': 1.48} {'loss': 0.3739, 'learning_rate': 3.2131644913935345e-06, 'epoch': 1.48} {'loss': 0.4834, 'learning_rate': 3.2129240779739013e-06, 'epoch': 1.48} {'loss': 0.508, 'learning_rate': 3.212683671827237e-06, 'epoch': 1.48} {'loss': 0.6065, 'learning_rate': 3.2124432729537915e-06, 'epoch': 1.48} {'loss': 0.479, 'learning_rate': 3.2122028813538252e-06, 'epoch': 1.48} {'loss': 0.5107, 'learning_rate': 3.2119624970275965e-06, 'epoch': 1.48} {'loss': 0.5577, 'learning_rate': 3.2117221199753622e-06, 'epoch': 1.48} {'loss': 0.5186, 'learning_rate': 3.211481750197384e-06, 'epoch': 1.48} {'loss': 0.5426, 'learning_rate': 3.2112413876939086e-06, 'epoch': 1.48} {'loss': 0.5657, 'learning_rate': 3.2110010324652085e-06, 'epoch': 1.48} {'loss': 0.5089, 'learning_rate': 3.210760684511529e-06, 'epoch': 1.48} {'loss': 0.5253, 'learning_rate': 3.2105203438331334e-06, 'epoch': 1.48} {'loss': 0.4158, 'learning_rate': 3.2102800104302768e-06, 'epoch': 1.48} {'loss': 0.5696, 'learning_rate': 3.210039684303219e-06, 'epoch': 1.48} {'loss': 0.4914, 'learning_rate': 3.2097993654522185e-06, 'epoch': 1.48} {'loss': 0.4866, 'learning_rate': 3.2095590538775255e-06, 'epoch': 1.48} {'loss': 0.5292, 'learning_rate': 3.2093187495794087e-06, 'epoch': 1.48} {'loss': 0.4674, 'learning_rate': 3.2090784525581177e-06, 'epoch': 1.48} {'loss': 0.501, 'learning_rate': 3.208838162813911e-06, 'epoch': 1.48} {'loss': 0.482, 'learning_rate': 3.2085978803470476e-06, 'epoch': 1.48} {'loss': 0.66, 'learning_rate': 3.2083576051577835e-06, 'epoch': 1.48} {'loss': 0.4217, 'learning_rate': 3.2081173372463815e-06, 'epoch': 1.48} {'loss': 0.6755, 'learning_rate': 3.2078770766130885e-06, 'epoch': 1.48} {'loss': 0.6341, 'learning_rate': 3.2076368232581734e-06, 'epoch': 1.48} {'loss': 0.4818, 'learning_rate': 3.207396577181886e-06, 'epoch': 1.48} {'loss': 0.3151, 'learning_rate': 3.207156338384487e-06, 'epoch': 1.48} {'loss': 0.5388, 'learning_rate': 3.206916106866236e-06, 'epoch': 1.48} {'loss': 0.5487, 'learning_rate': 3.2066758826273805e-06, 'epoch': 1.48} {'loss': 0.5506, 'learning_rate': 3.2064356656681917e-06, 'epoch': 1.48} {'loss': 0.3605, 'learning_rate': 3.206195455988913e-06, 'epoch': 1.48} {'loss': 0.5099, 'learning_rate': 3.2059552535898162e-06, 'epoch': 1.48} {'loss': 0.5617, 'learning_rate': 3.2057150584711484e-06, 'epoch': 1.48} {'loss': 0.3872, 'learning_rate': 3.2054748706331696e-06, 'epoch': 1.48} {'loss': 0.6044, 'learning_rate': 3.205234690076142e-06, 'epoch': 1.48} {'loss': 0.3232, 'learning_rate': 3.2049945168003117e-06, 'epoch': 1.48} {'loss': 0.6349, 'learning_rate': 3.2047543508059485e-06, 'epoch': 1.48} {'loss': 0.5746, 'learning_rate': 3.2045141920932996e-06, 'epoch': 1.48} {'loss': 0.6093, 'learning_rate': 3.204274040662633e-06, 'epoch': 1.48} {'loss': 0.5063, 'learning_rate': 3.204033896514196e-06, 'epoch': 1.48} {'loss': 0.5718, 'learning_rate': 3.2037937596482505e-06, 'epoch': 1.48} {'loss': 0.5706, 'learning_rate': 3.203553630065057e-06, 'epoch': 1.48} {'loss': 0.6106, 'learning_rate': 3.2033135077648626e-06, 'epoch': 1.48} {'loss': 0.4696, 'learning_rate': 3.203073392747937e-06, 'epoch': 1.48} {'loss': 0.5716, 'learning_rate': 3.202833285014526e-06, 'epoch': 1.48} {'loss': 0.4582, 'learning_rate': 3.2025931845648993e-06, 'epoch': 1.48} {'loss': 0.6391, 'learning_rate': 3.202353091399304e-06, 'epoch': 1.48} {'loss': 0.4258, 'learning_rate': 3.2021130055180003e-06, 'epoch': 1.48} {'loss': 0.5555, 'learning_rate': 3.20187292692125e-06, 'epoch': 1.48} {'loss': 0.5712, 'learning_rate': 3.2016328556093003e-06, 'epoch': 1.48} {'loss': 0.6488, 'learning_rate': 3.2013927915824205e-06, 'epoch': 1.48} {'loss': 0.4931, 'learning_rate': 3.2011527348408587e-06, 'epoch': 1.48} {'loss': 0.3395, 'learning_rate': 3.2009126853848747e-06, 'epoch': 1.48} {'loss': 0.3793, 'learning_rate': 3.200672643214727e-06, 'epoch': 1.48} {'loss': 0.6589, 'learning_rate': 3.2004326083306724e-06, 'epoch': 1.48} {'loss': 0.6078, 'learning_rate': 3.2001925807329715e-06, 'epoch': 1.48} {'loss': 0.4796, 'learning_rate': 3.199952560421871e-06, 'epoch': 1.48} {'loss': 0.4454, 'learning_rate': 3.199712547397642e-06, 'epoch': 1.48} {'loss': 0.5403, 'learning_rate': 3.199472541660531e-06, 'epoch': 1.48} {'loss': 0.4754, 'learning_rate': 3.1992325432107996e-06, 'epoch': 1.48} {'loss': 0.6038, 'learning_rate': 3.198992552048703e-06, 'epoch': 1.48} {'loss': 0.4028, 'learning_rate': 3.198752568174501e-06, 'epoch': 1.48} {'loss': 0.5808, 'learning_rate': 3.198512591588452e-06, 'epoch': 1.48} {'loss': 0.5653, 'learning_rate': 3.1982726222908046e-06, 'epoch': 1.48} {'loss': 0.471, 'learning_rate': 3.198032660281829e-06, 'epoch': 1.48} {'loss': 0.6958, 'learning_rate': 3.1977927055617707e-06, 'epoch': 1.48} {'loss': 0.5614, 'learning_rate': 3.197552758130893e-06, 'epoch': 1.48} {'loss': 0.4068, 'learning_rate': 3.197312817989453e-06, 'epoch': 1.48} {'loss': 0.5869, 'learning_rate': 3.197072885137701e-06, 'epoch': 1.48} {'loss': 0.4472, 'learning_rate': 3.196832959575906e-06, 'epoch': 1.48} {'loss': 0.6084, 'learning_rate': 3.196593041304311e-06, 'epoch': 1.48} {'loss': 0.4058, 'learning_rate': 3.1963531303231876e-06, 'epoch': 1.48} {'loss': 0.4322, 'learning_rate': 3.1961132266327833e-06, 'epoch': 1.48} {'loss': 0.5582, 'learning_rate': 3.1958733302333565e-06, 'epoch': 1.48} {'loss': 0.5146, 'learning_rate': 3.19563344112517e-06, 'epoch': 1.48} {'loss': 0.3997, 'learning_rate': 3.1953935593084695e-06, 'epoch': 1.48} {'loss': 0.6506, 'learning_rate': 3.195153684783525e-06, 'epoch': 1.48} {'loss': 0.574, 'learning_rate': 3.1949138175505813e-06, 'epoch': 1.48} {'loss': 0.5942, 'learning_rate': 3.1946739576099086e-06, 'epoch': 1.48} {'loss': 0.5047, 'learning_rate': 3.1944341049617533e-06, 'epoch': 1.48} {'loss': 0.3686, 'learning_rate': 3.194194259606376e-06, 'epoch': 1.48} {'loss': 0.5623, 'learning_rate': 3.193954421544038e-06, 'epoch': 1.48} {'loss': 0.6966, 'learning_rate': 3.1937145907749845e-06, 'epoch': 1.48} {'loss': 0.4188, 'learning_rate': 3.193474767299487e-06, 'epoch': 1.48} {'loss': 0.5286, 'learning_rate': 3.193234951117792e-06, 'epoch': 1.48} {'loss': 0.3531, 'learning_rate': 3.1929951422301597e-06, 'epoch': 1.48} {'loss': 0.5375, 'learning_rate': 3.1927553406368484e-06, 'epoch': 1.48} {'loss': 0.5583, 'learning_rate': 3.192515546338114e-06, 'epoch': 1.48} {'loss': 0.5401, 'learning_rate': 3.192275759334217e-06, 'epoch': 1.48} {'loss': 0.5396, 'learning_rate': 3.192035979625404e-06, 'epoch': 1.48} {'loss': 0.5674, 'learning_rate': 3.191796207211946e-06, 'epoch': 1.48} {'loss': 0.5356, 'learning_rate': 3.191556442094089e-06, 'epoch': 1.48} {'loss': 0.6737, 'learning_rate': 3.1913166842720943e-06, 'epoch': 1.48} {'loss': 0.622, 'learning_rate': 3.1910769337462177e-06, 'epoch': 1.48} {'loss': 0.4212, 'learning_rate': 3.190837190516717e-06, 'epoch': 1.48} {'loss': 0.4923, 'learning_rate': 3.1905974545838525e-06, 'epoch': 1.48} {'loss': 0.4323, 'learning_rate': 3.1903577259478733e-06, 'epoch': 1.48} {'loss': 0.4576, 'learning_rate': 3.1901180046090407e-06, 'epoch': 1.48} {'loss': 0.5219, 'learning_rate': 3.189878290567612e-06, 'epoch': 1.48} {'loss': 0.5446, 'learning_rate': 3.189638583823842e-06, 'epoch': 1.48} {'loss': 0.5092, 'learning_rate': 3.18939888437799e-06, 'epoch': 1.48} {'loss': 0.415, 'learning_rate': 3.1891591922303113e-06, 'epoch': 1.48} {'loss': 0.4847, 'learning_rate': 3.1889195073810664e-06, 'epoch': 1.48} {'loss': 0.5811, 'learning_rate': 3.1886798298305065e-06, 'epoch': 1.48} {'loss': 0.5153, 'learning_rate': 3.1884401595788906e-06, 'epoch': 1.48} {'loss': 0.5304, 'learning_rate': 3.1882004966264757e-06, 'epoch': 1.48} {'loss': 0.5577, 'learning_rate': 3.1879608409735187e-06, 'epoch': 1.48} {'loss': 0.6099, 'learning_rate': 3.1877211926202765e-06, 'epoch': 1.48} {'loss': 0.3722, 'learning_rate': 3.1874815515670056e-06, 'epoch': 1.48} {'loss': 0.4778, 'learning_rate': 3.187241917813967e-06, 'epoch': 1.48} {'loss': 0.5956, 'learning_rate': 3.1870022913614096e-06, 'epoch': 1.48} {'loss': 0.5379, 'learning_rate': 3.1867626722095947e-06, 'epoch': 1.48} {'loss': 0.3896, 'learning_rate': 3.1865230603587783e-06, 'epoch': 1.48} {'loss': 0.5414, 'learning_rate': 3.186283455809218e-06, 'epoch': 1.48} {'loss': 0.4837, 'learning_rate': 3.1860438585611696e-06, 'epoch': 1.48} {'loss': 0.6799, 'learning_rate': 3.185804268614893e-06, 'epoch': 1.48} {'loss': 0.4991, 'learning_rate': 3.185564685970639e-06, 'epoch': 1.48} {'loss': 0.6406, 'learning_rate': 3.1853251106286675e-06, 'epoch': 1.48} {'loss': 0.6099, 'learning_rate': 3.1850855425892356e-06, 'epoch': 1.48} {'loss': 0.524, 'learning_rate': 3.1848459818526e-06, 'epoch': 1.48} {'loss': 0.557, 'learning_rate': 3.1846064284190158e-06, 'epoch': 1.48} {'loss': 0.599, 'learning_rate': 3.184366882288742e-06, 'epoch': 1.48} {'loss': 0.4501, 'learning_rate': 3.184127343462037e-06, 'epoch': 1.48} {'loss': 0.6073, 'learning_rate': 3.1838878119391512e-06, 'epoch': 1.48} {'loss': 0.4026, 'learning_rate': 3.1836482877203454e-06, 'epoch': 1.48} {'loss': 0.4509, 'learning_rate': 3.1834087708058758e-06, 'epoch': 1.48} {'loss': 0.5638, 'learning_rate': 3.1831692611959984e-06, 'epoch': 1.48} {'loss': 0.5947, 'learning_rate': 3.18292975889097e-06, 'epoch': 1.48} {'loss': 0.5154, 'learning_rate': 3.1826902638910486e-06, 'epoch': 1.48} {'loss': 0.5642, 'learning_rate': 3.1824507761964928e-06, 'epoch': 1.48} {'loss': 0.4344, 'learning_rate': 3.1822112958075525e-06, 'epoch': 1.48} {'loss': 0.6195, 'learning_rate': 3.1819718227244887e-06, 'epoch': 1.48} {'loss': 0.4892, 'learning_rate': 3.1817323569475576e-06, 'epoch': 1.48} {'loss': 0.5693, 'learning_rate': 3.1814928984770153e-06, 'epoch': 1.48} {'loss': 0.582, 'learning_rate': 3.181253447313122e-06, 'epoch': 1.48} {'loss': 0.5826, 'learning_rate': 3.1810140034561274e-06, 'epoch': 1.48} {'loss': 0.6377, 'learning_rate': 3.180774566906293e-06, 'epoch': 1.48} {'loss': 0.5272, 'learning_rate': 3.1805351376638737e-06, 'epoch': 1.48} {'loss': 0.4729, 'learning_rate': 3.180295715729126e-06, 'epoch': 1.48} {'loss': 0.6226, 'learning_rate': 3.1800563011023076e-06, 'epoch': 1.48} {'loss': 0.5321, 'learning_rate': 3.179816893783674e-06, 'epoch': 1.48} {'loss': 0.5021, 'learning_rate': 3.1795774937734847e-06, 'epoch': 1.48} {'loss': 0.5509, 'learning_rate': 3.1793381010719913e-06, 'epoch': 1.48} {'loss': 0.4552, 'learning_rate': 3.179098715679453e-06, 'epoch': 1.48} {'loss': 0.589, 'learning_rate': 3.1788593375961252e-06, 'epoch': 1.48} {'loss': 0.5115, 'learning_rate': 3.1786199668222663e-06, 'epoch': 1.48} {'loss': 0.419, 'learning_rate': 3.178380603358131e-06, 'epoch': 1.48} {'loss': 0.5191, 'learning_rate': 3.1781412472039765e-06, 'epoch': 1.48} {'loss': 0.6226, 'learning_rate': 3.177901898360063e-06, 'epoch': 1.48} {'loss': 0.6868, 'learning_rate': 3.1776625568266396e-06, 'epoch': 1.48} {'loss': 0.6017, 'learning_rate': 3.177423222603967e-06, 'epoch': 1.48} {'loss': 0.4157, 'learning_rate': 3.1771838956923016e-06, 'epoch': 1.48} {'loss': 0.4915, 'learning_rate': 3.1769445760918984e-06, 'epoch': 1.48} {'loss': 0.5371, 'learning_rate': 3.176705263803019e-06, 'epoch': 1.48} {'loss': 0.4188, 'learning_rate': 3.1764659588259083e-06, 'epoch': 1.48} {'loss': 0.5714, 'learning_rate': 3.1762266611608382e-06, 'epoch': 1.48} {'loss': 0.4615, 'learning_rate': 3.1759873708080524e-06, 'epoch': 1.48} {'loss': 0.6224, 'learning_rate': 3.1757480877678125e-06, 'epoch': 1.48} {'loss': 0.4756, 'learning_rate': 3.1755088120403752e-06, 'epoch': 1.48} {'loss': 0.4346, 'learning_rate': 3.175269543625995e-06, 'epoch': 1.48} {'loss': 0.4494, 'learning_rate': 3.1750302825249335e-06, 'epoch': 1.48} {'loss': 0.4543, 'learning_rate': 3.1747910287374363e-06, 'epoch': 1.48} {'loss': 0.4686, 'learning_rate': 3.1745517822637727e-06, 'epoch': 1.48} {'loss': 0.425, 'learning_rate': 3.17431254310419e-06, 'epoch': 1.48} {'loss': 0.4185, 'learning_rate': 3.1740733112589482e-06, 'epoch': 1.48} {'loss': 0.6311, 'learning_rate': 3.173834086728301e-06, 'epoch': 1.48} {'loss': 0.5499, 'learning_rate': 3.1735948695125086e-06, 'epoch': 1.48} {'loss': 0.5253, 'learning_rate': 3.1733556596118277e-06, 'epoch': 1.48} {'loss': 0.5699, 'learning_rate': 3.1731164570265062e-06, 'epoch': 1.48} {'loss': 0.6152, 'learning_rate': 3.1728772617568126e-06, 'epoch': 1.48} {'loss': 0.5728, 'learning_rate': 3.172638073802995e-06, 'epoch': 1.48} {'loss': 0.553, 'learning_rate': 3.1723988931653104e-06, 'epoch': 1.48} {'loss': 0.5258, 'learning_rate': 3.1721597198440213e-06, 'epoch': 1.48} {'loss': 0.551, 'learning_rate': 3.1719205538393715e-06, 'epoch': 1.48} {'loss': 0.5196, 'learning_rate': 3.1716813951516325e-06, 'epoch': 1.48} {'loss': 0.626, 'learning_rate': 3.1714422437810464e-06, 'epoch': 1.48} {'loss': 0.6581, 'learning_rate': 3.171203099727883e-06, 'epoch': 1.48} {'loss': 0.5145, 'learning_rate': 3.170963962992388e-06, 'epoch': 1.48} {'loss': 0.5943, 'learning_rate': 3.170724833574822e-06, 'epoch': 1.48} {'loss': 0.5252, 'learning_rate': 3.1704857114754437e-06, 'epoch': 1.48} {'loss': 0.5338, 'learning_rate': 3.1702465966945007e-06, 'epoch': 1.48} {'loss': 0.5033, 'learning_rate': 3.1700074892322608e-06, 'epoch': 1.48} {'loss': 0.4922, 'learning_rate': 3.1697683890889674e-06, 'epoch': 1.48} {'loss': 0.4203, 'learning_rate': 3.1695292962648904e-06, 'epoch': 1.48} {'loss': 0.5343, 'learning_rate': 3.169290210760276e-06, 'epoch': 1.48} {'loss': 0.54, 'learning_rate': 3.1690511325753836e-06, 'epoch': 1.48} {'loss': 0.4998, 'learning_rate': 3.1688120617104735e-06, 'epoch': 1.48} {'loss': 0.5087, 'learning_rate': 3.16857299816579e-06, 'epoch': 1.48} {'loss': 0.4599, 'learning_rate': 3.1683339419416038e-06, 'epoch': 1.48} {'loss': 0.5744, 'learning_rate': 3.168094893038158e-06, 'epoch': 1.48} {'loss': 0.5729, 'learning_rate': 3.167855851455722e-06, 'epoch': 1.48} {'loss': 0.5224, 'learning_rate': 3.167616817194542e-06, 'epoch': 1.48} {'loss': 0.6183, 'learning_rate': 3.1673777902548774e-06, 'epoch': 1.48} {'loss': 0.466, 'learning_rate': 3.1671387706369874e-06, 'epoch': 1.48} {'loss': 0.3441, 'learning_rate': 3.166899758341118e-06, 'epoch': 1.48} {'loss': 0.4967, 'learning_rate': 3.1666607533675385e-06, 'epoch': 1.48} {'loss': 0.7901, 'learning_rate': 3.166421755716492e-06, 'epoch': 1.48} {'loss': 0.468, 'learning_rate': 3.1661827653882493e-06, 'epoch': 1.48} {'loss': 0.5575, 'learning_rate': 3.165943782383054e-06, 'epoch': 1.48} {'loss': 0.5115, 'learning_rate': 3.1657048067011674e-06, 'epoch': 1.48} {'loss': 0.4905, 'learning_rate': 3.165465838342847e-06, 'epoch': 1.48} {'loss': 0.4998, 'learning_rate': 3.1652268773083418e-06, 'epoch': 1.48} {'loss': 0.6439, 'learning_rate': 3.1649879235979185e-06, 'epoch': 1.48} {'loss': 0.5445, 'learning_rate': 3.1647489772118244e-06, 'epoch': 1.48} {'loss': 0.6248, 'learning_rate': 3.1645100381503193e-06, 'epoch': 1.48} {'loss': 0.5601, 'learning_rate': 3.164271106413659e-06, 'epoch': 1.48} {'loss': 0.5536, 'learning_rate': 3.164032182002098e-06, 'epoch': 1.48} {'loss': 0.5808, 'learning_rate': 3.1637932649158965e-06, 'epoch': 1.48} {'loss': 0.4829, 'learning_rate': 3.1635543551553016e-06, 'epoch': 1.48} {'loss': 0.4961, 'learning_rate': 3.1633154527205824e-06, 'epoch': 1.48} {'loss': 0.6875, 'learning_rate': 3.1630765576119837e-06, 'epoch': 1.48} {'loss': 0.5712, 'learning_rate': 3.162837669829766e-06, 'epoch': 1.48} {'loss': 0.6781, 'learning_rate': 3.162598789374185e-06, 'epoch': 1.48} {'loss': 0.565, 'learning_rate': 3.1623599162454954e-06, 'epoch': 1.48} {'loss': 0.4642, 'learning_rate': 3.162121050443958e-06, 'epoch': 1.48} {'loss': 0.456, 'learning_rate': 3.1618821919698193e-06, 'epoch': 1.48} {'loss': 0.4838, 'learning_rate': 3.161643340823347e-06, 'epoch': 1.48} {'loss': 0.5261, 'learning_rate': 3.1614044970047875e-06, 'epoch': 1.48} {'loss': 0.6303, 'learning_rate': 3.1611656605144004e-06, 'epoch': 1.48} {'loss': 0.5181, 'learning_rate': 3.1609268313524454e-06, 'epoch': 1.48} {'loss': 0.4499, 'learning_rate': 3.1606880095191673e-06, 'epoch': 1.48} {'loss': 0.4673, 'learning_rate': 3.1604491950148363e-06, 'epoch': 1.48} {'loss': 0.4773, 'learning_rate': 3.1602103878396984e-06, 'epoch': 1.48} {'loss': 0.5068, 'learning_rate': 3.159971587994012e-06, 'epoch': 1.48} {'loss': 0.552, 'learning_rate': 3.1597327954780333e-06, 'epoch': 1.48} {'loss': 0.4947, 'learning_rate': 3.159494010292018e-06, 'epoch': 1.48} {'loss': 0.4084, 'learning_rate': 3.159255232436226e-06, 'epoch': 1.48} {'loss': 0.4737, 'learning_rate': 3.1590164619109022e-06, 'epoch': 1.48} {'loss': 0.4634, 'learning_rate': 3.1587776987163166e-06, 'epoch': 1.48} {'loss': 0.3982, 'learning_rate': 3.1585389428527148e-06, 'epoch': 1.48} {'loss': 0.6308, 'learning_rate': 3.1583001943203563e-06, 'epoch': 1.48} {'loss': 0.6191, 'learning_rate': 3.1580614531194966e-06, 'epoch': 1.48} {'loss': 0.5786, 'learning_rate': 3.157822719250392e-06, 'epoch': 1.48} {'loss': 0.3264, 'learning_rate': 3.1575839927133e-06, 'epoch': 1.48} {'loss': 0.5825, 'learning_rate': 3.157345273508469e-06, 'epoch': 1.48} {'loss': 0.5247, 'learning_rate': 3.1571065616361664e-06, 'epoch': 1.48} {'loss': 0.6205, 'learning_rate': 3.1568678570966384e-06, 'epoch': 1.48} {'loss': 0.4061, 'learning_rate': 3.156629159890143e-06, 'epoch': 1.48} {'loss': 0.5158, 'learning_rate': 3.156390470016938e-06, 'epoch': 1.48} {'loss': 0.5291, 'learning_rate': 3.1561517874772786e-06, 'epoch': 1.48} {'loss': 0.463, 'learning_rate': 3.1559131122714235e-06, 'epoch': 1.48} {'loss': 0.5445, 'learning_rate': 3.1556744443996214e-06, 'epoch': 1.48} {'loss': 0.4533, 'learning_rate': 3.155435783862132e-06, 'epoch': 1.48} {'loss': 0.4064, 'learning_rate': 3.1551971306592113e-06, 'epoch': 1.48} {'loss': 0.4676, 'learning_rate': 3.154958484791114e-06, 'epoch': 1.48} {'loss': 0.5006, 'learning_rate': 3.1547198462580975e-06, 'epoch': 1.48} {'loss': 0.4952, 'learning_rate': 3.1544812150604152e-06, 'epoch': 1.48} {'loss': 0.6073, 'learning_rate': 3.1542425911983288e-06, 'epoch': 1.48} {'loss': 0.463, 'learning_rate': 3.154003974672085e-06, 'epoch': 1.48} {'loss': 0.561, 'learning_rate': 3.1537653654819446e-06, 'epoch': 1.48} {'loss': 0.5619, 'learning_rate': 3.153526763628162e-06, 'epoch': 1.48} {'loss': 0.7572, 'learning_rate': 3.153288169110994e-06, 'epoch': 1.48} {'loss': 0.6319, 'learning_rate': 3.153049581930695e-06, 'epoch': 1.48} {'loss': 0.6616, 'learning_rate': 3.1528110020875214e-06, 'epoch': 1.48} {'loss': 0.712, 'learning_rate': 3.1525724295817316e-06, 'epoch': 1.48} {'loss': 0.6247, 'learning_rate': 3.152333864413576e-06, 'epoch': 1.48} {'loss': 0.4613, 'learning_rate': 3.1520953065833126e-06, 'epoch': 1.48} {'loss': 0.6013, 'learning_rate': 3.151856756091197e-06, 'epoch': 1.48} {'loss': 0.3861, 'learning_rate': 3.151618212937485e-06, 'epoch': 1.48} {'loss': 0.5982, 'learning_rate': 3.1513796771224326e-06, 'epoch': 1.48} {'loss': 0.5098, 'learning_rate': 3.1511411486462984e-06, 'epoch': 1.48} {'loss': 0.4744, 'learning_rate': 3.1509026275093303e-06, 'epoch': 1.48} {'loss': 0.5045, 'learning_rate': 3.150664113711789e-06, 'epoch': 1.48} {'loss': 0.551, 'learning_rate': 3.1504256072539284e-06, 'epoch': 1.48} {'loss': 0.4176, 'learning_rate': 3.1501871081360057e-06, 'epoch': 1.48} {'loss': 0.6171, 'learning_rate': 3.149948616358276e-06, 'epoch': 1.48} {'loss': 0.5923, 'learning_rate': 3.1497101319209943e-06, 'epoch': 1.48} {'loss': 0.6762, 'learning_rate': 3.1494716548244197e-06, 'epoch': 1.48} {'loss': 0.5816, 'learning_rate': 3.149233185068802e-06, 'epoch': 1.48} {'loss': 0.5811, 'learning_rate': 3.148994722654398e-06, 'epoch': 1.48} {'loss': 0.5952, 'learning_rate': 3.1487562675814654e-06, 'epoch': 1.48} {'loss': 0.3875, 'learning_rate': 3.1485178198502576e-06, 'epoch': 1.48} {'loss': 0.6844, 'learning_rate': 3.1482793794610356e-06, 'epoch': 1.48} {'loss': 0.4619, 'learning_rate': 3.148040946414044e-06, 'epoch': 1.48} {'loss': 0.5206, 'learning_rate': 3.147802520709552e-06, 'epoch': 1.48} {'loss': 0.4533, 'learning_rate': 3.147564102347804e-06, 'epoch': 1.48} {'loss': 0.4106, 'learning_rate': 3.1473256913290596e-06, 'epoch': 1.48} {'loss': 0.4594, 'learning_rate': 3.147087287653574e-06, 'epoch': 1.48} {'loss': 0.5235, 'learning_rate': 3.1468488913216045e-06, 'epoch': 1.48} {'loss': 0.5943, 'learning_rate': 3.146610502333406e-06, 'epoch': 1.48} {'loss': 0.3877, 'learning_rate': 3.1463721206892275e-06, 'epoch': 1.48} {'loss': 0.5405, 'learning_rate': 3.1461337463893358e-06, 'epoch': 1.48} {'loss': 0.5476, 'learning_rate': 3.1458953794339787e-06, 'epoch': 1.48} {'loss': 0.6687, 'learning_rate': 3.1456570198234116e-06, 'epoch': 1.48} {'loss': 0.4496, 'learning_rate': 3.1454186675578924e-06, 'epoch': 1.48} {'loss': 0.4617, 'learning_rate': 3.145180322637675e-06, 'epoch': 1.48} {'loss': 0.4309, 'learning_rate': 3.1449419850630204e-06, 'epoch': 1.48} {'loss': 0.5381, 'learning_rate': 3.1447036548341712e-06, 'epoch': 1.48} {'loss': 0.4317, 'learning_rate': 3.1444653319513987e-06, 'epoch': 1.48} {'loss': 0.5181, 'learning_rate': 3.144227016414946e-06, 'epoch': 1.48} {'loss': 0.5826, 'learning_rate': 3.143988708225072e-06, 'epoch': 1.48} {'loss': 0.5071, 'learning_rate': 3.1437504073820378e-06, 'epoch': 1.48} {'loss': 0.4823, 'learning_rate': 3.143512113886087e-06, 'epoch': 1.48} {'loss': 0.49, 'learning_rate': 3.1432738277374875e-06, 'epoch': 1.48} {'loss': 0.4463, 'learning_rate': 3.143035548936486e-06, 'epoch': 1.48} {'loss': 0.431, 'learning_rate': 3.1427972774833415e-06, 'epoch': 1.48} {'loss': 0.4557, 'learning_rate': 3.142559013378308e-06, 'epoch': 1.48} {'loss': 0.543, 'learning_rate': 3.1423207566216407e-06, 'epoch': 1.48} {'loss': 0.52, 'learning_rate': 3.1420825072136e-06, 'epoch': 1.48} {'loss': 0.5802, 'learning_rate': 3.1418442651544303e-06, 'epoch': 1.48} {'loss': 0.5463, 'learning_rate': 3.1416060304443994e-06, 'epoch': 1.48} {'loss': 0.5697, 'learning_rate': 3.1413678030837537e-06, 'epoch': 1.48} {'loss': 0.4989, 'learning_rate': 3.141129583072752e-06, 'epoch': 1.48} {'loss': 0.5532, 'learning_rate': 3.1408913704116484e-06, 'epoch': 1.48} {'loss': 0.4559, 'learning_rate': 3.1406531651006988e-06, 'epoch': 1.48} {'loss': 0.4582, 'learning_rate': 3.1404149671401617e-06, 'epoch': 1.48} {'loss': 0.674, 'learning_rate': 3.1401767765302825e-06, 'epoch': 1.48} {'loss': 0.5777, 'learning_rate': 3.13993859327133e-06, 'epoch': 1.48} {'loss': 0.4898, 'learning_rate': 3.139700417363548e-06, 'epoch': 1.48} {'loss': 0.5684, 'learning_rate': 3.139462248807198e-06, 'epoch': 1.48} {'loss': 0.4616, 'learning_rate': 3.139224087602535e-06, 'epoch': 1.48} {'loss': 0.6564, 'learning_rate': 3.1389859337498076e-06, 'epoch': 1.48} {'loss': 0.3907, 'learning_rate': 3.138747787249281e-06, 'epoch': 1.48} {'loss': 0.467, 'learning_rate': 3.1385096481012e-06, 'epoch': 1.48} {'loss': 0.587, 'learning_rate': 3.1382715163058307e-06, 'epoch': 1.48} {'loss': 0.5461, 'learning_rate': 3.138033391863421e-06, 'epoch': 1.48} {'loss': 0.5499, 'learning_rate': 3.137795274774227e-06, 'epoch': 1.48} {'loss': 0.4555, 'learning_rate': 3.137557165038507e-06, 'epoch': 1.48} {'loss': 0.5997, 'learning_rate': 3.1373190626565085e-06, 'epoch': 1.48} {'loss': 0.4618, 'learning_rate': 3.1370809676284985e-06, 'epoch': 1.48} {'loss': 0.6033, 'learning_rate': 3.136842879954719e-06, 'epoch': 1.48} {'loss': 0.413, 'learning_rate': 3.136604799635439e-06, 'epoch': 1.48} {'loss': 0.6077, 'learning_rate': 3.1363667266709017e-06, 'epoch': 1.48} {'loss': 0.5853, 'learning_rate': 3.1361286610613684e-06, 'epoch': 1.48} {'loss': 0.5258, 'learning_rate': 3.1358906028070944e-06, 'epoch': 1.48} {'loss': 0.4803, 'learning_rate': 3.135652551908328e-06, 'epoch': 1.48} {'loss': 0.5988, 'learning_rate': 3.1354145083653352e-06, 'epoch': 1.48} {'loss': 0.5706, 'learning_rate': 3.1351764721783596e-06, 'epoch': 1.48} {'loss': 0.5487, 'learning_rate': 3.134938443347668e-06, 'epoch': 1.48} {'loss': 0.4103, 'learning_rate': 3.1347004218735065e-06, 'epoch': 1.48} {'loss': 0.4823, 'learning_rate': 3.1344624077561327e-06, 'epoch': 1.48} {'loss': 0.5054, 'learning_rate': 3.134224400995806e-06, 'epoch': 1.48} {'loss': 0.5314, 'learning_rate': 3.1339864015927703e-06, 'epoch': 1.48} {'loss': 0.5754, 'learning_rate': 3.1337484095472937e-06, 'epoch': 1.48} {'loss': 0.5459, 'learning_rate': 3.1335104248596206e-06, 'epoch': 1.48} {'loss': 0.4581, 'learning_rate': 3.133272447530016e-06, 'epoch': 1.48} {'loss': 0.4762, 'learning_rate': 3.1330344775587274e-06, 'epoch': 1.48} {'loss': 0.4882, 'learning_rate': 3.1327965149460114e-06, 'epoch': 1.48} {'loss': 0.5526, 'learning_rate': 3.132558559692127e-06, 'epoch': 1.48} {'loss': 0.6037, 'learning_rate': 3.1323206117973206e-06, 'epoch': 1.48} {'loss': 0.5423, 'learning_rate': 3.132082671261858e-06, 'epoch': 1.48} {'loss': 0.6553, 'learning_rate': 3.1318447380859816e-06, 'epoch': 1.48} {'loss': 0.5638, 'learning_rate': 3.1316068122699604e-06, 'epoch': 1.48} {'loss': 0.6436, 'learning_rate': 3.1313688938140397e-06, 'epoch': 1.48} {'loss': 0.4112, 'learning_rate': 3.131130982718478e-06, 'epoch': 1.48} {'loss': 0.5491, 'learning_rate': 3.130893078983531e-06, 'epoch': 1.48} {'loss': 0.409, 'learning_rate': 3.1306551826094455e-06, 'epoch': 1.48} {'loss': 0.6543, 'learning_rate': 3.1304172935964904e-06, 'epoch': 1.48} {'loss': 0.6071, 'learning_rate': 3.130179411944909e-06, 'epoch': 1.48} {'loss': 0.4336, 'learning_rate': 3.129941537654961e-06, 'epoch': 1.48} {'loss': 0.3912, 'learning_rate': 3.1297036707269015e-06, 'epoch': 1.48} {'loss': 0.4589, 'learning_rate': 3.1294658111609833e-06, 'epoch': 1.48} {'loss': 0.6431, 'learning_rate': 3.129227958957467e-06, 'epoch': 1.48} {'loss': 0.4837, 'learning_rate': 3.1289901141165957e-06, 'epoch': 1.48} {'loss': 0.4253, 'learning_rate': 3.128752276638638e-06, 'epoch': 1.48} {'loss': 0.552, 'learning_rate': 3.1285144465238394e-06, 'epoch': 1.48} {'loss': 0.5525, 'learning_rate': 3.1282766237724582e-06, 'epoch': 1.48} {'loss': 0.5869, 'learning_rate': 3.128038808384749e-06, 'epoch': 1.48} {'loss': 0.4452, 'learning_rate': 3.127801000360966e-06, 'epoch': 1.48} {'loss': 0.6604, 'learning_rate': 3.1275631997013665e-06, 'epoch': 1.48} {'loss': 0.5392, 'learning_rate': 3.127325406406202e-06, 'epoch': 1.48} {'loss': 0.4407, 'learning_rate': 3.1270876204757272e-06, 'epoch': 1.48} {'loss': 0.5797, 'learning_rate': 3.1268498419102e-06, 'epoch': 1.48} {'loss': 0.6289, 'learning_rate': 3.1266120707098723e-06, 'epoch': 1.48} {'loss': 0.5143, 'learning_rate': 3.1263743068749994e-06, 'epoch': 1.48} {'loss': 0.4998, 'learning_rate': 3.1261365504058383e-06, 'epoch': 1.48} {'loss': 0.5457, 'learning_rate': 3.1258988013026447e-06, 'epoch': 1.48} {'loss': 0.5909, 'learning_rate': 3.125661059565669e-06, 'epoch': 1.48} {'loss': 0.479, 'learning_rate': 3.125423325195166e-06, 'epoch': 1.48} {'loss': 0.5305, 'learning_rate': 3.1251855981913937e-06, 'epoch': 1.48} {'loss': 0.5049, 'learning_rate': 3.124947878554605e-06, 'epoch': 1.48} {'loss': 0.3956, 'learning_rate': 3.1247101662850555e-06, 'epoch': 1.48} {'loss': 0.6146, 'learning_rate': 3.124472461382999e-06, 'epoch': 1.48} {'loss': 0.4757, 'learning_rate': 3.124234763848695e-06, 'epoch': 1.48} {'loss': 0.5058, 'learning_rate': 3.12399707368239e-06, 'epoch': 1.48} {'loss': 0.4435, 'learning_rate': 3.1237593908843434e-06, 'epoch': 1.48} {'loss': 0.6478, 'learning_rate': 3.123521715454808e-06, 'epoch': 1.48} {'loss': 0.5042, 'learning_rate': 3.1232840473940406e-06, 'epoch': 1.48} {'loss': 0.6423, 'learning_rate': 3.1230463867022987e-06, 'epoch': 1.48} {'loss': 0.6125, 'learning_rate': 3.1228087333798297e-06, 'epoch': 1.48} {'loss': 0.4984, 'learning_rate': 3.1225710874268913e-06, 'epoch': 1.48} {'loss': 0.5757, 'learning_rate': 3.1223334488437384e-06, 'epoch': 1.48} {'loss': 0.4008, 'learning_rate': 3.122095817630627e-06, 'epoch': 1.48} {'loss': 0.6459, 'learning_rate': 3.12185819378781e-06, 'epoch': 1.48} {'loss': 0.575, 'learning_rate': 3.121620577315543e-06, 'epoch': 1.48} {'loss': 0.4872, 'learning_rate': 3.121382968214084e-06, 'epoch': 1.48} {'loss': 0.5402, 'learning_rate': 3.12114536648368e-06, 'epoch': 1.48} {'loss': 0.4395, 'learning_rate': 3.120907772124591e-06, 'epoch': 1.48} {'loss': 0.3933, 'learning_rate': 3.120670185137069e-06, 'epoch': 1.48} {'loss': 0.4952, 'learning_rate': 3.1204326055213698e-06, 'epoch': 1.48} {'loss': 0.4542, 'learning_rate': 3.1201950332777475e-06, 'epoch': 1.48} {'loss': 0.385, 'learning_rate': 3.119957468406458e-06, 'epoch': 1.48} {'loss': 0.6086, 'learning_rate': 3.119719910907758e-06, 'epoch': 1.48} {'loss': 0.4555, 'learning_rate': 3.119482360781896e-06, 'epoch': 1.48} {'loss': 0.6021, 'learning_rate': 3.11924481802913e-06, 'epoch': 1.48} {'loss': 0.4361, 'learning_rate': 3.119007282649714e-06, 'epoch': 1.48} {'loss': 0.576, 'learning_rate': 3.118769754643902e-06, 'epoch': 1.48} {'loss': 0.4501, 'learning_rate': 3.1185322340119505e-06, 'epoch': 1.48} {'loss': 0.404, 'learning_rate': 3.118294720754115e-06, 'epoch': 1.48} {'loss': 0.5742, 'learning_rate': 3.1180572148706447e-06, 'epoch': 1.48} {'loss': 0.5498, 'learning_rate': 3.1178197163617974e-06, 'epoch': 1.48} {'loss': 0.4627, 'learning_rate': 3.1175822252278275e-06, 'epoch': 1.48} {'loss': 0.6539, 'learning_rate': 3.1173447414689896e-06, 'epoch': 1.48} {'loss': 0.4712, 'learning_rate': 3.1171072650855382e-06, 'epoch': 1.48} {'loss': 0.5305, 'learning_rate': 3.116869796077727e-06, 'epoch': 1.48} {'loss': 0.6172, 'learning_rate': 3.1166323344458147e-06, 'epoch': 1.48} {'loss': 0.603, 'learning_rate': 3.116394880190049e-06, 'epoch': 1.48} {'loss': 0.5371, 'learning_rate': 3.116157433310687e-06, 'epoch': 1.48} {'loss': 0.6125, 'learning_rate': 3.115919993807983e-06, 'epoch': 1.48} {'loss': 0.4328, 'learning_rate': 3.115682561682194e-06, 'epoch': 1.49} {'loss': 0.4414, 'learning_rate': 3.11544513693357e-06, 'epoch': 1.49} {'loss': 0.4676, 'learning_rate': 3.1152077195623697e-06, 'epoch': 1.49} {'loss': 0.6301, 'learning_rate': 3.1149703095688487e-06, 'epoch': 1.49} {'loss': 0.5955, 'learning_rate': 3.114732906953255e-06, 'epoch': 1.49} {'loss': 0.4896, 'learning_rate': 3.114495511715846e-06, 'epoch': 1.49} {'loss': 0.5264, 'learning_rate': 3.114258123856877e-06, 'epoch': 1.49} {'loss': 0.46, 'learning_rate': 3.1140207433766024e-06, 'epoch': 1.49} {'loss': 0.4767, 'learning_rate': 3.1137833702752783e-06, 'epoch': 1.49} {'loss': 0.5445, 'learning_rate': 3.1135460045531506e-06, 'epoch': 1.49} {'loss': 0.5238, 'learning_rate': 3.1133086462104866e-06, 'epoch': 1.49} {'loss': 0.5904, 'learning_rate': 3.1130712952475306e-06, 'epoch': 1.49} {'loss': 0.609, 'learning_rate': 3.112833951664541e-06, 'epoch': 1.49} {'loss': 0.4218, 'learning_rate': 3.1125966154617703e-06, 'epoch': 1.49} {'loss': 0.4847, 'learning_rate': 3.1123592866394747e-06, 'epoch': 1.49} {'loss': 0.4149, 'learning_rate': 3.1121219651979107e-06, 'epoch': 1.49} {'loss': 0.3808, 'learning_rate': 3.1118846511373237e-06, 'epoch': 1.49} {'loss': 0.5823, 'learning_rate': 3.11164734445798e-06, 'epoch': 1.49} {'loss': 0.426, 'learning_rate': 3.1114100451601247e-06, 'epoch': 1.49} {'loss': 0.6086, 'learning_rate': 3.111172753244015e-06, 'epoch': 1.49} {'loss': 0.5185, 'learning_rate': 3.110935468709906e-06, 'epoch': 1.49} {'loss': 0.5434, 'learning_rate': 3.1106981915580503e-06, 'epoch': 1.49} {'loss': 0.4547, 'learning_rate': 3.1104609217887072e-06, 'epoch': 1.49} {'loss': 0.6231, 'learning_rate': 3.1102236594021207e-06, 'epoch': 1.49} {'loss': 0.3211, 'learning_rate': 3.1099864043985583e-06, 'epoch': 1.49} {'loss': 0.5218, 'learning_rate': 3.1097491567782633e-06, 'epoch': 1.49} {'loss': 0.578, 'learning_rate': 3.1095119165414943e-06, 'epoch': 1.49} {'loss': 0.4261, 'learning_rate': 3.1092746836885092e-06, 'epoch': 1.49} {'loss': 0.3653, 'learning_rate': 3.1090374582195505e-06, 'epoch': 1.49} {'loss': 0.539, 'learning_rate': 3.1088002401348873e-06, 'epoch': 1.49} {'loss': 0.3096, 'learning_rate': 3.1085630294347602e-06, 'epoch': 1.49} {'loss': 0.5324, 'learning_rate': 3.108325826119436e-06, 'epoch': 1.49} {'loss': 0.4669, 'learning_rate': 3.108088630189159e-06, 'epoch': 1.49} {'loss': 0.6779, 'learning_rate': 3.1078514416441875e-06, 'epoch': 1.49} {'loss': 0.4838, 'learning_rate': 3.1076142604847783e-06, 'epoch': 1.49} {'loss': 0.4538, 'learning_rate': 3.1073770867111763e-06, 'epoch': 1.49} {'loss': 0.4849, 'learning_rate': 3.1071399203236486e-06, 'epoch': 1.49} {'loss': 0.5229, 'learning_rate': 3.1069027613224388e-06, 'epoch': 1.49} {'loss': 0.5497, 'learning_rate': 3.106665609707805e-06, 'epoch': 1.49} {'loss': 0.6519, 'learning_rate': 3.1064284654800015e-06, 'epoch': 1.49} {'loss': 0.2546, 'learning_rate': 3.106191328639281e-06, 'epoch': 1.49} {'loss': 0.496, 'learning_rate': 3.1059541991859034e-06, 'epoch': 1.49} {'loss': 0.782, 'learning_rate': 3.1057170771201107e-06, 'epoch': 1.49} {'loss': 0.5759, 'learning_rate': 3.1054799624421704e-06, 'epoch': 1.49} {'loss': 0.4531, 'learning_rate': 3.1052428551523284e-06, 'epoch': 1.49} {'loss': 0.412, 'learning_rate': 3.1050057552508405e-06, 'epoch': 1.49} {'loss': 0.4498, 'learning_rate': 3.1047686627379613e-06, 'epoch': 1.49} {'loss': 0.5422, 'learning_rate': 3.104531577613945e-06, 'epoch': 1.49} {'loss': 0.5596, 'learning_rate': 3.104294499879048e-06, 'epoch': 1.49} {'loss': 0.4475, 'learning_rate': 3.104057429533517e-06, 'epoch': 1.49} {'loss': 0.5021, 'learning_rate': 3.1038203665776157e-06, 'epoch': 1.49} {'loss': 0.5205, 'learning_rate': 3.1035833110115907e-06, 'epoch': 1.49} {'loss': 0.3591, 'learning_rate': 3.1033462628356983e-06, 'epoch': 1.49} {'loss': 0.6497, 'learning_rate': 3.1031092220501966e-06, 'epoch': 1.49} {'loss': 0.5783, 'learning_rate': 3.1028721886553294e-06, 'epoch': 1.49} {'loss': 0.4892, 'learning_rate': 3.102635162651363e-06, 'epoch': 1.49} {'loss': 0.4987, 'learning_rate': 3.1023981440385398e-06, 'epoch': 1.49} {'loss': 0.4713, 'learning_rate': 3.1021611328171252e-06, 'epoch': 1.49} {'loss': 0.6058, 'learning_rate': 3.101924128987365e-06, 'epoch': 1.49} {'loss': 0.2917, 'learning_rate': 3.1016871325495145e-06, 'epoch': 1.49} {'loss': 0.7304, 'learning_rate': 3.1014501435038334e-06, 'epoch': 1.49} {'loss': 0.3314, 'learning_rate': 3.1012131618505636e-06, 'epoch': 1.49} {'loss': 0.459, 'learning_rate': 3.1009761875899734e-06, 'epoch': 1.49} {'loss': 0.5463, 'learning_rate': 3.100739220722304e-06, 'epoch': 1.49} {'loss': 0.6545, 'learning_rate': 3.1005022612478218e-06, 'epoch': 1.49} {'loss': 0.6489, 'learning_rate': 3.1002653091667702e-06, 'epoch': 1.49} {'loss': 0.5797, 'learning_rate': 3.100028364479407e-06, 'epoch': 1.49} {'loss': 0.6325, 'learning_rate': 3.0997914271859897e-06, 'epoch': 1.49} {'loss': 0.5006, 'learning_rate': 3.099554497286762e-06, 'epoch': 1.49} {'loss': 0.2886, 'learning_rate': 3.0993175747819915e-06, 'epoch': 1.49} {'loss': 0.5255, 'learning_rate': 3.099080659671918e-06, 'epoch': 1.49} {'loss': 0.5432, 'learning_rate': 3.098843751956809e-06, 'epoch': 1.49} {'loss': 0.5595, 'learning_rate': 3.0986068516369093e-06, 'epoch': 1.49} {'loss': 0.4598, 'learning_rate': 3.0983699587124736e-06, 'epoch': 1.49} {'loss': 0.4789, 'learning_rate': 3.098133073183762e-06, 'epoch': 1.49} {'loss': 0.3524, 'learning_rate': 3.0978961950510167e-06, 'epoch': 1.49} {'loss': 0.636, 'learning_rate': 3.0976593243145057e-06, 'epoch': 1.49} {'loss': 0.4437, 'learning_rate': 3.097422460974472e-06, 'epoch': 1.49} {'loss': 0.4203, 'learning_rate': 3.0971856050311733e-06, 'epoch': 1.49} {'loss': 0.5041, 'learning_rate': 3.0969487564848635e-06, 'epoch': 1.49} {'loss': 0.6116, 'learning_rate': 3.096711915335795e-06, 'epoch': 1.49} {'loss': 0.5523, 'learning_rate': 3.096475081584227e-06, 'epoch': 1.49} {'loss': 0.6167, 'learning_rate': 3.0962382552304028e-06, 'epoch': 1.49} {'loss': 0.4012, 'learning_rate': 3.096001436274587e-06, 'epoch': 1.49} {'loss': 0.4966, 'learning_rate': 3.0957646247170283e-06, 'epoch': 1.49} {'loss': 0.4878, 'learning_rate': 3.0955278205579787e-06, 'epoch': 1.49} {'loss': 0.5746, 'learning_rate': 3.0952910237976954e-06, 'epoch': 1.49} {'loss': 0.43, 'learning_rate': 3.0950542344364308e-06, 'epoch': 1.49} {'loss': 0.5129, 'learning_rate': 3.094817452474441e-06, 'epoch': 1.49} {'loss': 0.4423, 'learning_rate': 3.0945806779119725e-06, 'epoch': 1.49} {'loss': 0.4711, 'learning_rate': 3.09434391074929e-06, 'epoch': 1.49} {'loss': 0.3923, 'learning_rate': 3.0941071509866384e-06, 'epoch': 1.49} {'loss': 0.4877, 'learning_rate': 3.0938703986242736e-06, 'epoch': 1.49} {'loss': 0.5027, 'learning_rate': 3.09363365366245e-06, 'epoch': 1.49} {'loss': 0.4697, 'learning_rate': 3.093396916101421e-06, 'epoch': 1.49} {'loss': 0.5842, 'learning_rate': 3.093160185941445e-06, 'epoch': 1.49} {'loss': 0.5346, 'learning_rate': 3.0929234631827674e-06, 'epoch': 1.49} {'loss': 0.4177, 'learning_rate': 3.092686747825645e-06, 'epoch': 1.49} {'loss': 0.486, 'learning_rate': 3.092450039870333e-06, 'epoch': 1.49} {'loss': 0.4916, 'learning_rate': 3.092213339317084e-06, 'epoch': 1.49} {'loss': 0.4493, 'learning_rate': 3.0919766461661527e-06, 'epoch': 1.49} {'loss': 0.4145, 'learning_rate': 3.091739960417791e-06, 'epoch': 1.49} {'loss': 0.5298, 'learning_rate': 3.091503282072257e-06, 'epoch': 1.49} {'loss': 0.4439, 'learning_rate': 3.091266611129796e-06, 'epoch': 1.49} {'loss': 0.5937, 'learning_rate': 3.091029947590668e-06, 'epoch': 1.49} {'loss': 0.4991, 'learning_rate': 3.0907932914551252e-06, 'epoch': 1.49} {'loss': 0.7006, 'learning_rate': 3.09055664272342e-06, 'epoch': 1.49} {'loss': 0.4968, 'learning_rate': 3.090320001395808e-06, 'epoch': 1.49} {'loss': 0.4518, 'learning_rate': 3.0900833674725404e-06, 'epoch': 1.49} {'loss': 0.5687, 'learning_rate': 3.089846740953877e-06, 'epoch': 1.49} {'loss': 0.3284, 'learning_rate': 3.089610121840062e-06, 'epoch': 1.49} {'loss': 0.3817, 'learning_rate': 3.089373510131354e-06, 'epoch': 1.49} {'loss': 0.4109, 'learning_rate': 3.089136905828006e-06, 'epoch': 1.49} {'loss': 0.6186, 'learning_rate': 3.0889003089302718e-06, 'epoch': 1.49} {'loss': 0.4694, 'learning_rate': 3.088663719438404e-06, 'epoch': 1.49} {'loss': 0.5498, 'learning_rate': 3.088427137352661e-06, 'epoch': 1.49} {'loss': 0.4367, 'learning_rate': 3.0881905626732876e-06, 'epoch': 1.49} {'loss': 0.4835, 'learning_rate': 3.0879539954005424e-06, 'epoch': 1.49} {'loss': 0.6468, 'learning_rate': 3.0877174355346785e-06, 'epoch': 1.49} {'loss': 0.6276, 'learning_rate': 3.0874808830759495e-06, 'epoch': 1.49} {'loss': 0.5534, 'learning_rate': 3.087244338024609e-06, 'epoch': 1.49} {'loss': 0.4563, 'learning_rate': 3.0870078003809088e-06, 'epoch': 1.49} {'loss': 0.2682, 'learning_rate': 3.086771270145107e-06, 'epoch': 1.49} {'loss': 0.5652, 'learning_rate': 3.0865347473174514e-06, 'epoch': 1.49} {'loss': 0.4173, 'learning_rate': 3.086298231898197e-06, 'epoch': 1.49} {'loss': 0.4313, 'learning_rate': 3.0860617238875988e-06, 'epoch': 1.49} {'loss': 0.4974, 'learning_rate': 3.08582522328591e-06, 'epoch': 1.49} {'loss': 0.6103, 'learning_rate': 3.085588730093385e-06, 'epoch': 1.49} {'loss': 0.5058, 'learning_rate': 3.0853522443102734e-06, 'epoch': 1.49} {'loss': 0.6044, 'learning_rate': 3.0851157659368314e-06, 'epoch': 1.49} {'loss': 0.4376, 'learning_rate': 3.084879294973312e-06, 'epoch': 1.49} {'loss': 0.5429, 'learning_rate': 3.084642831419967e-06, 'epoch': 1.49} {'loss': 0.5994, 'learning_rate': 3.0844063752770526e-06, 'epoch': 1.49} {'loss': 0.571, 'learning_rate': 3.084169926544821e-06, 'epoch': 1.49} {'loss': 0.5064, 'learning_rate': 3.083933485223529e-06, 'epoch': 1.49} {'loss': 0.3954, 'learning_rate': 3.0836970513134223e-06, 'epoch': 1.49} {'loss': 0.6017, 'learning_rate': 3.083460624814759e-06, 'epoch': 1.49} {'loss': 0.5704, 'learning_rate': 3.083224205727792e-06, 'epoch': 1.49} {'loss': 0.5775, 'learning_rate': 3.0829877940527743e-06, 'epoch': 1.49} {'loss': 0.5466, 'learning_rate': 3.0827513897899596e-06, 'epoch': 1.49} {'loss': 0.5286, 'learning_rate': 3.0825149929396012e-06, 'epoch': 1.49} {'loss': 0.5925, 'learning_rate': 3.0822786035019556e-06, 'epoch': 1.49} {'loss': 0.3374, 'learning_rate': 3.0820422214772692e-06, 'epoch': 1.49} {'loss': 0.4935, 'learning_rate': 3.0818058468657995e-06, 'epoch': 1.49} {'loss': 0.6056, 'learning_rate': 3.0815694796677984e-06, 'epoch': 1.49} {'loss': 0.6159, 'learning_rate': 3.0813331198835206e-06, 'epoch': 1.49} {'loss': 0.4909, 'learning_rate': 3.0810967675132218e-06, 'epoch': 1.49} {'loss': 0.4185, 'learning_rate': 3.080860422557147e-06, 'epoch': 1.49} {'loss': 0.4497, 'learning_rate': 3.08062408501556e-06, 'epoch': 1.49} {'loss': 0.4774, 'learning_rate': 3.080387754888706e-06, 'epoch': 1.49} {'loss': 0.4754, 'learning_rate': 3.080151432176841e-06, 'epoch': 1.49} {'loss': 0.5058, 'learning_rate': 3.0799151168802177e-06, 'epoch': 1.49} {'loss': 0.6276, 'learning_rate': 3.0796788089990903e-06, 'epoch': 1.49} {'loss': 0.5888, 'learning_rate': 3.0794425085337156e-06, 'epoch': 1.49} {'loss': 0.5524, 'learning_rate': 3.079206215484335e-06, 'epoch': 1.49} {'loss': 0.4706, 'learning_rate': 3.078969929851218e-06, 'epoch': 1.49} {'loss': 0.4977, 'learning_rate': 3.0787336516346043e-06, 'epoch': 1.49} {'loss': 0.5621, 'learning_rate': 3.0784973808347527e-06, 'epoch': 1.49} {'loss': 0.6089, 'learning_rate': 3.0782611174519163e-06, 'epoch': 1.49} {'loss': 0.631, 'learning_rate': 3.078024861486347e-06, 'epoch': 1.49} {'loss': 0.5191, 'learning_rate': 3.0777886129383026e-06, 'epoch': 1.49} {'loss': 0.4211, 'learning_rate': 3.077552371808026e-06, 'epoch': 1.49} {'loss': 0.5693, 'learning_rate': 3.077316138095784e-06, 'epoch': 1.49} {'loss': 0.4258, 'learning_rate': 3.077079911801818e-06, 'epoch': 1.49} {'loss': 0.407, 'learning_rate': 3.076843692926387e-06, 'epoch': 1.49} {'loss': 0.7058, 'learning_rate': 3.0766074814697444e-06, 'epoch': 1.49} {'loss': 0.6728, 'learning_rate': 3.0763712774321365e-06, 'epoch': 1.49} {'loss': 0.5635, 'learning_rate': 3.076135080813828e-06, 'epoch': 1.49} {'loss': 0.3561, 'learning_rate': 3.075898891615059e-06, 'epoch': 1.49} {'loss': 0.6173, 'learning_rate': 3.075662709836096e-06, 'epoch': 1.49} {'loss': 0.3164, 'learning_rate': 3.0754265354771816e-06, 'epoch': 1.49} {'loss': 0.5483, 'learning_rate': 3.075190368538574e-06, 'epoch': 1.49} {'loss': 0.6267, 'learning_rate': 3.0749542090205266e-06, 'epoch': 1.49} {'loss': 0.5775, 'learning_rate': 3.074718056923285e-06, 'epoch': 1.49} {'loss': 0.5455, 'learning_rate': 3.0744819122471146e-06, 'epoch': 1.49} {'loss': 0.4781, 'learning_rate': 3.074245774992255e-06, 'epoch': 1.49} {'loss': 0.5787, 'learning_rate': 3.074009645158973e-06, 'epoch': 1.49} {'loss': 0.5281, 'learning_rate': 3.0737735227475117e-06, 'epoch': 1.49} {'loss': 0.4918, 'learning_rate': 3.073537407758127e-06, 'epoch': 1.49} {'loss': 0.6032, 'learning_rate': 3.073301300191075e-06, 'epoch': 1.49} {'loss': 0.6662, 'learning_rate': 3.0730652000465998e-06, 'epoch': 1.49} {'loss': 0.3473, 'learning_rate': 3.072829107324967e-06, 'epoch': 1.49} {'loss': 0.5665, 'learning_rate': 3.0725930220264168e-06, 'epoch': 1.49} {'loss': 0.4382, 'learning_rate': 3.0723569441512137e-06, 'epoch': 1.49} {'loss': 0.4404, 'learning_rate': 3.0721208736996035e-06, 'epoch': 1.49} {'loss': 0.4851, 'learning_rate': 3.07188481067184e-06, 'epoch': 1.49} {'loss': 0.7012, 'learning_rate': 3.0716487550681805e-06, 'epoch': 1.49} {'loss': 0.5643, 'learning_rate': 3.071412706888869e-06, 'epoch': 1.49} {'loss': 0.5762, 'learning_rate': 3.07117666613417e-06, 'epoch': 1.49} {'loss': 0.5565, 'learning_rate': 3.0709406328043244e-06, 'epoch': 1.49} {'loss': 0.6013, 'learning_rate': 3.0707046068995973e-06, 'epoch': 1.49} {'loss': 0.4995, 'learning_rate': 3.0704685884202334e-06, 'epoch': 1.49} {'loss': 0.4789, 'learning_rate': 3.0702325773664863e-06, 'epoch': 1.49} {'loss': 0.5615, 'learning_rate': 3.069996573738615e-06, 'epoch': 1.49} {'loss': 0.4147, 'learning_rate': 3.069760577536861e-06, 'epoch': 1.49} {'loss': 0.5266, 'learning_rate': 3.069524588761491e-06, 'epoch': 1.49} {'loss': 0.6762, 'learning_rate': 3.069288607412747e-06, 'epoch': 1.49} {'loss': 0.5732, 'learning_rate': 3.0690526334908857e-06, 'epoch': 1.49} {'loss': 0.3705, 'learning_rate': 3.0688166669961606e-06, 'epoch': 1.49} {'loss': 0.5634, 'learning_rate': 3.0685807079288234e-06, 'epoch': 1.49} {'loss': 0.5088, 'learning_rate': 3.068344756289131e-06, 'epoch': 1.49} {'loss': 0.4484, 'learning_rate': 3.068108812077326e-06, 'epoch': 1.49} {'loss': 0.4705, 'learning_rate': 3.0678728752936746e-06, 'epoch': 1.49} {'loss': 0.4974, 'learning_rate': 3.0676369459384216e-06, 'epoch': 1.49} {'loss': 0.3953, 'learning_rate': 3.067401024011819e-06, 'epoch': 1.49} {'loss': 0.6179, 'learning_rate': 3.067165109514123e-06, 'epoch': 1.49} {'loss': 0.4599, 'learning_rate': 3.0669292024455856e-06, 'epoch': 1.49} {'loss': 0.6143, 'learning_rate': 3.0666933028064616e-06, 'epoch': 1.49} {'loss': 0.5655, 'learning_rate': 3.0664574105969957e-06, 'epoch': 1.49} {'loss': 0.4104, 'learning_rate': 3.066221525817452e-06, 'epoch': 1.49} {'loss': 0.6305, 'learning_rate': 3.0659856484680763e-06, 'epoch': 1.49} {'loss': 0.4171, 'learning_rate': 3.065749778549121e-06, 'epoch': 1.49} {'loss': 0.5993, 'learning_rate': 3.065513916060845e-06, 'epoch': 1.49} {'loss': 0.4208, 'learning_rate': 3.0652780610034907e-06, 'epoch': 1.49} {'loss': 0.5612, 'learning_rate': 3.065042213377322e-06, 'epoch': 1.49} {'loss': 0.4565, 'learning_rate': 3.064806373182584e-06, 'epoch': 1.49} {'loss': 0.3885, 'learning_rate': 3.0645705404195313e-06, 'epoch': 1.49} {'loss': 0.4264, 'learning_rate': 3.0643347150884174e-06, 'epoch': 1.49} {'loss': 0.5384, 'learning_rate': 3.0640988971894945e-06, 'epoch': 1.49} {'loss': 0.5798, 'learning_rate': 3.0638630867230203e-06, 'epoch': 1.49} {'loss': 0.6049, 'learning_rate': 3.0636272836892355e-06, 'epoch': 1.49} {'loss': 0.5514, 'learning_rate': 3.0633914880884063e-06, 'epoch': 1.49} {'loss': 0.4196, 'learning_rate': 3.0631556999207766e-06, 'epoch': 1.49} {'loss': 0.6068, 'learning_rate': 3.0629199191866012e-06, 'epoch': 1.49} {'loss': 0.5584, 'learning_rate': 3.0626841458861336e-06, 'epoch': 1.49} {'loss': 0.4944, 'learning_rate': 3.0624483800196248e-06, 'epoch': 1.49} {'loss': 0.4612, 'learning_rate': 3.062212621587334e-06, 'epoch': 1.49} {'loss': 0.4402, 'learning_rate': 3.0619768705895004e-06, 'epoch': 1.49} {'loss': 0.547, 'learning_rate': 3.061741127026392e-06, 'epoch': 1.49} {'loss': 0.4433, 'learning_rate': 3.0615053908982506e-06, 'epoch': 1.49} {'loss': 0.6164, 'learning_rate': 3.0612696622053327e-06, 'epoch': 1.49} {'loss': 0.4016, 'learning_rate': 3.0610339409478907e-06, 'epoch': 1.49} {'loss': 0.5554, 'learning_rate': 3.060798227126177e-06, 'epoch': 1.49} {'loss': 0.5605, 'learning_rate': 3.0605625207404478e-06, 'epoch': 1.49} {'loss': 0.5287, 'learning_rate': 3.0603268217909474e-06, 'epoch': 1.49} {'loss': 0.5926, 'learning_rate': 3.0600911302779347e-06, 'epoch': 1.49} {'loss': 0.4842, 'learning_rate': 3.0598554462016604e-06, 'epoch': 1.49} {'loss': 0.5466, 'learning_rate': 3.0596197695623773e-06, 'epoch': 1.49} {'loss': 0.4431, 'learning_rate': 3.0593841003603386e-06, 'epoch': 1.49} {'loss': 0.4707, 'learning_rate': 3.059148438595796e-06, 'epoch': 1.49} {'loss': 0.3776, 'learning_rate': 3.058912784269005e-06, 'epoch': 1.49} {'loss': 0.5034, 'learning_rate': 3.0586771373802128e-06, 'epoch': 1.49} {'loss': 0.542, 'learning_rate': 3.058441497929674e-06, 'epoch': 1.49} {'loss': 0.3356, 'learning_rate': 3.058205865917642e-06, 'epoch': 1.49} {'loss': 0.5456, 'learning_rate': 3.057970241344369e-06, 'epoch': 1.49} {'loss': 0.626, 'learning_rate': 3.0577346242101067e-06, 'epoch': 1.49} {'loss': 0.6058, 'learning_rate': 3.0574990145151095e-06, 'epoch': 1.49} {'loss': 0.4418, 'learning_rate': 3.057263412259631e-06, 'epoch': 1.49} {'loss': 0.4349, 'learning_rate': 3.0570278174439182e-06, 'epoch': 1.49} {'loss': 0.5526, 'learning_rate': 3.0567922300682273e-06, 'epoch': 1.49} {'loss': 0.6156, 'learning_rate': 3.0565566501328103e-06, 'epoch': 1.49} {'loss': 0.4049, 'learning_rate': 3.056321077637919e-06, 'epoch': 1.49} {'loss': 0.4409, 'learning_rate': 3.0560855125838063e-06, 'epoch': 1.49} {'loss': 0.56, 'learning_rate': 3.0558499549707275e-06, 'epoch': 1.49} {'loss': 0.56, 'learning_rate': 3.05561440479893e-06, 'epoch': 1.49} {'loss': 0.3809, 'learning_rate': 3.0553788620686687e-06, 'epoch': 1.49} {'loss': 0.4353, 'learning_rate': 3.0551433267801944e-06, 'epoch': 1.49} {'loss': 0.5587, 'learning_rate': 3.054907798933762e-06, 'epoch': 1.49} {'loss': 0.365, 'learning_rate': 3.0546722785296224e-06, 'epoch': 1.49} {'loss': 0.5267, 'learning_rate': 3.0544367655680285e-06, 'epoch': 1.49} {'loss': 0.4737, 'learning_rate': 3.0542012600492353e-06, 'epoch': 1.49} {'loss': 0.7068, 'learning_rate': 3.0539657619734887e-06, 'epoch': 1.49} {'loss': 0.5196, 'learning_rate': 3.0537302713410454e-06, 'epoch': 1.49} {'loss': 0.4215, 'learning_rate': 3.053494788152157e-06, 'epoch': 1.49} {'loss': 0.4905, 'learning_rate': 3.0532593124070754e-06, 'epoch': 1.49} {'loss': 0.4114, 'learning_rate': 3.0530238441060544e-06, 'epoch': 1.49} {'loss': 0.5508, 'learning_rate': 3.052788383249344e-06, 'epoch': 1.49} {'loss': 0.4865, 'learning_rate': 3.0525529298372023e-06, 'epoch': 1.49} {'loss': 0.5832, 'learning_rate': 3.052317483869873e-06, 'epoch': 1.49} {'loss': 0.5073, 'learning_rate': 3.0520820453476142e-06, 'epoch': 1.49} {'loss': 0.5553, 'learning_rate': 3.051846614270675e-06, 'epoch': 1.49} {'loss': 0.4593, 'learning_rate': 3.05161119063931e-06, 'epoch': 1.49} {'loss': 0.4107, 'learning_rate': 3.051375774453773e-06, 'epoch': 1.49} {'loss': 0.5707, 'learning_rate': 3.051140365714309e-06, 'epoch': 1.49} {'loss': 0.5262, 'learning_rate': 3.050904964421181e-06, 'epoch': 1.49} {'loss': 0.641, 'learning_rate': 3.0506695705746316e-06, 'epoch': 1.49} {'loss': 0.5852, 'learning_rate': 3.0504341841749173e-06, 'epoch': 1.49} {'loss': 0.528, 'learning_rate': 3.050198805222291e-06, 'epoch': 1.49} {'loss': 0.5714, 'learning_rate': 3.0499634337170035e-06, 'epoch': 1.49} {'loss': 0.4961, 'learning_rate': 3.04972806965931e-06, 'epoch': 1.49} {'loss': 0.4185, 'learning_rate': 3.0494927130494577e-06, 'epoch': 1.49} {'loss': 0.5844, 'learning_rate': 3.049257363887701e-06, 'epoch': 1.49} {'loss': 0.4871, 'learning_rate': 3.0490220221742927e-06, 'epoch': 1.49} {'loss': 0.6197, 'learning_rate': 3.048786687909484e-06, 'epoch': 1.49} {'loss': 0.6535, 'learning_rate': 3.048551361093528e-06, 'epoch': 1.49} {'loss': 0.5751, 'learning_rate': 3.0483160417266765e-06, 'epoch': 1.49} {'loss': 0.552, 'learning_rate': 3.0480807298091854e-06, 'epoch': 1.49} {'loss': 0.4753, 'learning_rate': 3.0478454253413003e-06, 'epoch': 1.49} {'loss': 0.5038, 'learning_rate': 3.047610128323276e-06, 'epoch': 1.49} {'loss': 0.4979, 'learning_rate': 3.0473748387553647e-06, 'epoch': 1.49} {'loss': 0.3929, 'learning_rate': 3.047139556637819e-06, 'epoch': 1.49} {'loss': 0.6826, 'learning_rate': 3.046904281970894e-06, 'epoch': 1.49} {'loss': 0.4613, 'learning_rate': 3.0466690147548317e-06, 'epoch': 1.49} {'loss': 0.4785, 'learning_rate': 3.046433754989898e-06, 'epoch': 1.49} {'loss': 0.4852, 'learning_rate': 3.046198502676335e-06, 'epoch': 1.49} {'loss': 0.4314, 'learning_rate': 3.0459632578143974e-06, 'epoch': 1.49} {'loss': 0.5078, 'learning_rate': 3.0457280204043383e-06, 'epoch': 1.49} {'loss': 0.571, 'learning_rate': 3.0454927904464094e-06, 'epoch': 1.49} {'loss': 0.4026, 'learning_rate': 3.0452575679408658e-06, 'epoch': 1.49} {'loss': 0.5298, 'learning_rate': 3.0450223528879496e-06, 'epoch': 1.49} {'loss': 0.5532, 'learning_rate': 3.0447871452879263e-06, 'epoch': 1.49} {'loss': 0.5193, 'learning_rate': 3.044551945141038e-06, 'epoch': 1.49} {'loss': 0.3585, 'learning_rate': 3.0443167524475405e-06, 'epoch': 1.49} {'loss': 0.6806, 'learning_rate': 3.0440815672076852e-06, 'epoch': 1.49} {'loss': 0.6427, 'learning_rate': 3.043846389421724e-06, 'epoch': 1.49} {'loss': 0.5596, 'learning_rate': 3.0436112190899127e-06, 'epoch': 1.49} {'loss': 0.5749, 'learning_rate': 3.043376056212494e-06, 'epoch': 1.49} {'loss': 0.5272, 'learning_rate': 3.0431409007897306e-06, 'epoch': 1.49} {'loss': 0.4059, 'learning_rate': 3.0429057528218674e-06, 'epoch': 1.49} {'loss': 0.5496, 'learning_rate': 3.0426706123091588e-06, 'epoch': 1.49} {'loss': 0.5137, 'learning_rate': 3.0424354792518597e-06, 'epoch': 1.49} {'loss': 0.5906, 'learning_rate': 3.042200353650212e-06, 'epoch': 1.49} {'loss': 0.5553, 'learning_rate': 3.0419652355044814e-06, 'epoch': 1.49} {'loss': 0.4948, 'learning_rate': 3.0417301248149067e-06, 'epoch': 1.49} {'loss': 0.6073, 'learning_rate': 3.041495021581753e-06, 'epoch': 1.49} {'loss': 0.4597, 'learning_rate': 3.041259925805261e-06, 'epoch': 1.49} {'loss': 0.5321, 'learning_rate': 3.041024837485688e-06, 'epoch': 1.49} {'loss': 0.4909, 'learning_rate': 3.040789756623288e-06, 'epoch': 1.49} {'loss': 0.5412, 'learning_rate': 3.040554683218303e-06, 'epoch': 1.49} {'loss': 0.453, 'learning_rate': 3.040319617270999e-06, 'epoch': 1.49} {'loss': 0.4612, 'learning_rate': 3.040084558781614e-06, 'epoch': 1.49} {'loss': 0.5201, 'learning_rate': 3.039849507750413e-06, 'epoch': 1.49} {'loss': 0.4843, 'learning_rate': 3.039614464177638e-06, 'epoch': 1.49} {'loss': 0.4462, 'learning_rate': 3.039379428063545e-06, 'epoch': 1.49} {'loss': 0.44, 'learning_rate': 3.039144399408387e-06, 'epoch': 1.49} {'loss': 0.6558, 'learning_rate': 3.038909378212409e-06, 'epoch': 1.49} {'loss': 0.4507, 'learning_rate': 3.0386743644758733e-06, 'epoch': 1.49} {'loss': 0.5795, 'learning_rate': 3.03843935819902e-06, 'epoch': 1.49} {'loss': 0.5857, 'learning_rate': 3.038204359382114e-06, 'epoch': 1.49} {'loss': 0.5045, 'learning_rate': 3.0379693680253972e-06, 'epoch': 1.49} {'loss': 0.5755, 'learning_rate': 3.037734384129125e-06, 'epoch': 1.49} {'loss': 0.592, 'learning_rate': 3.0374994076935516e-06, 'epoch': 1.49} {'loss': 0.5216, 'learning_rate': 3.037264438718919e-06, 'epoch': 1.49} {'loss': 0.475, 'learning_rate': 3.037029477205493e-06, 'epoch': 1.49} {'loss': 0.5593, 'learning_rate': 3.0367945231535125e-06, 'epoch': 1.49} {'loss': 0.3707, 'learning_rate': 3.0365595765632407e-06, 'epoch': 1.49} {'loss': 0.488, 'learning_rate': 3.036324637434921e-06, 'epoch': 1.49} {'loss': 0.5829, 'learning_rate': 3.0360897057688076e-06, 'epoch': 1.49} {'loss': 0.6045, 'learning_rate': 3.035854781565155e-06, 'epoch': 1.49} {'loss': 0.481, 'learning_rate': 3.0356198648242074e-06, 'epoch': 1.49} {'loss': 0.3973, 'learning_rate': 3.0353849555462278e-06, 'epoch': 1.49} {'loss': 0.5493, 'learning_rate': 3.0351500537314593e-06, 'epoch': 1.49} {'loss': 0.6085, 'learning_rate': 3.034915159380155e-06, 'epoch': 1.49} {'loss': 0.5053, 'learning_rate': 3.0346802724925682e-06, 'epoch': 1.49} {'loss': 0.3913, 'learning_rate': 3.03444539306895e-06, 'epoch': 1.49} {'loss': 0.3771, 'learning_rate': 3.034210521109556e-06, 'epoch': 1.49} {'loss': 0.472, 'learning_rate': 3.0339756566146273e-06, 'epoch': 1.49} {'loss': 0.4196, 'learning_rate': 3.033740799584429e-06, 'epoch': 1.49} {'loss': 0.5704, 'learning_rate': 3.0335059500192023e-06, 'epoch': 1.49} {'loss': 0.5128, 'learning_rate': 3.0332711079192033e-06, 'epoch': 1.49} {'loss': 0.4146, 'learning_rate': 3.033036273284683e-06, 'epoch': 1.49} {'loss': 0.5675, 'learning_rate': 3.032801446115894e-06, 'epoch': 1.49} {'loss': 0.5351, 'learning_rate': 3.0325666264130893e-06, 'epoch': 1.49} {'loss': 0.4311, 'learning_rate': 3.0323318141765112e-06, 'epoch': 1.49} {'loss': 0.5124, 'learning_rate': 3.032097009406426e-06, 'epoch': 1.49} {'loss': 0.4733, 'learning_rate': 3.031862212103075e-06, 'epoch': 1.49} {'loss': 0.5608, 'learning_rate': 3.031627422266711e-06, 'epoch': 1.49} {'loss': 0.4718, 'learning_rate': 3.031392639897588e-06, 'epoch': 1.49} {'loss': 0.5005, 'learning_rate': 3.0311578649959574e-06, 'epoch': 1.49} {'loss': 0.4126, 'learning_rate': 3.030923097562072e-06, 'epoch': 1.49} {'loss': 0.3938, 'learning_rate': 3.0306883375961795e-06, 'epoch': 1.49} {'loss': 0.5578, 'learning_rate': 3.030453585098533e-06, 'epoch': 1.49} {'loss': 0.4423, 'learning_rate': 3.0302188400693842e-06, 'epoch': 1.49} {'loss': 0.5438, 'learning_rate': 3.029984102508985e-06, 'epoch': 1.49} {'loss': 0.4611, 'learning_rate': 3.029749372417591e-06, 'epoch': 1.49} {'loss': 0.5503, 'learning_rate': 3.029514649795442e-06, 'epoch': 1.49} {'loss': 0.5183, 'learning_rate': 3.0292799346428038e-06, 'epoch': 1.49} {'loss': 0.4358, 'learning_rate': 3.0290452269599192e-06, 'epoch': 1.49} {'loss': 0.4701, 'learning_rate': 3.0288105267470403e-06, 'epoch': 1.49} {'loss': 0.4148, 'learning_rate': 3.0285758340044214e-06, 'epoch': 1.49} {'loss': 0.5153, 'learning_rate': 3.028341148732312e-06, 'epoch': 1.49} {'loss': 0.5431, 'learning_rate': 3.028106470930967e-06, 'epoch': 1.49} {'loss': 0.5957, 'learning_rate': 3.0278718006006303e-06, 'epoch': 1.49} {'loss': 0.6726, 'learning_rate': 3.0276371377415638e-06, 'epoch': 1.49} {'loss': 0.6687, 'learning_rate': 3.0274024823540093e-06, 'epoch': 1.49} {'loss': 0.4301, 'learning_rate': 3.027167834438224e-06, 'epoch': 1.49} {'loss': 0.7454, 'learning_rate': 3.0269331939944567e-06, 'epoch': 1.49} {'loss': 0.5121, 'learning_rate': 3.026698561022959e-06, 'epoch': 1.49} {'loss': 0.5212, 'learning_rate': 3.0264639355239876e-06, 'epoch': 1.49} {'loss': 0.5943, 'learning_rate': 3.0262293174977863e-06, 'epoch': 1.49} {'loss': 0.4617, 'learning_rate': 3.0259947069446107e-06, 'epoch': 1.49} {'loss': 0.5947, 'learning_rate': 3.025760103864709e-06, 'epoch': 1.49} {'loss': 0.5267, 'learning_rate': 3.0255255082583356e-06, 'epoch': 1.49} {'loss': 0.5611, 'learning_rate': 3.0252909201257418e-06, 'epoch': 1.49} {'loss': 0.4822, 'learning_rate': 3.0250563394671782e-06, 'epoch': 1.49} {'loss': 0.5508, 'learning_rate': 3.0248217662828995e-06, 'epoch': 1.49} {'loss': 0.418, 'learning_rate': 3.024587200573149e-06, 'epoch': 1.49} {'loss': 0.5323, 'learning_rate': 3.0243526423381853e-06, 'epoch': 1.49} {'loss': 0.5184, 'learning_rate': 3.0241180915782555e-06, 'epoch': 1.49} {'loss': 0.5206, 'learning_rate': 3.0238835482936134e-06, 'epoch': 1.49} {'loss': 0.4352, 'learning_rate': 3.0236490124845097e-06, 'epoch': 1.49} {'loss': 0.4667, 'learning_rate': 3.023414484151196e-06, 'epoch': 1.49} {'loss': 0.4683, 'learning_rate': 3.0231799632939263e-06, 'epoch': 1.49} {'loss': 0.5631, 'learning_rate': 3.0229454499129464e-06, 'epoch': 1.49} {'loss': 0.5295, 'learning_rate': 3.022710944008509e-06, 'epoch': 1.49} {'loss': 0.3857, 'learning_rate': 3.0224764455808675e-06, 'epoch': 1.49} {'loss': 0.5145, 'learning_rate': 3.0222419546302717e-06, 'epoch': 1.49} {'loss': 0.383, 'learning_rate': 3.0220074711569736e-06, 'epoch': 1.49} {'loss': 0.441, 'learning_rate': 3.0217729951612272e-06, 'epoch': 1.49} {'loss': 0.5331, 'learning_rate': 3.0215385266432783e-06, 'epoch': 1.49} {'loss': 0.532, 'learning_rate': 3.0213040656033797e-06, 'epoch': 1.49} {'loss': 0.5055, 'learning_rate': 3.021069612041785e-06, 'epoch': 1.49} {'loss': 0.5564, 'learning_rate': 3.020835165958743e-06, 'epoch': 1.49} {'loss': 0.52, 'learning_rate': 3.0206007273545067e-06, 'epoch': 1.49} {'loss': 0.3896, 'learning_rate': 3.0203662962293266e-06, 'epoch': 1.49} {'loss': 0.4569, 'learning_rate': 3.020131872583457e-06, 'epoch': 1.49} {'loss': 0.4879, 'learning_rate': 3.0198974564171423e-06, 'epoch': 1.49} {'loss': 0.4741, 'learning_rate': 3.0196630477306387e-06, 'epoch': 1.49} {'loss': 0.5528, 'learning_rate': 3.019428646524195e-06, 'epoch': 1.49} {'loss': 0.5226, 'learning_rate': 3.0191942527980644e-06, 'epoch': 1.49} {'loss': 0.5625, 'learning_rate': 3.0189598665525e-06, 'epoch': 1.49} {'loss': 0.5572, 'learning_rate': 3.018725487787744e-06, 'epoch': 1.49} {'loss': 0.4773, 'learning_rate': 3.01849111650406e-06, 'epoch': 1.49} {'loss': 0.4863, 'learning_rate': 3.018256752701689e-06, 'epoch': 1.49} {'loss': 0.5738, 'learning_rate': 3.0180223963808875e-06, 'epoch': 1.49} {'loss': 0.4687, 'learning_rate': 3.0177880475419042e-06, 'epoch': 1.49} {'loss': 0.5753, 'learning_rate': 3.0175537061849913e-06, 'epoch': 1.49} {'loss': 0.6551, 'learning_rate': 3.0173193723104023e-06, 'epoch': 1.49} {'loss': 0.6297, 'learning_rate': 3.017085045918381e-06, 'epoch': 1.49} {'loss': 0.6795, 'learning_rate': 3.0168507270091886e-06, 'epoch': 1.49} {'loss': 0.5676, 'learning_rate': 3.016616415583068e-06, 'epoch': 1.49} {'loss': 0.5583, 'learning_rate': 3.0163821116402727e-06, 'epoch': 1.49} {'loss': 0.5622, 'learning_rate': 3.016147815181055e-06, 'epoch': 1.49} {'loss': 0.5652, 'learning_rate': 3.015913526205665e-06, 'epoch': 1.49} {'loss': 0.4529, 'learning_rate': 3.015679244714357e-06, 'epoch': 1.49} {'loss': 0.5787, 'learning_rate': 3.015444970707373e-06, 'epoch': 1.49} {'loss': 0.4242, 'learning_rate': 3.0152107041849766e-06, 'epoch': 1.49} {'loss': 0.5387, 'learning_rate': 3.0149764451474095e-06, 'epoch': 1.49} {'loss': 0.4569, 'learning_rate': 3.014742193594925e-06, 'epoch': 1.49} {'loss': 0.5008, 'learning_rate': 3.0145079495277774e-06, 'epoch': 1.49} {'loss': 0.5352, 'learning_rate': 3.0142737129462095e-06, 'epoch': 1.49} {'loss': 0.6208, 'learning_rate': 3.014039483850484e-06, 'epoch': 1.49} {'loss': 0.5579, 'learning_rate': 3.0138052622408387e-06, 'epoch': 1.49} {'loss': 0.5218, 'learning_rate': 3.0135710481175384e-06, 'epoch': 1.49} {'loss': 0.4621, 'learning_rate': 3.013336841480824e-06, 'epoch': 1.49} {'loss': 0.5071, 'learning_rate': 3.0131026423309507e-06, 'epoch': 1.49} {'loss': 0.5521, 'learning_rate': 3.0128684506681706e-06, 'epoch': 1.49} {'loss': 0.4554, 'learning_rate': 3.0126342664927264e-06, 'epoch': 1.49} {'loss': 0.6814, 'learning_rate': 3.012400089804882e-06, 'epoch': 1.49} {'loss': 0.4628, 'learning_rate': 3.0121659206048783e-06, 'epoch': 1.49} {'loss': 0.452, 'learning_rate': 3.0119317588929685e-06, 'epoch': 1.49} {'loss': 0.4362, 'learning_rate': 3.0116976046694056e-06, 'epoch': 1.49} {'loss': 0.541, 'learning_rate': 3.0114634579344393e-06, 'epoch': 1.49} {'loss': 0.4968, 'learning_rate': 3.0112293186883234e-06, 'epoch': 1.49} {'loss': 0.5668, 'learning_rate': 3.0109951869313e-06, 'epoch': 1.49} {'loss': 0.5954, 'learning_rate': 3.010761062663633e-06, 'epoch': 1.49} {'loss': 0.4431, 'learning_rate': 3.0105269458855624e-06, 'epoch': 1.49} {'loss': 0.6038, 'learning_rate': 3.010292836597344e-06, 'epoch': 1.49} {'loss': 0.4698, 'learning_rate': 3.010058734799226e-06, 'epoch': 1.49} {'loss': 0.3993, 'learning_rate': 3.009824640491462e-06, 'epoch': 1.49} {'loss': 0.4476, 'learning_rate': 3.0095905536743054e-06, 'epoch': 1.49} {'loss': 0.519, 'learning_rate': 3.0093564743479965e-06, 'epoch': 1.49} {'loss': 0.4725, 'learning_rate': 3.0091224025127995e-06, 'epoch': 1.49} {'loss': 0.5389, 'learning_rate': 3.008888338168956e-06, 'epoch': 1.49} {'loss': 0.5322, 'learning_rate': 3.0086542813167185e-06, 'epoch': 1.49} {'loss': 0.3897, 'learning_rate': 3.0084202319563426e-06, 'epoch': 1.49} {'loss': 0.5838, 'learning_rate': 3.0081861900880693e-06, 'epoch': 1.49} {'loss': 0.4518, 'learning_rate': 3.007952155712163e-06, 'epoch': 1.49} {'loss': 0.5505, 'learning_rate': 3.007718128828859e-06, 'epoch': 1.49} {'loss': 0.6073, 'learning_rate': 3.0074841094384233e-06, 'epoch': 1.49} {'loss': 0.5462, 'learning_rate': 3.0072500975410966e-06, 'epoch': 1.49} {'loss': 0.4037, 'learning_rate': 3.0070160931371317e-06, 'epoch': 1.49} {'loss': 0.5174, 'learning_rate': 3.0067820962267833e-06, 'epoch': 1.49} {'loss': 0.3495, 'learning_rate': 3.0065481068102943e-06, 'epoch': 1.49} {'loss': 0.3343, 'learning_rate': 3.0063141248879246e-06, 'epoch': 1.49} {'loss': 0.5931, 'learning_rate': 3.0060801504599157e-06, 'epoch': 1.49} {'loss': 0.5128, 'learning_rate': 3.0058461835265284e-06, 'epoch': 1.49} {'loss': 0.4556, 'learning_rate': 3.005612224088006e-06, 'epoch': 1.49} {'loss': 0.6029, 'learning_rate': 3.0053782721446e-06, 'epoch': 1.49} {'loss': 0.5428, 'learning_rate': 3.0051443276965662e-06, 'epoch': 1.49} {'loss': 0.5212, 'learning_rate': 3.0049103907441456e-06, 'epoch': 1.49} {'loss': 0.4369, 'learning_rate': 3.0046764612876023e-06, 'epoch': 1.49} {'loss': 0.4282, 'learning_rate': 3.0044425393271714e-06, 'epoch': 1.49} {'loss': 0.5358, 'learning_rate': 3.0042086248631184e-06, 'epoch': 1.49} {'loss': 0.4838, 'learning_rate': 3.0039747178956844e-06, 'epoch': 1.49} {'loss': 0.6545, 'learning_rate': 3.003740818425124e-06, 'epoch': 1.49} {'loss': 0.5856, 'learning_rate': 3.003506926451688e-06, 'epoch': 1.49} {'loss': 0.5711, 'learning_rate': 3.0032730419756206e-06, 'epoch': 1.49} {'loss': 0.4244, 'learning_rate': 3.0030391649971836e-06, 'epoch': 1.49} {'loss': 0.4213, 'learning_rate': 3.0028052955166153e-06, 'epoch': 1.49} {'loss': 0.3725, 'learning_rate': 3.0025714335341795e-06, 'epoch': 1.49} {'loss': 0.5942, 'learning_rate': 3.0023375790501165e-06, 'epoch': 1.5} {'loss': 0.5095, 'learning_rate': 3.0021037320646794e-06, 'epoch': 1.5} {'loss': 0.6426, 'learning_rate': 3.001869892578124e-06, 'epoch': 1.5} {'loss': 0.4505, 'learning_rate': 3.0016360605906904e-06, 'epoch': 1.5} {'loss': 0.698, 'learning_rate': 3.0014022361026407e-06, 'epoch': 1.5} {'loss': 0.6194, 'learning_rate': 3.001168419114218e-06, 'epoch': 1.5} {'loss': 0.5092, 'learning_rate': 3.000934609625674e-06, 'epoch': 1.5} {'loss': 0.4412, 'learning_rate': 3.0007008076372614e-06, 'epoch': 1.5} {'loss': 0.4796, 'learning_rate': 3.00046701314923e-06, 'epoch': 1.5} {'loss': 0.5572, 'learning_rate': 3.0002332261618317e-06, 'epoch': 1.5} {'loss': 0.6375, 'learning_rate': 2.9999994466753093e-06, 'epoch': 1.5} {'loss': 0.6197, 'learning_rate': 2.9997656746899264e-06, 'epoch': 1.5} {'loss': 0.615, 'learning_rate': 2.9995319102059228e-06, 'epoch': 1.5} {'loss': 0.5837, 'learning_rate': 2.999298153223552e-06, 'epoch': 1.5} {'loss': 0.4914, 'learning_rate': 2.999064403743066e-06, 'epoch': 1.5} {'loss': 0.5114, 'learning_rate': 2.9988306617647133e-06, 'epoch': 1.5} {'loss': 0.6298, 'learning_rate': 2.9985969272887492e-06, 'epoch': 1.5} {'loss': 0.4502, 'learning_rate': 2.998363200315417e-06, 'epoch': 1.5} {'loss': 0.3869, 'learning_rate': 2.998129480844971e-06, 'epoch': 1.5} {'loss': 0.4553, 'learning_rate': 2.9978957688776613e-06, 'epoch': 1.5} {'loss': 0.4693, 'learning_rate': 2.9976620644137376e-06, 'epoch': 1.5} {'loss': 0.6466, 'learning_rate': 2.9974283674534523e-06, 'epoch': 1.5} {'loss': 0.5093, 'learning_rate': 2.997194677997053e-06, 'epoch': 1.5} {'loss': 0.5888, 'learning_rate': 2.9969609960447956e-06, 'epoch': 1.5} {'loss': 0.4882, 'learning_rate': 2.9967273215969227e-06, 'epoch': 1.5} {'loss': 0.5003, 'learning_rate': 2.9964936546536893e-06, 'epoch': 1.5} {'loss': 0.5473, 'learning_rate': 2.996259995215345e-06, 'epoch': 1.5} {'loss': 0.6045, 'learning_rate': 2.99602634328214e-06, 'epoch': 1.5} {'loss': 0.5371, 'learning_rate': 2.9957926988543252e-06, 'epoch': 1.5} {'loss': 0.4513, 'learning_rate': 2.9955590619321507e-06, 'epoch': 1.5} {'loss': 0.4187, 'learning_rate': 2.99532543251587e-06, 'epoch': 1.5} {'loss': 0.4629, 'learning_rate': 2.995091810605727e-06, 'epoch': 1.5} {'loss': 0.455, 'learning_rate': 2.9948581962019753e-06, 'epoch': 1.5} {'loss': 0.6489, 'learning_rate': 2.994624589304865e-06, 'epoch': 1.5} {'loss': 0.4026, 'learning_rate': 2.9943909899146472e-06, 'epoch': 1.5} {'loss': 0.483, 'learning_rate': 2.9941573980315718e-06, 'epoch': 1.5} {'loss': 0.4806, 'learning_rate': 2.993923813655891e-06, 'epoch': 1.5} {'loss': 0.5488, 'learning_rate': 2.9936902367878516e-06, 'epoch': 1.5} {'loss': 0.5706, 'learning_rate': 2.9934566674277053e-06, 'epoch': 1.5} {'loss': 0.4614, 'learning_rate': 2.9932231055757023e-06, 'epoch': 1.5} {'loss': 0.3196, 'learning_rate': 2.992989551232093e-06, 'epoch': 1.5} {'loss': 0.5192, 'learning_rate': 2.992756004397127e-06, 'epoch': 1.5} {'loss': 0.4198, 'learning_rate': 2.9925224650710595e-06, 'epoch': 1.5} {'loss': 0.3786, 'learning_rate': 2.9922889332541337e-06, 'epoch': 1.5} {'loss': 0.5423, 'learning_rate': 2.9920554089466027e-06, 'epoch': 1.5} {'loss': 0.5482, 'learning_rate': 2.9918218921487162e-06, 'epoch': 1.5} {'loss': 0.4722, 'learning_rate': 2.991588382860725e-06, 'epoch': 1.5} {'loss': 0.4729, 'learning_rate': 2.991354881082881e-06, 'epoch': 1.5} {'loss': 0.4401, 'learning_rate': 2.991121386815431e-06, 'epoch': 1.5} {'loss': 0.505, 'learning_rate': 2.990887900058631e-06, 'epoch': 1.5} {'loss': 0.4795, 'learning_rate': 2.990654420812724e-06, 'epoch': 1.5} {'loss': 0.4473, 'learning_rate': 2.9904209490779633e-06, 'epoch': 1.5} {'loss': 0.3942, 'learning_rate': 2.9901874848545987e-06, 'epoch': 1.5} {'loss': 0.5734, 'learning_rate': 2.989954028142882e-06, 'epoch': 1.5} {'loss': 0.5656, 'learning_rate': 2.9897205789430618e-06, 'epoch': 1.5} {'loss': 0.5234, 'learning_rate': 2.989487137255391e-06, 'epoch': 1.5} {'loss': 0.5932, 'learning_rate': 2.989253703080115e-06, 'epoch': 1.5} {'loss': 0.3622, 'learning_rate': 2.989020276417487e-06, 'epoch': 1.5} {'loss': 0.4341, 'learning_rate': 2.9887868572677557e-06, 'epoch': 1.5} {'loss': 0.4348, 'learning_rate': 2.9885534456311726e-06, 'epoch': 1.5} {'loss': 0.5225, 'learning_rate': 2.9883200415079873e-06, 'epoch': 1.5} {'loss': 0.6165, 'learning_rate': 2.988086644898449e-06, 'epoch': 1.5} {'loss': 0.5537, 'learning_rate': 2.987853255802813e-06, 'epoch': 1.5} {'loss': 0.5604, 'learning_rate': 2.9876198742213215e-06, 'epoch': 1.5} {'loss': 0.5106, 'learning_rate': 2.987386500154229e-06, 'epoch': 1.5} {'loss': 0.5034, 'learning_rate': 2.9871531336017836e-06, 'epoch': 1.5} {'loss': 0.5468, 'learning_rate': 2.9869197745642375e-06, 'epoch': 1.5} {'loss': 0.5372, 'learning_rate': 2.986686423041839e-06, 'epoch': 1.5} {'loss': 0.4731, 'learning_rate': 2.9864530790348387e-06, 'epoch': 1.5} {'loss': 0.5552, 'learning_rate': 2.986219742543491e-06, 'epoch': 1.5} {'loss': 0.5897, 'learning_rate': 2.9859864135680394e-06, 'epoch': 1.5} {'loss': 0.4966, 'learning_rate': 2.9857530921087353e-06, 'epoch': 1.5} {'loss': 0.5543, 'learning_rate': 2.9855197781658296e-06, 'epoch': 1.5} {'loss': 0.5252, 'learning_rate': 2.9852864717395735e-06, 'epoch': 1.5} {'loss': 0.5946, 'learning_rate': 2.985053172830218e-06, 'epoch': 1.5} {'loss': 0.4947, 'learning_rate': 2.984819881438006e-06, 'epoch': 1.5} {'loss': 0.5545, 'learning_rate': 2.9845865975631983e-06, 'epoch': 1.5} {'loss': 0.5884, 'learning_rate': 2.9843533212060363e-06, 'epoch': 1.5} {'loss': 0.5511, 'learning_rate': 2.9841200523667736e-06, 'epoch': 1.5} {'loss': 0.6221, 'learning_rate': 2.983886791045658e-06, 'epoch': 1.5} {'loss': 0.4955, 'learning_rate': 2.983653537242942e-06, 'epoch': 1.5} {'loss': 0.4081, 'learning_rate': 2.983420290958877e-06, 'epoch': 1.5} {'loss': 0.6587, 'learning_rate': 2.9831870521937055e-06, 'epoch': 1.5} {'loss': 0.5243, 'learning_rate': 2.982953820947687e-06, 'epoch': 1.5} {'loss': 0.4751, 'learning_rate': 2.982720597221065e-06, 'epoch': 1.5} {'loss': 0.4864, 'learning_rate': 2.982487381014091e-06, 'epoch': 1.5} {'loss': 0.5457, 'learning_rate': 2.9822541723270136e-06, 'epoch': 1.5} {'loss': 0.4641, 'learning_rate': 2.9820209711600858e-06, 'epoch': 1.5} {'loss': 0.5307, 'learning_rate': 2.9817877775135595e-06, 'epoch': 1.5} {'loss': 0.5293, 'learning_rate': 2.981554591387673e-06, 'epoch': 1.5} {'loss': 0.5222, 'learning_rate': 2.981321412782692e-06, 'epoch': 1.5} {'loss': 0.7468, 'learning_rate': 2.9810882416988553e-06, 'epoch': 1.5} {'loss': 0.4571, 'learning_rate': 2.9808550781364155e-06, 'epoch': 1.5} {'loss': 0.4827, 'learning_rate': 2.9806219220956258e-06, 'epoch': 1.5} {'loss': 0.4277, 'learning_rate': 2.980388773576728e-06, 'epoch': 1.5} {'loss': 0.5067, 'learning_rate': 2.980155632579983e-06, 'epoch': 1.5} {'loss': 0.573, 'learning_rate': 2.9799224991056276e-06, 'epoch': 1.5} {'loss': 0.5854, 'learning_rate': 2.9796893731539266e-06, 'epoch': 1.5} {'loss': 0.478, 'learning_rate': 2.979456254725118e-06, 'epoch': 1.5} {'loss': 0.5148, 'learning_rate': 2.9792231438194565e-06, 'epoch': 1.5} {'loss': 0.5291, 'learning_rate': 2.978990040437193e-06, 'epoch': 1.5} {'loss': 0.3883, 'learning_rate': 2.9787569445785704e-06, 'epoch': 1.5} {'loss': 0.472, 'learning_rate': 2.978523856243849e-06, 'epoch': 1.5} {'loss': 0.5331, 'learning_rate': 2.978290775433266e-06, 'epoch': 1.5} {'loss': 0.5723, 'learning_rate': 2.9780577021470856e-06, 'epoch': 1.5} {'loss': 0.5034, 'learning_rate': 2.9778246363855466e-06, 'epoch': 1.5} {'loss': 0.5308, 'learning_rate': 2.9775915781489027e-06, 'epoch': 1.5} {'loss': 0.4281, 'learning_rate': 2.977358527437406e-06, 'epoch': 1.5} {'loss': 0.4843, 'learning_rate': 2.9771254842512964e-06, 'epoch': 1.5} {'loss': 0.5149, 'learning_rate': 2.976892448590838e-06, 'epoch': 1.5} {'loss': 0.4883, 'learning_rate': 2.9766594204562704e-06, 'epoch': 1.5} {'loss': 0.3974, 'learning_rate': 2.976426399847845e-06, 'epoch': 1.5} {'loss': 0.5515, 'learning_rate': 2.9761933867658134e-06, 'epoch': 1.5} {'loss': 0.4752, 'learning_rate': 2.9759603812104243e-06, 'epoch': 1.5} {'loss': 0.5186, 'learning_rate': 2.9757273831819313e-06, 'epoch': 1.5} {'loss': 0.4727, 'learning_rate': 2.9754943926805733e-06, 'epoch': 1.5} {'loss': 0.5226, 'learning_rate': 2.9752614097066133e-06, 'epoch': 1.5} {'loss': 0.4635, 'learning_rate': 2.975028434260292e-06, 'epoch': 1.5} {'loss': 0.3632, 'learning_rate': 2.9747954663418622e-06, 'epoch': 1.5} {'loss': 0.5587, 'learning_rate': 2.9745625059515726e-06, 'epoch': 1.5} {'loss': 0.48, 'learning_rate': 2.9743295530896733e-06, 'epoch': 1.5} {'loss': 0.5729, 'learning_rate': 2.974096607756417e-06, 'epoch': 1.5} {'loss': 0.4729, 'learning_rate': 2.973863669952044e-06, 'epoch': 1.5} {'loss': 0.6329, 'learning_rate': 2.973630739676817e-06, 'epoch': 1.5} {'loss': 0.395, 'learning_rate': 2.973397816930975e-06, 'epoch': 1.5} {'loss': 0.6118, 'learning_rate': 2.9731649017147724e-06, 'epoch': 1.5} {'loss': 0.5863, 'learning_rate': 2.9729319940284605e-06, 'epoch': 1.5} {'loss': 0.4536, 'learning_rate': 2.97269909387228e-06, 'epoch': 1.5} {'loss': 0.5126, 'learning_rate': 2.972466201246492e-06, 'epoch': 1.5} {'loss': 0.5922, 'learning_rate': 2.9722333161513362e-06, 'epoch': 1.5} {'loss': 0.4265, 'learning_rate': 2.9720004385870715e-06, 'epoch': 1.5} {'loss': 0.5885, 'learning_rate': 2.9717675685539402e-06, 'epoch': 1.5} {'loss': 0.5295, 'learning_rate': 2.9715347060521948e-06, 'epoch': 1.5} {'loss': 0.5174, 'learning_rate': 2.9713018510820867e-06, 'epoch': 1.5} {'loss': 0.4663, 'learning_rate': 2.971069003643856e-06, 'epoch': 1.5} {'loss': 0.4869, 'learning_rate': 2.970836163737767e-06, 'epoch': 1.5} {'loss': 0.46, 'learning_rate': 2.9706033313640547e-06, 'epoch': 1.5} {'loss': 0.3961, 'learning_rate': 2.9703705065229814e-06, 'epoch': 1.5} {'loss': 0.5086, 'learning_rate': 2.970137689214788e-06, 'epoch': 1.5} {'loss': 0.5387, 'learning_rate': 2.9699048794397255e-06, 'epoch': 1.5} {'loss': 0.5739, 'learning_rate': 2.969672077198048e-06, 'epoch': 1.5} {'loss': 0.3762, 'learning_rate': 2.9694392824899953e-06, 'epoch': 1.5} {'loss': 0.4927, 'learning_rate': 2.9692064953158296e-06, 'epoch': 1.5} {'loss': 0.5002, 'learning_rate': 2.9689737156757903e-06, 'epoch': 1.5} {'loss': 0.4942, 'learning_rate': 2.96874094357013e-06, 'epoch': 1.5} {'loss': 0.4513, 'learning_rate': 2.968508178999099e-06, 'epoch': 1.5} {'loss': 0.4937, 'learning_rate': 2.968275421962945e-06, 'epoch': 1.5} {'loss': 0.4696, 'learning_rate': 2.9680426724619226e-06, 'epoch': 1.5} {'loss': 0.4339, 'learning_rate': 2.9678099304962703e-06, 'epoch': 1.5} {'loss': 0.4892, 'learning_rate': 2.9675771960662516e-06, 'epoch': 1.5} {'loss': 0.4961, 'learning_rate': 2.9673444691721055e-06, 'epoch': 1.5} {'loss': 0.5665, 'learning_rate': 2.9671117498140835e-06, 'epoch': 1.5} {'loss': 0.5673, 'learning_rate': 2.9668790379924363e-06, 'epoch': 1.5} {'loss': 0.3883, 'learning_rate': 2.9666463337074126e-06, 'epoch': 1.5} {'loss': 0.6171, 'learning_rate': 2.9664136369592665e-06, 'epoch': 1.5} {'loss': 0.6404, 'learning_rate': 2.966180947748236e-06, 'epoch': 1.5} {'loss': 0.5902, 'learning_rate': 2.965948266074583e-06, 'epoch': 1.5} {'loss': 0.5394, 'learning_rate': 2.9657155919385495e-06, 'epoch': 1.5} {'loss': 0.4899, 'learning_rate': 2.965482925340386e-06, 'epoch': 1.5} {'loss': 0.5613, 'learning_rate': 2.965250266280343e-06, 'epoch': 1.5} {'loss': 0.5746, 'learning_rate': 2.9650176147586685e-06, 'epoch': 1.5} {'loss': 0.4239, 'learning_rate': 2.964784970775616e-06, 'epoch': 1.5} {'loss': 0.5389, 'learning_rate': 2.9645523343314275e-06, 'epoch': 1.5} {'loss': 0.5992, 'learning_rate': 2.9643197054263574e-06, 'epoch': 1.5} {'loss': 0.4256, 'learning_rate': 2.964087084060653e-06, 'epoch': 1.5} {'loss': 0.5214, 'learning_rate': 2.963854470234565e-06, 'epoch': 1.5} {'loss': 0.5479, 'learning_rate': 2.9636218639483416e-06, 'epoch': 1.5} {'loss': 0.4442, 'learning_rate': 2.9633892652022323e-06, 'epoch': 1.5} {'loss': 0.4939, 'learning_rate': 2.963156673996489e-06, 'epoch': 1.5} {'loss': 0.459, 'learning_rate': 2.962924090331356e-06, 'epoch': 1.5} {'loss': 0.5153, 'learning_rate': 2.9626915142070855e-06, 'epoch': 1.5} {'loss': 0.3662, 'learning_rate': 2.9624589456239262e-06, 'epoch': 1.5} {'loss': 0.5064, 'learning_rate': 2.9622263845821266e-06, 'epoch': 1.5} {'loss': 0.6139, 'learning_rate': 2.9619938310819364e-06, 'epoch': 1.5} {'loss': 0.5268, 'learning_rate': 2.9617612851236056e-06, 'epoch': 1.5} {'loss': 0.411, 'learning_rate': 2.9615287467073863e-06, 'epoch': 1.5} {'loss': 0.569, 'learning_rate': 2.96129621583352e-06, 'epoch': 1.5} {'loss': 0.4164, 'learning_rate': 2.961063692502261e-06, 'epoch': 1.5} {'loss': 0.5622, 'learning_rate': 2.9608311767138575e-06, 'epoch': 1.5} {'loss': 0.5516, 'learning_rate': 2.960598668468558e-06, 'epoch': 1.5} {'loss': 0.5302, 'learning_rate': 2.960366167766613e-06, 'epoch': 1.5} {'loss': 0.4027, 'learning_rate': 2.9601336746082745e-06, 'epoch': 1.5} {'loss': 0.4906, 'learning_rate': 2.9599011889937834e-06, 'epoch': 1.5} {'loss': 0.3472, 'learning_rate': 2.9596687109233947e-06, 'epoch': 1.5} {'loss': 0.5928, 'learning_rate': 2.9594362403973564e-06, 'epoch': 1.5} {'loss': 0.5919, 'learning_rate': 2.9592037774159178e-06, 'epoch': 1.5} {'loss': 0.4872, 'learning_rate': 2.958971321979328e-06, 'epoch': 1.5} {'loss': 0.4218, 'learning_rate': 2.9587388740878355e-06, 'epoch': 1.5} {'loss': 0.5431, 'learning_rate': 2.9585064337416926e-06, 'epoch': 1.5} {'loss': 0.3676, 'learning_rate': 2.9582740009411436e-06, 'epoch': 1.5} {'loss': 0.6046, 'learning_rate': 2.958041575686439e-06, 'epoch': 1.5} {'loss': 0.4516, 'learning_rate': 2.957809157977828e-06, 'epoch': 1.5} {'loss': 0.5844, 'learning_rate': 2.9575767478155605e-06, 'epoch': 1.5} {'loss': 0.6404, 'learning_rate': 2.9573443451998874e-06, 'epoch': 1.5} {'loss': 0.5289, 'learning_rate': 2.9571119501310495e-06, 'epoch': 1.5} {'loss': 0.4593, 'learning_rate': 2.9568795626093095e-06, 'epoch': 1.5} {'loss': 0.4962, 'learning_rate': 2.956647182634904e-06, 'epoch': 1.5} {'loss': 0.4619, 'learning_rate': 2.956414810208087e-06, 'epoch': 1.5} {'loss': 0.5293, 'learning_rate': 2.956182445329108e-06, 'epoch': 1.5} {'loss': 0.5012, 'learning_rate': 2.955950087998215e-06, 'epoch': 1.5} {'loss': 0.5107, 'learning_rate': 2.9557177382156598e-06, 'epoch': 1.5} {'loss': 0.4053, 'learning_rate': 2.9554853959816866e-06, 'epoch': 1.5} {'loss': 0.4975, 'learning_rate': 2.9552530612965456e-06, 'epoch': 1.5} {'loss': 0.4988, 'learning_rate': 2.9550207341604875e-06, 'epoch': 1.5} {'loss': 0.5186, 'learning_rate': 2.9547884145737604e-06, 'epoch': 1.5} {'loss': 0.6017, 'learning_rate': 2.954556102536613e-06, 'epoch': 1.5} {'loss': 0.528, 'learning_rate': 2.9543237980492956e-06, 'epoch': 1.5} {'loss': 0.5453, 'learning_rate': 2.9540915011120584e-06, 'epoch': 1.5} {'loss': 0.5846, 'learning_rate': 2.953859211725145e-06, 'epoch': 1.5} {'loss': 0.5226, 'learning_rate': 2.9536269298888075e-06, 'epoch': 1.5} {'loss': 0.5128, 'learning_rate': 2.9533946556032943e-06, 'epoch': 1.5} {'loss': 0.5182, 'learning_rate': 2.9531623888688554e-06, 'epoch': 1.5} {'loss': 0.5163, 'learning_rate': 2.9529301296857427e-06, 'epoch': 1.5} {'loss': 0.6045, 'learning_rate': 2.952697878054194e-06, 'epoch': 1.5} {'loss': 0.4915, 'learning_rate': 2.952465633974472e-06, 'epoch': 1.5} {'loss': 0.5926, 'learning_rate': 2.9522333974468164e-06, 'epoch': 1.5} {'loss': 0.5155, 'learning_rate': 2.9520011684714787e-06, 'epoch': 1.5} {'loss': 0.3866, 'learning_rate': 2.9517689470487077e-06, 'epoch': 1.5} {'loss': 0.4772, 'learning_rate': 2.9515367331787525e-06, 'epoch': 1.5} {'loss': 0.5345, 'learning_rate': 2.9513045268618655e-06, 'epoch': 1.5} {'loss': 0.638, 'learning_rate': 2.9510723280982855e-06, 'epoch': 1.5} {'loss': 0.436, 'learning_rate': 2.9508401368882734e-06, 'epoch': 1.5} {'loss': 0.4835, 'learning_rate': 2.9506079532320698e-06, 'epoch': 1.5} {'loss': 0.564, 'learning_rate': 2.950375777129926e-06, 'epoch': 1.5} {'loss': 0.558, 'learning_rate': 2.95014360858209e-06, 'epoch': 1.5} {'loss': 0.3693, 'learning_rate': 2.949911447588811e-06, 'epoch': 1.5} {'loss': 0.4519, 'learning_rate': 2.949679294150343e-06, 'epoch': 1.5} {'loss': 0.5239, 'learning_rate': 2.949447148266923e-06, 'epoch': 1.5} {'loss': 0.6993, 'learning_rate': 2.949215009938813e-06, 'epoch': 1.5} {'loss': 0.6018, 'learning_rate': 2.948982879166252e-06, 'epoch': 1.5} {'loss': 0.4169, 'learning_rate': 2.948750755949492e-06, 'epoch': 1.5} {'loss': 0.4603, 'learning_rate': 2.9485186402887867e-06, 'epoch': 1.5} {'loss': 0.6681, 'learning_rate': 2.9482865321843725e-06, 'epoch': 1.5} {'loss': 0.569, 'learning_rate': 2.9480544316365124e-06, 'epoch': 1.5} {'loss': 0.5362, 'learning_rate': 2.947822338645442e-06, 'epoch': 1.5} {'loss': 0.3966, 'learning_rate': 2.947590253211422e-06, 'epoch': 1.5} {'loss': 0.4786, 'learning_rate': 2.9473581753346936e-06, 'epoch': 1.5} {'loss': 0.5273, 'learning_rate': 2.9471261050155077e-06, 'epoch': 1.5} {'loss': 0.437, 'learning_rate': 2.946894042254115e-06, 'epoch': 1.5} {'loss': 0.3447, 'learning_rate': 2.946661987050755e-06, 'epoch': 1.5} {'loss': 0.4344, 'learning_rate': 2.9464299394056917e-06, 'epoch': 1.5} {'loss': 0.5022, 'learning_rate': 2.9461978993191577e-06, 'epoch': 1.5} {'loss': 0.5058, 'learning_rate': 2.945965866791415e-06, 'epoch': 1.5} {'loss': 0.4149, 'learning_rate': 2.9457338418227043e-06, 'epoch': 1.5} {'loss': 0.3913, 'learning_rate': 2.945501824413276e-06, 'epoch': 1.5} {'loss': 0.5379, 'learning_rate': 2.9452698145633828e-06, 'epoch': 1.5} {'loss': 0.7398, 'learning_rate': 2.9450378122732635e-06, 'epoch': 1.5} {'loss': 0.4737, 'learning_rate': 2.9448058175431793e-06, 'epoch': 1.5} {'loss': 0.5194, 'learning_rate': 2.9445738303733652e-06, 'epoch': 1.5} {'loss': 0.5709, 'learning_rate': 2.944341850764084e-06, 'epoch': 1.5} {'loss': 0.5461, 'learning_rate': 2.9441098787155742e-06, 'epoch': 1.5} {'loss': 0.4828, 'learning_rate': 2.943877914228087e-06, 'epoch': 1.5} {'loss': 0.4363, 'learning_rate': 2.943645957301876e-06, 'epoch': 1.5} {'loss': 0.5858, 'learning_rate': 2.9434140079371777e-06, 'epoch': 1.5} {'loss': 0.5464, 'learning_rate': 2.9431820661342547e-06, 'epoch': 1.5} {'loss': 0.5491, 'learning_rate': 2.942950131893343e-06, 'epoch': 1.5} {'loss': 0.5743, 'learning_rate': 2.942718205214703e-06, 'epoch': 1.5} {'loss': 0.4883, 'learning_rate': 2.942486286098575e-06, 'epoch': 1.5} {'loss': 0.4472, 'learning_rate': 2.9422543745452093e-06, 'epoch': 1.5} {'loss': 0.4834, 'learning_rate': 2.942022470554858e-06, 'epoch': 1.5} {'loss': 0.5002, 'learning_rate': 2.9417905741277608e-06, 'epoch': 1.5} {'loss': 0.5788, 'learning_rate': 2.9415586852641784e-06, 'epoch': 1.5} {'loss': 0.6051, 'learning_rate': 2.941326803964346e-06, 'epoch': 1.5} {'loss': 0.5268, 'learning_rate': 2.9410949302285262e-06, 'epoch': 1.5} {'loss': 0.5022, 'learning_rate': 2.940863064056957e-06, 'epoch': 1.5} {'loss': 0.5386, 'learning_rate': 2.94063120544989e-06, 'epoch': 1.5} {'loss': 0.6273, 'learning_rate': 2.940399354407576e-06, 'epoch': 1.5} {'loss': 0.4149, 'learning_rate': 2.9401675109302564e-06, 'epoch': 1.5} {'loss': 0.6393, 'learning_rate': 2.9399356750181895e-06, 'epoch': 1.5} {'loss': 0.4817, 'learning_rate': 2.9397038466716164e-06, 'epoch': 1.5} {'loss': 0.6901, 'learning_rate': 2.939472025890788e-06, 'epoch': 1.5} {'loss': 0.4949, 'learning_rate': 2.939240212675952e-06, 'epoch': 1.5} {'loss': 0.4302, 'learning_rate': 2.939008407027358e-06, 'epoch': 1.5} {'loss': 0.5672, 'learning_rate': 2.938776608945256e-06, 'epoch': 1.5} {'loss': 0.4765, 'learning_rate': 2.938544818429887e-06, 'epoch': 1.5} {'loss': 0.4481, 'learning_rate': 2.9383130354815105e-06, 'epoch': 1.5} {'loss': 0.5638, 'learning_rate': 2.9380812601003663e-06, 'epoch': 1.5} {'loss': 0.4711, 'learning_rate': 2.937849492286704e-06, 'epoch': 1.5} {'loss': 0.4342, 'learning_rate': 2.937617732040774e-06, 'epoch': 1.5} {'loss': 0.5994, 'learning_rate': 2.9373859793628245e-06, 'epoch': 1.5} {'loss': 0.5334, 'learning_rate': 2.9371542342531055e-06, 'epoch': 1.5} {'loss': 0.6114, 'learning_rate': 2.9369224967118614e-06, 'epoch': 1.5} {'loss': 0.5426, 'learning_rate': 2.936690766739342e-06, 'epoch': 1.5} {'loss': 0.5695, 'learning_rate': 2.9364590443357955e-06, 'epoch': 1.5} {'loss': 0.5586, 'learning_rate': 2.9362273295014696e-06, 'epoch': 1.5} {'loss': 0.6628, 'learning_rate': 2.935995622236618e-06, 'epoch': 1.5} {'loss': 0.4801, 'learning_rate': 2.935763922541479e-06, 'epoch': 1.5} {'loss': 0.5205, 'learning_rate': 2.9355322304163124e-06, 'epoch': 1.5} {'loss': 0.4595, 'learning_rate': 2.935300545861357e-06, 'epoch': 1.5} {'loss': 0.6902, 'learning_rate': 2.935068868876865e-06, 'epoch': 1.5} {'loss': 0.5594, 'learning_rate': 2.934837199463084e-06, 'epoch': 1.5} {'loss': 0.5354, 'learning_rate': 2.934605537620263e-06, 'epoch': 1.5} {'loss': 0.461, 'learning_rate': 2.9343738833486536e-06, 'epoch': 1.5} {'loss': 0.4135, 'learning_rate': 2.934142236648493e-06, 'epoch': 1.5} {'loss': 0.4483, 'learning_rate': 2.9339105975200433e-06, 'epoch': 1.5} {'loss': 0.4514, 'learning_rate': 2.933678965963542e-06, 'epoch': 1.5} {'loss': 0.5997, 'learning_rate': 2.933447341979243e-06, 'epoch': 1.5} {'loss': 0.3042, 'learning_rate': 2.9332157255673934e-06, 'epoch': 1.5} {'loss': 0.4586, 'learning_rate': 2.9329841167282392e-06, 'epoch': 1.5} {'loss': 0.5836, 'learning_rate': 2.932752515462034e-06, 'epoch': 1.5} {'loss': 0.4733, 'learning_rate': 2.93252092176902e-06, 'epoch': 1.5} {'loss': 0.4829, 'learning_rate': 2.9322893356494475e-06, 'epoch': 1.5} {'loss': 0.5676, 'learning_rate': 2.932057757103565e-06, 'epoch': 1.5} {'loss': 0.4729, 'learning_rate': 2.93182618613162e-06, 'epoch': 1.5} {'loss': 0.4841, 'learning_rate': 2.931594622733861e-06, 'epoch': 1.5} {'loss': 0.4231, 'learning_rate': 2.9313630669105363e-06, 'epoch': 1.5} {'loss': 0.4121, 'learning_rate': 2.931131518661898e-06, 'epoch': 1.5} {'loss': 0.435, 'learning_rate': 2.9308999779881863e-06, 'epoch': 1.5} {'loss': 0.5172, 'learning_rate': 2.930668444889654e-06, 'epoch': 1.5} {'loss': 0.5367, 'learning_rate': 2.930436919366548e-06, 'epoch': 1.5} {'loss': 0.4671, 'learning_rate': 2.9302054014191173e-06, 'epoch': 1.5} {'loss': 0.4396, 'learning_rate': 2.9299738910476093e-06, 'epoch': 1.5} {'loss': 0.481, 'learning_rate': 2.9297423882522724e-06, 'epoch': 1.5} {'loss': 0.5711, 'learning_rate': 2.9295108930333584e-06, 'epoch': 1.5} {'loss': 0.4714, 'learning_rate': 2.929279405391108e-06, 'epoch': 1.5} {'loss': 0.5359, 'learning_rate': 2.929047925325772e-06, 'epoch': 1.5} {'loss': 0.5542, 'learning_rate': 2.9288164528376006e-06, 'epoch': 1.5} {'loss': 0.4045, 'learning_rate': 2.92858498792684e-06, 'epoch': 1.5} {'loss': 0.5095, 'learning_rate': 2.9283535305937396e-06, 'epoch': 1.5} {'loss': 0.6396, 'learning_rate': 2.928122080838549e-06, 'epoch': 1.5} {'loss': 0.6223, 'learning_rate': 2.9278906386615112e-06, 'epoch': 1.5} {'loss': 0.503, 'learning_rate': 2.927659204062876e-06, 'epoch': 1.5} {'loss': 0.5314, 'learning_rate': 2.927427777042893e-06, 'epoch': 1.5} {'loss': 0.518, 'learning_rate': 2.927196357601809e-06, 'epoch': 1.5} {'loss': 0.5507, 'learning_rate': 2.926964945739873e-06, 'epoch': 1.5} {'loss': 0.4689, 'learning_rate': 2.926733541457333e-06, 'epoch': 1.5} {'loss': 0.5491, 'learning_rate': 2.9265021447544383e-06, 'epoch': 1.5} {'loss': 0.528, 'learning_rate': 2.9262707556314327e-06, 'epoch': 1.5} {'loss': 0.5155, 'learning_rate': 2.926039374088566e-06, 'epoch': 1.5} {'loss': 0.5393, 'learning_rate': 2.925808000126087e-06, 'epoch': 1.5} {'loss': 0.5497, 'learning_rate': 2.9255766337442428e-06, 'epoch': 1.5} {'loss': 0.4386, 'learning_rate': 2.925345274943282e-06, 'epoch': 1.5} {'loss': 0.4912, 'learning_rate': 2.9251139237234516e-06, 'epoch': 1.5} {'loss': 0.6583, 'learning_rate': 2.924882580085003e-06, 'epoch': 1.5} {'loss': 0.5577, 'learning_rate': 2.9246512440281794e-06, 'epoch': 1.5} {'loss': 0.4788, 'learning_rate': 2.9244199155532305e-06, 'epoch': 1.5} {'loss': 0.5741, 'learning_rate': 2.9241885946604043e-06, 'epoch': 1.5} {'loss': 0.4139, 'learning_rate': 2.9239572813499485e-06, 'epoch': 1.5} {'loss': 0.5374, 'learning_rate': 2.923725975622114e-06, 'epoch': 1.5} {'loss': 0.5272, 'learning_rate': 2.923494677477139e-06, 'epoch': 1.5} {'loss': 0.4967, 'learning_rate': 2.9232633869152847e-06, 'epoch': 1.5} {'loss': 0.5793, 'learning_rate': 2.923032103936789e-06, 'epoch': 1.5} {'loss': 0.4569, 'learning_rate': 2.922800828541904e-06, 'epoch': 1.5} {'loss': 0.4904, 'learning_rate': 2.9225695607308767e-06, 'epoch': 1.5} {'loss': 0.3217, 'learning_rate': 2.922338300503954e-06, 'epoch': 1.5} {'loss': 0.4862, 'learning_rate': 2.922107047861389e-06, 'epoch': 1.5} {'loss': 0.4046, 'learning_rate': 2.9218758028034176e-06, 'epoch': 1.5} {'loss': 0.5216, 'learning_rate': 2.921644565330303e-06, 'epoch': 1.5} {'loss': 0.5148, 'learning_rate': 2.9214133354422802e-06, 'epoch': 1.5} {'loss': 0.4373, 'learning_rate': 2.9211821131396024e-06, 'epoch': 1.5} {'loss': 0.5084, 'learning_rate': 2.920950898422518e-06, 'epoch': 1.5} {'loss': 0.5001, 'learning_rate': 2.9207196912912716e-06, 'epoch': 1.5} {'loss': 0.5767, 'learning_rate': 2.9204884917461175e-06, 'epoch': 1.5} {'loss': 0.4631, 'learning_rate': 2.920257299787296e-06, 'epoch': 1.5} {'loss': 0.6831, 'learning_rate': 2.9200261154150567e-06, 'epoch': 1.5} {'loss': 0.456, 'learning_rate': 2.9197949386296488e-06, 'epoch': 1.5} {'loss': 0.6391, 'learning_rate': 2.9195637694313208e-06, 'epoch': 1.5} {'loss': 0.4408, 'learning_rate': 2.919332607820321e-06, 'epoch': 1.5} {'loss': 0.482, 'learning_rate': 2.9191014537968897e-06, 'epoch': 1.5} {'loss': 0.5217, 'learning_rate': 2.9188703073612867e-06, 'epoch': 1.5} {'loss': 0.3894, 'learning_rate': 2.9186391685137493e-06, 'epoch': 1.5} {'loss': 0.5773, 'learning_rate': 2.9184080372545297e-06, 'epoch': 1.5} {'loss': 0.5233, 'learning_rate': 2.9181769135838758e-06, 'epoch': 1.5} {'loss': 0.553, 'learning_rate': 2.917945797502033e-06, 'epoch': 1.5} {'loss': 0.5129, 'learning_rate': 2.9177146890092545e-06, 'epoch': 1.5} {'loss': 0.4817, 'learning_rate': 2.9174835881057773e-06, 'epoch': 1.5} {'loss': 0.5096, 'learning_rate': 2.917252494791862e-06, 'epoch': 1.5} {'loss': 0.5313, 'learning_rate': 2.917021409067747e-06, 'epoch': 1.5} {'loss': 0.4305, 'learning_rate': 2.916790330933683e-06, 'epoch': 1.5} {'loss': 0.5924, 'learning_rate': 2.916559260389921e-06, 'epoch': 1.5} {'loss': 0.6136, 'learning_rate': 2.9163281974366985e-06, 'epoch': 1.5} {'loss': 0.5223, 'learning_rate': 2.916097142074276e-06, 'epoch': 1.5} {'loss': 0.5078, 'learning_rate': 2.915866094302887e-06, 'epoch': 1.5} {'loss': 0.4451, 'learning_rate': 2.915635054122795e-06, 'epoch': 1.5} {'loss': 0.6209, 'learning_rate': 2.915404021534235e-06, 'epoch': 1.5} {'loss': 0.5177, 'learning_rate': 2.9151729965374597e-06, 'epoch': 1.5} {'loss': 0.5286, 'learning_rate': 2.9149419791327192e-06, 'epoch': 1.5} {'loss': 0.5375, 'learning_rate': 2.9147109693202514e-06, 'epoch': 1.5} {'loss': 0.4946, 'learning_rate': 2.9144799671003167e-06, 'epoch': 1.5} {'loss': 0.3696, 'learning_rate': 2.9142489724731502e-06, 'epoch': 1.5} {'loss': 0.4519, 'learning_rate': 2.9140179854390116e-06, 'epoch': 1.5} {'loss': 0.623, 'learning_rate': 2.9137870059981387e-06, 'epoch': 1.5} {'loss': 0.4622, 'learning_rate': 2.9135560341507828e-06, 'epoch': 1.5} {'loss': 0.5488, 'learning_rate': 2.9133250698971937e-06, 'epoch': 1.5} {'loss': 0.589, 'learning_rate': 2.913094113237611e-06, 'epoch': 1.5} {'loss': 0.4346, 'learning_rate': 2.9128631641722936e-06, 'epoch': 1.5} {'loss': 0.5032, 'learning_rate': 2.9126322227014768e-06, 'epoch': 1.5} {'loss': 0.589, 'learning_rate': 2.9124012888254203e-06, 'epoch': 1.5} {'loss': 0.4487, 'learning_rate': 2.912170362544362e-06, 'epoch': 1.5} {'loss': 0.5519, 'learning_rate': 2.9119394438585535e-06, 'epoch': 1.5} {'loss': 0.6516, 'learning_rate': 2.911708532768245e-06, 'epoch': 1.5} {'loss': 0.4526, 'learning_rate': 2.9114776292736734e-06, 'epoch': 1.5} {'loss': 0.5767, 'learning_rate': 2.9112467333751003e-06, 'epoch': 1.5} {'loss': 0.4774, 'learning_rate': 2.91101584507276e-06, 'epoch': 1.5} {'loss': 0.5193, 'learning_rate': 2.9107849643669116e-06, 'epoch': 1.5} {'loss': 0.5443, 'learning_rate': 2.9105540912577946e-06, 'epoch': 1.5} {'loss': 0.501, 'learning_rate': 2.910323225745658e-06, 'epoch': 1.5} {'loss': 0.4276, 'learning_rate': 2.9100923678307537e-06, 'epoch': 1.5} {'loss': 0.4938, 'learning_rate': 2.9098615175133193e-06, 'epoch': 1.5} {'loss': 0.4058, 'learning_rate': 2.9096306747936133e-06, 'epoch': 1.5} {'loss': 0.4145, 'learning_rate': 2.9093998396718725e-06, 'epoch': 1.5} {'loss': 0.465, 'learning_rate': 2.9091690121483564e-06, 'epoch': 1.5} {'loss': 0.4831, 'learning_rate': 2.908938192223302e-06, 'epoch': 1.5} {'loss': 0.609, 'learning_rate': 2.90870737989696e-06, 'epoch': 1.5} {'loss': 0.4023, 'learning_rate': 2.908476575169582e-06, 'epoch': 1.5} {'loss': 0.5927, 'learning_rate': 2.908245778041404e-06, 'epoch': 1.5} {'loss': 0.5425, 'learning_rate': 2.9080149885126884e-06, 'epoch': 1.5} {'loss': 0.5184, 'learning_rate': 2.9077842065836705e-06, 'epoch': 1.5} {'loss': 0.2634, 'learning_rate': 2.907553432254603e-06, 'epoch': 1.5} {'loss': 0.5458, 'learning_rate': 2.9073226655257314e-06, 'epoch': 1.5} {'loss': 0.52, 'learning_rate': 2.9070919063973035e-06, 'epoch': 1.5} {'loss': 0.4721, 'learning_rate': 2.9068611548695704e-06, 'epoch': 1.5} {'loss': 0.6526, 'learning_rate': 2.906630410942769e-06, 'epoch': 1.5} {'loss': 0.5641, 'learning_rate': 2.9063996746171606e-06, 'epoch': 1.5} {'loss': 0.4725, 'learning_rate': 2.906168945892981e-06, 'epoch': 1.5} {'loss': 0.5756, 'learning_rate': 2.9059382247704825e-06, 'epoch': 1.5} {'loss': 0.5314, 'learning_rate': 2.905707511249911e-06, 'epoch': 1.5} {'loss': 0.5948, 'learning_rate': 2.9054768053315143e-06, 'epoch': 1.5} {'loss': 0.597, 'learning_rate': 2.9052461070155424e-06, 'epoch': 1.5} {'loss': 0.4936, 'learning_rate': 2.905015416302234e-06, 'epoch': 1.5} {'loss': 0.5274, 'learning_rate': 2.9047847331918476e-06, 'epoch': 1.5} {'loss': 0.5463, 'learning_rate': 2.9045540576846222e-06, 'epoch': 1.5} {'loss': 0.5418, 'learning_rate': 2.9043233897808063e-06, 'epoch': 1.5} {'loss': 0.4927, 'learning_rate': 2.9040927294806498e-06, 'epoch': 1.5} {'loss': 0.5626, 'learning_rate': 2.9038620767843973e-06, 'epoch': 1.5} {'loss': 0.3652, 'learning_rate': 2.903631431692301e-06, 'epoch': 1.5} {'loss': 0.4945, 'learning_rate': 2.9034007942046005e-06, 'epoch': 1.5} {'loss': 0.5572, 'learning_rate': 2.903170164321547e-06, 'epoch': 1.5} {'loss': 0.4622, 'learning_rate': 2.9029395420433857e-06, 'epoch': 1.5} {'loss': 0.5157, 'learning_rate': 2.902708927370367e-06, 'epoch': 1.5} {'loss': 0.4955, 'learning_rate': 2.9024783203027362e-06, 'epoch': 1.5} {'loss': 0.5287, 'learning_rate': 2.9022477208407397e-06, 'epoch': 1.5} {'loss': 0.5089, 'learning_rate': 2.902017128984629e-06, 'epoch': 1.5} {'loss': 0.393, 'learning_rate': 2.9017865447346437e-06, 'epoch': 1.5} {'loss': 0.5868, 'learning_rate': 2.9015559680910355e-06, 'epoch': 1.5} {'loss': 0.5635, 'learning_rate': 2.90132539905405e-06, 'epoch': 1.5} {'loss': 0.5088, 'learning_rate': 2.9010948376239358e-06, 'epoch': 1.5} {'loss': 0.4668, 'learning_rate': 2.9008642838009414e-06, 'epoch': 1.5} {'loss': 0.3843, 'learning_rate': 2.9006337375853067e-06, 'epoch': 1.5} {'loss': 0.4911, 'learning_rate': 2.9004031989772894e-06, 'epoch': 1.5} {'loss': 0.4918, 'learning_rate': 2.900172667977127e-06, 'epoch': 1.5} {'loss': 0.4869, 'learning_rate': 2.899942144585072e-06, 'epoch': 1.5} {'loss': 0.4533, 'learning_rate': 2.8997116288013683e-06, 'epoch': 1.5} {'loss': 0.4897, 'learning_rate': 2.8994811206262653e-06, 'epoch': 1.5} {'loss': 0.6492, 'learning_rate': 2.8992506200600114e-06, 'epoch': 1.5} {'loss': 0.545, 'learning_rate': 2.8990201271028484e-06, 'epoch': 1.5} {'loss': 0.4853, 'learning_rate': 2.8987896417550266e-06, 'epoch': 1.5} {'loss': 0.4137, 'learning_rate': 2.898559164016793e-06, 'epoch': 1.5} {'loss': 0.502, 'learning_rate': 2.8983286938883936e-06, 'epoch': 1.5} {'loss': 0.5707, 'learning_rate': 2.8980982313700766e-06, 'epoch': 1.5} {'loss': 0.4948, 'learning_rate': 2.8978677764620876e-06, 'epoch': 1.5} {'loss': 0.3995, 'learning_rate': 2.8976373291646774e-06, 'epoch': 1.5} {'loss': 0.6187, 'learning_rate': 2.8974068894780873e-06, 'epoch': 1.5} {'loss': 0.4576, 'learning_rate': 2.8971764574025664e-06, 'epoch': 1.5} {'loss': 0.5561, 'learning_rate': 2.8969460329383624e-06, 'epoch': 1.5} {'loss': 0.3812, 'learning_rate': 2.8967156160857215e-06, 'epoch': 1.5} {'loss': 0.5391, 'learning_rate': 2.8964852068448913e-06, 'epoch': 1.5} {'loss': 0.6179, 'learning_rate': 2.896254805216121e-06, 'epoch': 1.5} {'loss': 0.5252, 'learning_rate': 2.8960244111996516e-06, 'epoch': 1.5} {'loss': 0.6053, 'learning_rate': 2.8957940247957326e-06, 'epoch': 1.5} {'loss': 0.5101, 'learning_rate': 2.8955636460046133e-06, 'epoch': 1.5} {'loss': 0.5904, 'learning_rate': 2.895333274826537e-06, 'epoch': 1.5} {'loss': 0.4061, 'learning_rate': 2.8951029112617536e-06, 'epoch': 1.5} {'loss': 0.4427, 'learning_rate': 2.8948725553105084e-06, 'epoch': 1.5} {'loss': 0.4936, 'learning_rate': 2.8946422069730517e-06, 'epoch': 1.5} {'loss': 0.5999, 'learning_rate': 2.8944118662496234e-06, 'epoch': 1.5} {'loss': 0.5553, 'learning_rate': 2.8941815331404745e-06, 'epoch': 1.5} {'loss': 0.6013, 'learning_rate': 2.893951207645851e-06, 'epoch': 1.5} {'loss': 0.4442, 'learning_rate': 2.893720889766001e-06, 'epoch': 1.5} {'loss': 0.4562, 'learning_rate': 2.8934905795011705e-06, 'epoch': 1.5} {'loss': 0.5057, 'learning_rate': 2.893260276851605e-06, 'epoch': 1.5} {'loss': 0.4694, 'learning_rate': 2.8930299818175565e-06, 'epoch': 1.5} {'loss': 0.3905, 'learning_rate': 2.8927996943992655e-06, 'epoch': 1.5} {'loss': 0.6534, 'learning_rate': 2.8925694145969798e-06, 'epoch': 1.5} {'loss': 0.5301, 'learning_rate': 2.8923391424109483e-06, 'epoch': 1.5} {'loss': 0.5689, 'learning_rate': 2.8921088778414164e-06, 'epoch': 1.5} {'loss': 0.5046, 'learning_rate': 2.891878620888634e-06, 'epoch': 1.5} {'loss': 0.5827, 'learning_rate': 2.89164837155284e-06, 'epoch': 1.5} {'loss': 0.5402, 'learning_rate': 2.8914181298342914e-06, 'epoch': 1.5} {'loss': 0.5116, 'learning_rate': 2.8911878957332275e-06, 'epoch': 1.5} {'loss': 0.4317, 'learning_rate': 2.8909576692498976e-06, 'epoch': 1.5} {'loss': 0.4627, 'learning_rate': 2.8907274503845483e-06, 'epoch': 1.5} {'loss': 0.5846, 'learning_rate': 2.890497239137425e-06, 'epoch': 1.51} {'loss': 0.5058, 'learning_rate': 2.89026703550878e-06, 'epoch': 1.51} {'loss': 0.4992, 'learning_rate': 2.890036839498849e-06, 'epoch': 1.51} {'loss': 0.6104, 'learning_rate': 2.8898066511078916e-06, 'epoch': 1.51} {'loss': 0.4669, 'learning_rate': 2.889576470336144e-06, 'epoch': 1.51} {'loss': 0.6075, 'learning_rate': 2.8893462971838584e-06, 'epoch': 1.51} {'loss': 0.4913, 'learning_rate': 2.8891161316512783e-06, 'epoch': 1.51} {'loss': 0.5029, 'learning_rate': 2.888885973738653e-06, 'epoch': 1.51} {'loss': 0.5092, 'learning_rate': 2.8886558234462313e-06, 'epoch': 1.51} {'loss': 0.4109, 'learning_rate': 2.8884256807742518e-06, 'epoch': 1.51} {'loss': 0.4815, 'learning_rate': 2.8881955457229705e-06, 'epoch': 1.51} {'loss': 0.4977, 'learning_rate': 2.8879654182926264e-06, 'epoch': 1.51} {'loss': 0.654, 'learning_rate': 2.8877352984834706e-06, 'epoch': 1.51} {'loss': 0.4766, 'learning_rate': 2.8875051862957503e-06, 'epoch': 1.51} {'loss': 0.54, 'learning_rate': 2.8872750817297045e-06, 'epoch': 1.51} {'loss': 0.4767, 'learning_rate': 2.887044984785592e-06, 'epoch': 1.51} {'loss': 0.5163, 'learning_rate': 2.8868148954636455e-06, 'epoch': 1.51} {'loss': 0.5487, 'learning_rate': 2.886584813764125e-06, 'epoch': 1.51} {'loss': 0.5231, 'learning_rate': 2.8863547396872692e-06, 'epoch': 1.51} {'loss': 0.4489, 'learning_rate': 2.8861246732333248e-06, 'epoch': 1.51} {'loss': 0.486, 'learning_rate': 2.8858946144025447e-06, 'epoch': 1.51} {'loss': 0.3675, 'learning_rate': 2.885664563195163e-06, 'epoch': 1.51} {'loss': 0.6203, 'learning_rate': 2.8854345196114395e-06, 'epoch': 1.51} {'loss': 0.3399, 'learning_rate': 2.8852044836516104e-06, 'epoch': 1.51} {'loss': 0.4839, 'learning_rate': 2.884974455315932e-06, 'epoch': 1.51} {'loss': 0.4342, 'learning_rate': 2.884744434604644e-06, 'epoch': 1.51} {'loss': 0.4917, 'learning_rate': 2.884514421517993e-06, 'epoch': 1.51} {'loss': 0.5544, 'learning_rate': 2.88428441605623e-06, 'epoch': 1.51} {'loss': 0.6161, 'learning_rate': 2.884054418219593e-06, 'epoch': 1.51} {'loss': 0.4725, 'learning_rate': 2.8838244280083406e-06, 'epoch': 1.51} {'loss': 0.5515, 'learning_rate': 2.8835944454227083e-06, 'epoch': 1.51} {'loss': 0.5371, 'learning_rate': 2.8833644704629483e-06, 'epoch': 1.51} {'loss': 0.381, 'learning_rate': 2.8831345031293045e-06, 'epoch': 1.51} {'loss': 0.5521, 'learning_rate': 2.882904543422025e-06, 'epoch': 1.51} {'loss': 0.4561, 'learning_rate': 2.882674591341358e-06, 'epoch': 1.51} {'loss': 0.4672, 'learning_rate': 2.882444646887541e-06, 'epoch': 1.51} {'loss': 0.6241, 'learning_rate': 2.8822147100608342e-06, 'epoch': 1.51} {'loss': 0.455, 'learning_rate': 2.881984780861473e-06, 'epoch': 1.51} {'loss': 0.29, 'learning_rate': 2.881754859289708e-06, 'epoch': 1.51} {'loss': 0.4232, 'learning_rate': 2.881524945345786e-06, 'epoch': 1.51} {'loss': 0.5995, 'learning_rate': 2.881295039029951e-06, 'epoch': 1.51} {'loss': 0.564, 'learning_rate': 2.881065140342455e-06, 'epoch': 1.51} {'loss': 0.4655, 'learning_rate': 2.8808352492835336e-06, 'epoch': 1.51} {'loss': 0.6615, 'learning_rate': 2.880605365853446e-06, 'epoch': 1.51} {'loss': 0.4741, 'learning_rate': 2.880375490052428e-06, 'epoch': 1.51} {'loss': 0.5025, 'learning_rate': 2.880145621880732e-06, 'epoch': 1.51} {'loss': 0.4402, 'learning_rate': 2.8799157613386053e-06, 'epoch': 1.51} {'loss': 0.5226, 'learning_rate': 2.8796859084262853e-06, 'epoch': 1.51} {'loss': 0.5125, 'learning_rate': 2.8794560631440304e-06, 'epoch': 1.51} {'loss': 0.5248, 'learning_rate': 2.8792262254920745e-06, 'epoch': 1.51} {'loss': 0.5146, 'learning_rate': 2.8789963954706768e-06, 'epoch': 1.51} {'loss': 0.4939, 'learning_rate': 2.878766573080074e-06, 'epoch': 1.51} {'loss': 0.6215, 'learning_rate': 2.8785367583205158e-06, 'epoch': 1.51} {'loss': 0.7156, 'learning_rate': 2.8783069511922514e-06, 'epoch': 1.51} {'loss': 0.3661, 'learning_rate': 2.8780771516955176e-06, 'epoch': 1.51} {'loss': 0.4802, 'learning_rate': 2.8778473598305736e-06, 'epoch': 1.51} {'loss': 0.4819, 'learning_rate': 2.877617575597652e-06, 'epoch': 1.51} {'loss': 0.5024, 'learning_rate': 2.877387798997012e-06, 'epoch': 1.51} {'loss': 0.5181, 'learning_rate': 2.8771580300288916e-06, 'epoch': 1.51} {'loss': 0.4019, 'learning_rate': 2.8769282686935383e-06, 'epoch': 1.51} {'loss': 0.351, 'learning_rate': 2.876698514991203e-06, 'epoch': 1.51} {'loss': 0.5667, 'learning_rate': 2.8764687689221225e-06, 'epoch': 1.51} {'loss': 0.6106, 'learning_rate': 2.876239030486554e-06, 'epoch': 1.51} {'loss': 0.5237, 'learning_rate': 2.8760092996847355e-06, 'epoch': 1.51} {'loss': 0.4621, 'learning_rate': 2.875779576516916e-06, 'epoch': 1.51} {'loss': 0.4751, 'learning_rate': 2.875549860983341e-06, 'epoch': 1.51} {'loss': 0.596, 'learning_rate': 2.8753201530842577e-06, 'epoch': 1.51} {'loss': 0.5612, 'learning_rate': 2.8750904528199163e-06, 'epoch': 1.51} {'loss': 0.5572, 'learning_rate': 2.874860760190551e-06, 'epoch': 1.51} {'loss': 0.4421, 'learning_rate': 2.8746310751964224e-06, 'epoch': 1.51} {'loss': 0.5026, 'learning_rate': 2.8744013978377662e-06, 'epoch': 1.51} {'loss': 0.3294, 'learning_rate': 2.8741717281148317e-06, 'epoch': 1.51} {'loss': 0.5388, 'learning_rate': 2.873942066027866e-06, 'epoch': 1.51} {'loss': 0.6146, 'learning_rate': 2.8737124115771144e-06, 'epoch': 1.51} {'loss': 0.3612, 'learning_rate': 2.873482764762825e-06, 'epoch': 1.51} {'loss': 0.619, 'learning_rate': 2.873253125585237e-06, 'epoch': 1.51} {'loss': 0.563, 'learning_rate': 2.873023494044608e-06, 'epoch': 1.51} {'loss': 0.5251, 'learning_rate': 2.872793870141174e-06, 'epoch': 1.51} {'loss': 0.4812, 'learning_rate': 2.872564253875184e-06, 'epoch': 1.51} {'loss': 0.5017, 'learning_rate': 2.8723346452468858e-06, 'epoch': 1.51} {'loss': 0.5452, 'learning_rate': 2.8721050442565244e-06, 'epoch': 1.51} {'loss': 0.6081, 'learning_rate': 2.871875450904348e-06, 'epoch': 1.51} {'loss': 0.5429, 'learning_rate': 2.8716458651905977e-06, 'epoch': 1.51} {'loss': 0.528, 'learning_rate': 2.8714162871155226e-06, 'epoch': 1.51} {'loss': 0.5826, 'learning_rate': 2.8711867166793685e-06, 'epoch': 1.51} {'loss': 0.5394, 'learning_rate': 2.87095715388238e-06, 'epoch': 1.51} {'loss': 0.5493, 'learning_rate': 2.870727598724805e-06, 'epoch': 1.51} {'loss': 0.5243, 'learning_rate': 2.870498051206889e-06, 'epoch': 1.51} {'loss': 0.6527, 'learning_rate': 2.870268511328881e-06, 'epoch': 1.51} {'loss': 0.5724, 'learning_rate': 2.8700389790910197e-06, 'epoch': 1.51} {'loss': 0.4142, 'learning_rate': 2.869809454493556e-06, 'epoch': 1.51} {'loss': 0.484, 'learning_rate': 2.869579937536736e-06, 'epoch': 1.51} {'loss': 0.563, 'learning_rate': 2.869350428220803e-06, 'epoch': 1.51} {'loss': 0.5137, 'learning_rate': 2.869120926546005e-06, 'epoch': 1.51} {'loss': 0.5828, 'learning_rate': 2.8688914325125884e-06, 'epoch': 1.51} {'loss': 0.4513, 'learning_rate': 2.868661946120801e-06, 'epoch': 1.51} {'loss': 0.2645, 'learning_rate': 2.868432467370882e-06, 'epoch': 1.51} {'loss': 0.4671, 'learning_rate': 2.868202996263082e-06, 'epoch': 1.51} {'loss': 0.477, 'learning_rate': 2.8679735327976467e-06, 'epoch': 1.51} {'loss': 0.5438, 'learning_rate': 2.86774407697482e-06, 'epoch': 1.51} {'loss': 0.5256, 'learning_rate': 2.8675146287948496e-06, 'epoch': 1.51} {'loss': 0.4705, 'learning_rate': 2.8672851882579856e-06, 'epoch': 1.51} {'loss': 0.4873, 'learning_rate': 2.8670557553644653e-06, 'epoch': 1.51} {'loss': 0.7058, 'learning_rate': 2.866826330114538e-06, 'epoch': 1.51} {'loss': 0.5502, 'learning_rate': 2.86659691250845e-06, 'epoch': 1.51} {'loss': 0.4943, 'learning_rate': 2.8663675025464475e-06, 'epoch': 1.51} {'loss': 0.5672, 'learning_rate': 2.866138100228777e-06, 'epoch': 1.51} {'loss': 0.5872, 'learning_rate': 2.865908705555682e-06, 'epoch': 1.51} {'loss': 0.5728, 'learning_rate': 2.8656793185274145e-06, 'epoch': 1.51} {'loss': 0.5464, 'learning_rate': 2.8654499391442113e-06, 'epoch': 1.51} {'loss': 0.395, 'learning_rate': 2.865220567406323e-06, 'epoch': 1.51} {'loss': 0.4364, 'learning_rate': 2.864991203313994e-06, 'epoch': 1.51} {'loss': 0.5636, 'learning_rate': 2.864761846867471e-06, 'epoch': 1.51} {'loss': 0.3407, 'learning_rate': 2.8645324980669997e-06, 'epoch': 1.51} {'loss': 0.5658, 'learning_rate': 2.86430315691283e-06, 'epoch': 1.51} {'loss': 0.4562, 'learning_rate': 2.8640738234051992e-06, 'epoch': 1.51} {'loss': 0.5041, 'learning_rate': 2.863844497544358e-06, 'epoch': 1.51} {'loss': 0.5369, 'learning_rate': 2.863615179330551e-06, 'epoch': 1.51} {'loss': 0.465, 'learning_rate': 2.863385868764025e-06, 'epoch': 1.51} {'loss': 0.6646, 'learning_rate': 2.8631565658450245e-06, 'epoch': 1.51} {'loss': 0.5855, 'learning_rate': 2.8629272705737985e-06, 'epoch': 1.51} {'loss': 0.4885, 'learning_rate': 2.8626979829505885e-06, 'epoch': 1.51} {'loss': 0.3873, 'learning_rate': 2.8624687029756417e-06, 'epoch': 1.51} {'loss': 0.5071, 'learning_rate': 2.862239430649203e-06, 'epoch': 1.51} {'loss': 0.5248, 'learning_rate': 2.8620101659715195e-06, 'epoch': 1.51} {'loss': 0.4076, 'learning_rate': 2.8617809089428362e-06, 'epoch': 1.51} {'loss': 0.6276, 'learning_rate': 2.8615516595633984e-06, 'epoch': 1.51} {'loss': 0.6015, 'learning_rate': 2.8613224178334554e-06, 'epoch': 1.51} {'loss': 0.4478, 'learning_rate': 2.8610931837532473e-06, 'epoch': 1.51} {'loss': 0.5326, 'learning_rate': 2.8608639573230224e-06, 'epoch': 1.51} {'loss': 0.5809, 'learning_rate': 2.8606347385430254e-06, 'epoch': 1.51} {'loss': 0.4624, 'learning_rate': 2.8604055274135024e-06, 'epoch': 1.51} {'loss': 0.3987, 'learning_rate': 2.8601763239347004e-06, 'epoch': 1.51} {'loss': 0.4181, 'learning_rate': 2.8599471281068623e-06, 'epoch': 1.51} {'loss': 0.5942, 'learning_rate': 2.85971793993024e-06, 'epoch': 1.51} {'loss': 0.6667, 'learning_rate': 2.85948875940507e-06, 'epoch': 1.51} {'loss': 0.4186, 'learning_rate': 2.859259586531603e-06, 'epoch': 1.51} {'loss': 0.6015, 'learning_rate': 2.8590304213100837e-06, 'epoch': 1.51} {'loss': 0.4761, 'learning_rate': 2.858801263740758e-06, 'epoch': 1.51} {'loss': 0.4373, 'learning_rate': 2.8585721138238742e-06, 'epoch': 1.51} {'loss': 0.4773, 'learning_rate': 2.858342971559669e-06, 'epoch': 1.51} {'loss': 0.4706, 'learning_rate': 2.8581138369483995e-06, 'epoch': 1.51} {'loss': 0.4431, 'learning_rate': 2.8578847099903027e-06, 'epoch': 1.51} {'loss': 0.4914, 'learning_rate': 2.8576555906856272e-06, 'epoch': 1.51} {'loss': 0.5792, 'learning_rate': 2.8574264790346195e-06, 'epoch': 1.51} {'loss': 0.3323, 'learning_rate': 2.8571973750375225e-06, 'epoch': 1.51} {'loss': 0.4417, 'learning_rate': 2.8569682786945863e-06, 'epoch': 1.51} {'loss': 0.5319, 'learning_rate': 2.856739190006048e-06, 'epoch': 1.51} {'loss': 0.5265, 'learning_rate': 2.8565101089721638e-06, 'epoch': 1.51} {'loss': 0.5292, 'learning_rate': 2.8562810355931704e-06, 'epoch': 1.51} {'loss': 0.4212, 'learning_rate': 2.8560519698693178e-06, 'epoch': 1.51} {'loss': 0.5809, 'learning_rate': 2.855822911800852e-06, 'epoch': 1.51} {'loss': 0.3993, 'learning_rate': 2.8555938613880117e-06, 'epoch': 1.51} {'loss': 0.611, 'learning_rate': 2.8553648186310534e-06, 'epoch': 1.51} {'loss': 0.5422, 'learning_rate': 2.8551357835302095e-06, 'epoch': 1.51} {'loss': 0.3971, 'learning_rate': 2.854906756085739e-06, 'epoch': 1.51} {'loss': 0.5419, 'learning_rate': 2.8546777362978783e-06, 'epoch': 1.51} {'loss': 0.4531, 'learning_rate': 2.854448724166875e-06, 'epoch': 1.51} {'loss': 0.4572, 'learning_rate': 2.8542197196929778e-06, 'epoch': 1.51} {'loss': 0.5774, 'learning_rate': 2.853990722876423e-06, 'epoch': 1.51} {'loss': 0.4942, 'learning_rate': 2.8537617337174683e-06, 'epoch': 1.51} {'loss': 0.5691, 'learning_rate': 2.853532752216347e-06, 'epoch': 1.51} {'loss': 0.5611, 'learning_rate': 2.8533037783733164e-06, 'epoch': 1.51} {'loss': 0.5278, 'learning_rate': 2.853074812188612e-06, 'epoch': 1.51} {'loss': 0.423, 'learning_rate': 2.8528458536624838e-06, 'epoch': 1.51} {'loss': 0.5622, 'learning_rate': 2.852616902795179e-06, 'epoch': 1.51} {'loss': 0.4252, 'learning_rate': 2.852387959586934e-06, 'epoch': 1.51} {'loss': 0.431, 'learning_rate': 2.8521590240380072e-06, 'epoch': 1.51} {'loss': 0.5607, 'learning_rate': 2.8519300961486306e-06, 'epoch': 1.51} {'loss': 0.476, 'learning_rate': 2.851701175919063e-06, 'epoch': 1.51} {'loss': 0.5883, 'learning_rate': 2.8514722633495383e-06, 'epoch': 1.51} {'loss': 0.516, 'learning_rate': 2.8512433584403075e-06, 'epoch': 1.51} {'loss': 0.5382, 'learning_rate': 2.851014461191617e-06, 'epoch': 1.51} {'loss': 0.403, 'learning_rate': 2.8507855716037034e-06, 'epoch': 1.51} {'loss': 0.6233, 'learning_rate': 2.8505566896768257e-06, 'epoch': 1.51} {'loss': 0.431, 'learning_rate': 2.8503278154112144e-06, 'epoch': 1.51} {'loss': 0.4567, 'learning_rate': 2.8500989488071284e-06, 'epoch': 1.51} {'loss': 0.4555, 'learning_rate': 2.8498700898648035e-06, 'epoch': 1.51} {'loss': 0.4813, 'learning_rate': 2.8496412385844897e-06, 'epoch': 1.51} {'loss': 0.4833, 'learning_rate': 2.849412394966432e-06, 'epoch': 1.51} {'loss': 0.5097, 'learning_rate': 2.8491835590108686e-06, 'epoch': 1.51} {'loss': 0.3979, 'learning_rate': 2.8489547307180566e-06, 'epoch': 1.51} {'loss': 0.5039, 'learning_rate': 2.8487259100882326e-06, 'epoch': 1.51} {'loss': 0.5517, 'learning_rate': 2.848497097121643e-06, 'epoch': 1.51} {'loss': 0.5242, 'learning_rate': 2.8482682918185356e-06, 'epoch': 1.51} {'loss': 0.4688, 'learning_rate': 2.8480394941791534e-06, 'epoch': 1.51} {'loss': 0.5671, 'learning_rate': 2.8478107042037452e-06, 'epoch': 1.51} {'loss': 0.5288, 'learning_rate': 2.847581921892547e-06, 'epoch': 1.51} {'loss': 0.6487, 'learning_rate': 2.847353147245817e-06, 'epoch': 1.51} {'loss': 0.683, 'learning_rate': 2.8471243802637916e-06, 'epoch': 1.51} {'loss': 0.5714, 'learning_rate': 2.846895620946717e-06, 'epoch': 1.51} {'loss': 0.4787, 'learning_rate': 2.8466668692948384e-06, 'epoch': 1.51} {'loss': 0.3528, 'learning_rate': 2.846438125308404e-06, 'epoch': 1.51} {'loss': 0.5295, 'learning_rate': 2.8462093889876583e-06, 'epoch': 1.51} {'loss': 0.5779, 'learning_rate': 2.8459806603328387e-06, 'epoch': 1.51} {'loss': 0.3948, 'learning_rate': 2.8457519393442035e-06, 'epoch': 1.51} {'loss': 0.5217, 'learning_rate': 2.845523226021988e-06, 'epoch': 1.51} {'loss': 0.4778, 'learning_rate': 2.8452945203664393e-06, 'epoch': 1.51} {'loss': 0.4992, 'learning_rate': 2.845065822377806e-06, 'epoch': 1.51} {'loss': 0.5177, 'learning_rate': 2.844837132056325e-06, 'epoch': 1.51} {'loss': 0.5559, 'learning_rate': 2.844608449402253e-06, 'epoch': 1.51} {'loss': 0.5737, 'learning_rate': 2.844379774415822e-06, 'epoch': 1.51} {'loss': 0.4408, 'learning_rate': 2.8441511070972906e-06, 'epoch': 1.51} {'loss': 0.4154, 'learning_rate': 2.843922447446894e-06, 'epoch': 1.51} {'loss': 0.7069, 'learning_rate': 2.84369379546488e-06, 'epoch': 1.51} {'loss': 0.7735, 'learning_rate': 2.8434651511514976e-06, 'epoch': 1.51} {'loss': 0.3746, 'learning_rate': 2.843236514506983e-06, 'epoch': 1.51} {'loss': 0.4327, 'learning_rate': 2.8430078855315914e-06, 'epoch': 1.51} {'loss': 0.4194, 'learning_rate': 2.8427792642255592e-06, 'epoch': 1.51} {'loss': 0.3562, 'learning_rate': 2.8425506505891356e-06, 'epoch': 1.51} {'loss': 0.6396, 'learning_rate': 2.842322044622565e-06, 'epoch': 1.51} {'loss': 0.4862, 'learning_rate': 2.842093446326093e-06, 'epoch': 1.51} {'loss': 0.4578, 'learning_rate': 2.8418648556999664e-06, 'epoch': 1.51} {'loss': 0.5088, 'learning_rate': 2.841636272744421e-06, 'epoch': 1.51} {'loss': 0.4162, 'learning_rate': 2.8414076974597147e-06, 'epoch': 1.51} {'loss': 0.483, 'learning_rate': 2.8411791298460834e-06, 'epoch': 1.51} {'loss': 0.4423, 'learning_rate': 2.8409505699037754e-06, 'epoch': 1.51} {'loss': 0.6572, 'learning_rate': 2.840722017633034e-06, 'epoch': 1.51} {'loss': 0.5484, 'learning_rate': 2.840493473034106e-06, 'epoch': 1.51} {'loss': 0.5183, 'learning_rate': 2.8402649361072378e-06, 'epoch': 1.51} {'loss': 0.5638, 'learning_rate': 2.8400364068526653e-06, 'epoch': 1.51} {'loss': 0.4575, 'learning_rate': 2.839807885270648e-06, 'epoch': 1.51} {'loss': 0.5009, 'learning_rate': 2.8395793713614185e-06, 'epoch': 1.51} {'loss': 0.6469, 'learning_rate': 2.8393508651252256e-06, 'epoch': 1.51} {'loss': 0.4321, 'learning_rate': 2.8391223665623148e-06, 'epoch': 1.51} {'loss': 0.5024, 'learning_rate': 2.838893875672931e-06, 'epoch': 1.51} {'loss': 0.6267, 'learning_rate': 2.8386653924573214e-06, 'epoch': 1.51} {'loss': 0.5943, 'learning_rate': 2.8384369169157255e-06, 'epoch': 1.51} {'loss': 0.5287, 'learning_rate': 2.838208449048391e-06, 'epoch': 1.51} {'loss': 0.4937, 'learning_rate': 2.8379799888555626e-06, 'epoch': 1.51} {'loss': 0.5663, 'learning_rate': 2.8377515363374843e-06, 'epoch': 1.51} {'loss': 0.5114, 'learning_rate': 2.837523091494402e-06, 'epoch': 1.51} {'loss': 0.4489, 'learning_rate': 2.8372946543265602e-06, 'epoch': 1.51} {'loss': 0.5554, 'learning_rate': 2.8370662248342074e-06, 'epoch': 1.51} {'loss': 0.5185, 'learning_rate': 2.8368378030175803e-06, 'epoch': 1.51} {'loss': 0.4113, 'learning_rate': 2.836609388876929e-06, 'epoch': 1.51} {'loss': 0.4483, 'learning_rate': 2.8363809824124965e-06, 'epoch': 1.51} {'loss': 0.6031, 'learning_rate': 2.8361525836245298e-06, 'epoch': 1.51} {'loss': 0.5734, 'learning_rate': 2.835924192513271e-06, 'epoch': 1.51} {'loss': 0.7059, 'learning_rate': 2.8356958090789686e-06, 'epoch': 1.51} {'loss': 0.4002, 'learning_rate': 2.8354674333218625e-06, 'epoch': 1.51} {'loss': 0.5566, 'learning_rate': 2.835239065242199e-06, 'epoch': 1.51} {'loss': 0.3826, 'learning_rate': 2.8350107048402243e-06, 'epoch': 1.51} {'loss': 0.4525, 'learning_rate': 2.8347823521161823e-06, 'epoch': 1.51} {'loss': 0.5471, 'learning_rate': 2.834554007070317e-06, 'epoch': 1.51} {'loss': 0.5734, 'learning_rate': 2.8343256697028742e-06, 'epoch': 1.51} {'loss': 0.4543, 'learning_rate': 2.8340973400141016e-06, 'epoch': 1.51} {'loss': 0.5223, 'learning_rate': 2.833869018004237e-06, 'epoch': 1.51} {'loss': 0.5015, 'learning_rate': 2.833640703673529e-06, 'epoch': 1.51} {'loss': 0.5144, 'learning_rate': 2.8334123970222217e-06, 'epoch': 1.51} {'loss': 0.4048, 'learning_rate': 2.833184098050559e-06, 'epoch': 1.51} {'loss': 0.5729, 'learning_rate': 2.832955806758787e-06, 'epoch': 1.51} {'loss': 0.3868, 'learning_rate': 2.8327275231471495e-06, 'epoch': 1.51} {'loss': 0.6004, 'learning_rate': 2.832499247215895e-06, 'epoch': 1.51} {'loss': 0.6027, 'learning_rate': 2.8322709789652605e-06, 'epoch': 1.51} {'loss': 0.5498, 'learning_rate': 2.8320427183954957e-06, 'epoch': 1.51} {'loss': 0.5811, 'learning_rate': 2.8318144655068425e-06, 'epoch': 1.51} {'loss': 0.4966, 'learning_rate': 2.8315862202995482e-06, 'epoch': 1.51} {'loss': 0.4282, 'learning_rate': 2.831357982773859e-06, 'epoch': 1.51} {'loss': 0.7087, 'learning_rate': 2.8311297529300106e-06, 'epoch': 1.51} {'loss': 0.5753, 'learning_rate': 2.8309015307682607e-06, 'epoch': 1.51} {'loss': 0.4895, 'learning_rate': 2.830673316288842e-06, 'epoch': 1.51} {'loss': 0.6347, 'learning_rate': 2.830445109492006e-06, 'epoch': 1.51} {'loss': 0.6472, 'learning_rate': 2.830216910377994e-06, 'epoch': 1.51} {'loss': 0.5742, 'learning_rate': 2.829988718947051e-06, 'epoch': 1.51} {'loss': 0.5587, 'learning_rate': 2.8297605351994264e-06, 'epoch': 1.51} {'loss': 0.5368, 'learning_rate': 2.829532359135354e-06, 'epoch': 1.51} {'loss': 0.5296, 'learning_rate': 2.8293041907550912e-06, 'epoch': 1.51} {'loss': 0.6149, 'learning_rate': 2.829076030058873e-06, 'epoch': 1.51} {'loss': 0.5714, 'learning_rate': 2.8288478770469475e-06, 'epoch': 1.51} {'loss': 0.504, 'learning_rate': 2.8286197317195575e-06, 'epoch': 1.51} {'loss': 0.4736, 'learning_rate': 2.82839159407695e-06, 'epoch': 1.51} {'loss': 0.5058, 'learning_rate': 2.82816346411937e-06, 'epoch': 1.51} {'loss': 0.4869, 'learning_rate': 2.8279353418470578e-06, 'epoch': 1.51} {'loss': 0.5363, 'learning_rate': 2.827707227260261e-06, 'epoch': 1.51} {'loss': 0.5319, 'learning_rate': 2.827479120359222e-06, 'epoch': 1.51} {'loss': 0.6194, 'learning_rate': 2.827251021144187e-06, 'epoch': 1.51} {'loss': 0.4893, 'learning_rate': 2.8270229296154027e-06, 'epoch': 1.51} {'loss': 0.675, 'learning_rate': 2.826794845773105e-06, 'epoch': 1.51} {'loss': 0.4928, 'learning_rate': 2.8265667696175504e-06, 'epoch': 1.51} {'loss': 0.6619, 'learning_rate': 2.826338701148973e-06, 'epoch': 1.51} {'loss': 0.5128, 'learning_rate': 2.826110640367622e-06, 'epoch': 1.51} {'loss': 0.5504, 'learning_rate': 2.8258825872737407e-06, 'epoch': 1.51} {'loss': 0.565, 'learning_rate': 2.825654541867573e-06, 'epoch': 1.51} {'loss': 0.5151, 'learning_rate': 2.825426504149368e-06, 'epoch': 1.51} {'loss': 0.327, 'learning_rate': 2.8251984741193595e-06, 'epoch': 1.51} {'loss': 0.3471, 'learning_rate': 2.8249704517778042e-06, 'epoch': 1.51} {'loss': 0.5402, 'learning_rate': 2.8247424371249377e-06, 'epoch': 1.51} {'loss': 0.515, 'learning_rate': 2.8245144301610085e-06, 'epoch': 1.51} {'loss': 0.5874, 'learning_rate': 2.824286430886258e-06, 'epoch': 1.51} {'loss': 0.5371, 'learning_rate': 2.824058439300933e-06, 'epoch': 1.51} {'loss': 0.4556, 'learning_rate': 2.82383045540528e-06, 'epoch': 1.51} {'loss': 0.5325, 'learning_rate': 2.8236024791995344e-06, 'epoch': 1.51} {'loss': 0.5051, 'learning_rate': 2.823374510683953e-06, 'epoch': 1.51} {'loss': 0.5167, 'learning_rate': 2.8231465498587698e-06, 'epoch': 1.51} {'loss': 0.3642, 'learning_rate': 2.8229185967242325e-06, 'epoch': 1.51} {'loss': 0.6491, 'learning_rate': 2.8226906512805896e-06, 'epoch': 1.51} {'loss': 0.6629, 'learning_rate': 2.8224627135280745e-06, 'epoch': 1.51} {'loss': 0.3962, 'learning_rate': 2.822234783466945e-06, 'epoch': 1.51} {'loss': 0.3645, 'learning_rate': 2.8220068610974326e-06, 'epoch': 1.51} {'loss': 0.3922, 'learning_rate': 2.821778946419794e-06, 'epoch': 1.51} {'loss': 0.6334, 'learning_rate': 2.821551039434264e-06, 'epoch': 1.51} {'loss': 0.5076, 'learning_rate': 2.82132314014109e-06, 'epoch': 1.51} {'loss': 0.4693, 'learning_rate': 2.8210952485405198e-06, 'epoch': 1.51} {'loss': 0.6009, 'learning_rate': 2.8208673646327867e-06, 'epoch': 1.51} {'loss': 0.4365, 'learning_rate': 2.8206394884181486e-06, 'epoch': 1.51} {'loss': 0.6827, 'learning_rate': 2.8204116198968377e-06, 'epoch': 1.51} {'loss': 0.4316, 'learning_rate': 2.8201837590691096e-06, 'epoch': 1.51} {'loss': 0.6282, 'learning_rate': 2.819955905935199e-06, 'epoch': 1.51} {'loss': 0.5935, 'learning_rate': 2.8197280604953546e-06, 'epoch': 1.51} {'loss': 0.5114, 'learning_rate': 2.8195002227498224e-06, 'epoch': 1.51} {'loss': 0.451, 'learning_rate': 2.8192723926988374e-06, 'epoch': 1.51} {'loss': 0.4529, 'learning_rate': 2.8190445703426563e-06, 'epoch': 1.51} {'loss': 0.5104, 'learning_rate': 2.8188167556815116e-06, 'epoch': 1.51} {'loss': 0.4472, 'learning_rate': 2.8185889487156583e-06, 'epoch': 1.51} {'loss': 0.465, 'learning_rate': 2.818361149445332e-06, 'epoch': 1.51} {'loss': 0.53, 'learning_rate': 2.8181333578707803e-06, 'epoch': 1.51} {'loss': 0.5988, 'learning_rate': 2.817905573992249e-06, 'epoch': 1.51} {'loss': 0.5336, 'learning_rate': 2.8176777978099756e-06, 'epoch': 1.51} {'loss': 0.5776, 'learning_rate': 2.8174500293242133e-06, 'epoch': 1.51} {'loss': 0.4973, 'learning_rate': 2.817222268535196e-06, 'epoch': 1.51} {'loss': 0.5984, 'learning_rate': 2.81699451544318e-06, 'epoch': 1.51} {'loss': 0.479, 'learning_rate': 2.8167667700483993e-06, 'epoch': 1.51} {'loss': 0.6031, 'learning_rate': 2.816539032351101e-06, 'epoch': 1.51} {'loss': 0.5486, 'learning_rate': 2.8163113023515332e-06, 'epoch': 1.51} {'loss': 0.4841, 'learning_rate': 2.8160835800499285e-06, 'epoch': 1.51} {'loss': 0.5055, 'learning_rate': 2.8158558654465463e-06, 'epoch': 1.51} {'loss': 0.5539, 'learning_rate': 2.81562815854162e-06, 'epoch': 1.51} {'loss': 0.6494, 'learning_rate': 2.8154004593353957e-06, 'epoch': 1.51} {'loss': 0.5702, 'learning_rate': 2.815172767828118e-06, 'epoch': 1.51} {'loss': 0.4807, 'learning_rate': 2.814945084020032e-06, 'epoch': 1.51} {'loss': 0.3951, 'learning_rate': 2.814717407911384e-06, 'epoch': 1.51} {'loss': 0.5339, 'learning_rate': 2.8144897395024083e-06, 'epoch': 1.51} {'loss': 0.5914, 'learning_rate': 2.8142620787933617e-06, 'epoch': 1.51} {'loss': 0.6502, 'learning_rate': 2.8140344257844786e-06, 'epoch': 1.51} {'loss': 0.5294, 'learning_rate': 2.813806780476006e-06, 'epoch': 1.51} {'loss': 0.4522, 'learning_rate': 2.813579142868188e-06, 'epoch': 1.51} {'loss': 0.5759, 'learning_rate': 2.813351512961269e-06, 'epoch': 1.51} {'loss': 0.5137, 'learning_rate': 2.813123890755495e-06, 'epoch': 1.51} {'loss': 0.4584, 'learning_rate': 2.8128962762511015e-06, 'epoch': 1.51} {'loss': 0.5438, 'learning_rate': 2.812668669448345e-06, 'epoch': 1.51} {'loss': 0.5212, 'learning_rate': 2.8124410703474593e-06, 'epoch': 1.51} {'loss': 0.6882, 'learning_rate': 2.8122134789486912e-06, 'epoch': 1.51} {'loss': 0.5835, 'learning_rate': 2.811985895252286e-06, 'epoch': 1.51} {'loss': 0.4091, 'learning_rate': 2.8117583192584852e-06, 'epoch': 1.51} {'loss': 0.6177, 'learning_rate': 2.8115307509675383e-06, 'epoch': 1.51} {'loss': 0.6411, 'learning_rate': 2.8113031903796817e-06, 'epoch': 1.51} {'loss': 0.5459, 'learning_rate': 2.8110756374951633e-06, 'epoch': 1.51} {'loss': 0.7106, 'learning_rate': 2.8108480923142257e-06, 'epoch': 1.51} {'loss': 0.5115, 'learning_rate': 2.8106205548371126e-06, 'epoch': 1.51} {'loss': 0.5272, 'learning_rate': 2.8103930250640685e-06, 'epoch': 1.51} {'loss': 0.4823, 'learning_rate': 2.810165502995338e-06, 'epoch': 1.51} {'loss': 0.4458, 'learning_rate': 2.809937988631167e-06, 'epoch': 1.51} {'loss': 0.6024, 'learning_rate': 2.8097104819717935e-06, 'epoch': 1.51} {'loss': 0.6061, 'learning_rate': 2.809482983017463e-06, 'epoch': 1.51} {'loss': 0.4245, 'learning_rate': 2.809255491768421e-06, 'epoch': 1.51} {'loss': 0.5899, 'learning_rate': 2.8090280082249123e-06, 'epoch': 1.51} {'loss': 0.4971, 'learning_rate': 2.8088005323871804e-06, 'epoch': 1.51} {'loss': 0.4464, 'learning_rate': 2.808573064255462e-06, 'epoch': 1.51} {'loss': 0.6376, 'learning_rate': 2.808345603830013e-06, 'epoch': 1.51} {'loss': 0.5142, 'learning_rate': 2.8081181511110678e-06, 'epoch': 1.51} {'loss': 0.3853, 'learning_rate': 2.8078907060988727e-06, 'epoch': 1.51} {'loss': 0.5303, 'learning_rate': 2.8076632687936724e-06, 'epoch': 1.51} {'loss': 0.6603, 'learning_rate': 2.807435839195709e-06, 'epoch': 1.51} {'loss': 0.5507, 'learning_rate': 2.8072084173052316e-06, 'epoch': 1.51} {'loss': 0.6531, 'learning_rate': 2.8069810031224752e-06, 'epoch': 1.51} {'loss': 0.5324, 'learning_rate': 2.806753596647689e-06, 'epoch': 1.51} {'loss': 0.5858, 'learning_rate': 2.8065261978811152e-06, 'epoch': 1.51} {'loss': 0.4933, 'learning_rate': 2.806298806822998e-06, 'epoch': 1.51} {'loss': 0.6858, 'learning_rate': 2.80607142347358e-06, 'epoch': 1.51} {'loss': 0.5055, 'learning_rate': 2.805844047833106e-06, 'epoch': 1.51} {'loss': 0.3979, 'learning_rate': 2.8056166799018236e-06, 'epoch': 1.51} {'loss': 0.5259, 'learning_rate': 2.8053893196799686e-06, 'epoch': 1.51} {'loss': 0.6731, 'learning_rate': 2.8051619671677875e-06, 'epoch': 1.51} {'loss': 0.4813, 'learning_rate': 2.804934622365526e-06, 'epoch': 1.51} {'loss': 0.6278, 'learning_rate': 2.8047072852734257e-06, 'epoch': 1.51} {'loss': 0.5194, 'learning_rate': 2.804479955891731e-06, 'epoch': 1.51} {'loss': 0.4421, 'learning_rate': 2.8042526342206854e-06, 'epoch': 1.51} {'loss': 0.4214, 'learning_rate': 2.804025320260536e-06, 'epoch': 1.51} {'loss': 0.3647, 'learning_rate': 2.8037980140115204e-06, 'epoch': 1.51} {'loss': 0.3995, 'learning_rate': 2.8035707154738835e-06, 'epoch': 1.51} {'loss': 0.4641, 'learning_rate': 2.803343424647871e-06, 'epoch': 1.51} {'loss': 0.4827, 'learning_rate': 2.803116141533725e-06, 'epoch': 1.51} {'loss': 0.575, 'learning_rate': 2.80288886613169e-06, 'epoch': 1.51} {'loss': 0.4302, 'learning_rate': 2.8026615984420115e-06, 'epoch': 1.51} {'loss': 0.5742, 'learning_rate': 2.8024343384649287e-06, 'epoch': 1.51} {'loss': 0.6414, 'learning_rate': 2.802207086200687e-06, 'epoch': 1.51} {'loss': 0.4464, 'learning_rate': 2.801979841649529e-06, 'epoch': 1.51} {'loss': 0.5015, 'learning_rate': 2.8017526048117007e-06, 'epoch': 1.51} {'loss': 0.5408, 'learning_rate': 2.8015253756874426e-06, 'epoch': 1.51} {'loss': 0.5511, 'learning_rate': 2.801298154277e-06, 'epoch': 1.51} {'loss': 0.4826, 'learning_rate': 2.80107094058062e-06, 'epoch': 1.51} {'loss': 0.5725, 'learning_rate': 2.8008437345985397e-06, 'epoch': 1.51} {'loss': 0.6063, 'learning_rate': 2.8006165363310033e-06, 'epoch': 1.51} {'loss': 0.533, 'learning_rate': 2.8003893457782574e-06, 'epoch': 1.51} {'loss': 0.4091, 'learning_rate': 2.800162162940544e-06, 'epoch': 1.51} {'loss': 0.5013, 'learning_rate': 2.799934987818106e-06, 'epoch': 1.51} {'loss': 0.6632, 'learning_rate': 2.7997078204111884e-06, 'epoch': 1.51} {'loss': 0.5662, 'learning_rate': 2.7994806607200366e-06, 'epoch': 1.51} {'loss': 0.5776, 'learning_rate': 2.799253508744888e-06, 'epoch': 1.51} {'loss': 0.5048, 'learning_rate': 2.7990263644859883e-06, 'epoch': 1.51} {'loss': 0.6042, 'learning_rate': 2.798799227943583e-06, 'epoch': 1.51} {'loss': 0.5687, 'learning_rate': 2.7985720991179132e-06, 'epoch': 1.51} {'loss': 0.5073, 'learning_rate': 2.7983449780092274e-06, 'epoch': 1.51} {'loss': 0.6314, 'learning_rate': 2.798117864617759e-06, 'epoch': 1.51} {'loss': 0.5872, 'learning_rate': 2.797890758943762e-06, 'epoch': 1.51} {'loss': 0.5882, 'learning_rate': 2.797663660987473e-06, 'epoch': 1.51} {'loss': 0.3874, 'learning_rate': 2.797436570749138e-06, 'epoch': 1.51} {'loss': 0.4877, 'learning_rate': 2.797209488228999e-06, 'epoch': 1.51} {'loss': 0.3888, 'learning_rate': 2.7969824134273003e-06, 'epoch': 1.51} {'loss': 0.5442, 'learning_rate': 2.7967553463442876e-06, 'epoch': 1.51} {'loss': 0.6693, 'learning_rate': 2.796528286980197e-06, 'epoch': 1.51} {'loss': 0.5339, 'learning_rate': 2.796301235335281e-06, 'epoch': 1.51} {'loss': 0.4837, 'learning_rate': 2.7960741914097754e-06, 'epoch': 1.51} {'loss': 0.5788, 'learning_rate': 2.795847155203928e-06, 'epoch': 1.51} {'loss': 0.4158, 'learning_rate': 2.7956201267179793e-06, 'epoch': 1.51} {'loss': 0.4915, 'learning_rate': 2.7953931059521745e-06, 'epoch': 1.51} {'loss': 0.5175, 'learning_rate': 2.795166092906759e-06, 'epoch': 1.51} {'loss': 0.441, 'learning_rate': 2.7949390875819673e-06, 'epoch': 1.51} {'loss': 0.5407, 'learning_rate': 2.7947120899780544e-06, 'epoch': 1.51} {'loss': 0.5628, 'learning_rate': 2.7944851000952555e-06, 'epoch': 1.51} {'loss': 0.5781, 'learning_rate': 2.794258117933816e-06, 'epoch': 1.51} {'loss': 0.5181, 'learning_rate': 2.7940311434939814e-06, 'epoch': 1.51} {'loss': 0.5959, 'learning_rate': 2.793804176775987e-06, 'epoch': 1.51} {'loss': 0.6771, 'learning_rate': 2.793577217780089e-06, 'epoch': 1.51} {'loss': 0.6187, 'learning_rate': 2.7933502665065194e-06, 'epoch': 1.51} {'loss': 0.6328, 'learning_rate': 2.7931233229555253e-06, 'epoch': 1.51} {'loss': 0.5835, 'learning_rate': 2.7928963871273507e-06, 'epoch': 1.51} {'loss': 0.4163, 'learning_rate': 2.7926694590222382e-06, 'epoch': 1.51} {'loss': 0.3641, 'learning_rate': 2.7924425386404332e-06, 'epoch': 1.51} {'loss': 0.409, 'learning_rate': 2.792215625982171e-06, 'epoch': 1.51} {'loss': 0.5156, 'learning_rate': 2.791988721047706e-06, 'epoch': 1.51} {'loss': 0.4835, 'learning_rate': 2.7917618238372736e-06, 'epoch': 1.51} {'loss': 0.4355, 'learning_rate': 2.7915349343511178e-06, 'epoch': 1.51} {'loss': 0.532, 'learning_rate': 2.791308052589483e-06, 'epoch': 1.51} {'loss': 0.5334, 'learning_rate': 2.7910811785526127e-06, 'epoch': 1.51} {'loss': 0.6056, 'learning_rate': 2.7908543122407527e-06, 'epoch': 1.51} {'loss': 0.5742, 'learning_rate': 2.790627453654137e-06, 'epoch': 1.51} {'loss': 0.4406, 'learning_rate': 2.7904006027930196e-06, 'epoch': 1.51} {'loss': 0.415, 'learning_rate': 2.790173759657636e-06, 'epoch': 1.51} {'loss': 0.3877, 'learning_rate': 2.7899469242482337e-06, 'epoch': 1.51} {'loss': 0.3096, 'learning_rate': 2.789720096565055e-06, 'epoch': 1.51} {'loss': 0.5425, 'learning_rate': 2.7894932766083373e-06, 'epoch': 1.51} {'loss': 0.4236, 'learning_rate': 2.789266464378333e-06, 'epoch': 1.51} {'loss': 0.5499, 'learning_rate': 2.7890396598752754e-06, 'epoch': 1.51} {'loss': 0.6337, 'learning_rate': 2.7888128630994184e-06, 'epoch': 1.51} {'loss': 0.5273, 'learning_rate': 2.7885860740509964e-06, 'epoch': 1.51} {'loss': 0.5367, 'learning_rate': 2.788359292730255e-06, 'epoch': 1.51} {'loss': 0.6177, 'learning_rate': 2.7881325191374408e-06, 'epoch': 1.51} {'loss': 0.494, 'learning_rate': 2.787905753272787e-06, 'epoch': 1.51} {'loss': 0.4972, 'learning_rate': 2.7876789951365503e-06, 'epoch': 1.51} {'loss': 0.4305, 'learning_rate': 2.78745224472896e-06, 'epoch': 1.51} {'loss': 0.6141, 'learning_rate': 2.7872255020502703e-06, 'epoch': 1.51} {'loss': 0.4039, 'learning_rate': 2.786998767100718e-06, 'epoch': 1.51} {'loss': 0.5759, 'learning_rate': 2.7867720398805475e-06, 'epoch': 1.51} {'loss': 0.5874, 'learning_rate': 2.786545320390004e-06, 'epoch': 1.51} {'loss': 0.4212, 'learning_rate': 2.7863186086293227e-06, 'epoch': 1.51} {'loss': 0.5397, 'learning_rate': 2.7860919045987576e-06, 'epoch': 1.51} {'loss': 0.4623, 'learning_rate': 2.7858652082985404e-06, 'epoch': 1.51} {'loss': 0.4606, 'learning_rate': 2.7856385197289258e-06, 'epoch': 1.51} {'loss': 0.624, 'learning_rate': 2.7854118388901486e-06, 'epoch': 1.51} {'loss': 0.4561, 'learning_rate': 2.7851851657824525e-06, 'epoch': 1.51} {'loss': 0.4689, 'learning_rate': 2.784958500406085e-06, 'epoch': 1.51} {'loss': 0.5052, 'learning_rate': 2.7847318427612792e-06, 'epoch': 1.51} {'loss': 0.417, 'learning_rate': 2.784505192848291e-06, 'epoch': 1.51} {'loss': 0.5778, 'learning_rate': 2.7842785506673507e-06, 'epoch': 1.51} {'loss': 0.4866, 'learning_rate': 2.784051916218713e-06, 'epoch': 1.51} {'loss': 0.3788, 'learning_rate': 2.783825289502613e-06, 'epoch': 1.51} {'loss': 0.4397, 'learning_rate': 2.7835986705192943e-06, 'epoch': 1.51} {'loss': 0.4275, 'learning_rate': 2.783372059269004e-06, 'epoch': 1.51} {'loss': 0.5995, 'learning_rate': 2.7831454557519767e-06, 'epoch': 1.51} {'loss': 0.5697, 'learning_rate': 2.7829188599684653e-06, 'epoch': 1.51} {'loss': 0.4569, 'learning_rate': 2.7826922719187056e-06, 'epoch': 1.51} {'loss': 0.4229, 'learning_rate': 2.7824656916029424e-06, 'epoch': 1.51} {'loss': 0.4054, 'learning_rate': 2.782239119021418e-06, 'epoch': 1.51} {'loss': 0.5368, 'learning_rate': 2.7820125541743768e-06, 'epoch': 1.51} {'loss': 0.351, 'learning_rate': 2.781785997062063e-06, 'epoch': 1.51} {'loss': 0.4433, 'learning_rate': 2.7815594476847107e-06, 'epoch': 1.51} {'loss': 0.5306, 'learning_rate': 2.7813329060425754e-06, 'epoch': 1.51} {'loss': 0.3326, 'learning_rate': 2.78110637213589e-06, 'epoch': 1.51} {'loss': 0.5303, 'learning_rate': 2.780879845964901e-06, 'epoch': 1.51} {'loss': 0.7389, 'learning_rate': 2.780653327529851e-06, 'epoch': 1.52} {'loss': 0.6497, 'learning_rate': 2.780426816830982e-06, 'epoch': 1.52} {'loss': 0.5474, 'learning_rate': 2.780200313868542e-06, 'epoch': 1.52} {'loss': 0.513, 'learning_rate': 2.7799738186427605e-06, 'epoch': 1.52} {'loss': 0.4019, 'learning_rate': 2.779747331153896e-06, 'epoch': 1.52} {'loss': 0.411, 'learning_rate': 2.779520851402181e-06, 'epoch': 1.52} {'loss': 0.4403, 'learning_rate': 2.7792943793878613e-06, 'epoch': 1.52} {'loss': 0.5032, 'learning_rate': 2.779067915111179e-06, 'epoch': 1.52} {'loss': 0.4875, 'learning_rate': 2.778841458572377e-06, 'epoch': 1.52} {'loss': 0.5822, 'learning_rate': 2.7786150097717013e-06, 'epoch': 1.52} {'loss': 0.5649, 'learning_rate': 2.778388568709388e-06, 'epoch': 1.52} {'loss': 0.5023, 'learning_rate': 2.7781621353856836e-06, 'epoch': 1.52} {'loss': 0.436, 'learning_rate': 2.77793570980083e-06, 'epoch': 1.52} {'loss': 0.7006, 'learning_rate': 2.7777092919550695e-06, 'epoch': 1.52} {'loss': 0.5169, 'learning_rate': 2.7774828818486467e-06, 'epoch': 1.52} {'loss': 0.6093, 'learning_rate': 2.7772564794818024e-06, 'epoch': 1.52} {'loss': 0.588, 'learning_rate': 2.7770300848547826e-06, 'epoch': 1.52} {'loss': 0.3788, 'learning_rate': 2.7768036979678237e-06, 'epoch': 1.52} {'loss': 0.4748, 'learning_rate': 2.776577318821172e-06, 'epoch': 1.52} {'loss': 0.5054, 'learning_rate': 2.7763509474150697e-06, 'epoch': 1.52} {'loss': 0.5589, 'learning_rate': 2.7761245837497587e-06, 'epoch': 1.52} {'loss': 0.6232, 'learning_rate': 2.775898227825482e-06, 'epoch': 1.52} {'loss': 0.5154, 'learning_rate': 2.775671879642483e-06, 'epoch': 1.52} {'loss': 0.3491, 'learning_rate': 2.775445539201007e-06, 'epoch': 1.52} {'loss': 0.3167, 'learning_rate': 2.7752192065012895e-06, 'epoch': 1.52} {'loss': 0.5849, 'learning_rate': 2.7749928815435766e-06, 'epoch': 1.52} {'loss': 0.5805, 'learning_rate': 2.7747665643281117e-06, 'epoch': 1.52} {'loss': 0.6299, 'learning_rate': 2.774540254855136e-06, 'epoch': 1.52} {'loss': 0.5165, 'learning_rate': 2.7743139531248954e-06, 'epoch': 1.52} {'loss': 0.5464, 'learning_rate': 2.7740876591376277e-06, 'epoch': 1.52} {'loss': 0.493, 'learning_rate': 2.773861372893576e-06, 'epoch': 1.52} {'loss': 0.4989, 'learning_rate': 2.773635094392985e-06, 'epoch': 1.52} {'loss': 0.4134, 'learning_rate': 2.7734088236360946e-06, 'epoch': 1.52} {'loss': 0.4318, 'learning_rate': 2.77318256062315e-06, 'epoch': 1.52} {'loss': 0.5989, 'learning_rate': 2.772956305354393e-06, 'epoch': 1.52} {'loss': 0.5205, 'learning_rate': 2.7727300578300675e-06, 'epoch': 1.52} {'loss': 0.4126, 'learning_rate': 2.7725038180504114e-06, 'epoch': 1.52} {'loss': 0.415, 'learning_rate': 2.7722775860156705e-06, 'epoch': 1.52} {'loss': 0.5671, 'learning_rate': 2.7720513617260857e-06, 'epoch': 1.52} {'loss': 0.5028, 'learning_rate': 2.7718251451819002e-06, 'epoch': 1.52} {'loss': 0.7033, 'learning_rate': 2.771598936383357e-06, 'epoch': 1.52} {'loss': 0.5254, 'learning_rate': 2.771372735330701e-06, 'epoch': 1.52} {'loss': 0.4676, 'learning_rate': 2.771146542024168e-06, 'epoch': 1.52} {'loss': 0.5006, 'learning_rate': 2.770920356464004e-06, 'epoch': 1.52} {'loss': 0.5723, 'learning_rate': 2.7706941786504517e-06, 'epoch': 1.52} {'loss': 0.5287, 'learning_rate': 2.7704680085837522e-06, 'epoch': 1.52} {'loss': 0.4606, 'learning_rate': 2.77024184626415e-06, 'epoch': 1.52} {'loss': 0.4656, 'learning_rate': 2.7700156916918853e-06, 'epoch': 1.52} {'loss': 0.4307, 'learning_rate': 2.769789544867204e-06, 'epoch': 1.52} {'loss': 0.4426, 'learning_rate': 2.7695634057903443e-06, 'epoch': 1.52} {'loss': 0.6453, 'learning_rate': 2.769337274461549e-06, 'epoch': 1.52} {'loss': 0.4149, 'learning_rate': 2.7691111508810607e-06, 'epoch': 1.52} {'loss': 0.5992, 'learning_rate': 2.7688850350491236e-06, 'epoch': 1.52} {'loss': 0.7589, 'learning_rate': 2.768658926965978e-06, 'epoch': 1.52} {'loss': 0.592, 'learning_rate': 2.7684328266318683e-06, 'epoch': 1.52} {'loss': 0.5389, 'learning_rate': 2.7682067340470375e-06, 'epoch': 1.52} {'loss': 0.5303, 'learning_rate': 2.7679806492117223e-06, 'epoch': 1.52} {'loss': 0.5618, 'learning_rate': 2.76775457212617e-06, 'epoch': 1.52} {'loss': 0.5482, 'learning_rate': 2.7675285027906206e-06, 'epoch': 1.52} {'loss': 0.5446, 'learning_rate': 2.7673024412053174e-06, 'epoch': 1.52} {'loss': 0.5856, 'learning_rate': 2.7670763873705055e-06, 'epoch': 1.52} {'loss': 0.5054, 'learning_rate': 2.7668503412864177e-06, 'epoch': 1.52} {'loss': 0.4946, 'learning_rate': 2.766624302953309e-06, 'epoch': 1.52} {'loss': 0.5447, 'learning_rate': 2.766398272371412e-06, 'epoch': 1.52} {'loss': 0.4786, 'learning_rate': 2.7661722495409715e-06, 'epoch': 1.52} {'loss': 0.4596, 'learning_rate': 2.7659462344622312e-06, 'epoch': 1.52} {'loss': 0.4845, 'learning_rate': 2.7657202271354324e-06, 'epoch': 1.52} {'loss': 0.3533, 'learning_rate': 2.76549422756082e-06, 'epoch': 1.52} {'loss': 0.4756, 'learning_rate': 2.7652682357386272e-06, 'epoch': 1.52} {'loss': 0.4498, 'learning_rate': 2.76504225166911e-06, 'epoch': 1.52} {'loss': 0.5997, 'learning_rate': 2.7648162753524987e-06, 'epoch': 1.52} {'loss': 0.4734, 'learning_rate': 2.76459030678904e-06, 'epoch': 1.52} {'loss': 0.4985, 'learning_rate': 2.7643643459789747e-06, 'epoch': 1.52} {'loss': 0.4321, 'learning_rate': 2.7641383929225475e-06, 'epoch': 1.52} {'loss': 0.7062, 'learning_rate': 2.7639124476200017e-06, 'epoch': 1.52} {'loss': 0.508, 'learning_rate': 2.7636865100715716e-06, 'epoch': 1.52} {'loss': 0.4892, 'learning_rate': 2.763460580277509e-06, 'epoch': 1.52} {'loss': 0.6221, 'learning_rate': 2.76323465823805e-06, 'epoch': 1.52} {'loss': 0.5804, 'learning_rate': 2.763008743953437e-06, 'epoch': 1.52} {'loss': 0.5829, 'learning_rate': 2.7627828374239175e-06, 'epoch': 1.52} {'loss': 0.6251, 'learning_rate': 2.762556938649722e-06, 'epoch': 1.52} {'loss': 0.5053, 'learning_rate': 2.762331047631107e-06, 'epoch': 1.52} {'loss': 0.6748, 'learning_rate': 2.7621051643683004e-06, 'epoch': 1.52} {'loss': 0.4669, 'learning_rate': 2.7618792888615587e-06, 'epoch': 1.52} {'loss': 0.5494, 'learning_rate': 2.7616534211111134e-06, 'epoch': 1.52} {'loss': 0.4738, 'learning_rate': 2.7614275611172093e-06, 'epoch': 1.52} {'loss': 0.6039, 'learning_rate': 2.7612017088800924e-06, 'epoch': 1.52} {'loss': 0.5393, 'learning_rate': 2.7609758643999952e-06, 'epoch': 1.52} {'loss': 0.5275, 'learning_rate': 2.7607500276771702e-06, 'epoch': 1.52} {'loss': 0.4889, 'learning_rate': 2.7605241987118503e-06, 'epoch': 1.52} {'loss': 0.4459, 'learning_rate': 2.760298377504288e-06, 'epoch': 1.52} {'loss': 0.627, 'learning_rate': 2.7600725640547167e-06, 'epoch': 1.52} {'loss': 0.6698, 'learning_rate': 2.7598467583633803e-06, 'epoch': 1.52} {'loss': 0.4009, 'learning_rate': 2.7596209604305257e-06, 'epoch': 1.52} {'loss': 0.4464, 'learning_rate': 2.7593951702563836e-06, 'epoch': 1.52} {'loss': 0.355, 'learning_rate': 2.7591693878412094e-06, 'epoch': 1.52} {'loss': 0.4543, 'learning_rate': 2.758943613185233e-06, 'epoch': 1.52} {'loss': 0.5341, 'learning_rate': 2.7587178462887075e-06, 'epoch': 1.52} {'loss': 0.5153, 'learning_rate': 2.758492087151867e-06, 'epoch': 1.52} {'loss': 0.6472, 'learning_rate': 2.7582663357749562e-06, 'epoch': 1.52} {'loss': 0.4449, 'learning_rate': 2.7580405921582185e-06, 'epoch': 1.52} {'loss': 0.4883, 'learning_rate': 2.757814856301889e-06, 'epoch': 1.52} {'loss': 0.5305, 'learning_rate': 2.7575891282062195e-06, 'epoch': 1.52} {'loss': 0.5757, 'learning_rate': 2.7573634078714453e-06, 'epoch': 1.52} {'loss': 0.4364, 'learning_rate': 2.7571376952978078e-06, 'epoch': 1.52} {'loss': 0.4836, 'learning_rate': 2.7569119904855522e-06, 'epoch': 1.52} {'loss': 0.4787, 'learning_rate': 2.756686293434919e-06, 'epoch': 1.52} {'loss': 0.6057, 'learning_rate': 2.756460604146154e-06, 'epoch': 1.52} {'loss': 0.4742, 'learning_rate': 2.7562349226194884e-06, 'epoch': 1.52} {'loss': 0.5957, 'learning_rate': 2.7560092488551772e-06, 'epoch': 1.52} {'loss': 0.5056, 'learning_rate': 2.755783582853453e-06, 'epoch': 1.52} {'loss': 0.4275, 'learning_rate': 2.7555579246145603e-06, 'epoch': 1.52} {'loss': 0.4704, 'learning_rate': 2.75533227413874e-06, 'epoch': 1.52} {'loss': 0.5869, 'learning_rate': 2.7551066314262364e-06, 'epoch': 1.52} {'loss': 0.4465, 'learning_rate': 2.7548809964772927e-06, 'epoch': 1.52} {'loss': 0.4401, 'learning_rate': 2.754655369292142e-06, 'epoch': 1.52} {'loss': 0.5342, 'learning_rate': 2.7544297498710384e-06, 'epoch': 1.52} {'loss': 0.4089, 'learning_rate': 2.7542041382142136e-06, 'epoch': 1.52} {'loss': 0.396, 'learning_rate': 2.753978534321913e-06, 'epoch': 1.52} {'loss': 0.5343, 'learning_rate': 2.7537529381943817e-06, 'epoch': 1.52} {'loss': 0.6176, 'learning_rate': 2.7535273498318516e-06, 'epoch': 1.52} {'loss': 0.4812, 'learning_rate': 2.7533017692345777e-06, 'epoch': 1.52} {'loss': 0.6242, 'learning_rate': 2.7530761964027887e-06, 'epoch': 1.52} {'loss': 0.5338, 'learning_rate': 2.752850631336739e-06, 'epoch': 1.52} {'loss': 0.6073, 'learning_rate': 2.75262507403666e-06, 'epoch': 1.52} {'loss': 0.4051, 'learning_rate': 2.752399524502798e-06, 'epoch': 1.52} {'loss': 0.6487, 'learning_rate': 2.7521739827353965e-06, 'epoch': 1.52} {'loss': 0.6021, 'learning_rate': 2.751948448734689e-06, 'epoch': 1.52} {'loss': 0.5702, 'learning_rate': 2.75172292250093e-06, 'epoch': 1.52} {'loss': 0.495, 'learning_rate': 2.75149740403435e-06, 'epoch': 1.52} {'loss': 0.6265, 'learning_rate': 2.7512718933351945e-06, 'epoch': 1.52} {'loss': 0.5028, 'learning_rate': 2.7510463904037064e-06, 'epoch': 1.52} {'loss': 0.5151, 'learning_rate': 2.750820895240126e-06, 'epoch': 1.52} {'loss': 0.5446, 'learning_rate': 2.7505954078446985e-06, 'epoch': 1.52} {'loss': 0.3635, 'learning_rate': 2.7503699282176554e-06, 'epoch': 1.52} {'loss': 0.4454, 'learning_rate': 2.7501444563592517e-06, 'epoch': 1.52} {'loss': 0.4151, 'learning_rate': 2.74991899226972e-06, 'epoch': 1.52} {'loss': 0.4932, 'learning_rate': 2.7496935359493038e-06, 'epoch': 1.52} {'loss': 0.5278, 'learning_rate': 2.749468087398246e-06, 'epoch': 1.52} {'loss': 0.5529, 'learning_rate': 2.7492426466167867e-06, 'epoch': 1.52} {'loss': 0.557, 'learning_rate': 2.749017213605172e-06, 'epoch': 1.52} {'loss': 0.5269, 'learning_rate': 2.748791788363634e-06, 'epoch': 1.52} {'loss': 0.4517, 'learning_rate': 2.748566370892425e-06, 'epoch': 1.52} {'loss': 0.5821, 'learning_rate': 2.74834096119178e-06, 'epoch': 1.52} {'loss': 0.3708, 'learning_rate': 2.7481155592619413e-06, 'epoch': 1.52} {'loss': 0.652, 'learning_rate': 2.747890165103151e-06, 'epoch': 1.52} {'loss': 0.4842, 'learning_rate': 2.7476647787156517e-06, 'epoch': 1.52} {'loss': 0.3429, 'learning_rate': 2.7474394000996864e-06, 'epoch': 1.52} {'loss': 0.6128, 'learning_rate': 2.7472140292554915e-06, 'epoch': 1.52} {'loss': 0.488, 'learning_rate': 2.746988666183312e-06, 'epoch': 1.52} {'loss': 0.5213, 'learning_rate': 2.746763310883389e-06, 'epoch': 1.52} {'loss': 0.543, 'learning_rate': 2.746537963355963e-06, 'epoch': 1.52} {'loss': 0.4992, 'learning_rate': 2.746312623601276e-06, 'epoch': 1.52} {'loss': 0.4576, 'learning_rate': 2.7460872916195703e-06, 'epoch': 1.52} {'loss': 0.4585, 'learning_rate': 2.7458619674110897e-06, 'epoch': 1.52} {'loss': 0.3684, 'learning_rate': 2.74563665097607e-06, 'epoch': 1.52} {'loss': 0.5688, 'learning_rate': 2.7454113423147543e-06, 'epoch': 1.52} {'loss': 0.5183, 'learning_rate': 2.7451860414273866e-06, 'epoch': 1.52} {'loss': 0.478, 'learning_rate': 2.744960748314206e-06, 'epoch': 1.52} {'loss': 0.5859, 'learning_rate': 2.744735462975454e-06, 'epoch': 1.52} {'loss': 0.3173, 'learning_rate': 2.7445101854113744e-06, 'epoch': 1.52} {'loss': 0.6646, 'learning_rate': 2.7442849156222094e-06, 'epoch': 1.52} {'loss': 0.4792, 'learning_rate': 2.7440596536081944e-06, 'epoch': 1.52} {'loss': 0.6008, 'learning_rate': 2.7438343993695747e-06, 'epoch': 1.52} {'loss': 0.5706, 'learning_rate': 2.7436091529065913e-06, 'epoch': 1.52} {'loss': 0.4987, 'learning_rate': 2.7433839142194863e-06, 'epoch': 1.52} {'loss': 0.5185, 'learning_rate': 2.7431586833085e-06, 'epoch': 1.52} {'loss': 0.5224, 'learning_rate': 2.7429334601738767e-06, 'epoch': 1.52} {'loss': 0.6043, 'learning_rate': 2.7427082448158527e-06, 'epoch': 1.52} {'loss': 0.5325, 'learning_rate': 2.742483037234671e-06, 'epoch': 1.52} {'loss': 0.5187, 'learning_rate': 2.742257837430574e-06, 'epoch': 1.52} {'loss': 0.4835, 'learning_rate': 2.742032645403804e-06, 'epoch': 1.52} {'loss': 0.5082, 'learning_rate': 2.7418074611545996e-06, 'epoch': 1.52} {'loss': 0.5605, 'learning_rate': 2.741582284683204e-06, 'epoch': 1.52} {'loss': 0.4716, 'learning_rate': 2.7413571159898623e-06, 'epoch': 1.52} {'loss': 0.4987, 'learning_rate': 2.7411319550748073e-06, 'epoch': 1.52} {'loss': 0.6303, 'learning_rate': 2.7409068019382845e-06, 'epoch': 1.52} {'loss': 0.554, 'learning_rate': 2.7406816565805363e-06, 'epoch': 1.52} {'loss': 0.4807, 'learning_rate': 2.740456519001802e-06, 'epoch': 1.52} {'loss': 0.5105, 'learning_rate': 2.7402313892023234e-06, 'epoch': 1.52} {'loss': 0.436, 'learning_rate': 2.7400062671823425e-06, 'epoch': 1.52} {'loss': 0.4993, 'learning_rate': 2.7397811529421037e-06, 'epoch': 1.52} {'loss': 0.5341, 'learning_rate': 2.7395560464818415e-06, 'epoch': 1.52} {'loss': 0.5714, 'learning_rate': 2.739330947801799e-06, 'epoch': 1.52} {'loss': 0.443, 'learning_rate': 2.73910585690222e-06, 'epoch': 1.52} {'loss': 0.4418, 'learning_rate': 2.7388807737833443e-06, 'epoch': 1.52} {'loss': 0.416, 'learning_rate': 2.738655698445416e-06, 'epoch': 1.52} {'loss': 0.505, 'learning_rate': 2.738430630888671e-06, 'epoch': 1.52} {'loss': 0.6065, 'learning_rate': 2.738205571113353e-06, 'epoch': 1.52} {'loss': 0.5303, 'learning_rate': 2.737980519119702e-06, 'epoch': 1.52} {'loss': 0.6041, 'learning_rate': 2.7377554749079616e-06, 'epoch': 1.52} {'loss': 0.6133, 'learning_rate': 2.737530438478371e-06, 'epoch': 1.52} {'loss': 0.5304, 'learning_rate': 2.7373054098311715e-06, 'epoch': 1.52} {'loss': 0.4218, 'learning_rate': 2.7370803889666086e-06, 'epoch': 1.52} {'loss': 0.5692, 'learning_rate': 2.736855375884916e-06, 'epoch': 1.52} {'loss': 0.5817, 'learning_rate': 2.7366303705863395e-06, 'epoch': 1.52} {'loss': 0.477, 'learning_rate': 2.7364053730711182e-06, 'epoch': 1.52} {'loss': 0.678, 'learning_rate': 2.736180383339494e-06, 'epoch': 1.52} {'loss': 0.6906, 'learning_rate': 2.7359554013917087e-06, 'epoch': 1.52} {'loss': 0.5648, 'learning_rate': 2.7357304272280016e-06, 'epoch': 1.52} {'loss': 0.5417, 'learning_rate': 2.7355054608486197e-06, 'epoch': 1.52} {'loss': 0.5597, 'learning_rate': 2.7352805022537953e-06, 'epoch': 1.52} {'loss': 0.4799, 'learning_rate': 2.7350555514437738e-06, 'epoch': 1.52} {'loss': 0.5272, 'learning_rate': 2.734830608418796e-06, 'epoch': 1.52} {'loss': 0.5815, 'learning_rate': 2.7346056731791028e-06, 'epoch': 1.52} {'loss': 0.5194, 'learning_rate': 2.734380745724938e-06, 'epoch': 1.52} {'loss': 0.4407, 'learning_rate': 2.734155826056535e-06, 'epoch': 1.52} {'loss': 0.3916, 'learning_rate': 2.7339309141741456e-06, 'epoch': 1.52} {'loss': 0.572, 'learning_rate': 2.733706010078001e-06, 'epoch': 1.52} {'loss': 0.5058, 'learning_rate': 2.733481113768347e-06, 'epoch': 1.52} {'loss': 0.5257, 'learning_rate': 2.733256225245424e-06, 'epoch': 1.52} {'loss': 0.4248, 'learning_rate': 2.7330313445094726e-06, 'epoch': 1.52} {'loss': 0.4399, 'learning_rate': 2.7328064715607373e-06, 'epoch': 1.52} {'loss': 0.6104, 'learning_rate': 2.732581606399449e-06, 'epoch': 1.52} {'loss': 0.6896, 'learning_rate': 2.7323567490258616e-06, 'epoch': 1.52} {'loss': 0.4806, 'learning_rate': 2.7321318994402067e-06, 'epoch': 1.52} {'loss': 0.4619, 'learning_rate': 2.7319070576427296e-06, 'epoch': 1.52} {'loss': 0.6236, 'learning_rate': 2.7316822236336726e-06, 'epoch': 1.52} {'loss': 0.4584, 'learning_rate': 2.7314573974132673e-06, 'epoch': 1.52} {'loss': 0.4974, 'learning_rate': 2.7312325789817684e-06, 'epoch': 1.52} {'loss': 0.5549, 'learning_rate': 2.731007768339403e-06, 'epoch': 1.52} {'loss': 0.4598, 'learning_rate': 2.730782965486426e-06, 'epoch': 1.52} {'loss': 0.5338, 'learning_rate': 2.7305581704230665e-06, 'epoch': 1.52} {'loss': 0.6219, 'learning_rate': 2.7303333831495716e-06, 'epoch': 1.52} {'loss': 0.6174, 'learning_rate': 2.730108603666183e-06, 'epoch': 1.52} {'loss': 0.5299, 'learning_rate': 2.7298838319731327e-06, 'epoch': 1.52} {'loss': 0.3126, 'learning_rate': 2.729659068070675e-06, 'epoch': 1.52} {'loss': 0.4882, 'learning_rate': 2.729434311959037e-06, 'epoch': 1.52} {'loss': 0.5197, 'learning_rate': 2.729209563638472e-06, 'epoch': 1.52} {'loss': 0.4685, 'learning_rate': 2.728984823109213e-06, 'epoch': 1.52} {'loss': 0.4001, 'learning_rate': 2.7287600903715026e-06, 'epoch': 1.52} {'loss': 0.4554, 'learning_rate': 2.7285353654255854e-06, 'epoch': 1.52} {'loss': 0.6115, 'learning_rate': 2.7283106482716925e-06, 'epoch': 1.52} {'loss': 0.5603, 'learning_rate': 2.728085938910078e-06, 'epoch': 1.52} {'loss': 0.6949, 'learning_rate': 2.7278612373409685e-06, 'epoch': 1.52} {'loss': 0.6339, 'learning_rate': 2.727636543564619e-06, 'epoch': 1.52} {'loss': 0.4631, 'learning_rate': 2.727411857581259e-06, 'epoch': 1.52} {'loss': 0.4635, 'learning_rate': 2.7271871793911353e-06, 'epoch': 1.52} {'loss': 0.4837, 'learning_rate': 2.7269625089944885e-06, 'epoch': 1.52} {'loss': 0.4807, 'learning_rate': 2.7267378463915528e-06, 'epoch': 1.52} {'loss': 0.3942, 'learning_rate': 2.7265131915825793e-06, 'epoch': 1.52} {'loss': 0.4556, 'learning_rate': 2.726288544567798e-06, 'epoch': 1.52} {'loss': 0.4919, 'learning_rate': 2.7260639053474604e-06, 'epoch': 1.52} {'loss': 0.4991, 'learning_rate': 2.7258392739217987e-06, 'epoch': 1.52} {'loss': 0.5582, 'learning_rate': 2.7256146502910572e-06, 'epoch': 1.52} {'loss': 0.2456, 'learning_rate': 2.7253900344554795e-06, 'epoch': 1.52} {'loss': 0.5583, 'learning_rate': 2.725165426415296e-06, 'epoch': 1.52} {'loss': 0.3669, 'learning_rate': 2.724940826170761e-06, 'epoch': 1.52} {'loss': 0.5212, 'learning_rate': 2.724716233722102e-06, 'epoch': 1.52} {'loss': 0.4738, 'learning_rate': 2.7244916490695728e-06, 'epoch': 1.52} {'loss': 0.5213, 'learning_rate': 2.7242670722134048e-06, 'epoch': 1.52} {'loss': 0.5593, 'learning_rate': 2.724042503153841e-06, 'epoch': 1.52} {'loss': 0.3592, 'learning_rate': 2.7238179418911247e-06, 'epoch': 1.52} {'loss': 0.4257, 'learning_rate': 2.723593388425488e-06, 'epoch': 1.52} {'loss': 0.5654, 'learning_rate': 2.7233688427571847e-06, 'epoch': 1.52} {'loss': 0.5497, 'learning_rate': 2.7231443048864446e-06, 'epoch': 1.52} {'loss': 0.4946, 'learning_rate': 2.7229197748135126e-06, 'epoch': 1.52} {'loss': 0.4529, 'learning_rate': 2.7226952525386294e-06, 'epoch': 1.52} {'loss': 0.5606, 'learning_rate': 2.7224707380620343e-06, 'epoch': 1.52} {'loss': 0.4333, 'learning_rate': 2.7222462313839715e-06, 'epoch': 1.52} {'loss': 0.4984, 'learning_rate': 2.7220217325046737e-06, 'epoch': 1.52} {'loss': 0.7394, 'learning_rate': 2.721797241424392e-06, 'epoch': 1.52} {'loss': 0.5051, 'learning_rate': 2.721572758143358e-06, 'epoch': 1.52} {'loss': 0.5547, 'learning_rate': 2.7213482826618166e-06, 'epoch': 1.52} {'loss': 0.4771, 'learning_rate': 2.721123814980007e-06, 'epoch': 1.52} {'loss': 0.4484, 'learning_rate': 2.720899355098169e-06, 'epoch': 1.52} {'loss': 0.6049, 'learning_rate': 2.720674903016549e-06, 'epoch': 1.52} {'loss': 0.5551, 'learning_rate': 2.7204504587353763e-06, 'epoch': 1.52} {'loss': 0.5422, 'learning_rate': 2.7202260222549035e-06, 'epoch': 1.52} {'loss': 0.4739, 'learning_rate': 2.720001593575363e-06, 'epoch': 1.52} {'loss': 0.5266, 'learning_rate': 2.719777172696998e-06, 'epoch': 1.52} {'loss': 0.5604, 'learning_rate': 2.719552759620051e-06, 'epoch': 1.52} {'loss': 0.5419, 'learning_rate': 2.7193283543447556e-06, 'epoch': 1.52} {'loss': 0.2965, 'learning_rate': 2.7191039568713617e-06, 'epoch': 1.52} {'loss': 0.4023, 'learning_rate': 2.7188795672001035e-06, 'epoch': 1.52} {'loss': 0.4859, 'learning_rate': 2.7186551853312215e-06, 'epoch': 1.52} {'loss': 0.4855, 'learning_rate': 2.7184308112649593e-06, 'epoch': 1.52} {'loss': 0.586, 'learning_rate': 2.7182064450015544e-06, 'epoch': 1.52} {'loss': 0.5243, 'learning_rate': 2.717982086541252e-06, 'epoch': 1.52} {'loss': 0.6321, 'learning_rate': 2.7177577358842822e-06, 'epoch': 1.52} {'loss': 0.6091, 'learning_rate': 2.717533393030899e-06, 'epoch': 1.52} {'loss': 0.4343, 'learning_rate': 2.7173090579813333e-06, 'epoch': 1.52} {'loss': 0.4134, 'learning_rate': 2.717084730735828e-06, 'epoch': 1.52} {'loss': 0.524, 'learning_rate': 2.716860411294624e-06, 'epoch': 1.52} {'loss': 0.511, 'learning_rate': 2.716636099657961e-06, 'epoch': 1.52} {'loss': 0.4828, 'learning_rate': 2.716411795826083e-06, 'epoch': 1.52} {'loss': 0.4929, 'learning_rate': 2.716187499799221e-06, 'epoch': 1.52} {'loss': 0.6126, 'learning_rate': 2.715963211577627e-06, 'epoch': 1.52} {'loss': 0.5007, 'learning_rate': 2.7157389311615334e-06, 'epoch': 1.52} {'loss': 0.4925, 'learning_rate': 2.7155146585511827e-06, 'epoch': 1.52} {'loss': 0.4549, 'learning_rate': 2.7152903937468165e-06, 'epoch': 1.52} {'loss': 0.5419, 'learning_rate': 2.715066136748673e-06, 'epoch': 1.52} {'loss': 0.3478, 'learning_rate': 2.7148418875569973e-06, 'epoch': 1.52} {'loss': 0.4033, 'learning_rate': 2.714617646172023e-06, 'epoch': 1.52} {'loss': 0.5042, 'learning_rate': 2.714393412593993e-06, 'epoch': 1.52} {'loss': 0.339, 'learning_rate': 2.714169186823148e-06, 'epoch': 1.52} {'loss': 0.4449, 'learning_rate': 2.7139449688597287e-06, 'epoch': 1.52} {'loss': 0.4517, 'learning_rate': 2.713720758703975e-06, 'epoch': 1.52} {'loss': 0.4009, 'learning_rate': 2.7134965563561267e-06, 'epoch': 1.52} {'loss': 0.5487, 'learning_rate': 2.713272361816428e-06, 'epoch': 1.52} {'loss': 0.5252, 'learning_rate': 2.7130481750851125e-06, 'epoch': 1.52} {'loss': 0.4733, 'learning_rate': 2.7128239961624235e-06, 'epoch': 1.52} {'loss': 0.5527, 'learning_rate': 2.712599825048601e-06, 'epoch': 1.52} {'loss': 0.5053, 'learning_rate': 2.7123756617438857e-06, 'epoch': 1.52} {'loss': 0.5817, 'learning_rate': 2.712151506248517e-06, 'epoch': 1.52} {'loss': 0.5563, 'learning_rate': 2.7119273585627405e-06, 'epoch': 1.52} {'loss': 0.6961, 'learning_rate': 2.7117032186867877e-06, 'epoch': 1.52} {'loss': 0.7169, 'learning_rate': 2.7114790866209018e-06, 'epoch': 1.52} {'loss': 0.4705, 'learning_rate': 2.711254962365325e-06, 'epoch': 1.52} {'loss': 0.3706, 'learning_rate': 2.711030845920296e-06, 'epoch': 1.52} {'loss': 0.3428, 'learning_rate': 2.7108067372860546e-06, 'epoch': 1.52} {'loss': 0.44, 'learning_rate': 2.710582636462843e-06, 'epoch': 1.52} {'loss': 0.509, 'learning_rate': 2.7103585434509015e-06, 'epoch': 1.52} {'loss': 0.5291, 'learning_rate': 2.7101344582504676e-06, 'epoch': 1.52} {'loss': 0.6125, 'learning_rate': 2.709910380861781e-06, 'epoch': 1.52} {'loss': 0.6755, 'learning_rate': 2.7096863112850847e-06, 'epoch': 1.52} {'loss': 0.4883, 'learning_rate': 2.7094622495206168e-06, 'epoch': 1.52} {'loss': 0.5532, 'learning_rate': 2.7092381955686174e-06, 'epoch': 1.52} {'loss': 0.69, 'learning_rate': 2.7090141494293286e-06, 'epoch': 1.52} {'loss': 0.4633, 'learning_rate': 2.708790111102991e-06, 'epoch': 1.52} {'loss': 0.5741, 'learning_rate': 2.7085660805898407e-06, 'epoch': 1.52} {'loss': 0.6506, 'learning_rate': 2.7083420578901198e-06, 'epoch': 1.52} {'loss': 0.6331, 'learning_rate': 2.7081180430040686e-06, 'epoch': 1.52} {'loss': 0.5879, 'learning_rate': 2.7078940359319273e-06, 'epoch': 1.52} {'loss': 0.5245, 'learning_rate': 2.7076700366739385e-06, 'epoch': 1.52} {'loss': 0.6473, 'learning_rate': 2.707446045230333e-06, 'epoch': 1.52} {'loss': 0.4817, 'learning_rate': 2.7072220616013633e-06, 'epoch': 1.52} {'loss': 0.5411, 'learning_rate': 2.70699808578726e-06, 'epoch': 1.52} {'loss': 0.4654, 'learning_rate': 2.706774117788268e-06, 'epoch': 1.52} {'loss': 0.5273, 'learning_rate': 2.706550157604625e-06, 'epoch': 1.52} {'loss': 0.5008, 'learning_rate': 2.706326205236571e-06, 'epoch': 1.52} {'loss': 0.7198, 'learning_rate': 2.70610226068435e-06, 'epoch': 1.52} {'loss': 0.5211, 'learning_rate': 2.7058783239481933e-06, 'epoch': 1.52} {'loss': 0.607, 'learning_rate': 2.705654395028352e-06, 'epoch': 1.52} {'loss': 0.5547, 'learning_rate': 2.705430473925058e-06, 'epoch': 1.52} {'loss': 0.5398, 'learning_rate': 2.7052065606385523e-06, 'epoch': 1.52} {'loss': 0.4778, 'learning_rate': 2.7049826551690773e-06, 'epoch': 1.52} {'loss': 0.3766, 'learning_rate': 2.704758757516872e-06, 'epoch': 1.52} {'loss': 0.4728, 'learning_rate': 2.704534867682178e-06, 'epoch': 1.52} {'loss': 0.5596, 'learning_rate': 2.7043109856652284e-06, 'epoch': 1.52} {'loss': 0.4252, 'learning_rate': 2.704087111466274e-06, 'epoch': 1.52} {'loss': 0.4027, 'learning_rate': 2.7038632450855453e-06, 'epoch': 1.52} {'loss': 0.6253, 'learning_rate': 2.7036393865232857e-06, 'epoch': 1.52} {'loss': 0.4472, 'learning_rate': 2.7034155357797374e-06, 'epoch': 1.52} {'loss': 0.4286, 'learning_rate': 2.703191692855133e-06, 'epoch': 1.52} {'loss': 0.4749, 'learning_rate': 2.7029678577497232e-06, 'epoch': 1.52} {'loss': 0.6592, 'learning_rate': 2.7027440304637385e-06, 'epoch': 1.52} {'loss': 0.6179, 'learning_rate': 2.7025202109974226e-06, 'epoch': 1.52} {'loss': 0.3905, 'learning_rate': 2.7022963993510144e-06, 'epoch': 1.52} {'loss': 0.5089, 'learning_rate': 2.702072595524754e-06, 'epoch': 1.52} {'loss': 0.4528, 'learning_rate': 2.7018487995188845e-06, 'epoch': 1.52} {'loss': 0.5458, 'learning_rate': 2.7016250113336373e-06, 'epoch': 1.52} {'loss': 0.5429, 'learning_rate': 2.7014012309692637e-06, 'epoch': 1.52} {'loss': 0.6628, 'learning_rate': 2.7011774584259943e-06, 'epoch': 1.52} {'loss': 0.61, 'learning_rate': 2.7009536937040725e-06, 'epoch': 1.52} {'loss': 0.6333, 'learning_rate': 2.7007299368037364e-06, 'epoch': 1.52} {'loss': 0.5702, 'learning_rate': 2.7005061877252283e-06, 'epoch': 1.52} {'loss': 0.4603, 'learning_rate': 2.700282446468788e-06, 'epoch': 1.52} {'loss': 0.4881, 'learning_rate': 2.700058713034649e-06, 'epoch': 1.52} {'loss': 0.4403, 'learning_rate': 2.6998349874230624e-06, 'epoch': 1.52} {'loss': 0.5767, 'learning_rate': 2.699611269634258e-06, 'epoch': 1.52} {'loss': 0.4868, 'learning_rate': 2.699387559668478e-06, 'epoch': 1.52} {'loss': 0.451, 'learning_rate': 2.6991638575259672e-06, 'epoch': 1.52} {'loss': 0.4591, 'learning_rate': 2.6989401632069558e-06, 'epoch': 1.52} {'loss': 0.7199, 'learning_rate': 2.6987164767116937e-06, 'epoch': 1.52} {'loss': 0.5143, 'learning_rate': 2.6984927980404107e-06, 'epoch': 1.52} {'loss': 0.542, 'learning_rate': 2.698269127193358e-06, 'epoch': 1.52} {'loss': 0.6145, 'learning_rate': 2.6980454641707652e-06, 'epoch': 1.52} {'loss': 0.5333, 'learning_rate': 2.697821808972876e-06, 'epoch': 1.52} {'loss': 0.5657, 'learning_rate': 2.6975981615999325e-06, 'epoch': 1.52} {'loss': 0.4324, 'learning_rate': 2.697374522052166e-06, 'epoch': 1.52} {'loss': 0.5792, 'learning_rate': 2.697150890329827e-06, 'epoch': 1.52} {'loss': 0.4035, 'learning_rate': 2.6969272664331447e-06, 'epoch': 1.52} {'loss': 0.5052, 'learning_rate': 2.69670365036237e-06, 'epoch': 1.52} {'loss': 0.5435, 'learning_rate': 2.696480042117734e-06, 'epoch': 1.52} {'loss': 0.4057, 'learning_rate': 2.6962564416994775e-06, 'epoch': 1.52} {'loss': 0.6409, 'learning_rate': 2.6960328491078457e-06, 'epoch': 1.52} {'loss': 0.6528, 'learning_rate': 2.6958092643430676e-06, 'epoch': 1.52} {'loss': 0.5744, 'learning_rate': 2.695585687405394e-06, 'epoch': 1.52} {'loss': 0.571, 'learning_rate': 2.695362118295055e-06, 'epoch': 1.52} {'loss': 0.4774, 'learning_rate': 2.6951385570123e-06, 'epoch': 1.52} {'loss': 0.4059, 'learning_rate': 2.6949150035573614e-06, 'epoch': 1.52} {'loss': 0.5187, 'learning_rate': 2.6946914579304793e-06, 'epoch': 1.52} {'loss': 0.4942, 'learning_rate': 2.694467920131898e-06, 'epoch': 1.52} {'loss': 0.5021, 'learning_rate': 2.6942443901618488e-06, 'epoch': 1.52} {'loss': 0.6458, 'learning_rate': 2.69402086802058e-06, 'epoch': 1.52} {'loss': 0.4538, 'learning_rate': 2.693797353708323e-06, 'epoch': 1.52} {'loss': 0.5109, 'learning_rate': 2.693573847225327e-06, 'epoch': 1.52} {'loss': 0.4905, 'learning_rate': 2.6933503485718237e-06, 'epoch': 1.52} {'loss': 0.5922, 'learning_rate': 2.693126857748054e-06, 'epoch': 1.52} {'loss': 0.3166, 'learning_rate': 2.692903374754262e-06, 'epoch': 1.52} {'loss': 0.6844, 'learning_rate': 2.6926798995906777e-06, 'epoch': 1.52} {'loss': 0.3957, 'learning_rate': 2.6924564322575518e-06, 'epoch': 1.52} {'loss': 0.509, 'learning_rate': 2.6922329727551155e-06, 'epoch': 1.52} {'loss': 0.5119, 'learning_rate': 2.692009521083612e-06, 'epoch': 1.52} {'loss': 0.5529, 'learning_rate': 2.691786077243278e-06, 'epoch': 1.52} {'loss': 0.5231, 'learning_rate': 2.6915626412343563e-06, 'epoch': 1.52} {'loss': 0.4573, 'learning_rate': 2.691339213057087e-06, 'epoch': 1.52} {'loss': 0.487, 'learning_rate': 2.6911157927117026e-06, 'epoch': 1.52} {'loss': 0.5261, 'learning_rate': 2.690892380198452e-06, 'epoch': 1.52} {'loss': 0.415, 'learning_rate': 2.6906689755175673e-06, 'epoch': 1.52} {'loss': 0.5191, 'learning_rate': 2.6904455786692908e-06, 'epoch': 1.52} {'loss': 0.7072, 'learning_rate': 2.6902221896538616e-06, 'epoch': 1.52} {'loss': 0.5228, 'learning_rate': 2.689998808471519e-06, 'epoch': 1.52} {'loss': 0.4741, 'learning_rate': 2.689775435122506e-06, 'epoch': 1.52} {'loss': 0.5559, 'learning_rate': 2.689552069607051e-06, 'epoch': 1.52} {'loss': 0.5894, 'learning_rate': 2.6893287119254075e-06, 'epoch': 1.52} {'loss': 0.5699, 'learning_rate': 2.689105362077805e-06, 'epoch': 1.52} {'loss': 0.5871, 'learning_rate': 2.6888820200644874e-06, 'epoch': 1.52} {'loss': 0.5911, 'learning_rate': 2.6886586858856913e-06, 'epoch': 1.52} {'loss': 0.5838, 'learning_rate': 2.688435359541657e-06, 'epoch': 1.52} {'loss': 0.5433, 'learning_rate': 2.688212041032627e-06, 'epoch': 1.52} {'loss': 0.3859, 'learning_rate': 2.687988730358836e-06, 'epoch': 1.52} {'loss': 0.4929, 'learning_rate': 2.6877654275205233e-06, 'epoch': 1.52} {'loss': 0.5736, 'learning_rate': 2.6875421325179306e-06, 'epoch': 1.52} {'loss': 0.5177, 'learning_rate': 2.6873188453512978e-06, 'epoch': 1.52} {'loss': 0.4949, 'learning_rate': 2.687095566020861e-06, 'epoch': 1.52} {'loss': 0.6418, 'learning_rate': 2.6868722945268623e-06, 'epoch': 1.52} {'loss': 0.6142, 'learning_rate': 2.6866490308695424e-06, 'epoch': 1.52} {'loss': 0.4967, 'learning_rate': 2.686425775049136e-06, 'epoch': 1.52} {'loss': 0.506, 'learning_rate': 2.686202527065884e-06, 'epoch': 1.52} {'loss': 0.562, 'learning_rate': 2.6859792869200262e-06, 'epoch': 1.52} {'loss': 0.5125, 'learning_rate': 2.685756054611801e-06, 'epoch': 1.52} {'loss': 0.4801, 'learning_rate': 2.6855328301414497e-06, 'epoch': 1.52} {'loss': 0.4196, 'learning_rate': 2.6853096135092095e-06, 'epoch': 1.52} {'loss': 0.5143, 'learning_rate': 2.6850864047153224e-06, 'epoch': 1.52} {'loss': 0.5666, 'learning_rate': 2.6848632037600244e-06, 'epoch': 1.52} {'loss': 0.5311, 'learning_rate': 2.6846400106435534e-06, 'epoch': 1.52} {'loss': 0.5622, 'learning_rate': 2.684416825366153e-06, 'epoch': 1.52} {'loss': 0.4425, 'learning_rate': 2.6841936479280584e-06, 'epoch': 1.52} {'loss': 0.599, 'learning_rate': 2.683970478329515e-06, 'epoch': 1.52} {'loss': 0.4605, 'learning_rate': 2.683747316570754e-06, 'epoch': 1.52} {'loss': 0.4473, 'learning_rate': 2.683524162652018e-06, 'epoch': 1.52} {'loss': 0.4454, 'learning_rate': 2.6833010165735464e-06, 'epoch': 1.52} {'loss': 0.4404, 'learning_rate': 2.6830778783355773e-06, 'epoch': 1.52} {'loss': 0.4772, 'learning_rate': 2.6828547479383516e-06, 'epoch': 1.52} {'loss': 0.5648, 'learning_rate': 2.6826316253821074e-06, 'epoch': 1.52} {'loss': 0.5777, 'learning_rate': 2.682408510667086e-06, 'epoch': 1.52} {'loss': 0.4804, 'learning_rate': 2.6821854037935225e-06, 'epoch': 1.52} {'loss': 0.5621, 'learning_rate': 2.681962304761657e-06, 'epoch': 1.52} {'loss': 0.4369, 'learning_rate': 2.6817392135717302e-06, 'epoch': 1.52} {'loss': 0.5011, 'learning_rate': 2.6815161302239787e-06, 'epoch': 1.52} {'loss': 0.475, 'learning_rate': 2.6812930547186457e-06, 'epoch': 1.52} {'loss': 0.6868, 'learning_rate': 2.6810699870559653e-06, 'epoch': 1.52} {'loss': 0.5975, 'learning_rate': 2.6808469272361836e-06, 'epoch': 1.52} {'loss': 0.5167, 'learning_rate': 2.6806238752595314e-06, 'epoch': 1.52} {'loss': 0.509, 'learning_rate': 2.6804008311262506e-06, 'epoch': 1.52} {'loss': 0.5208, 'learning_rate': 2.6801777948365826e-06, 'epoch': 1.52} {'loss': 0.6005, 'learning_rate': 2.679954766390763e-06, 'epoch': 1.52} {'loss': 0.4961, 'learning_rate': 2.679731745789034e-06, 'epoch': 1.52} {'loss': 0.3993, 'learning_rate': 2.679508733031636e-06, 'epoch': 1.52} {'loss': 0.4568, 'learning_rate': 2.6792857281188013e-06, 'epoch': 1.52} {'loss': 0.5646, 'learning_rate': 2.679062731050773e-06, 'epoch': 1.52} {'loss': 0.4564, 'learning_rate': 2.67883974182779e-06, 'epoch': 1.52} {'loss': 0.5306, 'learning_rate': 2.678616760450091e-06, 'epoch': 1.52} {'loss': 0.4185, 'learning_rate': 2.6783937869179145e-06, 'epoch': 1.52} {'loss': 0.4524, 'learning_rate': 2.6781708212315004e-06, 'epoch': 1.52} {'loss': 0.4681, 'learning_rate': 2.6779478633910894e-06, 'epoch': 1.52} {'loss': 0.4963, 'learning_rate': 2.6777249133969153e-06, 'epoch': 1.52} {'loss': 0.5399, 'learning_rate': 2.6775019712492202e-06, 'epoch': 1.52} {'loss': 0.5115, 'learning_rate': 2.6772790369482427e-06, 'epoch': 1.52} {'loss': 0.5311, 'learning_rate': 2.6770561104942217e-06, 'epoch': 1.52} {'loss': 0.5848, 'learning_rate': 2.676833191887396e-06, 'epoch': 1.52} {'loss': 0.513, 'learning_rate': 2.676610281128004e-06, 'epoch': 1.52} {'loss': 0.5166, 'learning_rate': 2.6763873782162874e-06, 'epoch': 1.52} {'loss': 0.3908, 'learning_rate': 2.6761644831524815e-06, 'epoch': 1.52} {'loss': 0.5911, 'learning_rate': 2.675941595936825e-06, 'epoch': 1.52} {'loss': 0.3088, 'learning_rate': 2.6757187165695587e-06, 'epoch': 1.52} {'loss': 0.3692, 'learning_rate': 2.6754958450509203e-06, 'epoch': 1.52} {'loss': 0.4312, 'learning_rate': 2.6752729813811527e-06, 'epoch': 1.52} {'loss': 0.3887, 'learning_rate': 2.6750501255604853e-06, 'epoch': 1.52} {'loss': 0.5657, 'learning_rate': 2.674827277589168e-06, 'epoch': 1.52} {'loss': 0.4627, 'learning_rate': 2.674604437467433e-06, 'epoch': 1.52} {'loss': 0.6085, 'learning_rate': 2.6743816051955196e-06, 'epoch': 1.52} {'loss': 0.6023, 'learning_rate': 2.674158780773667e-06, 'epoch': 1.52} {'loss': 0.4878, 'learning_rate': 2.6739359642021147e-06, 'epoch': 1.52} {'loss': 0.2354, 'learning_rate': 2.673713155481105e-06, 'epoch': 1.52} {'loss': 0.5001, 'learning_rate': 2.673490354610866e-06, 'epoch': 1.52} {'loss': 0.4512, 'learning_rate': 2.6732675615916494e-06, 'epoch': 1.52} {'loss': 0.6077, 'learning_rate': 2.6730447764236857e-06, 'epoch': 1.52} {'loss': 0.637, 'learning_rate': 2.672821999107215e-06, 'epoch': 1.52} {'loss': 0.5327, 'learning_rate': 2.6725992296424797e-06, 'epoch': 1.53} {'loss': 0.553, 'learning_rate': 2.6723764680297103e-06, 'epoch': 1.53} {'loss': 0.4403, 'learning_rate': 2.6721537142691566e-06, 'epoch': 1.53} {'loss': 0.374, 'learning_rate': 2.671930968361046e-06, 'epoch': 1.53} {'loss': 0.5937, 'learning_rate': 2.6717082303056287e-06, 'epoch': 1.53} {'loss': 0.5161, 'learning_rate': 2.6714855001031336e-06, 'epoch': 1.53} {'loss': 0.5096, 'learning_rate': 2.6712627777538035e-06, 'epoch': 1.53} {'loss': 0.4941, 'learning_rate': 2.6710400632578805e-06, 'epoch': 1.53} {'loss': 0.6452, 'learning_rate': 2.670817356615593e-06, 'epoch': 1.53} {'loss': 0.5356, 'learning_rate': 2.6705946578271924e-06, 'epoch': 1.53} {'loss': 0.5542, 'learning_rate': 2.6703719668929053e-06, 'epoch': 1.53} {'loss': 0.4061, 'learning_rate': 2.6701492838129816e-06, 'epoch': 1.53} {'loss': 0.4524, 'learning_rate': 2.669926608587652e-06, 'epoch': 1.53} {'loss': 0.6247, 'learning_rate': 2.669703941217158e-06, 'epoch': 1.53} {'loss': 0.3973, 'learning_rate': 2.669481281701739e-06, 'epoch': 1.53} {'loss': 0.4478, 'learning_rate': 2.669258630041628e-06, 'epoch': 1.53} {'loss': 0.5172, 'learning_rate': 2.669035986237074e-06, 'epoch': 1.53} {'loss': 0.5254, 'learning_rate': 2.6688133502883064e-06, 'epoch': 1.53} {'loss': 0.6633, 'learning_rate': 2.6685907221955665e-06, 'epoch': 1.53} {'loss': 0.5336, 'learning_rate': 2.6683681019590945e-06, 'epoch': 1.53} {'loss': 0.4341, 'learning_rate': 2.668145489579127e-06, 'epoch': 1.53} {'loss': 0.4975, 'learning_rate': 2.6679228850559057e-06, 'epoch': 1.53} {'loss': 0.5649, 'learning_rate': 2.667700288389662e-06, 'epoch': 1.53} {'loss': 0.554, 'learning_rate': 2.667477699580645e-06, 'epoch': 1.53} {'loss': 0.4291, 'learning_rate': 2.667255118629084e-06, 'epoch': 1.53} {'loss': 0.5164, 'learning_rate': 2.667032545535221e-06, 'epoch': 1.53} {'loss': 0.5527, 'learning_rate': 2.6668099802992942e-06, 'epoch': 1.53} {'loss': 0.5043, 'learning_rate': 2.6665874229215425e-06, 'epoch': 1.53} {'loss': 0.5826, 'learning_rate': 2.6663648734022085e-06, 'epoch': 1.53} {'loss': 0.5063, 'learning_rate': 2.666142331741519e-06, 'epoch': 1.53} {'loss': 0.5292, 'learning_rate': 2.6659197979397266e-06, 'epoch': 1.53} {'loss': 0.648, 'learning_rate': 2.66569727199706e-06, 'epoch': 1.53} {'loss': 0.5059, 'learning_rate': 2.6654747539137604e-06, 'epoch': 1.53} {'loss': 0.4635, 'learning_rate': 2.6652522436900695e-06, 'epoch': 1.53} {'loss': 0.4847, 'learning_rate': 2.665029741326217e-06, 'epoch': 1.53} {'loss': 0.4884, 'learning_rate': 2.664807246822453e-06, 'epoch': 1.53} {'loss': 0.6314, 'learning_rate': 2.6645847601790044e-06, 'epoch': 1.53} {'loss': 0.4396, 'learning_rate': 2.664362281396121e-06, 'epoch': 1.53} {'loss': 0.4071, 'learning_rate': 2.6641398104740333e-06, 'epoch': 1.53} {'loss': 0.4209, 'learning_rate': 2.663917347412981e-06, 'epoch': 1.53} {'loss': 0.4839, 'learning_rate': 2.6636948922132068e-06, 'epoch': 1.53} {'loss': 0.5284, 'learning_rate': 2.6634724448749393e-06, 'epoch': 1.53} {'loss': 0.5629, 'learning_rate': 2.66325000539843e-06, 'epoch': 1.53} {'loss': 0.6461, 'learning_rate': 2.663027573783904e-06, 'epoch': 1.53} {'loss': 0.4975, 'learning_rate': 2.662805150031612e-06, 'epoch': 1.53} {'loss': 0.4301, 'learning_rate': 2.662582734141783e-06, 'epoch': 1.53} {'loss': 0.4365, 'learning_rate': 2.6623603261146603e-06, 'epoch': 1.53} {'loss': 0.5997, 'learning_rate': 2.6621379259504833e-06, 'epoch': 1.53} {'loss': 0.4749, 'learning_rate': 2.6619155336494805e-06, 'epoch': 1.53} {'loss': 0.4425, 'learning_rate': 2.6616931492119047e-06, 'epoch': 1.53} {'loss': 0.7584, 'learning_rate': 2.6614707726379807e-06, 'epoch': 1.53} {'loss': 0.5568, 'learning_rate': 2.6612484039279597e-06, 'epoch': 1.53} {'loss': 0.5259, 'learning_rate': 2.66102604308207e-06, 'epoch': 1.53} {'loss': 0.4968, 'learning_rate': 2.660803690100553e-06, 'epoch': 1.53} {'loss': 0.4542, 'learning_rate': 2.6605813449836505e-06, 'epoch': 1.53} {'loss': 0.4489, 'learning_rate': 2.660359007731591e-06, 'epoch': 1.53} {'loss': 0.5554, 'learning_rate': 2.660136678344626e-06, 'epoch': 1.53} {'loss': 0.5219, 'learning_rate': 2.6599143568229837e-06, 'epoch': 1.53} {'loss': 0.4963, 'learning_rate': 2.659692043166906e-06, 'epoch': 1.53} {'loss': 0.618, 'learning_rate': 2.6594697373766297e-06, 'epoch': 1.53} {'loss': 0.5893, 'learning_rate': 2.659247439452395e-06, 'epoch': 1.53} {'loss': 0.467, 'learning_rate': 2.659025149394442e-06, 'epoch': 1.53} {'loss': 0.6902, 'learning_rate': 2.658802867203001e-06, 'epoch': 1.53} {'loss': 0.5012, 'learning_rate': 2.6585805928783204e-06, 'epoch': 1.53} {'loss': 0.4688, 'learning_rate': 2.6583583264206303e-06, 'epoch': 1.53} {'loss': 0.4681, 'learning_rate': 2.6581360678301716e-06, 'epoch': 1.53} {'loss': 0.6139, 'learning_rate': 2.6579138171071827e-06, 'epoch': 1.53} {'loss': 0.466, 'learning_rate': 2.6576915742519026e-06, 'epoch': 1.53} {'loss': 0.4614, 'learning_rate': 2.657469339264571e-06, 'epoch': 1.53} {'loss': 0.5325, 'learning_rate': 2.657247112145418e-06, 'epoch': 1.53} {'loss': 0.5845, 'learning_rate': 2.657024892894694e-06, 'epoch': 1.53} {'loss': 0.5545, 'learning_rate': 2.656802681512627e-06, 'epoch': 1.53} {'loss': 0.4143, 'learning_rate': 2.6565804779994586e-06, 'epoch': 1.53} {'loss': 0.3574, 'learning_rate': 2.6563582823554266e-06, 'epoch': 1.53} {'loss': 0.5832, 'learning_rate': 2.65613609458077e-06, 'epoch': 1.53} {'loss': 0.5611, 'learning_rate': 2.6559139146757296e-06, 'epoch': 1.53} {'loss': 0.6388, 'learning_rate': 2.655691742640537e-06, 'epoch': 1.53} {'loss': 0.3371, 'learning_rate': 2.6554695784754335e-06, 'epoch': 1.53} {'loss': 0.6723, 'learning_rate': 2.655247422180658e-06, 'epoch': 1.53} {'loss': 0.5451, 'learning_rate': 2.6550252737564475e-06, 'epoch': 1.53} {'loss': 0.5688, 'learning_rate': 2.65480313320304e-06, 'epoch': 1.53} {'loss': 0.4379, 'learning_rate': 2.654581000520674e-06, 'epoch': 1.53} {'loss': 0.6255, 'learning_rate': 2.6543588757095895e-06, 'epoch': 1.53} {'loss': 0.3465, 'learning_rate': 2.6541367587700206e-06, 'epoch': 1.53} {'loss': 0.4838, 'learning_rate': 2.653914649702207e-06, 'epoch': 1.53} {'loss': 0.7294, 'learning_rate': 2.653692548506387e-06, 'epoch': 1.53} {'loss': 0.6067, 'learning_rate': 2.6534704551827984e-06, 'epoch': 1.53} {'loss': 0.5608, 'learning_rate': 2.653248369731678e-06, 'epoch': 1.53} {'loss': 0.4894, 'learning_rate': 2.65302629215327e-06, 'epoch': 1.53} {'loss': 0.5604, 'learning_rate': 2.6528042224478036e-06, 'epoch': 1.53} {'loss': 0.5959, 'learning_rate': 2.65258216061552e-06, 'epoch': 1.53} {'loss': 0.4832, 'learning_rate': 2.6523601066566586e-06, 'epoch': 1.53} {'loss': 0.5401, 'learning_rate': 2.6521380605714563e-06, 'epoch': 1.53} {'loss': 0.4393, 'learning_rate': 2.6519160223601515e-06, 'epoch': 1.53} {'loss': 0.4687, 'learning_rate': 2.651693992022981e-06, 'epoch': 1.53} {'loss': 0.6318, 'learning_rate': 2.6514719695601876e-06, 'epoch': 1.53} {'loss': 0.4883, 'learning_rate': 2.6512499549720015e-06, 'epoch': 1.53} {'loss': 0.5136, 'learning_rate': 2.6510279482586655e-06, 'epoch': 1.53} {'loss': 0.5895, 'learning_rate': 2.650805949420415e-06, 'epoch': 1.53} {'loss': 0.4775, 'learning_rate': 2.65058395845749e-06, 'epoch': 1.53} {'loss': 0.5548, 'learning_rate': 2.650361975370127e-06, 'epoch': 1.53} {'loss': 0.6739, 'learning_rate': 2.6501400001585676e-06, 'epoch': 1.53} {'loss': 0.3963, 'learning_rate': 2.6499180328230446e-06, 'epoch': 1.53} {'loss': 0.4532, 'learning_rate': 2.6496960733637967e-06, 'epoch': 1.53} {'loss': 0.6453, 'learning_rate': 2.6494741217810625e-06, 'epoch': 1.53} {'loss': 0.5861, 'learning_rate': 2.649252178075081e-06, 'epoch': 1.53} {'loss': 0.5782, 'learning_rate': 2.649030242246089e-06, 'epoch': 1.53} {'loss': 0.5444, 'learning_rate': 2.6488083142943277e-06, 'epoch': 1.53} {'loss': 0.5193, 'learning_rate': 2.6485863942200294e-06, 'epoch': 1.53} {'loss': 0.6589, 'learning_rate': 2.648364482023433e-06, 'epoch': 1.53} {'loss': 0.622, 'learning_rate': 2.6481425777047787e-06, 'epoch': 1.53} {'loss': 0.5638, 'learning_rate': 2.6479206812643023e-06, 'epoch': 1.53} {'loss': 0.583, 'learning_rate': 2.6476987927022436e-06, 'epoch': 1.53} {'loss': 0.5309, 'learning_rate': 2.647476912018838e-06, 'epoch': 1.53} {'loss': 0.6172, 'learning_rate': 2.6472550392143282e-06, 'epoch': 1.53} {'loss': 0.5511, 'learning_rate': 2.6470331742889455e-06, 'epoch': 1.53} {'loss': 0.4089, 'learning_rate': 2.64681131724293e-06, 'epoch': 1.53} {'loss': 0.3732, 'learning_rate': 2.6465894680765194e-06, 'epoch': 1.53} {'loss': 0.3515, 'learning_rate': 2.6463676267899517e-06, 'epoch': 1.53} {'loss': 0.6368, 'learning_rate': 2.6461457933834657e-06, 'epoch': 1.53} {'loss': 0.5871, 'learning_rate': 2.645923967857298e-06, 'epoch': 1.53} {'loss': 0.4365, 'learning_rate': 2.64570215021169e-06, 'epoch': 1.53} {'loss': 0.5025, 'learning_rate': 2.645480340446871e-06, 'epoch': 1.53} {'loss': 0.5225, 'learning_rate': 2.645258538563086e-06, 'epoch': 1.53} {'loss': 0.5361, 'learning_rate': 2.6450367445605685e-06, 'epoch': 1.53} {'loss': 0.4334, 'learning_rate': 2.6448149584395588e-06, 'epoch': 1.53} {'loss': 0.4831, 'learning_rate': 2.6445931802002965e-06, 'epoch': 1.53} {'loss': 0.6166, 'learning_rate': 2.644371409843011e-06, 'epoch': 1.53} {'loss': 0.5587, 'learning_rate': 2.6441496473679507e-06, 'epoch': 1.53} {'loss': 0.6905, 'learning_rate': 2.6439278927753453e-06, 'epoch': 1.53} {'loss': 0.5351, 'learning_rate': 2.6437061460654344e-06, 'epoch': 1.53} {'loss': 0.5964, 'learning_rate': 2.6434844072384568e-06, 'epoch': 1.53} {'loss': 0.4142, 'learning_rate': 2.64326267629465e-06, 'epoch': 1.53} {'loss': 0.5016, 'learning_rate': 2.643040953234254e-06, 'epoch': 1.53} {'loss': 0.5558, 'learning_rate': 2.642819238057498e-06, 'epoch': 1.53} {'loss': 0.5835, 'learning_rate': 2.6425975307646302e-06, 'epoch': 1.53} {'loss': 0.5854, 'learning_rate': 2.6423758313558813e-06, 'epoch': 1.53} {'loss': 0.5176, 'learning_rate': 2.64215413983149e-06, 'epoch': 1.53} {'loss': 0.4596, 'learning_rate': 2.6419324561916946e-06, 'epoch': 1.53} {'loss': 0.3586, 'learning_rate': 2.6417107804367325e-06, 'epoch': 1.53} {'loss': 0.5467, 'learning_rate': 2.641489112566845e-06, 'epoch': 1.53} {'loss': 0.4667, 'learning_rate': 2.6412674525822603e-06, 'epoch': 1.53} {'loss': 0.5423, 'learning_rate': 2.6410458004832275e-06, 'epoch': 1.53} {'loss': 0.4965, 'learning_rate': 2.6408241562699754e-06, 'epoch': 1.53} {'loss': 0.4849, 'learning_rate': 2.6406025199427444e-06, 'epoch': 1.53} {'loss': 0.6357, 'learning_rate': 2.640380891501774e-06, 'epoch': 1.53} {'loss': 0.5007, 'learning_rate': 2.6401592709472945e-06, 'epoch': 1.53} {'loss': 0.3677, 'learning_rate': 2.6399376582795543e-06, 'epoch': 1.53} {'loss': 0.4541, 'learning_rate': 2.6397160534987796e-06, 'epoch': 1.53} {'loss': 0.665, 'learning_rate': 2.6394944566052195e-06, 'epoch': 1.53} {'loss': 0.3917, 'learning_rate': 2.6392728675991032e-06, 'epoch': 1.53} {'loss': 0.5146, 'learning_rate': 2.6390512864806683e-06, 'epoch': 1.53} {'loss': 0.5809, 'learning_rate': 2.6388297132501595e-06, 'epoch': 1.53} {'loss': 0.5627, 'learning_rate': 2.6386081479078017e-06, 'epoch': 1.53} {'loss': 0.5233, 'learning_rate': 2.638386590453845e-06, 'epoch': 1.53} {'loss': 0.4665, 'learning_rate': 2.6381650408885175e-06, 'epoch': 1.53} {'loss': 0.5441, 'learning_rate': 2.6379434992120654e-06, 'epoch': 1.53} {'loss': 0.5804, 'learning_rate': 2.637721965424719e-06, 'epoch': 1.53} {'loss': 0.6293, 'learning_rate': 2.6375004395267166e-06, 'epoch': 1.53} {'loss': 0.3449, 'learning_rate': 2.6372789215183014e-06, 'epoch': 1.53} {'loss': 0.5374, 'learning_rate': 2.6370574113996995e-06, 'epoch': 1.53} {'loss': 0.5342, 'learning_rate': 2.6368359091711617e-06, 'epoch': 1.53} {'loss': 0.4738, 'learning_rate': 2.636614414832912e-06, 'epoch': 1.53} {'loss': 0.464, 'learning_rate': 2.636392928385202e-06, 'epoch': 1.53} {'loss': 0.4228, 'learning_rate': 2.6361714498282576e-06, 'epoch': 1.53} {'loss': 0.4557, 'learning_rate': 2.63594997916232e-06, 'epoch': 1.53} {'loss': 0.5871, 'learning_rate': 2.63572851638763e-06, 'epoch': 1.53} {'loss': 0.526, 'learning_rate': 2.6355070615044154e-06, 'epoch': 1.53} {'loss': 0.5691, 'learning_rate': 2.6352856145129256e-06, 'epoch': 1.53} {'loss': 0.4947, 'learning_rate': 2.6350641754133853e-06, 'epoch': 1.53} {'loss': 0.4392, 'learning_rate': 2.6348427442060452e-06, 'epoch': 1.53} {'loss': 0.6662, 'learning_rate': 2.6346213208911333e-06, 'epoch': 1.53} {'loss': 0.508, 'learning_rate': 2.6343999054688896e-06, 'epoch': 1.53} {'loss': 0.5877, 'learning_rate': 2.6341784979395535e-06, 'epoch': 1.53} {'loss': 0.3274, 'learning_rate': 2.6339570983033535e-06, 'epoch': 1.53} {'loss': 0.4833, 'learning_rate': 2.6337357065605397e-06, 'epoch': 1.53} {'loss': 0.4725, 'learning_rate': 2.6335143227113403e-06, 'epoch': 1.53} {'loss': 0.6084, 'learning_rate': 2.6332929467559954e-06, 'epoch': 1.53} {'loss': 0.5051, 'learning_rate': 2.6330715786947414e-06, 'epoch': 1.53} {'loss': 0.4897, 'learning_rate': 2.632850218527816e-06, 'epoch': 1.53} {'loss': 0.3945, 'learning_rate': 2.63262886625546e-06, 'epoch': 1.53} {'loss': 0.6088, 'learning_rate': 2.632407521877901e-06, 'epoch': 1.53} {'loss': 0.6187, 'learning_rate': 2.632186185395388e-06, 'epoch': 1.53} {'loss': 0.5674, 'learning_rate': 2.631964856808149e-06, 'epoch': 1.53} {'loss': 0.4541, 'learning_rate': 2.6317435361164256e-06, 'epoch': 1.53} {'loss': 0.401, 'learning_rate': 2.631522223320454e-06, 'epoch': 1.53} {'loss': 0.3833, 'learning_rate': 2.631300918420471e-06, 'epoch': 1.53} {'loss': 0.4663, 'learning_rate': 2.631079621416718e-06, 'epoch': 1.53} {'loss': 0.5405, 'learning_rate': 2.6308583323094204e-06, 'epoch': 1.53} {'loss': 0.3516, 'learning_rate': 2.630637051098831e-06, 'epoch': 1.53} {'loss': 0.4648, 'learning_rate': 2.6304157777851756e-06, 'epoch': 1.53} {'loss': 0.6264, 'learning_rate': 2.6301945123686946e-06, 'epoch': 1.53} {'loss': 0.4585, 'learning_rate': 2.6299732548496282e-06, 'epoch': 1.53} {'loss': 0.4826, 'learning_rate': 2.6297520052282043e-06, 'epoch': 1.53} {'loss': 0.3483, 'learning_rate': 2.629530763504674e-06, 'epoch': 1.53} {'loss': 0.509, 'learning_rate': 2.6293095296792625e-06, 'epoch': 1.53} {'loss': 0.6149, 'learning_rate': 2.629088303752211e-06, 'epoch': 1.53} {'loss': 0.5296, 'learning_rate': 2.6288670857237565e-06, 'epoch': 1.53} {'loss': 0.4724, 'learning_rate': 2.628645875594137e-06, 'epoch': 1.53} {'loss': 0.5037, 'learning_rate': 2.628424673363591e-06, 'epoch': 1.53} {'loss': 0.4702, 'learning_rate': 2.6282034790323475e-06, 'epoch': 1.53} {'loss': 0.6505, 'learning_rate': 2.627982292600656e-06, 'epoch': 1.53} {'loss': 0.4664, 'learning_rate': 2.6277611140687433e-06, 'epoch': 1.53} {'loss': 0.5346, 'learning_rate': 2.6275399434368496e-06, 'epoch': 1.53} {'loss': 0.4807, 'learning_rate': 2.6273187807052127e-06, 'epoch': 1.53} {'loss': 0.4734, 'learning_rate': 2.627097625874069e-06, 'epoch': 1.53} {'loss': 0.5122, 'learning_rate': 2.6268764789436585e-06, 'epoch': 1.53} {'loss': 0.3756, 'learning_rate': 2.626655339914209e-06, 'epoch': 1.53} {'loss': 0.5992, 'learning_rate': 2.6264342087859707e-06, 'epoch': 1.53} {'loss': 0.3751, 'learning_rate': 2.6262130855591704e-06, 'epoch': 1.53} {'loss': 0.5585, 'learning_rate': 2.6259919702340486e-06, 'epoch': 1.53} {'loss': 0.4843, 'learning_rate': 2.6257708628108412e-06, 'epoch': 1.53} {'loss': 0.5421, 'learning_rate': 2.6255497632897864e-06, 'epoch': 1.53} {'loss': 0.6746, 'learning_rate': 2.6253286716711233e-06, 'epoch': 1.53} {'loss': 0.5244, 'learning_rate': 2.6251075879550823e-06, 'epoch': 1.53} {'loss': 0.5744, 'learning_rate': 2.6248865121419054e-06, 'epoch': 1.53} {'loss': 0.5804, 'learning_rate': 2.6246654442318287e-06, 'epoch': 1.53} {'loss': 0.6577, 'learning_rate': 2.624444384225088e-06, 'epoch': 1.53} {'loss': 0.5816, 'learning_rate': 2.62422333212192e-06, 'epoch': 1.53} {'loss': 0.4944, 'learning_rate': 2.6240022879225634e-06, 'epoch': 1.53} {'loss': 0.4921, 'learning_rate': 2.6237812516272563e-06, 'epoch': 1.53} {'loss': 0.6605, 'learning_rate': 2.623560223236231e-06, 'epoch': 1.53} {'loss': 0.6312, 'learning_rate': 2.6233392027497263e-06, 'epoch': 1.53} {'loss': 0.6381, 'learning_rate': 2.6231181901679802e-06, 'epoch': 1.53} {'loss': 0.5958, 'learning_rate': 2.6228971854912276e-06, 'epoch': 1.53} {'loss': 0.4944, 'learning_rate': 2.6226761887197073e-06, 'epoch': 1.53} {'loss': 0.4417, 'learning_rate': 2.622455199853655e-06, 'epoch': 1.53} {'loss': 0.5775, 'learning_rate': 2.6222342188933113e-06, 'epoch': 1.53} {'loss': 0.3647, 'learning_rate': 2.622013245838906e-06, 'epoch': 1.53} {'loss': 0.4115, 'learning_rate': 2.621792280690679e-06, 'epoch': 1.53} {'loss': 0.4763, 'learning_rate': 2.621571323448868e-06, 'epoch': 1.53} {'loss': 0.4765, 'learning_rate': 2.6213503741137093e-06, 'epoch': 1.53} {'loss': 0.6025, 'learning_rate': 2.6211294326854396e-06, 'epoch': 1.53} {'loss': 0.6892, 'learning_rate': 2.6209084991642988e-06, 'epoch': 1.53} {'loss': 0.528, 'learning_rate': 2.620687573550518e-06, 'epoch': 1.53} {'loss': 0.4306, 'learning_rate': 2.620466655844336e-06, 'epoch': 1.53} {'loss': 0.5506, 'learning_rate': 2.6202457460459897e-06, 'epoch': 1.53} {'loss': 0.4741, 'learning_rate': 2.6200248441557162e-06, 'epoch': 1.53} {'loss': 0.4026, 'learning_rate': 2.6198039501737527e-06, 'epoch': 1.53} {'loss': 0.5683, 'learning_rate': 2.619583064100335e-06, 'epoch': 1.53} {'loss': 0.4455, 'learning_rate': 2.619362185935703e-06, 'epoch': 1.53} {'loss': 0.4707, 'learning_rate': 2.6191413156800884e-06, 'epoch': 1.53} {'loss': 0.4654, 'learning_rate': 2.618920453333729e-06, 'epoch': 1.53} {'loss': 0.5958, 'learning_rate': 2.6186995988968635e-06, 'epoch': 1.53} {'loss': 0.4318, 'learning_rate': 2.6184787523697265e-06, 'epoch': 1.53} {'loss': 0.4795, 'learning_rate': 2.6182579137525567e-06, 'epoch': 1.53} {'loss': 0.5289, 'learning_rate': 2.618037083045589e-06, 'epoch': 1.53} {'loss': 0.5809, 'learning_rate': 2.6178162602490644e-06, 'epoch': 1.53} {'loss': 0.4931, 'learning_rate': 2.6175954453632124e-06, 'epoch': 1.53} {'loss': 0.6321, 'learning_rate': 2.617374638388274e-06, 'epoch': 1.53} {'loss': 0.5692, 'learning_rate': 2.6171538393244844e-06, 'epoch': 1.53} {'loss': 0.5201, 'learning_rate': 2.616933048172081e-06, 'epoch': 1.53} {'loss': 0.6248, 'learning_rate': 2.6167122649313024e-06, 'epoch': 1.53} {'loss': 0.4263, 'learning_rate': 2.6164914896023787e-06, 'epoch': 1.53} {'loss': 0.5076, 'learning_rate': 2.6162707221855554e-06, 'epoch': 1.53} {'loss': 0.5748, 'learning_rate': 2.616049962681062e-06, 'epoch': 1.53} {'loss': 0.4903, 'learning_rate': 2.615829211089137e-06, 'epoch': 1.53} {'loss': 0.4391, 'learning_rate': 2.615608467410018e-06, 'epoch': 1.53} {'loss': 0.4135, 'learning_rate': 2.615387731643941e-06, 'epoch': 1.53} {'loss': 0.642, 'learning_rate': 2.615167003791146e-06, 'epoch': 1.53} {'loss': 0.4484, 'learning_rate': 2.6149462838518615e-06, 'epoch': 1.53} {'loss': 0.5169, 'learning_rate': 2.6147255718263296e-06, 'epoch': 1.53} {'loss': 0.5912, 'learning_rate': 2.6145048677147866e-06, 'epoch': 1.53} {'loss': 0.6184, 'learning_rate': 2.6142841715174672e-06, 'epoch': 1.53} {'loss': 0.5541, 'learning_rate': 2.6140634832346123e-06, 'epoch': 1.53} {'loss': 0.4584, 'learning_rate': 2.6138428028664485e-06, 'epoch': 1.53} {'loss': 0.4942, 'learning_rate': 2.613622130413225e-06, 'epoch': 1.53} {'loss': 0.5339, 'learning_rate': 2.6134014658751692e-06, 'epoch': 1.53} {'loss': 0.5328, 'learning_rate': 2.61318080925252e-06, 'epoch': 1.53} {'loss': 0.7178, 'learning_rate': 2.6129601605455148e-06, 'epoch': 1.53} {'loss': 0.5541, 'learning_rate': 2.612739519754389e-06, 'epoch': 1.53} {'loss': 0.5092, 'learning_rate': 2.612518886879383e-06, 'epoch': 1.53} {'loss': 0.464, 'learning_rate': 2.612298261920724e-06, 'epoch': 1.53} {'loss': 0.4328, 'learning_rate': 2.61207764487866e-06, 'epoch': 1.53} {'loss': 0.4584, 'learning_rate': 2.611857035753418e-06, 'epoch': 1.53} {'loss': 0.4459, 'learning_rate': 2.6116364345452384e-06, 'epoch': 1.53} {'loss': 0.5191, 'learning_rate': 2.611415841254358e-06, 'epoch': 1.53} {'loss': 0.6298, 'learning_rate': 2.6111952558810103e-06, 'epoch': 1.53} {'loss': 0.3404, 'learning_rate': 2.6109746784254387e-06, 'epoch': 1.53} {'loss': 0.5235, 'learning_rate': 2.6107541088878684e-06, 'epoch': 1.53} {'loss': 0.6028, 'learning_rate': 2.6105335472685476e-06, 'epoch': 1.53} {'loss': 0.4083, 'learning_rate': 2.610312993567704e-06, 'epoch': 1.53} {'loss': 0.4569, 'learning_rate': 2.610092447785577e-06, 'epoch': 1.53} {'loss': 0.3772, 'learning_rate': 2.6098719099224056e-06, 'epoch': 1.53} {'loss': 0.3219, 'learning_rate': 2.6096513799784184e-06, 'epoch': 1.53} {'loss': 0.4349, 'learning_rate': 2.609430857953862e-06, 'epoch': 1.53} {'loss': 0.4267, 'learning_rate': 2.6092103438489615e-06, 'epoch': 1.53} {'loss': 0.4248, 'learning_rate': 2.6089898376639656e-06, 'epoch': 1.53} {'loss': 0.5697, 'learning_rate': 2.608769339399101e-06, 'epoch': 1.53} {'loss': 0.6136, 'learning_rate': 2.6085488490546075e-06, 'epoch': 1.53} {'loss': 0.5599, 'learning_rate': 2.6083283666307235e-06, 'epoch': 1.53} {'loss': 0.4983, 'learning_rate': 2.6081078921276757e-06, 'epoch': 1.53} {'loss': 0.4391, 'learning_rate': 2.6078874255457154e-06, 'epoch': 1.53} {'loss': 0.4786, 'learning_rate': 2.607666966885064e-06, 'epoch': 1.53} {'loss': 0.4355, 'learning_rate': 2.6074465161459704e-06, 'epoch': 1.53} {'loss': 0.4839, 'learning_rate': 2.6072260733286626e-06, 'epoch': 1.53} {'loss': 0.5264, 'learning_rate': 2.60700563843338e-06, 'epoch': 1.53} {'loss': 0.394, 'learning_rate': 2.60678521146036e-06, 'epoch': 1.53} {'loss': 0.6308, 'learning_rate': 2.6065647924098313e-06, 'epoch': 1.53} {'loss': 0.4742, 'learning_rate': 2.606344381282041e-06, 'epoch': 1.53} {'loss': 0.5623, 'learning_rate': 2.6061239780772154e-06, 'epoch': 1.53} {'loss': 0.6789, 'learning_rate': 2.6059035827956002e-06, 'epoch': 1.53} {'loss': 0.6061, 'learning_rate': 2.605683195437424e-06, 'epoch': 1.53} {'loss': 0.5769, 'learning_rate': 2.605462816002926e-06, 'epoch': 1.53} {'loss': 0.4312, 'learning_rate': 2.605242444492344e-06, 'epoch': 1.53} {'loss': 0.7217, 'learning_rate': 2.605022080905907e-06, 'epoch': 1.53} {'loss': 0.3884, 'learning_rate': 2.604801725243862e-06, 'epoch': 1.53} {'loss': 0.6506, 'learning_rate': 2.604581377506433e-06, 'epoch': 1.53} {'loss': 0.6766, 'learning_rate': 2.60436103769387e-06, 'epoch': 1.53} {'loss': 0.5202, 'learning_rate': 2.6041407058063973e-06, 'epoch': 1.53} {'loss': 0.397, 'learning_rate': 2.603920381844256e-06, 'epoch': 1.53} {'loss': 0.5438, 'learning_rate': 2.603700065807684e-06, 'epoch': 1.53} {'loss': 0.4905, 'learning_rate': 2.6034797576969094e-06, 'epoch': 1.53} {'loss': 0.5431, 'learning_rate': 2.6032594575121796e-06, 'epoch': 1.53} {'loss': 0.4997, 'learning_rate': 2.603039165253719e-06, 'epoch': 1.53} {'loss': 0.5055, 'learning_rate': 2.602818880921775e-06, 'epoch': 1.53} {'loss': 0.589, 'learning_rate': 2.6025986045165765e-06, 'epoch': 1.53} {'loss': 0.5387, 'learning_rate': 2.602378336038359e-06, 'epoch': 1.53} {'loss': 0.4629, 'learning_rate': 2.6021580754873653e-06, 'epoch': 1.53} {'loss': 0.5645, 'learning_rate': 2.6019378228638214e-06, 'epoch': 1.53} {'loss': 0.4433, 'learning_rate': 2.6017175781679747e-06, 'epoch': 1.53} {'loss': 0.5062, 'learning_rate': 2.601497341400051e-06, 'epoch': 1.53} {'loss': 0.5216, 'learning_rate': 2.601277112560292e-06, 'epoch': 1.53} {'loss': 0.4544, 'learning_rate': 2.6010568916489322e-06, 'epoch': 1.53} {'loss': 0.5177, 'learning_rate': 2.6008366786662075e-06, 'epoch': 1.53} {'loss': 0.4393, 'learning_rate': 2.6006164736123575e-06, 'epoch': 1.53} {'loss': 0.4688, 'learning_rate': 2.600396276487608e-06, 'epoch': 1.53} {'loss': 0.5141, 'learning_rate': 2.6001760872922076e-06, 'epoch': 1.53} {'loss': 0.4558, 'learning_rate': 2.5999559060263847e-06, 'epoch': 1.53} {'loss': 0.5522, 'learning_rate': 2.599735732690376e-06, 'epoch': 1.53} {'loss': 0.6468, 'learning_rate': 2.5995155672844177e-06, 'epoch': 1.53} {'loss': 0.6088, 'learning_rate': 2.5992954098087475e-06, 'epoch': 1.53} {'loss': 0.4945, 'learning_rate': 2.599075260263603e-06, 'epoch': 1.53} {'loss': 0.5473, 'learning_rate': 2.5988551186492116e-06, 'epoch': 1.53} {'loss': 0.4285, 'learning_rate': 2.59863498496582e-06, 'epoch': 1.53} {'loss': 0.4756, 'learning_rate': 2.598414859213657e-06, 'epoch': 1.53} {'loss': 0.4868, 'learning_rate': 2.5981947413929596e-06, 'epoch': 1.53} {'loss': 0.5544, 'learning_rate': 2.5979746315039655e-06, 'epoch': 1.53} {'loss': 0.4205, 'learning_rate': 2.5977545295469097e-06, 'epoch': 1.53} {'loss': 0.6181, 'learning_rate': 2.59753443552203e-06, 'epoch': 1.53} {'loss': 0.5687, 'learning_rate': 2.5973143494295583e-06, 'epoch': 1.53} {'loss': 0.5579, 'learning_rate': 2.5970942712697323e-06, 'epoch': 1.53} {'loss': 0.4536, 'learning_rate': 2.596874201042787e-06, 'epoch': 1.53} {'loss': 0.4118, 'learning_rate': 2.5966541387489596e-06, 'epoch': 1.53} {'loss': 0.4375, 'learning_rate': 2.5964340843884893e-06, 'epoch': 1.53} {'loss': 0.4931, 'learning_rate': 2.5962140379616007e-06, 'epoch': 1.53} {'loss': 0.6266, 'learning_rate': 2.5959939994685445e-06, 'epoch': 1.53} {'loss': 0.4809, 'learning_rate': 2.595773968909545e-06, 'epoch': 1.53} {'loss': 0.5004, 'learning_rate': 2.595553946284842e-06, 'epoch': 1.53} {'loss': 0.4685, 'learning_rate': 2.5953339315946712e-06, 'epoch': 1.53} {'loss': 0.5184, 'learning_rate': 2.5951139248392687e-06, 'epoch': 1.53} {'loss': 0.4927, 'learning_rate': 2.5948939260188733e-06, 'epoch': 1.53} {'loss': 0.6634, 'learning_rate': 2.5946739351337134e-06, 'epoch': 1.53} {'loss': 0.6824, 'learning_rate': 2.5944539521840295e-06, 'epoch': 1.53} {'loss': 0.3321, 'learning_rate': 2.5942339771700575e-06, 'epoch': 1.53} {'loss': 0.5878, 'learning_rate': 2.594014010092031e-06, 'epoch': 1.53} {'loss': 0.5271, 'learning_rate': 2.593794050950187e-06, 'epoch': 1.53} {'loss': 0.4626, 'learning_rate': 2.593574099744761e-06, 'epoch': 1.53} {'loss': 0.591, 'learning_rate': 2.5933541564759924e-06, 'epoch': 1.53} {'loss': 0.5837, 'learning_rate': 2.5931342211441093e-06, 'epoch': 1.53} {'loss': 0.505, 'learning_rate': 2.5929142937493525e-06, 'epoch': 1.53} {'loss': 0.5463, 'learning_rate': 2.5926943742919565e-06, 'epoch': 1.53} {'loss': 0.5465, 'learning_rate': 2.5924744627721566e-06, 'epoch': 1.53} {'loss': 0.6704, 'learning_rate': 2.5922545591901883e-06, 'epoch': 1.53} {'loss': 0.586, 'learning_rate': 2.592034663546289e-06, 'epoch': 1.53} {'loss': 0.6825, 'learning_rate': 2.5918147758406953e-06, 'epoch': 1.53} {'loss': 0.4242, 'learning_rate': 2.591594896073638e-06, 'epoch': 1.53} {'loss': 0.6016, 'learning_rate': 2.591375024245355e-06, 'epoch': 1.53} {'loss': 0.4425, 'learning_rate': 2.5911551603560823e-06, 'epoch': 1.53} {'loss': 0.6559, 'learning_rate': 2.5909353044060572e-06, 'epoch': 1.53} {'loss': 0.4439, 'learning_rate': 2.5907154563955116e-06, 'epoch': 1.53} {'loss': 0.4986, 'learning_rate': 2.5904956163246874e-06, 'epoch': 1.53} {'loss': 0.578, 'learning_rate': 2.590275784193812e-06, 'epoch': 1.53} {'loss': 0.5041, 'learning_rate': 2.5900559600031263e-06, 'epoch': 1.53} {'loss': 0.5356, 'learning_rate': 2.589836143752863e-06, 'epoch': 1.53} {'loss': 0.5913, 'learning_rate': 2.589616335443259e-06, 'epoch': 1.53} {'loss': 0.5111, 'learning_rate': 2.5893965350745507e-06, 'epoch': 1.53} {'loss': 0.5495, 'learning_rate': 2.589176742646973e-06, 'epoch': 1.53} {'loss': 0.5468, 'learning_rate': 2.588956958160763e-06, 'epoch': 1.53} {'loss': 0.4572, 'learning_rate': 2.5887371816161533e-06, 'epoch': 1.53} {'loss': 0.4968, 'learning_rate': 2.5885174130133796e-06, 'epoch': 1.53} {'loss': 0.4482, 'learning_rate': 2.588297652352678e-06, 'epoch': 1.53} {'loss': 0.5335, 'learning_rate': 2.5880778996342848e-06, 'epoch': 1.53} {'loss': 0.4525, 'learning_rate': 2.587858154858436e-06, 'epoch': 1.53} {'loss': 0.4715, 'learning_rate': 2.5876384180253655e-06, 'epoch': 1.53} {'loss': 0.4802, 'learning_rate': 2.5874186891353126e-06, 'epoch': 1.53} {'loss': 0.5855, 'learning_rate': 2.5871989681885055e-06, 'epoch': 1.53} {'loss': 0.5104, 'learning_rate': 2.5869792551851845e-06, 'epoch': 1.53} {'loss': 0.3828, 'learning_rate': 2.586759550125585e-06, 'epoch': 1.53} {'loss': 0.4416, 'learning_rate': 2.5865398530099405e-06, 'epoch': 1.53} {'loss': 0.5379, 'learning_rate': 2.5863201638384916e-06, 'epoch': 1.53} {'loss': 0.5814, 'learning_rate': 2.5861004826114633e-06, 'epoch': 1.53} {'loss': 0.3942, 'learning_rate': 2.5858808093291043e-06, 'epoch': 1.53} {'loss': 0.5624, 'learning_rate': 2.585661143991639e-06, 'epoch': 1.53} {'loss': 0.4472, 'learning_rate': 2.585441486599308e-06, 'epoch': 1.53} {'loss': 0.478, 'learning_rate': 2.5852218371523454e-06, 'epoch': 1.53} {'loss': 0.4536, 'learning_rate': 2.585002195650986e-06, 'epoch': 1.53} {'loss': 0.5563, 'learning_rate': 2.5847825620954694e-06, 'epoch': 1.53} {'loss': 0.4789, 'learning_rate': 2.5845629364860224e-06, 'epoch': 1.53} {'loss': 0.5402, 'learning_rate': 2.5843433188228906e-06, 'epoch': 1.53} {'loss': 0.6226, 'learning_rate': 2.584123709106301e-06, 'epoch': 1.53} {'loss': 0.6027, 'learning_rate': 2.5839041073364933e-06, 'epoch': 1.53} {'loss': 0.4664, 'learning_rate': 2.5836845135137e-06, 'epoch': 1.53} {'loss': 0.5155, 'learning_rate': 2.5834649276381596e-06, 'epoch': 1.53} {'loss': 0.4864, 'learning_rate': 2.5832453497101086e-06, 'epoch': 1.53} {'loss': 0.666, 'learning_rate': 2.583025779729773e-06, 'epoch': 1.53} {'loss': 0.6014, 'learning_rate': 2.5828062176974013e-06, 'epoch': 1.53} {'loss': 0.5009, 'learning_rate': 2.582586663613219e-06, 'epoch': 1.53} {'loss': 0.5932, 'learning_rate': 2.5823671174774645e-06, 'epoch': 1.53} {'loss': 0.4397, 'learning_rate': 2.582147579290376e-06, 'epoch': 1.53} {'loss': 0.5748, 'learning_rate': 2.5819280490521804e-06, 'epoch': 1.53} {'loss': 0.3654, 'learning_rate': 2.5817085267631246e-06, 'epoch': 1.53} {'loss': 0.6435, 'learning_rate': 2.5814890124234336e-06, 'epoch': 1.53} {'loss': 0.7651, 'learning_rate': 2.581269506033347e-06, 'epoch': 1.53} {'loss': 0.6748, 'learning_rate': 2.5810500075931e-06, 'epoch': 1.53} {'loss': 0.506, 'learning_rate': 2.580830517102928e-06, 'epoch': 1.53} {'loss': 0.4303, 'learning_rate': 2.5806110345630685e-06, 'epoch': 1.53} {'loss': 0.4537, 'learning_rate': 2.5803915599737473e-06, 'epoch': 1.53} {'loss': 0.5411, 'learning_rate': 2.5801720933352126e-06, 'epoch': 1.53} {'loss': 0.5761, 'learning_rate': 2.57995263464769e-06, 'epoch': 1.53} {'loss': 0.5399, 'learning_rate': 2.5797331839114183e-06, 'epoch': 1.53} {'loss': 0.6145, 'learning_rate': 2.5795137411266312e-06, 'epoch': 1.53} {'loss': 0.4528, 'learning_rate': 2.579294306293566e-06, 'epoch': 1.53} {'loss': 0.5342, 'learning_rate': 2.5790748794124585e-06, 'epoch': 1.53} {'loss': 0.5641, 'learning_rate': 2.578855460483537e-06, 'epoch': 1.53} {'loss': 0.5398, 'learning_rate': 2.5786360495070475e-06, 'epoch': 1.53} {'loss': 0.6397, 'learning_rate': 2.578416646483216e-06, 'epoch': 1.53} {'loss': 0.3979, 'learning_rate': 2.5781972514122823e-06, 'epoch': 1.53} {'loss': 0.5046, 'learning_rate': 2.5779778642944785e-06, 'epoch': 1.53} {'loss': 0.6113, 'learning_rate': 2.5777584851300418e-06, 'epoch': 1.53} {'loss': 0.4567, 'learning_rate': 2.5775391139192097e-06, 'epoch': 1.53} {'loss': 0.53, 'learning_rate': 2.5773197506622084e-06, 'epoch': 1.53} {'loss': 0.4871, 'learning_rate': 2.5771003953592844e-06, 'epoch': 1.53} {'loss': 0.4482, 'learning_rate': 2.5768810480106655e-06, 'epoch': 1.53} {'loss': 0.641, 'learning_rate': 2.5766617086165877e-06, 'epoch': 1.53} {'loss': 0.5145, 'learning_rate': 2.5764423771772894e-06, 'epoch': 1.53} {'loss': 0.4598, 'learning_rate': 2.5762230536929976e-06, 'epoch': 1.53} {'loss': 0.6954, 'learning_rate': 2.576003738163959e-06, 'epoch': 1.53} {'loss': 0.583, 'learning_rate': 2.575784430590397e-06, 'epoch': 1.53} {'loss': 0.4705, 'learning_rate': 2.575565130972557e-06, 'epoch': 1.53} {'loss': 0.5412, 'learning_rate': 2.5753458393106668e-06, 'epoch': 1.53} {'loss': 0.4777, 'learning_rate': 2.5751265556049632e-06, 'epoch': 1.53} {'loss': 0.4685, 'learning_rate': 2.574907279855685e-06, 'epoch': 1.53} {'loss': 0.549, 'learning_rate': 2.574688012063058e-06, 'epoch': 1.53} {'loss': 0.5598, 'learning_rate': 2.574468752227328e-06, 'epoch': 1.53} {'loss': 0.4334, 'learning_rate': 2.57424950034872e-06, 'epoch': 1.53} {'loss': 0.6545, 'learning_rate': 2.574030256427479e-06, 'epoch': 1.53} {'loss': 0.5004, 'learning_rate': 2.5738110204638323e-06, 'epoch': 1.53} {'loss': 0.398, 'learning_rate': 2.573591792458018e-06, 'epoch': 1.53} {'loss': 0.5297, 'learning_rate': 2.573372572410272e-06, 'epoch': 1.53} {'loss': 0.4958, 'learning_rate': 2.5731533603208226e-06, 'epoch': 1.53} {'loss': 0.5042, 'learning_rate': 2.5729341561899147e-06, 'epoch': 1.53} {'loss': 0.4749, 'learning_rate': 2.5727149600177725e-06, 'epoch': 1.53} {'loss': 0.5011, 'learning_rate': 2.5724957718046427e-06, 'epoch': 1.53} {'loss': 0.5394, 'learning_rate': 2.572276591550752e-06, 'epoch': 1.53} {'loss': 0.4328, 'learning_rate': 2.5720574192563364e-06, 'epoch': 1.53} {'loss': 0.5971, 'learning_rate': 2.5718382549216347e-06, 'epoch': 1.53} {'loss': 0.5596, 'learning_rate': 2.5716190985468725e-06, 'epoch': 1.53} {'loss': 0.4917, 'learning_rate': 2.5713999501322973e-06, 'epoch': 1.53} {'loss': 0.5606, 'learning_rate': 2.5711808096781356e-06, 'epoch': 1.53} {'loss': 0.5068, 'learning_rate': 2.5709616771846225e-06, 'epoch': 1.53} {'loss': 0.5714, 'learning_rate': 2.5707425526519947e-06, 'epoch': 1.53} {'loss': 0.4694, 'learning_rate': 2.5705234360804877e-06, 'epoch': 1.53} {'loss': 0.3093, 'learning_rate': 2.570304327470338e-06, 'epoch': 1.53} {'loss': 0.4104, 'learning_rate': 2.570085226821771e-06, 'epoch': 1.53} {'loss': 0.4375, 'learning_rate': 2.569866134135035e-06, 'epoch': 1.53} {'loss': 0.5303, 'learning_rate': 2.5696470494103542e-06, 'epoch': 1.53} {'loss': 0.6318, 'learning_rate': 2.569427972647969e-06, 'epoch': 1.53} {'loss': 0.4768, 'learning_rate': 2.5692089038481105e-06, 'epoch': 1.53} {'loss': 0.5719, 'learning_rate': 2.568989843011016e-06, 'epoch': 1.53} {'loss': 0.4285, 'learning_rate': 2.568770790136923e-06, 'epoch': 1.53} {'loss': 0.4633, 'learning_rate': 2.5685517452260566e-06, 'epoch': 1.53} {'loss': 0.5205, 'learning_rate': 2.5683327082786634e-06, 'epoch': 1.53} {'loss': 0.5287, 'learning_rate': 2.56811367929497e-06, 'epoch': 1.53} {'loss': 0.3921, 'learning_rate': 2.5678946582752128e-06, 'epoch': 1.53} {'loss': 0.5507, 'learning_rate': 2.5676756452196285e-06, 'epoch': 1.53} {'loss': 0.5674, 'learning_rate': 2.5674566401284494e-06, 'epoch': 1.53} {'loss': 0.4263, 'learning_rate': 2.5672376430019143e-06, 'epoch': 1.53} {'loss': 0.5319, 'learning_rate': 2.5670186538402532e-06, 'epoch': 1.53} {'loss': 0.5714, 'learning_rate': 2.5667996726437004e-06, 'epoch': 1.53} {'loss': 0.5581, 'learning_rate': 2.566580699412494e-06, 'epoch': 1.53} {'loss': 0.5527, 'learning_rate': 2.566361734146867e-06, 'epoch': 1.53} {'loss': 0.4734, 'learning_rate': 2.566142776847055e-06, 'epoch': 1.54} {'loss': 0.5428, 'learning_rate': 2.5659238275132914e-06, 'epoch': 1.54} {'loss': 0.3786, 'learning_rate': 2.5657048861458146e-06, 'epoch': 1.54} {'loss': 0.6814, 'learning_rate': 2.565485952744853e-06, 'epoch': 1.54} {'loss': 0.537, 'learning_rate': 2.565267027310644e-06, 'epoch': 1.54} {'loss': 0.5901, 'learning_rate': 2.565048109843422e-06, 'epoch': 1.54} {'loss': 0.6288, 'learning_rate': 2.5648292003434228e-06, 'epoch': 1.54} {'loss': 0.5933, 'learning_rate': 2.56461029881088e-06, 'epoch': 1.54} {'loss': 0.521, 'learning_rate': 2.564391405246027e-06, 'epoch': 1.54} {'loss': 0.5323, 'learning_rate': 2.564172519649104e-06, 'epoch': 1.54} {'loss': 0.5117, 'learning_rate': 2.5639536420203382e-06, 'epoch': 1.54} {'loss': 0.662, 'learning_rate': 2.5637347723599683e-06, 'epoch': 1.54} {'loss': 0.4398, 'learning_rate': 2.563515910668226e-06, 'epoch': 1.54} {'loss': 0.5124, 'learning_rate': 2.5632970569453485e-06, 'epoch': 1.54} {'loss': 0.534, 'learning_rate': 2.5630782111915687e-06, 'epoch': 1.54} {'loss': 0.6448, 'learning_rate': 2.562859373407125e-06, 'epoch': 1.54} {'loss': 0.4927, 'learning_rate': 2.5626405435922463e-06, 'epoch': 1.54} {'loss': 0.3869, 'learning_rate': 2.562421721747169e-06, 'epoch': 1.54} {'loss': 0.5388, 'learning_rate': 2.5622029078721287e-06, 'epoch': 1.54} {'loss': 0.4246, 'learning_rate': 2.5619841019673587e-06, 'epoch': 1.54} {'loss': 0.655, 'learning_rate': 2.5617653040330937e-06, 'epoch': 1.54} {'loss': 0.4565, 'learning_rate': 2.5615465140695727e-06, 'epoch': 1.54} {'loss': 0.5017, 'learning_rate': 2.5613277320770226e-06, 'epoch': 1.54} {'loss': 0.4857, 'learning_rate': 2.56110895805568e-06, 'epoch': 1.54} {'loss': 0.4548, 'learning_rate': 2.5608901920057818e-06, 'epoch': 1.54} {'loss': 0.3963, 'learning_rate': 2.5606714339275607e-06, 'epoch': 1.54} {'loss': 0.4353, 'learning_rate': 2.5604526838212517e-06, 'epoch': 1.54} {'loss': 0.6393, 'learning_rate': 2.5602339416870893e-06, 'epoch': 1.54} {'loss': 0.4044, 'learning_rate': 2.5600152075253106e-06, 'epoch': 1.54} {'loss': 0.5725, 'learning_rate': 2.559796481336144e-06, 'epoch': 1.54} {'loss': 0.5827, 'learning_rate': 2.559577763119827e-06, 'epoch': 1.54} {'loss': 0.4718, 'learning_rate': 2.5593590528765945e-06, 'epoch': 1.54} {'loss': 0.5737, 'learning_rate': 2.559140350606679e-06, 'epoch': 1.54} {'loss': 0.621, 'learning_rate': 2.558921656310318e-06, 'epoch': 1.54} {'loss': 0.4193, 'learning_rate': 2.5587029699877465e-06, 'epoch': 1.54} {'loss': 0.5845, 'learning_rate': 2.5584842916391927e-06, 'epoch': 1.54} {'loss': 0.5195, 'learning_rate': 2.558265621264895e-06, 'epoch': 1.54} {'loss': 0.5307, 'learning_rate': 2.558046958865087e-06, 'epoch': 1.54} {'loss': 0.5739, 'learning_rate': 2.557828304440003e-06, 'epoch': 1.54} {'loss': 0.5224, 'learning_rate': 2.557609657989879e-06, 'epoch': 1.54} {'loss': 0.4663, 'learning_rate': 2.5573910195149477e-06, 'epoch': 1.54} {'loss': 0.6448, 'learning_rate': 2.5571723890154456e-06, 'epoch': 1.54} {'loss': 0.4971, 'learning_rate': 2.5569537664916023e-06, 'epoch': 1.54} {'loss': 0.4664, 'learning_rate': 2.5567351519436554e-06, 'epoch': 1.54} {'loss': 0.5799, 'learning_rate': 2.5565165453718388e-06, 'epoch': 1.54} {'loss': 0.4904, 'learning_rate': 2.556297946776386e-06, 'epoch': 1.54} {'loss': 0.4067, 'learning_rate': 2.5560793561575346e-06, 'epoch': 1.54} {'loss': 0.6044, 'learning_rate': 2.5558607735155105e-06, 'epoch': 1.54} {'loss': 0.5316, 'learning_rate': 2.5556421988505597e-06, 'epoch': 1.54} {'loss': 0.5087, 'learning_rate': 2.5554236321629068e-06, 'epoch': 1.54} {'loss': 0.5497, 'learning_rate': 2.555205073452789e-06, 'epoch': 1.54} {'loss': 0.4454, 'learning_rate': 2.5549865227204406e-06, 'epoch': 1.54} {'loss': 0.4144, 'learning_rate': 2.5547679799660975e-06, 'epoch': 1.54} {'loss': 0.4767, 'learning_rate': 2.5545494451899945e-06, 'epoch': 1.54} {'loss': 0.4806, 'learning_rate': 2.5543309183923583e-06, 'epoch': 1.54} {'loss': 0.5014, 'learning_rate': 2.554112399573434e-06, 'epoch': 1.54} {'loss': 0.4525, 'learning_rate': 2.5538938887334476e-06, 'epoch': 1.54} {'loss': 0.516, 'learning_rate': 2.553675385872636e-06, 'epoch': 1.54} {'loss': 0.5931, 'learning_rate': 2.5534568909912326e-06, 'epoch': 1.54} {'loss': 0.492, 'learning_rate': 2.5532384040894733e-06, 'epoch': 1.54} {'loss': 0.5448, 'learning_rate': 2.5530199251675936e-06, 'epoch': 1.54} {'loss': 0.5454, 'learning_rate': 2.5528014542258193e-06, 'epoch': 1.54} {'loss': 0.5508, 'learning_rate': 2.5525829912643964e-06, 'epoch': 1.54} {'loss': 0.5137, 'learning_rate': 2.5523645362835494e-06, 'epoch': 1.54} {'loss': 0.5078, 'learning_rate': 2.552146089283517e-06, 'epoch': 1.54} {'loss': 0.4947, 'learning_rate': 2.551927650264534e-06, 'epoch': 1.54} {'loss': 0.4044, 'learning_rate': 2.551709219226828e-06, 'epoch': 1.54} {'loss': 0.6012, 'learning_rate': 2.551490796170644e-06, 'epoch': 1.54} {'loss': 0.5765, 'learning_rate': 2.5512723810962027e-06, 'epoch': 1.54} {'loss': 0.6207, 'learning_rate': 2.551053974003752e-06, 'epoch': 1.54} {'loss': 0.4731, 'learning_rate': 2.5508355748935167e-06, 'epoch': 1.54} {'loss': 0.4575, 'learning_rate': 2.550617183765732e-06, 'epoch': 1.54} {'loss': 0.4172, 'learning_rate': 2.550398800620637e-06, 'epoch': 1.54} {'loss': 0.4174, 'learning_rate': 2.550180425458457e-06, 'epoch': 1.54} {'loss': 0.4596, 'learning_rate': 2.549962058279436e-06, 'epoch': 1.54} {'loss': 0.5826, 'learning_rate': 2.5497436990837975e-06, 'epoch': 1.54} {'loss': 0.5436, 'learning_rate': 2.5495253478717875e-06, 'epoch': 1.54} {'loss': 0.3919, 'learning_rate': 2.5493070046436297e-06, 'epoch': 1.54} {'loss': 0.4706, 'learning_rate': 2.549088669399562e-06, 'epoch': 1.54} {'loss': 0.4651, 'learning_rate': 2.548870342139821e-06, 'epoch': 1.54} {'loss': 0.5852, 'learning_rate': 2.5486520228646327e-06, 'epoch': 1.54} {'loss': 0.4503, 'learning_rate': 2.5484337115742418e-06, 'epoch': 1.54} {'loss': 0.4652, 'learning_rate': 2.5482154082688716e-06, 'epoch': 1.54} {'loss': 0.5259, 'learning_rate': 2.5479971129487655e-06, 'epoch': 1.54} {'loss': 0.419, 'learning_rate': 2.547778825614151e-06, 'epoch': 1.54} {'loss': 0.4728, 'learning_rate': 2.5475605462652642e-06, 'epoch': 1.54} {'loss': 0.6678, 'learning_rate': 2.5473422749023425e-06, 'epoch': 1.54} {'loss': 0.4905, 'learning_rate': 2.547124011525609e-06, 'epoch': 1.54} {'loss': 0.5257, 'learning_rate': 2.5469057561353117e-06, 'epoch': 1.54} {'loss': 0.4559, 'learning_rate': 2.5466875087316744e-06, 'epoch': 1.54} {'loss': 0.4573, 'learning_rate': 2.546469269314934e-06, 'epoch': 1.54} {'loss': 0.5901, 'learning_rate': 2.5462510378853246e-06, 'epoch': 1.54} {'loss': 0.4678, 'learning_rate': 2.546032814443079e-06, 'epoch': 1.54} {'loss': 0.5554, 'learning_rate': 2.5458145989884363e-06, 'epoch': 1.54} {'loss': 0.3726, 'learning_rate': 2.54559639152162e-06, 'epoch': 1.54} {'loss': 0.4102, 'learning_rate': 2.5453781920428746e-06, 'epoch': 1.54} {'loss': 0.4939, 'learning_rate': 2.545160000552427e-06, 'epoch': 1.54} {'loss': 0.5571, 'learning_rate': 2.5449418170505136e-06, 'epoch': 1.54} {'loss': 0.4883, 'learning_rate': 2.544723641537368e-06, 'epoch': 1.54} {'loss': 0.6841, 'learning_rate': 2.5445054740132236e-06, 'epoch': 1.54} {'loss': 0.5568, 'learning_rate': 2.5442873144783177e-06, 'epoch': 1.54} {'loss': 0.5489, 'learning_rate': 2.544069162932875e-06, 'epoch': 1.54} {'loss': 0.3291, 'learning_rate': 2.5438510193771404e-06, 'epoch': 1.54} {'loss': 0.6324, 'learning_rate': 2.54363288381134e-06, 'epoch': 1.54} {'loss': 0.5469, 'learning_rate': 2.543414756235709e-06, 'epoch': 1.54} {'loss': 0.4903, 'learning_rate': 2.5431966366504867e-06, 'epoch': 1.54} {'loss': 0.6386, 'learning_rate': 2.5429785250558957e-06, 'epoch': 1.54} {'loss': 0.5221, 'learning_rate': 2.5427604214521817e-06, 'epoch': 1.54} {'loss': 0.5861, 'learning_rate': 2.5425423258395667e-06, 'epoch': 1.54} {'loss': 0.4118, 'learning_rate': 2.5423242382182976e-06, 'epoch': 1.54} {'loss': 0.5535, 'learning_rate': 2.5421061585885976e-06, 'epoch': 1.54} {'loss': 0.5305, 'learning_rate': 2.5418880869507046e-06, 'epoch': 1.54} {'loss': 0.5359, 'learning_rate': 2.5416700233048543e-06, 'epoch': 1.54} {'loss': 0.4687, 'learning_rate': 2.541451967651272e-06, 'epoch': 1.54} {'loss': 0.5609, 'learning_rate': 2.5412339199902012e-06, 'epoch': 1.54} {'loss': 0.3826, 'learning_rate': 2.5410158803218678e-06, 'epoch': 1.54} {'loss': 0.6029, 'learning_rate': 2.5407978486465145e-06, 'epoch': 1.54} {'loss': 0.6278, 'learning_rate': 2.5405798249643656e-06, 'epoch': 1.54} {'loss': 0.4046, 'learning_rate': 2.54036180927566e-06, 'epoch': 1.54} {'loss': 0.487, 'learning_rate': 2.540143801580632e-06, 'epoch': 1.54} {'loss': 0.6732, 'learning_rate': 2.539925801879507e-06, 'epoch': 1.54} {'loss': 0.5959, 'learning_rate': 2.5397078101725315e-06, 'epoch': 1.54} {'loss': 0.4233, 'learning_rate': 2.5394898264599297e-06, 'epoch': 1.54} {'loss': 0.3965, 'learning_rate': 2.539271850741938e-06, 'epoch': 1.54} {'loss': 0.4755, 'learning_rate': 2.5390538830187894e-06, 'epoch': 1.54} {'loss': 0.4204, 'learning_rate': 2.538835923290718e-06, 'epoch': 1.54} {'loss': 0.5076, 'learning_rate': 2.5386179715579595e-06, 'epoch': 1.54} {'loss': 0.3965, 'learning_rate': 2.53840002782074e-06, 'epoch': 1.54} {'loss': 0.4959, 'learning_rate': 2.5381820920793043e-06, 'epoch': 1.54} {'loss': 0.3888, 'learning_rate': 2.5379641643338772e-06, 'epoch': 1.54} {'loss': 0.6135, 'learning_rate': 2.5377462445846945e-06, 'epoch': 1.54} {'loss': 0.4976, 'learning_rate': 2.537528332831991e-06, 'epoch': 1.54} {'loss': 0.4012, 'learning_rate': 2.5373104290759986e-06, 'epoch': 1.54} {'loss': 0.6457, 'learning_rate': 2.537092533316955e-06, 'epoch': 1.54} {'loss': 0.5484, 'learning_rate': 2.536874645555084e-06, 'epoch': 1.54} {'loss': 0.5807, 'learning_rate': 2.536656765790633e-06, 'epoch': 1.54} {'loss': 0.2905, 'learning_rate': 2.5364388940238226e-06, 'epoch': 1.54} {'loss': 0.4487, 'learning_rate': 2.5362210302548928e-06, 'epoch': 1.54} {'loss': 0.4137, 'learning_rate': 2.5360031744840753e-06, 'epoch': 1.54} {'loss': 0.6536, 'learning_rate': 2.535785326711605e-06, 'epoch': 1.54} {'loss': 0.6252, 'learning_rate': 2.5355674869377166e-06, 'epoch': 1.54} {'loss': 0.5402, 'learning_rate': 2.535349655162638e-06, 'epoch': 1.54} {'loss': 0.4208, 'learning_rate': 2.535131831386607e-06, 'epoch': 1.54} {'loss': 0.5091, 'learning_rate': 2.534914015609855e-06, 'epoch': 1.54} {'loss': 0.4319, 'learning_rate': 2.5346962078326164e-06, 'epoch': 1.54} {'loss': 0.4545, 'learning_rate': 2.5344784080551254e-06, 'epoch': 1.54} {'loss': 0.5779, 'learning_rate': 2.534260616277614e-06, 'epoch': 1.54} {'loss': 0.4881, 'learning_rate': 2.5340428325003197e-06, 'epoch': 1.54} {'loss': 0.5774, 'learning_rate': 2.533825056723469e-06, 'epoch': 1.54} {'loss': 0.5746, 'learning_rate': 2.5336072889472983e-06, 'epoch': 1.54} {'loss': 0.5543, 'learning_rate': 2.5333895291720423e-06, 'epoch': 1.54} {'loss': 0.4276, 'learning_rate': 2.5331717773979324e-06, 'epoch': 1.54} {'loss': 0.5555, 'learning_rate': 2.5329540336252032e-06, 'epoch': 1.54} {'loss': 0.5192, 'learning_rate': 2.53273629785409e-06, 'epoch': 1.54} {'loss': 0.5544, 'learning_rate': 2.532518570084822e-06, 'epoch': 1.54} {'loss': 0.5427, 'learning_rate': 2.5323008503176338e-06, 'epoch': 1.54} {'loss': 0.6721, 'learning_rate': 2.5320831385527588e-06, 'epoch': 1.54} {'loss': 0.4567, 'learning_rate': 2.5318654347904313e-06, 'epoch': 1.54} {'loss': 0.5339, 'learning_rate': 2.5316477390308838e-06, 'epoch': 1.54} {'loss': 0.5045, 'learning_rate': 2.5314300512743496e-06, 'epoch': 1.54} {'loss': 0.5498, 'learning_rate': 2.5312123715210655e-06, 'epoch': 1.54} {'loss': 0.5762, 'learning_rate': 2.5309946997712586e-06, 'epoch': 1.54} {'loss': 0.519, 'learning_rate': 2.530777036025165e-06, 'epoch': 1.54} {'loss': 0.4621, 'learning_rate': 2.5305593802830174e-06, 'epoch': 1.54} {'loss': 0.4401, 'learning_rate': 2.530341732545051e-06, 'epoch': 1.54} {'loss': 0.5854, 'learning_rate': 2.5301240928114955e-06, 'epoch': 1.54} {'loss': 0.4793, 'learning_rate': 2.5299064610825876e-06, 'epoch': 1.54} {'loss': 0.6181, 'learning_rate': 2.5296888373585615e-06, 'epoch': 1.54} {'loss': 0.7532, 'learning_rate': 2.5294712216396456e-06, 'epoch': 1.54} {'loss': 0.5072, 'learning_rate': 2.529253613926075e-06, 'epoch': 1.54} {'loss': 0.4833, 'learning_rate': 2.5290360142180837e-06, 'epoch': 1.54} {'loss': 0.4446, 'learning_rate': 2.5288184225159053e-06, 'epoch': 1.54} {'loss': 0.4757, 'learning_rate': 2.5286008388197747e-06, 'epoch': 1.54} {'loss': 0.6602, 'learning_rate': 2.528383263129919e-06, 'epoch': 1.54} {'loss': 0.6263, 'learning_rate': 2.528165695446576e-06, 'epoch': 1.54} {'loss': 0.4022, 'learning_rate': 2.5279481357699777e-06, 'epoch': 1.54} {'loss': 0.5153, 'learning_rate': 2.5277305841003564e-06, 'epoch': 1.54} {'loss': 0.5157, 'learning_rate': 2.5275130404379468e-06, 'epoch': 1.54} {'loss': 0.573, 'learning_rate': 2.5272955047829817e-06, 'epoch': 1.54} {'loss': 0.416, 'learning_rate': 2.5270779771356968e-06, 'epoch': 1.54} {'loss': 0.6055, 'learning_rate': 2.5268604574963185e-06, 'epoch': 1.54} {'loss': 0.4693, 'learning_rate': 2.5266429458650844e-06, 'epoch': 1.54} {'loss': 0.6165, 'learning_rate': 2.5264254422422275e-06, 'epoch': 1.54} {'loss': 0.6281, 'learning_rate': 2.52620794662798e-06, 'epoch': 1.54} {'loss': 0.6038, 'learning_rate': 2.525990459022575e-06, 'epoch': 1.54} {'loss': 0.5078, 'learning_rate': 2.525772979426245e-06, 'epoch': 1.54} {'loss': 0.4861, 'learning_rate': 2.525555507839228e-06, 'epoch': 1.54} {'loss': 0.5188, 'learning_rate': 2.5253380442617494e-06, 'epoch': 1.54} {'loss': 0.5712, 'learning_rate': 2.5251205886940456e-06, 'epoch': 1.54} {'loss': 0.5149, 'learning_rate': 2.52490314113635e-06, 'epoch': 1.54} {'loss': 0.6678, 'learning_rate': 2.524685701588895e-06, 'epoch': 1.54} {'loss': 0.5389, 'learning_rate': 2.5244682700519172e-06, 'epoch': 1.54} {'loss': 0.531, 'learning_rate': 2.5242508465256398e-06, 'epoch': 1.54} {'loss': 0.57, 'learning_rate': 2.52403343101031e-06, 'epoch': 1.54} {'loss': 0.3661, 'learning_rate': 2.523816023506148e-06, 'epoch': 1.54} {'loss': 0.3959, 'learning_rate': 2.5235986240133937e-06, 'epoch': 1.54} {'loss': 0.4853, 'learning_rate': 2.523381232532277e-06, 'epoch': 1.54} {'loss': 0.5061, 'learning_rate': 2.5231638490630327e-06, 'epoch': 1.54} {'loss': 0.4515, 'learning_rate': 2.522946473605896e-06, 'epoch': 1.54} {'loss': 0.3915, 'learning_rate': 2.5227291061610916e-06, 'epoch': 1.54} {'loss': 0.4604, 'learning_rate': 2.522511746728863e-06, 'epoch': 1.54} {'loss': 0.3553, 'learning_rate': 2.5222943953094348e-06, 'epoch': 1.54} {'loss': 0.5671, 'learning_rate': 2.5220770519030437e-06, 'epoch': 1.54} {'loss': 0.6692, 'learning_rate': 2.5218597165099222e-06, 'epoch': 1.54} {'loss': 0.3484, 'learning_rate': 2.521642389130302e-06, 'epoch': 1.54} {'loss': 0.4744, 'learning_rate': 2.5214250697644204e-06, 'epoch': 1.54} {'loss': 0.5018, 'learning_rate': 2.5212077584125017e-06, 'epoch': 1.54} {'loss': 0.4214, 'learning_rate': 2.5209904550747886e-06, 'epoch': 1.54} {'loss': 0.5246, 'learning_rate': 2.520773159751506e-06, 'epoch': 1.54} {'loss': 0.4952, 'learning_rate': 2.520555872442891e-06, 'epoch': 1.54} {'loss': 0.5997, 'learning_rate': 2.5203385931491785e-06, 'epoch': 1.54} {'loss': 0.5772, 'learning_rate': 2.5201213218705923e-06, 'epoch': 1.54} {'loss': 0.5301, 'learning_rate': 2.5199040586073763e-06, 'epoch': 1.54} {'loss': 0.5998, 'learning_rate': 2.5196868033597534e-06, 'epoch': 1.54} {'loss': 0.4548, 'learning_rate': 2.519469556127966e-06, 'epoch': 1.54} {'loss': 0.5441, 'learning_rate': 2.5192523169122397e-06, 'epoch': 1.54} {'loss': 0.6895, 'learning_rate': 2.51903508571281e-06, 'epoch': 1.54} {'loss': 0.5576, 'learning_rate': 2.518817862529912e-06, 'epoch': 1.54} {'loss': 0.4425, 'learning_rate': 2.5186006473637704e-06, 'epoch': 1.54} {'loss': 0.4405, 'learning_rate': 2.518383440214629e-06, 'epoch': 1.54} {'loss': 0.5223, 'learning_rate': 2.518166241082709e-06, 'epoch': 1.54} {'loss': 0.3866, 'learning_rate': 2.5179490499682557e-06, 'epoch': 1.54} {'loss': 0.4555, 'learning_rate': 2.5177318668714913e-06, 'epoch': 1.54} {'loss': 0.509, 'learning_rate': 2.517514691792653e-06, 'epoch': 1.54} {'loss': 0.3794, 'learning_rate': 2.5172975247319766e-06, 'epoch': 1.54} {'loss': 0.6123, 'learning_rate': 2.5170803656896845e-06, 'epoch': 1.54} {'loss': 0.5199, 'learning_rate': 2.516863214666022e-06, 'epoch': 1.54} {'loss': 0.6383, 'learning_rate': 2.5166460716612106e-06, 'epoch': 1.54} {'loss': 0.6238, 'learning_rate': 2.5164289366754945e-06, 'epoch': 1.54} {'loss': 0.577, 'learning_rate': 2.516211809709097e-06, 'epoch': 1.54} {'loss': 0.6214, 'learning_rate': 2.5159946907622536e-06, 'epoch': 1.54} {'loss': 0.5283, 'learning_rate': 2.5157775798352e-06, 'epoch': 1.54} {'loss': 0.6234, 'learning_rate': 2.5155604769281616e-06, 'epoch': 1.54} {'loss': 0.502, 'learning_rate': 2.515343382041381e-06, 'epoch': 1.54} {'loss': 0.561, 'learning_rate': 2.515126295175079e-06, 'epoch': 1.54} {'loss': 0.5447, 'learning_rate': 2.5149092163295007e-06, 'epoch': 1.54} {'loss': 0.4137, 'learning_rate': 2.51469214550487e-06, 'epoch': 1.54} {'loss': 0.5457, 'learning_rate': 2.514475082701423e-06, 'epoch': 1.54} {'loss': 0.5082, 'learning_rate': 2.514258027919394e-06, 'epoch': 1.54} {'loss': 0.4403, 'learning_rate': 2.514040981159007e-06, 'epoch': 1.54} {'loss': 0.4405, 'learning_rate': 2.5138239424205068e-06, 'epoch': 1.54} {'loss': 0.589, 'learning_rate': 2.5136069117041175e-06, 'epoch': 1.54} {'loss': 0.5118, 'learning_rate': 2.513389889010073e-06, 'epoch': 1.54} {'loss': 0.4416, 'learning_rate': 2.5131728743386073e-06, 'epoch': 1.54} {'loss': 0.538, 'learning_rate': 2.5129558676899537e-06, 'epoch': 1.54} {'loss': 0.4516, 'learning_rate': 2.5127388690643452e-06, 'epoch': 1.54} {'loss': 0.6097, 'learning_rate': 2.5125218784620074e-06, 'epoch': 1.54} {'loss': 0.5334, 'learning_rate': 2.512304895883184e-06, 'epoch': 1.54} {'loss': 0.7262, 'learning_rate': 2.5120879213280992e-06, 'epoch': 1.54} {'loss': 0.5691, 'learning_rate': 2.5118709547969876e-06, 'epoch': 1.54} {'loss': 0.6, 'learning_rate': 2.511653996290082e-06, 'epoch': 1.54} {'loss': 0.6285, 'learning_rate': 2.5114370458076152e-06, 'epoch': 1.54} {'loss': 0.514, 'learning_rate': 2.5112201033498216e-06, 'epoch': 1.54} {'loss': 0.4429, 'learning_rate': 2.511003168916927e-06, 'epoch': 1.54} {'loss': 0.3323, 'learning_rate': 2.5107862425091744e-06, 'epoch': 1.54} {'loss': 0.5508, 'learning_rate': 2.510569324126786e-06, 'epoch': 1.54} {'loss': 0.4458, 'learning_rate': 2.5103524137699997e-06, 'epoch': 1.54} {'loss': 0.5875, 'learning_rate': 2.5101355114390456e-06, 'epoch': 1.54} {'loss': 0.467, 'learning_rate': 2.509918617134158e-06, 'epoch': 1.54} {'loss': 0.6177, 'learning_rate': 2.5097017308555727e-06, 'epoch': 1.54} {'loss': 0.422, 'learning_rate': 2.509484852603513e-06, 'epoch': 1.54} {'loss': 0.6237, 'learning_rate': 2.5092679823782184e-06, 'epoch': 1.54} {'loss': 0.4942, 'learning_rate': 2.5090511201799174e-06, 'epoch': 1.54} {'loss': 0.6159, 'learning_rate': 2.5088342660088447e-06, 'epoch': 1.54} {'loss': 0.49, 'learning_rate': 2.508617419865236e-06, 'epoch': 1.54} {'loss': 0.4612, 'learning_rate': 2.508400581749314e-06, 'epoch': 1.54} {'loss': 0.5694, 'learning_rate': 2.508183751661322e-06, 'epoch': 1.54} {'loss': 0.4613, 'learning_rate': 2.507966929601484e-06, 'epoch': 1.54} {'loss': 0.5713, 'learning_rate': 2.5077501155700366e-06, 'epoch': 1.54} {'loss': 0.4725, 'learning_rate': 2.5075333095672107e-06, 'epoch': 1.54} {'loss': 0.4018, 'learning_rate': 2.50731651159324e-06, 'epoch': 1.54} {'loss': 0.538, 'learning_rate': 2.5070997216483574e-06, 'epoch': 1.54} {'loss': 0.5698, 'learning_rate': 2.5068829397327887e-06, 'epoch': 1.54} {'loss': 0.4876, 'learning_rate': 2.506666165846777e-06, 'epoch': 1.54} {'loss': 0.4993, 'learning_rate': 2.5064493999905457e-06, 'epoch': 1.54} {'loss': 0.5809, 'learning_rate': 2.50623264216433e-06, 'epoch': 1.54} {'loss': 0.4956, 'learning_rate': 2.506015892368363e-06, 'epoch': 1.54} {'loss': 0.466, 'learning_rate': 2.5057991506028756e-06, 'epoch': 1.54} {'loss': 0.4057, 'learning_rate': 2.505582416868104e-06, 'epoch': 1.54} {'loss': 0.5109, 'learning_rate': 2.5053656911642743e-06, 'epoch': 1.54} {'loss': 0.6082, 'learning_rate': 2.505148973491622e-06, 'epoch': 1.54} {'loss': 0.4896, 'learning_rate': 2.5049322638503793e-06, 'epoch': 1.54} {'loss': 0.5834, 'learning_rate': 2.5047155622407783e-06, 'epoch': 1.54} {'loss': 0.3855, 'learning_rate': 2.5044988686630502e-06, 'epoch': 1.54} {'loss': 0.6054, 'learning_rate': 2.504282183117428e-06, 'epoch': 1.54} {'loss': 0.5642, 'learning_rate': 2.5040655056041475e-06, 'epoch': 1.54} {'loss': 0.5152, 'learning_rate': 2.5038488361234336e-06, 'epoch': 1.54} {'loss': 0.4065, 'learning_rate': 2.5036321746755233e-06, 'epoch': 1.54} {'loss': 0.5666, 'learning_rate': 2.503415521260647e-06, 'epoch': 1.54} {'loss': 0.4323, 'learning_rate': 2.5031988758790384e-06, 'epoch': 1.54} {'loss': 0.5162, 'learning_rate': 2.5029822385309276e-06, 'epoch': 1.54} {'loss': 0.5227, 'learning_rate': 2.5027656092165487e-06, 'epoch': 1.54} {'loss': 0.4405, 'learning_rate': 2.5025489879361363e-06, 'epoch': 1.54} {'loss': 0.5312, 'learning_rate': 2.5023323746899165e-06, 'epoch': 1.54} {'loss': 0.4408, 'learning_rate': 2.502115769478124e-06, 'epoch': 1.54} {'loss': 0.5323, 'learning_rate': 2.501899172300991e-06, 'epoch': 1.54} {'loss': 0.5433, 'learning_rate': 2.50168258315875e-06, 'epoch': 1.54} {'loss': 0.4232, 'learning_rate': 2.5014660020516324e-06, 'epoch': 1.54} {'loss': 0.5278, 'learning_rate': 2.501249428979874e-06, 'epoch': 1.54} {'loss': 0.511, 'learning_rate': 2.5010328639437007e-06, 'epoch': 1.54} {'loss': 0.5531, 'learning_rate': 2.5008163069433477e-06, 'epoch': 1.54} {'loss': 0.5422, 'learning_rate': 2.5005997579790465e-06, 'epoch': 1.54} {'loss': 0.4889, 'learning_rate': 2.50038321705103e-06, 'epoch': 1.54} {'loss': 0.4243, 'learning_rate': 2.5001666841595294e-06, 'epoch': 1.54} {'loss': 0.5817, 'learning_rate': 2.499950159304777e-06, 'epoch': 1.54} {'loss': 0.478, 'learning_rate': 2.4997336424870078e-06, 'epoch': 1.54} {'loss': 0.4985, 'learning_rate': 2.4995171337064485e-06, 'epoch': 1.54} {'loss': 0.4532, 'learning_rate': 2.499300632963334e-06, 'epoch': 1.54} {'loss': 0.568, 'learning_rate': 2.499084140257895e-06, 'epoch': 1.54} {'loss': 0.5862, 'learning_rate': 2.4988676555903646e-06, 'epoch': 1.54} {'loss': 0.4425, 'learning_rate': 2.4986511789609746e-06, 'epoch': 1.54} {'loss': 0.345, 'learning_rate': 2.4984347103699556e-06, 'epoch': 1.54} {'loss': 0.5895, 'learning_rate': 2.4982182498175457e-06, 'epoch': 1.54} {'loss': 0.5624, 'learning_rate': 2.4980017973039685e-06, 'epoch': 1.54} {'loss': 0.5221, 'learning_rate': 2.4977853528294594e-06, 'epoch': 1.54} {'loss': 0.3829, 'learning_rate': 2.4975689163942497e-06, 'epoch': 1.54} {'loss': 0.393, 'learning_rate': 2.497352487998573e-06, 'epoch': 1.54} {'loss': 0.5043, 'learning_rate': 2.4971360676426624e-06, 'epoch': 1.54} {'loss': 0.6926, 'learning_rate': 2.4969196553267425e-06, 'epoch': 1.54} {'loss': 0.7037, 'learning_rate': 2.496703251051056e-06, 'epoch': 1.54} {'loss': 0.5058, 'learning_rate': 2.4964868548158262e-06, 'epoch': 1.54} {'loss': 0.5382, 'learning_rate': 2.4962704666212876e-06, 'epoch': 1.54} {'loss': 0.5283, 'learning_rate': 2.4960540864676742e-06, 'epoch': 1.54} {'loss': 0.4753, 'learning_rate': 2.4958377143552135e-06, 'epoch': 1.54} {'loss': 0.4335, 'learning_rate': 2.4956213502841453e-06, 'epoch': 1.54} {'loss': 0.5785, 'learning_rate': 2.495404994254689e-06, 'epoch': 1.54} {'loss': 0.3867, 'learning_rate': 2.4951886462670893e-06, 'epoch': 1.54} {'loss': 0.5564, 'learning_rate': 2.49497230632157e-06, 'epoch': 1.54} {'loss': 0.5987, 'learning_rate': 2.494755974418365e-06, 'epoch': 1.54} {'loss': 0.6848, 'learning_rate': 2.494539650557709e-06, 'epoch': 1.54} {'loss': 0.4999, 'learning_rate': 2.4943233347398254e-06, 'epoch': 1.54} {'loss': 0.5948, 'learning_rate': 2.494107026964958e-06, 'epoch': 1.54} {'loss': 0.4921, 'learning_rate': 2.493890727233329e-06, 'epoch': 1.54} {'loss': 0.4133, 'learning_rate': 2.4936744355451746e-06, 'epoch': 1.54} {'loss': 0.5646, 'learning_rate': 2.493458151900724e-06, 'epoch': 1.54} {'loss': 0.4809, 'learning_rate': 2.493241876300212e-06, 'epoch': 1.54} {'loss': 0.4453, 'learning_rate': 2.493025608743871e-06, 'epoch': 1.54} {'loss': 0.5744, 'learning_rate': 2.492809349231924e-06, 'epoch': 1.54} {'loss': 0.6128, 'learning_rate': 2.492593097764616e-06, 'epoch': 1.54} {'loss': 0.3494, 'learning_rate': 2.49237685434217e-06, 'epoch': 1.54} {'loss': 0.5734, 'learning_rate': 2.4921606189648185e-06, 'epoch': 1.54} {'loss': 0.5326, 'learning_rate': 2.4919443916327946e-06, 'epoch': 1.54} {'loss': 0.397, 'learning_rate': 2.4917281723463305e-06, 'epoch': 1.54} {'loss': 0.5981, 'learning_rate': 2.4915119611056604e-06, 'epoch': 1.54} {'loss': 0.5416, 'learning_rate': 2.4912957579110063e-06, 'epoch': 1.54} {'loss': 0.363, 'learning_rate': 2.491079562762613e-06, 'epoch': 1.54} {'loss': 0.5207, 'learning_rate': 2.4908633756607026e-06, 'epoch': 1.54} {'loss': 0.6255, 'learning_rate': 2.490647196605509e-06, 'epoch': 1.54} {'loss': 0.5537, 'learning_rate': 2.4904310255972685e-06, 'epoch': 1.54} {'loss': 0.5804, 'learning_rate': 2.4902148626362033e-06, 'epoch': 1.54} {'loss': 0.3605, 'learning_rate': 2.4899987077225563e-06, 'epoch': 1.54} {'loss': 0.5935, 'learning_rate': 2.4897825608565474e-06, 'epoch': 1.54} {'loss': 0.6202, 'learning_rate': 2.489566422038421e-06, 'epoch': 1.54} {'loss': 0.5773, 'learning_rate': 2.4893502912683977e-06, 'epoch': 1.54} {'loss': 0.443, 'learning_rate': 2.489134168546714e-06, 'epoch': 1.54} {'loss': 0.5027, 'learning_rate': 2.4889180538736045e-06, 'epoch': 1.54} {'loss': 0.4253, 'learning_rate': 2.4887019472492902e-06, 'epoch': 1.54} {'loss': 0.4982, 'learning_rate': 2.488485848674016e-06, 'epoch': 1.54} {'loss': 0.552, 'learning_rate': 2.488269758148002e-06, 'epoch': 1.54} {'loss': 0.6003, 'learning_rate': 2.48805367567149e-06, 'epoch': 1.54} {'loss': 0.6069, 'learning_rate': 2.487837601244705e-06, 'epoch': 1.54} {'loss': 0.405, 'learning_rate': 2.4876215348678777e-06, 'epoch': 1.54} {'loss': 0.4737, 'learning_rate': 2.487405476541247e-06, 'epoch': 1.54} {'loss': 0.6909, 'learning_rate': 2.487189426265032e-06, 'epoch': 1.54} {'loss': 0.6173, 'learning_rate': 2.486973384039478e-06, 'epoch': 1.54} {'loss': 0.5687, 'learning_rate': 2.4867573498648044e-06, 'epoch': 1.54} {'loss': 0.5652, 'learning_rate': 2.486541323741254e-06, 'epoch': 1.54} {'loss': 0.3984, 'learning_rate': 2.4863253056690506e-06, 'epoch': 1.54} {'loss': 0.4445, 'learning_rate': 2.4861092956484268e-06, 'epoch': 1.54} {'loss': 0.5281, 'learning_rate': 2.485893293679619e-06, 'epoch': 1.54} {'loss': 0.562, 'learning_rate': 2.4856772997628477e-06, 'epoch': 1.54} {'loss': 0.5204, 'learning_rate': 2.4854613138983576e-06, 'epoch': 1.54} {'loss': 0.4359, 'learning_rate': 2.485245336086368e-06, 'epoch': 1.54} {'loss': 0.4838, 'learning_rate': 2.485029366327123e-06, 'epoch': 1.54} {'loss': 0.457, 'learning_rate': 2.484813404620844e-06, 'epoch': 1.54} {'loss': 0.4941, 'learning_rate': 2.484597450967765e-06, 'epoch': 1.54} {'loss': 0.5456, 'learning_rate': 2.484381505368122e-06, 'epoch': 1.54} {'loss': 0.491, 'learning_rate': 2.4841655678221353e-06, 'epoch': 1.54} {'loss': 0.5552, 'learning_rate': 2.483949638330051e-06, 'epoch': 1.54} {'loss': 0.4836, 'learning_rate': 2.483733716892086e-06, 'epoch': 1.54} {'loss': 0.4843, 'learning_rate': 2.4835178035084852e-06, 'epoch': 1.54} {'loss': 0.7778, 'learning_rate': 2.483301898179471e-06, 'epoch': 1.54} {'loss': 0.3888, 'learning_rate': 2.483086000905276e-06, 'epoch': 1.54} {'loss': 0.6087, 'learning_rate': 2.4828701116861366e-06, 'epoch': 1.54} {'loss': 0.3849, 'learning_rate': 2.4826542305222743e-06, 'epoch': 1.54} {'loss': 0.5067, 'learning_rate': 2.482438357413932e-06, 'epoch': 1.54} {'loss': 0.5223, 'learning_rate': 2.4822224923613337e-06, 'epoch': 1.54} {'loss': 0.556, 'learning_rate': 2.482006635364711e-06, 'epoch': 1.54} {'loss': 0.4068, 'learning_rate': 2.4817907864242974e-06, 'epoch': 1.54} {'loss': 0.4955, 'learning_rate': 2.4815749455403237e-06, 'epoch': 1.54} {'loss': 0.4535, 'learning_rate': 2.481359112713023e-06, 'epoch': 1.54} {'loss': 0.4123, 'learning_rate': 2.48114328794262e-06, 'epoch': 1.54} {'loss': 0.575, 'learning_rate': 2.4809274712293563e-06, 'epoch': 1.54} {'loss': 0.5257, 'learning_rate': 2.480711662573454e-06, 'epoch': 1.54} {'loss': 0.7108, 'learning_rate': 2.4804958619751483e-06, 'epoch': 1.54} {'loss': 0.5015, 'learning_rate': 2.4802800694346696e-06, 'epoch': 1.54} {'loss': 0.3965, 'learning_rate': 2.4800642849522495e-06, 'epoch': 1.54} {'loss': 0.5975, 'learning_rate': 2.4798485085281222e-06, 'epoch': 1.54} {'loss': 0.6076, 'learning_rate': 2.4796327401625097e-06, 'epoch': 1.54} {'loss': 0.4965, 'learning_rate': 2.479416979855657e-06, 'epoch': 1.54} {'loss': 0.5728, 'learning_rate': 2.479201227607783e-06, 'epoch': 1.54} {'loss': 0.4518, 'learning_rate': 2.478985483419124e-06, 'epoch': 1.54} {'loss': 0.4851, 'learning_rate': 2.4787697472899118e-06, 'epoch': 1.54} {'loss': 0.4688, 'learning_rate': 2.478554019220376e-06, 'epoch': 1.54} {'loss': 0.6073, 'learning_rate': 2.478338299210751e-06, 'epoch': 1.54} {'loss': 0.4719, 'learning_rate': 2.4781225872612626e-06, 'epoch': 1.54} {'loss': 0.5892, 'learning_rate': 2.4779068833721453e-06, 'epoch': 1.54} {'loss': 0.5857, 'learning_rate': 2.4776911875436295e-06, 'epoch': 1.54} {'loss': 0.3415, 'learning_rate': 2.4774754997759463e-06, 'epoch': 1.54} {'loss': 0.5397, 'learning_rate': 2.4772598200693274e-06, 'epoch': 1.54} {'loss': 0.4898, 'learning_rate': 2.4770441484240025e-06, 'epoch': 1.54} {'loss': 0.4427, 'learning_rate': 2.476828484840208e-06, 'epoch': 1.54} {'loss': 0.6473, 'learning_rate': 2.476612829318168e-06, 'epoch': 1.54} {'loss': 0.5422, 'learning_rate': 2.4763971818581155e-06, 'epoch': 1.54} {'loss': 0.4655, 'learning_rate': 2.476181542460282e-06, 'epoch': 1.54} {'loss': 0.4685, 'learning_rate': 2.4759659111249003e-06, 'epoch': 1.54} {'loss': 0.5846, 'learning_rate': 2.4757502878522022e-06, 'epoch': 1.54} {'loss': 0.5333, 'learning_rate': 2.4755346726424146e-06, 'epoch': 1.54} {'loss': 0.4075, 'learning_rate': 2.4753190654957704e-06, 'epoch': 1.54} {'loss': 0.5731, 'learning_rate': 2.4751034664125007e-06, 'epoch': 1.54} {'loss': 0.5672, 'learning_rate': 2.4748878753928373e-06, 'epoch': 1.54} {'loss': 0.5193, 'learning_rate': 2.47467229243701e-06, 'epoch': 1.54} {'loss': 0.5655, 'learning_rate': 2.474456717545252e-06, 'epoch': 1.54} {'loss': 0.5663, 'learning_rate': 2.4742411507177943e-06, 'epoch': 1.54} {'loss': 0.6165, 'learning_rate': 2.4740255919548638e-06, 'epoch': 1.54} {'loss': 0.5588, 'learning_rate': 2.4738100412566944e-06, 'epoch': 1.54} {'loss': 0.4081, 'learning_rate': 2.473594498623517e-06, 'epoch': 1.54} {'loss': 0.568, 'learning_rate': 2.473378964055562e-06, 'epoch': 1.54} {'loss': 0.3938, 'learning_rate': 2.473163437553061e-06, 'epoch': 1.54} {'loss': 0.522, 'learning_rate': 2.472947919116244e-06, 'epoch': 1.54} {'loss': 0.5271, 'learning_rate': 2.4727324087453465e-06, 'epoch': 1.54} {'loss': 0.4746, 'learning_rate': 2.472516906440593e-06, 'epoch': 1.54} {'loss': 0.5472, 'learning_rate': 2.472301412202216e-06, 'epoch': 1.54} {'loss': 0.2646, 'learning_rate': 2.4720859260304487e-06, 'epoch': 1.54} {'loss': 0.4953, 'learning_rate': 2.4718704479255195e-06, 'epoch': 1.54} {'loss': 0.627, 'learning_rate': 2.471654977887661e-06, 'epoch': 1.54} {'loss': 0.5941, 'learning_rate': 2.4714395159171068e-06, 'epoch': 1.54} {'loss': 0.4637, 'learning_rate': 2.4712240620140815e-06, 'epoch': 1.54} {'loss': 0.4681, 'learning_rate': 2.4710086161788193e-06, 'epoch': 1.54} {'loss': 0.5914, 'learning_rate': 2.47079317841155e-06, 'epoch': 1.54} {'loss': 0.6038, 'learning_rate': 2.470577748712507e-06, 'epoch': 1.54} {'loss': 0.5702, 'learning_rate': 2.470362327081919e-06, 'epoch': 1.54} {'loss': 0.5049, 'learning_rate': 2.470146913520016e-06, 'epoch': 1.54} {'loss': 0.5653, 'learning_rate': 2.4699315080270345e-06, 'epoch': 1.54} {'loss': 0.5969, 'learning_rate': 2.4697161106031976e-06, 'epoch': 1.54} {'loss': 0.561, 'learning_rate': 2.46950072124874e-06, 'epoch': 1.54} {'loss': 0.5305, 'learning_rate': 2.469285339963892e-06, 'epoch': 1.54} {'loss': 0.5142, 'learning_rate': 2.4690699667488837e-06, 'epoch': 1.54} {'loss': 0.3592, 'learning_rate': 2.4688546016039474e-06, 'epoch': 1.54} {'loss': 0.5242, 'learning_rate': 2.4686392445293126e-06, 'epoch': 1.54} {'loss': 0.4761, 'learning_rate': 2.4684238955252137e-06, 'epoch': 1.54} {'loss': 0.5173, 'learning_rate': 2.4682085545918755e-06, 'epoch': 1.54} {'loss': 0.6321, 'learning_rate': 2.467993221729531e-06, 'epoch': 1.54} {'loss': 0.6254, 'learning_rate': 2.4677778969384123e-06, 'epoch': 1.54} {'loss': 0.4685, 'learning_rate': 2.4675625802187497e-06, 'epoch': 1.54} {'loss': 0.4665, 'learning_rate': 2.467347271570776e-06, 'epoch': 1.54} {'loss': 0.5617, 'learning_rate': 2.4671319709947138e-06, 'epoch': 1.54} {'loss': 0.5605, 'learning_rate': 2.4669166784908062e-06, 'epoch': 1.54} {'loss': 0.5134, 'learning_rate': 2.466701394059273e-06, 'epoch': 1.54} {'loss': 0.4263, 'learning_rate': 2.4664861177003497e-06, 'epoch': 1.54} {'loss': 0.4793, 'learning_rate': 2.4662708494142673e-06, 'epoch': 1.54} {'loss': 0.5154, 'learning_rate': 2.466055589201255e-06, 'epoch': 1.54} {'loss': 0.6195, 'learning_rate': 2.465840337061547e-06, 'epoch': 1.54} {'loss': 0.6197, 'learning_rate': 2.465625092995365e-06, 'epoch': 1.54} {'loss': 0.4582, 'learning_rate': 2.4654098570029517e-06, 'epoch': 1.54} {'loss': 0.6186, 'learning_rate': 2.4651946290845284e-06, 'epoch': 1.54} {'loss': 0.5389, 'learning_rate': 2.46497940924033e-06, 'epoch': 1.54} {'loss': 0.5284, 'learning_rate': 2.4647641974705862e-06, 'epoch': 1.54} {'loss': 0.5027, 'learning_rate': 2.4645489937755273e-06, 'epoch': 1.54} {'loss': 0.7709, 'learning_rate': 2.464333798155387e-06, 'epoch': 1.54} {'loss': 0.4566, 'learning_rate': 2.4641186106103874e-06, 'epoch': 1.54} {'loss': 0.6439, 'learning_rate': 2.463903431140772e-06, 'epoch': 1.54} {'loss': 0.3858, 'learning_rate': 2.463688259746759e-06, 'epoch': 1.54} {'loss': 0.5994, 'learning_rate': 2.463473096428586e-06, 'epoch': 1.54} {'loss': 0.5739, 'learning_rate': 2.4632579411864845e-06, 'epoch': 1.54} {'loss': 0.4612, 'learning_rate': 2.4630427940206756e-06, 'epoch': 1.54} {'loss': 0.4467, 'learning_rate': 2.4628276549314035e-06, 'epoch': 1.54} {'loss': 0.4811, 'learning_rate': 2.4626125239188848e-06, 'epoch': 1.54} {'loss': 0.6446, 'learning_rate': 2.462397400983364e-06, 'epoch': 1.54} {'loss': 0.5934, 'learning_rate': 2.4621822861250613e-06, 'epoch': 1.54} {'loss': 0.5116, 'learning_rate': 2.46196717934421e-06, 'epoch': 1.54} {'loss': 0.6714, 'learning_rate': 2.4617520806410457e-06, 'epoch': 1.55} {'loss': 0.6376, 'learning_rate': 2.461536990015787e-06, 'epoch': 1.55} {'loss': 0.5533, 'learning_rate': 2.461321907468679e-06, 'epoch': 1.55} {'loss': 0.5328, 'learning_rate': 2.461106832999941e-06, 'epoch': 1.55} {'loss': 0.5555, 'learning_rate': 2.4608917666098074e-06, 'epoch': 1.55} {'loss': 0.5266, 'learning_rate': 2.4606767082985095e-06, 'epoch': 1.55} {'loss': 0.4752, 'learning_rate': 2.4604616580662765e-06, 'epoch': 1.55} {'loss': 0.6067, 'learning_rate': 2.4602466159133433e-06, 'epoch': 1.55} {'loss': 0.72, 'learning_rate': 2.460031581839929e-06, 'epoch': 1.55} {'loss': 0.5975, 'learning_rate': 2.4598165558462784e-06, 'epoch': 1.55} {'loss': 0.5079, 'learning_rate': 2.459601537932611e-06, 'epoch': 1.55} {'loss': 0.441, 'learning_rate': 2.4593865280991613e-06, 'epoch': 1.55} {'loss': 0.5011, 'learning_rate': 2.4591715263461603e-06, 'epoch': 1.55} {'loss': 0.3113, 'learning_rate': 2.4589565326738375e-06, 'epoch': 1.55} {'loss': 0.4529, 'learning_rate': 2.458741547082425e-06, 'epoch': 1.55} {'loss': 0.3924, 'learning_rate': 2.458526569572147e-06, 'epoch': 1.55} {'loss': 0.5375, 'learning_rate': 2.458311600143244e-06, 'epoch': 1.55} {'loss': 0.503, 'learning_rate': 2.4580966387959383e-06, 'epoch': 1.55} {'loss': 0.53, 'learning_rate': 2.457881685530461e-06, 'epoch': 1.55} {'loss': 0.6458, 'learning_rate': 2.4576667403470457e-06, 'epoch': 1.55} {'loss': 0.4169, 'learning_rate': 2.4574518032459216e-06, 'epoch': 1.55} {'loss': 0.4793, 'learning_rate': 2.45723687422732e-06, 'epoch': 1.55} {'loss': 0.4632, 'learning_rate': 2.457021953291465e-06, 'epoch': 1.55} {'loss': 0.4565, 'learning_rate': 2.456807040438598e-06, 'epoch': 1.55} {'loss': 0.3894, 'learning_rate': 2.4565921356689395e-06, 'epoch': 1.55} {'loss': 0.7031, 'learning_rate': 2.4563772389827235e-06, 'epoch': 1.55} {'loss': 0.532, 'learning_rate': 2.4561623503801834e-06, 'epoch': 1.55} {'loss': 0.3808, 'learning_rate': 2.4559474698615403e-06, 'epoch': 1.55} {'loss': 0.4206, 'learning_rate': 2.4557325974270364e-06, 'epoch': 1.55} {'loss': 0.4728, 'learning_rate': 2.4555177330768897e-06, 'epoch': 1.55} {'loss': 0.3524, 'learning_rate': 2.455302876811342e-06, 'epoch': 1.55} {'loss': 0.385, 'learning_rate': 2.4550880286306154e-06, 'epoch': 1.55} {'loss': 0.3522, 'learning_rate': 2.4548731885349442e-06, 'epoch': 1.55} {'loss': 0.4693, 'learning_rate': 2.4546583565245596e-06, 'epoch': 1.55} {'loss': 0.4449, 'learning_rate': 2.454443532599683e-06, 'epoch': 1.55} {'loss': 0.4311, 'learning_rate': 2.4542287167605582e-06, 'epoch': 1.55} {'loss': 0.5976, 'learning_rate': 2.4540139090074023e-06, 'epoch': 1.55} {'loss': 0.5513, 'learning_rate': 2.4537991093404566e-06, 'epoch': 1.55} {'loss': 0.4129, 'learning_rate': 2.453584317759944e-06, 'epoch': 1.55} {'loss': 0.5185, 'learning_rate': 2.453369534266097e-06, 'epoch': 1.55} {'loss': 0.5364, 'learning_rate': 2.4531547588591477e-06, 'epoch': 1.55} {'loss': 0.5243, 'learning_rate': 2.452939991539319e-06, 'epoch': 1.55} {'loss': 0.44, 'learning_rate': 2.452725232306852e-06, 'epoch': 1.55} {'loss': 0.4693, 'learning_rate': 2.4525104811619684e-06, 'epoch': 1.55} {'loss': 0.5364, 'learning_rate': 2.4522957381049006e-06, 'epoch': 1.55} {'loss': 0.4893, 'learning_rate': 2.4520810031358798e-06, 'epoch': 1.55} {'loss': 0.4706, 'learning_rate': 2.451866276255135e-06, 'epoch': 1.55} {'loss': 0.5062, 'learning_rate': 2.4516515574629e-06, 'epoch': 1.55} {'loss': 0.6884, 'learning_rate': 2.451436846759395e-06, 'epoch': 1.55} {'loss': 0.4347, 'learning_rate': 2.4512221441448636e-06, 'epoch': 1.55} {'loss': 0.456, 'learning_rate': 2.4510074496195255e-06, 'epoch': 1.55} {'loss': 0.5798, 'learning_rate': 2.450792763183614e-06, 'epoch': 1.55} {'loss': 0.4996, 'learning_rate': 2.4505780848373594e-06, 'epoch': 1.55} {'loss': 0.503, 'learning_rate': 2.450363414580993e-06, 'epoch': 1.55} {'loss': 0.4562, 'learning_rate': 2.450148752414745e-06, 'epoch': 1.55} {'loss': 0.5786, 'learning_rate': 2.449934098338839e-06, 'epoch': 1.55} {'loss': 0.435, 'learning_rate': 2.4497194523535163e-06, 'epoch': 1.55} {'loss': 0.5245, 'learning_rate': 2.449504814458996e-06, 'epoch': 1.55} {'loss': 0.4657, 'learning_rate': 2.449290184655515e-06, 'epoch': 1.55} {'loss': 0.569, 'learning_rate': 2.4490755629432996e-06, 'epoch': 1.55} {'loss': 0.4867, 'learning_rate': 2.448860949322581e-06, 'epoch': 1.55} {'loss': 0.4728, 'learning_rate': 2.448646343793594e-06, 'epoch': 1.55} {'loss': 0.38, 'learning_rate': 2.4484317463565597e-06, 'epoch': 1.55} {'loss': 0.5895, 'learning_rate': 2.448217157011712e-06, 'epoch': 1.55} {'loss': 0.4427, 'learning_rate': 2.448002575759283e-06, 'epoch': 1.55} {'loss': 0.5245, 'learning_rate': 2.4477880025994994e-06, 'epoch': 1.55} {'loss': 0.6135, 'learning_rate': 2.447573437532592e-06, 'epoch': 1.55} {'loss': 0.4902, 'learning_rate': 2.4473588805587935e-06, 'epoch': 1.55} {'loss': 0.4475, 'learning_rate': 2.4471443316783326e-06, 'epoch': 1.55} {'loss': 0.6686, 'learning_rate': 2.4469297908914358e-06, 'epoch': 1.55} {'loss': 0.4894, 'learning_rate': 2.4467152581983356e-06, 'epoch': 1.55} {'loss': 0.542, 'learning_rate': 2.446500733599262e-06, 'epoch': 1.55} {'loss': 0.5096, 'learning_rate': 2.4462862170944447e-06, 'epoch': 1.55} {'loss': 0.4135, 'learning_rate': 2.4460717086841134e-06, 'epoch': 1.55} {'loss': 0.4242, 'learning_rate': 2.4458572083684974e-06, 'epoch': 1.55} {'loss': 0.4748, 'learning_rate': 2.4456427161478304e-06, 'epoch': 1.55} {'loss': 0.4409, 'learning_rate': 2.4454282320223365e-06, 'epoch': 1.55} {'loss': 0.6408, 'learning_rate': 2.4452137559922474e-06, 'epoch': 1.55} {'loss': 0.4757, 'learning_rate': 2.4449992880577946e-06, 'epoch': 1.55} {'loss': 0.6338, 'learning_rate': 2.4447848282192065e-06, 'epoch': 1.55} {'loss': 0.5372, 'learning_rate': 2.4445703764767127e-06, 'epoch': 1.55} {'loss': 0.5885, 'learning_rate': 2.4443559328305476e-06, 'epoch': 1.55} {'loss': 0.6365, 'learning_rate': 2.4441414972809343e-06, 'epoch': 1.55} {'loss': 0.5041, 'learning_rate': 2.4439270698281037e-06, 'epoch': 1.55} {'loss': 0.4302, 'learning_rate': 2.4437126504722886e-06, 'epoch': 1.55} {'loss': 0.6268, 'learning_rate': 2.4434982392137175e-06, 'epoch': 1.55} {'loss': 0.2715, 'learning_rate': 2.443283836052619e-06, 'epoch': 1.55} {'loss': 0.7022, 'learning_rate': 2.443069440989224e-06, 'epoch': 1.55} {'loss': 0.5493, 'learning_rate': 2.4428550540237662e-06, 'epoch': 1.55} {'loss': 0.5844, 'learning_rate': 2.442640675156468e-06, 'epoch': 1.55} {'loss': 0.6327, 'learning_rate': 2.442426304387562e-06, 'epoch': 1.55} {'loss': 0.4887, 'learning_rate': 2.4422119417172786e-06, 'epoch': 1.55} {'loss': 0.4625, 'learning_rate': 2.4419975871458467e-06, 'epoch': 1.55} {'loss': 0.4157, 'learning_rate': 2.4417832406734978e-06, 'epoch': 1.55} {'loss': 0.486, 'learning_rate': 2.4415689023004618e-06, 'epoch': 1.55} {'loss': 0.4838, 'learning_rate': 2.441354572026965e-06, 'epoch': 1.55} {'loss': 0.4799, 'learning_rate': 2.4411402498532387e-06, 'epoch': 1.55} {'loss': 0.4243, 'learning_rate': 2.4409259357795125e-06, 'epoch': 1.55} {'loss': 0.6822, 'learning_rate': 2.440711629806016e-06, 'epoch': 1.55} {'loss': 0.5222, 'learning_rate': 2.4404973319329805e-06, 'epoch': 1.55} {'loss': 0.4971, 'learning_rate': 2.440283042160637e-06, 'epoch': 1.55} {'loss': 0.3588, 'learning_rate': 2.4400687604892093e-06, 'epoch': 1.55} {'loss': 0.6064, 'learning_rate': 2.43985448691893e-06, 'epoch': 1.55} {'loss': 0.4287, 'learning_rate': 2.439640221450029e-06, 'epoch': 1.55} {'loss': 0.6244, 'learning_rate': 2.4394259640827365e-06, 'epoch': 1.55} {'loss': 0.48, 'learning_rate': 2.439211714817281e-06, 'epoch': 1.55} {'loss': 0.5865, 'learning_rate': 2.4389974736538924e-06, 'epoch': 1.55} {'loss': 0.4389, 'learning_rate': 2.4387832405928037e-06, 'epoch': 1.55} {'loss': 0.3308, 'learning_rate': 2.4385690156342377e-06, 'epoch': 1.55} {'loss': 0.5058, 'learning_rate': 2.4383547987784283e-06, 'epoch': 1.55} {'loss': 0.6002, 'learning_rate': 2.4381405900256038e-06, 'epoch': 1.55} {'loss': 0.4747, 'learning_rate': 2.437926389375994e-06, 'epoch': 1.55} {'loss': 0.5339, 'learning_rate': 2.4377121968298324e-06, 'epoch': 1.55} {'loss': 0.5346, 'learning_rate': 2.4374980123873384e-06, 'epoch': 1.55} {'loss': 0.5205, 'learning_rate': 2.437283836048753e-06, 'epoch': 1.55} {'loss': 0.4517, 'learning_rate': 2.437069667814298e-06, 'epoch': 1.55} {'loss': 0.538, 'learning_rate': 2.436855507684206e-06, 'epoch': 1.55} {'loss': 0.4721, 'learning_rate': 2.436641355658705e-06, 'epoch': 1.55} {'loss': 0.572, 'learning_rate': 2.436427211738026e-06, 'epoch': 1.55} {'loss': 0.5985, 'learning_rate': 2.4362130759224e-06, 'epoch': 1.55} {'loss': 0.4957, 'learning_rate': 2.4359989482120492e-06, 'epoch': 1.55} {'loss': 0.5604, 'learning_rate': 2.435784828607215e-06, 'epoch': 1.55} {'loss': 0.3844, 'learning_rate': 2.4355707171081157e-06, 'epoch': 1.55} {'loss': 0.335, 'learning_rate': 2.4353566137149865e-06, 'epoch': 1.55} {'loss': 0.6109, 'learning_rate': 2.435142518428054e-06, 'epoch': 1.55} {'loss': 0.446, 'learning_rate': 2.4349284312475497e-06, 'epoch': 1.55} {'loss': 0.3634, 'learning_rate': 2.434714352173705e-06, 'epoch': 1.55} {'loss': 0.4623, 'learning_rate': 2.434500281206741e-06, 'epoch': 1.55} {'loss': 0.4358, 'learning_rate': 2.4342862183468997e-06, 'epoch': 1.55} {'loss': 0.3923, 'learning_rate': 2.4340721635943986e-06, 'epoch': 1.55} {'loss': 0.4963, 'learning_rate': 2.4338581169494733e-06, 'epoch': 1.55} {'loss': 0.5964, 'learning_rate': 2.433644078412355e-06, 'epoch': 1.55} {'loss': 0.342, 'learning_rate': 2.433430047983264e-06, 'epoch': 1.55} {'loss': 0.4911, 'learning_rate': 2.4332160256624406e-06, 'epoch': 1.55} {'loss': 0.5453, 'learning_rate': 2.433002011450104e-06, 'epoch': 1.55} {'loss': 0.4477, 'learning_rate': 2.4327880053464947e-06, 'epoch': 1.55} {'loss': 0.5807, 'learning_rate': 2.4325740073518334e-06, 'epoch': 1.55} {'loss': 0.4084, 'learning_rate': 2.432360017466351e-06, 'epoch': 1.55} {'loss': 0.6602, 'learning_rate': 2.4321460356902817e-06, 'epoch': 1.55} {'loss': 0.521, 'learning_rate': 2.4319320620238453e-06, 'epoch': 1.55} {'loss': 0.5517, 'learning_rate': 2.4317180964672813e-06, 'epoch': 1.55} {'loss': 0.5478, 'learning_rate': 2.4315041390208093e-06, 'epoch': 1.55} {'loss': 0.4967, 'learning_rate': 2.4312901896846697e-06, 'epoch': 1.55} {'loss': 0.5054, 'learning_rate': 2.431076248459083e-06, 'epoch': 1.55} {'loss': 0.5036, 'learning_rate': 2.4308623153442813e-06, 'epoch': 1.55} {'loss': 0.4433, 'learning_rate': 2.4306483903404963e-06, 'epoch': 1.55} {'loss': 0.478, 'learning_rate': 2.430434473447949e-06, 'epoch': 1.55} {'loss': 0.5745, 'learning_rate': 2.430220564666881e-06, 'epoch': 1.55} {'loss': 0.5583, 'learning_rate': 2.4300066639975072e-06, 'epoch': 1.55} {'loss': 0.5124, 'learning_rate': 2.4297927714400715e-06, 'epoch': 1.55} {'loss': 0.5384, 'learning_rate': 2.4295788869947935e-06, 'epoch': 1.55} {'loss': 0.5317, 'learning_rate': 2.429365010661905e-06, 'epoch': 1.55} {'loss': 0.4534, 'learning_rate': 2.429151142441637e-06, 'epoch': 1.55} {'loss': 0.6026, 'learning_rate': 2.4289372823342118e-06, 'epoch': 1.55} {'loss': 0.6096, 'learning_rate': 2.42872343033987e-06, 'epoch': 1.55} {'loss': 0.5374, 'learning_rate': 2.428509586458827e-06, 'epoch': 1.55} {'loss': 0.5413, 'learning_rate': 2.4282957506913264e-06, 'epoch': 1.55} {'loss': 0.4513, 'learning_rate': 2.4280819230375874e-06, 'epoch': 1.55} {'loss': 0.4362, 'learning_rate': 2.427868103497841e-06, 'epoch': 1.55} {'loss': 0.3358, 'learning_rate': 2.4276542920723212e-06, 'epoch': 1.55} {'loss': 0.5091, 'learning_rate': 2.4274404887612477e-06, 'epoch': 1.55} {'loss': 0.5845, 'learning_rate': 2.4272266935648604e-06, 'epoch': 1.55} {'loss': 0.5454, 'learning_rate': 2.4270129064833803e-06, 'epoch': 1.55} {'loss': 0.5442, 'learning_rate': 2.42679912751704e-06, 'epoch': 1.55} {'loss': 0.5755, 'learning_rate': 2.426585356666067e-06, 'epoch': 1.55} {'loss': 0.5506, 'learning_rate': 2.426371593930692e-06, 'epoch': 1.55} {'loss': 0.6159, 'learning_rate': 2.4261578393111463e-06, 'epoch': 1.55} {'loss': 0.4427, 'learning_rate': 2.4259440928076495e-06, 'epoch': 1.55} {'loss': 0.4706, 'learning_rate': 2.4257303544204436e-06, 'epoch': 1.55} {'loss': 0.4804, 'learning_rate': 2.4255166241497487e-06, 'epoch': 1.55} {'loss': 0.7026, 'learning_rate': 2.4253029019957962e-06, 'epoch': 1.55} {'loss': 0.4634, 'learning_rate': 2.4250891879588143e-06, 'epoch': 1.55} {'loss': 0.4691, 'learning_rate': 2.4248754820390343e-06, 'epoch': 1.55} {'loss': 0.3501, 'learning_rate': 2.424661784236686e-06, 'epoch': 1.55} {'loss': 0.5283, 'learning_rate': 2.424448094551991e-06, 'epoch': 1.55} {'loss': 0.5793, 'learning_rate': 2.424234412985189e-06, 'epoch': 1.55} {'loss': 0.5462, 'learning_rate': 2.4240207395365013e-06, 'epoch': 1.55} {'loss': 0.4664, 'learning_rate': 2.423807074206158e-06, 'epoch': 1.55} {'loss': 0.5755, 'learning_rate': 2.423593416994393e-06, 'epoch': 1.55} {'loss': 0.6709, 'learning_rate': 2.423379767901426e-06, 'epoch': 1.55} {'loss': 0.4296, 'learning_rate': 2.4231661269274965e-06, 'epoch': 1.55} {'loss': 0.5475, 'learning_rate': 2.4229524940728234e-06, 'epoch': 1.55} {'loss': 0.4156, 'learning_rate': 2.422738869337645e-06, 'epoch': 1.55} {'loss': 0.5971, 'learning_rate': 2.4225252527221843e-06, 'epoch': 1.55} {'loss': 0.3773, 'learning_rate': 2.4223116442266715e-06, 'epoch': 1.55} {'loss': 0.552, 'learning_rate': 2.4220980438513374e-06, 'epoch': 1.55} {'loss': 0.5829, 'learning_rate': 2.4218844515964045e-06, 'epoch': 1.55} {'loss': 0.5105, 'learning_rate': 2.4216708674621115e-06, 'epoch': 1.55} {'loss': 0.482, 'learning_rate': 2.42145729144868e-06, 'epoch': 1.55} {'loss': 0.476, 'learning_rate': 2.4212437235563402e-06, 'epoch': 1.55} {'loss': 0.5476, 'learning_rate': 2.421030163785323e-06, 'epoch': 1.55} {'loss': 0.4012, 'learning_rate': 2.4208166121358546e-06, 'epoch': 1.55} {'loss': 0.4845, 'learning_rate': 2.4206030686081682e-06, 'epoch': 1.55} {'loss': 0.4669, 'learning_rate': 2.420389533202485e-06, 'epoch': 1.55} {'loss': 0.5306, 'learning_rate': 2.4201760059190437e-06, 'epoch': 1.55} {'loss': 0.5598, 'learning_rate': 2.419962486758065e-06, 'epoch': 1.55} {'loss': 0.585, 'learning_rate': 2.4197489757197813e-06, 'epoch': 1.55} {'loss': 0.3979, 'learning_rate': 2.41953547280442e-06, 'epoch': 1.55} {'loss': 0.5143, 'learning_rate': 2.41932197801221e-06, 'epoch': 1.55} {'loss': 0.4721, 'learning_rate': 2.419108491343385e-06, 'epoch': 1.55} {'loss': 0.4504, 'learning_rate': 2.418895012798166e-06, 'epoch': 1.55} {'loss': 0.6224, 'learning_rate': 2.4186815423767852e-06, 'epoch': 1.55} {'loss': 0.4304, 'learning_rate': 2.4184680800794712e-06, 'epoch': 1.55} {'loss': 0.5688, 'learning_rate': 2.4182546259064534e-06, 'epoch': 1.55} {'loss': 0.5522, 'learning_rate': 2.4180411798579596e-06, 'epoch': 1.55} {'loss': 0.4866, 'learning_rate': 2.417827741934219e-06, 'epoch': 1.55} {'loss': 0.4772, 'learning_rate': 2.417614312135463e-06, 'epoch': 1.55} {'loss': 0.6142, 'learning_rate': 2.4174008904619163e-06, 'epoch': 1.55} {'loss': 0.5223, 'learning_rate': 2.417187476913807e-06, 'epoch': 1.55} {'loss': 0.5194, 'learning_rate': 2.416974071491367e-06, 'epoch': 1.55} {'loss': 0.514, 'learning_rate': 2.4167606741948224e-06, 'epoch': 1.55} {'loss': 0.6363, 'learning_rate': 2.4165472850244043e-06, 'epoch': 1.55} {'loss': 0.4349, 'learning_rate': 2.41633390398034e-06, 'epoch': 1.55} {'loss': 0.4481, 'learning_rate': 2.416120531062861e-06, 'epoch': 1.55} {'loss': 0.5493, 'learning_rate': 2.41590716627219e-06, 'epoch': 1.55} {'loss': 0.5429, 'learning_rate': 2.4156938096085605e-06, 'epoch': 1.55} {'loss': 0.4927, 'learning_rate': 2.4154804610721983e-06, 'epoch': 1.55} {'loss': 0.6379, 'learning_rate': 2.4152671206633337e-06, 'epoch': 1.55} {'loss': 0.5434, 'learning_rate': 2.4150537883821944e-06, 'epoch': 1.55} {'loss': 0.5699, 'learning_rate': 2.4148404642290135e-06, 'epoch': 1.55} {'loss': 0.3996, 'learning_rate': 2.4146271482040116e-06, 'epoch': 1.55} {'loss': 0.4669, 'learning_rate': 2.4144138403074225e-06, 'epoch': 1.55} {'loss': 0.6814, 'learning_rate': 2.414200540539473e-06, 'epoch': 1.55} {'loss': 0.5068, 'learning_rate': 2.4139872489003922e-06, 'epoch': 1.55} {'loss': 0.5054, 'learning_rate': 2.413773965390409e-06, 'epoch': 1.55} {'loss': 0.456, 'learning_rate': 2.4135606900097506e-06, 'epoch': 1.55} {'loss': 0.3863, 'learning_rate': 2.413347422758652e-06, 'epoch': 1.55} {'loss': 0.4604, 'learning_rate': 2.413134163637332e-06, 'epoch': 1.55} {'loss': 0.4096, 'learning_rate': 2.412920912646023e-06, 'epoch': 1.55} {'loss': 0.4568, 'learning_rate': 2.412707669784954e-06, 'epoch': 1.55} {'loss': 0.4466, 'learning_rate': 2.4124944350543545e-06, 'epoch': 1.55} {'loss': 0.5351, 'learning_rate': 2.412281208454451e-06, 'epoch': 1.55} {'loss': 0.6402, 'learning_rate': 2.4120679899854737e-06, 'epoch': 1.55} {'loss': 0.4857, 'learning_rate': 2.4118547796476534e-06, 'epoch': 1.55} {'loss': 0.6012, 'learning_rate': 2.4116415774412125e-06, 'epoch': 1.55} {'loss': 0.5256, 'learning_rate': 2.411428383366382e-06, 'epoch': 1.55} {'loss': 0.5959, 'learning_rate': 2.4112151974233922e-06, 'epoch': 1.55} {'loss': 0.5941, 'learning_rate': 2.4110020196124693e-06, 'epoch': 1.55} {'loss': 0.4378, 'learning_rate': 2.410788849933845e-06, 'epoch': 1.55} {'loss': 0.3629, 'learning_rate': 2.4105756883877405e-06, 'epoch': 1.55} {'loss': 0.4946, 'learning_rate': 2.4103625349743954e-06, 'epoch': 1.55} {'loss': 0.4804, 'learning_rate': 2.4101493896940274e-06, 'epoch': 1.55} {'loss': 0.6404, 'learning_rate': 2.4099362525468705e-06, 'epoch': 1.55} {'loss': 0.4929, 'learning_rate': 2.409723123533152e-06, 'epoch': 1.55} {'loss': 0.5195, 'learning_rate': 2.4095100026531006e-06, 'epoch': 1.55} {'loss': 0.6027, 'learning_rate': 2.4092968899069457e-06, 'epoch': 1.55} {'loss': 0.4907, 'learning_rate': 2.409083785294912e-06, 'epoch': 1.55} {'loss': 0.4035, 'learning_rate': 2.408870688817231e-06, 'epoch': 1.55} {'loss': 0.5835, 'learning_rate': 2.4086576004741303e-06, 'epoch': 1.55} {'loss': 0.4673, 'learning_rate': 2.408444520265837e-06, 'epoch': 1.55} {'loss': 0.5205, 'learning_rate': 2.408231448192581e-06, 'epoch': 1.55} {'loss': 0.4671, 'learning_rate': 2.40801838425459e-06, 'epoch': 1.55} {'loss': 0.3913, 'learning_rate': 2.4078053284520965e-06, 'epoch': 1.55} {'loss': 0.5581, 'learning_rate': 2.4075922807853202e-06, 'epoch': 1.55} {'loss': 0.6403, 'learning_rate': 2.407379241254495e-06, 'epoch': 1.55} {'loss': 0.4008, 'learning_rate': 2.407166209859848e-06, 'epoch': 1.55} {'loss': 0.5068, 'learning_rate': 2.4069531866016083e-06, 'epoch': 1.55} {'loss': 0.5471, 'learning_rate': 2.4067401714800054e-06, 'epoch': 1.55} {'loss': 0.4874, 'learning_rate': 2.4065271644952615e-06, 'epoch': 1.55} {'loss': 0.5531, 'learning_rate': 2.406314165647613e-06, 'epoch': 1.55} {'loss': 0.5406, 'learning_rate': 2.406101174937283e-06, 'epoch': 1.55} {'loss': 0.5457, 'learning_rate': 2.4058881923645004e-06, 'epoch': 1.55} {'loss': 0.5749, 'learning_rate': 2.405675217929494e-06, 'epoch': 1.55} {'loss': 0.4284, 'learning_rate': 2.405462251632491e-06, 'epoch': 1.55} {'loss': 0.3406, 'learning_rate': 2.4052492934737246e-06, 'epoch': 1.55} {'loss': 0.4941, 'learning_rate': 2.4050363434534143e-06, 'epoch': 1.55} {'loss': 0.5962, 'learning_rate': 2.4048234015717975e-06, 'epoch': 1.55} {'loss': 0.5143, 'learning_rate': 2.404610467829095e-06, 'epoch': 1.55} {'loss': 0.6047, 'learning_rate': 2.404397542225538e-06, 'epoch': 1.55} {'loss': 0.3654, 'learning_rate': 2.404184624761354e-06, 'epoch': 1.55} {'loss': 0.5851, 'learning_rate': 2.4039717154367727e-06, 'epoch': 1.55} {'loss': 0.4915, 'learning_rate': 2.403758814252024e-06, 'epoch': 1.55} {'loss': 0.3869, 'learning_rate': 2.4035459212073274e-06, 'epoch': 1.55} {'loss': 0.5953, 'learning_rate': 2.4033330363029226e-06, 'epoch': 1.55} {'loss': 0.3808, 'learning_rate': 2.4031201595390296e-06, 'epoch': 1.55} {'loss': 0.3844, 'learning_rate': 2.4029072909158792e-06, 'epoch': 1.55} {'loss': 0.5304, 'learning_rate': 2.402694430433702e-06, 'epoch': 1.55} {'loss': 0.5645, 'learning_rate': 2.402481578092717e-06, 'epoch': 1.55} {'loss': 0.4226, 'learning_rate': 2.402268733893165e-06, 'epoch': 1.55} {'loss': 0.4706, 'learning_rate': 2.4020558978352624e-06, 'epoch': 1.55} {'loss': 0.5958, 'learning_rate': 2.4018430699192475e-06, 'epoch': 1.55} {'loss': 0.4506, 'learning_rate': 2.4016302501453414e-06, 'epoch': 1.55} {'loss': 0.4903, 'learning_rate': 2.4014174385137745e-06, 'epoch': 1.55} {'loss': 0.6364, 'learning_rate': 2.4012046350247765e-06, 'epoch': 1.55} {'loss': 0.419, 'learning_rate': 2.400991839678568e-06, 'epoch': 1.55} {'loss': 0.4593, 'learning_rate': 2.4007790524753894e-06, 'epoch': 1.55} {'loss': 0.493, 'learning_rate': 2.4005662734154556e-06, 'epoch': 1.55} {'loss': 0.6457, 'learning_rate': 2.4003535024990066e-06, 'epoch': 1.55} {'loss': 0.4978, 'learning_rate': 2.400140739726261e-06, 'epoch': 1.55} {'loss': 0.6481, 'learning_rate': 2.3999279850974523e-06, 'epoch': 1.55} {'loss': 0.6211, 'learning_rate': 2.3997152386128085e-06, 'epoch': 1.55} {'loss': 0.4773, 'learning_rate': 2.3995025002725505e-06, 'epoch': 1.55} {'loss': 0.6433, 'learning_rate': 2.399289770076917e-06, 'epoch': 1.55} {'loss': 0.5231, 'learning_rate': 2.399077048026124e-06, 'epoch': 1.55} {'loss': 0.575, 'learning_rate': 2.398864334120412e-06, 'epoch': 1.55} {'loss': 0.4823, 'learning_rate': 2.3986516283600016e-06, 'epoch': 1.55} {'loss': 0.5238, 'learning_rate': 2.3984389307451207e-06, 'epoch': 1.55} {'loss': 0.4396, 'learning_rate': 2.3982262412760014e-06, 'epoch': 1.55} {'loss': 0.6239, 'learning_rate': 2.3980135599528633e-06, 'epoch': 1.55} {'loss': 0.4899, 'learning_rate': 2.3978008867759463e-06, 'epoch': 1.55} {'loss': 0.6616, 'learning_rate': 2.397588221745465e-06, 'epoch': 1.55} {'loss': 0.4611, 'learning_rate': 2.397375564861659e-06, 'epoch': 1.55} {'loss': 0.6613, 'learning_rate': 2.39716291612475e-06, 'epoch': 1.55} {'loss': 0.5836, 'learning_rate': 2.396950275534967e-06, 'epoch': 1.55} {'loss': 0.4595, 'learning_rate': 2.3967376430925406e-06, 'epoch': 1.55} {'loss': 0.4833, 'learning_rate': 2.3965250187976896e-06, 'epoch': 1.55} {'loss': 0.5532, 'learning_rate': 2.3963124026506557e-06, 'epoch': 1.55} {'loss': 0.3705, 'learning_rate': 2.396099794651655e-06, 'epoch': 1.55} {'loss': 0.4777, 'learning_rate': 2.3958871948009198e-06, 'epoch': 1.55} {'loss': 0.5177, 'learning_rate': 2.395674603098679e-06, 'epoch': 1.55} {'loss': 0.3473, 'learning_rate': 2.3954620195451573e-06, 'epoch': 1.55} {'loss': 0.3178, 'learning_rate': 2.395249444140588e-06, 'epoch': 1.55} {'loss': 0.5575, 'learning_rate': 2.3950368768851904e-06, 'epoch': 1.55} {'loss': 0.3605, 'learning_rate': 2.394824317779202e-06, 'epoch': 1.55} {'loss': 0.5438, 'learning_rate': 2.394611766822843e-06, 'epoch': 1.55} {'loss': 0.6247, 'learning_rate': 2.394399224016345e-06, 'epoch': 1.55} {'loss': 0.3278, 'learning_rate': 2.394186689359933e-06, 'epoch': 1.55} {'loss': 0.5162, 'learning_rate': 2.3939741628538384e-06, 'epoch': 1.55} {'loss': 0.5714, 'learning_rate': 2.393761644498288e-06, 'epoch': 1.55} {'loss': 0.405, 'learning_rate': 2.3935491342935035e-06, 'epoch': 1.55} {'loss': 0.4396, 'learning_rate': 2.3933366322397234e-06, 'epoch': 1.55} {'loss': 0.5002, 'learning_rate': 2.3931241383371662e-06, 'epoch': 1.55} {'loss': 0.4302, 'learning_rate': 2.392911652586064e-06, 'epoch': 1.55} {'loss': 0.4705, 'learning_rate': 2.3926991749866436e-06, 'epoch': 1.55} {'loss': 0.4688, 'learning_rate': 2.392486705539131e-06, 'epoch': 1.55} {'loss': 0.5644, 'learning_rate': 2.3922742442437597e-06, 'epoch': 1.55} {'loss': 0.5705, 'learning_rate': 2.3920617911007503e-06, 'epoch': 1.55} {'loss': 0.501, 'learning_rate': 2.391849346110333e-06, 'epoch': 1.55} {'loss': 0.5384, 'learning_rate': 2.3916369092727366e-06, 'epoch': 1.55} {'loss': 0.5987, 'learning_rate': 2.391424480588187e-06, 'epoch': 1.55} {'loss': 0.446, 'learning_rate': 2.391212060056913e-06, 'epoch': 1.55} {'loss': 0.5041, 'learning_rate': 2.390999647679142e-06, 'epoch': 1.55} {'loss': 0.428, 'learning_rate': 2.390787243455105e-06, 'epoch': 1.55} {'loss': 0.6959, 'learning_rate': 2.390574847385023e-06, 'epoch': 1.55} {'loss': 0.3975, 'learning_rate': 2.3903624594691265e-06, 'epoch': 1.55} {'loss': 0.4892, 'learning_rate': 2.390150079707644e-06, 'epoch': 1.55} {'loss': 0.4024, 'learning_rate': 2.389937708100802e-06, 'epoch': 1.55} {'loss': 0.5331, 'learning_rate': 2.389725344648832e-06, 'epoch': 1.55} {'loss': 0.4101, 'learning_rate': 2.389512989351952e-06, 'epoch': 1.55} {'loss': 0.5253, 'learning_rate': 2.3893006422104014e-06, 'epoch': 1.55} {'loss': 0.5248, 'learning_rate': 2.3890883032243995e-06, 'epoch': 1.55} {'loss': 0.5717, 'learning_rate': 2.3888759723941767e-06, 'epoch': 1.55} {'loss': 0.6135, 'learning_rate': 2.38866364971996e-06, 'epoch': 1.55} {'loss': 0.421, 'learning_rate': 2.3884513352019765e-06, 'epoch': 1.55} {'loss': 0.3209, 'learning_rate': 2.388239028840459e-06, 'epoch': 1.55} {'loss': 0.6784, 'learning_rate': 2.3880267306356254e-06, 'epoch': 1.55} {'loss': 0.4756, 'learning_rate': 2.3878144405877093e-06, 'epoch': 1.55} {'loss': 0.6157, 'learning_rate': 2.387602158696937e-06, 'epoch': 1.55} {'loss': 0.4278, 'learning_rate': 2.387389884963536e-06, 'epoch': 1.55} {'loss': 0.6628, 'learning_rate': 2.387177619387734e-06, 'epoch': 1.55} {'loss': 0.3679, 'learning_rate': 2.3869653619697576e-06, 'epoch': 1.55} {'loss': 0.5293, 'learning_rate': 2.3867531127098385e-06, 'epoch': 1.55} {'loss': 0.4919, 'learning_rate': 2.3865408716081973e-06, 'epoch': 1.55} {'loss': 0.562, 'learning_rate': 2.386328638665065e-06, 'epoch': 1.55} {'loss': 0.5384, 'learning_rate': 2.3861164138806682e-06, 'epoch': 1.55} {'loss': 0.4871, 'learning_rate': 2.3859041972552354e-06, 'epoch': 1.55} {'loss': 0.648, 'learning_rate': 2.385691988788994e-06, 'epoch': 1.55} {'loss': 0.369, 'learning_rate': 2.38547978848217e-06, 'epoch': 1.55} {'loss': 0.5366, 'learning_rate': 2.385267596334995e-06, 'epoch': 1.55} {'loss': 0.5162, 'learning_rate': 2.3850554123476887e-06, 'epoch': 1.55} {'loss': 0.5159, 'learning_rate': 2.3848432365204845e-06, 'epoch': 1.55} {'loss': 0.5759, 'learning_rate': 2.3846310688536077e-06, 'epoch': 1.55} {'loss': 0.4545, 'learning_rate': 2.384418909347286e-06, 'epoch': 1.55} {'loss': 0.4975, 'learning_rate': 2.384206758001747e-06, 'epoch': 1.55} {'loss': 0.5552, 'learning_rate': 2.38399461481722e-06, 'epoch': 1.55} {'loss': 0.5281, 'learning_rate': 2.383782479793928e-06, 'epoch': 1.55} {'loss': 0.5959, 'learning_rate': 2.3835703529320996e-06, 'epoch': 1.55} {'loss': 0.6805, 'learning_rate': 2.383358234231964e-06, 'epoch': 1.55} {'loss': 0.6144, 'learning_rate': 2.383146123693747e-06, 'epoch': 1.55} {'loss': 0.4912, 'learning_rate': 2.3829340213176765e-06, 'epoch': 1.55} {'loss': 0.41, 'learning_rate': 2.3827219271039793e-06, 'epoch': 1.55} {'loss': 0.4832, 'learning_rate': 2.3825098410528867e-06, 'epoch': 1.55} {'loss': 0.4046, 'learning_rate': 2.3822977631646192e-06, 'epoch': 1.55} {'loss': 0.3579, 'learning_rate': 2.3820856934394065e-06, 'epoch': 1.55} {'loss': 0.4546, 'learning_rate': 2.381873631877477e-06, 'epoch': 1.55} {'loss': 0.5546, 'learning_rate': 2.3816615784790574e-06, 'epoch': 1.55} {'loss': 0.511, 'learning_rate': 2.381449533244379e-06, 'epoch': 1.55} {'loss': 0.4635, 'learning_rate': 2.3812374961736572e-06, 'epoch': 1.55} {'loss': 0.4188, 'learning_rate': 2.381025467267134e-06, 'epoch': 1.55} {'loss': 0.4897, 'learning_rate': 2.380813446525028e-06, 'epoch': 1.55} {'loss': 0.5131, 'learning_rate': 2.3806014339475657e-06, 'epoch': 1.55} {'loss': 0.5676, 'learning_rate': 2.380389429534978e-06, 'epoch': 1.55} {'loss': 0.4998, 'learning_rate': 2.3801774332874905e-06, 'epoch': 1.55} {'loss': 0.4222, 'learning_rate': 2.3799654452053335e-06, 'epoch': 1.55} {'loss': 0.621, 'learning_rate': 2.3797534652887257e-06, 'epoch': 1.55} {'loss': 0.63, 'learning_rate': 2.3795414935379048e-06, 'epoch': 1.55} {'loss': 0.5423, 'learning_rate': 2.3793295299530905e-06, 'epoch': 1.55} {'loss': 0.4665, 'learning_rate': 2.379117574534513e-06, 'epoch': 1.55} {'loss': 0.4369, 'learning_rate': 2.3789056272823986e-06, 'epoch': 1.55} {'loss': 0.4102, 'learning_rate': 2.3786936881969747e-06, 'epoch': 1.55} {'loss': 0.4793, 'learning_rate': 2.3784817572784714e-06, 'epoch': 1.55} {'loss': 0.4563, 'learning_rate': 2.378269834527106e-06, 'epoch': 1.55} {'loss': 0.4754, 'learning_rate': 2.3780579199431187e-06, 'epoch': 1.55} {'loss': 0.6059, 'learning_rate': 2.3778460135267277e-06, 'epoch': 1.55} {'loss': 0.6064, 'learning_rate': 2.3776341152781623e-06, 'epoch': 1.55} {'loss': 0.5968, 'learning_rate': 2.377422225197653e-06, 'epoch': 1.55} {'loss': 0.5897, 'learning_rate': 2.3772103432854177e-06, 'epoch': 1.55} {'loss': 0.4296, 'learning_rate': 2.376998469541696e-06, 'epoch': 1.55} {'loss': 0.4204, 'learning_rate': 2.376786603966702e-06, 'epoch': 1.55} {'loss': 0.4112, 'learning_rate': 2.3765747465606747e-06, 'epoch': 1.55} {'loss': 0.45, 'learning_rate': 2.376362897323834e-06, 'epoch': 1.55} {'loss': 0.5484, 'learning_rate': 2.376151056256407e-06, 'epoch': 1.55} {'loss': 0.4575, 'learning_rate': 2.3759392233586266e-06, 'epoch': 1.55} {'loss': 0.5628, 'learning_rate': 2.3757273986307084e-06, 'epoch': 1.55} {'loss': 0.6149, 'learning_rate': 2.3755155820728926e-06, 'epoch': 1.55} {'loss': 0.6816, 'learning_rate': 2.375303773685398e-06, 'epoch': 1.55} {'loss': 0.431, 'learning_rate': 2.375091973468453e-06, 'epoch': 1.55} {'loss': 0.3359, 'learning_rate': 2.3748801814222844e-06, 'epoch': 1.55} {'loss': 0.5175, 'learning_rate': 2.374668397547121e-06, 'epoch': 1.55} {'loss': 0.5878, 'learning_rate': 2.3744566218431908e-06, 'epoch': 1.55} {'loss': 0.5992, 'learning_rate': 2.3742448543107124e-06, 'epoch': 1.55} {'loss': 0.5406, 'learning_rate': 2.374033094949926e-06, 'epoch': 1.55} {'loss': 0.5064, 'learning_rate': 2.373821343761047e-06, 'epoch': 1.55} {'loss': 0.5179, 'learning_rate': 2.373609600744308e-06, 'epoch': 1.55} {'loss': 0.6163, 'learning_rate': 2.3733978658999346e-06, 'epoch': 1.55} {'loss': 0.4074, 'learning_rate': 2.373186139228153e-06, 'epoch': 1.55} {'loss': 0.4914, 'learning_rate': 2.3729744207291937e-06, 'epoch': 1.55} {'loss': 0.5338, 'learning_rate': 2.3727627104032758e-06, 'epoch': 1.55} {'loss': 0.5443, 'learning_rate': 2.3725510082506355e-06, 'epoch': 1.55} {'loss': 0.5481, 'learning_rate': 2.3723393142714934e-06, 'epoch': 1.55} {'loss': 0.3308, 'learning_rate': 2.3721276284660777e-06, 'epoch': 1.55} {'loss': 0.5468, 'learning_rate': 2.371915950834619e-06, 'epoch': 1.55} {'loss': 0.4378, 'learning_rate': 2.371704281377335e-06, 'epoch': 1.55} {'loss': 0.5349, 'learning_rate': 2.3714926200944632e-06, 'epoch': 1.55} {'loss': 0.6998, 'learning_rate': 2.3712809669862215e-06, 'epoch': 1.55} {'loss': 0.5526, 'learning_rate': 2.3710693220528446e-06, 'epoch': 1.55} {'loss': 0.4701, 'learning_rate': 2.370857685294554e-06, 'epoch': 1.55} {'loss': 0.5096, 'learning_rate': 2.3706460567115776e-06, 'epoch': 1.55} {'loss': 0.5196, 'learning_rate': 2.3704344363041456e-06, 'epoch': 1.55} {'loss': 0.5025, 'learning_rate': 2.3702228240724755e-06, 'epoch': 1.55} {'loss': 0.4489, 'learning_rate': 2.3700112200168058e-06, 'epoch': 1.55} {'loss': 0.4662, 'learning_rate': 2.3697996241373524e-06, 'epoch': 1.55} {'loss': 0.449, 'learning_rate': 2.3695880364343538e-06, 'epoch': 1.55} {'loss': 0.5341, 'learning_rate': 2.369376456908027e-06, 'epoch': 1.55} {'loss': 0.5757, 'learning_rate': 2.3691648855586014e-06, 'epoch': 1.55} {'loss': 0.5557, 'learning_rate': 2.368953322386307e-06, 'epoch': 1.55} {'loss': 0.7142, 'learning_rate': 2.3687417673913625e-06, 'epoch': 1.55} {'loss': 0.3834, 'learning_rate': 2.368530220574007e-06, 'epoch': 1.55} {'loss': 0.4358, 'learning_rate': 2.368318681934453e-06, 'epoch': 1.55} {'loss': 0.4063, 'learning_rate': 2.3681071514729405e-06, 'epoch': 1.55} {'loss': 0.428, 'learning_rate': 2.367895629189687e-06, 'epoch': 1.55} {'loss': 0.4356, 'learning_rate': 2.3676841150849217e-06, 'epoch': 1.55} {'loss': 0.6637, 'learning_rate': 2.3674726091588753e-06, 'epoch': 1.55} {'loss': 0.6371, 'learning_rate': 2.367261111411765e-06, 'epoch': 1.55} {'loss': 0.4999, 'learning_rate': 2.3670496218438297e-06, 'epoch': 1.55} {'loss': 0.4825, 'learning_rate': 2.366838140455283e-06, 'epoch': 1.55} {'loss': 0.4427, 'learning_rate': 2.3666266672463644e-06, 'epoch': 1.55} {'loss': 0.4075, 'learning_rate': 2.3664152022172904e-06, 'epoch': 1.55} {'loss': 0.6115, 'learning_rate': 2.3662037453682927e-06, 'epoch': 1.55} {'loss': 0.664, 'learning_rate': 2.3659922966995995e-06, 'epoch': 1.55} {'loss': 0.6076, 'learning_rate': 2.365780856211428e-06, 'epoch': 1.55} {'loss': 0.5375, 'learning_rate': 2.365569423904017e-06, 'epoch': 1.55} {'loss': 0.5365, 'learning_rate': 2.3653579997775856e-06, 'epoch': 1.55} {'loss': 0.6038, 'learning_rate': 2.3651465838323616e-06, 'epoch': 1.55} {'loss': 0.4865, 'learning_rate': 2.3649351760685725e-06, 'epoch': 1.55} {'loss': 0.5497, 'learning_rate': 2.364723776486444e-06, 'epoch': 1.55} {'loss': 0.4871, 'learning_rate': 2.3645123850862063e-06, 'epoch': 1.55} {'loss': 0.4665, 'learning_rate': 2.3643010018680767e-06, 'epoch': 1.55} {'loss': 0.716, 'learning_rate': 2.364089626832293e-06, 'epoch': 1.55} {'loss': 0.5102, 'learning_rate': 2.3638782599790743e-06, 'epoch': 1.55} {'loss': 0.441, 'learning_rate': 2.3636669013086487e-06, 'epoch': 1.55} {'loss': 0.5729, 'learning_rate': 2.3634555508212444e-06, 'epoch': 1.55} {'loss': 0.5234, 'learning_rate': 2.363244208517086e-06, 'epoch': 1.55} {'loss': 0.5968, 'learning_rate': 2.3630328743964026e-06, 'epoch': 1.55} {'loss': 0.5477, 'learning_rate': 2.3628215484594174e-06, 'epoch': 1.55} {'loss': 0.3704, 'learning_rate': 2.362610230706357e-06, 'epoch': 1.55} {'loss': 0.5296, 'learning_rate': 2.36239892113745e-06, 'epoch': 1.55} {'loss': 0.5794, 'learning_rate': 2.3621876197529213e-06, 'epoch': 1.55} {'loss': 0.4569, 'learning_rate': 2.361976326552998e-06, 'epoch': 1.55} {'loss': 0.5604, 'learning_rate': 2.3617650415379067e-06, 'epoch': 1.55} {'loss': 0.4436, 'learning_rate': 2.361553764707877e-06, 'epoch': 1.55} {'loss': 0.5409, 'learning_rate': 2.3613424960631282e-06, 'epoch': 1.55} {'loss': 0.6086, 'learning_rate': 2.3611312356038897e-06, 'epoch': 1.55} {'loss': 0.5298, 'learning_rate': 2.3609199833303897e-06, 'epoch': 1.55} {'loss': 0.5959, 'learning_rate': 2.360708739242853e-06, 'epoch': 1.55} {'loss': 0.5224, 'learning_rate': 2.3604975033415068e-06, 'epoch': 1.55} {'loss': 0.5529, 'learning_rate': 2.3602862756265765e-06, 'epoch': 1.55} {'loss': 0.581, 'learning_rate': 2.360075056098291e-06, 'epoch': 1.55} {'loss': 0.496, 'learning_rate': 2.3598638447568733e-06, 'epoch': 1.55} {'loss': 0.5645, 'learning_rate': 2.35965264160255e-06, 'epoch': 1.55} {'loss': 0.4367, 'learning_rate': 2.3594414466355496e-06, 'epoch': 1.55} {'loss': 0.4805, 'learning_rate': 2.3592302598560966e-06, 'epoch': 1.56} {'loss': 0.4892, 'learning_rate': 2.3590190812644177e-06, 'epoch': 1.56} {'loss': 0.6779, 'learning_rate': 2.3588079108607433e-06, 'epoch': 1.56} {'loss': 0.4447, 'learning_rate': 2.358596748645292e-06, 'epoch': 1.56} {'loss': 0.5911, 'learning_rate': 2.3583855946182944e-06, 'epoch': 1.56} {'loss': 0.4958, 'learning_rate': 2.358174448779976e-06, 'epoch': 1.56} {'loss': 0.5109, 'learning_rate': 2.3579633111305635e-06, 'epoch': 1.56} {'loss': 0.4608, 'learning_rate': 2.357752181670283e-06, 'epoch': 1.56} {'loss': 0.6351, 'learning_rate': 2.3575410603993643e-06, 'epoch': 1.56} {'loss': 0.3988, 'learning_rate': 2.3573299473180267e-06, 'epoch': 1.56} {'loss': 0.4142, 'learning_rate': 2.3571188424265e-06, 'epoch': 1.56} {'loss': 0.4516, 'learning_rate': 2.356907745725011e-06, 'epoch': 1.56} {'loss': 0.4832, 'learning_rate': 2.3566966572137838e-06, 'epoch': 1.56} {'loss': 0.4788, 'learning_rate': 2.356485576893047e-06, 'epoch': 1.56} {'loss': 0.6131, 'learning_rate': 2.3562745047630255e-06, 'epoch': 1.56} {'loss': 0.4732, 'learning_rate': 2.356063440823948e-06, 'epoch': 1.56} {'loss': 0.5539, 'learning_rate': 2.355852385076036e-06, 'epoch': 1.56} {'loss': 0.4926, 'learning_rate': 2.3556413375195186e-06, 'epoch': 1.56} {'loss': 0.541, 'learning_rate': 2.3554302981546216e-06, 'epoch': 1.56} {'loss': 0.5042, 'learning_rate': 2.35521926698157e-06, 'epoch': 1.56} {'loss': 0.502, 'learning_rate': 2.355008244000592e-06, 'epoch': 1.56} {'loss': 0.5151, 'learning_rate': 2.354797229211915e-06, 'epoch': 1.56} {'loss': 0.4226, 'learning_rate': 2.354586222615759e-06, 'epoch': 1.56} {'loss': 0.4801, 'learning_rate': 2.354375224212355e-06, 'epoch': 1.56} {'loss': 0.5292, 'learning_rate': 2.3541642340019278e-06, 'epoch': 1.56} {'loss': 0.4107, 'learning_rate': 2.3539532519847044e-06, 'epoch': 1.56} {'loss': 0.5595, 'learning_rate': 2.3537422781609086e-06, 'epoch': 1.56} {'loss': 0.5395, 'learning_rate': 2.353531312530769e-06, 'epoch': 1.56} {'loss': 0.5692, 'learning_rate': 2.353320355094514e-06, 'epoch': 1.56} {'loss': 0.5096, 'learning_rate': 2.353109405852363e-06, 'epoch': 1.56} {'loss': 0.5297, 'learning_rate': 2.352898464804545e-06, 'epoch': 1.56} {'loss': 0.4388, 'learning_rate': 2.3526875319512876e-06, 'epoch': 1.56} {'loss': 0.5427, 'learning_rate': 2.352476607292815e-06, 'epoch': 1.56} {'loss': 0.386, 'learning_rate': 2.352265690829354e-06, 'epoch': 1.56} {'loss': 0.6081, 'learning_rate': 2.3520547825611305e-06, 'epoch': 1.56} {'loss': 0.6307, 'learning_rate': 2.351843882488374e-06, 'epoch': 1.56} {'loss': 0.4751, 'learning_rate': 2.3516329906113033e-06, 'epoch': 1.56} {'loss': 0.598, 'learning_rate': 2.351422106930149e-06, 'epoch': 1.56} {'loss': 0.4958, 'learning_rate': 2.351211231445135e-06, 'epoch': 1.56} {'loss': 0.65, 'learning_rate': 2.3510003641564903e-06, 'epoch': 1.56} {'loss': 0.4454, 'learning_rate': 2.3507895050644414e-06, 'epoch': 1.56} {'loss': 0.5915, 'learning_rate': 2.3505786541692057e-06, 'epoch': 1.56} {'loss': 0.6157, 'learning_rate': 2.3503678114710204e-06, 'epoch': 1.56} {'loss': 0.4221, 'learning_rate': 2.350156976970105e-06, 'epoch': 1.56} {'loss': 0.4961, 'learning_rate': 2.3499461506666866e-06, 'epoch': 1.56} {'loss': 0.5304, 'learning_rate': 2.3497353325609907e-06, 'epoch': 1.56} {'loss': 0.3739, 'learning_rate': 2.3495245226532436e-06, 'epoch': 1.56} {'loss': 0.5257, 'learning_rate': 2.3493137209436755e-06, 'epoch': 1.56} {'loss': 0.5316, 'learning_rate': 2.3491029274325016e-06, 'epoch': 1.56} {'loss': 0.4046, 'learning_rate': 2.3488921421199608e-06, 'epoch': 1.56} {'loss': 0.4081, 'learning_rate': 2.348681365006269e-06, 'epoch': 1.56} {'loss': 0.4601, 'learning_rate': 2.3484705960916567e-06, 'epoch': 1.56} {'loss': 0.5917, 'learning_rate': 2.3482598353763475e-06, 'epoch': 1.56} {'loss': 0.6853, 'learning_rate': 2.3480490828605696e-06, 'epoch': 1.56} {'loss': 0.6159, 'learning_rate': 2.3478383385445504e-06, 'epoch': 1.56} {'loss': 0.4335, 'learning_rate': 2.3476276024285073e-06, 'epoch': 1.56} {'loss': 0.6024, 'learning_rate': 2.347416874512677e-06, 'epoch': 1.56} {'loss': 0.5586, 'learning_rate': 2.347206154797278e-06, 'epoch': 1.56} {'loss': 0.5627, 'learning_rate': 2.3469954432825382e-06, 'epoch': 1.56} {'loss': 0.4594, 'learning_rate': 2.346784739968686e-06, 'epoch': 1.56} {'loss': 0.5772, 'learning_rate': 2.3465740448559395e-06, 'epoch': 1.56} {'loss': 0.3869, 'learning_rate': 2.3463633579445354e-06, 'epoch': 1.56} {'loss': 0.5509, 'learning_rate': 2.346152679234688e-06, 'epoch': 1.56} {'loss': 0.4769, 'learning_rate': 2.3459420087266338e-06, 'epoch': 1.56} {'loss': 0.4905, 'learning_rate': 2.345731346420591e-06, 'epoch': 1.56} {'loss': 0.548, 'learning_rate': 2.3455206923167885e-06, 'epoch': 1.56} {'loss': 0.5769, 'learning_rate': 2.345310046415453e-06, 'epoch': 1.56} {'loss': 0.5575, 'learning_rate': 2.3450994087168044e-06, 'epoch': 1.56} {'loss': 0.4131, 'learning_rate': 2.3448887792210784e-06, 'epoch': 1.56} {'loss': 0.4909, 'learning_rate': 2.3446781579284883e-06, 'epoch': 1.56} {'loss': 0.5187, 'learning_rate': 2.344467544839273e-06, 'epoch': 1.56} {'loss': 0.4201, 'learning_rate': 2.3442569399536485e-06, 'epoch': 1.56} {'loss': 0.5036, 'learning_rate': 2.344046343271843e-06, 'epoch': 1.56} {'loss': 0.642, 'learning_rate': 2.3438357547940873e-06, 'epoch': 1.56} {'loss': 0.399, 'learning_rate': 2.3436251745205953e-06, 'epoch': 1.56} {'loss': 0.622, 'learning_rate': 2.343414602451606e-06, 'epoch': 1.56} {'loss': 0.5814, 'learning_rate': 2.3432040385873368e-06, 'epoch': 1.56} {'loss': 0.3615, 'learning_rate': 2.3429934829280154e-06, 'epoch': 1.56} {'loss': 0.5083, 'learning_rate': 2.3427829354738674e-06, 'epoch': 1.56} {'loss': 0.4918, 'learning_rate': 2.3425723962251177e-06, 'epoch': 1.56} {'loss': 0.4774, 'learning_rate': 2.3423618651819967e-06, 'epoch': 1.56} {'loss': 0.4476, 'learning_rate': 2.3421513423447205e-06, 'epoch': 1.56} {'loss': 0.5241, 'learning_rate': 2.3419408277135257e-06, 'epoch': 1.56} {'loss': 0.596, 'learning_rate': 2.34173032128863e-06, 'epoch': 1.56} {'loss': 0.3745, 'learning_rate': 2.341519823070261e-06, 'epoch': 1.56} {'loss': 0.3901, 'learning_rate': 2.3413093330586445e-06, 'epoch': 1.56} {'loss': 0.453, 'learning_rate': 2.3410988512540066e-06, 'epoch': 1.56} {'loss': 0.4458, 'learning_rate': 2.340888377656575e-06, 'epoch': 1.56} {'loss': 0.5048, 'learning_rate': 2.340677912266568e-06, 'epoch': 1.56} {'loss': 0.4472, 'learning_rate': 2.340467455084221e-06, 'epoch': 1.56} {'loss': 0.5304, 'learning_rate': 2.3402570061097517e-06, 'epoch': 1.56} {'loss': 0.4372, 'learning_rate': 2.340046565343388e-06, 'epoch': 1.56} {'loss': 0.5289, 'learning_rate': 2.339836132785357e-06, 'epoch': 1.56} {'loss': 0.7103, 'learning_rate': 2.3396257084358807e-06, 'epoch': 1.56} {'loss': 0.6029, 'learning_rate': 2.339415292295192e-06, 'epoch': 1.56} {'loss': 0.5104, 'learning_rate': 2.339204884363504e-06, 'epoch': 1.56} {'loss': 0.5569, 'learning_rate': 2.338994484641056e-06, 'epoch': 1.56} {'loss': 0.5556, 'learning_rate': 2.3387840931280635e-06, 'epoch': 1.56} {'loss': 0.4995, 'learning_rate': 2.3385737098247553e-06, 'epoch': 1.56} {'loss': 0.5854, 'learning_rate': 2.3383633347313605e-06, 'epoch': 1.56} {'loss': 0.4091, 'learning_rate': 2.338152967848094e-06, 'epoch': 1.56} {'loss': 0.5597, 'learning_rate': 2.3379426091751943e-06, 'epoch': 1.56} {'loss': 0.4353, 'learning_rate': 2.337732258712876e-06, 'epoch': 1.56} {'loss': 0.6789, 'learning_rate': 2.3375219164613737e-06, 'epoch': 1.56} {'loss': 0.5223, 'learning_rate': 2.337311582420906e-06, 'epoch': 1.56} {'loss': 0.4899, 'learning_rate': 2.3371012565916995e-06, 'epoch': 1.56} {'loss': 0.6119, 'learning_rate': 2.3368909389739837e-06, 'epoch': 1.56} {'loss': 0.5794, 'learning_rate': 2.3366806295679758e-06, 'epoch': 1.56} {'loss': 0.6724, 'learning_rate': 2.336470328373912e-06, 'epoch': 1.56} {'loss': 0.5083, 'learning_rate': 2.3362600353920085e-06, 'epoch': 1.56} {'loss': 0.6288, 'learning_rate': 2.3360497506224943e-06, 'epoch': 1.56} {'loss': 0.6386, 'learning_rate': 2.3358394740655955e-06, 'epoch': 1.56} {'loss': 0.5536, 'learning_rate': 2.3356292057215345e-06, 'epoch': 1.56} {'loss': 0.4719, 'learning_rate': 2.335418945590543e-06, 'epoch': 1.56} {'loss': 0.3811, 'learning_rate': 2.3352086936728357e-06, 'epoch': 1.56} {'loss': 0.4619, 'learning_rate': 2.3349984499686494e-06, 'epoch': 1.56} {'loss': 0.3491, 'learning_rate': 2.334788214478202e-06, 'epoch': 1.56} {'loss': 0.5269, 'learning_rate': 2.3345779872017204e-06, 'epoch': 1.56} {'loss': 0.4451, 'learning_rate': 2.3343677681394293e-06, 'epoch': 1.56} {'loss': 0.5286, 'learning_rate': 2.3341575572915565e-06, 'epoch': 1.56} {'loss': 0.5209, 'learning_rate': 2.333947354658328e-06, 'epoch': 1.56} {'loss': 0.5287, 'learning_rate': 2.333737160239962e-06, 'epoch': 1.56} {'loss': 0.5733, 'learning_rate': 2.3335269740366926e-06, 'epoch': 1.56} {'loss': 0.4305, 'learning_rate': 2.3333167960487392e-06, 'epoch': 1.56} {'loss': 0.3437, 'learning_rate': 2.333106626276329e-06, 'epoch': 1.56} {'loss': 0.5886, 'learning_rate': 2.3328964647196862e-06, 'epoch': 1.56} {'loss': 0.5497, 'learning_rate': 2.3326863113790376e-06, 'epoch': 1.56} {'loss': 0.4072, 'learning_rate': 2.3324761662546103e-06, 'epoch': 1.56} {'loss': 0.5765, 'learning_rate': 2.3322660293466237e-06, 'epoch': 1.56} {'loss': 0.6137, 'learning_rate': 2.332055900655307e-06, 'epoch': 1.56} {'loss': 0.5693, 'learning_rate': 2.3318457801808838e-06, 'epoch': 1.56} {'loss': 0.496, 'learning_rate': 2.3316356679235795e-06, 'epoch': 1.56} {'loss': 0.6236, 'learning_rate': 2.3314255638836204e-06, 'epoch': 1.56} {'loss': 0.4425, 'learning_rate': 2.33121546806123e-06, 'epoch': 1.56} {'loss': 0.6598, 'learning_rate': 2.331005380456638e-06, 'epoch': 1.56} {'loss': 0.4718, 'learning_rate': 2.3307953010700623e-06, 'epoch': 1.56} {'loss': 0.3874, 'learning_rate': 2.330585229901733e-06, 'epoch': 1.56} {'loss': 0.4844, 'learning_rate': 2.3303751669518724e-06, 'epoch': 1.56} {'loss': 0.7219, 'learning_rate': 2.3301651122207082e-06, 'epoch': 1.56} {'loss': 0.4654, 'learning_rate': 2.3299550657084635e-06, 'epoch': 1.56} {'loss': 0.5221, 'learning_rate': 2.3297450274153645e-06, 'epoch': 1.56} {'loss': 0.436, 'learning_rate': 2.3295349973416394e-06, 'epoch': 1.56} {'loss': 0.4122, 'learning_rate': 2.329324975487506e-06, 'epoch': 1.56} {'loss': 0.5593, 'learning_rate': 2.3291149618531937e-06, 'epoch': 1.56} {'loss': 0.4993, 'learning_rate': 2.328904956438928e-06, 'epoch': 1.56} {'loss': 0.5518, 'learning_rate': 2.3286949592449313e-06, 'epoch': 1.56} {'loss': 0.3796, 'learning_rate': 2.3284849702714306e-06, 'epoch': 1.56} {'loss': 0.5269, 'learning_rate': 2.3282749895186552e-06, 'epoch': 1.56} {'loss': 0.3497, 'learning_rate': 2.3280650169868213e-06, 'epoch': 1.56} {'loss': 0.5229, 'learning_rate': 2.327855052676158e-06, 'epoch': 1.56} {'loss': 0.4417, 'learning_rate': 2.3276450965868914e-06, 'epoch': 1.56} {'loss': 0.4794, 'learning_rate': 2.327435148719245e-06, 'epoch': 1.56} {'loss': 0.4299, 'learning_rate': 2.327225209073444e-06, 'epoch': 1.56} {'loss': 0.6639, 'learning_rate': 2.3270152776497134e-06, 'epoch': 1.56} {'loss': 0.5454, 'learning_rate': 2.3268053544482825e-06, 'epoch': 1.56} {'loss': 0.5025, 'learning_rate': 2.326595439469369e-06, 'epoch': 1.56} {'loss': 0.4355, 'learning_rate': 2.3263855327132e-06, 'epoch': 1.56} {'loss': 0.5754, 'learning_rate': 2.3261756341800023e-06, 'epoch': 1.56} {'loss': 0.5347, 'learning_rate': 2.32596574387e-06, 'epoch': 1.56} {'loss': 0.4624, 'learning_rate': 2.325755861783421e-06, 'epoch': 1.56} {'loss': 0.5907, 'learning_rate': 2.325545987920482e-06, 'epoch': 1.56} {'loss': 0.5159, 'learning_rate': 2.3253361222814186e-06, 'epoch': 1.56} {'loss': 0.5386, 'learning_rate': 2.3251262648664465e-06, 'epoch': 1.56} {'loss': 0.3737, 'learning_rate': 2.3249164156757954e-06, 'epoch': 1.56} {'loss': 0.4946, 'learning_rate': 2.3247065747096885e-06, 'epoch': 1.56} {'loss': 0.4727, 'learning_rate': 2.324496741968351e-06, 'epoch': 1.56} {'loss': 0.5834, 'learning_rate': 2.324286917452011e-06, 'epoch': 1.56} {'loss': 0.5587, 'learning_rate': 2.3240771011608877e-06, 'epoch': 1.56} {'loss': 0.4805, 'learning_rate': 2.3238672930952088e-06, 'epoch': 1.56} {'loss': 0.4599, 'learning_rate': 2.323657493255198e-06, 'epoch': 1.56} {'loss': 0.348, 'learning_rate': 2.3234477016410817e-06, 'epoch': 1.56} {'loss': 0.5197, 'learning_rate': 2.323237918253084e-06, 'epoch': 1.56} {'loss': 0.5969, 'learning_rate': 2.32302814309143e-06, 'epoch': 1.56} {'loss': 0.5085, 'learning_rate': 2.3228183761563472e-06, 'epoch': 1.56} {'loss': 0.4944, 'learning_rate': 2.3226086174480544e-06, 'epoch': 1.56} {'loss': 0.5002, 'learning_rate': 2.3223988669667783e-06, 'epoch': 1.56} {'loss': 0.6243, 'learning_rate': 2.322189124712746e-06, 'epoch': 1.56} {'loss': 0.6031, 'learning_rate': 2.321979390686181e-06, 'epoch': 1.56} {'loss': 0.4939, 'learning_rate': 2.3217696648873102e-06, 'epoch': 1.56} {'loss': 0.5681, 'learning_rate': 2.3215599473163507e-06, 'epoch': 1.56} {'loss': 0.5633, 'learning_rate': 2.3213502379735387e-06, 'epoch': 1.56} {'loss': 0.5751, 'learning_rate': 2.3211405368590902e-06, 'epoch': 1.56} {'loss': 0.4593, 'learning_rate': 2.3209308439732327e-06, 'epoch': 1.56} {'loss': 0.5061, 'learning_rate': 2.3207211593161905e-06, 'epoch': 1.56} {'loss': 0.5162, 'learning_rate': 2.320511482888189e-06, 'epoch': 1.56} {'loss': 0.5574, 'learning_rate': 2.3203018146894552e-06, 'epoch': 1.56} {'loss': 0.3768, 'learning_rate': 2.320092154720206e-06, 'epoch': 1.56} {'loss': 0.4475, 'learning_rate': 2.319882502980676e-06, 'epoch': 1.56} {'loss': 0.6065, 'learning_rate': 2.3196728594710828e-06, 'epoch': 1.56} {'loss': 0.5725, 'learning_rate': 2.319463224191654e-06, 'epoch': 1.56} {'loss': 0.4655, 'learning_rate': 2.319253597142612e-06, 'epoch': 1.56} {'loss': 0.6298, 'learning_rate': 2.3190439783241835e-06, 'epoch': 1.56} {'loss': 0.4271, 'learning_rate': 2.3188343677365955e-06, 'epoch': 1.56} {'loss': 0.6113, 'learning_rate': 2.318624765380064e-06, 'epoch': 1.56} {'loss': 0.5065, 'learning_rate': 2.3184151712548262e-06, 'epoch': 1.56} {'loss': 0.6274, 'learning_rate': 2.3182055853610964e-06, 'epoch': 1.56} {'loss': 0.5012, 'learning_rate': 2.3179960076991013e-06, 'epoch': 1.56} {'loss': 0.5146, 'learning_rate': 2.3177864382690717e-06, 'epoch': 1.56} {'loss': 0.4977, 'learning_rate': 2.3175768770712206e-06, 'epoch': 1.56} {'loss': 0.4971, 'learning_rate': 2.3173673241057848e-06, 'epoch': 1.56} {'loss': 0.4493, 'learning_rate': 2.317157779372978e-06, 'epoch': 1.56} {'loss': 0.5085, 'learning_rate': 2.316948242873035e-06, 'epoch': 1.56} {'loss': 0.4636, 'learning_rate': 2.316738714606174e-06, 'epoch': 1.56} {'loss': 0.6121, 'learning_rate': 2.3165291945726197e-06, 'epoch': 1.56} {'loss': 0.5919, 'learning_rate': 2.316319682772601e-06, 'epoch': 1.56} {'loss': 0.5059, 'learning_rate': 2.3161101792063333e-06, 'epoch': 1.56} {'loss': 0.3873, 'learning_rate': 2.3159006838740526e-06, 'epoch': 1.56} {'loss': 0.543, 'learning_rate': 2.315691196775973e-06, 'epoch': 1.56} {'loss': 0.3623, 'learning_rate': 2.315481717912329e-06, 'epoch': 1.56} {'loss': 0.5099, 'learning_rate': 2.315272247283338e-06, 'epoch': 1.56} {'loss': 0.6196, 'learning_rate': 2.3150627848892247e-06, 'epoch': 1.56} {'loss': 0.5886, 'learning_rate': 2.314853330730219e-06, 'epoch': 1.56} {'loss': 0.605, 'learning_rate': 2.3146438848065357e-06, 'epoch': 1.56} {'loss': 0.5386, 'learning_rate': 2.314434447118411e-06, 'epoch': 1.56} {'loss': 0.4939, 'learning_rate': 2.3142250176660574e-06, 'epoch': 1.56} {'loss': 0.5023, 'learning_rate': 2.3140155964497123e-06, 'epoch': 1.56} {'loss': 0.4539, 'learning_rate': 2.313806183469589e-06, 'epoch': 1.56} {'loss': 0.6403, 'learning_rate': 2.3135967787259163e-06, 'epoch': 1.56} {'loss': 0.5497, 'learning_rate': 2.3133873822189224e-06, 'epoch': 1.56} {'loss': 0.5925, 'learning_rate': 2.3131779939488207e-06, 'epoch': 1.56} {'loss': 0.4624, 'learning_rate': 2.312968613915848e-06, 'epoch': 1.56} {'loss': 0.5513, 'learning_rate': 2.3127592421202184e-06, 'epoch': 1.56} {'loss': 0.5598, 'learning_rate': 2.312549878562167e-06, 'epoch': 1.56} {'loss': 0.5446, 'learning_rate': 2.3123405232419084e-06, 'epoch': 1.56} {'loss': 0.5195, 'learning_rate': 2.312131176159671e-06, 'epoch': 1.56} {'loss': 0.5532, 'learning_rate': 2.3119218373156826e-06, 'epoch': 1.56} {'loss': 0.5014, 'learning_rate': 2.3117125067101576e-06, 'epoch': 1.56} {'loss': 0.6162, 'learning_rate': 2.311503184343332e-06, 'epoch': 1.56} {'loss': 0.4955, 'learning_rate': 2.3112938702154198e-06, 'epoch': 1.56} {'loss': 0.6522, 'learning_rate': 2.3110845643266546e-06, 'epoch': 1.56} {'loss': 0.7147, 'learning_rate': 2.310875266677255e-06, 'epoch': 1.56} {'loss': 0.6337, 'learning_rate': 2.3106659772674455e-06, 'epoch': 1.56} {'loss': 0.5768, 'learning_rate': 2.310456696097454e-06, 'epoch': 1.56} {'loss': 0.5096, 'learning_rate': 2.3102474231674966e-06, 'epoch': 1.56} {'loss': 0.4053, 'learning_rate': 2.3100381584778096e-06, 'epoch': 1.56} {'loss': 0.5225, 'learning_rate': 2.3098289020286068e-06, 'epoch': 1.56} {'loss': 0.4794, 'learning_rate': 2.3096196538201175e-06, 'epoch': 1.56} {'loss': 0.5481, 'learning_rate': 2.3094104138525643e-06, 'epoch': 1.56} {'loss': 0.482, 'learning_rate': 2.3092011821261716e-06, 'epoch': 1.56} {'loss': 0.4841, 'learning_rate': 2.308991958641168e-06, 'epoch': 1.56} {'loss': 0.5634, 'learning_rate': 2.308782743397767e-06, 'epoch': 1.56} {'loss': 0.457, 'learning_rate': 2.308573536396206e-06, 'epoch': 1.56} {'loss': 0.4877, 'learning_rate': 2.308364337636698e-06, 'epoch': 1.56} {'loss': 0.6158, 'learning_rate': 2.3081551471194742e-06, 'epoch': 1.56} {'loss': 0.4127, 'learning_rate': 2.3079459648447543e-06, 'epoch': 1.56} {'loss': 0.4403, 'learning_rate': 2.3077367908127656e-06, 'epoch': 1.56} {'loss': 0.477, 'learning_rate': 2.3075276250237344e-06, 'epoch': 1.56} {'loss': 0.5477, 'learning_rate': 2.307318467477875e-06, 'epoch': 1.56} {'loss': 0.4828, 'learning_rate': 2.3071093181754244e-06, 'epoch': 1.56} {'loss': 0.5135, 'learning_rate': 2.306900177116598e-06, 'epoch': 1.56} {'loss': 0.4115, 'learning_rate': 2.306691044301622e-06, 'epoch': 1.56} {'loss': 0.4323, 'learning_rate': 2.306481919730723e-06, 'epoch': 1.56} {'loss': 0.5533, 'learning_rate': 2.306272803404118e-06, 'epoch': 1.56} {'loss': 0.4068, 'learning_rate': 2.3060636953220427e-06, 'epoch': 1.56} {'loss': 0.5299, 'learning_rate': 2.305854595484711e-06, 'epoch': 1.56} {'loss': 0.5323, 'learning_rate': 2.3056455038923496e-06, 'epoch': 1.56} {'loss': 0.4778, 'learning_rate': 2.305436420545185e-06, 'epoch': 1.56} {'loss': 0.5928, 'learning_rate': 2.3052273454434395e-06, 'epoch': 1.56} {'loss': 0.5105, 'learning_rate': 2.3050182785873386e-06, 'epoch': 1.56} {'loss': 0.484, 'learning_rate': 2.3048092199771012e-06, 'epoch': 1.56} {'loss': 0.3888, 'learning_rate': 2.3046001696129605e-06, 'epoch': 1.56} {'loss': 0.4118, 'learning_rate': 2.3043911274951327e-06, 'epoch': 1.56} {'loss': 0.5179, 'learning_rate': 2.3041820936238436e-06, 'epoch': 1.56} {'loss': 0.4501, 'learning_rate': 2.3039730679993177e-06, 'epoch': 1.56} {'loss': 0.4727, 'learning_rate': 2.3037640506217807e-06, 'epoch': 1.56} {'loss': 0.5785, 'learning_rate': 2.3035550414914563e-06, 'epoch': 1.56} {'loss': 0.4697, 'learning_rate': 2.3033460406085662e-06, 'epoch': 1.56} {'loss': 0.5733, 'learning_rate': 2.303137047973335e-06, 'epoch': 1.56} {'loss': 0.5835, 'learning_rate': 2.302928063585986e-06, 'epoch': 1.56} {'loss': 0.6257, 'learning_rate': 2.3027190874467454e-06, 'epoch': 1.56} {'loss': 0.4781, 'learning_rate': 2.3025101195558352e-06, 'epoch': 1.56} {'loss': 0.3689, 'learning_rate': 2.3023011599134814e-06, 'epoch': 1.56} {'loss': 0.5367, 'learning_rate': 2.302092208519908e-06, 'epoch': 1.56} {'loss': 0.4985, 'learning_rate': 2.3018832653753365e-06, 'epoch': 1.56} {'loss': 0.6563, 'learning_rate': 2.3016743304799905e-06, 'epoch': 1.56} {'loss': 0.5678, 'learning_rate': 2.3014654038340957e-06, 'epoch': 1.56} {'loss': 0.5273, 'learning_rate': 2.301256485437876e-06, 'epoch': 1.56} {'loss': 0.4053, 'learning_rate': 2.301047575291554e-06, 'epoch': 1.56} {'loss': 0.3456, 'learning_rate': 2.300838673395355e-06, 'epoch': 1.56} {'loss': 0.4643, 'learning_rate': 2.300629779749505e-06, 'epoch': 1.56} {'loss': 0.5108, 'learning_rate': 2.3004208943542218e-06, 'epoch': 1.56} {'loss': 0.5364, 'learning_rate': 2.3002120172097333e-06, 'epoch': 1.56} {'loss': 0.4589, 'learning_rate': 2.300003148316261e-06, 'epoch': 1.56} {'loss': 0.5454, 'learning_rate': 2.299794287674032e-06, 'epoch': 1.56} {'loss': 0.6038, 'learning_rate': 2.299585435283268e-06, 'epoch': 1.56} {'loss': 0.5427, 'learning_rate': 2.2993765911441958e-06, 'epoch': 1.56} {'loss': 0.5234, 'learning_rate': 2.2991677552570334e-06, 'epoch': 1.56} {'loss': 0.6788, 'learning_rate': 2.298958927622008e-06, 'epoch': 1.56} {'loss': 0.5679, 'learning_rate': 2.2987501082393438e-06, 'epoch': 1.56} {'loss': 0.5699, 'learning_rate': 2.2985412971092637e-06, 'epoch': 1.56} {'loss': 0.5702, 'learning_rate': 2.2983324942319917e-06, 'epoch': 1.56} {'loss': 0.7055, 'learning_rate': 2.298123699607752e-06, 'epoch': 1.56} {'loss': 0.5233, 'learning_rate': 2.2979149132367697e-06, 'epoch': 1.56} {'loss': 0.4908, 'learning_rate': 2.2977061351192643e-06, 'epoch': 1.56} {'loss': 0.638, 'learning_rate': 2.2974973652554623e-06, 'epoch': 1.56} {'loss': 0.6414, 'learning_rate': 2.2972886036455868e-06, 'epoch': 1.56} {'loss': 0.4445, 'learning_rate': 2.297079850289862e-06, 'epoch': 1.56} {'loss': 0.6755, 'learning_rate': 2.2968711051885107e-06, 'epoch': 1.56} {'loss': 0.5044, 'learning_rate': 2.2966623683417577e-06, 'epoch': 1.56} {'loss': 0.4865, 'learning_rate': 2.2964536397498283e-06, 'epoch': 1.56} {'loss': 0.445, 'learning_rate': 2.2962449194129422e-06, 'epoch': 1.56} {'loss': 0.5259, 'learning_rate': 2.296036207331325e-06, 'epoch': 1.56} {'loss': 0.4009, 'learning_rate': 2.2958275035052e-06, 'epoch': 1.56} {'loss': 0.4741, 'learning_rate': 2.295618807934791e-06, 'epoch': 1.56} {'loss': 0.4017, 'learning_rate': 2.295410120620325e-06, 'epoch': 1.56} {'loss': 0.4912, 'learning_rate': 2.295201441562017e-06, 'epoch': 1.56} {'loss': 0.5181, 'learning_rate': 2.294992770760102e-06, 'epoch': 1.56} {'loss': 0.4311, 'learning_rate': 2.2947841082147936e-06, 'epoch': 1.56} {'loss': 0.5328, 'learning_rate': 2.2945754539263197e-06, 'epoch': 1.56} {'loss': 0.5047, 'learning_rate': 2.2943668078949043e-06, 'epoch': 1.56} {'loss': 0.4826, 'learning_rate': 2.2941581701207705e-06, 'epoch': 1.56} {'loss': 0.4264, 'learning_rate': 2.2939495406041436e-06, 'epoch': 1.56} {'loss': 0.4323, 'learning_rate': 2.293740919345241e-06, 'epoch': 1.56} {'loss': 0.6851, 'learning_rate': 2.293532306344295e-06, 'epoch': 1.56} {'loss': 0.6806, 'learning_rate': 2.2933237016015217e-06, 'epoch': 1.56} {'loss': 0.6269, 'learning_rate': 2.2931151051171486e-06, 'epoch': 1.56} {'loss': 0.4035, 'learning_rate': 2.2929065168913976e-06, 'epoch': 1.56} {'loss': 0.5927, 'learning_rate': 2.292697936924494e-06, 'epoch': 1.56} {'loss': 0.6127, 'learning_rate': 2.2924893652166612e-06, 'epoch': 1.56} {'loss': 0.4449, 'learning_rate': 2.2922808017681197e-06, 'epoch': 1.56} {'loss': 0.5641, 'learning_rate': 2.2920722465790956e-06, 'epoch': 1.56} {'loss': 0.542, 'learning_rate': 2.2918636996498112e-06, 'epoch': 1.56} {'loss': 0.483, 'learning_rate': 2.2916551609804906e-06, 'epoch': 1.56} {'loss': 0.4299, 'learning_rate': 2.29144663057136e-06, 'epoch': 1.56} {'loss': 0.5868, 'learning_rate': 2.2912381084226342e-06, 'epoch': 1.56} {'loss': 0.4312, 'learning_rate': 2.2910295945345483e-06, 'epoch': 1.56} {'loss': 0.4282, 'learning_rate': 2.290821088907318e-06, 'epoch': 1.56} {'loss': 0.5986, 'learning_rate': 2.2906125915411683e-06, 'epoch': 1.56} {'loss': 0.5907, 'learning_rate': 2.2904041024363223e-06, 'epoch': 1.56} {'loss': 0.4086, 'learning_rate': 2.290195621593004e-06, 'epoch': 1.56} {'loss': 0.4547, 'learning_rate': 2.28998714901144e-06, 'epoch': 1.56} {'loss': 0.4149, 'learning_rate': 2.2897786846918458e-06, 'epoch': 1.56} {'loss': 0.6991, 'learning_rate': 2.2895702286344544e-06, 'epoch': 1.56} {'loss': 0.5269, 'learning_rate': 2.289361780839482e-06, 'epoch': 1.56} {'loss': 0.5514, 'learning_rate': 2.289153341307154e-06, 'epoch': 1.56} {'loss': 0.4845, 'learning_rate': 2.288944910037695e-06, 'epoch': 1.56} {'loss': 0.488, 'learning_rate': 2.2887364870313268e-06, 'epoch': 1.56} {'loss': 0.5613, 'learning_rate': 2.288528072288276e-06, 'epoch': 1.56} {'loss': 0.4014, 'learning_rate': 2.288319665808759e-06, 'epoch': 1.56} {'loss': 0.5359, 'learning_rate': 2.2881112675930083e-06, 'epoch': 1.56} {'loss': 0.6433, 'learning_rate': 2.2879028776412394e-06, 'epoch': 1.56} {'loss': 0.5197, 'learning_rate': 2.2876944959536797e-06, 'epoch': 1.56} {'loss': 0.563, 'learning_rate': 2.287486122530552e-06, 'epoch': 1.56} {'loss': 0.5049, 'learning_rate': 2.287277757372075e-06, 'epoch': 1.56} {'loss': 0.5381, 'learning_rate': 2.287069400478482e-06, 'epoch': 1.56} {'loss': 0.6373, 'learning_rate': 2.2868610518499835e-06, 'epoch': 1.56} {'loss': 0.5159, 'learning_rate': 2.2866527114868162e-06, 'epoch': 1.56} {'loss': 0.6025, 'learning_rate': 2.2864443793891934e-06, 'epoch': 1.56} {'loss': 0.6454, 'learning_rate': 2.2862360555573416e-06, 'epoch': 1.56} {'loss': 0.5671, 'learning_rate': 2.2860277399914865e-06, 'epoch': 1.56} {'loss': 0.5269, 'learning_rate': 2.2858194326918438e-06, 'epoch': 1.56} {'loss': 0.4413, 'learning_rate': 2.285611133658647e-06, 'epoch': 1.56} {'loss': 0.544, 'learning_rate': 2.285402842892109e-06, 'epoch': 1.56} {'loss': 0.4922, 'learning_rate': 2.285194560392464e-06, 'epoch': 1.56} {'loss': 0.5849, 'learning_rate': 2.284986286159926e-06, 'epoch': 1.56} {'loss': 0.6093, 'learning_rate': 2.2847780201947223e-06, 'epoch': 1.56} {'loss': 0.4948, 'learning_rate': 2.2845697624970774e-06, 'epoch': 1.56} {'loss': 0.5684, 'learning_rate': 2.284361513067207e-06, 'epoch': 1.56} {'loss': 0.4411, 'learning_rate': 2.284153271905345e-06, 'epoch': 1.56} {'loss': 0.521, 'learning_rate': 2.2839450390117033e-06, 'epoch': 1.56} {'loss': 0.5594, 'learning_rate': 2.283736814386517e-06, 'epoch': 1.56} {'loss': 0.5374, 'learning_rate': 2.2835285980299994e-06, 'epoch': 1.56} {'loss': 0.5366, 'learning_rate': 2.2833203899423783e-06, 'epoch': 1.56} {'loss': 0.4356, 'learning_rate': 2.2831121901238783e-06, 'epoch': 1.56} {'loss': 0.45, 'learning_rate': 2.282903998574715e-06, 'epoch': 1.56} {'loss': 0.3867, 'learning_rate': 2.282695815295122e-06, 'epoch': 1.56} {'loss': 0.4348, 'learning_rate': 2.2824876402853114e-06, 'epoch': 1.56} {'loss': 0.5891, 'learning_rate': 2.282279473545517e-06, 'epoch': 1.56} {'loss': 0.538, 'learning_rate': 2.2820713150759542e-06, 'epoch': 1.56} {'loss': 0.6395, 'learning_rate': 2.2818631648768484e-06, 'epoch': 1.56} {'loss': 0.5804, 'learning_rate': 2.281655022948426e-06, 'epoch': 1.56} {'loss': 0.6229, 'learning_rate': 2.2814468892909004e-06, 'epoch': 1.56} {'loss': 0.7025, 'learning_rate': 2.2812387639045075e-06, 'epoch': 1.56} {'loss': 0.5912, 'learning_rate': 2.2810306467894617e-06, 'epoch': 1.56} {'loss': 0.585, 'learning_rate': 2.280822537945987e-06, 'epoch': 1.56} {'loss': 0.4412, 'learning_rate': 2.2806144373743077e-06, 'epoch': 1.56} {'loss': 0.463, 'learning_rate': 2.280406345074647e-06, 'epoch': 1.56} {'loss': 0.6198, 'learning_rate': 2.2801982610472316e-06, 'epoch': 1.56} {'loss': 0.5079, 'learning_rate': 2.2799901852922734e-06, 'epoch': 1.56} {'loss': 0.5279, 'learning_rate': 2.2797821178100087e-06, 'epoch': 1.56} {'loss': 0.4784, 'learning_rate': 2.279574058600651e-06, 'epoch': 1.56} {'loss': 0.547, 'learning_rate': 2.2793660076644277e-06, 'epoch': 1.56} {'loss': 0.4158, 'learning_rate': 2.2791579650015594e-06, 'epoch': 1.56} {'loss': 0.543, 'learning_rate': 2.278949930612271e-06, 'epoch': 1.56} {'loss': 0.5526, 'learning_rate': 2.2787419044967864e-06, 'epoch': 1.56} {'loss': 0.5652, 'learning_rate': 2.278533886655322e-06, 'epoch': 1.56} {'loss': 0.5512, 'learning_rate': 2.27832587708811e-06, 'epoch': 1.56} {'loss': 0.5845, 'learning_rate': 2.278117875795367e-06, 'epoch': 1.56} {'loss': 0.4649, 'learning_rate': 2.2779098827773174e-06, 'epoch': 1.56} {'loss': 0.5299, 'learning_rate': 2.2777018980341847e-06, 'epoch': 1.56} {'loss': 0.4676, 'learning_rate': 2.2774939215661908e-06, 'epoch': 1.56} {'loss': 0.5026, 'learning_rate': 2.2772859533735627e-06, 'epoch': 1.56} {'loss': 0.4443, 'learning_rate': 2.277077993456516e-06, 'epoch': 1.56} {'loss': 0.5151, 'learning_rate': 2.2768700418152766e-06, 'epoch': 1.56} {'loss': 0.4707, 'learning_rate': 2.2766620984500698e-06, 'epoch': 1.56} {'loss': 0.5333, 'learning_rate': 2.276454163361116e-06, 'epoch': 1.56} {'loss': 0.4355, 'learning_rate': 2.276246236548638e-06, 'epoch': 1.56} {'loss': 0.5426, 'learning_rate': 2.27603831801286e-06, 'epoch': 1.56} {'loss': 0.5412, 'learning_rate': 2.275830407754006e-06, 'epoch': 1.56} {'loss': 0.4604, 'learning_rate': 2.275622505772296e-06, 'epoch': 1.56} {'loss': 0.537, 'learning_rate': 2.2754146120679523e-06, 'epoch': 1.56} {'loss': 0.512, 'learning_rate': 2.2752067266411983e-06, 'epoch': 1.56} {'loss': 0.4911, 'learning_rate': 2.274998849492258e-06, 'epoch': 1.56} {'loss': 0.4412, 'learning_rate': 2.2747909806213543e-06, 'epoch': 1.56} {'loss': 0.5813, 'learning_rate': 2.2745831200287093e-06, 'epoch': 1.56} {'loss': 0.4513, 'learning_rate': 2.274375267714548e-06, 'epoch': 1.56} {'loss': 0.5492, 'learning_rate': 2.2741674236790878e-06, 'epoch': 1.56} {'loss': 0.5671, 'learning_rate': 2.273959587922555e-06, 'epoch': 1.56} {'loss': 0.6717, 'learning_rate': 2.273751760445172e-06, 'epoch': 1.56} {'loss': 0.5161, 'learning_rate': 2.2735439412471616e-06, 'epoch': 1.56} {'loss': 0.5324, 'learning_rate': 2.273336130328748e-06, 'epoch': 1.56} {'loss': 0.496, 'learning_rate': 2.2731283276901504e-06, 'epoch': 1.56} {'loss': 0.5, 'learning_rate': 2.2729205333315928e-06, 'epoch': 1.56} {'loss': 0.4638, 'learning_rate': 2.272712747253297e-06, 'epoch': 1.56} {'loss': 0.5515, 'learning_rate': 2.272504969455489e-06, 'epoch': 1.56} {'loss': 0.4784, 'learning_rate': 2.272297199938388e-06, 'epoch': 1.56} {'loss': 0.522, 'learning_rate': 2.2720894387022185e-06, 'epoch': 1.56} {'loss': 0.4577, 'learning_rate': 2.271881685747206e-06, 'epoch': 1.56} {'loss': 0.6835, 'learning_rate': 2.2716739410735657e-06, 'epoch': 1.56} {'loss': 0.6588, 'learning_rate': 2.271466204681525e-06, 'epoch': 1.56} {'loss': 0.5605, 'learning_rate': 2.2712584765713063e-06, 'epoch': 1.56} {'loss': 0.5077, 'learning_rate': 2.2710507567431306e-06, 'epoch': 1.56} {'loss': 0.5836, 'learning_rate': 2.270843045197222e-06, 'epoch': 1.56} {'loss': 0.5532, 'learning_rate': 2.2706353419338035e-06, 'epoch': 1.56} {'loss': 0.7481, 'learning_rate': 2.2704276469530984e-06, 'epoch': 1.56} {'loss': 0.4974, 'learning_rate': 2.2702199602553252e-06, 'epoch': 1.56} {'loss': 0.4983, 'learning_rate': 2.27001228184071e-06, 'epoch': 1.56} {'loss': 0.5524, 'learning_rate': 2.269804611709473e-06, 'epoch': 1.56} {'loss': 0.4089, 'learning_rate': 2.2695969498618388e-06, 'epoch': 1.56} {'loss': 0.4364, 'learning_rate': 2.269389296298029e-06, 'epoch': 1.56} {'loss': 0.6158, 'learning_rate': 2.2691816510182695e-06, 'epoch': 1.56} {'loss': 0.545, 'learning_rate': 2.268974014022777e-06, 'epoch': 1.56} {'loss': 0.5488, 'learning_rate': 2.268766385311776e-06, 'epoch': 1.56} {'loss': 0.5136, 'learning_rate': 2.268558764885489e-06, 'epoch': 1.56} {'loss': 0.5902, 'learning_rate': 2.2683511527441405e-06, 'epoch': 1.56} {'loss': 0.4328, 'learning_rate': 2.26814354888795e-06, 'epoch': 1.56} {'loss': 0.5984, 'learning_rate': 2.267935953317143e-06, 'epoch': 1.56} {'loss': 0.3769, 'learning_rate': 2.2677283660319426e-06, 'epoch': 1.56} {'loss': 0.4767, 'learning_rate': 2.2675207870325655e-06, 'epoch': 1.56} {'loss': 0.3404, 'learning_rate': 2.267313216319239e-06, 'epoch': 1.56} {'loss': 0.5753, 'learning_rate': 2.2671056538921844e-06, 'epoch': 1.56} {'loss': 0.6131, 'learning_rate': 2.2668980997516234e-06, 'epoch': 1.56} {'loss': 0.4909, 'learning_rate': 2.2666905538977814e-06, 'epoch': 1.56} {'loss': 0.4628, 'learning_rate': 2.2664830163308736e-06, 'epoch': 1.56} {'loss': 0.5489, 'learning_rate': 2.2662754870511328e-06, 'epoch': 1.56} {'loss': 0.4543, 'learning_rate': 2.2660679660587725e-06, 'epoch': 1.56} {'loss': 0.4354, 'learning_rate': 2.2658604533540197e-06, 'epoch': 1.56} {'loss': 0.6726, 'learning_rate': 2.2656529489370947e-06, 'epoch': 1.56} {'loss': 0.5318, 'learning_rate': 2.2654454528082203e-06, 'epoch': 1.56} {'loss': 0.4759, 'learning_rate': 2.2652379649676225e-06, 'epoch': 1.56} {'loss': 0.4815, 'learning_rate': 2.2650304854155136e-06, 'epoch': 1.56} {'loss': 0.518, 'learning_rate': 2.26482301415213e-06, 'epoch': 1.56} {'loss': 0.4793, 'learning_rate': 2.2646155511776826e-06, 'epoch': 1.56} {'loss': 0.5941, 'learning_rate': 2.2644080964923985e-06, 'epoch': 1.56} {'loss': 0.491, 'learning_rate': 2.2642006500964985e-06, 'epoch': 1.56} {'loss': 0.5409, 'learning_rate': 2.2639932119902064e-06, 'epoch': 1.56} {'loss': 0.5189, 'learning_rate': 2.2637857821737465e-06, 'epoch': 1.56} {'loss': 0.3942, 'learning_rate': 2.2635783606473327e-06, 'epoch': 1.56} {'loss': 0.5787, 'learning_rate': 2.2633709474111985e-06, 'epoch': 1.56} {'loss': 0.4996, 'learning_rate': 2.2631635424655576e-06, 'epoch': 1.56} {'loss': 0.5175, 'learning_rate': 2.2629561458106353e-06, 'epoch': 1.56} {'loss': 0.5291, 'learning_rate': 2.2627487574466567e-06, 'epoch': 1.56} {'loss': 0.5719, 'learning_rate': 2.262541377373836e-06, 'epoch': 1.56} {'loss': 0.6273, 'learning_rate': 2.262334005592406e-06, 'epoch': 1.56} {'loss': 0.7004, 'learning_rate': 2.262126642102578e-06, 'epoch': 1.56} {'loss': 0.4782, 'learning_rate': 2.2619192869045848e-06, 'epoch': 1.56} {'loss': 0.4836, 'learning_rate': 2.2617119399986397e-06, 'epoch': 1.56} {'loss': 0.5241, 'learning_rate': 2.2615046013849705e-06, 'epoch': 1.56} {'loss': 0.5436, 'learning_rate': 2.261297271063799e-06, 'epoch': 1.56} {'loss': 0.4673, 'learning_rate': 2.261089949035341e-06, 'epoch': 1.56} {'loss': 0.538, 'learning_rate': 2.2608826352998302e-06, 'epoch': 1.56} {'loss': 0.4615, 'learning_rate': 2.2606753298574747e-06, 'epoch': 1.56} {'loss': 0.538, 'learning_rate': 2.2604680327085116e-06, 'epoch': 1.56} {'loss': 0.4306, 'learning_rate': 2.260260743853151e-06, 'epoch': 1.56} {'loss': 0.5133, 'learning_rate': 2.2600534632916203e-06, 'epoch': 1.56} {'loss': 0.483, 'learning_rate': 2.259846191024144e-06, 'epoch': 1.56} {'loss': 0.4434, 'learning_rate': 2.2596389270509344e-06, 'epoch': 1.56} {'loss': 0.496, 'learning_rate': 2.2594316713722275e-06, 'epoch': 1.56} {'loss': 0.6182, 'learning_rate': 2.2592244239882343e-06, 'epoch': 1.56} {'loss': 0.7003, 'learning_rate': 2.2590171848991805e-06, 'epoch': 1.56} {'loss': 0.6412, 'learning_rate': 2.2588099541052898e-06, 'epoch': 1.56} {'loss': 0.4979, 'learning_rate': 2.2586027316067815e-06, 'epoch': 1.56} {'loss': 0.4987, 'learning_rate': 2.258395517403883e-06, 'epoch': 1.57} {'loss': 0.3431, 'learning_rate': 2.2581883114968063e-06, 'epoch': 1.57} {'loss': 0.6249, 'learning_rate': 2.2579811138857854e-06, 'epoch': 1.57} {'loss': 0.519, 'learning_rate': 2.257773924571033e-06, 'epoch': 1.57} {'loss': 0.5388, 'learning_rate': 2.257566743552775e-06, 'epoch': 1.57} {'loss': 0.3298, 'learning_rate': 2.2573595708312335e-06, 'epoch': 1.57} {'loss': 0.52, 'learning_rate': 2.2571524064066297e-06, 'epoch': 1.57} {'loss': 0.7013, 'learning_rate': 2.256945250279189e-06, 'epoch': 1.57} {'loss': 0.6285, 'learning_rate': 2.2567381024491243e-06, 'epoch': 1.57} {'loss': 0.5257, 'learning_rate': 2.2565309629166686e-06, 'epoch': 1.57} {'loss': 0.4276, 'learning_rate': 2.256323831682037e-06, 'epoch': 1.57} {'loss': 0.5052, 'learning_rate': 2.256116708745453e-06, 'epoch': 1.57} {'loss': 0.6608, 'learning_rate': 2.2559095941071418e-06, 'epoch': 1.57} {'loss': 0.4846, 'learning_rate': 2.255702487767317e-06, 'epoch': 1.57} {'loss': 0.5703, 'learning_rate': 2.2554953897262113e-06, 'epoch': 1.57} {'loss': 0.5469, 'learning_rate': 2.2552882999840353e-06, 'epoch': 1.57} {'loss': 0.5579, 'learning_rate': 2.2550812185410233e-06, 'epoch': 1.57} {'loss': 0.3495, 'learning_rate': 2.2548741453973875e-06, 'epoch': 1.57} {'loss': 0.35, 'learning_rate': 2.2546670805533533e-06, 'epoch': 1.57} {'loss': 0.4541, 'learning_rate': 2.254460024009145e-06, 'epoch': 1.57} {'loss': 0.3503, 'learning_rate': 2.2542529757649766e-06, 'epoch': 1.57} {'loss': 0.5385, 'learning_rate': 2.2540459358210797e-06, 'epoch': 1.57} {'loss': 0.5174, 'learning_rate': 2.2538389041776677e-06, 'epoch': 1.57} {'loss': 0.6643, 'learning_rate': 2.253631880834971e-06, 'epoch': 1.57} {'loss': 0.4651, 'learning_rate': 2.2534248657932046e-06, 'epoch': 1.57} {'loss': 0.4412, 'learning_rate': 2.2532178590525922e-06, 'epoch': 1.57} {'loss': 0.5333, 'learning_rate': 2.2530108606133593e-06, 'epoch': 1.57} {'loss': 0.4849, 'learning_rate': 2.2528038704757184e-06, 'epoch': 1.57} {'loss': 0.477, 'learning_rate': 2.252596888639903e-06, 'epoch': 1.57} {'loss': 0.5471, 'learning_rate': 2.2523899151061245e-06, 'epoch': 1.57} {'loss': 0.7176, 'learning_rate': 2.252182949874614e-06, 'epoch': 1.57} {'loss': 0.5135, 'learning_rate': 2.2519759929455864e-06, 'epoch': 1.57} {'loss': 0.5692, 'learning_rate': 2.2517690443192663e-06, 'epoch': 1.57} {'loss': 0.3233, 'learning_rate': 2.251562103995877e-06, 'epoch': 1.57} {'loss': 0.661, 'learning_rate': 2.251355171975633e-06, 'epoch': 1.57} {'loss': 0.534, 'learning_rate': 2.2511482482587678e-06, 'epoch': 1.57} {'loss': 0.4959, 'learning_rate': 2.250941332845492e-06, 'epoch': 1.57} {'loss': 0.4735, 'learning_rate': 2.2507344257360332e-06, 'epoch': 1.57} {'loss': 0.5699, 'learning_rate': 2.2505275269306114e-06, 'epoch': 1.57} {'loss': 0.4435, 'learning_rate': 2.2503206364294493e-06, 'epoch': 1.57} {'loss': 0.4491, 'learning_rate': 2.25011375423277e-06, 'epoch': 1.57} {'loss': 0.5637, 'learning_rate': 2.2499068803407887e-06, 'epoch': 1.57} {'loss': 0.5158, 'learning_rate': 2.2497000147537374e-06, 'epoch': 1.57} {'loss': 0.5776, 'learning_rate': 2.249493157471828e-06, 'epoch': 1.57} {'loss': 0.7183, 'learning_rate': 2.2492863084952865e-06, 'epoch': 1.57} {'loss': 0.4935, 'learning_rate': 2.2490794678243354e-06, 'epoch': 1.57} {'loss': 0.4943, 'learning_rate': 2.248872635459194e-06, 'epoch': 1.57} {'loss': 0.4372, 'learning_rate': 2.2486658114000883e-06, 'epoch': 1.57} {'loss': 0.606, 'learning_rate': 2.2484589956472346e-06, 'epoch': 1.57} {'loss': 0.3403, 'learning_rate': 2.2482521882008556e-06, 'epoch': 1.57} {'loss': 0.6016, 'learning_rate': 2.248045389061174e-06, 'epoch': 1.57} {'loss': 0.6075, 'learning_rate': 2.2478385982284125e-06, 'epoch': 1.57} {'loss': 0.6021, 'learning_rate': 2.247631815702791e-06, 'epoch': 1.57} {'loss': 0.6231, 'learning_rate': 2.247425041484532e-06, 'epoch': 1.57} {'loss': 0.5085, 'learning_rate': 2.247218275573859e-06, 'epoch': 1.57} {'loss': 0.5757, 'learning_rate': 2.2470115179709894e-06, 'epoch': 1.57} {'loss': 0.5087, 'learning_rate': 2.2468047686761463e-06, 'epoch': 1.57} {'loss': 0.5962, 'learning_rate': 2.2465980276895517e-06, 'epoch': 1.57} {'loss': 0.5247, 'learning_rate': 2.2463912950114274e-06, 'epoch': 1.57} {'loss': 0.7284, 'learning_rate': 2.2461845706419937e-06, 'epoch': 1.57} {'loss': 0.4747, 'learning_rate': 2.245977854581474e-06, 'epoch': 1.57} {'loss': 0.5406, 'learning_rate': 2.2457711468300913e-06, 'epoch': 1.57} {'loss': 0.5064, 'learning_rate': 2.2455644473880623e-06, 'epoch': 1.57} {'loss': 0.5692, 'learning_rate': 2.2453577562556093e-06, 'epoch': 1.57} {'loss': 0.592, 'learning_rate': 2.2451510734329575e-06, 'epoch': 1.57} {'loss': 0.5361, 'learning_rate': 2.2449443989203244e-06, 'epoch': 1.57} {'loss': 0.5995, 'learning_rate': 2.244737732717934e-06, 'epoch': 1.57} {'loss': 0.5373, 'learning_rate': 2.2445310748260106e-06, 'epoch': 1.57} {'loss': 0.68, 'learning_rate': 2.2443244252447695e-06, 'epoch': 1.57} {'loss': 0.5445, 'learning_rate': 2.244117783974433e-06, 'epoch': 1.57} {'loss': 0.5583, 'learning_rate': 2.2439111510152255e-06, 'epoch': 1.57} {'loss': 0.4871, 'learning_rate': 2.2437045263673674e-06, 'epoch': 1.57} {'loss': 0.4761, 'learning_rate': 2.2434979100310794e-06, 'epoch': 1.57} {'loss': 0.5456, 'learning_rate': 2.2432913020065838e-06, 'epoch': 1.57} {'loss': 0.4873, 'learning_rate': 2.243084702294105e-06, 'epoch': 1.57} {'loss': 0.5183, 'learning_rate': 2.2428781108938567e-06, 'epoch': 1.57} {'loss': 0.572, 'learning_rate': 2.242671527806066e-06, 'epoch': 1.57} {'loss': 0.6407, 'learning_rate': 2.2424649530309526e-06, 'epoch': 1.57} {'loss': 0.5742, 'learning_rate': 2.2422583865687375e-06, 'epoch': 1.57} {'loss': 0.6036, 'learning_rate': 2.2420518284196437e-06, 'epoch': 1.57} {'loss': 0.5586, 'learning_rate': 2.241845278583894e-06, 'epoch': 1.57} {'loss': 0.4305, 'learning_rate': 2.2416387370617043e-06, 'epoch': 1.57} {'loss': 0.544, 'learning_rate': 2.2414322038532987e-06, 'epoch': 1.57} {'loss': 0.4542, 'learning_rate': 2.2412256789588993e-06, 'epoch': 1.57} {'loss': 0.3849, 'learning_rate': 2.241019162378727e-06, 'epoch': 1.57} {'loss': 0.5221, 'learning_rate': 2.2408126541130016e-06, 'epoch': 1.57} {'loss': 0.4677, 'learning_rate': 2.2406061541619496e-06, 'epoch': 1.57} {'loss': 0.4368, 'learning_rate': 2.2403996625257864e-06, 'epoch': 1.57} {'loss': 0.3373, 'learning_rate': 2.240193179204734e-06, 'epoch': 1.57} {'loss': 0.613, 'learning_rate': 2.2399867041990153e-06, 'epoch': 1.57} {'loss': 0.5275, 'learning_rate': 2.2397802375088516e-06, 'epoch': 1.57} {'loss': 0.3947, 'learning_rate': 2.239573779134463e-06, 'epoch': 1.57} {'loss': 0.4744, 'learning_rate': 2.239367329076072e-06, 'epoch': 1.57} {'loss': 0.5943, 'learning_rate': 2.2391608873339023e-06, 'epoch': 1.57} {'loss': 0.4821, 'learning_rate': 2.2389544539081696e-06, 'epoch': 1.57} {'loss': 0.4885, 'learning_rate': 2.2387480287990972e-06, 'epoch': 1.57} {'loss': 0.4964, 'learning_rate': 2.238541612006907e-06, 'epoch': 1.57} {'loss': 0.387, 'learning_rate': 2.2383352035318195e-06, 'epoch': 1.57} {'loss': 0.6214, 'learning_rate': 2.238128803374058e-06, 'epoch': 1.57} {'loss': 0.6277, 'learning_rate': 2.2379224115338407e-06, 'epoch': 1.57} {'loss': 0.4731, 'learning_rate': 2.237716028011393e-06, 'epoch': 1.57} {'loss': 0.5436, 'learning_rate': 2.2375096528069294e-06, 'epoch': 1.57} {'loss': 0.548, 'learning_rate': 2.2373032859206766e-06, 'epoch': 1.57} {'loss': 0.4939, 'learning_rate': 2.2370969273528533e-06, 'epoch': 1.57} {'loss': 0.488, 'learning_rate': 2.236890577103681e-06, 'epoch': 1.57} {'loss': 0.497, 'learning_rate': 2.236684235173384e-06, 'epoch': 1.57} {'loss': 0.4483, 'learning_rate': 2.2364779015621752e-06, 'epoch': 1.57} {'loss': 0.5974, 'learning_rate': 2.236271576270286e-06, 'epoch': 1.57} {'loss': 0.46, 'learning_rate': 2.2360652592979302e-06, 'epoch': 1.57} {'loss': 0.5825, 'learning_rate': 2.235858950645331e-06, 'epoch': 1.57} {'loss': 0.5543, 'learning_rate': 2.2356526503127098e-06, 'epoch': 1.57} {'loss': 0.4559, 'learning_rate': 2.2354463583002885e-06, 'epoch': 1.57} {'loss': 0.5839, 'learning_rate': 2.235240074608288e-06, 'epoch': 1.57} {'loss': 0.4934, 'learning_rate': 2.235033799236924e-06, 'epoch': 1.57} {'loss': 0.4617, 'learning_rate': 2.2348275321864287e-06, 'epoch': 1.57} {'loss': 0.4675, 'learning_rate': 2.2346212734570125e-06, 'epoch': 1.57} {'loss': 0.4985, 'learning_rate': 2.2344150230489015e-06, 'epoch': 1.57} {'loss': 0.4376, 'learning_rate': 2.2342087809623148e-06, 'epoch': 1.57} {'loss': 0.668, 'learning_rate': 2.234002547197475e-06, 'epoch': 1.57} {'loss': 0.4319, 'learning_rate': 2.2337963217546045e-06, 'epoch': 1.57} {'loss': 0.5433, 'learning_rate': 2.233590104633916e-06, 'epoch': 1.57} {'loss': 0.3967, 'learning_rate': 2.2333838958356435e-06, 'epoch': 1.57} {'loss': 0.5332, 'learning_rate': 2.233177695359998e-06, 'epoch': 1.57} {'loss': 0.6306, 'learning_rate': 2.232971503207203e-06, 'epoch': 1.57} {'loss': 0.58, 'learning_rate': 2.2327653193774833e-06, 'epoch': 1.57} {'loss': 0.478, 'learning_rate': 2.2325591438710516e-06, 'epoch': 1.57} {'loss': 0.6144, 'learning_rate': 2.232352976688139e-06, 'epoch': 1.57} {'loss': 0.6577, 'learning_rate': 2.2321468178289552e-06, 'epoch': 1.57} {'loss': 0.3745, 'learning_rate': 2.231940667293733e-06, 'epoch': 1.57} {'loss': 0.6872, 'learning_rate': 2.2317345250826848e-06, 'epoch': 1.57} {'loss': 0.4917, 'learning_rate': 2.231528391196034e-06, 'epoch': 1.57} {'loss': 0.5252, 'learning_rate': 2.231322265634005e-06, 'epoch': 1.57} {'loss': 0.5382, 'learning_rate': 2.231116148396809e-06, 'epoch': 1.57} {'loss': 0.5491, 'learning_rate': 2.2309100394846792e-06, 'epoch': 1.57} {'loss': 0.4988, 'learning_rate': 2.230703938897826e-06, 'epoch': 1.57} {'loss': 0.5251, 'learning_rate': 2.230497846636479e-06, 'epoch': 1.57} {'loss': 0.5933, 'learning_rate': 2.2302917627008525e-06, 'epoch': 1.57} {'loss': 0.607, 'learning_rate': 2.230085687091169e-06, 'epoch': 1.57} {'loss': 0.5034, 'learning_rate': 2.2298796198076534e-06, 'epoch': 1.57} {'loss': 0.5495, 'learning_rate': 2.229673560850517e-06, 'epoch': 1.57} {'loss': 0.4909, 'learning_rate': 2.2294675102199923e-06, 'epoch': 1.57} {'loss': 0.3925, 'learning_rate': 2.2292614679162894e-06, 'epoch': 1.57} {'loss': 0.5892, 'learning_rate': 2.22905543393964e-06, 'epoch': 1.57} {'loss': 0.6279, 'learning_rate': 2.2288494082902556e-06, 'epoch': 1.57} {'loss': 0.5717, 'learning_rate': 2.2286433909683613e-06, 'epoch': 1.57} {'loss': 0.6111, 'learning_rate': 2.228437381974179e-06, 'epoch': 1.57} {'loss': 0.5179, 'learning_rate': 2.2282313813079227e-06, 'epoch': 1.57} {'loss': 0.3642, 'learning_rate': 2.228025388969822e-06, 'epoch': 1.57} {'loss': 0.3889, 'learning_rate': 2.227819404960092e-06, 'epoch': 1.57} {'loss': 0.5848, 'learning_rate': 2.227613429278954e-06, 'epoch': 1.57} {'loss': 0.4704, 'learning_rate': 2.2274074619266307e-06, 'epoch': 1.57} {'loss': 0.5573, 'learning_rate': 2.227201502903342e-06, 'epoch': 1.57} {'loss': 0.597, 'learning_rate': 2.22699555220931e-06, 'epoch': 1.57} {'loss': 0.3383, 'learning_rate': 2.2267896098447492e-06, 'epoch': 1.57} {'loss': 0.541, 'learning_rate': 2.2265836758098903e-06, 'epoch': 1.57} {'loss': 0.462, 'learning_rate': 2.2263777501049456e-06, 'epoch': 1.57} {'loss': 0.4587, 'learning_rate': 2.2261718327301397e-06, 'epoch': 1.57} {'loss': 0.4021, 'learning_rate': 2.225965923685691e-06, 'epoch': 1.57} {'loss': 0.5613, 'learning_rate': 2.2257600229718225e-06, 'epoch': 1.57} {'loss': 0.5027, 'learning_rate': 2.2255541305887563e-06, 'epoch': 1.57} {'loss': 0.3662, 'learning_rate': 2.2253482465367038e-06, 'epoch': 1.57} {'loss': 0.6029, 'learning_rate': 2.2251423708158992e-06, 'epoch': 1.57} {'loss': 0.4913, 'learning_rate': 2.2249365034265535e-06, 'epoch': 1.57} {'loss': 0.559, 'learning_rate': 2.22473064436889e-06, 'epoch': 1.57} {'loss': 0.5722, 'learning_rate': 2.2245247936431315e-06, 'epoch': 1.57} {'loss': 0.5435, 'learning_rate': 2.2243189512494913e-06, 'epoch': 1.57} {'loss': 0.4648, 'learning_rate': 2.2241131171882e-06, 'epoch': 1.57} {'loss': 0.5229, 'learning_rate': 2.2239072914594695e-06, 'epoch': 1.57} {'loss': 0.598, 'learning_rate': 2.2237014740635275e-06, 'epoch': 1.57} {'loss': 0.3816, 'learning_rate': 2.22349566500059e-06, 'epoch': 1.57} {'loss': 0.4028, 'learning_rate': 2.223289864270879e-06, 'epoch': 1.57} {'loss': 0.3923, 'learning_rate': 2.2230840718746173e-06, 'epoch': 1.57} {'loss': 0.5802, 'learning_rate': 2.222878287812017e-06, 'epoch': 1.57} {'loss': 0.5779, 'learning_rate': 2.2226725120833092e-06, 'epoch': 1.57} {'loss': 0.3874, 'learning_rate': 2.2224667446887085e-06, 'epoch': 1.57} {'loss': 0.6361, 'learning_rate': 2.222260985628436e-06, 'epoch': 1.57} {'loss': 0.4804, 'learning_rate': 2.2220552349027126e-06, 'epoch': 1.57} {'loss': 0.5515, 'learning_rate': 2.2218494925117595e-06, 'epoch': 1.57} {'loss': 0.5105, 'learning_rate': 2.221643758455799e-06, 'epoch': 1.57} {'loss': 0.2969, 'learning_rate': 2.2214380327350437e-06, 'epoch': 1.57} {'loss': 0.7, 'learning_rate': 2.2212323153497264e-06, 'epoch': 1.57} {'loss': 0.5067, 'learning_rate': 2.2210266063000565e-06, 'epoch': 1.57} {'loss': 0.4744, 'learning_rate': 2.2208209055862594e-06, 'epoch': 1.57} {'loss': 0.559, 'learning_rate': 2.2206152132085547e-06, 'epoch': 1.57} {'loss': 0.6678, 'learning_rate': 2.2204095291671625e-06, 'epoch': 1.57} {'loss': 0.4738, 'learning_rate': 2.220203853462307e-06, 'epoch': 1.57} {'loss': 0.3756, 'learning_rate': 2.2199981860942e-06, 'epoch': 1.57} {'loss': 0.4422, 'learning_rate': 2.2197925270630718e-06, 'epoch': 1.57} {'loss': 0.4671, 'learning_rate': 2.2195868763691354e-06, 'epoch': 1.57} {'loss': 0.4296, 'learning_rate': 2.2193812340126142e-06, 'epoch': 1.57} {'loss': 0.5745, 'learning_rate': 2.219175599993728e-06, 'epoch': 1.57} {'loss': 0.5222, 'learning_rate': 2.218969974312698e-06, 'epoch': 1.57} {'loss': 0.5251, 'learning_rate': 2.218764356969747e-06, 'epoch': 1.57} {'loss': 0.5464, 'learning_rate': 2.2185587479650884e-06, 'epoch': 1.57} {'loss': 0.6923, 'learning_rate': 2.2183531472989474e-06, 'epoch': 1.57} {'loss': 0.4335, 'learning_rate': 2.2181475549715425e-06, 'epoch': 1.57} {'loss': 0.6375, 'learning_rate': 2.217941970983095e-06, 'epoch': 1.57} {'loss': 0.387, 'learning_rate': 2.217736395333825e-06, 'epoch': 1.57} {'loss': 0.5613, 'learning_rate': 2.2175308280239536e-06, 'epoch': 1.57} {'loss': 0.3402, 'learning_rate': 2.2173252690537027e-06, 'epoch': 1.57} {'loss': 0.4883, 'learning_rate': 2.2171197184232874e-06, 'epoch': 1.57} {'loss': 0.3711, 'learning_rate': 2.2169141761329305e-06, 'epoch': 1.57} {'loss': 0.3708, 'learning_rate': 2.216708642182852e-06, 'epoch': 1.57} {'loss': 0.4837, 'learning_rate': 2.216503116573274e-06, 'epoch': 1.57} {'loss': 0.4584, 'learning_rate': 2.2162975993044145e-06, 'epoch': 1.57} {'loss': 0.538, 'learning_rate': 2.216092090376495e-06, 'epoch': 1.57} {'loss': 0.5412, 'learning_rate': 2.2158865897897386e-06, 'epoch': 1.57} {'loss': 0.5171, 'learning_rate': 2.2156810975443586e-06, 'epoch': 1.57} {'loss': 0.4512, 'learning_rate': 2.21547561364058e-06, 'epoch': 1.57} {'loss': 0.5879, 'learning_rate': 2.21527013807862e-06, 'epoch': 1.57} {'loss': 0.6211, 'learning_rate': 2.215064670858702e-06, 'epoch': 1.57} {'loss': 0.6067, 'learning_rate': 2.214859211981045e-06, 'epoch': 1.57} {'loss': 0.5609, 'learning_rate': 2.214653761445872e-06, 'epoch': 1.57} {'loss': 0.542, 'learning_rate': 2.2144483192533962e-06, 'epoch': 1.57} {'loss': 0.5218, 'learning_rate': 2.2142428854038424e-06, 'epoch': 1.57} {'loss': 0.5062, 'learning_rate': 2.21403745989743e-06, 'epoch': 1.57} {'loss': 0.5178, 'learning_rate': 2.2138320427343795e-06, 'epoch': 1.57} {'loss': 0.4377, 'learning_rate': 2.2136266339149106e-06, 'epoch': 1.57} {'loss': 0.4905, 'learning_rate': 2.2134212334392434e-06, 'epoch': 1.57} {'loss': 0.5915, 'learning_rate': 2.2132158413076e-06, 'epoch': 1.57} {'loss': 0.4154, 'learning_rate': 2.213010457520197e-06, 'epoch': 1.57} {'loss': 0.4597, 'learning_rate': 2.212805082077256e-06, 'epoch': 1.57} {'loss': 0.5003, 'learning_rate': 2.2125997149789967e-06, 'epoch': 1.57} {'loss': 0.6266, 'learning_rate': 2.21239435622564e-06, 'epoch': 1.57} {'loss': 0.4354, 'learning_rate': 2.212189005817409e-06, 'epoch': 1.57} {'loss': 0.5555, 'learning_rate': 2.2119836637545135e-06, 'epoch': 1.57} {'loss': 0.6024, 'learning_rate': 2.2117783300371865e-06, 'epoch': 1.57} {'loss': 0.432, 'learning_rate': 2.2115730046656405e-06, 'epoch': 1.57} {'loss': 0.5612, 'learning_rate': 2.2113676876400947e-06, 'epoch': 1.57} {'loss': 0.5604, 'learning_rate': 2.2111623789607727e-06, 'epoch': 1.57} {'loss': 0.5688, 'learning_rate': 2.2109570786278933e-06, 'epoch': 1.57} {'loss': 0.5125, 'learning_rate': 2.210751786641678e-06, 'epoch': 1.57} {'loss': 0.4787, 'learning_rate': 2.210546503002341e-06, 'epoch': 1.57} {'loss': 0.3736, 'learning_rate': 2.210341227710112e-06, 'epoch': 1.57} {'loss': 0.6005, 'learning_rate': 2.2101359607652018e-06, 'epoch': 1.57} {'loss': 0.5534, 'learning_rate': 2.209930702167834e-06, 'epoch': 1.57} {'loss': 0.6951, 'learning_rate': 2.2097254519182298e-06, 'epoch': 1.57} {'loss': 0.5624, 'learning_rate': 2.209520210016607e-06, 'epoch': 1.57} {'loss': 0.7465, 'learning_rate': 2.2093149764631892e-06, 'epoch': 1.57} {'loss': 0.541, 'learning_rate': 2.2091097512581905e-06, 'epoch': 1.57} {'loss': 0.7249, 'learning_rate': 2.2089045344018344e-06, 'epoch': 1.57} {'loss': 0.4728, 'learning_rate': 2.2086993258943403e-06, 'epoch': 1.57} {'loss': 0.491, 'learning_rate': 2.208494125735927e-06, 'epoch': 1.57} {'loss': 0.4973, 'learning_rate': 2.2082889339268197e-06, 'epoch': 1.57} {'loss': 0.5033, 'learning_rate': 2.208083750467227e-06, 'epoch': 1.57} {'loss': 0.5583, 'learning_rate': 2.2078785753573826e-06, 'epoch': 1.57} {'loss': 0.5545, 'learning_rate': 2.207673408597497e-06, 'epoch': 1.57} {'loss': 0.6356, 'learning_rate': 2.207468250187792e-06, 'epoch': 1.57} {'loss': 0.3801, 'learning_rate': 2.207263100128488e-06, 'epoch': 1.57} {'loss': 0.5726, 'learning_rate': 2.207057958419805e-06, 'epoch': 1.57} {'loss': 0.4909, 'learning_rate': 2.206852825061966e-06, 'epoch': 1.57} {'loss': 0.663, 'learning_rate': 2.2066477000551812e-06, 'epoch': 1.57} {'loss': 0.5959, 'learning_rate': 2.206442583399683e-06, 'epoch': 1.57} {'loss': 0.5652, 'learning_rate': 2.2062374750956815e-06, 'epoch': 1.57} {'loss': 0.4737, 'learning_rate': 2.206032375143401e-06, 'epoch': 1.57} {'loss': 0.4395, 'learning_rate': 2.2058272835430596e-06, 'epoch': 1.57} {'loss': 0.4035, 'learning_rate': 2.2056222002948778e-06, 'epoch': 1.57} {'loss': 0.4866, 'learning_rate': 2.2054171253990786e-06, 'epoch': 1.57} {'loss': 0.5091, 'learning_rate': 2.205212058855872e-06, 'epoch': 1.57} {'loss': 0.5422, 'learning_rate': 2.205007000665491e-06, 'epoch': 1.57} {'loss': 0.5549, 'learning_rate': 2.2048019508281447e-06, 'epoch': 1.57} {'loss': 0.5272, 'learning_rate': 2.204596909344057e-06, 'epoch': 1.57} {'loss': 0.5865, 'learning_rate': 2.2043918762134495e-06, 'epoch': 1.57} {'loss': 0.43, 'learning_rate': 2.204186851436535e-06, 'epoch': 1.57} {'loss': 0.6068, 'learning_rate': 2.2039818350135435e-06, 'epoch': 1.57} {'loss': 0.4242, 'learning_rate': 2.2037768269446823e-06, 'epoch': 1.57} {'loss': 0.601, 'learning_rate': 2.2035718272301854e-06, 'epoch': 1.57} {'loss': 0.5827, 'learning_rate': 2.2033668358702607e-06, 'epoch': 1.57} {'loss': 0.448, 'learning_rate': 2.2031618528651324e-06, 'epoch': 1.57} {'loss': 0.6162, 'learning_rate': 2.2029568782150223e-06, 'epoch': 1.57} {'loss': 0.439, 'learning_rate': 2.2027519119201434e-06, 'epoch': 1.57} {'loss': 0.5775, 'learning_rate': 2.2025469539807244e-06, 'epoch': 1.57} {'loss': 0.5642, 'learning_rate': 2.2023420043969734e-06, 'epoch': 1.57} {'loss': 0.5428, 'learning_rate': 2.202137063169124e-06, 'epoch': 1.57} {'loss': 0.3707, 'learning_rate': 2.201932130297385e-06, 'epoch': 1.57} {'loss': 0.5683, 'learning_rate': 2.2017272057819795e-06, 'epoch': 1.57} {'loss': 0.4326, 'learning_rate': 2.2015222896231302e-06, 'epoch': 1.57} {'loss': 0.4462, 'learning_rate': 2.2013173818210475e-06, 'epoch': 1.57} {'loss': 0.6002, 'learning_rate': 2.2011124823759634e-06, 'epoch': 1.57} {'loss': 0.5339, 'learning_rate': 2.200907591288085e-06, 'epoch': 1.57} {'loss': 0.4383, 'learning_rate': 2.2007027085576438e-06, 'epoch': 1.57} {'loss': 0.4136, 'learning_rate': 2.2004978341848517e-06, 'epoch': 1.57} {'loss': 0.5157, 'learning_rate': 2.200292968169929e-06, 'epoch': 1.57} {'loss': 0.578, 'learning_rate': 2.200088110513099e-06, 'epoch': 1.57} {'loss': 0.4718, 'learning_rate': 2.199883261214574e-06, 'epoch': 1.57} {'loss': 0.6802, 'learning_rate': 2.1996784202745826e-06, 'epoch': 1.57} {'loss': 0.6384, 'learning_rate': 2.199473587693335e-06, 'epoch': 1.57} {'loss': 0.4513, 'learning_rate': 2.1992687634710606e-06, 'epoch': 1.57} {'loss': 0.5028, 'learning_rate': 2.199063947607971e-06, 'epoch': 1.57} {'loss': 0.5344, 'learning_rate': 2.1988591401042882e-06, 'epoch': 1.57} {'loss': 0.5143, 'learning_rate': 2.1986543409602357e-06, 'epoch': 1.57} {'loss': 0.3634, 'learning_rate': 2.1984495501760227e-06, 'epoch': 1.57} {'loss': 0.4692, 'learning_rate': 2.1982447677518813e-06, 'epoch': 1.57} {'loss': 0.4704, 'learning_rate': 2.198039993688019e-06, 'epoch': 1.57} {'loss': 0.4898, 'learning_rate': 2.197835227984666e-06, 'epoch': 1.57} {'loss': 0.5755, 'learning_rate': 2.197630470642035e-06, 'epoch': 1.57} {'loss': 0.3769, 'learning_rate': 2.197425721660347e-06, 'epoch': 1.57} {'loss': 0.5572, 'learning_rate': 2.1972209810398238e-06, 'epoch': 1.57} {'loss': 0.3951, 'learning_rate': 2.1970162487806768e-06, 'epoch': 1.57} {'loss': 0.3865, 'learning_rate': 2.196811524883138e-06, 'epoch': 1.57} {'loss': 0.6292, 'learning_rate': 2.196606809347416e-06, 'epoch': 1.57} {'loss': 0.3631, 'learning_rate': 2.1964021021737337e-06, 'epoch': 1.57} {'loss': 0.4675, 'learning_rate': 2.1961974033623122e-06, 'epoch': 1.57} {'loss': 0.3836, 'learning_rate': 2.1959927129133684e-06, 'epoch': 1.57} {'loss': 0.4832, 'learning_rate': 2.195788030827126e-06, 'epoch': 1.57} {'loss': 0.5262, 'learning_rate': 2.1955833571037953e-06, 'epoch': 1.57} {'loss': 0.5891, 'learning_rate': 2.195378691743608e-06, 'epoch': 1.57} {'loss': 0.508, 'learning_rate': 2.1951740347467733e-06, 'epoch': 1.57} {'loss': 0.3878, 'learning_rate': 2.1949693861135137e-06, 'epoch': 1.57} {'loss': 0.5172, 'learning_rate': 2.194764745844049e-06, 'epoch': 1.57} {'loss': 0.5246, 'learning_rate': 2.1945601139385987e-06, 'epoch': 1.57} {'loss': 0.4671, 'learning_rate': 2.194355490397384e-06, 'epoch': 1.57} {'loss': 0.5333, 'learning_rate': 2.1941508752206198e-06, 'epoch': 1.57} {'loss': 0.5536, 'learning_rate': 2.1939462684085265e-06, 'epoch': 1.57} {'loss': 0.4573, 'learning_rate': 2.1937416699613258e-06, 'epoch': 1.57} {'loss': 0.5721, 'learning_rate': 2.1935370798792344e-06, 'epoch': 1.57} {'loss': 0.5327, 'learning_rate': 2.1933324981624725e-06, 'epoch': 1.57} {'loss': 0.3616, 'learning_rate': 2.19312792481126e-06, 'epoch': 1.57} {'loss': 0.3788, 'learning_rate': 2.192923359825818e-06, 'epoch': 1.57} {'loss': 0.4271, 'learning_rate': 2.192718803206361e-06, 'epoch': 1.57} {'loss': 0.5268, 'learning_rate': 2.19251425495311e-06, 'epoch': 1.57} {'loss': 0.5487, 'learning_rate': 2.192309715066284e-06, 'epoch': 1.57} {'loss': 0.5066, 'learning_rate': 2.1921051835461037e-06, 'epoch': 1.57} {'loss': 0.6053, 'learning_rate': 2.1919006603927895e-06, 'epoch': 1.57} {'loss': 0.4817, 'learning_rate': 2.191696145606553e-06, 'epoch': 1.57} {'loss': 0.5375, 'learning_rate': 2.191491639187625e-06, 'epoch': 1.57} {'loss': 0.4666, 'learning_rate': 2.191287141136216e-06, 'epoch': 1.57} {'loss': 0.5659, 'learning_rate': 2.1910826514525463e-06, 'epoch': 1.57} {'loss': 0.5741, 'learning_rate': 2.1908781701368376e-06, 'epoch': 1.57} {'loss': 0.3829, 'learning_rate': 2.190673697189307e-06, 'epoch': 1.57} {'loss': 0.5977, 'learning_rate': 2.1904692326101774e-06, 'epoch': 1.57} {'loss': 0.5897, 'learning_rate': 2.190264776399662e-06, 'epoch': 1.57} {'loss': 0.3743, 'learning_rate': 2.1900603285579826e-06, 'epoch': 1.57} {'loss': 0.4437, 'learning_rate': 2.1898558890853593e-06, 'epoch': 1.57} {'loss': 0.4905, 'learning_rate': 2.1896514579820093e-06, 'epoch': 1.57} {'loss': 0.5842, 'learning_rate': 2.1894470352481533e-06, 'epoch': 1.57} {'loss': 0.5558, 'learning_rate': 2.189242620884009e-06, 'epoch': 1.57} {'loss': 0.4407, 'learning_rate': 2.1890382148897993e-06, 'epoch': 1.57} {'loss': 0.4909, 'learning_rate': 2.1888338172657374e-06, 'epoch': 1.57} {'loss': 0.6338, 'learning_rate': 2.1886294280120458e-06, 'epoch': 1.57} {'loss': 0.4128, 'learning_rate': 2.1884250471289426e-06, 'epoch': 1.57} {'loss': 0.5572, 'learning_rate': 2.1882206746166467e-06, 'epoch': 1.57} {'loss': 0.5809, 'learning_rate': 2.188016310475377e-06, 'epoch': 1.57} {'loss': 0.6487, 'learning_rate': 2.1878119547053536e-06, 'epoch': 1.57} {'loss': 0.4759, 'learning_rate': 2.1876076073067964e-06, 'epoch': 1.57} {'loss': 0.3929, 'learning_rate': 2.1874032682799207e-06, 'epoch': 1.57} {'loss': 0.4552, 'learning_rate': 2.187198937624948e-06, 'epoch': 1.57} {'loss': 0.5595, 'learning_rate': 2.1869946153420963e-06, 'epoch': 1.57} {'loss': 0.4636, 'learning_rate': 2.186790301431585e-06, 'epoch': 1.57} {'loss': 0.5858, 'learning_rate': 2.186585995893633e-06, 'epoch': 1.57} {'loss': 0.5941, 'learning_rate': 2.1863816987284626e-06, 'epoch': 1.57} {'loss': 0.4039, 'learning_rate': 2.1861774099362865e-06, 'epoch': 1.57} {'loss': 0.4488, 'learning_rate': 2.185973129517326e-06, 'epoch': 1.57} {'loss': 0.5149, 'learning_rate': 2.1857688574718006e-06, 'epoch': 1.57} {'loss': 0.5342, 'learning_rate': 2.1855645937999304e-06, 'epoch': 1.57} {'loss': 0.6434, 'learning_rate': 2.1853603385019316e-06, 'epoch': 1.57} {'loss': 0.652, 'learning_rate': 2.1851560915780245e-06, 'epoch': 1.57} {'loss': 0.6576, 'learning_rate': 2.184951853028432e-06, 'epoch': 1.57} {'loss': 0.4893, 'learning_rate': 2.1847476228533647e-06, 'epoch': 1.57} {'loss': 0.6281, 'learning_rate': 2.1845434010530465e-06, 'epoch': 1.57} {'loss': 0.5137, 'learning_rate': 2.1843391876276954e-06, 'epoch': 1.57} {'loss': 0.5058, 'learning_rate': 2.1841349825775304e-06, 'epoch': 1.57} {'loss': 0.5049, 'learning_rate': 2.1839307859027704e-06, 'epoch': 1.57} {'loss': 0.6114, 'learning_rate': 2.1837265976036336e-06, 'epoch': 1.57} {'loss': 0.5388, 'learning_rate': 2.1835224176803418e-06, 'epoch': 1.57} {'loss': 0.5683, 'learning_rate': 2.1833182461331094e-06, 'epoch': 1.57} {'loss': 0.5565, 'learning_rate': 2.1831140829621557e-06, 'epoch': 1.57} {'loss': 0.5357, 'learning_rate': 2.1829099281677014e-06, 'epoch': 1.57} {'loss': 0.5679, 'learning_rate': 2.1827057817499642e-06, 'epoch': 1.57} {'loss': 0.4957, 'learning_rate': 2.182501643709166e-06, 'epoch': 1.57} {'loss': 0.5765, 'learning_rate': 2.182297514045518e-06, 'epoch': 1.57} {'loss': 0.6456, 'learning_rate': 2.182093392759249e-06, 'epoch': 1.57} {'loss': 0.4997, 'learning_rate': 2.181889279850571e-06, 'epoch': 1.57} {'loss': 0.5169, 'learning_rate': 2.1816851753197023e-06, 'epoch': 1.57} {'loss': 0.5243, 'learning_rate': 2.181481079166865e-06, 'epoch': 1.57} {'loss': 0.4048, 'learning_rate': 2.181276991392276e-06, 'epoch': 1.57} {'loss': 0.5905, 'learning_rate': 2.181072911996157e-06, 'epoch': 1.57} {'loss': 0.4145, 'learning_rate': 2.1808688409787184e-06, 'epoch': 1.57} {'loss': 0.4063, 'learning_rate': 2.18066477834019e-06, 'epoch': 1.57} {'loss': 0.5737, 'learning_rate': 2.1804607240807828e-06, 'epoch': 1.57} {'loss': 0.3997, 'learning_rate': 2.1802566782007175e-06, 'epoch': 1.57} {'loss': 0.689, 'learning_rate': 2.180052640700212e-06, 'epoch': 1.57} {'loss': 0.5556, 'learning_rate': 2.179848611579487e-06, 'epoch': 1.57} {'loss': 0.5654, 'learning_rate': 2.179644590838763e-06, 'epoch': 1.57} {'loss': 0.5298, 'learning_rate': 2.179440578478249e-06, 'epoch': 1.57} {'loss': 0.4931, 'learning_rate': 2.179236574498177e-06, 'epoch': 1.57} {'loss': 0.4949, 'learning_rate': 2.1790325788987554e-06, 'epoch': 1.57} {'loss': 0.5228, 'learning_rate': 2.1788285916802067e-06, 'epoch': 1.57} {'loss': 0.5246, 'learning_rate': 2.1786246128427513e-06, 'epoch': 1.57} {'loss': 0.5933, 'learning_rate': 2.1784206423866005e-06, 'epoch': 1.57} {'loss': 0.4202, 'learning_rate': 2.178216680311983e-06, 'epoch': 1.57} {'loss': 0.6424, 'learning_rate': 2.17801272661911e-06, 'epoch': 1.57} {'loss': 0.4204, 'learning_rate': 2.1778087813082015e-06, 'epoch': 1.57} {'loss': 0.3839, 'learning_rate': 2.1776048443794774e-06, 'epoch': 1.57} {'loss': 0.3439, 'learning_rate': 2.1774009158331553e-06, 'epoch': 1.57} {'loss': 0.4613, 'learning_rate': 2.1771969956694583e-06, 'epoch': 1.57} {'loss': 0.563, 'learning_rate': 2.1769930838885944e-06, 'epoch': 1.57} {'loss': 0.4833, 'learning_rate': 2.1767891804907935e-06, 'epoch': 1.57} {'loss': 0.4764, 'learning_rate': 2.176585285476267e-06, 'epoch': 1.57} {'loss': 0.5053, 'learning_rate': 2.1763813988452352e-06, 'epoch': 1.57} {'loss': 0.3511, 'learning_rate': 2.1761775205979174e-06, 'epoch': 1.57} {'loss': 0.3551, 'learning_rate': 2.175973650734531e-06, 'epoch': 1.57} {'loss': 0.5766, 'learning_rate': 2.1757697892552974e-06, 'epoch': 1.57} {'loss': 0.4913, 'learning_rate': 2.1755659361604277e-06, 'epoch': 1.57} {'loss': 0.6626, 'learning_rate': 2.1753620914501503e-06, 'epoch': 1.57} {'loss': 0.5766, 'learning_rate': 2.1751582551246763e-06, 'epoch': 1.57} {'loss': 0.4398, 'learning_rate': 2.174954427184226e-06, 'epoch': 1.57} {'loss': 0.3977, 'learning_rate': 2.1747506076290215e-06, 'epoch': 1.57} {'loss': 0.4179, 'learning_rate': 2.1745467964592727e-06, 'epoch': 1.57} {'loss': 0.4847, 'learning_rate': 2.174342993675209e-06, 'epoch': 1.57} {'loss': 0.563, 'learning_rate': 2.1741391992770366e-06, 'epoch': 1.57} {'loss': 0.5925, 'learning_rate': 2.173935413264987e-06, 'epoch': 1.57} {'loss': 0.456, 'learning_rate': 2.1737316356392678e-06, 'epoch': 1.57} {'loss': 0.5251, 'learning_rate': 2.1735278664001025e-06, 'epoch': 1.57} {'loss': 0.398, 'learning_rate': 2.1733241055477115e-06, 'epoch': 1.57} {'loss': 0.4071, 'learning_rate': 2.173120353082304e-06, 'epoch': 1.57} {'loss': 0.3871, 'learning_rate': 2.17291660900411e-06, 'epoch': 1.57} {'loss': 0.458, 'learning_rate': 2.1727128733133374e-06, 'epoch': 1.57} {'loss': 0.5845, 'learning_rate': 2.1725091460102143e-06, 'epoch': 1.57} {'loss': 0.5001, 'learning_rate': 2.1723054270949505e-06, 'epoch': 1.57} {'loss': 0.5737, 'learning_rate': 2.1721017165677694e-06, 'epoch': 1.57} {'loss': 0.444, 'learning_rate': 2.17189801442889e-06, 'epoch': 1.57} {'loss': 0.5007, 'learning_rate': 2.1716943206785234e-06, 'epoch': 1.57} {'loss': 0.5092, 'learning_rate': 2.1714906353168974e-06, 'epoch': 1.57} {'loss': 0.5019, 'learning_rate': 2.171286958344221e-06, 'epoch': 1.57} {'loss': 0.5337, 'learning_rate': 2.1710832897607225e-06, 'epoch': 1.57} {'loss': 0.414, 'learning_rate': 2.1708796295666125e-06, 'epoch': 1.57} {'loss': 0.7185, 'learning_rate': 2.170675977762111e-06, 'epoch': 1.57} {'loss': 0.4429, 'learning_rate': 2.17047233434744e-06, 'epoch': 1.57} {'loss': 0.5802, 'learning_rate': 2.1702686993228083e-06, 'epoch': 1.57} {'loss': 0.562, 'learning_rate': 2.1700650726884478e-06, 'epoch': 1.57} {'loss': 0.4677, 'learning_rate': 2.1698614544445618e-06, 'epoch': 1.57} {'loss': 0.5492, 'learning_rate': 2.169657844591382e-06, 'epoch': 1.57} {'loss': 0.5131, 'learning_rate': 2.1694542431291178e-06, 'epoch': 1.57} {'loss': 0.4567, 'learning_rate': 2.16925065005799e-06, 'epoch': 1.57} {'loss': 0.4971, 'learning_rate': 2.1690470653782204e-06, 'epoch': 1.57} {'loss': 0.5027, 'learning_rate': 2.168843489090018e-06, 'epoch': 1.57} {'loss': 0.3837, 'learning_rate': 2.1686399211936116e-06, 'epoch': 1.57} {'loss': 0.456, 'learning_rate': 2.168436361689211e-06, 'epoch': 1.57} {'loss': 0.5175, 'learning_rate': 2.168232810577039e-06, 'epoch': 1.57} {'loss': 0.5023, 'learning_rate': 2.168029267857311e-06, 'epoch': 1.57} {'loss': 0.4125, 'learning_rate': 2.1678257335302476e-06, 'epoch': 1.57} {'loss': 0.5315, 'learning_rate': 2.1676222075960685e-06, 'epoch': 1.57} {'loss': 0.4421, 'learning_rate': 2.167418690054983e-06, 'epoch': 1.57} {'loss': 0.3794, 'learning_rate': 2.1672151809072216e-06, 'epoch': 1.57} {'loss': 0.4859, 'learning_rate': 2.167011680152993e-06, 'epoch': 1.57} {'loss': 0.4842, 'learning_rate': 2.1668081877925186e-06, 'epoch': 1.57} {'loss': 0.5104, 'learning_rate': 2.166604703826015e-06, 'epoch': 1.57} {'loss': 0.5039, 'learning_rate': 2.166401228253703e-06, 'epoch': 1.57} {'loss': 0.5237, 'learning_rate': 2.1661977610758013e-06, 'epoch': 1.57} {'loss': 0.4097, 'learning_rate': 2.1659943022925203e-06, 'epoch': 1.57} {'loss': 0.4626, 'learning_rate': 2.165790851904089e-06, 'epoch': 1.57} {'loss': 0.4223, 'learning_rate': 2.1655874099107167e-06, 'epoch': 1.57} {'loss': 0.3586, 'learning_rate': 2.165383976312625e-06, 'epoch': 1.57} {'loss': 0.6534, 'learning_rate': 2.165180551110031e-06, 'epoch': 1.57} {'loss': 0.6254, 'learning_rate': 2.1649771343031547e-06, 'epoch': 1.57} {'loss': 0.5016, 'learning_rate': 2.164773725892213e-06, 'epoch': 1.57} {'loss': 0.613, 'learning_rate': 2.164570325877422e-06, 'epoch': 1.57} {'loss': 0.411, 'learning_rate': 2.164366934259001e-06, 'epoch': 1.57} {'loss': 0.4438, 'learning_rate': 2.1641635510371682e-06, 'epoch': 1.57} {'loss': 0.4266, 'learning_rate': 2.163960176212141e-06, 'epoch': 1.57} {'loss': 0.6694, 'learning_rate': 2.1637568097841376e-06, 'epoch': 1.57} {'loss': 0.413, 'learning_rate': 2.1635534517533775e-06, 'epoch': 1.57} {'loss': 0.5612, 'learning_rate': 2.1633501021200775e-06, 'epoch': 1.57} {'loss': 0.5735, 'learning_rate': 2.1631467608844547e-06, 'epoch': 1.57} {'loss': 0.5797, 'learning_rate': 2.1629434280467254e-06, 'epoch': 1.57} {'loss': 0.5823, 'learning_rate': 2.1627401036071117e-06, 'epoch': 1.57} {'loss': 0.3857, 'learning_rate': 2.1625367875658275e-06, 'epoch': 1.57} {'loss': 0.5393, 'learning_rate': 2.162333479923093e-06, 'epoch': 1.57} {'loss': 0.4999, 'learning_rate': 2.1621301806791263e-06, 'epoch': 1.57} {'loss': 0.574, 'learning_rate': 2.1619268898341462e-06, 'epoch': 1.57} {'loss': 0.5683, 'learning_rate': 2.1617236073883673e-06, 'epoch': 1.57} {'loss': 0.5625, 'learning_rate': 2.1615203333420077e-06, 'epoch': 1.57} {'loss': 0.4554, 'learning_rate': 2.1613170676952876e-06, 'epoch': 1.57} {'loss': 0.4617, 'learning_rate': 2.161113810448423e-06, 'epoch': 1.57} {'loss': 0.4597, 'learning_rate': 2.1609105616016335e-06, 'epoch': 1.57} {'loss': 0.3771, 'learning_rate': 2.1607073211551376e-06, 'epoch': 1.57} {'loss': 0.6685, 'learning_rate': 2.160504089109149e-06, 'epoch': 1.57} {'loss': 0.6988, 'learning_rate': 2.160300865463888e-06, 'epoch': 1.57} {'loss': 0.4902, 'learning_rate': 2.1600976502195713e-06, 'epoch': 1.57} {'loss': 0.4031, 'learning_rate': 2.1598944433764178e-06, 'epoch': 1.57} {'loss': 0.6208, 'learning_rate': 2.1596912449346465e-06, 'epoch': 1.58} {'loss': 0.541, 'learning_rate': 2.159488054894475e-06, 'epoch': 1.58} {'loss': 0.428, 'learning_rate': 2.159284873256117e-06, 'epoch': 1.58} {'loss': 0.4268, 'learning_rate': 2.159081700019794e-06, 'epoch': 1.58} {'loss': 0.4013, 'learning_rate': 2.1588785351857212e-06, 'epoch': 1.58} {'loss': 0.3591, 'learning_rate': 2.158675378754118e-06, 'epoch': 1.58} {'loss': 0.5377, 'learning_rate': 2.1584722307252025e-06, 'epoch': 1.58} {'loss': 0.5848, 'learning_rate': 2.1582690910991943e-06, 'epoch': 1.58} {'loss': 0.4662, 'learning_rate': 2.1580659598763056e-06, 'epoch': 1.58} {'loss': 0.4636, 'learning_rate': 2.157862837056758e-06, 'epoch': 1.58} {'loss': 0.4268, 'learning_rate': 2.1576597226407668e-06, 'epoch': 1.58} {'loss': 0.5143, 'learning_rate': 2.1574566166285517e-06, 'epoch': 1.58} {'loss': 0.4899, 'learning_rate': 2.1572535190203294e-06, 'epoch': 1.58} {'loss': 0.5549, 'learning_rate': 2.1570504298163176e-06, 'epoch': 1.58} {'loss': 0.4988, 'learning_rate': 2.1568473490167373e-06, 'epoch': 1.58} {'loss': 0.3991, 'learning_rate': 2.1566442766218e-06, 'epoch': 1.58} {'loss': 0.5422, 'learning_rate': 2.1564412126317267e-06, 'epoch': 1.58} {'loss': 0.4227, 'learning_rate': 2.156238157046734e-06, 'epoch': 1.58} {'loss': 0.5421, 'learning_rate': 2.1560351098670407e-06, 'epoch': 1.58} {'loss': 0.3821, 'learning_rate': 2.1558320710928625e-06, 'epoch': 1.58} {'loss': 0.5164, 'learning_rate': 2.1556290407244195e-06, 'epoch': 1.58} {'loss': 0.6509, 'learning_rate': 2.15542601876193e-06, 'epoch': 1.58} {'loss': 0.4402, 'learning_rate': 2.155223005205608e-06, 'epoch': 1.58} {'loss': 0.346, 'learning_rate': 2.155020000055671e-06, 'epoch': 1.58} {'loss': 0.6211, 'learning_rate': 2.1548170033123384e-06, 'epoch': 1.58} {'loss': 0.5639, 'learning_rate': 2.1546140149758276e-06, 'epoch': 1.58} {'loss': 0.4503, 'learning_rate': 2.1544110350463598e-06, 'epoch': 1.58} {'loss': 0.4559, 'learning_rate': 2.1542080635241425e-06, 'epoch': 1.58} {'loss': 0.5852, 'learning_rate': 2.1540051004094044e-06, 'epoch': 1.58} {'loss': 0.386, 'learning_rate': 2.153802145702355e-06, 'epoch': 1.58} {'loss': 0.4732, 'learning_rate': 2.153599199403216e-06, 'epoch': 1.58} {'loss': 0.5437, 'learning_rate': 2.153396261512203e-06, 'epoch': 1.58} {'loss': 0.5843, 'learning_rate': 2.153193332029534e-06, 'epoch': 1.58} {'loss': 0.491, 'learning_rate': 2.1529904109554287e-06, 'epoch': 1.58} {'loss': 0.5403, 'learning_rate': 2.1527874982900975e-06, 'epoch': 1.58} {'loss': 0.5161, 'learning_rate': 2.152584594033769e-06, 'epoch': 1.58} {'loss': 0.4063, 'learning_rate': 2.1523816981866507e-06, 'epoch': 1.58} {'loss': 0.5178, 'learning_rate': 2.152178810748964e-06, 'epoch': 1.58} {'loss': 0.49, 'learning_rate': 2.1519759317209253e-06, 'epoch': 1.58} {'loss': 0.4762, 'learning_rate': 2.1517730611027543e-06, 'epoch': 1.58} {'loss': 0.5231, 'learning_rate': 2.151570198894668e-06, 'epoch': 1.58} {'loss': 0.4491, 'learning_rate': 2.1513673450968784e-06, 'epoch': 1.58} {'loss': 0.6287, 'learning_rate': 2.1511644997096115e-06, 'epoch': 1.58} {'loss': 0.5677, 'learning_rate': 2.1509616627330777e-06, 'epoch': 1.58} {'loss': 0.5029, 'learning_rate': 2.150758834167498e-06, 'epoch': 1.58} {'loss': 0.4847, 'learning_rate': 2.1505560140130897e-06, 'epoch': 1.58} {'loss': 0.3395, 'learning_rate': 2.1503532022700647e-06, 'epoch': 1.58} {'loss': 0.4592, 'learning_rate': 2.1501503989386498e-06, 'epoch': 1.58} {'loss': 0.7025, 'learning_rate': 2.1499476040190513e-06, 'epoch': 1.58} {'loss': 0.563, 'learning_rate': 2.149744817511499e-06, 'epoch': 1.58} {'loss': 0.6142, 'learning_rate': 2.1495420394162003e-06, 'epoch': 1.58} {'loss': 0.573, 'learning_rate': 2.149339269733376e-06, 'epoch': 1.58} {'loss': 0.5491, 'learning_rate': 2.1491365084632463e-06, 'epoch': 1.58} {'loss': 0.5644, 'learning_rate': 2.1489337556060195e-06, 'epoch': 1.58} {'loss': 0.5053, 'learning_rate': 2.148731011161924e-06, 'epoch': 1.58} {'loss': 0.5094, 'learning_rate': 2.1485282751311665e-06, 'epoch': 1.58} {'loss': 0.6375, 'learning_rate': 2.1483255475139752e-06, 'epoch': 1.58} {'loss': 0.3864, 'learning_rate': 2.148122828310559e-06, 'epoch': 1.58} {'loss': 0.3642, 'learning_rate': 2.1479201175211385e-06, 'epoch': 1.58} {'loss': 0.4239, 'learning_rate': 2.1477174151459323e-06, 'epoch': 1.58} {'loss': 0.4075, 'learning_rate': 2.14751472118515e-06, 'epoch': 1.58} {'loss': 0.493, 'learning_rate': 2.147312035639021e-06, 'epoch': 1.58} {'loss': 0.6184, 'learning_rate': 2.1471093585077497e-06, 'epoch': 1.58} {'loss': 0.6241, 'learning_rate': 2.1469066897915647e-06, 'epoch': 1.58} {'loss': 0.5731, 'learning_rate': 2.146704029490675e-06, 'epoch': 1.58} {'loss': 0.3843, 'learning_rate': 2.146501377605301e-06, 'epoch': 1.58} {'loss': 0.4652, 'learning_rate': 2.1462987341356624e-06, 'epoch': 1.58} {'loss': 0.5072, 'learning_rate': 2.146096099081968e-06, 'epoch': 1.58} {'loss': 0.525, 'learning_rate': 2.1458934724444468e-06, 'epoch': 1.58} {'loss': 0.4362, 'learning_rate': 2.1456908542233055e-06, 'epoch': 1.58} {'loss': 0.5587, 'learning_rate': 2.1454882444187665e-06, 'epoch': 1.58} {'loss': 0.5044, 'learning_rate': 2.145285643031045e-06, 'epoch': 1.58} {'loss': 0.4987, 'learning_rate': 2.1450830500603593e-06, 'epoch': 1.58} {'loss': 0.38, 'learning_rate': 2.1448804655069286e-06, 'epoch': 1.58} {'loss': 0.5551, 'learning_rate': 2.144677889370962e-06, 'epoch': 1.58} {'loss': 0.5165, 'learning_rate': 2.144475321652688e-06, 'epoch': 1.58} {'loss': 0.5165, 'learning_rate': 2.144272762352314e-06, 'epoch': 1.58} {'loss': 0.527, 'learning_rate': 2.1440702114700618e-06, 'epoch': 1.58} {'loss': 0.4334, 'learning_rate': 2.1438676690061468e-06, 'epoch': 1.58} {'loss': 0.3874, 'learning_rate': 2.1436651349607864e-06, 'epoch': 1.58} {'loss': 0.4294, 'learning_rate': 2.1434626093342016e-06, 'epoch': 1.58} {'loss': 0.4165, 'learning_rate': 2.1432600921265988e-06, 'epoch': 1.58} {'loss': 0.5448, 'learning_rate': 2.1430575833382082e-06, 'epoch': 1.58} {'loss': 0.5496, 'learning_rate': 2.1428550829692375e-06, 'epoch': 1.58} {'loss': 0.5746, 'learning_rate': 2.142652591019907e-06, 'epoch': 1.58} {'loss': 0.566, 'learning_rate': 2.142450107490437e-06, 'epoch': 1.58} {'loss': 0.4938, 'learning_rate': 2.1422476323810335e-06, 'epoch': 1.58} {'loss': 0.6094, 'learning_rate': 2.1420451656919283e-06, 'epoch': 1.58} {'loss': 0.6229, 'learning_rate': 2.1418427074233238e-06, 'epoch': 1.58} {'loss': 0.525, 'learning_rate': 2.1416402575754515e-06, 'epoch': 1.58} {'loss': 0.4585, 'learning_rate': 2.141437816148516e-06, 'epoch': 1.58} {'loss': 0.4918, 'learning_rate': 2.1412353831427404e-06, 'epoch': 1.58} {'loss': 0.5009, 'learning_rate': 2.141032958558343e-06, 'epoch': 1.58} {'loss': 0.3504, 'learning_rate': 2.140830542395532e-06, 'epoch': 1.58} {'loss': 0.4932, 'learning_rate': 2.1406281346545367e-06, 'epoch': 1.58} {'loss': 0.5518, 'learning_rate': 2.140425735335565e-06, 'epoch': 1.58} {'loss': 0.7759, 'learning_rate': 2.1402233444388366e-06, 'epoch': 1.58} {'loss': 0.5395, 'learning_rate': 2.140020961964567e-06, 'epoch': 1.58} {'loss': 0.4742, 'learning_rate': 2.1398185879129753e-06, 'epoch': 1.58} {'loss': 0.5472, 'learning_rate': 2.1396162222842808e-06, 'epoch': 1.58} {'loss': 0.5037, 'learning_rate': 2.13941386507869e-06, 'epoch': 1.58} {'loss': 0.3169, 'learning_rate': 2.139211516296433e-06, 'epoch': 1.58} {'loss': 0.5172, 'learning_rate': 2.1390091759377173e-06, 'epoch': 1.58} {'loss': 0.4885, 'learning_rate': 2.138806844002763e-06, 'epoch': 1.58} {'loss': 0.5806, 'learning_rate': 2.138604520491787e-06, 'epoch': 1.58} {'loss': 0.4462, 'learning_rate': 2.138402205405006e-06, 'epoch': 1.58} {'loss': 0.6276, 'learning_rate': 2.138199898742638e-06, 'epoch': 1.58} {'loss': 0.5519, 'learning_rate': 2.137997600504894e-06, 'epoch': 1.58} {'loss': 0.5021, 'learning_rate': 2.1377953106920003e-06, 'epoch': 1.58} {'loss': 0.5503, 'learning_rate': 2.137593029304166e-06, 'epoch': 1.58} {'loss': 0.5319, 'learning_rate': 2.1373907563416097e-06, 'epoch': 1.58} {'loss': 0.6773, 'learning_rate': 2.1371884918045495e-06, 'epoch': 1.58} {'loss': 0.4627, 'learning_rate': 2.1369862356932014e-06, 'epoch': 1.58} {'loss': 0.6625, 'learning_rate': 2.1367839880077855e-06, 'epoch': 1.58} {'loss': 0.4877, 'learning_rate': 2.136581748748512e-06, 'epoch': 1.58} {'loss': 0.4466, 'learning_rate': 2.1363795179156e-06, 'epoch': 1.58} {'loss': 0.5402, 'learning_rate': 2.1361772955092687e-06, 'epoch': 1.58} {'loss': 0.5623, 'learning_rate': 2.135975081529732e-06, 'epoch': 1.58} {'loss': 0.3719, 'learning_rate': 2.135772875977208e-06, 'epoch': 1.58} {'loss': 0.5752, 'learning_rate': 2.1355706788519136e-06, 'epoch': 1.58} {'loss': 0.5607, 'learning_rate': 2.1353684901540674e-06, 'epoch': 1.58} {'loss': 0.2651, 'learning_rate': 2.1351663098838806e-06, 'epoch': 1.58} {'loss': 0.5661, 'learning_rate': 2.134964138041574e-06, 'epoch': 1.58} {'loss': 0.2868, 'learning_rate': 2.134761974627362e-06, 'epoch': 1.58} {'loss': 0.4343, 'learning_rate': 2.134559819641463e-06, 'epoch': 1.58} {'loss': 0.4678, 'learning_rate': 2.134357673084093e-06, 'epoch': 1.58} {'loss': 0.5422, 'learning_rate': 2.134155534955469e-06, 'epoch': 1.58} {'loss': 0.5276, 'learning_rate': 2.1339534052558095e-06, 'epoch': 1.58} {'loss': 0.3634, 'learning_rate': 2.133751283985327e-06, 'epoch': 1.58} {'loss': 0.4958, 'learning_rate': 2.1335491711442393e-06, 'epoch': 1.58} {'loss': 0.4408, 'learning_rate': 2.1333470667327638e-06, 'epoch': 1.58} {'loss': 0.5168, 'learning_rate': 2.1331449707511164e-06, 'epoch': 1.58} {'loss': 0.579, 'learning_rate': 2.1329428831995146e-06, 'epoch': 1.58} {'loss': 0.5658, 'learning_rate': 2.132740804078177e-06, 'epoch': 1.58} {'loss': 0.5241, 'learning_rate': 2.132538733387316e-06, 'epoch': 1.58} {'loss': 0.6617, 'learning_rate': 2.1323366711271486e-06, 'epoch': 1.58} {'loss': 0.5402, 'learning_rate': 2.132134617297893e-06, 'epoch': 1.58} {'loss': 0.4478, 'learning_rate': 2.1319325718997654e-06, 'epoch': 1.58} {'loss': 0.7618, 'learning_rate': 2.131730534932982e-06, 'epoch': 1.58} {'loss': 0.529, 'learning_rate': 2.1315285063977596e-06, 'epoch': 1.58} {'loss': 0.6325, 'learning_rate': 2.1313264862943172e-06, 'epoch': 1.58} {'loss': 0.5417, 'learning_rate': 2.1311244746228664e-06, 'epoch': 1.58} {'loss': 0.3547, 'learning_rate': 2.130922471383625e-06, 'epoch': 1.58} {'loss': 0.5142, 'learning_rate': 2.1307204765768107e-06, 'epoch': 1.58} {'loss': 0.579, 'learning_rate': 2.130518490202641e-06, 'epoch': 1.58} {'loss': 0.6274, 'learning_rate': 2.130316512261329e-06, 'epoch': 1.58} {'loss': 0.4887, 'learning_rate': 2.1301145427530946e-06, 'epoch': 1.58} {'loss': 0.5876, 'learning_rate': 2.1299125816781553e-06, 'epoch': 1.58} {'loss': 0.7108, 'learning_rate': 2.129710629036722e-06, 'epoch': 1.58} {'loss': 0.3334, 'learning_rate': 2.1295086848290134e-06, 'epoch': 1.58} {'loss': 0.4496, 'learning_rate': 2.1293067490552476e-06, 'epoch': 1.58} {'loss': 0.6487, 'learning_rate': 2.1291048217156396e-06, 'epoch': 1.58} {'loss': 0.2918, 'learning_rate': 2.128902902810409e-06, 'epoch': 1.58} {'loss': 0.4275, 'learning_rate': 2.128700992339766e-06, 'epoch': 1.58} {'loss': 0.5332, 'learning_rate': 2.1284990903039314e-06, 'epoch': 1.58} {'loss': 0.5473, 'learning_rate': 2.1282971967031195e-06, 'epoch': 1.58} {'loss': 0.6014, 'learning_rate': 2.128095311537548e-06, 'epoch': 1.58} {'loss': 0.5186, 'learning_rate': 2.127893434807433e-06, 'epoch': 1.58} {'loss': 0.5779, 'learning_rate': 2.1276915665129903e-06, 'epoch': 1.58} {'loss': 0.5194, 'learning_rate': 2.1274897066544398e-06, 'epoch': 1.58} {'loss': 0.5833, 'learning_rate': 2.127287855231992e-06, 'epoch': 1.58} {'loss': 0.4471, 'learning_rate': 2.1270860122458657e-06, 'epoch': 1.58} {'loss': 0.4615, 'learning_rate': 2.1268841776962768e-06, 'epoch': 1.58} {'loss': 0.4097, 'learning_rate': 2.126682351583442e-06, 'epoch': 1.58} {'loss': 0.428, 'learning_rate': 2.1264805339075788e-06, 'epoch': 1.58} {'loss': 0.5041, 'learning_rate': 2.126278724668901e-06, 'epoch': 1.58} {'loss': 0.502, 'learning_rate': 2.1260769238676304e-06, 'epoch': 1.58} {'loss': 0.4906, 'learning_rate': 2.125875131503975e-06, 'epoch': 1.58} {'loss': 0.5394, 'learning_rate': 2.1256733475781553e-06, 'epoch': 1.58} {'loss': 0.6323, 'learning_rate': 2.1254715720903886e-06, 'epoch': 1.58} {'loss': 0.6112, 'learning_rate': 2.1252698050408882e-06, 'epoch': 1.58} {'loss': 0.5683, 'learning_rate': 2.1250680464298757e-06, 'epoch': 1.58} {'loss': 0.5329, 'learning_rate': 2.124866296257557e-06, 'epoch': 1.58} {'loss': 0.5364, 'learning_rate': 2.124664554524162e-06, 'epoch': 1.58} {'loss': 0.5558, 'learning_rate': 2.1244628212298956e-06, 'epoch': 1.58} {'loss': 0.6118, 'learning_rate': 2.1242610963749777e-06, 'epoch': 1.58} {'loss': 0.5581, 'learning_rate': 2.1240593799596263e-06, 'epoch': 1.58} {'loss': 0.4242, 'learning_rate': 2.1238576719840553e-06, 'epoch': 1.58} {'loss': 0.3173, 'learning_rate': 2.123655972448484e-06, 'epoch': 1.58} {'loss': 0.4509, 'learning_rate': 2.123454281353121e-06, 'epoch': 1.58} {'loss': 0.494, 'learning_rate': 2.1232525986981943e-06, 'epoch': 1.58} {'loss': 0.6047, 'learning_rate': 2.1230509244839094e-06, 'epoch': 1.58} {'loss': 0.5816, 'learning_rate': 2.1228492587104866e-06, 'epoch': 1.58} {'loss': 0.6191, 'learning_rate': 2.122647601378145e-06, 'epoch': 1.58} {'loss': 0.4203, 'learning_rate': 2.122445952487091e-06, 'epoch': 1.58} {'loss': 0.5429, 'learning_rate': 2.1222443120375536e-06, 'epoch': 1.58} {'loss': 0.6528, 'learning_rate': 2.1220426800297368e-06, 'epoch': 1.58} {'loss': 0.5558, 'learning_rate': 2.121841056463867e-06, 'epoch': 1.58} {'loss': 0.4023, 'learning_rate': 2.121639441340154e-06, 'epoch': 1.58} {'loss': 0.6163, 'learning_rate': 2.121437834658815e-06, 'epoch': 1.58} {'loss': 0.4451, 'learning_rate': 2.121236236420069e-06, 'epoch': 1.58} {'loss': 0.4639, 'learning_rate': 2.1210346466241237e-06, 'epoch': 1.58} {'loss': 0.5925, 'learning_rate': 2.120833065271206e-06, 'epoch': 1.58} {'loss': 0.446, 'learning_rate': 2.1206314923615225e-06, 'epoch': 1.58} {'loss': 0.4405, 'learning_rate': 2.120429927895299e-06, 'epoch': 1.58} {'loss': 0.3397, 'learning_rate': 2.1202283718727422e-06, 'epoch': 1.58} {'loss': 0.5872, 'learning_rate': 2.1200268242940724e-06, 'epoch': 1.58} {'loss': 0.6148, 'learning_rate': 2.119825285159508e-06, 'epoch': 1.58} {'loss': 0.5704, 'learning_rate': 2.1196237544692567e-06, 'epoch': 1.58} {'loss': 0.5482, 'learning_rate': 2.119422232223545e-06, 'epoch': 1.58} {'loss': 0.5608, 'learning_rate': 2.119220718422578e-06, 'epoch': 1.58} {'loss': 0.6401, 'learning_rate': 2.119019213066582e-06, 'epoch': 1.58} {'loss': 0.5728, 'learning_rate': 2.1188177161557666e-06, 'epoch': 1.58} {'loss': 0.5858, 'learning_rate': 2.11861622769035e-06, 'epoch': 1.58} {'loss': 0.3785, 'learning_rate': 2.1184147476705487e-06, 'epoch': 1.58} {'loss': 0.5164, 'learning_rate': 2.1182132760965725e-06, 'epoch': 1.58} {'loss': 0.6619, 'learning_rate': 2.1180118129686478e-06, 'epoch': 1.58} {'loss': 0.5142, 'learning_rate': 2.117810358286979e-06, 'epoch': 1.58} {'loss': 0.6295, 'learning_rate': 2.117608912051794e-06, 'epoch': 1.58} {'loss': 0.469, 'learning_rate': 2.117407474263299e-06, 'epoch': 1.58} {'loss': 0.5508, 'learning_rate': 2.1172060449217134e-06, 'epoch': 1.58} {'loss': 0.4144, 'learning_rate': 2.117004624027256e-06, 'epoch': 1.58} {'loss': 0.5271, 'learning_rate': 2.116803211580134e-06, 'epoch': 1.58} {'loss': 0.4782, 'learning_rate': 2.116601807580574e-06, 'epoch': 1.58} {'loss': 0.51, 'learning_rate': 2.1164004120287817e-06, 'epoch': 1.58} {'loss': 0.45, 'learning_rate': 2.1161990249249833e-06, 'epoch': 1.58} {'loss': 0.4781, 'learning_rate': 2.1159976462693864e-06, 'epoch': 1.58} {'loss': 0.4148, 'learning_rate': 2.1157962760622097e-06, 'epoch': 1.58} {'loss': 0.6045, 'learning_rate': 2.1155949143036716e-06, 'epoch': 1.58} {'loss': 0.4676, 'learning_rate': 2.1153935609939792e-06, 'epoch': 1.58} {'loss': 0.51, 'learning_rate': 2.1151922161333605e-06, 'epoch': 1.58} {'loss': 0.6259, 'learning_rate': 2.114990879722022e-06, 'epoch': 1.58} {'loss': 0.526, 'learning_rate': 2.1147895517601824e-06, 'epoch': 1.58} {'loss': 0.5205, 'learning_rate': 2.114588232248057e-06, 'epoch': 1.58} {'loss': 0.5487, 'learning_rate': 2.1143869211858627e-06, 'epoch': 1.58} {'loss': 0.615, 'learning_rate': 2.1141856185738163e-06, 'epoch': 1.58} {'loss': 0.5341, 'learning_rate': 2.113984324412127e-06, 'epoch': 1.58} {'loss': 0.4324, 'learning_rate': 2.1137830387010206e-06, 'epoch': 1.58} {'loss': 0.6117, 'learning_rate': 2.113581761440705e-06, 'epoch': 1.58} {'loss': 0.4556, 'learning_rate': 2.113380492631398e-06, 'epoch': 1.58} {'loss': 0.5349, 'learning_rate': 2.113179232273316e-06, 'epoch': 1.58} {'loss': 0.5342, 'learning_rate': 2.112977980366674e-06, 'epoch': 1.58} {'loss': 0.3869, 'learning_rate': 2.11277673691169e-06, 'epoch': 1.58} {'loss': 0.4684, 'learning_rate': 2.1125755019085736e-06, 'epoch': 1.58} {'loss': 0.5197, 'learning_rate': 2.1123742753575494e-06, 'epoch': 1.58} {'loss': 0.5346, 'learning_rate': 2.112173057258825e-06, 'epoch': 1.58} {'loss': 0.5067, 'learning_rate': 2.111971847612618e-06, 'epoch': 1.58} {'loss': 0.5495, 'learning_rate': 2.11177064641915e-06, 'epoch': 1.58} {'loss': 0.3423, 'learning_rate': 2.1115694536786245e-06, 'epoch': 1.58} {'loss': 0.4263, 'learning_rate': 2.1113682693912706e-06, 'epoch': 1.58} {'loss': 0.4467, 'learning_rate': 2.111167093557295e-06, 'epoch': 1.58} {'loss': 0.6882, 'learning_rate': 2.1109659261769156e-06, 'epoch': 1.58} {'loss': 0.4549, 'learning_rate': 2.1107647672503486e-06, 'epoch': 1.58} {'loss': 0.5081, 'learning_rate': 2.1105636167778087e-06, 'epoch': 1.58} {'loss': 0.5043, 'learning_rate': 2.1103624747595143e-06, 'epoch': 1.58} {'loss': 0.6787, 'learning_rate': 2.1101613411956743e-06, 'epoch': 1.58} {'loss': 0.6694, 'learning_rate': 2.1099602160865128e-06, 'epoch': 1.58} {'loss': 0.5462, 'learning_rate': 2.1097590994322393e-06, 'epoch': 1.58} {'loss': 0.5035, 'learning_rate': 2.109557991233071e-06, 'epoch': 1.58} {'loss': 0.4863, 'learning_rate': 2.1093568914892226e-06, 'epoch': 1.58} {'loss': 0.598, 'learning_rate': 2.1091558002009105e-06, 'epoch': 1.58} {'loss': 0.6152, 'learning_rate': 2.1089547173683543e-06, 'epoch': 1.58} {'loss': 0.419, 'learning_rate': 2.108753642991759e-06, 'epoch': 1.58} {'loss': 0.6719, 'learning_rate': 2.108552577071351e-06, 'epoch': 1.58} {'loss': 0.6686, 'learning_rate': 2.10835151960734e-06, 'epoch': 1.58} {'loss': 0.4588, 'learning_rate': 2.1081504705999413e-06, 'epoch': 1.58} {'loss': 0.6088, 'learning_rate': 2.107949430049372e-06, 'epoch': 1.58} {'loss': 0.3205, 'learning_rate': 2.1077483979558477e-06, 'epoch': 1.58} {'loss': 0.6361, 'learning_rate': 2.107547374319585e-06, 'epoch': 1.58} {'loss': 0.4402, 'learning_rate': 2.107346359140796e-06, 'epoch': 1.58} {'loss': 0.5082, 'learning_rate': 2.107145352419697e-06, 'epoch': 1.58} {'loss': 0.6279, 'learning_rate': 2.106944354156505e-06, 'epoch': 1.58} {'loss': 0.5326, 'learning_rate': 2.1067433643514347e-06, 'epoch': 1.58} {'loss': 0.471, 'learning_rate': 2.1065423830047004e-06, 'epoch': 1.58} {'loss': 0.5214, 'learning_rate': 2.106341410116518e-06, 'epoch': 1.58} {'loss': 0.4226, 'learning_rate': 2.106140445687107e-06, 'epoch': 1.58} {'loss': 0.5148, 'learning_rate': 2.105939489716675e-06, 'epoch': 1.58} {'loss': 0.4279, 'learning_rate': 2.105738542205442e-06, 'epoch': 1.58} {'loss': 0.4624, 'learning_rate': 2.1055376031536235e-06, 'epoch': 1.58} {'loss': 0.4688, 'learning_rate': 2.1053366725614334e-06, 'epoch': 1.58} {'loss': 0.5755, 'learning_rate': 2.105135750429087e-06, 'epoch': 1.58} {'loss': 0.4577, 'learning_rate': 2.1049348367568033e-06, 'epoch': 1.58} {'loss': 0.3688, 'learning_rate': 2.104733931544791e-06, 'epoch': 1.58} {'loss': 0.5025, 'learning_rate': 2.10453303479327e-06, 'epoch': 1.58} {'loss': 0.7002, 'learning_rate': 2.1043321465024547e-06, 'epoch': 1.58} {'loss': 0.5554, 'learning_rate': 2.10413126667256e-06, 'epoch': 1.58} {'loss': 0.5424, 'learning_rate': 2.1039303953038004e-06, 'epoch': 1.58} {'loss': 0.6064, 'learning_rate': 2.1037295323963926e-06, 'epoch': 1.58} {'loss': 0.5598, 'learning_rate': 2.1035286779505535e-06, 'epoch': 1.58} {'loss': 0.5456, 'learning_rate': 2.103327831966494e-06, 'epoch': 1.58} {'loss': 0.6266, 'learning_rate': 2.103126994444431e-06, 'epoch': 1.58} {'loss': 0.4417, 'learning_rate': 2.102926165384581e-06, 'epoch': 1.58} {'loss': 0.4557, 'learning_rate': 2.1027253447871577e-06, 'epoch': 1.58} {'loss': 0.3033, 'learning_rate': 2.102524532652377e-06, 'epoch': 1.58} {'loss': 0.5924, 'learning_rate': 2.1023237289804545e-06, 'epoch': 1.58} {'loss': 0.3982, 'learning_rate': 2.1021229337716066e-06, 'epoch': 1.58} {'loss': 0.5405, 'learning_rate': 2.1019221470260455e-06, 'epoch': 1.58} {'loss': 0.6242, 'learning_rate': 2.1017213687439865e-06, 'epoch': 1.58} {'loss': 0.4864, 'learning_rate': 2.101520598925646e-06, 'epoch': 1.58} {'loss': 0.5624, 'learning_rate': 2.1013198375712394e-06, 'epoch': 1.58} {'loss': 0.5987, 'learning_rate': 2.1011190846809847e-06, 'epoch': 1.58} {'loss': 0.6474, 'learning_rate': 2.1009183402550883e-06, 'epoch': 1.58} {'loss': 0.3818, 'learning_rate': 2.1007176042937747e-06, 'epoch': 1.58} {'loss': 0.5258, 'learning_rate': 2.100516876797254e-06, 'epoch': 1.58} {'loss': 0.3667, 'learning_rate': 2.100316157765743e-06, 'epoch': 1.58} {'loss': 0.6423, 'learning_rate': 2.1001154471994545e-06, 'epoch': 1.58} {'loss': 0.4797, 'learning_rate': 2.0999147450986057e-06, 'epoch': 1.58} {'loss': 0.5888, 'learning_rate': 2.099714051463415e-06, 'epoch': 1.58} {'loss': 0.5347, 'learning_rate': 2.099513366294087e-06, 'epoch': 1.58} {'loss': 0.688, 'learning_rate': 2.09931268959085e-06, 'epoch': 1.58} {'loss': 0.5365, 'learning_rate': 2.0991120213539097e-06, 'epoch': 1.58} {'loss': 0.6315, 'learning_rate': 2.0989113615834833e-06, 'epoch': 1.58} {'loss': 0.7359, 'learning_rate': 2.0987107102797864e-06, 'epoch': 1.58} {'loss': 0.5403, 'learning_rate': 2.0985100674430348e-06, 'epoch': 1.58} {'loss': 0.6364, 'learning_rate': 2.0983094330734455e-06, 'epoch': 1.58} {'loss': 0.6157, 'learning_rate': 2.0981088071712253e-06, 'epoch': 1.58} {'loss': 0.5881, 'learning_rate': 2.0979081897366004e-06, 'epoch': 1.58} {'loss': 0.632, 'learning_rate': 2.0977075807697766e-06, 'epoch': 1.58} {'loss': 0.3963, 'learning_rate': 2.0975069802709723e-06, 'epoch': 1.58} {'loss': 0.5684, 'learning_rate': 2.0973063882404067e-06, 'epoch': 1.58} {'loss': 0.616, 'learning_rate': 2.0971058046782833e-06, 'epoch': 1.58} {'loss': 0.4618, 'learning_rate': 2.0969052295848314e-06, 'epoch': 1.58} {'loss': 0.4978, 'learning_rate': 2.096704662960255e-06, 'epoch': 1.58} {'loss': 0.5744, 'learning_rate': 2.096504104804773e-06, 'epoch': 1.58} {'loss': 0.534, 'learning_rate': 2.0963035551186007e-06, 'epoch': 1.58} {'loss': 0.5279, 'learning_rate': 2.0961030139019524e-06, 'epoch': 1.58} {'loss': 0.5207, 'learning_rate': 2.0959024811550453e-06, 'epoch': 1.58} {'loss': 0.6007, 'learning_rate': 2.095701956878087e-06, 'epoch': 1.58} {'loss': 0.5281, 'learning_rate': 2.0955014410713025e-06, 'epoch': 1.58} {'loss': 0.5914, 'learning_rate': 2.0953009337348993e-06, 'epoch': 1.58} {'loss': 0.548, 'learning_rate': 2.095100434869094e-06, 'epoch': 1.58} {'loss': 0.4703, 'learning_rate': 2.0948999444741024e-06, 'epoch': 1.58} {'loss': 0.4623, 'learning_rate': 2.0946994625501394e-06, 'epoch': 1.58} {'loss': 0.4752, 'learning_rate': 2.094498989097422e-06, 'epoch': 1.58} {'loss': 0.5014, 'learning_rate': 2.094298524116157e-06, 'epoch': 1.58} {'loss': 0.4572, 'learning_rate': 2.0940980676065703e-06, 'epoch': 1.58} {'loss': 0.3552, 'learning_rate': 2.0938976195688677e-06, 'epoch': 1.58} {'loss': 0.5194, 'learning_rate': 2.0936971800032677e-06, 'epoch': 1.58} {'loss': 0.5415, 'learning_rate': 2.093496748909988e-06, 'epoch': 1.58} {'loss': 0.4934, 'learning_rate': 2.0932963262892337e-06, 'epoch': 1.58} {'loss': 0.2981, 'learning_rate': 2.093095912141232e-06, 'epoch': 1.58} {'loss': 0.3987, 'learning_rate': 2.092895506466186e-06, 'epoch': 1.58} {'loss': 0.5561, 'learning_rate': 2.0926951092643224e-06, 'epoch': 1.58} {'loss': 0.3319, 'learning_rate': 2.092494720535846e-06, 'epoch': 1.58} {'loss': 0.7578, 'learning_rate': 2.0922943402809757e-06, 'epoch': 1.58} {'loss': 0.5894, 'learning_rate': 2.0920939684999277e-06, 'epoch': 1.58} {'loss': 0.5569, 'learning_rate': 2.0918936051929095e-06, 'epoch': 1.58} {'loss': 0.4345, 'learning_rate': 2.091693250360147e-06, 'epoch': 1.58} {'loss': 0.4663, 'learning_rate': 2.091492904001844e-06, 'epoch': 1.58} {'loss': 0.3906, 'learning_rate': 2.0912925661182248e-06, 'epoch': 1.58} {'loss': 0.5113, 'learning_rate': 2.0910922367094964e-06, 'epoch': 1.58} {'loss': 0.449, 'learning_rate': 2.0908919157758777e-06, 'epoch': 1.58} {'loss': 0.5064, 'learning_rate': 2.090691603317584e-06, 'epoch': 1.58} {'loss': 0.5776, 'learning_rate': 2.0904912993348224e-06, 'epoch': 1.58} {'loss': 0.4461, 'learning_rate': 2.090291003827819e-06, 'epoch': 1.58} {'loss': 0.323, 'learning_rate': 2.0900907167967775e-06, 'epoch': 1.58} {'loss': 0.6257, 'learning_rate': 2.0898904382419227e-06, 'epoch': 1.58} {'loss': 0.4656, 'learning_rate': 2.0896901681634617e-06, 'epoch': 1.58} {'loss': 0.5036, 'learning_rate': 2.0894899065616113e-06, 'epoch': 1.58} {'loss': 0.5513, 'learning_rate': 2.08928965343659e-06, 'epoch': 1.58} {'loss': 0.6238, 'learning_rate': 2.0890894087886027e-06, 'epoch': 1.58} {'loss': 0.5878, 'learning_rate': 2.0888891726178764e-06, 'epoch': 1.58} {'loss': 0.4704, 'learning_rate': 2.088688944924613e-06, 'epoch': 1.58} {'loss': 0.5243, 'learning_rate': 2.088488725709039e-06, 'epoch': 1.58} {'loss': 0.5477, 'learning_rate': 2.0882885149713617e-06, 'epoch': 1.58} {'loss': 0.4748, 'learning_rate': 2.0880883127117956e-06, 'epoch': 1.58} {'loss': 0.5277, 'learning_rate': 2.0878881189305612e-06, 'epoch': 1.58} {'loss': 0.5578, 'learning_rate': 2.087687933627862e-06, 'epoch': 1.58} {'loss': 0.5083, 'learning_rate': 2.0874877568039253e-06, 'epoch': 1.58} {'loss': 0.4927, 'learning_rate': 2.0872875884589574e-06, 'epoch': 1.58} {'loss': 0.3696, 'learning_rate': 2.087087428593175e-06, 'epoch': 1.58} {'loss': 0.6697, 'learning_rate': 2.0868872772067927e-06, 'epoch': 1.58} {'loss': 0.4939, 'learning_rate': 2.0866871343000237e-06, 'epoch': 1.58} {'loss': 0.4899, 'learning_rate': 2.0864869998730875e-06, 'epoch': 1.58} {'loss': 0.493, 'learning_rate': 2.086286873926189e-06, 'epoch': 1.58} {'loss': 0.511, 'learning_rate': 2.086086756459553e-06, 'epoch': 1.58} {'loss': 0.4281, 'learning_rate': 2.0858866474733887e-06, 'epoch': 1.58} {'loss': 0.4144, 'learning_rate': 2.0856865469679087e-06, 'epoch': 1.58} {'loss': 0.4257, 'learning_rate': 2.0854864549433317e-06, 'epoch': 1.58} {'loss': 0.5742, 'learning_rate': 2.0852863713998694e-06, 'epoch': 1.58} {'loss': 0.4857, 'learning_rate': 2.0850862963377396e-06, 'epoch': 1.58} {'loss': 0.527, 'learning_rate': 2.0848862297571493e-06, 'epoch': 1.58} {'loss': 0.593, 'learning_rate': 2.0846861716583234e-06, 'epoch': 1.58} {'loss': 0.5326, 'learning_rate': 2.084486122041467e-06, 'epoch': 1.58} {'loss': 0.4044, 'learning_rate': 2.0842860809067988e-06, 'epoch': 1.58} {'loss': 0.5309, 'learning_rate': 2.084086048254532e-06, 'epoch': 1.58} {'loss': 0.4651, 'learning_rate': 2.0838860240848822e-06, 'epoch': 1.58} {'loss': 0.5864, 'learning_rate': 2.083686008398066e-06, 'epoch': 1.58} {'loss': 0.4598, 'learning_rate': 2.0834860011942915e-06, 'epoch': 1.58} {'loss': 0.4947, 'learning_rate': 2.0832860024737755e-06, 'epoch': 1.58} {'loss': 0.5807, 'learning_rate': 2.083086012236735e-06, 'epoch': 1.58} {'loss': 0.4439, 'learning_rate': 2.082886030483381e-06, 'epoch': 1.58} {'loss': 0.493, 'learning_rate': 2.0826860572139285e-06, 'epoch': 1.58} {'loss': 0.4174, 'learning_rate': 2.082486092428594e-06, 'epoch': 1.58} {'loss': 0.3746, 'learning_rate': 2.0822861361275916e-06, 'epoch': 1.58} {'loss': 0.4623, 'learning_rate': 2.082086188311132e-06, 'epoch': 1.58} {'loss': 0.6354, 'learning_rate': 2.0818862489794323e-06, 'epoch': 1.58} {'loss': 0.6176, 'learning_rate': 2.0816863181327064e-06, 'epoch': 1.58} {'loss': 0.4325, 'learning_rate': 2.0814863957711674e-06, 'epoch': 1.58} {'loss': 0.5645, 'learning_rate': 2.0812864818950308e-06, 'epoch': 1.58} {'loss': 0.4796, 'learning_rate': 2.0810865765045096e-06, 'epoch': 1.58} {'loss': 0.4562, 'learning_rate': 2.080886679599823e-06, 'epoch': 1.58} {'loss': 0.5384, 'learning_rate': 2.080686791181177e-06, 'epoch': 1.58} {'loss': 0.532, 'learning_rate': 2.0804869112487904e-06, 'epoch': 1.58} {'loss': 0.5647, 'learning_rate': 2.0802870398028774e-06, 'epoch': 1.58} {'loss': 0.4047, 'learning_rate': 2.08008717684365e-06, 'epoch': 1.58} {'loss': 0.4218, 'learning_rate': 2.079887322371329e-06, 'epoch': 1.58} {'loss': 0.4969, 'learning_rate': 2.0796874763861196e-06, 'epoch': 1.58} {'loss': 0.6069, 'learning_rate': 2.0794876388882403e-06, 'epoch': 1.58} {'loss': 0.6457, 'learning_rate': 2.0792878098779034e-06, 'epoch': 1.58} {'loss': 0.4799, 'learning_rate': 2.079087989355326e-06, 'epoch': 1.58} {'loss': 0.3878, 'learning_rate': 2.0788881773207205e-06, 'epoch': 1.58} {'loss': 0.6245, 'learning_rate': 2.0786883737743014e-06, 'epoch': 1.58} {'loss': 0.6047, 'learning_rate': 2.0784885787162857e-06, 'epoch': 1.58} {'loss': 0.5284, 'learning_rate': 2.0782887921468807e-06, 'epoch': 1.58} {'loss': 0.4808, 'learning_rate': 2.0780890140663047e-06, 'epoch': 1.58} {'loss': 0.4084, 'learning_rate': 2.0778892444747713e-06, 'epoch': 1.58} {'loss': 0.4873, 'learning_rate': 2.0776894833724947e-06, 'epoch': 1.58} {'loss': 0.6059, 'learning_rate': 2.0774897307596884e-06, 'epoch': 1.58} {'loss': 0.5916, 'learning_rate': 2.077289986636567e-06, 'epoch': 1.58} {'loss': 0.5048, 'learning_rate': 2.0770902510033474e-06, 'epoch': 1.58} {'loss': 0.4494, 'learning_rate': 2.0768905238602386e-06, 'epoch': 1.58} {'loss': 0.4775, 'learning_rate': 2.0766908052074565e-06, 'epoch': 1.58} {'loss': 0.5362, 'learning_rate': 2.0764910950452145e-06, 'epoch': 1.58} {'loss': 0.3979, 'learning_rate': 2.0762913933737282e-06, 'epoch': 1.58} {'loss': 0.6073, 'learning_rate': 2.07609170019321e-06, 'epoch': 1.58} {'loss': 0.4844, 'learning_rate': 2.0758920155038786e-06, 'epoch': 1.58} {'loss': 0.5334, 'learning_rate': 2.0756923393059404e-06, 'epoch': 1.58} {'loss': 0.5042, 'learning_rate': 2.075492671599614e-06, 'epoch': 1.58} {'loss': 0.5132, 'learning_rate': 2.075293012385111e-06, 'epoch': 1.58} {'loss': 0.532, 'learning_rate': 2.075093361662648e-06, 'epoch': 1.58} {'loss': 0.5349, 'learning_rate': 2.074893719432437e-06, 'epoch': 1.58} {'loss': 0.6628, 'learning_rate': 2.074694085694693e-06, 'epoch': 1.58} {'loss': 0.5037, 'learning_rate': 2.074494460449632e-06, 'epoch': 1.58} {'loss': 0.5981, 'learning_rate': 2.074294843697463e-06, 'epoch': 1.58} {'loss': 0.5207, 'learning_rate': 2.0740952354384026e-06, 'epoch': 1.58} {'loss': 0.4022, 'learning_rate': 2.0738956356726645e-06, 'epoch': 1.58} {'loss': 0.51, 'learning_rate': 2.073696044400463e-06, 'epoch': 1.58} {'loss': 0.4798, 'learning_rate': 2.073496461622011e-06, 'epoch': 1.58} {'loss': 0.4501, 'learning_rate': 2.0732968873375227e-06, 'epoch': 1.58} {'loss': 0.4847, 'learning_rate': 2.073097321547216e-06, 'epoch': 1.58} {'loss': 0.4986, 'learning_rate': 2.072897764251297e-06, 'epoch': 1.58} {'loss': 0.5051, 'learning_rate': 2.072698215449984e-06, 'epoch': 1.58} {'loss': 0.3905, 'learning_rate': 2.0724986751434904e-06, 'epoch': 1.58} {'loss': 0.586, 'learning_rate': 2.0722991433320306e-06, 'epoch': 1.58} {'loss': 0.4035, 'learning_rate': 2.0720996200158195e-06, 'epoch': 1.58} {'loss': 0.4245, 'learning_rate': 2.071900105195064e-06, 'epoch': 1.58} {'loss': 0.5752, 'learning_rate': 2.071700598869989e-06, 'epoch': 1.58} {'loss': 0.5651, 'learning_rate': 2.071501101040799e-06, 'epoch': 1.58} {'loss': 0.5517, 'learning_rate': 2.071301611707712e-06, 'epoch': 1.58} {'loss': 0.5925, 'learning_rate': 2.07110213087094e-06, 'epoch': 1.58} {'loss': 0.5638, 'learning_rate': 2.070902658530698e-06, 'epoch': 1.58} {'loss': 0.4499, 'learning_rate': 2.0707031946872024e-06, 'epoch': 1.58} {'loss': 0.4874, 'learning_rate': 2.070503739340659e-06, 'epoch': 1.58} {'loss': 0.5582, 'learning_rate': 2.0703042924912908e-06, 'epoch': 1.58} {'loss': 0.6059, 'learning_rate': 2.0701048541393055e-06, 'epoch': 1.58} {'loss': 0.5453, 'learning_rate': 2.0699054242849182e-06, 'epoch': 1.58} {'loss': 0.4091, 'learning_rate': 2.0697060029283433e-06, 'epoch': 1.58} {'loss': 0.5937, 'learning_rate': 2.069506590069793e-06, 'epoch': 1.58} {'loss': 0.5738, 'learning_rate': 2.069307185709486e-06, 'epoch': 1.58} {'loss': 0.5359, 'learning_rate': 2.0691077898476263e-06, 'epoch': 1.58} {'loss': 0.5471, 'learning_rate': 2.0689084024844397e-06, 'epoch': 1.58} {'loss': 0.4856, 'learning_rate': 2.06870902362013e-06, 'epoch': 1.58} {'loss': 0.6246, 'learning_rate': 2.068509653254914e-06, 'epoch': 1.58} {'loss': 0.4955, 'learning_rate': 2.0683102913890095e-06, 'epoch': 1.58} {'loss': 0.5676, 'learning_rate': 2.0681109380226207e-06, 'epoch': 1.58} {'loss': 0.4458, 'learning_rate': 2.067911593155971e-06, 'epoch': 1.58} {'loss': 0.6329, 'learning_rate': 2.067712256789266e-06, 'epoch': 1.58} {'loss': 0.5045, 'learning_rate': 2.0675129289227293e-06, 'epoch': 1.58} {'loss': 0.5282, 'learning_rate': 2.067313609556564e-06, 'epoch': 1.58} {'loss': 0.4438, 'learning_rate': 2.067114298690989e-06, 'epoch': 1.58} {'loss': 0.6076, 'learning_rate': 2.06691499632622e-06, 'epoch': 1.58} {'loss': 0.4849, 'learning_rate': 2.066715702462462e-06, 'epoch': 1.58} {'loss': 0.427, 'learning_rate': 2.0665164170999386e-06, 'epoch': 1.58} {'loss': 0.5517, 'learning_rate': 2.0663171402388573e-06, 'epoch': 1.58} {'loss': 0.5333, 'learning_rate': 2.066117871879433e-06, 'epoch': 1.58} {'loss': 0.5439, 'learning_rate': 2.06591861202188e-06, 'epoch': 1.58} {'loss': 0.4962, 'learning_rate': 2.0657193606664107e-06, 'epoch': 1.58} {'loss': 0.5868, 'learning_rate': 2.065520117813241e-06, 'epoch': 1.58} {'loss': 0.4969, 'learning_rate': 2.0653208834625782e-06, 'epoch': 1.58} {'loss': 0.5047, 'learning_rate': 2.065121657614646e-06, 'epoch': 1.58} {'loss': 0.4927, 'learning_rate': 2.0649224402696487e-06, 'epoch': 1.58} {'loss': 0.5342, 'learning_rate': 2.064723231427804e-06, 'epoch': 1.58} {'loss': 0.5121, 'learning_rate': 2.0645240310893234e-06, 'epoch': 1.58} {'loss': 0.3385, 'learning_rate': 2.0643248392544223e-06, 'epoch': 1.58} {'loss': 0.6175, 'learning_rate': 2.0641256559233157e-06, 'epoch': 1.58} {'loss': 0.5142, 'learning_rate': 2.06392648109621e-06, 'epoch': 1.58} {'loss': 0.6335, 'learning_rate': 2.0637273147733284e-06, 'epoch': 1.58} {'loss': 0.4736, 'learning_rate': 2.063528156954876e-06, 'epoch': 1.58} {'loss': 0.4708, 'learning_rate': 2.0633290076410706e-06, 'epoch': 1.58} {'loss': 0.4693, 'learning_rate': 2.0631298668321263e-06, 'epoch': 1.58} {'loss': 0.6167, 'learning_rate': 2.06293073452825e-06, 'epoch': 1.59} {'loss': 0.5432, 'learning_rate': 2.0627316107296645e-06, 'epoch': 1.59} {'loss': 0.51, 'learning_rate': 2.0625324954365735e-06, 'epoch': 1.59} {'loss': 0.4171, 'learning_rate': 2.0623333886492005e-06, 'epoch': 1.59} {'loss': 0.4328, 'learning_rate': 2.062134290367751e-06, 'epoch': 1.59} {'loss': 0.4264, 'learning_rate': 2.061935200592441e-06, 'epoch': 1.59} {'loss': 0.5317, 'learning_rate': 2.0617361193234865e-06, 'epoch': 1.59} {'loss': 0.487, 'learning_rate': 2.061537046561093e-06, 'epoch': 1.59} {'loss': 0.4837, 'learning_rate': 2.0613379823054845e-06, 'epoch': 1.59} {'loss': 0.5997, 'learning_rate': 2.0611389265568636e-06, 'epoch': 1.59} {'loss': 0.3946, 'learning_rate': 2.0609398793154532e-06, 'epoch': 1.59} {'loss': 0.6767, 'learning_rate': 2.060740840581461e-06, 'epoch': 1.59} {'loss': 0.4861, 'learning_rate': 2.060541810355101e-06, 'epoch': 1.59} {'loss': 0.5054, 'learning_rate': 2.06034278863659e-06, 'epoch': 1.59} {'loss': 0.5846, 'learning_rate': 2.060143775426132e-06, 'epoch': 1.59} {'loss': 0.4855, 'learning_rate': 2.0599447707239527e-06, 'epoch': 1.59} {'loss': 0.5018, 'learning_rate': 2.0597457745302542e-06, 'epoch': 1.59} {'loss': 0.3526, 'learning_rate': 2.059546786845259e-06, 'epoch': 1.59} {'loss': 0.4863, 'learning_rate': 2.059347807669174e-06, 'epoch': 1.59} {'loss': 0.3413, 'learning_rate': 2.059148837002215e-06, 'epoch': 1.59} {'loss': 0.4335, 'learning_rate': 2.058949874844597e-06, 'epoch': 1.59} {'loss': 0.5729, 'learning_rate': 2.058750921196525e-06, 'epoch': 1.59} {'loss': 0.3661, 'learning_rate': 2.058551976058224e-06, 'epoch': 1.59} {'loss': 0.5295, 'learning_rate': 2.058353039429899e-06, 'epoch': 1.59} {'loss': 0.5055, 'learning_rate': 2.0581541113117654e-06, 'epoch': 1.59} {'loss': 0.4625, 'learning_rate': 2.0579551917040362e-06, 'epoch': 1.59} {'loss': 0.4614, 'learning_rate': 2.057756280606924e-06, 'epoch': 1.59} {'loss': 0.4093, 'learning_rate': 2.057557378020647e-06, 'epoch': 1.59} {'loss': 0.4725, 'learning_rate': 2.0573584839454076e-06, 'epoch': 1.59} {'loss': 0.5417, 'learning_rate': 2.057159598381432e-06, 'epoch': 1.59} {'loss': 0.472, 'learning_rate': 2.0569607213289233e-06, 'epoch': 1.59} {'loss': 0.5452, 'learning_rate': 2.0567618527880973e-06, 'epoch': 1.59} {'loss': 0.4606, 'learning_rate': 2.056562992759169e-06, 'epoch': 1.59} {'loss': 0.5873, 'learning_rate': 2.0563641412423507e-06, 'epoch': 1.59} {'loss': 0.7006, 'learning_rate': 2.0561652982378566e-06, 'epoch': 1.59} {'loss': 0.3719, 'learning_rate': 2.055966463745894e-06, 'epoch': 1.59} {'loss': 0.5113, 'learning_rate': 2.0557676377666856e-06, 'epoch': 1.59} {'loss': 0.3706, 'learning_rate': 2.0555688203004365e-06, 'epoch': 1.59} {'loss': 0.5031, 'learning_rate': 2.055370011347362e-06, 'epoch': 1.59} {'loss': 0.4718, 'learning_rate': 2.055171210907676e-06, 'epoch': 1.59} {'loss': 0.5922, 'learning_rate': 2.05497241898159e-06, 'epoch': 1.59} {'loss': 0.536, 'learning_rate': 2.0547736355693226e-06, 'epoch': 1.59} {'loss': 0.5695, 'learning_rate': 2.054574860671078e-06, 'epoch': 1.59} {'loss': 0.3427, 'learning_rate': 2.0543760942870748e-06, 'epoch': 1.59} {'loss': 0.3529, 'learning_rate': 2.0541773364175243e-06, 'epoch': 1.59} {'loss': 0.6008, 'learning_rate': 2.0539785870626407e-06, 'epoch': 1.59} {'loss': 0.528, 'learning_rate': 2.0537798462226342e-06, 'epoch': 1.59} {'loss': 0.5226, 'learning_rate': 2.053581113897721e-06, 'epoch': 1.59} {'loss': 0.4809, 'learning_rate': 2.053382390088117e-06, 'epoch': 1.59} {'loss': 0.5156, 'learning_rate': 2.053183674794026e-06, 'epoch': 1.59} {'loss': 0.5062, 'learning_rate': 2.0529849680156665e-06, 'epoch': 1.59} {'loss': 0.4798, 'learning_rate': 2.0527862697532517e-06, 'epoch': 1.59} {'loss': 0.5628, 'learning_rate': 2.0525875800069926e-06, 'epoch': 1.59} {'loss': 0.517, 'learning_rate': 2.0523888987771047e-06, 'epoch': 1.59} {'loss': 0.5506, 'learning_rate': 2.0521902260637984e-06, 'epoch': 1.59} {'loss': 0.3905, 'learning_rate': 2.0519915618672904e-06, 'epoch': 1.59} {'loss': 0.4608, 'learning_rate': 2.0517929061877884e-06, 'epoch': 1.59} {'loss': 0.3704, 'learning_rate': 2.0515942590255067e-06, 'epoch': 1.59} {'loss': 0.6062, 'learning_rate': 2.0513956203806606e-06, 'epoch': 1.59} {'loss': 0.4969, 'learning_rate': 2.05119699025346e-06, 'epoch': 1.59} {'loss': 0.4127, 'learning_rate': 2.0509983686441202e-06, 'epoch': 1.59} {'loss': 0.5583, 'learning_rate': 2.050799755552856e-06, 'epoch': 1.59} {'loss': 0.5451, 'learning_rate': 2.050601150979874e-06, 'epoch': 1.59} {'loss': 0.3188, 'learning_rate': 2.0504025549253903e-06, 'epoch': 1.59} {'loss': 0.7449, 'learning_rate': 2.0502039673896178e-06, 'epoch': 1.59} {'loss': 0.5486, 'learning_rate': 2.05000538837277e-06, 'epoch': 1.59} {'loss': 0.3569, 'learning_rate': 2.0498068178750586e-06, 'epoch': 1.59} {'loss': 0.5411, 'learning_rate': 2.0496082558966956e-06, 'epoch': 1.59} {'loss': 0.6295, 'learning_rate': 2.0494097024378987e-06, 'epoch': 1.59} {'loss': 0.4167, 'learning_rate': 2.049211157498875e-06, 'epoch': 1.59} {'loss': 0.5201, 'learning_rate': 2.0490126210798377e-06, 'epoch': 1.59} {'loss': 0.5561, 'learning_rate': 2.048814093181002e-06, 'epoch': 1.59} {'loss': 0.4374, 'learning_rate': 2.0486155738025783e-06, 'epoch': 1.59} {'loss': 0.5736, 'learning_rate': 2.048417062944784e-06, 'epoch': 1.59} {'loss': 0.4653, 'learning_rate': 2.0482185606078263e-06, 'epoch': 1.59} {'loss': 0.4771, 'learning_rate': 2.04802006679192e-06, 'epoch': 1.59} {'loss': 0.489, 'learning_rate': 2.0478215814972777e-06, 'epoch': 1.59} {'loss': 0.6478, 'learning_rate': 2.0476231047241124e-06, 'epoch': 1.59} {'loss': 0.3486, 'learning_rate': 2.047424636472637e-06, 'epoch': 1.59} {'loss': 0.5001, 'learning_rate': 2.0472261767430636e-06, 'epoch': 1.59} {'loss': 0.4686, 'learning_rate': 2.0470277255356075e-06, 'epoch': 1.59} {'loss': 0.5026, 'learning_rate': 2.0468292828504767e-06, 'epoch': 1.59} {'loss': 0.5539, 'learning_rate': 2.046630848687885e-06, 'epoch': 1.59} {'loss': 0.3554, 'learning_rate': 2.046432423048048e-06, 'epoch': 1.59} {'loss': 0.4139, 'learning_rate': 2.0462340059311747e-06, 'epoch': 1.59} {'loss': 0.5745, 'learning_rate': 2.046035597337481e-06, 'epoch': 1.59} {'loss': 0.5292, 'learning_rate': 2.0458371972671776e-06, 'epoch': 1.59} {'loss': 0.4682, 'learning_rate': 2.0456388057204803e-06, 'epoch': 1.59} {'loss': 0.5128, 'learning_rate': 2.0454404226975954e-06, 'epoch': 1.59} {'loss': 0.4482, 'learning_rate': 2.04524204819874e-06, 'epoch': 1.59} {'loss': 0.5514, 'learning_rate': 2.045043682224126e-06, 'epoch': 1.59} {'loss': 0.4417, 'learning_rate': 2.0448453247739653e-06, 'epoch': 1.59} {'loss': 0.5657, 'learning_rate': 2.0446469758484735e-06, 'epoch': 1.59} {'loss': 0.5021, 'learning_rate': 2.0444486354478545e-06, 'epoch': 1.59} {'loss': 0.5107, 'learning_rate': 2.044250303572333e-06, 'epoch': 1.59} {'loss': 0.6815, 'learning_rate': 2.0440519802221114e-06, 'epoch': 1.59} {'loss': 0.5187, 'learning_rate': 2.043853665397407e-06, 'epoch': 1.59} {'loss': 0.6014, 'learning_rate': 2.043655359098432e-06, 'epoch': 1.59} {'loss': 0.5595, 'learning_rate': 2.043457061325398e-06, 'epoch': 1.59} {'loss': 0.5416, 'learning_rate': 2.043258772078521e-06, 'epoch': 1.59} {'loss': 0.4879, 'learning_rate': 2.0430604913580043e-06, 'epoch': 1.59} {'loss': 0.6662, 'learning_rate': 2.042862219164072e-06, 'epoch': 1.59} {'loss': 0.435, 'learning_rate': 2.0426639554969286e-06, 'epoch': 1.59} {'loss': 0.4839, 'learning_rate': 2.042465700356788e-06, 'epoch': 1.59} {'loss': 0.378, 'learning_rate': 2.0422674537438647e-06, 'epoch': 1.59} {'loss': 0.4701, 'learning_rate': 2.04206921565837e-06, 'epoch': 1.59} {'loss': 0.3561, 'learning_rate': 2.041870986100518e-06, 'epoch': 1.59} {'loss': 0.5735, 'learning_rate': 2.041672765070516e-06, 'epoch': 1.59} {'loss': 0.4467, 'learning_rate': 2.0414745525685843e-06, 'epoch': 1.59} {'loss': 0.5891, 'learning_rate': 2.041276348594927e-06, 'epoch': 1.59} {'loss': 0.6242, 'learning_rate': 2.0410781531497627e-06, 'epoch': 1.59} {'loss': 0.6048, 'learning_rate': 2.0408799662333023e-06, 'epoch': 1.59} {'loss': 0.4177, 'learning_rate': 2.040681787845753e-06, 'epoch': 1.59} {'loss': 0.4757, 'learning_rate': 2.0404836179873367e-06, 'epoch': 1.59} {'loss': 0.4863, 'learning_rate': 2.040285456658255e-06, 'epoch': 1.59} {'loss': 0.4545, 'learning_rate': 2.040087303858731e-06, 'epoch': 1.59} {'loss': 0.6057, 'learning_rate': 2.0398891595889703e-06, 'epoch': 1.59} {'loss': 0.6008, 'learning_rate': 2.039691023849185e-06, 'epoch': 1.59} {'loss': 0.4641, 'learning_rate': 2.039492896639593e-06, 'epoch': 1.59} {'loss': 0.4841, 'learning_rate': 2.039294777960398e-06, 'epoch': 1.59} {'loss': 0.4879, 'learning_rate': 2.0390966678118218e-06, 'epoch': 1.59} {'loss': 0.524, 'learning_rate': 2.0388985661940673e-06, 'epoch': 1.59} {'loss': 0.4291, 'learning_rate': 2.0387004731073555e-06, 'epoch': 1.59} {'loss': 0.5542, 'learning_rate': 2.038502388551894e-06, 'epoch': 1.59} {'loss': 0.3648, 'learning_rate': 2.0383043125278947e-06, 'epoch': 1.59} {'loss': 0.4462, 'learning_rate': 2.0381062450355725e-06, 'epoch': 1.59} {'loss': 0.556, 'learning_rate': 2.037908186075135e-06, 'epoch': 1.59} {'loss': 0.4905, 'learning_rate': 2.037710135646801e-06, 'epoch': 1.59} {'loss': 0.5649, 'learning_rate': 2.037512093750774e-06, 'epoch': 1.59} {'loss': 0.4175, 'learning_rate': 2.0373140603872776e-06, 'epoch': 1.59} {'loss': 0.4909, 'learning_rate': 2.0371160355565157e-06, 'epoch': 1.59} {'loss': 0.4728, 'learning_rate': 2.0369180192587014e-06, 'epoch': 1.59} {'loss': 0.5127, 'learning_rate': 2.0367200114940512e-06, 'epoch': 1.59} {'loss': 0.5044, 'learning_rate': 2.0365220122627692e-06, 'epoch': 1.59} {'loss': 0.4962, 'learning_rate': 2.0363240215650782e-06, 'epoch': 1.59} {'loss': 0.4788, 'learning_rate': 2.0361260394011785e-06, 'epoch': 1.59} {'loss': 0.5653, 'learning_rate': 2.035928065771294e-06, 'epoch': 1.59} {'loss': 0.4929, 'learning_rate': 2.0357301006756292e-06, 'epoch': 1.59} {'loss': 0.4605, 'learning_rate': 2.035532144114398e-06, 'epoch': 1.59} {'loss': 0.494, 'learning_rate': 2.035334196087817e-06, 'epoch': 1.59} {'loss': 0.4255, 'learning_rate': 2.0351362565960876e-06, 'epoch': 1.59} {'loss': 0.4257, 'learning_rate': 2.034938325639434e-06, 'epoch': 1.59} {'loss': 0.4999, 'learning_rate': 2.0347404032180605e-06, 'epoch': 1.59} {'loss': 0.5045, 'learning_rate': 2.034542489332181e-06, 'epoch': 1.59} {'loss': 0.5389, 'learning_rate': 2.0343445839820087e-06, 'epoch': 1.59} {'loss': 0.4293, 'learning_rate': 2.034146687167755e-06, 'epoch': 1.59} {'loss': 0.489, 'learning_rate': 2.0339487988896344e-06, 'epoch': 1.59} {'loss': 0.676, 'learning_rate': 2.033750919147852e-06, 'epoch': 1.59} {'loss': 0.6542, 'learning_rate': 2.033553047942629e-06, 'epoch': 1.59} {'loss': 0.5876, 'learning_rate': 2.0333551852741717e-06, 'epoch': 1.59} {'loss': 0.4542, 'learning_rate': 2.033157331142692e-06, 'epoch': 1.59} {'loss': 0.5121, 'learning_rate': 2.0329594855484036e-06, 'epoch': 1.59} {'loss': 0.5373, 'learning_rate': 2.032761648491518e-06, 'epoch': 1.59} {'loss': 0.5559, 'learning_rate': 2.0325638199722506e-06, 'epoch': 1.59} {'loss': 0.5329, 'learning_rate': 2.032365999990804e-06, 'epoch': 1.59} {'loss': 0.4712, 'learning_rate': 2.032168188547403e-06, 'epoch': 1.59} {'loss': 0.5447, 'learning_rate': 2.031970385642249e-06, 'epoch': 1.59} {'loss': 0.452, 'learning_rate': 2.031772591275558e-06, 'epoch': 1.59} {'loss': 0.5215, 'learning_rate': 2.031574805447546e-06, 'epoch': 1.59} {'loss': 0.6563, 'learning_rate': 2.031377028158413e-06, 'epoch': 1.59} {'loss': 0.459, 'learning_rate': 2.0311792594083867e-06, 'epoch': 1.59} {'loss': 0.4631, 'learning_rate': 2.030981499197666e-06, 'epoch': 1.59} {'loss': 0.511, 'learning_rate': 2.0307837475264692e-06, 'epoch': 1.59} {'loss': 0.6399, 'learning_rate': 2.0305860043950076e-06, 'epoch': 1.59} {'loss': 0.5989, 'learning_rate': 2.0303882698034906e-06, 'epoch': 1.59} {'loss': 0.5135, 'learning_rate': 2.0301905437521354e-06, 'epoch': 1.59} {'loss': 0.4152, 'learning_rate': 2.029992826241145e-06, 'epoch': 1.59} {'loss': 0.5039, 'learning_rate': 2.029795117270742e-06, 'epoch': 1.59} {'loss': 0.6213, 'learning_rate': 2.0295974168411304e-06, 'epoch': 1.59} {'loss': 0.5392, 'learning_rate': 2.0293997249525244e-06, 'epoch': 1.59} {'loss': 0.5398, 'learning_rate': 2.029202041605136e-06, 'epoch': 1.59} {'loss': 0.4641, 'learning_rate': 2.0290043667991764e-06, 'epoch': 1.59} {'loss': 0.4205, 'learning_rate': 2.028806700534861e-06, 'epoch': 1.59} {'loss': 0.5058, 'learning_rate': 2.028609042812394e-06, 'epoch': 1.59} {'loss': 0.3415, 'learning_rate': 2.028411393631997e-06, 'epoch': 1.59} {'loss': 0.4006, 'learning_rate': 2.028213752993874e-06, 'epoch': 1.59} {'loss': 0.5404, 'learning_rate': 2.0280161208982386e-06, 'epoch': 1.59} {'loss': 0.5095, 'learning_rate': 2.027818497345304e-06, 'epoch': 1.59} {'loss': 0.4712, 'learning_rate': 2.0276208823352815e-06, 'epoch': 1.59} {'loss': 0.6177, 'learning_rate': 2.0274232758683855e-06, 'epoch': 1.59} {'loss': 0.5379, 'learning_rate': 2.027225677944823e-06, 'epoch': 1.59} {'loss': 0.4733, 'learning_rate': 2.0270280885648063e-06, 'epoch': 1.59} {'loss': 0.5673, 'learning_rate': 2.02683050772855e-06, 'epoch': 1.59} {'loss': 0.5698, 'learning_rate': 2.0266329354362634e-06, 'epoch': 1.59} {'loss': 0.5238, 'learning_rate': 2.0264353716881603e-06, 'epoch': 1.59} {'loss': 0.4796, 'learning_rate': 2.02623781648445e-06, 'epoch': 1.59} {'loss': 0.4716, 'learning_rate': 2.026040269825349e-06, 'epoch': 1.59} {'loss': 0.7228, 'learning_rate': 2.025842731711063e-06, 'epoch': 1.59} {'loss': 0.5507, 'learning_rate': 2.025645202141806e-06, 'epoch': 1.59} {'loss': 0.4661, 'learning_rate': 2.0254476811177903e-06, 'epoch': 1.59} {'loss': 0.489, 'learning_rate': 2.025250168639227e-06, 'epoch': 1.59} {'loss': 0.4582, 'learning_rate': 2.0250526647063273e-06, 'epoch': 1.59} {'loss': 0.4899, 'learning_rate': 2.024855169319304e-06, 'epoch': 1.59} {'loss': 0.5015, 'learning_rate': 2.02465768247837e-06, 'epoch': 1.59} {'loss': 0.456, 'learning_rate': 2.0244602041837336e-06, 'epoch': 1.59} {'loss': 0.5016, 'learning_rate': 2.0242627344356083e-06, 'epoch': 1.59} {'loss': 0.4495, 'learning_rate': 2.0240652732342037e-06, 'epoch': 1.59} {'loss': 0.6062, 'learning_rate': 2.0238678205797334e-06, 'epoch': 1.59} {'loss': 0.6314, 'learning_rate': 2.0236703764724097e-06, 'epoch': 1.59} {'loss': 0.4053, 'learning_rate': 2.0234729409124454e-06, 'epoch': 1.59} {'loss': 0.468, 'learning_rate': 2.0232755139000472e-06, 'epoch': 1.59} {'loss': 0.4307, 'learning_rate': 2.023078095435428e-06, 'epoch': 1.59} {'loss': 0.4415, 'learning_rate': 2.022880685518802e-06, 'epoch': 1.59} {'loss': 0.4916, 'learning_rate': 2.0226832841503785e-06, 'epoch': 1.59} {'loss': 0.6411, 'learning_rate': 2.0224858913303702e-06, 'epoch': 1.59} {'loss': 0.6032, 'learning_rate': 2.0222885070589882e-06, 'epoch': 1.59} {'loss': 0.471, 'learning_rate': 2.0220911313364468e-06, 'epoch': 1.59} {'loss': 0.6266, 'learning_rate': 2.021893764162952e-06, 'epoch': 1.59} {'loss': 0.5, 'learning_rate': 2.0216964055387177e-06, 'epoch': 1.59} {'loss': 0.5839, 'learning_rate': 2.021499055463957e-06, 'epoch': 1.59} {'loss': 0.5557, 'learning_rate': 2.021301713938879e-06, 'epoch': 1.59} {'loss': 0.4258, 'learning_rate': 2.0211043809636976e-06, 'epoch': 1.59} {'loss': 0.4661, 'learning_rate': 2.0209070565386225e-06, 'epoch': 1.59} {'loss': 0.6238, 'learning_rate': 2.0207097406638677e-06, 'epoch': 1.59} {'loss': 0.6009, 'learning_rate': 2.02051243333964e-06, 'epoch': 1.59} {'loss': 0.5355, 'learning_rate': 2.020315134566153e-06, 'epoch': 1.59} {'loss': 0.4882, 'learning_rate': 2.02011784434362e-06, 'epoch': 1.59} {'loss': 0.5989, 'learning_rate': 2.0199205626722496e-06, 'epoch': 1.59} {'loss': 0.6248, 'learning_rate': 2.019723289552258e-06, 'epoch': 1.59} {'loss': 0.7621, 'learning_rate': 2.0195260249838477e-06, 'epoch': 1.59} {'loss': 0.517, 'learning_rate': 2.0193287689672414e-06, 'epoch': 1.59} {'loss': 0.4008, 'learning_rate': 2.019131521502641e-06, 'epoch': 1.59} {'loss': 0.5259, 'learning_rate': 2.018934282590261e-06, 'epoch': 1.59} {'loss': 0.3822, 'learning_rate': 2.018737052230315e-06, 'epoch': 1.59} {'loss': 0.5482, 'learning_rate': 2.0185398304230117e-06, 'epoch': 1.59} {'loss': 0.6505, 'learning_rate': 2.018342617168566e-06, 'epoch': 1.59} {'loss': 0.5557, 'learning_rate': 2.018145412467184e-06, 'epoch': 1.59} {'loss': 0.6633, 'learning_rate': 2.01794821631908e-06, 'epoch': 1.59} {'loss': 0.6252, 'learning_rate': 2.017751028724464e-06, 'epoch': 1.59} {'loss': 0.5423, 'learning_rate': 2.017553849683549e-06, 'epoch': 1.59} {'loss': 0.5772, 'learning_rate': 2.0173566791965447e-06, 'epoch': 1.59} {'loss': 0.5121, 'learning_rate': 2.017159517263664e-06, 'epoch': 1.59} {'loss': 0.6446, 'learning_rate': 2.01696236388512e-06, 'epoch': 1.59} {'loss': 0.5147, 'learning_rate': 2.0167652190611177e-06, 'epoch': 1.59} {'loss': 0.495, 'learning_rate': 2.0165680827918733e-06, 'epoch': 1.59} {'loss': 0.5869, 'learning_rate': 2.0163709550775955e-06, 'epoch': 1.59} {'loss': 0.5378, 'learning_rate': 2.016173835918498e-06, 'epoch': 1.59} {'loss': 0.5215, 'learning_rate': 2.015976725314792e-06, 'epoch': 1.59} {'loss': 0.5304, 'learning_rate': 2.015779623266684e-06, 'epoch': 1.59} {'loss': 0.4551, 'learning_rate': 2.0155825297743925e-06, 'epoch': 1.59} {'loss': 0.6292, 'learning_rate': 2.015385444838124e-06, 'epoch': 1.59} {'loss': 0.6431, 'learning_rate': 2.0151883684580885e-06, 'epoch': 1.59} {'loss': 0.4582, 'learning_rate': 2.0149913006345013e-06, 'epoch': 1.59} {'loss': 0.6157, 'learning_rate': 2.0147942413675703e-06, 'epoch': 1.59} {'loss': 0.5988, 'learning_rate': 2.0145971906575114e-06, 'epoch': 1.59} {'loss': 0.5075, 'learning_rate': 2.0144001485045274e-06, 'epoch': 1.59} {'loss': 0.405, 'learning_rate': 2.014203114908838e-06, 'epoch': 1.59} {'loss': 0.498, 'learning_rate': 2.014006089870649e-06, 'epoch': 1.59} {'loss': 0.4238, 'learning_rate': 2.0138090733901737e-06, 'epoch': 1.59} {'loss': 0.4648, 'learning_rate': 2.013612065467625e-06, 'epoch': 1.59} {'loss': 0.4147, 'learning_rate': 2.013415066103207e-06, 'epoch': 1.59} {'loss': 0.5096, 'learning_rate': 2.013218075297141e-06, 'epoch': 1.59} {'loss': 0.4976, 'learning_rate': 2.013021093049626e-06, 'epoch': 1.59} {'loss': 0.4648, 'learning_rate': 2.012824119360887e-06, 'epoch': 1.59} {'loss': 0.6157, 'learning_rate': 2.0126271542311236e-06, 'epoch': 1.59} {'loss': 0.5543, 'learning_rate': 2.0124301976605508e-06, 'epoch': 1.59} {'loss': 0.4561, 'learning_rate': 2.012233249649385e-06, 'epoch': 1.59} {'loss': 0.4898, 'learning_rate': 2.0120363101978247e-06, 'epoch': 1.59} {'loss': 0.4944, 'learning_rate': 2.011839379306094e-06, 'epoch': 1.59} {'loss': 0.5414, 'learning_rate': 2.0116424569743943e-06, 'epoch': 1.59} {'loss': 0.6034, 'learning_rate': 2.0114455432029445e-06, 'epoch': 1.59} {'loss': 0.494, 'learning_rate': 2.0112486379919506e-06, 'epoch': 1.59} {'loss': 0.5503, 'learning_rate': 2.011051741341623e-06, 'epoch': 1.59} {'loss': 0.4078, 'learning_rate': 2.0108548532521788e-06, 'epoch': 1.59} {'loss': 0.6785, 'learning_rate': 2.0106579737238184e-06, 'epoch': 1.59} {'loss': 0.5104, 'learning_rate': 2.0104611027567657e-06, 'epoch': 1.59} {'loss': 0.4192, 'learning_rate': 2.0102642403512183e-06, 'epoch': 1.59} {'loss': 0.5064, 'learning_rate': 2.0100673865073995e-06, 'epoch': 1.59} {'loss': 0.4921, 'learning_rate': 2.0098705412255126e-06, 'epoch': 1.59} {'loss': 0.5319, 'learning_rate': 2.00967370450577e-06, 'epoch': 1.59} {'loss': 0.6013, 'learning_rate': 2.0094768763483863e-06, 'epoch': 1.59} {'loss': 0.458, 'learning_rate': 2.009280056753563e-06, 'epoch': 1.59} {'loss': 0.6191, 'learning_rate': 2.009083245721524e-06, 'epoch': 1.59} {'loss': 0.5687, 'learning_rate': 2.0088864432524666e-06, 'epoch': 1.59} {'loss': 0.5321, 'learning_rate': 2.0086896493466156e-06, 'epoch': 1.59} {'loss': 0.5121, 'learning_rate': 2.008492864004171e-06, 'epoch': 1.59} {'loss': 0.3767, 'learning_rate': 2.0082960872253487e-06, 'epoch': 1.59} {'loss': 0.5604, 'learning_rate': 2.0080993190103605e-06, 'epoch': 1.59} {'loss': 0.4485, 'learning_rate': 2.0079025593594104e-06, 'epoch': 1.59} {'loss': 0.5639, 'learning_rate': 2.0077058082727185e-06, 'epoch': 1.59} {'loss': 0.4875, 'learning_rate': 2.007509065750486e-06, 'epoch': 1.59} {'loss': 0.5739, 'learning_rate': 2.0073123317929344e-06, 'epoch': 1.59} {'loss': 0.5823, 'learning_rate': 2.007115606400266e-06, 'epoch': 1.59} {'loss': 0.4421, 'learning_rate': 2.0069188895726955e-06, 'epoch': 1.59} {'loss': 0.616, 'learning_rate': 2.0067221813104355e-06, 'epoch': 1.59} {'loss': 0.39, 'learning_rate': 2.0065254816136883e-06, 'epoch': 1.59} {'loss': 0.5996, 'learning_rate': 2.0063287904826756e-06, 'epoch': 1.59} {'loss': 0.4732, 'learning_rate': 2.0061321079176012e-06, 'epoch': 1.59} {'loss': 0.3797, 'learning_rate': 2.0059354339186765e-06, 'epoch': 1.59} {'loss': 0.526, 'learning_rate': 2.005738768486114e-06, 'epoch': 1.59} {'loss': 0.5788, 'learning_rate': 2.0055421116201248e-06, 'epoch': 1.59} {'loss': 0.6455, 'learning_rate': 2.00534546332092e-06, 'epoch': 1.59} {'loss': 0.51, 'learning_rate': 2.005148823588705e-06, 'epoch': 1.59} {'loss': 0.473, 'learning_rate': 2.004952192423699e-06, 'epoch': 1.59} {'loss': 0.6287, 'learning_rate': 2.004755569826107e-06, 'epoch': 1.59} {'loss': 0.513, 'learning_rate': 2.00455895579614e-06, 'epoch': 1.59} {'loss': 0.5118, 'learning_rate': 2.0043623503340095e-06, 'epoch': 1.59} {'loss': 0.5245, 'learning_rate': 2.0041657534399273e-06, 'epoch': 1.59} {'loss': 0.4576, 'learning_rate': 2.0039691651141047e-06, 'epoch': 1.59} {'loss': 0.5687, 'learning_rate': 2.003772585356746e-06, 'epoch': 1.59} {'loss': 0.4019, 'learning_rate': 2.0035760141680727e-06, 'epoch': 1.59} {'loss': 0.2532, 'learning_rate': 2.003379451548285e-06, 'epoch': 1.59} {'loss': 0.5632, 'learning_rate': 2.0031828974976e-06, 'epoch': 1.59} {'loss': 0.5261, 'learning_rate': 2.002986352016225e-06, 'epoch': 1.59} {'loss': 0.5892, 'learning_rate': 2.0027898151043724e-06, 'epoch': 1.59} {'loss': 0.6396, 'learning_rate': 2.0025932867622544e-06, 'epoch': 1.59} {'loss': 0.5298, 'learning_rate': 2.0023967669900778e-06, 'epoch': 1.59} {'loss': 0.4729, 'learning_rate': 2.0022002557880547e-06, 'epoch': 1.59} {'loss': 0.5159, 'learning_rate': 2.0020037531563953e-06, 'epoch': 1.59} {'loss': 0.7409, 'learning_rate': 2.001807259095311e-06, 'epoch': 1.59} {'loss': 0.4663, 'learning_rate': 2.001610773605015e-06, 'epoch': 1.59} {'loss': 0.6862, 'learning_rate': 2.0014142966857085e-06, 'epoch': 1.59} {'loss': 0.4319, 'learning_rate': 2.001217828337615e-06, 'epoch': 1.59} {'loss': 0.434, 'learning_rate': 2.0010213685609357e-06, 'epoch': 1.59} {'loss': 0.5872, 'learning_rate': 2.0008249173558835e-06, 'epoch': 1.59} {'loss': 0.5259, 'learning_rate': 2.00062847472267e-06, 'epoch': 1.59} {'loss': 0.5046, 'learning_rate': 2.0004320406615053e-06, 'epoch': 1.59} {'loss': 0.5693, 'learning_rate': 2.000235615172602e-06, 'epoch': 1.59} {'loss': 0.4361, 'learning_rate': 2.0000391982561627e-06, 'epoch': 1.59} {'loss': 0.5923, 'learning_rate': 1.9998427899124086e-06, 'epoch': 1.59} {'loss': 0.4135, 'learning_rate': 1.9996463901415433e-06, 'epoch': 1.59} {'loss': 0.5758, 'learning_rate': 1.999449998943778e-06, 'epoch': 1.59} {'loss': 0.561, 'learning_rate': 1.999253616319324e-06, 'epoch': 1.59} {'loss': 0.4484, 'learning_rate': 1.999057242268392e-06, 'epoch': 1.59} {'loss': 0.4983, 'learning_rate': 1.9988608767911953e-06, 'epoch': 1.59} {'loss': 0.5158, 'learning_rate': 1.9986645198879385e-06, 'epoch': 1.59} {'loss': 0.5001, 'learning_rate': 1.998468171558835e-06, 'epoch': 1.59} {'loss': 0.5435, 'learning_rate': 1.998271831804095e-06, 'epoch': 1.59} {'loss': 0.5622, 'learning_rate': 1.9980755006239283e-06, 'epoch': 1.59} {'loss': 0.5745, 'learning_rate': 1.997879178018547e-06, 'epoch': 1.59} {'loss': 0.4419, 'learning_rate': 1.9976828639881594e-06, 'epoch': 1.59} {'loss': 0.557, 'learning_rate': 1.9974865585329807e-06, 'epoch': 1.59} {'loss': 0.5536, 'learning_rate': 1.997290261653214e-06, 'epoch': 1.59} {'loss': 0.513, 'learning_rate': 1.9970939733490724e-06, 'epoch': 1.59} {'loss': 0.4233, 'learning_rate': 1.9968976936207683e-06, 'epoch': 1.59} {'loss': 0.5781, 'learning_rate': 1.9967014224685098e-06, 'epoch': 1.59} {'loss': 0.5288, 'learning_rate': 1.9965051598925076e-06, 'epoch': 1.59} {'loss': 0.3625, 'learning_rate': 1.9963089058929763e-06, 'epoch': 1.59} {'loss': 0.4562, 'learning_rate': 1.99611266047012e-06, 'epoch': 1.59} {'loss': 0.3957, 'learning_rate': 1.99591642362415e-06, 'epoch': 1.59} {'loss': 0.5188, 'learning_rate': 1.9957201953552785e-06, 'epoch': 1.59} {'loss': 0.4499, 'learning_rate': 1.9955239756637156e-06, 'epoch': 1.59} {'loss': 0.4047, 'learning_rate': 1.9953277645496703e-06, 'epoch': 1.59} {'loss': 0.4633, 'learning_rate': 1.995131562013355e-06, 'epoch': 1.59} {'loss': 0.5816, 'learning_rate': 1.994935368054981e-06, 'epoch': 1.59} {'loss': 0.5176, 'learning_rate': 1.994739182674753e-06, 'epoch': 1.59} {'loss': 0.5011, 'learning_rate': 1.9945430058728854e-06, 'epoch': 1.59} {'loss': 0.4924, 'learning_rate': 1.9943468376495867e-06, 'epoch': 1.59} {'loss': 0.4077, 'learning_rate': 1.9941506780050677e-06, 'epoch': 1.59} {'loss': 0.478, 'learning_rate': 1.99395452693954e-06, 'epoch': 1.59} {'loss': 0.538, 'learning_rate': 1.9937583844532114e-06, 'epoch': 1.59} {'loss': 0.4278, 'learning_rate': 1.993562250546297e-06, 'epoch': 1.59} {'loss': 0.3221, 'learning_rate': 1.9933661252189996e-06, 'epoch': 1.59} {'loss': 0.4782, 'learning_rate': 1.9931700084715334e-06, 'epoch': 1.59} {'loss': 0.616, 'learning_rate': 1.992973900304108e-06, 'epoch': 1.59} {'loss': 0.558, 'learning_rate': 1.992777800716934e-06, 'epoch': 1.59} {'loss': 0.4316, 'learning_rate': 1.992581709710224e-06, 'epoch': 1.59} {'loss': 0.4049, 'learning_rate': 1.9923856272841802e-06, 'epoch': 1.59} {'loss': 0.4773, 'learning_rate': 1.9921895534390234e-06, 'epoch': 1.59} {'loss': 0.4232, 'learning_rate': 1.9919934881749558e-06, 'epoch': 1.59} {'loss': 0.5445, 'learning_rate': 1.9917974314921895e-06, 'epoch': 1.59} {'loss': 0.4684, 'learning_rate': 1.9916013833909342e-06, 'epoch': 1.59} {'loss': 0.5523, 'learning_rate': 1.991405343871402e-06, 'epoch': 1.59} {'loss': 0.514, 'learning_rate': 1.991209312933804e-06, 'epoch': 1.59} {'loss': 0.5818, 'learning_rate': 1.991013290578343e-06, 'epoch': 1.59} {'loss': 0.5192, 'learning_rate': 1.990817276805239e-06, 'epoch': 1.59} {'loss': 0.366, 'learning_rate': 1.9906212716146954e-06, 'epoch': 1.59} {'loss': 0.6958, 'learning_rate': 1.990425275006923e-06, 'epoch': 1.59} {'loss': 0.3715, 'learning_rate': 1.9902292869821336e-06, 'epoch': 1.59} {'loss': 0.5103, 'learning_rate': 1.9900333075405356e-06, 'epoch': 1.59} {'loss': 0.6247, 'learning_rate': 1.989837336682343e-06, 'epoch': 1.59} {'loss': 0.4709, 'learning_rate': 1.989641374407757e-06, 'epoch': 1.59} {'loss': 0.6399, 'learning_rate': 1.989445420716999e-06, 'epoch': 1.59} {'loss': 0.5587, 'learning_rate': 1.989249475610271e-06, 'epoch': 1.59} {'loss': 0.5784, 'learning_rate': 1.9890535390877842e-06, 'epoch': 1.59} {'loss': 0.5848, 'learning_rate': 1.9888576111497527e-06, 'epoch': 1.59} {'loss': 0.5314, 'learning_rate': 1.9886616917963784e-06, 'epoch': 1.59} {'loss': 0.4902, 'learning_rate': 1.9884657810278805e-06, 'epoch': 1.59} {'loss': 0.4209, 'learning_rate': 1.98826987884446e-06, 'epoch': 1.59} {'loss': 0.5106, 'learning_rate': 1.988073985246337e-06, 'epoch': 1.59} {'loss': 0.5227, 'learning_rate': 1.9878781002337123e-06, 'epoch': 1.59} {'loss': 0.5108, 'learning_rate': 1.9876822238067993e-06, 'epoch': 1.59} {'loss': 0.4325, 'learning_rate': 1.987486355965812e-06, 'epoch': 1.59} {'loss': 0.458, 'learning_rate': 1.9872904967109497e-06, 'epoch': 1.59} {'loss': 0.594, 'learning_rate': 1.9870946460424345e-06, 'epoch': 1.59} {'loss': 0.3799, 'learning_rate': 1.9868988039604676e-06, 'epoch': 1.59} {'loss': 0.37, 'learning_rate': 1.986702970465263e-06, 'epoch': 1.59} {'loss': 0.4755, 'learning_rate': 1.9865071455570283e-06, 'epoch': 1.59} {'loss': 0.367, 'learning_rate': 1.9863113292359748e-06, 'epoch': 1.59} {'loss': 0.3357, 'learning_rate': 1.986115521502314e-06, 'epoch': 1.59} {'loss': 0.5432, 'learning_rate': 1.98591972235625e-06, 'epoch': 1.59} {'loss': 0.5223, 'learning_rate': 1.9857239317980003e-06, 'epoch': 1.59} {'loss': 0.5243, 'learning_rate': 1.985528149827768e-06, 'epoch': 1.59} {'loss': 0.5007, 'learning_rate': 1.9853323764457668e-06, 'epoch': 1.59} {'loss': 0.5388, 'learning_rate': 1.985136611652204e-06, 'epoch': 1.59} {'loss': 0.5331, 'learning_rate': 1.9849408554472913e-06, 'epoch': 1.59} {'loss': 0.6458, 'learning_rate': 1.984745107831241e-06, 'epoch': 1.59} {'loss': 0.6249, 'learning_rate': 1.9845493688042537e-06, 'epoch': 1.59} {'loss': 0.6262, 'learning_rate': 1.9843536383665507e-06, 'epoch': 1.59} {'loss': 0.4581, 'learning_rate': 1.984157916518333e-06, 'epoch': 1.59} {'loss': 0.5564, 'learning_rate': 1.983962203259815e-06, 'epoch': 1.59} {'loss': 0.4262, 'learning_rate': 1.9837664985912063e-06, 'epoch': 1.59} {'loss': 0.4788, 'learning_rate': 1.983570802512711e-06, 'epoch': 1.59} {'loss': 0.4969, 'learning_rate': 1.9833751150245483e-06, 'epoch': 1.59} {'loss': 0.4596, 'learning_rate': 1.9831794361269176e-06, 'epoch': 1.59} {'loss': 0.4465, 'learning_rate': 1.9829837658200378e-06, 'epoch': 1.59} {'loss': 0.5203, 'learning_rate': 1.982788104104113e-06, 'epoch': 1.59} {'loss': 0.6908, 'learning_rate': 1.9825924509793537e-06, 'epoch': 1.59} {'loss': 0.5017, 'learning_rate': 1.982396806445973e-06, 'epoch': 1.59} {'loss': 0.5421, 'learning_rate': 1.9822011705041723e-06, 'epoch': 1.59} {'loss': 0.6094, 'learning_rate': 1.982005543154172e-06, 'epoch': 1.59} {'loss': 0.5435, 'learning_rate': 1.981809924396172e-06, 'epoch': 1.59} {'loss': 0.6277, 'learning_rate': 1.9816143142303903e-06, 'epoch': 1.59} {'loss': 0.6147, 'learning_rate': 1.9814187126570306e-06, 'epoch': 1.59} {'loss': 0.4196, 'learning_rate': 1.9812231196763044e-06, 'epoch': 1.59} {'loss': 0.458, 'learning_rate': 1.9810275352884247e-06, 'epoch': 1.59} {'loss': 0.52, 'learning_rate': 1.980831959493591e-06, 'epoch': 1.59} {'loss': 0.5858, 'learning_rate': 1.9806363922920256e-06, 'epoch': 1.59} {'loss': 0.4309, 'learning_rate': 1.9804408336839278e-06, 'epoch': 1.59} {'loss': 0.4846, 'learning_rate': 1.9802452836695153e-06, 'epoch': 1.59} {'loss': 0.3395, 'learning_rate': 1.9800497422489916e-06, 'epoch': 1.59} {'loss': 0.4206, 'learning_rate': 1.979854209422569e-06, 'epoch': 1.59} {'loss': 0.607, 'learning_rate': 1.9796586851904586e-06, 'epoch': 1.59} {'loss': 0.6188, 'learning_rate': 1.979463169552862e-06, 'epoch': 1.59} {'loss': 0.5106, 'learning_rate': 1.9792676625100016e-06, 'epoch': 1.59} {'loss': 0.592, 'learning_rate': 1.9790721640620757e-06, 'epoch': 1.59} {'loss': 0.6422, 'learning_rate': 1.978876674209298e-06, 'epoch': 1.59} {'loss': 0.5347, 'learning_rate': 1.978681192951878e-06, 'epoch': 1.59} {'loss': 0.513, 'learning_rate': 1.9784857202900254e-06, 'epoch': 1.59} {'loss': 0.5325, 'learning_rate': 1.9782902562239513e-06, 'epoch': 1.59} {'loss': 0.5672, 'learning_rate': 1.9780948007538593e-06, 'epoch': 1.59} {'loss': 0.363, 'learning_rate': 1.9778993538799663e-06, 'epoch': 1.59} {'loss': 0.4375, 'learning_rate': 1.977703915602477e-06, 'epoch': 1.59} {'loss': 0.525, 'learning_rate': 1.977508485921601e-06, 'epoch': 1.59} {'loss': 0.5949, 'learning_rate': 1.977313064837549e-06, 'epoch': 1.59} {'loss': 0.502, 'learning_rate': 1.97711765235053e-06, 'epoch': 1.59} {'loss': 0.5009, 'learning_rate': 1.9769222484607566e-06, 'epoch': 1.59} {'loss': 0.5856, 'learning_rate': 1.976726853168429e-06, 'epoch': 1.59} {'loss': 0.5079, 'learning_rate': 1.976531466473769e-06, 'epoch': 1.59} {'loss': 0.559, 'learning_rate': 1.9763360883769767e-06, 'epoch': 1.59} {'loss': 0.626, 'learning_rate': 1.9761407188782645e-06, 'epoch': 1.59} {'loss': 0.6493, 'learning_rate': 1.975945357977842e-06, 'epoch': 1.59} {'loss': 0.5773, 'learning_rate': 1.9757500056759183e-06, 'epoch': 1.59} {'loss': 0.5349, 'learning_rate': 1.975554661972705e-06, 'epoch': 1.59} {'loss': 0.474, 'learning_rate': 1.9753593268684055e-06, 'epoch': 1.59} {'loss': 0.4846, 'learning_rate': 1.9751640003632344e-06, 'epoch': 1.59} {'loss': 0.4761, 'learning_rate': 1.974968682457399e-06, 'epoch': 1.59} {'loss': 0.4246, 'learning_rate': 1.9747733731511086e-06, 'epoch': 1.59} {'loss': 0.3942, 'learning_rate': 1.974578072444573e-06, 'epoch': 1.59} {'loss': 0.4341, 'learning_rate': 1.974382780338001e-06, 'epoch': 1.59} {'loss': 0.6484, 'learning_rate': 1.9741874968316056e-06, 'epoch': 1.59} {'loss': 0.5155, 'learning_rate': 1.973992221925589e-06, 'epoch': 1.59} {'loss': 0.6475, 'learning_rate': 1.9737969556201655e-06, 'epoch': 1.59} {'loss': 0.5478, 'learning_rate': 1.9736016979155416e-06, 'epoch': 1.59} {'loss': 0.6017, 'learning_rate': 1.9734064488119286e-06, 'epoch': 1.59} {'loss': 0.444, 'learning_rate': 1.9732112083095347e-06, 'epoch': 1.59} {'loss': 0.5053, 'learning_rate': 1.97301597640857e-06, 'epoch': 1.59} {'loss': 0.5223, 'learning_rate': 1.9728207531092446e-06, 'epoch': 1.59} {'loss': 0.535, 'learning_rate': 1.9726255384117644e-06, 'epoch': 1.59} {'loss': 0.4509, 'learning_rate': 1.972430332316341e-06, 'epoch': 1.59} {'loss': 0.444, 'learning_rate': 1.9722351348231827e-06, 'epoch': 1.59} {'loss': 0.5303, 'learning_rate': 1.972039945932499e-06, 'epoch': 1.59} {'loss': 0.3876, 'learning_rate': 1.9718447656444985e-06, 'epoch': 1.59} {'loss': 0.4524, 'learning_rate': 1.9716495939593937e-06, 'epoch': 1.59} {'loss': 0.6141, 'learning_rate': 1.9714544308773887e-06, 'epoch': 1.59} {'loss': 0.4258, 'learning_rate': 1.9712592763986948e-06, 'epoch': 1.59} {'loss': 0.4892, 'learning_rate': 1.971064130523521e-06, 'epoch': 1.59} {'loss': 0.549, 'learning_rate': 1.9708689932520776e-06, 'epoch': 1.59} {'loss': 0.4504, 'learning_rate': 1.9706738645845714e-06, 'epoch': 1.59} {'loss': 0.6063, 'learning_rate': 1.970478744521216e-06, 'epoch': 1.59} {'loss': 0.4268, 'learning_rate': 1.9702836330622157e-06, 'epoch': 1.59} {'loss': 0.5813, 'learning_rate': 1.97008853020778e-06, 'epoch': 1.59} {'loss': 0.5958, 'learning_rate': 1.969893435958119e-06, 'epoch': 1.59} {'loss': 0.4349, 'learning_rate': 1.9696983503134425e-06, 'epoch': 1.59} {'loss': 0.3977, 'learning_rate': 1.9695032732739595e-06, 'epoch': 1.59} {'loss': 0.5646, 'learning_rate': 1.9693082048398773e-06, 'epoch': 1.59} {'loss': 0.3283, 'learning_rate': 1.96911314501141e-06, 'epoch': 1.59} {'loss': 0.5256, 'learning_rate': 1.96891809378876e-06, 'epoch': 1.59} {'loss': 0.4348, 'learning_rate': 1.9687230511721376e-06, 'epoch': 1.59} {'loss': 0.4365, 'learning_rate': 1.968528017161755e-06, 'epoch': 1.59} {'loss': 0.6625, 'learning_rate': 1.9683329917578186e-06, 'epoch': 1.59} {'loss': 0.4542, 'learning_rate': 1.968137974960539e-06, 'epoch': 1.59} {'loss': 0.4285, 'learning_rate': 1.9679429667701266e-06, 'epoch': 1.6} {'loss': 0.4138, 'learning_rate': 1.967747967186786e-06, 'epoch': 1.6} {'loss': 0.6876, 'learning_rate': 1.9675529762107284e-06, 'epoch': 1.6} {'loss': 0.3963, 'learning_rate': 1.967357993842163e-06, 'epoch': 1.6} {'loss': 0.6153, 'learning_rate': 1.9671630200812975e-06, 'epoch': 1.6} {'loss': 0.5269, 'learning_rate': 1.966968054928342e-06, 'epoch': 1.6} {'loss': 0.5027, 'learning_rate': 1.9667730983835064e-06, 'epoch': 1.6} {'loss': 0.5372, 'learning_rate': 1.9665781504470006e-06, 'epoch': 1.6} {'loss': 0.3694, 'learning_rate': 1.9663832111190286e-06, 'epoch': 1.6} {'loss': 0.5196, 'learning_rate': 1.966188280399801e-06, 'epoch': 1.6} {'loss': 0.3148, 'learning_rate': 1.9659933582895296e-06, 'epoch': 1.6} {'loss': 0.57, 'learning_rate': 1.9657984447884206e-06, 'epoch': 1.6} {'loss': 0.5348, 'learning_rate': 1.965603539896683e-06, 'epoch': 1.6} {'loss': 0.5019, 'learning_rate': 1.965408643614527e-06, 'epoch': 1.6} {'loss': 0.4586, 'learning_rate': 1.9652137559421635e-06, 'epoch': 1.6} {'loss': 0.6175, 'learning_rate': 1.9650188768797963e-06, 'epoch': 1.6} {'loss': 0.6668, 'learning_rate': 1.964824006427636e-06, 'epoch': 1.6} {'loss': 0.5602, 'learning_rate': 1.9646291445858923e-06, 'epoch': 1.6} {'loss': 0.3476, 'learning_rate': 1.9644342913547744e-06, 'epoch': 1.6} {'loss': 0.4779, 'learning_rate': 1.964239446734492e-06, 'epoch': 1.6} {'loss': 0.447, 'learning_rate': 1.9640446107252474e-06, 'epoch': 1.6} {'loss': 0.3762, 'learning_rate': 1.9638497833272597e-06, 'epoch': 1.6} {'loss': 0.4362, 'learning_rate': 1.963654964540729e-06, 'epoch': 1.6} {'loss': 0.4649, 'learning_rate': 1.9634601543658683e-06, 'epoch': 1.6} {'loss': 0.412, 'learning_rate': 1.9632653528028843e-06, 'epoch': 1.6} {'loss': 0.6135, 'learning_rate': 1.963070559851987e-06, 'epoch': 1.6} {'loss': 0.4606, 'learning_rate': 1.9628757755133886e-06, 'epoch': 1.6} {'loss': 0.4242, 'learning_rate': 1.9626809997872876e-06, 'epoch': 1.6} {'loss': 0.3916, 'learning_rate': 1.9624862326739056e-06, 'epoch': 1.6} {'loss': 0.5613, 'learning_rate': 1.9622914741734423e-06, 'epoch': 1.6} {'loss': 0.4672, 'learning_rate': 1.962096724286109e-06, 'epoch': 1.6} {'loss': 0.6842, 'learning_rate': 1.9619019830121167e-06, 'epoch': 1.6} {'loss': 0.4535, 'learning_rate': 1.961707250351668e-06, 'epoch': 1.6} {'loss': 0.5772, 'learning_rate': 1.9615125263049794e-06, 'epoch': 1.6} {'loss': 0.4791, 'learning_rate': 1.961317810872251e-06, 'epoch': 1.6} {'loss': 0.5904, 'learning_rate': 1.9611231040537003e-06, 'epoch': 1.6} {'loss': 0.5721, 'learning_rate': 1.96092840584953e-06, 'epoch': 1.6} {'loss': 0.5037, 'learning_rate': 1.9607337162599506e-06, 'epoch': 1.6} {'loss': 0.5645, 'learning_rate': 1.9605390352851726e-06, 'epoch': 1.6} {'loss': 0.5428, 'learning_rate': 1.960344362925398e-06, 'epoch': 1.6} {'loss': 0.4493, 'learning_rate': 1.9601496991808454e-06, 'epoch': 1.6} {'loss': 0.5188, 'learning_rate': 1.9599550440517125e-06, 'epoch': 1.6} {'loss': 0.5393, 'learning_rate': 1.9597603975382184e-06, 'epoch': 1.6} {'loss': 0.4921, 'learning_rate': 1.9595657596405647e-06, 'epoch': 1.6} {'loss': 0.6762, 'learning_rate': 1.9593711303589623e-06, 'epoch': 1.6} {'loss': 0.5333, 'learning_rate': 1.959176509693621e-06, 'epoch': 1.6} {'loss': 0.4803, 'learning_rate': 1.958981897644743e-06, 'epoch': 1.6} {'loss': 0.4935, 'learning_rate': 1.9587872942125473e-06, 'epoch': 1.6} {'loss': 0.4844, 'learning_rate': 1.9585926993972306e-06, 'epoch': 1.6} {'loss': 0.4199, 'learning_rate': 1.9583981131990138e-06, 'epoch': 1.6} {'loss': 0.4579, 'learning_rate': 1.958203535618096e-06, 'epoch': 1.6} {'loss': 0.5674, 'learning_rate': 1.9580089666546885e-06, 'epoch': 1.6} {'loss': 0.454, 'learning_rate': 1.9578144063090045e-06, 'epoch': 1.6} {'loss': 0.5077, 'learning_rate': 1.957619854581242e-06, 'epoch': 1.6} {'loss': 0.5017, 'learning_rate': 1.95742531147162e-06, 'epoch': 1.6} {'loss': 0.4461, 'learning_rate': 1.957230776980341e-06, 'epoch': 1.6} {'loss': 0.5681, 'learning_rate': 1.957036251107616e-06, 'epoch': 1.6} {'loss': 0.4116, 'learning_rate': 1.9568417338536505e-06, 'epoch': 1.6} {'loss': 0.41, 'learning_rate': 1.956647225218656e-06, 'epoch': 1.6} {'loss': 0.4704, 'learning_rate': 1.956452725202843e-06, 'epoch': 1.6} {'loss': 0.4727, 'learning_rate': 1.9562582338064116e-06, 'epoch': 1.6} {'loss': 0.6373, 'learning_rate': 1.956063751029581e-06, 'epoch': 1.6} {'loss': 0.6529, 'learning_rate': 1.955869276872551e-06, 'epoch': 1.6} {'loss': 0.4762, 'learning_rate': 1.955674811335533e-06, 'epoch': 1.6} {'loss': 0.6278, 'learning_rate': 1.9554803544187352e-06, 'epoch': 1.6} {'loss': 0.6468, 'learning_rate': 1.9552859061223663e-06, 'epoch': 1.6} {'loss': 0.6007, 'learning_rate': 1.9550914664466382e-06, 'epoch': 1.6} {'loss': 0.6503, 'learning_rate': 1.9548970353917494e-06, 'epoch': 1.6} {'loss': 0.6581, 'learning_rate': 1.9547026129579204e-06, 'epoch': 1.6} {'loss': 0.4492, 'learning_rate': 1.9545081991453507e-06, 'epoch': 1.6} {'loss': 0.4242, 'learning_rate': 1.954313793954252e-06, 'epoch': 1.6} {'loss': 0.4622, 'learning_rate': 1.954119397384835e-06, 'epoch': 1.6} {'loss': 0.4469, 'learning_rate': 1.9539250094373e-06, 'epoch': 1.6} {'loss': 0.6359, 'learning_rate': 1.9537306301118642e-06, 'epoch': 1.6} {'loss': 0.6373, 'learning_rate': 1.953536259408728e-06, 'epoch': 1.6} {'loss': 0.4346, 'learning_rate': 1.9533418973281103e-06, 'epoch': 1.6} {'loss': 0.5079, 'learning_rate': 1.9531475438702096e-06, 'epoch': 1.6} {'loss': 0.5619, 'learning_rate': 1.952953199035237e-06, 'epoch': 1.6} {'loss': 0.4171, 'learning_rate': 1.952758862823405e-06, 'epoch': 1.6} {'loss': 0.4205, 'learning_rate': 1.9525645352349122e-06, 'epoch': 1.6} {'loss': 0.4217, 'learning_rate': 1.9523702162699787e-06, 'epoch': 1.6} {'loss': 0.5477, 'learning_rate': 1.9521759059288003e-06, 'epoch': 1.6} {'loss': 0.3305, 'learning_rate': 1.951981604211598e-06, 'epoch': 1.6} {'loss': 0.3555, 'learning_rate': 1.9517873111185714e-06, 'epoch': 1.6} {'loss': 0.5778, 'learning_rate': 1.9515930266499305e-06, 'epoch': 1.6} {'loss': 0.4252, 'learning_rate': 1.9513987508058875e-06, 'epoch': 1.6} {'loss': 0.6558, 'learning_rate': 1.951204483586642e-06, 'epoch': 1.6} {'loss': 0.552, 'learning_rate': 1.951010224992411e-06, 'epoch': 1.6} {'loss': 0.4973, 'learning_rate': 1.950815975023398e-06, 'epoch': 1.6} {'loss': 0.4855, 'learning_rate': 1.9506217336798117e-06, 'epoch': 1.6} {'loss': 0.4403, 'learning_rate': 1.95042750096186e-06, 'epoch': 1.6} {'loss': 0.5548, 'learning_rate': 1.9502332768697516e-06, 'epoch': 1.6} {'loss': 0.5573, 'learning_rate': 1.950039061403699e-06, 'epoch': 1.6} {'loss': 0.4565, 'learning_rate': 1.9498448545639006e-06, 'epoch': 1.6} {'loss': 0.5208, 'learning_rate': 1.9496506563505737e-06, 'epoch': 1.6} {'loss': 0.3856, 'learning_rate': 1.9494564667639216e-06, 'epoch': 1.6} {'loss': 0.4583, 'learning_rate': 1.949262285804152e-06, 'epoch': 1.6} {'loss': 0.5539, 'learning_rate': 1.9490681134714763e-06, 'epoch': 1.6} {'loss': 0.7186, 'learning_rate': 1.9488739497660993e-06, 'epoch': 1.6} {'loss': 0.4576, 'learning_rate': 1.948679794688234e-06, 'epoch': 1.6} {'loss': 0.4646, 'learning_rate': 1.94848564823808e-06, 'epoch': 1.6} {'loss': 0.6315, 'learning_rate': 1.948291510415854e-06, 'epoch': 1.6} {'loss': 0.5378, 'learning_rate': 1.9480973812217597e-06, 'epoch': 1.6} {'loss': 0.4661, 'learning_rate': 1.9479032606560046e-06, 'epoch': 1.6} {'loss': 0.4253, 'learning_rate': 1.9477091487187982e-06, 'epoch': 1.6} {'loss': 0.6126, 'learning_rate': 1.9475150454103475e-06, 'epoch': 1.6} {'loss': 0.5314, 'learning_rate': 1.9473209507308644e-06, 'epoch': 1.6} {'loss': 0.5621, 'learning_rate': 1.947126864680552e-06, 'epoch': 1.6} {'loss': 0.539, 'learning_rate': 1.946932787259619e-06, 'epoch': 1.6} {'loss': 0.4805, 'learning_rate': 1.946738718468274e-06, 'epoch': 1.6} {'loss': 0.6364, 'learning_rate': 1.9465446583067262e-06, 'epoch': 1.6} {'loss': 0.6556, 'learning_rate': 1.9463506067751824e-06, 'epoch': 1.6} {'loss': 0.4717, 'learning_rate': 1.94615656387385e-06, 'epoch': 1.6} {'loss': 0.6337, 'learning_rate': 1.9459625296029418e-06, 'epoch': 1.6} {'loss': 0.4575, 'learning_rate': 1.9457685039626583e-06, 'epoch': 1.6} {'loss': 0.5354, 'learning_rate': 1.94557448695321e-06, 'epoch': 1.6} {'loss': 0.472, 'learning_rate': 1.9453804785748065e-06, 'epoch': 1.6} {'loss': 0.5927, 'learning_rate': 1.9451864788276553e-06, 'epoch': 1.6} {'loss': 0.6438, 'learning_rate': 1.944992487711963e-06, 'epoch': 1.6} {'loss': 0.599, 'learning_rate': 1.9447985052279404e-06, 'epoch': 1.6} {'loss': 0.5833, 'learning_rate': 1.944604531375792e-06, 'epoch': 1.6} {'loss': 0.5457, 'learning_rate': 1.9444105661557257e-06, 'epoch': 1.6} {'loss': 0.471, 'learning_rate': 1.9442166095679516e-06, 'epoch': 1.6} {'loss': 0.5317, 'learning_rate': 1.9440226616126757e-06, 'epoch': 1.6} {'loss': 0.4277, 'learning_rate': 1.9438287222901064e-06, 'epoch': 1.6} {'loss': 0.5024, 'learning_rate': 1.9436347916004515e-06, 'epoch': 1.6} {'loss': 0.6554, 'learning_rate': 1.9434408695439233e-06, 'epoch': 1.6} {'loss': 0.6942, 'learning_rate': 1.943246956120721e-06, 'epoch': 1.6} {'loss': 0.4534, 'learning_rate': 1.9430530513310575e-06, 'epoch': 1.6} {'loss': 0.4776, 'learning_rate': 1.9428591551751395e-06, 'epoch': 1.6} {'loss': 0.3448, 'learning_rate': 1.9426652676531767e-06, 'epoch': 1.6} {'loss': 0.4918, 'learning_rate': 1.9424713887653735e-06, 'epoch': 1.6} {'loss': 0.4268, 'learning_rate': 1.9422775185119404e-06, 'epoch': 1.6} {'loss': 0.5567, 'learning_rate': 1.9420836568930857e-06, 'epoch': 1.6} {'loss': 0.6297, 'learning_rate': 1.941889803909014e-06, 'epoch': 1.6} {'loss': 0.4594, 'learning_rate': 1.941695959559934e-06, 'epoch': 1.6} {'loss': 0.5401, 'learning_rate': 1.941502123846055e-06, 'epoch': 1.6} {'loss': 0.5309, 'learning_rate': 1.9413082967675833e-06, 'epoch': 1.6} {'loss': 0.6226, 'learning_rate': 1.9411144783247293e-06, 'epoch': 1.6} {'loss': 0.4713, 'learning_rate': 1.940920668517694e-06, 'epoch': 1.6} {'loss': 0.6591, 'learning_rate': 1.940726867346694e-06, 'epoch': 1.6} {'loss': 0.4813, 'learning_rate': 1.94053307481193e-06, 'epoch': 1.6} {'loss': 0.5999, 'learning_rate': 1.940339290913613e-06, 'epoch': 1.6} {'loss': 0.4298, 'learning_rate': 1.94014551565195e-06, 'epoch': 1.6} {'loss': 0.5138, 'learning_rate': 1.939951749027148e-06, 'epoch': 1.6} {'loss': 0.64, 'learning_rate': 1.939757991039417e-06, 'epoch': 1.6} {'loss': 0.4863, 'learning_rate': 1.9395642416889616e-06, 'epoch': 1.6} {'loss': 0.5572, 'learning_rate': 1.93937050097599e-06, 'epoch': 1.6} {'loss': 0.4042, 'learning_rate': 1.9391767689007103e-06, 'epoch': 1.6} {'loss': 0.4941, 'learning_rate': 1.9389830454633306e-06, 'epoch': 1.6} {'loss': 0.4521, 'learning_rate': 1.938789330664057e-06, 'epoch': 1.6} {'loss': 0.7236, 'learning_rate': 1.938595624503099e-06, 'epoch': 1.6} {'loss': 0.5567, 'learning_rate': 1.9384019269806663e-06, 'epoch': 1.6} {'loss': 0.5138, 'learning_rate': 1.9382082380969615e-06, 'epoch': 1.6} {'loss': 0.5813, 'learning_rate': 1.9380145578521923e-06, 'epoch': 1.6} {'loss': 0.326, 'learning_rate': 1.9378208862465697e-06, 'epoch': 1.6} {'loss': 0.4698, 'learning_rate': 1.9376272232802994e-06, 'epoch': 1.6} {'loss': 0.5294, 'learning_rate': 1.937433568953592e-06, 'epoch': 1.6} {'loss': 0.5421, 'learning_rate': 1.937239923266646e-06, 'epoch': 1.6} {'loss': 0.6021, 'learning_rate': 1.9370462862196803e-06, 'epoch': 1.6} {'loss': 0.4275, 'learning_rate': 1.9368526578128955e-06, 'epoch': 1.6} {'loss': 0.5618, 'learning_rate': 1.936659038046501e-06, 'epoch': 1.6} {'loss': 0.5457, 'learning_rate': 1.936465426920704e-06, 'epoch': 1.6} {'loss': 0.5384, 'learning_rate': 1.9362718244357115e-06, 'epoch': 1.6} {'loss': 0.4353, 'learning_rate': 1.9360782305917347e-06, 'epoch': 1.6} {'loss': 0.6216, 'learning_rate': 1.9358846453889724e-06, 'epoch': 1.6} {'loss': 0.4714, 'learning_rate': 1.935691068827642e-06, 'epoch': 1.6} {'loss': 0.4421, 'learning_rate': 1.9354975009079445e-06, 'epoch': 1.6} {'loss': 0.383, 'learning_rate': 1.93530394163009e-06, 'epoch': 1.6} {'loss': 0.4172, 'learning_rate': 1.9351103909942847e-06, 'epoch': 1.6} {'loss': 0.3597, 'learning_rate': 1.9349168490007364e-06, 'epoch': 1.6} {'loss': 0.5752, 'learning_rate': 1.9347233156496546e-06, 'epoch': 1.6} {'loss': 0.6296, 'learning_rate': 1.934529790941241e-06, 'epoch': 1.6} {'loss': 0.5865, 'learning_rate': 1.934336274875711e-06, 'epoch': 1.6} {'loss': 0.5129, 'learning_rate': 1.9341427674532643e-06, 'epoch': 1.6} {'loss': 0.4726, 'learning_rate': 1.9339492686741123e-06, 'epoch': 1.6} {'loss': 0.5559, 'learning_rate': 1.933755778538465e-06, 'epoch': 1.6} {'loss': 0.4159, 'learning_rate': 1.9335622970465207e-06, 'epoch': 1.6} {'loss': 0.5784, 'learning_rate': 1.933368824198497e-06, 'epoch': 1.6} {'loss': 0.5258, 'learning_rate': 1.9331753599945925e-06, 'epoch': 1.6} {'loss': 0.4401, 'learning_rate': 1.932981904435023e-06, 'epoch': 1.6} {'loss': 0.4698, 'learning_rate': 1.9327884575199896e-06, 'epoch': 1.6} {'loss': 0.5593, 'learning_rate': 1.9325950192497013e-06, 'epoch': 1.6} {'loss': 0.4474, 'learning_rate': 1.9324015896243675e-06, 'epoch': 1.6} {'loss': 0.6381, 'learning_rate': 1.9322081686441883e-06, 'epoch': 1.6} {'loss': 0.4867, 'learning_rate': 1.9320147563093826e-06, 'epoch': 1.6} {'loss': 0.3999, 'learning_rate': 1.9318213526201457e-06, 'epoch': 1.6} {'loss': 0.5138, 'learning_rate': 1.931627957576695e-06, 'epoch': 1.6} {'loss': 0.6419, 'learning_rate': 1.9314345711792305e-06, 'epoch': 1.6} {'loss': 0.6543, 'learning_rate': 1.931241193427963e-06, 'epoch': 1.6} {'loss': 0.5761, 'learning_rate': 1.9310478243231e-06, 'epoch': 1.6} {'loss': 0.5059, 'learning_rate': 1.930854463864844e-06, 'epoch': 1.6} {'loss': 0.5324, 'learning_rate': 1.93066111205341e-06, 'epoch': 1.6} {'loss': 0.4817, 'learning_rate': 1.930467768888996e-06, 'epoch': 1.6} {'loss': 0.5071, 'learning_rate': 1.9302744343718193e-06, 'epoch': 1.6} {'loss': 0.5605, 'learning_rate': 1.930081108502079e-06, 'epoch': 1.6} {'loss': 0.5313, 'learning_rate': 1.9298877912799853e-06, 'epoch': 1.6} {'loss': 0.5094, 'learning_rate': 1.9296944827057475e-06, 'epoch': 1.6} {'loss': 0.6079, 'learning_rate': 1.9295011827795653e-06, 'epoch': 1.6} {'loss': 0.4834, 'learning_rate': 1.929307891501657e-06, 'epoch': 1.6} {'loss': 0.3869, 'learning_rate': 1.9291146088722177e-06, 'epoch': 1.6} {'loss': 0.6046, 'learning_rate': 1.928921334891466e-06, 'epoch': 1.6} {'loss': 0.4619, 'learning_rate': 1.928728069559601e-06, 'epoch': 1.6} {'loss': 0.5862, 'learning_rate': 1.9285348128768323e-06, 'epoch': 1.6} {'loss': 0.3942, 'learning_rate': 1.928341564843369e-06, 'epoch': 1.6} {'loss': 0.6087, 'learning_rate': 1.9281483254594125e-06, 'epoch': 1.6} {'loss': 0.6216, 'learning_rate': 1.927955094725178e-06, 'epoch': 1.6} {'loss': 0.4507, 'learning_rate': 1.9277618726408653e-06, 'epoch': 1.6} {'loss': 0.5519, 'learning_rate': 1.9275686592066844e-06, 'epoch': 1.6} {'loss': 0.4834, 'learning_rate': 1.9273754544228427e-06, 'epoch': 1.6} {'loss': 0.5078, 'learning_rate': 1.927182258289546e-06, 'epoch': 1.6} {'loss': 0.4132, 'learning_rate': 1.926989070807005e-06, 'epoch': 1.6} {'loss': 0.5339, 'learning_rate': 1.9267958919754194e-06, 'epoch': 1.6} {'loss': 0.5353, 'learning_rate': 1.9266027217950056e-06, 'epoch': 1.6} {'loss': 0.5531, 'learning_rate': 1.9264095602659627e-06, 'epoch': 1.6} {'loss': 0.4484, 'learning_rate': 1.9262164073885003e-06, 'epoch': 1.6} {'loss': 0.5221, 'learning_rate': 1.926023263162826e-06, 'epoch': 1.6} {'loss': 0.4579, 'learning_rate': 1.9258301275891465e-06, 'epoch': 1.6} {'loss': 0.5449, 'learning_rate': 1.925637000667672e-06, 'epoch': 1.6} {'loss': 0.4493, 'learning_rate': 1.9254438823986e-06, 'epoch': 1.6} {'loss': 0.4134, 'learning_rate': 1.92525077278215e-06, 'epoch': 1.6} {'loss': 0.4442, 'learning_rate': 1.9250576718185187e-06, 'epoch': 1.6} {'loss': 0.6337, 'learning_rate': 1.924864579507918e-06, 'epoch': 1.6} {'loss': 0.5262, 'learning_rate': 1.9246714958505532e-06, 'epoch': 1.6} {'loss': 0.5249, 'learning_rate': 1.9244784208466315e-06, 'epoch': 1.6} {'loss': 0.4807, 'learning_rate': 1.9242853544963634e-06, 'epoch': 1.6} {'loss': 0.5208, 'learning_rate': 1.9240922967999497e-06, 'epoch': 1.6} {'loss': 0.537, 'learning_rate': 1.9238992477575992e-06, 'epoch': 1.6} {'loss': 0.3752, 'learning_rate': 1.92370620736952e-06, 'epoch': 1.6} {'loss': 0.5109, 'learning_rate': 1.9235131756359192e-06, 'epoch': 1.6} {'loss': 0.4951, 'learning_rate': 1.9233201525570043e-06, 'epoch': 1.6} {'loss': 0.5601, 'learning_rate': 1.9231271381329764e-06, 'epoch': 1.6} {'loss': 0.5184, 'learning_rate': 1.9229341323640518e-06, 'epoch': 1.6} {'loss': 0.4947, 'learning_rate': 1.92274113525043e-06, 'epoch': 1.6} {'loss': 0.5493, 'learning_rate': 1.9225481467923203e-06, 'epoch': 1.6} {'loss': 0.2828, 'learning_rate': 1.922355166989929e-06, 'epoch': 1.6} {'loss': 0.6285, 'learning_rate': 1.922162195843462e-06, 'epoch': 1.6} {'loss': 0.4363, 'learning_rate': 1.9219692333531315e-06, 'epoch': 1.6} {'loss': 0.5375, 'learning_rate': 1.921776279519134e-06, 'epoch': 1.6} {'loss': 0.5902, 'learning_rate': 1.921583334341688e-06, 'epoch': 1.6} {'loss': 0.5429, 'learning_rate': 1.9213903978209915e-06, 'epoch': 1.6} {'loss': 0.484, 'learning_rate': 1.9211974699572543e-06, 'epoch': 1.6} {'loss': 0.6414, 'learning_rate': 1.9210045507506835e-06, 'epoch': 1.6} {'loss': 0.4843, 'learning_rate': 1.920811640201485e-06, 'epoch': 1.6} {'loss': 0.4643, 'learning_rate': 1.9206187383098695e-06, 'epoch': 1.6} {'loss': 0.5623, 'learning_rate': 1.920425845076037e-06, 'epoch': 1.6} {'loss': 0.586, 'learning_rate': 1.920232960500198e-06, 'epoch': 1.6} {'loss': 0.4663, 'learning_rate': 1.9200400845825583e-06, 'epoch': 1.6} {'loss': 0.47, 'learning_rate': 1.919847217323325e-06, 'epoch': 1.6} {'loss': 0.4238, 'learning_rate': 1.9196543587227044e-06, 'epoch': 1.6} {'loss': 0.6326, 'learning_rate': 1.919461508780903e-06, 'epoch': 1.6} {'loss': 0.4339, 'learning_rate': 1.919268667498132e-06, 'epoch': 1.6} {'loss': 0.364, 'learning_rate': 1.9190758348745897e-06, 'epoch': 1.6} {'loss': 0.5042, 'learning_rate': 1.9188830109104884e-06, 'epoch': 1.6} {'loss': 0.5974, 'learning_rate': 1.9186901956060322e-06, 'epoch': 1.6} {'loss': 0.4007, 'learning_rate': 1.9184973889614288e-06, 'epoch': 1.6} {'loss': 0.5376, 'learning_rate': 1.918304590976886e-06, 'epoch': 1.6} {'loss': 0.5247, 'learning_rate': 1.918111801652609e-06, 'epoch': 1.6} {'loss': 0.6186, 'learning_rate': 1.9179190209888066e-06, 'epoch': 1.6} {'loss': 0.4085, 'learning_rate': 1.9177262489856806e-06, 'epoch': 1.6} {'loss': 0.4957, 'learning_rate': 1.9175334856434415e-06, 'epoch': 1.6} {'loss': 0.4685, 'learning_rate': 1.917340730962294e-06, 'epoch': 1.6} {'loss': 0.6159, 'learning_rate': 1.9171479849424455e-06, 'epoch': 1.6} {'loss': 0.4384, 'learning_rate': 1.9169552475841025e-06, 'epoch': 1.6} {'loss': 0.5018, 'learning_rate': 1.916762518887474e-06, 'epoch': 1.6} {'loss': 0.4807, 'learning_rate': 1.916569798852761e-06, 'epoch': 1.6} {'loss': 0.5012, 'learning_rate': 1.9163770874801736e-06, 'epoch': 1.6} {'loss': 0.5394, 'learning_rate': 1.916184384769918e-06, 'epoch': 1.6} {'loss': 0.516, 'learning_rate': 1.9159916907222e-06, 'epoch': 1.6} {'loss': 0.4513, 'learning_rate': 1.9157990053372267e-06, 'epoch': 1.6} {'loss': 0.4945, 'learning_rate': 1.915606328615204e-06, 'epoch': 1.6} {'loss': 0.5359, 'learning_rate': 1.915413660556342e-06, 'epoch': 1.6} {'loss': 0.4985, 'learning_rate': 1.9152210011608407e-06, 'epoch': 1.6} {'loss': 0.5313, 'learning_rate': 1.9150283504289104e-06, 'epoch': 1.6} {'loss': 0.5241, 'learning_rate': 1.914835708360757e-06, 'epoch': 1.6} {'loss': 0.4085, 'learning_rate': 1.914643074956587e-06, 'epoch': 1.6} {'loss': 0.3838, 'learning_rate': 1.9144504502166063e-06, 'epoch': 1.6} {'loss': 0.5244, 'learning_rate': 1.914257834141021e-06, 'epoch': 1.6} {'loss': 0.5854, 'learning_rate': 1.914065226730042e-06, 'epoch': 1.6} {'loss': 0.5563, 'learning_rate': 1.913872627983868e-06, 'epoch': 1.6} {'loss': 0.4194, 'learning_rate': 1.913680037902711e-06, 'epoch': 1.6} {'loss': 0.5138, 'learning_rate': 1.9134874564867744e-06, 'epoch': 1.6} {'loss': 0.482, 'learning_rate': 1.913294883736266e-06, 'epoch': 1.6} {'loss': 0.6022, 'learning_rate': 1.9131023196513954e-06, 'epoch': 1.6} {'loss': 0.5287, 'learning_rate': 1.912909764232359e-06, 'epoch': 1.6} {'loss': 0.5074, 'learning_rate': 1.912717217479376e-06, 'epoch': 1.6} {'loss': 0.6639, 'learning_rate': 1.912524679392643e-06, 'epoch': 1.6} {'loss': 0.4476, 'learning_rate': 1.9123321499723713e-06, 'epoch': 1.6} {'loss': 0.5436, 'learning_rate': 1.9121396292187644e-06, 'epoch': 1.6} {'loss': 0.4577, 'learning_rate': 1.911947117132029e-06, 'epoch': 1.6} {'loss': 0.6187, 'learning_rate': 1.911754613712377e-06, 'epoch': 1.6} {'loss': 0.5129, 'learning_rate': 1.911562118960003e-06, 'epoch': 1.6} {'loss': 0.5658, 'learning_rate': 1.9113696328751265e-06, 'epoch': 1.6} {'loss': 0.4881, 'learning_rate': 1.911177155457944e-06, 'epoch': 1.6} {'loss': 0.484, 'learning_rate': 1.9109846867086656e-06, 'epoch': 1.6} {'loss': 0.5454, 'learning_rate': 1.9107922266275e-06, 'epoch': 1.6} {'loss': 0.5379, 'learning_rate': 1.9105997752146455e-06, 'epoch': 1.6} {'loss': 0.576, 'learning_rate': 1.9104073324703187e-06, 'epoch': 1.6} {'loss': 0.4615, 'learning_rate': 1.9102148983947178e-06, 'epoch': 1.6} {'loss': 0.5002, 'learning_rate': 1.9100224729880514e-06, 'epoch': 1.6} {'loss': 0.5049, 'learning_rate': 1.9098300562505266e-06, 'epoch': 1.6} {'loss': 0.6111, 'learning_rate': 1.9096376481823485e-06, 'epoch': 1.6} {'loss': 0.4726, 'learning_rate': 1.9094452487837267e-06, 'epoch': 1.6} {'loss': 0.4366, 'learning_rate': 1.9092528580548597e-06, 'epoch': 1.6} {'loss': 0.4575, 'learning_rate': 1.909060475995964e-06, 'epoch': 1.6} {'loss': 0.4211, 'learning_rate': 1.9088681026072364e-06, 'epoch': 1.6} {'loss': 0.5249, 'learning_rate': 1.9086757378888874e-06, 'epoch': 1.6} {'loss': 0.4395, 'learning_rate': 1.908483381841123e-06, 'epoch': 1.6} {'loss': 0.6019, 'learning_rate': 1.9082910344641494e-06, 'epoch': 1.6} {'loss': 0.5639, 'learning_rate': 1.9080986957581737e-06, 'epoch': 1.6} {'loss': 0.5802, 'learning_rate': 1.9079063657233963e-06, 'epoch': 1.6} {'loss': 0.5431, 'learning_rate': 1.9077140443600327e-06, 'epoch': 1.6} {'loss': 0.5394, 'learning_rate': 1.9075217316682816e-06, 'epoch': 1.6} {'loss': 0.4237, 'learning_rate': 1.90732942764835e-06, 'epoch': 1.6} {'loss': 0.4954, 'learning_rate': 1.9071371323004495e-06, 'epoch': 1.6} {'loss': 0.6342, 'learning_rate': 1.9069448456247752e-06, 'epoch': 1.6} {'loss': 0.3931, 'learning_rate': 1.9067525676215459e-06, 'epoch': 1.6} {'loss': 0.4592, 'learning_rate': 1.906560298290957e-06, 'epoch': 1.6} {'loss': 0.5781, 'learning_rate': 1.906368037633224e-06, 'epoch': 1.6} {'loss': 0.5044, 'learning_rate': 1.9061757856485452e-06, 'epoch': 1.6} {'loss': 0.4274, 'learning_rate': 1.9059835423371298e-06, 'epoch': 1.6} {'loss': 0.5164, 'learning_rate': 1.9057913076991863e-06, 'epoch': 1.6} {'loss': 0.5665, 'learning_rate': 1.9055990817349124e-06, 'epoch': 1.6} {'loss': 0.4902, 'learning_rate': 1.9054068644445256e-06, 'epoch': 1.6} {'loss': 0.5824, 'learning_rate': 1.9052146558282202e-06, 'epoch': 1.6} {'loss': 0.5058, 'learning_rate': 1.9050224558862129e-06, 'epoch': 1.6} {'loss': 0.6242, 'learning_rate': 1.9048302646187021e-06, 'epoch': 1.6} {'loss': 0.4787, 'learning_rate': 1.904638082025897e-06, 'epoch': 1.6} {'loss': 0.4835, 'learning_rate': 1.9044459081080048e-06, 'epoch': 1.6} {'loss': 0.3922, 'learning_rate': 1.9042537428652251e-06, 'epoch': 1.6} {'loss': 0.491, 'learning_rate': 1.9040615862977728e-06, 'epoch': 1.6} {'loss': 0.557, 'learning_rate': 1.9038694384058431e-06, 'epoch': 1.6} {'loss': 0.6127, 'learning_rate': 1.9036772991896547e-06, 'epoch': 1.6} {'loss': 0.5725, 'learning_rate': 1.9034851686494037e-06, 'epoch': 1.6} {'loss': 0.5225, 'learning_rate': 1.9032930467852985e-06, 'epoch': 1.6} {'loss': 0.5006, 'learning_rate': 1.9031009335975493e-06, 'epoch': 1.6} {'loss': 0.3854, 'learning_rate': 1.9029088290863518e-06, 'epoch': 1.6} {'loss': 0.502, 'learning_rate': 1.9027167332519248e-06, 'epoch': 1.6} {'loss': 0.4214, 'learning_rate': 1.9025246460944614e-06, 'epoch': 1.6} {'loss': 0.5246, 'learning_rate': 1.902332567614179e-06, 'epoch': 1.6} {'loss': 0.5723, 'learning_rate': 1.9021404978112757e-06, 'epoch': 1.6} {'loss': 0.4401, 'learning_rate': 1.9019484366859598e-06, 'epoch': 1.6} {'loss': 0.6023, 'learning_rate': 1.9017563842384401e-06, 'epoch': 1.6} {'loss': 0.3936, 'learning_rate': 1.9015643404689132e-06, 'epoch': 1.6} {'loss': 0.4637, 'learning_rate': 1.9013723053775968e-06, 'epoch': 1.6} {'loss': 0.4769, 'learning_rate': 1.901180278964686e-06, 'epoch': 1.6} {'loss': 0.5623, 'learning_rate': 1.9009882612303965e-06, 'epoch': 1.6} {'loss': 0.4571, 'learning_rate': 1.9007962521749257e-06, 'epoch': 1.6} {'loss': 0.4622, 'learning_rate': 1.9006042517984835e-06, 'epoch': 1.6} {'loss': 0.4985, 'learning_rate': 1.9004122601012775e-06, 'epoch': 1.6} {'loss': 0.6104, 'learning_rate': 1.9002202770835054e-06, 'epoch': 1.6} {'loss': 0.564, 'learning_rate': 1.9000283027453837e-06, 'epoch': 1.6} {'loss': 0.5147, 'learning_rate': 1.8998363370871097e-06, 'epoch': 1.6} {'loss': 0.3774, 'learning_rate': 1.8996443801088927e-06, 'epoch': 1.6} {'loss': 0.4872, 'learning_rate': 1.8994524318109363e-06, 'epoch': 1.6} {'loss': 0.3751, 'learning_rate': 1.8992604921934498e-06, 'epoch': 1.6} {'loss': 0.6645, 'learning_rate': 1.8990685612566384e-06, 'epoch': 1.6} {'loss': 0.4351, 'learning_rate': 1.8988766390007007e-06, 'epoch': 1.6} {'loss': 0.4661, 'learning_rate': 1.8986847254258544e-06, 'epoch': 1.6} {'loss': 0.3591, 'learning_rate': 1.898492820532295e-06, 'epoch': 1.6} {'loss': 0.4657, 'learning_rate': 1.898300924320231e-06, 'epoch': 1.6} {'loss': 0.5815, 'learning_rate': 1.8981090367898703e-06, 'epoch': 1.6} {'loss': 0.4251, 'learning_rate': 1.897917157941417e-06, 'epoch': 1.6} {'loss': 0.386, 'learning_rate': 1.8977252877750785e-06, 'epoch': 1.6} {'loss': 0.4663, 'learning_rate': 1.8975334262910528e-06, 'epoch': 1.6} {'loss': 0.5411, 'learning_rate': 1.8973415734895573e-06, 'epoch': 1.6} {'loss': 0.6273, 'learning_rate': 1.8971497293707896e-06, 'epoch': 1.6} {'loss': 0.5629, 'learning_rate': 1.8969578939349565e-06, 'epoch': 1.6} {'loss': 0.4006, 'learning_rate': 1.8967660671822652e-06, 'epoch': 1.6} {'loss': 0.4579, 'learning_rate': 1.896574249112919e-06, 'epoch': 1.6} {'loss': 0.4904, 'learning_rate': 1.8963824397271292e-06, 'epoch': 1.6} {'loss': 0.4813, 'learning_rate': 1.896190639025093e-06, 'epoch': 1.6} {'loss': 0.583, 'learning_rate': 1.89599884700702e-06, 'epoch': 1.6} {'loss': 0.3601, 'learning_rate': 1.8958070636731164e-06, 'epoch': 1.6} {'loss': 0.617, 'learning_rate': 1.8956152890235869e-06, 'epoch': 1.6} {'loss': 0.5606, 'learning_rate': 1.8954235230586371e-06, 'epoch': 1.6} {'loss': 0.5363, 'learning_rate': 1.8952317657784724e-06, 'epoch': 1.6} {'loss': 0.4624, 'learning_rate': 1.8950400171833005e-06, 'epoch': 1.6} {'loss': 0.558, 'learning_rate': 1.8948482772733222e-06, 'epoch': 1.6} {'loss': 0.4591, 'learning_rate': 1.8946565460487465e-06, 'epoch': 1.6} {'loss': 0.4483, 'learning_rate': 1.8944648235097773e-06, 'epoch': 1.6} {'loss': 0.5244, 'learning_rate': 1.8942731096566203e-06, 'epoch': 1.6} {'loss': 0.5067, 'learning_rate': 1.894081404489484e-06, 'epoch': 1.6} {'loss': 0.5097, 'learning_rate': 1.8938897080085683e-06, 'epoch': 1.6} {'loss': 0.3979, 'learning_rate': 1.893698020214082e-06, 'epoch': 1.6} {'loss': 0.2863, 'learning_rate': 1.8935063411062293e-06, 'epoch': 1.6} {'loss': 0.5778, 'learning_rate': 1.8933146706852158e-06, 'epoch': 1.6} {'loss': 0.4963, 'learning_rate': 1.8931230089512487e-06, 'epoch': 1.6} {'loss': 0.6187, 'learning_rate': 1.8929313559045304e-06, 'epoch': 1.6} {'loss': 0.583, 'learning_rate': 1.8927397115452718e-06, 'epoch': 1.6} {'loss': 0.2747, 'learning_rate': 1.8925480758736714e-06, 'epoch': 1.6} {'loss': 0.4596, 'learning_rate': 1.8923564488899371e-06, 'epoch': 1.6} {'loss': 0.6433, 'learning_rate': 1.892164830594274e-06, 'epoch': 1.6} {'loss': 0.4981, 'learning_rate': 1.891973220986889e-06, 'epoch': 1.6} {'loss': 0.4572, 'learning_rate': 1.8917816200679872e-06, 'epoch': 1.6} {'loss': 0.5411, 'learning_rate': 1.8915900278377719e-06, 'epoch': 1.6} {'loss': 0.453, 'learning_rate': 1.8913984442964527e-06, 'epoch': 1.6} {'loss': 0.3759, 'learning_rate': 1.8912068694442298e-06, 'epoch': 1.6} {'loss': 0.5107, 'learning_rate': 1.8910153032813095e-06, 'epoch': 1.6} {'loss': 0.5612, 'learning_rate': 1.8908237458078992e-06, 'epoch': 1.6} {'loss': 0.5344, 'learning_rate': 1.8906321970242024e-06, 'epoch': 1.6} {'loss': 0.5609, 'learning_rate': 1.8904406569304257e-06, 'epoch': 1.6} {'loss': 0.3426, 'learning_rate': 1.8902491255267763e-06, 'epoch': 1.6} {'loss': 0.5543, 'learning_rate': 1.8900576028134543e-06, 'epoch': 1.6} {'loss': 0.4336, 'learning_rate': 1.8898660887906673e-06, 'epoch': 1.6} {'loss': 0.3299, 'learning_rate': 1.8896745834586217e-06, 'epoch': 1.6} {'loss': 0.5474, 'learning_rate': 1.8894830868175208e-06, 'epoch': 1.6} {'loss': 0.4438, 'learning_rate': 1.8892915988675708e-06, 'epoch': 1.6} {'loss': 0.4829, 'learning_rate': 1.8891001196089775e-06, 'epoch': 1.6} {'loss': 0.568, 'learning_rate': 1.8889086490419474e-06, 'epoch': 1.6} {'loss': 0.6818, 'learning_rate': 1.888717187166681e-06, 'epoch': 1.6} {'loss': 0.5152, 'learning_rate': 1.8885257339833873e-06, 'epoch': 1.6} {'loss': 0.6278, 'learning_rate': 1.8883342894922697e-06, 'epoch': 1.6} {'loss': 0.5016, 'learning_rate': 1.8881428536935342e-06, 'epoch': 1.6} {'loss': 0.4911, 'learning_rate': 1.8879514265873855e-06, 'epoch': 1.6} {'loss': 0.5394, 'learning_rate': 1.8877600081740288e-06, 'epoch': 1.6} {'loss': 0.5433, 'learning_rate': 1.887568598453673e-06, 'epoch': 1.6} {'loss': 0.4851, 'learning_rate': 1.8873771974265166e-06, 'epoch': 1.6} {'loss': 0.609, 'learning_rate': 1.8871858050927672e-06, 'epoch': 1.6} {'loss': 0.4888, 'learning_rate': 1.8869944214526304e-06, 'epoch': 1.6} {'loss': 0.4949, 'learning_rate': 1.8868030465063126e-06, 'epoch': 1.6} {'loss': 0.5861, 'learning_rate': 1.8866116802540191e-06, 'epoch': 1.6} {'loss': 0.414, 'learning_rate': 1.8864203226959478e-06, 'epoch': 1.6} {'loss': 0.6007, 'learning_rate': 1.8862289738323158e-06, 'epoch': 1.6} {'loss': 0.5323, 'learning_rate': 1.886037633663318e-06, 'epoch': 1.6} {'loss': 0.6948, 'learning_rate': 1.885846302189165e-06, 'epoch': 1.6} {'loss': 0.4932, 'learning_rate': 1.8856549794100587e-06, 'epoch': 1.6} {'loss': 0.5747, 'learning_rate': 1.8854636653262049e-06, 'epoch': 1.6} {'loss': 0.5688, 'learning_rate': 1.885272359937813e-06, 'epoch': 1.6} {'loss': 0.497, 'learning_rate': 1.8850810632450788e-06, 'epoch': 1.6} {'loss': 0.425, 'learning_rate': 1.8848897752482175e-06, 'epoch': 1.6} {'loss': 0.5942, 'learning_rate': 1.8846984959474268e-06, 'epoch': 1.6} {'loss': 0.5815, 'learning_rate': 1.884507225342913e-06, 'epoch': 1.6} {'loss': 0.623, 'learning_rate': 1.884315963434884e-06, 'epoch': 1.6} {'loss': 0.66, 'learning_rate': 1.8841247102235417e-06, 'epoch': 1.6} {'loss': 0.5069, 'learning_rate': 1.8839334657090958e-06, 'epoch': 1.6} {'loss': 0.6378, 'learning_rate': 1.8837422298917417e-06, 'epoch': 1.6} {'loss': 0.4821, 'learning_rate': 1.8835510027716953e-06, 'epoch': 1.6} {'loss': 0.573, 'learning_rate': 1.8833597843491547e-06, 'epoch': 1.6} {'loss': 0.4996, 'learning_rate': 1.8831685746243268e-06, 'epoch': 1.6} {'loss': 0.4778, 'learning_rate': 1.8829773735974189e-06, 'epoch': 1.6} {'loss': 0.6703, 'learning_rate': 1.8827861812686278e-06, 'epoch': 1.6} {'loss': 0.529, 'learning_rate': 1.8825949976381685e-06, 'epoch': 1.6} {'loss': 0.5466, 'learning_rate': 1.8824038227062369e-06, 'epoch': 1.6} {'loss': 0.5214, 'learning_rate': 1.8822126564730481e-06, 'epoch': 1.6} {'loss': 0.5688, 'learning_rate': 1.8820214989387975e-06, 'epoch': 1.6} {'loss': 0.4397, 'learning_rate': 1.8818303501036939e-06, 'epoch': 1.6} {'loss': 0.4759, 'learning_rate': 1.8816392099679437e-06, 'epoch': 1.6} {'loss': 0.4892, 'learning_rate': 1.8814480785317457e-06, 'epoch': 1.6} {'loss': 0.5164, 'learning_rate': 1.881256955795313e-06, 'epoch': 1.6} {'loss': 0.4396, 'learning_rate': 1.8810658417588424e-06, 'epoch': 1.6} {'loss': 0.4067, 'learning_rate': 1.8808747364225465e-06, 'epoch': 1.6} {'loss': 0.4624, 'learning_rate': 1.8806836397866246e-06, 'epoch': 1.6} {'loss': 0.4053, 'learning_rate': 1.8804925518512817e-06, 'epoch': 1.6} {'loss': 0.4331, 'learning_rate': 1.8803014726167269e-06, 'epoch': 1.6} {'loss': 0.4254, 'learning_rate': 1.8801104020831573e-06, 'epoch': 1.6} {'loss': 0.4748, 'learning_rate': 1.8799193402507877e-06, 'epoch': 1.6} {'loss': 0.5678, 'learning_rate': 1.879728287119814e-06, 'epoch': 1.6} {'loss': 0.5917, 'learning_rate': 1.8795372426904447e-06, 'epoch': 1.6} {'loss': 0.4898, 'learning_rate': 1.8793462069628832e-06, 'epoch': 1.6} {'loss': 0.4369, 'learning_rate': 1.8791551799373365e-06, 'epoch': 1.6} {'loss': 0.5391, 'learning_rate': 1.8789641616140098e-06, 'epoch': 1.6} {'loss': 0.5099, 'learning_rate': 1.8787731519931006e-06, 'epoch': 1.6} {'loss': 0.4665, 'learning_rate': 1.8785821510748248e-06, 'epoch': 1.6} {'loss': 0.5694, 'learning_rate': 1.8783911588593784e-06, 'epoch': 1.6} {'loss': 0.515, 'learning_rate': 1.8782001753469692e-06, 'epoch': 1.6} {'loss': 0.5305, 'learning_rate': 1.8780092005378015e-06, 'epoch': 1.6} {'loss': 0.6145, 'learning_rate': 1.8778182344320795e-06, 'epoch': 1.6} {'loss': 0.5692, 'learning_rate': 1.8776272770300108e-06, 'epoch': 1.6} {'loss': 0.3989, 'learning_rate': 1.877436328331793e-06, 'epoch': 1.6} {'loss': 0.5139, 'learning_rate': 1.8772453883376408e-06, 'epoch': 1.6} {'loss': 0.4682, 'learning_rate': 1.87705445704775e-06, 'epoch': 1.6} {'loss': 0.58, 'learning_rate': 1.8768635344623286e-06, 'epoch': 1.6} {'loss': 0.535, 'learning_rate': 1.8766726205815834e-06, 'epoch': 1.6} {'loss': 0.6405, 'learning_rate': 1.8764817154057114e-06, 'epoch': 1.6} {'loss': 0.5616, 'learning_rate': 1.8762908189349282e-06, 'epoch': 1.6} {'loss': 0.5979, 'learning_rate': 1.8760999311694273e-06, 'epoch': 1.6} {'loss': 0.5269, 'learning_rate': 1.8759090521094237e-06, 'epoch': 1.6} {'loss': 0.5832, 'learning_rate': 1.875718181755114e-06, 'epoch': 1.6} {'loss': 0.4912, 'learning_rate': 1.875527320106706e-06, 'epoch': 1.6} {'loss': 0.3853, 'learning_rate': 1.8753364671644058e-06, 'epoch': 1.6} {'loss': 0.5094, 'learning_rate': 1.8751456229284103e-06, 'epoch': 1.61} {'loss': 0.4572, 'learning_rate': 1.874954787398936e-06, 'epoch': 1.61} {'loss': 0.4806, 'learning_rate': 1.8747639605761746e-06, 'epoch': 1.61} {'loss': 0.5863, 'learning_rate': 1.8745731424603431e-06, 'epoch': 1.61} {'loss': 0.4526, 'learning_rate': 1.8743823330516374e-06, 'epoch': 1.61} {'loss': 0.5592, 'learning_rate': 1.8741915323502636e-06, 'epoch': 1.61} {'loss': 0.5106, 'learning_rate': 1.8740007403564297e-06, 'epoch': 1.61} {'loss': 0.6936, 'learning_rate': 1.8738099570703327e-06, 'epoch': 1.61} {'loss': 0.4273, 'learning_rate': 1.8736191824921868e-06, 'epoch': 1.61} {'loss': 0.4233, 'learning_rate': 1.8734284166221884e-06, 'epoch': 1.61} {'loss': 0.5253, 'learning_rate': 1.873237659460545e-06, 'epoch': 1.61} {'loss': 0.3722, 'learning_rate': 1.8730469110074612e-06, 'epoch': 1.61} {'loss': 0.4124, 'learning_rate': 1.872856171263141e-06, 'epoch': 1.61} {'loss': 0.5416, 'learning_rate': 1.8726654402277912e-06, 'epoch': 1.61} {'loss': 0.5772, 'learning_rate': 1.872474717901609e-06, 'epoch': 1.61} {'loss': 0.4464, 'learning_rate': 1.872284004284809e-06, 'epoch': 1.61} {'loss': 0.5337, 'learning_rate': 1.8720932993775876e-06, 'epoch': 1.61} {'loss': 0.4957, 'learning_rate': 1.8719026031801523e-06, 'epoch': 1.61} {'loss': 0.5329, 'learning_rate': 1.8717119156927066e-06, 'epoch': 1.61} {'loss': 0.5235, 'learning_rate': 1.8715212369154545e-06, 'epoch': 1.61} {'loss': 0.5771, 'learning_rate': 1.8713305668486047e-06, 'epoch': 1.61} {'loss': 0.6359, 'learning_rate': 1.8711399054923519e-06, 'epoch': 1.61} {'loss': 0.5078, 'learning_rate': 1.870949252846912e-06, 'epoch': 1.61} {'loss': 0.3702, 'learning_rate': 1.8707586089124808e-06, 'epoch': 1.61} {'loss': 0.6423, 'learning_rate': 1.8705679736892658e-06, 'epoch': 1.61} {'loss': 0.4016, 'learning_rate': 1.8703773471774712e-06, 'epoch': 1.61} {'loss': 0.538, 'learning_rate': 1.8701867293773002e-06, 'epoch': 1.61} {'loss': 0.5655, 'learning_rate': 1.8699961202889604e-06, 'epoch': 1.61} {'loss': 0.4769, 'learning_rate': 1.8698055199126518e-06, 'epoch': 1.61} {'loss': 0.4747, 'learning_rate': 1.8696149282485798e-06, 'epoch': 1.61} {'loss': 0.5705, 'learning_rate': 1.8694243452969496e-06, 'epoch': 1.61} {'loss': 0.5549, 'learning_rate': 1.8692337710579644e-06, 'epoch': 1.61} {'loss': 0.6376, 'learning_rate': 1.8690432055318297e-06, 'epoch': 1.61} {'loss': 0.4251, 'learning_rate': 1.8688526487187485e-06, 'epoch': 1.61} {'loss': 0.5635, 'learning_rate': 1.8686621006189286e-06, 'epoch': 1.61} {'loss': 0.4503, 'learning_rate': 1.8684715612325688e-06, 'epoch': 1.61} {'loss': 0.4415, 'learning_rate': 1.8682810305598754e-06, 'epoch': 1.61} {'loss': 0.5058, 'learning_rate': 1.8680905086010525e-06, 'epoch': 1.61} {'loss': 0.4585, 'learning_rate': 1.8678999953563049e-06, 'epoch': 1.61} {'loss': 0.6027, 'learning_rate': 1.8677094908258364e-06, 'epoch': 1.61} {'loss': 0.4576, 'learning_rate': 1.8675189950098515e-06, 'epoch': 1.61} {'loss': 0.487, 'learning_rate': 1.8673285079085558e-06, 'epoch': 1.61} {'loss': 0.3988, 'learning_rate': 1.8671380295221497e-06, 'epoch': 1.61} {'loss': 0.6445, 'learning_rate': 1.866947559850839e-06, 'epoch': 1.61} {'loss': 0.5678, 'learning_rate': 1.8667570988948281e-06, 'epoch': 1.61} {'loss': 0.5199, 'learning_rate': 1.8665666466543209e-06, 'epoch': 1.61} {'loss': 0.6319, 'learning_rate': 1.8663762031295207e-06, 'epoch': 1.61} {'loss': 0.5503, 'learning_rate': 1.8661857683206363e-06, 'epoch': 1.61} {'loss': 0.506, 'learning_rate': 1.8659953422278655e-06, 'epoch': 1.61} {'loss': 0.5193, 'learning_rate': 1.8658049248514143e-06, 'epoch': 1.61} {'loss': 0.5093, 'learning_rate': 1.8656145161914874e-06, 'epoch': 1.61} {'loss': 0.4133, 'learning_rate': 1.8654241162482888e-06, 'epoch': 1.61} {'loss': 0.5031, 'learning_rate': 1.865233725022022e-06, 'epoch': 1.61} {'loss': 0.5036, 'learning_rate': 1.8650433425128922e-06, 'epoch': 1.61} {'loss': 0.5474, 'learning_rate': 1.8648529687211048e-06, 'epoch': 1.61} {'loss': 0.6137, 'learning_rate': 1.8646626036468597e-06, 'epoch': 1.61} {'loss': 0.5259, 'learning_rate': 1.864472247290362e-06, 'epoch': 1.61} {'loss': 0.5732, 'learning_rate': 1.8642818996518174e-06, 'epoch': 1.61} {'loss': 0.5798, 'learning_rate': 1.8640915607314281e-06, 'epoch': 1.61} {'loss': 0.423, 'learning_rate': 1.8639012305294001e-06, 'epoch': 1.61} {'loss': 0.4505, 'learning_rate': 1.8637109090459381e-06, 'epoch': 1.61} {'loss': 0.4815, 'learning_rate': 1.863520596281242e-06, 'epoch': 1.61} {'loss': 0.4641, 'learning_rate': 1.863330292235518e-06, 'epoch': 1.61} {'loss': 0.4445, 'learning_rate': 1.863139996908969e-06, 'epoch': 1.61} {'loss': 0.5305, 'learning_rate': 1.8629497103018013e-06, 'epoch': 1.61} {'loss': 0.5781, 'learning_rate': 1.8627594324142163e-06, 'epoch': 1.61} {'loss': 0.4614, 'learning_rate': 1.8625691632464216e-06, 'epoch': 1.61} {'loss': 0.4591, 'learning_rate': 1.8623789027986173e-06, 'epoch': 1.61} {'loss': 0.6009, 'learning_rate': 1.8621886510710074e-06, 'epoch': 1.61} {'loss': 0.4554, 'learning_rate': 1.8619984080637965e-06, 'epoch': 1.61} {'loss': 0.4675, 'learning_rate': 1.8618081737771887e-06, 'epoch': 1.61} {'loss': 0.5543, 'learning_rate': 1.8616179482113893e-06, 'epoch': 1.61} {'loss': 0.4923, 'learning_rate': 1.8614277313665997e-06, 'epoch': 1.61} {'loss': 0.5824, 'learning_rate': 1.861237523243028e-06, 'epoch': 1.61} {'loss': 0.6179, 'learning_rate': 1.8610473238408721e-06, 'epoch': 1.61} {'loss': 0.5881, 'learning_rate': 1.8608571331603375e-06, 'epoch': 1.61} {'loss': 0.4403, 'learning_rate': 1.8606669512016306e-06, 'epoch': 1.61} {'loss': 0.5451, 'learning_rate': 1.8604767779649534e-06, 'epoch': 1.61} {'loss': 0.5057, 'learning_rate': 1.8602866134505093e-06, 'epoch': 1.61} {'loss': 0.6241, 'learning_rate': 1.8600964576585035e-06, 'epoch': 1.61} {'loss': 0.5787, 'learning_rate': 1.8599063105891413e-06, 'epoch': 1.61} {'loss': 0.4317, 'learning_rate': 1.8597161722426215e-06, 'epoch': 1.61} {'loss': 0.6232, 'learning_rate': 1.8595260426191508e-06, 'epoch': 1.61} {'loss': 0.6846, 'learning_rate': 1.8593359217189322e-06, 'epoch': 1.61} {'loss': 0.4728, 'learning_rate': 1.8591458095421699e-06, 'epoch': 1.61} {'loss': 0.4835, 'learning_rate': 1.8589557060890705e-06, 'epoch': 1.61} {'loss': 0.4896, 'learning_rate': 1.8587656113598295e-06, 'epoch': 1.61} {'loss': 0.5024, 'learning_rate': 1.858575525354661e-06, 'epoch': 1.61} {'loss': 0.4286, 'learning_rate': 1.8583854480737618e-06, 'epoch': 1.61} {'loss': 0.4521, 'learning_rate': 1.858195379517337e-06, 'epoch': 1.61} {'loss': 0.3791, 'learning_rate': 1.8580053196855908e-06, 'epoch': 1.61} {'loss': 0.5297, 'learning_rate': 1.8578152685787265e-06, 'epoch': 1.61} {'loss': 0.6288, 'learning_rate': 1.8576252261969507e-06, 'epoch': 1.61} {'loss': 0.4508, 'learning_rate': 1.8574351925404589e-06, 'epoch': 1.61} {'loss': 0.5365, 'learning_rate': 1.857245167609465e-06, 'epoch': 1.61} {'loss': 0.4802, 'learning_rate': 1.8570551514041656e-06, 'epoch': 1.61} {'loss': 0.4857, 'learning_rate': 1.8568651439247675e-06, 'epoch': 1.61} {'loss': 0.4885, 'learning_rate': 1.856675145171475e-06, 'epoch': 1.61} {'loss': 0.5056, 'learning_rate': 1.8564851551444852e-06, 'epoch': 1.61} {'loss': 0.6473, 'learning_rate': 1.8562951738440117e-06, 'epoch': 1.61} {'loss': 0.4963, 'learning_rate': 1.8561052012702474e-06, 'epoch': 1.61} {'loss': 0.5427, 'learning_rate': 1.855915237423408e-06, 'epoch': 1.61} {'loss': 0.4335, 'learning_rate': 1.8557252823036864e-06, 'epoch': 1.61} {'loss': 0.506, 'learning_rate': 1.8555353359112904e-06, 'epoch': 1.61} {'loss': 0.5218, 'learning_rate': 1.8553453982464264e-06, 'epoch': 1.61} {'loss': 0.4491, 'learning_rate': 1.8551554693092898e-06, 'epoch': 1.61} {'loss': 0.5699, 'learning_rate': 1.854965549100094e-06, 'epoch': 1.61} {'loss': 0.4997, 'learning_rate': 1.854775637619033e-06, 'epoch': 1.61} {'loss': 0.4523, 'learning_rate': 1.8545857348663198e-06, 'epoch': 1.61} {'loss': 0.5202, 'learning_rate': 1.8543958408421504e-06, 'epoch': 1.61} {'loss': 0.5266, 'learning_rate': 1.8542059555467317e-06, 'epoch': 1.61} {'loss': 0.6433, 'learning_rate': 1.8540160789802685e-06, 'epoch': 1.61} {'loss': 0.4839, 'learning_rate': 1.8538262111429572e-06, 'epoch': 1.61} {'loss': 0.485, 'learning_rate': 1.853636352035012e-06, 'epoch': 1.61} {'loss': 0.5785, 'learning_rate': 1.853446501656625e-06, 'epoch': 1.61} {'loss': 0.5543, 'learning_rate': 1.8532566600080104e-06, 'epoch': 1.61} {'loss': 0.6126, 'learning_rate': 1.8530668270893649e-06, 'epoch': 1.61} {'loss': 0.6067, 'learning_rate': 1.8528770029008925e-06, 'epoch': 1.61} {'loss': 0.5012, 'learning_rate': 1.852687187442801e-06, 'epoch': 1.61} {'loss': 0.557, 'learning_rate': 1.8524973807152857e-06, 'epoch': 1.61} {'loss': 0.5563, 'learning_rate': 1.8523075827185588e-06, 'epoch': 1.61} {'loss': 0.3636, 'learning_rate': 1.8521177934528156e-06, 'epoch': 1.61} {'loss': 0.5459, 'learning_rate': 1.8519280129182682e-06, 'epoch': 1.61} {'loss': 0.5427, 'learning_rate': 1.851738241115113e-06, 'epoch': 1.61} {'loss': 0.5566, 'learning_rate': 1.8515484780435556e-06, 'epoch': 1.61} {'loss': 0.5105, 'learning_rate': 1.8513587237038023e-06, 'epoch': 1.61} {'loss': 0.5052, 'learning_rate': 1.8511689780960485e-06, 'epoch': 1.61} {'loss': 0.4434, 'learning_rate': 1.8509792412205074e-06, 'epoch': 1.61} {'loss': 0.5545, 'learning_rate': 1.8507895130773744e-06, 'epoch': 1.61} {'loss': 0.4963, 'learning_rate': 1.8505997936668562e-06, 'epoch': 1.61} {'loss': 0.6589, 'learning_rate': 1.8504100829891569e-06, 'epoch': 1.61} {'loss': 0.3967, 'learning_rate': 1.8502203810444775e-06, 'epoch': 1.61} {'loss': 0.4038, 'learning_rate': 1.8500306878330265e-06, 'epoch': 1.61} {'loss': 0.5199, 'learning_rate': 1.8498410033549962e-06, 'epoch': 1.61} {'loss': 0.5871, 'learning_rate': 1.8496513276106032e-06, 'epoch': 1.61} {'loss': 0.5605, 'learning_rate': 1.8494616606000416e-06, 'epoch': 1.61} {'loss': 0.5621, 'learning_rate': 1.8492720023235178e-06, 'epoch': 1.61} {'loss': 0.4498, 'learning_rate': 1.849082352781234e-06, 'epoch': 1.61} {'loss': 0.3806, 'learning_rate': 1.8488927119733945e-06, 'epoch': 1.61} {'loss': 0.525, 'learning_rate': 1.8487030799002048e-06, 'epoch': 1.61} {'loss': 0.5181, 'learning_rate': 1.8485134565618612e-06, 'epoch': 1.61} {'loss': 0.5189, 'learning_rate': 1.8483238419585748e-06, 'epoch': 1.61} {'loss': 0.5236, 'learning_rate': 1.848134236090543e-06, 'epoch': 1.61} {'loss': 0.5208, 'learning_rate': 1.8479446389579715e-06, 'epoch': 1.61} {'loss': 0.5072, 'learning_rate': 1.8477550505610652e-06, 'epoch': 1.61} {'loss': 0.487, 'learning_rate': 1.8475654709000202e-06, 'epoch': 1.61} {'loss': 0.5807, 'learning_rate': 1.8473758999750501e-06, 'epoch': 1.61} {'loss': 0.542, 'learning_rate': 1.8471863377863474e-06, 'epoch': 1.61} {'loss': 0.4545, 'learning_rate': 1.8469967843341253e-06, 'epoch': 1.61} {'loss': 0.393, 'learning_rate': 1.8468072396185788e-06, 'epoch': 1.61} {'loss': 0.4232, 'learning_rate': 1.8466177036399147e-06, 'epoch': 1.61} {'loss': 0.5151, 'learning_rate': 1.8464281763983384e-06, 'epoch': 1.61} {'loss': 0.6079, 'learning_rate': 1.846238657894045e-06, 'epoch': 1.61} {'loss': 0.4436, 'learning_rate': 1.846049148127247e-06, 'epoch': 1.61} {'loss': 0.5282, 'learning_rate': 1.8458596470981415e-06, 'epoch': 1.61} {'loss': 0.5, 'learning_rate': 1.8456701548069333e-06, 'epoch': 1.61} {'loss': 0.5385, 'learning_rate': 1.8454806712538264e-06, 'epoch': 1.61} {'loss': 0.5487, 'learning_rate': 1.8452911964390218e-06, 'epoch': 1.61} {'loss': 0.4439, 'learning_rate': 1.845101730362726e-06, 'epoch': 1.61} {'loss': 0.5466, 'learning_rate': 1.8449122730251356e-06, 'epoch': 1.61} {'loss': 0.4371, 'learning_rate': 1.8447228244264626e-06, 'epoch': 1.61} {'loss': 0.5116, 'learning_rate': 1.8445333845669023e-06, 'epoch': 1.61} {'loss': 0.5859, 'learning_rate': 1.8443439534466612e-06, 'epoch': 1.61} {'loss': 0.5465, 'learning_rate': 1.8441545310659404e-06, 'epoch': 1.61} {'loss': 0.4389, 'learning_rate': 1.843965117424945e-06, 'epoch': 1.61} {'loss': 0.4247, 'learning_rate': 1.8437757125238797e-06, 'epoch': 1.61} {'loss': 0.5473, 'learning_rate': 1.8435863163629398e-06, 'epoch': 1.61} {'loss': 0.65, 'learning_rate': 1.8433969289423382e-06, 'epoch': 1.61} {'loss': 0.6271, 'learning_rate': 1.8432075502622705e-06, 'epoch': 1.61} {'loss': 0.3768, 'learning_rate': 1.843018180322942e-06, 'epoch': 1.61} {'loss': 0.4785, 'learning_rate': 1.8428288191245558e-06, 'epoch': 1.61} {'loss': 0.5423, 'learning_rate': 1.8426394666673141e-06, 'epoch': 1.61} {'loss': 0.3876, 'learning_rate': 1.8424501229514235e-06, 'epoch': 1.61} {'loss': 0.4593, 'learning_rate': 1.8422607879770816e-06, 'epoch': 1.61} {'loss': 0.5647, 'learning_rate': 1.8420714617444935e-06, 'epoch': 1.61} {'loss': 0.5745, 'learning_rate': 1.8418821442538627e-06, 'epoch': 1.61} {'loss': 0.4775, 'learning_rate': 1.841692835505391e-06, 'epoch': 1.61} {'loss': 0.5904, 'learning_rate': 1.8415035354992805e-06, 'epoch': 1.61} {'loss': 0.5611, 'learning_rate': 1.8413142442357367e-06, 'epoch': 1.61} {'loss': 0.6677, 'learning_rate': 1.841124961714964e-06, 'epoch': 1.61} {'loss': 0.4836, 'learning_rate': 1.8409356879371587e-06, 'epoch': 1.61} {'loss': 0.5364, 'learning_rate': 1.8407464229025274e-06, 'epoch': 1.61} {'loss': 0.5217, 'learning_rate': 1.8405571666112732e-06, 'epoch': 1.61} {'loss': 0.584, 'learning_rate': 1.8403679190635982e-06, 'epoch': 1.61} {'loss': 0.5319, 'learning_rate': 1.8401786802597045e-06, 'epoch': 1.61} {'loss': 0.3609, 'learning_rate': 1.8399894501997994e-06, 'epoch': 1.61} {'loss': 0.467, 'learning_rate': 1.83980022888408e-06, 'epoch': 1.61} {'loss': 0.5782, 'learning_rate': 1.83961101631275e-06, 'epoch': 1.61} {'loss': 0.5481, 'learning_rate': 1.8394218124860142e-06, 'epoch': 1.61} {'loss': 0.4904, 'learning_rate': 1.8392326174040732e-06, 'epoch': 1.61} {'loss': 0.4353, 'learning_rate': 1.8390434310671324e-06, 'epoch': 1.61} {'loss': 0.3866, 'learning_rate': 1.8388542534753928e-06, 'epoch': 1.61} {'loss': 0.4885, 'learning_rate': 1.8386650846290599e-06, 'epoch': 1.61} {'loss': 0.443, 'learning_rate': 1.8384759245283313e-06, 'epoch': 1.61} {'loss': 0.6112, 'learning_rate': 1.8382867731734122e-06, 'epoch': 1.61} {'loss': 0.4584, 'learning_rate': 1.838097630564506e-06, 'epoch': 1.61} {'loss': 0.2813, 'learning_rate': 1.8379084967018135e-06, 'epoch': 1.61} {'loss': 0.4947, 'learning_rate': 1.8377193715855402e-06, 'epoch': 1.61} {'loss': 0.4483, 'learning_rate': 1.8375302552158868e-06, 'epoch': 1.61} {'loss': 0.5156, 'learning_rate': 1.837341147593059e-06, 'epoch': 1.61} {'loss': 0.4364, 'learning_rate': 1.8371520487172545e-06, 'epoch': 1.61} {'loss': 0.6171, 'learning_rate': 1.8369629585886784e-06, 'epoch': 1.61} {'loss': 0.4592, 'learning_rate': 1.8367738772075327e-06, 'epoch': 1.61} {'loss': 0.5041, 'learning_rate': 1.836584804574021e-06, 'epoch': 1.61} {'loss': 0.6031, 'learning_rate': 1.8363957406883482e-06, 'epoch': 1.61} {'loss': 0.4552, 'learning_rate': 1.8362066855507087e-06, 'epoch': 1.61} {'loss': 0.5554, 'learning_rate': 1.836017639161315e-06, 'epoch': 1.61} {'loss': 0.5545, 'learning_rate': 1.835828601520364e-06, 'epoch': 1.61} {'loss': 0.3879, 'learning_rate': 1.8356395726280584e-06, 'epoch': 1.61} {'loss': 0.6293, 'learning_rate': 1.8354505524846033e-06, 'epoch': 1.61} {'loss': 0.6414, 'learning_rate': 1.8352615410901986e-06, 'epoch': 1.61} {'loss': 0.564, 'learning_rate': 1.8350725384450507e-06, 'epoch': 1.61} {'loss': 0.5787, 'learning_rate': 1.8348835445493574e-06, 'epoch': 1.61} {'loss': 0.5447, 'learning_rate': 1.8346945594033228e-06, 'epoch': 1.61} {'loss': 0.6489, 'learning_rate': 1.8345055830071513e-06, 'epoch': 1.61} {'loss': 0.5945, 'learning_rate': 1.8343166153610425e-06, 'epoch': 1.61} {'loss': 0.4983, 'learning_rate': 1.8341276564652012e-06, 'epoch': 1.61} {'loss': 0.6546, 'learning_rate': 1.8339387063198288e-06, 'epoch': 1.61} {'loss': 0.5828, 'learning_rate': 1.8337497649251313e-06, 'epoch': 1.61} {'loss': 0.5378, 'learning_rate': 1.8335608322813048e-06, 'epoch': 1.61} {'loss': 0.5526, 'learning_rate': 1.8333719083885548e-06, 'epoch': 1.61} {'loss': 0.4961, 'learning_rate': 1.8331829932470845e-06, 'epoch': 1.61} {'loss': 0.4385, 'learning_rate': 1.832994086857095e-06, 'epoch': 1.61} {'loss': 0.3591, 'learning_rate': 1.8328051892187926e-06, 'epoch': 1.61} {'loss': 0.4594, 'learning_rate': 1.8326163003323705e-06, 'epoch': 1.61} {'loss': 0.44, 'learning_rate': 1.832427420198044e-06, 'epoch': 1.61} {'loss': 0.4283, 'learning_rate': 1.8322385488160043e-06, 'epoch': 1.61} {'loss': 0.5605, 'learning_rate': 1.8320496861864589e-06, 'epoch': 1.61} {'loss': 0.5341, 'learning_rate': 1.8318608323096098e-06, 'epoch': 1.61} {'loss': 0.5938, 'learning_rate': 1.8316719871856591e-06, 'epoch': 1.61} {'loss': 0.5241, 'learning_rate': 1.8314831508148112e-06, 'epoch': 1.61} {'loss': 0.5129, 'learning_rate': 1.8312943231972623e-06, 'epoch': 1.61} {'loss': 0.598, 'learning_rate': 1.8311055043332227e-06, 'epoch': 1.61} {'loss': 0.5662, 'learning_rate': 1.8309166942228884e-06, 'epoch': 1.61} {'loss': 0.3738, 'learning_rate': 1.8307278928664652e-06, 'epoch': 1.61} {'loss': 0.4483, 'learning_rate': 1.8305391002641526e-06, 'epoch': 1.61} {'loss': 0.4682, 'learning_rate': 1.8303503164161562e-06, 'epoch': 1.61} {'loss': 0.4217, 'learning_rate': 1.8301615413226791e-06, 'epoch': 1.61} {'loss': 0.526, 'learning_rate': 1.8299727749839158e-06, 'epoch': 1.61} {'loss': 0.5565, 'learning_rate': 1.8297840174000793e-06, 'epoch': 1.61} {'loss': 0.4868, 'learning_rate': 1.8295952685713635e-06, 'epoch': 1.61} {'loss': 0.4793, 'learning_rate': 1.8294065284979745e-06, 'epoch': 1.61} {'loss': 0.4759, 'learning_rate': 1.8292177971801161e-06, 'epoch': 1.61} {'loss': 0.5268, 'learning_rate': 1.829029074617984e-06, 'epoch': 1.61} {'loss': 0.2943, 'learning_rate': 1.8288403608117888e-06, 'epoch': 1.61} {'loss': 0.5548, 'learning_rate': 1.828651655761724e-06, 'epoch': 1.61} {'loss': 0.4437, 'learning_rate': 1.8284629594680015e-06, 'epoch': 1.61} {'loss': 0.619, 'learning_rate': 1.8282742719308167e-06, 'epoch': 1.61} {'loss': 0.5382, 'learning_rate': 1.8280855931503728e-06, 'epoch': 1.61} {'loss': 0.4105, 'learning_rate': 1.827896923126875e-06, 'epoch': 1.61} {'loss': 0.5167, 'learning_rate': 1.827708261860518e-06, 'epoch': 1.61} {'loss': 0.548, 'learning_rate': 1.8275196093515146e-06, 'epoch': 1.61} {'loss': 0.5147, 'learning_rate': 1.827330965600057e-06, 'epoch': 1.61} {'loss': 0.3231, 'learning_rate': 1.8271423306063562e-06, 'epoch': 1.61} {'loss': 0.4573, 'learning_rate': 1.8269537043706076e-06, 'epoch': 1.61} {'loss': 0.4924, 'learning_rate': 1.8267650868930165e-06, 'epoch': 1.61} {'loss': 0.409, 'learning_rate': 1.826576478173786e-06, 'epoch': 1.61} {'loss': 0.5387, 'learning_rate': 1.8263878782131117e-06, 'epoch': 1.61} {'loss': 0.5948, 'learning_rate': 1.8261992870112054e-06, 'epoch': 1.61} {'loss': 0.4829, 'learning_rate': 1.8260107045682596e-06, 'epoch': 1.61} {'loss': 0.5548, 'learning_rate': 1.825822130884486e-06, 'epoch': 1.61} {'loss': 0.6157, 'learning_rate': 1.82563356596008e-06, 'epoch': 1.61} {'loss': 0.4525, 'learning_rate': 1.8254450097952437e-06, 'epoch': 1.61} {'loss': 0.4557, 'learning_rate': 1.8252564623901846e-06, 'epoch': 1.61} {'loss': 0.5597, 'learning_rate': 1.8250679237450962e-06, 'epoch': 1.61} {'loss': 0.3577, 'learning_rate': 1.8248793938601895e-06, 'epoch': 1.61} {'loss': 0.4989, 'learning_rate': 1.8246908727356583e-06, 'epoch': 1.61} {'loss': 0.6319, 'learning_rate': 1.8245023603717127e-06, 'epoch': 1.61} {'loss': 0.4509, 'learning_rate': 1.824313856768548e-06, 'epoch': 1.61} {'loss': 0.4775, 'learning_rate': 1.8241253619263699e-06, 'epoch': 1.61} {'loss': 0.4064, 'learning_rate': 1.8239368758453824e-06, 'epoch': 1.61} {'loss': 0.5431, 'learning_rate': 1.8237483985257775e-06, 'epoch': 1.61} {'loss': 0.5431, 'learning_rate': 1.823559929967771e-06, 'epoch': 1.61} {'loss': 0.5303, 'learning_rate': 1.8233714701715543e-06, 'epoch': 1.61} {'loss': 0.5056, 'learning_rate': 1.8231830191373334e-06, 'epoch': 1.61} {'loss': 0.4803, 'learning_rate': 1.8229945768653102e-06, 'epoch': 1.61} {'loss': 0.4819, 'learning_rate': 1.8228061433556866e-06, 'epoch': 1.61} {'loss': 0.5583, 'learning_rate': 1.8226177186086658e-06, 'epoch': 1.61} {'loss': 0.4617, 'learning_rate': 1.8224293026244444e-06, 'epoch': 1.61} {'loss': 0.6524, 'learning_rate': 1.8222408954032323e-06, 'epoch': 1.61} {'loss': 0.3844, 'learning_rate': 1.8220524969452248e-06, 'epoch': 1.61} {'loss': 0.5083, 'learning_rate': 1.821864107250626e-06, 'epoch': 1.61} {'loss': 0.5856, 'learning_rate': 1.8216757263196384e-06, 'epoch': 1.61} {'loss': 0.6162, 'learning_rate': 1.8214873541524625e-06, 'epoch': 1.61} {'loss': 0.5086, 'learning_rate': 1.821298990749304e-06, 'epoch': 1.61} {'loss': 0.441, 'learning_rate': 1.821110636110357e-06, 'epoch': 1.61} {'loss': 0.4517, 'learning_rate': 1.8209222902358326e-06, 'epoch': 1.61} {'loss': 0.4523, 'learning_rate': 1.820733953125926e-06, 'epoch': 1.61} {'loss': 0.4472, 'learning_rate': 1.8205456247808417e-06, 'epoch': 1.61} {'loss': 0.6087, 'learning_rate': 1.8203573052007805e-06, 'epoch': 1.61} {'loss': 0.4495, 'learning_rate': 1.8201689943859446e-06, 'epoch': 1.61} {'loss': 0.5389, 'learning_rate': 1.8199806923365393e-06, 'epoch': 1.61} {'loss': 0.5088, 'learning_rate': 1.81979239905276e-06, 'epoch': 1.61} {'loss': 0.5941, 'learning_rate': 1.819604114534811e-06, 'epoch': 1.61} {'loss': 0.4935, 'learning_rate': 1.819415838782894e-06, 'epoch': 1.61} {'loss': 0.583, 'learning_rate': 1.819227571797213e-06, 'epoch': 1.61} {'loss': 0.2819, 'learning_rate': 1.819039313577966e-06, 'epoch': 1.61} {'loss': 0.4689, 'learning_rate': 1.8188510641253588e-06, 'epoch': 1.61} {'loss': 0.464, 'learning_rate': 1.818662823439592e-06, 'epoch': 1.61} {'loss': 0.5088, 'learning_rate': 1.8184745915208646e-06, 'epoch': 1.61} {'loss': 0.4629, 'learning_rate': 1.8182863683693798e-06, 'epoch': 1.61} {'loss': 0.5836, 'learning_rate': 1.8180981539853405e-06, 'epoch': 1.61} {'loss': 0.4906, 'learning_rate': 1.8179099483689467e-06, 'epoch': 1.61} {'loss': 0.4816, 'learning_rate': 1.8177217515204026e-06, 'epoch': 1.61} {'loss': 0.5695, 'learning_rate': 1.8175335634399039e-06, 'epoch': 1.61} {'loss': 0.563, 'learning_rate': 1.8173453841276623e-06, 'epoch': 1.61} {'loss': 0.5616, 'learning_rate': 1.81715721358387e-06, 'epoch': 1.61} {'loss': 0.5854, 'learning_rate': 1.8169690518087324e-06, 'epoch': 1.61} {'loss': 0.6193, 'learning_rate': 1.8167808988024516e-06, 'epoch': 1.61} {'loss': 0.274, 'learning_rate': 1.8165927545652283e-06, 'epoch': 1.61} {'loss': 0.4947, 'learning_rate': 1.8164046190972673e-06, 'epoch': 1.61} {'loss': 0.3941, 'learning_rate': 1.8162164923987647e-06, 'epoch': 1.61} {'loss': 0.5161, 'learning_rate': 1.8160283744699248e-06, 'epoch': 1.61} {'loss': 0.5028, 'learning_rate': 1.8158402653109486e-06, 'epoch': 1.61} {'loss': 0.4706, 'learning_rate': 1.8156521649220394e-06, 'epoch': 1.61} {'loss': 0.4392, 'learning_rate': 1.8154640733033969e-06, 'epoch': 1.61} {'loss': 0.4593, 'learning_rate': 1.815275990455223e-06, 'epoch': 1.61} {'loss': 0.4772, 'learning_rate': 1.8150879163777225e-06, 'epoch': 1.61} {'loss': 0.5999, 'learning_rate': 1.8148998510710914e-06, 'epoch': 1.61} {'loss': 0.3448, 'learning_rate': 1.8147117945355342e-06, 'epoch': 1.61} {'loss': 0.5759, 'learning_rate': 1.8145237467712507e-06, 'epoch': 1.61} {'loss': 0.5696, 'learning_rate': 1.814335707778445e-06, 'epoch': 1.61} {'loss': 0.3702, 'learning_rate': 1.8141476775573174e-06, 'epoch': 1.61} {'loss': 0.6102, 'learning_rate': 1.8139596561080696e-06, 'epoch': 1.61} {'loss': 0.5954, 'learning_rate': 1.813771643430905e-06, 'epoch': 1.61} {'loss': 0.6383, 'learning_rate': 1.8135836395260199e-06, 'epoch': 1.61} {'loss': 0.461, 'learning_rate': 1.8133956443936195e-06, 'epoch': 1.61} {'loss': 0.5919, 'learning_rate': 1.8132076580339043e-06, 'epoch': 1.61} {'loss': 0.5625, 'learning_rate': 1.8130196804470768e-06, 'epoch': 1.61} {'loss': 0.5694, 'learning_rate': 1.812831711633336e-06, 'epoch': 1.61} {'loss': 0.5676, 'learning_rate': 1.8126437515928886e-06, 'epoch': 1.61} {'loss': 0.3988, 'learning_rate': 1.8124558003259296e-06, 'epoch': 1.61} {'loss': 0.4905, 'learning_rate': 1.8122678578326636e-06, 'epoch': 1.61} {'loss': 0.3719, 'learning_rate': 1.8120799241132913e-06, 'epoch': 1.61} {'loss': 0.4558, 'learning_rate': 1.811891999168014e-06, 'epoch': 1.61} {'loss': 0.6314, 'learning_rate': 1.8117040829970333e-06, 'epoch': 1.61} {'loss': 0.3962, 'learning_rate': 1.8115161756005517e-06, 'epoch': 1.61} {'loss': 0.5769, 'learning_rate': 1.811328276978771e-06, 'epoch': 1.61} {'loss': 0.4454, 'learning_rate': 1.811140387131889e-06, 'epoch': 1.61} {'loss': 0.4322, 'learning_rate': 1.8109525060601097e-06, 'epoch': 1.61} {'loss': 0.5301, 'learning_rate': 1.810764633763633e-06, 'epoch': 1.61} {'loss': 0.524, 'learning_rate': 1.8105767702426623e-06, 'epoch': 1.61} {'loss': 0.4802, 'learning_rate': 1.8103889154973964e-06, 'epoch': 1.61} {'loss': 0.4587, 'learning_rate': 1.8102010695280393e-06, 'epoch': 1.61} {'loss': 0.4153, 'learning_rate': 1.810013232334793e-06, 'epoch': 1.61} {'loss': 0.4345, 'learning_rate': 1.8098254039178531e-06, 'epoch': 1.61} {'loss': 0.6331, 'learning_rate': 1.8096375842774261e-06, 'epoch': 1.61} {'loss': 0.5173, 'learning_rate': 1.8094497734137106e-06, 'epoch': 1.61} {'loss': 0.4846, 'learning_rate': 1.8092619713269088e-06, 'epoch': 1.61} {'loss': 0.5846, 'learning_rate': 1.809074178017225e-06, 'epoch': 1.61} {'loss': 0.5648, 'learning_rate': 1.808886393484852e-06, 'epoch': 1.61} {'loss': 0.5345, 'learning_rate': 1.8086986177300025e-06, 'epoch': 1.61} {'loss': 0.5958, 'learning_rate': 1.8085108507528682e-06, 'epoch': 1.61} {'loss': 0.4095, 'learning_rate': 1.8083230925536544e-06, 'epoch': 1.61} {'loss': 0.4184, 'learning_rate': 1.808135343132562e-06, 'epoch': 1.61} {'loss': 0.5725, 'learning_rate': 1.8079476024897913e-06, 'epoch': 1.61} {'loss': 0.4581, 'learning_rate': 1.8077598706255472e-06, 'epoch': 1.61} {'loss': 0.3977, 'learning_rate': 1.8075721475400232e-06, 'epoch': 1.61} {'loss': 0.4479, 'learning_rate': 1.807384433233429e-06, 'epoch': 1.61} {'loss': 0.5873, 'learning_rate': 1.80719672770596e-06, 'epoch': 1.61} {'loss': 0.5397, 'learning_rate': 1.807009030957818e-06, 'epoch': 1.61} {'loss': 0.5466, 'learning_rate': 1.806821342989209e-06, 'epoch': 1.61} {'loss': 0.5734, 'learning_rate': 1.8066336638003257e-06, 'epoch': 1.61} {'loss': 0.5165, 'learning_rate': 1.806445993391378e-06, 'epoch': 1.61} {'loss': 0.6117, 'learning_rate': 1.8062583317625583e-06, 'epoch': 1.61} {'loss': 0.6004, 'learning_rate': 1.806070678914077e-06, 'epoch': 1.61} {'loss': 0.6443, 'learning_rate': 1.8058830348461288e-06, 'epoch': 1.61} {'loss': 0.3766, 'learning_rate': 1.8056953995589154e-06, 'epoch': 1.61} {'loss': 0.4618, 'learning_rate': 1.8055077730526417e-06, 'epoch': 1.61} {'loss': 0.4752, 'learning_rate': 1.8053201553275013e-06, 'epoch': 1.61} {'loss': 0.5801, 'learning_rate': 1.8051325463837055e-06, 'epoch': 1.61} {'loss': 0.4291, 'learning_rate': 1.8049449462214462e-06, 'epoch': 1.61} {'loss': 0.5355, 'learning_rate': 1.8047573548409292e-06, 'epoch': 1.61} {'loss': 0.491, 'learning_rate': 1.8045697722423538e-06, 'epoch': 1.61} {'loss': 0.5286, 'learning_rate': 1.8043821984259212e-06, 'epoch': 1.61} {'loss': 0.5432, 'learning_rate': 1.8041946333918359e-06, 'epoch': 1.61} {'loss': 0.5392, 'learning_rate': 1.8040070771402906e-06, 'epoch': 1.61} {'loss': 0.6489, 'learning_rate': 1.8038195296714966e-06, 'epoch': 1.61} {'loss': 0.5465, 'learning_rate': 1.8036319909856471e-06, 'epoch': 1.61} {'loss': 0.5317, 'learning_rate': 1.8034444610829461e-06, 'epoch': 1.61} {'loss': 0.4396, 'learning_rate': 1.8032569399635935e-06, 'epoch': 1.61} {'loss': 0.3656, 'learning_rate': 1.8030694276277904e-06, 'epoch': 1.61} {'loss': 0.532, 'learning_rate': 1.802881924075741e-06, 'epoch': 1.61} {'loss': 0.4754, 'learning_rate': 1.8026944293076397e-06, 'epoch': 1.61} {'loss': 0.5648, 'learning_rate': 1.8025069433236953e-06, 'epoch': 1.61} {'loss': 0.5688, 'learning_rate': 1.8023194661241017e-06, 'epoch': 1.61} {'loss': 0.5401, 'learning_rate': 1.8021319977090633e-06, 'epoch': 1.61} {'loss': 0.3741, 'learning_rate': 1.8019445380787826e-06, 'epoch': 1.61} {'loss': 0.4708, 'learning_rate': 1.8017570872334534e-06, 'epoch': 1.61} {'loss': 0.5276, 'learning_rate': 1.8015696451732855e-06, 'epoch': 1.61} {'loss': 0.611, 'learning_rate': 1.8013822118984726e-06, 'epoch': 1.61} {'loss': 0.484, 'learning_rate': 1.8011947874092218e-06, 'epoch': 1.61} {'loss': 0.5219, 'learning_rate': 1.8010073717057285e-06, 'epoch': 1.61} {'loss': 0.6205, 'learning_rate': 1.8008199647881963e-06, 'epoch': 1.61} {'loss': 0.5402, 'learning_rate': 1.800632566656828e-06, 'epoch': 1.61} {'loss': 0.6189, 'learning_rate': 1.800445177311817e-06, 'epoch': 1.61} {'loss': 0.4757, 'learning_rate': 1.8002577967533741e-06, 'epoch': 1.61} {'loss': 0.5585, 'learning_rate': 1.8000704249816902e-06, 'epoch': 1.61} {'loss': 0.5184, 'learning_rate': 1.7998830619969753e-06, 'epoch': 1.61} {'loss': 0.5601, 'learning_rate': 1.7996957077994237e-06, 'epoch': 1.61} {'loss': 0.5197, 'learning_rate': 1.7995083623892385e-06, 'epoch': 1.61} {'loss': 0.5272, 'learning_rate': 1.7993210257666226e-06, 'epoch': 1.61} {'loss': 0.4775, 'learning_rate': 1.7991336979317697e-06, 'epoch': 1.61} {'loss': 0.4399, 'learning_rate': 1.7989463788848893e-06, 'epoch': 1.61} {'loss': 0.5653, 'learning_rate': 1.7987590686261736e-06, 'epoch': 1.61} {'loss': 0.4672, 'learning_rate': 1.7985717671558322e-06, 'epoch': 1.61} {'loss': 0.4587, 'learning_rate': 1.7983844744740598e-06, 'epoch': 1.61} {'loss': 0.4524, 'learning_rate': 1.798197190581058e-06, 'epoch': 1.61} {'loss': 0.6198, 'learning_rate': 1.7980099154770314e-06, 'epoch': 1.61} {'loss': 0.5359, 'learning_rate': 1.797822649162172e-06, 'epoch': 1.61} {'loss': 0.5298, 'learning_rate': 1.7976353916366906e-06, 'epoch': 1.61} {'loss': 0.4428, 'learning_rate': 1.7974481429007783e-06, 'epoch': 1.61} {'loss': 0.4765, 'learning_rate': 1.7972609029546461e-06, 'epoch': 1.61} {'loss': 0.5635, 'learning_rate': 1.7970736717984861e-06, 'epoch': 1.61} {'loss': 0.5589, 'learning_rate': 1.7968864494325022e-06, 'epoch': 1.61} {'loss': 0.3976, 'learning_rate': 1.7966992358568979e-06, 'epoch': 1.61} {'loss': 0.508, 'learning_rate': 1.7965120310718652e-06, 'epoch': 1.61} {'loss': 0.5432, 'learning_rate': 1.7963248350776152e-06, 'epoch': 1.61} {'loss': 0.5061, 'learning_rate': 1.796137647874342e-06, 'epoch': 1.61} {'loss': 0.4044, 'learning_rate': 1.7959504694622465e-06, 'epoch': 1.61} {'loss': 0.4272, 'learning_rate': 1.7957632998415308e-06, 'epoch': 1.61} {'loss': 0.518, 'learning_rate': 1.795576139012396e-06, 'epoch': 1.61} {'loss': 0.5457, 'learning_rate': 1.795388986975044e-06, 'epoch': 1.61} {'loss': 0.6265, 'learning_rate': 1.795201843729668e-06, 'epoch': 1.61} {'loss': 0.6278, 'learning_rate': 1.795014709276478e-06, 'epoch': 1.61} {'loss': 0.5804, 'learning_rate': 1.7948275836156692e-06, 'epoch': 1.61} {'loss': 0.5016, 'learning_rate': 1.7946404667474426e-06, 'epoch': 1.61} {'loss': 0.4627, 'learning_rate': 1.7944533586719992e-06, 'epoch': 1.61} {'loss': 0.3637, 'learning_rate': 1.7942662593895399e-06, 'epoch': 1.61} {'loss': 0.5126, 'learning_rate': 1.7940791689002668e-06, 'epoch': 1.61} {'loss': 0.451, 'learning_rate': 1.793892087204374e-06, 'epoch': 1.61} {'loss': 0.6142, 'learning_rate': 1.7937050143020717e-06, 'epoch': 1.61} {'loss': 0.4153, 'learning_rate': 1.7935179501935519e-06, 'epoch': 1.61} {'loss': 0.3949, 'learning_rate': 1.7933308948790196e-06, 'epoch': 1.61} {'loss': 0.4636, 'learning_rate': 1.7931438483586728e-06, 'epoch': 1.61} {'loss': 0.5197, 'learning_rate': 1.7929568106327133e-06, 'epoch': 1.61} {'loss': 0.6466, 'learning_rate': 1.7927697817013435e-06, 'epoch': 1.61} {'loss': 0.4302, 'learning_rate': 1.7925827615647595e-06, 'epoch': 1.61} {'loss': 0.4362, 'learning_rate': 1.7923957502231638e-06, 'epoch': 1.61} {'loss': 0.4392, 'learning_rate': 1.792208747676757e-06, 'epoch': 1.61} {'loss': 0.6141, 'learning_rate': 1.792021753925739e-06, 'epoch': 1.61} {'loss': 0.4362, 'learning_rate': 1.7918347689703108e-06, 'epoch': 1.61} {'loss': 0.6477, 'learning_rate': 1.7916477928106724e-06, 'epoch': 1.61} {'loss': 0.4417, 'learning_rate': 1.7914608254470267e-06, 'epoch': 1.61} {'loss': 0.4609, 'learning_rate': 1.7912738668795694e-06, 'epoch': 1.61} {'loss': 0.441, 'learning_rate': 1.7910869171085032e-06, 'epoch': 1.61} {'loss': 0.5435, 'learning_rate': 1.7908999761340273e-06, 'epoch': 1.61} {'loss': 0.5119, 'learning_rate': 1.7907130439563437e-06, 'epoch': 1.61} {'loss': 0.5393, 'learning_rate': 1.790526120575652e-06, 'epoch': 1.61} {'loss': 0.565, 'learning_rate': 1.7903392059921543e-06, 'epoch': 1.61} {'loss': 0.488, 'learning_rate': 1.7901523002060473e-06, 'epoch': 1.61} {'loss': 0.6066, 'learning_rate': 1.7899654032175329e-06, 'epoch': 1.61} {'loss': 0.3973, 'learning_rate': 1.789778515026812e-06, 'epoch': 1.61} {'loss': 0.5452, 'learning_rate': 1.7895916356340836e-06, 'epoch': 1.61} {'loss': 0.642, 'learning_rate': 1.7894047650395497e-06, 'epoch': 1.61} {'loss': 0.6458, 'learning_rate': 1.789217903243412e-06, 'epoch': 1.61} {'loss': 0.4516, 'learning_rate': 1.7890310502458652e-06, 'epoch': 1.61} {'loss': 0.5274, 'learning_rate': 1.7888442060471134e-06, 'epoch': 1.61} {'loss': 0.5573, 'learning_rate': 1.7886573706473554e-06, 'epoch': 1.61} {'loss': 0.4697, 'learning_rate': 1.788470544046793e-06, 'epoch': 1.61} {'loss': 0.5006, 'learning_rate': 1.7882837262456255e-06, 'epoch': 1.61} {'loss': 0.5956, 'learning_rate': 1.788096917244052e-06, 'epoch': 1.61} {'loss': 0.5397, 'learning_rate': 1.7879101170422776e-06, 'epoch': 1.61} {'loss': 0.5018, 'learning_rate': 1.7877233256404957e-06, 'epoch': 1.61} {'loss': 0.6275, 'learning_rate': 1.787536543038909e-06, 'epoch': 1.61} {'loss': 0.4853, 'learning_rate': 1.7873497692377184e-06, 'epoch': 1.61} {'loss': 0.3947, 'learning_rate': 1.7871630042371246e-06, 'epoch': 1.61} {'loss': 0.497, 'learning_rate': 1.7869762480373254e-06, 'epoch': 1.61} {'loss': 0.4336, 'learning_rate': 1.786789500638526e-06, 'epoch': 1.61} {'loss': 0.4496, 'learning_rate': 1.786602762040921e-06, 'epoch': 1.61} {'loss': 0.6352, 'learning_rate': 1.786416032244711e-06, 'epoch': 1.61} {'loss': 0.7191, 'learning_rate': 1.7862293112500984e-06, 'epoch': 1.61} {'loss': 0.559, 'learning_rate': 1.7860425990572816e-06, 'epoch': 1.61} {'loss': 0.4305, 'learning_rate': 1.7858558956664628e-06, 'epoch': 1.61} {'loss': 0.4426, 'learning_rate': 1.7856692010778399e-06, 'epoch': 1.61} {'loss': 0.5012, 'learning_rate': 1.7854825152916166e-06, 'epoch': 1.61} {'loss': 0.5514, 'learning_rate': 1.7852958383079878e-06, 'epoch': 1.61} {'loss': 0.5659, 'learning_rate': 1.785109170127156e-06, 'epoch': 1.61} {'loss': 0.4049, 'learning_rate': 1.7849225107493207e-06, 'epoch': 1.61} {'loss': 0.3428, 'learning_rate': 1.7847358601746822e-06, 'epoch': 1.61} {'loss': 0.6586, 'learning_rate': 1.7845492184034418e-06, 'epoch': 1.61} {'loss': 0.6124, 'learning_rate': 1.7843625854357971e-06, 'epoch': 1.61} {'loss': 0.4585, 'learning_rate': 1.7841759612719521e-06, 'epoch': 1.62} {'loss': 0.5429, 'learning_rate': 1.7839893459121026e-06, 'epoch': 1.62} {'loss': 0.43, 'learning_rate': 1.7838027393564495e-06, 'epoch': 1.62} {'loss': 0.57, 'learning_rate': 1.7836161416051934e-06, 'epoch': 1.62} {'loss': 0.6486, 'learning_rate': 1.7834295526585344e-06, 'epoch': 1.62} {'loss': 0.4164, 'learning_rate': 1.7832429725166733e-06, 'epoch': 1.62} {'loss': 0.514, 'learning_rate': 1.7830564011798057e-06, 'epoch': 1.62} {'loss': 0.4318, 'learning_rate': 1.7828698386481392e-06, 'epoch': 1.62} {'loss': 0.4538, 'learning_rate': 1.7826832849218666e-06, 'epoch': 1.62} {'loss': 0.5881, 'learning_rate': 1.7824967400011906e-06, 'epoch': 1.62} {'loss': 0.5853, 'learning_rate': 1.7823102038863117e-06, 'epoch': 1.62} {'loss': 0.4584, 'learning_rate': 1.7821236765774274e-06, 'epoch': 1.62} {'loss': 0.5227, 'learning_rate': 1.7819371580747436e-06, 'epoch': 1.62} {'loss': 0.5523, 'learning_rate': 1.7817506483784496e-06, 'epoch': 1.62} {'loss': 0.5603, 'learning_rate': 1.781564147488758e-06, 'epoch': 1.62} {'loss': 0.5745, 'learning_rate': 1.7813776554058581e-06, 'epoch': 1.62} {'loss': 0.5277, 'learning_rate': 1.7811911721299547e-06, 'epoch': 1.62} {'loss': 0.5631, 'learning_rate': 1.781004697661246e-06, 'epoch': 1.62} {'loss': 0.5906, 'learning_rate': 1.7808182319999333e-06, 'epoch': 1.62} {'loss': 0.6048, 'learning_rate': 1.7806317751462177e-06, 'epoch': 1.62} {'loss': 0.4989, 'learning_rate': 1.780445327100293e-06, 'epoch': 1.62} {'loss': 0.6807, 'learning_rate': 1.7802588878623672e-06, 'epoch': 1.62} {'loss': 0.5094, 'learning_rate': 1.7800724574326334e-06, 'epoch': 1.62} {'loss': 0.2965, 'learning_rate': 1.7798860358112934e-06, 'epoch': 1.62} {'loss': 0.5149, 'learning_rate': 1.7796996229985508e-06, 'epoch': 1.62} {'loss': 0.3997, 'learning_rate': 1.7795132189945962e-06, 'epoch': 1.62} {'loss': 0.4021, 'learning_rate': 1.7793268237996409e-06, 'epoch': 1.62} {'loss': 0.6734, 'learning_rate': 1.7791404374138733e-06, 'epoch': 1.62} {'loss': 0.5366, 'learning_rate': 1.7789540598375044e-06, 'epoch': 1.62} {'loss': 0.4938, 'learning_rate': 1.7787676910707252e-06, 'epoch': 1.62} {'loss': 0.3531, 'learning_rate': 1.7785813311137378e-06, 'epoch': 1.62} {'loss': 0.4801, 'learning_rate': 1.7783949799667465e-06, 'epoch': 1.62} {'loss': 0.5827, 'learning_rate': 1.7782086376299412e-06, 'epoch': 1.62} {'loss': 0.3916, 'learning_rate': 1.7780223041035328e-06, 'epoch': 1.62} {'loss': 0.5507, 'learning_rate': 1.7778359793877098e-06, 'epoch': 1.62} {'loss': 0.7081, 'learning_rate': 1.7776496634826834e-06, 'epoch': 1.62} {'loss': 0.5561, 'learning_rate': 1.7774633563886445e-06, 'epoch': 1.62} {'loss': 0.5857, 'learning_rate': 1.7772770581057952e-06, 'epoch': 1.62} {'loss': 0.4308, 'learning_rate': 1.7770907686343397e-06, 'epoch': 1.62} {'loss': 0.4233, 'learning_rate': 1.7769044879744669e-06, 'epoch': 1.62} {'loss': 0.4672, 'learning_rate': 1.7767182161263897e-06, 'epoch': 1.62} {'loss': 0.5422, 'learning_rate': 1.7765319530902946e-06, 'epoch': 1.62} {'loss': 0.4955, 'learning_rate': 1.776345698866394e-06, 'epoch': 1.62} {'loss': 0.5468, 'learning_rate': 1.7761594534548787e-06, 'epoch': 1.62} {'loss': 0.5979, 'learning_rate': 1.7759732168559495e-06, 'epoch': 1.62} {'loss': 0.4349, 'learning_rate': 1.775786989069811e-06, 'epoch': 1.62} {'loss': 0.4468, 'learning_rate': 1.7756007700966537e-06, 'epoch': 1.62} {'loss': 0.4731, 'learning_rate': 1.775414559936688e-06, 'epoch': 1.62} {'loss': 0.5362, 'learning_rate': 1.7752283585901043e-06, 'epoch': 1.62} {'loss': 0.4879, 'learning_rate': 1.775042166057106e-06, 'epoch': 1.62} {'loss': 0.6083, 'learning_rate': 1.774855982337893e-06, 'epoch': 1.62} {'loss': 0.532, 'learning_rate': 1.774669807432664e-06, 'epoch': 1.62} {'loss': 0.3761, 'learning_rate': 1.774483641341621e-06, 'epoch': 1.62} {'loss': 0.5517, 'learning_rate': 1.7742974840649563e-06, 'epoch': 1.62} {'loss': 0.5613, 'learning_rate': 1.7741113356028793e-06, 'epoch': 1.62} {'loss': 0.4431, 'learning_rate': 1.7739251959555814e-06, 'epoch': 1.62} {'loss': 0.3582, 'learning_rate': 1.7737390651232655e-06, 'epoch': 1.62} {'loss': 0.4918, 'learning_rate': 1.7735529431061304e-06, 'epoch': 1.62} {'loss': 0.4477, 'learning_rate': 1.7733668299043761e-06, 'epoch': 1.62} {'loss': 0.4762, 'learning_rate': 1.7731807255182043e-06, 'epoch': 1.62} {'loss': 0.4645, 'learning_rate': 1.7729946299478073e-06, 'epoch': 1.62} {'loss': 0.5093, 'learning_rate': 1.7728085431933928e-06, 'epoch': 1.62} {'loss': 0.6556, 'learning_rate': 1.772622465255155e-06, 'epoch': 1.62} {'loss': 0.5632, 'learning_rate': 1.7724363961332947e-06, 'epoch': 1.62} {'loss': 0.5127, 'learning_rate': 1.772250335828014e-06, 'epoch': 1.62} {'loss': 0.5578, 'learning_rate': 1.7720642843395041e-06, 'epoch': 1.62} {'loss': 0.5723, 'learning_rate': 1.7718782416679758e-06, 'epoch': 1.62} {'loss': 0.5927, 'learning_rate': 1.7716922078136168e-06, 'epoch': 1.62} {'loss': 0.5834, 'learning_rate': 1.7715061827766368e-06, 'epoch': 1.62} {'loss': 0.5575, 'learning_rate': 1.7713201665572289e-06, 'epoch': 1.62} {'loss': 0.5876, 'learning_rate': 1.7711341591555942e-06, 'epoch': 1.62} {'loss': 0.4325, 'learning_rate': 1.7709481605719347e-06, 'epoch': 1.62} {'loss': 0.5011, 'learning_rate': 1.7707621708064415e-06, 'epoch': 1.62} {'loss': 0.583, 'learning_rate': 1.7705761898593244e-06, 'epoch': 1.62} {'loss': 0.5432, 'learning_rate': 1.7703902177307751e-06, 'epoch': 1.62} {'loss': 0.4442, 'learning_rate': 1.7702042544209953e-06, 'epoch': 1.62} {'loss': 0.5895, 'learning_rate': 1.770018299930184e-06, 'epoch': 1.62} {'loss': 0.5214, 'learning_rate': 1.7698323542585416e-06, 'epoch': 1.62} {'loss': 0.4327, 'learning_rate': 1.76964641740627e-06, 'epoch': 1.62} {'loss': 0.407, 'learning_rate': 1.769460489373559e-06, 'epoch': 1.62} {'loss': 0.5468, 'learning_rate': 1.7692745701606184e-06, 'epoch': 1.62} {'loss': 0.5844, 'learning_rate': 1.7690886597676416e-06, 'epoch': 1.62} {'loss': 0.37, 'learning_rate': 1.7689027581948292e-06, 'epoch': 1.62} {'loss': 0.4527, 'learning_rate': 1.7687168654423792e-06, 'epoch': 1.62} {'loss': 0.5963, 'learning_rate': 1.7685309815104933e-06, 'epoch': 1.62} {'loss': 0.4197, 'learning_rate': 1.7683451063993705e-06, 'epoch': 1.62} {'loss': 0.5036, 'learning_rate': 1.7681592401092052e-06, 'epoch': 1.62} {'loss': 0.4397, 'learning_rate': 1.7679733826402045e-06, 'epoch': 1.62} {'loss': 0.542, 'learning_rate': 1.767787533992561e-06, 'epoch': 1.62} {'loss': 0.5595, 'learning_rate': 1.7676016941664765e-06, 'epoch': 1.62} {'loss': 0.584, 'learning_rate': 1.7674158631621497e-06, 'epoch': 1.62} {'loss': 0.4046, 'learning_rate': 1.7672300409797794e-06, 'epoch': 1.62} {'loss': 0.4511, 'learning_rate': 1.7670442276195688e-06, 'epoch': 1.62} {'loss': 0.4699, 'learning_rate': 1.76685842308171e-06, 'epoch': 1.62} {'loss': 0.3977, 'learning_rate': 1.7666726273664047e-06, 'epoch': 1.62} {'loss': 0.4498, 'learning_rate': 1.7664868404738534e-06, 'epoch': 1.62} {'loss': 0.6227, 'learning_rate': 1.7663010624042553e-06, 'epoch': 1.62} {'loss': 0.5888, 'learning_rate': 1.7661152931578084e-06, 'epoch': 1.62} {'loss': 0.6101, 'learning_rate': 1.7659295327347114e-06, 'epoch': 1.62} {'loss': 0.4108, 'learning_rate': 1.7657437811351674e-06, 'epoch': 1.62} {'loss': 0.4231, 'learning_rate': 1.7655580383593695e-06, 'epoch': 1.62} {'loss': 0.4842, 'learning_rate': 1.7653723044075188e-06, 'epoch': 1.62} {'loss': 0.62, 'learning_rate': 1.765186579279815e-06, 'epoch': 1.62} {'loss': 0.4688, 'learning_rate': 1.765000862976458e-06, 'epoch': 1.62} {'loss': 0.5382, 'learning_rate': 1.7648151554976444e-06, 'epoch': 1.62} {'loss': 0.4854, 'learning_rate': 1.7646294568435761e-06, 'epoch': 1.62} {'loss': 0.307, 'learning_rate': 1.7644437670144521e-06, 'epoch': 1.62} {'loss': 0.4594, 'learning_rate': 1.7642580860104674e-06, 'epoch': 1.62} {'loss': 0.5264, 'learning_rate': 1.7640724138318244e-06, 'epoch': 1.62} {'loss': 0.5532, 'learning_rate': 1.7638867504787205e-06, 'epoch': 1.62} {'loss': 0.5395, 'learning_rate': 1.7637010959513556e-06, 'epoch': 1.62} {'loss': 0.4777, 'learning_rate': 1.7635154502499275e-06, 'epoch': 1.62} {'loss': 0.4415, 'learning_rate': 1.763329813374639e-06, 'epoch': 1.62} {'loss': 0.6044, 'learning_rate': 1.7631441853256837e-06, 'epoch': 1.62} {'loss': 0.4405, 'learning_rate': 1.7629585661032634e-06, 'epoch': 1.62} {'loss': 0.5321, 'learning_rate': 1.7627729557075757e-06, 'epoch': 1.62} {'loss': 0.4651, 'learning_rate': 1.7625873541388195e-06, 'epoch': 1.62} {'loss': 0.4804, 'learning_rate': 1.7624017613971955e-06, 'epoch': 1.62} {'loss': 0.6166, 'learning_rate': 1.7622161774829017e-06, 'epoch': 1.62} {'loss': 0.4246, 'learning_rate': 1.7620306023961388e-06, 'epoch': 1.62} {'loss': 0.4544, 'learning_rate': 1.7618450361371009e-06, 'epoch': 1.62} {'loss': 0.6159, 'learning_rate': 1.7616594787059892e-06, 'epoch': 1.62} {'loss': 0.6204, 'learning_rate': 1.7614739301030037e-06, 'epoch': 1.62} {'loss': 0.3873, 'learning_rate': 1.7612883903283428e-06, 'epoch': 1.62} {'loss': 0.5485, 'learning_rate': 1.7611028593822044e-06, 'epoch': 1.62} {'loss': 0.4665, 'learning_rate': 1.760917337264788e-06, 'epoch': 1.62} {'loss': 0.5357, 'learning_rate': 1.760731823976295e-06, 'epoch': 1.62} {'loss': 0.6089, 'learning_rate': 1.760546319516918e-06, 'epoch': 1.62} {'loss': 0.5371, 'learning_rate': 1.7603608238868598e-06, 'epoch': 1.62} {'loss': 0.4113, 'learning_rate': 1.7601753370863195e-06, 'epoch': 1.62} {'loss': 0.4369, 'learning_rate': 1.759989859115494e-06, 'epoch': 1.62} {'loss': 0.4858, 'learning_rate': 1.7598043899745864e-06, 'epoch': 1.62} {'loss': 0.4195, 'learning_rate': 1.7596189296637888e-06, 'epoch': 1.62} {'loss': 0.3791, 'learning_rate': 1.7594334781833034e-06, 'epoch': 1.62} {'loss': 0.5113, 'learning_rate': 1.7592480355333297e-06, 'epoch': 1.62} {'loss': 0.578, 'learning_rate': 1.7590626017140644e-06, 'epoch': 1.62} {'loss': 0.5499, 'learning_rate': 1.7588771767257073e-06, 'epoch': 1.62} {'loss': 0.4042, 'learning_rate': 1.7586917605684584e-06, 'epoch': 1.62} {'loss': 0.4946, 'learning_rate': 1.7585063532425162e-06, 'epoch': 1.62} {'loss': 0.454, 'learning_rate': 1.7583209547480762e-06, 'epoch': 1.62} {'loss': 0.5549, 'learning_rate': 1.7581355650853393e-06, 'epoch': 1.62} {'loss': 0.4226, 'learning_rate': 1.7579501842545045e-06, 'epoch': 1.62} {'loss': 0.5225, 'learning_rate': 1.757764812255769e-06, 'epoch': 1.62} {'loss': 0.4143, 'learning_rate': 1.7575794490893361e-06, 'epoch': 1.62} {'loss': 0.509, 'learning_rate': 1.7573940947553946e-06, 'epoch': 1.62} {'loss': 0.566, 'learning_rate': 1.7572087492541545e-06, 'epoch': 1.62} {'loss': 0.5327, 'learning_rate': 1.7570234125858066e-06, 'epoch': 1.62} {'loss': 0.5527, 'learning_rate': 1.7568380847505529e-06, 'epoch': 1.62} {'loss': 0.3929, 'learning_rate': 1.756652765748591e-06, 'epoch': 1.62} {'loss': 0.5582, 'learning_rate': 1.7564674555801187e-06, 'epoch': 1.62} {'loss': 0.5652, 'learning_rate': 1.756282154245339e-06, 'epoch': 1.62} {'loss': 0.4581, 'learning_rate': 1.7560968617444417e-06, 'epoch': 1.62} {'loss': 0.4252, 'learning_rate': 1.755911578077636e-06, 'epoch': 1.62} {'loss': 0.4843, 'learning_rate': 1.7557263032451123e-06, 'epoch': 1.62} {'loss': 0.666, 'learning_rate': 1.7555410372470715e-06, 'epoch': 1.62} {'loss': 0.5156, 'learning_rate': 1.755355780083713e-06, 'epoch': 1.62} {'loss': 0.6299, 'learning_rate': 1.7551705317552348e-06, 'epoch': 1.62} {'loss': 0.5628, 'learning_rate': 1.7549852922618381e-06, 'epoch': 1.62} {'loss': 0.5516, 'learning_rate': 1.7548000616037143e-06, 'epoch': 1.62} {'loss': 0.6423, 'learning_rate': 1.7546148397810703e-06, 'epoch': 1.62} {'loss': 0.4197, 'learning_rate': 1.7544296267940997e-06, 'epoch': 1.62} {'loss': 0.593, 'learning_rate': 1.754244422643e-06, 'epoch': 1.62} {'loss': 0.4476, 'learning_rate': 1.7540592273279755e-06, 'epoch': 1.62} {'loss': 0.2676, 'learning_rate': 1.753874040849216e-06, 'epoch': 1.62} {'loss': 0.4764, 'learning_rate': 1.7536888632069293e-06, 'epoch': 1.62} {'loss': 0.4131, 'learning_rate': 1.753503694401304e-06, 'epoch': 1.62} {'loss': 0.6957, 'learning_rate': 1.7533185344325487e-06, 'epoch': 1.62} {'loss': 0.4643, 'learning_rate': 1.7531333833008545e-06, 'epoch': 1.62} {'loss': 0.4911, 'learning_rate': 1.7529482410064224e-06, 'epoch': 1.62} {'loss': 0.5057, 'learning_rate': 1.7527631075494534e-06, 'epoch': 1.62} {'loss': 0.3498, 'learning_rate': 1.7525779829301382e-06, 'epoch': 1.62} {'loss': 0.6048, 'learning_rate': 1.7523928671486846e-06, 'epoch': 1.62} {'loss': 0.5477, 'learning_rate': 1.752207760205281e-06, 'epoch': 1.62} {'loss': 0.4003, 'learning_rate': 1.7520226621001368e-06, 'epoch': 1.62} {'loss': 0.5277, 'learning_rate': 1.7518375728334425e-06, 'epoch': 1.62} {'loss': 0.5166, 'learning_rate': 1.751652492405398e-06, 'epoch': 1.62} {'loss': 0.6068, 'learning_rate': 1.7514674208162052e-06, 'epoch': 1.62} {'loss': 0.4102, 'learning_rate': 1.7512823580660542e-06, 'epoch': 1.62} {'loss': 0.518, 'learning_rate': 1.7510973041551549e-06, 'epoch': 1.62} {'loss': 0.4729, 'learning_rate': 1.7509122590836925e-06, 'epoch': 1.62} {'loss': 0.4502, 'learning_rate': 1.7507272228518779e-06, 'epoch': 1.62} {'loss': 0.5468, 'learning_rate': 1.750542195459901e-06, 'epoch': 1.62} {'loss': 0.6416, 'learning_rate': 1.750357176907963e-06, 'epoch': 1.62} {'loss': 0.4048, 'learning_rate': 1.7501721671962647e-06, 'epoch': 1.62} {'loss': 0.4637, 'learning_rate': 1.7499871663249968e-06, 'epoch': 1.62} {'loss': 0.646, 'learning_rate': 1.749802174294366e-06, 'epoch': 1.62} {'loss': 0.5502, 'learning_rate': 1.7496171911045623e-06, 'epoch': 1.62} {'loss': 0.4715, 'learning_rate': 1.7494322167557932e-06, 'epoch': 1.62} {'loss': 0.4855, 'learning_rate': 1.7492472512482506e-06, 'epoch': 1.62} {'loss': 0.4545, 'learning_rate': 1.7490622945821335e-06, 'epoch': 1.62} {'loss': 0.5341, 'learning_rate': 1.7488773467576437e-06, 'epoch': 1.62} {'loss': 0.5491, 'learning_rate': 1.7486924077749712e-06, 'epoch': 1.62} {'loss': 0.6073, 'learning_rate': 1.7485074776343237e-06, 'epoch': 1.62} {'loss': 0.4637, 'learning_rate': 1.748322556335892e-06, 'epoch': 1.62} {'loss': 0.5914, 'learning_rate': 1.7481376438798814e-06, 'epoch': 1.62} {'loss': 0.535, 'learning_rate': 1.747952740266483e-06, 'epoch': 1.62} {'loss': 0.5155, 'learning_rate': 1.747767845495899e-06, 'epoch': 1.62} {'loss': 0.5985, 'learning_rate': 1.7475829595683292e-06, 'epoch': 1.62} {'loss': 0.6454, 'learning_rate': 1.747398082483963e-06, 'epoch': 1.62} {'loss': 0.4497, 'learning_rate': 1.7472132142430108e-06, 'epoch': 1.62} {'loss': 0.4579, 'learning_rate': 1.7470283548456613e-06, 'epoch': 1.62} {'loss': 0.5841, 'learning_rate': 1.746843504292116e-06, 'epoch': 1.62} {'loss': 0.615, 'learning_rate': 1.746658662582572e-06, 'epoch': 1.62} {'loss': 0.5105, 'learning_rate': 1.746473829717229e-06, 'epoch': 1.62} {'loss': 0.579, 'learning_rate': 1.7462890056962866e-06, 'epoch': 1.62} {'loss': 0.4769, 'learning_rate': 1.746104190519936e-06, 'epoch': 1.62} {'loss': 0.4948, 'learning_rate': 1.7459193841883836e-06, 'epoch': 1.62} {'loss': 0.5152, 'learning_rate': 1.7457345867018216e-06, 'epoch': 1.62} {'loss': 0.5529, 'learning_rate': 1.7455497980604507e-06, 'epoch': 1.62} {'loss': 0.4953, 'learning_rate': 1.7453650182644676e-06, 'epoch': 1.62} {'loss': 0.4516, 'learning_rate': 1.7451802473140712e-06, 'epoch': 1.62} {'loss': 0.4706, 'learning_rate': 1.744995485209461e-06, 'epoch': 1.62} {'loss': 0.4606, 'learning_rate': 1.7448107319508278e-06, 'epoch': 1.62} {'loss': 0.613, 'learning_rate': 1.7446259875383808e-06, 'epoch': 1.62} {'loss': 0.642, 'learning_rate': 1.7444412519723098e-06, 'epoch': 1.62} {'loss': 0.5419, 'learning_rate': 1.7442565252528153e-06, 'epoch': 1.62} {'loss': 0.5726, 'learning_rate': 1.7440718073800966e-06, 'epoch': 1.62} {'loss': 0.481, 'learning_rate': 1.7438870983543454e-06, 'epoch': 1.62} {'loss': 0.5448, 'learning_rate': 1.7437023981757705e-06, 'epoch': 1.62} {'loss': 0.4883, 'learning_rate': 1.7435177068445596e-06, 'epoch': 1.62} {'loss': 0.5021, 'learning_rate': 1.743333024360916e-06, 'epoch': 1.62} {'loss': 0.4318, 'learning_rate': 1.7431483507250358e-06, 'epoch': 1.62} {'loss': 0.5297, 'learning_rate': 1.7429636859371168e-06, 'epoch': 1.62} {'loss': 0.4946, 'learning_rate': 1.7427790299973602e-06, 'epoch': 1.62} {'loss': 0.5414, 'learning_rate': 1.7425943829059566e-06, 'epoch': 1.62} {'loss': 0.5048, 'learning_rate': 1.7424097446631127e-06, 'epoch': 1.62} {'loss': 0.5098, 'learning_rate': 1.7422251152690195e-06, 'epoch': 1.62} {'loss': 0.5504, 'learning_rate': 1.742040494723878e-06, 'epoch': 1.62} {'loss': 0.5413, 'learning_rate': 1.7418558830278853e-06, 'epoch': 1.62} {'loss': 0.48, 'learning_rate': 1.7416712801812396e-06, 'epoch': 1.62} {'loss': 0.5082, 'learning_rate': 1.7414866861841407e-06, 'epoch': 1.62} {'loss': 0.4694, 'learning_rate': 1.7413021010367814e-06, 'epoch': 1.62} {'loss': 0.5322, 'learning_rate': 1.741117524739363e-06, 'epoch': 1.62} {'loss': 0.4109, 'learning_rate': 1.7409329572920819e-06, 'epoch': 1.62} {'loss': 0.4113, 'learning_rate': 1.7407483986951368e-06, 'epoch': 1.62} {'loss': 0.4079, 'learning_rate': 1.7405638489487252e-06, 'epoch': 1.62} {'loss': 0.3873, 'learning_rate': 1.740379308053045e-06, 'epoch': 1.62} {'loss': 0.6055, 'learning_rate': 1.740194776008296e-06, 'epoch': 1.62} {'loss': 0.5981, 'learning_rate': 1.7400102528146712e-06, 'epoch': 1.62} {'loss': 0.5024, 'learning_rate': 1.7398257384723717e-06, 'epoch': 1.62} {'loss': 0.4165, 'learning_rate': 1.7396412329815938e-06, 'epoch': 1.62} {'loss': 0.5557, 'learning_rate': 1.7394567363425363e-06, 'epoch': 1.62} {'loss': 0.5252, 'learning_rate': 1.7392722485553958e-06, 'epoch': 1.62} {'loss': 0.4021, 'learning_rate': 1.7390877696203712e-06, 'epoch': 1.62} {'loss': 0.7036, 'learning_rate': 1.738903299537663e-06, 'epoch': 1.62} {'loss': 0.5815, 'learning_rate': 1.7387188383074616e-06, 'epoch': 1.62} {'loss': 0.5645, 'learning_rate': 1.7385343859299696e-06, 'epoch': 1.62} {'loss': 0.5782, 'learning_rate': 1.7383499424053828e-06, 'epoch': 1.62} {'loss': 0.6388, 'learning_rate': 1.7381655077339e-06, 'epoch': 1.62} {'loss': 0.6042, 'learning_rate': 1.7379810819157184e-06, 'epoch': 1.62} {'loss': 0.506, 'learning_rate': 1.7377966649510391e-06, 'epoch': 1.62} {'loss': 0.4727, 'learning_rate': 1.7376122568400533e-06, 'epoch': 1.62} {'loss': 0.3927, 'learning_rate': 1.7374278575829607e-06, 'epoch': 1.62} {'loss': 0.5982, 'learning_rate': 1.737243467179961e-06, 'epoch': 1.62} {'loss': 0.5922, 'learning_rate': 1.7370590856312509e-06, 'epoch': 1.62} {'loss': 0.4743, 'learning_rate': 1.7368747129370279e-06, 'epoch': 1.62} {'loss': 0.5301, 'learning_rate': 1.7366903490974885e-06, 'epoch': 1.62} {'loss': 0.5759, 'learning_rate': 1.7365059941128336e-06, 'epoch': 1.62} {'loss': 0.3817, 'learning_rate': 1.7363216479832567e-06, 'epoch': 1.62} {'loss': 0.4715, 'learning_rate': 1.7361373107089562e-06, 'epoch': 1.62} {'loss': 0.6214, 'learning_rate': 1.7359529822901311e-06, 'epoch': 1.62} {'loss': 0.6007, 'learning_rate': 1.7357686627269787e-06, 'epoch': 1.62} {'loss': 0.4724, 'learning_rate': 1.7355843520196947e-06, 'epoch': 1.62} {'loss': 0.5294, 'learning_rate': 1.7354000501684788e-06, 'epoch': 1.62} {'loss': 0.4174, 'learning_rate': 1.7352157571735306e-06, 'epoch': 1.62} {'loss': 0.5447, 'learning_rate': 1.7350314730350416e-06, 'epoch': 1.62} {'loss': 0.5655, 'learning_rate': 1.7348471977532123e-06, 'epoch': 1.62} {'loss': 0.4683, 'learning_rate': 1.7346629313282403e-06, 'epoch': 1.62} {'loss': 0.4555, 'learning_rate': 1.7344786737603225e-06, 'epoch': 1.62} {'loss': 0.5174, 'learning_rate': 1.7342944250496597e-06, 'epoch': 1.62} {'loss': 0.4536, 'learning_rate': 1.7341101851964414e-06, 'epoch': 1.62} {'loss': 0.4643, 'learning_rate': 1.7339259542008757e-06, 'epoch': 1.62} {'loss': 0.696, 'learning_rate': 1.7337417320631512e-06, 'epoch': 1.62} {'loss': 0.4754, 'learning_rate': 1.7335575187834685e-06, 'epoch': 1.62} {'loss': 0.4378, 'learning_rate': 1.7333733143620257e-06, 'epoch': 1.62} {'loss': 0.5849, 'learning_rate': 1.733189118799019e-06, 'epoch': 1.62} {'loss': 0.3384, 'learning_rate': 1.7330049320946484e-06, 'epoch': 1.62} {'loss': 0.4176, 'learning_rate': 1.7328207542491048e-06, 'epoch': 1.62} {'loss': 0.6647, 'learning_rate': 1.7326365852625948e-06, 'epoch': 1.62} {'loss': 0.632, 'learning_rate': 1.732452425135308e-06, 'epoch': 1.62} {'loss': 0.3684, 'learning_rate': 1.7322682738674447e-06, 'epoch': 1.62} {'loss': 0.4443, 'learning_rate': 1.7320841314592029e-06, 'epoch': 1.62} {'loss': 0.2965, 'learning_rate': 1.7318999979107787e-06, 'epoch': 1.62} {'loss': 0.6082, 'learning_rate': 1.7317158732223715e-06, 'epoch': 1.62} {'loss': 0.4064, 'learning_rate': 1.7315317573941758e-06, 'epoch': 1.62} {'loss': 0.5334, 'learning_rate': 1.7313476504263893e-06, 'epoch': 1.62} {'loss': 0.5033, 'learning_rate': 1.7311635523192105e-06, 'epoch': 1.62} {'loss': 0.5033, 'learning_rate': 1.7309794630728361e-06, 'epoch': 1.62} {'loss': 0.4286, 'learning_rate': 1.7307953826874657e-06, 'epoch': 1.62} {'loss': 0.6043, 'learning_rate': 1.7306113111632904e-06, 'epoch': 1.62} {'loss': 0.4067, 'learning_rate': 1.7304272485005157e-06, 'epoch': 1.62} {'loss': 0.3818, 'learning_rate': 1.7302431946993315e-06, 'epoch': 1.62} {'loss': 0.4117, 'learning_rate': 1.7300591497599394e-06, 'epoch': 1.62} {'loss': 0.3147, 'learning_rate': 1.7298751136825343e-06, 'epoch': 1.62} {'loss': 0.4437, 'learning_rate': 1.7296910864673155e-06, 'epoch': 1.62} {'loss': 0.6129, 'learning_rate': 1.729507068114481e-06, 'epoch': 1.62} {'loss': 0.3754, 'learning_rate': 1.7293230586242204e-06, 'epoch': 1.62} {'loss': 0.6246, 'learning_rate': 1.7291390579967426e-06, 'epoch': 1.62} {'loss': 0.5108, 'learning_rate': 1.7289550662322363e-06, 'epoch': 1.62} {'loss': 0.4747, 'learning_rate': 1.7287710833309e-06, 'epoch': 1.62} {'loss': 0.4966, 'learning_rate': 1.728587109292934e-06, 'epoch': 1.62} {'loss': 0.6281, 'learning_rate': 1.7284031441185323e-06, 'epoch': 1.62} {'loss': 0.5358, 'learning_rate': 1.7282191878078959e-06, 'epoch': 1.62} {'loss': 0.5723, 'learning_rate': 1.7280352403612133e-06, 'epoch': 1.62} {'loss': 0.4272, 'learning_rate': 1.7278513017786935e-06, 'epoch': 1.62} {'loss': 0.5847, 'learning_rate': 1.7276673720605252e-06, 'epoch': 1.62} {'loss': 0.5699, 'learning_rate': 1.7274834512069073e-06, 'epoch': 1.62} {'loss': 0.4669, 'learning_rate': 1.7272995392180403e-06, 'epoch': 1.62} {'loss': 0.4374, 'learning_rate': 1.7271156360941133e-06, 'epoch': 1.62} {'loss': 0.5359, 'learning_rate': 1.7269317418353337e-06, 'epoch': 1.62} {'loss': 0.4245, 'learning_rate': 1.7267478564418893e-06, 'epoch': 1.62} {'loss': 0.7537, 'learning_rate': 1.7265639799139854e-06, 'epoch': 1.62} {'loss': 0.4971, 'learning_rate': 1.7263801122518131e-06, 'epoch': 1.62} {'loss': 0.438, 'learning_rate': 1.7261962534555698e-06, 'epoch': 1.62} {'loss': 0.419, 'learning_rate': 1.7260124035254578e-06, 'epoch': 1.62} {'loss': 0.6211, 'learning_rate': 1.7258285624616644e-06, 'epoch': 1.62} {'loss': 0.6791, 'learning_rate': 1.7256447302643987e-06, 'epoch': 1.62} {'loss': 0.5077, 'learning_rate': 1.7254609069338457e-06, 'epoch': 1.62} {'loss': 0.433, 'learning_rate': 1.7252770924702133e-06, 'epoch': 1.62} {'loss': 0.3927, 'learning_rate': 1.7250932868736904e-06, 'epoch': 1.62} {'loss': 0.5117, 'learning_rate': 1.7249094901444775e-06, 'epoch': 1.62} {'loss': 0.4381, 'learning_rate': 1.7247257022827735e-06, 'epoch': 1.62} {'loss': 0.5918, 'learning_rate': 1.7245419232887672e-06, 'epoch': 1.62} {'loss': 0.5945, 'learning_rate': 1.7243581531626662e-06, 'epoch': 1.62} {'loss': 0.502, 'learning_rate': 1.7241743919046571e-06, 'epoch': 1.62} {'loss': 0.5818, 'learning_rate': 1.7239906395149486e-06, 'epoch': 1.62} {'loss': 0.53, 'learning_rate': 1.723806895993727e-06, 'epoch': 1.62} {'loss': 0.3591, 'learning_rate': 1.7236231613411935e-06, 'epoch': 1.62} {'loss': 0.5422, 'learning_rate': 1.7234394355575479e-06, 'epoch': 1.62} {'loss': 0.5386, 'learning_rate': 1.7232557186429789e-06, 'epoch': 1.62} {'loss': 0.5027, 'learning_rate': 1.7230720105976929e-06, 'epoch': 1.62} {'loss': 0.6793, 'learning_rate': 1.7228883114218776e-06, 'epoch': 1.62} {'loss': 0.5698, 'learning_rate': 1.7227046211157394e-06, 'epoch': 1.62} {'loss': 0.3866, 'learning_rate': 1.7225209396794685e-06, 'epoch': 1.62} {'loss': 0.4248, 'learning_rate': 1.722337267113262e-06, 'epoch': 1.62} {'loss': 0.6031, 'learning_rate': 1.7221536034173225e-06, 'epoch': 1.62} {'loss': 0.5253, 'learning_rate': 1.7219699485918361e-06, 'epoch': 1.62} {'loss': 0.5447, 'learning_rate': 1.7217863026370118e-06, 'epoch': 1.62} {'loss': 0.4717, 'learning_rate': 1.7216026655530382e-06, 'epoch': 1.62} {'loss': 0.4454, 'learning_rate': 1.721419037340114e-06, 'epoch': 1.62} {'loss': 0.5904, 'learning_rate': 1.7212354179984369e-06, 'epoch': 1.62} {'loss': 0.5044, 'learning_rate': 1.7210518075282022e-06, 'epoch': 1.62} {'loss': 0.6263, 'learning_rate': 1.7208682059296122e-06, 'epoch': 1.62} {'loss': 0.6545, 'learning_rate': 1.720684613202852e-06, 'epoch': 1.62} {'loss': 0.5287, 'learning_rate': 1.7205010293481317e-06, 'epoch': 1.62} {'loss': 0.5782, 'learning_rate': 1.7203174543656398e-06, 'epoch': 1.62} {'loss': 0.4358, 'learning_rate': 1.720133888255574e-06, 'epoch': 1.62} {'loss': 0.4012, 'learning_rate': 1.719950331018132e-06, 'epoch': 1.62} {'loss': 0.5157, 'learning_rate': 1.7197667826535114e-06, 'epoch': 1.62} {'loss': 0.5711, 'learning_rate': 1.7195832431619098e-06, 'epoch': 1.62} {'loss': 0.3602, 'learning_rate': 1.719399712543518e-06, 'epoch': 1.62} {'loss': 0.4011, 'learning_rate': 1.7192161907985406e-06, 'epoch': 1.62} {'loss': 0.4815, 'learning_rate': 1.7190326779271693e-06, 'epoch': 1.62} {'loss': 0.6192, 'learning_rate': 1.718849173929601e-06, 'epoch': 1.62} {'loss': 0.4615, 'learning_rate': 1.718665678806033e-06, 'epoch': 1.62} {'loss': 0.5019, 'learning_rate': 1.718482192556663e-06, 'epoch': 1.62} {'loss': 0.392, 'learning_rate': 1.7182987151816888e-06, 'epoch': 1.62} {'loss': 0.5147, 'learning_rate': 1.7181152466813022e-06, 'epoch': 1.62} {'loss': 0.7078, 'learning_rate': 1.7179317870557023e-06, 'epoch': 1.62} {'loss': 0.5865, 'learning_rate': 1.7177483363050874e-06, 'epoch': 1.62} {'loss': 0.4739, 'learning_rate': 1.717564894429652e-06, 'epoch': 1.62} {'loss': 0.3445, 'learning_rate': 1.7173814614295925e-06, 'epoch': 1.62} {'loss': 0.5259, 'learning_rate': 1.7171980373051068e-06, 'epoch': 1.62} {'loss': 0.4348, 'learning_rate': 1.7170146220563943e-06, 'epoch': 1.62} {'loss': 0.3437, 'learning_rate': 1.7168312156836452e-06, 'epoch': 1.62} {'loss': 0.4081, 'learning_rate': 1.7166478181870584e-06, 'epoch': 1.62} {'loss': 0.3412, 'learning_rate': 1.716464429566832e-06, 'epoch': 1.62} {'loss': 0.4908, 'learning_rate': 1.7162810498231608e-06, 'epoch': 1.62} {'loss': 0.5008, 'learning_rate': 1.7160976789562432e-06, 'epoch': 1.62} {'loss': 0.4627, 'learning_rate': 1.715914316966274e-06, 'epoch': 1.62} {'loss': 0.5255, 'learning_rate': 1.7157309638534525e-06, 'epoch': 1.62} {'loss': 0.4107, 'learning_rate': 1.715547619617971e-06, 'epoch': 1.62} {'loss': 0.4854, 'learning_rate': 1.715364284260027e-06, 'epoch': 1.62} {'loss': 0.4894, 'learning_rate': 1.7151809577798185e-06, 'epoch': 1.62} {'loss': 0.5854, 'learning_rate': 1.7149976401775415e-06, 'epoch': 1.62} {'loss': 0.598, 'learning_rate': 1.714814331453395e-06, 'epoch': 1.62} {'loss': 0.4035, 'learning_rate': 1.7146310316075698e-06, 'epoch': 1.62} {'loss': 0.6201, 'learning_rate': 1.714447740640266e-06, 'epoch': 1.62} {'loss': 0.4499, 'learning_rate': 1.7142644585516777e-06, 'epoch': 1.62} {'loss': 0.4907, 'learning_rate': 1.7140811853420047e-06, 'epoch': 1.62} {'loss': 0.5676, 'learning_rate': 1.7138979210114404e-06, 'epoch': 1.62} {'loss': 0.545, 'learning_rate': 1.7137146655601822e-06, 'epoch': 1.62} {'loss': 0.5993, 'learning_rate': 1.71353141898843e-06, 'epoch': 1.62} {'loss': 0.5365, 'learning_rate': 1.7133481812963738e-06, 'epoch': 1.62} {'loss': 0.5707, 'learning_rate': 1.713164952484213e-06, 'epoch': 1.62} {'loss': 0.5737, 'learning_rate': 1.7129817325521437e-06, 'epoch': 1.62} {'loss': 0.5896, 'learning_rate': 1.7127985215003629e-06, 'epoch': 1.62} {'loss': 0.5467, 'learning_rate': 1.7126153193290663e-06, 'epoch': 1.62} {'loss': 0.5171, 'learning_rate': 1.7124321260384502e-06, 'epoch': 1.62} {'loss': 0.3548, 'learning_rate': 1.7122489416287137e-06, 'epoch': 1.62} {'loss': 0.5972, 'learning_rate': 1.7120657661000473e-06, 'epoch': 1.62} {'loss': 0.5284, 'learning_rate': 1.7118825994526512e-06, 'epoch': 1.62} {'loss': 0.4554, 'learning_rate': 1.7116994416867206e-06, 'epoch': 1.62} {'loss': 0.5066, 'learning_rate': 1.711516292802452e-06, 'epoch': 1.62} {'loss': 0.5915, 'learning_rate': 1.7113331528000421e-06, 'epoch': 1.62} {'loss': 0.4562, 'learning_rate': 1.7111500216796894e-06, 'epoch': 1.62} {'loss': 0.5974, 'learning_rate': 1.710966899441585e-06, 'epoch': 1.62} {'loss': 0.5043, 'learning_rate': 1.7107837860859277e-06, 'epoch': 1.62} {'loss': 0.5885, 'learning_rate': 1.710600681612914e-06, 'epoch': 1.62} {'loss': 0.3651, 'learning_rate': 1.710417586022739e-06, 'epoch': 1.62} {'loss': 0.5531, 'learning_rate': 1.7102344993156005e-06, 'epoch': 1.62} {'loss': 0.5146, 'learning_rate': 1.7100514214916942e-06, 'epoch': 1.62} {'loss': 0.5344, 'learning_rate': 1.7098683525512172e-06, 'epoch': 1.62} {'loss': 0.5004, 'learning_rate': 1.709685292494363e-06, 'epoch': 1.62} {'loss': 0.4131, 'learning_rate': 1.7095022413213292e-06, 'epoch': 1.62} {'loss': 0.4297, 'learning_rate': 1.7093191990323122e-06, 'epoch': 1.62} {'loss': 0.4967, 'learning_rate': 1.7091361656275073e-06, 'epoch': 1.62} {'loss': 0.5429, 'learning_rate': 1.7089531411071137e-06, 'epoch': 1.62} {'loss': 0.4535, 'learning_rate': 1.7087701254713207e-06, 'epoch': 1.62} {'loss': 0.4585, 'learning_rate': 1.708587118720334e-06, 'epoch': 1.62} {'loss': 0.5804, 'learning_rate': 1.708404120854341e-06, 'epoch': 1.62} {'loss': 0.6452, 'learning_rate': 1.708221131873543e-06, 'epoch': 1.62} {'loss': 0.5354, 'learning_rate': 1.708038151778133e-06, 'epoch': 1.62} {'loss': 0.5763, 'learning_rate': 1.7078551805683096e-06, 'epoch': 1.62} {'loss': 0.446, 'learning_rate': 1.7076722182442695e-06, 'epoch': 1.62} {'loss': 0.5083, 'learning_rate': 1.7074892648062025e-06, 'epoch': 1.62} {'loss': 0.5214, 'learning_rate': 1.7073063202543138e-06, 'epoch': 1.62} {'loss': 0.5086, 'learning_rate': 1.7071233845887926e-06, 'epoch': 1.62} {'loss': 0.4625, 'learning_rate': 1.706940457809837e-06, 'epoch': 1.62} {'loss': 0.4972, 'learning_rate': 1.7067575399176428e-06, 'epoch': 1.62} {'loss': 0.3861, 'learning_rate': 1.7065746309124065e-06, 'epoch': 1.62} {'loss': 0.5792, 'learning_rate': 1.7063917307943277e-06, 'epoch': 1.62} {'loss': 0.555, 'learning_rate': 1.7062088395635923e-06, 'epoch': 1.62} {'loss': 0.396, 'learning_rate': 1.7060259572204084e-06, 'epoch': 1.62} {'loss': 0.6449, 'learning_rate': 1.7058430837649643e-06, 'epoch': 1.62} {'loss': 0.2752, 'learning_rate': 1.705660219197457e-06, 'epoch': 1.62} {'loss': 0.4325, 'learning_rate': 1.7054773635180855e-06, 'epoch': 1.62} {'loss': 0.5572, 'learning_rate': 1.7052945167270395e-06, 'epoch': 1.62} {'loss': 0.4028, 'learning_rate': 1.7051116788245237e-06, 'epoch': 1.62} {'loss': 0.5601, 'learning_rate': 1.7049288498107252e-06, 'epoch': 1.62} {'loss': 0.6013, 'learning_rate': 1.7047460296858487e-06, 'epoch': 1.62} {'loss': 0.4932, 'learning_rate': 1.7045632184500827e-06, 'epoch': 1.62} {'loss': 0.446, 'learning_rate': 1.7043804161036258e-06, 'epoch': 1.62} {'loss': 0.4771, 'learning_rate': 1.7041976226466762e-06, 'epoch': 1.62} {'loss': 0.53, 'learning_rate': 1.704014838079423e-06, 'epoch': 1.62} {'loss': 0.5684, 'learning_rate': 1.703832062402072e-06, 'epoch': 1.62} {'loss': 0.5848, 'learning_rate': 1.7036492956148088e-06, 'epoch': 1.62} {'loss': 0.5237, 'learning_rate': 1.7034665377178383e-06, 'epoch': 1.62} {'loss': 0.5393, 'learning_rate': 1.7032837887113507e-06, 'epoch': 1.62} {'loss': 0.4341, 'learning_rate': 1.7031010485955423e-06, 'epoch': 1.62} {'loss': 0.5831, 'learning_rate': 1.7029183173706132e-06, 'epoch': 1.62} {'loss': 0.4403, 'learning_rate': 1.702735595036752e-06, 'epoch': 1.62} {'loss': 0.601, 'learning_rate': 1.7025528815941617e-06, 'epoch': 1.62} {'loss': 0.532, 'learning_rate': 1.7023701770430334e-06, 'epoch': 1.62} {'loss': 0.5959, 'learning_rate': 1.7021874813835636e-06, 'epoch': 1.62} {'loss': 0.5316, 'learning_rate': 1.702004794615949e-06, 'epoch': 1.62} {'loss': 0.5042, 'learning_rate': 1.701822116740386e-06, 'epoch': 1.62} {'loss': 0.4952, 'learning_rate': 1.7016394477570708e-06, 'epoch': 1.62} {'loss': 0.4745, 'learning_rate': 1.7014567876661935e-06, 'epoch': 1.62} {'loss': 0.4583, 'learning_rate': 1.7012741364679598e-06, 'epoch': 1.62} {'loss': 0.3571, 'learning_rate': 1.7010914941625566e-06, 'epoch': 1.62} {'loss': 0.3232, 'learning_rate': 1.7009088607501835e-06, 'epoch': 1.62} {'loss': 0.4315, 'learning_rate': 1.700726236231035e-06, 'epoch': 1.62} {'loss': 0.6501, 'learning_rate': 1.7005436206053083e-06, 'epoch': 1.62} {'loss': 0.506, 'learning_rate': 1.7003610138731997e-06, 'epoch': 1.62} {'loss': 0.4882, 'learning_rate': 1.700178416034899e-06, 'epoch': 1.62} {'loss': 0.5194, 'learning_rate': 1.6999958270906103e-06, 'epoch': 1.62} {'loss': 0.4619, 'learning_rate': 1.6998132470405239e-06, 'epoch': 1.62} {'loss': 0.7153, 'learning_rate': 1.6996306758848358e-06, 'epoch': 1.62} {'loss': 0.4479, 'learning_rate': 1.699448113623746e-06, 'epoch': 1.62} {'loss': 0.6019, 'learning_rate': 1.6992655602574415e-06, 'epoch': 1.62} {'loss': 0.5926, 'learning_rate': 1.6990830157861271e-06, 'epoch': 1.62} {'loss': 0.4165, 'learning_rate': 1.6989004802099907e-06, 'epoch': 1.62} {'loss': 0.5572, 'learning_rate': 1.6987179535292365e-06, 'epoch': 1.62} {'loss': 0.5196, 'learning_rate': 1.698535435744052e-06, 'epoch': 1.62} {'loss': 0.5545, 'learning_rate': 1.6983529268546362e-06, 'epoch': 1.62} {'loss': 0.4533, 'learning_rate': 1.6981704268611877e-06, 'epoch': 1.62} {'loss': 0.536, 'learning_rate': 1.697987935763893e-06, 'epoch': 1.62} {'loss': 0.6619, 'learning_rate': 1.6978054535629595e-06, 'epoch': 1.62} {'loss': 0.6383, 'learning_rate': 1.6976229802585708e-06, 'epoch': 1.62} {'loss': 0.5134, 'learning_rate': 1.6974405158509333e-06, 'epoch': 1.62} {'loss': 0.6723, 'learning_rate': 1.6972580603402366e-06, 'epoch': 1.62} {'loss': 0.4865, 'learning_rate': 1.6970756137266763e-06, 'epoch': 1.62} {'loss': 0.4845, 'learning_rate': 1.6968931760104511e-06, 'epoch': 1.62} {'loss': 0.5292, 'learning_rate': 1.69671074719175e-06, 'epoch': 1.62} {'loss': 0.3903, 'learning_rate': 1.6965283272707767e-06, 'epoch': 1.62} {'loss': 0.3093, 'learning_rate': 1.696345916247718e-06, 'epoch': 1.62} {'loss': 0.3896, 'learning_rate': 1.6961635141227795e-06, 'epoch': 1.62} {'loss': 0.3849, 'learning_rate': 1.6959811208961497e-06, 'epoch': 1.62} {'loss': 0.4706, 'learning_rate': 1.6957987365680239e-06, 'epoch': 1.62} {'loss': 0.6433, 'learning_rate': 1.6956163611386022e-06, 'epoch': 1.62} {'loss': 0.6851, 'learning_rate': 1.6954339946080733e-06, 'epoch': 1.63} {'loss': 0.5595, 'learning_rate': 1.6952516369766402e-06, 'epoch': 1.63} {'loss': 0.5775, 'learning_rate': 1.6950692882444919e-06, 'epoch': 1.63} {'loss': 0.5569, 'learning_rate': 1.694886948411827e-06, 'epoch': 1.63} {'loss': 0.624, 'learning_rate': 1.6947046174788406e-06, 'epoch': 1.63} {'loss': 0.5681, 'learning_rate': 1.6945222954457275e-06, 'epoch': 1.63} {'loss': 0.5873, 'learning_rate': 1.694339982312685e-06, 'epoch': 1.63} {'loss': 0.5601, 'learning_rate': 1.694157678079903e-06, 'epoch': 1.63} {'loss': 0.4744, 'learning_rate': 1.6939753827475846e-06, 'epoch': 1.63} {'loss': 0.4031, 'learning_rate': 1.69379309631592e-06, 'epoch': 1.63} {'loss': 0.455, 'learning_rate': 1.6936108187851053e-06, 'epoch': 1.63} {'loss': 0.362, 'learning_rate': 1.693428550155336e-06, 'epoch': 1.63} {'loss': 0.3955, 'learning_rate': 1.6932462904268076e-06, 'epoch': 1.63} {'loss': 0.5902, 'learning_rate': 1.6930640395997188e-06, 'epoch': 1.63} {'loss': 0.5833, 'learning_rate': 1.6928817976742584e-06, 'epoch': 1.63} {'loss': 0.5634, 'learning_rate': 1.692699564650625e-06, 'epoch': 1.63} {'loss': 0.4349, 'learning_rate': 1.6925173405290141e-06, 'epoch': 1.63} {'loss': 0.4296, 'learning_rate': 1.692335125309621e-06, 'epoch': 1.63} {'loss': 0.5854, 'learning_rate': 1.69215291899264e-06, 'epoch': 1.63} {'loss': 0.4807, 'learning_rate': 1.6919707215782665e-06, 'epoch': 1.63} {'loss': 0.4596, 'learning_rate': 1.6917885330666995e-06, 'epoch': 1.63} {'loss': 0.5391, 'learning_rate': 1.6916063534581285e-06, 'epoch': 1.63} {'loss': 0.4226, 'learning_rate': 1.691424182752751e-06, 'epoch': 1.63} {'loss': 0.5956, 'learning_rate': 1.691242020950763e-06, 'epoch': 1.63} {'loss': 0.5657, 'learning_rate': 1.6910598680523582e-06, 'epoch': 1.63} {'loss': 0.513, 'learning_rate': 1.6908777240577323e-06, 'epoch': 1.63} {'loss': 0.6147, 'learning_rate': 1.6906955889670817e-06, 'epoch': 1.63} {'loss': 0.5291, 'learning_rate': 1.690513462780603e-06, 'epoch': 1.63} {'loss': 0.4711, 'learning_rate': 1.6903313454984872e-06, 'epoch': 1.63} {'loss': 0.5496, 'learning_rate': 1.6901492371209306e-06, 'epoch': 1.63} {'loss': 0.5385, 'learning_rate': 1.6899671376481297e-06, 'epoch': 1.63} {'loss': 0.5283, 'learning_rate': 1.689785047080278e-06, 'epoch': 1.63} {'loss': 0.4089, 'learning_rate': 1.6896029654175728e-06, 'epoch': 1.63} {'loss': 0.5649, 'learning_rate': 1.6894208926602095e-06, 'epoch': 1.63} {'loss': 0.5357, 'learning_rate': 1.6892388288083806e-06, 'epoch': 1.63} {'loss': 0.515, 'learning_rate': 1.6890567738622809e-06, 'epoch': 1.63} {'loss': 0.4057, 'learning_rate': 1.6888747278221085e-06, 'epoch': 1.63} {'loss': 0.5238, 'learning_rate': 1.6886926906880563e-06, 'epoch': 1.63} {'loss': 0.5473, 'learning_rate': 1.6885106624603198e-06, 'epoch': 1.63} {'loss': 0.4181, 'learning_rate': 1.6883286431390945e-06, 'epoch': 1.63} {'loss': 0.5413, 'learning_rate': 1.6881466327245765e-06, 'epoch': 1.63} {'loss': 0.5176, 'learning_rate': 1.6879646312169585e-06, 'epoch': 1.63} {'loss': 0.4131, 'learning_rate': 1.6877826386164364e-06, 'epoch': 1.63} {'loss': 0.5569, 'learning_rate': 1.687600654923206e-06, 'epoch': 1.63} {'loss': 0.4726, 'learning_rate': 1.6874186801374602e-06, 'epoch': 1.63} {'loss': 0.5057, 'learning_rate': 1.687236714259397e-06, 'epoch': 1.63} {'loss': 0.5711, 'learning_rate': 1.6870547572892116e-06, 'epoch': 1.63} {'loss': 0.7545, 'learning_rate': 1.686872809227096e-06, 'epoch': 1.63} {'loss': 0.613, 'learning_rate': 1.6866908700732455e-06, 'epoch': 1.63} {'loss': 0.5716, 'learning_rate': 1.6865089398278555e-06, 'epoch': 1.63} {'loss': 0.5241, 'learning_rate': 1.6863270184911218e-06, 'epoch': 1.63} {'loss': 0.4331, 'learning_rate': 1.6861451060632395e-06, 'epoch': 1.63} {'loss': 0.5623, 'learning_rate': 1.6859632025444062e-06, 'epoch': 1.63} {'loss': 0.5373, 'learning_rate': 1.6857813079348096e-06, 'epoch': 1.63} {'loss': 0.597, 'learning_rate': 1.6855994222346506e-06, 'epoch': 1.63} {'loss': 0.5416, 'learning_rate': 1.6854175454441212e-06, 'epoch': 1.63} {'loss': 0.5367, 'learning_rate': 1.6852356775634172e-06, 'epoch': 1.63} {'loss': 0.5384, 'learning_rate': 1.6850538185927335e-06, 'epoch': 1.63} {'loss': 0.6477, 'learning_rate': 1.6848719685322657e-06, 'epoch': 1.63} {'loss': 0.4265, 'learning_rate': 1.6846901273822103e-06, 'epoch': 1.63} {'loss': 0.4612, 'learning_rate': 1.684508295142757e-06, 'epoch': 1.63} {'loss': 0.5906, 'learning_rate': 1.684326471814104e-06, 'epoch': 1.63} {'loss': 0.4146, 'learning_rate': 1.684144657396446e-06, 'epoch': 1.63} {'loss': 0.3417, 'learning_rate': 1.6839628518899776e-06, 'epoch': 1.63} {'loss': 0.4258, 'learning_rate': 1.683781055294893e-06, 'epoch': 1.63} {'loss': 0.5738, 'learning_rate': 1.6835992676113878e-06, 'epoch': 1.63} {'loss': 0.4169, 'learning_rate': 1.6834174888396593e-06, 'epoch': 1.63} {'loss': 0.5199, 'learning_rate': 1.6832357189798964e-06, 'epoch': 1.63} {'loss': 0.5293, 'learning_rate': 1.6830539580322979e-06, 'epoch': 1.63} {'loss': 0.6707, 'learning_rate': 1.6828722059970582e-06, 'epoch': 1.63} {'loss': 0.4338, 'learning_rate': 1.68269046287437e-06, 'epoch': 1.63} {'loss': 0.4017, 'learning_rate': 1.6825087286644337e-06, 'epoch': 1.63} {'loss': 0.4789, 'learning_rate': 1.6823270033674333e-06, 'epoch': 1.63} {'loss': 0.3299, 'learning_rate': 1.6821452869835765e-06, 'epoch': 1.63} {'loss': 0.6277, 'learning_rate': 1.6819635795130496e-06, 'epoch': 1.63} {'loss': 0.5467, 'learning_rate': 1.6817818809560483e-06, 'epoch': 1.63} {'loss': 0.6333, 'learning_rate': 1.681600191312769e-06, 'epoch': 1.63} {'loss': 0.5539, 'learning_rate': 1.6814185105834057e-06, 'epoch': 1.63} {'loss': 0.555, 'learning_rate': 1.6812368387681565e-06, 'epoch': 1.63} {'loss': 0.4448, 'learning_rate': 1.6810551758672067e-06, 'epoch': 1.63} {'loss': 0.4495, 'learning_rate': 1.6808735218807625e-06, 'epoch': 1.63} {'loss': 0.4824, 'learning_rate': 1.680691876809012e-06, 'epoch': 1.63} {'loss': 0.4102, 'learning_rate': 1.680510240652149e-06, 'epoch': 1.63} {'loss': 0.3214, 'learning_rate': 1.6803286134103713e-06, 'epoch': 1.63} {'loss': 0.3851, 'learning_rate': 1.6801469950838723e-06, 'epoch': 1.63} {'loss': 0.6057, 'learning_rate': 1.6799653856728492e-06, 'epoch': 1.63} {'loss': 0.4076, 'learning_rate': 1.679783785177489e-06, 'epoch': 1.63} {'loss': 0.6127, 'learning_rate': 1.6796021935979968e-06, 'epoch': 1.63} {'loss': 0.4686, 'learning_rate': 1.679420610934558e-06, 'epoch': 1.63} {'loss': 0.5125, 'learning_rate': 1.6792390371873724e-06, 'epoch': 1.63} {'loss': 0.5402, 'learning_rate': 1.6790574723566344e-06, 'epoch': 1.63} {'loss': 0.4416, 'learning_rate': 1.6788759164425339e-06, 'epoch': 1.63} {'loss': 0.5919, 'learning_rate': 1.6786943694452729e-06, 'epoch': 1.63} {'loss': 0.3963, 'learning_rate': 1.6785128313650366e-06, 'epoch': 1.63} {'loss': 0.3995, 'learning_rate': 1.6783313022020308e-06, 'epoch': 1.63} {'loss': 0.3121, 'learning_rate': 1.6781497819564407e-06, 'epoch': 1.63} {'loss': 0.4832, 'learning_rate': 1.677968270628465e-06, 'epoch': 1.63} {'loss': 0.3903, 'learning_rate': 1.6777867682182992e-06, 'epoch': 1.63} {'loss': 0.508, 'learning_rate': 1.6776052747261318e-06, 'epoch': 1.63} {'loss': 0.5922, 'learning_rate': 1.6774237901521662e-06, 'epoch': 1.63} {'loss': 0.6311, 'learning_rate': 1.6772423144965866e-06, 'epoch': 1.63} {'loss': 0.462, 'learning_rate': 1.6770608477595984e-06, 'epoch': 1.63} {'loss': 0.4558, 'learning_rate': 1.6768793899413883e-06, 'epoch': 1.63} {'loss': 0.4479, 'learning_rate': 1.6766979410421535e-06, 'epoch': 1.63} {'loss': 0.5612, 'learning_rate': 1.6765165010620898e-06, 'epoch': 1.63} {'loss': 0.5352, 'learning_rate': 1.6763350700013858e-06, 'epoch': 1.63} {'loss': 0.6693, 'learning_rate': 1.6761536478602448e-06, 'epoch': 1.63} {'loss': 0.5286, 'learning_rate': 1.6759722346388507e-06, 'epoch': 1.63} {'loss': 0.4981, 'learning_rate': 1.6757908303374093e-06, 'epoch': 1.63} {'loss': 0.5504, 'learning_rate': 1.6756094349561069e-06, 'epoch': 1.63} {'loss': 0.5892, 'learning_rate': 1.675428048495139e-06, 'epoch': 1.63} {'loss': 0.5772, 'learning_rate': 1.6752466709547054e-06, 'epoch': 1.63} {'loss': 0.5029, 'learning_rate': 1.6750653023349905e-06, 'epoch': 1.63} {'loss': 0.6172, 'learning_rate': 1.6748839426361995e-06, 'epoch': 1.63} {'loss': 0.605, 'learning_rate': 1.674702591858518e-06, 'epoch': 1.63} {'loss': 0.5781, 'learning_rate': 1.6745212500021479e-06, 'epoch': 1.63} {'loss': 0.5655, 'learning_rate': 1.674339917067277e-06, 'epoch': 1.63} {'loss': 0.5278, 'learning_rate': 1.6741585930541026e-06, 'epoch': 1.63} {'loss': 0.4488, 'learning_rate': 1.6739772779628215e-06, 'epoch': 1.63} {'loss': 0.4289, 'learning_rate': 1.6737959717936204e-06, 'epoch': 1.63} {'loss': 0.4752, 'learning_rate': 1.673614674546703e-06, 'epoch': 1.63} {'loss': 0.7432, 'learning_rate': 1.6734333862222563e-06, 'epoch': 1.63} {'loss': 0.5777, 'learning_rate': 1.6732521068204777e-06, 'epoch': 1.63} {'loss': 0.3633, 'learning_rate': 1.6730708363415603e-06, 'epoch': 1.63} {'loss': 0.3687, 'learning_rate': 1.6728895747857e-06, 'epoch': 1.63} {'loss': 0.5031, 'learning_rate': 1.6727083221530915e-06, 'epoch': 1.63} {'loss': 0.6256, 'learning_rate': 1.672527078443924e-06, 'epoch': 1.63} {'loss': 0.5355, 'learning_rate': 1.6723458436583994e-06, 'epoch': 1.63} {'loss': 0.4918, 'learning_rate': 1.6721646177967056e-06, 'epoch': 1.63} {'loss': 0.4836, 'learning_rate': 1.6719834008590385e-06, 'epoch': 1.63} {'loss': 0.5332, 'learning_rate': 1.671802192845594e-06, 'epoch': 1.63} {'loss': 0.5533, 'learning_rate': 1.6716209937565641e-06, 'epoch': 1.63} {'loss': 0.406, 'learning_rate': 1.6714398035921464e-06, 'epoch': 1.63} {'loss': 0.4764, 'learning_rate': 1.6712586223525284e-06, 'epoch': 1.63} {'loss': 0.5241, 'learning_rate': 1.6710774500379135e-06, 'epoch': 1.63} {'loss': 0.5305, 'learning_rate': 1.6708962866484878e-06, 'epoch': 1.63} {'loss': 0.4595, 'learning_rate': 1.6707151321844484e-06, 'epoch': 1.63} {'loss': 0.5402, 'learning_rate': 1.6705339866459924e-06, 'epoch': 1.63} {'loss': 0.6523, 'learning_rate': 1.6703528500333066e-06, 'epoch': 1.63} {'loss': 0.6196, 'learning_rate': 1.670171722346593e-06, 'epoch': 1.63} {'loss': 0.5461, 'learning_rate': 1.6699906035860403e-06, 'epoch': 1.63} {'loss': 0.5111, 'learning_rate': 1.669809493751845e-06, 'epoch': 1.63} {'loss': 0.4472, 'learning_rate': 1.6696283928442004e-06, 'epoch': 1.63} {'loss': 0.407, 'learning_rate': 1.6694473008633016e-06, 'epoch': 1.63} {'loss': 0.4959, 'learning_rate': 1.6692662178093434e-06, 'epoch': 1.63} {'loss': 0.4207, 'learning_rate': 1.669085143682513e-06, 'epoch': 1.63} {'loss': 0.3811, 'learning_rate': 1.6689040784830157e-06, 'epoch': 1.63} {'loss': 0.6627, 'learning_rate': 1.6687230222110362e-06, 'epoch': 1.63} {'loss': 0.4866, 'learning_rate': 1.668541974866773e-06, 'epoch': 1.63} {'loss': 0.4741, 'learning_rate': 1.6683609364504184e-06, 'epoch': 1.63} {'loss': 0.3735, 'learning_rate': 1.6681799069621673e-06, 'epoch': 1.63} {'loss': 0.567, 'learning_rate': 1.6679988864022156e-06, 'epoch': 1.63} {'loss': 0.4792, 'learning_rate': 1.6678178747707508e-06, 'epoch': 1.63} {'loss': 0.4509, 'learning_rate': 1.667636872067976e-06, 'epoch': 1.63} {'loss': 0.5634, 'learning_rate': 1.6674558782940765e-06, 'epoch': 1.63} {'loss': 0.369, 'learning_rate': 1.667274893449251e-06, 'epoch': 1.63} {'loss': 0.3728, 'learning_rate': 1.6670939175336932e-06, 'epoch': 1.63} {'loss': 0.4473, 'learning_rate': 1.6669129505475956e-06, 'epoch': 1.63} {'loss': 0.6301, 'learning_rate': 1.666731992491155e-06, 'epoch': 1.63} {'loss': 0.437, 'learning_rate': 1.6665510433645615e-06, 'epoch': 1.63} {'loss': 0.5507, 'learning_rate': 1.6663701031680112e-06, 'epoch': 1.63} {'loss': 0.5647, 'learning_rate': 1.6661891719016965e-06, 'epoch': 1.63} {'loss': 0.4303, 'learning_rate': 1.6660082495658125e-06, 'epoch': 1.63} {'loss': 0.5496, 'learning_rate': 1.6658273361605526e-06, 'epoch': 1.63} {'loss': 0.5066, 'learning_rate': 1.665646431686111e-06, 'epoch': 1.63} {'loss': 0.4795, 'learning_rate': 1.665465536142684e-06, 'epoch': 1.63} {'loss': 0.585, 'learning_rate': 1.6652846495304608e-06, 'epoch': 1.63} {'loss': 0.5734, 'learning_rate': 1.6651037718496378e-06, 'epoch': 1.63} {'loss': 0.5814, 'learning_rate': 1.6649229031004078e-06, 'epoch': 1.63} {'loss': 0.5769, 'learning_rate': 1.6647420432829641e-06, 'epoch': 1.63} {'loss': 0.6118, 'learning_rate': 1.6645611923975036e-06, 'epoch': 1.63} {'loss': 0.5163, 'learning_rate': 1.6643803504442169e-06, 'epoch': 1.63} {'loss': 0.5959, 'learning_rate': 1.6641995174233017e-06, 'epoch': 1.63} {'loss': 0.4199, 'learning_rate': 1.6640186933349467e-06, 'epoch': 1.63} {'loss': 0.4261, 'learning_rate': 1.6638378781793474e-06, 'epoch': 1.63} {'loss': 0.533, 'learning_rate': 1.663657071956699e-06, 'epoch': 1.63} {'loss': 0.4683, 'learning_rate': 1.663476274667194e-06, 'epoch': 1.63} {'loss': 0.5542, 'learning_rate': 1.6632954863110262e-06, 'epoch': 1.63} {'loss': 0.5589, 'learning_rate': 1.6631147068883936e-06, 'epoch': 1.63} {'loss': 0.5807, 'learning_rate': 1.6629339363994824e-06, 'epoch': 1.63} {'loss': 0.5114, 'learning_rate': 1.6627531748444903e-06, 'epoch': 1.63} {'loss': 0.5223, 'learning_rate': 1.6625724222236107e-06, 'epoch': 1.63} {'loss': 0.5142, 'learning_rate': 1.6623916785370365e-06, 'epoch': 1.63} {'loss': 0.59, 'learning_rate': 1.6622109437849632e-06, 'epoch': 1.63} {'loss': 0.4608, 'learning_rate': 1.6620302179675828e-06, 'epoch': 1.63} {'loss': 0.4762, 'learning_rate': 1.661849501085092e-06, 'epoch': 1.63} {'loss': 0.4537, 'learning_rate': 1.6616687931376806e-06, 'epoch': 1.63} {'loss': 0.5878, 'learning_rate': 1.6614880941255429e-06, 'epoch': 1.63} {'loss': 0.5658, 'learning_rate': 1.661307404048873e-06, 'epoch': 1.63} {'loss': 0.5079, 'learning_rate': 1.6611267229078654e-06, 'epoch': 1.63} {'loss': 0.4794, 'learning_rate': 1.6609460507027153e-06, 'epoch': 1.63} {'loss': 0.3779, 'learning_rate': 1.6607653874336095e-06, 'epoch': 1.63} {'loss': 0.3415, 'learning_rate': 1.6605847331007508e-06, 'epoch': 1.63} {'loss': 0.5837, 'learning_rate': 1.6604040877043248e-06, 'epoch': 1.63} {'loss': 0.4846, 'learning_rate': 1.6602234512445304e-06, 'epoch': 1.63} {'loss': 0.4976, 'learning_rate': 1.6600428237215581e-06, 'epoch': 1.63} {'loss': 0.3263, 'learning_rate': 1.6598622051356028e-06, 'epoch': 1.63} {'loss': 0.4451, 'learning_rate': 1.6596815954868606e-06, 'epoch': 1.63} {'loss': 0.6025, 'learning_rate': 1.6595009947755181e-06, 'epoch': 1.63} {'loss': 0.4103, 'learning_rate': 1.6593204030017772e-06, 'epoch': 1.63} {'loss': 0.492, 'learning_rate': 1.6591398201658249e-06, 'epoch': 1.63} {'loss': 0.5709, 'learning_rate': 1.6589592462678571e-06, 'epoch': 1.63} {'loss': 0.5425, 'learning_rate': 1.6587786813080675e-06, 'epoch': 1.63} {'loss': 0.5185, 'learning_rate': 1.658598125286649e-06, 'epoch': 1.63} {'loss': 0.5794, 'learning_rate': 1.6584175782037981e-06, 'epoch': 1.63} {'loss': 0.6748, 'learning_rate': 1.6582370400597024e-06, 'epoch': 1.63} {'loss': 0.6175, 'learning_rate': 1.65805651085456e-06, 'epoch': 1.63} {'loss': 0.4484, 'learning_rate': 1.657875990588562e-06, 'epoch': 1.63} {'loss': 0.5555, 'learning_rate': 1.6576954792619037e-06, 'epoch': 1.63} {'loss': 0.469, 'learning_rate': 1.657514976874779e-06, 'epoch': 1.63} {'loss': 0.409, 'learning_rate': 1.6573344834273752e-06, 'epoch': 1.63} {'loss': 0.4848, 'learning_rate': 1.657153998919896e-06, 'epoch': 1.63} {'loss': 0.4634, 'learning_rate': 1.6569735233525264e-06, 'epoch': 1.63} {'loss': 0.473, 'learning_rate': 1.6567930567254631e-06, 'epoch': 1.63} {'loss': 0.3162, 'learning_rate': 1.6566125990388994e-06, 'epoch': 1.63} {'loss': 0.5177, 'learning_rate': 1.656432150293027e-06, 'epoch': 1.63} {'loss': 0.5253, 'learning_rate': 1.6562517104880437e-06, 'epoch': 1.63} {'loss': 0.4789, 'learning_rate': 1.6560712796241352e-06, 'epoch': 1.63} {'loss': 0.59, 'learning_rate': 1.6558908577015043e-06, 'epoch': 1.63} {'loss': 0.4883, 'learning_rate': 1.6557104447203366e-06, 'epoch': 1.63} {'loss': 0.5599, 'learning_rate': 1.6555300406808283e-06, 'epoch': 1.63} {'loss': 0.4808, 'learning_rate': 1.655349645583173e-06, 'epoch': 1.63} {'loss': 0.5829, 'learning_rate': 1.6551692594275636e-06, 'epoch': 1.63} {'loss': 0.4646, 'learning_rate': 1.6549888822141957e-06, 'epoch': 1.63} {'loss': 0.4848, 'learning_rate': 1.6548085139432558e-06, 'epoch': 1.63} {'loss': 0.5928, 'learning_rate': 1.6546281546149468e-06, 'epoch': 1.63} {'loss': 0.451, 'learning_rate': 1.6544478042294542e-06, 'epoch': 1.63} {'loss': 0.5002, 'learning_rate': 1.6542674627869738e-06, 'epoch': 1.63} {'loss': 0.317, 'learning_rate': 1.6540871302877027e-06, 'epoch': 1.63} {'loss': 0.5995, 'learning_rate': 1.6539068067318243e-06, 'epoch': 1.63} {'loss': 0.5111, 'learning_rate': 1.653726492119543e-06, 'epoch': 1.63} {'loss': 0.4765, 'learning_rate': 1.6535461864510427e-06, 'epoch': 1.63} {'loss': 0.4769, 'learning_rate': 1.653365889726526e-06, 'epoch': 1.63} {'loss': 0.4415, 'learning_rate': 1.6531856019461778e-06, 'epoch': 1.63} {'loss': 0.4666, 'learning_rate': 1.653005323110195e-06, 'epoch': 1.63} {'loss': 0.485, 'learning_rate': 1.6528250532187727e-06, 'epoch': 1.63} {'loss': 0.4757, 'learning_rate': 1.6526447922720978e-06, 'epoch': 1.63} {'loss': 0.5663, 'learning_rate': 1.652464540270371e-06, 'epoch': 1.63} {'loss': 0.6082, 'learning_rate': 1.6522842972137775e-06, 'epoch': 1.63} {'loss': 0.378, 'learning_rate': 1.6521040631025198e-06, 'epoch': 1.63} {'loss': 0.5795, 'learning_rate': 1.6519238379367841e-06, 'epoch': 1.63} {'loss': 0.6632, 'learning_rate': 1.6517436217167647e-06, 'epoch': 1.63} {'loss': 0.5757, 'learning_rate': 1.6515634144426574e-06, 'epoch': 1.63} {'loss': 0.6544, 'learning_rate': 1.6513832161146492e-06, 'epoch': 1.63} {'loss': 0.5874, 'learning_rate': 1.6512030267329426e-06, 'epoch': 1.63} {'loss': 0.6494, 'learning_rate': 1.6510228462977207e-06, 'epoch': 1.63} {'loss': 0.6324, 'learning_rate': 1.6508426748091855e-06, 'epoch': 1.63} {'loss': 0.521, 'learning_rate': 1.6506625122675236e-06, 'epoch': 1.63} {'loss': 0.5332, 'learning_rate': 1.6504823586729313e-06, 'epoch': 1.63} {'loss': 0.5141, 'learning_rate': 1.6503022140256019e-06, 'epoch': 1.63} {'loss': 0.6156, 'learning_rate': 1.6501220783257233e-06, 'epoch': 1.63} {'loss': 0.4745, 'learning_rate': 1.649941951573497e-06, 'epoch': 1.63} {'loss': 0.5729, 'learning_rate': 1.6497618337691068e-06, 'epoch': 1.63} {'loss': 0.5668, 'learning_rate': 1.6495817249127555e-06, 'epoch': 1.63} {'loss': 0.4151, 'learning_rate': 1.6494016250046285e-06, 'epoch': 1.63} {'loss': 0.4639, 'learning_rate': 1.6492215340449203e-06, 'epoch': 1.63} {'loss': 0.3775, 'learning_rate': 1.6490414520338282e-06, 'epoch': 1.63} {'loss': 0.5235, 'learning_rate': 1.648861378971538e-06, 'epoch': 1.63} {'loss': 0.6162, 'learning_rate': 1.6486813148582504e-06, 'epoch': 1.63} {'loss': 0.5884, 'learning_rate': 1.6485012596941496e-06, 'epoch': 1.63} {'loss': 0.431, 'learning_rate': 1.648321213479439e-06, 'epoch': 1.63} {'loss': 0.3993, 'learning_rate': 1.648141176214303e-06, 'epoch': 1.63} {'loss': 0.5044, 'learning_rate': 1.6479611478989378e-06, 'epoch': 1.63} {'loss': 0.5141, 'learning_rate': 1.6477811285335377e-06, 'epoch': 1.63} {'loss': 0.5278, 'learning_rate': 1.6476011181182904e-06, 'epoch': 1.63} {'loss': 0.3763, 'learning_rate': 1.647421116653396e-06, 'epoch': 1.63} {'loss': 0.4663, 'learning_rate': 1.6472411241390417e-06, 'epoch': 1.63} {'loss': 0.5321, 'learning_rate': 1.6470611405754233e-06, 'epoch': 1.63} {'loss': 0.5155, 'learning_rate': 1.6468811659627315e-06, 'epoch': 1.63} {'loss': 0.4573, 'learning_rate': 1.6467012003011617e-06, 'epoch': 1.63} {'loss': 0.4815, 'learning_rate': 1.6465212435909072e-06, 'epoch': 1.63} {'loss': 0.458, 'learning_rate': 1.6463412958321546e-06, 'epoch': 1.63} {'loss': 0.5341, 'learning_rate': 1.6461613570251055e-06, 'epoch': 1.63} {'loss': 0.6068, 'learning_rate': 1.645981427169946e-06, 'epoch': 1.63} {'loss': 0.4212, 'learning_rate': 1.645801506266872e-06, 'epoch': 1.63} {'loss': 0.434, 'learning_rate': 1.6456215943160758e-06, 'epoch': 1.63} {'loss': 0.4573, 'learning_rate': 1.6454416913177495e-06, 'epoch': 1.63} {'loss': 0.4815, 'learning_rate': 1.6452617972720896e-06, 'epoch': 1.63} {'loss': 0.6342, 'learning_rate': 1.6450819121792804e-06, 'epoch': 1.63} {'loss': 0.6499, 'learning_rate': 1.6449020360395252e-06, 'epoch': 1.63} {'loss': 0.4305, 'learning_rate': 1.644722168853008e-06, 'epoch': 1.63} {'loss': 0.6486, 'learning_rate': 1.6445423106199265e-06, 'epoch': 1.63} {'loss': 0.6031, 'learning_rate': 1.6443624613404719e-06, 'epoch': 1.63} {'loss': 0.5318, 'learning_rate': 1.644182621014836e-06, 'epoch': 1.63} {'loss': 0.3018, 'learning_rate': 1.6440027896432153e-06, 'epoch': 1.63} {'loss': 0.4958, 'learning_rate': 1.643822967225799e-06, 'epoch': 1.63} {'loss': 0.5127, 'learning_rate': 1.6436431537627783e-06, 'epoch': 1.63} {'loss': 0.5029, 'learning_rate': 1.6434633492543495e-06, 'epoch': 1.63} {'loss': 0.4634, 'learning_rate': 1.6432835537007041e-06, 'epoch': 1.63} {'loss': 0.5483, 'learning_rate': 1.6431037671020368e-06, 'epoch': 1.63} {'loss': 0.3827, 'learning_rate': 1.6429239894585325e-06, 'epoch': 1.63} {'loss': 0.4517, 'learning_rate': 1.6427442207703947e-06, 'epoch': 1.63} {'loss': 0.5313, 'learning_rate': 1.642564461037809e-06, 'epoch': 1.63} {'loss': 0.6254, 'learning_rate': 1.6423847102609691e-06, 'epoch': 1.63} {'loss': 0.5905, 'learning_rate': 1.6422049684400677e-06, 'epoch': 1.63} {'loss': 0.5654, 'learning_rate': 1.6420252355752985e-06, 'epoch': 1.63} {'loss': 0.3474, 'learning_rate': 1.6418455116668575e-06, 'epoch': 1.63} {'loss': 0.299, 'learning_rate': 1.6416657967149296e-06, 'epoch': 1.63} {'loss': 0.4141, 'learning_rate': 1.6414860907197106e-06, 'epoch': 1.63} {'loss': 0.3355, 'learning_rate': 1.6413063936813945e-06, 'epoch': 1.63} {'loss': 0.5905, 'learning_rate': 1.6411267056001735e-06, 'epoch': 1.63} {'loss': 0.4472, 'learning_rate': 1.6409470264762383e-06, 'epoch': 1.63} {'loss': 0.524, 'learning_rate': 1.6407673563097837e-06, 'epoch': 1.63} {'loss': 0.5721, 'learning_rate': 1.6405876951010035e-06, 'epoch': 1.63} {'loss': 0.4564, 'learning_rate': 1.6404080428500856e-06, 'epoch': 1.63} {'loss': 0.4582, 'learning_rate': 1.6402283995572255e-06, 'epoch': 1.63} {'loss': 0.5655, 'learning_rate': 1.6400487652226148e-06, 'epoch': 1.63} {'loss': 0.5028, 'learning_rate': 1.6398691398464472e-06, 'epoch': 1.63} {'loss': 0.5522, 'learning_rate': 1.6396895234289135e-06, 'epoch': 1.63} {'loss': 0.379, 'learning_rate': 1.6395099159702066e-06, 'epoch': 1.63} {'loss': 0.4267, 'learning_rate': 1.6393303174705222e-06, 'epoch': 1.63} {'loss': 0.3587, 'learning_rate': 1.6391507279300479e-06, 'epoch': 1.63} {'loss': 0.4806, 'learning_rate': 1.6389711473489788e-06, 'epoch': 1.63} {'loss': 0.5484, 'learning_rate': 1.6387915757275053e-06, 'epoch': 1.63} {'loss': 0.5783, 'learning_rate': 1.6386120130658222e-06, 'epoch': 1.63} {'loss': 0.4216, 'learning_rate': 1.638432459364121e-06, 'epoch': 1.63} {'loss': 0.4848, 'learning_rate': 1.6382529146225956e-06, 'epoch': 1.63} {'loss': 0.3954, 'learning_rate': 1.638073378841436e-06, 'epoch': 1.63} {'loss': 0.4186, 'learning_rate': 1.6378938520208342e-06, 'epoch': 1.63} {'loss': 0.6363, 'learning_rate': 1.6377143341609847e-06, 'epoch': 1.63} {'loss': 0.5426, 'learning_rate': 1.6375348252620781e-06, 'epoch': 1.63} {'loss': 0.5335, 'learning_rate': 1.637355325324308e-06, 'epoch': 1.63} {'loss': 0.4858, 'learning_rate': 1.6371758343478673e-06, 'epoch': 1.63} {'loss': 0.5387, 'learning_rate': 1.636996352332949e-06, 'epoch': 1.63} {'loss': 0.5481, 'learning_rate': 1.6368168792797412e-06, 'epoch': 1.63} {'loss': 0.5726, 'learning_rate': 1.63663741518844e-06, 'epoch': 1.63} {'loss': 0.4206, 'learning_rate': 1.6364579600592356e-06, 'epoch': 1.63} {'loss': 0.3921, 'learning_rate': 1.636278513892322e-06, 'epoch': 1.63} {'loss': 0.5473, 'learning_rate': 1.6360990766878915e-06, 'epoch': 1.63} {'loss': 0.5345, 'learning_rate': 1.6359196484461348e-06, 'epoch': 1.63} {'loss': 0.4206, 'learning_rate': 1.6357402291672475e-06, 'epoch': 1.63} {'loss': 0.6392, 'learning_rate': 1.6355608188514172e-06, 'epoch': 1.63} {'loss': 0.4842, 'learning_rate': 1.6353814174988392e-06, 'epoch': 1.63} {'loss': 0.4404, 'learning_rate': 1.6352020251097033e-06, 'epoch': 1.63} {'loss': 0.5014, 'learning_rate': 1.6350226416842051e-06, 'epoch': 1.63} {'loss': 0.708, 'learning_rate': 1.6348432672225367e-06, 'epoch': 1.63} {'loss': 0.5536, 'learning_rate': 1.6346639017248834e-06, 'epoch': 1.63} {'loss': 0.401, 'learning_rate': 1.6344845451914482e-06, 'epoch': 1.63} {'loss': 0.4463, 'learning_rate': 1.6343051976224156e-06, 'epoch': 1.63} {'loss': 0.5032, 'learning_rate': 1.6341258590179798e-06, 'epoch': 1.63} {'loss': 0.4386, 'learning_rate': 1.633946529378333e-06, 'epoch': 1.63} {'loss': 0.3607, 'learning_rate': 1.6337672087036682e-06, 'epoch': 1.63} {'loss': 0.4947, 'learning_rate': 1.6335878969941787e-06, 'epoch': 1.63} {'loss': 0.6762, 'learning_rate': 1.63340859425005e-06, 'epoch': 1.63} {'loss': 0.5665, 'learning_rate': 1.633229300471485e-06, 'epoch': 1.63} {'loss': 0.5179, 'learning_rate': 1.6330500156586659e-06, 'epoch': 1.63} {'loss': 0.4919, 'learning_rate': 1.6328707398117904e-06, 'epoch': 1.63} {'loss': 0.6632, 'learning_rate': 1.6326914729310483e-06, 'epoch': 1.63} {'loss': 0.5548, 'learning_rate': 1.6325122150166327e-06, 'epoch': 1.63} {'loss': 0.6147, 'learning_rate': 1.6323329660687382e-06, 'epoch': 1.63} {'loss': 0.4579, 'learning_rate': 1.6321537260875486e-06, 'epoch': 1.63} {'loss': 0.5709, 'learning_rate': 1.6319744950732664e-06, 'epoch': 1.63} {'loss': 0.5583, 'learning_rate': 1.6317952730260766e-06, 'epoch': 1.63} {'loss': 0.4636, 'learning_rate': 1.6316160599461738e-06, 'epoch': 1.63} {'loss': 0.568, 'learning_rate': 1.6314368558337522e-06, 'epoch': 1.63} {'loss': 0.5478, 'learning_rate': 1.6312576606889962e-06, 'epoch': 1.63} {'loss': 0.5482, 'learning_rate': 1.6310784745121078e-06, 'epoch': 1.63} {'loss': 0.5265, 'learning_rate': 1.630899297303271e-06, 'epoch': 1.63} {'loss': 0.3671, 'learning_rate': 1.6307201290626817e-06, 'epoch': 1.63} {'loss': 0.7567, 'learning_rate': 1.6305409697905316e-06, 'epoch': 1.63} {'loss': 0.2969, 'learning_rate': 1.6303618194870107e-06, 'epoch': 1.63} {'loss': 0.4357, 'learning_rate': 1.6301826781523168e-06, 'epoch': 1.63} {'loss': 0.4962, 'learning_rate': 1.6300035457866314e-06, 'epoch': 1.63} {'loss': 0.4755, 'learning_rate': 1.6298244223901583e-06, 'epoch': 1.63} {'loss': 0.6329, 'learning_rate': 1.6296453079630815e-06, 'epoch': 1.63} {'loss': 0.3695, 'learning_rate': 1.629466202505594e-06, 'epoch': 1.63} {'loss': 0.5531, 'learning_rate': 1.6292871060178894e-06, 'epoch': 1.63} {'loss': 0.4025, 'learning_rate': 1.6291080185001595e-06, 'epoch': 1.63} {'loss': 0.4956, 'learning_rate': 1.6289289399525987e-06, 'epoch': 1.63} {'loss': 0.5965, 'learning_rate': 1.6287498703753913e-06, 'epoch': 1.63} {'loss': 0.5705, 'learning_rate': 1.6285708097687381e-06, 'epoch': 1.63} {'loss': 0.4599, 'learning_rate': 1.6283917581328246e-06, 'epoch': 1.63} {'loss': 0.4449, 'learning_rate': 1.628212715467845e-06, 'epoch': 1.63} {'loss': 0.5975, 'learning_rate': 1.6280336817739906e-06, 'epoch': 1.63} {'loss': 0.5117, 'learning_rate': 1.6278546570514541e-06, 'epoch': 1.63} {'loss': 0.5294, 'learning_rate': 1.6276756413004292e-06, 'epoch': 1.63} {'loss': 0.499, 'learning_rate': 1.6274966345211008e-06, 'epoch': 1.63} {'loss': 0.5926, 'learning_rate': 1.627317636713671e-06, 'epoch': 1.63} {'loss': 0.5931, 'learning_rate': 1.6271386478783225e-06, 'epoch': 1.63} {'loss': 0.4837, 'learning_rate': 1.6269596680152511e-06, 'epoch': 1.63} {'loss': 0.4823, 'learning_rate': 1.6267806971246513e-06, 'epoch': 1.63} {'loss': 0.443, 'learning_rate': 1.6266017352067053e-06, 'epoch': 1.63} {'loss': 0.4873, 'learning_rate': 1.6264227822616174e-06, 'epoch': 1.63} {'loss': 0.5171, 'learning_rate': 1.6262438382895673e-06, 'epoch': 1.63} {'loss': 0.5021, 'learning_rate': 1.6260649032907583e-06, 'epoch': 1.63} {'loss': 0.4344, 'learning_rate': 1.6258859772653746e-06, 'epoch': 1.63} {'loss': 0.5133, 'learning_rate': 1.6257070602136094e-06, 'epoch': 1.63} {'loss': 0.4581, 'learning_rate': 1.625528152135657e-06, 'epoch': 1.63} {'loss': 0.4266, 'learning_rate': 1.6253492530317027e-06, 'epoch': 1.63} {'loss': 0.4679, 'learning_rate': 1.6251703629019467e-06, 'epoch': 1.63} {'loss': 0.4561, 'learning_rate': 1.6249914817465727e-06, 'epoch': 1.63} {'loss': 0.5135, 'learning_rate': 1.62481260956578e-06, 'epoch': 1.63} {'loss': 0.398, 'learning_rate': 1.6246337463597551e-06, 'epoch': 1.63} {'loss': 0.4292, 'learning_rate': 1.6244548921286907e-06, 'epoch': 1.63} {'loss': 0.4139, 'learning_rate': 1.6242760468727802e-06, 'epoch': 1.63} {'loss': 0.6071, 'learning_rate': 1.6240972105922104e-06, 'epoch': 1.63} {'loss': 0.3912, 'learning_rate': 1.6239183832871807e-06, 'epoch': 1.63} {'loss': 0.4328, 'learning_rate': 1.6237395649578735e-06, 'epoch': 1.63} {'loss': 0.3605, 'learning_rate': 1.6235607556044908e-06, 'epoch': 1.63} {'loss': 0.569, 'learning_rate': 1.6233819552272156e-06, 'epoch': 1.63} {'loss': 0.5232, 'learning_rate': 1.6232031638262424e-06, 'epoch': 1.63} {'loss': 0.4667, 'learning_rate': 1.6230243814017666e-06, 'epoch': 1.63} {'loss': 0.4943, 'learning_rate': 1.6228456079539712e-06, 'epoch': 1.63} {'loss': 0.6576, 'learning_rate': 1.6226668434830572e-06, 'epoch': 1.63} {'loss': 0.4797, 'learning_rate': 1.6224880879892091e-06, 'epoch': 1.63} {'loss': 0.5576, 'learning_rate': 1.622309341472621e-06, 'epoch': 1.63} {'loss': 0.5728, 'learning_rate': 1.622130603933486e-06, 'epoch': 1.63} {'loss': 0.5571, 'learning_rate': 1.6219518753719933e-06, 'epoch': 1.63} {'loss': 0.6618, 'learning_rate': 1.6217731557883376e-06, 'epoch': 1.63} {'loss': 0.6297, 'learning_rate': 1.6215944451827026e-06, 'epoch': 1.63} {'loss': 0.5015, 'learning_rate': 1.6214157435552914e-06, 'epoch': 1.63} {'loss': 0.5068, 'learning_rate': 1.621237050906287e-06, 'epoch': 1.63} {'loss': 0.5956, 'learning_rate': 1.6210583672358827e-06, 'epoch': 1.63} {'loss': 0.481, 'learning_rate': 1.6208796925442704e-06, 'epoch': 1.63} {'loss': 0.4386, 'learning_rate': 1.6207010268316425e-06, 'epoch': 1.63} {'loss': 0.5241, 'learning_rate': 1.6205223700981921e-06, 'epoch': 1.63} {'loss': 0.5201, 'learning_rate': 1.6203437223441033e-06, 'epoch': 1.63} {'loss': 0.5028, 'learning_rate': 1.620165083569577e-06, 'epoch': 1.63} {'loss': 0.582, 'learning_rate': 1.6199864537747989e-06, 'epoch': 1.63} {'loss': 0.644, 'learning_rate': 1.6198078329599598e-06, 'epoch': 1.63} {'loss': 0.3895, 'learning_rate': 1.619629221125254e-06, 'epoch': 1.63} {'loss': 0.5746, 'learning_rate': 1.6194506182708724e-06, 'epoch': 1.63} {'loss': 0.4652, 'learning_rate': 1.6192720243970074e-06, 'epoch': 1.63} {'loss': 0.5197, 'learning_rate': 1.619093439503847e-06, 'epoch': 1.63} {'loss': 0.5516, 'learning_rate': 1.6189148635915842e-06, 'epoch': 1.63} {'loss': 0.4615, 'learning_rate': 1.6187362966604104e-06, 'epoch': 1.63} {'loss': 0.4986, 'learning_rate': 1.6185577387105167e-06, 'epoch': 1.63} {'loss': 0.605, 'learning_rate': 1.6183791897420953e-06, 'epoch': 1.63} {'loss': 0.4063, 'learning_rate': 1.6182006497553371e-06, 'epoch': 1.63} {'loss': 0.5821, 'learning_rate': 1.6180221187504364e-06, 'epoch': 1.63} {'loss': 0.4262, 'learning_rate': 1.6178435967275786e-06, 'epoch': 1.63} {'loss': 0.3816, 'learning_rate': 1.6176650836869578e-06, 'epoch': 1.63} {'loss': 0.4202, 'learning_rate': 1.6174865796287654e-06, 'epoch': 1.63} {'loss': 0.5049, 'learning_rate': 1.617308084553193e-06, 'epoch': 1.63} {'loss': 0.3651, 'learning_rate': 1.6171295984604308e-06, 'epoch': 1.63} {'loss': 0.5104, 'learning_rate': 1.6169511213506716e-06, 'epoch': 1.63} {'loss': 0.4495, 'learning_rate': 1.616772653224108e-06, 'epoch': 1.63} {'loss': 0.5097, 'learning_rate': 1.616594194080927e-06, 'epoch': 1.63} {'loss': 0.4122, 'learning_rate': 1.6164157439213213e-06, 'epoch': 1.63} {'loss': 0.4851, 'learning_rate': 1.6162373027454835e-06, 'epoch': 1.63} {'loss': 0.4851, 'learning_rate': 1.616058870553604e-06, 'epoch': 1.63} {'loss': 0.5659, 'learning_rate': 1.6158804473458744e-06, 'epoch': 1.63} {'loss': 0.6284, 'learning_rate': 1.615702033122487e-06, 'epoch': 1.63} {'loss': 0.4832, 'learning_rate': 1.6155236278836306e-06, 'epoch': 1.63} {'loss': 0.6037, 'learning_rate': 1.615345231629496e-06, 'epoch': 1.63} {'loss': 0.5411, 'learning_rate': 1.6151668443602764e-06, 'epoch': 1.63} {'loss': 0.623, 'learning_rate': 1.6149884660761627e-06, 'epoch': 1.63} {'loss': 0.5327, 'learning_rate': 1.614810096777345e-06, 'epoch': 1.63} {'loss': 0.4888, 'learning_rate': 1.6146317364640175e-06, 'epoch': 1.63} {'loss': 0.521, 'learning_rate': 1.6144533851363663e-06, 'epoch': 1.63} {'loss': 0.3558, 'learning_rate': 1.6142750427945864e-06, 'epoch': 1.63} {'loss': 0.4966, 'learning_rate': 1.614096709438866e-06, 'epoch': 1.63} {'loss': 0.4843, 'learning_rate': 1.6139183850693995e-06, 'epoch': 1.63} {'loss': 0.4942, 'learning_rate': 1.6137400696863748e-06, 'epoch': 1.63} {'loss': 0.3926, 'learning_rate': 1.6135617632899857e-06, 'epoch': 1.63} {'loss': 0.5757, 'learning_rate': 1.6133834658804238e-06, 'epoch': 1.63} {'loss': 0.6121, 'learning_rate': 1.613205177457876e-06, 'epoch': 1.63} {'loss': 0.6327, 'learning_rate': 1.6130268980225362e-06, 'epoch': 1.63} {'loss': 0.6822, 'learning_rate': 1.6128486275745947e-06, 'epoch': 1.63} {'loss': 0.4155, 'learning_rate': 1.6126703661142439e-06, 'epoch': 1.63} {'loss': 0.5184, 'learning_rate': 1.6124921136416727e-06, 'epoch': 1.63} {'loss': 0.42, 'learning_rate': 1.6123138701570763e-06, 'epoch': 1.63} {'loss': 0.5043, 'learning_rate': 1.61213563566064e-06, 'epoch': 1.63} {'loss': 0.4796, 'learning_rate': 1.611957410152557e-06, 'epoch': 1.63} {'loss': 0.6067, 'learning_rate': 1.6117791936330184e-06, 'epoch': 1.63} {'loss': 0.5588, 'learning_rate': 1.6116009861022165e-06, 'epoch': 1.63} {'loss': 0.6275, 'learning_rate': 1.6114227875603406e-06, 'epoch': 1.63} {'loss': 0.4688, 'learning_rate': 1.611244598007583e-06, 'epoch': 1.63} {'loss': 0.3972, 'learning_rate': 1.611066417444136e-06, 'epoch': 1.63} {'loss': 0.5002, 'learning_rate': 1.6108882458701857e-06, 'epoch': 1.63} {'loss': 0.5165, 'learning_rate': 1.6107100832859256e-06, 'epoch': 1.63} {'loss': 0.5269, 'learning_rate': 1.6105319296915477e-06, 'epoch': 1.63} {'loss': 0.4636, 'learning_rate': 1.6103537850872419e-06, 'epoch': 1.63} {'loss': 0.5864, 'learning_rate': 1.6101756494732012e-06, 'epoch': 1.63} {'loss': 0.4813, 'learning_rate': 1.60999752284961e-06, 'epoch': 1.63} {'loss': 0.4572, 'learning_rate': 1.6098194052166683e-06, 'epoch': 1.63} {'loss': 0.5262, 'learning_rate': 1.6096412965745601e-06, 'epoch': 1.63} {'loss': 0.5553, 'learning_rate': 1.6094631969234786e-06, 'epoch': 1.63} {'loss': 0.5879, 'learning_rate': 1.609285106263614e-06, 'epoch': 1.63} {'loss': 0.5856, 'learning_rate': 1.6091070245951578e-06, 'epoch': 1.63} {'loss': 0.5019, 'learning_rate': 1.6089289519183038e-06, 'epoch': 1.63} {'loss': 0.5923, 'learning_rate': 1.6087508882332349e-06, 'epoch': 1.64} {'loss': 0.389, 'learning_rate': 1.6085728335401508e-06, 'epoch': 1.64} {'loss': 0.5269, 'learning_rate': 1.608394787839237e-06, 'epoch': 1.64} {'loss': 0.5305, 'learning_rate': 1.6082167511306845e-06, 'epoch': 1.64} {'loss': 0.5302, 'learning_rate': 1.6080387234146854e-06, 'epoch': 1.64} {'loss': 0.7011, 'learning_rate': 1.6078607046914307e-06, 'epoch': 1.64} {'loss': 0.5579, 'learning_rate': 1.6076826949611134e-06, 'epoch': 1.64} {'loss': 0.613, 'learning_rate': 1.6075046942239159e-06, 'epoch': 1.64} {'loss': 0.5752, 'learning_rate': 1.6073267024800398e-06, 'epoch': 1.64} {'loss': 0.6174, 'learning_rate': 1.6071487197296688e-06, 'epoch': 1.64} {'loss': 0.2787, 'learning_rate': 1.6069707459729945e-06, 'epoch': 1.64} {'loss': 0.5591, 'learning_rate': 1.6067927812102113e-06, 'epoch': 1.64} {'loss': 0.4185, 'learning_rate': 1.6066148254415014e-06, 'epoch': 1.64} {'loss': 0.5434, 'learning_rate': 1.606436878667067e-06, 'epoch': 1.64} {'loss': 0.4804, 'learning_rate': 1.6062589408870888e-06, 'epoch': 1.64} {'loss': 0.4483, 'learning_rate': 1.6060810121017656e-06, 'epoch': 1.64} {'loss': 0.5558, 'learning_rate': 1.6059030923112829e-06, 'epoch': 1.64} {'loss': 0.4861, 'learning_rate': 1.6057251815158315e-06, 'epoch': 1.64} {'loss': 0.4989, 'learning_rate': 1.6055472797156058e-06, 'epoch': 1.64} {'loss': 0.4802, 'learning_rate': 1.605369386910789e-06, 'epoch': 1.64} {'loss': 0.5012, 'learning_rate': 1.6051915031015818e-06, 'epoch': 1.64} {'loss': 0.6152, 'learning_rate': 1.6050136282881646e-06, 'epoch': 1.64} {'loss': 0.4706, 'learning_rate': 1.6048357624707377e-06, 'epoch': 1.64} {'loss': 0.4574, 'learning_rate': 1.604657905649485e-06, 'epoch': 1.64} {'loss': 0.414, 'learning_rate': 1.6044800578245989e-06, 'epoch': 1.64} {'loss': 0.4618, 'learning_rate': 1.604302218996272e-06, 'epoch': 1.64} {'loss': 0.3755, 'learning_rate': 1.6041243891646885e-06, 'epoch': 1.64} {'loss': 0.5353, 'learning_rate': 1.6039465683300493e-06, 'epoch': 1.64} {'loss': 0.4596, 'learning_rate': 1.603768756492533e-06, 'epoch': 1.64} {'loss': 0.6393, 'learning_rate': 1.6035909536523419e-06, 'epoch': 1.64} {'loss': 0.5309, 'learning_rate': 1.603413159809658e-06, 'epoch': 1.64} {'loss': 0.5921, 'learning_rate': 1.6032353749646746e-06, 'epoch': 1.64} {'loss': 0.3655, 'learning_rate': 1.6030575991175857e-06, 'epoch': 1.64} {'loss': 0.5007, 'learning_rate': 1.6028798322685724e-06, 'epoch': 1.64} {'loss': 0.3371, 'learning_rate': 1.6027020744178367e-06, 'epoch': 1.64} {'loss': 0.4259, 'learning_rate': 1.6025243255655609e-06, 'epoch': 1.64} {'loss': 0.6249, 'learning_rate': 1.602346585711939e-06, 'epoch': 1.64} {'loss': 0.5438, 'learning_rate': 1.60216885485716e-06, 'epoch': 1.64} {'loss': 0.5663, 'learning_rate': 1.601991133001416e-06, 'epoch': 1.64} {'loss': 0.6042, 'learning_rate': 1.6018134201448975e-06, 'epoch': 1.64} {'loss': 0.6169, 'learning_rate': 1.6016357162877894e-06, 'epoch': 1.64} {'loss': 0.448, 'learning_rate': 1.6014580214302922e-06, 'epoch': 1.64} {'loss': 0.508, 'learning_rate': 1.601280335572588e-06, 'epoch': 1.64} {'loss': 0.43, 'learning_rate': 1.6011026587148692e-06, 'epoch': 1.64} {'loss': 0.5563, 'learning_rate': 1.6009249908573276e-06, 'epoch': 1.64} {'loss': 0.5582, 'learning_rate': 1.6007473320001533e-06, 'epoch': 1.64} {'loss': 0.5935, 'learning_rate': 1.6005696821435379e-06, 'epoch': 1.64} {'loss': 0.437, 'learning_rate': 1.6003920412876661e-06, 'epoch': 1.64} {'loss': 0.6792, 'learning_rate': 1.6002144094327364e-06, 'epoch': 1.64} {'loss': 0.4064, 'learning_rate': 1.6000367865789334e-06, 'epoch': 1.64} {'loss': 0.7151, 'learning_rate': 1.599859172726449e-06, 'epoch': 1.64} {'loss': 0.5446, 'learning_rate': 1.5996815678754762e-06, 'epoch': 1.64} {'loss': 0.5389, 'learning_rate': 1.5995039720261974e-06, 'epoch': 1.64} {'loss': 0.6082, 'learning_rate': 1.5993263851788133e-06, 'epoch': 1.64} {'loss': 0.3616, 'learning_rate': 1.5991488073335037e-06, 'epoch': 1.64} {'loss': 0.5844, 'learning_rate': 1.598971238490471e-06, 'epoch': 1.64} {'loss': 0.3477, 'learning_rate': 1.5987936786498947e-06, 'epoch': 1.64} {'loss': 0.6016, 'learning_rate': 1.5986161278119704e-06, 'epoch': 1.64} {'loss': 0.4224, 'learning_rate': 1.5984385859768891e-06, 'epoch': 1.64} {'loss': 0.5328, 'learning_rate': 1.598261053144834e-06, 'epoch': 1.64} {'loss': 0.5695, 'learning_rate': 1.5980835293160058e-06, 'epoch': 1.64} {'loss': 0.5393, 'learning_rate': 1.5979060144905845e-06, 'epoch': 1.64} {'loss': 0.4973, 'learning_rate': 1.59772850866877e-06, 'epoch': 1.64} {'loss': 0.5024, 'learning_rate': 1.5975510118507453e-06, 'epoch': 1.64} {'loss': 0.5542, 'learning_rate': 1.5973735240367028e-06, 'epoch': 1.64} {'loss': 0.6654, 'learning_rate': 1.5971960452268353e-06, 'epoch': 1.64} {'loss': 0.5526, 'learning_rate': 1.5970185754213263e-06, 'epoch': 1.64} {'loss': 0.4995, 'learning_rate': 1.5968411146203756e-06, 'epoch': 1.64} {'loss': 0.4613, 'learning_rate': 1.596663662824165e-06, 'epoch': 1.64} {'loss': 0.3583, 'learning_rate': 1.5964862200328878e-06, 'epoch': 1.64} {'loss': 0.6781, 'learning_rate': 1.596308786246734e-06, 'epoch': 1.64} {'loss': 0.4977, 'learning_rate': 1.5961313614658935e-06, 'epoch': 1.64} {'loss': 0.4381, 'learning_rate': 1.5959539456905592e-06, 'epoch': 1.64} {'loss': 0.6087, 'learning_rate': 1.5957765389209146e-06, 'epoch': 1.64} {'loss': 0.6124, 'learning_rate': 1.595599141157159e-06, 'epoch': 1.64} {'loss': 0.4944, 'learning_rate': 1.5954217523994742e-06, 'epoch': 1.64} {'loss': 0.5324, 'learning_rate': 1.5952443726480537e-06, 'epoch': 1.64} {'loss': 0.6107, 'learning_rate': 1.595067001903088e-06, 'epoch': 1.64} {'loss': 0.6077, 'learning_rate': 1.5948896401647662e-06, 'epoch': 1.64} {'loss': 0.462, 'learning_rate': 1.594712287433281e-06, 'epoch': 1.64} {'loss': 0.4774, 'learning_rate': 1.5945349437088187e-06, 'epoch': 1.64} {'loss': 0.4797, 'learning_rate': 1.594357608991569e-06, 'epoch': 1.64} {'loss': 0.3826, 'learning_rate': 1.5941802832817256e-06, 'epoch': 1.64} {'loss': 0.5331, 'learning_rate': 1.5940029665794754e-06, 'epoch': 1.64} {'loss': 0.3527, 'learning_rate': 1.593825658885011e-06, 'epoch': 1.64} {'loss': 0.5396, 'learning_rate': 1.5936483601985197e-06, 'epoch': 1.64} {'loss': 0.5018, 'learning_rate': 1.5934710705201961e-06, 'epoch': 1.64} {'loss': 0.6593, 'learning_rate': 1.5932937898502255e-06, 'epoch': 1.64} {'loss': 0.6161, 'learning_rate': 1.5931165181887975e-06, 'epoch': 1.64} {'loss': 0.3502, 'learning_rate': 1.5929392555361056e-06, 'epoch': 1.64} {'loss': 0.5976, 'learning_rate': 1.5927620018923373e-06, 'epoch': 1.64} {'loss': 0.5021, 'learning_rate': 1.5925847572576825e-06, 'epoch': 1.64} {'loss': 0.5987, 'learning_rate': 1.5924075216323332e-06, 'epoch': 1.64} {'loss': 0.6543, 'learning_rate': 1.5922302950164804e-06, 'epoch': 1.64} {'loss': 0.6207, 'learning_rate': 1.5920530774103082e-06, 'epoch': 1.64} {'loss': 0.6579, 'learning_rate': 1.5918758688140112e-06, 'epoch': 1.64} {'loss': 0.4215, 'learning_rate': 1.591698669227777e-06, 'epoch': 1.64} {'loss': 0.521, 'learning_rate': 1.5915214786517975e-06, 'epoch': 1.64} {'loss': 0.5234, 'learning_rate': 1.5913442970862614e-06, 'epoch': 1.64} {'loss': 0.3823, 'learning_rate': 1.591167124531361e-06, 'epoch': 1.64} {'loss': 0.4159, 'learning_rate': 1.5909899609872814e-06, 'epoch': 1.64} {'loss': 0.5541, 'learning_rate': 1.590812806454215e-06, 'epoch': 1.64} {'loss': 0.6918, 'learning_rate': 1.5906356609323525e-06, 'epoch': 1.64} {'loss': 0.4551, 'learning_rate': 1.5904585244218817e-06, 'epoch': 1.64} {'loss': 0.5091, 'learning_rate': 1.5902813969229948e-06, 'epoch': 1.64} {'loss': 0.3721, 'learning_rate': 1.59010427843588e-06, 'epoch': 1.64} {'loss': 0.4676, 'learning_rate': 1.5899271689607299e-06, 'epoch': 1.64} {'loss': 0.5293, 'learning_rate': 1.5897500684977286e-06, 'epoch': 1.64} {'loss': 0.6346, 'learning_rate': 1.5895729770470702e-06, 'epoch': 1.64} {'loss': 0.6082, 'learning_rate': 1.5893958946089427e-06, 'epoch': 1.64} {'loss': 0.3641, 'learning_rate': 1.589218821183538e-06, 'epoch': 1.64} {'loss': 0.6519, 'learning_rate': 1.5890417567710437e-06, 'epoch': 1.64} {'loss': 0.389, 'learning_rate': 1.5888647013716496e-06, 'epoch': 1.64} {'loss': 0.2909, 'learning_rate': 1.588687654985549e-06, 'epoch': 1.64} {'loss': 0.4192, 'learning_rate': 1.5885106176129262e-06, 'epoch': 1.64} {'loss': 0.4522, 'learning_rate': 1.5883335892539742e-06, 'epoch': 1.64} {'loss': 0.549, 'learning_rate': 1.5881565699088807e-06, 'epoch': 1.64} {'loss': 0.5032, 'learning_rate': 1.587979559577838e-06, 'epoch': 1.64} {'loss': 0.6525, 'learning_rate': 1.5878025582610357e-06, 'epoch': 1.64} {'loss': 0.4186, 'learning_rate': 1.5876255659586604e-06, 'epoch': 1.64} {'loss': 0.5771, 'learning_rate': 1.587448582670903e-06, 'epoch': 1.64} {'loss': 0.5076, 'learning_rate': 1.5872716083979545e-06, 'epoch': 1.64} {'loss': 0.564, 'learning_rate': 1.5870946431400037e-06, 'epoch': 1.64} {'loss': 0.6075, 'learning_rate': 1.5869176868972402e-06, 'epoch': 1.64} {'loss': 0.3963, 'learning_rate': 1.586740739669853e-06, 'epoch': 1.64} {'loss': 0.4882, 'learning_rate': 1.5865638014580352e-06, 'epoch': 1.64} {'loss': 0.4612, 'learning_rate': 1.5863868722619725e-06, 'epoch': 1.64} {'loss': 0.5477, 'learning_rate': 1.5862099520818541e-06, 'epoch': 1.64} {'loss': 0.4434, 'learning_rate': 1.5860330409178715e-06, 'epoch': 1.64} {'loss': 0.3763, 'learning_rate': 1.5858561387702143e-06, 'epoch': 1.64} {'loss': 0.5166, 'learning_rate': 1.5856792456390712e-06, 'epoch': 1.64} {'loss': 0.5074, 'learning_rate': 1.5855023615246324e-06, 'epoch': 1.64} {'loss': 0.5926, 'learning_rate': 1.5853254864270895e-06, 'epoch': 1.64} {'loss': 0.4186, 'learning_rate': 1.5851486203466282e-06, 'epoch': 1.64} {'loss': 0.4375, 'learning_rate': 1.5849717632834382e-06, 'epoch': 1.64} {'loss': 0.4873, 'learning_rate': 1.5847949152377119e-06, 'epoch': 1.64} {'loss': 0.4424, 'learning_rate': 1.5846180762096364e-06, 'epoch': 1.64} {'loss': 0.4451, 'learning_rate': 1.5844412461994053e-06, 'epoch': 1.64} {'loss': 0.6047, 'learning_rate': 1.5842644252072004e-06, 'epoch': 1.64} {'loss': 0.5119, 'learning_rate': 1.5840876132332194e-06, 'epoch': 1.64} {'loss': 0.5536, 'learning_rate': 1.5839108102776458e-06, 'epoch': 1.64} {'loss': 0.5932, 'learning_rate': 1.5837340163406723e-06, 'epoch': 1.64} {'loss': 0.4902, 'learning_rate': 1.5835572314224868e-06, 'epoch': 1.64} {'loss': 0.4928, 'learning_rate': 1.5833804555232801e-06, 'epoch': 1.64} {'loss': 0.6157, 'learning_rate': 1.5832036886432423e-06, 'epoch': 1.64} {'loss': 0.3741, 'learning_rate': 1.5830269307825564e-06, 'epoch': 1.64} {'loss': 0.427, 'learning_rate': 1.5828501819414222e-06, 'epoch': 1.64} {'loss': 0.4385, 'learning_rate': 1.5826734421200217e-06, 'epoch': 1.64} {'loss': 0.4162, 'learning_rate': 1.5824967113185464e-06, 'epoch': 1.64} {'loss': 0.3854, 'learning_rate': 1.5823199895371843e-06, 'epoch': 1.64} {'loss': 0.5353, 'learning_rate': 1.582143276776128e-06, 'epoch': 1.64} {'loss': 0.4983, 'learning_rate': 1.581966573035566e-06, 'epoch': 1.64} {'loss': 0.5247, 'learning_rate': 1.5817898783156815e-06, 'epoch': 1.64} {'loss': 0.5594, 'learning_rate': 1.5816131926166745e-06, 'epoch': 1.64} {'loss': 0.507, 'learning_rate': 1.5814365159387268e-06, 'epoch': 1.64} {'loss': 0.392, 'learning_rate': 1.5812598482820286e-06, 'epoch': 1.64} {'loss': 0.5895, 'learning_rate': 1.5810831896467726e-06, 'epoch': 1.64} {'loss': 0.5121, 'learning_rate': 1.5809065400331425e-06, 'epoch': 1.64} {'loss': 0.4734, 'learning_rate': 1.5807298994413346e-06, 'epoch': 1.64} {'loss': 0.4859, 'learning_rate': 1.5805532678715297e-06, 'epoch': 1.64} {'loss': 0.5475, 'learning_rate': 1.5803766453239266e-06, 'epoch': 1.64} {'loss': 0.5267, 'learning_rate': 1.5802000317987075e-06, 'epoch': 1.64} {'loss': 0.4938, 'learning_rate': 1.5800234272960646e-06, 'epoch': 1.64} {'loss': 0.4238, 'learning_rate': 1.5798468318161885e-06, 'epoch': 1.64} {'loss': 0.465, 'learning_rate': 1.5796702453592617e-06, 'epoch': 1.64} {'loss': 0.5932, 'learning_rate': 1.5794936679254835e-06, 'epoch': 1.64} {'loss': 0.4069, 'learning_rate': 1.579317099515032e-06, 'epoch': 1.64} {'loss': 0.5585, 'learning_rate': 1.579140540128108e-06, 'epoch': 1.64} {'loss': 0.4337, 'learning_rate': 1.5789639897648923e-06, 'epoch': 1.64} {'loss': 0.5599, 'learning_rate': 1.578787448425576e-06, 'epoch': 1.64} {'loss': 0.6408, 'learning_rate': 1.5786109161103525e-06, 'epoch': 1.64} {'loss': 0.4028, 'learning_rate': 1.5784343928194023e-06, 'epoch': 1.64} {'loss': 0.5582, 'learning_rate': 1.5782578785529246e-06, 'epoch': 1.64} {'loss': 0.5534, 'learning_rate': 1.578081373311099e-06, 'epoch': 1.64} {'loss': 0.5345, 'learning_rate': 1.577904877094123e-06, 'epoch': 1.64} {'loss': 0.4733, 'learning_rate': 1.577728389902181e-06, 'epoch': 1.64} {'loss': 0.4893, 'learning_rate': 1.5775519117354631e-06, 'epoch': 1.64} {'loss': 0.4998, 'learning_rate': 1.5773754425941601e-06, 'epoch': 1.64} {'loss': 0.4828, 'learning_rate': 1.577198982478455e-06, 'epoch': 1.64} {'loss': 0.6972, 'learning_rate': 1.5770225313885467e-06, 'epoch': 1.64} {'loss': 0.5307, 'learning_rate': 1.576846089324614e-06, 'epoch': 1.64} {'loss': 0.4025, 'learning_rate': 1.5766696562868555e-06, 'epoch': 1.64} {'loss': 0.5209, 'learning_rate': 1.5764932322754533e-06, 'epoch': 1.64} {'loss': 0.5817, 'learning_rate': 1.5763168172905985e-06, 'epoch': 1.64} {'loss': 0.5128, 'learning_rate': 1.5761404113324841e-06, 'epoch': 1.64} {'loss': 0.6144, 'learning_rate': 1.57596401440129e-06, 'epoch': 1.64} {'loss': 0.6091, 'learning_rate': 1.575787626497215e-06, 'epoch': 1.64} {'loss': 0.6454, 'learning_rate': 1.5756112476204421e-06, 'epoch': 1.64} {'loss': 0.4545, 'learning_rate': 1.5754348777711625e-06, 'epoch': 1.64} {'loss': 0.4575, 'learning_rate': 1.5752585169495638e-06, 'epoch': 1.64} {'loss': 0.472, 'learning_rate': 1.5750821651558369e-06, 'epoch': 1.64} {'loss': 0.5339, 'learning_rate': 1.5749058223901714e-06, 'epoch': 1.64} {'loss': 0.3802, 'learning_rate': 1.5747294886527509e-06, 'epoch': 1.64} {'loss': 0.4592, 'learning_rate': 1.5745531639437728e-06, 'epoch': 1.64} {'loss': 0.4416, 'learning_rate': 1.5743768482634181e-06, 'epoch': 1.64} {'loss': 0.351, 'learning_rate': 1.57420054161188e-06, 'epoch': 1.64} {'loss': 0.6405, 'learning_rate': 1.574024243989346e-06, 'epoch': 1.64} {'loss': 0.592, 'learning_rate': 1.5738479553960062e-06, 'epoch': 1.64} {'loss': 0.5457, 'learning_rate': 1.5736716758320503e-06, 'epoch': 1.64} {'loss': 0.4351, 'learning_rate': 1.5734954052976614e-06, 'epoch': 1.64} {'loss': 0.5655, 'learning_rate': 1.5733191437930373e-06, 'epoch': 1.64} {'loss': 0.4596, 'learning_rate': 1.57314289131836e-06, 'epoch': 1.64} {'loss': 0.5292, 'learning_rate': 1.5729666478738215e-06, 'epoch': 1.64} {'loss': 0.578, 'learning_rate': 1.5727904134596084e-06, 'epoch': 1.64} {'loss': 0.516, 'learning_rate': 1.5726141880759115e-06, 'epoch': 1.64} {'loss': 0.398, 'learning_rate': 1.572437971722922e-06, 'epoch': 1.64} {'loss': 0.4141, 'learning_rate': 1.5722617644008232e-06, 'epoch': 1.64} {'loss': 0.4252, 'learning_rate': 1.5720855661098067e-06, 'epoch': 1.64} {'loss': 0.447, 'learning_rate': 1.5719093768500603e-06, 'epoch': 1.64} {'loss': 0.5788, 'learning_rate': 1.5717331966217741e-06, 'epoch': 1.64} {'loss': 0.3454, 'learning_rate': 1.571557025425139e-06, 'epoch': 1.64} {'loss': 0.3583, 'learning_rate': 1.5713808632603367e-06, 'epoch': 1.64} {'loss': 0.4729, 'learning_rate': 1.571204710127565e-06, 'epoch': 1.64} {'loss': 0.4278, 'learning_rate': 1.5710285660270063e-06, 'epoch': 1.64} {'loss': 0.6234, 'learning_rate': 1.5708524309588513e-06, 'epoch': 1.64} {'loss': 0.5093, 'learning_rate': 1.5706763049232886e-06, 'epoch': 1.64} {'loss': 0.5671, 'learning_rate': 1.5705001879205063e-06, 'epoch': 1.64} {'loss': 0.6492, 'learning_rate': 1.5703240799506969e-06, 'epoch': 1.64} {'loss': 0.5717, 'learning_rate': 1.5701479810140407e-06, 'epoch': 1.64} {'loss': 0.4279, 'learning_rate': 1.5699718911107375e-06, 'epoch': 1.64} {'loss': 0.5566, 'learning_rate': 1.5697958102409671e-06, 'epoch': 1.64} {'loss': 0.4554, 'learning_rate': 1.5696197384049216e-06, 'epoch': 1.64} {'loss': 0.5194, 'learning_rate': 1.5694436756027898e-06, 'epoch': 1.64} {'loss': 0.5172, 'learning_rate': 1.5692676218347591e-06, 'epoch': 1.64} {'loss': 0.6098, 'learning_rate': 1.5690915771010228e-06, 'epoch': 1.64} {'loss': 0.4404, 'learning_rate': 1.568915541401762e-06, 'epoch': 1.64} {'loss': 0.5344, 'learning_rate': 1.5687395147371697e-06, 'epoch': 1.64} {'loss': 0.5732, 'learning_rate': 1.5685634971074348e-06, 'epoch': 1.64} {'loss': 0.5622, 'learning_rate': 1.5683874885127438e-06, 'epoch': 1.64} {'loss': 0.5206, 'learning_rate': 1.5682114889532873e-06, 'epoch': 1.64} {'loss': 0.5513, 'learning_rate': 1.5680354984292533e-06, 'epoch': 1.64} {'loss': 0.4536, 'learning_rate': 1.567859516940833e-06, 'epoch': 1.64} {'loss': 0.3493, 'learning_rate': 1.5676835444882089e-06, 'epoch': 1.64} {'loss': 0.435, 'learning_rate': 1.5675075810715733e-06, 'epoch': 1.64} {'loss': 0.4222, 'learning_rate': 1.5673316266911143e-06, 'epoch': 1.64} {'loss': 0.4703, 'learning_rate': 1.5671556813470212e-06, 'epoch': 1.64} {'loss': 0.6559, 'learning_rate': 1.5669797450394807e-06, 'epoch': 1.64} {'loss': 0.3863, 'learning_rate': 1.566803817768684e-06, 'epoch': 1.64} {'loss': 0.5084, 'learning_rate': 1.5666278995348194e-06, 'epoch': 1.64} {'loss': 0.4832, 'learning_rate': 1.5664519903380725e-06, 'epoch': 1.64} {'loss': 0.4149, 'learning_rate': 1.5662760901786333e-06, 'epoch': 1.64} {'loss': 0.501, 'learning_rate': 1.5661001990566903e-06, 'epoch': 1.64} {'loss': 0.3932, 'learning_rate': 1.5659243169724326e-06, 'epoch': 1.64} {'loss': 0.5662, 'learning_rate': 1.5657484439260473e-06, 'epoch': 1.64} {'loss': 0.4659, 'learning_rate': 1.5655725799177268e-06, 'epoch': 1.64} {'loss': 0.621, 'learning_rate': 1.5653967249476542e-06, 'epoch': 1.64} {'loss': 0.31, 'learning_rate': 1.5652208790160194e-06, 'epoch': 1.64} {'loss': 0.41, 'learning_rate': 1.5650450421230124e-06, 'epoch': 1.64} {'loss': 0.4278, 'learning_rate': 1.5648692142688215e-06, 'epoch': 1.64} {'loss': 0.6656, 'learning_rate': 1.5646933954536337e-06, 'epoch': 1.64} {'loss': 0.4811, 'learning_rate': 1.5645175856776384e-06, 'epoch': 1.64} {'loss': 0.5022, 'learning_rate': 1.5643417849410269e-06, 'epoch': 1.64} {'loss': 0.547, 'learning_rate': 1.5641659932439813e-06, 'epoch': 1.64} {'loss': 0.4978, 'learning_rate': 1.5639902105866934e-06, 'epoch': 1.64} {'loss': 0.4884, 'learning_rate': 1.563814436969352e-06, 'epoch': 1.64} {'loss': 0.5512, 'learning_rate': 1.5636386723921447e-06, 'epoch': 1.64} {'loss': 0.5607, 'learning_rate': 1.5634629168552618e-06, 'epoch': 1.64} {'loss': 0.6467, 'learning_rate': 1.563287170358886e-06, 'epoch': 1.64} {'loss': 0.5782, 'learning_rate': 1.5631114329032127e-06, 'epoch': 1.64} {'loss': 0.5488, 'learning_rate': 1.5629357044884253e-06, 'epoch': 1.64} {'loss': 0.4489, 'learning_rate': 1.5627599851147146e-06, 'epoch': 1.64} {'loss': 0.3928, 'learning_rate': 1.5625842747822673e-06, 'epoch': 1.64} {'loss': 0.4125, 'learning_rate': 1.5624085734912731e-06, 'epoch': 1.64} {'loss': 0.5139, 'learning_rate': 1.5622328812419207e-06, 'epoch': 1.64} {'loss': 0.5565, 'learning_rate': 1.5620571980343936e-06, 'epoch': 1.64} {'loss': 0.4513, 'learning_rate': 1.561881523868889e-06, 'epoch': 1.64} {'loss': 0.5293, 'learning_rate': 1.5617058587455869e-06, 'epoch': 1.64} {'loss': 0.4923, 'learning_rate': 1.5615302026646783e-06, 'epoch': 1.64} {'loss': 0.3845, 'learning_rate': 1.561354555626352e-06, 'epoch': 1.64} {'loss': 0.4946, 'learning_rate': 1.5611789176307956e-06, 'epoch': 1.64} {'loss': 0.6299, 'learning_rate': 1.5610032886782e-06, 'epoch': 1.64} {'loss': 0.423, 'learning_rate': 1.5608276687687473e-06, 'epoch': 1.64} {'loss': 0.5015, 'learning_rate': 1.560652057902633e-06, 'epoch': 1.64} {'loss': 0.5146, 'learning_rate': 1.56047645608004e-06, 'epoch': 1.64} {'loss': 0.4781, 'learning_rate': 1.5603008633011585e-06, 'epoch': 1.64} {'loss': 0.5038, 'learning_rate': 1.560125279566178e-06, 'epoch': 1.64} {'loss': 0.4869, 'learning_rate': 1.559949704875281e-06, 'epoch': 1.64} {'loss': 0.5924, 'learning_rate': 1.5597741392286635e-06, 'epoch': 1.64} {'loss': 0.5372, 'learning_rate': 1.5595985826265081e-06, 'epoch': 1.64} {'loss': 0.6129, 'learning_rate': 1.5594230350690042e-06, 'epoch': 1.64} {'loss': 0.5059, 'learning_rate': 1.559247496556341e-06, 'epoch': 1.64} {'loss': 0.6237, 'learning_rate': 1.5590719670887043e-06, 'epoch': 1.64} {'loss': 0.5642, 'learning_rate': 1.5588964466662882e-06, 'epoch': 1.64} {'loss': 0.5682, 'learning_rate': 1.5587209352892707e-06, 'epoch': 1.64} {'loss': 0.4013, 'learning_rate': 1.5585454329578497e-06, 'epoch': 1.64} {'loss': 0.4759, 'learning_rate': 1.5583699396722084e-06, 'epoch': 1.64} {'loss': 0.4977, 'learning_rate': 1.5581944554325345e-06, 'epoch': 1.64} {'loss': 0.6062, 'learning_rate': 1.5580189802390179e-06, 'epoch': 1.64} {'loss': 0.5898, 'learning_rate': 1.5578435140918446e-06, 'epoch': 1.64} {'loss': 0.4738, 'learning_rate': 1.5576680569912074e-06, 'epoch': 1.64} {'loss': 0.3913, 'learning_rate': 1.5574926089372856e-06, 'epoch': 1.64} {'loss': 0.5826, 'learning_rate': 1.557317169930278e-06, 'epoch': 1.64} {'loss': 0.395, 'learning_rate': 1.5571417399703637e-06, 'epoch': 1.64} {'loss': 0.5576, 'learning_rate': 1.5569663190577344e-06, 'epoch': 1.64} {'loss': 0.5858, 'learning_rate': 1.5567909071925802e-06, 'epoch': 1.64} {'loss': 0.508, 'learning_rate': 1.5566155043750818e-06, 'epoch': 1.64} {'loss': 0.4805, 'learning_rate': 1.5564401106054361e-06, 'epoch': 1.64} {'loss': 0.4706, 'learning_rate': 1.5562647258838226e-06, 'epoch': 1.64} {'loss': 0.59, 'learning_rate': 1.5560893502104391e-06, 'epoch': 1.64} {'loss': 0.5972, 'learning_rate': 1.555913983585464e-06, 'epoch': 1.64} {'loss': 0.6303, 'learning_rate': 1.5557386260090911e-06, 'epoch': 1.64} {'loss': 0.4421, 'learning_rate': 1.5555632774815078e-06, 'epoch': 1.64} {'loss': 0.6187, 'learning_rate': 1.5553879380028958e-06, 'epoch': 1.64} {'loss': 0.5356, 'learning_rate': 1.555212607573452e-06, 'epoch': 1.64} {'loss': 0.5515, 'learning_rate': 1.5550372861933561e-06, 'epoch': 1.64} {'loss': 0.477, 'learning_rate': 1.5548619738628046e-06, 'epoch': 1.64} {'loss': 0.4973, 'learning_rate': 1.5546866705819786e-06, 'epoch': 1.64} {'loss': 0.3701, 'learning_rate': 1.5545113763510667e-06, 'epoch': 1.64} {'loss': 0.351, 'learning_rate': 1.5543360911702621e-06, 'epoch': 1.64} {'loss': 0.4926, 'learning_rate': 1.5541608150397436e-06, 'epoch': 1.64} {'loss': 0.4879, 'learning_rate': 1.5539855479597077e-06, 'epoch': 1.64} {'loss': 0.598, 'learning_rate': 1.5538102899303353e-06, 'epoch': 1.64} {'loss': 0.4954, 'learning_rate': 1.5536350409518208e-06, 'epoch': 1.64} {'loss': 0.4111, 'learning_rate': 1.5534598010243473e-06, 'epoch': 1.64} {'loss': 0.4196, 'learning_rate': 1.5532845701481037e-06, 'epoch': 1.64} {'loss': 0.5354, 'learning_rate': 1.5531093483232807e-06, 'epoch': 1.64} {'loss': 0.6136, 'learning_rate': 1.5529341355500582e-06, 'epoch': 1.64} {'loss': 0.4723, 'learning_rate': 1.552758931828634e-06, 'epoch': 1.64} {'loss': 0.5465, 'learning_rate': 1.5525837371591867e-06, 'epoch': 1.64} {'loss': 0.4823, 'learning_rate': 1.552408551541913e-06, 'epoch': 1.64} {'loss': 0.5346, 'learning_rate': 1.5522333749769935e-06, 'epoch': 1.64} {'loss': 0.3947, 'learning_rate': 1.5520582074646184e-06, 'epoch': 1.64} {'loss': 0.5532, 'learning_rate': 1.5518830490049775e-06, 'epoch': 1.64} {'loss': 0.5386, 'learning_rate': 1.5517078995982527e-06, 'epoch': 1.64} {'loss': 0.4138, 'learning_rate': 1.5515327592446384e-06, 'epoch': 1.64} {'loss': 0.4953, 'learning_rate': 1.5513576279443155e-06, 'epoch': 1.64} {'loss': 0.5087, 'learning_rate': 1.5511825056974804e-06, 'epoch': 1.64} {'loss': 0.3983, 'learning_rate': 1.5510073925043134e-06, 'epoch': 1.64} {'loss': 0.477, 'learning_rate': 1.550832288365004e-06, 'epoch': 1.64} {'loss': 0.5703, 'learning_rate': 1.550657193279743e-06, 'epoch': 1.64} {'loss': 0.5289, 'learning_rate': 1.550482107248711e-06, 'epoch': 1.64} {'loss': 0.4864, 'learning_rate': 1.5503070302721046e-06, 'epoch': 1.64} {'loss': 0.4603, 'learning_rate': 1.5501319623501042e-06, 'epoch': 1.64} {'loss': 0.4765, 'learning_rate': 1.5499569034828999e-06, 'epoch': 1.64} {'loss': 0.64, 'learning_rate': 1.54978185367068e-06, 'epoch': 1.64} {'loss': 0.556, 'learning_rate': 1.549606812913631e-06, 'epoch': 1.64} {'loss': 0.5183, 'learning_rate': 1.549431781211944e-06, 'epoch': 1.64} {'loss': 0.4873, 'learning_rate': 1.549256758565798e-06, 'epoch': 1.64} {'loss': 0.5128, 'learning_rate': 1.5490817449753914e-06, 'epoch': 1.64} {'loss': 0.5106, 'learning_rate': 1.5489067404409042e-06, 'epoch': 1.64} {'loss': 0.4687, 'learning_rate': 1.5487317449625262e-06, 'epoch': 1.64} {'loss': 0.6297, 'learning_rate': 1.5485567585404449e-06, 'epoch': 1.64} {'loss': 0.5273, 'learning_rate': 1.548381781174848e-06, 'epoch': 1.64} {'loss': 0.411, 'learning_rate': 1.5482068128659245e-06, 'epoch': 1.64} {'loss': 0.4704, 'learning_rate': 1.5480318536138584e-06, 'epoch': 1.64} {'loss': 0.5644, 'learning_rate': 1.5478569034188384e-06, 'epoch': 1.64} {'loss': 0.6044, 'learning_rate': 1.5476819622810536e-06, 'epoch': 1.64} {'loss': 0.4461, 'learning_rate': 1.5475070302006889e-06, 'epoch': 1.64} {'loss': 0.5251, 'learning_rate': 1.5473321071779346e-06, 'epoch': 1.64} {'loss': 0.5273, 'learning_rate': 1.547157193212977e-06, 'epoch': 1.64} {'loss': 0.5547, 'learning_rate': 1.546982288306005e-06, 'epoch': 1.64} {'loss': 0.4373, 'learning_rate': 1.5468073924572024e-06, 'epoch': 1.64} {'loss': 0.4932, 'learning_rate': 1.5466325056667575e-06, 'epoch': 1.64} {'loss': 0.5691, 'learning_rate': 1.5464576279348608e-06, 'epoch': 1.64} {'loss': 0.4953, 'learning_rate': 1.5462827592616959e-06, 'epoch': 1.64} {'loss': 0.5318, 'learning_rate': 1.5461078996474532e-06, 'epoch': 1.64} {'loss': 0.4199, 'learning_rate': 1.5459330490923186e-06, 'epoch': 1.64} {'loss': 0.5629, 'learning_rate': 1.5457582075964817e-06, 'epoch': 1.64} {'loss': 0.7323, 'learning_rate': 1.5455833751601267e-06, 'epoch': 1.64} {'loss': 0.5912, 'learning_rate': 1.5454085517834416e-06, 'epoch': 1.64} {'loss': 0.4353, 'learning_rate': 1.5452337374666139e-06, 'epoch': 1.64} {'loss': 0.4406, 'learning_rate': 1.5450589322098307e-06, 'epoch': 1.64} {'loss': 0.6493, 'learning_rate': 1.5448841360132839e-06, 'epoch': 1.64} {'loss': 0.4629, 'learning_rate': 1.5447093488771537e-06, 'epoch': 1.64} {'loss': 0.5854, 'learning_rate': 1.5445345708016312e-06, 'epoch': 1.64} {'loss': 0.4522, 'learning_rate': 1.5443598017869022e-06, 'epoch': 1.64} {'loss': 0.563, 'learning_rate': 1.544185041833155e-06, 'epoch': 1.64} {'loss': 0.6107, 'learning_rate': 1.5440102909405774e-06, 'epoch': 1.64} {'loss': 0.4867, 'learning_rate': 1.5438355491093547e-06, 'epoch': 1.64} {'loss': 0.5215, 'learning_rate': 1.5436608163396794e-06, 'epoch': 1.64} {'loss': 0.4188, 'learning_rate': 1.5434860926317308e-06, 'epoch': 1.64} {'loss': 0.5632, 'learning_rate': 1.5433113779857011e-06, 'epoch': 1.64} {'loss': 0.5534, 'learning_rate': 1.543136672401776e-06, 'epoch': 1.64} {'loss': 0.6215, 'learning_rate': 1.542961975880144e-06, 'epoch': 1.64} {'loss': 0.6258, 'learning_rate': 1.5427872884209905e-06, 'epoch': 1.64} {'loss': 0.6088, 'learning_rate': 1.5426126100245043e-06, 'epoch': 1.64} {'loss': 0.4954, 'learning_rate': 1.5424379406908753e-06, 'epoch': 1.64} {'loss': 0.5111, 'learning_rate': 1.5422632804202842e-06, 'epoch': 1.64} {'loss': 0.5305, 'learning_rate': 1.5420886292129212e-06, 'epoch': 1.64} {'loss': 0.4068, 'learning_rate': 1.5419139870689737e-06, 'epoch': 1.64} {'loss': 0.7625, 'learning_rate': 1.5417393539886282e-06, 'epoch': 1.64} {'loss': 0.6083, 'learning_rate': 1.5415647299720726e-06, 'epoch': 1.64} {'loss': 0.6045, 'learning_rate': 1.5413901150194966e-06, 'epoch': 1.64} {'loss': 0.4815, 'learning_rate': 1.5412155091310822e-06, 'epoch': 1.64} {'loss': 0.5171, 'learning_rate': 1.541040912307019e-06, 'epoch': 1.64} {'loss': 0.6429, 'learning_rate': 1.540866324547493e-06, 'epoch': 1.64} {'loss': 0.5948, 'learning_rate': 1.5406917458526928e-06, 'epoch': 1.64} {'loss': 0.5877, 'learning_rate': 1.5405171762228054e-06, 'epoch': 1.64} {'loss': 0.4438, 'learning_rate': 1.5403426156580171e-06, 'epoch': 1.64} {'loss': 0.5182, 'learning_rate': 1.540168064158517e-06, 'epoch': 1.64} {'loss': 0.5181, 'learning_rate': 1.5399935217244889e-06, 'epoch': 1.64} {'loss': 0.5586, 'learning_rate': 1.5398189883561199e-06, 'epoch': 1.64} {'loss': 0.8047, 'learning_rate': 1.539644464053599e-06, 'epoch': 1.64} {'loss': 0.6653, 'learning_rate': 1.539469948817114e-06, 'epoch': 1.64} {'loss': 0.5044, 'learning_rate': 1.5392954426468488e-06, 'epoch': 1.64} {'loss': 0.5084, 'learning_rate': 1.5391209455429935e-06, 'epoch': 1.64} {'loss': 0.4313, 'learning_rate': 1.5389464575057355e-06, 'epoch': 1.64} {'loss': 0.5602, 'learning_rate': 1.5387719785352573e-06, 'epoch': 1.64} {'loss': 0.6336, 'learning_rate': 1.5385975086317483e-06, 'epoch': 1.64} {'loss': 0.3461, 'learning_rate': 1.5384230477953966e-06, 'epoch': 1.64} {'loss': 0.566, 'learning_rate': 1.5382485960263883e-06, 'epoch': 1.64} {'loss': 0.5553, 'learning_rate': 1.5380741533249132e-06, 'epoch': 1.64} {'loss': 0.5213, 'learning_rate': 1.5378997196911493e-06, 'epoch': 1.64} {'loss': 0.5244, 'learning_rate': 1.5377252951252953e-06, 'epoch': 1.64} {'loss': 0.525, 'learning_rate': 1.5375508796275296e-06, 'epoch': 1.64} {'loss': 0.5148, 'learning_rate': 1.5373764731980422e-06, 'epoch': 1.64} {'loss': 0.4546, 'learning_rate': 1.5372020758370198e-06, 'epoch': 1.64} {'loss': 0.5378, 'learning_rate': 1.5370276875446488e-06, 'epoch': 1.64} {'loss': 0.5145, 'learning_rate': 1.536853308321119e-06, 'epoch': 1.64} {'loss': 0.3799, 'learning_rate': 1.5366789381666102e-06, 'epoch': 1.64} {'loss': 0.5413, 'learning_rate': 1.5365045770813181e-06, 'epoch': 1.64} {'loss': 0.5163, 'learning_rate': 1.5363302250654232e-06, 'epoch': 1.64} {'loss': 0.6006, 'learning_rate': 1.5361558821191136e-06, 'epoch': 1.64} {'loss': 0.6081, 'learning_rate': 1.5359815482425777e-06, 'epoch': 1.64} {'loss': 0.5516, 'learning_rate': 1.5358072234360011e-06, 'epoch': 1.64} {'loss': 0.5716, 'learning_rate': 1.5356329076995736e-06, 'epoch': 1.64} {'loss': 0.4818, 'learning_rate': 1.535458601033475e-06, 'epoch': 1.64} {'loss': 0.4707, 'learning_rate': 1.5352843034379006e-06, 'epoch': 1.64} {'loss': 0.4254, 'learning_rate': 1.5351100149130317e-06, 'epoch': 1.64} {'loss': 0.5453, 'learning_rate': 1.5349357354590555e-06, 'epoch': 1.64} {'loss': 0.6297, 'learning_rate': 1.5347614650761622e-06, 'epoch': 1.64} {'loss': 0.5565, 'learning_rate': 1.5345872037645315e-06, 'epoch': 1.64} {'loss': 0.6106, 'learning_rate': 1.5344129515243589e-06, 'epoch': 1.64} {'loss': 0.4399, 'learning_rate': 1.534238708355822e-06, 'epoch': 1.64} {'loss': 0.5127, 'learning_rate': 1.5340644742591181e-06, 'epoch': 1.64} {'loss': 0.4809, 'learning_rate': 1.5338902492344254e-06, 'epoch': 1.64} {'loss': 0.5007, 'learning_rate': 1.5337160332819335e-06, 'epoch': 1.64} {'loss': 0.2451, 'learning_rate': 1.5335418264018309e-06, 'epoch': 1.64} {'loss': 0.5054, 'learning_rate': 1.5333676285942977e-06, 'epoch': 1.64} {'loss': 0.7338, 'learning_rate': 1.5331934398595305e-06, 'epoch': 1.64} {'loss': 0.4283, 'learning_rate': 1.5330192601977078e-06, 'epoch': 1.64} {'loss': 0.5212, 'learning_rate': 1.5328450896090196e-06, 'epoch': 1.64} {'loss': 0.4662, 'learning_rate': 1.5326709280936513e-06, 'epoch': 1.64} {'loss': 0.5203, 'learning_rate': 1.5324967756517916e-06, 'epoch': 1.64} {'loss': 0.4964, 'learning_rate': 1.5323226322836271e-06, 'epoch': 1.64} {'loss': 0.4773, 'learning_rate': 1.5321484979893397e-06, 'epoch': 1.64} {'loss': 0.5172, 'learning_rate': 1.5319743727691228e-06, 'epoch': 1.64} {'loss': 0.5904, 'learning_rate': 1.5318002566231583e-06, 'epoch': 1.64} {'loss': 0.5313, 'learning_rate': 1.5316261495516338e-06, 'epoch': 1.64} {'loss': 0.4599, 'learning_rate': 1.531452051554736e-06, 'epoch': 1.64} {'loss': 0.5462, 'learning_rate': 1.5312779626326512e-06, 'epoch': 1.64} {'loss': 0.6085, 'learning_rate': 1.5311038827855696e-06, 'epoch': 1.64} {'loss': 0.5153, 'learning_rate': 1.5309298120136696e-06, 'epoch': 1.64} {'loss': 0.4908, 'learning_rate': 1.5307557503171478e-06, 'epoch': 1.64} {'loss': 0.4458, 'learning_rate': 1.5305816976961819e-06, 'epoch': 1.64} {'loss': 0.576, 'learning_rate': 1.5304076541509637e-06, 'epoch': 1.64} {'loss': 0.3547, 'learning_rate': 1.5302336196816793e-06, 'epoch': 1.64} {'loss': 0.4497, 'learning_rate': 1.53005959428851e-06, 'epoch': 1.64} {'loss': 0.5005, 'learning_rate': 1.5298855779716504e-06, 'epoch': 1.64} {'loss': 0.4663, 'learning_rate': 1.5297115707312793e-06, 'epoch': 1.64} {'loss': 0.4535, 'learning_rate': 1.529537572567591e-06, 'epoch': 1.64} {'loss': 0.6471, 'learning_rate': 1.5293635834807652e-06, 'epoch': 1.64} {'loss': 0.4082, 'learning_rate': 1.5291896034709908e-06, 'epoch': 1.64} {'loss': 0.5474, 'learning_rate': 1.5290156325384564e-06, 'epoch': 1.64} {'loss': 0.5446, 'learning_rate': 1.528841670683341e-06, 'epoch': 1.64} {'loss': 0.5275, 'learning_rate': 1.5286677179058418e-06, 'epoch': 1.64} {'loss': 0.488, 'learning_rate': 1.5284937742061356e-06, 'epoch': 1.64} {'loss': 0.6407, 'learning_rate': 1.5283198395844169e-06, 'epoch': 1.64} {'loss': 0.4451, 'learning_rate': 1.528145914040866e-06, 'epoch': 1.64} {'loss': 0.47, 'learning_rate': 1.5279719975756713e-06, 'epoch': 1.64} {'loss': 0.5934, 'learning_rate': 1.527798090189021e-06, 'epoch': 1.64} {'loss': 0.4071, 'learning_rate': 1.5276241918810964e-06, 'epoch': 1.64} {'loss': 0.5179, 'learning_rate': 1.5274503026520903e-06, 'epoch': 1.64} {'loss': 0.517, 'learning_rate': 1.527276422502182e-06, 'epoch': 1.64} {'loss': 0.6151, 'learning_rate': 1.5271025514315662e-06, 'epoch': 1.64} {'loss': 0.6332, 'learning_rate': 1.5269286894404234e-06, 'epoch': 1.64} {'loss': 0.4802, 'learning_rate': 1.5267548365289397e-06, 'epoch': 1.64} {'loss': 0.502, 'learning_rate': 1.5265809926973063e-06, 'epoch': 1.64} {'loss': 0.57, 'learning_rate': 1.5264071579457018e-06, 'epoch': 1.64} {'loss': 0.5166, 'learning_rate': 1.5262333322743206e-06, 'epoch': 1.64} {'loss': 0.4884, 'learning_rate': 1.5260595156833424e-06, 'epoch': 1.64} {'loss': 0.4529, 'learning_rate': 1.5258857081729573e-06, 'epoch': 1.64} {'loss': 0.4023, 'learning_rate': 1.5257119097433504e-06, 'epoch': 1.64} {'loss': 0.5464, 'learning_rate': 1.5255381203947072e-06, 'epoch': 1.64} {'loss': 0.6177, 'learning_rate': 1.5253643401272179e-06, 'epoch': 1.64} {'loss': 0.3656, 'learning_rate': 1.5251905689410607e-06, 'epoch': 1.64} {'loss': 0.574, 'learning_rate': 1.5250168068364323e-06, 'epoch': 1.64} {'loss': 0.6524, 'learning_rate': 1.5248430538135095e-06, 'epoch': 1.64} {'loss': 0.5829, 'learning_rate': 1.524669309872483e-06, 'epoch': 1.64} {'loss': 0.5553, 'learning_rate': 1.5244955750135382e-06, 'epoch': 1.64} {'loss': 0.4942, 'learning_rate': 1.5243218492368617e-06, 'epoch': 1.64} {'loss': 0.4918, 'learning_rate': 1.5241481325426411e-06, 'epoch': 1.64} {'loss': 0.5383, 'learning_rate': 1.5239744249310562e-06, 'epoch': 1.65} {'loss': 0.2831, 'learning_rate': 1.5238007264023025e-06, 'epoch': 1.65} {'loss': 0.4828, 'learning_rate': 1.5236270369565587e-06, 'epoch': 1.65} {'loss': 0.6851, 'learning_rate': 1.5234533565940135e-06, 'epoch': 1.65} {'loss': 0.5797, 'learning_rate': 1.5232796853148536e-06, 'epoch': 1.65} {'loss': 0.4992, 'learning_rate': 1.5231060231192652e-06, 'epoch': 1.65} {'loss': 0.4665, 'learning_rate': 1.522932370007435e-06, 'epoch': 1.65} {'loss': 0.5342, 'learning_rate': 1.5227587259795463e-06, 'epoch': 1.65} {'loss': 0.4885, 'learning_rate': 1.5225850910357853e-06, 'epoch': 1.65} {'loss': 0.3367, 'learning_rate': 1.522411465176341e-06, 'epoch': 1.65} {'loss': 0.4448, 'learning_rate': 1.5222378484013978e-06, 'epoch': 1.65} {'loss': 0.5564, 'learning_rate': 1.5220642407111408e-06, 'epoch': 1.65} {'loss': 0.3035, 'learning_rate': 1.521890642105759e-06, 'epoch': 1.65} {'loss': 0.4302, 'learning_rate': 1.5217170525854374e-06, 'epoch': 1.65} {'loss': 0.4604, 'learning_rate': 1.5215434721503586e-06, 'epoch': 1.65} {'loss': 0.4689, 'learning_rate': 1.5213699008007121e-06, 'epoch': 1.65} {'loss': 0.5332, 'learning_rate': 1.5211963385366835e-06, 'epoch': 1.65} {'loss': 0.4251, 'learning_rate': 1.521022785358457e-06, 'epoch': 1.65} {'loss': 0.5709, 'learning_rate': 1.52084924126622e-06, 'epoch': 1.65} {'loss': 0.5303, 'learning_rate': 1.5206757062601597e-06, 'epoch': 1.65} {'loss': 0.6112, 'learning_rate': 1.5205021803404619e-06, 'epoch': 1.65} {'loss': 0.6234, 'learning_rate': 1.520328663507309e-06, 'epoch': 1.65} {'loss': 0.4599, 'learning_rate': 1.5201551557608896e-06, 'epoch': 1.65} {'loss': 0.5923, 'learning_rate': 1.5199816571013893e-06, 'epoch': 1.65} {'loss': 0.5348, 'learning_rate': 1.5198081675289934e-06, 'epoch': 1.65} {'loss': 0.4014, 'learning_rate': 1.5196346870438894e-06, 'epoch': 1.65} {'loss': 0.4536, 'learning_rate': 1.519461215646264e-06, 'epoch': 1.65} {'loss': 0.3817, 'learning_rate': 1.5192877533362993e-06, 'epoch': 1.65} {'loss': 0.5978, 'learning_rate': 1.5191143001141828e-06, 'epoch': 1.65} {'loss': 0.4016, 'learning_rate': 1.518940855980101e-06, 'epoch': 1.65} {'loss': 0.5284, 'learning_rate': 1.5187674209342396e-06, 'epoch': 1.65} {'loss': 0.4625, 'learning_rate': 1.5185939949767835e-06, 'epoch': 1.65} {'loss': 0.5044, 'learning_rate': 1.518420578107921e-06, 'epoch': 1.65} {'loss': 0.6258, 'learning_rate': 1.5182471703278379e-06, 'epoch': 1.65} {'loss': 0.5004, 'learning_rate': 1.5180737716367155e-06, 'epoch': 1.65} {'loss': 0.5826, 'learning_rate': 1.5179003820347438e-06, 'epoch': 1.65} {'loss': 0.4472, 'learning_rate': 1.5177270015221068e-06, 'epoch': 1.65} {'loss': 0.5425, 'learning_rate': 1.5175536300989913e-06, 'epoch': 1.65} {'loss': 0.4549, 'learning_rate': 1.5173802677655848e-06, 'epoch': 1.65} {'loss': 0.3838, 'learning_rate': 1.517206914522068e-06, 'epoch': 1.65} {'loss': 0.5517, 'learning_rate': 1.51703357036863e-06, 'epoch': 1.65} {'loss': 0.5077, 'learning_rate': 1.5168602353054563e-06, 'epoch': 1.65} {'loss': 0.543, 'learning_rate': 1.516686909332732e-06, 'epoch': 1.65} {'loss': 0.5833, 'learning_rate': 1.5165135924506446e-06, 'epoch': 1.65} {'loss': 0.5, 'learning_rate': 1.5163402846593777e-06, 'epoch': 1.65} {'loss': 0.5649, 'learning_rate': 1.51616698595912e-06, 'epoch': 1.65} {'loss': 0.5997, 'learning_rate': 1.5159936963500533e-06, 'epoch': 1.65} {'loss': 0.4607, 'learning_rate': 1.5158204158323642e-06, 'epoch': 1.65} {'loss': 0.5791, 'learning_rate': 1.5156471444062405e-06, 'epoch': 1.65} {'loss': 0.611, 'learning_rate': 1.515473882071865e-06, 'epoch': 1.65} {'loss': 0.4447, 'learning_rate': 1.515300628829427e-06, 'epoch': 1.65} {'loss': 0.4369, 'learning_rate': 1.5151273846791092e-06, 'epoch': 1.65} {'loss': 0.5532, 'learning_rate': 1.5149541496211006e-06, 'epoch': 1.65} {'loss': 0.4985, 'learning_rate': 1.5147809236555821e-06, 'epoch': 1.65} {'loss': 0.5531, 'learning_rate': 1.5146077067827413e-06, 'epoch': 1.65} {'loss': 0.5054, 'learning_rate': 1.5144344990027649e-06, 'epoch': 1.65} {'loss': 0.4364, 'learning_rate': 1.5142613003158368e-06, 'epoch': 1.65} {'loss': 0.5799, 'learning_rate': 1.5140881107221472e-06, 'epoch': 1.65} {'loss': 0.5058, 'learning_rate': 1.5139149302218726e-06, 'epoch': 1.65} {'loss': 0.4747, 'learning_rate': 1.5137417588152092e-06, 'epoch': 1.65} {'loss': 0.3644, 'learning_rate': 1.513568596502334e-06, 'epoch': 1.65} {'loss': 0.3977, 'learning_rate': 1.5133954432834374e-06, 'epoch': 1.65} {'loss': 0.4785, 'learning_rate': 1.5132222991587031e-06, 'epoch': 1.65} {'loss': 0.4109, 'learning_rate': 1.5130491641283162e-06, 'epoch': 1.65} {'loss': 0.6502, 'learning_rate': 1.5128760381924667e-06, 'epoch': 1.65} {'loss': 0.425, 'learning_rate': 1.512702921351331e-06, 'epoch': 1.65} {'loss': 0.4347, 'learning_rate': 1.512529813605106e-06, 'epoch': 1.65} {'loss': 0.5101, 'learning_rate': 1.5123567149539675e-06, 'epoch': 1.65} {'loss': 0.4247, 'learning_rate': 1.512183625398106e-06, 'epoch': 1.65} {'loss': 0.5086, 'learning_rate': 1.5120105449377053e-06, 'epoch': 1.65} {'loss': 0.5662, 'learning_rate': 1.5118374735729513e-06, 'epoch': 1.65} {'loss': 0.4788, 'learning_rate': 1.5116644113040323e-06, 'epoch': 1.65} {'loss': 0.5894, 'learning_rate': 1.5114913581311263e-06, 'epoch': 1.65} {'loss': 0.4202, 'learning_rate': 1.5113183140544274e-06, 'epoch': 1.65} {'loss': 0.6132, 'learning_rate': 1.5111452790741154e-06, 'epoch': 1.65} {'loss': 0.5331, 'learning_rate': 1.510972253190377e-06, 'epoch': 1.65} {'loss': 0.484, 'learning_rate': 1.5107992364034007e-06, 'epoch': 1.65} {'loss': 0.5871, 'learning_rate': 1.5106262287133644e-06, 'epoch': 1.65} {'loss': 0.5575, 'learning_rate': 1.5104532301204633e-06, 'epoch': 1.65} {'loss': 0.5197, 'learning_rate': 1.5102802406248728e-06, 'epoch': 1.65} {'loss': 0.6073, 'learning_rate': 1.5101072602267887e-06, 'epoch': 1.65} {'loss': 0.5131, 'learning_rate': 1.5099342889263868e-06, 'epoch': 1.65} {'loss': 0.575, 'learning_rate': 1.5097613267238577e-06, 'epoch': 1.65} {'loss': 0.5142, 'learning_rate': 1.5095883736193884e-06, 'epoch': 1.65} {'loss': 0.5098, 'learning_rate': 1.5094154296131558e-06, 'epoch': 1.65} {'loss': 0.4833, 'learning_rate': 1.5092424947053564e-06, 'epoch': 1.65} {'loss': 0.6146, 'learning_rate': 1.5090695688961653e-06, 'epoch': 1.65} {'loss': 0.4134, 'learning_rate': 1.5088966521857761e-06, 'epoch': 1.65} {'loss': 0.5375, 'learning_rate': 1.5087237445743697e-06, 'epoch': 1.65} {'loss': 0.5162, 'learning_rate': 1.5085508460621312e-06, 'epoch': 1.65} {'loss': 0.5834, 'learning_rate': 1.5083779566492496e-06, 'epoch': 1.65} {'loss': 0.652, 'learning_rate': 1.5082050763359024e-06, 'epoch': 1.65} {'loss': 0.5163, 'learning_rate': 1.5080322051222851e-06, 'epoch': 1.65} {'loss': 0.5463, 'learning_rate': 1.507859343008573e-06, 'epoch': 1.65} {'loss': 0.4597, 'learning_rate': 1.5076864899949607e-06, 'epoch': 1.65} {'loss': 0.3967, 'learning_rate': 1.5075136460816253e-06, 'epoch': 1.65} {'loss': 0.6098, 'learning_rate': 1.507340811268757e-06, 'epoch': 1.65} {'loss': 0.3932, 'learning_rate': 1.5071679855565413e-06, 'epoch': 1.65} {'loss': 0.4499, 'learning_rate': 1.5069951689451568e-06, 'epoch': 1.65} {'loss': 0.6364, 'learning_rate': 1.5068223614347988e-06, 'epoch': 1.65} {'loss': 0.4871, 'learning_rate': 1.5066495630256416e-06, 'epoch': 1.65} {'loss': 0.4824, 'learning_rate': 1.506476773717882e-06, 'epoch': 1.65} {'loss': 0.2994, 'learning_rate': 1.5063039935116952e-06, 'epoch': 1.65} {'loss': 0.4884, 'learning_rate': 1.506131222407271e-06, 'epoch': 1.65} {'loss': 0.5888, 'learning_rate': 1.5059584604047961e-06, 'epoch': 1.65} {'loss': 0.5477, 'learning_rate': 1.5057857075044492e-06, 'epoch': 1.65} {'loss': 0.5438, 'learning_rate': 1.5056129637064244e-06, 'epoch': 1.65} {'loss': 0.4413, 'learning_rate': 1.5054402290108983e-06, 'epoch': 1.65} {'loss': 0.4544, 'learning_rate': 1.505267503418061e-06, 'epoch': 1.65} {'loss': 0.4819, 'learning_rate': 1.5050947869280952e-06, 'epoch': 1.65} {'loss': 0.4136, 'learning_rate': 1.504922079541188e-06, 'epoch': 1.65} {'loss': 0.6505, 'learning_rate': 1.5047493812575254e-06, 'epoch': 1.65} {'loss': 0.4833, 'learning_rate': 1.5045766920772853e-06, 'epoch': 1.65} {'loss': 0.7074, 'learning_rate': 1.5044040120006631e-06, 'epoch': 1.65} {'loss': 0.5252, 'learning_rate': 1.5042313410278375e-06, 'epoch': 1.65} {'loss': 0.4446, 'learning_rate': 1.5040586791589939e-06, 'epoch': 1.65} {'loss': 0.4247, 'learning_rate': 1.5038860263943178e-06, 'epoch': 1.65} {'loss': 0.4647, 'learning_rate': 1.5037133827339955e-06, 'epoch': 1.65} {'loss': 0.5342, 'learning_rate': 1.5035407481782127e-06, 'epoch': 1.65} {'loss': 0.3893, 'learning_rate': 1.503368122727149e-06, 'epoch': 1.65} {'loss': 0.351, 'learning_rate': 1.5031955063809978e-06, 'epoch': 1.65} {'loss': 0.5281, 'learning_rate': 1.5030228991399364e-06, 'epoch': 1.65} {'loss': 0.6093, 'learning_rate': 1.5028503010041529e-06, 'epoch': 1.65} {'loss': 0.5303, 'learning_rate': 1.5026777119738356e-06, 'epoch': 1.65} {'loss': 0.43, 'learning_rate': 1.50250513204916e-06, 'epoch': 1.65} {'loss': 0.5804, 'learning_rate': 1.502332561230323e-06, 'epoch': 1.65} {'loss': 0.5237, 'learning_rate': 1.5021599995175008e-06, 'epoch': 1.65} {'loss': 0.5047, 'learning_rate': 1.5019874469108808e-06, 'epoch': 1.65} {'loss': 0.5653, 'learning_rate': 1.501814903410649e-06, 'epoch': 1.65} {'loss': 0.5946, 'learning_rate': 1.501642369016989e-06, 'epoch': 1.65} {'loss': 0.5754, 'learning_rate': 1.501469843730089e-06, 'epoch': 1.65} {'loss': 0.515, 'learning_rate': 1.5012973275501264e-06, 'epoch': 1.65} {'loss': 0.5629, 'learning_rate': 1.5011248204772943e-06, 'epoch': 1.65} {'loss': 0.4232, 'learning_rate': 1.5009523225117728e-06, 'epoch': 1.65} {'loss': 0.4668, 'learning_rate': 1.5007798336537482e-06, 'epoch': 1.65} {'loss': 0.4458, 'learning_rate': 1.5006073539034038e-06, 'epoch': 1.65} {'loss': 0.6605, 'learning_rate': 1.5004348832609273e-06, 'epoch': 1.65} {'loss': 0.5498, 'learning_rate': 1.5002624217265038e-06, 'epoch': 1.65} {'loss': 0.536, 'learning_rate': 1.5000899693003113e-06, 'epoch': 1.65} {'loss': 0.454, 'learning_rate': 1.4999175259825438e-06, 'epoch': 1.65} {'loss': 0.5056, 'learning_rate': 1.4997450917733803e-06, 'epoch': 1.65} {'loss': 0.6127, 'learning_rate': 1.499572666673007e-06, 'epoch': 1.65} {'loss': 0.5096, 'learning_rate': 1.4994002506816085e-06, 'epoch': 1.65} {'loss': 0.4803, 'learning_rate': 1.49922784379937e-06, 'epoch': 1.65} {'loss': 0.6085, 'learning_rate': 1.4990554460264784e-06, 'epoch': 1.65} {'loss': 0.5535, 'learning_rate': 1.4988830573631141e-06, 'epoch': 1.65} {'loss': 0.425, 'learning_rate': 1.4987106778094628e-06, 'epoch': 1.65} {'loss': 0.557, 'learning_rate': 1.4985383073657112e-06, 'epoch': 1.65} {'loss': 0.5177, 'learning_rate': 1.4983659460320433e-06, 'epoch': 1.65} {'loss': 0.5364, 'learning_rate': 1.4981935938086434e-06, 'epoch': 1.65} {'loss': 0.4862, 'learning_rate': 1.498021250695696e-06, 'epoch': 1.65} {'loss': 0.5034, 'learning_rate': 1.4978489166933897e-06, 'epoch': 1.65} {'loss': 0.4251, 'learning_rate': 1.4976765918019022e-06, 'epoch': 1.65} {'loss': 0.6494, 'learning_rate': 1.497504276021422e-06, 'epoch': 1.65} {'loss': 0.5979, 'learning_rate': 1.4973319693521326e-06, 'epoch': 1.65} {'loss': 0.4146, 'learning_rate': 1.4971596717942204e-06, 'epoch': 1.65} {'loss': 0.4363, 'learning_rate': 1.4969873833478687e-06, 'epoch': 1.65} {'loss': 0.4752, 'learning_rate': 1.4968151040132628e-06, 'epoch': 1.65} {'loss': 0.4325, 'learning_rate': 1.4966428337905893e-06, 'epoch': 1.65} {'loss': 0.5033, 'learning_rate': 1.4964705726800277e-06, 'epoch': 1.65} {'loss': 0.4277, 'learning_rate': 1.496298320681765e-06, 'epoch': 1.65} {'loss': 0.5242, 'learning_rate': 1.4961260777959863e-06, 'epoch': 1.65} {'loss': 0.5591, 'learning_rate': 1.4959538440228771e-06, 'epoch': 1.65} {'loss': 0.4762, 'learning_rate': 1.4957816193626195e-06, 'epoch': 1.65} {'loss': 0.5903, 'learning_rate': 1.4956094038154022e-06, 'epoch': 1.65} {'loss': 0.4668, 'learning_rate': 1.4954371973814052e-06, 'epoch': 1.65} {'loss': 0.525, 'learning_rate': 1.4952650000608148e-06, 'epoch': 1.65} {'loss': 0.6706, 'learning_rate': 1.4950928118538155e-06, 'epoch': 1.65} {'loss': 0.5652, 'learning_rate': 1.4949206327605915e-06, 'epoch': 1.65} {'loss': 0.486, 'learning_rate': 1.494748462781328e-06, 'epoch': 1.65} {'loss': 0.4726, 'learning_rate': 1.4945763019162086e-06, 'epoch': 1.65} {'loss': 0.644, 'learning_rate': 1.4944041501654216e-06, 'epoch': 1.65} {'loss': 0.579, 'learning_rate': 1.494232007529145e-06, 'epoch': 1.65} {'loss': 0.5364, 'learning_rate': 1.4940598740075673e-06, 'epoch': 1.65} {'loss': 0.4944, 'learning_rate': 1.493887749600872e-06, 'epoch': 1.65} {'loss': 0.5411, 'learning_rate': 1.493715634309243e-06, 'epoch': 1.65} {'loss': 0.5211, 'learning_rate': 1.493543528132866e-06, 'epoch': 1.65} {'loss': 0.5312, 'learning_rate': 1.493371431071925e-06, 'epoch': 1.65} {'loss': 0.4062, 'learning_rate': 1.4931993431266056e-06, 'epoch': 1.65} {'loss': 0.4412, 'learning_rate': 1.49302726429709e-06, 'epoch': 1.65} {'loss': 0.5293, 'learning_rate': 1.4928551945835623e-06, 'epoch': 1.65} {'loss': 0.4849, 'learning_rate': 1.4926831339862092e-06, 'epoch': 1.65} {'loss': 0.5216, 'learning_rate': 1.4925110825052125e-06, 'epoch': 1.65} {'loss': 0.4307, 'learning_rate': 1.492339040140761e-06, 'epoch': 1.65} {'loss': 0.4155, 'learning_rate': 1.4921670068930328e-06, 'epoch': 1.65} {'loss': 0.701, 'learning_rate': 1.4919949827622181e-06, 'epoch': 1.65} {'loss': 0.4266, 'learning_rate': 1.4918229677484974e-06, 'epoch': 1.65} {'loss': 0.758, 'learning_rate': 1.4916509618520568e-06, 'epoch': 1.65} {'loss': 0.4629, 'learning_rate': 1.4914789650730787e-06, 'epoch': 1.65} {'loss': 0.4484, 'learning_rate': 1.4913069774117495e-06, 'epoch': 1.65} {'loss': 0.5607, 'learning_rate': 1.4911349988682555e-06, 'epoch': 1.65} {'loss': 0.3948, 'learning_rate': 1.4909630294427757e-06, 'epoch': 1.65} {'loss': 0.4669, 'learning_rate': 1.4907910691354976e-06, 'epoch': 1.65} {'loss': 0.4866, 'learning_rate': 1.4906191179466046e-06, 'epoch': 1.65} {'loss': 0.3961, 'learning_rate': 1.4904471758762807e-06, 'epoch': 1.65} {'loss': 0.5287, 'learning_rate': 1.4902752429247102e-06, 'epoch': 1.65} {'loss': 0.3783, 'learning_rate': 1.4901033190920788e-06, 'epoch': 1.65} {'loss': 0.5037, 'learning_rate': 1.4899314043785718e-06, 'epoch': 1.65} {'loss': 0.3815, 'learning_rate': 1.48975949878437e-06, 'epoch': 1.65} {'loss': 0.4507, 'learning_rate': 1.489587602309658e-06, 'epoch': 1.65} {'loss': 0.592, 'learning_rate': 1.4894157149546207e-06, 'epoch': 1.65} {'loss': 0.4059, 'learning_rate': 1.4892438367194427e-06, 'epoch': 1.65} {'loss': 0.5299, 'learning_rate': 1.489071967604311e-06, 'epoch': 1.65} {'loss': 0.4028, 'learning_rate': 1.4889001076094022e-06, 'epoch': 1.65} {'loss': 0.4195, 'learning_rate': 1.4887282567349093e-06, 'epoch': 1.65} {'loss': 0.4767, 'learning_rate': 1.4885564149810095e-06, 'epoch': 1.65} {'loss': 0.4221, 'learning_rate': 1.4883845823478904e-06, 'epoch': 1.65} {'loss': 0.3483, 'learning_rate': 1.4882127588357353e-06, 'epoch': 1.65} {'loss': 0.5719, 'learning_rate': 1.4880409444447286e-06, 'epoch': 1.65} {'loss': 0.4961, 'learning_rate': 1.4878691391750567e-06, 'epoch': 1.65} {'loss': 0.5821, 'learning_rate': 1.487697343026897e-06, 'epoch': 1.65} {'loss': 0.4428, 'learning_rate': 1.487525556000442e-06, 'epoch': 1.65} {'loss': 0.4796, 'learning_rate': 1.487353778095869e-06, 'epoch': 1.65} {'loss': 0.4992, 'learning_rate': 1.487182009313365e-06, 'epoch': 1.65} {'loss': 0.6926, 'learning_rate': 1.487010249653116e-06, 'epoch': 1.65} {'loss': 0.4087, 'learning_rate': 1.4868384991152995e-06, 'epoch': 1.65} {'loss': 0.4738, 'learning_rate': 1.4866667577001082e-06, 'epoch': 1.65} {'loss': 0.5138, 'learning_rate': 1.4864950254077182e-06, 'epoch': 1.65} {'loss': 0.4393, 'learning_rate': 1.4863233022383207e-06, 'epoch': 1.65} {'loss': 0.5204, 'learning_rate': 1.486151588192094e-06, 'epoch': 1.65} {'loss': 0.4734, 'learning_rate': 1.4859798832692252e-06, 'epoch': 1.65} {'loss': 0.5516, 'learning_rate': 1.4858081874698983e-06, 'epoch': 1.65} {'loss': 0.3378, 'learning_rate': 1.485636500794293e-06, 'epoch': 1.65} {'loss': 0.5996, 'learning_rate': 1.4854648232426006e-06, 'epoch': 1.65} {'loss': 0.4683, 'learning_rate': 1.4852931548149962e-06, 'epoch': 1.65} {'loss': 0.5828, 'learning_rate': 1.4851214955116743e-06, 'epoch': 1.65} {'loss': 0.5671, 'learning_rate': 1.4849498453328103e-06, 'epoch': 1.65} {'loss': 0.4652, 'learning_rate': 1.4847782042785907e-06, 'epoch': 1.65} {'loss': 0.4902, 'learning_rate': 1.4846065723492032e-06, 'epoch': 1.65} {'loss': 0.4245, 'learning_rate': 1.484434949544823e-06, 'epoch': 1.65} {'loss': 0.5789, 'learning_rate': 1.4842633358656444e-06, 'epoch': 1.65} {'loss': 0.3885, 'learning_rate': 1.4840917313118408e-06, 'epoch': 1.65} {'loss': 0.5854, 'learning_rate': 1.4839201358836063e-06, 'epoch': 1.65} {'loss': 0.4639, 'learning_rate': 1.4837485495811187e-06, 'epoch': 1.65} {'loss': 0.5352, 'learning_rate': 1.4835769724045624e-06, 'epoch': 1.65} {'loss': 0.4089, 'learning_rate': 1.4834054043541245e-06, 'epoch': 1.65} {'loss': 0.3724, 'learning_rate': 1.4832338454299811e-06, 'epoch': 1.65} {'loss': 0.4501, 'learning_rate': 1.483062295632327e-06, 'epoch': 1.65} {'loss': 0.4954, 'learning_rate': 1.4828907549613347e-06, 'epoch': 1.65} {'loss': 0.538, 'learning_rate': 1.4827192234171995e-06, 'epoch': 1.65} {'loss': 0.4292, 'learning_rate': 1.4825477010000954e-06, 'epoch': 1.65} {'loss': 0.447, 'learning_rate': 1.4823761877102116e-06, 'epoch': 1.65} {'loss': 0.5254, 'learning_rate': 1.482204683547732e-06, 'epoch': 1.65} {'loss': 0.4806, 'learning_rate': 1.4820331885128347e-06, 'epoch': 1.65} {'loss': 0.4392, 'learning_rate': 1.4818617026057126e-06, 'epoch': 1.65} {'loss': 0.4305, 'learning_rate': 1.4816902258265398e-06, 'epoch': 1.65} {'loss': 0.5612, 'learning_rate': 1.4815187581755086e-06, 'epoch': 1.65} {'loss': 0.3964, 'learning_rate': 1.4813472996527967e-06, 'epoch': 1.65} {'loss': 0.4416, 'learning_rate': 1.4811758502585904e-06, 'epoch': 1.65} {'loss': 0.3484, 'learning_rate': 1.4810044099930753e-06, 'epoch': 1.65} {'loss': 0.4103, 'learning_rate': 1.4808329788564279e-06, 'epoch': 1.65} {'loss': 0.5901, 'learning_rate': 1.4806615568488426e-06, 'epoch': 1.65} {'loss': 0.4749, 'learning_rate': 1.4804901439704933e-06, 'epoch': 1.65} {'loss': 0.6587, 'learning_rate': 1.480318740221569e-06, 'epoch': 1.65} {'loss': 0.4736, 'learning_rate': 1.480147345602252e-06, 'epoch': 1.65} {'loss': 0.5336, 'learning_rate': 1.4799759601127262e-06, 'epoch': 1.65} {'loss': 0.6882, 'learning_rate': 1.4798045837531773e-06, 'epoch': 1.65} {'loss': 0.4984, 'learning_rate': 1.4796332165237814e-06, 'epoch': 1.65} {'loss': 0.733, 'learning_rate': 1.4794618584247323e-06, 'epoch': 1.65} {'loss': 0.5829, 'learning_rate': 1.479290509456207e-06, 'epoch': 1.65} {'loss': 0.6108, 'learning_rate': 1.4791191696183916e-06, 'epoch': 1.65} {'loss': 0.5414, 'learning_rate': 1.4789478389114687e-06, 'epoch': 1.65} {'loss': 0.4258, 'learning_rate': 1.4787765173356217e-06, 'epoch': 1.65} {'loss': 0.5088, 'learning_rate': 1.478605204891037e-06, 'epoch': 1.65} {'loss': 0.5369, 'learning_rate': 1.4784339015778916e-06, 'epoch': 1.65} {'loss': 0.6233, 'learning_rate': 1.478262607396378e-06, 'epoch': 1.65} {'loss': 0.5352, 'learning_rate': 1.4780913223466732e-06, 'epoch': 1.65} {'loss': 0.5338, 'learning_rate': 1.4779200464289622e-06, 'epoch': 1.65} {'loss': 0.424, 'learning_rate': 1.4777487796434288e-06, 'epoch': 1.65} {'loss': 0.6068, 'learning_rate': 1.4775775219902577e-06, 'epoch': 1.65} {'loss': 0.3554, 'learning_rate': 1.4774062734696336e-06, 'epoch': 1.65} {'loss': 0.4215, 'learning_rate': 1.4772350340817343e-06, 'epoch': 1.65} {'loss': 0.6647, 'learning_rate': 1.477063803826748e-06, 'epoch': 1.65} {'loss': 0.4202, 'learning_rate': 1.4768925827048574e-06, 'epoch': 1.65} {'loss': 0.3883, 'learning_rate': 1.4767213707162453e-06, 'epoch': 1.65} {'loss': 0.5172, 'learning_rate': 1.476550167861095e-06, 'epoch': 1.65} {'loss': 0.4735, 'learning_rate': 1.4763789741395907e-06, 'epoch': 1.65} {'loss': 0.3843, 'learning_rate': 1.476207789551919e-06, 'epoch': 1.65} {'loss': 0.4662, 'learning_rate': 1.4760366140982562e-06, 'epoch': 1.65} {'loss': 0.463, 'learning_rate': 1.4758654477787903e-06, 'epoch': 1.65} {'loss': 0.5435, 'learning_rate': 1.4756942905937033e-06, 'epoch': 1.65} {'loss': 0.5858, 'learning_rate': 1.4755231425431804e-06, 'epoch': 1.65} {'loss': 0.4732, 'learning_rate': 1.4753520036274049e-06, 'epoch': 1.65} {'loss': 0.38, 'learning_rate': 1.4751808738465544e-06, 'epoch': 1.65} {'loss': 0.4479, 'learning_rate': 1.4750097532008234e-06, 'epoch': 1.65} {'loss': 0.5161, 'learning_rate': 1.4748386416903847e-06, 'epoch': 1.65} {'loss': 0.4652, 'learning_rate': 1.4746675393154263e-06, 'epoch': 1.65} {'loss': 0.6032, 'learning_rate': 1.4744964460761314e-06, 'epoch': 1.65} {'loss': 0.4877, 'learning_rate': 1.4743253619726827e-06, 'epoch': 1.65} {'loss': 0.5831, 'learning_rate': 1.4741542870052672e-06, 'epoch': 1.65} {'loss': 0.4959, 'learning_rate': 1.4739832211740613e-06, 'epoch': 1.65} {'loss': 0.469, 'learning_rate': 1.4738121644792524e-06, 'epoch': 1.65} {'loss': 0.4994, 'learning_rate': 1.473641116921024e-06, 'epoch': 1.65} {'loss': 0.3641, 'learning_rate': 1.473470078499558e-06, 'epoch': 1.65} {'loss': 0.5717, 'learning_rate': 1.473299049215038e-06, 'epoch': 1.65} {'loss': 0.5376, 'learning_rate': 1.4731280290676475e-06, 'epoch': 1.65} {'loss': 0.5775, 'learning_rate': 1.4729570180575735e-06, 'epoch': 1.65} {'loss': 0.5059, 'learning_rate': 1.4727860161849926e-06, 'epoch': 1.65} {'loss': 0.4535, 'learning_rate': 1.4726150234500914e-06, 'epoch': 1.65} {'loss': 0.5452, 'learning_rate': 1.4724440398530527e-06, 'epoch': 1.65} {'loss': 0.4387, 'learning_rate': 1.4722730653940587e-06, 'epoch': 1.65} {'loss': 0.5579, 'learning_rate': 1.4721021000732949e-06, 'epoch': 1.65} {'loss': 0.6428, 'learning_rate': 1.4719311438909455e-06, 'epoch': 1.65} {'loss': 0.5332, 'learning_rate': 1.4717601968471895e-06, 'epoch': 1.65} {'loss': 0.5089, 'learning_rate': 1.4715892589422122e-06, 'epoch': 1.65} {'loss': 0.5364, 'learning_rate': 1.4714183301761975e-06, 'epoch': 1.65} {'loss': 0.3681, 'learning_rate': 1.471247410549327e-06, 'epoch': 1.65} {'loss': 0.6022, 'learning_rate': 1.4710765000617844e-06, 'epoch': 1.65} {'loss': 0.4786, 'learning_rate': 1.4709055987137533e-06, 'epoch': 1.65} {'loss': 0.3766, 'learning_rate': 1.470734706505419e-06, 'epoch': 1.65} {'loss': 0.3744, 'learning_rate': 1.470563823436959e-06, 'epoch': 1.65} {'loss': 0.4838, 'learning_rate': 1.4703929495085612e-06, 'epoch': 1.65} {'loss': 0.4803, 'learning_rate': 1.4702220847204064e-06, 'epoch': 1.65} {'loss': 0.4512, 'learning_rate': 1.4700512290726787e-06, 'epoch': 1.65} {'loss': 0.5274, 'learning_rate': 1.4698803825655617e-06, 'epoch': 1.65} {'loss': 0.2768, 'learning_rate': 1.469709545199237e-06, 'epoch': 1.65} {'loss': 0.5385, 'learning_rate': 1.4695387169738907e-06, 'epoch': 1.65} {'loss': 0.449, 'learning_rate': 1.4693678978897007e-06, 'epoch': 1.65} {'loss': 0.609, 'learning_rate': 1.4691970879468543e-06, 'epoch': 1.65} {'loss': 0.5726, 'learning_rate': 1.469026287145532e-06, 'epoch': 1.65} {'loss': 0.493, 'learning_rate': 1.4688554954859191e-06, 'epoch': 1.65} {'loss': 0.5318, 'learning_rate': 1.4686847129681991e-06, 'epoch': 1.65} {'loss': 0.4588, 'learning_rate': 1.4685139395925485e-06, 'epoch': 1.65} {'loss': 0.5948, 'learning_rate': 1.4683431753591604e-06, 'epoch': 1.65} {'loss': 0.6417, 'learning_rate': 1.4681724202682101e-06, 'epoch': 1.65} {'loss': 0.4742, 'learning_rate': 1.4680016743198834e-06, 'epoch': 1.65} {'loss': 0.5161, 'learning_rate': 1.467830937514363e-06, 'epoch': 1.65} {'loss': 0.6232, 'learning_rate': 1.467660209851831e-06, 'epoch': 1.65} {'loss': 0.5465, 'learning_rate': 1.4674894913324744e-06, 'epoch': 1.65} {'loss': 0.605, 'learning_rate': 1.4673187819564683e-06, 'epoch': 1.65} {'loss': 0.299, 'learning_rate': 1.4671480817240047e-06, 'epoch': 1.65} {'loss': 0.6354, 'learning_rate': 1.466977390635259e-06, 'epoch': 1.65} {'loss': 0.4019, 'learning_rate': 1.466806708690418e-06, 'epoch': 1.65} {'loss': 0.3443, 'learning_rate': 1.4666360358896637e-06, 'epoch': 1.65} {'loss': 0.52, 'learning_rate': 1.4664653722331789e-06, 'epoch': 1.65} {'loss': 0.4534, 'learning_rate': 1.4662947177211484e-06, 'epoch': 1.65} {'loss': 0.5157, 'learning_rate': 1.4661240723537494e-06, 'epoch': 1.65} {'loss': 0.6215, 'learning_rate': 1.4659534361311733e-06, 'epoch': 1.65} {'loss': 0.6572, 'learning_rate': 1.4657828090535964e-06, 'epoch': 1.65} {'loss': 0.3925, 'learning_rate': 1.4656121911212029e-06, 'epoch': 1.65} {'loss': 0.5056, 'learning_rate': 1.4654415823341783e-06, 'epoch': 1.65} {'loss': 0.4896, 'learning_rate': 1.4652709826926993e-06, 'epoch': 1.65} {'loss': 0.6312, 'learning_rate': 1.4651003921969575e-06, 'epoch': 1.65} {'loss': 0.4482, 'learning_rate': 1.4649298108471256e-06, 'epoch': 1.65} {'loss': 0.4193, 'learning_rate': 1.4647592386433962e-06, 'epoch': 1.65} {'loss': 0.4144, 'learning_rate': 1.4645886755859463e-06, 'epoch': 1.65} {'loss': 0.5752, 'learning_rate': 1.4644181216749598e-06, 'epoch': 1.65} {'loss': 0.4965, 'learning_rate': 1.4642475769106213e-06, 'epoch': 1.65} {'loss': 0.3904, 'learning_rate': 1.4640770412931083e-06, 'epoch': 1.65} {'loss': 0.5929, 'learning_rate': 1.4639065148226106e-06, 'epoch': 1.65} {'loss': 0.5117, 'learning_rate': 1.463735997499306e-06, 'epoch': 1.65} {'loss': 0.395, 'learning_rate': 1.4635654893233787e-06, 'epoch': 1.65} {'loss': 0.4771, 'learning_rate': 1.4633949902950106e-06, 'epoch': 1.65} {'loss': 0.411, 'learning_rate': 1.4632245004143863e-06, 'epoch': 1.65} {'loss': 0.5065, 'learning_rate': 1.463054019681689e-06, 'epoch': 1.65} {'loss': 0.5475, 'learning_rate': 1.462883548097096e-06, 'epoch': 1.65} {'loss': 0.4546, 'learning_rate': 1.4627130856607974e-06, 'epoch': 1.65} {'loss': 0.5636, 'learning_rate': 1.4625426323729709e-06, 'epoch': 1.65} {'loss': 0.5627, 'learning_rate': 1.4623721882338005e-06, 'epoch': 1.65} {'loss': 0.3942, 'learning_rate': 1.4622017532434685e-06, 'epoch': 1.65} {'loss': 0.5325, 'learning_rate': 1.462031327402158e-06, 'epoch': 1.65} {'loss': 0.4127, 'learning_rate': 1.4618609107100533e-06, 'epoch': 1.65} {'loss': 0.3488, 'learning_rate': 1.4616905031673312e-06, 'epoch': 1.65} {'loss': 0.471, 'learning_rate': 1.4615201047741834e-06, 'epoch': 1.65} {'loss': 0.5296, 'learning_rate': 1.4613497155307842e-06, 'epoch': 1.65} {'loss': 0.5578, 'learning_rate': 1.4611793354373193e-06, 'epoch': 1.65} {'loss': 0.5211, 'learning_rate': 1.4610089644939752e-06, 'epoch': 1.65} {'loss': 0.6996, 'learning_rate': 1.4608386027009247e-06, 'epoch': 1.65} {'loss': 0.5418, 'learning_rate': 1.4606682500583613e-06, 'epoch': 1.65} {'loss': 0.5242, 'learning_rate': 1.4604979065664582e-06, 'epoch': 1.65} {'loss': 0.4231, 'learning_rate': 1.4603275722254074e-06, 'epoch': 1.65} {'loss': 0.4478, 'learning_rate': 1.4601572470353831e-06, 'epoch': 1.65} {'loss': 0.4696, 'learning_rate': 1.459986930996572e-06, 'epoch': 1.65} {'loss': 0.4763, 'learning_rate': 1.459816624109157e-06, 'epoch': 1.65} {'loss': 0.4709, 'learning_rate': 1.4596463263733153e-06, 'epoch': 1.65} {'loss': 0.6563, 'learning_rate': 1.4594760377892382e-06, 'epoch': 1.65} {'loss': 0.6763, 'learning_rate': 1.459305758357098e-06, 'epoch': 1.65} {'loss': 0.5552, 'learning_rate': 1.459135488077087e-06, 'epoch': 1.65} {'loss': 0.4584, 'learning_rate': 1.4589652269493814e-06, 'epoch': 1.65} {'loss': 0.537, 'learning_rate': 1.458794974974166e-06, 'epoch': 1.65} {'loss': 0.5093, 'learning_rate': 1.4586247321516244e-06, 'epoch': 1.65} {'loss': 0.5586, 'learning_rate': 1.4584544984819327e-06, 'epoch': 1.65} {'loss': 0.4302, 'learning_rate': 1.4582842739652824e-06, 'epoch': 1.65} {'loss': 0.5063, 'learning_rate': 1.4581140586018472e-06, 'epoch': 1.65} {'loss': 0.5472, 'learning_rate': 1.4579438523918176e-06, 'epoch': 1.65} {'loss': 0.7169, 'learning_rate': 1.4577736553353705e-06, 'epoch': 1.65} {'loss': 0.462, 'learning_rate': 1.45760346743269e-06, 'epoch': 1.65} {'loss': 0.4438, 'learning_rate': 1.4574332886839603e-06, 'epoch': 1.65} {'loss': 0.4111, 'learning_rate': 1.457263119089357e-06, 'epoch': 1.65} {'loss': 0.5699, 'learning_rate': 1.4570929586490723e-06, 'epoch': 1.65} {'loss': 0.5401, 'learning_rate': 1.4569228073632791e-06, 'epoch': 1.65} {'loss': 0.4144, 'learning_rate': 1.4567526652321684e-06, 'epoch': 1.65} {'loss': 0.438, 'learning_rate': 1.456582532255917e-06, 'epoch': 1.65} {'loss': 0.5044, 'learning_rate': 1.4564124084347075e-06, 'epoch': 1.65} {'loss': 0.4924, 'learning_rate': 1.4562422937687249e-06, 'epoch': 1.65} {'loss': 0.5888, 'learning_rate': 1.4560721882581462e-06, 'epoch': 1.65} {'loss': 0.433, 'learning_rate': 1.455902091903162e-06, 'epoch': 1.65} {'loss': 0.6022, 'learning_rate': 1.455732004703947e-06, 'epoch': 1.65} {'loss': 0.6228, 'learning_rate': 1.4555619266606868e-06, 'epoch': 1.65} {'loss': 0.4961, 'learning_rate': 1.4553918577735627e-06, 'epoch': 1.65} {'loss': 0.5048, 'learning_rate': 1.4552217980427575e-06, 'epoch': 1.65} {'loss': 0.5212, 'learning_rate': 1.4550517474684567e-06, 'epoch': 1.65} {'loss': 0.572, 'learning_rate': 1.4548817060508336e-06, 'epoch': 1.65} {'loss': 0.599, 'learning_rate': 1.45471167379008e-06, 'epoch': 1.65} {'loss': 0.5618, 'learning_rate': 1.454541650686373e-06, 'epoch': 1.65} {'loss': 0.5024, 'learning_rate': 1.4543716367398952e-06, 'epoch': 1.65} {'loss': 0.4273, 'learning_rate': 1.4542016319508301e-06, 'epoch': 1.65} {'loss': 0.4872, 'learning_rate': 1.4540316363193585e-06, 'epoch': 1.65} {'loss': 0.4936, 'learning_rate': 1.453861649845666e-06, 'epoch': 1.65} {'loss': 0.6236, 'learning_rate': 1.4536916725299299e-06, 'epoch': 1.65} {'loss': 0.5392, 'learning_rate': 1.4535217043723348e-06, 'epoch': 1.65} {'loss': 0.538, 'learning_rate': 1.4533517453730616e-06, 'epoch': 1.65} {'loss': 0.3544, 'learning_rate': 1.4531817955322946e-06, 'epoch': 1.65} {'loss': 0.666, 'learning_rate': 1.4530118548502137e-06, 'epoch': 1.65} {'loss': 0.3885, 'learning_rate': 1.452841923327002e-06, 'epoch': 1.65} {'loss': 0.5651, 'learning_rate': 1.4526720009628447e-06, 'epoch': 1.65} {'loss': 0.5304, 'learning_rate': 1.4525020877579176e-06, 'epoch': 1.65} {'loss': 0.5237, 'learning_rate': 1.4523321837124072e-06, 'epoch': 1.65} {'loss': 0.5194, 'learning_rate': 1.452162288826493e-06, 'epoch': 1.65} {'loss': 0.4355, 'learning_rate': 1.4519924031003595e-06, 'epoch': 1.65} {'loss': 0.5363, 'learning_rate': 1.4518225265341868e-06, 'epoch': 1.65} {'loss': 0.6149, 'learning_rate': 1.4516526591281577e-06, 'epoch': 1.65} {'loss': 0.4037, 'learning_rate': 1.4514828008824578e-06, 'epoch': 1.65} {'loss': 0.5362, 'learning_rate': 1.4513129517972624e-06, 'epoch': 1.65} {'loss': 0.6268, 'learning_rate': 1.451143111872757e-06, 'epoch': 1.65} {'loss': 0.6036, 'learning_rate': 1.4509732811091225e-06, 'epoch': 1.65} {'loss': 0.4881, 'learning_rate': 1.4508034595065423e-06, 'epoch': 1.65} {'loss': 0.4921, 'learning_rate': 1.4506336470651984e-06, 'epoch': 1.65} {'loss': 0.5113, 'learning_rate': 1.4504638437852736e-06, 'epoch': 1.65} {'loss': 0.4562, 'learning_rate': 1.450294049666947e-06, 'epoch': 1.65} {'loss': 0.6453, 'learning_rate': 1.450124264710402e-06, 'epoch': 1.65} {'loss': 0.5024, 'learning_rate': 1.449954488915819e-06, 'epoch': 1.65} {'loss': 0.4984, 'learning_rate': 1.4497847222833826e-06, 'epoch': 1.65} {'loss': 0.5686, 'learning_rate': 1.449614964813274e-06, 'epoch': 1.65} {'loss': 0.419, 'learning_rate': 1.449445216505676e-06, 'epoch': 1.65} {'loss': 0.6709, 'learning_rate': 1.4492754773607676e-06, 'epoch': 1.65} {'loss': 0.636, 'learning_rate': 1.4491057473787317e-06, 'epoch': 1.65} {'loss': 0.6481, 'learning_rate': 1.4489360265597518e-06, 'epoch': 1.65} {'loss': 0.503, 'learning_rate': 1.4487663149040076e-06, 'epoch': 1.65} {'loss': 0.495, 'learning_rate': 1.4485966124116823e-06, 'epoch': 1.65} {'loss': 0.6828, 'learning_rate': 1.448426919082958e-06, 'epoch': 1.65} {'loss': 0.5577, 'learning_rate': 1.448257234918018e-06, 'epoch': 1.65} {'loss': 0.4818, 'learning_rate': 1.4480875599170407e-06, 'epoch': 1.65} {'loss': 0.5414, 'learning_rate': 1.4479178940802086e-06, 'epoch': 1.65} {'loss': 0.4922, 'learning_rate': 1.4477482374077046e-06, 'epoch': 1.65} {'loss': 0.4955, 'learning_rate': 1.4475785898997096e-06, 'epoch': 1.65} {'loss': 0.4098, 'learning_rate': 1.4474089515564071e-06, 'epoch': 1.65} {'loss': 0.3779, 'learning_rate': 1.4472393223779802e-06, 'epoch': 1.65} {'loss': 0.5491, 'learning_rate': 1.4470697023646052e-06, 'epoch': 1.65} {'loss': 0.495, 'learning_rate': 1.4469000915164676e-06, 'epoch': 1.65} {'loss': 0.4443, 'learning_rate': 1.4467304898337475e-06, 'epoch': 1.65} {'loss': 0.6229, 'learning_rate': 1.446560897316629e-06, 'epoch': 1.65} {'loss': 0.6047, 'learning_rate': 1.4463913139652918e-06, 'epoch': 1.65} {'loss': 0.6174, 'learning_rate': 1.4462217397799183e-06, 'epoch': 1.65} {'loss': 0.4826, 'learning_rate': 1.4460521747606925e-06, 'epoch': 1.65} {'loss': 0.5759, 'learning_rate': 1.4458826189077913e-06, 'epoch': 1.65} {'loss': 0.4714, 'learning_rate': 1.4457130722213998e-06, 'epoch': 1.65} {'loss': 0.5704, 'learning_rate': 1.4455435347016977e-06, 'epoch': 1.65} {'loss': 0.4038, 'learning_rate': 1.4453740063488686e-06, 'epoch': 1.65} {'loss': 0.2629, 'learning_rate': 1.4452044871630933e-06, 'epoch': 1.65} {'loss': 0.4427, 'learning_rate': 1.4450349771445526e-06, 'epoch': 1.65} {'loss': 0.5651, 'learning_rate': 1.4448654762934322e-06, 'epoch': 1.65} {'loss': 0.6237, 'learning_rate': 1.4446959846099084e-06, 'epoch': 1.65} {'loss': 0.3684, 'learning_rate': 1.4445265020941645e-06, 'epoch': 1.65} {'loss': 0.4431, 'learning_rate': 1.4443570287463826e-06, 'epoch': 1.65} {'loss': 0.5244, 'learning_rate': 1.4441875645667447e-06, 'epoch': 1.65} {'loss': 0.5107, 'learning_rate': 1.444018109555435e-06, 'epoch': 1.65} {'loss': 0.3961, 'learning_rate': 1.4438486637126258e-06, 'epoch': 1.65} {'loss': 0.4898, 'learning_rate': 1.4436792270385114e-06, 'epoch': 1.65} {'loss': 0.5736, 'learning_rate': 1.4435097995332637e-06, 'epoch': 1.65} {'loss': 0.5507, 'learning_rate': 1.443340381197068e-06, 'epoch': 1.65} {'loss': 0.511, 'learning_rate': 1.4431709720301046e-06, 'epoch': 1.65} {'loss': 0.4213, 'learning_rate': 1.4430015720325563e-06, 'epoch': 1.65} {'loss': 0.4806, 'learning_rate': 1.4428321812046065e-06, 'epoch': 1.65} {'loss': 0.4582, 'learning_rate': 1.4426627995464292e-06, 'epoch': 1.65} {'loss': 0.4912, 'learning_rate': 1.442493427058217e-06, 'epoch': 1.65} {'loss': 0.5181, 'learning_rate': 1.4423240637401415e-06, 'epoch': 1.65} {'loss': 0.5418, 'learning_rate': 1.4421547095923893e-06, 'epoch': 1.65} {'loss': 0.5087, 'learning_rate': 1.4419853646151405e-06, 'epoch': 1.65} {'loss': 0.5366, 'learning_rate': 1.4418160288085758e-06, 'epoch': 1.65} {'loss': 0.3761, 'learning_rate': 1.4416467021728808e-06, 'epoch': 1.65} {'loss': 0.481, 'learning_rate': 1.4414773847082297e-06, 'epoch': 1.66} {'loss': 0.5151, 'learning_rate': 1.4413080764148125e-06, 'epoch': 1.66} {'loss': 0.5003, 'learning_rate': 1.4411387772928032e-06, 'epoch': 1.66} {'loss': 0.4467, 'learning_rate': 1.4409694873423862e-06, 'epoch': 1.66} {'loss': 0.4765, 'learning_rate': 1.440800206563745e-06, 'epoch': 1.66} {'loss': 0.5334, 'learning_rate': 1.4406309349570547e-06, 'epoch': 1.66} {'loss': 0.4824, 'learning_rate': 1.4404616725225061e-06, 'epoch': 1.66} {'loss': 0.5057, 'learning_rate': 1.4402924192602696e-06, 'epoch': 1.66} {'loss': 0.3834, 'learning_rate': 1.440123175170538e-06, 'epoch': 1.66} {'loss': 0.5169, 'learning_rate': 1.4399539402534845e-06, 'epoch': 1.66} {'loss': 0.4645, 'learning_rate': 1.4397847145092925e-06, 'epoch': 1.66} {'loss': 0.6706, 'learning_rate': 1.439615497938146e-06, 'epoch': 1.66} {'loss': 0.4577, 'learning_rate': 1.4394462905402195e-06, 'epoch': 1.66} {'loss': 0.6081, 'learning_rate': 1.439277092315704e-06, 'epoch': 1.66} {'loss': 0.431, 'learning_rate': 1.4391079032647703e-06, 'epoch': 1.66} {'loss': 0.4991, 'learning_rate': 1.4389387233876106e-06, 'epoch': 1.66} {'loss': 0.4591, 'learning_rate': 1.4387695526843981e-06, 'epoch': 1.66} {'loss': 0.467, 'learning_rate': 1.438600391155317e-06, 'epoch': 1.66} {'loss': 0.4799, 'learning_rate': 1.4384312388005506e-06, 'epoch': 1.66} {'loss': 0.5341, 'learning_rate': 1.438262095620273e-06, 'epoch': 1.66} {'loss': 0.5004, 'learning_rate': 1.4380929616146755e-06, 'epoch': 1.66} {'loss': 0.6184, 'learning_rate': 1.437923836783931e-06, 'epoch': 1.66} {'loss': 0.5513, 'learning_rate': 1.4377547211282251e-06, 'epoch': 1.66} {'loss': 0.397, 'learning_rate': 1.4375856146477362e-06, 'epoch': 1.66} {'loss': 0.6473, 'learning_rate': 1.437416517342648e-06, 'epoch': 1.66} {'loss': 0.5608, 'learning_rate': 1.4372474292131433e-06, 'epoch': 1.66} {'loss': 0.571, 'learning_rate': 1.4370783502593954e-06, 'epoch': 1.66} {'loss': 0.4033, 'learning_rate': 1.4369092804815964e-06, 'epoch': 1.66} {'loss': 0.622, 'learning_rate': 1.4367402198799197e-06, 'epoch': 1.66} {'loss': 0.5632, 'learning_rate': 1.4365711684545481e-06, 'epoch': 1.66} {'loss': 0.4301, 'learning_rate': 1.4364021262056638e-06, 'epoch': 1.66} {'loss': 0.4173, 'learning_rate': 1.4362330931334466e-06, 'epoch': 1.66} {'loss': 0.6116, 'learning_rate': 1.4360640692380822e-06, 'epoch': 1.66} {'loss': 0.5077, 'learning_rate': 1.4358950545197425e-06, 'epoch': 1.66} {'loss': 0.5949, 'learning_rate': 1.4357260489786196e-06, 'epoch': 1.66} {'loss': 0.3854, 'learning_rate': 1.4355570526148865e-06, 'epoch': 1.66} {'loss': 0.4095, 'learning_rate': 1.4353880654287266e-06, 'epoch': 1.66} {'loss': 0.587, 'learning_rate': 1.4352190874203241e-06, 'epoch': 1.66} {'loss': 0.625, 'learning_rate': 1.4350501185898536e-06, 'epoch': 1.66} {'loss': 0.2949, 'learning_rate': 1.4348811589375033e-06, 'epoch': 1.66} {'loss': 0.4731, 'learning_rate': 1.434712208463447e-06, 'epoch': 1.66} {'loss': 0.579, 'learning_rate': 1.4345432671678738e-06, 'epoch': 1.66} {'loss': 0.3953, 'learning_rate': 1.4343743350509577e-06, 'epoch': 1.66} {'loss': 0.4786, 'learning_rate': 1.4342054121128833e-06, 'epoch': 1.66} {'loss': 0.5321, 'learning_rate': 1.4340364983538336e-06, 'epoch': 1.66} {'loss': 0.5456, 'learning_rate': 1.433867593773982e-06, 'epoch': 1.66} {'loss': 0.5781, 'learning_rate': 1.433698698373519e-06, 'epoch': 1.66} {'loss': 0.6122, 'learning_rate': 1.4335298121526163e-06, 'epoch': 1.66} {'loss': 0.5718, 'learning_rate': 1.4333609351114642e-06, 'epoch': 1.66} {'loss': 0.3645, 'learning_rate': 1.4331920672502364e-06, 'epoch': 1.66} {'loss': 0.5919, 'learning_rate': 1.4330232085691176e-06, 'epoch': 1.66} {'loss': 0.5029, 'learning_rate': 1.4328543590682886e-06, 'epoch': 1.66} {'loss': 0.5501, 'learning_rate': 1.4326855187479261e-06, 'epoch': 1.66} {'loss': 0.2999, 'learning_rate': 1.4325166876082174e-06, 'epoch': 1.66} {'loss': 0.6217, 'learning_rate': 1.4323478656493394e-06, 'epoch': 1.66} {'loss': 0.5378, 'learning_rate': 1.4321790528714729e-06, 'epoch': 1.66} {'loss': 0.5315, 'learning_rate': 1.4320102492748012e-06, 'epoch': 1.66} {'loss': 0.4199, 'learning_rate': 1.4318414548595028e-06, 'epoch': 1.66} {'loss': 0.4686, 'learning_rate': 1.4316726696257622e-06, 'epoch': 1.66} {'loss': 0.5454, 'learning_rate': 1.4315038935737524e-06, 'epoch': 1.66} {'loss': 0.5853, 'learning_rate': 1.4313351267036647e-06, 'epoch': 1.66} {'loss': 0.5274, 'learning_rate': 1.431166369015673e-06, 'epoch': 1.66} {'loss': 0.5818, 'learning_rate': 1.4309976205099596e-06, 'epoch': 1.66} {'loss': 0.4508, 'learning_rate': 1.4308288811867055e-06, 'epoch': 1.66} {'loss': 0.4005, 'learning_rate': 1.4306601510460916e-06, 'epoch': 1.66} {'loss': 0.4763, 'learning_rate': 1.430491430088301e-06, 'epoch': 1.66} {'loss': 0.5344, 'learning_rate': 1.4303227183135071e-06, 'epoch': 1.66} {'loss': 0.5688, 'learning_rate': 1.4301540157219019e-06, 'epoch': 1.66} {'loss': 0.5181, 'learning_rate': 1.4299853223136573e-06, 'epoch': 1.66} {'loss': 0.5202, 'learning_rate': 1.4298166380889567e-06, 'epoch': 1.66} {'loss': 0.4242, 'learning_rate': 1.4296479630479809e-06, 'epoch': 1.66} {'loss': 0.4168, 'learning_rate': 1.429479297190911e-06, 'epoch': 1.66} {'loss': 0.5235, 'learning_rate': 1.4293106405179292e-06, 'epoch': 1.66} {'loss': 0.6012, 'learning_rate': 1.429141993029214e-06, 'epoch': 1.66} {'loss': 0.4981, 'learning_rate': 1.4289733547249451e-06, 'epoch': 1.66} {'loss': 0.3234, 'learning_rate': 1.428804725605305e-06, 'epoch': 1.66} {'loss': 0.5078, 'learning_rate': 1.4286361056704757e-06, 'epoch': 1.66} {'loss': 0.4886, 'learning_rate': 1.4284674949206346e-06, 'epoch': 1.66} {'loss': 0.4826, 'learning_rate': 1.428298893355965e-06, 'epoch': 1.66} {'loss': 0.3125, 'learning_rate': 1.428130300976649e-06, 'epoch': 1.66} {'loss': 0.4428, 'learning_rate': 1.427961717782863e-06, 'epoch': 1.66} {'loss': 0.5458, 'learning_rate': 1.4277931437747894e-06, 'epoch': 1.66} {'loss': 0.6145, 'learning_rate': 1.42762457895261e-06, 'epoch': 1.66} {'loss': 0.6701, 'learning_rate': 1.4274560233165035e-06, 'epoch': 1.66} {'loss': 0.4728, 'learning_rate': 1.4272874768666523e-06, 'epoch': 1.66} {'loss': 0.47, 'learning_rate': 1.427118939603236e-06, 'epoch': 1.66} {'loss': 0.5225, 'learning_rate': 1.4269504115264376e-06, 'epoch': 1.66} {'loss': 0.583, 'learning_rate': 1.426781892636433e-06, 'epoch': 1.66} {'loss': 0.5165, 'learning_rate': 1.426613382933406e-06, 'epoch': 1.66} {'loss': 0.5523, 'learning_rate': 1.4264448824175358e-06, 'epoch': 1.66} {'loss': 0.5415, 'learning_rate': 1.4262763910890043e-06, 'epoch': 1.66} {'loss': 0.6363, 'learning_rate': 1.4261079089479924e-06, 'epoch': 1.66} {'loss': 0.5418, 'learning_rate': 1.425939435994681e-06, 'epoch': 1.66} {'loss': 0.4966, 'learning_rate': 1.4257709722292468e-06, 'epoch': 1.66} {'loss': 0.4777, 'learning_rate': 1.4256025176518728e-06, 'epoch': 1.66} {'loss': 0.4654, 'learning_rate': 1.4254340722627402e-06, 'epoch': 1.66} {'loss': 0.5515, 'learning_rate': 1.4252656360620286e-06, 'epoch': 1.66} {'loss': 0.5682, 'learning_rate': 1.4250972090499193e-06, 'epoch': 1.66} {'loss': 0.4278, 'learning_rate': 1.424928791226592e-06, 'epoch': 1.66} {'loss': 0.5607, 'learning_rate': 1.4247603825922295e-06, 'epoch': 1.66} {'loss': 0.4847, 'learning_rate': 1.4245919831470078e-06, 'epoch': 1.66} {'loss': 0.3931, 'learning_rate': 1.42442359289111e-06, 'epoch': 1.66} {'loss': 0.4405, 'learning_rate': 1.4242552118247165e-06, 'epoch': 1.66} {'loss': 0.6723, 'learning_rate': 1.4240868399480067e-06, 'epoch': 1.66} {'loss': 0.4914, 'learning_rate': 1.423918477261166e-06, 'epoch': 1.66} {'loss': 0.4756, 'learning_rate': 1.4237501237643647e-06, 'epoch': 1.66} {'loss': 0.5133, 'learning_rate': 1.4235817794577932e-06, 'epoch': 1.66} {'loss': 0.644, 'learning_rate': 1.423413444341627e-06, 'epoch': 1.66} {'loss': 0.4823, 'learning_rate': 1.4232451184160467e-06, 'epoch': 1.66} {'loss': 0.496, 'learning_rate': 1.4230768016812334e-06, 'epoch': 1.66} {'loss': 0.5904, 'learning_rate': 1.4229084941373672e-06, 'epoch': 1.66} {'loss': 0.4189, 'learning_rate': 1.422740195784631e-06, 'epoch': 1.66} {'loss': 0.5071, 'learning_rate': 1.4225719066232014e-06, 'epoch': 1.66} {'loss': 0.654, 'learning_rate': 1.4224036266532593e-06, 'epoch': 1.66} {'loss': 0.4902, 'learning_rate': 1.4222353558749858e-06, 'epoch': 1.66} {'loss': 0.5725, 'learning_rate': 1.4220670942885616e-06, 'epoch': 1.66} {'loss': 0.5426, 'learning_rate': 1.421898841894167e-06, 'epoch': 1.66} {'loss': 0.4695, 'learning_rate': 1.4217305986919816e-06, 'epoch': 1.66} {'loss': 0.5365, 'learning_rate': 1.4215623646821886e-06, 'epoch': 1.66} {'loss': 0.534, 'learning_rate': 1.4213941398649632e-06, 'epoch': 1.66} {'loss': 0.4633, 'learning_rate': 1.421225924240489e-06, 'epoch': 1.66} {'loss': 0.4945, 'learning_rate': 1.4210577178089447e-06, 'epoch': 1.66} {'loss': 0.5812, 'learning_rate': 1.420889520570512e-06, 'epoch': 1.66} {'loss': 0.575, 'learning_rate': 1.420721332525372e-06, 'epoch': 1.66} {'loss': 0.4975, 'learning_rate': 1.4205531536736993e-06, 'epoch': 1.66} {'loss': 0.6014, 'learning_rate': 1.4203849840156836e-06, 'epoch': 1.66} {'loss': 0.5169, 'learning_rate': 1.420216823551497e-06, 'epoch': 1.66} {'loss': 0.6314, 'learning_rate': 1.4200486722813211e-06, 'epoch': 1.66} {'loss': 0.5482, 'learning_rate': 1.4198805302053386e-06, 'epoch': 1.66} {'loss': 0.5337, 'learning_rate': 1.419712397323728e-06, 'epoch': 1.66} {'loss': 0.5143, 'learning_rate': 1.4195442736366726e-06, 'epoch': 1.66} {'loss': 0.4047, 'learning_rate': 1.4193761591443456e-06, 'epoch': 1.66} {'loss': 0.5328, 'learning_rate': 1.4192080538469366e-06, 'epoch': 1.66} {'loss': 0.6045, 'learning_rate': 1.4190399577446168e-06, 'epoch': 1.66} {'loss': 0.5769, 'learning_rate': 1.4188718708375715e-06, 'epoch': 1.66} {'loss': 0.6112, 'learning_rate': 1.4187037931259783e-06, 'epoch': 1.66} {'loss': 0.4325, 'learning_rate': 1.4185357246100196e-06, 'epoch': 1.66} {'loss': 0.4849, 'learning_rate': 1.4183676652898758e-06, 'epoch': 1.66} {'loss': 0.3567, 'learning_rate': 1.4181996151657218e-06, 'epoch': 1.66} {'loss': 0.4931, 'learning_rate': 1.418031574237746e-06, 'epoch': 1.66} {'loss': 0.5004, 'learning_rate': 1.4178635425061216e-06, 'epoch': 1.66} {'loss': 0.588, 'learning_rate': 1.4176955199710307e-06, 'epoch': 1.66} {'loss': 0.5058, 'learning_rate': 1.4175275066326555e-06, 'epoch': 1.66} {'loss': 0.4139, 'learning_rate': 1.41735950249117e-06, 'epoch': 1.66} {'loss': 0.3741, 'learning_rate': 1.4171915075467635e-06, 'epoch': 1.66} {'loss': 0.618, 'learning_rate': 1.4170235217996053e-06, 'epoch': 1.66} {'loss': 0.6594, 'learning_rate': 1.4168555452498867e-06, 'epoch': 1.66} {'loss': 0.4564, 'learning_rate': 1.4166875778977796e-06, 'epoch': 1.66} {'loss': 0.4238, 'learning_rate': 1.416519619743466e-06, 'epoch': 1.66} {'loss': 0.4372, 'learning_rate': 1.4163516707871294e-06, 'epoch': 1.66} {'loss': 0.5468, 'learning_rate': 1.4161837310289406e-06, 'epoch': 1.66} {'loss': 0.4707, 'learning_rate': 1.4160158004690915e-06, 'epoch': 1.66} {'loss': 0.5513, 'learning_rate': 1.4158478791077513e-06, 'epoch': 1.66} {'loss': 0.4325, 'learning_rate': 1.4156799669451094e-06, 'epoch': 1.66} {'loss': 0.4517, 'learning_rate': 1.4155120639813392e-06, 'epoch': 1.66} {'loss': 0.4112, 'learning_rate': 1.4153441702166227e-06, 'epoch': 1.66} {'loss': 0.5815, 'learning_rate': 1.415176285651142e-06, 'epoch': 1.66} {'loss': 0.4962, 'learning_rate': 1.4150084102850692e-06, 'epoch': 1.66} {'loss': 0.3344, 'learning_rate': 1.4148405441185953e-06, 'epoch': 1.66} {'loss': 0.5508, 'learning_rate': 1.41467268715189e-06, 'epoch': 1.66} {'loss': 0.4406, 'learning_rate': 1.4145048393851423e-06, 'epoch': 1.66} {'loss': 0.6096, 'learning_rate': 1.4143370008185253e-06, 'epoch': 1.66} {'loss': 0.3943, 'learning_rate': 1.414169171452221e-06, 'epoch': 1.66} {'loss': 0.5804, 'learning_rate': 1.4140013512864116e-06, 'epoch': 1.66} {'loss': 0.5518, 'learning_rate': 1.4138335403212699e-06, 'epoch': 1.66} {'loss': 0.4007, 'learning_rate': 1.4136657385569853e-06, 'epoch': 1.66} {'loss': 0.3718, 'learning_rate': 1.4134979459937282e-06, 'epoch': 1.66} {'loss': 0.4282, 'learning_rate': 1.4133301626316875e-06, 'epoch': 1.66} {'loss': 0.4763, 'learning_rate': 1.4131623884710365e-06, 'epoch': 1.66} {'loss': 0.4912, 'learning_rate': 1.4129946235119562e-06, 'epoch': 1.66} {'loss': 0.5645, 'learning_rate': 1.4128268677546308e-06, 'epoch': 1.66} {'loss': 0.5029, 'learning_rate': 1.4126591211992313e-06, 'epoch': 1.66} {'loss': 0.4712, 'learning_rate': 1.4124913838459464e-06, 'epoch': 1.66} {'loss': 0.4573, 'learning_rate': 1.4123236556949481e-06, 'epoch': 1.66} {'loss': 0.6658, 'learning_rate': 1.4121559367464254e-06, 'epoch': 1.66} {'loss': 0.5544, 'learning_rate': 1.4119882270005493e-06, 'epoch': 1.66} {'loss': 0.6496, 'learning_rate': 1.4118205264575036e-06, 'epoch': 1.66} {'loss': 0.515, 'learning_rate': 1.4116528351174696e-06, 'epoch': 1.66} {'loss': 0.4538, 'learning_rate': 1.4114851529806195e-06, 'epoch': 1.66} {'loss': 0.3475, 'learning_rate': 1.411317480047144e-06, 'epoch': 1.66} {'loss': 0.5427, 'learning_rate': 1.4111498163172132e-06, 'epoch': 1.66} {'loss': 0.5826, 'learning_rate': 1.4109821617910114e-06, 'epoch': 1.66} {'loss': 0.4368, 'learning_rate': 1.4108145164687182e-06, 'epoch': 1.66} {'loss': 0.4145, 'learning_rate': 1.4106468803505112e-06, 'epoch': 1.66} {'loss': 0.387, 'learning_rate': 1.410479253436574e-06, 'epoch': 1.66} {'loss': 0.3879, 'learning_rate': 1.4103116357270785e-06, 'epoch': 1.66} {'loss': 0.5565, 'learning_rate': 1.4101440272222144e-06, 'epoch': 1.66} {'loss': 0.4131, 'learning_rate': 1.409976427922154e-06, 'epoch': 1.66} {'loss': 0.581, 'learning_rate': 1.4098088378270792e-06, 'epoch': 1.66} {'loss': 0.3497, 'learning_rate': 1.4096412569371697e-06, 'epoch': 1.66} {'loss': 0.4788, 'learning_rate': 1.4094736852526047e-06, 'epoch': 1.66} {'loss': 0.4883, 'learning_rate': 1.409306122773566e-06, 'epoch': 1.66} {'loss': 0.3849, 'learning_rate': 1.409138569500229e-06, 'epoch': 1.66} {'loss': 0.5085, 'learning_rate': 1.408971025432776e-06, 'epoch': 1.66} {'loss': 0.5837, 'learning_rate': 1.4088034905713855e-06, 'epoch': 1.66} {'loss': 0.3623, 'learning_rate': 1.4086359649162374e-06, 'epoch': 1.66} {'loss': 0.7225, 'learning_rate': 1.4084684484675137e-06, 'epoch': 1.66} {'loss': 0.2648, 'learning_rate': 1.4083009412253868e-06, 'epoch': 1.66} {'loss': 0.5076, 'learning_rate': 1.4081334431900452e-06, 'epoch': 1.66} {'loss': 0.465, 'learning_rate': 1.407965954361662e-06, 'epoch': 1.66} {'loss': 0.5734, 'learning_rate': 1.4077984747404195e-06, 'epoch': 1.66} {'loss': 0.4943, 'learning_rate': 1.407631004326495e-06, 'epoch': 1.66} {'loss': 0.5562, 'learning_rate': 1.4074635431200712e-06, 'epoch': 1.66} {'loss': 0.5789, 'learning_rate': 1.4072960911213262e-06, 'epoch': 1.66} {'loss': 0.4763, 'learning_rate': 1.4071286483304358e-06, 'epoch': 1.66} {'loss': 0.609, 'learning_rate': 1.4069612147475864e-06, 'epoch': 1.66} {'loss': 0.5554, 'learning_rate': 1.406793790372951e-06, 'epoch': 1.66} {'loss': 0.5295, 'learning_rate': 1.4066263752067121e-06, 'epoch': 1.66} {'loss': 0.4687, 'learning_rate': 1.4064589692490494e-06, 'epoch': 1.66} {'loss': 0.5003, 'learning_rate': 1.4062915725001403e-06, 'epoch': 1.66} {'loss': 0.5348, 'learning_rate': 1.4061241849601682e-06, 'epoch': 1.66} {'loss': 0.6187, 'learning_rate': 1.4059568066293071e-06, 'epoch': 1.66} {'loss': 0.4968, 'learning_rate': 1.4057894375077396e-06, 'epoch': 1.66} {'loss': 0.7253, 'learning_rate': 1.4056220775956442e-06, 'epoch': 1.66} {'loss': 0.5914, 'learning_rate': 1.4054547268932007e-06, 'epoch': 1.66} {'loss': 0.462, 'learning_rate': 1.4052873854005877e-06, 'epoch': 1.66} {'loss': 0.3261, 'learning_rate': 1.4051200531179842e-06, 'epoch': 1.66} {'loss': 0.3743, 'learning_rate': 1.4049527300455735e-06, 'epoch': 1.66} {'loss': 0.5756, 'learning_rate': 1.4047854161835295e-06, 'epoch': 1.66} {'loss': 0.5238, 'learning_rate': 1.4046181115320335e-06, 'epoch': 1.66} {'loss': 0.4678, 'learning_rate': 1.404450816091265e-06, 'epoch': 1.66} {'loss': 0.5299, 'learning_rate': 1.4042835298614032e-06, 'epoch': 1.66} {'loss': 0.4582, 'learning_rate': 1.4041162528426279e-06, 'epoch': 1.66} {'loss': 0.4326, 'learning_rate': 1.4039489850351173e-06, 'epoch': 1.66} {'loss': 0.4591, 'learning_rate': 1.403781726439053e-06, 'epoch': 1.66} {'loss': 0.4195, 'learning_rate': 1.4036144770546113e-06, 'epoch': 1.66} {'loss': 0.5678, 'learning_rate': 1.4034472368819718e-06, 'epoch': 1.66} {'loss': 0.4728, 'learning_rate': 1.4032800059213147e-06, 'epoch': 1.66} {'loss': 0.3893, 'learning_rate': 1.4031127841728186e-06, 'epoch': 1.66} {'loss': 0.5975, 'learning_rate': 1.4029455716366636e-06, 'epoch': 1.66} {'loss': 0.5079, 'learning_rate': 1.4027783683130304e-06, 'epoch': 1.66} {'loss': 0.4714, 'learning_rate': 1.4026111742020942e-06, 'epoch': 1.66} {'loss': 0.5514, 'learning_rate': 1.4024439893040354e-06, 'epoch': 1.66} {'loss': 0.4629, 'learning_rate': 1.4022768136190345e-06, 'epoch': 1.66} {'loss': 0.4076, 'learning_rate': 1.4021096471472694e-06, 'epoch': 1.66} {'loss': 0.6452, 'learning_rate': 1.4019424898889212e-06, 'epoch': 1.66} {'loss': 0.4025, 'learning_rate': 1.401775341844166e-06, 'epoch': 1.66} {'loss': 0.4704, 'learning_rate': 1.4016082030131873e-06, 'epoch': 1.66} {'loss': 0.5804, 'learning_rate': 1.4014410733961593e-06, 'epoch': 1.66} {'loss': 0.5055, 'learning_rate': 1.401273952993264e-06, 'epoch': 1.66} {'loss': 0.5907, 'learning_rate': 1.401106841804678e-06, 'epoch': 1.66} {'loss': 0.4727, 'learning_rate': 1.4009397398305834e-06, 'epoch': 1.66} {'loss': 0.6093, 'learning_rate': 1.400772647071158e-06, 'epoch': 1.66} {'loss': 0.5033, 'learning_rate': 1.4006055635265802e-06, 'epoch': 1.66} {'loss': 0.437, 'learning_rate': 1.4004384891970325e-06, 'epoch': 1.66} {'loss': 0.5317, 'learning_rate': 1.4002714240826887e-06, 'epoch': 1.66} {'loss': 0.4335, 'learning_rate': 1.40010436818373e-06, 'epoch': 1.66} {'loss': 0.4701, 'learning_rate': 1.3999373215003365e-06, 'epoch': 1.66} {'loss': 0.6153, 'learning_rate': 1.3997702840326854e-06, 'epoch': 1.66} {'loss': 0.4155, 'learning_rate': 1.399603255780959e-06, 'epoch': 1.66} {'loss': 0.6327, 'learning_rate': 1.3994362367453295e-06, 'epoch': 1.66} {'loss': 0.3882, 'learning_rate': 1.3992692269259856e-06, 'epoch': 1.66} {'loss': 0.4959, 'learning_rate': 1.399102226323098e-06, 'epoch': 1.66} {'loss': 0.5833, 'learning_rate': 1.3989352349368491e-06, 'epoch': 1.66} {'loss': 0.4974, 'learning_rate': 1.3987682527674162e-06, 'epoch': 1.66} {'loss': 0.5537, 'learning_rate': 1.3986012798149807e-06, 'epoch': 1.66} {'loss': 0.4906, 'learning_rate': 1.398434316079722e-06, 'epoch': 1.66} {'loss': 0.4885, 'learning_rate': 1.3982673615618136e-06, 'epoch': 1.66} {'loss': 0.5701, 'learning_rate': 1.398100416261441e-06, 'epoch': 1.66} {'loss': 0.5659, 'learning_rate': 1.3979334801787791e-06, 'epoch': 1.66} {'loss': 0.5652, 'learning_rate': 1.3977665533140073e-06, 'epoch': 1.66} {'loss': 0.5138, 'learning_rate': 1.3975996356673061e-06, 'epoch': 1.66} {'loss': 0.4585, 'learning_rate': 1.397432727238852e-06, 'epoch': 1.66} {'loss': 0.6075, 'learning_rate': 1.3972658280288276e-06, 'epoch': 1.66} {'loss': 0.4359, 'learning_rate': 1.3970989380374078e-06, 'epoch': 1.66} {'loss': 0.4254, 'learning_rate': 1.3969320572647726e-06, 'epoch': 1.66} {'loss': 0.409, 'learning_rate': 1.3967651857111008e-06, 'epoch': 1.66} {'loss': 0.5262, 'learning_rate': 1.3965983233765723e-06, 'epoch': 1.66} {'loss': 0.4449, 'learning_rate': 1.3964314702613667e-06, 'epoch': 1.66} {'loss': 0.4541, 'learning_rate': 1.3962646263656566e-06, 'epoch': 1.66} {'loss': 0.5236, 'learning_rate': 1.3960977916896311e-06, 'epoch': 1.66} {'loss': 0.5181, 'learning_rate': 1.3959309662334609e-06, 'epoch': 1.66} {'loss': 0.3679, 'learning_rate': 1.3957641499973261e-06, 'epoch': 1.66} {'loss': 0.4599, 'learning_rate': 1.3955973429814074e-06, 'epoch': 1.66} {'loss': 0.5796, 'learning_rate': 1.395430545185883e-06, 'epoch': 1.66} {'loss': 0.4629, 'learning_rate': 1.395263756610933e-06, 'epoch': 1.66} {'loss': 0.5374, 'learning_rate': 1.3950969772567301e-06, 'epoch': 1.66} {'loss': 0.3674, 'learning_rate': 1.3949302071234626e-06, 'epoch': 1.66} {'loss': 0.3775, 'learning_rate': 1.3947634462113014e-06, 'epoch': 1.66} {'loss': 0.6075, 'learning_rate': 1.394596694520428e-06, 'epoch': 1.66} {'loss': 0.5128, 'learning_rate': 1.3944299520510229e-06, 'epoch': 1.66} {'loss': 0.4957, 'learning_rate': 1.3942632188032578e-06, 'epoch': 1.66} {'loss': 0.4829, 'learning_rate': 1.3940964947773216e-06, 'epoch': 1.66} {'loss': 0.4456, 'learning_rate': 1.393929779973383e-06, 'epoch': 1.66} {'loss': 0.4707, 'learning_rate': 1.3937630743916308e-06, 'epoch': 1.66} {'loss': 0.3851, 'learning_rate': 1.3935963780322348e-06, 'epoch': 1.66} {'loss': 0.5996, 'learning_rate': 1.3934296908953771e-06, 'epoch': 1.66} {'loss': 0.4885, 'learning_rate': 1.3932630129812385e-06, 'epoch': 1.66} {'loss': 0.5883, 'learning_rate': 1.3930963442899914e-06, 'epoch': 1.66} {'loss': 0.5453, 'learning_rate': 1.3929296848218233e-06, 'epoch': 1.66} {'loss': 0.5816, 'learning_rate': 1.3927630345769027e-06, 'epoch': 1.66} {'loss': 0.5133, 'learning_rate': 1.3925963935554177e-06, 'epoch': 1.66} {'loss': 0.5528, 'learning_rate': 1.392429761757541e-06, 'epoch': 1.66} {'loss': 0.6102, 'learning_rate': 1.3922631391834519e-06, 'epoch': 1.66} {'loss': 0.6818, 'learning_rate': 1.392096525833332e-06, 'epoch': 1.66} {'loss': 0.6197, 'learning_rate': 1.3919299217073534e-06, 'epoch': 1.66} {'loss': 0.4773, 'learning_rate': 1.391763326805704e-06, 'epoch': 1.66} {'loss': 0.4519, 'learning_rate': 1.3915967411285513e-06, 'epoch': 1.66} {'loss': 0.4765, 'learning_rate': 1.3914301646760853e-06, 'epoch': 1.66} {'loss': 0.5463, 'learning_rate': 1.3912635974484757e-06, 'epoch': 1.66} {'loss': 0.5655, 'learning_rate': 1.3910970394459045e-06, 'epoch': 1.66} {'loss': 0.4081, 'learning_rate': 1.3909304906685529e-06, 'epoch': 1.66} {'loss': 0.4666, 'learning_rate': 1.3907639511165904e-06, 'epoch': 1.66} {'loss': 0.4211, 'learning_rate': 1.3905974207902062e-06, 'epoch': 1.66} {'loss': 0.3715, 'learning_rate': 1.39043089968957e-06, 'epoch': 1.66} {'loss': 0.3871, 'learning_rate': 1.390264387814868e-06, 'epoch': 1.66} {'loss': 0.4949, 'learning_rate': 1.3900978851662727e-06, 'epoch': 1.66} {'loss': 0.5608, 'learning_rate': 1.389931391743965e-06, 'epoch': 1.66} {'loss': 0.6107, 'learning_rate': 1.3897649075481257e-06, 'epoch': 1.66} {'loss': 0.4614, 'learning_rate': 1.3895984325789246e-06, 'epoch': 1.66} {'loss': 0.4532, 'learning_rate': 1.3894319668365508e-06, 'epoch': 1.66} {'loss': 0.4517, 'learning_rate': 1.389265510321174e-06, 'epoch': 1.66} {'loss': 0.4309, 'learning_rate': 1.3890990630329803e-06, 'epoch': 1.66} {'loss': 0.5124, 'learning_rate': 1.3889326249721424e-06, 'epoch': 1.66} {'loss': 0.6234, 'learning_rate': 1.3887661961388398e-06, 'epoch': 1.66} {'loss': 0.5306, 'learning_rate': 1.3885997765332538e-06, 'epoch': 1.66} {'loss': 0.6429, 'learning_rate': 1.388433366155556e-06, 'epoch': 1.66} {'loss': 0.4705, 'learning_rate': 1.3882669650059333e-06, 'epoch': 1.66} {'loss': 0.616, 'learning_rate': 1.3881005730845576e-06, 'epoch': 1.66} {'loss': 0.4889, 'learning_rate': 1.3879341903916098e-06, 'epoch': 1.66} {'loss': 0.4483, 'learning_rate': 1.3877678169272669e-06, 'epoch': 1.66} {'loss': 0.4094, 'learning_rate': 1.3876014526917092e-06, 'epoch': 1.66} {'loss': 0.5256, 'learning_rate': 1.3874350976851158e-06, 'epoch': 1.66} {'loss': 0.5752, 'learning_rate': 1.3872687519076577e-06, 'epoch': 1.66} {'loss': 0.5113, 'learning_rate': 1.3871024153595236e-06, 'epoch': 1.66} {'loss': 0.4166, 'learning_rate': 1.3869360880408844e-06, 'epoch': 1.66} {'loss': 0.5867, 'learning_rate': 1.3867697699519212e-06, 'epoch': 1.66} {'loss': 0.5531, 'learning_rate': 1.3866034610928104e-06, 'epoch': 1.66} {'loss': 0.3926, 'learning_rate': 1.386437161463733e-06, 'epoch': 1.66} {'loss': 0.4509, 'learning_rate': 1.3862708710648665e-06, 'epoch': 1.66} {'loss': 0.6995, 'learning_rate': 1.3861045898963832e-06, 'epoch': 1.66} {'loss': 0.4592, 'learning_rate': 1.3859383179584717e-06, 'epoch': 1.66} {'loss': 0.4639, 'learning_rate': 1.3857720552513031e-06, 'epoch': 1.66} {'loss': 0.586, 'learning_rate': 1.3856058017750562e-06, 'epoch': 1.66} {'loss': 0.5384, 'learning_rate': 1.3854395575299107e-06, 'epoch': 1.66} {'loss': 0.5641, 'learning_rate': 1.3852733225160441e-06, 'epoch': 1.66} {'loss': 0.5791, 'learning_rate': 1.3851070967336366e-06, 'epoch': 1.66} {'loss': 0.4883, 'learning_rate': 1.3849408801828623e-06, 'epoch': 1.66} {'loss': 0.4812, 'learning_rate': 1.384774672863901e-06, 'epoch': 1.66} {'loss': 0.5218, 'learning_rate': 1.3846084747769328e-06, 'epoch': 1.66} {'loss': 0.3751, 'learning_rate': 1.384442285922133e-06, 'epoch': 1.66} {'loss': 0.5635, 'learning_rate': 1.3842761062996802e-06, 'epoch': 1.66} {'loss': 0.4245, 'learning_rate': 1.3841099359097542e-06, 'epoch': 1.66} {'loss': 0.5851, 'learning_rate': 1.3839437747525341e-06, 'epoch': 1.66} {'loss': 0.5242, 'learning_rate': 1.383777622828194e-06, 'epoch': 1.66} {'loss': 0.5442, 'learning_rate': 1.3836114801369126e-06, 'epoch': 1.66} {'loss': 0.4546, 'learning_rate': 1.383445346678871e-06, 'epoch': 1.66} {'loss': 0.525, 'learning_rate': 1.3832792224542447e-06, 'epoch': 1.66} {'loss': 0.6041, 'learning_rate': 1.383113107463212e-06, 'epoch': 1.66} {'loss': 0.4808, 'learning_rate': 1.382947001705951e-06, 'epoch': 1.66} {'loss': 0.5595, 'learning_rate': 1.3827809051826423e-06, 'epoch': 1.66} {'loss': 0.5524, 'learning_rate': 1.3826148178934607e-06, 'epoch': 1.66} {'loss': 0.5159, 'learning_rate': 1.3824487398385833e-06, 'epoch': 1.66} {'loss': 0.4789, 'learning_rate': 1.3822826710181913e-06, 'epoch': 1.66} {'loss': 0.6059, 'learning_rate': 1.3821166114324602e-06, 'epoch': 1.66} {'loss': 0.5976, 'learning_rate': 1.381950561081572e-06, 'epoch': 1.66} {'loss': 0.4676, 'learning_rate': 1.3817845199656988e-06, 'epoch': 1.66} {'loss': 0.5522, 'learning_rate': 1.3816184880850213e-06, 'epoch': 1.66} {'loss': 0.473, 'learning_rate': 1.3814524654397188e-06, 'epoch': 1.66} {'loss': 0.4356, 'learning_rate': 1.3812864520299663e-06, 'epoch': 1.66} {'loss': 0.5511, 'learning_rate': 1.3811204478559437e-06, 'epoch': 1.66} {'loss': 0.2862, 'learning_rate': 1.3809544529178287e-06, 'epoch': 1.66} {'loss': 0.6151, 'learning_rate': 1.380788467215801e-06, 'epoch': 1.66} {'loss': 0.4555, 'learning_rate': 1.3806224907500344e-06, 'epoch': 1.66} {'loss': 0.4002, 'learning_rate': 1.3804565235207079e-06, 'epoch': 1.66} {'loss': 0.6026, 'learning_rate': 1.3802905655280009e-06, 'epoch': 1.66} {'loss': 0.4954, 'learning_rate': 1.3801246167720905e-06, 'epoch': 1.66} {'loss': 0.4996, 'learning_rate': 1.3799586772531536e-06, 'epoch': 1.66} {'loss': 0.4545, 'learning_rate': 1.3797927469713724e-06, 'epoch': 1.66} {'loss': 0.3662, 'learning_rate': 1.3796268259269186e-06, 'epoch': 1.66} {'loss': 0.5483, 'learning_rate': 1.3794609141199733e-06, 'epoch': 1.66} {'loss': 0.5609, 'learning_rate': 1.3792950115507132e-06, 'epoch': 1.66} {'loss': 0.5573, 'learning_rate': 1.3791291182193168e-06, 'epoch': 1.66} {'loss': 0.4069, 'learning_rate': 1.3789632341259607e-06, 'epoch': 1.66} {'loss': 0.5303, 'learning_rate': 1.378797359270825e-06, 'epoch': 1.66} {'loss': 0.545, 'learning_rate': 1.3786314936540867e-06, 'epoch': 1.66} {'loss': 0.495, 'learning_rate': 1.378465637275922e-06, 'epoch': 1.66} {'loss': 0.4708, 'learning_rate': 1.3782997901365092e-06, 'epoch': 1.66} {'loss': 0.4847, 'learning_rate': 1.378133952236026e-06, 'epoch': 1.66} {'loss': 0.4937, 'learning_rate': 1.37796812357465e-06, 'epoch': 1.66} {'loss': 0.4604, 'learning_rate': 1.37780230415256e-06, 'epoch': 1.66} {'loss': 0.4553, 'learning_rate': 1.3776364939699326e-06, 'epoch': 1.66} {'loss': 0.4792, 'learning_rate': 1.3774706930269488e-06, 'epoch': 1.66} {'loss': 0.4694, 'learning_rate': 1.3773049013237805e-06, 'epoch': 1.66} {'loss': 0.4697, 'learning_rate': 1.3771391188606087e-06, 'epoch': 1.66} {'loss': 0.4505, 'learning_rate': 1.3769733456376111e-06, 'epoch': 1.66} {'loss': 0.6615, 'learning_rate': 1.3768075816549642e-06, 'epoch': 1.66} {'loss': 0.5679, 'learning_rate': 1.3766418269128478e-06, 'epoch': 1.66} {'loss': 0.5033, 'learning_rate': 1.3764760814114342e-06, 'epoch': 1.66} {'loss': 0.5646, 'learning_rate': 1.3763103451509097e-06, 'epoch': 1.66} {'loss': 0.4977, 'learning_rate': 1.3761446181314442e-06, 'epoch': 1.66} {'loss': 0.4926, 'learning_rate': 1.3759789003532186e-06, 'epoch': 1.66} {'loss': 0.5424, 'learning_rate': 1.3758131918164097e-06, 'epoch': 1.66} {'loss': 0.5097, 'learning_rate': 1.375647492521195e-06, 'epoch': 1.66} {'loss': 0.5912, 'learning_rate': 1.3754818024677552e-06, 'epoch': 1.66} {'loss': 0.4263, 'learning_rate': 1.3753161216562605e-06, 'epoch': 1.66} {'loss': 0.5479, 'learning_rate': 1.3751504500868973e-06, 'epoch': 1.66} {'loss': 0.4562, 'learning_rate': 1.3749847877598366e-06, 'epoch': 1.66} {'loss': 0.6323, 'learning_rate': 1.3748191346752582e-06, 'epoch': 1.66} {'loss': 0.4577, 'learning_rate': 1.3746534908333398e-06, 'epoch': 1.66} {'loss': 0.5888, 'learning_rate': 1.3744878562342579e-06, 'epoch': 1.66} {'loss': 0.4035, 'learning_rate': 1.3743222308781935e-06, 'epoch': 1.66} {'loss': 0.4946, 'learning_rate': 1.3741566147653174e-06, 'epoch': 1.66} {'loss': 0.5075, 'learning_rate': 1.373991007895814e-06, 'epoch': 1.66} {'loss': 0.5086, 'learning_rate': 1.3738254102698568e-06, 'epoch': 1.66} {'loss': 0.3674, 'learning_rate': 1.373659821887624e-06, 'epoch': 1.66} {'loss': 0.3408, 'learning_rate': 1.3734942427492959e-06, 'epoch': 1.66} {'loss': 0.5334, 'learning_rate': 1.3733286728550421e-06, 'epoch': 1.66} {'loss': 0.6052, 'learning_rate': 1.3731631122050494e-06, 'epoch': 1.66} {'loss': 0.4089, 'learning_rate': 1.3729975607994872e-06, 'epoch': 1.66} {'loss': 0.6088, 'learning_rate': 1.3728320186385414e-06, 'epoch': 1.66} {'loss': 0.6598, 'learning_rate': 1.3726664857223826e-06, 'epoch': 1.66} {'loss': 0.4562, 'learning_rate': 1.3725009620511897e-06, 'epoch': 1.66} {'loss': 0.4922, 'learning_rate': 1.372335447625144e-06, 'epoch': 1.66} {'loss': 0.5787, 'learning_rate': 1.3721699424444134e-06, 'epoch': 1.66} {'loss': 0.5926, 'learning_rate': 1.3720044465091875e-06, 'epoch': 1.66} {'loss': 0.3906, 'learning_rate': 1.3718389598196324e-06, 'epoch': 1.66} {'loss': 0.4135, 'learning_rate': 1.3716734823759347e-06, 'epoch': 1.66} {'loss': 0.5247, 'learning_rate': 1.3715080141782655e-06, 'epoch': 1.66} {'loss': 0.5721, 'learning_rate': 1.3713425552268045e-06, 'epoch': 1.66} {'loss': 0.6213, 'learning_rate': 1.3711771055217316e-06, 'epoch': 1.66} {'loss': 0.5485, 'learning_rate': 1.3710116650632155e-06, 'epoch': 1.66} {'loss': 0.4714, 'learning_rate': 1.3708462338514449e-06, 'epoch': 1.66} {'loss': 0.3641, 'learning_rate': 1.3706808118865888e-06, 'epoch': 1.66} {'loss': 0.5551, 'learning_rate': 1.3705153991688258e-06, 'epoch': 1.66} {'loss': 0.7577, 'learning_rate': 1.3703499956983357e-06, 'epoch': 1.66} {'loss': 0.5942, 'learning_rate': 1.3701846014752939e-06, 'epoch': 1.66} {'loss': 0.5215, 'learning_rate': 1.3700192164998816e-06, 'epoch': 1.66} {'loss': 0.5331, 'learning_rate': 1.3698538407722673e-06, 'epoch': 1.66} {'loss': 0.4388, 'learning_rate': 1.3696884742926375e-06, 'epoch': 1.66} {'loss': 0.4759, 'learning_rate': 1.3695231170611633e-06, 'epoch': 1.66} {'loss': 0.6102, 'learning_rate': 1.3693577690780246e-06, 'epoch': 1.66} {'loss': 0.5031, 'learning_rate': 1.369192430343398e-06, 'epoch': 1.66} {'loss': 0.7011, 'learning_rate': 1.3690271008574608e-06, 'epoch': 1.66} {'loss': 0.5258, 'learning_rate': 1.368861780620392e-06, 'epoch': 1.66} {'loss': 0.4184, 'learning_rate': 1.3686964696323623e-06, 'epoch': 1.66} {'loss': 0.534, 'learning_rate': 1.3685311678935575e-06, 'epoch': 1.66} {'loss': 0.4917, 'learning_rate': 1.3683658754041485e-06, 'epoch': 1.66} {'loss': 0.3781, 'learning_rate': 1.368200592164315e-06, 'epoch': 1.66} {'loss': 0.3046, 'learning_rate': 1.3680353181742356e-06, 'epoch': 1.66} {'loss': 0.6005, 'learning_rate': 1.3678700534340806e-06, 'epoch': 1.66} {'loss': 0.5208, 'learning_rate': 1.3677047979440373e-06, 'epoch': 1.66} {'loss': 0.5073, 'learning_rate': 1.3675395517042721e-06, 'epoch': 1.66} {'loss': 0.5301, 'learning_rate': 1.367374314714972e-06, 'epoch': 1.66} {'loss': 0.5233, 'learning_rate': 1.3672090869763077e-06, 'epoch': 1.66} {'loss': 0.5707, 'learning_rate': 1.367043868488458e-06, 'epoch': 1.66} {'loss': 0.573, 'learning_rate': 1.3668786592516014e-06, 'epoch': 1.66} {'loss': 0.3261, 'learning_rate': 1.3667134592659093e-06, 'epoch': 1.66} {'loss': 0.5481, 'learning_rate': 1.366548268531568e-06, 'epoch': 1.66} {'loss': 0.6938, 'learning_rate': 1.366383087048745e-06, 'epoch': 1.66} {'loss': 0.6511, 'learning_rate': 1.3662179148176258e-06, 'epoch': 1.66} {'loss': 0.381, 'learning_rate': 1.3660527518383815e-06, 'epoch': 1.66} {'loss': 0.5918, 'learning_rate': 1.3658875981111907e-06, 'epoch': 1.66} {'loss': 0.6108, 'learning_rate': 1.3657224536362324e-06, 'epoch': 1.66} {'loss': 0.5635, 'learning_rate': 1.3655573184136772e-06, 'epoch': 1.66} {'loss': 0.5364, 'learning_rate': 1.365392192443712e-06, 'epoch': 1.66} {'loss': 0.5069, 'learning_rate': 1.3652270757265062e-06, 'epoch': 1.66} {'loss': 0.5707, 'learning_rate': 1.365061968262238e-06, 'epoch': 1.66} {'loss': 0.5519, 'learning_rate': 1.3648968700510855e-06, 'epoch': 1.66} {'loss': 0.5113, 'learning_rate': 1.364731781093226e-06, 'epoch': 1.66} {'loss': 0.3861, 'learning_rate': 1.3645667013888375e-06, 'epoch': 1.66} {'loss': 0.3764, 'learning_rate': 1.3644016309380903e-06, 'epoch': 1.66} {'loss': 0.4903, 'learning_rate': 1.3642365697411718e-06, 'epoch': 1.66} {'loss': 0.6755, 'learning_rate': 1.3640715177982499e-06, 'epoch': 1.66} {'loss': 0.439, 'learning_rate': 1.3639064751095055e-06, 'epoch': 1.66} {'loss': 0.4896, 'learning_rate': 1.363741441675115e-06, 'epoch': 1.66} {'loss': 0.291, 'learning_rate': 1.3635764174952537e-06, 'epoch': 1.66} {'loss': 0.3445, 'learning_rate': 1.363411402570103e-06, 'epoch': 1.66} {'loss': 0.5462, 'learning_rate': 1.3632463968998322e-06, 'epoch': 1.66} {'loss': 0.5046, 'learning_rate': 1.363081400484626e-06, 'epoch': 1.66} {'loss': 0.4296, 'learning_rate': 1.3629164133246563e-06, 'epoch': 1.66} {'loss': 0.5526, 'learning_rate': 1.362751435420101e-06, 'epoch': 1.66} {'loss': 0.5529, 'learning_rate': 1.3625864667711364e-06, 'epoch': 1.66} {'loss': 0.345, 'learning_rate': 1.3624215073779413e-06, 'epoch': 1.66} {'loss': 0.4627, 'learning_rate': 1.362256557240692e-06, 'epoch': 1.66} {'loss': 0.4622, 'learning_rate': 1.3620916163595633e-06, 'epoch': 1.66} {'loss': 0.5498, 'learning_rate': 1.3619266847347323e-06, 'epoch': 1.66} {'loss': 0.4873, 'learning_rate': 1.3617617623663759e-06, 'epoch': 1.66} {'loss': 0.5486, 'learning_rate': 1.3615968492546727e-06, 'epoch': 1.66} {'loss': 0.652, 'learning_rate': 1.3614319453997982e-06, 'epoch': 1.66} {'loss': 0.5809, 'learning_rate': 1.3612670508019277e-06, 'epoch': 1.66} {'loss': 0.4726, 'learning_rate': 1.3611021654612422e-06, 'epoch': 1.67} {'loss': 0.4951, 'learning_rate': 1.3609372893779137e-06, 'epoch': 1.67} {'loss': 0.5079, 'learning_rate': 1.36077242255212e-06, 'epoch': 1.67} {'loss': 0.6299, 'learning_rate': 1.360607564984039e-06, 'epoch': 1.67} {'loss': 0.3747, 'learning_rate': 1.3604427166738466e-06, 'epoch': 1.67} {'loss': 0.4606, 'learning_rate': 1.3602778776217184e-06, 'epoch': 1.67} {'loss': 0.5123, 'learning_rate': 1.3601130478278336e-06, 'epoch': 1.67} {'loss': 0.5904, 'learning_rate': 1.3599482272923691e-06, 'epoch': 1.67} {'loss': 0.4036, 'learning_rate': 1.3597834160154976e-06, 'epoch': 1.67} {'loss': 0.4784, 'learning_rate': 1.3596186139973988e-06, 'epoch': 1.67} {'loss': 0.4904, 'learning_rate': 1.359453821238248e-06, 'epoch': 1.67} {'loss': 0.4961, 'learning_rate': 1.3592890377382218e-06, 'epoch': 1.67} {'loss': 0.4443, 'learning_rate': 1.3591242634974977e-06, 'epoch': 1.67} {'loss': 0.603, 'learning_rate': 1.3589594985162535e-06, 'epoch': 1.67} {'loss': 0.5116, 'learning_rate': 1.3587947427946634e-06, 'epoch': 1.67} {'loss': 0.6147, 'learning_rate': 1.358629996332903e-06, 'epoch': 1.67} {'loss': 0.6032, 'learning_rate': 1.3584652591311508e-06, 'epoch': 1.67} {'loss': 0.4399, 'learning_rate': 1.3583005311895837e-06, 'epoch': 1.67} {'loss': 0.54, 'learning_rate': 1.3581358125083776e-06, 'epoch': 1.67} {'loss': 0.4917, 'learning_rate': 1.3579711030877084e-06, 'epoch': 1.67} {'loss': 0.381, 'learning_rate': 1.357806402927756e-06, 'epoch': 1.67} {'loss': 0.4369, 'learning_rate': 1.3576417120286912e-06, 'epoch': 1.67} {'loss': 0.4611, 'learning_rate': 1.3574770303906938e-06, 'epoch': 1.67} {'loss': 0.4717, 'learning_rate': 1.357312358013939e-06, 'epoch': 1.67} {'loss': 0.5223, 'learning_rate': 1.357147694898604e-06, 'epoch': 1.67} {'loss': 0.4728, 'learning_rate': 1.356983041044866e-06, 'epoch': 1.67} {'loss': 0.4286, 'learning_rate': 1.3568183964529035e-06, 'epoch': 1.67} {'loss': 0.4298, 'learning_rate': 1.3566537611228869e-06, 'epoch': 1.67} {'loss': 0.4521, 'learning_rate': 1.356489135054997e-06, 'epoch': 1.67} {'loss': 0.6368, 'learning_rate': 1.3563245182494078e-06, 'epoch': 1.67} {'loss': 0.4741, 'learning_rate': 1.3561599107062972e-06, 'epoch': 1.67} {'loss': 0.4321, 'learning_rate': 1.3559953124258417e-06, 'epoch': 1.67} {'loss': 0.5177, 'learning_rate': 1.3558307234082203e-06, 'epoch': 1.67} {'loss': 0.5658, 'learning_rate': 1.3556661436536033e-06, 'epoch': 1.67} {'loss': 0.7082, 'learning_rate': 1.3555015731621713e-06, 'epoch': 1.67} {'loss': 0.4726, 'learning_rate': 1.3553370119340991e-06, 'epoch': 1.67} {'loss': 0.4469, 'learning_rate': 1.3551724599695625e-06, 'epoch': 1.67} {'loss': 0.5187, 'learning_rate': 1.3550079172687402e-06, 'epoch': 1.67} {'loss': 0.4327, 'learning_rate': 1.3548433838318065e-06, 'epoch': 1.67} {'loss': 0.395, 'learning_rate': 1.354678859658941e-06, 'epoch': 1.67} {'loss': 0.567, 'learning_rate': 1.354514344750315e-06, 'epoch': 1.67} {'loss': 0.5515, 'learning_rate': 1.3543498391061071e-06, 'epoch': 1.67} {'loss': 0.488, 'learning_rate': 1.3541853427264939e-06, 'epoch': 1.67} {'loss': 0.5893, 'learning_rate': 1.3540208556116508e-06, 'epoch': 1.67} {'loss': 0.5185, 'learning_rate': 1.3538563777617553e-06, 'epoch': 1.67} {'loss': 0.4744, 'learning_rate': 1.353691909176983e-06, 'epoch': 1.67} {'loss': 0.4871, 'learning_rate': 1.3535274498575124e-06, 'epoch': 1.67} {'loss': 0.3721, 'learning_rate': 1.3533629998035147e-06, 'epoch': 1.67} {'loss': 0.3727, 'learning_rate': 1.3531985590151697e-06, 'epoch': 1.67} {'loss': 0.5374, 'learning_rate': 1.3530341274926528e-06, 'epoch': 1.67} {'loss': 0.6276, 'learning_rate': 1.3528697052361406e-06, 'epoch': 1.67} {'loss': 0.5503, 'learning_rate': 1.3527052922458106e-06, 'epoch': 1.67} {'loss': 0.5738, 'learning_rate': 1.3525408885218327e-06, 'epoch': 1.67} {'loss': 0.4553, 'learning_rate': 1.3523764940643923e-06, 'epoch': 1.67} {'loss': 0.6355, 'learning_rate': 1.3522121088736584e-06, 'epoch': 1.67} {'loss': 0.5201, 'learning_rate': 1.3520477329498105e-06, 'epoch': 1.67} {'loss': 0.2907, 'learning_rate': 1.3518833662930242e-06, 'epoch': 1.67} {'loss': 0.5369, 'learning_rate': 1.3517190089034748e-06, 'epoch': 1.67} {'loss': 0.4042, 'learning_rate': 1.3515546607813413e-06, 'epoch': 1.67} {'loss': 0.3585, 'learning_rate': 1.3513903219267932e-06, 'epoch': 1.67} {'loss': 0.4864, 'learning_rate': 1.351225992340015e-06, 'epoch': 1.67} {'loss': 0.4996, 'learning_rate': 1.3510616720211777e-06, 'epoch': 1.67} {'loss': 0.4447, 'learning_rate': 1.350897360970458e-06, 'epoch': 1.67} {'loss': 0.4053, 'learning_rate': 1.3507330591880341e-06, 'epoch': 1.67} {'loss': 0.5111, 'learning_rate': 1.3505687666740752e-06, 'epoch': 1.67} {'loss': 0.5991, 'learning_rate': 1.3504044834287688e-06, 'epoch': 1.67} {'loss': 0.5522, 'learning_rate': 1.3502402094522792e-06, 'epoch': 1.67} {'loss': 0.4623, 'learning_rate': 1.350075944744792e-06, 'epoch': 1.67} {'loss': 0.5821, 'learning_rate': 1.3499116893064778e-06, 'epoch': 1.67} {'loss': 0.5177, 'learning_rate': 1.3497474431375135e-06, 'epoch': 1.67} {'loss': 0.4911, 'learning_rate': 1.3495832062380777e-06, 'epoch': 1.67} {'loss': 0.7023, 'learning_rate': 1.34941897860834e-06, 'epoch': 1.67} {'loss': 0.4689, 'learning_rate': 1.3492547602484851e-06, 'epoch': 1.67} {'loss': 0.4493, 'learning_rate': 1.3490905511586794e-06, 'epoch': 1.67} {'loss': 0.4897, 'learning_rate': 1.3489263513391093e-06, 'epoch': 1.67} {'loss': 0.4876, 'learning_rate': 1.3487621607899426e-06, 'epoch': 1.67} {'loss': 0.4495, 'learning_rate': 1.3485979795113579e-06, 'epoch': 1.67} {'loss': 0.4992, 'learning_rate': 1.3484338075035342e-06, 'epoch': 1.67} {'loss': 0.4984, 'learning_rate': 1.3482696447666399e-06, 'epoch': 1.67} {'loss': 0.5497, 'learning_rate': 1.3481054913008606e-06, 'epoch': 1.67} {'loss': 0.5125, 'learning_rate': 1.3479413471063617e-06, 'epoch': 1.67} {'loss': 0.5801, 'learning_rate': 1.3477772121833288e-06, 'epoch': 1.67} {'loss': 0.6497, 'learning_rate': 1.3476130865319325e-06, 'epoch': 1.67} {'loss': 0.555, 'learning_rate': 1.3474489701523486e-06, 'epoch': 1.67} {'loss': 0.5036, 'learning_rate': 1.3472848630447566e-06, 'epoch': 1.67} {'loss': 0.3932, 'learning_rate': 1.3471207652093254e-06, 'epoch': 1.67} {'loss': 0.6086, 'learning_rate': 1.3469566766462406e-06, 'epoch': 1.67} {'loss': 0.298, 'learning_rate': 1.3467925973556673e-06, 'epoch': 1.67} {'loss': 0.4083, 'learning_rate': 1.346628527337791e-06, 'epoch': 1.67} {'loss': 0.4444, 'learning_rate': 1.3464644665927818e-06, 'epoch': 1.67} {'loss': 0.3582, 'learning_rate': 1.346300415120816e-06, 'epoch': 1.67} {'loss': 0.4465, 'learning_rate': 1.3461363729220734e-06, 'epoch': 1.67} {'loss': 0.4314, 'learning_rate': 1.3459723399967217e-06, 'epoch': 1.67} {'loss': 0.5124, 'learning_rate': 1.3458083163449465e-06, 'epoch': 1.67} {'loss': 0.5501, 'learning_rate': 1.3456443019669162e-06, 'epoch': 1.67} {'loss': 0.5382, 'learning_rate': 1.34548029686281e-06, 'epoch': 1.67} {'loss': 0.558, 'learning_rate': 1.3453163010328018e-06, 'epoch': 1.67} {'loss': 0.4699, 'learning_rate': 1.3451523144770683e-06, 'epoch': 1.67} {'loss': 0.5078, 'learning_rate': 1.3449883371957885e-06, 'epoch': 1.67} {'loss': 0.3316, 'learning_rate': 1.3448243691891293e-06, 'epoch': 1.67} {'loss': 0.5537, 'learning_rate': 1.3446604104572769e-06, 'epoch': 1.67} {'loss': 0.5064, 'learning_rate': 1.3444964610003996e-06, 'epoch': 1.67} {'loss': 0.4233, 'learning_rate': 1.3443325208186764e-06, 'epoch': 1.67} {'loss': 0.5869, 'learning_rate': 1.3441685899122814e-06, 'epoch': 1.67} {'loss': 0.3815, 'learning_rate': 1.3440046682813913e-06, 'epoch': 1.67} {'loss': 0.5634, 'learning_rate': 1.3438407559261834e-06, 'epoch': 1.67} {'loss': 0.5592, 'learning_rate': 1.343676852846827e-06, 'epoch': 1.67} {'loss': 0.5856, 'learning_rate': 1.343512959043507e-06, 'epoch': 1.67} {'loss': 0.4667, 'learning_rate': 1.3433490745163914e-06, 'epoch': 1.67} {'loss': 0.5372, 'learning_rate': 1.3431851992656586e-06, 'epoch': 1.67} {'loss': 0.5719, 'learning_rate': 1.3430213332914866e-06, 'epoch': 1.67} {'loss': 0.4626, 'learning_rate': 1.342857476594044e-06, 'epoch': 1.67} {'loss': 0.5593, 'learning_rate': 1.342693629173516e-06, 'epoch': 1.67} {'loss': 0.5563, 'learning_rate': 1.3425297910300682e-06, 'epoch': 1.67} {'loss': 0.5388, 'learning_rate': 1.3423659621638852e-06, 'epoch': 1.67} {'loss': 0.5167, 'learning_rate': 1.3422021425751364e-06, 'epoch': 1.67} {'loss': 0.4612, 'learning_rate': 1.3420383322639996e-06, 'epoch': 1.67} {'loss': 0.5345, 'learning_rate': 1.3418745312306524e-06, 'epoch': 1.67} {'loss': 0.4445, 'learning_rate': 1.3417107394752637e-06, 'epoch': 1.67} {'loss': 0.604, 'learning_rate': 1.3415469569980177e-06, 'epoch': 1.67} {'loss': 0.4937, 'learning_rate': 1.3413831837990842e-06, 'epoch': 1.67} {'loss': 0.5815, 'learning_rate': 1.3412194198786387e-06, 'epoch': 1.67} {'loss': 0.581, 'learning_rate': 1.341055665236859e-06, 'epoch': 1.67} {'loss': 0.4737, 'learning_rate': 1.340891919873919e-06, 'epoch': 1.67} {'loss': 0.5515, 'learning_rate': 1.3407281837899978e-06, 'epoch': 1.67} {'loss': 0.2914, 'learning_rate': 1.3405644569852638e-06, 'epoch': 1.67} {'loss': 0.5907, 'learning_rate': 1.3404007394598994e-06, 'epoch': 1.67} {'loss': 0.564, 'learning_rate': 1.3402370312140766e-06, 'epoch': 1.67} {'loss': 0.465, 'learning_rate': 1.340073332247971e-06, 'epoch': 1.67} {'loss': 0.522, 'learning_rate': 1.3399096425617574e-06, 'epoch': 1.67} {'loss': 0.4608, 'learning_rate': 1.339745962155613e-06, 'epoch': 1.67} {'loss': 0.4391, 'learning_rate': 1.339582291029715e-06, 'epoch': 1.67} {'loss': 0.3818, 'learning_rate': 1.3394186291842315e-06, 'epoch': 1.67} {'loss': 0.4005, 'learning_rate': 1.3392549766193475e-06, 'epoch': 1.67} {'loss': 0.7107, 'learning_rate': 1.3390913333352307e-06, 'epoch': 1.67} {'loss': 0.408, 'learning_rate': 1.3389276993320587e-06, 'epoch': 1.67} {'loss': 0.4717, 'learning_rate': 1.3387640746100083e-06, 'epoch': 1.67} {'loss': 0.4867, 'learning_rate': 1.3386004591692535e-06, 'epoch': 1.67} {'loss': 0.3594, 'learning_rate': 1.3384368530099723e-06, 'epoch': 1.67} {'loss': 0.5394, 'learning_rate': 1.3382732561323353e-06, 'epoch': 1.67} {'loss': 0.462, 'learning_rate': 1.3381096685365213e-06, 'epoch': 1.67} {'loss': 0.6221, 'learning_rate': 1.3379460902227036e-06, 'epoch': 1.67} {'loss': 0.4895, 'learning_rate': 1.3377825211910588e-06, 'epoch': 1.67} {'loss': 0.4841, 'learning_rate': 1.3376189614417611e-06, 'epoch': 1.67} {'loss': 0.5278, 'learning_rate': 1.3374554109749872e-06, 'epoch': 1.67} {'loss': 0.6508, 'learning_rate': 1.3372918697909144e-06, 'epoch': 1.67} {'loss': 0.3911, 'learning_rate': 1.3371283378897127e-06, 'epoch': 1.67} {'loss': 0.4811, 'learning_rate': 1.3369648152715598e-06, 'epoch': 1.67} {'loss': 0.6063, 'learning_rate': 1.33680130193663e-06, 'epoch': 1.67} {'loss': 0.5031, 'learning_rate': 1.3366377978851008e-06, 'epoch': 1.67} {'loss': 0.4789, 'learning_rate': 1.3364743031171456e-06, 'epoch': 1.67} {'loss': 0.5196, 'learning_rate': 1.336310817632942e-06, 'epoch': 1.67} {'loss': 0.5182, 'learning_rate': 1.336147341432662e-06, 'epoch': 1.67} {'loss': 0.4781, 'learning_rate': 1.335983874516481e-06, 'epoch': 1.67} {'loss': 0.5504, 'learning_rate': 1.3358204168845757e-06, 'epoch': 1.67} {'loss': 0.5217, 'learning_rate': 1.3356569685371213e-06, 'epoch': 1.67} {'loss': 0.4909, 'learning_rate': 1.3354935294742922e-06, 'epoch': 1.67} {'loss': 0.5198, 'learning_rate': 1.3353300996962638e-06, 'epoch': 1.67} {'loss': 0.5124, 'learning_rate': 1.3351666792032126e-06, 'epoch': 1.67} {'loss': 0.4024, 'learning_rate': 1.3350032679953107e-06, 'epoch': 1.67} {'loss': 0.5527, 'learning_rate': 1.3348398660727357e-06, 'epoch': 1.67} {'loss': 0.4327, 'learning_rate': 1.334676473435661e-06, 'epoch': 1.67} {'loss': 0.5303, 'learning_rate': 1.334513090084263e-06, 'epoch': 1.67} {'loss': 0.5432, 'learning_rate': 1.3343497160187158e-06, 'epoch': 1.67} {'loss': 0.4919, 'learning_rate': 1.3341863512391951e-06, 'epoch': 1.67} {'loss': 0.5023, 'learning_rate': 1.3340229957458783e-06, 'epoch': 1.67} {'loss': 0.5053, 'learning_rate': 1.3338596495389356e-06, 'epoch': 1.67} {'loss': 0.4356, 'learning_rate': 1.3336963126185454e-06, 'epoch': 1.67} {'loss': 0.4593, 'learning_rate': 1.333532984984881e-06, 'epoch': 1.67} {'loss': 0.5507, 'learning_rate': 1.3333696666381179e-06, 'epoch': 1.67} {'loss': 0.5059, 'learning_rate': 1.3332063575784338e-06, 'epoch': 1.67} {'loss': 0.3912, 'learning_rate': 1.3330430578059972e-06, 'epoch': 1.67} {'loss': 0.4971, 'learning_rate': 1.3328797673209914e-06, 'epoch': 1.67} {'loss': 0.5675, 'learning_rate': 1.3327164861235853e-06, 'epoch': 1.67} {'loss': 0.5042, 'learning_rate': 1.3325532142139553e-06, 'epoch': 1.67} {'loss': 0.4235, 'learning_rate': 1.3323899515922768e-06, 'epoch': 1.67} {'loss': 0.6707, 'learning_rate': 1.3322266982587252e-06, 'epoch': 1.67} {'loss': 0.4773, 'learning_rate': 1.332063454213477e-06, 'epoch': 1.67} {'loss': 0.5967, 'learning_rate': 1.3319002194566998e-06, 'epoch': 1.67} {'loss': 0.533, 'learning_rate': 1.3317369939885793e-06, 'epoch': 1.67} {'loss': 0.5358, 'learning_rate': 1.331573777809283e-06, 'epoch': 1.67} {'loss': 0.5016, 'learning_rate': 1.3314105709189872e-06, 'epoch': 1.67} {'loss': 0.4537, 'learning_rate': 1.3312473733178676e-06, 'epoch': 1.67} {'loss': 0.546, 'learning_rate': 1.3310841850060984e-06, 'epoch': 1.67} {'loss': 0.3956, 'learning_rate': 1.3309210059838585e-06, 'epoch': 1.67} {'loss': 0.5745, 'learning_rate': 1.330757836251315e-06, 'epoch': 1.67} {'loss': 0.5999, 'learning_rate': 1.3305946758086485e-06, 'epoch': 1.67} {'loss': 0.6451, 'learning_rate': 1.3304315246560317e-06, 'epoch': 1.67} {'loss': 0.5333, 'learning_rate': 1.3302683827936403e-06, 'epoch': 1.67} {'loss': 0.4862, 'learning_rate': 1.3301052502216505e-06, 'epoch': 1.67} {'loss': 0.3166, 'learning_rate': 1.3299421269402312e-06, 'epoch': 1.67} {'loss': 0.5472, 'learning_rate': 1.3297790129495657e-06, 'epoch': 1.67} {'loss': 0.5737, 'learning_rate': 1.3296159082498229e-06, 'epoch': 1.67} {'loss': 0.5548, 'learning_rate': 1.3294528128411788e-06, 'epoch': 1.67} {'loss': 0.5381, 'learning_rate': 1.329289726723808e-06, 'epoch': 1.67} {'loss': 0.4683, 'learning_rate': 1.3291266498978862e-06, 'epoch': 1.67} {'loss': 0.5368, 'learning_rate': 1.3289635823635905e-06, 'epoch': 1.67} {'loss': 0.4533, 'learning_rate': 1.3288005241210887e-06, 'epoch': 1.67} {'loss': 0.4043, 'learning_rate': 1.3286374751705634e-06, 'epoch': 1.67} {'loss': 0.4864, 'learning_rate': 1.3284744355121836e-06, 'epoch': 1.67} {'loss': 0.4435, 'learning_rate': 1.3283114051461266e-06, 'epoch': 1.67} {'loss': 0.5609, 'learning_rate': 1.3281483840725662e-06, 'epoch': 1.67} {'loss': 0.6942, 'learning_rate': 1.327985372291677e-06, 'epoch': 1.67} {'loss': 0.4345, 'learning_rate': 1.3278223698036375e-06, 'epoch': 1.67} {'loss': 0.5276, 'learning_rate': 1.3276593766086144e-06, 'epoch': 1.67} {'loss': 0.5368, 'learning_rate': 1.3274963927067908e-06, 'epoch': 1.67} {'loss': 0.5226, 'learning_rate': 1.3273334180983355e-06, 'epoch': 1.67} {'loss': 0.5192, 'learning_rate': 1.327170452783425e-06, 'epoch': 1.67} {'loss': 0.5439, 'learning_rate': 1.3270074967622372e-06, 'epoch': 1.67} {'loss': 0.4607, 'learning_rate': 1.326844550034938e-06, 'epoch': 1.67} {'loss': 0.6095, 'learning_rate': 1.3266816126017135e-06, 'epoch': 1.67} {'loss': 0.4946, 'learning_rate': 1.3265186844627277e-06, 'epoch': 1.67} {'loss': 0.4514, 'learning_rate': 1.3263557656181637e-06, 'epoch': 1.67} {'loss': 0.4117, 'learning_rate': 1.3261928560681902e-06, 'epoch': 1.67} {'loss': 0.5852, 'learning_rate': 1.3260299558129841e-06, 'epoch': 1.67} {'loss': 0.5114, 'learning_rate': 1.3258670648527217e-06, 'epoch': 1.67} {'loss': 0.392, 'learning_rate': 1.3257041831875717e-06, 'epoch': 1.67} {'loss': 0.6553, 'learning_rate': 1.3255413108177173e-06, 'epoch': 1.67} {'loss': 0.5226, 'learning_rate': 1.325378447743323e-06, 'epoch': 1.67} {'loss': 0.4582, 'learning_rate': 1.325215593964574e-06, 'epoch': 1.67} {'loss': 0.6241, 'learning_rate': 1.3250527494816367e-06, 'epoch': 1.67} {'loss': 0.5619, 'learning_rate': 1.3248899142946881e-06, 'epoch': 1.67} {'loss': 0.5414, 'learning_rate': 1.3247270884039053e-06, 'epoch': 1.67} {'loss': 0.485, 'learning_rate': 1.3245642718094565e-06, 'epoch': 1.67} {'loss': 0.4851, 'learning_rate': 1.3244014645115245e-06, 'epoch': 1.67} {'loss': 0.456, 'learning_rate': 1.3242386665102736e-06, 'epoch': 1.67} {'loss': 0.4357, 'learning_rate': 1.3240758778058894e-06, 'epoch': 1.67} {'loss': 0.5682, 'learning_rate': 1.3239130983985394e-06, 'epoch': 1.67} {'loss': 0.3602, 'learning_rate': 1.323750328288399e-06, 'epoch': 1.67} {'loss': 0.3003, 'learning_rate': 1.3235875674756448e-06, 'epoch': 1.67} {'loss': 0.46, 'learning_rate': 1.3234248159604456e-06, 'epoch': 1.67} {'loss': 0.5888, 'learning_rate': 1.3232620737429848e-06, 'epoch': 1.67} {'loss': 0.5645, 'learning_rate': 1.3230993408234262e-06, 'epoch': 1.67} {'loss': 0.3951, 'learning_rate': 1.3229366172019553e-06, 'epoch': 1.67} {'loss': 0.4781, 'learning_rate': 1.322773902878739e-06, 'epoch': 1.67} {'loss': 0.4744, 'learning_rate': 1.3226111978539525e-06, 'epoch': 1.67} {'loss': 0.4201, 'learning_rate': 1.3224485021277745e-06, 'epoch': 1.67} {'loss': 0.4042, 'learning_rate': 1.3222858157003704e-06, 'epoch': 1.67} {'loss': 0.5619, 'learning_rate': 1.3221231385719258e-06, 'epoch': 1.67} {'loss': 0.6007, 'learning_rate': 1.321960470742607e-06, 'epoch': 1.67} {'loss': 0.5021, 'learning_rate': 1.3217978122125908e-06, 'epoch': 1.67} {'loss': 0.4122, 'learning_rate': 1.321635162982051e-06, 'epoch': 1.67} {'loss': 0.6445, 'learning_rate': 1.321472523051164e-06, 'epoch': 1.67} {'loss': 0.3608, 'learning_rate': 1.321309892420103e-06, 'epoch': 1.67} {'loss': 0.4024, 'learning_rate': 1.3211472710890382e-06, 'epoch': 1.67} {'loss': 0.5615, 'learning_rate': 1.320984659058151e-06, 'epoch': 1.67} {'loss': 0.5186, 'learning_rate': 1.3208220563276108e-06, 'epoch': 1.67} {'loss': 0.4985, 'learning_rate': 1.3206594628975922e-06, 'epoch': 1.67} {'loss': 0.583, 'learning_rate': 1.3204968787682714e-06, 'epoch': 1.67} {'loss': 0.3778, 'learning_rate': 1.3203343039398209e-06, 'epoch': 1.67} {'loss': 0.3763, 'learning_rate': 1.320171738412418e-06, 'epoch': 1.67} {'loss': 0.5531, 'learning_rate': 1.3200091821862292e-06, 'epoch': 1.67} {'loss': 0.4062, 'learning_rate': 1.3198466352614392e-06, 'epoch': 1.67} {'loss': 0.521, 'learning_rate': 1.3196840976382152e-06, 'epoch': 1.67} {'loss': 0.4942, 'learning_rate': 1.319521569316733e-06, 'epoch': 1.67} {'loss': 0.4841, 'learning_rate': 1.3193590502971664e-06, 'epoch': 1.67} {'loss': 0.4351, 'learning_rate': 1.3191965405796902e-06, 'epoch': 1.67} {'loss': 0.5339, 'learning_rate': 1.3190340401644807e-06, 'epoch': 1.67} {'loss': 0.544, 'learning_rate': 1.3188715490517067e-06, 'epoch': 1.67} {'loss': 0.5322, 'learning_rate': 1.318709067241547e-06, 'epoch': 1.67} {'loss': 0.596, 'learning_rate': 1.3185465947341724e-06, 'epoch': 1.67} {'loss': 0.3619, 'learning_rate': 1.3183841315297597e-06, 'epoch': 1.67} {'loss': 0.6231, 'learning_rate': 1.3182216776284818e-06, 'epoch': 1.67} {'loss': 0.6396, 'learning_rate': 1.318059233030513e-06, 'epoch': 1.67} {'loss': 0.6401, 'learning_rate': 1.3178967977360291e-06, 'epoch': 1.67} {'loss': 0.6332, 'learning_rate': 1.3177343717452007e-06, 'epoch': 1.67} {'loss': 0.4634, 'learning_rate': 1.3175719550582033e-06, 'epoch': 1.67} {'loss': 0.4306, 'learning_rate': 1.3174095476752113e-06, 'epoch': 1.67} {'loss': 0.4571, 'learning_rate': 1.317247149596399e-06, 'epoch': 1.67} {'loss': 0.4494, 'learning_rate': 1.3170847608219418e-06, 'epoch': 1.67} {'loss': 0.5073, 'learning_rate': 1.3169223813520072e-06, 'epoch': 1.67} {'loss': 0.4582, 'learning_rate': 1.3167600111867785e-06, 'epoch': 1.67} {'loss': 0.545, 'learning_rate': 1.3165976503264234e-06, 'epoch': 1.67} {'loss': 0.5822, 'learning_rate': 1.3164352987711171e-06, 'epoch': 1.67} {'loss': 0.4235, 'learning_rate': 1.316272956521034e-06, 'epoch': 1.67} {'loss': 0.5163, 'learning_rate': 1.3161106235763488e-06, 'epoch': 1.67} {'loss': 0.3809, 'learning_rate': 1.3159482999372375e-06, 'epoch': 1.67} {'loss': 0.5045, 'learning_rate': 1.3157859856038678e-06, 'epoch': 1.67} {'loss': 0.5101, 'learning_rate': 1.315623680576419e-06, 'epoch': 1.67} {'loss': 0.5488, 'learning_rate': 1.3154613848550612e-06, 'epoch': 1.67} {'loss': 0.6848, 'learning_rate': 1.3152990984399716e-06, 'epoch': 1.67} {'loss': 0.444, 'learning_rate': 1.315136821331323e-06, 'epoch': 1.67} {'loss': 0.5409, 'learning_rate': 1.3149745535292878e-06, 'epoch': 1.67} {'loss': 0.5992, 'learning_rate': 1.3148122950340447e-06, 'epoch': 1.67} {'loss': 0.5442, 'learning_rate': 1.3146500458457622e-06, 'epoch': 1.67} {'loss': 0.4987, 'learning_rate': 1.3144878059646149e-06, 'epoch': 1.67} {'loss': 0.4768, 'learning_rate': 1.314325575390779e-06, 'epoch': 1.67} {'loss': 0.538, 'learning_rate': 1.3141633541244259e-06, 'epoch': 1.67} {'loss': 0.4841, 'learning_rate': 1.3140011421657317e-06, 'epoch': 1.67} {'loss': 0.5315, 'learning_rate': 1.3138389395148687e-06, 'epoch': 1.67} {'loss': 0.5594, 'learning_rate': 1.3136767461720135e-06, 'epoch': 1.67} {'loss': 0.4592, 'learning_rate': 1.3135145621373357e-06, 'epoch': 1.67} {'loss': 0.5002, 'learning_rate': 1.313352387411011e-06, 'epoch': 1.67} {'loss': 0.402, 'learning_rate': 1.3131902219932137e-06, 'epoch': 1.67} {'loss': 0.6045, 'learning_rate': 1.3130280658841165e-06, 'epoch': 1.67} {'loss': 0.475, 'learning_rate': 1.3128659190838945e-06, 'epoch': 1.67} {'loss': 0.4568, 'learning_rate': 1.3127037815927213e-06, 'epoch': 1.67} {'loss': 0.4281, 'learning_rate': 1.3125416534107694e-06, 'epoch': 1.67} {'loss': 0.5209, 'learning_rate': 1.3123795345382128e-06, 'epoch': 1.67} {'loss': 0.6219, 'learning_rate': 1.312217424975225e-06, 'epoch': 1.67} {'loss': 0.3728, 'learning_rate': 1.3120553247219813e-06, 'epoch': 1.67} {'loss': 0.5695, 'learning_rate': 1.3118932337786539e-06, 'epoch': 1.67} {'loss': 0.5793, 'learning_rate': 1.311731152145418e-06, 'epoch': 1.67} {'loss': 0.4557, 'learning_rate': 1.3115690798224468e-06, 'epoch': 1.67} {'loss': 0.5033, 'learning_rate': 1.3114070168099125e-06, 'epoch': 1.67} {'loss': 0.6075, 'learning_rate': 1.3112449631079893e-06, 'epoch': 1.67} {'loss': 0.3985, 'learning_rate': 1.3110829187168517e-06, 'epoch': 1.67} {'loss': 0.4532, 'learning_rate': 1.3109208836366726e-06, 'epoch': 1.67} {'loss': 0.6613, 'learning_rate': 1.3107588578676266e-06, 'epoch': 1.67} {'loss': 0.3478, 'learning_rate': 1.310596841409887e-06, 'epoch': 1.67} {'loss': 0.5259, 'learning_rate': 1.3104348342636286e-06, 'epoch': 1.67} {'loss': 0.4404, 'learning_rate': 1.3102728364290219e-06, 'epoch': 1.67} {'loss': 0.5571, 'learning_rate': 1.3101108479062408e-06, 'epoch': 1.67} {'loss': 0.5334, 'learning_rate': 1.309948868695462e-06, 'epoch': 1.67} {'loss': 0.6716, 'learning_rate': 1.3097868987968565e-06, 'epoch': 1.67} {'loss': 0.4859, 'learning_rate': 1.3096249382106007e-06, 'epoch': 1.67} {'loss': 0.5037, 'learning_rate': 1.3094629869368613e-06, 'epoch': 1.67} {'loss': 0.5457, 'learning_rate': 1.3093010449758225e-06, 'epoch': 1.67} {'loss': 0.544, 'learning_rate': 1.3091391123276487e-06, 'epoch': 1.67} {'loss': 0.4639, 'learning_rate': 1.3089771889925173e-06, 'epoch': 1.67} {'loss': 0.3255, 'learning_rate': 1.3088152749706007e-06, 'epoch': 1.67} {'loss': 0.4787, 'learning_rate': 1.308653370262073e-06, 'epoch': 1.67} {'loss': 0.6012, 'learning_rate': 1.3084914748671106e-06, 'epoch': 1.67} {'loss': 0.6224, 'learning_rate': 1.3083295887858793e-06, 'epoch': 1.67} {'loss': 0.4115, 'learning_rate': 1.308167712018561e-06, 'epoch': 1.67} {'loss': 0.6303, 'learning_rate': 1.3080058445653242e-06, 'epoch': 1.67} {'loss': 0.5428, 'learning_rate': 1.3078439864263438e-06, 'epoch': 1.67} {'loss': 0.5515, 'learning_rate': 1.3076821376017946e-06, 'epoch': 1.67} {'loss': 0.5778, 'learning_rate': 1.3075202980918433e-06, 'epoch': 1.67} {'loss': 0.4495, 'learning_rate': 1.3073584678966743e-06, 'epoch': 1.67} {'loss': 0.6181, 'learning_rate': 1.307196647016451e-06, 'epoch': 1.67} {'loss': 0.4129, 'learning_rate': 1.307034835451355e-06, 'epoch': 1.67} {'loss': 0.4864, 'learning_rate': 1.3068730332015534e-06, 'epoch': 1.67} {'loss': 0.5541, 'learning_rate': 1.3067112402672222e-06, 'epoch': 1.67} {'loss': 0.5805, 'learning_rate': 1.306549456648536e-06, 'epoch': 1.67} {'loss': 0.5279, 'learning_rate': 1.3063876823456634e-06, 'epoch': 1.67} {'loss': 0.4759, 'learning_rate': 1.3062259173587843e-06, 'epoch': 1.67} {'loss': 0.597, 'learning_rate': 1.3060641616880675e-06, 'epoch': 1.67} {'loss': 0.4331, 'learning_rate': 1.3059024153336874e-06, 'epoch': 1.67} {'loss': 0.3763, 'learning_rate': 1.3057406782958182e-06, 'epoch': 1.67} {'loss': 0.6258, 'learning_rate': 1.305578950574632e-06, 'epoch': 1.67} {'loss': 0.6005, 'learning_rate': 1.305417232170304e-06, 'epoch': 1.67} {'loss': 0.5976, 'learning_rate': 1.3052555230830032e-06, 'epoch': 1.67} {'loss': 0.3506, 'learning_rate': 1.3050938233129096e-06, 'epoch': 1.67} {'loss': 0.5355, 'learning_rate': 1.3049321328601904e-06, 'epoch': 1.67} {'loss': 0.5045, 'learning_rate': 1.3047704517250215e-06, 'epoch': 1.67} {'loss': 0.4474, 'learning_rate': 1.3046087799075756e-06, 'epoch': 1.67} {'loss': 0.4371, 'learning_rate': 1.3044471174080264e-06, 'epoch': 1.67} {'loss': 0.4168, 'learning_rate': 1.304285464226549e-06, 'epoch': 1.67} {'loss': 0.48, 'learning_rate': 1.30412382036331e-06, 'epoch': 1.67} {'loss': 0.5462, 'learning_rate': 1.3039621858184914e-06, 'epoch': 1.67} {'loss': 0.6345, 'learning_rate': 1.3038005605922599e-06, 'epoch': 1.67} {'loss': 0.5575, 'learning_rate': 1.303638944684792e-06, 'epoch': 1.67} {'loss': 0.5517, 'learning_rate': 1.3034773380962617e-06, 'epoch': 1.67} {'loss': 0.4959, 'learning_rate': 1.303315740826836e-06, 'epoch': 1.67} {'loss': 0.5243, 'learning_rate': 1.3031541528766956e-06, 'epoch': 1.67} {'loss': 0.4427, 'learning_rate': 1.302992574246007e-06, 'epoch': 1.67} {'loss': 0.5829, 'learning_rate': 1.3028310049349512e-06, 'epoch': 1.67} {'loss': 0.551, 'learning_rate': 1.302669444943695e-06, 'epoch': 1.67} {'loss': 0.591, 'learning_rate': 1.3025078942724135e-06, 'epoch': 1.67} {'loss': 0.4453, 'learning_rate': 1.3023463529212822e-06, 'epoch': 1.67} {'loss': 0.6046, 'learning_rate': 1.3021848208904665e-06, 'epoch': 1.67} {'loss': 0.5479, 'learning_rate': 1.3020232981801495e-06, 'epoch': 1.67} {'loss': 0.4813, 'learning_rate': 1.3018617847904957e-06, 'epoch': 1.67} {'loss': 0.4464, 'learning_rate': 1.3017002807216862e-06, 'epoch': 1.67} {'loss': 0.6606, 'learning_rate': 1.301538785973887e-06, 'epoch': 1.67} {'loss': 0.4974, 'learning_rate': 1.301377300547274e-06, 'epoch': 1.67} {'loss': 0.5832, 'learning_rate': 1.3012158244420237e-06, 'epoch': 1.67} {'loss': 0.5632, 'learning_rate': 1.3010543576583011e-06, 'epoch': 1.67} {'loss': 0.3991, 'learning_rate': 1.3008929001962878e-06, 'epoch': 1.67} {'loss': 0.514, 'learning_rate': 1.3007314520561486e-06, 'epoch': 1.67} {'loss': 0.4674, 'learning_rate': 1.300570013238065e-06, 'epoch': 1.67} {'loss': 0.597, 'learning_rate': 1.3004085837422043e-06, 'epoch': 1.67} {'loss': 0.5124, 'learning_rate': 1.3002471635687408e-06, 'epoch': 1.67} {'loss': 0.3964, 'learning_rate': 1.300085752717849e-06, 'epoch': 1.67} {'loss': 0.518, 'learning_rate': 1.2999243511896974e-06, 'epoch': 1.67} {'loss': 0.4998, 'learning_rate': 1.2997629589844652e-06, 'epoch': 1.67} {'loss': 0.69, 'learning_rate': 1.2996015761023195e-06, 'epoch': 1.67} {'loss': 0.4126, 'learning_rate': 1.2994402025434393e-06, 'epoch': 1.67} {'loss': 0.4688, 'learning_rate': 1.2992788383079912e-06, 'epoch': 1.67} {'loss': 0.4777, 'learning_rate': 1.2991174833961528e-06, 'epoch': 1.67} {'loss': 0.4341, 'learning_rate': 1.2989561378080961e-06, 'epoch': 1.67} {'loss': 0.5007, 'learning_rate': 1.29879480154399e-06, 'epoch': 1.67} {'loss': 0.5613, 'learning_rate': 1.2986334746040141e-06, 'epoch': 1.67} {'loss': 0.4696, 'learning_rate': 1.2984721569883362e-06, 'epoch': 1.67} {'loss': 0.5699, 'learning_rate': 1.2983108486971307e-06, 'epoch': 1.67} {'loss': 0.365, 'learning_rate': 1.2981495497305697e-06, 'epoch': 1.67} {'loss': 0.4676, 'learning_rate': 1.2979882600888272e-06, 'epoch': 1.67} {'loss': 0.5388, 'learning_rate': 1.2978269797720788e-06, 'epoch': 1.67} {'loss': 0.5379, 'learning_rate': 1.297665708780489e-06, 'epoch': 1.67} {'loss': 0.3946, 'learning_rate': 1.2975044471142406e-06, 'epoch': 1.67} {'loss': 0.4657, 'learning_rate': 1.2973431947734982e-06, 'epoch': 1.67} {'loss': 0.6202, 'learning_rate': 1.2971819517584393e-06, 'epoch': 1.67} {'loss': 0.525, 'learning_rate': 1.2970207180692352e-06, 'epoch': 1.67} {'loss': 0.4995, 'learning_rate': 1.2968594937060587e-06, 'epoch': 1.67} {'loss': 0.4242, 'learning_rate': 1.2966982786690852e-06, 'epoch': 1.67} {'loss': 0.5469, 'learning_rate': 1.2965370729584803e-06, 'epoch': 1.67} {'loss': 0.5354, 'learning_rate': 1.2963758765744261e-06, 'epoch': 1.67} {'loss': 0.5683, 'learning_rate': 1.296214689517089e-06, 'epoch': 1.67} {'loss': 0.43, 'learning_rate': 1.2960535117866425e-06, 'epoch': 1.67} {'loss': 0.439, 'learning_rate': 1.2958923433832604e-06, 'epoch': 1.67} {'loss': 0.5149, 'learning_rate': 1.2957311843071153e-06, 'epoch': 1.67} {'loss': 0.4433, 'learning_rate': 1.2955700345583822e-06, 'epoch': 1.67} {'loss': 0.5236, 'learning_rate': 1.2954088941372301e-06, 'epoch': 1.67} {'loss': 0.3743, 'learning_rate': 1.295247763043832e-06, 'epoch': 1.67} {'loss': 0.5223, 'learning_rate': 1.2950866412783613e-06, 'epoch': 1.67} {'loss': 0.3907, 'learning_rate': 1.2949255288409912e-06, 'epoch': 1.67} {'loss': 0.5124, 'learning_rate': 1.2947644257318948e-06, 'epoch': 1.67} {'loss': 0.4709, 'learning_rate': 1.294603331951243e-06, 'epoch': 1.67} {'loss': 0.4809, 'learning_rate': 1.2944422474992125e-06, 'epoch': 1.67} {'loss': 0.4361, 'learning_rate': 1.2942811723759697e-06, 'epoch': 1.67} {'loss': 0.5597, 'learning_rate': 1.294120106581691e-06, 'epoch': 1.67} {'loss': 0.5431, 'learning_rate': 1.293959050116549e-06, 'epoch': 1.67} {'loss': 0.4925, 'learning_rate': 1.293798002980714e-06, 'epoch': 1.67} {'loss': 0.5211, 'learning_rate': 1.2936369651743619e-06, 'epoch': 1.67} {'loss': 0.5176, 'learning_rate': 1.2934759366976646e-06, 'epoch': 1.67} {'loss': 0.5526, 'learning_rate': 1.293314917550792e-06, 'epoch': 1.67} {'loss': 0.5079, 'learning_rate': 1.2931539077339184e-06, 'epoch': 1.67} {'loss': 0.5673, 'learning_rate': 1.2929929072472158e-06, 'epoch': 1.67} {'loss': 0.6781, 'learning_rate': 1.2928319160908575e-06, 'epoch': 1.67} {'loss': 0.522, 'learning_rate': 1.2926709342650156e-06, 'epoch': 1.67} {'loss': 0.633, 'learning_rate': 1.2925099617698623e-06, 'epoch': 1.67} {'loss': 0.4652, 'learning_rate': 1.2923489986055726e-06, 'epoch': 1.67} {'loss': 0.567, 'learning_rate': 1.2921880447723157e-06, 'epoch': 1.67} {'loss': 0.6012, 'learning_rate': 1.2920271002702644e-06, 'epoch': 1.67} {'loss': 0.5036, 'learning_rate': 1.2918661650995923e-06, 'epoch': 1.67} {'loss': 0.5951, 'learning_rate': 1.2917052392604712e-06, 'epoch': 1.67} {'loss': 0.6382, 'learning_rate': 1.2915443227530744e-06, 'epoch': 1.67} {'loss': 0.6078, 'learning_rate': 1.2913834155775752e-06, 'epoch': 1.67} {'loss': 0.4998, 'learning_rate': 1.291222517734143e-06, 'epoch': 1.67} {'loss': 0.4233, 'learning_rate': 1.2910616292229527e-06, 'epoch': 1.67} {'loss': 0.5074, 'learning_rate': 1.290900750044175e-06, 'epoch': 1.67} {'loss': 0.5499, 'learning_rate': 1.2907398801979832e-06, 'epoch': 1.67} {'loss': 0.4173, 'learning_rate': 1.2905790196845502e-06, 'epoch': 1.67} {'loss': 0.3797, 'learning_rate': 1.2904181685040496e-06, 'epoch': 1.67} {'loss': 0.5002, 'learning_rate': 1.2902573266566497e-06, 'epoch': 1.67} {'loss': 0.5409, 'learning_rate': 1.2900964941425253e-06, 'epoch': 1.67} {'loss': 0.5648, 'learning_rate': 1.2899356709618482e-06, 'epoch': 1.67} {'loss': 0.6715, 'learning_rate': 1.2897748571147917e-06, 'epoch': 1.67} {'loss': 0.5902, 'learning_rate': 1.2896140526015277e-06, 'epoch': 1.67} {'loss': 0.5868, 'learning_rate': 1.2894532574222284e-06, 'epoch': 1.67} {'loss': 0.5688, 'learning_rate': 1.2892924715770683e-06, 'epoch': 1.67} {'loss': 0.55, 'learning_rate': 1.2891316950662146e-06, 'epoch': 1.67} {'loss': 0.4764, 'learning_rate': 1.2889709278898432e-06, 'epoch': 1.67} {'loss': 0.4437, 'learning_rate': 1.288810170048126e-06, 'epoch': 1.67} {'loss': 0.5217, 'learning_rate': 1.2886494215412348e-06, 'epoch': 1.67} {'loss': 0.5435, 'learning_rate': 1.288488682369341e-06, 'epoch': 1.67} {'loss': 0.5685, 'learning_rate': 1.2883279525326187e-06, 'epoch': 1.67} {'loss': 0.4925, 'learning_rate': 1.288167232031241e-06, 'epoch': 1.67} {'loss': 0.5417, 'learning_rate': 1.2880065208653769e-06, 'epoch': 1.67} {'loss': 0.5419, 'learning_rate': 1.2878458190351994e-06, 'epoch': 1.67} {'loss': 0.471, 'learning_rate': 1.2876851265408818e-06, 'epoch': 1.67} {'loss': 0.4267, 'learning_rate': 1.287524443382596e-06, 'epoch': 1.67} {'loss': 0.4385, 'learning_rate': 1.2873637695605168e-06, 'epoch': 1.67} {'loss': 0.4059, 'learning_rate': 1.287203105074808e-06, 'epoch': 1.67} {'loss': 0.5805, 'learning_rate': 1.287042449925653e-06, 'epoch': 1.67} {'loss': 0.4941, 'learning_rate': 1.2868818041132159e-06, 'epoch': 1.67} {'loss': 0.5193, 'learning_rate': 1.28672116763767e-06, 'epoch': 1.67} {'loss': 0.3842, 'learning_rate': 1.286560540499191e-06, 'epoch': 1.67} {'loss': 0.4541, 'learning_rate': 1.2863999226979473e-06, 'epoch': 1.67} {'loss': 0.4897, 'learning_rate': 1.2862393142341156e-06, 'epoch': 1.67} {'loss': 0.5173, 'learning_rate': 1.2860787151078602e-06, 'epoch': 1.67} {'loss': 0.5617, 'learning_rate': 1.285918125319362e-06, 'epoch': 1.67} {'loss': 0.5525, 'learning_rate': 1.2857575448687864e-06, 'epoch': 1.67} {'loss': 0.6815, 'learning_rate': 1.2855969737563089e-06, 'epoch': 1.67} {'loss': 0.484, 'learning_rate': 1.2854364119821007e-06, 'epoch': 1.67} {'loss': 0.5658, 'learning_rate': 1.2852758595463343e-06, 'epoch': 1.67} {'loss': 0.4147, 'learning_rate': 1.2851153164491835e-06, 'epoch': 1.67} {'loss': 0.43, 'learning_rate': 1.2849547826908126e-06, 'epoch': 1.67} {'loss': 0.5202, 'learning_rate': 1.2847942582714045e-06, 'epoch': 1.67} {'loss': 0.6223, 'learning_rate': 1.2846337431911237e-06, 'epoch': 1.67} {'loss': 0.3642, 'learning_rate': 1.2844732374501446e-06, 'epoch': 1.67} {'loss': 0.5811, 'learning_rate': 1.2843127410486412e-06, 'epoch': 1.67} {'loss': 0.5977, 'learning_rate': 1.284152253986779e-06, 'epoch': 1.67} {'loss': 0.4197, 'learning_rate': 1.2839917762647392e-06, 'epoch': 1.67} {'loss': 0.4574, 'learning_rate': 1.2838313078826836e-06, 'epoch': 1.67} {'loss': 0.4316, 'learning_rate': 1.2836708488407946e-06, 'epoch': 1.67} {'loss': 0.5574, 'learning_rate': 1.2835103991392361e-06, 'epoch': 1.67} {'loss': 0.4753, 'learning_rate': 1.2833499587781827e-06, 'epoch': 1.67} {'loss': 0.457, 'learning_rate': 1.283189527757809e-06, 'epoch': 1.67} {'loss': 0.5795, 'learning_rate': 1.2830291060782806e-06, 'epoch': 1.67} {'loss': 0.3855, 'learning_rate': 1.2828686937397773e-06, 'epoch': 1.67} {'loss': 0.4704, 'learning_rate': 1.2827082907424625e-06, 'epoch': 1.68} {'loss': 0.6211, 'learning_rate': 1.2825478970865168e-06, 'epoch': 1.68} {'loss': 0.4895, 'learning_rate': 1.2823875127721063e-06, 'epoch': 1.68} {'loss': 0.4795, 'learning_rate': 1.2822271377994033e-06, 'epoch': 1.68} {'loss': 0.5999, 'learning_rate': 1.2820667721685843e-06, 'epoch': 1.68} {'loss': 0.3757, 'learning_rate': 1.2819064158798123e-06, 'epoch': 1.68} {'loss': 0.4446, 'learning_rate': 1.2817460689332683e-06, 'epoch': 1.68} {'loss': 0.6525, 'learning_rate': 1.281585731329117e-06, 'epoch': 1.68} {'loss': 0.5119, 'learning_rate': 1.2814254030675378e-06, 'epoch': 1.68} {'loss': 0.4634, 'learning_rate': 1.281265084148695e-06, 'epoch': 1.68} {'loss': 0.4614, 'learning_rate': 1.2811047745727646e-06, 'epoch': 1.68} {'loss': 0.4922, 'learning_rate': 1.280944474339919e-06, 'epoch': 1.68} {'loss': 0.6421, 'learning_rate': 1.2807841834503242e-06, 'epoch': 1.68} {'loss': 0.4594, 'learning_rate': 1.2806239019041599e-06, 'epoch': 1.68} {'loss': 0.586, 'learning_rate': 1.2804636297015927e-06, 'epoch': 1.68} {'loss': 0.4405, 'learning_rate': 1.2803033668427956e-06, 'epoch': 1.68} {'loss': 0.5127, 'learning_rate': 1.2801431133279407e-06, 'epoch': 1.68} {'loss': 0.4463, 'learning_rate': 1.2799828691571992e-06, 'epoch': 1.68} {'loss': 0.488, 'learning_rate': 1.279822634330744e-06, 'epoch': 1.68} {'loss': 0.425, 'learning_rate': 1.2796624088487431e-06, 'epoch': 1.68} {'loss': 0.4508, 'learning_rate': 1.2795021927113748e-06, 'epoch': 1.68} {'loss': 0.5451, 'learning_rate': 1.279341985918805e-06, 'epoch': 1.68} {'loss': 0.4686, 'learning_rate': 1.2791817884712065e-06, 'epoch': 1.68} {'loss': 0.4994, 'learning_rate': 1.2790216003687528e-06, 'epoch': 1.68} {'loss': 0.5956, 'learning_rate': 1.2788614216116146e-06, 'epoch': 1.68} {'loss': 0.5522, 'learning_rate': 1.2787012521999652e-06, 'epoch': 1.68} {'loss': 0.419, 'learning_rate': 1.2785410921339702e-06, 'epoch': 1.68} {'loss': 0.5446, 'learning_rate': 1.2783809414138104e-06, 'epoch': 1.68} {'loss': 0.4748, 'learning_rate': 1.2782208000396502e-06, 'epoch': 1.68} {'loss': 0.506, 'learning_rate': 1.2780606680116636e-06, 'epoch': 1.68} {'loss': 0.4537, 'learning_rate': 1.2779005453300242e-06, 'epoch': 1.68} {'loss': 0.5791, 'learning_rate': 1.2777404319948972e-06, 'epoch': 1.68} {'loss': 0.3494, 'learning_rate': 1.2775803280064636e-06, 'epoch': 1.68} {'loss': 0.3436, 'learning_rate': 1.2774202333648845e-06, 'epoch': 1.68} {'loss': 0.4964, 'learning_rate': 1.2772601480703417e-06, 'epoch': 1.68} {'loss': 0.468, 'learning_rate': 1.2771000721229998e-06, 'epoch': 1.68} {'loss': 0.5243, 'learning_rate': 1.276940005523033e-06, 'epoch': 1.68} {'loss': 0.4975, 'learning_rate': 1.2767799482706134e-06, 'epoch': 1.68} {'loss': 0.5047, 'learning_rate': 1.2766199003659074e-06, 'epoch': 1.68} {'loss': 0.6611, 'learning_rate': 1.2764598618090951e-06, 'epoch': 1.68} {'loss': 0.4874, 'learning_rate': 1.2762998326003418e-06, 'epoch': 1.68} {'loss': 0.4885, 'learning_rate': 1.2761398127398195e-06, 'epoch': 1.68} {'loss': 0.4333, 'learning_rate': 1.2759798022277015e-06, 'epoch': 1.68} {'loss': 0.5676, 'learning_rate': 1.2758198010641588e-06, 'epoch': 1.68} {'loss': 0.5188, 'learning_rate': 1.2756598092493632e-06, 'epoch': 1.68} {'loss': 0.3918, 'learning_rate': 1.275499826783483e-06, 'epoch': 1.68} {'loss': 0.5445, 'learning_rate': 1.275339853666695e-06, 'epoch': 1.68} {'loss': 0.5133, 'learning_rate': 1.2751798898991662e-06, 'epoch': 1.68} {'loss': 0.6095, 'learning_rate': 1.27501993548107e-06, 'epoch': 1.68} {'loss': 0.4382, 'learning_rate': 1.274859990412578e-06, 'epoch': 1.68} {'loss': 0.3661, 'learning_rate': 1.2747000546938594e-06, 'epoch': 1.68} {'loss': 0.4546, 'learning_rate': 1.2745401283250903e-06, 'epoch': 1.68} {'loss': 0.4523, 'learning_rate': 1.2743802113064353e-06, 'epoch': 1.68} {'loss': 0.6141, 'learning_rate': 1.274220303638073e-06, 'epoch': 1.68} {'loss': 0.564, 'learning_rate': 1.2740604053201688e-06, 'epoch': 1.68} {'loss': 0.5477, 'learning_rate': 1.2739005163528961e-06, 'epoch': 1.68} {'loss': 0.5207, 'learning_rate': 1.273740636736427e-06, 'epoch': 1.68} {'loss': 0.6899, 'learning_rate': 1.2735807664709332e-06, 'epoch': 1.68} {'loss': 0.5017, 'learning_rate': 1.273420905556586e-06, 'epoch': 1.68} {'loss': 0.473, 'learning_rate': 1.2732610539935553e-06, 'epoch': 1.68} {'loss': 0.5529, 'learning_rate': 1.273101211782012e-06, 'epoch': 1.68} {'loss': 0.6493, 'learning_rate': 1.2729413789221278e-06, 'epoch': 1.68} {'loss': 0.5126, 'learning_rate': 1.2727815554140755e-06, 'epoch': 1.68} {'loss': 0.4974, 'learning_rate': 1.2726217412580256e-06, 'epoch': 1.68} {'loss': 0.3235, 'learning_rate': 1.272461936454149e-06, 'epoch': 1.68} {'loss': 0.4309, 'learning_rate': 1.2723021410026194e-06, 'epoch': 1.68} {'loss': 0.3244, 'learning_rate': 1.272142354903604e-06, 'epoch': 1.68} {'loss': 0.5427, 'learning_rate': 1.2719825781572747e-06, 'epoch': 1.68} {'loss': 0.6166, 'learning_rate': 1.2718228107638041e-06, 'epoch': 1.68} {'loss': 0.5287, 'learning_rate': 1.271663052723363e-06, 'epoch': 1.68} {'loss': 0.6364, 'learning_rate': 1.2715033040361236e-06, 'epoch': 1.68} {'loss': 0.5095, 'learning_rate': 1.2713435647022554e-06, 'epoch': 1.68} {'loss': 0.5475, 'learning_rate': 1.271183834721933e-06, 'epoch': 1.68} {'loss': 0.5226, 'learning_rate': 1.2710241140953228e-06, 'epoch': 1.68} {'loss': 0.4406, 'learning_rate': 1.270864402822598e-06, 'epoch': 1.68} {'loss': 0.5064, 'learning_rate': 1.2707047009039297e-06, 'epoch': 1.68} {'loss': 0.5028, 'learning_rate': 1.27054500833949e-06, 'epoch': 1.68} {'loss': 0.5069, 'learning_rate': 1.2703853251294484e-06, 'epoch': 1.68} {'loss': 0.5405, 'learning_rate': 1.2702256512739786e-06, 'epoch': 1.68} {'loss': 0.5245, 'learning_rate': 1.270065986773248e-06, 'epoch': 1.68} {'loss': 0.5046, 'learning_rate': 1.2699063316274296e-06, 'epoch': 1.68} {'loss': 0.5755, 'learning_rate': 1.2697466858366946e-06, 'epoch': 1.68} {'loss': 0.5363, 'learning_rate': 1.2695870494012152e-06, 'epoch': 1.68} {'loss': 0.399, 'learning_rate': 1.26942742232116e-06, 'epoch': 1.68} {'loss': 0.4454, 'learning_rate': 1.269267804596701e-06, 'epoch': 1.68} {'loss': 0.6041, 'learning_rate': 1.2691081962280127e-06, 'epoch': 1.68} {'loss': 0.4798, 'learning_rate': 1.2689485972152603e-06, 'epoch': 1.68} {'loss': 0.5222, 'learning_rate': 1.2687890075586172e-06, 'epoch': 1.68} {'loss': 0.614, 'learning_rate': 1.2686294272582556e-06, 'epoch': 1.68} {'loss': 0.5227, 'learning_rate': 1.2684698563143449e-06, 'epoch': 1.68} {'loss': 0.3964, 'learning_rate': 1.2683102947270565e-06, 'epoch': 1.68} {'loss': 0.4459, 'learning_rate': 1.2681507424965623e-06, 'epoch': 1.68} {'loss': 0.6131, 'learning_rate': 1.2679911996230344e-06, 'epoch': 1.68} {'loss': 0.3497, 'learning_rate': 1.2678316661066402e-06, 'epoch': 1.68} {'loss': 0.3637, 'learning_rate': 1.2676721419475525e-06, 'epoch': 1.68} {'loss': 0.5588, 'learning_rate': 1.2675126271459426e-06, 'epoch': 1.68} {'loss': 0.6098, 'learning_rate': 1.2673531217019807e-06, 'epoch': 1.68} {'loss': 0.3335, 'learning_rate': 1.2671936256158401e-06, 'epoch': 1.68} {'loss': 0.5319, 'learning_rate': 1.2670341388876872e-06, 'epoch': 1.68} {'loss': 0.5041, 'learning_rate': 1.2668746615176964e-06, 'epoch': 1.68} {'loss': 0.49, 'learning_rate': 1.2667151935060374e-06, 'epoch': 1.68} {'loss': 0.4267, 'learning_rate': 1.266555734852881e-06, 'epoch': 1.68} {'loss': 0.4283, 'learning_rate': 1.2663962855583978e-06, 'epoch': 1.68} {'loss': 0.6287, 'learning_rate': 1.2662368456227602e-06, 'epoch': 1.68} {'loss': 0.4947, 'learning_rate': 1.2660774150461397e-06, 'epoch': 1.68} {'loss': 0.5038, 'learning_rate': 1.2659179938287035e-06, 'epoch': 1.68} {'loss': 0.3755, 'learning_rate': 1.2657585819706252e-06, 'epoch': 1.68} {'loss': 0.5066, 'learning_rate': 1.2655991794720746e-06, 'epoch': 1.68} {'loss': 0.4756, 'learning_rate': 1.2654397863332224e-06, 'epoch': 1.68} {'loss': 0.6075, 'learning_rate': 1.2652804025542397e-06, 'epoch': 1.68} {'loss': 0.5371, 'learning_rate': 1.2651210281352976e-06, 'epoch': 1.68} {'loss': 0.5612, 'learning_rate': 1.2649616630765683e-06, 'epoch': 1.68} {'loss': 0.4346, 'learning_rate': 1.26480230737822e-06, 'epoch': 1.68} {'loss': 0.418, 'learning_rate': 1.2646429610404232e-06, 'epoch': 1.68} {'loss': 0.5212, 'learning_rate': 1.2644836240633507e-06, 'epoch': 1.68} {'loss': 0.3133, 'learning_rate': 1.2643242964471726e-06, 'epoch': 1.68} {'loss': 0.6247, 'learning_rate': 1.2641649781920606e-06, 'epoch': 1.68} {'loss': 0.5209, 'learning_rate': 1.2640056692981806e-06, 'epoch': 1.68} {'loss': 0.4621, 'learning_rate': 1.263846369765711e-06, 'epoch': 1.68} {'loss': 0.5421, 'learning_rate': 1.2636870795948165e-06, 'epoch': 1.68} {'loss': 0.4929, 'learning_rate': 1.2635277987856697e-06, 'epoch': 1.68} {'loss': 0.4399, 'learning_rate': 1.263368527338442e-06, 'epoch': 1.68} {'loss': 0.5224, 'learning_rate': 1.2632092652533034e-06, 'epoch': 1.68} {'loss': 0.4345, 'learning_rate': 1.2630500125304258e-06, 'epoch': 1.68} {'loss': 0.4299, 'learning_rate': 1.2628907691699755e-06, 'epoch': 1.68} {'loss': 0.6909, 'learning_rate': 1.2627315351721304e-06, 'epoch': 1.68} {'loss': 0.4032, 'learning_rate': 1.2625723105370546e-06, 'epoch': 1.68} {'loss': 0.4967, 'learning_rate': 1.2624130952649205e-06, 'epoch': 1.68} {'loss': 0.5278, 'learning_rate': 1.2622538893559022e-06, 'epoch': 1.68} {'loss': 0.4957, 'learning_rate': 1.2620946928101628e-06, 'epoch': 1.68} {'loss': 0.4455, 'learning_rate': 1.2619355056278825e-06, 'epoch': 1.68} {'loss': 0.4482, 'learning_rate': 1.2617763278092232e-06, 'epoch': 1.68} {'loss': 0.6047, 'learning_rate': 1.2616171593543624e-06, 'epoch': 1.68} {'loss': 0.5115, 'learning_rate': 1.2614580002634658e-06, 'epoch': 1.68} {'loss': 0.4791, 'learning_rate': 1.2612988505367052e-06, 'epoch': 1.68} {'loss': 0.3407, 'learning_rate': 1.2611397101742539e-06, 'epoch': 1.68} {'loss': 0.6674, 'learning_rate': 1.2609805791762763e-06, 'epoch': 1.68} {'loss': 0.4652, 'learning_rate': 1.2608214575429512e-06, 'epoch': 1.68} {'loss': 0.464, 'learning_rate': 1.2606623452744393e-06, 'epoch': 1.68} {'loss': 0.4137, 'learning_rate': 1.2605032423709218e-06, 'epoch': 1.68} {'loss': 0.5932, 'learning_rate': 1.260344148832562e-06, 'epoch': 1.68} {'loss': 0.702, 'learning_rate': 1.2601850646595315e-06, 'epoch': 1.68} {'loss': 0.4294, 'learning_rate': 1.2600259898520029e-06, 'epoch': 1.68} {'loss': 0.4949, 'learning_rate': 1.2598669244101425e-06, 'epoch': 1.68} {'loss': 0.5062, 'learning_rate': 1.259707868334127e-06, 'epoch': 1.68} {'loss': 0.5035, 'learning_rate': 1.2595488216241192e-06, 'epoch': 1.68} {'loss': 0.4956, 'learning_rate': 1.2593897842802982e-06, 'epoch': 1.68} {'loss': 0.5945, 'learning_rate': 1.2592307563028271e-06, 'epoch': 1.68} {'loss': 0.5411, 'learning_rate': 1.2590717376918805e-06, 'epoch': 1.68} {'loss': 0.5156, 'learning_rate': 1.2589127284476289e-06, 'epoch': 1.68} {'loss': 0.4583, 'learning_rate': 1.2587537285702368e-06, 'epoch': 1.68} {'loss': 0.4824, 'learning_rate': 1.2585947380598828e-06, 'epoch': 1.68} {'loss': 0.5079, 'learning_rate': 1.2584357569167304e-06, 'epoch': 1.68} {'loss': 0.5309, 'learning_rate': 1.258276785140956e-06, 'epoch': 1.68} {'loss': 0.3837, 'learning_rate': 1.2581178227327262e-06, 'epoch': 1.68} {'loss': 0.4343, 'learning_rate': 1.2579588696922119e-06, 'epoch': 1.68} {'loss': 0.5466, 'learning_rate': 1.257799926019585e-06, 'epoch': 1.68} {'loss': 0.508, 'learning_rate': 1.2576409917150112e-06, 'epoch': 1.68} {'loss': 0.5043, 'learning_rate': 1.257482066778668e-06, 'epoch': 1.68} {'loss': 0.4529, 'learning_rate': 1.2573231512107175e-06, 'epoch': 1.68} {'loss': 0.513, 'learning_rate': 1.2571642450113386e-06, 'epoch': 1.68} {'loss': 0.5288, 'learning_rate': 1.2570053481806943e-06, 'epoch': 1.68} {'loss': 0.5912, 'learning_rate': 1.256846460718959e-06, 'epoch': 1.68} {'loss': 0.6111, 'learning_rate': 1.2566875826263036e-06, 'epoch': 1.68} {'loss': 0.5663, 'learning_rate': 1.2565287139028925e-06, 'epoch': 1.68} {'loss': 0.6578, 'learning_rate': 1.2563698545489045e-06, 'epoch': 1.68} {'loss': 0.6458, 'learning_rate': 1.2562110045645026e-06, 'epoch': 1.68} {'loss': 0.5549, 'learning_rate': 1.2560521639498601e-06, 'epoch': 1.68} {'loss': 0.5534, 'learning_rate': 1.255893332705147e-06, 'epoch': 1.68} {'loss': 0.6133, 'learning_rate': 1.2557345108305329e-06, 'epoch': 1.68} {'loss': 0.3288, 'learning_rate': 1.2555756983261914e-06, 'epoch': 1.68} {'loss': 0.5126, 'learning_rate': 1.2554168951922852e-06, 'epoch': 1.68} {'loss': 0.5995, 'learning_rate': 1.2552581014289932e-06, 'epoch': 1.68} {'loss': 0.4999, 'learning_rate': 1.25509931703648e-06, 'epoch': 1.68} {'loss': 0.3612, 'learning_rate': 1.2549405420149164e-06, 'epoch': 1.68} {'loss': 0.4242, 'learning_rate': 1.2547817763644732e-06, 'epoch': 1.68} {'loss': 0.619, 'learning_rate': 1.2546230200853205e-06, 'epoch': 1.68} {'loss': 0.5421, 'learning_rate': 1.2544642731776314e-06, 'epoch': 1.68} {'loss': 0.4177, 'learning_rate': 1.2543055356415678e-06, 'epoch': 1.68} {'loss': 0.6143, 'learning_rate': 1.2541468074773112e-06, 'epoch': 1.68} {'loss': 0.5255, 'learning_rate': 1.253988088685022e-06, 'epoch': 1.68} {'loss': 0.4883, 'learning_rate': 1.2538293792648747e-06, 'epoch': 1.68} {'loss': 0.5562, 'learning_rate': 1.2536706792170405e-06, 'epoch': 1.68} {'loss': 0.5699, 'learning_rate': 1.2535119885416825e-06, 'epoch': 1.68} {'loss': 0.5236, 'learning_rate': 1.2533533072389813e-06, 'epoch': 1.68} {'loss': 0.5003, 'learning_rate': 1.2531946353090985e-06, 'epoch': 1.68} {'loss': 0.4707, 'learning_rate': 1.253035972752208e-06, 'epoch': 1.68} {'loss': 0.6458, 'learning_rate': 1.2528773195684784e-06, 'epoch': 1.68} {'loss': 0.6016, 'learning_rate': 1.25271867575808e-06, 'epoch': 1.68} {'loss': 0.4844, 'learning_rate': 1.2525600413211859e-06, 'epoch': 1.68} {'loss': 0.5305, 'learning_rate': 1.2524014162579579e-06, 'epoch': 1.68} {'loss': 0.4713, 'learning_rate': 1.252242800568576e-06, 'epoch': 1.68} {'loss': 0.6348, 'learning_rate': 1.2520841942532037e-06, 'epoch': 1.68} {'loss': 0.4918, 'learning_rate': 1.2519255973120127e-06, 'epoch': 1.68} {'loss': 0.4946, 'learning_rate': 1.2517670097451729e-06, 'epoch': 1.68} {'loss': 0.5979, 'learning_rate': 1.2516084315528544e-06, 'epoch': 1.68} {'loss': 0.5376, 'learning_rate': 1.2514498627352278e-06, 'epoch': 1.68} {'loss': 0.3841, 'learning_rate': 1.25129130329246e-06, 'epoch': 1.68} {'loss': 0.5894, 'learning_rate': 1.2511327532247264e-06, 'epoch': 1.68} {'loss': 0.4353, 'learning_rate': 1.2509742125321923e-06, 'epoch': 1.68} {'loss': 0.4977, 'learning_rate': 1.2508156812150284e-06, 'epoch': 1.68} {'loss': 0.5515, 'learning_rate': 1.2506571592734052e-06, 'epoch': 1.68} {'loss': 0.5811, 'learning_rate': 1.250498646707492e-06, 'epoch': 1.68} {'loss': 0.3517, 'learning_rate': 1.2503401435174623e-06, 'epoch': 1.68} {'loss': 0.5633, 'learning_rate': 1.2501816497034803e-06, 'epoch': 1.68} {'loss': 0.617, 'learning_rate': 1.250023165265718e-06, 'epoch': 1.68} {'loss': 0.5979, 'learning_rate': 1.2498646902043466e-06, 'epoch': 1.68} {'loss': 0.3504, 'learning_rate': 1.2497062245195336e-06, 'epoch': 1.68} {'loss': 0.4496, 'learning_rate': 1.2495477682114509e-06, 'epoch': 1.68} {'loss': 0.4089, 'learning_rate': 1.2493893212802677e-06, 'epoch': 1.68} {'loss': 0.6949, 'learning_rate': 1.2492308837261558e-06, 'epoch': 1.68} {'loss': 0.5057, 'learning_rate': 1.2490724555492805e-06, 'epoch': 1.68} {'loss': 0.6368, 'learning_rate': 1.2489140367498142e-06, 'epoch': 1.68} {'loss': 0.5329, 'learning_rate': 1.2487556273279255e-06, 'epoch': 1.68} {'loss': 0.5046, 'learning_rate': 1.2485972272837855e-06, 'epoch': 1.68} {'loss': 0.5558, 'learning_rate': 1.2484388366175637e-06, 'epoch': 1.68} {'loss': 0.586, 'learning_rate': 1.2482804553294314e-06, 'epoch': 1.68} {'loss': 0.459, 'learning_rate': 1.248122083419554e-06, 'epoch': 1.68} {'loss': 0.4204, 'learning_rate': 1.2479637208881046e-06, 'epoch': 1.68} {'loss': 0.628, 'learning_rate': 1.2478053677352509e-06, 'epoch': 1.68} {'loss': 0.4693, 'learning_rate': 1.2476470239611648e-06, 'epoch': 1.68} {'loss': 0.4004, 'learning_rate': 1.2474886895660144e-06, 'epoch': 1.68} {'loss': 0.5294, 'learning_rate': 1.247330364549969e-06, 'epoch': 1.68} {'loss': 0.4705, 'learning_rate': 1.2471720489132022e-06, 'epoch': 1.68} {'loss': 0.5616, 'learning_rate': 1.2470137426558781e-06, 'epoch': 1.68} {'loss': 0.5759, 'learning_rate': 1.2468554457781689e-06, 'epoch': 1.68} {'loss': 0.5757, 'learning_rate': 1.2466971582802446e-06, 'epoch': 1.68} {'loss': 0.4006, 'learning_rate': 1.2465388801622736e-06, 'epoch': 1.68} {'loss': 0.4788, 'learning_rate': 1.2463806114244259e-06, 'epoch': 1.68} {'loss': 0.4225, 'learning_rate': 1.2462223520668726e-06, 'epoch': 1.68} {'loss': 0.4436, 'learning_rate': 1.2460641020897834e-06, 'epoch': 1.68} {'loss': 0.4187, 'learning_rate': 1.245905861493325e-06, 'epoch': 1.68} {'loss': 0.6026, 'learning_rate': 1.2457476302776684e-06, 'epoch': 1.68} {'loss': 0.543, 'learning_rate': 1.245589408442983e-06, 'epoch': 1.68} {'loss': 0.5667, 'learning_rate': 1.2454311959894395e-06, 'epoch': 1.68} {'loss': 0.5341, 'learning_rate': 1.245272992917208e-06, 'epoch': 1.68} {'loss': 0.4354, 'learning_rate': 1.2451147992264523e-06, 'epoch': 1.68} {'loss': 0.5195, 'learning_rate': 1.244956614917351e-06, 'epoch': 1.68} {'loss': 0.534, 'learning_rate': 1.244798439990066e-06, 'epoch': 1.68} {'loss': 0.6187, 'learning_rate': 1.2446402744447705e-06, 'epoch': 1.68} {'loss': 0.5261, 'learning_rate': 1.2444821182816324e-06, 'epoch': 1.68} {'loss': 0.5367, 'learning_rate': 1.2443239715008225e-06, 'epoch': 1.68} {'loss': 0.5954, 'learning_rate': 1.244165834102512e-06, 'epoch': 1.68} {'loss': 0.5042, 'learning_rate': 1.2440077060868637e-06, 'epoch': 1.68} {'loss': 0.4278, 'learning_rate': 1.2438495874540557e-06, 'epoch': 1.68} {'loss': 0.3969, 'learning_rate': 1.2436914782042508e-06, 'epoch': 1.68} {'loss': 0.4534, 'learning_rate': 1.2435333783376201e-06, 'epoch': 1.68} {'loss': 0.7137, 'learning_rate': 1.2433752878543349e-06, 'epoch': 1.68} {'loss': 0.5562, 'learning_rate': 1.2432172067545634e-06, 'epoch': 1.68} {'loss': 0.5872, 'learning_rate': 1.2430591350384768e-06, 'epoch': 1.68} {'loss': 0.4268, 'learning_rate': 1.2429010727062386e-06, 'epoch': 1.68} {'loss': 0.5608, 'learning_rate': 1.242743019758026e-06, 'epoch': 1.68} {'loss': 0.5663, 'learning_rate': 1.2425849761940024e-06, 'epoch': 1.68} {'loss': 0.5179, 'learning_rate': 1.2424269420143397e-06, 'epoch': 1.68} {'loss': 0.5415, 'learning_rate': 1.2422689172192093e-06, 'epoch': 1.68} {'loss': 0.426, 'learning_rate': 1.242110901808774e-06, 'epoch': 1.68} {'loss': 0.4997, 'learning_rate': 1.2419528957832116e-06, 'epoch': 1.68} {'loss': 0.4829, 'learning_rate': 1.2417948991426843e-06, 'epoch': 1.68} {'loss': 0.6479, 'learning_rate': 1.2416369118873651e-06, 'epoch': 1.68} {'loss': 0.3838, 'learning_rate': 1.2414789340174217e-06, 'epoch': 1.68} {'loss': 0.5839, 'learning_rate': 1.241320965533025e-06, 'epoch': 1.68} {'loss': 0.4286, 'learning_rate': 1.2411630064343449e-06, 'epoch': 1.68} {'loss': 0.5906, 'learning_rate': 1.2410050567215448e-06, 'epoch': 1.68} {'loss': 0.5738, 'learning_rate': 1.2408471163948032e-06, 'epoch': 1.68} {'loss': 0.6738, 'learning_rate': 1.2406891854542825e-06, 'epoch': 1.68} {'loss': 0.4746, 'learning_rate': 1.2405312639001532e-06, 'epoch': 1.68} {'loss': 0.5463, 'learning_rate': 1.2403733517325855e-06, 'epoch': 1.68} {'loss': 0.5943, 'learning_rate': 1.2402154489517482e-06, 'epoch': 1.68} {'loss': 0.6351, 'learning_rate': 1.2400575555578132e-06, 'epoch': 1.68} {'loss': 0.4902, 'learning_rate': 1.2398996715509426e-06, 'epoch': 1.68} {'loss': 0.5265, 'learning_rate': 1.2397417969313142e-06, 'epoch': 1.68} {'loss': 0.3856, 'learning_rate': 1.239583931699091e-06, 'epoch': 1.68} {'loss': 0.4477, 'learning_rate': 1.239426075854444e-06, 'epoch': 1.68} {'loss': 0.4228, 'learning_rate': 1.2392682293975456e-06, 'epoch': 1.68} {'loss': 0.6088, 'learning_rate': 1.2391103923285574e-06, 'epoch': 1.68} {'loss': 0.4133, 'learning_rate': 1.2389525646476575e-06, 'epoch': 1.68} {'loss': 0.4628, 'learning_rate': 1.2387947463550064e-06, 'epoch': 1.68} {'loss': 0.5158, 'learning_rate': 1.2386369374507822e-06, 'epoch': 1.68} {'loss': 0.4626, 'learning_rate': 1.238479137935147e-06, 'epoch': 1.68} {'loss': 0.5097, 'learning_rate': 1.2383213478082711e-06, 'epoch': 1.68} {'loss': 0.631, 'learning_rate': 1.2381635670703274e-06, 'epoch': 1.68} {'loss': 0.5552, 'learning_rate': 1.2380057957214785e-06, 'epoch': 1.68} {'loss': 0.5011, 'learning_rate': 1.2378480337619014e-06, 'epoch': 1.68} {'loss': 0.5148, 'learning_rate': 1.2376902811917558e-06, 'epoch': 1.68} {'loss': 0.606, 'learning_rate': 1.2375325380112214e-06, 'epoch': 1.68} {'loss': 0.4596, 'learning_rate': 1.237374804220458e-06, 'epoch': 1.68} {'loss': 0.4122, 'learning_rate': 1.2372170798196393e-06, 'epoch': 1.68} {'loss': 0.4065, 'learning_rate': 1.2370593648089357e-06, 'epoch': 1.68} {'loss': 0.3595, 'learning_rate': 1.2369016591885097e-06, 'epoch': 1.68} {'loss': 0.5909, 'learning_rate': 1.2367439629585387e-06, 'epoch': 1.68} {'loss': 0.5469, 'learning_rate': 1.2365862761191828e-06, 'epoch': 1.68} {'loss': 0.5052, 'learning_rate': 1.2364285986706205e-06, 'epoch': 1.68} {'loss': 0.6241, 'learning_rate': 1.2362709306130127e-06, 'epoch': 1.68} {'loss': 0.3923, 'learning_rate': 1.236113271946533e-06, 'epoch': 1.68} {'loss': 0.4727, 'learning_rate': 1.23595562267135e-06, 'epoch': 1.68} {'loss': 0.4081, 'learning_rate': 1.2357979827876275e-06, 'epoch': 1.68} {'loss': 0.5417, 'learning_rate': 1.2356403522955428e-06, 'epoch': 1.68} {'loss': 0.5151, 'learning_rate': 1.2354827311952566e-06, 'epoch': 1.68} {'loss': 0.5792, 'learning_rate': 1.2353251194869465e-06, 'epoch': 1.68} {'loss': 0.37, 'learning_rate': 1.2351675171707733e-06, 'epoch': 1.68} {'loss': 0.3585, 'learning_rate': 1.2350099242469093e-06, 'epoch': 1.68} {'loss': 0.3769, 'learning_rate': 1.2348523407155255e-06, 'epoch': 1.68} {'loss': 0.5395, 'learning_rate': 1.234694766576785e-06, 'epoch': 1.68} {'loss': 0.4912, 'learning_rate': 1.2345372018308632e-06, 'epoch': 1.68} {'loss': 0.6002, 'learning_rate': 1.2343796464779244e-06, 'epoch': 1.68} {'loss': 0.3668, 'learning_rate': 1.2342221005181388e-06, 'epoch': 1.68} {'loss': 0.4225, 'learning_rate': 1.2340645639516757e-06, 'epoch': 1.68} {'loss': 0.5413, 'learning_rate': 1.2339070367787043e-06, 'epoch': 1.68} {'loss': 0.4103, 'learning_rate': 1.2337495189993932e-06, 'epoch': 1.68} {'loss': 0.4746, 'learning_rate': 1.2335920106139076e-06, 'epoch': 1.68} {'loss': 0.4643, 'learning_rate': 1.2334345116224234e-06, 'epoch': 1.68} {'loss': 0.5652, 'learning_rate': 1.2332770220251022e-06, 'epoch': 1.68} {'loss': 0.5359, 'learning_rate': 1.2331195418221176e-06, 'epoch': 1.68} {'loss': 0.6536, 'learning_rate': 1.2329620710136358e-06, 'epoch': 1.68} {'loss': 0.5945, 'learning_rate': 1.232804609599826e-06, 'epoch': 1.68} {'loss': 0.5059, 'learning_rate': 1.2326471575808608e-06, 'epoch': 1.68} {'loss': 0.4561, 'learning_rate': 1.2324897149568993e-06, 'epoch': 1.68} {'loss': 0.4126, 'learning_rate': 1.2323322817281224e-06, 'epoch': 1.68} {'loss': 0.4607, 'learning_rate': 1.2321748578946902e-06, 'epoch': 1.68} {'loss': 0.4553, 'learning_rate': 1.2320174434567734e-06, 'epoch': 1.68} {'loss': 0.5217, 'learning_rate': 1.2318600384145418e-06, 'epoch': 1.68} {'loss': 0.657, 'learning_rate': 1.2317026427681632e-06, 'epoch': 1.68} {'loss': 0.4461, 'learning_rate': 1.2315452565178089e-06, 'epoch': 1.68} {'loss': 0.4868, 'learning_rate': 1.2313878796636437e-06, 'epoch': 1.68} {'loss': 0.6301, 'learning_rate': 1.2312305122058365e-06, 'epoch': 1.68} {'loss': 0.5197, 'learning_rate': 1.2310731541445586e-06, 'epoch': 1.68} {'loss': 0.492, 'learning_rate': 1.2309158054799763e-06, 'epoch': 1.68} {'loss': 0.5784, 'learning_rate': 1.2307584662122595e-06, 'epoch': 1.68} {'loss': 0.6133, 'learning_rate': 1.230601136341576e-06, 'epoch': 1.68} {'loss': 0.4802, 'learning_rate': 1.2304438158680975e-06, 'epoch': 1.68} {'loss': 0.4392, 'learning_rate': 1.2302865047919888e-06, 'epoch': 1.68} {'loss': 0.3985, 'learning_rate': 1.2301292031134182e-06, 'epoch': 1.68} {'loss': 0.6469, 'learning_rate': 1.229971910832556e-06, 'epoch': 1.68} {'loss': 0.5554, 'learning_rate': 1.2298146279495704e-06, 'epoch': 1.68} {'loss': 0.511, 'learning_rate': 1.2296573544646306e-06, 'epoch': 1.68} {'loss': 0.5614, 'learning_rate': 1.2295000903779041e-06, 'epoch': 1.68} {'loss': 0.4766, 'learning_rate': 1.229342835689562e-06, 'epoch': 1.68} {'loss': 0.5553, 'learning_rate': 1.2291855903997685e-06, 'epoch': 1.68} {'loss': 0.3741, 'learning_rate': 1.2290283545086934e-06, 'epoch': 1.68} {'loss': 0.4718, 'learning_rate': 1.2288711280165077e-06, 'epoch': 1.68} {'loss': 0.4546, 'learning_rate': 1.228713910923377e-06, 'epoch': 1.68} {'loss': 0.623, 'learning_rate': 1.2285567032294732e-06, 'epoch': 1.68} {'loss': 0.5212, 'learning_rate': 1.2283995049349605e-06, 'epoch': 1.68} {'loss': 0.6474, 'learning_rate': 1.2282423160400104e-06, 'epoch': 1.68} {'loss': 0.4312, 'learning_rate': 1.2280851365447898e-06, 'epoch': 1.68} {'loss': 0.5496, 'learning_rate': 1.227927966449467e-06, 'epoch': 1.68} {'loss': 0.2981, 'learning_rate': 1.2277708057542115e-06, 'epoch': 1.68} {'loss': 0.5968, 'learning_rate': 1.2276136544591921e-06, 'epoch': 1.68} {'loss': 0.5046, 'learning_rate': 1.2274565125645776e-06, 'epoch': 1.68} {'loss': 0.5761, 'learning_rate': 1.2272993800705335e-06, 'epoch': 1.68} {'loss': 0.5264, 'learning_rate': 1.2271422569772296e-06, 'epoch': 1.68} {'loss': 0.5061, 'learning_rate': 1.2269851432848346e-06, 'epoch': 1.68} {'loss': 0.4491, 'learning_rate': 1.2268280389935172e-06, 'epoch': 1.68} {'loss': 0.3916, 'learning_rate': 1.2266709441034453e-06, 'epoch': 1.68} {'loss': 0.4087, 'learning_rate': 1.2265138586147874e-06, 'epoch': 1.68} {'loss': 0.553, 'learning_rate': 1.2263567825277133e-06, 'epoch': 1.68} {'loss': 0.4762, 'learning_rate': 1.2261997158423888e-06, 'epoch': 1.68} {'loss': 0.4763, 'learning_rate': 1.2260426585589824e-06, 'epoch': 1.68} {'loss': 0.4877, 'learning_rate': 1.2258856106776629e-06, 'epoch': 1.68} {'loss': 0.3898, 'learning_rate': 1.225728572198599e-06, 'epoch': 1.68} {'loss': 0.6798, 'learning_rate': 1.2255715431219594e-06, 'epoch': 1.68} {'loss': 0.6213, 'learning_rate': 1.2254145234479131e-06, 'epoch': 1.68} {'loss': 0.4487, 'learning_rate': 1.2252575131766264e-06, 'epoch': 1.68} {'loss': 0.4935, 'learning_rate': 1.2251005123082671e-06, 'epoch': 1.68} {'loss': 0.5257, 'learning_rate': 1.224943520843005e-06, 'epoch': 1.68} {'loss': 0.4972, 'learning_rate': 1.2247865387810076e-06, 'epoch': 1.68} {'loss': 0.6497, 'learning_rate': 1.224629566122444e-06, 'epoch': 1.68} {'loss': 0.5084, 'learning_rate': 1.2244726028674814e-06, 'epoch': 1.68} {'loss': 0.4851, 'learning_rate': 1.22431564901629e-06, 'epoch': 1.68} {'loss': 0.4242, 'learning_rate': 1.224158704569035e-06, 'epoch': 1.68} {'loss': 0.2913, 'learning_rate': 1.2240017695258855e-06, 'epoch': 1.68} {'loss': 0.4422, 'learning_rate': 1.223844843887011e-06, 'epoch': 1.68} {'loss': 0.5012, 'learning_rate': 1.223687927652578e-06, 'epoch': 1.68} {'loss': 0.5494, 'learning_rate': 1.2235310208227569e-06, 'epoch': 1.68} {'loss': 0.504, 'learning_rate': 1.2233741233977125e-06, 'epoch': 1.68} {'loss': 0.5137, 'learning_rate': 1.2232172353776185e-06, 'epoch': 1.68} {'loss': 0.5855, 'learning_rate': 1.2230603567626365e-06, 'epoch': 1.68} {'loss': 0.4489, 'learning_rate': 1.2229034875529378e-06, 'epoch': 1.68} {'loss': 0.4421, 'learning_rate': 1.2227466277486899e-06, 'epoch': 1.68} {'loss': 0.4618, 'learning_rate': 1.2225897773500616e-06, 'epoch': 1.68} {'loss': 0.6175, 'learning_rate': 1.222432936357223e-06, 'epoch': 1.68} {'loss': 0.4299, 'learning_rate': 1.2222761047703346e-06, 'epoch': 1.68} {'loss': 0.5127, 'learning_rate': 1.2221192825895745e-06, 'epoch': 1.68} {'loss': 0.6416, 'learning_rate': 1.2219624698151034e-06, 'epoch': 1.68} {'loss': 0.6759, 'learning_rate': 1.2218056664470923e-06, 'epoch': 1.68} {'loss': 0.4711, 'learning_rate': 1.2216488724857079e-06, 'epoch': 1.68} {'loss': 0.5535, 'learning_rate': 1.2214920879311199e-06, 'epoch': 1.68} {'loss': 0.4468, 'learning_rate': 1.221335312783497e-06, 'epoch': 1.68} {'loss': 0.6202, 'learning_rate': 1.2211785470430016e-06, 'epoch': 1.68} {'loss': 0.5764, 'learning_rate': 1.2210217907098088e-06, 'epoch': 1.68} {'loss': 0.5302, 'learning_rate': 1.220865043784083e-06, 'epoch': 1.68} {'loss': 0.3475, 'learning_rate': 1.220708306265992e-06, 'epoch': 1.68} {'loss': 0.6659, 'learning_rate': 1.2205515781557064e-06, 'epoch': 1.68} {'loss': 0.7155, 'learning_rate': 1.2203948594533876e-06, 'epoch': 1.68} {'loss': 0.4449, 'learning_rate': 1.220238150159213e-06, 'epoch': 1.68} {'loss': 0.5132, 'learning_rate': 1.2200814502733416e-06, 'epoch': 1.68} {'loss': 0.4354, 'learning_rate': 1.2199247597959495e-06, 'epoch': 1.68} {'loss': 0.4838, 'learning_rate': 1.219768078727198e-06, 'epoch': 1.68} {'loss': 0.4723, 'learning_rate': 1.2196114070672581e-06, 'epoch': 1.68} {'loss': 0.4225, 'learning_rate': 1.2194547448162987e-06, 'epoch': 1.68} {'loss': 0.4779, 'learning_rate': 1.2192980919744812e-06, 'epoch': 1.68} {'loss': 0.6336, 'learning_rate': 1.2191414485419839e-06, 'epoch': 1.68} {'loss': 0.5875, 'learning_rate': 1.2189848145189632e-06, 'epoch': 1.68} {'loss': 0.471, 'learning_rate': 1.2188281899055987e-06, 'epoch': 1.68} {'loss': 0.5614, 'learning_rate': 1.2186715747020494e-06, 'epoch': 1.68} {'loss': 0.4997, 'learning_rate': 1.2185149689084864e-06, 'epoch': 1.68} {'loss': 0.5445, 'learning_rate': 1.218358372525078e-06, 'epoch': 1.68} {'loss': 0.6532, 'learning_rate': 1.218201785551988e-06, 'epoch': 1.68} {'loss': 0.554, 'learning_rate': 1.2180452079893923e-06, 'epoch': 1.68} {'loss': 0.6411, 'learning_rate': 1.21788863983745e-06, 'epoch': 1.68} {'loss': 0.5846, 'learning_rate': 1.2177320810963343e-06, 'epoch': 1.68} {'loss': 0.5557, 'learning_rate': 1.2175755317662108e-06, 'epoch': 1.68} {'loss': 0.5459, 'learning_rate': 1.2174189918472478e-06, 'epoch': 1.68} {'loss': 0.7233, 'learning_rate': 1.2172624613396145e-06, 'epoch': 1.68} {'loss': 0.573, 'learning_rate': 1.2171059402434738e-06, 'epoch': 1.68} {'loss': 0.5455, 'learning_rate': 1.216949428559e-06, 'epoch': 1.68} {'loss': 0.4935, 'learning_rate': 1.2167929262863565e-06, 'epoch': 1.68} {'loss': 0.7272, 'learning_rate': 1.2166364334257118e-06, 'epoch': 1.68} {'loss': 0.445, 'learning_rate': 1.216479949977234e-06, 'epoch': 1.68} {'loss': 0.5585, 'learning_rate': 1.2163234759410903e-06, 'epoch': 1.68} {'loss': 0.4576, 'learning_rate': 1.2161670113174506e-06, 'epoch': 1.68} {'loss': 0.569, 'learning_rate': 1.2160105561064772e-06, 'epoch': 1.68} {'loss': 0.5555, 'learning_rate': 1.2158541103083455e-06, 'epoch': 1.68} {'loss': 0.5078, 'learning_rate': 1.2156976739232174e-06, 'epoch': 1.68} {'loss': 0.6435, 'learning_rate': 1.2155412469512607e-06, 'epoch': 1.68} {'loss': 0.3954, 'learning_rate': 1.2153848293926474e-06, 'epoch': 1.68} {'loss': 0.4184, 'learning_rate': 1.2152284212475374e-06, 'epoch': 1.68} {'loss': 0.5474, 'learning_rate': 1.2150720225161073e-06, 'epoch': 1.68} {'loss': 0.4977, 'learning_rate': 1.2149156331985169e-06, 'epoch': 1.68} {'loss': 0.556, 'learning_rate': 1.2147592532949404e-06, 'epoch': 1.68} {'loss': 0.5582, 'learning_rate': 1.214602882805541e-06, 'epoch': 1.68} {'loss': 0.6258, 'learning_rate': 1.2144465217304878e-06, 'epoch': 1.68} {'loss': 0.5323, 'learning_rate': 1.2142901700699493e-06, 'epoch': 1.68} {'loss': 0.4956, 'learning_rate': 1.2141338278240878e-06, 'epoch': 1.68} {'loss': 0.5597, 'learning_rate': 1.2139774949930795e-06, 'epoch': 1.68} {'loss': 0.5395, 'learning_rate': 1.213821171577083e-06, 'epoch': 1.68} {'loss': 0.4663, 'learning_rate': 1.2136648575762744e-06, 'epoch': 1.68} {'loss': 0.4092, 'learning_rate': 1.2135085529908153e-06, 'epoch': 1.68} {'loss': 0.571, 'learning_rate': 1.2133522578208734e-06, 'epoch': 1.68} {'loss': 0.5528, 'learning_rate': 1.213195972066621e-06, 'epoch': 1.68} {'loss': 0.3936, 'learning_rate': 1.2130396957282175e-06, 'epoch': 1.68} {'loss': 0.4461, 'learning_rate': 1.2128834288058389e-06, 'epoch': 1.68} {'loss': 0.5611, 'learning_rate': 1.2127271712996447e-06, 'epoch': 1.68} {'loss': 0.5891, 'learning_rate': 1.2125709232098115e-06, 'epoch': 1.68} {'loss': 0.5786, 'learning_rate': 1.2124146845364981e-06, 'epoch': 1.68} {'loss': 0.4899, 'learning_rate': 1.2122584552798766e-06, 'epoch': 1.68} {'loss': 0.6423, 'learning_rate': 1.2121022354401157e-06, 'epoch': 1.68} {'loss': 0.4568, 'learning_rate': 1.2119460250173754e-06, 'epoch': 1.68} {'loss': 0.508, 'learning_rate': 1.211789824011832e-06, 'epoch': 1.68} {'loss': 0.601, 'learning_rate': 1.2116336324236478e-06, 'epoch': 1.68} {'loss': 0.6391, 'learning_rate': 1.2114774502529913e-06, 'epoch': 1.68} {'loss': 0.4307, 'learning_rate': 1.2113212775000293e-06, 'epoch': 1.68} {'loss': 0.4843, 'learning_rate': 1.2111651141649305e-06, 'epoch': 1.68} {'loss': 0.5888, 'learning_rate': 1.2110089602478626e-06, 'epoch': 1.68} {'loss': 0.6077, 'learning_rate': 1.2108528157489884e-06, 'epoch': 1.68} {'loss': 0.7071, 'learning_rate': 1.2106966806684828e-06, 'epoch': 1.68} {'loss': 0.4544, 'learning_rate': 1.2105405550065064e-06, 'epoch': 1.68} {'loss': 0.6014, 'learning_rate': 1.2103844387632302e-06, 'epoch': 1.68} {'loss': 0.5982, 'learning_rate': 1.2102283319388198e-06, 'epoch': 1.68} {'loss': 0.6737, 'learning_rate': 1.2100722345334426e-06, 'epoch': 1.68} {'loss': 0.5891, 'learning_rate': 1.2099161465472686e-06, 'epoch': 1.68} {'loss': 0.4997, 'learning_rate': 1.2097600679804588e-06, 'epoch': 1.68} {'loss': 0.4835, 'learning_rate': 1.2096039988331888e-06, 'epoch': 1.68} {'loss': 0.4861, 'learning_rate': 1.209447939105619e-06, 'epoch': 1.68} {'loss': 0.5163, 'learning_rate': 1.2092918887979199e-06, 'epoch': 1.68} {'loss': 0.3973, 'learning_rate': 1.2091358479102577e-06, 'epoch': 1.68} {'loss': 0.665, 'learning_rate': 1.208979816442799e-06, 'epoch': 1.68} {'loss': 0.4762, 'learning_rate': 1.2088237943957148e-06, 'epoch': 1.68} {'loss': 0.4455, 'learning_rate': 1.2086677817691672e-06, 'epoch': 1.68} {'loss': 0.5235, 'learning_rate': 1.2085117785633249e-06, 'epoch': 1.68} {'loss': 0.4794, 'learning_rate': 1.2083557847783566e-06, 'epoch': 1.68} {'loss': 0.5532, 'learning_rate': 1.208199800414428e-06, 'epoch': 1.68} {'loss': 0.5729, 'learning_rate': 1.2080438254717075e-06, 'epoch': 1.68} {'loss': 0.4275, 'learning_rate': 1.2078878599503608e-06, 'epoch': 1.68} {'loss': 0.3695, 'learning_rate': 1.2077319038505586e-06, 'epoch': 1.68} {'loss': 0.5478, 'learning_rate': 1.207575957172462e-06, 'epoch': 1.68} {'loss': 0.4469, 'learning_rate': 1.2074200199162423e-06, 'epoch': 1.68} {'loss': 0.4419, 'learning_rate': 1.2072640920820655e-06, 'epoch': 1.68} {'loss': 0.5133, 'learning_rate': 1.2071081736700985e-06, 'epoch': 1.68} {'loss': 0.5463, 'learning_rate': 1.2069522646805087e-06, 'epoch': 1.68} {'loss': 0.4611, 'learning_rate': 1.206796365113465e-06, 'epoch': 1.68} {'loss': 0.4148, 'learning_rate': 1.2066404749691318e-06, 'epoch': 1.69} {'loss': 0.5811, 'learning_rate': 1.2064845942476754e-06, 'epoch': 1.69} {'loss': 0.5267, 'learning_rate': 1.2063287229492647e-06, 'epoch': 1.69} {'loss': 0.5569, 'learning_rate': 1.2061728610740674e-06, 'epoch': 1.69} {'loss': 0.691, 'learning_rate': 1.2060170086222489e-06, 'epoch': 1.69} {'loss': 0.5276, 'learning_rate': 1.2058611655939778e-06, 'epoch': 1.69} {'loss': 0.5647, 'learning_rate': 1.2057053319894208e-06, 'epoch': 1.69} {'loss': 0.5751, 'learning_rate': 1.205549507808743e-06, 'epoch': 1.69} {'loss': 0.3322, 'learning_rate': 1.2053936930521127e-06, 'epoch': 1.69} {'loss': 0.4751, 'learning_rate': 1.2052378877196968e-06, 'epoch': 1.69} {'loss': 0.6862, 'learning_rate': 1.2050820918116624e-06, 'epoch': 1.69} {'loss': 0.3638, 'learning_rate': 1.2049263053281756e-06, 'epoch': 1.69} {'loss': 0.4706, 'learning_rate': 1.2047705282694045e-06, 'epoch': 1.69} {'loss': 0.5697, 'learning_rate': 1.2046147606355174e-06, 'epoch': 1.69} {'loss': 0.3997, 'learning_rate': 1.2044590024266778e-06, 'epoch': 1.69} {'loss': 0.5112, 'learning_rate': 1.2043032536430544e-06, 'epoch': 1.69} {'loss': 0.5737, 'learning_rate': 1.2041475142848136e-06, 'epoch': 1.69} {'loss': 0.4521, 'learning_rate': 1.2039917843521231e-06, 'epoch': 1.69} {'loss': 0.553, 'learning_rate': 1.2038360638451507e-06, 'epoch': 1.69} {'loss': 0.3641, 'learning_rate': 1.2036803527640594e-06, 'epoch': 1.69} {'loss': 0.5167, 'learning_rate': 1.2035246511090192e-06, 'epoch': 1.69} {'loss': 0.5591, 'learning_rate': 1.2033689588801967e-06, 'epoch': 1.69} {'loss': 0.4678, 'learning_rate': 1.203213276077757e-06, 'epoch': 1.69} {'loss': 0.4777, 'learning_rate': 1.2030576027018692e-06, 'epoch': 1.69} {'loss': 0.4584, 'learning_rate': 1.2029019387526997e-06, 'epoch': 1.69} {'loss': 0.6073, 'learning_rate': 1.2027462842304162e-06, 'epoch': 1.69} {'loss': 0.4889, 'learning_rate': 1.2025906391351815e-06, 'epoch': 1.69} {'loss': 0.5072, 'learning_rate': 1.202435003467165e-06, 'epoch': 1.69} {'loss': 0.6269, 'learning_rate': 1.202279377226534e-06, 'epoch': 1.69} {'loss': 0.5057, 'learning_rate': 1.202123760413455e-06, 'epoch': 1.69} {'loss': 0.4268, 'learning_rate': 1.2019681530280936e-06, 'epoch': 1.69} {'loss': 0.5442, 'learning_rate': 1.2018125550706171e-06, 'epoch': 1.69} {'loss': 0.5625, 'learning_rate': 1.2016569665411959e-06, 'epoch': 1.69} {'loss': 0.4857, 'learning_rate': 1.2015013874399905e-06, 'epoch': 1.69} {'loss': 0.4908, 'learning_rate': 1.20134581776717e-06, 'epoch': 1.69} {'loss': 0.679, 'learning_rate': 1.2011902575229028e-06, 'epoch': 1.69} {'loss': 0.4241, 'learning_rate': 1.2010347067073535e-06, 'epoch': 1.69} {'loss': 0.4634, 'learning_rate': 1.2008791653206919e-06, 'epoch': 1.69} {'loss': 0.4798, 'learning_rate': 1.2007236333630778e-06, 'epoch': 1.69} {'loss': 0.6132, 'learning_rate': 1.2005681108346878e-06, 'epoch': 1.69} {'loss': 0.6322, 'learning_rate': 1.2004125977356806e-06, 'epoch': 1.69} {'loss': 0.5695, 'learning_rate': 1.200257094066225e-06, 'epoch': 1.69} {'loss': 0.5987, 'learning_rate': 1.2001015998264887e-06, 'epoch': 1.69} {'loss': 0.5304, 'learning_rate': 1.199946115016638e-06, 'epoch': 1.69} {'loss': 0.5317, 'learning_rate': 1.1997906396368408e-06, 'epoch': 1.69} {'loss': 0.4618, 'learning_rate': 1.1996351736872592e-06, 'epoch': 1.69} {'loss': 0.538, 'learning_rate': 1.199479717168066e-06, 'epoch': 1.69} {'loss': 0.5085, 'learning_rate': 1.1993242700794227e-06, 'epoch': 1.69} {'loss': 0.6795, 'learning_rate': 1.199168832421498e-06, 'epoch': 1.69} {'loss': 0.5926, 'learning_rate': 1.1990134041944567e-06, 'epoch': 1.69} {'loss': 0.4637, 'learning_rate': 1.1988579853984683e-06, 'epoch': 1.69} {'loss': 0.5479, 'learning_rate': 1.1987025760337001e-06, 'epoch': 1.69} {'loss': 0.531, 'learning_rate': 1.198547176100312e-06, 'epoch': 1.69} {'loss': 0.6168, 'learning_rate': 1.1983917855984794e-06, 'epoch': 1.69} {'loss': 0.4596, 'learning_rate': 1.1982364045283613e-06, 'epoch': 1.69} {'loss': 0.5365, 'learning_rate': 1.1980810328901283e-06, 'epoch': 1.69} {'loss': 0.4797, 'learning_rate': 1.1979256706839481e-06, 'epoch': 1.69} {'loss': 0.5152, 'learning_rate': 1.1977703179099798e-06, 'epoch': 1.69} {'loss': 0.5769, 'learning_rate': 1.1976149745683996e-06, 'epoch': 1.69} {'loss': 0.6213, 'learning_rate': 1.1974596406593663e-06, 'epoch': 1.69} {'loss': 0.6476, 'learning_rate': 1.1973043161830522e-06, 'epoch': 1.69} {'loss': 0.4576, 'learning_rate': 1.1971490011396204e-06, 'epoch': 1.69} {'loss': 0.4847, 'learning_rate': 1.196993695529236e-06, 'epoch': 1.69} {'loss': 0.4151, 'learning_rate': 1.1968383993520716e-06, 'epoch': 1.69} {'loss': 0.5164, 'learning_rate': 1.1966831126082834e-06, 'epoch': 1.69} {'loss': 0.3212, 'learning_rate': 1.1965278352980493e-06, 'epoch': 1.69} {'loss': 0.4809, 'learning_rate': 1.1963725674215253e-06, 'epoch': 1.69} {'loss': 0.5326, 'learning_rate': 1.1962173089788876e-06, 'epoch': 1.69} {'loss': 0.591, 'learning_rate': 1.1960620599702944e-06, 'epoch': 1.69} {'loss': 0.5923, 'learning_rate': 1.1959068203959157e-06, 'epoch': 1.69} {'loss': 0.5258, 'learning_rate': 1.1957515902559202e-06, 'epoch': 1.69} {'loss': 0.5397, 'learning_rate': 1.195596369550467e-06, 'epoch': 1.69} {'loss': 0.4473, 'learning_rate': 1.195441158279731e-06, 'epoch': 1.69} {'loss': 0.4282, 'learning_rate': 1.1952859564438701e-06, 'epoch': 1.69} {'loss': 0.6498, 'learning_rate': 1.1951307640430587e-06, 'epoch': 1.69} {'loss': 0.554, 'learning_rate': 1.1949755810774576e-06, 'epoch': 1.69} {'loss': 0.3697, 'learning_rate': 1.1948204075472358e-06, 'epoch': 1.69} {'loss': 0.4963, 'learning_rate': 1.1946652434525595e-06, 'epoch': 1.69} {'loss': 0.5016, 'learning_rate': 1.1945100887935912e-06, 'epoch': 1.69} {'loss': 0.5436, 'learning_rate': 1.1943549435705037e-06, 'epoch': 1.69} {'loss': 0.5297, 'learning_rate': 1.1941998077834548e-06, 'epoch': 1.69} {'loss': 0.3949, 'learning_rate': 1.19404468143262e-06, 'epoch': 1.69} {'loss': 0.4753, 'learning_rate': 1.1938895645181603e-06, 'epoch': 1.69} {'loss': 0.3881, 'learning_rate': 1.193734457040241e-06, 'epoch': 1.69} {'loss': 0.4568, 'learning_rate': 1.193579358999033e-06, 'epoch': 1.69} {'loss': 0.4584, 'learning_rate': 1.1934242703946952e-06, 'epoch': 1.69} {'loss': 0.5071, 'learning_rate': 1.193269191227403e-06, 'epoch': 1.69} {'loss': 0.5247, 'learning_rate': 1.1931141214973152e-06, 'epoch': 1.69} {'loss': 0.5082, 'learning_rate': 1.1929590612046005e-06, 'epoch': 1.69} {'loss': 0.5629, 'learning_rate': 1.1928040103494244e-06, 'epoch': 1.69} {'loss': 0.5106, 'learning_rate': 1.1926489689319543e-06, 'epoch': 1.69} {'loss': 0.558, 'learning_rate': 1.1924939369523569e-06, 'epoch': 1.69} {'loss': 0.5838, 'learning_rate': 1.1923389144107944e-06, 'epoch': 1.69} {'loss': 0.5052, 'learning_rate': 1.1921839013074388e-06, 'epoch': 1.69} {'loss': 0.4869, 'learning_rate': 1.1920288976424521e-06, 'epoch': 1.69} {'loss': 0.4003, 'learning_rate': 1.191873903416001e-06, 'epoch': 1.69} {'loss': 0.6716, 'learning_rate': 1.191718918628252e-06, 'epoch': 1.69} {'loss': 0.4042, 'learning_rate': 1.1915639432793702e-06, 'epoch': 1.69} {'loss': 0.6606, 'learning_rate': 1.191408977369526e-06, 'epoch': 1.69} {'loss': 0.5899, 'learning_rate': 1.1912540208988764e-06, 'epoch': 1.69} {'loss': 0.4824, 'learning_rate': 1.1910990738675987e-06, 'epoch': 1.69} {'loss': 0.4611, 'learning_rate': 1.1909441362758512e-06, 'epoch': 1.69} {'loss': 0.3971, 'learning_rate': 1.1907892081238014e-06, 'epoch': 1.69} {'loss': 0.4135, 'learning_rate': 1.1906342894116185e-06, 'epoch': 1.69} {'loss': 0.4683, 'learning_rate': 1.190479380139462e-06, 'epoch': 1.69} {'loss': 0.4897, 'learning_rate': 1.1903244803075066e-06, 'epoch': 1.69} {'loss': 0.6218, 'learning_rate': 1.1901695899159115e-06, 'epoch': 1.69} {'loss': 0.4984, 'learning_rate': 1.190014708964844e-06, 'epoch': 1.69} {'loss': 0.4248, 'learning_rate': 1.1898598374544712e-06, 'epoch': 1.69} {'loss': 0.5127, 'learning_rate': 1.1897049753849589e-06, 'epoch': 1.69} {'loss': 0.5513, 'learning_rate': 1.1895501227564755e-06, 'epoch': 1.69} {'loss': 0.5341, 'learning_rate': 1.1893952795691787e-06, 'epoch': 1.69} {'loss': 0.6265, 'learning_rate': 1.1892404458232454e-06, 'epoch': 1.69} {'loss': 0.4265, 'learning_rate': 1.189085621518834e-06, 'epoch': 1.69} {'loss': 0.4788, 'learning_rate': 1.1889308066561123e-06, 'epoch': 1.69} {'loss': 0.4153, 'learning_rate': 1.1887760012352467e-06, 'epoch': 1.69} {'loss': 0.5893, 'learning_rate': 1.1886212052564027e-06, 'epoch': 1.69} {'loss': 0.4657, 'learning_rate': 1.1884664187197481e-06, 'epoch': 1.69} {'loss': 0.6262, 'learning_rate': 1.1883116416254437e-06, 'epoch': 1.69} {'loss': 0.5134, 'learning_rate': 1.1881568739736627e-06, 'epoch': 1.69} {'loss': 0.4396, 'learning_rate': 1.1880021157645637e-06, 'epoch': 1.69} {'loss': 0.5464, 'learning_rate': 1.187847366998317e-06, 'epoch': 1.69} {'loss': 0.6167, 'learning_rate': 1.1876926276750867e-06, 'epoch': 1.69} {'loss': 0.4509, 'learning_rate': 1.187537897795039e-06, 'epoch': 1.69} {'loss': 0.4857, 'learning_rate': 1.1873831773583423e-06, 'epoch': 1.69} {'loss': 0.5158, 'learning_rate': 1.1872284663651578e-06, 'epoch': 1.69} {'loss': 0.5167, 'learning_rate': 1.1870737648156526e-06, 'epoch': 1.69} {'loss': 0.6693, 'learning_rate': 1.1869190727099944e-06, 'epoch': 1.69} {'loss': 0.5314, 'learning_rate': 1.1867643900483472e-06, 'epoch': 1.69} {'loss': 0.5135, 'learning_rate': 1.1866097168308776e-06, 'epoch': 1.69} {'loss': 0.4279, 'learning_rate': 1.1864550530577512e-06, 'epoch': 1.69} {'loss': 0.5276, 'learning_rate': 1.1863003987291354e-06, 'epoch': 1.69} {'loss': 0.5208, 'learning_rate': 1.1861457538451926e-06, 'epoch': 1.69} {'loss': 0.4095, 'learning_rate': 1.1859911184060902e-06, 'epoch': 1.69} {'loss': 0.6605, 'learning_rate': 1.1858364924119936e-06, 'epoch': 1.69} {'loss': 0.4664, 'learning_rate': 1.1856818758630683e-06, 'epoch': 1.69} {'loss': 0.5458, 'learning_rate': 1.185527268759481e-06, 'epoch': 1.69} {'loss': 0.5202, 'learning_rate': 1.1853726711013968e-06, 'epoch': 1.69} {'loss': 0.4969, 'learning_rate': 1.1852180828889836e-06, 'epoch': 1.69} {'loss': 0.7611, 'learning_rate': 1.1850635041224022e-06, 'epoch': 1.69} {'loss': 0.4267, 'learning_rate': 1.1849089348018205e-06, 'epoch': 1.69} {'loss': 0.563, 'learning_rate': 1.1847543749274049e-06, 'epoch': 1.69} {'loss': 0.4377, 'learning_rate': 1.1845998244993207e-06, 'epoch': 1.69} {'loss': 0.3905, 'learning_rate': 1.1844452835177333e-06, 'epoch': 1.69} {'loss': 0.4959, 'learning_rate': 1.1842907519828107e-06, 'epoch': 1.69} {'loss': 0.5827, 'learning_rate': 1.1841362298947146e-06, 'epoch': 1.69} {'loss': 0.5437, 'learning_rate': 1.1839817172536117e-06, 'epoch': 1.69} {'loss': 0.4628, 'learning_rate': 1.1838272140596684e-06, 'epoch': 1.69} {'loss': 0.6143, 'learning_rate': 1.1836727203130493e-06, 'epoch': 1.69} {'loss': 0.3361, 'learning_rate': 1.1835182360139208e-06, 'epoch': 1.69} {'loss': 0.4963, 'learning_rate': 1.1833637611624481e-06, 'epoch': 1.69} {'loss': 0.5403, 'learning_rate': 1.1832092957587993e-06, 'epoch': 1.69} {'loss': 0.4467, 'learning_rate': 1.183054839803136e-06, 'epoch': 1.69} {'loss': 0.4839, 'learning_rate': 1.182900393295624e-06, 'epoch': 1.69} {'loss': 0.468, 'learning_rate': 1.1827459562364308e-06, 'epoch': 1.69} {'loss': 0.6576, 'learning_rate': 1.1825915286257205e-06, 'epoch': 1.69} {'loss': 0.4303, 'learning_rate': 1.18243711046366e-06, 'epoch': 1.69} {'loss': 0.5259, 'learning_rate': 1.1822827017504135e-06, 'epoch': 1.69} {'loss': 0.6743, 'learning_rate': 1.1821283024861495e-06, 'epoch': 1.69} {'loss': 0.5268, 'learning_rate': 1.1819739126710283e-06, 'epoch': 1.69} {'loss': 0.5492, 'learning_rate': 1.1818195323052183e-06, 'epoch': 1.69} {'loss': 0.5074, 'learning_rate': 1.181665161388884e-06, 'epoch': 1.69} {'loss': 0.3718, 'learning_rate': 1.181510799922192e-06, 'epoch': 1.69} {'loss': 0.6149, 'learning_rate': 1.1813564479053085e-06, 'epoch': 1.69} {'loss': 0.5618, 'learning_rate': 1.1812021053383938e-06, 'epoch': 1.69} {'loss': 0.4703, 'learning_rate': 1.1810477722216207e-06, 'epoch': 1.69} {'loss': 0.5666, 'learning_rate': 1.1808934485551494e-06, 'epoch': 1.69} {'loss': 0.5146, 'learning_rate': 1.1807391343391461e-06, 'epoch': 1.69} {'loss': 0.4744, 'learning_rate': 1.1805848295737777e-06, 'epoch': 1.69} {'loss': 0.4064, 'learning_rate': 1.1804305342592081e-06, 'epoch': 1.69} {'loss': 0.3999, 'learning_rate': 1.1802762483956054e-06, 'epoch': 1.69} {'loss': 0.4842, 'learning_rate': 1.1801219719831303e-06, 'epoch': 1.69} {'loss': 0.5902, 'learning_rate': 1.1799677050219504e-06, 'epoch': 1.69} {'loss': 0.5958, 'learning_rate': 1.1798134475122325e-06, 'epoch': 1.69} {'loss': 0.5309, 'learning_rate': 1.1796591994541395e-06, 'epoch': 1.69} {'loss': 0.477, 'learning_rate': 1.1795049608478392e-06, 'epoch': 1.69} {'loss': 0.4659, 'learning_rate': 1.1793507316934928e-06, 'epoch': 1.69} {'loss': 0.6531, 'learning_rate': 1.1791965119912719e-06, 'epoch': 1.69} {'loss': 0.5799, 'learning_rate': 1.1790423017413354e-06, 'epoch': 1.69} {'loss': 0.5196, 'learning_rate': 1.1788881009438512e-06, 'epoch': 1.69} {'loss': 0.471, 'learning_rate': 1.1787339095989848e-06, 'epoch': 1.69} {'loss': 0.6018, 'learning_rate': 1.1785797277069012e-06, 'epoch': 1.69} {'loss': 0.502, 'learning_rate': 1.1784255552677682e-06, 'epoch': 1.69} {'loss': 0.5663, 'learning_rate': 1.1782713922817435e-06, 'epoch': 1.69} {'loss': 0.4886, 'learning_rate': 1.1781172387490014e-06, 'epoch': 1.69} {'loss': 0.5631, 'learning_rate': 1.1779630946697019e-06, 'epoch': 1.69} {'loss': 0.6368, 'learning_rate': 1.1778089600440102e-06, 'epoch': 1.69} {'loss': 0.4675, 'learning_rate': 1.1776548348720918e-06, 'epoch': 1.69} {'loss': 0.6233, 'learning_rate': 1.1775007191541144e-06, 'epoch': 1.69} {'loss': 0.5505, 'learning_rate': 1.1773466128902423e-06, 'epoch': 1.69} {'loss': 0.5136, 'learning_rate': 1.1771925160806353e-06, 'epoch': 1.69} {'loss': 0.6097, 'learning_rate': 1.1770384287254665e-06, 'epoch': 1.69} {'loss': 0.5698, 'learning_rate': 1.1768843508248963e-06, 'epoch': 1.69} {'loss': 0.4669, 'learning_rate': 1.1767302823790905e-06, 'epoch': 1.69} {'loss': 0.4698, 'learning_rate': 1.176576223388216e-06, 'epoch': 1.69} {'loss': 0.4436, 'learning_rate': 1.176422173852433e-06, 'epoch': 1.69} {'loss': 0.4932, 'learning_rate': 1.176268133771914e-06, 'epoch': 1.69} {'loss': 0.573, 'learning_rate': 1.1761141031468159e-06, 'epoch': 1.69} {'loss': 0.3929, 'learning_rate': 1.175960081977312e-06, 'epoch': 1.69} {'loss': 0.5316, 'learning_rate': 1.175806070263561e-06, 'epoch': 1.69} {'loss': 0.4125, 'learning_rate': 1.1756520680057315e-06, 'epoch': 1.69} {'loss': 0.5188, 'learning_rate': 1.1754980752039879e-06, 'epoch': 1.69} {'loss': 0.4441, 'learning_rate': 1.1753440918584913e-06, 'epoch': 1.69} {'loss': 0.5022, 'learning_rate': 1.1751901179694136e-06, 'epoch': 1.69} {'loss': 0.6941, 'learning_rate': 1.1750361535369115e-06, 'epoch': 1.69} {'loss': 0.4859, 'learning_rate': 1.1748821985611604e-06, 'epoch': 1.69} {'loss': 0.6139, 'learning_rate': 1.1747282530423165e-06, 'epoch': 1.69} {'loss': 0.4473, 'learning_rate': 1.174574316980548e-06, 'epoch': 1.69} {'loss': 0.464, 'learning_rate': 1.174420390376021e-06, 'epoch': 1.69} {'loss': 0.4739, 'learning_rate': 1.1742664732288956e-06, 'epoch': 1.69} {'loss': 0.4239, 'learning_rate': 1.174112565539345e-06, 'epoch': 1.69} {'loss': 0.4943, 'learning_rate': 1.1739586673075242e-06, 'epoch': 1.69} {'loss': 0.4697, 'learning_rate': 1.1738047785336082e-06, 'epoch': 1.69} {'loss': 0.5729, 'learning_rate': 1.1736508992177541e-06, 'epoch': 1.69} {'loss': 0.667, 'learning_rate': 1.17349702936013e-06, 'epoch': 1.69} {'loss': 0.6223, 'learning_rate': 1.1733431689609031e-06, 'epoch': 1.69} {'loss': 0.5338, 'learning_rate': 1.1731893180202304e-06, 'epoch': 1.69} {'loss': 0.5148, 'learning_rate': 1.1730354765382867e-06, 'epoch': 1.69} {'loss': 0.6456, 'learning_rate': 1.1728816445152291e-06, 'epoch': 1.69} {'loss': 0.5199, 'learning_rate': 1.1727278219512284e-06, 'epoch': 1.69} {'loss': 0.3933, 'learning_rate': 1.1725740088464444e-06, 'epoch': 1.69} {'loss': 0.4993, 'learning_rate': 1.1724202052010447e-06, 'epoch': 1.69} {'loss': 0.5294, 'learning_rate': 1.172266411015196e-06, 'epoch': 1.69} {'loss': 0.6256, 'learning_rate': 1.1721126262890547e-06, 'epoch': 1.69} {'loss': 0.5049, 'learning_rate': 1.1719588510227976e-06, 'epoch': 1.69} {'loss': 0.4129, 'learning_rate': 1.1718050852165786e-06, 'epoch': 1.69} {'loss': 0.5307, 'learning_rate': 1.1716513288705711e-06, 'epoch': 1.69} {'loss': 0.29, 'learning_rate': 1.1714975819849339e-06, 'epoch': 1.69} {'loss': 0.5231, 'learning_rate': 1.1713438445598334e-06, 'epoch': 1.69} {'loss': 0.5653, 'learning_rate': 1.1711901165954375e-06, 'epoch': 1.69} {'loss': 0.4031, 'learning_rate': 1.1710363980919037e-06, 'epoch': 1.69} {'loss': 0.6165, 'learning_rate': 1.1708826890494062e-06, 'epoch': 1.69} {'loss': 0.5308, 'learning_rate': 1.1707289894681018e-06, 'epoch': 1.69} {'loss': 0.4663, 'learning_rate': 1.1705752993481588e-06, 'epoch': 1.69} {'loss': 0.4265, 'learning_rate': 1.170421618689741e-06, 'epoch': 1.69} {'loss': 0.5341, 'learning_rate': 1.1702679474930133e-06, 'epoch': 1.69} {'loss': 0.564, 'learning_rate': 1.1701142857581426e-06, 'epoch': 1.69} {'loss': 0.4922, 'learning_rate': 1.1699606334852875e-06, 'epoch': 1.69} {'loss': 0.5704, 'learning_rate': 1.1698069906746202e-06, 'epoch': 1.69} {'loss': 0.4872, 'learning_rate': 1.1696533573263003e-06, 'epoch': 1.69} {'loss': 0.4189, 'learning_rate': 1.1694997334404933e-06, 'epoch': 1.69} {'loss': 0.4457, 'learning_rate': 1.1693461190173649e-06, 'epoch': 1.69} {'loss': 0.5305, 'learning_rate': 1.169192514057078e-06, 'epoch': 1.69} {'loss': 0.4962, 'learning_rate': 1.1690389185598016e-06, 'epoch': 1.69} {'loss': 0.3433, 'learning_rate': 1.1688853325256922e-06, 'epoch': 1.69} {'loss': 0.5218, 'learning_rate': 1.1687317559549238e-06, 'epoch': 1.69} {'loss': 0.5042, 'learning_rate': 1.1685781888476532e-06, 'epoch': 1.69} {'loss': 0.4204, 'learning_rate': 1.1684246312040492e-06, 'epoch': 1.69} {'loss': 0.4879, 'learning_rate': 1.168271083024276e-06, 'epoch': 1.69} {'loss': 0.3737, 'learning_rate': 1.1681175443084957e-06, 'epoch': 1.69} {'loss': 0.4841, 'learning_rate': 1.1679640150568784e-06, 'epoch': 1.69} {'loss': 0.4703, 'learning_rate': 1.1678104952695813e-06, 'epoch': 1.69} {'loss': 0.4822, 'learning_rate': 1.1676569849467733e-06, 'epoch': 1.69} {'loss': 0.6112, 'learning_rate': 1.1675034840886178e-06, 'epoch': 1.69} {'loss': 0.6157, 'learning_rate': 1.167349992695279e-06, 'epoch': 1.69} {'loss': 0.5147, 'learning_rate': 1.1671965107669247e-06, 'epoch': 1.69} {'loss': 0.5285, 'learning_rate': 1.1670430383037124e-06, 'epoch': 1.69} {'loss': 0.5077, 'learning_rate': 1.166889575305814e-06, 'epoch': 1.69} {'loss': 0.5623, 'learning_rate': 1.1667361217733886e-06, 'epoch': 1.69} {'loss': 0.4687, 'learning_rate': 1.1665826777066037e-06, 'epoch': 1.69} {'loss': 0.4401, 'learning_rate': 1.1664292431056223e-06, 'epoch': 1.69} {'loss': 0.6246, 'learning_rate': 1.1662758179706091e-06, 'epoch': 1.69} {'loss': 0.4806, 'learning_rate': 1.1661224023017304e-06, 'epoch': 1.69} {'loss': 0.5111, 'learning_rate': 1.1659689960991472e-06, 'epoch': 1.69} {'loss': 0.43, 'learning_rate': 1.1658155993630261e-06, 'epoch': 1.69} {'loss': 0.4592, 'learning_rate': 1.16566221209353e-06, 'epoch': 1.69} {'loss': 0.5836, 'learning_rate': 1.165508834290825e-06, 'epoch': 1.69} {'loss': 0.6141, 'learning_rate': 1.1653554659550737e-06, 'epoch': 1.69} {'loss': 0.5107, 'learning_rate': 1.1652021070864416e-06, 'epoch': 1.69} {'loss': 0.4721, 'learning_rate': 1.1650487576850955e-06, 'epoch': 1.69} {'loss': 0.5568, 'learning_rate': 1.164895417751195e-06, 'epoch': 1.69} {'loss': 0.6101, 'learning_rate': 1.1647420872849058e-06, 'epoch': 1.69} {'loss': 0.4644, 'learning_rate': 1.164588766286393e-06, 'epoch': 1.69} {'loss': 0.5851, 'learning_rate': 1.1644354547558211e-06, 'epoch': 1.69} {'loss': 0.2967, 'learning_rate': 1.1642821526933535e-06, 'epoch': 1.69} {'loss': 0.5706, 'learning_rate': 1.1641288600991563e-06, 'epoch': 1.69} {'loss': 0.631, 'learning_rate': 1.163975576973393e-06, 'epoch': 1.69} {'loss': 0.3269, 'learning_rate': 1.1638223033162265e-06, 'epoch': 1.69} {'loss': 0.5457, 'learning_rate': 1.1636690391278215e-06, 'epoch': 1.69} {'loss': 0.4289, 'learning_rate': 1.1635157844083421e-06, 'epoch': 1.69} {'loss': 0.5977, 'learning_rate': 1.163362539157954e-06, 'epoch': 1.69} {'loss': 0.7319, 'learning_rate': 1.1632093033768199e-06, 'epoch': 1.69} {'loss': 0.5094, 'learning_rate': 1.1630560770651078e-06, 'epoch': 1.69} {'loss': 0.4816, 'learning_rate': 1.1629028602229752e-06, 'epoch': 1.69} {'loss': 0.5468, 'learning_rate': 1.1627496528505899e-06, 'epoch': 1.69} {'loss': 0.4794, 'learning_rate': 1.1625964549481172e-06, 'epoch': 1.69} {'loss': 0.4606, 'learning_rate': 1.1624432665157193e-06, 'epoch': 1.69} {'loss': 0.5373, 'learning_rate': 1.1622900875535604e-06, 'epoch': 1.69} {'loss': 0.6225, 'learning_rate': 1.1621369180618058e-06, 'epoch': 1.69} {'loss': 0.6422, 'learning_rate': 1.1619837580406212e-06, 'epoch': 1.69} {'loss': 0.4913, 'learning_rate': 1.1618306074901676e-06, 'epoch': 1.69} {'loss': 0.3775, 'learning_rate': 1.161677466410609e-06, 'epoch': 1.69} {'loss': 0.4059, 'learning_rate': 1.161524334802111e-06, 'epoch': 1.69} {'loss': 0.5949, 'learning_rate': 1.1613712126648368e-06, 'epoch': 1.69} {'loss': 0.6228, 'learning_rate': 1.161218099998952e-06, 'epoch': 1.69} {'loss': 0.5627, 'learning_rate': 1.1610649968046195e-06, 'epoch': 1.69} {'loss': 0.6212, 'learning_rate': 1.160911903082006e-06, 'epoch': 1.69} {'loss': 0.4977, 'learning_rate': 1.1607588188312702e-06, 'epoch': 1.69} {'loss': 0.4119, 'learning_rate': 1.1606057440525798e-06, 'epoch': 1.69} {'loss': 0.5438, 'learning_rate': 1.160452678746098e-06, 'epoch': 1.69} {'loss': 0.6203, 'learning_rate': 1.160299622911989e-06, 'epoch': 1.69} {'loss': 0.5226, 'learning_rate': 1.1601465765504195e-06, 'epoch': 1.69} {'loss': 0.4854, 'learning_rate': 1.1599935396615457e-06, 'epoch': 1.69} {'loss': 0.5632, 'learning_rate': 1.1598405122455414e-06, 'epoch': 1.69} {'loss': 0.494, 'learning_rate': 1.1596874943025638e-06, 'epoch': 1.69} {'loss': 0.5978, 'learning_rate': 1.1595344858327784e-06, 'epoch': 1.69} {'loss': 0.4513, 'learning_rate': 1.1593814868363496e-06, 'epoch': 1.69} {'loss': 0.5662, 'learning_rate': 1.1592284973134416e-06, 'epoch': 1.69} {'loss': 0.5448, 'learning_rate': 1.159075517264221e-06, 'epoch': 1.69} {'loss': 0.477, 'learning_rate': 1.1589225466888443e-06, 'epoch': 1.69} {'loss': 0.5991, 'learning_rate': 1.1587695855874835e-06, 'epoch': 1.69} {'loss': 0.5674, 'learning_rate': 1.1586166339602979e-06, 'epoch': 1.69} {'loss': 0.6643, 'learning_rate': 1.158463691807452e-06, 'epoch': 1.69} {'loss': 0.6465, 'learning_rate': 1.1583107591291109e-06, 'epoch': 1.69} {'loss': 0.5081, 'learning_rate': 1.1581578359254375e-06, 'epoch': 1.69} {'loss': 0.5304, 'learning_rate': 1.1580049221965983e-06, 'epoch': 1.69} {'loss': 0.4521, 'learning_rate': 1.1578520179427511e-06, 'epoch': 1.69} {'loss': 0.5884, 'learning_rate': 1.1576991231640667e-06, 'epoch': 1.69} {'loss': 0.455, 'learning_rate': 1.157546237860704e-06, 'epoch': 1.69} {'loss': 0.5415, 'learning_rate': 1.1573933620328282e-06, 'epoch': 1.69} {'loss': 0.5549, 'learning_rate': 1.157240495680606e-06, 'epoch': 1.69} {'loss': 0.5989, 'learning_rate': 1.1570876388041953e-06, 'epoch': 1.69} {'loss': 0.51, 'learning_rate': 1.1569347914037666e-06, 'epoch': 1.69} {'loss': 0.498, 'learning_rate': 1.1567819534794767e-06, 'epoch': 1.69} {'loss': 0.6538, 'learning_rate': 1.1566291250314964e-06, 'epoch': 1.69} {'loss': 0.5203, 'learning_rate': 1.1564763060599848e-06, 'epoch': 1.69} {'loss': 0.5375, 'learning_rate': 1.156323496565107e-06, 'epoch': 1.69} {'loss': 0.5328, 'learning_rate': 1.1561706965470287e-06, 'epoch': 1.69} {'loss': 0.4801, 'learning_rate': 1.1560179060059074e-06, 'epoch': 1.69} {'loss': 0.5168, 'learning_rate': 1.155865124941915e-06, 'epoch': 1.69} {'loss': 0.5354, 'learning_rate': 1.1557123533552094e-06, 'epoch': 1.69} {'loss': 0.4899, 'learning_rate': 1.1555595912459572e-06, 'epoch': 1.69} {'loss': 0.6369, 'learning_rate': 1.1554068386143202e-06, 'epoch': 1.69} {'loss': 0.5944, 'learning_rate': 1.155254095460463e-06, 'epoch': 1.69} {'loss': 0.2926, 'learning_rate': 1.155101361784552e-06, 'epoch': 1.69} {'loss': 0.4745, 'learning_rate': 1.1549486375867436e-06, 'epoch': 1.69} {'loss': 0.6347, 'learning_rate': 1.1547959228672111e-06, 'epoch': 1.69} {'loss': 0.5156, 'learning_rate': 1.1546432176261101e-06, 'epoch': 1.69} {'loss': 0.5091, 'learning_rate': 1.1544905218636072e-06, 'epoch': 1.69} {'loss': 0.5498, 'learning_rate': 1.1543378355798663e-06, 'epoch': 1.69} {'loss': 0.5608, 'learning_rate': 1.1541851587750509e-06, 'epoch': 1.69} {'loss': 0.5444, 'learning_rate': 1.154032491449326e-06, 'epoch': 1.69} {'loss': 0.706, 'learning_rate': 1.15387983360285e-06, 'epoch': 1.69} {'loss': 0.478, 'learning_rate': 1.1537271852357946e-06, 'epoch': 1.69} {'loss': 0.503, 'learning_rate': 1.1535745463483172e-06, 'epoch': 1.69} {'loss': 0.5853, 'learning_rate': 1.1534219169405826e-06, 'epoch': 1.69} {'loss': 0.3923, 'learning_rate': 1.1532692970127569e-06, 'epoch': 1.69} {'loss': 0.4796, 'learning_rate': 1.1531166865649968e-06, 'epoch': 1.69} {'loss': 0.541, 'learning_rate': 1.1529640855974755e-06, 'epoch': 1.69} {'loss': 0.5628, 'learning_rate': 1.1528114941103474e-06, 'epoch': 1.69} {'loss': 0.3537, 'learning_rate': 1.1526589121037846e-06, 'epoch': 1.69} {'loss': 0.3824, 'learning_rate': 1.1525063395779446e-06, 'epoch': 1.69} {'loss': 0.4053, 'learning_rate': 1.1523537765329917e-06, 'epoch': 1.69} {'loss': 0.5864, 'learning_rate': 1.1522012229690927e-06, 'epoch': 1.69} {'loss': 0.4143, 'learning_rate': 1.1520486788864049e-06, 'epoch': 1.69} {'loss': 0.354, 'learning_rate': 1.1518961442850985e-06, 'epoch': 1.69} {'loss': 0.5594, 'learning_rate': 1.1517436191653307e-06, 'epoch': 1.69} {'loss': 0.4016, 'learning_rate': 1.151591103527273e-06, 'epoch': 1.69} {'loss': 0.5768, 'learning_rate': 1.1514385973710807e-06, 'epoch': 1.69} {'loss': 0.4445, 'learning_rate': 1.1512861006969212e-06, 'epoch': 1.69} {'loss': 0.3309, 'learning_rate': 1.1511336135049588e-06, 'epoch': 1.69} {'loss': 0.4206, 'learning_rate': 1.1509811357953526e-06, 'epoch': 1.69} {'loss': 0.7016, 'learning_rate': 1.1508286675682723e-06, 'epoch': 1.69} {'loss': 0.4879, 'learning_rate': 1.1506762088238733e-06, 'epoch': 1.69} {'loss': 0.3557, 'learning_rate': 1.1505237595623275e-06, 'epoch': 1.69} {'loss': 0.5106, 'learning_rate': 1.1503713197837918e-06, 'epoch': 1.69} {'loss': 0.5015, 'learning_rate': 1.1502188894884325e-06, 'epoch': 1.69} {'loss': 0.5238, 'learning_rate': 1.1500664686764152e-06, 'epoch': 1.69} {'loss': 0.4504, 'learning_rate': 1.1499140573478951e-06, 'epoch': 1.69} {'loss': 0.4887, 'learning_rate': 1.1497616555030456e-06, 'epoch': 1.69} {'loss': 0.4182, 'learning_rate': 1.149609263142023e-06, 'epoch': 1.69} {'loss': 0.556, 'learning_rate': 1.149456880264993e-06, 'epoch': 1.69} {'loss': 0.3796, 'learning_rate': 1.1493045068721187e-06, 'epoch': 1.69} {'loss': 0.5507, 'learning_rate': 1.1491521429635633e-06, 'epoch': 1.69} {'loss': 0.7312, 'learning_rate': 1.1489997885394933e-06, 'epoch': 1.69} {'loss': 0.5409, 'learning_rate': 1.1488474436000629e-06, 'epoch': 1.69} {'loss': 0.5229, 'learning_rate': 1.1486951081454467e-06, 'epoch': 1.69} {'loss': 0.4949, 'learning_rate': 1.1485427821757999e-06, 'epoch': 1.69} {'loss': 0.4525, 'learning_rate': 1.1483904656912891e-06, 'epoch': 1.69} {'loss': 0.4484, 'learning_rate': 1.1482381586920765e-06, 'epoch': 1.69} {'loss': 0.5512, 'learning_rate': 1.1480858611783251e-06, 'epoch': 1.69} {'loss': 0.4179, 'learning_rate': 1.1479335731502018e-06, 'epoch': 1.69} {'loss': 0.6398, 'learning_rate': 1.1477812946078615e-06, 'epoch': 1.69} {'loss': 0.6198, 'learning_rate': 1.1476290255514777e-06, 'epoch': 1.69} {'loss': 0.627, 'learning_rate': 1.1474767659812058e-06, 'epoch': 1.69} {'loss': 0.4507, 'learning_rate': 1.1473245158972113e-06, 'epoch': 1.69} {'loss': 0.5225, 'learning_rate': 1.1471722752996573e-06, 'epoch': 1.69} {'loss': 0.5688, 'learning_rate': 1.147020044188708e-06, 'epoch': 1.69} {'loss': 0.4867, 'learning_rate': 1.1468678225645269e-06, 'epoch': 1.69} {'loss': 0.4739, 'learning_rate': 1.1467156104272748e-06, 'epoch': 1.69} {'loss': 0.522, 'learning_rate': 1.146563407777116e-06, 'epoch': 1.69} {'loss': 0.4517, 'learning_rate': 1.1464112146142126e-06, 'epoch': 1.69} {'loss': 0.3992, 'learning_rate': 1.1462590309387289e-06, 'epoch': 1.69} {'loss': 0.4235, 'learning_rate': 1.1461068567508282e-06, 'epoch': 1.69} {'loss': 0.5928, 'learning_rate': 1.1459546920506736e-06, 'epoch': 1.69} {'loss': 0.6988, 'learning_rate': 1.1458025368384284e-06, 'epoch': 1.69} {'loss': 0.4407, 'learning_rate': 1.1456503911142536e-06, 'epoch': 1.69} {'loss': 0.5308, 'learning_rate': 1.1454982548783144e-06, 'epoch': 1.69} {'loss': 0.6068, 'learning_rate': 1.145346128130772e-06, 'epoch': 1.69} {'loss': 0.5019, 'learning_rate': 1.1451940108717908e-06, 'epoch': 1.69} {'loss': 0.4072, 'learning_rate': 1.1450419031015325e-06, 'epoch': 1.69} {'loss': 0.4997, 'learning_rate': 1.1448898048201618e-06, 'epoch': 1.69} {'loss': 0.5409, 'learning_rate': 1.1447377160278429e-06, 'epoch': 1.69} {'loss': 0.3901, 'learning_rate': 1.1445856367247343e-06, 'epoch': 1.69} {'loss': 0.467, 'learning_rate': 1.1444335669110017e-06, 'epoch': 1.69} {'loss': 0.5588, 'learning_rate': 1.1442815065868086e-06, 'epoch': 1.69} {'loss': 0.5796, 'learning_rate': 1.1441294557523164e-06, 'epoch': 1.69} {'loss': 0.5318, 'learning_rate': 1.1439774144076888e-06, 'epoch': 1.69} {'loss': 0.5238, 'learning_rate': 1.143825382553091e-06, 'epoch': 1.69} {'loss': 0.542, 'learning_rate': 1.1436733601886807e-06, 'epoch': 1.69} {'loss': 0.5334, 'learning_rate': 1.1435213473146244e-06, 'epoch': 1.69} {'loss': 0.6884, 'learning_rate': 1.1433693439310844e-06, 'epoch': 1.69} {'loss': 0.5407, 'learning_rate': 1.1432173500382238e-06, 'epoch': 1.69} {'loss': 0.368, 'learning_rate': 1.1430653656362045e-06, 'epoch': 1.69} {'loss': 0.4086, 'learning_rate': 1.142913390725192e-06, 'epoch': 1.69} {'loss': 0.4927, 'learning_rate': 1.1427614253053465e-06, 'epoch': 1.69} {'loss': 0.5989, 'learning_rate': 1.1426094693768308e-06, 'epoch': 1.69} {'loss': 0.4318, 'learning_rate': 1.1424575229398082e-06, 'epoch': 1.69} {'loss': 0.4511, 'learning_rate': 1.142305585994441e-06, 'epoch': 1.69} {'loss': 0.6314, 'learning_rate': 1.1421536585408944e-06, 'epoch': 1.69} {'loss': 0.3798, 'learning_rate': 1.1420017405793282e-06, 'epoch': 1.69} {'loss': 0.5688, 'learning_rate': 1.1418498321099103e-06, 'epoch': 1.69} {'loss': 0.5683, 'learning_rate': 1.141697933132797e-06, 'epoch': 1.69} {'loss': 0.4879, 'learning_rate': 1.1415460436481528e-06, 'epoch': 1.69} {'loss': 0.4381, 'learning_rate': 1.1413941636561432e-06, 'epoch': 1.69} {'loss': 0.55, 'learning_rate': 1.1412422931569279e-06, 'epoch': 1.69} {'loss': 0.4815, 'learning_rate': 1.1410904321506721e-06, 'epoch': 1.69} {'loss': 0.4861, 'learning_rate': 1.1409385806375394e-06, 'epoch': 1.69} {'loss': 0.3107, 'learning_rate': 1.1407867386176885e-06, 'epoch': 1.69} {'loss': 0.5415, 'learning_rate': 1.1406349060912836e-06, 'epoch': 1.69} {'loss': 0.532, 'learning_rate': 1.140483083058488e-06, 'epoch': 1.69} {'loss': 0.471, 'learning_rate': 1.1403312695194647e-06, 'epoch': 1.69} {'loss': 0.5023, 'learning_rate': 1.140179465474377e-06, 'epoch': 1.69} {'loss': 0.438, 'learning_rate': 1.1400276709233848e-06, 'epoch': 1.69} {'loss': 0.3988, 'learning_rate': 1.139875885866656e-06, 'epoch': 1.69} {'loss': 0.3824, 'learning_rate': 1.1397241103043477e-06, 'epoch': 1.69} {'loss': 0.3937, 'learning_rate': 1.1395723442366247e-06, 'epoch': 1.69} {'loss': 0.5735, 'learning_rate': 1.139420587663649e-06, 'epoch': 1.69} {'loss': 0.4933, 'learning_rate': 1.1392688405855845e-06, 'epoch': 1.69} {'loss': 0.4441, 'learning_rate': 1.139117103002595e-06, 'epoch': 1.69} {'loss': 0.4081, 'learning_rate': 1.1389653749148367e-06, 'epoch': 1.69} {'loss': 0.4285, 'learning_rate': 1.1388136563224817e-06, 'epoch': 1.69} {'loss': 0.5295, 'learning_rate': 1.1386619472256855e-06, 'epoch': 1.69} {'loss': 0.4841, 'learning_rate': 1.1385102476246125e-06, 'epoch': 1.69} {'loss': 0.4676, 'learning_rate': 1.1383585575194257e-06, 'epoch': 1.69} {'loss': 0.5588, 'learning_rate': 1.1382068769102872e-06, 'epoch': 1.69} {'loss': 0.4525, 'learning_rate': 1.1380552057973614e-06, 'epoch': 1.69} {'loss': 0.4757, 'learning_rate': 1.1379035441808063e-06, 'epoch': 1.69} {'loss': 0.5461, 'learning_rate': 1.137751892060791e-06, 'epoch': 1.69} {'loss': 0.3882, 'learning_rate': 1.1376002494374727e-06, 'epoch': 1.69} {'loss': 0.5413, 'learning_rate': 1.1374486163110155e-06, 'epoch': 1.69} {'loss': 0.4211, 'learning_rate': 1.1372969926815814e-06, 'epoch': 1.69} {'loss': 0.5245, 'learning_rate': 1.1371453785493347e-06, 'epoch': 1.69} {'loss': 0.5332, 'learning_rate': 1.1369937739144378e-06, 'epoch': 1.69} {'loss': 0.4737, 'learning_rate': 1.1368421787770479e-06, 'epoch': 1.69} {'loss': 0.3145, 'learning_rate': 1.1366905931373362e-06, 'epoch': 1.69} {'loss': 0.6316, 'learning_rate': 1.1365390169954582e-06, 'epoch': 1.69} {'loss': 0.5347, 'learning_rate': 1.1363874503515782e-06, 'epoch': 1.69} {'loss': 0.4342, 'learning_rate': 1.1362358932058615e-06, 'epoch': 1.69} {'loss': 0.5008, 'learning_rate': 1.1360843455584635e-06, 'epoch': 1.69} {'loss': 0.5257, 'learning_rate': 1.1359328074095556e-06, 'epoch': 1.69} {'loss': 0.4592, 'learning_rate': 1.1357812787592914e-06, 'epoch': 1.69} {'loss': 0.5838, 'learning_rate': 1.1356297596078425e-06, 'epoch': 1.69} {'loss': 0.5226, 'learning_rate': 1.135478249955363e-06, 'epoch': 1.69} {'loss': 0.494, 'learning_rate': 1.1353267498020194e-06, 'epoch': 1.69} {'loss': 0.5347, 'learning_rate': 1.135175259147976e-06, 'epoch': 1.69} {'loss': 0.5509, 'learning_rate': 1.135023777993387e-06, 'epoch': 1.69} {'loss': 0.4626, 'learning_rate': 1.1348723063384249e-06, 'epoch': 1.69} {'loss': 0.3937, 'learning_rate': 1.1347208441832436e-06, 'epoch': 1.69} {'loss': 0.6207, 'learning_rate': 1.1345693915280121e-06, 'epoch': 1.69} {'loss': 0.5976, 'learning_rate': 1.1344179483728878e-06, 'epoch': 1.69} {'loss': 0.6264, 'learning_rate': 1.1342665147180353e-06, 'epoch': 1.69} {'loss': 0.7085, 'learning_rate': 1.1341150905636189e-06, 'epoch': 1.69} {'loss': 0.4872, 'learning_rate': 1.1339636759097938e-06, 'epoch': 1.69} {'loss': 0.5198, 'learning_rate': 1.13381227075673e-06, 'epoch': 1.69} {'loss': 0.3714, 'learning_rate': 1.1336608751045841e-06, 'epoch': 1.69} {'loss': 0.4087, 'learning_rate': 1.1335094889535236e-06, 'epoch': 1.69} {'loss': 0.4911, 'learning_rate': 1.1333581123037063e-06, 'epoch': 1.69} {'loss': 0.4149, 'learning_rate': 1.1332067451552963e-06, 'epoch': 1.69} {'loss': 0.5395, 'learning_rate': 1.1330553875084572e-06, 'epoch': 1.69} {'loss': 0.5348, 'learning_rate': 1.1329040393633461e-06, 'epoch': 1.69} {'loss': 0.4802, 'learning_rate': 1.1327527007201323e-06, 'epoch': 1.7} {'loss': 0.3528, 'learning_rate': 1.132601371578972e-06, 'epoch': 1.7} {'loss': 0.5473, 'learning_rate': 1.1324500519400305e-06, 'epoch': 1.7} {'loss': 0.4983, 'learning_rate': 1.132298741803468e-06, 'epoch': 1.7} {'loss': 0.5388, 'learning_rate': 1.132147441169449e-06, 'epoch': 1.7} {'loss': 0.6186, 'learning_rate': 1.1319961500381348e-06, 'epoch': 1.7} {'loss': 0.4482, 'learning_rate': 1.1318448684096838e-06, 'epoch': 1.7} {'loss': 0.618, 'learning_rate': 1.1316935962842668e-06, 'epoch': 1.7} {'loss': 0.5019, 'learning_rate': 1.1315423336620367e-06, 'epoch': 1.7} {'loss': 0.4937, 'learning_rate': 1.1313910805431604e-06, 'epoch': 1.7} {'loss': 0.5214, 'learning_rate': 1.1312398369277988e-06, 'epoch': 1.7} {'loss': 0.629, 'learning_rate': 1.131088602816114e-06, 'epoch': 1.7} {'loss': 0.4796, 'learning_rate': 1.13093737820827e-06, 'epoch': 1.7} {'loss': 0.4768, 'learning_rate': 1.1307861631044236e-06, 'epoch': 1.7} {'loss': 0.5723, 'learning_rate': 1.1306349575047436e-06, 'epoch': 1.7} {'loss': 0.4865, 'learning_rate': 1.1304837614093878e-06, 'epoch': 1.7} {'loss': 0.5235, 'learning_rate': 1.1303325748185178e-06, 'epoch': 1.7} {'loss': 0.4954, 'learning_rate': 1.1301813977323006e-06, 'epoch': 1.7} {'loss': 0.562, 'learning_rate': 1.1300302301508891e-06, 'epoch': 1.7} {'loss': 0.5867, 'learning_rate': 1.1298790720744558e-06, 'epoch': 1.7} {'loss': 0.4438, 'learning_rate': 1.1297279235031534e-06, 'epoch': 1.7} {'loss': 0.5076, 'learning_rate': 1.1295767844371518e-06, 'epoch': 1.7} {'loss': 0.6214, 'learning_rate': 1.129425654876608e-06, 'epoch': 1.7} {'loss': 0.4955, 'learning_rate': 1.129274534821685e-06, 'epoch': 1.7} {'loss': 0.6224, 'learning_rate': 1.1291234242725457e-06, 'epoch': 1.7} {'loss': 0.5677, 'learning_rate': 1.1289723232293492e-06, 'epoch': 1.7} {'loss': 0.3686, 'learning_rate': 1.128821231692262e-06, 'epoch': 1.7} {'loss': 0.4768, 'learning_rate': 1.1286701496614405e-06, 'epoch': 1.7} {'loss': 0.5196, 'learning_rate': 1.1285190771370535e-06, 'epoch': 1.7} {'loss': 0.6335, 'learning_rate': 1.1283680141192566e-06, 'epoch': 1.7} {'loss': 0.6255, 'learning_rate': 1.1282169606082139e-06, 'epoch': 1.7} {'loss': 0.52, 'learning_rate': 1.1280659166040898e-06, 'epoch': 1.7} {'loss': 0.348, 'learning_rate': 1.1279148821070396e-06, 'epoch': 1.7} {'loss': 0.6435, 'learning_rate': 1.1277638571172345e-06, 'epoch': 1.7} {'loss': 0.5415, 'learning_rate': 1.1276128416348276e-06, 'epoch': 1.7} {'loss': 0.4306, 'learning_rate': 1.1274618356599854e-06, 'epoch': 1.7} {'loss': 0.5357, 'learning_rate': 1.1273108391928677e-06, 'epoch': 1.7} {'loss': 0.4127, 'learning_rate': 1.127159852233638e-06, 'epoch': 1.7} {'loss': 0.3805, 'learning_rate': 1.1270088747824591e-06, 'epoch': 1.7} {'loss': 0.4322, 'learning_rate': 1.1268579068394869e-06, 'epoch': 1.7} {'loss': 0.5337, 'learning_rate': 1.126706948404892e-06, 'epoch': 1.7} {'loss': 0.6207, 'learning_rate': 1.1265559994788289e-06, 'epoch': 1.7} {'loss': 0.4851, 'learning_rate': 1.1264050600614618e-06, 'epoch': 1.7} {'loss': 0.3623, 'learning_rate': 1.1262541301529527e-06, 'epoch': 1.7} {'loss': 0.5745, 'learning_rate': 1.126103209753463e-06, 'epoch': 1.7} {'loss': 0.6428, 'learning_rate': 1.1259522988631578e-06, 'epoch': 1.7} {'loss': 0.5598, 'learning_rate': 1.1258013974821923e-06, 'epoch': 1.7} {'loss': 0.5056, 'learning_rate': 1.1256505056107315e-06, 'epoch': 1.7} {'loss': 0.4962, 'learning_rate': 1.125499623248938e-06, 'epoch': 1.7} {'loss': 0.5221, 'learning_rate': 1.1253487503969718e-06, 'epoch': 1.7} {'loss': 0.6142, 'learning_rate': 1.1251978870549963e-06, 'epoch': 1.7} {'loss': 0.5555, 'learning_rate': 1.125047033223171e-06, 'epoch': 1.7} {'loss': 0.4909, 'learning_rate': 1.1248961889016619e-06, 'epoch': 1.7} {'loss': 0.5171, 'learning_rate': 1.1247453540906262e-06, 'epoch': 1.7} {'loss': 0.4614, 'learning_rate': 1.1245945287902248e-06, 'epoch': 1.7} {'loss': 0.6319, 'learning_rate': 1.1244437130006237e-06, 'epoch': 1.7} {'loss': 0.4174, 'learning_rate': 1.1242929067219809e-06, 'epoch': 1.7} {'loss': 0.3419, 'learning_rate': 1.124142109954459e-06, 'epoch': 1.7} {'loss': 0.479, 'learning_rate': 1.1239913226982203e-06, 'epoch': 1.7} {'loss': 0.5301, 'learning_rate': 1.1238405449534284e-06, 'epoch': 1.7} {'loss': 0.4636, 'learning_rate': 1.1236897767202403e-06, 'epoch': 1.7} {'loss': 0.5892, 'learning_rate': 1.1235390179988203e-06, 'epoch': 1.7} {'loss': 0.6222, 'learning_rate': 1.1233882687893283e-06, 'epoch': 1.7} {'loss': 0.4574, 'learning_rate': 1.1232375290919272e-06, 'epoch': 1.7} {'loss': 0.4628, 'learning_rate': 1.1230867989067785e-06, 'epoch': 1.7} {'loss': 0.4865, 'learning_rate': 1.1229360782340459e-06, 'epoch': 1.7} {'loss': 0.3736, 'learning_rate': 1.1227853670738865e-06, 'epoch': 1.7} {'loss': 0.3342, 'learning_rate': 1.122634665426463e-06, 'epoch': 1.7} {'loss': 0.5921, 'learning_rate': 1.122483973291938e-06, 'epoch': 1.7} {'loss': 0.515, 'learning_rate': 1.122333290670473e-06, 'epoch': 1.7} {'loss': 0.5209, 'learning_rate': 1.1221826175622285e-06, 'epoch': 1.7} {'loss': 0.3892, 'learning_rate': 1.1220319539673675e-06, 'epoch': 1.7} {'loss': 0.6321, 'learning_rate': 1.1218812998860518e-06, 'epoch': 1.7} {'loss': 0.5076, 'learning_rate': 1.1217306553184392e-06, 'epoch': 1.7} {'loss': 0.4896, 'learning_rate': 1.1215800202646943e-06, 'epoch': 1.7} {'loss': 0.5973, 'learning_rate': 1.1214293947249777e-06, 'epoch': 1.7} {'loss': 0.4357, 'learning_rate': 1.1212787786994506e-06, 'epoch': 1.7} {'loss': 0.4534, 'learning_rate': 1.121128172188275e-06, 'epoch': 1.7} {'loss': 0.4921, 'learning_rate': 1.1209775751916118e-06, 'epoch': 1.7} {'loss': 0.6058, 'learning_rate': 1.1208269877096246e-06, 'epoch': 1.7} {'loss': 0.5912, 'learning_rate': 1.1206764097424695e-06, 'epoch': 1.7} {'loss': 0.5687, 'learning_rate': 1.120525841290312e-06, 'epoch': 1.7} {'loss': 0.4299, 'learning_rate': 1.1203752823533131e-06, 'epoch': 1.7} {'loss': 0.6445, 'learning_rate': 1.120224732931633e-06, 'epoch': 1.7} {'loss': 0.4086, 'learning_rate': 1.1200741930254355e-06, 'epoch': 1.7} {'loss': 0.625, 'learning_rate': 1.1199236626348776e-06, 'epoch': 1.7} {'loss': 0.5468, 'learning_rate': 1.1197731417601233e-06, 'epoch': 1.7} {'loss': 0.3855, 'learning_rate': 1.1196226304013335e-06, 'epoch': 1.7} {'loss': 0.6289, 'learning_rate': 1.1194721285586696e-06, 'epoch': 1.7} {'loss': 0.683, 'learning_rate': 1.1193216362322924e-06, 'epoch': 1.7} {'loss': 0.6189, 'learning_rate': 1.1191711534223648e-06, 'epoch': 1.7} {'loss': 0.5131, 'learning_rate': 1.1190206801290483e-06, 'epoch': 1.7} {'loss': 0.3946, 'learning_rate': 1.1188702163525001e-06, 'epoch': 1.7} {'loss': 0.5751, 'learning_rate': 1.1187197620928847e-06, 'epoch': 1.7} {'loss': 0.5744, 'learning_rate': 1.118569317350362e-06, 'epoch': 1.7} {'loss': 0.4877, 'learning_rate': 1.1184188821250941e-06, 'epoch': 1.7} {'loss': 0.624, 'learning_rate': 1.118268456417242e-06, 'epoch': 1.7} {'loss': 0.6021, 'learning_rate': 1.1181180402269675e-06, 'epoch': 1.7} {'loss': 0.3629, 'learning_rate': 1.1179676335544321e-06, 'epoch': 1.7} {'loss': 0.5538, 'learning_rate': 1.1178172363997953e-06, 'epoch': 1.7} {'loss': 0.5429, 'learning_rate': 1.1176668487632181e-06, 'epoch': 1.7} {'loss': 0.5093, 'learning_rate': 1.1175164706448626e-06, 'epoch': 1.7} {'loss': 0.4708, 'learning_rate': 1.11736610204489e-06, 'epoch': 1.7} {'loss': 0.4536, 'learning_rate': 1.1172157429634634e-06, 'epoch': 1.7} {'loss': 0.6668, 'learning_rate': 1.117065393400738e-06, 'epoch': 1.7} {'loss': 0.5885, 'learning_rate': 1.1169150533568829e-06, 'epoch': 1.7} {'loss': 0.5524, 'learning_rate': 1.116764722832052e-06, 'epoch': 1.7} {'loss': 0.6729, 'learning_rate': 1.1166144018264103e-06, 'epoch': 1.7} {'loss': 0.5113, 'learning_rate': 1.116464090340118e-06, 'epoch': 1.7} {'loss': 0.5305, 'learning_rate': 1.1163137883733366e-06, 'epoch': 1.7} {'loss': 0.4881, 'learning_rate': 1.116163495926228e-06, 'epoch': 1.7} {'loss': 0.3911, 'learning_rate': 1.1160132129989488e-06, 'epoch': 1.7} {'loss': 0.506, 'learning_rate': 1.1158629395916664e-06, 'epoch': 1.7} {'loss': 0.5663, 'learning_rate': 1.1157126757045378e-06, 'epoch': 1.7} {'loss': 0.5338, 'learning_rate': 1.1155624213377236e-06, 'epoch': 1.7} {'loss': 0.4354, 'learning_rate': 1.1154121764913872e-06, 'epoch': 1.7} {'loss': 0.5841, 'learning_rate': 1.1152619411656884e-06, 'epoch': 1.7} {'loss': 0.5915, 'learning_rate': 1.1151117153607905e-06, 'epoch': 1.7} {'loss': 0.5478, 'learning_rate': 1.1149614990768476e-06, 'epoch': 1.7} {'loss': 0.5541, 'learning_rate': 1.1148112923140298e-06, 'epoch': 1.7} {'loss': 0.6484, 'learning_rate': 1.1146610950724913e-06, 'epoch': 1.7} {'loss': 0.4986, 'learning_rate': 1.1145109073523953e-06, 'epoch': 1.7} {'loss': 0.4765, 'learning_rate': 1.1143607291539049e-06, 'epoch': 1.7} {'loss': 0.505, 'learning_rate': 1.1142105604771758e-06, 'epoch': 1.7} {'loss': 0.441, 'learning_rate': 1.1140604013223755e-06, 'epoch': 1.7} {'loss': 0.4075, 'learning_rate': 1.1139102516896573e-06, 'epoch': 1.7} {'loss': 0.4626, 'learning_rate': 1.1137601115791908e-06, 'epoch': 1.7} {'loss': 0.5927, 'learning_rate': 1.1136099809911294e-06, 'epoch': 1.7} {'loss': 0.493, 'learning_rate': 1.1134598599256374e-06, 'epoch': 1.7} {'loss': 0.5215, 'learning_rate': 1.1133097483828782e-06, 'epoch': 1.7} {'loss': 0.4563, 'learning_rate': 1.1131596463630046e-06, 'epoch': 1.7} {'loss': 0.5816, 'learning_rate': 1.1130095538661867e-06, 'epoch': 1.7} {'loss': 0.4755, 'learning_rate': 1.1128594708925778e-06, 'epoch': 1.7} {'loss': 0.5778, 'learning_rate': 1.1127093974423452e-06, 'epoch': 1.7} {'loss': 0.5261, 'learning_rate': 1.1125593335156448e-06, 'epoch': 1.7} {'loss': 0.5335, 'learning_rate': 1.1124092791126395e-06, 'epoch': 1.7} {'loss': 0.5365, 'learning_rate': 1.1122592342334915e-06, 'epoch': 1.7} {'loss': 0.6152, 'learning_rate': 1.112109198878356e-06, 'epoch': 1.7} {'loss': 0.4795, 'learning_rate': 1.1119591730474022e-06, 'epoch': 1.7} {'loss': 0.4563, 'learning_rate': 1.1118091567407818e-06, 'epoch': 1.7} {'loss': 0.4161, 'learning_rate': 1.1116591499586637e-06, 'epoch': 1.7} {'loss': 0.5575, 'learning_rate': 1.1115091527012033e-06, 'epoch': 1.7} {'loss': 0.4194, 'learning_rate': 1.111359164968564e-06, 'epoch': 1.7} {'loss': 0.3885, 'learning_rate': 1.1112091867609066e-06, 'epoch': 1.7} {'loss': 0.5795, 'learning_rate': 1.1110592180783875e-06, 'epoch': 1.7} {'loss': 0.5368, 'learning_rate': 1.1109092589211745e-06, 'epoch': 1.7} {'loss': 0.3492, 'learning_rate': 1.1107593092894198e-06, 'epoch': 1.7} {'loss': 0.6475, 'learning_rate': 1.1106093691832941e-06, 'epoch': 1.7} {'loss': 0.5815, 'learning_rate': 1.1104594386029498e-06, 'epoch': 1.7} {'loss': 0.3769, 'learning_rate': 1.1103095175485511e-06, 'epoch': 1.7} {'loss': 0.5474, 'learning_rate': 1.110159606020259e-06, 'epoch': 1.7} {'loss': 0.5056, 'learning_rate': 1.11000970401823e-06, 'epoch': 1.7} {'loss': 0.4215, 'learning_rate': 1.109859811542633e-06, 'epoch': 1.7} {'loss': 0.488, 'learning_rate': 1.1097099285936197e-06, 'epoch': 1.7} {'loss': 0.4448, 'learning_rate': 1.1095600551713558e-06, 'epoch': 1.7} {'loss': 0.3721, 'learning_rate': 1.1094101912760003e-06, 'epoch': 1.7} {'loss': 0.4501, 'learning_rate': 1.1092603369077148e-06, 'epoch': 1.7} {'loss': 0.5203, 'learning_rate': 1.1091104920666607e-06, 'epoch': 1.7} {'loss': 0.4292, 'learning_rate': 1.1089606567529931e-06, 'epoch': 1.7} {'loss': 0.5618, 'learning_rate': 1.108810830966881e-06, 'epoch': 1.7} {'loss': 0.5625, 'learning_rate': 1.1086610147084786e-06, 'epoch': 1.7} {'loss': 0.4493, 'learning_rate': 1.1085112079779482e-06, 'epoch': 1.7} {'loss': 0.5115, 'learning_rate': 1.1083614107754504e-06, 'epoch': 1.7} {'loss': 0.5912, 'learning_rate': 1.1082116231011465e-06, 'epoch': 1.7} {'loss': 0.4634, 'learning_rate': 1.1080618449551973e-06, 'epoch': 1.7} {'loss': 0.3653, 'learning_rate': 1.1079120763377592e-06, 'epoch': 1.7} {'loss': 0.4238, 'learning_rate': 1.1077623172489993e-06, 'epoch': 1.7} {'loss': 0.5847, 'learning_rate': 1.1076125676890737e-06, 'epoch': 1.7} {'loss': 0.5784, 'learning_rate': 1.1074628276581422e-06, 'epoch': 1.7} {'loss': 0.4849, 'learning_rate': 1.1073130971563684e-06, 'epoch': 1.7} {'loss': 0.438, 'learning_rate': 1.1071633761839106e-06, 'epoch': 1.7} {'loss': 0.6323, 'learning_rate': 1.1070136647409325e-06, 'epoch': 1.7} {'loss': 0.5877, 'learning_rate': 1.106863962827589e-06, 'epoch': 1.7} {'loss': 0.5615, 'learning_rate': 1.1067142704440437e-06, 'epoch': 1.7} {'loss': 0.4228, 'learning_rate': 1.1065645875904562e-06, 'epoch': 1.7} {'loss': 0.5245, 'learning_rate': 1.1064149142669878e-06, 'epoch': 1.7} {'loss': 0.3785, 'learning_rate': 1.1062652504738015e-06, 'epoch': 1.7} {'loss': 0.6053, 'learning_rate': 1.1061155962110492e-06, 'epoch': 1.7} {'loss': 0.4306, 'learning_rate': 1.1059659514789022e-06, 'epoch': 1.7} {'loss': 0.5268, 'learning_rate': 1.1058163162775125e-06, 'epoch': 1.7} {'loss': 0.598, 'learning_rate': 1.1056666906070435e-06, 'epoch': 1.7} {'loss': 0.5695, 'learning_rate': 1.1055170744676557e-06, 'epoch': 1.7} {'loss': 0.6582, 'learning_rate': 1.1053674678595083e-06, 'epoch': 1.7} {'loss': 0.4902, 'learning_rate': 1.1052178707827654e-06, 'epoch': 1.7} {'loss': 0.6624, 'learning_rate': 1.1050682832375803e-06, 'epoch': 1.7} {'loss': 0.4949, 'learning_rate': 1.1049187052241207e-06, 'epoch': 1.7} {'loss': 0.5962, 'learning_rate': 1.1047691367425417e-06, 'epoch': 1.7} {'loss': 0.5582, 'learning_rate': 1.1046195777930057e-06, 'epoch': 1.7} {'loss': 0.5224, 'learning_rate': 1.1044700283756725e-06, 'epoch': 1.7} {'loss': 0.4746, 'learning_rate': 1.1043204884907022e-06, 'epoch': 1.7} {'loss': 0.4878, 'learning_rate': 1.1041709581382587e-06, 'epoch': 1.7} {'loss': 0.6309, 'learning_rate': 1.1040214373184955e-06, 'epoch': 1.7} {'loss': 0.5988, 'learning_rate': 1.1038719260315767e-06, 'epoch': 1.7} {'loss': 0.4663, 'learning_rate': 1.1037224242776622e-06, 'epoch': 1.7} {'loss': 0.4884, 'learning_rate': 1.1035729320569121e-06, 'epoch': 1.7} {'loss': 0.4196, 'learning_rate': 1.1034234493694863e-06, 'epoch': 1.7} {'loss': 0.5425, 'learning_rate': 1.1032739762155452e-06, 'epoch': 1.7} {'loss': 0.5666, 'learning_rate': 1.1031245125952516e-06, 'epoch': 1.7} {'loss': 0.4358, 'learning_rate': 1.1029750585087606e-06, 'epoch': 1.7} {'loss': 0.569, 'learning_rate': 1.1028256139562342e-06, 'epoch': 1.7} {'loss': 0.4542, 'learning_rate': 1.1026761789378336e-06, 'epoch': 1.7} {'loss': 0.5147, 'learning_rate': 1.1025267534537198e-06, 'epoch': 1.7} {'loss': 0.5746, 'learning_rate': 1.1023773375040503e-06, 'epoch': 1.7} {'loss': 0.5275, 'learning_rate': 1.1022279310889872e-06, 'epoch': 1.7} {'loss': 0.6635, 'learning_rate': 1.1020785342086914e-06, 'epoch': 1.7} {'loss': 0.4648, 'learning_rate': 1.1019291468633197e-06, 'epoch': 1.7} {'loss': 0.4696, 'learning_rate': 1.1017797690530342e-06, 'epoch': 1.7} {'loss': 0.7019, 'learning_rate': 1.1016304007779944e-06, 'epoch': 1.7} {'loss': 0.4773, 'learning_rate': 1.1014810420383604e-06, 'epoch': 1.7} {'loss': 0.5324, 'learning_rate': 1.1013316928342933e-06, 'epoch': 1.7} {'loss': 0.55, 'learning_rate': 1.101182353165955e-06, 'epoch': 1.7} {'loss': 0.422, 'learning_rate': 1.1010330230334997e-06, 'epoch': 1.7} {'loss': 0.458, 'learning_rate': 1.1008837024370911e-06, 'epoch': 1.7} {'loss': 0.6348, 'learning_rate': 1.1007343913768897e-06, 'epoch': 1.7} {'loss': 0.5066, 'learning_rate': 1.1005850898530536e-06, 'epoch': 1.7} {'loss': 0.4429, 'learning_rate': 1.1004357978657444e-06, 'epoch': 1.7} {'loss': 0.5845, 'learning_rate': 1.100286515415121e-06, 'epoch': 1.7} {'loss': 0.2737, 'learning_rate': 1.1001372425013457e-06, 'epoch': 1.7} {'loss': 0.4799, 'learning_rate': 1.0999879791245748e-06, 'epoch': 1.7} {'loss': 0.3723, 'learning_rate': 1.0998387252849707e-06, 'epoch': 1.7} {'loss': 0.4893, 'learning_rate': 1.0996894809826918e-06, 'epoch': 1.7} {'loss': 0.5824, 'learning_rate': 1.0995402462178995e-06, 'epoch': 1.7} {'loss': 0.4382, 'learning_rate': 1.0993910209907533e-06, 'epoch': 1.7} {'loss': 0.5997, 'learning_rate': 1.0992418053014132e-06, 'epoch': 1.7} {'loss': 0.3717, 'learning_rate': 1.0990925991500402e-06, 'epoch': 1.7} {'loss': 0.6274, 'learning_rate': 1.0989434025367907e-06, 'epoch': 1.7} {'loss': 0.5533, 'learning_rate': 1.098794215461827e-06, 'epoch': 1.7} {'loss': 0.5603, 'learning_rate': 1.098645037925309e-06, 'epoch': 1.7} {'loss': 0.5279, 'learning_rate': 1.098495869927395e-06, 'epoch': 1.7} {'loss': 0.3957, 'learning_rate': 1.098346711468249e-06, 'epoch': 1.7} {'loss': 0.5541, 'learning_rate': 1.0981975625480235e-06, 'epoch': 1.7} {'loss': 0.5423, 'learning_rate': 1.0980484231668876e-06, 'epoch': 1.7} {'loss': 0.5144, 'learning_rate': 1.0978992933249932e-06, 'epoch': 1.7} {'loss': 0.5926, 'learning_rate': 1.097750173022505e-06, 'epoch': 1.7} {'loss': 0.3711, 'learning_rate': 1.0976010622595789e-06, 'epoch': 1.7} {'loss': 0.5919, 'learning_rate': 1.0974519610363777e-06, 'epoch': 1.7} {'loss': 0.4567, 'learning_rate': 1.0973028693530617e-06, 'epoch': 1.7} {'loss': 0.5884, 'learning_rate': 1.097153787209786e-06, 'epoch': 1.7} {'loss': 0.3494, 'learning_rate': 1.0970047146067176e-06, 'epoch': 1.7} {'loss': 0.4655, 'learning_rate': 1.0968556515440088e-06, 'epoch': 1.7} {'loss': 0.5652, 'learning_rate': 1.0967065980218238e-06, 'epoch': 1.7} {'loss': 0.5986, 'learning_rate': 1.0965575540403238e-06, 'epoch': 1.7} {'loss': 0.5778, 'learning_rate': 1.096408519599661e-06, 'epoch': 1.7} {'loss': 0.5146, 'learning_rate': 1.0962594947000037e-06, 'epoch': 1.7} {'loss': 0.4846, 'learning_rate': 1.0961104793415067e-06, 'epoch': 1.7} {'loss': 0.5911, 'learning_rate': 1.095961473524332e-06, 'epoch': 1.7} {'loss': 0.4104, 'learning_rate': 1.0958124772486368e-06, 'epoch': 1.7} {'loss': 0.3158, 'learning_rate': 1.0956634905145825e-06, 'epoch': 1.7} {'loss': 0.3837, 'learning_rate': 1.0955145133223299e-06, 'epoch': 1.7} {'loss': 0.4735, 'learning_rate': 1.0953655456720336e-06, 'epoch': 1.7} {'loss': 0.4609, 'learning_rate': 1.095216587563861e-06, 'epoch': 1.7} {'loss': 0.5063, 'learning_rate': 1.0950676389979654e-06, 'epoch': 1.7} {'loss': 0.5346, 'learning_rate': 1.0949186999745087e-06, 'epoch': 1.7} {'loss': 0.388, 'learning_rate': 1.0947697704936499e-06, 'epoch': 1.7} {'loss': 0.5104, 'learning_rate': 1.09462085055555e-06, 'epoch': 1.7} {'loss': 0.5445, 'learning_rate': 1.0944719401603687e-06, 'epoch': 1.7} {'loss': 0.57, 'learning_rate': 1.0943230393082604e-06, 'epoch': 1.7} {'loss': 0.5864, 'learning_rate': 1.0941741479993928e-06, 'epoch': 1.7} {'loss': 0.3655, 'learning_rate': 1.0940252662339202e-06, 'epoch': 1.7} {'loss': 0.5881, 'learning_rate': 1.0938763940120035e-06, 'epoch': 1.7} {'loss': 0.5587, 'learning_rate': 1.0937275313338026e-06, 'epoch': 1.7} {'loss': 0.4683, 'learning_rate': 1.0935786781994739e-06, 'epoch': 1.7} {'loss': 0.4515, 'learning_rate': 1.093429834609182e-06, 'epoch': 1.7} {'loss': 0.5353, 'learning_rate': 1.0932810005630811e-06, 'epoch': 1.7} {'loss': 0.6382, 'learning_rate': 1.0931321760613379e-06, 'epoch': 1.7} {'loss': 0.5771, 'learning_rate': 1.092983361104104e-06, 'epoch': 1.7} {'loss': 0.3028, 'learning_rate': 1.0928345556915431e-06, 'epoch': 1.7} {'loss': 0.512, 'learning_rate': 1.092685759823816e-06, 'epoch': 1.7} {'loss': 0.4731, 'learning_rate': 1.092536973501076e-06, 'epoch': 1.7} {'loss': 0.54, 'learning_rate': 1.0923881967234905e-06, 'epoch': 1.7} {'loss': 0.3984, 'learning_rate': 1.0922394294912108e-06, 'epoch': 1.7} {'loss': 0.5734, 'learning_rate': 1.0920906718044056e-06, 'epoch': 1.7} {'loss': 0.4943, 'learning_rate': 1.0919419236632255e-06, 'epoch': 1.7} {'loss': 0.4559, 'learning_rate': 1.0917931850678353e-06, 'epoch': 1.7} {'loss': 0.4813, 'learning_rate': 1.0916444560183937e-06, 'epoch': 1.7} {'loss': 0.5887, 'learning_rate': 1.0914957365150558e-06, 'epoch': 1.7} {'loss': 0.5212, 'learning_rate': 1.0913470265579873e-06, 'epoch': 1.7} {'loss': 0.5674, 'learning_rate': 1.0911983261473413e-06, 'epoch': 1.7} {'loss': 0.5321, 'learning_rate': 1.0910496352832844e-06, 'epoch': 1.7} {'loss': 0.5891, 'learning_rate': 1.0909009539659688e-06, 'epoch': 1.7} {'loss': 0.4767, 'learning_rate': 1.0907522821955584e-06, 'epoch': 1.7} {'loss': 0.494, 'learning_rate': 1.0906036199722114e-06, 'epoch': 1.7} {'loss': 0.4406, 'learning_rate': 1.090454967296084e-06, 'epoch': 1.7} {'loss': 0.5347, 'learning_rate': 1.0903063241673418e-06, 'epoch': 1.7} {'loss': 0.5836, 'learning_rate': 1.0901576905861366e-06, 'epoch': 1.7} {'loss': 0.4767, 'learning_rate': 1.0900090665526365e-06, 'epoch': 1.7} {'loss': 0.5876, 'learning_rate': 1.0898604520669932e-06, 'epoch': 1.7} {'loss': 0.4525, 'learning_rate': 1.0897118471293678e-06, 'epoch': 1.7} {'loss': 0.6457, 'learning_rate': 1.0895632517399234e-06, 'epoch': 1.7} {'loss': 0.3584, 'learning_rate': 1.0894146658988115e-06, 'epoch': 1.7} {'loss': 0.4371, 'learning_rate': 1.0892660896062e-06, 'epoch': 1.7} {'loss': 0.6007, 'learning_rate': 1.089117522862241e-06, 'epoch': 1.7} {'loss': 0.5739, 'learning_rate': 1.0889689656671e-06, 'epoch': 1.7} {'loss': 0.4227, 'learning_rate': 1.0888204180209317e-06, 'epoch': 1.7} {'loss': 0.414, 'learning_rate': 1.088671879923896e-06, 'epoch': 1.7} {'loss': 0.5584, 'learning_rate': 1.088523351376154e-06, 'epoch': 1.7} {'loss': 0.5237, 'learning_rate': 1.088374832377861e-06, 'epoch': 1.7} {'loss': 0.4845, 'learning_rate': 1.0882263229291822e-06, 'epoch': 1.7} {'loss': 0.5379, 'learning_rate': 1.0880778230302714e-06, 'epoch': 1.7} {'loss': 0.3217, 'learning_rate': 1.087929332681289e-06, 'epoch': 1.7} {'loss': 0.6165, 'learning_rate': 1.0877808518823952e-06, 'epoch': 1.7} {'loss': 0.5709, 'learning_rate': 1.0876323806337474e-06, 'epoch': 1.7} {'loss': 0.559, 'learning_rate': 1.087483918935509e-06, 'epoch': 1.7} {'loss': 0.4538, 'learning_rate': 1.0873354667878322e-06, 'epoch': 1.7} {'loss': 0.455, 'learning_rate': 1.0871870241908832e-06, 'epoch': 1.7} {'loss': 0.681, 'learning_rate': 1.0870385911448166e-06, 'epoch': 1.7} {'loss': 0.5111, 'learning_rate': 1.0868901676497924e-06, 'epoch': 1.7} {'loss': 0.6058, 'learning_rate': 1.0867417537059688e-06, 'epoch': 1.7} {'loss': 0.3994, 'learning_rate': 1.0865933493135072e-06, 'epoch': 1.7} {'loss': 0.5238, 'learning_rate': 1.0864449544725664e-06, 'epoch': 1.7} {'loss': 0.407, 'learning_rate': 1.0862965691833005e-06, 'epoch': 1.7} {'loss': 0.5042, 'learning_rate': 1.0861481934458761e-06, 'epoch': 1.7} {'loss': 0.5272, 'learning_rate': 1.0859998272604467e-06, 'epoch': 1.7} {'loss': 0.4152, 'learning_rate': 1.0858514706271739e-06, 'epoch': 1.7} {'loss': 0.5471, 'learning_rate': 1.0857031235462145e-06, 'epoch': 1.7} {'loss': 0.4402, 'learning_rate': 1.0855547860177296e-06, 'epoch': 1.7} {'loss': 0.4401, 'learning_rate': 1.0854064580418787e-06, 'epoch': 1.7} {'loss': 0.5459, 'learning_rate': 1.0852581396188178e-06, 'epoch': 1.7} {'loss': 0.5904, 'learning_rate': 1.0851098307487073e-06, 'epoch': 1.7} {'loss': 0.5977, 'learning_rate': 1.0849615314317063e-06, 'epoch': 1.7} {'loss': 0.5099, 'learning_rate': 1.0848132416679736e-06, 'epoch': 1.7} {'loss': 0.4766, 'learning_rate': 1.0846649614576676e-06, 'epoch': 1.7} {'loss': 0.5606, 'learning_rate': 1.0845166908009486e-06, 'epoch': 1.7} {'loss': 0.5135, 'learning_rate': 1.0843684296979762e-06, 'epoch': 1.7} {'loss': 0.5535, 'learning_rate': 1.084220178148906e-06, 'epoch': 1.7} {'loss': 0.6351, 'learning_rate': 1.0840719361538987e-06, 'epoch': 1.7} {'loss': 0.3634, 'learning_rate': 1.0839237037131122e-06, 'epoch': 1.7} {'loss': 0.6051, 'learning_rate': 1.0837754808267064e-06, 'epoch': 1.7} {'loss': 0.5427, 'learning_rate': 1.0836272674948422e-06, 'epoch': 1.7} {'loss': 0.4689, 'learning_rate': 1.0834790637176752e-06, 'epoch': 1.7} {'loss': 0.5742, 'learning_rate': 1.0833308694953636e-06, 'epoch': 1.7} {'loss': 0.4275, 'learning_rate': 1.083182684828068e-06, 'epoch': 1.7} {'loss': 0.4587, 'learning_rate': 1.0830345097159478e-06, 'epoch': 1.7} {'loss': 0.5134, 'learning_rate': 1.0828863441591597e-06, 'epoch': 1.7} {'loss': 0.5601, 'learning_rate': 1.0827381881578648e-06, 'epoch': 1.7} {'loss': 0.5537, 'learning_rate': 1.0825900417122226e-06, 'epoch': 1.7} {'loss': 0.5098, 'learning_rate': 1.0824419048223879e-06, 'epoch': 1.7} {'loss': 0.5923, 'learning_rate': 1.0822937774885211e-06, 'epoch': 1.7} {'loss': 0.6001, 'learning_rate': 1.0821456597107815e-06, 'epoch': 1.7} {'loss': 0.541, 'learning_rate': 1.0819975514893276e-06, 'epoch': 1.7} {'loss': 0.4907, 'learning_rate': 1.0818494528243185e-06, 'epoch': 1.7} {'loss': 0.5233, 'learning_rate': 1.0817013637159124e-06, 'epoch': 1.7} {'loss': 0.4926, 'learning_rate': 1.0815532841642707e-06, 'epoch': 1.7} {'loss': 0.4163, 'learning_rate': 1.0814052141695474e-06, 'epoch': 1.7} {'loss': 0.556, 'learning_rate': 1.0812571537319038e-06, 'epoch': 1.7} {'loss': 0.4111, 'learning_rate': 1.0811091028514975e-06, 'epoch': 1.7} {'loss': 0.5939, 'learning_rate': 1.0809610615284882e-06, 'epoch': 1.7} {'loss': 0.4769, 'learning_rate': 1.0808130297630338e-06, 'epoch': 1.7} {'loss': 0.5828, 'learning_rate': 1.080665007555295e-06, 'epoch': 1.7} {'loss': 0.4639, 'learning_rate': 1.0805169949054273e-06, 'epoch': 1.7} {'loss': 0.5836, 'learning_rate': 1.0803689918135895e-06, 'epoch': 1.7} {'loss': 0.5764, 'learning_rate': 1.0802209982799427e-06, 'epoch': 1.7} {'loss': 0.3829, 'learning_rate': 1.0800730143046434e-06, 'epoch': 1.7} {'loss': 0.4016, 'learning_rate': 1.0799250398878514e-06, 'epoch': 1.7} {'loss': 0.569, 'learning_rate': 1.0797770750297243e-06, 'epoch': 1.7} {'loss': 0.5332, 'learning_rate': 1.0796291197304233e-06, 'epoch': 1.7} {'loss': 0.4353, 'learning_rate': 1.0794811739901034e-06, 'epoch': 1.7} {'loss': 0.5303, 'learning_rate': 1.0793332378089238e-06, 'epoch': 1.7} {'loss': 0.4308, 'learning_rate': 1.0791853111870443e-06, 'epoch': 1.7} {'loss': 0.5639, 'learning_rate': 1.0790373941246223e-06, 'epoch': 1.7} {'loss': 0.5849, 'learning_rate': 1.078889486621818e-06, 'epoch': 1.7} {'loss': 0.5076, 'learning_rate': 1.0787415886787877e-06, 'epoch': 1.7} {'loss': 0.6171, 'learning_rate': 1.0785937002956936e-06, 'epoch': 1.7} {'loss': 0.5009, 'learning_rate': 1.0784458214726889e-06, 'epoch': 1.7} {'loss': 0.5391, 'learning_rate': 1.0782979522099357e-06, 'epoch': 1.7} {'loss': 0.5312, 'learning_rate': 1.0781500925075905e-06, 'epoch': 1.7} {'loss': 0.6375, 'learning_rate': 1.0780022423658132e-06, 'epoch': 1.7} {'loss': 0.567, 'learning_rate': 1.0778544017847637e-06, 'epoch': 1.7} {'loss': 0.6802, 'learning_rate': 1.077706570764594e-06, 'epoch': 1.7} {'loss': 0.5161, 'learning_rate': 1.0775587493054717e-06, 'epoch': 1.7} {'loss': 0.3337, 'learning_rate': 1.077410937407548e-06, 'epoch': 1.7} {'loss': 0.6372, 'learning_rate': 1.077263135070985e-06, 'epoch': 1.7} {'loss': 0.3924, 'learning_rate': 1.0771153422959378e-06, 'epoch': 1.7} {'loss': 0.4819, 'learning_rate': 1.076967559082569e-06, 'epoch': 1.7} {'loss': 0.6019, 'learning_rate': 1.0768197854310359e-06, 'epoch': 1.7} {'loss': 0.5578, 'learning_rate': 1.0766720213414915e-06, 'epoch': 1.7} {'loss': 0.4493, 'learning_rate': 1.076524266814103e-06, 'epoch': 1.7} {'loss': 0.6757, 'learning_rate': 1.0763765218490208e-06, 'epoch': 1.7} {'loss': 0.4161, 'learning_rate': 1.0762287864464084e-06, 'epoch': 1.7} {'loss': 0.6257, 'learning_rate': 1.076081060606421e-06, 'epoch': 1.7} {'loss': 0.4115, 'learning_rate': 1.0759333443292186e-06, 'epoch': 1.7} {'loss': 0.4195, 'learning_rate': 1.0757856376149612e-06, 'epoch': 1.7} {'loss': 0.4817, 'learning_rate': 1.0756379404638006e-06, 'epoch': 1.7} {'loss': 0.5457, 'learning_rate': 1.0754902528759038e-06, 'epoch': 1.7} {'loss': 0.5162, 'learning_rate': 1.0753425748514224e-06, 'epoch': 1.7} {'loss': 0.5695, 'learning_rate': 1.0751949063905165e-06, 'epoch': 1.7} {'loss': 0.5391, 'learning_rate': 1.0750472474933472e-06, 'epoch': 1.7} {'loss': 0.6874, 'learning_rate': 1.0748995981600662e-06, 'epoch': 1.7} {'loss': 0.5758, 'learning_rate': 1.0747519583908406e-06, 'epoch': 1.7} {'loss': 0.5571, 'learning_rate': 1.0746043281858188e-06, 'epoch': 1.7} {'loss': 0.4385, 'learning_rate': 1.0744567075451684e-06, 'epoch': 1.7} {'loss': 0.607, 'learning_rate': 1.0743090964690417e-06, 'epoch': 1.7} {'loss': 0.6212, 'learning_rate': 1.0741614949575973e-06, 'epoch': 1.7} {'loss': 0.3319, 'learning_rate': 1.0740139030109976e-06, 'epoch': 1.7} {'loss': 0.7024, 'learning_rate': 1.0738663206293931e-06, 'epoch': 1.7} {'loss': 0.6394, 'learning_rate': 1.0737187478129508e-06, 'epoch': 1.7} {'loss': 0.4403, 'learning_rate': 1.0735711845618203e-06, 'epoch': 1.7} {'loss': 0.4274, 'learning_rate': 1.073423630876168e-06, 'epoch': 1.7} {'loss': 0.3501, 'learning_rate': 1.0732760867561453e-06, 'epoch': 1.7} {'loss': 0.3822, 'learning_rate': 1.0731285522019131e-06, 'epoch': 1.7} {'loss': 0.4034, 'learning_rate': 1.0729810272136321e-06, 'epoch': 1.7} {'loss': 0.5369, 'learning_rate': 1.0728335117914534e-06, 'epoch': 1.7} {'loss': 0.4778, 'learning_rate': 1.0726860059355437e-06, 'epoch': 1.7} {'loss': 0.5855, 'learning_rate': 1.072538509646054e-06, 'epoch': 1.7} {'loss': 0.4934, 'learning_rate': 1.072391022923145e-06, 'epoch': 1.7} {'loss': 0.6275, 'learning_rate': 1.0722435457669743e-06, 'epoch': 1.7} {'loss': 0.4682, 'learning_rate': 1.0720960781777012e-06, 'epoch': 1.7} {'loss': 0.5006, 'learning_rate': 1.0719486201554852e-06, 'epoch': 1.7} {'loss': 0.4464, 'learning_rate': 1.0718011717004784e-06, 'epoch': 1.7} {'loss': 0.5175, 'learning_rate': 1.0716537328128451e-06, 'epoch': 1.7} {'loss': 0.5082, 'learning_rate': 1.0715063034927397e-06, 'epoch': 1.7} {'loss': 0.5188, 'learning_rate': 1.071358883740321e-06, 'epoch': 1.7} {'loss': 0.7097, 'learning_rate': 1.0712114735557466e-06, 'epoch': 1.7} {'loss': 0.5363, 'learning_rate': 1.0710640729391752e-06, 'epoch': 1.7} {'loss': 0.6172, 'learning_rate': 1.0709166818907668e-06, 'epoch': 1.7} {'loss': 0.681, 'learning_rate': 1.0707693004106733e-06, 'epoch': 1.7} {'loss': 0.6028, 'learning_rate': 1.0706219284990594e-06, 'epoch': 1.7} {'loss': 0.4344, 'learning_rate': 1.070474566156079e-06, 'epoch': 1.7} {'loss': 0.3557, 'learning_rate': 1.070327213381891e-06, 'epoch': 1.7} {'loss': 0.4798, 'learning_rate': 1.0701798701766542e-06, 'epoch': 1.7} {'loss': 0.519, 'learning_rate': 1.0700325365405228e-06, 'epoch': 1.7} {'loss': 0.5867, 'learning_rate': 1.0698852124736613e-06, 'epoch': 1.7} {'loss': 0.5795, 'learning_rate': 1.0697378979762197e-06, 'epoch': 1.7} {'loss': 0.6335, 'learning_rate': 1.069590593048364e-06, 'epoch': 1.7} {'loss': 0.5453, 'learning_rate': 1.0694432976902458e-06, 'epoch': 1.7} {'loss': 0.5874, 'learning_rate': 1.0692960119020256e-06, 'epoch': 1.7} {'loss': 0.5172, 'learning_rate': 1.0691487356838626e-06, 'epoch': 1.7} {'loss': 0.4044, 'learning_rate': 1.0690014690359085e-06, 'epoch': 1.7} {'loss': 0.4621, 'learning_rate': 1.068854211958329e-06, 'epoch': 1.7} {'loss': 0.6472, 'learning_rate': 1.068706964451275e-06, 'epoch': 1.7} {'loss': 0.454, 'learning_rate': 1.0685597265149116e-06, 'epoch': 1.7} {'loss': 0.5512, 'learning_rate': 1.0684124981493904e-06, 'epoch': 1.7} {'loss': 0.4474, 'learning_rate': 1.068265279354871e-06, 'epoch': 1.7} {'loss': 0.4617, 'learning_rate': 1.068118070131514e-06, 'epoch': 1.7} {'loss': 0.3996, 'learning_rate': 1.06797087047947e-06, 'epoch': 1.7} {'loss': 0.4329, 'learning_rate': 1.0678236803989062e-06, 'epoch': 1.7} {'loss': 0.3718, 'learning_rate': 1.0676764998899724e-06, 'epoch': 1.7} {'loss': 0.5432, 'learning_rate': 1.067529328952831e-06, 'epoch': 1.7} {'loss': 0.5186, 'learning_rate': 1.0673821675876373e-06, 'epoch': 1.7} {'loss': 0.2951, 'learning_rate': 1.06723501579455e-06, 'epoch': 1.7} {'loss': 0.48, 'learning_rate': 1.0670878735737279e-06, 'epoch': 1.7} {'loss': 0.3727, 'learning_rate': 1.066940740925324e-06, 'epoch': 1.7} {'loss': 0.4394, 'learning_rate': 1.066793617849503e-06, 'epoch': 1.7} {'loss': 0.4154, 'learning_rate': 1.066646504346417e-06, 'epoch': 1.7} {'loss': 0.5429, 'learning_rate': 1.0664994004162254e-06, 'epoch': 1.7} {'loss': 0.5214, 'learning_rate': 1.0663523060590874e-06, 'epoch': 1.7} {'loss': 0.533, 'learning_rate': 1.0662052212751572e-06, 'epoch': 1.7} {'loss': 0.4848, 'learning_rate': 1.066058146064598e-06, 'epoch': 1.7} {'loss': 0.5381, 'learning_rate': 1.0659110804275585e-06, 'epoch': 1.7} {'loss': 0.6282, 'learning_rate': 1.0657640243642063e-06, 'epoch': 1.7} {'loss': 0.6008, 'learning_rate': 1.0656169778746927e-06, 'epoch': 1.7} {'loss': 0.3703, 'learning_rate': 1.0654699409591763e-06, 'epoch': 1.7} {'loss': 0.3869, 'learning_rate': 1.0653229136178157e-06, 'epoch': 1.7} {'loss': 0.5171, 'learning_rate': 1.0651758958507674e-06, 'epoch': 1.7} {'loss': 0.5595, 'learning_rate': 1.0650288876581927e-06, 'epoch': 1.7} {'loss': 0.4973, 'learning_rate': 1.0648818890402423e-06, 'epoch': 1.7} {'loss': 0.4523, 'learning_rate': 1.0647348999970785e-06, 'epoch': 1.7} {'loss': 0.4775, 'learning_rate': 1.0645879205288579e-06, 'epoch': 1.7} {'loss': 0.4598, 'learning_rate': 1.0644409506357379e-06, 'epoch': 1.7} {'loss': 0.3796, 'learning_rate': 1.064293990317875e-06, 'epoch': 1.7} {'loss': 0.4804, 'learning_rate': 1.0641470395754284e-06, 'epoch': 1.7} {'loss': 0.7302, 'learning_rate': 1.0640000984085564e-06, 'epoch': 1.7} {'loss': 0.3744, 'learning_rate': 1.0638531668174125e-06, 'epoch': 1.7} {'loss': 0.4389, 'learning_rate': 1.0637062448021562e-06, 'epoch': 1.7} {'loss': 0.3958, 'learning_rate': 1.0635593323629457e-06, 'epoch': 1.7} {'loss': 0.5871, 'learning_rate': 1.0634124294999383e-06, 'epoch': 1.7} {'loss': 0.5592, 'learning_rate': 1.0632655362132905e-06, 'epoch': 1.7} {'loss': 0.506, 'learning_rate': 1.0631186525031612e-06, 'epoch': 1.7} {'loss': 0.5886, 'learning_rate': 1.062971778369708e-06, 'epoch': 1.7} {'loss': 0.4571, 'learning_rate': 1.0628249138130852e-06, 'epoch': 1.7} {'loss': 0.4497, 'learning_rate': 1.062678058833453e-06, 'epoch': 1.7} {'loss': 0.404, 'learning_rate': 1.0625312134309662e-06, 'epoch': 1.7} {'loss': 0.427, 'learning_rate': 1.0623843776057852e-06, 'epoch': 1.7} {'loss': 0.3532, 'learning_rate': 1.0622375513580664e-06, 'epoch': 1.7} {'loss': 0.4826, 'learning_rate': 1.0620907346879672e-06, 'epoch': 1.7} {'loss': 0.6169, 'learning_rate': 1.0619439275956433e-06, 'epoch': 1.7} {'loss': 0.4296, 'learning_rate': 1.0617971300812534e-06, 'epoch': 1.7} {'loss': 0.5404, 'learning_rate': 1.0616503421449542e-06, 'epoch': 1.7} {'loss': 0.571, 'learning_rate': 1.0615035637869042e-06, 'epoch': 1.7} {'loss': 0.4602, 'learning_rate': 1.061356795007259e-06, 'epoch': 1.7} {'loss': 0.5463, 'learning_rate': 1.0612100358061771e-06, 'epoch': 1.7} {'loss': 0.4085, 'learning_rate': 1.0610632861838166e-06, 'epoch': 1.7} {'loss': 0.5076, 'learning_rate': 1.0609165461403326e-06, 'epoch': 1.71} {'loss': 0.5588, 'learning_rate': 1.0607698156758827e-06, 'epoch': 1.71} {'loss': 0.6597, 'learning_rate': 1.060623094790626e-06, 'epoch': 1.71} {'loss': 0.5535, 'learning_rate': 1.0604763834847176e-06, 'epoch': 1.71} {'loss': 0.404, 'learning_rate': 1.0603296817583154e-06, 'epoch': 1.71} {'loss': 0.549, 'learning_rate': 1.060182989611579e-06, 'epoch': 1.71} {'loss': 0.479, 'learning_rate': 1.0600363070446606e-06, 'epoch': 1.71} {'loss': 0.5607, 'learning_rate': 1.0598896340577214e-06, 'epoch': 1.71} {'loss': 0.6639, 'learning_rate': 1.0597429706509167e-06, 'epoch': 1.71} {'loss': 0.506, 'learning_rate': 1.059596316824405e-06, 'epoch': 1.71} {'loss': 0.4436, 'learning_rate': 1.059449672578342e-06, 'epoch': 1.71} {'loss': 0.5844, 'learning_rate': 1.0593030379128877e-06, 'epoch': 1.71} {'loss': 0.5555, 'learning_rate': 1.059156412828195e-06, 'epoch': 1.71} {'loss': 0.4615, 'learning_rate': 1.059009797324424e-06, 'epoch': 1.71} {'loss': 0.4377, 'learning_rate': 1.05886319140173e-06, 'epoch': 1.71} {'loss': 0.5784, 'learning_rate': 1.0587165950602718e-06, 'epoch': 1.71} {'loss': 0.5002, 'learning_rate': 1.058570008300206e-06, 'epoch': 1.71} {'loss': 0.6279, 'learning_rate': 1.058423431121689e-06, 'epoch': 1.71} {'loss': 0.364, 'learning_rate': 1.0582768635248798e-06, 'epoch': 1.71} {'loss': 0.4578, 'learning_rate': 1.0581303055099323e-06, 'epoch': 1.71} {'loss': 0.6037, 'learning_rate': 1.0579837570770058e-06, 'epoch': 1.71} {'loss': 0.5413, 'learning_rate': 1.0578372182262564e-06, 'epoch': 1.71} {'loss': 0.542, 'learning_rate': 1.057690688957842e-06, 'epoch': 1.71} {'loss': 0.5742, 'learning_rate': 1.05754416927192e-06, 'epoch': 1.71} {'loss': 0.4769, 'learning_rate': 1.057397659168643e-06, 'epoch': 1.71} {'loss': 0.5623, 'learning_rate': 1.057251158648176e-06, 'epoch': 1.71} {'loss': 0.4851, 'learning_rate': 1.0571046677106688e-06, 'epoch': 1.71} {'loss': 0.5217, 'learning_rate': 1.0569581863562817e-06, 'epoch': 1.71} {'loss': 0.5511, 'learning_rate': 1.056811714585171e-06, 'epoch': 1.71} {'loss': 0.4755, 'learning_rate': 1.056665252397493e-06, 'epoch': 1.71} {'loss': 0.6067, 'learning_rate': 1.0565187997934078e-06, 'epoch': 1.71} {'loss': 0.5279, 'learning_rate': 1.0563723567730667e-06, 'epoch': 1.71} {'loss': 0.5342, 'learning_rate': 1.0562259233366334e-06, 'epoch': 1.71} {'loss': 0.421, 'learning_rate': 1.0560794994842583e-06, 'epoch': 1.71} {'loss': 0.582, 'learning_rate': 1.055933085216102e-06, 'epoch': 1.71} {'loss': 0.6576, 'learning_rate': 1.0557866805323213e-06, 'epoch': 1.71} {'loss': 0.4089, 'learning_rate': 1.0556402854330717e-06, 'epoch': 1.71} {'loss': 0.4857, 'learning_rate': 1.0554938999185127e-06, 'epoch': 1.71} {'loss': 0.5761, 'learning_rate': 1.0553475239887956e-06, 'epoch': 1.71} {'loss': 0.5307, 'learning_rate': 1.0552011576440846e-06, 'epoch': 1.71} {'loss': 0.5998, 'learning_rate': 1.0550548008845307e-06, 'epoch': 1.71} {'loss': 0.4042, 'learning_rate': 1.0549084537102938e-06, 'epoch': 1.71} {'loss': 0.5341, 'learning_rate': 1.0547621161215304e-06, 'epoch': 1.71} {'loss': 0.3258, 'learning_rate': 1.0546157881183937e-06, 'epoch': 1.71} {'loss': 0.5207, 'learning_rate': 1.0544694697010482e-06, 'epoch': 1.71} {'loss': 0.6049, 'learning_rate': 1.0543231608696413e-06, 'epoch': 1.71} {'loss': 0.405, 'learning_rate': 1.0541768616243387e-06, 'epoch': 1.71} {'loss': 0.688, 'learning_rate': 1.054030571965291e-06, 'epoch': 1.71} {'loss': 0.4418, 'learning_rate': 1.0538842918926561e-06, 'epoch': 1.71} {'loss': 0.4411, 'learning_rate': 1.053738021406595e-06, 'epoch': 1.71} {'loss': 0.3359, 'learning_rate': 1.0535917605072566e-06, 'epoch': 1.71} {'loss': 0.5192, 'learning_rate': 1.0534455091948059e-06, 'epoch': 1.71} {'loss': 0.6506, 'learning_rate': 1.0532992674693921e-06, 'epoch': 1.71} {'loss': 0.5606, 'learning_rate': 1.0531530353311792e-06, 'epoch': 1.71} {'loss': 0.5827, 'learning_rate': 1.0530068127803184e-06, 'epoch': 1.71} {'loss': 0.5221, 'learning_rate': 1.0528605998169684e-06, 'epoch': 1.71} {'loss': 0.6063, 'learning_rate': 1.0527143964412879e-06, 'epoch': 1.71} {'loss': 0.4961, 'learning_rate': 1.0525682026534268e-06, 'epoch': 1.71} {'loss': 0.5521, 'learning_rate': 1.0524220184535515e-06, 'epoch': 1.71} {'loss': 0.5227, 'learning_rate': 1.052275843841809e-06, 'epoch': 1.71} {'loss': 0.48, 'learning_rate': 1.0521296788183644e-06, 'epoch': 1.71} {'loss': 0.5314, 'learning_rate': 1.0519835233833687e-06, 'epoch': 1.71} {'loss': 0.4535, 'learning_rate': 1.0518373775369805e-06, 'epoch': 1.71} {'loss': 0.618, 'learning_rate': 1.051691241279358e-06, 'epoch': 1.71} {'loss': 0.4592, 'learning_rate': 1.0515451146106514e-06, 'epoch': 1.71} {'loss': 0.5241, 'learning_rate': 1.0513989975310258e-06, 'epoch': 1.71} {'loss': 0.4742, 'learning_rate': 1.0512528900406305e-06, 'epoch': 1.71} {'loss': 0.5308, 'learning_rate': 1.051106792139629e-06, 'epoch': 1.71} {'loss': 0.4396, 'learning_rate': 1.0509607038281734e-06, 'epoch': 1.71} {'loss': 0.6478, 'learning_rate': 1.05081462510642e-06, 'epoch': 1.71} {'loss': 0.6003, 'learning_rate': 1.050668555974529e-06, 'epoch': 1.71} {'loss': 0.5493, 'learning_rate': 1.0505224964326498e-06, 'epoch': 1.71} {'loss': 0.5325, 'learning_rate': 1.0503764464809475e-06, 'epoch': 1.71} {'loss': 0.485, 'learning_rate': 1.0502304061195724e-06, 'epoch': 1.71} {'loss': 0.5721, 'learning_rate': 1.0500843753486833e-06, 'epoch': 1.71} {'loss': 0.3187, 'learning_rate': 1.049938354168437e-06, 'epoch': 1.71} {'loss': 0.3262, 'learning_rate': 1.0497923425789903e-06, 'epoch': 1.71} {'loss': 0.4582, 'learning_rate': 1.049646340580499e-06, 'epoch': 1.71} {'loss': 0.5524, 'learning_rate': 1.0495003481731169e-06, 'epoch': 1.71} {'loss': 0.6096, 'learning_rate': 1.049354365357007e-06, 'epoch': 1.71} {'loss': 0.3512, 'learning_rate': 1.0492083921323193e-06, 'epoch': 1.71} {'loss': 0.5541, 'learning_rate': 1.0490624284992123e-06, 'epoch': 1.71} {'loss': 0.5623, 'learning_rate': 1.0489164744578428e-06, 'epoch': 1.71} {'loss': 0.5234, 'learning_rate': 1.0487705300083683e-06, 'epoch': 1.71} {'loss': 0.5812, 'learning_rate': 1.0486245951509444e-06, 'epoch': 1.71} {'loss': 0.3912, 'learning_rate': 1.0484786698857242e-06, 'epoch': 1.71} {'loss': 0.4883, 'learning_rate': 1.0483327542128719e-06, 'epoch': 1.71} {'loss': 0.5276, 'learning_rate': 1.0481868481325352e-06, 'epoch': 1.71} {'loss': 0.4106, 'learning_rate': 1.0480409516448754e-06, 'epoch': 1.71} {'loss': 0.4166, 'learning_rate': 1.0478950647500496e-06, 'epoch': 1.71} {'loss': 0.5359, 'learning_rate': 1.047749187448207e-06, 'epoch': 1.71} {'loss': 0.581, 'learning_rate': 1.0476033197395152e-06, 'epoch': 1.71} {'loss': 0.4555, 'learning_rate': 1.0474574616241185e-06, 'epoch': 1.71} {'loss': 0.4889, 'learning_rate': 1.0473116131021844e-06, 'epoch': 1.71} {'loss': 0.465, 'learning_rate': 1.0471657741738616e-06, 'epoch': 1.71} {'loss': 0.4385, 'learning_rate': 1.047019944839308e-06, 'epoch': 1.71} {'loss': 0.3708, 'learning_rate': 1.0468741250986835e-06, 'epoch': 1.71} {'loss': 0.5597, 'learning_rate': 1.046728314952138e-06, 'epoch': 1.71} {'loss': 0.6142, 'learning_rate': 1.0465825143998342e-06, 'epoch': 1.71} {'loss': 0.4708, 'learning_rate': 1.0464367234419227e-06, 'epoch': 1.71} {'loss': 0.5224, 'learning_rate': 1.0462909420785638e-06, 'epoch': 1.71} {'loss': 0.4994, 'learning_rate': 1.0461451703099113e-06, 'epoch': 1.71} {'loss': 0.6032, 'learning_rate': 1.0459994081361224e-06, 'epoch': 1.71} {'loss': 0.3264, 'learning_rate': 1.045853655557356e-06, 'epoch': 1.71} {'loss': 0.6665, 'learning_rate': 1.0457079125737612e-06, 'epoch': 1.71} {'loss': 0.2913, 'learning_rate': 1.045562179185502e-06, 'epoch': 1.71} {'loss': 0.4148, 'learning_rate': 1.0454164553927305e-06, 'epoch': 1.71} {'loss': 0.5668, 'learning_rate': 1.045270741195602e-06, 'epoch': 1.71} {'loss': 0.4209, 'learning_rate': 1.0451250365942744e-06, 'epoch': 1.71} {'loss': 0.3915, 'learning_rate': 1.0449793415889042e-06, 'epoch': 1.71} {'loss': 0.5172, 'learning_rate': 1.044833656179649e-06, 'epoch': 1.71} {'loss': 0.6627, 'learning_rate': 1.0446879803666598e-06, 'epoch': 1.71} {'loss': 0.4947, 'learning_rate': 1.0445423141500964e-06, 'epoch': 1.71} {'loss': 0.4559, 'learning_rate': 1.0443966575301145e-06, 'epoch': 1.71} {'loss': 0.4974, 'learning_rate': 1.0442510105068692e-06, 'epoch': 1.71} {'loss': 0.6507, 'learning_rate': 1.0441053730805173e-06, 'epoch': 1.71} {'loss': 0.3413, 'learning_rate': 1.0439597452512152e-06, 'epoch': 1.71} {'loss': 0.4154, 'learning_rate': 1.0438141270191205e-06, 'epoch': 1.71} {'loss': 0.3588, 'learning_rate': 1.0436685183843842e-06, 'epoch': 1.71} {'loss': 0.4996, 'learning_rate': 1.0435229193471675e-06, 'epoch': 1.71} {'loss': 0.4869, 'learning_rate': 1.0433773299076221e-06, 'epoch': 1.71} {'loss': 0.4001, 'learning_rate': 1.0432317500659085e-06, 'epoch': 1.71} {'loss': 0.5636, 'learning_rate': 1.0430861798221793e-06, 'epoch': 1.71} {'loss': 0.4321, 'learning_rate': 1.0429406191765912e-06, 'epoch': 1.71} {'loss': 0.4784, 'learning_rate': 1.042795068129303e-06, 'epoch': 1.71} {'loss': 0.4771, 'learning_rate': 1.042649526680467e-06, 'epoch': 1.71} {'loss': 0.4998, 'learning_rate': 1.0425039948302395e-06, 'epoch': 1.71} {'loss': 0.6193, 'learning_rate': 1.0423584725787783e-06, 'epoch': 1.71} {'loss': 0.4883, 'learning_rate': 1.0422129599262386e-06, 'epoch': 1.71} {'loss': 0.5206, 'learning_rate': 1.0420674568727752e-06, 'epoch': 1.71} {'loss': 0.6339, 'learning_rate': 1.0419219634185474e-06, 'epoch': 1.71} {'loss': 0.3697, 'learning_rate': 1.0417764795637075e-06, 'epoch': 1.71} {'loss': 0.657, 'learning_rate': 1.0416310053084121e-06, 'epoch': 1.71} {'loss': 0.4597, 'learning_rate': 1.0414855406528167e-06, 'epoch': 1.71} {'loss': 0.5714, 'learning_rate': 1.041340085597079e-06, 'epoch': 1.71} {'loss': 0.5299, 'learning_rate': 1.0411946401413543e-06, 'epoch': 1.71} {'loss': 0.541, 'learning_rate': 1.0410492042857979e-06, 'epoch': 1.71} {'loss': 0.5985, 'learning_rate': 1.0409037780305675e-06, 'epoch': 1.71} {'loss': 0.4085, 'learning_rate': 1.0407583613758155e-06, 'epoch': 1.71} {'loss': 0.5611, 'learning_rate': 1.0406129543216991e-06, 'epoch': 1.71} {'loss': 0.5085, 'learning_rate': 1.0404675568683753e-06, 'epoch': 1.71} {'loss': 0.3031, 'learning_rate': 1.0403221690159993e-06, 'epoch': 1.71} {'loss': 0.556, 'learning_rate': 1.0401767907647264e-06, 'epoch': 1.71} {'loss': 0.3744, 'learning_rate': 1.0400314221147122e-06, 'epoch': 1.71} {'loss': 0.52, 'learning_rate': 1.0398860630661155e-06, 'epoch': 1.71} {'loss': 0.5666, 'learning_rate': 1.0397407136190874e-06, 'epoch': 1.71} {'loss': 0.5556, 'learning_rate': 1.0395953737737862e-06, 'epoch': 1.71} {'loss': 0.3476, 'learning_rate': 1.0394500435303666e-06, 'epoch': 1.71} {'loss': 0.4965, 'learning_rate': 1.0393047228889864e-06, 'epoch': 1.71} {'loss': 0.5477, 'learning_rate': 1.0391594118498006e-06, 'epoch': 1.71} {'loss': 0.4551, 'learning_rate': 1.0390141104129615e-06, 'epoch': 1.71} {'loss': 0.6072, 'learning_rate': 1.03886881857863e-06, 'epoch': 1.71} {'loss': 0.4566, 'learning_rate': 1.0387235363469584e-06, 'epoch': 1.71} {'loss': 0.4377, 'learning_rate': 1.038578263718103e-06, 'epoch': 1.71} {'loss': 0.3576, 'learning_rate': 1.0384330006922194e-06, 'epoch': 1.71} {'loss': 0.4698, 'learning_rate': 1.038287747269464e-06, 'epoch': 1.71} {'loss': 0.3488, 'learning_rate': 1.0381425034499947e-06, 'epoch': 1.71} {'loss': 0.6312, 'learning_rate': 1.0379972692339624e-06, 'epoch': 1.71} {'loss': 0.5047, 'learning_rate': 1.0378520446215246e-06, 'epoch': 1.71} {'loss': 0.7181, 'learning_rate': 1.0377068296128367e-06, 'epoch': 1.71} {'loss': 0.4333, 'learning_rate': 1.0375616242080556e-06, 'epoch': 1.71} {'loss': 0.5241, 'learning_rate': 1.0374164284073363e-06, 'epoch': 1.71} {'loss': 0.3219, 'learning_rate': 1.0372712422108334e-06, 'epoch': 1.71} {'loss': 0.4115, 'learning_rate': 1.0371260656187065e-06, 'epoch': 1.71} {'loss': 0.5582, 'learning_rate': 1.0369808986311047e-06, 'epoch': 1.71} {'loss': 0.435, 'learning_rate': 1.0368357412481878e-06, 'epoch': 1.71} {'loss': 0.546, 'learning_rate': 1.0366905934701099e-06, 'epoch': 1.71} {'loss': 0.3774, 'learning_rate': 1.0365454552970267e-06, 'epoch': 1.71} {'loss': 0.4487, 'learning_rate': 1.0364003267290968e-06, 'epoch': 1.71} {'loss': 0.563, 'learning_rate': 1.0362552077664678e-06, 'epoch': 1.71} {'loss': 0.4909, 'learning_rate': 1.0361100984093053e-06, 'epoch': 1.71} {'loss': 0.5559, 'learning_rate': 1.035964998657758e-06, 'epoch': 1.71} {'loss': 0.5732, 'learning_rate': 1.0358199085119824e-06, 'epoch': 1.71} {'loss': 0.5037, 'learning_rate': 1.0356748279721352e-06, 'epoch': 1.71} {'loss': 0.3961, 'learning_rate': 1.0355297570383716e-06, 'epoch': 1.71} {'loss': 0.4447, 'learning_rate': 1.0353846957108492e-06, 'epoch': 1.71} {'loss': 0.5364, 'learning_rate': 1.0352396439897173e-06, 'epoch': 1.71} {'loss': 0.6198, 'learning_rate': 1.0350946018751395e-06, 'epoch': 1.71} {'loss': 0.6184, 'learning_rate': 1.034949569367264e-06, 'epoch': 1.71} {'loss': 0.4957, 'learning_rate': 1.0348045464662493e-06, 'epoch': 1.71} {'loss': 0.5544, 'learning_rate': 1.0346595331722508e-06, 'epoch': 1.71} {'loss': 0.567, 'learning_rate': 1.0345145294854243e-06, 'epoch': 1.71} {'loss': 0.5293, 'learning_rate': 1.034369535405927e-06, 'epoch': 1.71} {'loss': 0.3812, 'learning_rate': 1.0342245509339067e-06, 'epoch': 1.71} {'loss': 0.4115, 'learning_rate': 1.0340795760695287e-06, 'epoch': 1.71} {'loss': 0.5396, 'learning_rate': 1.0339346108129421e-06, 'epoch': 1.71} {'loss': 0.4138, 'learning_rate': 1.0337896551643034e-06, 'epoch': 1.71} {'loss': 0.3783, 'learning_rate': 1.03364470912377e-06, 'epoch': 1.71} {'loss': 0.4062, 'learning_rate': 1.033499772691492e-06, 'epoch': 1.71} {'loss': 0.5543, 'learning_rate': 1.0333548458676312e-06, 'epoch': 1.71} {'loss': 0.4785, 'learning_rate': 1.0332099286523366e-06, 'epoch': 1.71} {'loss': 0.5747, 'learning_rate': 1.0330650210457715e-06, 'epoch': 1.71} {'loss': 0.3772, 'learning_rate': 1.0329201230480845e-06, 'epoch': 1.71} {'loss': 0.5829, 'learning_rate': 1.0327752346594321e-06, 'epoch': 1.71} {'loss': 0.6609, 'learning_rate': 1.0326303558799734e-06, 'epoch': 1.71} {'loss': 0.4389, 'learning_rate': 1.0324854867098555e-06, 'epoch': 1.71} {'loss': 0.4947, 'learning_rate': 1.0323406271492431e-06, 'epoch': 1.71} {'loss': 0.5678, 'learning_rate': 1.0321957771982837e-06, 'epoch': 1.71} {'loss': 0.4929, 'learning_rate': 1.0320509368571397e-06, 'epoch': 1.71} {'loss': 0.6065, 'learning_rate': 1.0319061061259605e-06, 'epoch': 1.71} {'loss': 0.6902, 'learning_rate': 1.0317612850049031e-06, 'epoch': 1.71} {'loss': 0.5697, 'learning_rate': 1.0316164734941247e-06, 'epoch': 1.71} {'loss': 0.4092, 'learning_rate': 1.0314716715937756e-06, 'epoch': 1.71} {'loss': 0.5585, 'learning_rate': 1.0313268793040166e-06, 'epoch': 1.71} {'loss': 0.5044, 'learning_rate': 1.0311820966249975e-06, 'epoch': 1.71} {'loss': 0.6853, 'learning_rate': 1.0310373235568805e-06, 'epoch': 1.71} {'loss': 0.5422, 'learning_rate': 1.0308925600998132e-06, 'epoch': 1.71} {'loss': 0.4645, 'learning_rate': 1.0307478062539556e-06, 'epoch': 1.71} {'loss': 0.4951, 'learning_rate': 1.0306030620194619e-06, 'epoch': 1.71} {'loss': 0.5218, 'learning_rate': 1.030458327396483e-06, 'epoch': 1.71} {'loss': 0.4201, 'learning_rate': 1.0303136023851822e-06, 'epoch': 1.71} {'loss': 0.6408, 'learning_rate': 1.0301688869857053e-06, 'epoch': 1.71} {'loss': 0.5061, 'learning_rate': 1.030024181198216e-06, 'epoch': 1.71} {'loss': 0.5228, 'learning_rate': 1.0298794850228632e-06, 'epoch': 1.71} {'loss': 0.481, 'learning_rate': 1.029734798459805e-06, 'epoch': 1.71} {'loss': 0.4809, 'learning_rate': 1.0295901215091963e-06, 'epoch': 1.71} {'loss': 0.525, 'learning_rate': 1.0294454541711885e-06, 'epoch': 1.71} {'loss': 0.4454, 'learning_rate': 1.0293007964459433e-06, 'epoch': 1.71} {'loss': 0.5224, 'learning_rate': 1.0291561483336098e-06, 'epoch': 1.71} {'loss': 0.4859, 'learning_rate': 1.0290115098343445e-06, 'epoch': 1.71} {'loss': 0.565, 'learning_rate': 1.0288668809483037e-06, 'epoch': 1.71} {'loss': 0.5503, 'learning_rate': 1.0287222616756421e-06, 'epoch': 1.71} {'loss': 0.5253, 'learning_rate': 1.0285776520165159e-06, 'epoch': 1.71} {'loss': 0.5645, 'learning_rate': 1.0284330519710751e-06, 'epoch': 1.71} {'loss': 0.5638, 'learning_rate': 1.0282884615394805e-06, 'epoch': 1.71} {'loss': 0.6294, 'learning_rate': 1.0281438807218835e-06, 'epoch': 1.71} {'loss': 0.5077, 'learning_rate': 1.0279993095184404e-06, 'epoch': 1.71} {'loss': 0.6635, 'learning_rate': 1.0278547479293055e-06, 'epoch': 1.71} {'loss': 0.4559, 'learning_rate': 1.0277101959546342e-06, 'epoch': 1.71} {'loss': 0.3637, 'learning_rate': 1.0275656535945832e-06, 'epoch': 1.71} {'loss': 0.5251, 'learning_rate': 1.0274211208493012e-06, 'epoch': 1.71} {'loss': 0.5017, 'learning_rate': 1.0272765977189514e-06, 'epoch': 1.71} {'loss': 0.5483, 'learning_rate': 1.0271320842036824e-06, 'epoch': 1.71} {'loss': 0.5212, 'learning_rate': 1.026987580303651e-06, 'epoch': 1.71} {'loss': 0.5564, 'learning_rate': 1.0268430860190136e-06, 'epoch': 1.71} {'loss': 0.4276, 'learning_rate': 1.0266986013499224e-06, 'epoch': 1.71} {'loss': 0.462, 'learning_rate': 1.0265541262965362e-06, 'epoch': 1.71} {'loss': 0.5654, 'learning_rate': 1.0264096608590046e-06, 'epoch': 1.71} {'loss': 0.3747, 'learning_rate': 1.0262652050374856e-06, 'epoch': 1.71} {'loss': 0.422, 'learning_rate': 1.026120758832132e-06, 'epoch': 1.71} {'loss': 0.4802, 'learning_rate': 1.025976322243102e-06, 'epoch': 1.71} {'loss': 0.5653, 'learning_rate': 1.0258318952705472e-06, 'epoch': 1.71} {'loss': 0.5378, 'learning_rate': 1.0256874779146232e-06, 'epoch': 1.71} {'loss': 0.5001, 'learning_rate': 1.0255430701754876e-06, 'epoch': 1.71} {'loss': 0.5534, 'learning_rate': 1.0253986720532894e-06, 'epoch': 1.71} {'loss': 0.5493, 'learning_rate': 1.0252542835481883e-06, 'epoch': 1.71} {'loss': 0.6522, 'learning_rate': 1.0251099046603364e-06, 'epoch': 1.71} {'loss': 0.3222, 'learning_rate': 1.024965535389889e-06, 'epoch': 1.71} {'loss': 0.5894, 'learning_rate': 1.0248211757370031e-06, 'epoch': 1.71} {'loss': 0.5501, 'learning_rate': 1.024676825701828e-06, 'epoch': 1.71} {'loss': 0.3939, 'learning_rate': 1.024532485284525e-06, 'epoch': 1.71} {'loss': 0.436, 'learning_rate': 1.0243881544852441e-06, 'epoch': 1.71} {'loss': 0.6706, 'learning_rate': 1.0242438333041415e-06, 'epoch': 1.71} {'loss': 0.57, 'learning_rate': 1.0240995217413719e-06, 'epoch': 1.71} {'loss': 0.4909, 'learning_rate': 1.0239552197970893e-06, 'epoch': 1.71} {'loss': 0.5459, 'learning_rate': 1.0238109274714503e-06, 'epoch': 1.71} {'loss': 0.5713, 'learning_rate': 1.023666644764607e-06, 'epoch': 1.71} {'loss': 0.5536, 'learning_rate': 1.0235223716767151e-06, 'epoch': 1.71} {'loss': 0.5162, 'learning_rate': 1.0233781082079286e-06, 'epoch': 1.71} {'loss': 0.5327, 'learning_rate': 1.0232338543584031e-06, 'epoch': 1.71} {'loss': 0.581, 'learning_rate': 1.0230896101282916e-06, 'epoch': 1.71} {'loss': 0.5659, 'learning_rate': 1.022945375517751e-06, 'epoch': 1.71} {'loss': 0.4587, 'learning_rate': 1.0228011505269364e-06, 'epoch': 1.71} {'loss': 0.5195, 'learning_rate': 1.022656935155999e-06, 'epoch': 1.71} {'loss': 0.6083, 'learning_rate': 1.022512729405094e-06, 'epoch': 1.71} {'loss': 0.54, 'learning_rate': 1.022368533274377e-06, 'epoch': 1.71} {'loss': 0.5519, 'learning_rate': 1.0222243467640035e-06, 'epoch': 1.71} {'loss': 0.492, 'learning_rate': 1.0220801698741256e-06, 'epoch': 1.71} {'loss': 0.5521, 'learning_rate': 1.0219360026048997e-06, 'epoch': 1.71} {'loss': 0.4605, 'learning_rate': 1.0217918449564812e-06, 'epoch': 1.71} {'loss': 0.5882, 'learning_rate': 1.0216476969290222e-06, 'epoch': 1.71} {'loss': 0.4483, 'learning_rate': 1.0215035585226774e-06, 'epoch': 1.71} {'loss': 0.372, 'learning_rate': 1.0213594297376018e-06, 'epoch': 1.71} {'loss': 0.5821, 'learning_rate': 1.0212153105739496e-06, 'epoch': 1.71} {'loss': 0.5379, 'learning_rate': 1.0210712010318756e-06, 'epoch': 1.71} {'loss': 0.5473, 'learning_rate': 1.0209271011115373e-06, 'epoch': 1.71} {'loss': 0.6365, 'learning_rate': 1.0207830108130835e-06, 'epoch': 1.71} {'loss': 0.6342, 'learning_rate': 1.0206389301366705e-06, 'epoch': 1.71} {'loss': 0.462, 'learning_rate': 1.0204948590824537e-06, 'epoch': 1.71} {'loss': 0.5452, 'learning_rate': 1.0203507976505877e-06, 'epoch': 1.71} {'loss': 0.4645, 'learning_rate': 1.0202067458412257e-06, 'epoch': 1.71} {'loss': 0.5124, 'learning_rate': 1.020062703654523e-06, 'epoch': 1.71} {'loss': 0.5383, 'learning_rate': 1.0199186710906351e-06, 'epoch': 1.71} {'loss': 0.5784, 'learning_rate': 1.0197746481497128e-06, 'epoch': 1.71} {'loss': 0.6207, 'learning_rate': 1.0196306348319129e-06, 'epoch': 1.71} {'loss': 0.431, 'learning_rate': 1.0194866311373886e-06, 'epoch': 1.71} {'loss': 0.5238, 'learning_rate': 1.0193426370662963e-06, 'epoch': 1.71} {'loss': 0.5602, 'learning_rate': 1.0191986526187892e-06, 'epoch': 1.71} {'loss': 0.5766, 'learning_rate': 1.0190546777950183e-06, 'epoch': 1.71} {'loss': 0.6498, 'learning_rate': 1.0189107125951448e-06, 'epoch': 1.71} {'loss': 0.5422, 'learning_rate': 1.0187667570193171e-06, 'epoch': 1.71} {'loss': 0.561, 'learning_rate': 1.018622811067691e-06, 'epoch': 1.71} {'loss': 0.5536, 'learning_rate': 1.0184788747404217e-06, 'epoch': 1.71} {'loss': 0.6078, 'learning_rate': 1.0183349480376625e-06, 'epoch': 1.71} {'loss': 0.6025, 'learning_rate': 1.0181910309595711e-06, 'epoch': 1.71} {'loss': 0.5139, 'learning_rate': 1.0180471235062938e-06, 'epoch': 1.71} {'loss': 0.4637, 'learning_rate': 1.017903225677993e-06, 'epoch': 1.71} {'loss': 0.6089, 'learning_rate': 1.0177593374748185e-06, 'epoch': 1.71} {'loss': 0.5715, 'learning_rate': 1.0176154588969257e-06, 'epoch': 1.71} {'loss': 0.5792, 'learning_rate': 1.0174715899444688e-06, 'epoch': 1.71} {'loss': 0.4378, 'learning_rate': 1.017327730617601e-06, 'epoch': 1.71} {'loss': 0.6354, 'learning_rate': 1.0171838809164792e-06, 'epoch': 1.71} {'loss': 0.4978, 'learning_rate': 1.017040040841253e-06, 'epoch': 1.71} {'loss': 0.587, 'learning_rate': 1.016896210392082e-06, 'epoch': 1.71} {'loss': 0.4581, 'learning_rate': 1.0167523895691156e-06, 'epoch': 1.71} {'loss': 0.4327, 'learning_rate': 1.01660857837251e-06, 'epoch': 1.71} {'loss': 0.5801, 'learning_rate': 1.0164647768024204e-06, 'epoch': 1.71} {'loss': 0.5942, 'learning_rate': 1.016320984858996e-06, 'epoch': 1.71} {'loss': 0.4558, 'learning_rate': 1.0161772025423988e-06, 'epoch': 1.71} {'loss': 0.479, 'learning_rate': 1.0160334298527751e-06, 'epoch': 1.71} {'loss': 0.4822, 'learning_rate': 1.0158896667902863e-06, 'epoch': 1.71} {'loss': 0.6278, 'learning_rate': 1.0157459133550795e-06, 'epoch': 1.71} {'loss': 0.4238, 'learning_rate': 1.0156021695473129e-06, 'epoch': 1.71} {'loss': 0.6216, 'learning_rate': 1.0154584353671405e-06, 'epoch': 1.71} {'loss': 0.5095, 'learning_rate': 1.0153147108147121e-06, 'epoch': 1.71} {'loss': 0.6553, 'learning_rate': 1.015170995890188e-06, 'epoch': 1.71} {'loss': 0.4708, 'learning_rate': 1.0150272905937175e-06, 'epoch': 1.71} {'loss': 0.498, 'learning_rate': 1.0148835949254566e-06, 'epoch': 1.71} {'loss': 0.3697, 'learning_rate': 1.014739908885559e-06, 'epoch': 1.71} {'loss': 0.5216, 'learning_rate': 1.0145962324741787e-06, 'epoch': 1.71} {'loss': 0.4705, 'learning_rate': 1.0144525656914704e-06, 'epoch': 1.71} {'loss': 0.5801, 'learning_rate': 1.0143089085375846e-06, 'epoch': 1.71} {'loss': 0.5566, 'learning_rate': 1.0141652610126806e-06, 'epoch': 1.71} {'loss': 0.4546, 'learning_rate': 1.0140216231169076e-06, 'epoch': 1.71} {'loss': 0.5516, 'learning_rate': 1.0138779948504219e-06, 'epoch': 1.71} {'loss': 0.5772, 'learning_rate': 1.0137343762133779e-06, 'epoch': 1.71} {'loss': 0.5506, 'learning_rate': 1.0135907672059275e-06, 'epoch': 1.71} {'loss': 0.4624, 'learning_rate': 1.0134471678282276e-06, 'epoch': 1.71} {'loss': 0.5833, 'learning_rate': 1.0133035780804257e-06, 'epoch': 1.71} {'loss': 0.6378, 'learning_rate': 1.0131599979626849e-06, 'epoch': 1.71} {'loss': 0.4112, 'learning_rate': 1.0130164274751519e-06, 'epoch': 1.71} {'loss': 0.4902, 'learning_rate': 1.0128728666179833e-06, 'epoch': 1.71} {'loss': 0.6158, 'learning_rate': 1.0127293153913343e-06, 'epoch': 1.71} {'loss': 0.537, 'learning_rate': 1.0125857737953538e-06, 'epoch': 1.71} {'loss': 0.517, 'learning_rate': 1.0124422418302016e-06, 'epoch': 1.71} {'loss': 0.4866, 'learning_rate': 1.0122987194960254e-06, 'epoch': 1.71} {'loss': 0.5956, 'learning_rate': 1.0121552067929863e-06, 'epoch': 1.71} {'loss': 0.4, 'learning_rate': 1.0120117037212318e-06, 'epoch': 1.71} {'loss': 0.3976, 'learning_rate': 1.0118682102809186e-06, 'epoch': 1.71} {'loss': 0.5558, 'learning_rate': 1.0117247264722009e-06, 'epoch': 1.71} {'loss': 0.3134, 'learning_rate': 1.0115812522952284e-06, 'epoch': 1.71} {'loss': 0.4772, 'learning_rate': 1.0114377877501603e-06, 'epoch': 1.71} {'loss': 0.3615, 'learning_rate': 1.011294332837145e-06, 'epoch': 1.71} {'loss': 0.6893, 'learning_rate': 1.0111508875563435e-06, 'epoch': 1.71} {'loss': 0.4948, 'learning_rate': 1.0110074519079028e-06, 'epoch': 1.71} {'loss': 0.437, 'learning_rate': 1.0108640258919788e-06, 'epoch': 1.71} {'loss': 0.5006, 'learning_rate': 1.0107206095087263e-06, 'epoch': 1.71} {'loss': 0.6295, 'learning_rate': 1.010577202758295e-06, 'epoch': 1.71} {'loss': 0.498, 'learning_rate': 1.0104338056408459e-06, 'epoch': 1.71} {'loss': 0.4308, 'learning_rate': 1.0102904181565243e-06, 'epoch': 1.71} {'loss': 0.4784, 'learning_rate': 1.0101470403054914e-06, 'epoch': 1.71} {'loss': 0.3933, 'learning_rate': 1.0100036720878958e-06, 'epoch': 1.71} {'loss': 0.4371, 'learning_rate': 1.009860313503892e-06, 'epoch': 1.71} {'loss': 0.6413, 'learning_rate': 1.0097169645536364e-06, 'epoch': 1.71} {'loss': 0.5428, 'learning_rate': 1.0095736252372768e-06, 'epoch': 1.71} {'loss': 0.4229, 'learning_rate': 1.009430295554974e-06, 'epoch': 1.71} {'loss': 0.5881, 'learning_rate': 1.0092869755068746e-06, 'epoch': 1.71} {'loss': 0.4882, 'learning_rate': 1.0091436650931396e-06, 'epoch': 1.71} {'loss': 0.4636, 'learning_rate': 1.0090003643139168e-06, 'epoch': 1.71} {'loss': 0.5297, 'learning_rate': 1.0088570731693615e-06, 'epoch': 1.71} {'loss': 0.457, 'learning_rate': 1.008713791659629e-06, 'epoch': 1.71} {'loss': 0.4264, 'learning_rate': 1.0085705197848671e-06, 'epoch': 1.71} {'loss': 0.3825, 'learning_rate': 1.0084272575452381e-06, 'epoch': 1.71} {'loss': 0.5911, 'learning_rate': 1.0082840049408882e-06, 'epoch': 1.71} {'loss': 0.7182, 'learning_rate': 1.008140761971974e-06, 'epoch': 1.71} {'loss': 0.5223, 'learning_rate': 1.007997528638649e-06, 'epoch': 1.71} {'loss': 0.4876, 'learning_rate': 1.007854304941065e-06, 'epoch': 1.71} {'loss': 0.5633, 'learning_rate': 1.0077110908793798e-06, 'epoch': 1.71} {'loss': 0.4406, 'learning_rate': 1.0075678864537387e-06, 'epoch': 1.71} {'loss': 0.4827, 'learning_rate': 1.0074246916643048e-06, 'epoch': 1.71} {'loss': 0.4758, 'learning_rate': 1.0072815065112252e-06, 'epoch': 1.71} {'loss': 0.4921, 'learning_rate': 1.0071383309946547e-06, 'epoch': 1.71} {'loss': 0.5126, 'learning_rate': 1.006995165114747e-06, 'epoch': 1.71} {'loss': 0.4283, 'learning_rate': 1.006852008871656e-06, 'epoch': 1.71} {'loss': 0.4316, 'learning_rate': 1.0067088622655374e-06, 'epoch': 1.71} {'loss': 0.5392, 'learning_rate': 1.006565725296539e-06, 'epoch': 1.71} {'loss': 0.5324, 'learning_rate': 1.0064225979648168e-06, 'epoch': 1.71} {'loss': 0.4629, 'learning_rate': 1.0062794802705255e-06, 'epoch': 1.71} {'loss': 0.6002, 'learning_rate': 1.0061363722138174e-06, 'epoch': 1.71} {'loss': 0.6504, 'learning_rate': 1.0059932737948452e-06, 'epoch': 1.71} {'loss': 0.5002, 'learning_rate': 1.0058501850137637e-06, 'epoch': 1.71} {'loss': 0.4519, 'learning_rate': 1.0057071058707268e-06, 'epoch': 1.71} {'loss': 0.4705, 'learning_rate': 1.0055640363658847e-06, 'epoch': 1.71} {'loss': 0.6118, 'learning_rate': 1.0054209764993928e-06, 'epoch': 1.71} {'loss': 0.5407, 'learning_rate': 1.005277926271404e-06, 'epoch': 1.71} {'loss': 0.4755, 'learning_rate': 1.005134885682072e-06, 'epoch': 1.71} {'loss': 0.5839, 'learning_rate': 1.0049918547315495e-06, 'epoch': 1.71} {'loss': 0.5397, 'learning_rate': 1.0048488334199902e-06, 'epoch': 1.71} {'loss': 0.4777, 'learning_rate': 1.004705821747549e-06, 'epoch': 1.71} {'loss': 0.4889, 'learning_rate': 1.0045628197143764e-06, 'epoch': 1.71} {'loss': 0.5874, 'learning_rate': 1.0044198273206252e-06, 'epoch': 1.71} {'loss': 0.4901, 'learning_rate': 1.0042768445664509e-06, 'epoch': 1.71} {'loss': 0.4325, 'learning_rate': 1.0041338714520056e-06, 'epoch': 1.71} {'loss': 0.374, 'learning_rate': 1.0039909079774423e-06, 'epoch': 1.71} {'loss': 0.5603, 'learning_rate': 1.003847954142918e-06, 'epoch': 1.71} {'loss': 0.577, 'learning_rate': 1.003705009948579e-06, 'epoch': 1.71} {'loss': 0.3945, 'learning_rate': 1.0035620753945829e-06, 'epoch': 1.71} {'loss': 0.6104, 'learning_rate': 1.003419150481082e-06, 'epoch': 1.71} {'loss': 0.5746, 'learning_rate': 1.0032762352082291e-06, 'epoch': 1.71} {'loss': 0.5568, 'learning_rate': 1.0031333295761792e-06, 'epoch': 1.71} {'loss': 0.5327, 'learning_rate': 1.0029904335850837e-06, 'epoch': 1.71} {'loss': 0.6088, 'learning_rate': 1.0028475472350952e-06, 'epoch': 1.71} {'loss': 0.661, 'learning_rate': 1.0027046705263676e-06, 'epoch': 1.71} {'loss': 0.473, 'learning_rate': 1.0025618034590546e-06, 'epoch': 1.71} {'loss': 0.4814, 'learning_rate': 1.0024189460333077e-06, 'epoch': 1.71} {'loss': 0.7067, 'learning_rate': 1.0022760982492808e-06, 'epoch': 1.71} {'loss': 0.495, 'learning_rate': 1.0021332601071277e-06, 'epoch': 1.71} {'loss': 0.4405, 'learning_rate': 1.0019904316070029e-06, 'epoch': 1.71} {'loss': 0.4719, 'learning_rate': 1.001847612749055e-06, 'epoch': 1.71} {'loss': 0.4208, 'learning_rate': 1.0017048035334408e-06, 'epoch': 1.71} {'loss': 0.5026, 'learning_rate': 1.0015620039603103e-06, 'epoch': 1.71} {'loss': 0.5799, 'learning_rate': 1.0014192140298195e-06, 'epoch': 1.71} {'loss': 0.4874, 'learning_rate': 1.0012764337421199e-06, 'epoch': 1.71} {'loss': 0.2929, 'learning_rate': 1.0011336630973667e-06, 'epoch': 1.71} {'loss': 0.546, 'learning_rate': 1.0009909020957086e-06, 'epoch': 1.71} {'loss': 0.4195, 'learning_rate': 1.0008481507373013e-06, 'epoch': 1.71} {'loss': 0.4878, 'learning_rate': 1.0007054090222978e-06, 'epoch': 1.71} {'loss': 0.4671, 'learning_rate': 1.0005626769508503e-06, 'epoch': 1.71} {'loss': 0.4538, 'learning_rate': 1.0004199545231118e-06, 'epoch': 1.71} {'loss': 0.4318, 'learning_rate': 1.000277241739237e-06, 'epoch': 1.71} {'loss': 0.5464, 'learning_rate': 1.0001345385993778e-06, 'epoch': 1.71} {'loss': 0.5847, 'learning_rate': 9.99991845103685e-07, 'epoch': 1.71} {'loss': 0.555, 'learning_rate': 9.998491612523143e-07, 'epoch': 1.71} {'loss': 0.5415, 'learning_rate': 9.997064870454165e-07, 'epoch': 1.71} {'loss': 0.4516, 'learning_rate': 9.99563822483146e-07, 'epoch': 1.71} {'loss': 0.4074, 'learning_rate': 9.99421167565655e-07, 'epoch': 1.71} {'loss': 0.5297, 'learning_rate': 9.992785222930968e-07, 'epoch': 1.71} {'loss': 0.5015, 'learning_rate': 9.991358866656254e-07, 'epoch': 1.71} {'loss': 0.527, 'learning_rate': 9.989932606833908e-07, 'epoch': 1.71} {'loss': 0.5597, 'learning_rate': 9.988506443465474e-07, 'epoch': 1.71} {'loss': 0.3717, 'learning_rate': 9.987080376552472e-07, 'epoch': 1.71} {'loss': 0.4762, 'learning_rate': 9.985654406096446e-07, 'epoch': 1.71} {'loss': 0.5026, 'learning_rate': 9.984228532098937e-07, 'epoch': 1.71} {'loss': 0.6282, 'learning_rate': 9.982802754561405e-07, 'epoch': 1.71} {'loss': 0.5009, 'learning_rate': 9.981377073485466e-07, 'epoch': 1.71} {'loss': 0.5346, 'learning_rate': 9.979951488872585e-07, 'epoch': 1.71} {'loss': 0.402, 'learning_rate': 9.97852600072432e-07, 'epoch': 1.71} {'loss': 0.5469, 'learning_rate': 9.97710060904218e-07, 'epoch': 1.71} {'loss': 0.4606, 'learning_rate': 9.975675313827704e-07, 'epoch': 1.71} {'loss': 0.5471, 'learning_rate': 9.974250115082428e-07, 'epoch': 1.71} {'loss': 0.5539, 'learning_rate': 9.972825012807841e-07, 'epoch': 1.71} {'loss': 0.3992, 'learning_rate': 9.971400007005538e-07, 'epoch': 1.71} {'loss': 0.3588, 'learning_rate': 9.969975097676976e-07, 'epoch': 1.71} {'loss': 0.446, 'learning_rate': 9.96855028482372e-07, 'epoch': 1.71} {'loss': 0.5913, 'learning_rate': 9.96712556844729e-07, 'epoch': 1.71} {'loss': 0.5187, 'learning_rate': 9.965700948549195e-07, 'epoch': 1.71} {'loss': 0.4773, 'learning_rate': 9.964276425131014e-07, 'epoch': 1.71} {'loss': 0.5128, 'learning_rate': 9.96285199819419e-07, 'epoch': 1.71} {'loss': 0.4495, 'learning_rate': 9.961427667740342e-07, 'epoch': 1.71} {'loss': 0.4077, 'learning_rate': 9.960003433770927e-07, 'epoch': 1.71} {'loss': 0.4201, 'learning_rate': 9.958579296287486e-07, 'epoch': 1.71} {'loss': 0.3375, 'learning_rate': 9.957155255291584e-07, 'epoch': 1.71} {'loss': 0.4243, 'learning_rate': 9.955731310784677e-07, 'epoch': 1.71} {'loss': 0.4608, 'learning_rate': 9.954307462768364e-07, 'epoch': 1.71} {'loss': 0.4344, 'learning_rate': 9.95288371124411e-07, 'epoch': 1.71} {'loss': 0.5277, 'learning_rate': 9.951460056213503e-07, 'epoch': 1.71} {'loss': 0.578, 'learning_rate': 9.950036497678006e-07, 'epoch': 1.71} {'loss': 0.4009, 'learning_rate': 9.948613035639187e-07, 'epoch': 1.71} {'loss': 0.4656, 'learning_rate': 9.947189670098568e-07, 'epoch': 1.71} {'loss': 0.3714, 'learning_rate': 9.945766401057622e-07, 'epoch': 1.71} {'loss': 0.4529, 'learning_rate': 9.94434322851795e-07, 'epoch': 1.71} {'loss': 0.4688, 'learning_rate': 9.942920152481018e-07, 'epoch': 1.71} {'loss': 0.3377, 'learning_rate': 9.9414971729484e-07, 'epoch': 1.71} {'loss': 0.4742, 'learning_rate': 9.940074289921587e-07, 'epoch': 1.71} {'loss': 0.6592, 'learning_rate': 9.938651503402107e-07, 'epoch': 1.71} {'loss': 0.5135, 'learning_rate': 9.93722881339151e-07, 'epoch': 1.71} {'loss': 0.5355, 'learning_rate': 9.935806219891263e-07, 'epoch': 1.71} {'loss': 0.4117, 'learning_rate': 9.934383722902964e-07, 'epoch': 1.71} {'loss': 0.5117, 'learning_rate': 9.93296132242807e-07, 'epoch': 1.71} {'loss': 0.4708, 'learning_rate': 9.931539018468172e-07, 'epoch': 1.71} {'loss': 0.6483, 'learning_rate': 9.930116811024736e-07, 'epoch': 1.71} {'loss': 0.6086, 'learning_rate': 9.928694700099317e-07, 'epoch': 1.71} {'loss': 0.4053, 'learning_rate': 9.927272685693445e-07, 'epoch': 1.71} {'loss': 0.4899, 'learning_rate': 9.925850767808586e-07, 'epoch': 1.71} {'loss': 0.5468, 'learning_rate': 9.924428946446363e-07, 'epoch': 1.71} {'loss': 0.5447, 'learning_rate': 9.923007221608216e-07, 'epoch': 1.71} {'loss': 0.5266, 'learning_rate': 9.92158559329569e-07, 'epoch': 1.71} {'loss': 0.4213, 'learning_rate': 9.920164061510317e-07, 'epoch': 1.71} {'loss': 0.5889, 'learning_rate': 9.91874262625363e-07, 'epoch': 1.71} {'loss': 0.5883, 'learning_rate': 9.917321287527148e-07, 'epoch': 1.71} {'loss': 0.4793, 'learning_rate': 9.915900045332349e-07, 'epoch': 1.71} {'loss': 0.6741, 'learning_rate': 9.914478899670843e-07, 'epoch': 1.72} {'loss': 0.4953, 'learning_rate': 9.913057850544073e-07, 'epoch': 1.72} {'loss': 0.6023, 'learning_rate': 9.91163689795359e-07, 'epoch': 1.72} {'loss': 0.5456, 'learning_rate': 9.910216041900934e-07, 'epoch': 1.72} {'loss': 0.4546, 'learning_rate': 9.908795282387595e-07, 'epoch': 1.72} {'loss': 0.4809, 'learning_rate': 9.907374619415143e-07, 'epoch': 1.72} {'loss': 0.4227, 'learning_rate': 9.905954052985034e-07, 'epoch': 1.72} {'loss': 0.5318, 'learning_rate': 9.904533583098862e-07, 'epoch': 1.72} {'loss': 0.5217, 'learning_rate': 9.903113209758098e-07, 'epoch': 1.72} {'loss': 0.4791, 'learning_rate': 9.901692932964268e-07, 'epoch': 1.72} {'loss': 0.5617, 'learning_rate': 9.900272752718931e-07, 'epoch': 1.72} {'loss': 0.5611, 'learning_rate': 9.898852669023552e-07, 'epoch': 1.72} {'loss': 0.5182, 'learning_rate': 9.897432681879715e-07, 'epoch': 1.72} {'loss': 0.5283, 'learning_rate': 9.896012791288878e-07, 'epoch': 1.72} {'loss': 0.4932, 'learning_rate': 9.894592997252627e-07, 'epoch': 1.72} {'loss': 0.5884, 'learning_rate': 9.89317329977244e-07, 'epoch': 1.72} {'loss': 0.4903, 'learning_rate': 9.891753698849848e-07, 'epoch': 1.72} {'loss': 0.467, 'learning_rate': 9.890334194486394e-07, 'epoch': 1.72} {'loss': 0.5319, 'learning_rate': 9.888914786683545e-07, 'epoch': 1.72} {'loss': 0.387, 'learning_rate': 9.887495475442898e-07, 'epoch': 1.72} {'loss': 0.5812, 'learning_rate': 9.886076260765899e-07, 'epoch': 1.72} {'loss': 0.4384, 'learning_rate': 9.88465714265412e-07, 'epoch': 1.72} {'loss': 0.5067, 'learning_rate': 9.88323812110905e-07, 'epoch': 1.72} {'loss': 0.4332, 'learning_rate': 9.881819196132225e-07, 'epoch': 1.72} {'loss': 0.4217, 'learning_rate': 9.880400367725195e-07, 'epoch': 1.72} {'loss': 0.5301, 'learning_rate': 9.878981635889406e-07, 'epoch': 1.72} {'loss': 0.5266, 'learning_rate': 9.877563000626455e-07, 'epoch': 1.72} {'loss': 0.5527, 'learning_rate': 9.87614446193781e-07, 'epoch': 1.72} {'loss': 0.4319, 'learning_rate': 9.87472601982502e-07, 'epoch': 1.72} {'loss': 0.5181, 'learning_rate': 9.87330767428959e-07, 'epoch': 1.72} {'loss': 0.395, 'learning_rate': 9.871889425333038e-07, 'epoch': 1.72} {'loss': 0.4505, 'learning_rate': 9.870471272956916e-07, 'epoch': 1.72} {'loss': 0.539, 'learning_rate': 9.869053217162684e-07, 'epoch': 1.72} {'loss': 0.5294, 'learning_rate': 9.867635257951934e-07, 'epoch': 1.72} {'loss': 0.5435, 'learning_rate': 9.866217395326128e-07, 'epoch': 1.72} {'loss': 0.584, 'learning_rate': 9.864799629286803e-07, 'epoch': 1.72} {'loss': 0.4582, 'learning_rate': 9.863381959835483e-07, 'epoch': 1.72} {'loss': 0.4821, 'learning_rate': 9.861964386973677e-07, 'epoch': 1.72} {'loss': 0.4941, 'learning_rate': 9.86054691070294e-07, 'epoch': 1.72} {'loss': 0.4732, 'learning_rate': 9.859129531024737e-07, 'epoch': 1.72} {'loss': 0.4215, 'learning_rate': 9.85771224794062e-07, 'epoch': 1.72} {'loss': 0.6741, 'learning_rate': 9.856295061452092e-07, 'epoch': 1.72} {'loss': 0.5436, 'learning_rate': 9.854877971560684e-07, 'epoch': 1.72} {'loss': 0.6572, 'learning_rate': 9.853460978267916e-07, 'epoch': 1.72} {'loss': 0.6225, 'learning_rate': 9.852044081575295e-07, 'epoch': 1.72} {'loss': 0.5388, 'learning_rate': 9.85062728148436e-07, 'epoch': 1.72} {'loss': 0.5112, 'learning_rate': 9.849210577996604e-07, 'epoch': 1.72} {'loss': 0.4339, 'learning_rate': 9.84779397111355e-07, 'epoch': 1.72} {'loss': 0.5452, 'learning_rate': 9.84637746083672e-07, 'epoch': 1.72} {'loss': 0.3664, 'learning_rate': 9.844961047167634e-07, 'epoch': 1.72} {'loss': 0.6055, 'learning_rate': 9.843544730107812e-07, 'epoch': 1.72} {'loss': 0.4873, 'learning_rate': 9.842128509658766e-07, 'epoch': 1.72} {'loss': 0.3587, 'learning_rate': 9.840712385822037e-07, 'epoch': 1.72} {'loss': 0.5981, 'learning_rate': 9.839296358599104e-07, 'epoch': 1.72} {'loss': 0.5042, 'learning_rate': 9.837880427991498e-07, 'epoch': 1.72} {'loss': 0.4001, 'learning_rate': 9.83646459400075e-07, 'epoch': 1.72} {'loss': 0.6868, 'learning_rate': 9.83504885662836e-07, 'epoch': 1.72} {'loss': 0.5518, 'learning_rate': 9.83363321587586e-07, 'epoch': 1.72} {'loss': 0.4513, 'learning_rate': 9.83221767174477e-07, 'epoch': 1.72} {'loss': 0.7307, 'learning_rate': 9.83080222423658e-07, 'epoch': 1.72} {'loss': 0.4303, 'learning_rate': 9.829386873352832e-07, 'epoch': 1.72} {'loss': 0.5559, 'learning_rate': 9.827971619095022e-07, 'epoch': 1.72} {'loss': 0.3946, 'learning_rate': 9.826556461464687e-07, 'epoch': 1.72} {'loss': 0.4659, 'learning_rate': 9.825141400463333e-07, 'epoch': 1.72} {'loss': 0.4693, 'learning_rate': 9.823726436092484e-07, 'epoch': 1.72} {'loss': 0.4081, 'learning_rate': 9.82231156835366e-07, 'epoch': 1.72} {'loss': 0.4485, 'learning_rate': 9.820896797248358e-07, 'epoch': 1.72} {'loss': 0.5951, 'learning_rate': 9.819482122778101e-07, 'epoch': 1.72} {'loss': 0.4851, 'learning_rate': 9.818067544944409e-07, 'epoch': 1.72} {'loss': 0.5456, 'learning_rate': 9.816653063748794e-07, 'epoch': 1.72} {'loss': 0.5976, 'learning_rate': 9.815238679192795e-07, 'epoch': 1.72} {'loss': 0.468, 'learning_rate': 9.813824391277872e-07, 'epoch': 1.72} {'loss': 0.5235, 'learning_rate': 9.812410200005618e-07, 'epoch': 1.72} {'loss': 0.495, 'learning_rate': 9.810996105377478e-07, 'epoch': 1.72} {'loss': 0.4561, 'learning_rate': 9.809582107395e-07, 'epoch': 1.72} {'loss': 0.5893, 'learning_rate': 9.8081682060597e-07, 'epoch': 1.72} {'loss': 0.3785, 'learning_rate': 9.806754401373075e-07, 'epoch': 1.72} {'loss': 0.635, 'learning_rate': 9.805340693336685e-07, 'epoch': 1.72} {'loss': 0.2588, 'learning_rate': 9.803927081951991e-07, 'epoch': 1.72} {'loss': 0.3879, 'learning_rate': 9.80251356722053e-07, 'epoch': 1.72} {'loss': 0.4432, 'learning_rate': 9.801100149143806e-07, 'epoch': 1.72} {'loss': 0.5641, 'learning_rate': 9.799686827723353e-07, 'epoch': 1.72} {'loss': 0.5592, 'learning_rate': 9.798273602960673e-07, 'epoch': 1.72} {'loss': 0.5314, 'learning_rate': 9.796860474857296e-07, 'epoch': 1.72} {'loss': 0.5337, 'learning_rate': 9.795447443414729e-07, 'epoch': 1.72} {'loss': 0.4886, 'learning_rate': 9.794034508634465e-07, 'epoch': 1.72} {'loss': 0.537, 'learning_rate': 9.792621670518043e-07, 'epoch': 1.72} {'loss': 0.5308, 'learning_rate': 9.791208929066965e-07, 'epoch': 1.72} {'loss': 0.6015, 'learning_rate': 9.78979628428275e-07, 'epoch': 1.72} {'loss': 0.561, 'learning_rate': 9.788383736166917e-07, 'epoch': 1.72} {'loss': 0.3788, 'learning_rate': 9.786971284720947e-07, 'epoch': 1.72} {'loss': 0.3869, 'learning_rate': 9.785558929946415e-07, 'epoch': 1.72} {'loss': 0.6117, 'learning_rate': 9.784146671844774e-07, 'epoch': 1.72} {'loss': 0.3782, 'learning_rate': 9.782734510417568e-07, 'epoch': 1.72} {'loss': 0.509, 'learning_rate': 9.781322445666308e-07, 'epoch': 1.72} {'loss': 0.4812, 'learning_rate': 9.779910477592503e-07, 'epoch': 1.72} {'loss': 0.5436, 'learning_rate': 9.778498606197683e-07, 'epoch': 1.72} {'loss': 0.4925, 'learning_rate': 9.777086831483307e-07, 'epoch': 1.72} {'loss': 0.5501, 'learning_rate': 9.775675153450958e-07, 'epoch': 1.72} {'loss': 0.4833, 'learning_rate': 9.774263572102104e-07, 'epoch': 1.72} {'loss': 0.6024, 'learning_rate': 9.772852087438267e-07, 'epoch': 1.72} {'loss': 0.4322, 'learning_rate': 9.771440699460966e-07, 'epoch': 1.72} {'loss': 0.4936, 'learning_rate': 9.77002940817171e-07, 'epoch': 1.72} {'loss': 0.4421, 'learning_rate': 9.768618213572023e-07, 'epoch': 1.72} {'loss': 0.492, 'learning_rate': 9.76720711566338e-07, 'epoch': 1.72} {'loss': 0.653, 'learning_rate': 9.765796114447346e-07, 'epoch': 1.72} {'loss': 0.4532, 'learning_rate': 9.764385209925387e-07, 'epoch': 1.72} {'loss': 0.5198, 'learning_rate': 9.762974402099036e-07, 'epoch': 1.72} {'loss': 0.4933, 'learning_rate': 9.761563690969822e-07, 'epoch': 1.72} {'loss': 0.4716, 'learning_rate': 9.760153076539202e-07, 'epoch': 1.72} {'loss': 0.3595, 'learning_rate': 9.758742558808755e-07, 'epoch': 1.72} {'loss': 0.2677, 'learning_rate': 9.75733213777993e-07, 'epoch': 1.72} {'loss': 0.6376, 'learning_rate': 9.755921813454295e-07, 'epoch': 1.72} {'loss': 0.4694, 'learning_rate': 9.754511585833326e-07, 'epoch': 1.72} {'loss': 0.4832, 'learning_rate': 9.753101454918535e-07, 'epoch': 1.72} {'loss': 0.4614, 'learning_rate': 9.751691420711462e-07, 'epoch': 1.72} {'loss': 0.5355, 'learning_rate': 9.750281483213565e-07, 'epoch': 1.72} {'loss': 0.3988, 'learning_rate': 9.748871642426417e-07, 'epoch': 1.72} {'loss': 0.593, 'learning_rate': 9.747461898351462e-07, 'epoch': 1.72} {'loss': 0.3514, 'learning_rate': 9.74605225099029e-07, 'epoch': 1.72} {'loss': 0.4342, 'learning_rate': 9.744642700344354e-07, 'epoch': 1.72} {'loss': 0.2664, 'learning_rate': 9.743233246415163e-07, 'epoch': 1.72} {'loss': 0.5193, 'learning_rate': 9.741823889204283e-07, 'epoch': 1.72} {'loss': 0.4252, 'learning_rate': 9.740414628713135e-07, 'epoch': 1.72} {'loss': 0.458, 'learning_rate': 9.739005464943318e-07, 'epoch': 1.72} {'loss': 0.6155, 'learning_rate': 9.737596397896265e-07, 'epoch': 1.72} {'loss': 0.5329, 'learning_rate': 9.736187427573562e-07, 'epoch': 1.72} {'loss': 0.5627, 'learning_rate': 9.734778553976664e-07, 'epoch': 1.72} {'loss': 0.4416, 'learning_rate': 9.733369777107094e-07, 'epoch': 1.72} {'loss': 0.4633, 'learning_rate': 9.73196109696639e-07, 'epoch': 1.72} {'loss': 0.6525, 'learning_rate': 9.730552513556001e-07, 'epoch': 1.72} {'loss': 0.4605, 'learning_rate': 9.7291440268775e-07, 'epoch': 1.72} {'loss': 0.5295, 'learning_rate': 9.727735636932333e-07, 'epoch': 1.72} {'loss': 0.4969, 'learning_rate': 9.726327343722087e-07, 'epoch': 1.72} {'loss': 0.5796, 'learning_rate': 9.724919147248212e-07, 'epoch': 1.72} {'loss': 0.6191, 'learning_rate': 9.723511047512234e-07, 'epoch': 1.72} {'loss': 0.4773, 'learning_rate': 9.722103044515673e-07, 'epoch': 1.72} {'loss': 0.451, 'learning_rate': 9.720695138259995e-07, 'epoch': 1.72} {'loss': 0.5306, 'learning_rate': 9.719287328746774e-07, 'epoch': 1.72} {'loss': 0.4623, 'learning_rate': 9.717879615977454e-07, 'epoch': 1.72} {'loss': 0.568, 'learning_rate': 9.716471999953615e-07, 'epoch': 1.72} {'loss': 0.4506, 'learning_rate': 9.715064480676695e-07, 'epoch': 1.72} {'loss': 0.4746, 'learning_rate': 9.71365705814824e-07, 'epoch': 1.72} {'loss': 0.5248, 'learning_rate': 9.71224973236976e-07, 'epoch': 1.72} {'loss': 0.443, 'learning_rate': 9.710842503342722e-07, 'epoch': 1.72} {'loss': 0.4643, 'learning_rate': 9.709435371068699e-07, 'epoch': 1.72} {'loss': 0.4544, 'learning_rate': 9.708028335549157e-07, 'epoch': 1.72} {'loss': 0.384, 'learning_rate': 9.706621396785599e-07, 'epoch': 1.72} {'loss': 0.5649, 'learning_rate': 9.705214554779551e-07, 'epoch': 1.72} {'loss': 0.6423, 'learning_rate': 9.703807809532517e-07, 'epoch': 1.72} {'loss': 0.46, 'learning_rate': 9.702401161046027e-07, 'epoch': 1.72} {'loss': 0.4169, 'learning_rate': 9.700994609321513e-07, 'epoch': 1.72} {'loss': 0.5482, 'learning_rate': 9.699588154360572e-07, 'epoch': 1.72} {'loss': 0.6247, 'learning_rate': 9.698181796164663e-07, 'epoch': 1.72} {'loss': 0.3773, 'learning_rate': 9.696775534735304e-07, 'epoch': 1.72} {'loss': 0.3978, 'learning_rate': 9.695369370073993e-07, 'epoch': 1.72} {'loss': 0.466, 'learning_rate': 9.69396330218224e-07, 'epoch': 1.72} {'loss': 0.4927, 'learning_rate': 9.69255733106158e-07, 'epoch': 1.72} {'loss': 0.4859, 'learning_rate': 9.691151456713487e-07, 'epoch': 1.72} {'loss': 0.4768, 'learning_rate': 9.689745679139461e-07, 'epoch': 1.72} {'loss': 0.535, 'learning_rate': 9.688339998341033e-07, 'epoch': 1.72} {'loss': 0.5936, 'learning_rate': 9.686934414319694e-07, 'epoch': 1.72} {'loss': 0.5884, 'learning_rate': 9.68552892707698e-07, 'epoch': 1.72} {'loss': 0.4882, 'learning_rate': 9.684123536614331e-07, 'epoch': 1.72} {'loss': 0.466, 'learning_rate': 9.682718242933332e-07, 'epoch': 1.72} {'loss': 0.5292, 'learning_rate': 9.681313046035435e-07, 'epoch': 1.72} {'loss': 0.4655, 'learning_rate': 9.679907945922162e-07, 'epoch': 1.72} {'loss': 0.4511, 'learning_rate': 9.678502942595025e-07, 'epoch': 1.72} {'loss': 0.5455, 'learning_rate': 9.67709803605552e-07, 'epoch': 1.72} {'loss': 0.4899, 'learning_rate': 9.67569322630517e-07, 'epoch': 1.72} {'loss': 0.5284, 'learning_rate': 9.67428851334543e-07, 'epoch': 1.72} {'loss': 0.5211, 'learning_rate': 9.672883897177888e-07, 'epoch': 1.72} {'loss': 0.4652, 'learning_rate': 9.671479377803983e-07, 'epoch': 1.72} {'loss': 0.5108, 'learning_rate': 9.67007495522524e-07, 'epoch': 1.72} {'loss': 0.5505, 'learning_rate': 9.668670629443165e-07, 'epoch': 1.72} {'loss': 0.4953, 'learning_rate': 9.667266400459264e-07, 'epoch': 1.72} {'loss': 0.4922, 'learning_rate': 9.66586226827505e-07, 'epoch': 1.72} {'loss': 0.3531, 'learning_rate': 9.664458232892004e-07, 'epoch': 1.72} {'loss': 0.4212, 'learning_rate': 9.663054294311646e-07, 'epoch': 1.72} {'loss': 0.5318, 'learning_rate': 9.661650452535476e-07, 'epoch': 1.72} {'loss': 0.4535, 'learning_rate': 9.660246707565002e-07, 'epoch': 1.72} {'loss': 0.4238, 'learning_rate': 9.658843059401723e-07, 'epoch': 1.72} {'loss': 0.6127, 'learning_rate': 9.657439508047161e-07, 'epoch': 1.72} {'loss': 0.543, 'learning_rate': 9.656036053502815e-07, 'epoch': 1.72} {'loss': 0.6249, 'learning_rate': 9.654632695770162e-07, 'epoch': 1.72} {'loss': 0.5295, 'learning_rate': 9.653229434850718e-07, 'epoch': 1.72} {'loss': 0.3513, 'learning_rate': 9.651826270746002e-07, 'epoch': 1.72} {'loss': 0.5198, 'learning_rate': 9.650423203457515e-07, 'epoch': 1.72} {'loss': 0.5295, 'learning_rate': 9.649020232986739e-07, 'epoch': 1.72} {'loss': 0.5892, 'learning_rate': 9.647617359335204e-07, 'epoch': 1.72} {'loss': 0.6273, 'learning_rate': 9.64621458250441e-07, 'epoch': 1.72} {'loss': 0.5394, 'learning_rate': 9.644811902495844e-07, 'epoch': 1.72} {'loss': 0.5774, 'learning_rate': 9.643409319311016e-07, 'epoch': 1.72} {'loss': 0.5113, 'learning_rate': 9.642006832951423e-07, 'epoch': 1.72} {'loss': 0.384, 'learning_rate': 9.640604443418577e-07, 'epoch': 1.72} {'loss': 0.5236, 'learning_rate': 9.639202150713978e-07, 'epoch': 1.72} {'loss': 0.6066, 'learning_rate': 9.637799954839156e-07, 'epoch': 1.72} {'loss': 0.563, 'learning_rate': 9.636397855795564e-07, 'epoch': 1.72} {'loss': 0.6049, 'learning_rate': 9.634995853584716e-07, 'epoch': 1.72} {'loss': 0.5269, 'learning_rate': 9.633593948208141e-07, 'epoch': 1.72} {'loss': 0.5709, 'learning_rate': 9.632192139667317e-07, 'epoch': 1.72} {'loss': 0.5098, 'learning_rate': 9.630790427963765e-07, 'epoch': 1.72} {'loss': 0.4225, 'learning_rate': 9.629388813098972e-07, 'epoch': 1.72} {'loss': 0.5782, 'learning_rate': 9.627987295074459e-07, 'epoch': 1.72} {'loss': 0.4934, 'learning_rate': 9.626585873891703e-07, 'epoch': 1.72} {'loss': 0.5315, 'learning_rate': 9.625184549552214e-07, 'epoch': 1.72} {'loss': 0.564, 'learning_rate': 9.6237833220575e-07, 'epoch': 1.72} {'loss': 0.5062, 'learning_rate': 9.622382191409051e-07, 'epoch': 1.72} {'loss': 0.451, 'learning_rate': 9.62098115760839e-07, 'epoch': 1.72} {'loss': 0.496, 'learning_rate': 9.619580220657e-07, 'epoch': 1.72} {'loss': 0.5109, 'learning_rate': 9.618179380556392e-07, 'epoch': 1.72} {'loss': 0.5289, 'learning_rate': 9.616778637308055e-07, 'epoch': 1.72} {'loss': 0.4879, 'learning_rate': 9.6153779909135e-07, 'epoch': 1.72} {'loss': 0.4794, 'learning_rate': 9.613977441374223e-07, 'epoch': 1.72} {'loss': 0.5397, 'learning_rate': 9.612576988691724e-07, 'epoch': 1.72} {'loss': 0.467, 'learning_rate': 9.611176632867524e-07, 'epoch': 1.72} {'loss': 0.5376, 'learning_rate': 9.60977637390308e-07, 'epoch': 1.72} {'loss': 0.459, 'learning_rate': 9.60837621179994e-07, 'epoch': 1.72} {'loss': 0.4352, 'learning_rate': 9.606976146559578e-07, 'epoch': 1.72} {'loss': 0.5869, 'learning_rate': 9.605576178183495e-07, 'epoch': 1.72} {'loss': 0.5422, 'learning_rate': 9.604176306673196e-07, 'epoch': 1.72} {'loss': 0.4678, 'learning_rate': 9.602776532030178e-07, 'epoch': 1.72} {'loss': 0.5428, 'learning_rate': 9.60137685425596e-07, 'epoch': 1.72} {'loss': 0.52, 'learning_rate': 9.59997727335199e-07, 'epoch': 1.72} {'loss': 0.5037, 'learning_rate': 9.598577789319851e-07, 'epoch': 1.72} {'loss': 0.5974, 'learning_rate': 9.597178402160968e-07, 'epoch': 1.72} {'loss': 0.5296, 'learning_rate': 9.595779111876867e-07, 'epoch': 1.72} {'loss': 0.4962, 'learning_rate': 9.594379918469054e-07, 'epoch': 1.72} {'loss': 0.5171, 'learning_rate': 9.592980821939014e-07, 'epoch': 1.72} {'loss': 0.4876, 'learning_rate': 9.591581822288276e-07, 'epoch': 1.72} {'loss': 0.4379, 'learning_rate': 9.590182919518298e-07, 'epoch': 1.72} {'loss': 0.4159, 'learning_rate': 9.588784113630612e-07, 'epoch': 1.72} {'loss': 0.4358, 'learning_rate': 9.587385404626692e-07, 'epoch': 1.72} {'loss': 0.4996, 'learning_rate': 9.585986792508052e-07, 'epoch': 1.72} {'loss': 0.5887, 'learning_rate': 9.584588277276196e-07, 'epoch': 1.72} {'loss': 0.4933, 'learning_rate': 9.583189858932595e-07, 'epoch': 1.72} {'loss': 0.712, 'learning_rate': 9.581791537478791e-07, 'epoch': 1.72} {'loss': 0.4615, 'learning_rate': 9.580393312916248e-07, 'epoch': 1.72} {'loss': 0.5296, 'learning_rate': 9.578995185246464e-07, 'epoch': 1.72} {'loss': 0.5677, 'learning_rate': 9.577597154470952e-07, 'epoch': 1.72} {'loss': 0.515, 'learning_rate': 9.57619922059121e-07, 'epoch': 1.72} {'loss': 0.5402, 'learning_rate': 9.574801383608745e-07, 'epoch': 1.72} {'loss': 0.4289, 'learning_rate': 9.573403643525004e-07, 'epoch': 1.72} {'loss': 0.4468, 'learning_rate': 9.572006000341572e-07, 'epoch': 1.72} {'loss': 0.4372, 'learning_rate': 9.57060845405986e-07, 'epoch': 1.72} {'loss': 0.4648, 'learning_rate': 9.569211004681411e-07, 'epoch': 1.72} {'loss': 0.5169, 'learning_rate': 9.567813652207736e-07, 'epoch': 1.72} {'loss': 0.4531, 'learning_rate': 9.566416396640277e-07, 'epoch': 1.72} {'loss': 0.4374, 'learning_rate': 9.5650192379806e-07, 'epoch': 1.72} {'loss': 0.5882, 'learning_rate': 9.563622176230125e-07, 'epoch': 1.72} {'loss': 0.4877, 'learning_rate': 9.562225211390431e-07, 'epoch': 1.72} {'loss': 0.5332, 'learning_rate': 9.560828343462946e-07, 'epoch': 1.72} {'loss': 0.6429, 'learning_rate': 9.559431572449206e-07, 'epoch': 1.72} {'loss': 0.4768, 'learning_rate': 9.55803489835072e-07, 'epoch': 1.72} {'loss': 0.4351, 'learning_rate': 9.556638321168921e-07, 'epoch': 1.72} {'loss': 0.5464, 'learning_rate': 9.555241840905384e-07, 'epoch': 1.72} {'loss': 0.4984, 'learning_rate': 9.553845457561528e-07, 'epoch': 1.72} {'loss': 0.5368, 'learning_rate': 9.552449171138933e-07, 'epoch': 1.72} {'loss': 0.6373, 'learning_rate': 9.551052981639031e-07, 'epoch': 1.72} {'loss': 0.5289, 'learning_rate': 9.549656889063342e-07, 'epoch': 1.72} {'loss': 0.3813, 'learning_rate': 9.548260893413374e-07, 'epoch': 1.72} {'loss': 0.2824, 'learning_rate': 9.546864994690574e-07, 'epoch': 1.72} {'loss': 0.56, 'learning_rate': 9.545469192896505e-07, 'epoch': 1.72} {'loss': 0.357, 'learning_rate': 9.5440734880326e-07, 'epoch': 1.72} {'loss': 0.6335, 'learning_rate': 9.542677880100415e-07, 'epoch': 1.72} {'loss': 0.5253, 'learning_rate': 9.541282369101401e-07, 'epoch': 1.72} {'loss': 0.5876, 'learning_rate': 9.53988695503707e-07, 'epoch': 1.72} {'loss': 0.3994, 'learning_rate': 9.53849163790892e-07, 'epoch': 1.72} {'loss': 0.517, 'learning_rate': 9.537096417718416e-07, 'epoch': 1.72} {'loss': 0.4244, 'learning_rate': 9.535701294467114e-07, 'epoch': 1.72} {'loss': 0.5862, 'learning_rate': 9.534306268156435e-07, 'epoch': 1.72} {'loss': 0.6621, 'learning_rate': 9.532911338787942e-07, 'epoch': 1.72} {'loss': 0.3906, 'learning_rate': 9.531516506363081e-07, 'epoch': 1.72} {'loss': 0.6544, 'learning_rate': 9.530121770883371e-07, 'epoch': 1.72} {'loss': 0.629, 'learning_rate': 9.528727132350324e-07, 'epoch': 1.72} {'loss': 0.5559, 'learning_rate': 9.52733259076537e-07, 'epoch': 1.72} {'loss': 0.7656, 'learning_rate': 9.525938146130076e-07, 'epoch': 1.72} {'loss': 0.4872, 'learning_rate': 9.524543798445873e-07, 'epoch': 1.72} {'loss': 0.4197, 'learning_rate': 9.523149547714327e-07, 'epoch': 1.72} {'loss': 0.394, 'learning_rate': 9.521755393936871e-07, 'epoch': 1.72} {'loss': 0.5607, 'learning_rate': 9.520361337115025e-07, 'epoch': 1.72} {'loss': 0.3742, 'learning_rate': 9.518967377250288e-07, 'epoch': 1.72} {'loss': 0.47, 'learning_rate': 9.517573514344113e-07, 'epoch': 1.72} {'loss': 0.3845, 'learning_rate': 9.516179748398057e-07, 'epoch': 1.72} {'loss': 0.5179, 'learning_rate': 9.514786079413562e-07, 'epoch': 1.72} {'loss': 0.4972, 'learning_rate': 9.513392507392149e-07, 'epoch': 1.72} {'loss': 0.5254, 'learning_rate': 9.511999032335295e-07, 'epoch': 1.72} {'loss': 0.4384, 'learning_rate': 9.510605654244498e-07, 'epoch': 1.72} {'loss': 0.5717, 'learning_rate': 9.50921237312128e-07, 'epoch': 1.72} {'loss': 0.3707, 'learning_rate': 9.507819188967071e-07, 'epoch': 1.72} {'loss': 0.4758, 'learning_rate': 9.506426101783439e-07, 'epoch': 1.72} {'loss': 0.6169, 'learning_rate': 9.505033111571816e-07, 'epoch': 1.72} {'loss': 0.5397, 'learning_rate': 9.503640218333721e-07, 'epoch': 1.72} {'loss': 0.4711, 'learning_rate': 9.502247422070643e-07, 'epoch': 1.72} {'loss': 0.4615, 'learning_rate': 9.50085472278407e-07, 'epoch': 1.72} {'loss': 0.4072, 'learning_rate': 9.499462120475522e-07, 'epoch': 1.72} {'loss': 0.494, 'learning_rate': 9.498069615146433e-07, 'epoch': 1.72} {'loss': 0.5217, 'learning_rate': 9.496677206798366e-07, 'epoch': 1.72} {'loss': 0.5875, 'learning_rate': 9.495284895432755e-07, 'epoch': 1.72} {'loss': 0.5191, 'learning_rate': 9.49389268105112e-07, 'epoch': 1.72} {'loss': 0.5154, 'learning_rate': 9.49250056365495e-07, 'epoch': 1.72} {'loss': 0.6906, 'learning_rate': 9.491108543245731e-07, 'epoch': 1.72} {'loss': 0.4056, 'learning_rate': 9.489716619824974e-07, 'epoch': 1.72} {'loss': 0.7054, 'learning_rate': 9.488324793394144e-07, 'epoch': 1.72} {'loss': 0.4244, 'learning_rate': 9.48693306395474e-07, 'epoch': 1.72} {'loss': 0.5595, 'learning_rate': 9.485541431508249e-07, 'epoch': 1.72} {'loss': 0.4747, 'learning_rate': 9.484149896056172e-07, 'epoch': 1.72} {'loss': 0.4593, 'learning_rate': 9.482758457600006e-07, 'epoch': 1.72} {'loss': 0.3887, 'learning_rate': 9.481367116141227e-07, 'epoch': 1.72} {'loss': 0.718, 'learning_rate': 9.479975871681357e-07, 'epoch': 1.72} {'loss': 0.538, 'learning_rate': 9.47858472422184e-07, 'epoch': 1.72} {'loss': 0.6524, 'learning_rate': 9.477193673764185e-07, 'epoch': 1.72} {'loss': 0.4985, 'learning_rate': 9.475802720309901e-07, 'epoch': 1.72} {'loss': 0.5653, 'learning_rate': 9.474411863860456e-07, 'epoch': 1.72} {'loss': 0.5814, 'learning_rate': 9.473021104417346e-07, 'epoch': 1.72} {'loss': 0.5013, 'learning_rate': 9.471630441982072e-07, 'epoch': 1.72} {'loss': 0.3623, 'learning_rate': 9.470239876556131e-07, 'epoch': 1.72} {'loss': 0.5012, 'learning_rate': 9.468849408140979e-07, 'epoch': 1.72} {'loss': 0.537, 'learning_rate': 9.467459036738124e-07, 'epoch': 1.72} {'loss': 0.5964, 'learning_rate': 9.466068762349057e-07, 'epoch': 1.72} {'loss': 0.5414, 'learning_rate': 9.464678584975273e-07, 'epoch': 1.72} {'loss': 0.5341, 'learning_rate': 9.463288504618284e-07, 'epoch': 1.72} {'loss': 0.6745, 'learning_rate': 9.461898521279522e-07, 'epoch': 1.72} {'loss': 0.4001, 'learning_rate': 9.460508634960507e-07, 'epoch': 1.72} {'loss': 0.6858, 'learning_rate': 9.459118845662741e-07, 'epoch': 1.72} {'loss': 0.4051, 'learning_rate': 9.457729153387685e-07, 'epoch': 1.72} {'loss': 0.5665, 'learning_rate': 9.456339558136851e-07, 'epoch': 1.72} {'loss': 0.5876, 'learning_rate': 9.454950059911727e-07, 'epoch': 1.72} {'loss': 0.4512, 'learning_rate': 9.453560658713812e-07, 'epoch': 1.72} {'loss': 0.4319, 'learning_rate': 9.452171354544549e-07, 'epoch': 1.72} {'loss': 0.4575, 'learning_rate': 9.450782147405468e-07, 'epoch': 1.72} {'loss': 0.4482, 'learning_rate': 9.449393037298049e-07, 'epoch': 1.72} {'loss': 0.6214, 'learning_rate': 9.448004024223767e-07, 'epoch': 1.72} {'loss': 0.3292, 'learning_rate': 9.446615108184131e-07, 'epoch': 1.72} {'loss': 0.6085, 'learning_rate': 9.44522628918062e-07, 'epoch': 1.72} {'loss': 0.4902, 'learning_rate': 9.443837567214731e-07, 'epoch': 1.72} {'loss': 0.589, 'learning_rate': 9.442448942287941e-07, 'epoch': 1.72} {'loss': 0.5501, 'learning_rate': 9.441060414401726e-07, 'epoch': 1.72} {'loss': 0.4306, 'learning_rate': 9.439671983557597e-07, 'epoch': 1.72} {'loss': 0.5247, 'learning_rate': 9.438283649757019e-07, 'epoch': 1.72} {'loss': 0.6639, 'learning_rate': 9.436895413001512e-07, 'epoch': 1.72} {'loss': 0.544, 'learning_rate': 9.435507273292554e-07, 'epoch': 1.72} {'loss': 0.649, 'learning_rate': 9.4341192306316e-07, 'epoch': 1.72} {'loss': 0.4728, 'learning_rate': 9.432731285020169e-07, 'epoch': 1.72} {'loss': 0.5285, 'learning_rate': 9.431343436459739e-07, 'epoch': 1.72} {'loss': 0.464, 'learning_rate': 9.429955684951808e-07, 'epoch': 1.72} {'loss': 0.5825, 'learning_rate': 9.428568030497843e-07, 'epoch': 1.72} {'loss': 0.4606, 'learning_rate': 9.42718047309934e-07, 'epoch': 1.72} {'loss': 0.3947, 'learning_rate': 9.425793012757811e-07, 'epoch': 1.72} {'loss': 0.5163, 'learning_rate': 9.424405649474711e-07, 'epoch': 1.72} {'loss': 0.4901, 'learning_rate': 9.423018383251514e-07, 'epoch': 1.72} {'loss': 0.5463, 'learning_rate': 9.421631214089744e-07, 'epoch': 1.72} {'loss': 0.2989, 'learning_rate': 9.420244141990864e-07, 'epoch': 1.72} {'loss': 0.5866, 'learning_rate': 9.418857166956397e-07, 'epoch': 1.72} {'loss': 0.4768, 'learning_rate': 9.417470288987752e-07, 'epoch': 1.72} {'loss': 0.4367, 'learning_rate': 9.416083508086504e-07, 'epoch': 1.72} {'loss': 0.5715, 'learning_rate': 9.414696824254077e-07, 'epoch': 1.72} {'loss': 0.5517, 'learning_rate': 9.41331023749198e-07, 'epoch': 1.72} {'loss': 0.5358, 'learning_rate': 9.411923747801699e-07, 'epoch': 1.72} {'loss': 0.5787, 'learning_rate': 9.410537355184713e-07, 'epoch': 1.72} {'loss': 0.5218, 'learning_rate': 9.409151059642529e-07, 'epoch': 1.72} {'loss': 0.5678, 'learning_rate': 9.407764861176583e-07, 'epoch': 1.72} {'loss': 0.4188, 'learning_rate': 9.406378759788437e-07, 'epoch': 1.72} {'loss': 0.4942, 'learning_rate': 9.404992755479503e-07, 'epoch': 1.72} {'loss': 0.4105, 'learning_rate': 9.403606848251301e-07, 'epoch': 1.72} {'loss': 0.4343, 'learning_rate': 9.402221038105319e-07, 'epoch': 1.72} {'loss': 0.6296, 'learning_rate': 9.400835325043023e-07, 'epoch': 1.72} {'loss': 0.4372, 'learning_rate': 9.399449709065933e-07, 'epoch': 1.72} {'loss': 0.4744, 'learning_rate': 9.398064190175471e-07, 'epoch': 1.72} {'loss': 0.5858, 'learning_rate': 9.396678768373191e-07, 'epoch': 1.72} {'loss': 0.4928, 'learning_rate': 9.395293443660535e-07, 'epoch': 1.72} {'loss': 0.4378, 'learning_rate': 9.393908216039005e-07, 'epoch': 1.72} {'loss': 0.533, 'learning_rate': 9.392523085510097e-07, 'epoch': 1.72} {'loss': 0.4308, 'learning_rate': 9.391138052075233e-07, 'epoch': 1.72} {'loss': 0.5566, 'learning_rate': 9.389753115735989e-07, 'epoch': 1.72} {'loss': 0.4953, 'learning_rate': 9.388368276493754e-07, 'epoch': 1.72} {'loss': 0.5003, 'learning_rate': 9.386983534350102e-07, 'epoch': 1.72} {'loss': 0.287, 'learning_rate': 9.385598889306458e-07, 'epoch': 1.72} {'loss': 0.6186, 'learning_rate': 9.384214341364328e-07, 'epoch': 1.72} {'loss': 0.4538, 'learning_rate': 9.382829890525203e-07, 'epoch': 1.72} {'loss': 0.2881, 'learning_rate': 9.381445536790523e-07, 'epoch': 1.72} {'loss': 0.4946, 'learning_rate': 9.380061280161834e-07, 'epoch': 1.72} {'loss': 0.5133, 'learning_rate': 9.378677120640556e-07, 'epoch': 1.72} {'loss': 0.4299, 'learning_rate': 9.377293058228243e-07, 'epoch': 1.72} {'loss': 0.5859, 'learning_rate': 9.375909092926317e-07, 'epoch': 1.72} {'loss': 0.4676, 'learning_rate': 9.374525224736286e-07, 'epoch': 1.72} {'loss': 0.5564, 'learning_rate': 9.373141453659651e-07, 'epoch': 1.72} {'loss': 0.5577, 'learning_rate': 9.371757779697832e-07, 'epoch': 1.72} {'loss': 0.432, 'learning_rate': 9.370374202852395e-07, 'epoch': 1.72} {'loss': 0.4207, 'learning_rate': 9.36899072312476e-07, 'epoch': 1.72} {'loss': 0.5382, 'learning_rate': 9.367607340516439e-07, 'epoch': 1.72} {'loss': 0.4806, 'learning_rate': 9.366224055028905e-07, 'epoch': 1.72} {'loss': 0.487, 'learning_rate': 9.364840866663638e-07, 'epoch': 1.72} {'loss': 0.458, 'learning_rate': 9.363457775422136e-07, 'epoch': 1.72} {'loss': 0.603, 'learning_rate': 9.36207478130584e-07, 'epoch': 1.72} {'loss': 0.3148, 'learning_rate': 9.360691884316297e-07, 'epoch': 1.72} {'loss': 0.5877, 'learning_rate': 9.359309084454937e-07, 'epoch': 1.72} {'loss': 0.5385, 'learning_rate': 9.357926381723259e-07, 'epoch': 1.72} {'loss': 0.5621, 'learning_rate': 9.356543776122751e-07, 'epoch': 1.72} {'loss': 0.4903, 'learning_rate': 9.355161267654877e-07, 'epoch': 1.72} {'loss': 0.6574, 'learning_rate': 9.35377885632115e-07, 'epoch': 1.72} {'loss': 0.5825, 'learning_rate': 9.352396542122988e-07, 'epoch': 1.72} {'loss': 0.5496, 'learning_rate': 9.351014325061957e-07, 'epoch': 1.72} {'loss': 0.4967, 'learning_rate': 9.349632205139481e-07, 'epoch': 1.72} {'loss': 0.5199, 'learning_rate': 9.348250182357043e-07, 'epoch': 1.72} {'loss': 0.486, 'learning_rate': 9.346868256716169e-07, 'epoch': 1.72} {'loss': 0.5274, 'learning_rate': 9.345486428218265e-07, 'epoch': 1.72} {'loss': 0.3944, 'learning_rate': 9.344104696864886e-07, 'epoch': 1.72} {'loss': 0.6062, 'learning_rate': 9.342723062657455e-07, 'epoch': 1.72} {'loss': 0.4578, 'learning_rate': 9.341341525597503e-07, 'epoch': 1.72} {'loss': 0.491, 'learning_rate': 9.339960085686484e-07, 'epoch': 1.72} {'loss': 0.5966, 'learning_rate': 9.338578742925863e-07, 'epoch': 1.72} {'loss': 0.4969, 'learning_rate': 9.337197497317163e-07, 'epoch': 1.72} {'loss': 0.5441, 'learning_rate': 9.335816348861804e-07, 'epoch': 1.72} {'loss': 0.508, 'learning_rate': 9.33443529756134e-07, 'epoch': 1.72} {'loss': 0.5623, 'learning_rate': 9.33305434341717e-07, 'epoch': 1.72} {'loss': 0.5568, 'learning_rate': 9.331673486430848e-07, 'epoch': 1.72} {'loss': 0.4589, 'learning_rate': 9.330292726603818e-07, 'epoch': 1.72} {'loss': 0.6389, 'learning_rate': 9.328912063937546e-07, 'epoch': 1.72} {'loss': 0.5826, 'learning_rate': 9.327531498433551e-07, 'epoch': 1.72} {'loss': 0.5539, 'learning_rate': 9.326151030093255e-07, 'epoch': 1.72} {'loss': 0.5408, 'learning_rate': 9.324770658918214e-07, 'epoch': 1.72} {'loss': 0.3416, 'learning_rate': 9.323390384909825e-07, 'epoch': 1.72} {'loss': 0.4435, 'learning_rate': 9.322010208069643e-07, 'epoch': 1.72} {'loss': 0.4529, 'learning_rate': 9.320630128399089e-07, 'epoch': 1.72} {'loss': 0.4332, 'learning_rate': 9.319250145899672e-07, 'epoch': 1.72} {'loss': 0.5837, 'learning_rate': 9.31787026057287e-07, 'epoch': 1.72} {'loss': 0.521, 'learning_rate': 9.316490472420125e-07, 'epoch': 1.72} {'loss': 0.5808, 'learning_rate': 9.315110781442982e-07, 'epoch': 1.72} {'loss': 0.4724, 'learning_rate': 9.313731187642871e-07, 'epoch': 1.72} {'loss': 0.4557, 'learning_rate': 9.31235169102127e-07, 'epoch': 1.72} {'loss': 0.4191, 'learning_rate': 9.310972291579678e-07, 'epoch': 1.72} {'loss': 0.359, 'learning_rate': 9.309592989319561e-07, 'epoch': 1.72} {'loss': 0.3854, 'learning_rate': 9.308213784242415e-07, 'epoch': 1.72} {'loss': 0.4603, 'learning_rate': 9.306834676349674e-07, 'epoch': 1.72} {'loss': 0.5592, 'learning_rate': 9.305455665642882e-07, 'epoch': 1.72} {'loss': 0.46, 'learning_rate': 9.304076752123447e-07, 'epoch': 1.72} {'loss': 0.5946, 'learning_rate': 9.302697935792892e-07, 'epoch': 1.72} {'loss': 0.5981, 'learning_rate': 9.301319216652682e-07, 'epoch': 1.72} {'loss': 0.495, 'learning_rate': 9.299940594704293e-07, 'epoch': 1.72} {'loss': 0.4883, 'learning_rate': 9.298562069949224e-07, 'epoch': 1.72} {'loss': 0.4875, 'learning_rate': 9.297183642388907e-07, 'epoch': 1.72} {'loss': 0.4964, 'learning_rate': 9.295805312024853e-07, 'epoch': 1.72} {'loss': 0.6476, 'learning_rate': 9.294427078858525e-07, 'epoch': 1.72} {'loss': 0.4209, 'learning_rate': 9.293048942891403e-07, 'epoch': 1.72} {'loss': 0.4244, 'learning_rate': 9.291670904124972e-07, 'epoch': 1.72} {'loss': 0.3856, 'learning_rate': 9.290292962560699e-07, 'epoch': 1.72} {'loss': 0.6104, 'learning_rate': 9.288915118200082e-07, 'epoch': 1.72} {'loss': 0.5468, 'learning_rate': 9.287537371044564e-07, 'epoch': 1.72} {'loss': 0.5599, 'learning_rate': 9.286159721095633e-07, 'epoch': 1.72} {'loss': 0.4496, 'learning_rate': 9.284782168354778e-07, 'epoch': 1.72} {'loss': 0.5322, 'learning_rate': 9.283404712823451e-07, 'epoch': 1.72} {'loss': 0.4653, 'learning_rate': 9.282027354503154e-07, 'epoch': 1.72} {'loss': 0.4397, 'learning_rate': 9.28065009339536e-07, 'epoch': 1.72} {'loss': 0.3648, 'learning_rate': 9.279272929501548e-07, 'epoch': 1.72} {'loss': 0.5994, 'learning_rate': 9.27789586282316e-07, 'epoch': 1.72} {'loss': 0.5083, 'learning_rate': 9.276518893361697e-07, 'epoch': 1.72} {'loss': 0.4566, 'learning_rate': 9.275142021118633e-07, 'epoch': 1.72} {'loss': 0.643, 'learning_rate': 9.273765246095446e-07, 'epoch': 1.72} {'loss': 0.5953, 'learning_rate': 9.272388568293599e-07, 'epoch': 1.72} {'loss': 0.39, 'learning_rate': 9.271011987714607e-07, 'epoch': 1.72} {'loss': 0.5432, 'learning_rate': 9.269635504359886e-07, 'epoch': 1.72} {'loss': 0.6363, 'learning_rate': 9.268259118230949e-07, 'epoch': 1.72} {'loss': 0.5501, 'learning_rate': 9.266882829329249e-07, 'epoch': 1.72} {'loss': 0.4536, 'learning_rate': 9.265506637656285e-07, 'epoch': 1.72} {'loss': 0.4728, 'learning_rate': 9.264130543213512e-07, 'epoch': 1.72} {'loss': 0.6296, 'learning_rate': 9.262754546002417e-07, 'epoch': 1.72} {'loss': 0.4507, 'learning_rate': 9.261378646024488e-07, 'epoch': 1.72} {'loss': 0.5492, 'learning_rate': 9.260002843281168e-07, 'epoch': 1.72} {'loss': 0.4214, 'learning_rate': 9.258627137773934e-07, 'epoch': 1.72} {'loss': 0.522, 'learning_rate': 9.257251529504275e-07, 'epoch': 1.72} {'loss': 0.4544, 'learning_rate': 9.255876018473664e-07, 'epoch': 1.72} {'loss': 0.4824, 'learning_rate': 9.25450060468357e-07, 'epoch': 1.72} {'loss': 0.4421, 'learning_rate': 9.25312528813549e-07, 'epoch': 1.72} {'loss': 0.4646, 'learning_rate': 9.251750068830855e-07, 'epoch': 1.72} {'loss': 0.5142, 'learning_rate': 9.250374946771157e-07, 'epoch': 1.72} {'loss': 0.4489, 'learning_rate': 9.24899992195788e-07, 'epoch': 1.72} {'loss': 0.5366, 'learning_rate': 9.24762499439249e-07, 'epoch': 1.72} {'loss': 0.4105, 'learning_rate': 9.246250164076453e-07, 'epoch': 1.72} {'loss': 0.5295, 'learning_rate': 9.24487543101128e-07, 'epoch': 1.72} {'loss': 0.5557, 'learning_rate': 9.24350079519838e-07, 'epoch': 1.72} {'loss': 0.5754, 'learning_rate': 9.242126256639272e-07, 'epoch': 1.73} {'loss': 0.5159, 'learning_rate': 9.240751815335413e-07, 'epoch': 1.73} {'loss': 0.393, 'learning_rate': 9.23937747128828e-07, 'epoch': 1.73} {'loss': 0.4739, 'learning_rate': 9.238003224499347e-07, 'epoch': 1.73} {'loss': 0.3722, 'learning_rate': 9.236629074970094e-07, 'epoch': 1.73} {'loss': 0.4699, 'learning_rate': 9.235255022701995e-07, 'epoch': 1.73} {'loss': 0.5224, 'learning_rate': 9.233881067696493e-07, 'epoch': 1.73} {'loss': 0.5895, 'learning_rate': 9.232507209955077e-07, 'epoch': 1.73} {'loss': 0.5684, 'learning_rate': 9.231133449479224e-07, 'epoch': 1.73} {'loss': 0.4937, 'learning_rate': 9.229759786270409e-07, 'epoch': 1.73} {'loss': 0.6766, 'learning_rate': 9.228386220330088e-07, 'epoch': 1.73} {'loss': 0.4283, 'learning_rate': 9.227012751659748e-07, 'epoch': 1.73} {'loss': 0.5899, 'learning_rate': 9.225639380260886e-07, 'epoch': 1.73} {'loss': 0.6179, 'learning_rate': 9.224266106134916e-07, 'epoch': 1.73} {'loss': 0.6017, 'learning_rate': 9.222892929283333e-07, 'epoch': 1.73} {'loss': 0.5621, 'learning_rate': 9.221519849707628e-07, 'epoch': 1.73} {'loss': 0.5735, 'learning_rate': 9.220146867409241e-07, 'epoch': 1.73} {'loss': 0.4642, 'learning_rate': 9.218773982389695e-07, 'epoch': 1.73} {'loss': 0.5076, 'learning_rate': 9.217401194650378e-07, 'epoch': 1.73} {'loss': 0.7278, 'learning_rate': 9.216028504192853e-07, 'epoch': 1.73} {'loss': 0.4803, 'learning_rate': 9.214655911018522e-07, 'epoch': 1.73} {'loss': 0.4461, 'learning_rate': 9.213283415128882e-07, 'epoch': 1.73} {'loss': 0.5351, 'learning_rate': 9.21191101652541e-07, 'epoch': 1.73} {'loss': 0.594, 'learning_rate': 9.210538715209561e-07, 'epoch': 1.73} {'loss': 0.5711, 'learning_rate': 9.209166511182832e-07, 'epoch': 1.73} {'loss': 0.479, 'learning_rate': 9.207794404446647e-07, 'epoch': 1.73} {'loss': 0.4581, 'learning_rate': 9.206422395002535e-07, 'epoch': 1.73} {'loss': 0.4401, 'learning_rate': 9.205050482851919e-07, 'epoch': 1.73} {'loss': 0.3886, 'learning_rate': 9.203678667996286e-07, 'epoch': 1.73} {'loss': 0.4584, 'learning_rate': 9.202306950437112e-07, 'epoch': 1.73} {'loss': 0.3938, 'learning_rate': 9.200935330175853e-07, 'epoch': 1.73} {'loss': 0.5621, 'learning_rate': 9.199563807214007e-07, 'epoch': 1.73} {'loss': 0.4217, 'learning_rate': 9.198192381552995e-07, 'epoch': 1.73} {'loss': 0.4218, 'learning_rate': 9.196821053194338e-07, 'epoch': 1.73} {'loss': 0.5281, 'learning_rate': 9.19544982213948e-07, 'epoch': 1.73} {'loss': 0.4727, 'learning_rate': 9.194078688389885e-07, 'epoch': 1.73} {'loss': 0.5549, 'learning_rate': 9.192707651947041e-07, 'epoch': 1.73} {'loss': 0.4934, 'learning_rate': 9.191336712812382e-07, 'epoch': 1.73} {'loss': 0.5538, 'learning_rate': 9.189965870987428e-07, 'epoch': 1.73} {'loss': 0.4501, 'learning_rate': 9.188595126473598e-07, 'epoch': 1.73} {'loss': 0.5428, 'learning_rate': 9.187224479272417e-07, 'epoch': 1.73} {'loss': 0.5713, 'learning_rate': 9.185853929385291e-07, 'epoch': 1.73} {'loss': 0.6209, 'learning_rate': 9.184483476813732e-07, 'epoch': 1.73} {'loss': 0.532, 'learning_rate': 9.183113121559206e-07, 'epoch': 1.73} {'loss': 0.584, 'learning_rate': 9.181742863623144e-07, 'epoch': 1.73} {'loss': 0.4584, 'learning_rate': 9.180372703007068e-07, 'epoch': 1.73} {'loss': 0.5093, 'learning_rate': 9.179002639712386e-07, 'epoch': 1.73} {'loss': 0.5614, 'learning_rate': 9.177632673740644e-07, 'epoch': 1.73} {'loss': 0.5851, 'learning_rate': 9.176262805093239e-07, 'epoch': 1.73} {'loss': 0.548, 'learning_rate': 9.17489303377167e-07, 'epoch': 1.73} {'loss': 0.6139, 'learning_rate': 9.173523359777415e-07, 'epoch': 1.73} {'loss': 0.6359, 'learning_rate': 9.172153783111893e-07, 'epoch': 1.73} {'loss': 0.2872, 'learning_rate': 9.170784303776648e-07, 'epoch': 1.73} {'loss': 0.555, 'learning_rate': 9.169414921773056e-07, 'epoch': 1.73} {'loss': 0.4133, 'learning_rate': 9.168045637102685e-07, 'epoch': 1.73} {'loss': 0.65, 'learning_rate': 9.16667644976692e-07, 'epoch': 1.73} {'loss': 0.5313, 'learning_rate': 9.165307359767261e-07, 'epoch': 1.73} {'loss': 0.5286, 'learning_rate': 9.163938367105196e-07, 'epoch': 1.73} {'loss': 0.579, 'learning_rate': 9.162569471782134e-07, 'epoch': 1.73} {'loss': 0.4154, 'learning_rate': 9.16120067379962e-07, 'epoch': 1.73} {'loss': 0.4109, 'learning_rate': 9.159831973159028e-07, 'epoch': 1.73} {'loss': 0.4033, 'learning_rate': 9.158463369861926e-07, 'epoch': 1.73} {'loss': 0.5591, 'learning_rate': 9.1570948639097e-07, 'epoch': 1.73} {'loss': 0.525, 'learning_rate': 9.155726455303849e-07, 'epoch': 1.73} {'loss': 0.4218, 'learning_rate': 9.154358144045849e-07, 'epoch': 1.73} {'loss': 0.4415, 'learning_rate': 9.152989930137124e-07, 'epoch': 1.73} {'loss': 0.3258, 'learning_rate': 9.151621813579203e-07, 'epoch': 1.73} {'loss': 0.5551, 'learning_rate': 9.150253794373509e-07, 'epoch': 1.73} {'loss': 0.5943, 'learning_rate': 9.148885872521507e-07, 'epoch': 1.73} {'loss': 0.4733, 'learning_rate': 9.147518048024684e-07, 'epoch': 1.73} {'loss': 0.5605, 'learning_rate': 9.146150320884483e-07, 'epoch': 1.73} {'loss': 0.6176, 'learning_rate': 9.144782691102405e-07, 'epoch': 1.73} {'loss': 0.6038, 'learning_rate': 9.143415158679858e-07, 'epoch': 1.73} {'loss': 0.5232, 'learning_rate': 9.142047723618375e-07, 'epoch': 1.73} {'loss': 0.4762, 'learning_rate': 9.140680385919376e-07, 'epoch': 1.73} {'loss': 0.5188, 'learning_rate': 9.139313145584338e-07, 'epoch': 1.73} {'loss': 0.4904, 'learning_rate': 9.137946002614717e-07, 'epoch': 1.73} {'loss': 0.474, 'learning_rate': 9.136578957011999e-07, 'epoch': 1.73} {'loss': 0.5366, 'learning_rate': 9.135212008777649e-07, 'epoch': 1.73} {'loss': 0.5313, 'learning_rate': 9.13384515791309e-07, 'epoch': 1.73} {'loss': 0.5016, 'learning_rate': 9.132478404419853e-07, 'epoch': 1.73} {'loss': 0.5216, 'learning_rate': 9.131111748299338e-07, 'epoch': 1.73} {'loss': 0.5894, 'learning_rate': 9.129745189553052e-07, 'epoch': 1.73} {'loss': 0.5842, 'learning_rate': 9.128378728182452e-07, 'epoch': 1.73} {'loss': 0.4909, 'learning_rate': 9.12701236418897e-07, 'epoch': 1.73} {'loss': 0.5828, 'learning_rate': 9.125646097574125e-07, 'epoch': 1.73} {'loss': 0.3993, 'learning_rate': 9.124279928339342e-07, 'epoch': 1.73} {'loss': 0.4558, 'learning_rate': 9.122913856486082e-07, 'epoch': 1.73} {'loss': 0.4585, 'learning_rate': 9.121547882015835e-07, 'epoch': 1.73} {'loss': 0.502, 'learning_rate': 9.120182004930045e-07, 'epoch': 1.73} {'loss': 0.4352, 'learning_rate': 9.118816225230198e-07, 'epoch': 1.73} {'loss': 0.6076, 'learning_rate': 9.117450542917705e-07, 'epoch': 1.73} {'loss': 0.5165, 'learning_rate': 9.116084957994109e-07, 'epoch': 1.73} {'loss': 0.6238, 'learning_rate': 9.114719470460809e-07, 'epoch': 1.73} {'loss': 0.4022, 'learning_rate': 9.113354080319292e-07, 'epoch': 1.73} {'loss': 0.4055, 'learning_rate': 9.111988787571024e-07, 'epoch': 1.73} {'loss': 0.5513, 'learning_rate': 9.11062359221746e-07, 'epoch': 1.73} {'loss': 0.5592, 'learning_rate': 9.109258494260076e-07, 'epoch': 1.73} {'loss': 0.4777, 'learning_rate': 9.107893493700292e-07, 'epoch': 1.73} {'loss': 0.4156, 'learning_rate': 9.106528590539654e-07, 'epoch': 1.73} {'loss': 0.5462, 'learning_rate': 9.105163784779536e-07, 'epoch': 1.73} {'loss': 0.5285, 'learning_rate': 9.10379907642145e-07, 'epoch': 1.73} {'loss': 0.4821, 'learning_rate': 9.102434465466847e-07, 'epoch': 1.73} {'loss': 0.4767, 'learning_rate': 9.101069951917185e-07, 'epoch': 1.73} {'loss': 0.7431, 'learning_rate': 9.09970553577395e-07, 'epoch': 1.73} {'loss': 0.4073, 'learning_rate': 9.098341217038575e-07, 'epoch': 1.73} {'loss': 0.5503, 'learning_rate': 9.096976995712514e-07, 'epoch': 1.73} {'loss': 0.4239, 'learning_rate': 9.095612871797265e-07, 'epoch': 1.73} {'loss': 0.7044, 'learning_rate': 9.094248845294263e-07, 'epoch': 1.73} {'loss': 0.3483, 'learning_rate': 9.09288491620498e-07, 'epoch': 1.73} {'loss': 0.5011, 'learning_rate': 9.091521084530874e-07, 'epoch': 1.73} {'loss': 0.5077, 'learning_rate': 9.090157350273421e-07, 'epoch': 1.73} {'loss': 0.6592, 'learning_rate': 9.088793713434063e-07, 'epoch': 1.73} {'loss': 0.4368, 'learning_rate': 9.087430174014256e-07, 'epoch': 1.73} {'loss': 0.5149, 'learning_rate': 9.086066732015486e-07, 'epoch': 1.73} {'loss': 0.5184, 'learning_rate': 9.084703387439187e-07, 'epoch': 1.73} {'loss': 0.4863, 'learning_rate': 9.083340140286844e-07, 'epoch': 1.73} {'loss': 0.4839, 'learning_rate': 9.081976990559904e-07, 'epoch': 1.73} {'loss': 0.5779, 'learning_rate': 9.080613938259852e-07, 'epoch': 1.73} {'loss': 0.4589, 'learning_rate': 9.079250983388111e-07, 'epoch': 1.73} {'loss': 0.4357, 'learning_rate': 9.077888125946155e-07, 'epoch': 1.73} {'loss': 0.6223, 'learning_rate': 9.07652536593544e-07, 'epoch': 1.73} {'loss': 0.6184, 'learning_rate': 9.075162703357443e-07, 'epoch': 1.73} {'loss': 0.4573, 'learning_rate': 9.073800138213617e-07, 'epoch': 1.73} {'loss': 0.5543, 'learning_rate': 9.072437670505441e-07, 'epoch': 1.73} {'loss': 0.4896, 'learning_rate': 9.071075300234333e-07, 'epoch': 1.73} {'loss': 0.4854, 'learning_rate': 9.069713027401772e-07, 'epoch': 1.73} {'loss': 0.5123, 'learning_rate': 9.068350852009222e-07, 'epoch': 1.73} {'loss': 0.5122, 'learning_rate': 9.06698877405815e-07, 'epoch': 1.73} {'loss': 0.536, 'learning_rate': 9.065626793549997e-07, 'epoch': 1.73} {'loss': 0.4494, 'learning_rate': 9.064264910486232e-07, 'epoch': 1.73} {'loss': 0.4605, 'learning_rate': 9.062903124868339e-07, 'epoch': 1.73} {'loss': 0.6077, 'learning_rate': 9.06154143669773e-07, 'epoch': 1.73} {'loss': 0.5661, 'learning_rate': 9.060179845975892e-07, 'epoch': 1.73} {'loss': 0.657, 'learning_rate': 9.058818352704269e-07, 'epoch': 1.73} {'loss': 0.67, 'learning_rate': 9.057456956884337e-07, 'epoch': 1.73} {'loss': 0.557, 'learning_rate': 9.056095658517572e-07, 'epoch': 1.73} {'loss': 0.5408, 'learning_rate': 9.054734457605363e-07, 'epoch': 1.73} {'loss': 0.4799, 'learning_rate': 9.053373354149253e-07, 'epoch': 1.73} {'loss': 0.5538, 'learning_rate': 9.052012348150641e-07, 'epoch': 1.73} {'loss': 0.5564, 'learning_rate': 9.050651439611014e-07, 'epoch': 1.73} {'loss': 0.517, 'learning_rate': 9.049290628531815e-07, 'epoch': 1.73} {'loss': 0.4803, 'learning_rate': 9.047929914914522e-07, 'epoch': 1.73} {'loss': 0.4167, 'learning_rate': 9.046569298760588e-07, 'epoch': 1.73} {'loss': 0.5546, 'learning_rate': 9.045208780071424e-07, 'epoch': 1.73} {'loss': 0.4885, 'learning_rate': 9.043848358848572e-07, 'epoch': 1.73} {'loss': 0.5962, 'learning_rate': 9.042488035093433e-07, 'epoch': 1.73} {'loss': 0.4448, 'learning_rate': 9.04112780880747e-07, 'epoch': 1.73} {'loss': 0.6042, 'learning_rate': 9.03976767999214e-07, 'epoch': 1.73} {'loss': 0.6469, 'learning_rate': 9.038407648648917e-07, 'epoch': 1.73} {'loss': 0.305, 'learning_rate': 9.037047714779268e-07, 'epoch': 1.73} {'loss': 0.553, 'learning_rate': 9.035687878384624e-07, 'epoch': 1.73} {'loss': 0.506, 'learning_rate': 9.034328139466442e-07, 'epoch': 1.73} {'loss': 0.4839, 'learning_rate': 9.032968498026185e-07, 'epoch': 1.73} {'loss': 0.6215, 'learning_rate': 9.031608954065307e-07, 'epoch': 1.73} {'loss': 0.4717, 'learning_rate': 9.030249507585298e-07, 'epoch': 1.73} {'loss': 0.5527, 'learning_rate': 9.028890158587544e-07, 'epoch': 1.73} {'loss': 0.5106, 'learning_rate': 9.02753090707359e-07, 'epoch': 1.73} {'loss': 0.5135, 'learning_rate': 9.026171753044821e-07, 'epoch': 1.73} {'loss': 0.5279, 'learning_rate': 9.024812696502728e-07, 'epoch': 1.73} {'loss': 0.5859, 'learning_rate': 9.02345373744875e-07, 'epoch': 1.73} {'loss': 0.4879, 'learning_rate': 9.022094875884369e-07, 'epoch': 1.73} {'loss': 0.5732, 'learning_rate': 9.020736111811024e-07, 'epoch': 1.73} {'loss': 0.5805, 'learning_rate': 9.019377445230149e-07, 'epoch': 1.73} {'loss': 0.5527, 'learning_rate': 9.018018876143253e-07, 'epoch': 1.73} {'loss': 0.3855, 'learning_rate': 9.016660404551736e-07, 'epoch': 1.73} {'loss': 0.5111, 'learning_rate': 9.015302030457085e-07, 'epoch': 1.73} {'loss': 0.4032, 'learning_rate': 9.013943753860755e-07, 'epoch': 1.73} {'loss': 0.4812, 'learning_rate': 9.012585574764187e-07, 'epoch': 1.73} {'loss': 0.6598, 'learning_rate': 9.011227493168873e-07, 'epoch': 1.73} {'loss': 0.5733, 'learning_rate': 9.009869509076196e-07, 'epoch': 1.73} {'loss': 0.5103, 'learning_rate': 9.008511622487703e-07, 'epoch': 1.73} {'loss': 0.4127, 'learning_rate': 9.00715383340478e-07, 'epoch': 1.73} {'loss': 0.5999, 'learning_rate': 9.005796141828905e-07, 'epoch': 1.73} {'loss': 0.6345, 'learning_rate': 9.00443854776154e-07, 'epoch': 1.73} {'loss': 0.3462, 'learning_rate': 9.00308105120411e-07, 'epoch': 1.73} {'loss': 0.5175, 'learning_rate': 9.001723652158112e-07, 'epoch': 1.73} {'loss': 0.3491, 'learning_rate': 9.000366350624957e-07, 'epoch': 1.73} {'loss': 0.5805, 'learning_rate': 8.999009146606153e-07, 'epoch': 1.73} {'loss': 0.4748, 'learning_rate': 8.997652040103111e-07, 'epoch': 1.73} {'loss': 0.5975, 'learning_rate': 8.996295031117297e-07, 'epoch': 1.73} {'loss': 0.5433, 'learning_rate': 8.994938119650176e-07, 'epoch': 1.73} {'loss': 0.4712, 'learning_rate': 8.99358130570317e-07, 'epoch': 1.73} {'loss': 0.4668, 'learning_rate': 8.992224589277787e-07, 'epoch': 1.73} {'loss': 0.3901, 'learning_rate': 8.990867970375406e-07, 'epoch': 1.73} {'loss': 0.4512, 'learning_rate': 8.989511448997567e-07, 'epoch': 1.73} {'loss': 0.5819, 'learning_rate': 8.988155025145661e-07, 'epoch': 1.73} {'loss': 0.6094, 'learning_rate': 8.986798698821164e-07, 'epoch': 1.73} {'loss': 0.4079, 'learning_rate': 8.985442470025541e-07, 'epoch': 1.73} {'loss': 0.5747, 'learning_rate': 8.98408633876019e-07, 'epoch': 1.73} {'loss': 0.422, 'learning_rate': 8.982730305026655e-07, 'epoch': 1.73} {'loss': 0.468, 'learning_rate': 8.98137436882629e-07, 'epoch': 1.73} {'loss': 0.4541, 'learning_rate': 8.980018530160639e-07, 'epoch': 1.73} {'loss': 0.402, 'learning_rate': 8.978662789031089e-07, 'epoch': 1.73} {'loss': 0.4234, 'learning_rate': 8.977307145439129e-07, 'epoch': 1.73} {'loss': 0.538, 'learning_rate': 8.975951599386212e-07, 'epoch': 1.73} {'loss': 0.4156, 'learning_rate': 8.974596150873738e-07, 'epoch': 1.73} {'loss': 0.4905, 'learning_rate': 8.973240799903238e-07, 'epoch': 1.73} {'loss': 0.5067, 'learning_rate': 8.9718855464761e-07, 'epoch': 1.73} {'loss': 0.4209, 'learning_rate': 8.970530390593824e-07, 'epoch': 1.73} {'loss': 0.6151, 'learning_rate': 8.969175332257829e-07, 'epoch': 1.73} {'loss': 0.4573, 'learning_rate': 8.967820371469582e-07, 'epoch': 1.73} {'loss': 0.6398, 'learning_rate': 8.966465508230548e-07, 'epoch': 1.73} {'loss': 0.6089, 'learning_rate': 8.965110742542116e-07, 'epoch': 1.73} {'loss': 0.411, 'learning_rate': 8.963756074405838e-07, 'epoch': 1.73} {'loss': 0.5442, 'learning_rate': 8.962401503823059e-07, 'epoch': 1.73} {'loss': 0.4841, 'learning_rate': 8.961047030795333e-07, 'epoch': 1.73} {'loss': 0.5205, 'learning_rate': 8.959692655324037e-07, 'epoch': 1.73} {'loss': 0.3597, 'learning_rate': 8.958338377410647e-07, 'epoch': 1.73} {'loss': 0.528, 'learning_rate': 8.956984197056639e-07, 'epoch': 1.73} {'loss': 0.4963, 'learning_rate': 8.955630114263391e-07, 'epoch': 1.73} {'loss': 0.6687, 'learning_rate': 8.954276129032446e-07, 'epoch': 1.73} {'loss': 0.4315, 'learning_rate': 8.952922241365191e-07, 'epoch': 1.73} {'loss': 0.5805, 'learning_rate': 8.951568451263104e-07, 'epoch': 1.73} {'loss': 0.5574, 'learning_rate': 8.950214758727627e-07, 'epoch': 1.73} {'loss': 0.5943, 'learning_rate': 8.948861163760203e-07, 'epoch': 1.73} {'loss': 0.6686, 'learning_rate': 8.947507666362321e-07, 'epoch': 1.73} {'loss': 0.475, 'learning_rate': 8.946154266535368e-07, 'epoch': 1.73} {'loss': 0.4609, 'learning_rate': 8.944800964280853e-07, 'epoch': 1.73} {'loss': 0.6307, 'learning_rate': 8.943447759600199e-07, 'epoch': 1.73} {'loss': 0.5063, 'learning_rate': 8.942094652494848e-07, 'epoch': 1.73} {'loss': 0.4681, 'learning_rate': 8.940741642966266e-07, 'epoch': 1.73} {'loss': 0.4619, 'learning_rate': 8.939388731015896e-07, 'epoch': 1.73} {'loss': 0.6617, 'learning_rate': 8.938035916645205e-07, 'epoch': 1.73} {'loss': 0.4505, 'learning_rate': 8.936683199855611e-07, 'epoch': 1.73} {'loss': 0.3922, 'learning_rate': 8.935330580648582e-07, 'epoch': 1.73} {'loss': 0.5345, 'learning_rate': 8.933978059025561e-07, 'epoch': 1.73} {'loss': 0.5122, 'learning_rate': 8.932625634988012e-07, 'epoch': 1.73} {'loss': 0.4667, 'learning_rate': 8.931273308537358e-07, 'epoch': 1.73} {'loss': 0.4921, 'learning_rate': 8.929921079675074e-07, 'epoch': 1.73} {'loss': 0.3643, 'learning_rate': 8.928568948402616e-07, 'epoch': 1.73} {'loss': 0.5243, 'learning_rate': 8.927216914721404e-07, 'epoch': 1.73} {'loss': 0.509, 'learning_rate': 8.925864978632892e-07, 'epoch': 1.73} {'loss': 0.505, 'learning_rate': 8.924513140138536e-07, 'epoch': 1.73} {'loss': 0.4388, 'learning_rate': 8.923161399239788e-07, 'epoch': 1.73} {'loss': 0.4411, 'learning_rate': 8.921809755938105e-07, 'epoch': 1.73} {'loss': 0.5414, 'learning_rate': 8.920458210234895e-07, 'epoch': 1.73} {'loss': 0.4233, 'learning_rate': 8.919106762131658e-07, 'epoch': 1.73} {'loss': 0.4276, 'learning_rate': 8.917755411629814e-07, 'epoch': 1.73} {'loss': 0.4617, 'learning_rate': 8.916404158730807e-07, 'epoch': 1.73} {'loss': 0.552, 'learning_rate': 8.915053003436103e-07, 'epoch': 1.73} {'loss': 0.4566, 'learning_rate': 8.913701945747133e-07, 'epoch': 1.73} {'loss': 0.6402, 'learning_rate': 8.912350985665364e-07, 'epoch': 1.73} {'loss': 0.5231, 'learning_rate': 8.911000123192227e-07, 'epoch': 1.73} {'loss': 0.5407, 'learning_rate': 8.909649358329164e-07, 'epoch': 1.73} {'loss': 0.597, 'learning_rate': 8.908298691077643e-07, 'epoch': 1.73} {'loss': 0.3839, 'learning_rate': 8.906948121439097e-07, 'epoch': 1.73} {'loss': 0.5173, 'learning_rate': 8.905597649414976e-07, 'epoch': 1.73} {'loss': 0.464, 'learning_rate': 8.904247275006728e-07, 'epoch': 1.73} {'loss': 0.5299, 'learning_rate': 8.902896998215827e-07, 'epoch': 1.73} {'loss': 0.6203, 'learning_rate': 8.901546819043671e-07, 'epoch': 1.73} {'loss': 0.618, 'learning_rate': 8.900196737491729e-07, 'epoch': 1.73} {'loss': 0.541, 'learning_rate': 8.898846753561452e-07, 'epoch': 1.73} {'loss': 0.4536, 'learning_rate': 8.897496867254273e-07, 'epoch': 1.73} {'loss': 0.5998, 'learning_rate': 8.89614707857166e-07, 'epoch': 1.73} {'loss': 0.4798, 'learning_rate': 8.894797387515041e-07, 'epoch': 1.73} {'loss': 0.4137, 'learning_rate': 8.893447794085897e-07, 'epoch': 1.73} {'loss': 0.5056, 'learning_rate': 8.892098298285611e-07, 'epoch': 1.73} {'loss': 0.4746, 'learning_rate': 8.890748900115676e-07, 'epoch': 1.73} {'loss': 0.4495, 'learning_rate': 8.88939959957753e-07, 'epoch': 1.73} {'loss': 0.4098, 'learning_rate': 8.888050396672609e-07, 'epoch': 1.73} {'loss': 0.5787, 'learning_rate': 8.886701291402366e-07, 'epoch': 1.73} {'loss': 0.4711, 'learning_rate': 8.885352283768267e-07, 'epoch': 1.73} {'loss': 0.533, 'learning_rate': 8.884003373771721e-07, 'epoch': 1.73} {'loss': 0.4762, 'learning_rate': 8.882654561414184e-07, 'epoch': 1.73} {'loss': 0.4549, 'learning_rate': 8.881305846697108e-07, 'epoch': 1.73} {'loss': 0.5551, 'learning_rate': 8.879957229621938e-07, 'epoch': 1.73} {'loss': 0.3904, 'learning_rate': 8.878608710190117e-07, 'epoch': 1.73} {'loss': 0.5506, 'learning_rate': 8.87726028840309e-07, 'epoch': 1.73} {'loss': 0.6074, 'learning_rate': 8.875911964262318e-07, 'epoch': 1.73} {'loss': 0.3911, 'learning_rate': 8.874563737769215e-07, 'epoch': 1.73} {'loss': 0.3814, 'learning_rate': 8.873215608925246e-07, 'epoch': 1.73} {'loss': 0.5054, 'learning_rate': 8.871867577731852e-07, 'epoch': 1.73} {'loss': 0.6141, 'learning_rate': 8.870519644190468e-07, 'epoch': 1.73} {'loss': 0.5912, 'learning_rate': 8.869171808302557e-07, 'epoch': 1.73} {'loss': 0.6801, 'learning_rate': 8.867824070069542e-07, 'epoch': 1.73} {'loss': 0.5133, 'learning_rate': 8.866476429492909e-07, 'epoch': 1.73} {'loss': 0.5294, 'learning_rate': 8.865128886574048e-07, 'epoch': 1.73} {'loss': 0.545, 'learning_rate': 8.863781441314423e-07, 'epoch': 1.73} {'loss': 0.4418, 'learning_rate': 8.862434093715489e-07, 'epoch': 1.73} {'loss': 0.5616, 'learning_rate': 8.861086843778677e-07, 'epoch': 1.73} {'loss': 0.5528, 'learning_rate': 8.859739691505454e-07, 'epoch': 1.73} {'loss': 0.5891, 'learning_rate': 8.858392636897217e-07, 'epoch': 1.73} {'loss': 0.4808, 'learning_rate': 8.857045679955467e-07, 'epoch': 1.73} {'loss': 0.6273, 'learning_rate': 8.855698820681602e-07, 'epoch': 1.73} {'loss': 0.5841, 'learning_rate': 8.854352059077087e-07, 'epoch': 1.73} {'loss': 0.6355, 'learning_rate': 8.853005395143355e-07, 'epoch': 1.73} {'loss': 0.5432, 'learning_rate': 8.85165882888186e-07, 'epoch': 1.73} {'loss': 0.5688, 'learning_rate': 8.850312360294044e-07, 'epoch': 1.73} {'loss': 0.574, 'learning_rate': 8.848965989381319e-07, 'epoch': 1.73} {'loss': 0.522, 'learning_rate': 8.847619716145195e-07, 'epoch': 1.73} {'loss': 0.602, 'learning_rate': 8.846273540587047e-07, 'epoch': 1.73} {'loss': 0.6124, 'learning_rate': 8.844927462708353e-07, 'epoch': 1.73} {'loss': 0.4963, 'learning_rate': 8.843581482510532e-07, 'epoch': 1.73} {'loss': 0.3849, 'learning_rate': 8.842235599995053e-07, 'epoch': 1.73} {'loss': 0.4697, 'learning_rate': 8.840889815163356e-07, 'epoch': 1.73} {'loss': 0.5022, 'learning_rate': 8.839544128016841e-07, 'epoch': 1.73} {'loss': 0.5563, 'learning_rate': 8.838198538557019e-07, 'epoch': 1.73} {'loss': 0.4745, 'learning_rate': 8.836853046785277e-07, 'epoch': 1.73} {'loss': 0.682, 'learning_rate': 8.835507652703079e-07, 'epoch': 1.73} {'loss': 0.4903, 'learning_rate': 8.83416235631187e-07, 'epoch': 1.73} {'loss': 0.4966, 'learning_rate': 8.83281715761305e-07, 'epoch': 1.73} {'loss': 0.5479, 'learning_rate': 8.831472056608137e-07, 'epoch': 1.73} {'loss': 0.4612, 'learning_rate': 8.830127053298509e-07, 'epoch': 1.73} {'loss': 0.4851, 'learning_rate': 8.828782147685633e-07, 'epoch': 1.73} {'loss': 0.6692, 'learning_rate': 8.827437339770939e-07, 'epoch': 1.73} {'loss': 0.5014, 'learning_rate': 8.826092629555882e-07, 'epoch': 1.73} {'loss': 0.5416, 'learning_rate': 8.824748017041907e-07, 'epoch': 1.73} {'loss': 0.7467, 'learning_rate': 8.82340350223041e-07, 'epoch': 1.73} {'loss': 0.486, 'learning_rate': 8.822059085122902e-07, 'epoch': 1.73} {'loss': 0.4992, 'learning_rate': 8.820714765720772e-07, 'epoch': 1.73} {'loss': 0.6338, 'learning_rate': 8.819370544025474e-07, 'epoch': 1.73} {'loss': 0.5116, 'learning_rate': 8.81802642003844e-07, 'epoch': 1.73} {'loss': 0.4906, 'learning_rate': 8.816682393761134e-07, 'epoch': 1.73} {'loss': 0.4697, 'learning_rate': 8.815338465194989e-07, 'epoch': 1.73} {'loss': 0.5463, 'learning_rate': 8.813994634341417e-07, 'epoch': 1.73} {'loss': 0.5685, 'learning_rate': 8.812650901201902e-07, 'epoch': 1.73} {'loss': 0.559, 'learning_rate': 8.811307265777847e-07, 'epoch': 1.73} {'loss': 0.4776, 'learning_rate': 8.809963728070714e-07, 'epoch': 1.73} {'loss': 0.4803, 'learning_rate': 8.808620288081948e-07, 'epoch': 1.73} {'loss': 0.6288, 'learning_rate': 8.807276945812937e-07, 'epoch': 1.73} {'loss': 0.5657, 'learning_rate': 8.805933701265201e-07, 'epoch': 1.73} {'loss': 0.4787, 'learning_rate': 8.804590554440096e-07, 'epoch': 1.73} {'loss': 0.4501, 'learning_rate': 8.80324750533914e-07, 'epoch': 1.73} {'loss': 0.535, 'learning_rate': 8.801904553963725e-07, 'epoch': 1.73} {'loss': 0.6029, 'learning_rate': 8.800561700315291e-07, 'epoch': 1.73} {'loss': 0.4915, 'learning_rate': 8.799218944395316e-07, 'epoch': 1.73} {'loss': 0.5938, 'learning_rate': 8.797876286205165e-07, 'epoch': 1.73} {'loss': 0.5029, 'learning_rate': 8.796533725746359e-07, 'epoch': 1.73} {'loss': 0.4284, 'learning_rate': 8.795191263020253e-07, 'epoch': 1.73} {'loss': 0.4256, 'learning_rate': 8.793848898028379e-07, 'epoch': 1.73} {'loss': 0.501, 'learning_rate': 8.792506630772112e-07, 'epoch': 1.73} {'loss': 0.476, 'learning_rate': 8.791164461252899e-07, 'epoch': 1.73} {'loss': 0.5193, 'learning_rate': 8.789822389472202e-07, 'epoch': 1.73} {'loss': 0.5733, 'learning_rate': 8.788480415431411e-07, 'epoch': 1.73} {'loss': 0.5472, 'learning_rate': 8.787138539132034e-07, 'epoch': 1.73} {'loss': 0.5752, 'learning_rate': 8.785796760575427e-07, 'epoch': 1.73} {'loss': 0.4697, 'learning_rate': 8.78445507976311e-07, 'epoch': 1.73} {'loss': 0.5133, 'learning_rate': 8.783113496696471e-07, 'epoch': 1.73} {'loss': 0.4975, 'learning_rate': 8.781772011376955e-07, 'epoch': 1.73} {'loss': 0.5003, 'learning_rate': 8.780430623806014e-07, 'epoch': 1.73} {'loss': 0.4355, 'learning_rate': 8.779089333985046e-07, 'epoch': 1.73} {'loss': 0.3564, 'learning_rate': 8.777748141915543e-07, 'epoch': 1.73} {'loss': 0.6228, 'learning_rate': 8.77640704759889e-07, 'epoch': 1.73} {'loss': 0.5199, 'learning_rate': 8.775066051036585e-07, 'epoch': 1.73} {'loss': 0.4282, 'learning_rate': 8.773725152230017e-07, 'epoch': 1.73} {'loss': 0.5197, 'learning_rate': 8.77238435118063e-07, 'epoch': 1.73} {'loss': 0.4893, 'learning_rate': 8.771043647889887e-07, 'epoch': 1.73} {'loss': 0.3187, 'learning_rate': 8.769703042359168e-07, 'epoch': 1.73} {'loss': 0.6117, 'learning_rate': 8.768362534589981e-07, 'epoch': 1.73} {'loss': 0.5233, 'learning_rate': 8.767022124583712e-07, 'epoch': 1.73} {'loss': 0.4843, 'learning_rate': 8.765681812341809e-07, 'epoch': 1.73} {'loss': 0.358, 'learning_rate': 8.764341597865711e-07, 'epoch': 1.73} {'loss': 0.3836, 'learning_rate': 8.763001481156863e-07, 'epoch': 1.73} {'loss': 0.4733, 'learning_rate': 8.761661462216708e-07, 'epoch': 1.73} {'loss': 0.5067, 'learning_rate': 8.760321541046634e-07, 'epoch': 1.73} {'loss': 0.4173, 'learning_rate': 8.758981717648141e-07, 'epoch': 1.73} {'loss': 0.6239, 'learning_rate': 8.757641992022614e-07, 'epoch': 1.73} {'loss': 0.4768, 'learning_rate': 8.756302364171521e-07, 'epoch': 1.73} {'loss': 0.5224, 'learning_rate': 8.75496283409627e-07, 'epoch': 1.73} {'loss': 0.6516, 'learning_rate': 8.753623401798328e-07, 'epoch': 1.73} {'loss': 0.4731, 'learning_rate': 8.752284067279116e-07, 'epoch': 1.73} {'loss': 0.5399, 'learning_rate': 8.750944830540043e-07, 'epoch': 1.73} {'loss': 0.3319, 'learning_rate': 8.749605691582596e-07, 'epoch': 1.73} {'loss': 0.4507, 'learning_rate': 8.748266650408177e-07, 'epoch': 1.73} {'loss': 0.5362, 'learning_rate': 8.746927707018215e-07, 'epoch': 1.73} {'loss': 0.4936, 'learning_rate': 8.745588861414156e-07, 'epoch': 1.73} {'loss': 0.573, 'learning_rate': 8.744250113597441e-07, 'epoch': 1.73} {'loss': 0.6233, 'learning_rate': 8.742911463569514e-07, 'epoch': 1.73} {'loss': 0.5315, 'learning_rate': 8.741572911331775e-07, 'epoch': 1.73} {'loss': 0.4794, 'learning_rate': 8.740234456885676e-07, 'epoch': 1.73} {'loss': 0.5259, 'learning_rate': 8.738896100232653e-07, 'epoch': 1.73} {'loss': 0.4371, 'learning_rate': 8.737557841374145e-07, 'epoch': 1.73} {'loss': 0.534, 'learning_rate': 8.736219680311575e-07, 'epoch': 1.73} {'loss': 0.3968, 'learning_rate': 8.734881617046376e-07, 'epoch': 1.73} {'loss': 0.5709, 'learning_rate': 8.733543651580012e-07, 'epoch': 1.73} {'loss': 0.4791, 'learning_rate': 8.732205783913883e-07, 'epoch': 1.73} {'loss': 0.5467, 'learning_rate': 8.730868014049432e-07, 'epoch': 1.73} {'loss': 0.5439, 'learning_rate': 8.72953034198808e-07, 'epoch': 1.73} {'loss': 0.5695, 'learning_rate': 8.728192767731292e-07, 'epoch': 1.73} {'loss': 0.3502, 'learning_rate': 8.726855291280468e-07, 'epoch': 1.73} {'loss': 0.5067, 'learning_rate': 8.725517912637061e-07, 'epoch': 1.73} {'loss': 0.5329, 'learning_rate': 8.724180631802526e-07, 'epoch': 1.73} {'loss': 0.4623, 'learning_rate': 8.72284344877824e-07, 'epoch': 1.73} {'loss': 0.5289, 'learning_rate': 8.721506363565668e-07, 'epoch': 1.73} {'loss': 0.5076, 'learning_rate': 8.720169376166243e-07, 'epoch': 1.73} {'loss': 0.4918, 'learning_rate': 8.718832486581397e-07, 'epoch': 1.73} {'loss': 0.6083, 'learning_rate': 8.717495694812561e-07, 'epoch': 1.73} {'loss': 0.3387, 'learning_rate': 8.71615900086118e-07, 'epoch': 1.73} {'loss': 0.5325, 'learning_rate': 8.714822404728651e-07, 'epoch': 1.73} {'loss': 0.4902, 'learning_rate': 8.713485906416441e-07, 'epoch': 1.73} {'loss': 0.4577, 'learning_rate': 8.712149505925959e-07, 'epoch': 1.73} {'loss': 0.6826, 'learning_rate': 8.710813203258661e-07, 'epoch': 1.73} {'loss': 0.5708, 'learning_rate': 8.709476998415955e-07, 'epoch': 1.73} {'loss': 0.6313, 'learning_rate': 8.708140891399309e-07, 'epoch': 1.73} {'loss': 0.525, 'learning_rate': 8.706804882210107e-07, 'epoch': 1.73} {'loss': 0.4555, 'learning_rate': 8.705468970849806e-07, 'epoch': 1.73} {'loss': 0.5165, 'learning_rate': 8.704133157319828e-07, 'epoch': 1.73} {'loss': 0.4162, 'learning_rate': 8.702797441621624e-07, 'epoch': 1.73} {'loss': 0.5157, 'learning_rate': 8.701461823756596e-07, 'epoch': 1.73} {'loss': 0.4594, 'learning_rate': 8.70012630372622e-07, 'epoch': 1.73} {'loss': 0.4659, 'learning_rate': 8.698790881531882e-07, 'epoch': 1.73} {'loss': 0.4809, 'learning_rate': 8.697455557175027e-07, 'epoch': 1.73} {'loss': 0.4027, 'learning_rate': 8.696120330657099e-07, 'epoch': 1.73} {'loss': 0.4901, 'learning_rate': 8.694785201979505e-07, 'epoch': 1.73} {'loss': 0.4518, 'learning_rate': 8.693450171143692e-07, 'epoch': 1.73} {'loss': 0.5457, 'learning_rate': 8.692115238151089e-07, 'epoch': 1.73} {'loss': 0.4756, 'learning_rate': 8.690780403003151e-07, 'epoch': 1.73} {'loss': 0.3929, 'learning_rate': 8.689445665701257e-07, 'epoch': 1.73} {'loss': 0.4442, 'learning_rate': 8.688111026246859e-07, 'epoch': 1.73} {'loss': 0.3541, 'learning_rate': 8.686776484641401e-07, 'epoch': 1.73} {'loss': 0.3451, 'learning_rate': 8.685442040886305e-07, 'epoch': 1.73} {'loss': 0.6377, 'learning_rate': 8.68410769498299e-07, 'epoch': 1.73} {'loss': 0.4526, 'learning_rate': 8.682773446932902e-07, 'epoch': 1.73} {'loss': 0.3278, 'learning_rate': 8.681439296737481e-07, 'epoch': 1.73} {'loss': 0.5546, 'learning_rate': 8.680105244398118e-07, 'epoch': 1.73} {'loss': 0.5994, 'learning_rate': 8.678771289916266e-07, 'epoch': 1.73} {'loss': 0.4365, 'learning_rate': 8.677437433293357e-07, 'epoch': 1.73} {'loss': 0.3637, 'learning_rate': 8.676103674530812e-07, 'epoch': 1.73} {'loss': 0.6145, 'learning_rate': 8.674770013630085e-07, 'epoch': 1.73} {'loss': 0.4874, 'learning_rate': 8.673436450592543e-07, 'epoch': 1.73} {'loss': 0.5158, 'learning_rate': 8.672102985419695e-07, 'epoch': 1.73} {'loss': 0.6116, 'learning_rate': 8.670769618112918e-07, 'epoch': 1.73} {'loss': 0.4697, 'learning_rate': 8.669436348673655e-07, 'epoch': 1.73} {'loss': 0.3544, 'learning_rate': 8.668103177103327e-07, 'epoch': 1.73} {'loss': 0.3474, 'learning_rate': 8.666770103403377e-07, 'epoch': 1.73} {'loss': 0.4989, 'learning_rate': 8.665437127575238e-07, 'epoch': 1.73} {'loss': 0.6722, 'learning_rate': 8.664104249620297e-07, 'epoch': 1.73} {'loss': 0.4271, 'learning_rate': 8.662771469540043e-07, 'epoch': 1.73} {'loss': 0.4925, 'learning_rate': 8.661438787335852e-07, 'epoch': 1.73} {'loss': 0.5979, 'learning_rate': 8.660106203009178e-07, 'epoch': 1.73} {'loss': 0.4964, 'learning_rate': 8.658773716561441e-07, 'epoch': 1.73} {'loss': 0.6323, 'learning_rate': 8.657441327994076e-07, 'epoch': 1.73} {'loss': 0.3685, 'learning_rate': 8.656109037308524e-07, 'epoch': 1.73} {'loss': 0.5229, 'learning_rate': 8.654776844506163e-07, 'epoch': 1.73} {'loss': 0.5308, 'learning_rate': 8.65344474958848e-07, 'epoch': 1.73} {'loss': 0.4177, 'learning_rate': 8.652112752556862e-07, 'epoch': 1.73} {'loss': 0.4224, 'learning_rate': 8.650780853412755e-07, 'epoch': 1.73} {'loss': 0.4607, 'learning_rate': 8.649449052157588e-07, 'epoch': 1.73} {'loss': 0.5165, 'learning_rate': 8.64811734879275e-07, 'epoch': 1.73} {'loss': 0.4973, 'learning_rate': 8.646785743319741e-07, 'epoch': 1.73} {'loss': 0.422, 'learning_rate': 8.645454235739903e-07, 'epoch': 1.73} {'loss': 0.4138, 'learning_rate': 8.644122826054746e-07, 'epoch': 1.73} {'loss': 0.6333, 'learning_rate': 8.642791514265636e-07, 'epoch': 1.73} {'loss': 0.664, 'learning_rate': 8.641460300374028e-07, 'epoch': 1.73} {'loss': 0.4634, 'learning_rate': 8.640129184381352e-07, 'epoch': 1.73} {'loss': 0.4437, 'learning_rate': 8.638798166288986e-07, 'epoch': 1.73} {'loss': 0.3388, 'learning_rate': 8.63746724609843e-07, 'epoch': 1.73} {'loss': 0.498, 'learning_rate': 8.636136423811036e-07, 'epoch': 1.73} {'loss': 0.4874, 'learning_rate': 8.634805699428306e-07, 'epoch': 1.73} {'loss': 0.4963, 'learning_rate': 8.633475072951614e-07, 'epoch': 1.73} {'loss': 0.4199, 'learning_rate': 8.632144544382404e-07, 'epoch': 1.73} {'loss': 0.4269, 'learning_rate': 8.630814113722108e-07, 'epoch': 1.73} {'loss': 0.4303, 'learning_rate': 8.629483780972103e-07, 'epoch': 1.73} {'loss': 0.4481, 'learning_rate': 8.628153546133888e-07, 'epoch': 1.73} {'loss': 0.4819, 'learning_rate': 8.626823409208829e-07, 'epoch': 1.73} {'loss': 0.4171, 'learning_rate': 8.625493370198401e-07, 'epoch': 1.73} {'loss': 0.6346, 'learning_rate': 8.624163429103982e-07, 'epoch': 1.73} {'loss': 0.4348, 'learning_rate': 8.622833585927026e-07, 'epoch': 1.73} {'loss': 0.5276, 'learning_rate': 8.621503840668977e-07, 'epoch': 1.73} {'loss': 0.5071, 'learning_rate': 8.620174193331187e-07, 'epoch': 1.73} {'loss': 0.6326, 'learning_rate': 8.61884464391517e-07, 'epoch': 1.73} {'loss': 0.5232, 'learning_rate': 8.617515192422288e-07, 'epoch': 1.73} {'loss': 0.4999, 'learning_rate': 8.616185838853986e-07, 'epoch': 1.73} {'loss': 0.5578, 'learning_rate': 8.614856583211684e-07, 'epoch': 1.73} {'loss': 0.4661, 'learning_rate': 8.613527425496815e-07, 'epoch': 1.73} {'loss': 0.3607, 'learning_rate': 8.612198365710822e-07, 'epoch': 1.73} {'loss': 0.3732, 'learning_rate': 8.61086940385506e-07, 'epoch': 1.73} {'loss': 0.5542, 'learning_rate': 8.609540539931049e-07, 'epoch': 1.73} {'loss': 0.4607, 'learning_rate': 8.608211773940134e-07, 'epoch': 1.73} {'loss': 0.549, 'learning_rate': 8.606883105883779e-07, 'epoch': 1.73} {'loss': 0.5028, 'learning_rate': 8.605554535763394e-07, 'epoch': 1.73} {'loss': 0.5228, 'learning_rate': 8.604226063580401e-07, 'epoch': 1.73} {'loss': 0.5229, 'learning_rate': 8.602897689336253e-07, 'epoch': 1.73} {'loss': 0.5283, 'learning_rate': 8.601569413032307e-07, 'epoch': 1.73} {'loss': 0.5164, 'learning_rate': 8.60024123467007e-07, 'epoch': 1.73} {'loss': 0.4672, 'learning_rate': 8.59891315425091e-07, 'epoch': 1.73} {'loss': 0.4366, 'learning_rate': 8.597585171776258e-07, 'epoch': 1.73} {'loss': 0.6319, 'learning_rate': 8.596257287247556e-07, 'epoch': 1.73} {'loss': 0.4659, 'learning_rate': 8.594929500666182e-07, 'epoch': 1.73} {'loss': 0.3889, 'learning_rate': 8.593601812033636e-07, 'epoch': 1.73} {'loss': 0.401, 'learning_rate': 8.592274221351249e-07, 'epoch': 1.73} {'loss': 0.6135, 'learning_rate': 8.590946728620531e-07, 'epoch': 1.74} {'loss': 0.4347, 'learning_rate': 8.589619333842847e-07, 'epoch': 1.74} {'loss': 0.5352, 'learning_rate': 8.58829203701963e-07, 'epoch': 1.74} {'loss': 0.4022, 'learning_rate': 8.586964838152334e-07, 'epoch': 1.74} {'loss': 0.516, 'learning_rate': 8.585637737242314e-07, 'epoch': 1.74} {'loss': 0.4673, 'learning_rate': 8.584310734291069e-07, 'epoch': 1.74} {'loss': 0.4214, 'learning_rate': 8.582983829299973e-07, 'epoch': 1.74} {'loss': 0.424, 'learning_rate': 8.58165702227045e-07, 'epoch': 1.74} {'loss': 0.4092, 'learning_rate': 8.580330313203944e-07, 'epoch': 1.74} {'loss': 0.5875, 'learning_rate': 8.579003702101862e-07, 'epoch': 1.74} {'loss': 0.4464, 'learning_rate': 8.57767718896565e-07, 'epoch': 1.74} {'loss': 0.5461, 'learning_rate': 8.57635077379666e-07, 'epoch': 1.74} {'loss': 0.6632, 'learning_rate': 8.575024456596414e-07, 'epoch': 1.74} {'loss': 0.6124, 'learning_rate': 8.573698237366246e-07, 'epoch': 1.74} {'loss': 0.5319, 'learning_rate': 8.57237211610763e-07, 'epoch': 1.74} {'loss': 0.46, 'learning_rate': 8.571046092821955e-07, 'epoch': 1.74} {'loss': 0.5402, 'learning_rate': 8.569720167510665e-07, 'epoch': 1.74} {'loss': 0.4613, 'learning_rate': 8.568394340175179e-07, 'epoch': 1.74} {'loss': 0.4084, 'learning_rate': 8.567068610816887e-07, 'epoch': 1.74} {'loss': 0.4479, 'learning_rate': 8.565742979437263e-07, 'epoch': 1.74} {'loss': 0.4927, 'learning_rate': 8.564417446037687e-07, 'epoch': 1.74} {'loss': 0.3731, 'learning_rate': 8.563092010619578e-07, 'epoch': 1.74} {'loss': 0.4526, 'learning_rate': 8.561766673184379e-07, 'epoch': 1.74} {'loss': 0.474, 'learning_rate': 8.56044143373349e-07, 'epoch': 1.74} {'loss': 0.455, 'learning_rate': 8.559116292268366e-07, 'epoch': 1.74} {'loss': 0.5967, 'learning_rate': 8.557791248790381e-07, 'epoch': 1.74} {'loss': 0.5283, 'learning_rate': 8.556466303300981e-07, 'epoch': 1.74} {'loss': 0.4267, 'learning_rate': 8.555141455801574e-07, 'epoch': 1.74} {'loss': 0.4927, 'learning_rate': 8.553816706293593e-07, 'epoch': 1.74} {'loss': 0.5861, 'learning_rate': 8.552492054778449e-07, 'epoch': 1.74} {'loss': 0.5364, 'learning_rate': 8.551167501257562e-07, 'epoch': 1.74} {'loss': 0.4542, 'learning_rate': 8.549843045732376e-07, 'epoch': 1.74} {'loss': 0.254, 'learning_rate': 8.548518688204255e-07, 'epoch': 1.74} {'loss': 0.6711, 'learning_rate': 8.547194428674665e-07, 'epoch': 1.74} {'loss': 0.6158, 'learning_rate': 8.545870267145007e-07, 'epoch': 1.74} {'loss': 0.6082, 'learning_rate': 8.544546203616699e-07, 'epoch': 1.74} {'loss': 0.4683, 'learning_rate': 8.543222238091164e-07, 'epoch': 1.74} {'loss': 0.5304, 'learning_rate': 8.541898370569823e-07, 'epoch': 1.74} {'loss': 0.4939, 'learning_rate': 8.540574601054108e-07, 'epoch': 1.74} {'loss': 0.6777, 'learning_rate': 8.539250929545407e-07, 'epoch': 1.74} {'loss': 0.5507, 'learning_rate': 8.53792735604515e-07, 'epoch': 1.74} {'loss': 0.5432, 'learning_rate': 8.536603880554762e-07, 'epoch': 1.74} {'loss': 0.5679, 'learning_rate': 8.53528050307566e-07, 'epoch': 1.74} {'loss': 0.595, 'learning_rate': 8.533957223609257e-07, 'epoch': 1.74} {'loss': 0.4311, 'learning_rate': 8.532634042156996e-07, 'epoch': 1.74} {'loss': 0.5089, 'learning_rate': 8.531310958720251e-07, 'epoch': 1.74} {'loss': 0.6855, 'learning_rate': 8.529987973300458e-07, 'epoch': 1.74} {'loss': 0.5107, 'learning_rate': 8.528665085899046e-07, 'epoch': 1.74} {'loss': 0.4516, 'learning_rate': 8.527342296517415e-07, 'epoch': 1.74} {'loss': 0.5829, 'learning_rate': 8.52601960515701e-07, 'epoch': 1.74} {'loss': 0.3989, 'learning_rate': 8.524697011819216e-07, 'epoch': 1.74} {'loss': 0.4511, 'learning_rate': 8.523374516505489e-07, 'epoch': 1.74} {'loss': 0.5413, 'learning_rate': 8.522052119217205e-07, 'epoch': 1.74} {'loss': 0.4511, 'learning_rate': 8.520729819955798e-07, 'epoch': 1.74} {'loss': 0.4256, 'learning_rate': 8.519407618722686e-07, 'epoch': 1.74} {'loss': 0.6956, 'learning_rate': 8.518085515519281e-07, 'epoch': 1.74} {'loss': 0.3735, 'learning_rate': 8.516763510347004e-07, 'epoch': 1.74} {'loss': 0.5281, 'learning_rate': 8.515441603207276e-07, 'epoch': 1.74} {'loss': 0.4039, 'learning_rate': 8.514119794101528e-07, 'epoch': 1.74} {'loss': 0.4745, 'learning_rate': 8.512798083031137e-07, 'epoch': 1.74} {'loss': 0.4743, 'learning_rate': 8.511476469997548e-07, 'epoch': 1.74} {'loss': 0.5639, 'learning_rate': 8.510154955002159e-07, 'epoch': 1.74} {'loss': 0.3549, 'learning_rate': 8.508833538046402e-07, 'epoch': 1.74} {'loss': 0.403, 'learning_rate': 8.507512219131698e-07, 'epoch': 1.74} {'loss': 0.5819, 'learning_rate': 8.506190998259445e-07, 'epoch': 1.74} {'loss': 0.5469, 'learning_rate': 8.504869875431054e-07, 'epoch': 1.74} {'loss': 0.5222, 'learning_rate': 8.503548850647969e-07, 'epoch': 1.74} {'loss': 0.4433, 'learning_rate': 8.502227923911577e-07, 'epoch': 1.74} {'loss': 0.6111, 'learning_rate': 8.50090709522331e-07, 'epoch': 1.74} {'loss': 0.445, 'learning_rate': 8.499586364584577e-07, 'epoch': 1.74} {'loss': 0.6174, 'learning_rate': 8.498265731996813e-07, 'epoch': 1.74} {'loss': 0.4486, 'learning_rate': 8.496945197461403e-07, 'epoch': 1.74} {'loss': 0.5954, 'learning_rate': 8.495624760979771e-07, 'epoch': 1.74} {'loss': 0.4533, 'learning_rate': 8.494304422553335e-07, 'epoch': 1.74} {'loss': 0.4742, 'learning_rate': 8.492984182183517e-07, 'epoch': 1.74} {'loss': 0.5087, 'learning_rate': 8.491664039871716e-07, 'epoch': 1.74} {'loss': 0.4862, 'learning_rate': 8.490343995619366e-07, 'epoch': 1.74} {'loss': 0.4975, 'learning_rate': 8.489024049427885e-07, 'epoch': 1.74} {'loss': 0.5094, 'learning_rate': 8.487704201298652e-07, 'epoch': 1.74} {'loss': 0.393, 'learning_rate': 8.48638445123311e-07, 'epoch': 1.74} {'loss': 0.5385, 'learning_rate': 8.485064799232668e-07, 'epoch': 1.74} {'loss': 0.5587, 'learning_rate': 8.483745245298735e-07, 'epoch': 1.74} {'loss': 0.4832, 'learning_rate': 8.482425789432747e-07, 'epoch': 1.74} {'loss': 0.391, 'learning_rate': 8.481106431636055e-07, 'epoch': 1.74} {'loss': 0.2697, 'learning_rate': 8.47978717191017e-07, 'epoch': 1.74} {'loss': 0.4975, 'learning_rate': 8.478468010256424e-07, 'epoch': 1.74} {'loss': 0.6133, 'learning_rate': 8.477148946676262e-07, 'epoch': 1.74} {'loss': 0.6291, 'learning_rate': 8.475829981171102e-07, 'epoch': 1.74} {'loss': 0.4979, 'learning_rate': 8.474511113742345e-07, 'epoch': 1.74} {'loss': 0.4331, 'learning_rate': 8.473192344391423e-07, 'epoch': 1.74} {'loss': 0.5016, 'learning_rate': 8.471873673119713e-07, 'epoch': 1.74} {'loss': 0.4838, 'learning_rate': 8.470555099928679e-07, 'epoch': 1.74} {'loss': 0.4487, 'learning_rate': 8.469236624819688e-07, 'epoch': 1.74} {'loss': 0.6225, 'learning_rate': 8.467918247794171e-07, 'epoch': 1.74} {'loss': 0.3582, 'learning_rate': 8.466599968853561e-07, 'epoch': 1.74} {'loss': 0.5414, 'learning_rate': 8.465281787999213e-07, 'epoch': 1.74} {'loss': 0.3707, 'learning_rate': 8.463963705232614e-07, 'epoch': 1.74} {'loss': 0.2195, 'learning_rate': 8.462645720555096e-07, 'epoch': 1.74} {'loss': 0.4147, 'learning_rate': 8.461327833968158e-07, 'epoch': 1.74} {'loss': 0.675, 'learning_rate': 8.460010045473155e-07, 'epoch': 1.74} {'loss': 0.4782, 'learning_rate': 8.458692355071507e-07, 'epoch': 1.74} {'loss': 0.3996, 'learning_rate': 8.457374762764658e-07, 'epoch': 1.74} {'loss': 0.5282, 'learning_rate': 8.456057268553952e-07, 'epoch': 1.74} {'loss': 0.3764, 'learning_rate': 8.454739872440875e-07, 'epoch': 1.74} {'loss': 0.5638, 'learning_rate': 8.453422574426784e-07, 'epoch': 1.74} {'loss': 0.3075, 'learning_rate': 8.452105374513131e-07, 'epoch': 1.74} {'loss': 0.6134, 'learning_rate': 8.450788272701305e-07, 'epoch': 1.74} {'loss': 0.3819, 'learning_rate': 8.449471268992715e-07, 'epoch': 1.74} {'loss': 0.5171, 'learning_rate': 8.448154363388805e-07, 'epoch': 1.74} {'loss': 0.3975, 'learning_rate': 8.446837555890919e-07, 'epoch': 1.74} {'loss': 0.4767, 'learning_rate': 8.445520846500554e-07, 'epoch': 1.74} {'loss': 0.6927, 'learning_rate': 8.444204235219034e-07, 'epoch': 1.74} {'loss': 0.394, 'learning_rate': 8.442887722047843e-07, 'epoch': 1.74} {'loss': 0.5237, 'learning_rate': 8.44157130698835e-07, 'epoch': 1.74} {'loss': 0.3506, 'learning_rate': 8.440254990041985e-07, 'epoch': 1.74} {'loss': 0.5687, 'learning_rate': 8.438938771210159e-07, 'epoch': 1.74} {'loss': 0.3443, 'learning_rate': 8.437622650494237e-07, 'epoch': 1.74} {'loss': 0.5126, 'learning_rate': 8.436306627895696e-07, 'epoch': 1.74} {'loss': 0.5515, 'learning_rate': 8.434990703415891e-07, 'epoch': 1.74} {'loss': 0.5769, 'learning_rate': 8.433674877056297e-07, 'epoch': 1.74} {'loss': 0.503, 'learning_rate': 8.432359148818259e-07, 'epoch': 1.74} {'loss': 0.5069, 'learning_rate': 8.431043518703219e-07, 'epoch': 1.74} {'loss': 0.4632, 'learning_rate': 8.429727986712588e-07, 'epoch': 1.74} {'loss': 0.5158, 'learning_rate': 8.428412552847742e-07, 'epoch': 1.74} {'loss': 0.4279, 'learning_rate': 8.427097217110147e-07, 'epoch': 1.74} {'loss': 0.5308, 'learning_rate': 8.425781979501146e-07, 'epoch': 1.74} {'loss': 0.3665, 'learning_rate': 8.424466840022227e-07, 'epoch': 1.74} {'loss': 0.4877, 'learning_rate': 8.423151798674733e-07, 'epoch': 1.74} {'loss': 0.5273, 'learning_rate': 8.421836855460108e-07, 'epoch': 1.74} {'loss': 0.5437, 'learning_rate': 8.42052201037975e-07, 'epoch': 1.74} {'loss': 0.6207, 'learning_rate': 8.419207263435047e-07, 'epoch': 1.74} {'loss': 0.5587, 'learning_rate': 8.417892614627465e-07, 'epoch': 1.74} {'loss': 0.5257, 'learning_rate': 8.416578063958348e-07, 'epoch': 1.74} {'loss': 0.5071, 'learning_rate': 8.415263611429136e-07, 'epoch': 1.74} {'loss': 0.4011, 'learning_rate': 8.413949257041243e-07, 'epoch': 1.74} {'loss': 0.4922, 'learning_rate': 8.412635000796065e-07, 'epoch': 1.74} {'loss': 0.4698, 'learning_rate': 8.411320842695037e-07, 'epoch': 1.74} {'loss': 0.3789, 'learning_rate': 8.410006782739499e-07, 'epoch': 1.74} {'loss': 0.5024, 'learning_rate': 8.408692820930953e-07, 'epoch': 1.74} {'loss': 0.5083, 'learning_rate': 8.407378957270728e-07, 'epoch': 1.74} {'loss': 0.3471, 'learning_rate': 8.406065191760282e-07, 'epoch': 1.74} {'loss': 0.5862, 'learning_rate': 8.40475152440099e-07, 'epoch': 1.74} {'loss': 0.4768, 'learning_rate': 8.403437955194271e-07, 'epoch': 1.74} {'loss': 0.4347, 'learning_rate': 8.402124484141561e-07, 'epoch': 1.74} {'loss': 0.5141, 'learning_rate': 8.4008111112442e-07, 'epoch': 1.74} {'loss': 0.4665, 'learning_rate': 8.399497836503678e-07, 'epoch': 1.74} {'loss': 0.5785, 'learning_rate': 8.398184659921349e-07, 'epoch': 1.74} {'loss': 0.4434, 'learning_rate': 8.396871581498622e-07, 'epoch': 1.74} {'loss': 0.4197, 'learning_rate': 8.39555860123692e-07, 'epoch': 1.74} {'loss': 0.3765, 'learning_rate': 8.39424571913765e-07, 'epoch': 1.74} {'loss': 0.4838, 'learning_rate': 8.392932935202225e-07, 'epoch': 1.74} {'loss': 0.4391, 'learning_rate': 8.391620249432019e-07, 'epoch': 1.74} {'loss': 0.5591, 'learning_rate': 8.390307661828467e-07, 'epoch': 1.74} {'loss': 0.4599, 'learning_rate': 8.388995172392966e-07, 'epoch': 1.74} {'loss': 0.522, 'learning_rate': 8.387682781126915e-07, 'epoch': 1.74} {'loss': 0.3782, 'learning_rate': 8.386370488031758e-07, 'epoch': 1.74} {'loss': 0.4234, 'learning_rate': 8.385058293108838e-07, 'epoch': 1.74} {'loss': 0.4808, 'learning_rate': 8.383746196359643e-07, 'epoch': 1.74} {'loss': 0.4913, 'learning_rate': 8.382434197785505e-07, 'epoch': 1.74} {'loss': 0.5732, 'learning_rate': 8.381122297387856e-07, 'epoch': 1.74} {'loss': 0.7753, 'learning_rate': 8.379810495168106e-07, 'epoch': 1.74} {'loss': 0.6333, 'learning_rate': 8.378498791127654e-07, 'epoch': 1.74} {'loss': 0.3084, 'learning_rate': 8.377187185267932e-07, 'epoch': 1.74} {'loss': 0.5132, 'learning_rate': 8.375875677590284e-07, 'epoch': 1.74} {'loss': 0.4966, 'learning_rate': 8.374564268096196e-07, 'epoch': 1.74} {'loss': 0.5754, 'learning_rate': 8.373252956787004e-07, 'epoch': 1.74} {'loss': 0.5552, 'learning_rate': 8.371941743664147e-07, 'epoch': 1.74} {'loss': 0.5841, 'learning_rate': 8.370630628729027e-07, 'epoch': 1.74} {'loss': 0.5488, 'learning_rate': 8.369319611983051e-07, 'epoch': 1.74} {'loss': 0.4606, 'learning_rate': 8.368008693427632e-07, 'epoch': 1.74} {'loss': 0.4869, 'learning_rate': 8.366697873064144e-07, 'epoch': 1.74} {'loss': 0.5136, 'learning_rate': 8.365387150894011e-07, 'epoch': 1.74} {'loss': 0.4349, 'learning_rate': 8.364076526918629e-07, 'epoch': 1.74} {'loss': 0.6209, 'learning_rate': 8.36276600113941e-07, 'epoch': 1.74} {'loss': 0.5936, 'learning_rate': 8.361455573557764e-07, 'epoch': 1.74} {'loss': 0.4692, 'learning_rate': 8.360145244175089e-07, 'epoch': 1.74} {'loss': 0.2892, 'learning_rate': 8.358835012992805e-07, 'epoch': 1.74} {'loss': 0.5527, 'learning_rate': 8.357524880012291e-07, 'epoch': 1.74} {'loss': 0.53, 'learning_rate': 8.356214845234956e-07, 'epoch': 1.74} {'loss': 0.4206, 'learning_rate': 8.354904908662198e-07, 'epoch': 1.74} {'loss': 0.5482, 'learning_rate': 8.353595070295439e-07, 'epoch': 1.74} {'loss': 0.5889, 'learning_rate': 8.352285330136078e-07, 'epoch': 1.74} {'loss': 0.53, 'learning_rate': 8.350975688185525e-07, 'epoch': 1.74} {'loss': 0.5422, 'learning_rate': 8.349666144445157e-07, 'epoch': 1.74} {'loss': 0.4546, 'learning_rate': 8.348356698916404e-07, 'epoch': 1.74} {'loss': 0.4436, 'learning_rate': 8.347047351600646e-07, 'epoch': 1.74} {'loss': 0.4915, 'learning_rate': 8.345738102499301e-07, 'epoch': 1.74} {'loss': 0.6489, 'learning_rate': 8.344428951613781e-07, 'epoch': 1.74} {'loss': 0.4991, 'learning_rate': 8.343119898945462e-07, 'epoch': 1.74} {'loss': 0.5733, 'learning_rate': 8.341810944495787e-07, 'epoch': 1.74} {'loss': 0.5165, 'learning_rate': 8.340502088266122e-07, 'epoch': 1.74} {'loss': 0.5853, 'learning_rate': 8.339193330257877e-07, 'epoch': 1.74} {'loss': 0.4694, 'learning_rate': 8.337884670472463e-07, 'epoch': 1.74} {'loss': 0.494, 'learning_rate': 8.336576108911265e-07, 'epoch': 1.74} {'loss': 0.5293, 'learning_rate': 8.335267645575718e-07, 'epoch': 1.74} {'loss': 0.5121, 'learning_rate': 8.333959280467197e-07, 'epoch': 1.74} {'loss': 0.5473, 'learning_rate': 8.332651013587123e-07, 'epoch': 1.74} {'loss': 0.5175, 'learning_rate': 8.331342844936874e-07, 'epoch': 1.74} {'loss': 0.4356, 'learning_rate': 8.33003477451787e-07, 'epoch': 1.74} {'loss': 0.5935, 'learning_rate': 8.3287268023315e-07, 'epoch': 1.74} {'loss': 0.5036, 'learning_rate': 8.327418928379172e-07, 'epoch': 1.74} {'loss': 0.5611, 'learning_rate': 8.326111152662309e-07, 'epoch': 1.74} {'loss': 0.6196, 'learning_rate': 8.324803475182263e-07, 'epoch': 1.74} {'loss': 0.5762, 'learning_rate': 8.323495895940492e-07, 'epoch': 1.74} {'loss': 0.4841, 'learning_rate': 8.322188414938359e-07, 'epoch': 1.74} {'loss': 0.5113, 'learning_rate': 8.320881032177264e-07, 'epoch': 1.74} {'loss': 0.5181, 'learning_rate': 8.319573747658627e-07, 'epoch': 1.74} {'loss': 0.4656, 'learning_rate': 8.318266561383848e-07, 'epoch': 1.74} {'loss': 0.4883, 'learning_rate': 8.316959473354325e-07, 'epoch': 1.74} {'loss': 0.5953, 'learning_rate': 8.315652483571424e-07, 'epoch': 1.74} {'loss': 0.4412, 'learning_rate': 8.314345592036621e-07, 'epoch': 1.74} {'loss': 0.5119, 'learning_rate': 8.31303879875125e-07, 'epoch': 1.74} {'loss': 0.4028, 'learning_rate': 8.31173210371673e-07, 'epoch': 1.74} {'loss': 0.6598, 'learning_rate': 8.310425506934461e-07, 'epoch': 1.74} {'loss': 0.416, 'learning_rate': 8.309119008405853e-07, 'epoch': 1.74} {'loss': 0.6148, 'learning_rate': 8.307812608132315e-07, 'epoch': 1.74} {'loss': 0.5167, 'learning_rate': 8.306506306115191e-07, 'epoch': 1.74} {'loss': 0.5185, 'learning_rate': 8.30520010235596e-07, 'epoch': 1.74} {'loss': 0.5185, 'learning_rate': 8.303893996855972e-07, 'epoch': 1.74} {'loss': 0.5003, 'learning_rate': 8.302587989616628e-07, 'epoch': 1.74} {'loss': 0.6092, 'learning_rate': 8.301282080639361e-07, 'epoch': 1.74} {'loss': 0.538, 'learning_rate': 8.299976269925514e-07, 'epoch': 1.74} {'loss': 0.4565, 'learning_rate': 8.29867055747654e-07, 'epoch': 1.74} {'loss': 0.4398, 'learning_rate': 8.297364943293818e-07, 'epoch': 1.74} {'loss': 0.737, 'learning_rate': 8.296059427378733e-07, 'epoch': 1.74} {'loss': 0.3941, 'learning_rate': 8.294754009732697e-07, 'epoch': 1.74} {'loss': 0.4968, 'learning_rate': 8.293448690357119e-07, 'epoch': 1.74} {'loss': 0.5193, 'learning_rate': 8.2921434692534e-07, 'epoch': 1.74} {'loss': 0.4539, 'learning_rate': 8.290838346422891e-07, 'epoch': 1.74} {'loss': 0.4489, 'learning_rate': 8.28953332186706e-07, 'epoch': 1.74} {'loss': 0.4104, 'learning_rate': 8.28822839558725e-07, 'epoch': 1.74} {'loss': 0.6084, 'learning_rate': 8.286923567584892e-07, 'epoch': 1.74} {'loss': 0.5642, 'learning_rate': 8.285618837861365e-07, 'epoch': 1.74} {'loss': 0.4602, 'learning_rate': 8.284314206418076e-07, 'epoch': 1.74} {'loss': 0.458, 'learning_rate': 8.283009673256437e-07, 'epoch': 1.74} {'loss': 0.459, 'learning_rate': 8.281705238377801e-07, 'epoch': 1.74} {'loss': 0.3667, 'learning_rate': 8.280400901783636e-07, 'epoch': 1.74} {'loss': 0.6397, 'learning_rate': 8.279096663475272e-07, 'epoch': 1.74} {'loss': 0.3734, 'learning_rate': 8.277792523454143e-07, 'epoch': 1.74} {'loss': 0.5833, 'learning_rate': 8.276488481721645e-07, 'epoch': 1.74} {'loss': 0.5431, 'learning_rate': 8.275184538279135e-07, 'epoch': 1.74} {'loss': 0.3419, 'learning_rate': 8.273880693128089e-07, 'epoch': 1.74} {'loss': 0.498, 'learning_rate': 8.272576946269817e-07, 'epoch': 1.74} {'loss': 0.5247, 'learning_rate': 8.271273297705784e-07, 'epoch': 1.74} {'loss': 0.4192, 'learning_rate': 8.269969747437356e-07, 'epoch': 1.74} {'loss': 0.5057, 'learning_rate': 8.268666295465933e-07, 'epoch': 1.74} {'loss': 0.5718, 'learning_rate': 8.267362941792922e-07, 'epoch': 1.74} {'loss': 0.5165, 'learning_rate': 8.266059686419681e-07, 'epoch': 1.74} {'loss': 0.316, 'learning_rate': 8.264756529347673e-07, 'epoch': 1.74} {'loss': 0.4967, 'learning_rate': 8.26345347057822e-07, 'epoch': 1.74} {'loss': 0.5211, 'learning_rate': 8.262150510112798e-07, 'epoch': 1.74} {'loss': 0.5624, 'learning_rate': 8.260847647952741e-07, 'epoch': 1.74} {'loss': 0.5036, 'learning_rate': 8.259544884099469e-07, 'epoch': 1.74} {'loss': 0.3889, 'learning_rate': 8.258242218554379e-07, 'epoch': 1.74} {'loss': 0.4515, 'learning_rate': 8.25693965131884e-07, 'epoch': 1.74} {'loss': 0.4799, 'learning_rate': 8.255637182394305e-07, 'epoch': 1.74} {'loss': 0.5445, 'learning_rate': 8.254334811782095e-07, 'epoch': 1.74} {'loss': 0.6029, 'learning_rate': 8.253032539483685e-07, 'epoch': 1.74} {'loss': 0.5611, 'learning_rate': 8.25173036550041e-07, 'epoch': 1.74} {'loss': 0.5496, 'learning_rate': 8.25042828983369e-07, 'epoch': 1.74} {'loss': 0.3482, 'learning_rate': 8.249126312484934e-07, 'epoch': 1.74} {'loss': 0.4695, 'learning_rate': 8.247824433455476e-07, 'epoch': 1.74} {'loss': 0.6594, 'learning_rate': 8.246522652746803e-07, 'epoch': 1.74} {'loss': 0.5902, 'learning_rate': 8.245220970360224e-07, 'epoch': 1.74} {'loss': 0.5551, 'learning_rate': 8.243919386297206e-07, 'epoch': 1.74} {'loss': 0.5074, 'learning_rate': 8.242617900559091e-07, 'epoch': 1.74} {'loss': 0.594, 'learning_rate': 8.241316513147291e-07, 'epoch': 1.74} {'loss': 0.6114, 'learning_rate': 8.240015224063224e-07, 'epoch': 1.74} {'loss': 0.436, 'learning_rate': 8.238714033308226e-07, 'epoch': 1.74} {'loss': 0.5168, 'learning_rate': 8.23741294088376e-07, 'epoch': 1.74} {'loss': 0.4012, 'learning_rate': 8.236111946791181e-07, 'epoch': 1.74} {'loss': 0.4414, 'learning_rate': 8.234811051031877e-07, 'epoch': 1.74} {'loss': 0.607, 'learning_rate': 8.233510253607257e-07, 'epoch': 1.74} {'loss': 0.4785, 'learning_rate': 8.232209554518722e-07, 'epoch': 1.74} {'loss': 0.5035, 'learning_rate': 8.230908953767669e-07, 'epoch': 1.74} {'loss': 0.452, 'learning_rate': 8.229608451355442e-07, 'epoch': 1.74} {'loss': 0.5191, 'learning_rate': 8.228308047283518e-07, 'epoch': 1.74} {'loss': 0.4862, 'learning_rate': 8.227007741553217e-07, 'epoch': 1.74} {'loss': 0.5682, 'learning_rate': 8.225707534165961e-07, 'epoch': 1.74} {'loss': 0.4669, 'learning_rate': 8.224407425123149e-07, 'epoch': 1.74} {'loss': 0.4492, 'learning_rate': 8.223107414426157e-07, 'epoch': 1.74} {'loss': 0.5144, 'learning_rate': 8.221807502076418e-07, 'epoch': 1.74} {'loss': 0.3842, 'learning_rate': 8.220507688075252e-07, 'epoch': 1.74} {'loss': 0.4708, 'learning_rate': 8.219207972424137e-07, 'epoch': 1.74} {'loss': 0.3984, 'learning_rate': 8.217908355124404e-07, 'epoch': 1.74} {'loss': 0.4483, 'learning_rate': 8.216608836177464e-07, 'epoch': 1.74} {'loss': 0.5083, 'learning_rate': 8.215309415584716e-07, 'epoch': 1.74} {'loss': 0.5306, 'learning_rate': 8.214010093347547e-07, 'epoch': 1.74} {'loss': 0.5063, 'learning_rate': 8.212710869467366e-07, 'epoch': 1.74} {'loss': 0.6877, 'learning_rate': 8.21141174394553e-07, 'epoch': 1.74} {'loss': 0.4714, 'learning_rate': 8.210112716783447e-07, 'epoch': 1.74} {'loss': 0.4183, 'learning_rate': 8.208813787982528e-07, 'epoch': 1.74} {'loss': 0.5024, 'learning_rate': 8.207514957544138e-07, 'epoch': 1.74} {'loss': 0.5439, 'learning_rate': 8.206216225469688e-07, 'epoch': 1.74} {'loss': 0.5233, 'learning_rate': 8.204917591760553e-07, 'epoch': 1.74} {'loss': 0.5329, 'learning_rate': 8.203619056418155e-07, 'epoch': 1.74} {'loss': 0.6072, 'learning_rate': 8.202320619443849e-07, 'epoch': 1.74} {'loss': 0.5361, 'learning_rate': 8.201022280839044e-07, 'epoch': 1.74} {'loss': 0.6328, 'learning_rate': 8.199724040605118e-07, 'epoch': 1.74} {'loss': 0.5, 'learning_rate': 8.198425898743478e-07, 'epoch': 1.74} {'loss': 0.4437, 'learning_rate': 8.197127855255515e-07, 'epoch': 1.74} {'loss': 0.486, 'learning_rate': 8.195829910142617e-07, 'epoch': 1.74} {'loss': 0.5162, 'learning_rate': 8.194532063406191e-07, 'epoch': 1.74} {'loss': 0.5043, 'learning_rate': 8.193234315047583e-07, 'epoch': 1.74} {'loss': 0.4564, 'learning_rate': 8.191936665068212e-07, 'epoch': 1.74} {'loss': 0.5466, 'learning_rate': 8.190639113469478e-07, 'epoch': 1.74} {'loss': 0.4086, 'learning_rate': 8.189341660252748e-07, 'epoch': 1.74} {'loss': 0.5115, 'learning_rate': 8.188044305419451e-07, 'epoch': 1.74} {'loss': 0.4268, 'learning_rate': 8.186747048970934e-07, 'epoch': 1.74} {'loss': 0.3789, 'learning_rate': 8.185449890908592e-07, 'epoch': 1.74} {'loss': 0.6154, 'learning_rate': 8.184152831233838e-07, 'epoch': 1.74} {'loss': 0.5513, 'learning_rate': 8.182855869948047e-07, 'epoch': 1.74} {'loss': 0.4951, 'learning_rate': 8.181559007052619e-07, 'epoch': 1.74} {'loss': 0.4885, 'learning_rate': 8.180262242548931e-07, 'epoch': 1.74} {'loss': 0.5642, 'learning_rate': 8.178965576438403e-07, 'epoch': 1.74} {'loss': 0.4092, 'learning_rate': 8.177669008722377e-07, 'epoch': 1.74} {'loss': 0.599, 'learning_rate': 8.176372539402266e-07, 'epoch': 1.74} {'loss': 0.5215, 'learning_rate': 8.175076168479456e-07, 'epoch': 1.74} {'loss': 0.4846, 'learning_rate': 8.173779895955347e-07, 'epoch': 1.74} {'loss': 0.3577, 'learning_rate': 8.172483721831326e-07, 'epoch': 1.74} {'loss': 0.4864, 'learning_rate': 8.17118764610877e-07, 'epoch': 1.74} {'loss': 0.4239, 'learning_rate': 8.169891668789088e-07, 'epoch': 1.74} {'loss': 0.4554, 'learning_rate': 8.168595789873646e-07, 'epoch': 1.74} {'loss': 0.5129, 'learning_rate': 8.167300009363832e-07, 'epoch': 1.74} {'loss': 0.6652, 'learning_rate': 8.166004327261045e-07, 'epoch': 1.74} {'loss': 0.5615, 'learning_rate': 8.164708743566685e-07, 'epoch': 1.74} {'loss': 0.3543, 'learning_rate': 8.163413258282116e-07, 'epoch': 1.74} {'loss': 0.5144, 'learning_rate': 8.162117871408759e-07, 'epoch': 1.74} {'loss': 0.4269, 'learning_rate': 8.160822582947969e-07, 'epoch': 1.74} {'loss': 0.5325, 'learning_rate': 8.159527392901146e-07, 'epoch': 1.74} {'loss': 0.5559, 'learning_rate': 8.158232301269676e-07, 'epoch': 1.74} {'loss': 0.4985, 'learning_rate': 8.156937308054947e-07, 'epoch': 1.74} {'loss': 0.5582, 'learning_rate': 8.155642413258357e-07, 'epoch': 1.74} {'loss': 0.6068, 'learning_rate': 8.154347616881275e-07, 'epoch': 1.74} {'loss': 0.6116, 'learning_rate': 8.153052918925119e-07, 'epoch': 1.74} {'loss': 0.5506, 'learning_rate': 8.151758319391245e-07, 'epoch': 1.74} {'loss': 0.3958, 'learning_rate': 8.150463818281052e-07, 'epoch': 1.74} {'loss': 0.5605, 'learning_rate': 8.149169415595926e-07, 'epoch': 1.74} {'loss': 0.3992, 'learning_rate': 8.147875111337244e-07, 'epoch': 1.74} {'loss': 0.6754, 'learning_rate': 8.146580905506418e-07, 'epoch': 1.74} {'loss': 0.4833, 'learning_rate': 8.145286798104812e-07, 'epoch': 1.74} {'loss': 0.5626, 'learning_rate': 8.143992789133848e-07, 'epoch': 1.74} {'loss': 0.4355, 'learning_rate': 8.142698878594857e-07, 'epoch': 1.74} {'loss': 0.6312, 'learning_rate': 8.141405066489261e-07, 'epoch': 1.74} {'loss': 0.5086, 'learning_rate': 8.140111352818437e-07, 'epoch': 1.74} {'loss': 0.5057, 'learning_rate': 8.138817737583781e-07, 'epoch': 1.74} {'loss': 0.6557, 'learning_rate': 8.137524220786685e-07, 'epoch': 1.74} {'loss': 0.5563, 'learning_rate': 8.136230802428491e-07, 'epoch': 1.74} {'loss': 0.5019, 'learning_rate': 8.134937482510652e-07, 'epoch': 1.74} {'loss': 0.5268, 'learning_rate': 8.133644261034501e-07, 'epoch': 1.74} {'loss': 0.4247, 'learning_rate': 8.132351138001437e-07, 'epoch': 1.74} {'loss': 0.4888, 'learning_rate': 8.13105811341286e-07, 'epoch': 1.74} {'loss': 0.4531, 'learning_rate': 8.129765187270133e-07, 'epoch': 1.74} {'loss': 0.3295, 'learning_rate': 8.128472359574679e-07, 'epoch': 1.74} {'loss': 0.4943, 'learning_rate': 8.12717963032783e-07, 'epoch': 1.74} {'loss': 0.43, 'learning_rate': 8.12588699953103e-07, 'epoch': 1.74} {'loss': 0.4741, 'learning_rate': 8.124594467185609e-07, 'epoch': 1.74} {'loss': 0.5236, 'learning_rate': 8.12330203329299e-07, 'epoch': 1.74} {'loss': 0.554, 'learning_rate': 8.12200969785455e-07, 'epoch': 1.74} {'loss': 0.5594, 'learning_rate': 8.120717460871641e-07, 'epoch': 1.74} {'loss': 0.6196, 'learning_rate': 8.119425322345709e-07, 'epoch': 1.74} {'loss': 0.4376, 'learning_rate': 8.118133282278074e-07, 'epoch': 1.74} {'loss': 0.4264, 'learning_rate': 8.11684134067019e-07, 'epoch': 1.74} {'loss': 0.5709, 'learning_rate': 8.115549497523379e-07, 'epoch': 1.74} {'loss': 0.5288, 'learning_rate': 8.11425775283905e-07, 'epoch': 1.74} {'loss': 0.5646, 'learning_rate': 8.112966106618603e-07, 'epoch': 1.74} {'loss': 0.5167, 'learning_rate': 8.111674558863381e-07, 'epoch': 1.74} {'loss': 0.4266, 'learning_rate': 8.110383109574815e-07, 'epoch': 1.74} {'loss': 0.5024, 'learning_rate': 8.10909175875424e-07, 'epoch': 1.74} {'loss': 0.4229, 'learning_rate': 8.107800506403107e-07, 'epoch': 1.74} {'loss': 0.5424, 'learning_rate': 8.106509352522729e-07, 'epoch': 1.74} {'loss': 0.6074, 'learning_rate': 8.105218297114525e-07, 'epoch': 1.74} {'loss': 0.398, 'learning_rate': 8.103927340179896e-07, 'epoch': 1.74} {'loss': 0.4325, 'learning_rate': 8.10263648172016e-07, 'epoch': 1.74} {'loss': 0.4853, 'learning_rate': 8.101345721736786e-07, 'epoch': 1.74} {'loss': 0.44, 'learning_rate': 8.100055060231093e-07, 'epoch': 1.74} {'loss': 0.5913, 'learning_rate': 8.098764497204493e-07, 'epoch': 1.74} {'loss': 0.5751, 'learning_rate': 8.097474032658348e-07, 'epoch': 1.74} {'loss': 0.4602, 'learning_rate': 8.096183666594071e-07, 'epoch': 1.74} {'loss': 0.5336, 'learning_rate': 8.094893399013027e-07, 'epoch': 1.74} {'loss': 0.6449, 'learning_rate': 8.09360322991658e-07, 'epoch': 1.74} {'loss': 0.6338, 'learning_rate': 8.092313159306153e-07, 'epoch': 1.74} {'loss': 0.4608, 'learning_rate': 8.0910231871831e-07, 'epoch': 1.74} {'loss': 0.5531, 'learning_rate': 8.089733313548809e-07, 'epoch': 1.74} {'loss': 0.3648, 'learning_rate': 8.088443538404667e-07, 'epoch': 1.74} {'loss': 0.4056, 'learning_rate': 8.087153861752051e-07, 'epoch': 1.74} {'loss': 0.3614, 'learning_rate': 8.08586428359236e-07, 'epoch': 1.74} {'loss': 0.4382, 'learning_rate': 8.084574803926925e-07, 'epoch': 1.74} {'loss': 0.4699, 'learning_rate': 8.083285422757203e-07, 'epoch': 1.74} {'loss': 0.4989, 'learning_rate': 8.081996140084525e-07, 'epoch': 1.74} {'loss': 0.6083, 'learning_rate': 8.080706955910278e-07, 'epoch': 1.74} {'loss': 0.4454, 'learning_rate': 8.079417870235862e-07, 'epoch': 1.74} {'loss': 0.5449, 'learning_rate': 8.078128883062619e-07, 'epoch': 1.74} {'loss': 0.4752, 'learning_rate': 8.076839994391983e-07, 'epoch': 1.74} {'loss': 0.5728, 'learning_rate': 8.075551204225285e-07, 'epoch': 1.74} {'loss': 0.4609, 'learning_rate': 8.074262512563957e-07, 'epoch': 1.74} {'loss': 0.4501, 'learning_rate': 8.072973919409343e-07, 'epoch': 1.74} {'loss': 0.5745, 'learning_rate': 8.071685424762831e-07, 'epoch': 1.74} {'loss': 0.3797, 'learning_rate': 8.07039702862582e-07, 'epoch': 1.74} {'loss': 0.451, 'learning_rate': 8.069108730999652e-07, 'epoch': 1.74} {'loss': 0.519, 'learning_rate': 8.06782053188575e-07, 'epoch': 1.74} {'loss': 0.4664, 'learning_rate': 8.066532431285457e-07, 'epoch': 1.74} {'loss': 0.34, 'learning_rate': 8.065244429200192e-07, 'epoch': 1.74} {'loss': 0.4817, 'learning_rate': 8.063956525631311e-07, 'epoch': 1.74} {'loss': 0.4457, 'learning_rate': 8.062668720580191e-07, 'epoch': 1.74} {'loss': 0.4767, 'learning_rate': 8.06138101404823e-07, 'epoch': 1.74} {'loss': 0.405, 'learning_rate': 8.060093406036773e-07, 'epoch': 1.74} {'loss': 0.5519, 'learning_rate': 8.058805896547262e-07, 'epoch': 1.74} {'loss': 0.6811, 'learning_rate': 8.057518485580995e-07, 'epoch': 1.74} {'loss': 0.3908, 'learning_rate': 8.056231173139429e-07, 'epoch': 1.74} {'loss': 0.6076, 'learning_rate': 8.054943959223905e-07, 'epoch': 1.74} {'loss': 0.531, 'learning_rate': 8.0536568438358e-07, 'epoch': 1.74} {'loss': 0.3531, 'learning_rate': 8.052369826976514e-07, 'epoch': 1.74} {'loss': 0.5463, 'learning_rate': 8.051082908647379e-07, 'epoch': 1.74} {'loss': 0.5157, 'learning_rate': 8.049796088849837e-07, 'epoch': 1.74} {'loss': 0.3555, 'learning_rate': 8.048509367585233e-07, 'epoch': 1.74} {'loss': 0.5008, 'learning_rate': 8.047222744854943e-07, 'epoch': 1.74} {'loss': 0.545, 'learning_rate': 8.045936220660356e-07, 'epoch': 1.74} {'loss': 0.5225, 'learning_rate': 8.044649795002846e-07, 'epoch': 1.74} {'loss': 0.5826, 'learning_rate': 8.043363467883803e-07, 'epoch': 1.74} {'loss': 0.4515, 'learning_rate': 8.042077239304568e-07, 'epoch': 1.74} {'loss': 0.4746, 'learning_rate': 8.040791109266588e-07, 'epoch': 1.74} {'loss': 0.5043, 'learning_rate': 8.03950507777117e-07, 'epoch': 1.74} {'loss': 0.5593, 'learning_rate': 8.038219144819736e-07, 'epoch': 1.74} {'loss': 0.5006, 'learning_rate': 8.036933310413642e-07, 'epoch': 1.74} {'loss': 0.5449, 'learning_rate': 8.035647574554273e-07, 'epoch': 1.74} {'loss': 0.6956, 'learning_rate': 8.03436193724303e-07, 'epoch': 1.74} {'loss': 0.5244, 'learning_rate': 8.033076398481233e-07, 'epoch': 1.74} {'loss': 0.4096, 'learning_rate': 8.031790958270325e-07, 'epoch': 1.74} {'loss': 0.3348, 'learning_rate': 8.03050561661164e-07, 'epoch': 1.74} {'loss': 0.3166, 'learning_rate': 8.029220373506564e-07, 'epoch': 1.74} {'loss': 0.5254, 'learning_rate': 8.027935228956485e-07, 'epoch': 1.74} {'loss': 0.6765, 'learning_rate': 8.02665018296277e-07, 'epoch': 1.74} {'loss': 0.5664, 'learning_rate': 8.025365235526827e-07, 'epoch': 1.74} {'loss': 0.4297, 'learning_rate': 8.024080386649979e-07, 'epoch': 1.74} {'loss': 0.4979, 'learning_rate': 8.022795636333636e-07, 'epoch': 1.74} {'loss': 0.3885, 'learning_rate': 8.021510984579173e-07, 'epoch': 1.74} {'loss': 0.4467, 'learning_rate': 8.020226431387956e-07, 'epoch': 1.74} {'loss': 0.564, 'learning_rate': 8.018941976761363e-07, 'epoch': 1.74} {'loss': 0.455, 'learning_rate': 8.017657620700781e-07, 'epoch': 1.74} {'loss': 0.465, 'learning_rate': 8.016373363207597e-07, 'epoch': 1.74} {'loss': 0.4584, 'learning_rate': 8.015089204283155e-07, 'epoch': 1.74} {'loss': 0.3886, 'learning_rate': 8.013805143928854e-07, 'epoch': 1.74} {'loss': 0.5882, 'learning_rate': 8.012521182146049e-07, 'epoch': 1.74} {'loss': 0.4592, 'learning_rate': 8.011237318936138e-07, 'epoch': 1.74} {'loss': 0.4122, 'learning_rate': 8.009953554300487e-07, 'epoch': 1.74} {'loss': 0.5179, 'learning_rate': 8.008669888240495e-07, 'epoch': 1.74} {'loss': 0.5192, 'learning_rate': 8.007386320757493e-07, 'epoch': 1.74} {'loss': 0.5768, 'learning_rate': 8.006102851852882e-07, 'epoch': 1.74} {'loss': 0.5368, 'learning_rate': 8.004819481528036e-07, 'epoch': 1.74} {'loss': 0.5112, 'learning_rate': 8.003536209784324e-07, 'epoch': 1.74} {'loss': 0.5097, 'learning_rate': 8.002253036623131e-07, 'epoch': 1.74} {'loss': 0.6033, 'learning_rate': 8.000969962045824e-07, 'epoch': 1.74} {'loss': 0.5749, 'learning_rate': 7.999686986053801e-07, 'epoch': 1.74} {'loss': 0.4618, 'learning_rate': 7.998404108648405e-07, 'epoch': 1.74} {'loss': 0.4517, 'learning_rate': 7.997121329831015e-07, 'epoch': 1.74} {'loss': 0.5249, 'learning_rate': 7.995838649603016e-07, 'epoch': 1.74} {'loss': 0.5338, 'learning_rate': 7.994556067965776e-07, 'epoch': 1.74} {'loss': 0.5153, 'learning_rate': 7.993273584920669e-07, 'epoch': 1.74} {'loss': 0.5703, 'learning_rate': 7.991991200469085e-07, 'epoch': 1.74} {'loss': 0.4917, 'learning_rate': 7.990708914612399e-07, 'epoch': 1.74} {'loss': 0.463, 'learning_rate': 7.989426727351957e-07, 'epoch': 1.74} {'loss': 0.552, 'learning_rate': 7.988144638689144e-07, 'epoch': 1.74} {'loss': 0.5134, 'learning_rate': 7.986862648625338e-07, 'epoch': 1.74} {'loss': 0.4371, 'learning_rate': 7.985580757161926e-07, 'epoch': 1.74} {'loss': 0.4659, 'learning_rate': 7.984298964300275e-07, 'epoch': 1.74} {'loss': 0.4725, 'learning_rate': 7.983017270041737e-07, 'epoch': 1.74} {'loss': 0.562, 'learning_rate': 7.981735674387702e-07, 'epoch': 1.74} {'loss': 0.5941, 'learning_rate': 7.980454177339537e-07, 'epoch': 1.74} {'loss': 0.4591, 'learning_rate': 7.979172778898625e-07, 'epoch': 1.74} {'loss': 0.507, 'learning_rate': 7.977891479066347e-07, 'epoch': 1.74} {'loss': 0.4159, 'learning_rate': 7.976610277844044e-07, 'epoch': 1.74} {'loss': 0.5672, 'learning_rate': 7.975329175233138e-07, 'epoch': 1.74} {'loss': 0.4177, 'learning_rate': 7.97404817123495e-07, 'epoch': 1.74} {'loss': 0.3998, 'learning_rate': 7.972767265850878e-07, 'epoch': 1.74} {'loss': 0.5724, 'learning_rate': 7.97148645908229e-07, 'epoch': 1.74} {'loss': 0.3272, 'learning_rate': 7.970205750930559e-07, 'epoch': 1.74} {'loss': 0.4616, 'learning_rate': 7.968925141397065e-07, 'epoch': 1.74} {'loss': 0.6269, 'learning_rate': 7.967644630483173e-07, 'epoch': 1.74} {'loss': 0.5625, 'learning_rate': 7.96636421819027e-07, 'epoch': 1.74} {'loss': 0.3813, 'learning_rate': 7.965083904519688e-07, 'epoch': 1.74} {'loss': 0.325, 'learning_rate': 7.963803689472838e-07, 'epoch': 1.75} {'loss': 0.6031, 'learning_rate': 7.962523573051073e-07, 'epoch': 1.75} {'loss': 0.646, 'learning_rate': 7.961243555255783e-07, 'epoch': 1.75} {'loss': 0.4726, 'learning_rate': 7.95996363608833e-07, 'epoch': 1.75} {'loss': 0.5864, 'learning_rate': 7.95868381555005e-07, 'epoch': 1.75} {'loss': 0.479, 'learning_rate': 7.957404093642395e-07, 'epoch': 1.75} {'loss': 0.4873, 'learning_rate': 7.956124470366655e-07, 'epoch': 1.75} {'loss': 0.4745, 'learning_rate': 7.954844945724249e-07, 'epoch': 1.75} {'loss': 0.436, 'learning_rate': 7.953565519716522e-07, 'epoch': 1.75} {'loss': 0.4612, 'learning_rate': 7.952286192344872e-07, 'epoch': 1.75} {'loss': 0.5815, 'learning_rate': 7.951006963610663e-07, 'epoch': 1.75} {'loss': 0.4416, 'learning_rate': 7.949727833515219e-07, 'epoch': 1.75} {'loss': 0.4369, 'learning_rate': 7.948448802059993e-07, 'epoch': 1.75} {'loss': 0.5883, 'learning_rate': 7.947169869246286e-07, 'epoch': 1.75} {'loss': 0.5853, 'learning_rate': 7.945891035075503e-07, 'epoch': 1.75} {'loss': 0.5168, 'learning_rate': 7.944612299549004e-07, 'epoch': 1.75} {'loss': 0.5128, 'learning_rate': 7.943333662668162e-07, 'epoch': 1.75} {'loss': 0.5795, 'learning_rate': 7.942055124434356e-07, 'epoch': 1.75} {'loss': 0.6166, 'learning_rate': 7.940776684848927e-07, 'epoch': 1.75} {'loss': 0.6528, 'learning_rate': 7.939498343913288e-07, 'epoch': 1.75} {'loss': 0.4402, 'learning_rate': 7.938220101628768e-07, 'epoch': 1.75} {'loss': 0.6114, 'learning_rate': 7.936941957996758e-07, 'epoch': 1.75} {'loss': 0.6109, 'learning_rate': 7.935663913018643e-07, 'epoch': 1.75} {'loss': 0.4922, 'learning_rate': 7.934385966695734e-07, 'epoch': 1.75} {'loss': 0.5101, 'learning_rate': 7.933108119029475e-07, 'epoch': 1.75} {'loss': 0.5496, 'learning_rate': 7.931830370021177e-07, 'epoch': 1.75} {'loss': 0.567, 'learning_rate': 7.930552719672246e-07, 'epoch': 1.75} {'loss': 0.5598, 'learning_rate': 7.929275167984041e-07, 'epoch': 1.75} {'loss': 0.5219, 'learning_rate': 7.927997714957913e-07, 'epoch': 1.75} {'loss': 0.5648, 'learning_rate': 7.926720360595275e-07, 'epoch': 1.75} {'loss': 0.3139, 'learning_rate': 7.925443104897423e-07, 'epoch': 1.75} {'loss': 0.6661, 'learning_rate': 7.924165947865803e-07, 'epoch': 1.75} {'loss': 0.4829, 'learning_rate': 7.922888889501712e-07, 'epoch': 1.75} {'loss': 0.5204, 'learning_rate': 7.921611929806605e-07, 'epoch': 1.75} {'loss': 0.4808, 'learning_rate': 7.920335068781771e-07, 'epoch': 1.75} {'loss': 0.5353, 'learning_rate': 7.919058306428618e-07, 'epoch': 1.75} {'loss': 0.2828, 'learning_rate': 7.917781642748513e-07, 'epoch': 1.75} {'loss': 0.5829, 'learning_rate': 7.916505077742787e-07, 'epoch': 1.75} {'loss': 0.5934, 'learning_rate': 7.915228611412861e-07, 'epoch': 1.75} {'loss': 0.5143, 'learning_rate': 7.913952243760059e-07, 'epoch': 1.75} {'loss': 0.5214, 'learning_rate': 7.9126759747858e-07, 'epoch': 1.75} {'loss': 0.3421, 'learning_rate': 7.911399804491393e-07, 'epoch': 1.75} {'loss': 0.5379, 'learning_rate': 7.910123732878238e-07, 'epoch': 1.75} {'loss': 0.4478, 'learning_rate': 7.908847759947724e-07, 'epoch': 1.75} {'loss': 0.5606, 'learning_rate': 7.907571885701148e-07, 'epoch': 1.75} {'loss': 0.3815, 'learning_rate': 7.906296110139955e-07, 'epoch': 1.75} {'loss': 0.4903, 'learning_rate': 7.905020433265442e-07, 'epoch': 1.75} {'loss': 0.431, 'learning_rate': 7.903744855079043e-07, 'epoch': 1.75} {'loss': 0.5585, 'learning_rate': 7.902469375582089e-07, 'epoch': 1.75} {'loss': 0.5309, 'learning_rate': 7.901193994775935e-07, 'epoch': 1.75} {'loss': 0.51, 'learning_rate': 7.899918712661992e-07, 'epoch': 1.75} {'loss': 0.5324, 'learning_rate': 7.898643529241568e-07, 'epoch': 1.75} {'loss': 0.5423, 'learning_rate': 7.897368444516085e-07, 'epoch': 1.75} {'loss': 0.4318, 'learning_rate': 7.896093458486876e-07, 'epoch': 1.75} {'loss': 0.4069, 'learning_rate': 7.894818571155305e-07, 'epoch': 1.75} {'loss': 0.4984, 'learning_rate': 7.89354378252275e-07, 'epoch': 1.75} {'loss': 0.5078, 'learning_rate': 7.892269092590588e-07, 'epoch': 1.75} {'loss': 0.4263, 'learning_rate': 7.890994501360183e-07, 'epoch': 1.75} {'loss': 0.3663, 'learning_rate': 7.889720008832857e-07, 'epoch': 1.75} {'loss': 0.4969, 'learning_rate': 7.888445615010043e-07, 'epoch': 1.75} {'loss': 0.516, 'learning_rate': 7.88717131989305e-07, 'epoch': 1.75} {'loss': 0.5267, 'learning_rate': 7.885897123483277e-07, 'epoch': 1.75} {'loss': 0.4354, 'learning_rate': 7.884623025782068e-07, 'epoch': 1.75} {'loss': 0.4925, 'learning_rate': 7.883349026790809e-07, 'epoch': 1.75} {'loss': 0.4353, 'learning_rate': 7.882075126510869e-07, 'epoch': 1.75} {'loss': 0.4549, 'learning_rate': 7.880801324943565e-07, 'epoch': 1.75} {'loss': 0.7155, 'learning_rate': 7.879527622090333e-07, 'epoch': 1.75} {'loss': 0.5248, 'learning_rate': 7.87825401795248e-07, 'epoch': 1.75} {'loss': 0.5498, 'learning_rate': 7.876980512531396e-07, 'epoch': 1.75} {'loss': 0.3841, 'learning_rate': 7.875707105828456e-07, 'epoch': 1.75} {'loss': 0.6258, 'learning_rate': 7.874433797844983e-07, 'epoch': 1.75} {'loss': 0.5955, 'learning_rate': 7.873160588582396e-07, 'epoch': 1.75} {'loss': 0.5062, 'learning_rate': 7.871887478042028e-07, 'epoch': 1.75} {'loss': 0.5928, 'learning_rate': 7.870614466225234e-07, 'epoch': 1.75} {'loss': 0.4824, 'learning_rate': 7.869341553133391e-07, 'epoch': 1.75} {'loss': 0.3726, 'learning_rate': 7.868068738767876e-07, 'epoch': 1.75} {'loss': 0.5487, 'learning_rate': 7.866796023130052e-07, 'epoch': 1.75} {'loss': 0.4289, 'learning_rate': 7.865523406221232e-07, 'epoch': 1.75} {'loss': 0.4459, 'learning_rate': 7.864250888042857e-07, 'epoch': 1.75} {'loss': 0.4535, 'learning_rate': 7.862978468596239e-07, 'epoch': 1.75} {'loss': 0.5377, 'learning_rate': 7.861706147882752e-07, 'epoch': 1.75} {'loss': 0.4909, 'learning_rate': 7.860433925903765e-07, 'epoch': 1.75} {'loss': 0.6569, 'learning_rate': 7.859161802660631e-07, 'epoch': 1.75} {'loss': 0.5954, 'learning_rate': 7.857889778154748e-07, 'epoch': 1.75} {'loss': 0.679, 'learning_rate': 7.856617852387416e-07, 'epoch': 1.75} {'loss': 0.5868, 'learning_rate': 7.855346025360067e-07, 'epoch': 1.75} {'loss': 0.601, 'learning_rate': 7.854074297074021e-07, 'epoch': 1.75} {'loss': 0.4141, 'learning_rate': 7.852802667530646e-07, 'epoch': 1.75} {'loss': 0.5714, 'learning_rate': 7.851531136731305e-07, 'epoch': 1.75} {'loss': 0.6308, 'learning_rate': 7.850259704677376e-07, 'epoch': 1.75} {'loss': 0.5927, 'learning_rate': 7.848988371370215e-07, 'epoch': 1.75} {'loss': 0.4925, 'learning_rate': 7.847717136811173e-07, 'epoch': 1.75} {'loss': 0.5471, 'learning_rate': 7.846446001001617e-07, 'epoch': 1.75} {'loss': 0.7211, 'learning_rate': 7.845174963942904e-07, 'epoch': 1.75} {'loss': 0.5369, 'learning_rate': 7.843904025636417e-07, 'epoch': 1.75} {'loss': 0.4508, 'learning_rate': 7.842633186083493e-07, 'epoch': 1.75} {'loss': 0.4826, 'learning_rate': 7.841362445285505e-07, 'epoch': 1.75} {'loss': 0.6125, 'learning_rate': 7.840091803243844e-07, 'epoch': 1.75} {'loss': 0.4294, 'learning_rate': 7.838821259959817e-07, 'epoch': 1.75} {'loss': 0.5487, 'learning_rate': 7.837550815434813e-07, 'epoch': 1.75} {'loss': 0.5265, 'learning_rate': 7.836280469670188e-07, 'epoch': 1.75} {'loss': 0.4955, 'learning_rate': 7.835010222667306e-07, 'epoch': 1.75} {'loss': 0.49, 'learning_rate': 7.833740074427532e-07, 'epoch': 1.75} {'loss': 0.5194, 'learning_rate': 7.832470024952232e-07, 'epoch': 1.75} {'loss': 0.5425, 'learning_rate': 7.831200074242762e-07, 'epoch': 1.75} {'loss': 0.4988, 'learning_rate': 7.829930222300474e-07, 'epoch': 1.75} {'loss': 0.6211, 'learning_rate': 7.828660469126725e-07, 'epoch': 1.75} {'loss': 0.5758, 'learning_rate': 7.827390814722891e-07, 'epoch': 1.75} {'loss': 0.3909, 'learning_rate': 7.826121259090324e-07, 'epoch': 1.75} {'loss': 0.5483, 'learning_rate': 7.824851802230393e-07, 'epoch': 1.75} {'loss': 0.5414, 'learning_rate': 7.823582444144462e-07, 'epoch': 1.75} {'loss': 0.6383, 'learning_rate': 7.822313184833874e-07, 'epoch': 1.75} {'loss': 0.4657, 'learning_rate': 7.821044024299995e-07, 'epoch': 1.75} {'loss': 0.4939, 'learning_rate': 7.81977496254418e-07, 'epoch': 1.75} {'loss': 0.4444, 'learning_rate': 7.818505999567805e-07, 'epoch': 1.75} {'loss': 0.4906, 'learning_rate': 7.817237135372213e-07, 'epoch': 1.75} {'loss': 0.4569, 'learning_rate': 7.815968369958771e-07, 'epoch': 1.75} {'loss': 0.4581, 'learning_rate': 7.814699703328854e-07, 'epoch': 1.75} {'loss': 0.3928, 'learning_rate': 7.813431135483796e-07, 'epoch': 1.75} {'loss': 0.5579, 'learning_rate': 7.812162666424972e-07, 'epoch': 1.75} {'loss': 0.494, 'learning_rate': 7.810894296153726e-07, 'epoch': 1.75} {'loss': 0.5176, 'learning_rate': 7.809626024671435e-07, 'epoch': 1.75} {'loss': 0.385, 'learning_rate': 7.808357851979442e-07, 'epoch': 1.75} {'loss': 0.5699, 'learning_rate': 7.807089778079113e-07, 'epoch': 1.75} {'loss': 0.4462, 'learning_rate': 7.805821802971836e-07, 'epoch': 1.75} {'loss': 0.417, 'learning_rate': 7.804553926658919e-07, 'epoch': 1.75} {'loss': 0.5741, 'learning_rate': 7.803286149141742e-07, 'epoch': 1.75} {'loss': 0.5188, 'learning_rate': 7.802018470421669e-07, 'epoch': 1.75} {'loss': 0.4708, 'learning_rate': 7.800750890500052e-07, 'epoch': 1.75} {'loss': 0.5389, 'learning_rate': 7.799483409378272e-07, 'epoch': 1.75} {'loss': 0.5236, 'learning_rate': 7.798216027057637e-07, 'epoch': 1.75} {'loss': 0.5422, 'learning_rate': 7.796948743539557e-07, 'epoch': 1.75} {'loss': 0.4653, 'learning_rate': 7.795681558825363e-07, 'epoch': 1.75} {'loss': 0.5354, 'learning_rate': 7.794414472916412e-07, 'epoch': 1.75} {'loss': 0.6944, 'learning_rate': 7.793147485814067e-07, 'epoch': 1.75} {'loss': 0.4277, 'learning_rate': 7.791880597519685e-07, 'epoch': 1.75} {'loss': 0.5951, 'learning_rate': 7.790613808034652e-07, 'epoch': 1.75} {'loss': 0.6271, 'learning_rate': 7.789347117360268e-07, 'epoch': 1.75} {'loss': 0.5948, 'learning_rate': 7.788080525497931e-07, 'epoch': 1.75} {'loss': 0.4116, 'learning_rate': 7.786814032448987e-07, 'epoch': 1.75} {'loss': 0.5949, 'learning_rate': 7.785547638214796e-07, 'epoch': 1.75} {'loss': 0.358, 'learning_rate': 7.784281342796707e-07, 'epoch': 1.75} {'loss': 0.5675, 'learning_rate': 7.783015146196094e-07, 'epoch': 1.75} {'loss': 0.5756, 'learning_rate': 7.781749048414311e-07, 'epoch': 1.75} {'loss': 0.5208, 'learning_rate': 7.780483049452692e-07, 'epoch': 1.75} {'loss': 0.5528, 'learning_rate': 7.779217149312613e-07, 'epoch': 1.75} {'loss': 0.374, 'learning_rate': 7.777951347995416e-07, 'epoch': 1.75} {'loss': 0.5063, 'learning_rate': 7.776685645502479e-07, 'epoch': 1.75} {'loss': 0.4754, 'learning_rate': 7.775420041835158e-07, 'epoch': 1.75} {'loss': 0.553, 'learning_rate': 7.77415453699476e-07, 'epoch': 1.75} {'loss': 0.4239, 'learning_rate': 7.772889130982719e-07, 'epoch': 1.75} {'loss': 0.3868, 'learning_rate': 7.771623823800345e-07, 'epoch': 1.75} {'loss': 0.534, 'learning_rate': 7.770358615448981e-07, 'epoch': 1.75} {'loss': 0.4362, 'learning_rate': 7.769093505930015e-07, 'epoch': 1.75} {'loss': 0.5581, 'learning_rate': 7.767828495244789e-07, 'epoch': 1.75} {'loss': 0.4406, 'learning_rate': 7.766563583394671e-07, 'epoch': 1.75} {'loss': 0.5418, 'learning_rate': 7.765298770380969e-07, 'epoch': 1.75} {'loss': 0.6318, 'learning_rate': 7.764034056205116e-07, 'epoch': 1.75} {'loss': 0.5484, 'learning_rate': 7.7627694408684e-07, 'epoch': 1.75} {'loss': 0.4212, 'learning_rate': 7.76150492437221e-07, 'epoch': 1.75} {'loss': 0.4611, 'learning_rate': 7.760240506717897e-07, 'epoch': 1.75} {'loss': 0.6045, 'learning_rate': 7.758976187906786e-07, 'epoch': 1.75} {'loss': 0.599, 'learning_rate': 7.757711967940296e-07, 'epoch': 1.75} {'loss': 0.5151, 'learning_rate': 7.756447846819703e-07, 'epoch': 1.75} {'loss': 0.5301, 'learning_rate': 7.75518382454643e-07, 'epoch': 1.75} {'loss': 0.4941, 'learning_rate': 7.753919901121799e-07, 'epoch': 1.75} {'loss': 0.5424, 'learning_rate': 7.75265607654716e-07, 'epoch': 1.75} {'loss': 0.4973, 'learning_rate': 7.751392350823894e-07, 'epoch': 1.75} {'loss': 0.4181, 'learning_rate': 7.750128723953299e-07, 'epoch': 1.75} {'loss': 0.5004, 'learning_rate': 7.748865195936805e-07, 'epoch': 1.75} {'loss': 0.6712, 'learning_rate': 7.747601766775703e-07, 'epoch': 1.75} {'loss': 0.3401, 'learning_rate': 7.74633843647139e-07, 'epoch': 1.75} {'loss': 0.5361, 'learning_rate': 7.745075205025199e-07, 'epoch': 1.75} {'loss': 0.5721, 'learning_rate': 7.743812072438472e-07, 'epoch': 1.75} {'loss': 0.5207, 'learning_rate': 7.74254903871261e-07, 'epoch': 1.75} {'loss': 0.575, 'learning_rate': 7.741286103848889e-07, 'epoch': 1.75} {'loss': 0.5602, 'learning_rate': 7.74002326784874e-07, 'epoch': 1.75} {'loss': 0.4578, 'learning_rate': 7.738760530713451e-07, 'epoch': 1.75} {'loss': 0.6329, 'learning_rate': 7.737497892444446e-07, 'epoch': 1.75} {'loss': 0.5849, 'learning_rate': 7.73623535304302e-07, 'epoch': 1.75} {'loss': 0.5506, 'learning_rate': 7.734972912510541e-07, 'epoch': 1.75} {'loss': 0.5208, 'learning_rate': 7.733710570848385e-07, 'epoch': 1.75} {'loss': 0.5476, 'learning_rate': 7.732448328057862e-07, 'epoch': 1.75} {'loss': 0.6036, 'learning_rate': 7.731186184140372e-07, 'epoch': 1.75} {'loss': 0.4968, 'learning_rate': 7.729924139097212e-07, 'epoch': 1.75} {'loss': 0.5001, 'learning_rate': 7.728662192929792e-07, 'epoch': 1.75} {'loss': 0.4037, 'learning_rate': 7.727400345639435e-07, 'epoch': 1.75} {'loss': 0.5282, 'learning_rate': 7.726138597227483e-07, 'epoch': 1.75} {'loss': 0.4272, 'learning_rate': 7.724876947695326e-07, 'epoch': 1.75} {'loss': 0.4976, 'learning_rate': 7.72361539704426e-07, 'epoch': 1.75} {'loss': 0.4475, 'learning_rate': 7.722353945275696e-07, 'epoch': 1.75} {'loss': 0.5095, 'learning_rate': 7.721092592390933e-07, 'epoch': 1.75} {'loss': 0.4432, 'learning_rate': 7.71983133839137e-07, 'epoch': 1.75} {'loss': 0.6195, 'learning_rate': 7.718570183278329e-07, 'epoch': 1.75} {'loss': 0.6101, 'learning_rate': 7.717309127053174e-07, 'epoch': 1.75} {'loss': 0.5627, 'learning_rate': 7.716048169717261e-07, 'epoch': 1.75} {'loss': 0.6478, 'learning_rate': 7.714787311271898e-07, 'epoch': 1.75} {'loss': 0.2667, 'learning_rate': 7.713526551718498e-07, 'epoch': 1.75} {'loss': 0.5802, 'learning_rate': 7.712265891058368e-07, 'epoch': 1.75} {'loss': 0.5483, 'learning_rate': 7.711005329292887e-07, 'epoch': 1.75} {'loss': 0.6721, 'learning_rate': 7.709744866423385e-07, 'epoch': 1.75} {'loss': 0.5973, 'learning_rate': 7.708484502451219e-07, 'epoch': 1.75} {'loss': 0.4575, 'learning_rate': 7.707224237377764e-07, 'epoch': 1.75} {'loss': 0.5103, 'learning_rate': 7.705964071204308e-07, 'epoch': 1.75} {'loss': 0.4502, 'learning_rate': 7.704704003932273e-07, 'epoch': 1.75} {'loss': 0.4966, 'learning_rate': 7.703444035562968e-07, 'epoch': 1.75} {'loss': 0.4652, 'learning_rate': 7.702184166097748e-07, 'epoch': 1.75} {'loss': 0.4772, 'learning_rate': 7.700924395537979e-07, 'epoch': 1.75} {'loss': 0.4578, 'learning_rate': 7.699664723884993e-07, 'epoch': 1.75} {'loss': 0.6277, 'learning_rate': 7.698405151140165e-07, 'epoch': 1.75} {'loss': 0.3763, 'learning_rate': 7.697145677304785e-07, 'epoch': 1.75} {'loss': 0.4141, 'learning_rate': 7.695886302380284e-07, 'epoch': 1.75} {'loss': 0.5523, 'learning_rate': 7.694627026367952e-07, 'epoch': 1.75} {'loss': 0.5105, 'learning_rate': 7.693367849269162e-07, 'epoch': 1.75} {'loss': 0.507, 'learning_rate': 7.69210877108526e-07, 'epoch': 1.75} {'loss': 0.5011, 'learning_rate': 7.69084979181759e-07, 'epoch': 1.75} {'loss': 0.5248, 'learning_rate': 7.689590911467526e-07, 'epoch': 1.75} {'loss': 0.5395, 'learning_rate': 7.68833213003638e-07, 'epoch': 1.75} {'loss': 0.5808, 'learning_rate': 7.687073447525517e-07, 'epoch': 1.75} {'loss': 0.4066, 'learning_rate': 7.685814863936291e-07, 'epoch': 1.75} {'loss': 0.6196, 'learning_rate': 7.684556379270048e-07, 'epoch': 1.75} {'loss': 0.4787, 'learning_rate': 7.683297993528127e-07, 'epoch': 1.75} {'loss': 0.4649, 'learning_rate': 7.682039706711886e-07, 'epoch': 1.75} {'loss': 0.4923, 'learning_rate': 7.680781518822688e-07, 'epoch': 1.75} {'loss': 0.5012, 'learning_rate': 7.679523429861846e-07, 'epoch': 1.75} {'loss': 0.5136, 'learning_rate': 7.678265439830734e-07, 'epoch': 1.75} {'loss': 0.4929, 'learning_rate': 7.677007548730686e-07, 'epoch': 1.75} {'loss': 0.6235, 'learning_rate': 7.675749756563067e-07, 'epoch': 1.75} {'loss': 0.4198, 'learning_rate': 7.67449206332922e-07, 'epoch': 1.75} {'loss': 0.5502, 'learning_rate': 7.673234469030466e-07, 'epoch': 1.75} {'loss': 0.458, 'learning_rate': 7.671976973668194e-07, 'epoch': 1.75} {'loss': 0.487, 'learning_rate': 7.670719577243724e-07, 'epoch': 1.75} {'loss': 0.4925, 'learning_rate': 7.66946227975841e-07, 'epoch': 1.75} {'loss': 0.5049, 'learning_rate': 7.668205081213598e-07, 'epoch': 1.75} {'loss': 0.547, 'learning_rate': 7.666947981610639e-07, 'epoch': 1.75} {'loss': 0.4796, 'learning_rate': 7.665690980950902e-07, 'epoch': 1.75} {'loss': 0.5572, 'learning_rate': 7.664434079235683e-07, 'epoch': 1.75} {'loss': 0.4714, 'learning_rate': 7.663177276466371e-07, 'epoch': 1.75} {'loss': 0.6029, 'learning_rate': 7.661920572644288e-07, 'epoch': 1.75} {'loss': 0.5573, 'learning_rate': 7.660663967770788e-07, 'epoch': 1.75} {'loss': 0.4097, 'learning_rate': 7.659407461847224e-07, 'epoch': 1.75} {'loss': 0.5187, 'learning_rate': 7.65815105487494e-07, 'epoch': 1.75} {'loss': 0.5148, 'learning_rate': 7.656894746855303e-07, 'epoch': 1.75} {'loss': 0.5076, 'learning_rate': 7.655638537789611e-07, 'epoch': 1.75} {'loss': 0.5125, 'learning_rate': 7.654382427679252e-07, 'epoch': 1.75} {'loss': 0.5801, 'learning_rate': 7.653126416525547e-07, 'epoch': 1.75} {'loss': 0.4677, 'learning_rate': 7.651870504329851e-07, 'epoch': 1.75} {'loss': 0.4565, 'learning_rate': 7.650614691093506e-07, 'epoch': 1.75} {'loss': 0.5654, 'learning_rate': 7.649358976817888e-07, 'epoch': 1.75} {'loss': 0.5764, 'learning_rate': 7.6481033615043e-07, 'epoch': 1.75} {'loss': 0.5054, 'learning_rate': 7.646847845154104e-07, 'epoch': 1.75} {'loss': 0.6015, 'learning_rate': 7.645592427768644e-07, 'epoch': 1.75} {'loss': 0.5937, 'learning_rate': 7.644337109349264e-07, 'epoch': 1.75} {'loss': 0.5089, 'learning_rate': 7.643081889897319e-07, 'epoch': 1.75} {'loss': 0.3149, 'learning_rate': 7.64182676941414e-07, 'epoch': 1.75} {'loss': 0.3732, 'learning_rate': 7.640571747901104e-07, 'epoch': 1.75} {'loss': 0.5213, 'learning_rate': 7.63931682535951e-07, 'epoch': 1.75} {'loss': 0.3685, 'learning_rate': 7.638062001790724e-07, 'epoch': 1.75} {'loss': 0.4295, 'learning_rate': 7.63680727719609e-07, 'epoch': 1.75} {'loss': 0.5928, 'learning_rate': 7.635552651576961e-07, 'epoch': 1.75} {'loss': 0.3555, 'learning_rate': 7.634298124934669e-07, 'epoch': 1.75} {'loss': 0.4893, 'learning_rate': 7.63304369727056e-07, 'epoch': 1.75} {'loss': 0.4649, 'learning_rate': 7.631789368585996e-07, 'epoch': 1.75} {'loss': 0.5896, 'learning_rate': 7.6305351388823e-07, 'epoch': 1.75} {'loss': 0.4303, 'learning_rate': 7.629281008160816e-07, 'epoch': 1.75} {'loss': 0.6316, 'learning_rate': 7.628026976422886e-07, 'epoch': 1.75} {'loss': 0.541, 'learning_rate': 7.626773043669877e-07, 'epoch': 1.75} {'loss': 0.4458, 'learning_rate': 7.62551920990312e-07, 'epoch': 1.75} {'loss': 0.677, 'learning_rate': 7.624265475123938e-07, 'epoch': 1.75} {'loss': 0.3722, 'learning_rate': 7.623011839333716e-07, 'epoch': 1.75} {'loss': 0.56, 'learning_rate': 7.621758302533766e-07, 'epoch': 1.75} {'loss': 0.4774, 'learning_rate': 7.620504864725431e-07, 'epoch': 1.75} {'loss': 0.5122, 'learning_rate': 7.619251525910065e-07, 'epoch': 1.75} {'loss': 0.5304, 'learning_rate': 7.617998286089012e-07, 'epoch': 1.75} {'loss': 0.4578, 'learning_rate': 7.616745145263626e-07, 'epoch': 1.75} {'loss': 0.3382, 'learning_rate': 7.615492103435207e-07, 'epoch': 1.75} {'loss': 0.4768, 'learning_rate': 7.614239160605153e-07, 'epoch': 1.75} {'loss': 0.4984, 'learning_rate': 7.612986316774773e-07, 'epoch': 1.75} {'loss': 0.4015, 'learning_rate': 7.611733571945413e-07, 'epoch': 1.75} {'loss': 0.5952, 'learning_rate': 7.610480926118413e-07, 'epoch': 1.75} {'loss': 0.3502, 'learning_rate': 7.60922837929512e-07, 'epoch': 1.75} {'loss': 0.5098, 'learning_rate': 7.607975931476907e-07, 'epoch': 1.75} {'loss': 0.5092, 'learning_rate': 7.606723582665043e-07, 'epoch': 1.75} {'loss': 0.7207, 'learning_rate': 7.605471332860947e-07, 'epoch': 1.75} {'loss': 0.5296, 'learning_rate': 7.604219182065909e-07, 'epoch': 1.75} {'loss': 0.4892, 'learning_rate': 7.602967130281303e-07, 'epoch': 1.75} {'loss': 0.3853, 'learning_rate': 7.601715177508462e-07, 'epoch': 1.75} {'loss': 0.5829, 'learning_rate': 7.600463323748686e-07, 'epoch': 1.75} {'loss': 0.5098, 'learning_rate': 7.599211569003395e-07, 'epoch': 1.75} {'loss': 0.4549, 'learning_rate': 7.597959913273856e-07, 'epoch': 1.75} {'loss': 0.643, 'learning_rate': 7.596708356561466e-07, 'epoch': 1.75} {'loss': 0.4555, 'learning_rate': 7.595456898867537e-07, 'epoch': 1.75} {'loss': 0.5124, 'learning_rate': 7.594205540193412e-07, 'epoch': 1.75} {'loss': 0.4392, 'learning_rate': 7.592954280540455e-07, 'epoch': 1.75} {'loss': 0.6159, 'learning_rate': 7.591703119909943e-07, 'epoch': 1.75} {'loss': 0.623, 'learning_rate': 7.590452058303311e-07, 'epoch': 1.75} {'loss': 0.554, 'learning_rate': 7.589201095721821e-07, 'epoch': 1.75} {'loss': 0.4591, 'learning_rate': 7.587950232166852e-07, 'epoch': 1.75} {'loss': 0.588, 'learning_rate': 7.586699467639724e-07, 'epoch': 1.75} {'loss': 0.6117, 'learning_rate': 7.585448802141793e-07, 'epoch': 1.75} {'loss': 0.6054, 'learning_rate': 7.584198235674422e-07, 'epoch': 1.75} {'loss': 0.5082, 'learning_rate': 7.58294776823888e-07, 'epoch': 1.75} {'loss': 0.599, 'learning_rate': 7.581697399836585e-07, 'epoch': 1.75} {'loss': 0.5131, 'learning_rate': 7.580447130468826e-07, 'epoch': 1.75} {'loss': 0.593, 'learning_rate': 7.579196960136958e-07, 'epoch': 1.75} {'loss': 0.3498, 'learning_rate': 7.577946888842325e-07, 'epoch': 1.75} {'loss': 0.3657, 'learning_rate': 7.576696916586257e-07, 'epoch': 1.75} {'loss': 0.5478, 'learning_rate': 7.575447043370121e-07, 'epoch': 1.75} {'loss': 0.5095, 'learning_rate': 7.574197269195205e-07, 'epoch': 1.75} {'loss': 0.4412, 'learning_rate': 7.572947594062907e-07, 'epoch': 1.75} {'loss': 0.6485, 'learning_rate': 7.571698017974527e-07, 'epoch': 1.75} {'loss': 0.5481, 'learning_rate': 7.570448540931408e-07, 'epoch': 1.75} {'loss': 0.5675, 'learning_rate': 7.569199162934915e-07, 'epoch': 1.75} {'loss': 0.4372, 'learning_rate': 7.567949883986336e-07, 'epoch': 1.75} {'loss': 0.4736, 'learning_rate': 7.566700704087071e-07, 'epoch': 1.75} {'loss': 0.3932, 'learning_rate': 7.565451623238407e-07, 'epoch': 1.75} {'loss': 0.4225, 'learning_rate': 7.56420264144172e-07, 'epoch': 1.75} {'loss': 0.5231, 'learning_rate': 7.562953758698333e-07, 'epoch': 1.75} {'loss': 0.5335, 'learning_rate': 7.561704975009576e-07, 'epoch': 1.75} {'loss': 0.3697, 'learning_rate': 7.560456290376805e-07, 'epoch': 1.75} {'loss': 0.585, 'learning_rate': 7.559207704801319e-07, 'epoch': 1.75} {'loss': 0.4388, 'learning_rate': 7.557959218284527e-07, 'epoch': 1.75} {'loss': 0.496, 'learning_rate': 7.556710830827685e-07, 'epoch': 1.75} {'loss': 0.5801, 'learning_rate': 7.555462542432202e-07, 'epoch': 1.75} {'loss': 0.5529, 'learning_rate': 7.554214353099377e-07, 'epoch': 1.75} {'loss': 0.4602, 'learning_rate': 7.552966262830541e-07, 'epoch': 1.75} {'loss': 0.3093, 'learning_rate': 7.551718271627074e-07, 'epoch': 1.75} {'loss': 0.579, 'learning_rate': 7.550470379490248e-07, 'epoch': 1.75} {'loss': 0.4918, 'learning_rate': 7.549222586421467e-07, 'epoch': 1.75} {'loss': 0.5204, 'learning_rate': 7.547974892422006e-07, 'epoch': 1.75} {'loss': 0.4955, 'learning_rate': 7.546727297493273e-07, 'epoch': 1.75} {'loss': 0.4505, 'learning_rate': 7.545479801636546e-07, 'epoch': 1.75} {'loss': 0.6202, 'learning_rate': 7.54423240485318e-07, 'epoch': 1.75} {'loss': 0.4627, 'learning_rate': 7.542985107144529e-07, 'epoch': 1.75} {'loss': 0.5802, 'learning_rate': 7.541737908511881e-07, 'epoch': 1.75} {'loss': 0.4414, 'learning_rate': 7.540490808956647e-07, 'epoch': 1.75} {'loss': 0.5, 'learning_rate': 7.539243808480101e-07, 'epoch': 1.75} {'loss': 0.5581, 'learning_rate': 7.5379969070836e-07, 'epoch': 1.75} {'loss': 0.5645, 'learning_rate': 7.536750104768475e-07, 'epoch': 1.75} {'loss': 0.5227, 'learning_rate': 7.535503401536082e-07, 'epoch': 1.75} {'loss': 0.5193, 'learning_rate': 7.534256797387751e-07, 'epoch': 1.75} {'loss': 0.654, 'learning_rate': 7.533010292324772e-07, 'epoch': 1.75} {'loss': 0.4085, 'learning_rate': 7.531763886348553e-07, 'epoch': 1.75} {'loss': 0.4845, 'learning_rate': 7.530517579460383e-07, 'epoch': 1.75} {'loss': 0.5344, 'learning_rate': 7.529271371661607e-07, 'epoch': 1.75} {'loss': 0.5844, 'learning_rate': 7.528025262953554e-07, 'epoch': 1.75} {'loss': 0.525, 'learning_rate': 7.52677925333758e-07, 'epoch': 1.75} {'loss': 0.558, 'learning_rate': 7.525533342815017e-07, 'epoch': 1.75} {'loss': 0.6385, 'learning_rate': 7.524287531387165e-07, 'epoch': 1.75} {'loss': 0.4091, 'learning_rate': 7.52304181905541e-07, 'epoch': 1.75} {'loss': 0.5092, 'learning_rate': 7.521796205821052e-07, 'epoch': 1.75} {'loss': 0.4741, 'learning_rate': 7.520550691685435e-07, 'epoch': 1.75} {'loss': 0.5414, 'learning_rate': 7.519305276649902e-07, 'epoch': 1.75} {'loss': 0.5469, 'learning_rate': 7.518059960715773e-07, 'epoch': 1.75} {'loss': 0.6359, 'learning_rate': 7.516814743884404e-07, 'epoch': 1.75} {'loss': 0.4844, 'learning_rate': 7.515569626157105e-07, 'epoch': 1.75} {'loss': 0.4542, 'learning_rate': 7.514324607535206e-07, 'epoch': 1.75} {'loss': 0.5767, 'learning_rate': 7.513079688020075e-07, 'epoch': 1.75} {'loss': 0.5334, 'learning_rate': 7.511834867613011e-07, 'epoch': 1.75} {'loss': 0.4844, 'learning_rate': 7.510590146315366e-07, 'epoch': 1.75} {'loss': 0.6271, 'learning_rate': 7.509345524128475e-07, 'epoch': 1.75} {'loss': 0.4883, 'learning_rate': 7.508101001053692e-07, 'epoch': 1.75} {'loss': 0.5046, 'learning_rate': 7.506856577092302e-07, 'epoch': 1.75} {'loss': 0.5642, 'learning_rate': 7.505612252245664e-07, 'epoch': 1.75} {'loss': 0.384, 'learning_rate': 7.504368026515108e-07, 'epoch': 1.75} {'loss': 0.4703, 'learning_rate': 7.503123899901976e-07, 'epoch': 1.75} {'loss': 0.3868, 'learning_rate': 7.501879872407591e-07, 'epoch': 1.75} {'loss': 0.6235, 'learning_rate': 7.500635944033297e-07, 'epoch': 1.75} {'loss': 0.3329, 'learning_rate': 7.499392114780424e-07, 'epoch': 1.75} {'loss': 0.5083, 'learning_rate': 7.498148384650295e-07, 'epoch': 1.75} {'loss': 0.5678, 'learning_rate': 7.49690475364424e-07, 'epoch': 1.75} {'loss': 0.5726, 'learning_rate': 7.495661221763606e-07, 'epoch': 1.75} {'loss': 0.549, 'learning_rate': 7.494417789009722e-07, 'epoch': 1.75} {'loss': 0.5202, 'learning_rate': 7.493174455383911e-07, 'epoch': 1.75} {'loss': 0.4646, 'learning_rate': 7.491931220887538e-07, 'epoch': 1.75} {'loss': 0.5096, 'learning_rate': 7.490688085521891e-07, 'epoch': 1.75} {'loss': 0.5279, 'learning_rate': 7.489445049288324e-07, 'epoch': 1.75} {'loss': 0.5093, 'learning_rate': 7.488202112188159e-07, 'epoch': 1.75} {'loss': 0.5132, 'learning_rate': 7.486959274222738e-07, 'epoch': 1.75} {'loss': 0.5959, 'learning_rate': 7.485716535393394e-07, 'epoch': 1.75} {'loss': 0.484, 'learning_rate': 7.484473895701461e-07, 'epoch': 1.75} {'loss': 0.475, 'learning_rate': 7.483231355148257e-07, 'epoch': 1.75} {'loss': 0.4621, 'learning_rate': 7.481988913735117e-07, 'epoch': 1.75} {'loss': 0.4725, 'learning_rate': 7.480746571463382e-07, 'epoch': 1.75} {'loss': 0.6701, 'learning_rate': 7.479504328334375e-07, 'epoch': 1.75} {'loss': 0.6543, 'learning_rate': 7.478262184349427e-07, 'epoch': 1.75} {'loss': 0.5461, 'learning_rate': 7.477020139509871e-07, 'epoch': 1.75} {'loss': 0.4145, 'learning_rate': 7.475778193817052e-07, 'epoch': 1.75} {'loss': 0.7266, 'learning_rate': 7.474536347272276e-07, 'epoch': 1.75} {'loss': 0.6059, 'learning_rate': 7.473294599876891e-07, 'epoch': 1.75} {'loss': 0.4532, 'learning_rate': 7.472052951632214e-07, 'epoch': 1.75} {'loss': 0.564, 'learning_rate': 7.470811402539579e-07, 'epoch': 1.75} {'loss': 0.577, 'learning_rate': 7.46956995260033e-07, 'epoch': 1.75} {'loss': 0.4056, 'learning_rate': 7.4683286018158e-07, 'epoch': 1.75} {'loss': 0.4682, 'learning_rate': 7.467087350187296e-07, 'epoch': 1.75} {'loss': 0.5128, 'learning_rate': 7.465846197716153e-07, 'epoch': 1.75} {'loss': 0.4111, 'learning_rate': 7.464605144403703e-07, 'epoch': 1.75} {'loss': 0.4964, 'learning_rate': 7.463364190251287e-07, 'epoch': 1.75} {'loss': 0.4838, 'learning_rate': 7.462123335260229e-07, 'epoch': 1.75} {'loss': 0.4615, 'learning_rate': 7.46088257943186e-07, 'epoch': 1.75} {'loss': 0.4572, 'learning_rate': 7.459641922767524e-07, 'epoch': 1.75} {'loss': 0.382, 'learning_rate': 7.45840136526852e-07, 'epoch': 1.75} {'loss': 0.5537, 'learning_rate': 7.457160906936179e-07, 'epoch': 1.75} {'loss': 0.6116, 'learning_rate': 7.455920547771855e-07, 'epoch': 1.75} {'loss': 0.5199, 'learning_rate': 7.454680287776861e-07, 'epoch': 1.75} {'loss': 0.4436, 'learning_rate': 7.453440126952527e-07, 'epoch': 1.75} {'loss': 0.5416, 'learning_rate': 7.452200065300186e-07, 'epoch': 1.75} {'loss': 0.5277, 'learning_rate': 7.450960102821181e-07, 'epoch': 1.75} {'loss': 0.4812, 'learning_rate': 7.449720239516811e-07, 'epoch': 1.75} {'loss': 0.4228, 'learning_rate': 7.44848047538842e-07, 'epoch': 1.75} {'loss': 0.4046, 'learning_rate': 7.447240810437329e-07, 'epoch': 1.75} {'loss': 0.4037, 'learning_rate': 7.44600124466488e-07, 'epoch': 1.75} {'loss': 0.6356, 'learning_rate': 7.444761778072407e-07, 'epoch': 1.75} {'loss': 0.3958, 'learning_rate': 7.443522410661197e-07, 'epoch': 1.75} {'loss': 0.6066, 'learning_rate': 7.442283142432639e-07, 'epoch': 1.75} {'loss': 0.4717, 'learning_rate': 7.441043973388006e-07, 'epoch': 1.75} {'loss': 0.5341, 'learning_rate': 7.439804903528658e-07, 'epoch': 1.75} {'loss': 0.5618, 'learning_rate': 7.438565932855901e-07, 'epoch': 1.75} {'loss': 0.4745, 'learning_rate': 7.43732706137108e-07, 'epoch': 1.75} {'loss': 0.4967, 'learning_rate': 7.436088289075538e-07, 'epoch': 1.75} {'loss': 0.6076, 'learning_rate': 7.434849615970541e-07, 'epoch': 1.75} {'loss': 0.5131, 'learning_rate': 7.433611042057498e-07, 'epoch': 1.75} {'loss': 0.5264, 'learning_rate': 7.432372567337676e-07, 'epoch': 1.75} {'loss': 0.5902, 'learning_rate': 7.431134191812417e-07, 'epoch': 1.75} {'loss': 0.4634, 'learning_rate': 7.429895915483077e-07, 'epoch': 1.75} {'loss': 0.5993, 'learning_rate': 7.42865773835092e-07, 'epoch': 1.75} {'loss': 0.4169, 'learning_rate': 7.427419660417346e-07, 'epoch': 1.75} {'loss': 0.3785, 'learning_rate': 7.426181681683609e-07, 'epoch': 1.75} {'loss': 0.5132, 'learning_rate': 7.424943802151119e-07, 'epoch': 1.75} {'loss': 0.5614, 'learning_rate': 7.423706021821131e-07, 'epoch': 1.75} {'loss': 0.4477, 'learning_rate': 7.422468340694999e-07, 'epoch': 1.75} {'loss': 0.4001, 'learning_rate': 7.421230758774067e-07, 'epoch': 1.75} {'loss': 0.4539, 'learning_rate': 7.4199932760596e-07, 'epoch': 1.75} {'loss': 0.4561, 'learning_rate': 7.418755892553009e-07, 'epoch': 1.75} {'loss': 0.4281, 'learning_rate': 7.417518608255536e-07, 'epoch': 1.75} {'loss': 0.5917, 'learning_rate': 7.416281423168592e-07, 'epoch': 1.75} {'loss': 0.5523, 'learning_rate': 7.415044337293431e-07, 'epoch': 1.75} {'loss': 0.51, 'learning_rate': 7.413807350631408e-07, 'epoch': 1.75} {'loss': 0.5709, 'learning_rate': 7.412570463183877e-07, 'epoch': 1.75} {'loss': 0.4737, 'learning_rate': 7.411333674952082e-07, 'epoch': 1.75} {'loss': 0.466, 'learning_rate': 7.410096985937443e-07, 'epoch': 1.75} {'loss': 0.5388, 'learning_rate': 7.408860396141204e-07, 'epoch': 1.75} {'loss': 0.5282, 'learning_rate': 7.407623905564765e-07, 'epoch': 1.75} {'loss': 0.5025, 'learning_rate': 7.406387514209401e-07, 'epoch': 1.75} {'loss': 0.4859, 'learning_rate': 7.405151222076434e-07, 'epoch': 1.75} {'loss': 0.3682, 'learning_rate': 7.403915029167241e-07, 'epoch': 1.75} {'loss': 0.4569, 'learning_rate': 7.402678935483065e-07, 'epoch': 1.75} {'loss': 0.5375, 'learning_rate': 7.401442941025316e-07, 'epoch': 1.75} {'loss': 0.5259, 'learning_rate': 7.40020704579525e-07, 'epoch': 1.75} {'loss': 0.5234, 'learning_rate': 7.398971249794229e-07, 'epoch': 1.75} {'loss': 0.4974, 'learning_rate': 7.397735553023567e-07, 'epoch': 1.75} {'loss': 0.6086, 'learning_rate': 7.396499955484593e-07, 'epoch': 1.75} {'loss': 0.4182, 'learning_rate': 7.395264457178641e-07, 'epoch': 1.75} {'loss': 0.4677, 'learning_rate': 7.394029058106989e-07, 'epoch': 1.75} {'loss': 0.4929, 'learning_rate': 7.392793758271022e-07, 'epoch': 1.75} {'loss': 0.463, 'learning_rate': 7.391558557672018e-07, 'epoch': 1.75} {'loss': 0.504, 'learning_rate': 7.390323456311321e-07, 'epoch': 1.75} {'loss': 0.5339, 'learning_rate': 7.389088454190252e-07, 'epoch': 1.75} {'loss': 0.5892, 'learning_rate': 7.387853551310132e-07, 'epoch': 1.75} {'loss': 0.6102, 'learning_rate': 7.386618747672303e-07, 'epoch': 1.75} {'loss': 0.4181, 'learning_rate': 7.385384043278032e-07, 'epoch': 1.75} {'loss': 0.5839, 'learning_rate': 7.384149438128718e-07, 'epoch': 1.75} {'loss': 0.465, 'learning_rate': 7.382914932225626e-07, 'epoch': 1.75} {'loss': 0.4506, 'learning_rate': 7.381680525570112e-07, 'epoch': 1.75} {'loss': 0.6193, 'learning_rate': 7.380446218163495e-07, 'epoch': 1.75} {'loss': 0.3694, 'learning_rate': 7.379212010007053e-07, 'epoch': 1.75} {'loss': 0.5534, 'learning_rate': 7.377977901102184e-07, 'epoch': 1.75} {'loss': 0.4772, 'learning_rate': 7.376743891450133e-07, 'epoch': 1.75} {'loss': 0.4418, 'learning_rate': 7.375509981052298e-07, 'epoch': 1.75} {'loss': 0.408, 'learning_rate': 7.374276169909944e-07, 'epoch': 1.75} {'loss': 0.4644, 'learning_rate': 7.373042458024415e-07, 'epoch': 1.75} {'loss': 0.5906, 'learning_rate': 7.371808845397055e-07, 'epoch': 1.75} {'loss': 0.4536, 'learning_rate': 7.370575332029117e-07, 'epoch': 1.75} {'loss': 0.3897, 'learning_rate': 7.369341917922013e-07, 'epoch': 1.75} {'loss': 0.555, 'learning_rate': 7.368108603076973e-07, 'epoch': 1.75} {'loss': 0.402, 'learning_rate': 7.366875387495409e-07, 'epoch': 1.75} {'loss': 0.6756, 'learning_rate': 7.365642271178574e-07, 'epoch': 1.75} {'loss': 0.5601, 'learning_rate': 7.364409254127824e-07, 'epoch': 1.75} {'loss': 0.628, 'learning_rate': 7.36317633634448e-07, 'epoch': 1.75} {'loss': 0.6482, 'learning_rate': 7.361943517829817e-07, 'epoch': 1.75} {'loss': 0.4953, 'learning_rate': 7.360710798585235e-07, 'epoch': 1.75} {'loss': 0.5003, 'learning_rate': 7.35947817861199e-07, 'epoch': 1.76} {'loss': 0.7131, 'learning_rate': 7.358245657911423e-07, 'epoch': 1.76} {'loss': 0.4637, 'learning_rate': 7.357013236484867e-07, 'epoch': 1.76} {'loss': 0.5092, 'learning_rate': 7.355780914333621e-07, 'epoch': 1.76} {'loss': 0.5647, 'learning_rate': 7.35454869145904e-07, 'epoch': 1.76} {'loss': 0.5619, 'learning_rate': 7.35331656786239e-07, 'epoch': 1.76} {'loss': 0.3248, 'learning_rate': 7.352084543545058e-07, 'epoch': 1.76} {'loss': 0.3348, 'learning_rate': 7.350852618508308e-07, 'epoch': 1.76} {'loss': 0.397, 'learning_rate': 7.349620792753476e-07, 'epoch': 1.76} {'loss': 0.4574, 'learning_rate': 7.348389066281903e-07, 'epoch': 1.76} {'loss': 0.536, 'learning_rate': 7.347157439094876e-07, 'epoch': 1.76} {'loss': 0.6024, 'learning_rate': 7.345925911193763e-07, 'epoch': 1.76} {'loss': 0.3847, 'learning_rate': 7.344694482579817e-07, 'epoch': 1.76} {'loss': 0.5818, 'learning_rate': 7.343463153254426e-07, 'epoch': 1.76} {'loss': 0.6554, 'learning_rate': 7.342231923218857e-07, 'epoch': 1.76} {'loss': 0.4857, 'learning_rate': 7.341000792474451e-07, 'epoch': 1.76} {'loss': 0.5053, 'learning_rate': 7.339769761022519e-07, 'epoch': 1.76} {'loss': 0.6083, 'learning_rate': 7.338538828864394e-07, 'epoch': 1.76} {'loss': 0.4815, 'learning_rate': 7.337307996001408e-07, 'epoch': 1.76} {'loss': 0.5688, 'learning_rate': 7.336077262434838e-07, 'epoch': 1.76} {'loss': 0.4295, 'learning_rate': 7.334846628166025e-07, 'epoch': 1.76} {'loss': 0.4794, 'learning_rate': 7.333616093196294e-07, 'epoch': 1.76} {'loss': 0.5748, 'learning_rate': 7.332385657526952e-07, 'epoch': 1.76} {'loss': 0.5825, 'learning_rate': 7.331155321159323e-07, 'epoch': 1.76} {'loss': 0.5962, 'learning_rate': 7.329925084094713e-07, 'epoch': 1.76} {'loss': 0.4267, 'learning_rate': 7.328694946334481e-07, 'epoch': 1.76} {'loss': 0.5001, 'learning_rate': 7.3274649078799e-07, 'epoch': 1.76} {'loss': 0.6194, 'learning_rate': 7.326234968732304e-07, 'epoch': 1.76} {'loss': 0.3863, 'learning_rate': 7.325005128893015e-07, 'epoch': 1.76} {'loss': 0.6551, 'learning_rate': 7.323775388363341e-07, 'epoch': 1.76} {'loss': 0.5278, 'learning_rate': 7.322545747144605e-07, 'epoch': 1.76} {'loss': 0.3868, 'learning_rate': 7.321316205238149e-07, 'epoch': 1.76} {'loss': 0.5788, 'learning_rate': 7.320086762645251e-07, 'epoch': 1.76} {'loss': 0.4327, 'learning_rate': 7.318857419367242e-07, 'epoch': 1.76} {'loss': 0.4255, 'learning_rate': 7.317628175405433e-07, 'epoch': 1.76} {'loss': 0.5339, 'learning_rate': 7.316399030761167e-07, 'epoch': 1.76} {'loss': 0.5801, 'learning_rate': 7.315169985435733e-07, 'epoch': 1.76} {'loss': 0.5306, 'learning_rate': 7.313941039430461e-07, 'epoch': 1.76} {'loss': 0.4761, 'learning_rate': 7.312712192746685e-07, 'epoch': 1.76} {'loss': 0.4435, 'learning_rate': 7.311483445385692e-07, 'epoch': 1.76} {'loss': 0.4874, 'learning_rate': 7.310254797348803e-07, 'epoch': 1.76} {'loss': 0.4573, 'learning_rate': 7.309026248637352e-07, 'epoch': 1.76} {'loss': 0.446, 'learning_rate': 7.307797799252636e-07, 'epoch': 1.76} {'loss': 0.4802, 'learning_rate': 7.306569449195977e-07, 'epoch': 1.76} {'loss': 0.6461, 'learning_rate': 7.305341198468708e-07, 'epoch': 1.76} {'loss': 0.4727, 'learning_rate': 7.304113047072137e-07, 'epoch': 1.76} {'loss': 0.4444, 'learning_rate': 7.302884995007565e-07, 'epoch': 1.76} {'loss': 0.4763, 'learning_rate': 7.301657042276311e-07, 'epoch': 1.76} {'loss': 0.5389, 'learning_rate': 7.300429188879709e-07, 'epoch': 1.76} {'loss': 0.4481, 'learning_rate': 7.299201434819058e-07, 'epoch': 1.76} {'loss': 0.6384, 'learning_rate': 7.29797378009569e-07, 'epoch': 1.76} {'loss': 0.4786, 'learning_rate': 7.296746224710882e-07, 'epoch': 1.76} {'loss': 0.4996, 'learning_rate': 7.29551876866601e-07, 'epoch': 1.76} {'loss': 0.5139, 'learning_rate': 7.294291411962351e-07, 'epoch': 1.76} {'loss': 0.53, 'learning_rate': 7.293064154601215e-07, 'epoch': 1.76} {'loss': 0.3333, 'learning_rate': 7.291836996583924e-07, 'epoch': 1.76} {'loss': 0.511, 'learning_rate': 7.290609937911808e-07, 'epoch': 1.76} {'loss': 0.5678, 'learning_rate': 7.28938297858618e-07, 'epoch': 1.76} {'loss': 0.6487, 'learning_rate': 7.288156118608325e-07, 'epoch': 1.76} {'loss': 0.4494, 'learning_rate': 7.286929357979588e-07, 'epoch': 1.76} {'loss': 0.5395, 'learning_rate': 7.285702696701269e-07, 'epoch': 1.76} {'loss': 0.471, 'learning_rate': 7.284476134774688e-07, 'epoch': 1.76} {'loss': 0.4485, 'learning_rate': 7.283249672201165e-07, 'epoch': 1.76} {'loss': 0.5181, 'learning_rate': 7.282023308982e-07, 'epoch': 1.76} {'loss': 0.5646, 'learning_rate': 7.280797045118537e-07, 'epoch': 1.76} {'loss': 0.3207, 'learning_rate': 7.279570880612053e-07, 'epoch': 1.76} {'loss': 0.5521, 'learning_rate': 7.278344815463878e-07, 'epoch': 1.76} {'loss': 0.3474, 'learning_rate': 7.277118849675313e-07, 'epoch': 1.76} {'loss': 0.4339, 'learning_rate': 7.275892983247701e-07, 'epoch': 1.76} {'loss': 0.4485, 'learning_rate': 7.274667216182341e-07, 'epoch': 1.76} {'loss': 0.4439, 'learning_rate': 7.27344154848052e-07, 'epoch': 1.76} {'loss': 0.5083, 'learning_rate': 7.272215980143604e-07, 'epoch': 1.76} {'loss': 0.4849, 'learning_rate': 7.270990511172859e-07, 'epoch': 1.76} {'loss': 0.5514, 'learning_rate': 7.269765141569618e-07, 'epoch': 1.76} {'loss': 0.5509, 'learning_rate': 7.268539871335201e-07, 'epoch': 1.76} {'loss': 0.3725, 'learning_rate': 7.267314700470907e-07, 'epoch': 1.76} {'loss': 0.6022, 'learning_rate': 7.266089628978068e-07, 'epoch': 1.76} {'loss': 0.5442, 'learning_rate': 7.264864656857962e-07, 'epoch': 1.76} {'loss': 0.5022, 'learning_rate': 7.263639784111942e-07, 'epoch': 1.76} {'loss': 0.5134, 'learning_rate': 7.262415010741297e-07, 'epoch': 1.76} {'loss': 0.5901, 'learning_rate': 7.261190336747337e-07, 'epoch': 1.76} {'loss': 0.5476, 'learning_rate': 7.259965762131382e-07, 'epoch': 1.76} {'loss': 0.4891, 'learning_rate': 7.258741286894755e-07, 'epoch': 1.76} {'loss': 0.5403, 'learning_rate': 7.257516911038764e-07, 'epoch': 1.76} {'loss': 0.621, 'learning_rate': 7.256292634564677e-07, 'epoch': 1.76} {'loss': 0.3906, 'learning_rate': 7.255068457473879e-07, 'epoch': 1.76} {'loss': 0.6047, 'learning_rate': 7.253844379767638e-07, 'epoch': 1.76} {'loss': 0.536, 'learning_rate': 7.252620401447264e-07, 'epoch': 1.76} {'loss': 0.4767, 'learning_rate': 7.251396522514098e-07, 'epoch': 1.76} {'loss': 0.531, 'learning_rate': 7.250172742969397e-07, 'epoch': 1.76} {'loss': 0.4803, 'learning_rate': 7.248949062814547e-07, 'epoch': 1.76} {'loss': 0.5347, 'learning_rate': 7.247725482050783e-07, 'epoch': 1.76} {'loss': 0.5562, 'learning_rate': 7.246502000679478e-07, 'epoch': 1.76} {'loss': 0.4544, 'learning_rate': 7.245278618701912e-07, 'epoch': 1.76} {'loss': 0.4971, 'learning_rate': 7.244055336119393e-07, 'epoch': 1.76} {'loss': 0.4932, 'learning_rate': 7.242832152933265e-07, 'epoch': 1.76} {'loss': 0.5003, 'learning_rate': 7.241609069144773e-07, 'epoch': 1.76} {'loss': 0.5453, 'learning_rate': 7.240386084755313e-07, 'epoch': 1.76} {'loss': 0.5156, 'learning_rate': 7.239163199766109e-07, 'epoch': 1.76} {'loss': 0.4484, 'learning_rate': 7.237940414178546e-07, 'epoch': 1.76} {'loss': 0.5171, 'learning_rate': 7.236717727993892e-07, 'epoch': 1.76} {'loss': 0.4141, 'learning_rate': 7.235495141213467e-07, 'epoch': 1.76} {'loss': 0.4898, 'learning_rate': 7.234272653838592e-07, 'epoch': 1.76} {'loss': 0.4872, 'learning_rate': 7.233050265870534e-07, 'epoch': 1.76} {'loss': 0.4697, 'learning_rate': 7.231827977310668e-07, 'epoch': 1.76} {'loss': 0.5518, 'learning_rate': 7.230605788160239e-07, 'epoch': 1.76} {'loss': 0.6752, 'learning_rate': 7.229383698420634e-07, 'epoch': 1.76} {'loss': 0.4467, 'learning_rate': 7.228161708093084e-07, 'epoch': 1.76} {'loss': 0.5034, 'learning_rate': 7.226939817178935e-07, 'epoch': 1.76} {'loss': 0.4935, 'learning_rate': 7.225718025679518e-07, 'epoch': 1.76} {'loss': 0.5055, 'learning_rate': 7.224496333596076e-07, 'epoch': 1.76} {'loss': 0.4657, 'learning_rate': 7.223274740929997e-07, 'epoch': 1.76} {'loss': 0.4365, 'learning_rate': 7.222053247682525e-07, 'epoch': 1.76} {'loss': 0.3586, 'learning_rate': 7.220831853855026e-07, 'epoch': 1.76} {'loss': 0.4525, 'learning_rate': 7.219610559448753e-07, 'epoch': 1.76} {'loss': 0.538, 'learning_rate': 7.218389364465051e-07, 'epoch': 1.76} {'loss': 0.6175, 'learning_rate': 7.217168268905239e-07, 'epoch': 1.76} {'loss': 0.4494, 'learning_rate': 7.215947272770563e-07, 'epoch': 1.76} {'loss': 0.5487, 'learning_rate': 7.214726376062409e-07, 'epoch': 1.76} {'loss': 0.5902, 'learning_rate': 7.213505578782043e-07, 'epoch': 1.76} {'loss': 0.4528, 'learning_rate': 7.212284880930764e-07, 'epoch': 1.76} {'loss': 0.5176, 'learning_rate': 7.211064282509906e-07, 'epoch': 1.76} {'loss': 0.5383, 'learning_rate': 7.209843783520765e-07, 'epoch': 1.76} {'loss': 0.5245, 'learning_rate': 7.208623383964675e-07, 'epoch': 1.76} {'loss': 0.5687, 'learning_rate': 7.207403083842879e-07, 'epoch': 1.76} {'loss': 0.6112, 'learning_rate': 7.206182883156765e-07, 'epoch': 1.76} {'loss': 0.5313, 'learning_rate': 7.204962781907576e-07, 'epoch': 1.76} {'loss': 0.4679, 'learning_rate': 7.203742780096645e-07, 'epoch': 1.76} {'loss': 0.4267, 'learning_rate': 7.202522877725294e-07, 'epoch': 1.76} {'loss': 0.685, 'learning_rate': 7.201303074794797e-07, 'epoch': 1.76} {'loss': 0.4902, 'learning_rate': 7.20008337130651e-07, 'epoch': 1.76} {'loss': 0.4871, 'learning_rate': 7.198863767261665e-07, 'epoch': 1.76} {'loss': 0.5464, 'learning_rate': 7.197644262661652e-07, 'epoch': 1.76} {'loss': 0.5245, 'learning_rate': 7.196424857507722e-07, 'epoch': 1.76} {'loss': 0.3817, 'learning_rate': 7.195205551801198e-07, 'epoch': 1.76} {'loss': 0.6004, 'learning_rate': 7.19398634554338e-07, 'epoch': 1.76} {'loss': 0.4846, 'learning_rate': 7.192767238735599e-07, 'epoch': 1.76} {'loss': 0.5522, 'learning_rate': 7.191548231379153e-07, 'epoch': 1.76} {'loss': 0.4147, 'learning_rate': 7.190329323475321e-07, 'epoch': 1.76} {'loss': 0.5016, 'learning_rate': 7.189110515025422e-07, 'epoch': 1.76} {'loss': 0.5447, 'learning_rate': 7.187891806030778e-07, 'epoch': 1.76} {'loss': 0.5745, 'learning_rate': 7.186673196492677e-07, 'epoch': 1.76} {'loss': 0.679, 'learning_rate': 7.185454686412452e-07, 'epoch': 1.76} {'loss': 0.4459, 'learning_rate': 7.184236275791356e-07, 'epoch': 1.76} {'loss': 0.6962, 'learning_rate': 7.183017964630767e-07, 'epoch': 1.76} {'loss': 0.4278, 'learning_rate': 7.181799752931928e-07, 'epoch': 1.76} {'loss': 0.3961, 'learning_rate': 7.180581640696171e-07, 'epoch': 1.76} {'loss': 0.6185, 'learning_rate': 7.179363627924796e-07, 'epoch': 1.76} {'loss': 0.602, 'learning_rate': 7.178145714619112e-07, 'epoch': 1.76} {'loss': 0.5545, 'learning_rate': 7.17692790078044e-07, 'epoch': 1.76} {'loss': 0.3657, 'learning_rate': 7.175710186410034e-07, 'epoch': 1.76} {'loss': 0.5564, 'learning_rate': 7.174492571509262e-07, 'epoch': 1.76} {'loss': 0.5476, 'learning_rate': 7.173275056079388e-07, 'epoch': 1.76} {'loss': 0.4306, 'learning_rate': 7.172057640121721e-07, 'epoch': 1.76} {'loss': 0.377, 'learning_rate': 7.170840323637573e-07, 'epoch': 1.76} {'loss': 0.5898, 'learning_rate': 7.169623106628254e-07, 'epoch': 1.76} {'loss': 0.5511, 'learning_rate': 7.168405989095085e-07, 'epoch': 1.76} {'loss': 0.4941, 'learning_rate': 7.167188971039318e-07, 'epoch': 1.76} {'loss': 0.5008, 'learning_rate': 7.165972052462288e-07, 'epoch': 1.76} {'loss': 0.5382, 'learning_rate': 7.164755233365306e-07, 'epoch': 1.76} {'loss': 0.3232, 'learning_rate': 7.163538513749657e-07, 'epoch': 1.76} {'loss': 0.5833, 'learning_rate': 7.162321893616663e-07, 'epoch': 1.76} {'loss': 0.649, 'learning_rate': 7.161105372967625e-07, 'epoch': 1.76} {'loss': 0.5595, 'learning_rate': 7.15988895180385e-07, 'epoch': 1.76} {'loss': 0.5383, 'learning_rate': 7.158672630126617e-07, 'epoch': 1.76} {'loss': 0.4154, 'learning_rate': 7.157456407937247e-07, 'epoch': 1.76} {'loss': 0.614, 'learning_rate': 7.156240285237037e-07, 'epoch': 1.76} {'loss': 0.4054, 'learning_rate': 7.155024262027311e-07, 'epoch': 1.76} {'loss': 0.5198, 'learning_rate': 7.153808338309342e-07, 'epoch': 1.76} {'loss': 0.5364, 'learning_rate': 7.152592514084444e-07, 'epoch': 1.76} {'loss': 0.5129, 'learning_rate': 7.151376789353947e-07, 'epoch': 1.76} {'loss': 0.5036, 'learning_rate': 7.150161164119119e-07, 'epoch': 1.76} {'loss': 0.3335, 'learning_rate': 7.148945638381266e-07, 'epoch': 1.76} {'loss': 0.5945, 'learning_rate': 7.147730212141702e-07, 'epoch': 1.76} {'loss': 0.5668, 'learning_rate': 7.146514885401723e-07, 'epoch': 1.76} {'loss': 0.5463, 'learning_rate': 7.14529965816263e-07, 'epoch': 1.76} {'loss': 0.4749, 'learning_rate': 7.144084530425754e-07, 'epoch': 1.76} {'loss': 0.4691, 'learning_rate': 7.142869502192351e-07, 'epoch': 1.76} {'loss': 0.5468, 'learning_rate': 7.141654573463741e-07, 'epoch': 1.76} {'loss': 0.6067, 'learning_rate': 7.140439744241234e-07, 'epoch': 1.76} {'loss': 0.5402, 'learning_rate': 7.13922501452613e-07, 'epoch': 1.76} {'loss': 0.5584, 'learning_rate': 7.138010384319716e-07, 'epoch': 1.76} {'loss': 0.5433, 'learning_rate': 7.136795853623313e-07, 'epoch': 1.76} {'loss': 0.4665, 'learning_rate': 7.135581422438231e-07, 'epoch': 1.76} {'loss': 0.6694, 'learning_rate': 7.134367090765737e-07, 'epoch': 1.76} {'loss': 0.4823, 'learning_rate': 7.13315285860715e-07, 'epoch': 1.76} {'loss': 0.5952, 'learning_rate': 7.131938725963772e-07, 'epoch': 1.76} {'loss': 0.4518, 'learning_rate': 7.13072469283691e-07, 'epoch': 1.76} {'loss': 0.4847, 'learning_rate': 7.129510759227853e-07, 'epoch': 1.76} {'loss': 0.5339, 'learning_rate': 7.128296925137912e-07, 'epoch': 1.76} {'loss': 0.4246, 'learning_rate': 7.127083190568384e-07, 'epoch': 1.76} {'loss': 0.6015, 'learning_rate': 7.125869555520571e-07, 'epoch': 1.76} {'loss': 0.6632, 'learning_rate': 7.124656019995757e-07, 'epoch': 1.76} {'loss': 0.5943, 'learning_rate': 7.123442583995266e-07, 'epoch': 1.76} {'loss': 0.533, 'learning_rate': 7.122229247520385e-07, 'epoch': 1.76} {'loss': 0.4932, 'learning_rate': 7.121016010572435e-07, 'epoch': 1.76} {'loss': 0.5548, 'learning_rate': 7.11980287315267e-07, 'epoch': 1.76} {'loss': 0.3736, 'learning_rate': 7.118589835262446e-07, 'epoch': 1.76} {'loss': 0.5577, 'learning_rate': 7.117376896903017e-07, 'epoch': 1.76} {'loss': 0.3907, 'learning_rate': 7.116164058075714e-07, 'epoch': 1.76} {'loss': 0.6012, 'learning_rate': 7.114951318781815e-07, 'epoch': 1.76} {'loss': 0.5453, 'learning_rate': 7.11373867902263e-07, 'epoch': 1.76} {'loss': 0.5557, 'learning_rate': 7.11252613879948e-07, 'epoch': 1.76} {'loss': 0.5053, 'learning_rate': 7.111313698113598e-07, 'epoch': 1.76} {'loss': 0.5474, 'learning_rate': 7.11010135696637e-07, 'epoch': 1.76} {'loss': 0.4528, 'learning_rate': 7.10888911535903e-07, 'epoch': 1.76} {'loss': 0.5972, 'learning_rate': 7.107676973292898e-07, 'epoch': 1.76} {'loss': 0.5435, 'learning_rate': 7.106464930769297e-07, 'epoch': 1.76} {'loss': 0.4741, 'learning_rate': 7.105252987789468e-07, 'epoch': 1.76} {'loss': 0.5225, 'learning_rate': 7.104041144354779e-07, 'epoch': 1.76} {'loss': 0.4561, 'learning_rate': 7.102829400466471e-07, 'epoch': 1.76} {'loss': 0.5763, 'learning_rate': 7.101617756125878e-07, 'epoch': 1.76} {'loss': 0.5856, 'learning_rate': 7.100406211334276e-07, 'epoch': 1.76} {'loss': 0.435, 'learning_rate': 7.099194766092976e-07, 'epoch': 1.76} {'loss': 0.4823, 'learning_rate': 7.097983420403287e-07, 'epoch': 1.76} {'loss': 0.4155, 'learning_rate': 7.096772174266464e-07, 'epoch': 1.76} {'loss': 0.4443, 'learning_rate': 7.095561027683873e-07, 'epoch': 1.76} {'loss': 0.4663, 'learning_rate': 7.094349980656745e-07, 'epoch': 1.76} {'loss': 0.4718, 'learning_rate': 7.093139033186414e-07, 'epoch': 1.76} {'loss': 0.5994, 'learning_rate': 7.091928185274166e-07, 'epoch': 1.76} {'loss': 0.4067, 'learning_rate': 7.090717436921302e-07, 'epoch': 1.76} {'loss': 0.4988, 'learning_rate': 7.089506788129142e-07, 'epoch': 1.76} {'loss': 0.5812, 'learning_rate': 7.088296238898928e-07, 'epoch': 1.76} {'loss': 0.5504, 'learning_rate': 7.087085789232017e-07, 'epoch': 1.76} {'loss': 0.5766, 'learning_rate': 7.085875439129675e-07, 'epoch': 1.76} {'loss': 0.6475, 'learning_rate': 7.084665188593187e-07, 'epoch': 1.76} {'loss': 0.5516, 'learning_rate': 7.083455037623899e-07, 'epoch': 1.76} {'loss': 0.3744, 'learning_rate': 7.08224498622303e-07, 'epoch': 1.76} {'loss': 0.5007, 'learning_rate': 7.081035034391958e-07, 'epoch': 1.76} {'loss': 0.4658, 'learning_rate': 7.079825182131917e-07, 'epoch': 1.76} {'loss': 0.4534, 'learning_rate': 7.078615429444258e-07, 'epoch': 1.76} {'loss': 0.5039, 'learning_rate': 7.077405776330226e-07, 'epoch': 1.76} {'loss': 0.4826, 'learning_rate': 7.076196222791154e-07, 'epoch': 1.76} {'loss': 0.5207, 'learning_rate': 7.074986768828329e-07, 'epoch': 1.76} {'loss': 0.6106, 'learning_rate': 7.073777414443017e-07, 'epoch': 1.76} {'loss': 0.5526, 'learning_rate': 7.072568159636572e-07, 'epoch': 1.76} {'loss': 0.4458, 'learning_rate': 7.071359004410216e-07, 'epoch': 1.76} {'loss': 0.3038, 'learning_rate': 7.070149948765326e-07, 'epoch': 1.76} {'loss': 0.4846, 'learning_rate': 7.068940992703144e-07, 'epoch': 1.76} {'loss': 0.4734, 'learning_rate': 7.06773213622498e-07, 'epoch': 1.76} {'loss': 0.3644, 'learning_rate': 7.066523379332135e-07, 'epoch': 1.76} {'loss': 0.5047, 'learning_rate': 7.065314722025874e-07, 'epoch': 1.76} {'loss': 0.5942, 'learning_rate': 7.064106164307549e-07, 'epoch': 1.76} {'loss': 0.5663, 'learning_rate': 7.062897706178384e-07, 'epoch': 1.76} {'loss': 0.5519, 'learning_rate': 7.061689347639745e-07, 'epoch': 1.76} {'loss': 0.4828, 'learning_rate': 7.060481088692883e-07, 'epoch': 1.76} {'loss': 0.5081, 'learning_rate': 7.0592729293391e-07, 'epoch': 1.76} {'loss': 0.4324, 'learning_rate': 7.058064869579717e-07, 'epoch': 1.76} {'loss': 0.5358, 'learning_rate': 7.056856909415966e-07, 'epoch': 1.76} {'loss': 0.4668, 'learning_rate': 7.055649048849222e-07, 'epoch': 1.76} {'loss': 0.6093, 'learning_rate': 7.054441287880698e-07, 'epoch': 1.76} {'loss': 0.3819, 'learning_rate': 7.053233626511757e-07, 'epoch': 1.76} {'loss': 0.5074, 'learning_rate': 7.052026064743667e-07, 'epoch': 1.76} {'loss': 0.4878, 'learning_rate': 7.050818602577702e-07, 'epoch': 1.76} {'loss': 0.4066, 'learning_rate': 7.049611240015197e-07, 'epoch': 1.76} {'loss': 0.4163, 'learning_rate': 7.048403977057394e-07, 'epoch': 1.76} {'loss': 0.5753, 'learning_rate': 7.047196813705648e-07, 'epoch': 1.76} {'loss': 0.3225, 'learning_rate': 7.045989749961179e-07, 'epoch': 1.76} {'loss': 0.5624, 'learning_rate': 7.044782785825366e-07, 'epoch': 1.76} {'loss': 0.4272, 'learning_rate': 7.043575921299428e-07, 'epoch': 1.76} {'loss': 0.4937, 'learning_rate': 7.042369156384699e-07, 'epoch': 1.76} {'loss': 0.4702, 'learning_rate': 7.041162491082476e-07, 'epoch': 1.76} {'loss': 0.6218, 'learning_rate': 7.039955925394004e-07, 'epoch': 1.76} {'loss': 0.3726, 'learning_rate': 7.038749459320637e-07, 'epoch': 1.76} {'loss': 0.4534, 'learning_rate': 7.03754309286363e-07, 'epoch': 1.76} {'loss': 0.5652, 'learning_rate': 7.036336826024292e-07, 'epoch': 1.76} {'loss': 0.5181, 'learning_rate': 7.035130658803901e-07, 'epoch': 1.76} {'loss': 0.5193, 'learning_rate': 7.033924591203755e-07, 'epoch': 1.76} {'loss': 0.4504, 'learning_rate': 7.032718623225166e-07, 'epoch': 1.76} {'loss': 0.5077, 'learning_rate': 7.031512754869386e-07, 'epoch': 1.76} {'loss': 0.4111, 'learning_rate': 7.030306986137758e-07, 'epoch': 1.76} {'loss': 0.6094, 'learning_rate': 7.029101317031528e-07, 'epoch': 1.76} {'loss': 0.6017, 'learning_rate': 7.027895747552016e-07, 'epoch': 1.76} {'loss': 0.6511, 'learning_rate': 7.026690277700499e-07, 'epoch': 1.76} {'loss': 0.5067, 'learning_rate': 7.025484907478275e-07, 'epoch': 1.76} {'loss': 0.3507, 'learning_rate': 7.024279636886655e-07, 'epoch': 1.76} {'loss': 0.5802, 'learning_rate': 7.023074465926871e-07, 'epoch': 1.76} {'loss': 0.3839, 'learning_rate': 7.021869394600289e-07, 'epoch': 1.76} {'loss': 0.4662, 'learning_rate': 7.020664422908153e-07, 'epoch': 1.76} {'loss': 0.5669, 'learning_rate': 7.01945955085177e-07, 'epoch': 1.76} {'loss': 0.5356, 'learning_rate': 7.01825477843242e-07, 'epoch': 1.76} {'loss': 0.4086, 'learning_rate': 7.017050105651402e-07, 'epoch': 1.76} {'loss': 0.4646, 'learning_rate': 7.015845532510035e-07, 'epoch': 1.76} {'loss': 0.459, 'learning_rate': 7.014641059009553e-07, 'epoch': 1.76} {'loss': 0.5096, 'learning_rate': 7.013436685151287e-07, 'epoch': 1.76} {'loss': 0.4537, 'learning_rate': 7.012232410936504e-07, 'epoch': 1.76} {'loss': 0.4709, 'learning_rate': 7.011028236366513e-07, 'epoch': 1.76} {'loss': 0.5613, 'learning_rate': 7.009824161442602e-07, 'epoch': 1.76} {'loss': 0.4111, 'learning_rate': 7.008620186166048e-07, 'epoch': 1.76} {'loss': 0.4381, 'learning_rate': 7.007416310538174e-07, 'epoch': 1.76} {'loss': 0.4062, 'learning_rate': 7.006212534560219e-07, 'epoch': 1.76} {'loss': 0.5617, 'learning_rate': 7.00500885823352e-07, 'epoch': 1.76} {'loss': 0.4655, 'learning_rate': 7.003805281559328e-07, 'epoch': 1.76} {'loss': 0.5329, 'learning_rate': 7.002601804538966e-07, 'epoch': 1.76} {'loss': 0.5081, 'learning_rate': 7.0013984271737e-07, 'epoch': 1.76} {'loss': 0.3835, 'learning_rate': 7.00019514946485e-07, 'epoch': 1.76} {'loss': 0.4132, 'learning_rate': 6.998991971413672e-07, 'epoch': 1.76} {'loss': 0.3871, 'learning_rate': 6.997788893021462e-07, 'epoch': 1.76} {'loss': 0.4082, 'learning_rate': 6.996585914289511e-07, 'epoch': 1.76} {'loss': 0.5736, 'learning_rate': 6.995383035219128e-07, 'epoch': 1.76} {'loss': 0.5661, 'learning_rate': 6.994180255811567e-07, 'epoch': 1.76} {'loss': 0.2691, 'learning_rate': 6.992977576068172e-07, 'epoch': 1.76} {'loss': 0.5182, 'learning_rate': 6.991774995990163e-07, 'epoch': 1.76} {'loss': 0.595, 'learning_rate': 6.990572515578875e-07, 'epoch': 1.76} {'loss': 0.4128, 'learning_rate': 6.989370134835571e-07, 'epoch': 1.76} {'loss': 0.6289, 'learning_rate': 6.988167853761563e-07, 'epoch': 1.76} {'loss': 0.4643, 'learning_rate': 6.986965672358114e-07, 'epoch': 1.76} {'loss': 0.3754, 'learning_rate': 6.985763590626537e-07, 'epoch': 1.76} {'loss': 0.5109, 'learning_rate': 6.984561608568119e-07, 'epoch': 1.76} {'loss': 0.4794, 'learning_rate': 6.983359726184136e-07, 'epoch': 1.76} {'loss': 0.6123, 'learning_rate': 6.982157943475865e-07, 'epoch': 1.76} {'loss': 0.3148, 'learning_rate': 6.980956260444605e-07, 'epoch': 1.76} {'loss': 0.507, 'learning_rate': 6.979754677091655e-07, 'epoch': 1.76} {'loss': 0.4859, 'learning_rate': 6.978553193418292e-07, 'epoch': 1.76} {'loss': 0.462, 'learning_rate': 6.977351809425814e-07, 'epoch': 1.76} {'loss': 0.4799, 'learning_rate': 6.976150525115488e-07, 'epoch': 1.76} {'loss': 0.488, 'learning_rate': 6.974949340488612e-07, 'epoch': 1.76} {'loss': 0.493, 'learning_rate': 6.973748255546475e-07, 'epoch': 1.76} {'loss': 0.5294, 'learning_rate': 6.972547270290364e-07, 'epoch': 1.76} {'loss': 0.5655, 'learning_rate': 6.971346384721566e-07, 'epoch': 1.76} {'loss': 0.5124, 'learning_rate': 6.97014559884136e-07, 'epoch': 1.76} {'loss': 0.4628, 'learning_rate': 6.968944912651066e-07, 'epoch': 1.76} {'loss': 0.5362, 'learning_rate': 6.967744326151915e-07, 'epoch': 1.76} {'loss': 0.403, 'learning_rate': 6.96654383934523e-07, 'epoch': 1.76} {'loss': 0.5211, 'learning_rate': 6.965343452232287e-07, 'epoch': 1.76} {'loss': 0.466, 'learning_rate': 6.964143164814386e-07, 'epoch': 1.76} {'loss': 0.4962, 'learning_rate': 6.96294297709279e-07, 'epoch': 1.76} {'loss': 0.5041, 'learning_rate': 6.961742889068801e-07, 'epoch': 1.76} {'loss': 0.5881, 'learning_rate': 6.960542900743716e-07, 'epoch': 1.76} {'loss': 0.5184, 'learning_rate': 6.959343012118802e-07, 'epoch': 1.76} {'loss': 0.3572, 'learning_rate': 6.958143223195335e-07, 'epoch': 1.76} {'loss': 0.4024, 'learning_rate': 6.956943533974625e-07, 'epoch': 1.76} {'loss': 0.4603, 'learning_rate': 6.955743944457938e-07, 'epoch': 1.76} {'loss': 0.4153, 'learning_rate': 6.954544454646595e-07, 'epoch': 1.76} {'loss': 0.5183, 'learning_rate': 6.953345064541817e-07, 'epoch': 1.76} {'loss': 0.4683, 'learning_rate': 6.952145774144969e-07, 'epoch': 1.76} {'loss': 0.3965, 'learning_rate': 6.950946583457264e-07, 'epoch': 1.76} {'loss': 0.5886, 'learning_rate': 6.94974749248003e-07, 'epoch': 1.76} {'loss': 0.3461, 'learning_rate': 6.948548501214536e-07, 'epoch': 1.76} {'loss': 0.39, 'learning_rate': 6.947349609662069e-07, 'epoch': 1.76} {'loss': 0.5186, 'learning_rate': 6.946150817823938e-07, 'epoch': 1.76} {'loss': 0.4907, 'learning_rate': 6.944952125701365e-07, 'epoch': 1.76} {'loss': 0.4335, 'learning_rate': 6.943753533295705e-07, 'epoch': 1.76} {'loss': 0.4969, 'learning_rate': 6.942555040608201e-07, 'epoch': 1.76} {'loss': 0.5403, 'learning_rate': 6.941356647640152e-07, 'epoch': 1.76} {'loss': 0.4676, 'learning_rate': 6.940158354392835e-07, 'epoch': 1.76} {'loss': 0.5938, 'learning_rate': 6.938960160867536e-07, 'epoch': 1.76} {'loss': 0.3734, 'learning_rate': 6.937762067065556e-07, 'epoch': 1.76} {'loss': 0.5633, 'learning_rate': 6.936564072988128e-07, 'epoch': 1.76} {'loss': 0.4597, 'learning_rate': 6.935366178636605e-07, 'epoch': 1.76} {'loss': 0.4575, 'learning_rate': 6.93416838401223e-07, 'epoch': 1.76} {'loss': 0.4736, 'learning_rate': 6.93297068911628e-07, 'epoch': 1.76} {'loss': 0.3903, 'learning_rate': 6.931773093950078e-07, 'epoch': 1.76} {'loss': 0.5618, 'learning_rate': 6.930575598514844e-07, 'epoch': 1.76} {'loss': 0.5468, 'learning_rate': 6.929378202811932e-07, 'epoch': 1.76} {'loss': 0.4581, 'learning_rate': 6.928180906842563e-07, 'epoch': 1.76} {'loss': 0.6007, 'learning_rate': 6.926983710608071e-07, 'epoch': 1.76} {'loss': 0.4058, 'learning_rate': 6.925786614109709e-07, 'epoch': 1.76} {'loss': 0.4087, 'learning_rate': 6.924589617348765e-07, 'epoch': 1.76} {'loss': 0.5051, 'learning_rate': 6.923392720326538e-07, 'epoch': 1.76} {'loss': 0.4321, 'learning_rate': 6.922195923044261e-07, 'epoch': 1.76} {'loss': 0.4941, 'learning_rate': 6.920999225503289e-07, 'epoch': 1.76} {'loss': 0.4685, 'learning_rate': 6.919802627704831e-07, 'epoch': 1.76} {'loss': 0.7017, 'learning_rate': 6.918606129650241e-07, 'epoch': 1.76} {'loss': 0.4704, 'learning_rate': 6.917409731340752e-07, 'epoch': 1.76} {'loss': 0.546, 'learning_rate': 6.916213432777652e-07, 'epoch': 1.76} {'loss': 0.5429, 'learning_rate': 6.915017233962251e-07, 'epoch': 1.76} {'loss': 0.5625, 'learning_rate': 6.913821134895781e-07, 'epoch': 1.76} {'loss': 0.5707, 'learning_rate': 6.912625135579587e-07, 'epoch': 1.76} {'loss': 0.4884, 'learning_rate': 6.9114292360149e-07, 'epoch': 1.76} {'loss': 0.467, 'learning_rate': 6.910233436203007e-07, 'epoch': 1.76} {'loss': 0.4805, 'learning_rate': 6.909037736145208e-07, 'epoch': 1.76} {'loss': 0.4712, 'learning_rate': 6.90784213584278e-07, 'epoch': 1.76} {'loss': 0.4938, 'learning_rate': 6.90664663529702e-07, 'epoch': 1.76} {'loss': 0.5567, 'learning_rate': 6.905451234509153e-07, 'epoch': 1.76} {'loss': 0.4666, 'learning_rate': 6.90425593348053e-07, 'epoch': 1.76} {'loss': 0.4489, 'learning_rate': 6.903060732212385e-07, 'epoch': 1.76} {'loss': 0.5262, 'learning_rate': 6.901865630706007e-07, 'epoch': 1.76} {'loss': 0.5191, 'learning_rate': 6.900670628962691e-07, 'epoch': 1.76} {'loss': 0.6642, 'learning_rate': 6.899475726983695e-07, 'epoch': 1.76} {'loss': 0.4941, 'learning_rate': 6.89828092477034e-07, 'epoch': 1.76} {'loss': 0.5654, 'learning_rate': 6.897086222323857e-07, 'epoch': 1.76} {'loss': 0.5688, 'learning_rate': 6.895891619645568e-07, 'epoch': 1.76} {'loss': 0.4618, 'learning_rate': 6.894697116736715e-07, 'epoch': 1.76} {'loss': 0.4054, 'learning_rate': 6.89350271359861e-07, 'epoch': 1.76} {'loss': 0.64, 'learning_rate': 6.892308410232529e-07, 'epoch': 1.76} {'loss': 0.6236, 'learning_rate': 6.891114206639715e-07, 'epoch': 1.76} {'loss': 0.457, 'learning_rate': 6.889920102821501e-07, 'epoch': 1.76} {'loss': 0.5536, 'learning_rate': 6.888726098779119e-07, 'epoch': 1.76} {'loss': 0.4844, 'learning_rate': 6.88753219451389e-07, 'epoch': 1.76} {'loss': 0.6159, 'learning_rate': 6.88633839002707e-07, 'epoch': 1.76} {'loss': 0.483, 'learning_rate': 6.885144685319934e-07, 'epoch': 1.76} {'loss': 0.4875, 'learning_rate': 6.883951080393792e-07, 'epoch': 1.76} {'loss': 0.4518, 'learning_rate': 6.882757575249866e-07, 'epoch': 1.76} {'loss': 0.4677, 'learning_rate': 6.881564169889498e-07, 'epoch': 1.76} {'loss': 0.4121, 'learning_rate': 6.880370864313912e-07, 'epoch': 1.76} {'loss': 0.556, 'learning_rate': 6.879177658524449e-07, 'epoch': 1.76} {'loss': 0.4407, 'learning_rate': 6.877984552522332e-07, 'epoch': 1.76} {'loss': 0.5523, 'learning_rate': 6.876791546308847e-07, 'epoch': 1.76} {'loss': 0.4262, 'learning_rate': 6.875598639885317e-07, 'epoch': 1.76} {'loss': 0.3679, 'learning_rate': 6.874405833252951e-07, 'epoch': 1.76} {'loss': 0.5304, 'learning_rate': 6.873213126413092e-07, 'epoch': 1.76} {'loss': 0.4112, 'learning_rate': 6.872020519366985e-07, 'epoch': 1.76} {'loss': 0.5884, 'learning_rate': 6.870828012115904e-07, 'epoch': 1.76} {'loss': 0.6742, 'learning_rate': 6.86963560466114e-07, 'epoch': 1.76} {'loss': 0.5877, 'learning_rate': 6.868443297003957e-07, 'epoch': 1.76} {'loss': 0.3876, 'learning_rate': 6.867251089145677e-07, 'epoch': 1.76} {'loss': 0.3095, 'learning_rate': 6.866058981087497e-07, 'epoch': 1.76} {'loss': 0.6516, 'learning_rate': 6.864866972830775e-07, 'epoch': 1.76} {'loss': 0.4464, 'learning_rate': 6.863675064376741e-07, 'epoch': 1.76} {'loss': 0.406, 'learning_rate': 6.862483255726682e-07, 'epoch': 1.76} {'loss': 0.6269, 'learning_rate': 6.861291546881887e-07, 'epoch': 1.76} {'loss': 0.3634, 'learning_rate': 6.860099937843612e-07, 'epoch': 1.76} {'loss': 0.4662, 'learning_rate': 6.858908428613176e-07, 'epoch': 1.76} {'loss': 0.5553, 'learning_rate': 6.857717019191778e-07, 'epoch': 1.76} {'loss': 0.5909, 'learning_rate': 6.856525709580786e-07, 'epoch': 1.76} {'loss': 0.5333, 'learning_rate': 6.855334499781418e-07, 'epoch': 1.76} {'loss': 0.5163, 'learning_rate': 6.854143389794965e-07, 'epoch': 1.76} {'loss': 0.5006, 'learning_rate': 6.852952379622702e-07, 'epoch': 1.76} {'loss': 0.4526, 'learning_rate': 6.851761469265905e-07, 'epoch': 1.76} {'loss': 0.61, 'learning_rate': 6.850570658725864e-07, 'epoch': 1.76} {'loss': 0.2229, 'learning_rate': 6.849379948003843e-07, 'epoch': 1.76} {'loss': 0.6154, 'learning_rate': 6.848189337101108e-07, 'epoch': 1.76} {'loss': 0.5057, 'learning_rate': 6.846998826018947e-07, 'epoch': 1.76} {'loss': 0.3846, 'learning_rate': 6.845808414758637e-07, 'epoch': 1.76} {'loss': 0.631, 'learning_rate': 6.844618103321455e-07, 'epoch': 1.76} {'loss': 0.559, 'learning_rate': 6.843427891708665e-07, 'epoch': 1.76} {'loss': 0.5894, 'learning_rate': 6.842237779921568e-07, 'epoch': 1.76} {'loss': 0.3859, 'learning_rate': 6.841047767961407e-07, 'epoch': 1.76} {'loss': 0.5162, 'learning_rate': 6.839857855829469e-07, 'epoch': 1.76} {'loss': 0.5434, 'learning_rate': 6.83866804352703e-07, 'epoch': 1.76} {'loss': 0.5332, 'learning_rate': 6.837478331055369e-07, 'epoch': 1.76} {'loss': 0.6453, 'learning_rate': 6.836288718415751e-07, 'epoch': 1.76} {'loss': 0.4361, 'learning_rate': 6.835099205609474e-07, 'epoch': 1.76} {'loss': 0.5319, 'learning_rate': 6.833909792637805e-07, 'epoch': 1.76} {'loss': 0.6403, 'learning_rate': 6.832720479501986e-07, 'epoch': 1.76} {'loss': 0.5877, 'learning_rate': 6.831531266203328e-07, 'epoch': 1.76} {'loss': 0.6191, 'learning_rate': 6.830342152743085e-07, 'epoch': 1.76} {'loss': 0.6057, 'learning_rate': 6.829153139122546e-07, 'epoch': 1.76} {'loss': 0.462, 'learning_rate': 6.827964225342976e-07, 'epoch': 1.76} {'loss': 0.5215, 'learning_rate': 6.826775411405662e-07, 'epoch': 1.76} {'loss': 0.5761, 'learning_rate': 6.825586697311859e-07, 'epoch': 1.76} {'loss': 0.4882, 'learning_rate': 6.824398083062855e-07, 'epoch': 1.76} {'loss': 0.6661, 'learning_rate': 6.823209568659905e-07, 'epoch': 1.76} {'loss': 0.389, 'learning_rate': 6.822021154104297e-07, 'epoch': 1.76} {'loss': 0.6284, 'learning_rate': 6.820832839397317e-07, 'epoch': 1.76} {'loss': 0.457, 'learning_rate': 6.819644624540211e-07, 'epoch': 1.76} {'loss': 0.5469, 'learning_rate': 6.818456509534288e-07, 'epoch': 1.76} {'loss': 0.5863, 'learning_rate': 6.81726849438078e-07, 'epoch': 1.76} {'loss': 0.4624, 'learning_rate': 6.816080579080974e-07, 'epoch': 1.76} {'loss': 0.5974, 'learning_rate': 6.81489276363616e-07, 'epoch': 1.76} {'loss': 0.4334, 'learning_rate': 6.813705048047592e-07, 'epoch': 1.76} {'loss': 0.4178, 'learning_rate': 6.812517432316545e-07, 'epoch': 1.76} {'loss': 0.5983, 'learning_rate': 6.81132991644432e-07, 'epoch': 1.76} {'loss': 0.4277, 'learning_rate': 6.810142500432148e-07, 'epoch': 1.76} {'loss': 0.4414, 'learning_rate': 6.808955184281318e-07, 'epoch': 1.76} {'loss': 0.6411, 'learning_rate': 6.807767967993106e-07, 'epoch': 1.76} {'loss': 0.4289, 'learning_rate': 6.806580851568778e-07, 'epoch': 1.76} {'loss': 0.4554, 'learning_rate': 6.80539383500961e-07, 'epoch': 1.76} {'loss': 0.5825, 'learning_rate': 6.804206918316891e-07, 'epoch': 1.76} {'loss': 0.4259, 'learning_rate': 6.803020101491864e-07, 'epoch': 1.76} {'loss': 0.5632, 'learning_rate': 6.801833384535805e-07, 'epoch': 1.76} {'loss': 0.6171, 'learning_rate': 6.800646767450003e-07, 'epoch': 1.76} {'loss': 0.5256, 'learning_rate': 6.799460250235712e-07, 'epoch': 1.76} {'loss': 0.5567, 'learning_rate': 6.798273832894208e-07, 'epoch': 1.76} {'loss': 0.542, 'learning_rate': 6.79708751542677e-07, 'epoch': 1.76} {'loss': 0.6205, 'learning_rate': 6.795901297834684e-07, 'epoch': 1.76} {'loss': 0.5654, 'learning_rate': 6.794715180119182e-07, 'epoch': 1.76} {'loss': 0.5039, 'learning_rate': 6.793529162281565e-07, 'epoch': 1.76} {'loss': 0.4044, 'learning_rate': 6.792343244323074e-07, 'epoch': 1.76} {'loss': 0.4565, 'learning_rate': 6.791157426245021e-07, 'epoch': 1.76} {'loss': 0.3812, 'learning_rate': 6.789971708048659e-07, 'epoch': 1.76} {'loss': 0.4825, 'learning_rate': 6.788786089735222e-07, 'epoch': 1.76} {'loss': 0.5855, 'learning_rate': 6.787600571306052e-07, 'epoch': 1.76} {'loss': 0.5566, 'learning_rate': 6.78641515276236e-07, 'epoch': 1.76} {'loss': 0.4837, 'learning_rate': 6.785229834105445e-07, 'epoch': 1.76} {'loss': 0.4675, 'learning_rate': 6.78404461533656e-07, 'epoch': 1.76} {'loss': 0.4012, 'learning_rate': 6.782859496456984e-07, 'epoch': 1.76} {'loss': 0.6013, 'learning_rate': 6.781674477468014e-07, 'epoch': 1.76} {'loss': 0.5535, 'learning_rate': 6.780489558370851e-07, 'epoch': 1.76} {'loss': 0.4749, 'learning_rate': 6.779304739166836e-07, 'epoch': 1.76} {'loss': 0.4557, 'learning_rate': 6.778120019857204e-07, 'epoch': 1.76} {'loss': 0.3963, 'learning_rate': 6.77693540044323e-07, 'epoch': 1.77} {'loss': 0.4589, 'learning_rate': 6.77575088092618e-07, 'epoch': 1.77} {'loss': 0.4303, 'learning_rate': 6.77456646130733e-07, 'epoch': 1.77} {'loss': 0.426, 'learning_rate': 6.773382141587959e-07, 'epoch': 1.77} {'loss': 0.59, 'learning_rate': 6.772197921769285e-07, 'epoch': 1.77} {'loss': 0.5761, 'learning_rate': 6.771013801852655e-07, 'epoch': 1.77} {'loss': 0.5213, 'learning_rate': 6.769829781839276e-07, 'epoch': 1.77} {'loss': 0.3811, 'learning_rate': 6.768645861730449e-07, 'epoch': 1.77} {'loss': 0.4896, 'learning_rate': 6.76746204152744e-07, 'epoch': 1.77} {'loss': 0.5679, 'learning_rate': 6.76627832123149e-07, 'epoch': 1.77} {'loss': 0.6353, 'learning_rate': 6.76509470084391e-07, 'epoch': 1.77} {'loss': 0.5151, 'learning_rate': 6.763911180365912e-07, 'epoch': 1.77} {'loss': 0.5199, 'learning_rate': 6.762727759798837e-07, 'epoch': 1.77} {'loss': 0.5379, 'learning_rate': 6.761544439143886e-07, 'epoch': 1.77} {'loss': 0.7247, 'learning_rate': 6.760361218402367e-07, 'epoch': 1.77} {'loss': 0.5264, 'learning_rate': 6.759178097575547e-07, 'epoch': 1.77} {'loss': 0.5436, 'learning_rate': 6.757995076664658e-07, 'epoch': 1.77} {'loss': 0.3988, 'learning_rate': 6.756812155671022e-07, 'epoch': 1.77} {'loss': 0.5227, 'learning_rate': 6.755629334595848e-07, 'epoch': 1.77} {'loss': 0.5825, 'learning_rate': 6.754446613440458e-07, 'epoch': 1.77} {'loss': 0.5305, 'learning_rate': 6.753263992206083e-07, 'epoch': 1.77} {'loss': 0.4087, 'learning_rate': 6.752081470894001e-07, 'epoch': 1.77} {'loss': 0.5505, 'learning_rate': 6.750899049505489e-07, 'epoch': 1.77} {'loss': 0.4795, 'learning_rate': 6.749716728041778e-07, 'epoch': 1.77} {'loss': 0.5115, 'learning_rate': 6.748534506504201e-07, 'epoch': 1.77} {'loss': 0.4934, 'learning_rate': 6.747352384893946e-07, 'epoch': 1.77} {'loss': 0.5544, 'learning_rate': 6.746170363212357e-07, 'epoch': 1.77} {'loss': 0.4934, 'learning_rate': 6.744988441460643e-07, 'epoch': 1.77} {'loss': 0.657, 'learning_rate': 6.743806619640091e-07, 'epoch': 1.77} {'loss': 0.5635, 'learning_rate': 6.742624897751981e-07, 'epoch': 1.77} {'loss': 0.3317, 'learning_rate': 6.741443275797532e-07, 'epoch': 1.77} {'loss': 0.3836, 'learning_rate': 6.740261753778077e-07, 'epoch': 1.77} {'loss': 0.4181, 'learning_rate': 6.739080331694825e-07, 'epoch': 1.77} {'loss': 0.5165, 'learning_rate': 6.737899009549087e-07, 'epoch': 1.77} {'loss': 0.5821, 'learning_rate': 6.736717787342095e-07, 'epoch': 1.77} {'loss': 0.5014, 'learning_rate': 6.735536665075137e-07, 'epoch': 1.77} {'loss': 0.6109, 'learning_rate': 6.734355642749468e-07, 'epoch': 1.77} {'loss': 0.4664, 'learning_rate': 6.733174720366332e-07, 'epoch': 1.77} {'loss': 0.4465, 'learning_rate': 6.731993897927048e-07, 'epoch': 1.77} {'loss': 0.394, 'learning_rate': 6.730813175432838e-07, 'epoch': 1.77} {'loss': 0.5493, 'learning_rate': 6.729632552884979e-07, 'epoch': 1.77} {'loss': 0.5034, 'learning_rate': 6.728452030284738e-07, 'epoch': 1.77} {'loss': 0.4407, 'learning_rate': 6.727271607633368e-07, 'epoch': 1.77} {'loss': 0.3771, 'learning_rate': 6.726091284932168e-07, 'epoch': 1.77} {'loss': 0.4995, 'learning_rate': 6.724911062182349e-07, 'epoch': 1.77} {'loss': 0.417, 'learning_rate': 6.723730939385243e-07, 'epoch': 1.77} {'loss': 0.5565, 'learning_rate': 6.722550916542058e-07, 'epoch': 1.77} {'loss': 0.4186, 'learning_rate': 6.721370993654075e-07, 'epoch': 1.77} {'loss': 0.4424, 'learning_rate': 6.720191170722568e-07, 'epoch': 1.77} {'loss': 0.5794, 'learning_rate': 6.719011447748791e-07, 'epoch': 1.77} {'loss': 0.4349, 'learning_rate': 6.717831824734022e-07, 'epoch': 1.77} {'loss': 0.5461, 'learning_rate': 6.716652301679494e-07, 'epoch': 1.77} {'loss': 0.4116, 'learning_rate': 6.715472878586515e-07, 'epoch': 1.77} {'loss': 0.5903, 'learning_rate': 6.71429355545632e-07, 'epoch': 1.77} {'loss': 0.4054, 'learning_rate': 6.713114332290172e-07, 'epoch': 1.77} {'loss': 0.4476, 'learning_rate': 6.711935209089359e-07, 'epoch': 1.77} {'loss': 0.3521, 'learning_rate': 6.710756185855094e-07, 'epoch': 1.77} {'loss': 0.4297, 'learning_rate': 6.709577262588718e-07, 'epoch': 1.77} {'loss': 0.5652, 'learning_rate': 6.708398439291408e-07, 'epoch': 1.77} {'loss': 0.6833, 'learning_rate': 6.707219715964496e-07, 'epoch': 1.77} {'loss': 0.5309, 'learning_rate': 6.706041092609205e-07, 'epoch': 1.77} {'loss': 0.5614, 'learning_rate': 6.704862569226822e-07, 'epoch': 1.77} {'loss': 0.5779, 'learning_rate': 6.703684145818601e-07, 'epoch': 1.77} {'loss': 0.4204, 'learning_rate': 6.702505822385774e-07, 'epoch': 1.77} {'loss': 0.5046, 'learning_rate': 6.701327598929674e-07, 'epoch': 1.77} {'loss': 0.644, 'learning_rate': 6.7001494754515e-07, 'epoch': 1.77} {'loss': 0.4377, 'learning_rate': 6.698971451952529e-07, 'epoch': 1.77} {'loss': 0.681, 'learning_rate': 6.697793528434049e-07, 'epoch': 1.77} {'loss': 0.5114, 'learning_rate': 6.696615704897291e-07, 'epoch': 1.77} {'loss': 0.3922, 'learning_rate': 6.695437981343544e-07, 'epoch': 1.77} {'loss': 0.6882, 'learning_rate': 6.694260357774029e-07, 'epoch': 1.77} {'loss': 0.5661, 'learning_rate': 6.693082834190067e-07, 'epoch': 1.77} {'loss': 0.5098, 'learning_rate': 6.69190541059288e-07, 'epoch': 1.77} {'loss': 0.6186, 'learning_rate': 6.690728086983733e-07, 'epoch': 1.77} {'loss': 0.5707, 'learning_rate': 6.689550863363892e-07, 'epoch': 1.77} {'loss': 0.3856, 'learning_rate': 6.688373739734611e-07, 'epoch': 1.77} {'loss': 0.4178, 'learning_rate': 6.687196716097188e-07, 'epoch': 1.77} {'loss': 0.5336, 'learning_rate': 6.686019792452824e-07, 'epoch': 1.77} {'loss': 0.5223, 'learning_rate': 6.684842968802829e-07, 'epoch': 1.77} {'loss': 0.5834, 'learning_rate': 6.683666245148434e-07, 'epoch': 1.77} {'loss': 0.4227, 'learning_rate': 6.682489621490929e-07, 'epoch': 1.77} {'loss': 0.6036, 'learning_rate': 6.681313097831544e-07, 'epoch': 1.77} {'loss': 0.6216, 'learning_rate': 6.680136674171556e-07, 'epoch': 1.77} {'loss': 0.4977, 'learning_rate': 6.678960350512242e-07, 'epoch': 1.77} {'loss': 0.4995, 'learning_rate': 6.677784126854836e-07, 'epoch': 1.77} {'loss': 0.4446, 'learning_rate': 6.676608003200602e-07, 'epoch': 1.77} {'loss': 0.4895, 'learning_rate': 6.675431979550806e-07, 'epoch': 1.77} {'loss': 0.4162, 'learning_rate': 6.674256055906703e-07, 'epoch': 1.77} {'loss': 0.5831, 'learning_rate': 6.673080232269557e-07, 'epoch': 1.77} {'loss': 0.3094, 'learning_rate': 6.671904508640636e-07, 'epoch': 1.77} {'loss': 0.4553, 'learning_rate': 6.670728885021204e-07, 'epoch': 1.77} {'loss': 0.4942, 'learning_rate': 6.669553361412495e-07, 'epoch': 1.77} {'loss': 0.4908, 'learning_rate': 6.668377937815785e-07, 'epoch': 1.77} {'loss': 0.4683, 'learning_rate': 6.667202614232326e-07, 'epoch': 1.77} {'loss': 0.6006, 'learning_rate': 6.666027390663388e-07, 'epoch': 1.77} {'loss': 0.4575, 'learning_rate': 6.664852267110234e-07, 'epoch': 1.77} {'loss': 0.4931, 'learning_rate': 6.663677243574118e-07, 'epoch': 1.77} {'loss': 0.4827, 'learning_rate': 6.662502320056285e-07, 'epoch': 1.77} {'loss': 0.4031, 'learning_rate': 6.661327496558001e-07, 'epoch': 1.77} {'loss': 0.5949, 'learning_rate': 6.660152773080531e-07, 'epoch': 1.77} {'loss': 0.5747, 'learning_rate': 6.658978149625128e-07, 'epoch': 1.77} {'loss': 0.5404, 'learning_rate': 6.65780362619306e-07, 'epoch': 1.77} {'loss': 0.564, 'learning_rate': 6.65662920278558e-07, 'epoch': 1.77} {'loss': 0.5763, 'learning_rate': 6.655454879403967e-07, 'epoch': 1.77} {'loss': 0.5132, 'learning_rate': 6.654280656049427e-07, 'epoch': 1.77} {'loss': 0.478, 'learning_rate': 6.653106532723264e-07, 'epoch': 1.77} {'loss': 0.6136, 'learning_rate': 6.651932509426717e-07, 'epoch': 1.77} {'loss': 0.5318, 'learning_rate': 6.650758586161055e-07, 'epoch': 1.77} {'loss': 0.4224, 'learning_rate': 6.64958476292753e-07, 'epoch': 1.77} {'loss': 0.4674, 'learning_rate': 6.648411039727398e-07, 'epoch': 1.77} {'loss': 0.5312, 'learning_rate': 6.647237416561936e-07, 'epoch': 1.77} {'loss': 0.5778, 'learning_rate': 6.646063893432364e-07, 'epoch': 1.77} {'loss': 0.5073, 'learning_rate': 6.64489047033996e-07, 'epoch': 1.77} {'loss': 0.5868, 'learning_rate': 6.643717147285988e-07, 'epoch': 1.77} {'loss': 0.7082, 'learning_rate': 6.642543924271694e-07, 'epoch': 1.77} {'loss': 0.4635, 'learning_rate': 6.641370801298363e-07, 'epoch': 1.77} {'loss': 0.5463, 'learning_rate': 6.640197778367186e-07, 'epoch': 1.77} {'loss': 0.4966, 'learning_rate': 6.639024855479503e-07, 'epoch': 1.77} {'loss': 0.3584, 'learning_rate': 6.637852032636516e-07, 'epoch': 1.77} {'loss': 0.5801, 'learning_rate': 6.6366793098395e-07, 'epoch': 1.77} {'loss': 0.5883, 'learning_rate': 6.635506687089699e-07, 'epoch': 1.77} {'loss': 0.3483, 'learning_rate': 6.634334164388389e-07, 'epoch': 1.77} {'loss': 0.3906, 'learning_rate': 6.633161741736827e-07, 'epoch': 1.77} {'loss': 0.5994, 'learning_rate': 6.631989419136219e-07, 'epoch': 1.77} {'loss': 0.4628, 'learning_rate': 6.630817196587913e-07, 'epoch': 1.77} {'loss': 0.3488, 'learning_rate': 6.629645074093083e-07, 'epoch': 1.77} {'loss': 0.4373, 'learning_rate': 6.628473051653018e-07, 'epoch': 1.77} {'loss': 0.5517, 'learning_rate': 6.62730112926897e-07, 'epoch': 1.77} {'loss': 0.4982, 'learning_rate': 6.626129306942197e-07, 'epoch': 1.77} {'loss': 0.5347, 'learning_rate': 6.624957584673974e-07, 'epoch': 1.77} {'loss': 0.4644, 'learning_rate': 6.623785962465523e-07, 'epoch': 1.77} {'loss': 0.3998, 'learning_rate': 6.62261444031811e-07, 'epoch': 1.77} {'loss': 0.4366, 'learning_rate': 6.621443018232987e-07, 'epoch': 1.77} {'loss': 0.4554, 'learning_rate': 6.620271696211422e-07, 'epoch': 1.77} {'loss': 0.5813, 'learning_rate': 6.61910047425468e-07, 'epoch': 1.77} {'loss': 0.4894, 'learning_rate': 6.61792935236396e-07, 'epoch': 1.77} {'loss': 0.4176, 'learning_rate': 6.616758330540596e-07, 'epoch': 1.77} {'loss': 0.5345, 'learning_rate': 6.615587408785795e-07, 'epoch': 1.77} {'loss': 0.4979, 'learning_rate': 6.614416587100813e-07, 'epoch': 1.77} {'loss': 0.4836, 'learning_rate': 6.613245865486905e-07, 'epoch': 1.77} {'loss': 0.4167, 'learning_rate': 6.612075243945348e-07, 'epoch': 1.77} {'loss': 0.5978, 'learning_rate': 6.610904722477385e-07, 'epoch': 1.77} {'loss': 0.5541, 'learning_rate': 6.609734301084237e-07, 'epoch': 1.77} {'loss': 0.5746, 'learning_rate': 6.608563979767224e-07, 'epoch': 1.77} {'loss': 0.4138, 'learning_rate': 6.607393758527547e-07, 'epoch': 1.77} {'loss': 0.5772, 'learning_rate': 6.606223637366471e-07, 'epoch': 1.77} {'loss': 0.5191, 'learning_rate': 6.605053616285262e-07, 'epoch': 1.77} {'loss': 0.6818, 'learning_rate': 6.603883695285163e-07, 'epoch': 1.77} {'loss': 0.5235, 'learning_rate': 6.60271387436745e-07, 'epoch': 1.77} {'loss': 0.3762, 'learning_rate': 6.601544153533323e-07, 'epoch': 1.77} {'loss': 0.4034, 'learning_rate': 6.600374532784115e-07, 'epoch': 1.77} {'loss': 0.6524, 'learning_rate': 6.599205012121012e-07, 'epoch': 1.77} {'loss': 0.4142, 'learning_rate': 6.598035591545283e-07, 'epoch': 1.77} {'loss': 0.5873, 'learning_rate': 6.596866271058211e-07, 'epoch': 1.77} {'loss': 0.518, 'learning_rate': 6.595697050660998e-07, 'epoch': 1.77} {'loss': 0.3708, 'learning_rate': 6.594527930354955e-07, 'epoch': 1.77} {'loss': 0.4754, 'learning_rate': 6.593358910141278e-07, 'epoch': 1.77} {'loss': 0.4606, 'learning_rate': 6.59218999002128e-07, 'epoch': 1.77} {'loss': 0.4833, 'learning_rate': 6.591021169996159e-07, 'epoch': 1.77} {'loss': 0.583, 'learning_rate': 6.589852450067191e-07, 'epoch': 1.77} {'loss': 0.4954, 'learning_rate': 6.588683830235643e-07, 'epoch': 1.77} {'loss': 0.4167, 'learning_rate': 6.587515310502723e-07, 'epoch': 1.77} {'loss': 0.6079, 'learning_rate': 6.586346890869732e-07, 'epoch': 1.77} {'loss': 0.4161, 'learning_rate': 6.58517857133788e-07, 'epoch': 1.77} {'loss': 0.5182, 'learning_rate': 6.584010351908465e-07, 'epoch': 1.77} {'loss': 0.6086, 'learning_rate': 6.582842232582709e-07, 'epoch': 1.77} {'loss': 0.6162, 'learning_rate': 6.581674213361866e-07, 'epoch': 1.77} {'loss': 0.4843, 'learning_rate': 6.580506294247202e-07, 'epoch': 1.77} {'loss': 0.4721, 'learning_rate': 6.579338475239927e-07, 'epoch': 1.77} {'loss': 0.4717, 'learning_rate': 6.578170756341351e-07, 'epoch': 1.77} {'loss': 0.4019, 'learning_rate': 6.577003137552673e-07, 'epoch': 1.77} {'loss': 0.4417, 'learning_rate': 6.575835618875193e-07, 'epoch': 1.77} {'loss': 0.3019, 'learning_rate': 6.57466820031012e-07, 'epoch': 1.77} {'loss': 0.5878, 'learning_rate': 6.57350088185873e-07, 'epoch': 1.77} {'loss': 0.4931, 'learning_rate': 6.572333663522279e-07, 'epoch': 1.77} {'loss': 0.4793, 'learning_rate': 6.571166545301966e-07, 'epoch': 1.77} {'loss': 0.514, 'learning_rate': 6.569999527199122e-07, 'epoch': 1.77} {'loss': 0.4845, 'learning_rate': 6.568832609214914e-07, 'epoch': 1.77} {'loss': 0.5033, 'learning_rate': 6.567665791350675e-07, 'epoch': 1.77} {'loss': 0.5514, 'learning_rate': 6.566499073607602e-07, 'epoch': 1.77} {'loss': 0.4923, 'learning_rate': 6.56533245598695e-07, 'epoch': 1.77} {'loss': 0.4886, 'learning_rate': 6.564165938489997e-07, 'epoch': 1.77} {'loss': 0.3686, 'learning_rate': 6.562999521117941e-07, 'epoch': 1.77} {'loss': 0.5192, 'learning_rate': 6.561833203872093e-07, 'epoch': 1.77} {'loss': 0.5069, 'learning_rate': 6.560666986753661e-07, 'epoch': 1.77} {'loss': 0.5727, 'learning_rate': 6.559500869763902e-07, 'epoch': 1.77} {'loss': 0.4023, 'learning_rate': 6.558334852904081e-07, 'epoch': 1.77} {'loss': 0.5261, 'learning_rate': 6.557168936175428e-07, 'epoch': 1.77} {'loss': 0.4111, 'learning_rate': 6.556003119579224e-07, 'epoch': 1.77} {'loss': 0.6928, 'learning_rate': 6.554837403116665e-07, 'epoch': 1.77} {'loss': 0.5138, 'learning_rate': 6.553671786789073e-07, 'epoch': 1.77} {'loss': 0.3943, 'learning_rate': 6.552506270597625e-07, 'epoch': 1.77} {'loss': 0.5017, 'learning_rate': 6.551340854543608e-07, 'epoch': 1.77} {'loss': 0.3923, 'learning_rate': 6.550175538628256e-07, 'epoch': 1.77} {'loss': 0.5143, 'learning_rate': 6.549010322852833e-07, 'epoch': 1.77} {'loss': 0.5018, 'learning_rate': 6.547845207218595e-07, 'epoch': 1.77} {'loss': 0.5682, 'learning_rate': 6.54668019172674e-07, 'epoch': 1.77} {'loss': 0.4468, 'learning_rate': 6.545515276378589e-07, 'epoch': 1.77} {'loss': 0.5037, 'learning_rate': 6.54435046117533e-07, 'epoch': 1.77} {'loss': 0.4865, 'learning_rate': 6.543185746118241e-07, 'epoch': 1.77} {'loss': 0.485, 'learning_rate': 6.542021131208554e-07, 'epoch': 1.77} {'loss': 0.3949, 'learning_rate': 6.540856616447533e-07, 'epoch': 1.77} {'loss': 0.5451, 'learning_rate': 6.539692201836434e-07, 'epoch': 1.77} {'loss': 0.5357, 'learning_rate': 6.538527887376478e-07, 'epoch': 1.77} {'loss': 0.511, 'learning_rate': 6.53736367306892e-07, 'epoch': 1.77} {'loss': 0.5682, 'learning_rate': 6.536199558915013e-07, 'epoch': 1.77} {'loss': 0.4628, 'learning_rate': 6.535035544916013e-07, 'epoch': 1.77} {'loss': 0.552, 'learning_rate': 6.533871631073141e-07, 'epoch': 1.77} {'loss': 0.4446, 'learning_rate': 6.532707817387674e-07, 'epoch': 1.77} {'loss': 0.4505, 'learning_rate': 6.531544103860865e-07, 'epoch': 1.77} {'loss': 0.5258, 'learning_rate': 6.530380490493915e-07, 'epoch': 1.77} {'loss': 0.4621, 'learning_rate': 6.52921697728811e-07, 'epoch': 1.77} {'loss': 0.4989, 'learning_rate': 6.528053564244674e-07, 'epoch': 1.77} {'loss': 0.5709, 'learning_rate': 6.52689025136487e-07, 'epoch': 1.77} {'loss': 0.5124, 'learning_rate': 6.525727038649954e-07, 'epoch': 1.77} {'loss': 0.5726, 'learning_rate': 6.524563926101135e-07, 'epoch': 1.77} {'loss': 0.5393, 'learning_rate': 6.523400913719702e-07, 'epoch': 1.77} {'loss': 0.4421, 'learning_rate': 6.522238001506875e-07, 'epoch': 1.77} {'loss': 0.4805, 'learning_rate': 6.521075189463899e-07, 'epoch': 1.77} {'loss': 0.422, 'learning_rate': 6.519912477592039e-07, 'epoch': 1.77} {'loss': 0.4697, 'learning_rate': 6.518749865892516e-07, 'epoch': 1.77} {'loss': 0.5989, 'learning_rate': 6.517587354366617e-07, 'epoch': 1.77} {'loss': 0.4669, 'learning_rate': 6.516424943015542e-07, 'epoch': 1.77} {'loss': 0.5372, 'learning_rate': 6.515262631840547e-07, 'epoch': 1.77} {'loss': 0.623, 'learning_rate': 6.514100420842894e-07, 'epoch': 1.77} {'loss': 0.4373, 'learning_rate': 6.512938310023819e-07, 'epoch': 1.77} {'loss': 0.4873, 'learning_rate': 6.511776299384565e-07, 'epoch': 1.77} {'loss': 0.5622, 'learning_rate': 6.510614388926383e-07, 'epoch': 1.77} {'loss': 0.508, 'learning_rate': 6.509452578650533e-07, 'epoch': 1.77} {'loss': 0.4377, 'learning_rate': 6.508290868558232e-07, 'epoch': 1.77} {'loss': 0.6983, 'learning_rate': 6.507129258650724e-07, 'epoch': 1.77} {'loss': 0.3967, 'learning_rate': 6.505967748929265e-07, 'epoch': 1.77} {'loss': 0.522, 'learning_rate': 6.504806339395108e-07, 'epoch': 1.77} {'loss': 0.4538, 'learning_rate': 6.503645030049488e-07, 'epoch': 1.77} {'loss': 0.4622, 'learning_rate': 6.502483820893646e-07, 'epoch': 1.77} {'loss': 0.4414, 'learning_rate': 6.501322711928849e-07, 'epoch': 1.77} {'loss': 0.6415, 'learning_rate': 6.500161703156316e-07, 'epoch': 1.77} {'loss': 0.6395, 'learning_rate': 6.499000794577293e-07, 'epoch': 1.77} {'loss': 0.5951, 'learning_rate': 6.497839986193022e-07, 'epoch': 1.77} {'loss': 0.5601, 'learning_rate': 6.496679278004758e-07, 'epoch': 1.77} {'loss': 0.4392, 'learning_rate': 6.495518670013745e-07, 'epoch': 1.77} {'loss': 0.5364, 'learning_rate': 6.494358162221237e-07, 'epoch': 1.77} {'loss': 0.5081, 'learning_rate': 6.493197754628455e-07, 'epoch': 1.77} {'loss': 0.5428, 'learning_rate': 6.492037447236643e-07, 'epoch': 1.77} {'loss': 0.4806, 'learning_rate': 6.490877240047056e-07, 'epoch': 1.77} {'loss': 0.7318, 'learning_rate': 6.489717133060924e-07, 'epoch': 1.77} {'loss': 0.5021, 'learning_rate': 6.488557126279516e-07, 'epoch': 1.77} {'loss': 0.5915, 'learning_rate': 6.48739721970405e-07, 'epoch': 1.77} {'loss': 0.3727, 'learning_rate': 6.486237413335794e-07, 'epoch': 1.77} {'loss': 0.4007, 'learning_rate': 6.485077707175958e-07, 'epoch': 1.77} {'loss': 0.4848, 'learning_rate': 6.483918101225805e-07, 'epoch': 1.77} {'loss': 0.5429, 'learning_rate': 6.482758595486571e-07, 'epoch': 1.77} {'loss': 0.3817, 'learning_rate': 6.481599189959508e-07, 'epoch': 1.77} {'loss': 0.4939, 'learning_rate': 6.480439884645839e-07, 'epoch': 1.77} {'loss': 0.4229, 'learning_rate': 6.479280679546829e-07, 'epoch': 1.77} {'loss': 0.4315, 'learning_rate': 6.47812157466372e-07, 'epoch': 1.77} {'loss': 0.434, 'learning_rate': 6.476962569997736e-07, 'epoch': 1.77} {'loss': 0.4784, 'learning_rate': 6.475803665550129e-07, 'epoch': 1.77} {'loss': 0.2382, 'learning_rate': 6.474644861322132e-07, 'epoch': 1.77} {'loss': 0.4806, 'learning_rate': 6.473486157315001e-07, 'epoch': 1.77} {'loss': 0.5263, 'learning_rate': 6.472327553529977e-07, 'epoch': 1.77} {'loss': 0.5849, 'learning_rate': 6.471169049968274e-07, 'epoch': 1.77} {'loss': 0.4823, 'learning_rate': 6.470010646631186e-07, 'epoch': 1.77} {'loss': 0.4515, 'learning_rate': 6.468852343519905e-07, 'epoch': 1.77} {'loss': 0.3833, 'learning_rate': 6.467694140635683e-07, 'epoch': 1.77} {'loss': 0.5744, 'learning_rate': 6.466536037979776e-07, 'epoch': 1.77} {'loss': 0.5863, 'learning_rate': 6.465378035553416e-07, 'epoch': 1.77} {'loss': 0.4935, 'learning_rate': 6.464220133357868e-07, 'epoch': 1.77} {'loss': 0.5944, 'learning_rate': 6.46306233139431e-07, 'epoch': 1.77} {'loss': 0.5046, 'learning_rate': 6.461904629664051e-07, 'epoch': 1.77} {'loss': 0.5934, 'learning_rate': 6.460747028168302e-07, 'epoch': 1.77} {'loss': 0.5346, 'learning_rate': 6.459589526908294e-07, 'epoch': 1.77} {'loss': 0.4045, 'learning_rate': 6.458432125885295e-07, 'epoch': 1.77} {'loss': 0.5326, 'learning_rate': 6.457274825100502e-07, 'epoch': 1.77} {'loss': 0.4487, 'learning_rate': 6.456117624555202e-07, 'epoch': 1.77} {'loss': 0.544, 'learning_rate': 6.454960524250597e-07, 'epoch': 1.77} {'loss': 0.5027, 'learning_rate': 6.453803524187974e-07, 'epoch': 1.77} {'loss': 0.7002, 'learning_rate': 6.45264662436852e-07, 'epoch': 1.77} {'loss': 0.5432, 'learning_rate': 6.4514898247935e-07, 'epoch': 1.77} {'loss': 0.4132, 'learning_rate': 6.450333125464181e-07, 'epoch': 1.77} {'loss': 0.5956, 'learning_rate': 6.449176526381729e-07, 'epoch': 1.77} {'loss': 0.4592, 'learning_rate': 6.448020027547464e-07, 'epoch': 1.77} {'loss': 0.6041, 'learning_rate': 6.446863628962563e-07, 'epoch': 1.77} {'loss': 0.5234, 'learning_rate': 6.445707330628303e-07, 'epoch': 1.77} {'loss': 0.5447, 'learning_rate': 6.444551132545906e-07, 'epoch': 1.77} {'loss': 0.5841, 'learning_rate': 6.443395034716616e-07, 'epoch': 1.77} {'loss': 0.6361, 'learning_rate': 6.442239037141696e-07, 'epoch': 1.77} {'loss': 0.5261, 'learning_rate': 6.441083139822324e-07, 'epoch': 1.77} {'loss': 0.4968, 'learning_rate': 6.439927342759811e-07, 'epoch': 1.77} {'loss': 0.5173, 'learning_rate': 6.438771645955332e-07, 'epoch': 1.77} {'loss': 0.6301, 'learning_rate': 6.437616049410167e-07, 'epoch': 1.77} {'loss': 0.5922, 'learning_rate': 6.436460553125534e-07, 'epoch': 1.77} {'loss': 0.5451, 'learning_rate': 6.435305157102678e-07, 'epoch': 1.77} {'loss': 0.4455, 'learning_rate': 6.434149861342853e-07, 'epoch': 1.77} {'loss': 0.5535, 'learning_rate': 6.432994665847258e-07, 'epoch': 1.77} {'loss': 0.5356, 'learning_rate': 6.431839570617182e-07, 'epoch': 1.77} {'loss': 0.5318, 'learning_rate': 6.430684575653811e-07, 'epoch': 1.77} {'loss': 0.5357, 'learning_rate': 6.429529680958412e-07, 'epoch': 1.77} {'loss': 0.5091, 'learning_rate': 6.42837488653223e-07, 'epoch': 1.77} {'loss': 0.5136, 'learning_rate': 6.427220192376471e-07, 'epoch': 1.77} {'loss': 0.47, 'learning_rate': 6.426065598492404e-07, 'epoch': 1.77} {'loss': 0.5014, 'learning_rate': 6.424911104881237e-07, 'epoch': 1.77} {'loss': 0.3348, 'learning_rate': 6.423756711544249e-07, 'epoch': 1.77} {'loss': 0.5512, 'learning_rate': 6.422602418482637e-07, 'epoch': 1.77} {'loss': 0.339, 'learning_rate': 6.421448225697646e-07, 'epoch': 1.77} {'loss': 0.3691, 'learning_rate': 6.420294133190542e-07, 'epoch': 1.77} {'loss': 0.5612, 'learning_rate': 6.419140140962499e-07, 'epoch': 1.77} {'loss': 0.4765, 'learning_rate': 6.417986249014841e-07, 'epoch': 1.77} {'loss': 0.5321, 'learning_rate': 6.41683245734871e-07, 'epoch': 1.77} {'loss': 0.5561, 'learning_rate': 6.415678765965427e-07, 'epoch': 1.77} {'loss': 0.5179, 'learning_rate': 6.414525174866171e-07, 'epoch': 1.77} {'loss': 0.3629, 'learning_rate': 6.413371684052205e-07, 'epoch': 1.77} {'loss': 0.4802, 'learning_rate': 6.412218293524775e-07, 'epoch': 1.77} {'loss': 0.5618, 'learning_rate': 6.411065003285055e-07, 'epoch': 1.77} {'loss': 0.343, 'learning_rate': 6.409911813334368e-07, 'epoch': 1.77} {'loss': 0.3482, 'learning_rate': 6.408758723673881e-07, 'epoch': 1.77} {'loss': 0.5181, 'learning_rate': 6.407605734304879e-07, 'epoch': 1.77} {'loss': 0.5357, 'learning_rate': 6.406452845228561e-07, 'epoch': 1.77} {'loss': 0.597, 'learning_rate': 6.405300056446173e-07, 'epoch': 1.77} {'loss': 0.4525, 'learning_rate': 6.404147367958969e-07, 'epoch': 1.77} {'loss': 0.53, 'learning_rate': 6.402994779768145e-07, 'epoch': 1.77} {'loss': 0.5255, 'learning_rate': 6.401842291874983e-07, 'epoch': 1.77} {'loss': 0.5787, 'learning_rate': 6.400689904280666e-07, 'epoch': 1.77} {'loss': 0.4947, 'learning_rate': 6.399537616986495e-07, 'epoch': 1.77} {'loss': 0.6118, 'learning_rate': 6.398385429993648e-07, 'epoch': 1.77} {'loss': 0.546, 'learning_rate': 6.397233343303366e-07, 'epoch': 1.77} {'loss': 0.5117, 'learning_rate': 6.396081356916928e-07, 'epoch': 1.77} {'loss': 0.5314, 'learning_rate': 6.394929470835499e-07, 'epoch': 1.77} {'loss': 0.381, 'learning_rate': 6.393777685060388e-07, 'epoch': 1.77} {'loss': 0.5528, 'learning_rate': 6.392625999592772e-07, 'epoch': 1.77} {'loss': 0.5321, 'learning_rate': 6.391474414433907e-07, 'epoch': 1.77} {'loss': 0.593, 'learning_rate': 6.390322929585035e-07, 'epoch': 1.77} {'loss': 0.4029, 'learning_rate': 6.389171545047368e-07, 'epoch': 1.77} {'loss': 0.5272, 'learning_rate': 6.38802026082217e-07, 'epoch': 1.77} {'loss': 0.441, 'learning_rate': 6.386869076910629e-07, 'epoch': 1.77} {'loss': 0.4736, 'learning_rate': 6.385717993314045e-07, 'epoch': 1.77} {'loss': 0.5553, 'learning_rate': 6.384567010033593e-07, 'epoch': 1.77} {'loss': 0.5901, 'learning_rate': 6.383416127070518e-07, 'epoch': 1.77} {'loss': 0.5786, 'learning_rate': 6.382265344426075e-07, 'epoch': 1.77} {'loss': 0.5539, 'learning_rate': 6.381114662101474e-07, 'epoch': 1.77} {'loss': 0.5503, 'learning_rate': 6.379964080097978e-07, 'epoch': 1.77} {'loss': 0.5061, 'learning_rate': 6.378813598416766e-07, 'epoch': 1.77} {'loss': 0.5349, 'learning_rate': 6.377663217059138e-07, 'epoch': 1.77} {'loss': 0.4856, 'learning_rate': 6.37651293602628e-07, 'epoch': 1.77} {'loss': 0.5372, 'learning_rate': 6.375362755319436e-07, 'epoch': 1.77} {'loss': 0.4272, 'learning_rate': 6.37421267493985e-07, 'epoch': 1.77} {'loss': 0.631, 'learning_rate': 6.373062694888732e-07, 'epoch': 1.77} {'loss': 0.3134, 'learning_rate': 6.371912815167358e-07, 'epoch': 1.77} {'loss': 0.5948, 'learning_rate': 6.370763035776906e-07, 'epoch': 1.77} {'loss': 0.5858, 'learning_rate': 6.369613356718629e-07, 'epoch': 1.77} {'loss': 0.4092, 'learning_rate': 6.368463777993761e-07, 'epoch': 1.77} {'loss': 0.4998, 'learning_rate': 6.367314299603544e-07, 'epoch': 1.77} {'loss': 0.4906, 'learning_rate': 6.366164921549189e-07, 'epoch': 1.77} {'loss': 0.5636, 'learning_rate': 6.365015643831951e-07, 'epoch': 1.77} {'loss': 0.4645, 'learning_rate': 6.363866466453051e-07, 'epoch': 1.77} {'loss': 0.699, 'learning_rate': 6.362717389413719e-07, 'epoch': 1.77} {'loss': 0.4968, 'learning_rate': 6.36156841271518e-07, 'epoch': 1.77} {'loss': 0.427, 'learning_rate': 6.360419536358675e-07, 'epoch': 1.77} {'loss': 0.621, 'learning_rate': 6.359270760345426e-07, 'epoch': 1.77} {'loss': 0.5037, 'learning_rate': 6.358122084676665e-07, 'epoch': 1.77} {'loss': 0.5031, 'learning_rate': 6.356973509353659e-07, 'epoch': 1.77} {'loss': 0.4528, 'learning_rate': 6.355825034377583e-07, 'epoch': 1.77} {'loss': 0.5405, 'learning_rate': 6.354676659749692e-07, 'epoch': 1.77} {'loss': 0.5686, 'learning_rate': 6.353528385471219e-07, 'epoch': 1.77} {'loss': 0.3695, 'learning_rate': 6.352380211543396e-07, 'epoch': 1.77} {'loss': 0.4474, 'learning_rate': 6.351232137967445e-07, 'epoch': 1.77} {'loss': 0.4814, 'learning_rate': 6.350084164744619e-07, 'epoch': 1.77} {'loss': 0.5151, 'learning_rate': 6.348936291876106e-07, 'epoch': 1.77} {'loss': 0.3861, 'learning_rate': 6.347788519363174e-07, 'epoch': 1.77} {'loss': 0.6615, 'learning_rate': 6.34664084720703e-07, 'epoch': 1.77} {'loss': 0.3387, 'learning_rate': 6.345493275408921e-07, 'epoch': 1.77} {'loss': 0.3789, 'learning_rate': 6.344345803970054e-07, 'epoch': 1.77} {'loss': 0.5353, 'learning_rate': 6.343198432891684e-07, 'epoch': 1.77} {'loss': 0.5865, 'learning_rate': 6.342051162175044e-07, 'epoch': 1.77} {'loss': 0.5885, 'learning_rate': 6.340903991821335e-07, 'epoch': 1.77} {'loss': 0.546, 'learning_rate': 6.339756921831807e-07, 'epoch': 1.77} {'loss': 0.477, 'learning_rate': 6.338609952207675e-07, 'epoch': 1.77} {'loss': 0.6302, 'learning_rate': 6.337463082950179e-07, 'epoch': 1.77} {'loss': 0.602, 'learning_rate': 6.336316314060542e-07, 'epoch': 1.77} {'loss': 0.4451, 'learning_rate': 6.335169645540007e-07, 'epoch': 1.77} {'loss': 0.4114, 'learning_rate': 6.334023077389784e-07, 'epoch': 1.77} {'loss': 0.5214, 'learning_rate': 6.332876609611105e-07, 'epoch': 1.77} {'loss': 0.5612, 'learning_rate': 6.331730242205203e-07, 'epoch': 1.77} {'loss': 0.4859, 'learning_rate': 6.33058397517331e-07, 'epoch': 1.77} {'loss': 0.507, 'learning_rate': 6.329437808516647e-07, 'epoch': 1.77} {'loss': 0.5004, 'learning_rate': 6.328291742236447e-07, 'epoch': 1.77} {'loss': 0.4214, 'learning_rate': 6.327145776333942e-07, 'epoch': 1.77} {'loss': 0.5161, 'learning_rate': 6.325999910810354e-07, 'epoch': 1.77} {'loss': 0.4346, 'learning_rate': 6.324854145666904e-07, 'epoch': 1.77} {'loss': 0.4076, 'learning_rate': 6.323708480904833e-07, 'epoch': 1.77} {'loss': 0.5206, 'learning_rate': 6.322562916525355e-07, 'epoch': 1.77} {'loss': 0.5438, 'learning_rate': 6.32141745252971e-07, 'epoch': 1.77} {'loss': 0.4633, 'learning_rate': 6.320272088919122e-07, 'epoch': 1.77} {'loss': 0.5583, 'learning_rate': 6.319126825694832e-07, 'epoch': 1.77} {'loss': 0.538, 'learning_rate': 6.317981662858041e-07, 'epoch': 1.77} {'loss': 0.6411, 'learning_rate': 6.316836600409992e-07, 'epoch': 1.77} {'loss': 0.5874, 'learning_rate': 6.315691638351895e-07, 'epoch': 1.77} {'loss': 0.5168, 'learning_rate': 6.314546776685005e-07, 'epoch': 1.77} {'loss': 0.5418, 'learning_rate': 6.31340201541053e-07, 'epoch': 1.77} {'loss': 0.4602, 'learning_rate': 6.312257354529683e-07, 'epoch': 1.77} {'loss': 0.4238, 'learning_rate': 6.311112794043739e-07, 'epoch': 1.77} {'loss': 0.4347, 'learning_rate': 6.309968333953875e-07, 'epoch': 1.77} {'loss': 0.5972, 'learning_rate': 6.308823974261335e-07, 'epoch': 1.77} {'loss': 0.4814, 'learning_rate': 6.307679714967352e-07, 'epoch': 1.77} {'loss': 0.5708, 'learning_rate': 6.306535556073134e-07, 'epoch': 1.77} {'loss': 0.5356, 'learning_rate': 6.305391497579949e-07, 'epoch': 1.77} {'loss': 0.4715, 'learning_rate': 6.30424753948895e-07, 'epoch': 1.77} {'loss': 0.5525, 'learning_rate': 6.303103681801448e-07, 'epoch': 1.77} {'loss': 0.5811, 'learning_rate': 6.301959924518608e-07, 'epoch': 1.77} {'loss': 0.3838, 'learning_rate': 6.300816267641674e-07, 'epoch': 1.77} {'loss': 0.4787, 'learning_rate': 6.299672711171867e-07, 'epoch': 1.77} {'loss': 0.5927, 'learning_rate': 6.29852925511043e-07, 'epoch': 1.77} {'loss': 0.4999, 'learning_rate': 6.297385899458586e-07, 'epoch': 1.77} {'loss': 0.6136, 'learning_rate': 6.296242644217509e-07, 'epoch': 1.77} {'loss': 0.4332, 'learning_rate': 6.295099489388512e-07, 'epoch': 1.77} {'loss': 0.568, 'learning_rate': 6.293956434972748e-07, 'epoch': 1.77} {'loss': 0.6174, 'learning_rate': 6.292813480971471e-07, 'epoch': 1.77} {'loss': 0.2298, 'learning_rate': 6.291670627385916e-07, 'epoch': 1.77} {'loss': 0.5012, 'learning_rate': 6.290527874217256e-07, 'epoch': 1.77} {'loss': 0.4534, 'learning_rate': 6.289385221466793e-07, 'epoch': 1.77} {'loss': 0.5281, 'learning_rate': 6.28824266913568e-07, 'epoch': 1.77} {'loss': 0.6284, 'learning_rate': 6.287100217225206e-07, 'epoch': 1.77} {'loss': 0.5149, 'learning_rate': 6.285957865736547e-07, 'epoch': 1.77} {'loss': 0.3787, 'learning_rate': 6.284815614670936e-07, 'epoch': 1.77} {'loss': 0.478, 'learning_rate': 6.283673464029616e-07, 'epoch': 1.77} {'loss': 0.4144, 'learning_rate': 6.282531413813775e-07, 'epoch': 1.77} {'loss': 0.5552, 'learning_rate': 6.28138946402469e-07, 'epoch': 1.77} {'loss': 0.5065, 'learning_rate': 6.280247614663526e-07, 'epoch': 1.77} {'loss': 0.4593, 'learning_rate': 6.279105865731561e-07, 'epoch': 1.77} {'loss': 0.5717, 'learning_rate': 6.277964217229982e-07, 'epoch': 1.77} {'loss': 0.5647, 'learning_rate': 6.276822669160021e-07, 'epoch': 1.77} {'loss': 0.4821, 'learning_rate': 6.275681221522922e-07, 'epoch': 1.77} {'loss': 0.5004, 'learning_rate': 6.274539874319852e-07, 'epoch': 1.77} {'loss': 0.5383, 'learning_rate': 6.273398627552107e-07, 'epoch': 1.77} {'loss': 0.534, 'learning_rate': 6.272257481220845e-07, 'epoch': 1.77} {'loss': 0.5381, 'learning_rate': 6.27111643532734e-07, 'epoch': 1.77} {'loss': 0.4165, 'learning_rate': 6.269975489872793e-07, 'epoch': 1.77} {'loss': 0.3076, 'learning_rate': 6.268834644858413e-07, 'epoch': 1.77} {'loss': 0.3613, 'learning_rate': 6.267693900285465e-07, 'epoch': 1.77} {'loss': 0.3811, 'learning_rate': 6.266553256155106e-07, 'epoch': 1.77} {'loss': 0.5498, 'learning_rate': 6.265412712468622e-07, 'epoch': 1.77} {'loss': 0.3585, 'learning_rate': 6.2642722692272e-07, 'epoch': 1.77} {'loss': 0.6099, 'learning_rate': 6.263131926432065e-07, 'epoch': 1.77} {'loss': 0.415, 'learning_rate': 6.261991684084446e-07, 'epoch': 1.77} {'loss': 0.4433, 'learning_rate': 6.260851542185564e-07, 'epoch': 1.77} {'loss': 0.4513, 'learning_rate': 6.259711500736654e-07, 'epoch': 1.77} {'loss': 0.5783, 'learning_rate': 6.258571559738891e-07, 'epoch': 1.77} {'loss': 0.616, 'learning_rate': 6.257431719193563e-07, 'epoch': 1.77} {'loss': 0.5476, 'learning_rate': 6.256291979101847e-07, 'epoch': 1.77} {'loss': 0.3866, 'learning_rate': 6.255152339464965e-07, 'epoch': 1.77} {'loss': 0.5085, 'learning_rate': 6.254012800284159e-07, 'epoch': 1.77} {'loss': 0.5753, 'learning_rate': 6.252873361560629e-07, 'epoch': 1.77} {'loss': 0.3069, 'learning_rate': 6.25173402329563e-07, 'epoch': 1.77} {'loss': 0.4884, 'learning_rate': 6.250594785490327e-07, 'epoch': 1.77} {'loss': 0.3458, 'learning_rate': 6.249455648145997e-07, 'epoch': 1.77} {'loss': 0.5247, 'learning_rate': 6.248316611263827e-07, 'epoch': 1.77} {'loss': 0.4284, 'learning_rate': 6.247177674845051e-07, 'epoch': 1.77} {'loss': 0.615, 'learning_rate': 6.2460388388909e-07, 'epoch': 1.77} {'loss': 0.5979, 'learning_rate': 6.244900103402541e-07, 'epoch': 1.77} {'loss': 0.4969, 'learning_rate': 6.243761468381271e-07, 'epoch': 1.77} {'loss': 0.4388, 'learning_rate': 6.242622933828246e-07, 'epoch': 1.77} {'loss': 0.4607, 'learning_rate': 6.241484499744733e-07, 'epoch': 1.77} {'loss': 0.4214, 'learning_rate': 6.240346166131927e-07, 'epoch': 1.77} {'loss': 0.3585, 'learning_rate': 6.239207932991043e-07, 'epoch': 1.77} {'loss': 0.5302, 'learning_rate': 6.238069800323332e-07, 'epoch': 1.77} {'loss': 0.5345, 'learning_rate': 6.23693176812995e-07, 'epoch': 1.77} {'loss': 0.4746, 'learning_rate': 6.235793836412207e-07, 'epoch': 1.77} {'loss': 0.5175, 'learning_rate': 6.234656005171247e-07, 'epoch': 1.77} {'loss': 0.6018, 'learning_rate': 6.233518274408312e-07, 'epoch': 1.77} {'loss': 0.4292, 'learning_rate': 6.232380644124636e-07, 'epoch': 1.77} {'loss': 0.4081, 'learning_rate': 6.231243114321417e-07, 'epoch': 1.77} {'loss': 0.6034, 'learning_rate': 6.23010568499991e-07, 'epoch': 1.77} {'loss': 0.5038, 'learning_rate': 6.22896835616127e-07, 'epoch': 1.77} {'loss': 0.5085, 'learning_rate': 6.227831127806782e-07, 'epoch': 1.77} {'loss': 0.4555, 'learning_rate': 6.226693999937627e-07, 'epoch': 1.77} {'loss': 0.4444, 'learning_rate': 6.225556972555036e-07, 'epoch': 1.77} {'loss': 0.5622, 'learning_rate': 6.224420045660218e-07, 'epoch': 1.77} {'loss': 0.4391, 'learning_rate': 6.223283219254395e-07, 'epoch': 1.77} {'loss': 0.5682, 'learning_rate': 6.222146493338809e-07, 'epoch': 1.77} {'loss': 0.5857, 'learning_rate': 6.221009867914618e-07, 'epoch': 1.77} {'loss': 0.4844, 'learning_rate': 6.219873342983118e-07, 'epoch': 1.77} {'loss': 0.5024, 'learning_rate': 6.218736918545476e-07, 'epoch': 1.78} {'loss': 0.5309, 'learning_rate': 6.217600594602912e-07, 'epoch': 1.78} {'loss': 0.489, 'learning_rate': 6.216464371156661e-07, 'epoch': 1.78} {'loss': 0.4384, 'learning_rate': 6.21532824820793e-07, 'epoch': 1.78} {'loss': 0.4439, 'learning_rate': 6.214192225757954e-07, 'epoch': 1.78} {'loss': 0.4829, 'learning_rate': 6.213056303807918e-07, 'epoch': 1.78} {'loss': 0.498, 'learning_rate': 6.211920482359069e-07, 'epoch': 1.78} {'loss': 0.392, 'learning_rate': 6.210784761412602e-07, 'epoch': 1.78} {'loss': 0.3821, 'learning_rate': 6.209649140969742e-07, 'epoch': 1.78} {'loss': 0.4248, 'learning_rate': 6.208513621031709e-07, 'epoch': 1.78} {'loss': 0.4712, 'learning_rate': 6.207378201599724e-07, 'epoch': 1.78} {'loss': 0.6068, 'learning_rate': 6.206242882675007e-07, 'epoch': 1.78} {'loss': 0.6557, 'learning_rate': 6.205107664258758e-07, 'epoch': 1.78} {'loss': 0.4498, 'learning_rate': 6.2039725463522e-07, 'epoch': 1.78} {'loss': 0.4615, 'learning_rate': 6.202837528956551e-07, 'epoch': 1.78} {'loss': 0.3436, 'learning_rate': 6.201702612073024e-07, 'epoch': 1.78} {'loss': 0.5882, 'learning_rate': 6.200567795702839e-07, 'epoch': 1.78} {'loss': 0.5328, 'learning_rate': 6.199433079847217e-07, 'epoch': 1.78} {'loss': 0.4117, 'learning_rate': 6.198298464507379e-07, 'epoch': 1.78} {'loss': 0.5742, 'learning_rate': 6.197163949684515e-07, 'epoch': 1.78} {'loss': 0.3053, 'learning_rate': 6.196029535379855e-07, 'epoch': 1.78} {'loss': 0.5496, 'learning_rate': 6.19489522159461e-07, 'epoch': 1.78} {'loss': 0.513, 'learning_rate': 6.193761008330013e-07, 'epoch': 1.78} {'loss': 0.5251, 'learning_rate': 6.192626895587261e-07, 'epoch': 1.78} {'loss': 0.5624, 'learning_rate': 6.191492883367601e-07, 'epoch': 1.78} {'loss': 0.4085, 'learning_rate': 6.190358971672195e-07, 'epoch': 1.78} {'loss': 0.3541, 'learning_rate': 6.189225160502288e-07, 'epoch': 1.78} {'loss': 0.545, 'learning_rate': 6.188091449859102e-07, 'epoch': 1.78} {'loss': 0.5582, 'learning_rate': 6.186957839743835e-07, 'epoch': 1.78} {'loss': 0.5403, 'learning_rate': 6.18582433015772e-07, 'epoch': 1.78} {'loss': 0.4643, 'learning_rate': 6.184690921101943e-07, 'epoch': 1.78} {'loss': 0.6852, 'learning_rate': 6.183557612577773e-07, 'epoch': 1.78} {'loss': 0.5427, 'learning_rate': 6.182424404586362e-07, 'epoch': 1.78} {'loss': 0.5189, 'learning_rate': 6.181291297128955e-07, 'epoch': 1.78} {'loss': 0.4572, 'learning_rate': 6.18015829020675e-07, 'epoch': 1.78} {'loss': 0.5993, 'learning_rate': 6.179025383820991e-07, 'epoch': 1.78} {'loss': 0.4891, 'learning_rate': 6.177892577972866e-07, 'epoch': 1.78} {'loss': 0.56, 'learning_rate': 6.176759872663595e-07, 'epoch': 1.78} {'loss': 0.516, 'learning_rate': 6.175627267894413e-07, 'epoch': 1.78} {'loss': 0.5382, 'learning_rate': 6.174494763666495e-07, 'epoch': 1.78} {'loss': 0.5428, 'learning_rate': 6.173362359981073e-07, 'epoch': 1.78} {'loss': 0.3992, 'learning_rate': 6.172230056839368e-07, 'epoch': 1.78} {'loss': 0.5472, 'learning_rate': 6.171097854242581e-07, 'epoch': 1.78} {'loss': 0.4207, 'learning_rate': 6.169965752191953e-07, 'epoch': 1.78} {'loss': 0.4761, 'learning_rate': 6.168833750688652e-07, 'epoch': 1.78} {'loss': 0.6079, 'learning_rate': 6.167701849733921e-07, 'epoch': 1.78} {'loss': 0.5205, 'learning_rate': 6.166570049328968e-07, 'epoch': 1.78} {'loss': 0.3732, 'learning_rate': 6.165438349474994e-07, 'epoch': 1.78} {'loss': 0.5372, 'learning_rate': 6.164306750173232e-07, 'epoch': 1.78} {'loss': 0.6102, 'learning_rate': 6.16317525142488e-07, 'epoch': 1.78} {'loss': 0.4867, 'learning_rate': 6.16204385323117e-07, 'epoch': 1.78} {'loss': 0.5502, 'learning_rate': 6.160912555593291e-07, 'epoch': 1.78} {'loss': 0.5547, 'learning_rate': 6.159781358512451e-07, 'epoch': 1.78} {'loss': 0.5126, 'learning_rate': 6.158650261989885e-07, 'epoch': 1.78} {'loss': 0.6492, 'learning_rate': 6.15751926602679e-07, 'epoch': 1.78} {'loss': 0.4235, 'learning_rate': 6.1563883706244e-07, 'epoch': 1.78} {'loss': 0.5881, 'learning_rate': 6.15525757578388e-07, 'epoch': 1.78} {'loss': 0.5664, 'learning_rate': 6.154126881506506e-07, 'epoch': 1.78} {'loss': 0.4112, 'learning_rate': 6.152996287793434e-07, 'epoch': 1.78} {'loss': 0.5359, 'learning_rate': 6.151865794645895e-07, 'epoch': 1.78} {'loss': 0.4439, 'learning_rate': 6.150735402065111e-07, 'epoch': 1.78} {'loss': 0.5253, 'learning_rate': 6.14960511005227e-07, 'epoch': 1.78} {'loss': 0.4826, 'learning_rate': 6.148474918608627e-07, 'epoch': 1.78} {'loss': 0.3978, 'learning_rate': 6.147344827735325e-07, 'epoch': 1.78} {'loss': 0.7129, 'learning_rate': 6.14621483743365e-07, 'epoch': 1.78} {'loss': 0.4841, 'learning_rate': 6.14508494770476e-07, 'epoch': 1.78} {'loss': 0.3393, 'learning_rate': 6.143955158549875e-07, 'epoch': 1.78} {'loss': 0.439, 'learning_rate': 6.142825469970226e-07, 'epoch': 1.78} {'loss': 0.4828, 'learning_rate': 6.141695881967002e-07, 'epoch': 1.78} {'loss': 0.5346, 'learning_rate': 6.140566394541436e-07, 'epoch': 1.78} {'loss': 0.4182, 'learning_rate': 6.139437007694693e-07, 'epoch': 1.78} {'loss': 0.4413, 'learning_rate': 6.13830772142805e-07, 'epoch': 1.78} {'loss': 0.5783, 'learning_rate': 6.137178535742672e-07, 'epoch': 1.78} {'loss': 0.5527, 'learning_rate': 6.136049450639769e-07, 'epoch': 1.78} {'loss': 0.5237, 'learning_rate': 6.134920466120575e-07, 'epoch': 1.78} {'loss': 0.5844, 'learning_rate': 6.133791582186266e-07, 'epoch': 1.78} {'loss': 0.5997, 'learning_rate': 6.132662798838096e-07, 'epoch': 1.78} {'loss': 0.5781, 'learning_rate': 6.131534116077209e-07, 'epoch': 1.78} {'loss': 0.5873, 'learning_rate': 6.130405533904904e-07, 'epoch': 1.78} {'loss': 0.539, 'learning_rate': 6.129277052322314e-07, 'epoch': 1.78} {'loss': 0.6462, 'learning_rate': 6.12814867133068e-07, 'epoch': 1.78} {'loss': 0.7877, 'learning_rate': 6.127020390931227e-07, 'epoch': 1.78} {'loss': 0.623, 'learning_rate': 6.125892211125106e-07, 'epoch': 1.78} {'loss': 0.5921, 'learning_rate': 6.124764131913596e-07, 'epoch': 1.78} {'loss': 0.7367, 'learning_rate': 6.12363615329784e-07, 'epoch': 1.78} {'loss': 0.5264, 'learning_rate': 6.122508275279126e-07, 'epoch': 1.78} {'loss': 0.438, 'learning_rate': 6.121380497858586e-07, 'epoch': 1.78} {'loss': 0.5049, 'learning_rate': 6.120252821037464e-07, 'epoch': 1.78} {'loss': 0.5355, 'learning_rate': 6.119125244816992e-07, 'epoch': 1.78} {'loss': 0.4966, 'learning_rate': 6.117997769198303e-07, 'epoch': 1.78} {'loss': 0.28, 'learning_rate': 6.116870394182694e-07, 'epoch': 1.78} {'loss': 0.4596, 'learning_rate': 6.1157431197713e-07, 'epoch': 1.78} {'loss': 0.6577, 'learning_rate': 6.114615945965385e-07, 'epoch': 1.78} {'loss': 0.4492, 'learning_rate': 6.113488872766127e-07, 'epoch': 1.78} {'loss': 0.6933, 'learning_rate': 6.112361900174723e-07, 'epoch': 1.78} {'loss': 0.4011, 'learning_rate': 6.11123502819243e-07, 'epoch': 1.78} {'loss': 0.5604, 'learning_rate': 6.11010825682038e-07, 'epoch': 1.78} {'loss': 0.4212, 'learning_rate': 6.108981586059859e-07, 'epoch': 1.78} {'loss': 0.4642, 'learning_rate': 6.107855015912012e-07, 'epoch': 1.78} {'loss': 0.5375, 'learning_rate': 6.106728546378094e-07, 'epoch': 1.78} {'loss': 0.4758, 'learning_rate': 6.105602177459279e-07, 'epoch': 1.78} {'loss': 0.4894, 'learning_rate': 6.104475909156793e-07, 'epoch': 1.78} {'loss': 0.5054, 'learning_rate': 6.103349741471842e-07, 'epoch': 1.78} {'loss': 0.4586, 'learning_rate': 6.102223674405605e-07, 'epoch': 1.78} {'loss': 0.5303, 'learning_rate': 6.101097707959336e-07, 'epoch': 1.78} {'loss': 0.5674, 'learning_rate': 6.099971842134178e-07, 'epoch': 1.78} {'loss': 0.5248, 'learning_rate': 6.098846076931419e-07, 'epoch': 1.78} {'loss': 0.444, 'learning_rate': 6.097720412352192e-07, 'epoch': 1.78} {'loss': 0.4772, 'learning_rate': 6.096594848397741e-07, 'epoch': 1.78} {'loss': 0.4694, 'learning_rate': 6.095469385069275e-07, 'epoch': 1.78} {'loss': 0.2875, 'learning_rate': 6.094344022367971e-07, 'epoch': 1.78} {'loss': 0.5233, 'learning_rate': 6.093218760295072e-07, 'epoch': 1.78} {'loss': 0.5643, 'learning_rate': 6.092093598851745e-07, 'epoch': 1.78} {'loss': 0.6095, 'learning_rate': 6.090968538039222e-07, 'epoch': 1.78} {'loss': 0.3416, 'learning_rate': 6.089843577858701e-07, 'epoch': 1.78} {'loss': 0.2872, 'learning_rate': 6.088718718311393e-07, 'epoch': 1.78} {'loss': 0.4463, 'learning_rate': 6.087593959398508e-07, 'epoch': 1.78} {'loss': 0.4248, 'learning_rate': 6.086469301121212e-07, 'epoch': 1.78} {'loss': 0.4367, 'learning_rate': 6.085344743480781e-07, 'epoch': 1.78} {'loss': 0.5848, 'learning_rate': 6.084220286478349e-07, 'epoch': 1.78} {'loss': 0.4708, 'learning_rate': 6.083095930115157e-07, 'epoch': 1.78} {'loss': 0.4868, 'learning_rate': 6.081971674392406e-07, 'epoch': 1.78} {'loss': 0.6064, 'learning_rate': 6.080847519311306e-07, 'epoch': 1.78} {'loss': 0.6777, 'learning_rate': 6.079723464873056e-07, 'epoch': 1.78} {'loss': 0.4585, 'learning_rate': 6.078599511078842e-07, 'epoch': 1.78} {'loss': 0.4273, 'learning_rate': 6.07747565792991e-07, 'epoch': 1.78} {'loss': 0.504, 'learning_rate': 6.076351905427425e-07, 'epoch': 1.78} {'loss': 0.5551, 'learning_rate': 6.075228253572596e-07, 'epoch': 1.78} {'loss': 0.5879, 'learning_rate': 6.074104702366668e-07, 'epoch': 1.78} {'loss': 0.4877, 'learning_rate': 6.072981251810772e-07, 'epoch': 1.78} {'loss': 0.5701, 'learning_rate': 6.071857901906186e-07, 'epoch': 1.78} {'loss': 0.478, 'learning_rate': 6.070734652654076e-07, 'epoch': 1.78} {'loss': 0.4124, 'learning_rate': 6.069611504055651e-07, 'epoch': 1.78} {'loss': 0.6213, 'learning_rate': 6.068488456112099e-07, 'epoch': 1.78} {'loss': 0.495, 'learning_rate': 6.067365508824652e-07, 'epoch': 1.78} {'loss': 0.4651, 'learning_rate': 6.066242662194521e-07, 'epoch': 1.78} {'loss': 0.4974, 'learning_rate': 6.065119916222851e-07, 'epoch': 1.78} {'loss': 0.5104, 'learning_rate': 6.063997270910915e-07, 'epoch': 1.78} {'loss': 0.3409, 'learning_rate': 6.062874726259859e-07, 'epoch': 1.78} {'loss': 0.4119, 'learning_rate': 6.061752282270928e-07, 'epoch': 1.78} {'loss': 0.504, 'learning_rate': 6.060629938945295e-07, 'epoch': 1.78} {'loss': 0.4238, 'learning_rate': 6.059507696284183e-07, 'epoch': 1.78} {'loss': 0.6727, 'learning_rate': 6.058385554288804e-07, 'epoch': 1.78} {'loss': 0.4217, 'learning_rate': 6.05726351296032e-07, 'epoch': 1.78} {'loss': 0.4891, 'learning_rate': 6.056141572299967e-07, 'epoch': 1.78} {'loss': 0.489, 'learning_rate': 6.055019732308931e-07, 'epoch': 1.78} {'loss': 0.5565, 'learning_rate': 6.053897992988422e-07, 'epoch': 1.78} {'loss': 0.4968, 'learning_rate': 6.05277635433964e-07, 'epoch': 1.78} {'loss': 0.4952, 'learning_rate': 6.051654816363784e-07, 'epoch': 1.78} {'loss': 0.4231, 'learning_rate': 6.050533379062074e-07, 'epoch': 1.78} {'loss': 0.382, 'learning_rate': 6.049412042435688e-07, 'epoch': 1.78} {'loss': 0.5057, 'learning_rate': 6.048290806485834e-07, 'epoch': 1.78} {'loss': 0.5757, 'learning_rate': 6.047169671213715e-07, 'epoch': 1.78} {'loss': 0.5562, 'learning_rate': 6.046048636620538e-07, 'epoch': 1.78} {'loss': 0.5195, 'learning_rate': 6.044927702707492e-07, 'epoch': 1.78} {'loss': 0.4623, 'learning_rate': 6.043806869475787e-07, 'epoch': 1.78} {'loss': 0.5277, 'learning_rate': 6.042686136926645e-07, 'epoch': 1.78} {'loss': 0.5036, 'learning_rate': 6.041565505061231e-07, 'epoch': 1.78} {'loss': 0.4233, 'learning_rate': 6.040444973880755e-07, 'epoch': 1.78} {'loss': 0.4541, 'learning_rate': 6.039324543386416e-07, 'epoch': 1.78} {'loss': 0.5194, 'learning_rate': 6.038204213579424e-07, 'epoch': 1.78} {'loss': 0.6083, 'learning_rate': 6.03708398446099e-07, 'epoch': 1.78} {'loss': 0.6336, 'learning_rate': 6.035963856032301e-07, 'epoch': 1.78} {'loss': 0.6905, 'learning_rate': 6.034843828294545e-07, 'epoch': 1.78} {'loss': 0.5333, 'learning_rate': 6.033723901248945e-07, 'epoch': 1.78} {'loss': 0.5708, 'learning_rate': 6.032604074896686e-07, 'epoch': 1.78} {'loss': 0.4141, 'learning_rate': 6.03148434923897e-07, 'epoch': 1.78} {'loss': 0.5134, 'learning_rate': 6.030364724276994e-07, 'epoch': 1.78} {'loss': 0.5719, 'learning_rate': 6.029245200011968e-07, 'epoch': 1.78} {'loss': 0.4949, 'learning_rate': 6.028125776445104e-07, 'epoch': 1.78} {'loss': 0.5094, 'learning_rate': 6.027006453577578e-07, 'epoch': 1.78} {'loss': 0.5573, 'learning_rate': 6.025887231410588e-07, 'epoch': 1.78} {'loss': 0.6295, 'learning_rate': 6.024768109945334e-07, 'epoch': 1.78} {'loss': 0.5331, 'learning_rate': 6.023649089183037e-07, 'epoch': 1.78} {'loss': 0.6484, 'learning_rate': 6.022530169124874e-07, 'epoch': 1.78} {'loss': 0.5019, 'learning_rate': 6.021411349772054e-07, 'epoch': 1.78} {'loss': 0.4948, 'learning_rate': 6.02029263112578e-07, 'epoch': 1.78} {'loss': 0.3963, 'learning_rate': 6.019174013187245e-07, 'epoch': 1.78} {'loss': 0.4186, 'learning_rate': 6.018055495957631e-07, 'epoch': 1.78} {'loss': 0.5139, 'learning_rate': 6.016937079438168e-07, 'epoch': 1.78} {'loss': 0.3647, 'learning_rate': 6.015818763630033e-07, 'epoch': 1.78} {'loss': 0.5042, 'learning_rate': 6.014700548534447e-07, 'epoch': 1.78} {'loss': 0.5966, 'learning_rate': 6.013582434152554e-07, 'epoch': 1.78} {'loss': 0.5318, 'learning_rate': 6.012464420485631e-07, 'epoch': 1.78} {'loss': 0.5521, 'learning_rate': 6.011346507534821e-07, 'epoch': 1.78} {'loss': 0.5963, 'learning_rate': 6.010228695301323e-07, 'epoch': 1.78} {'loss': 0.4609, 'learning_rate': 6.00911098378636e-07, 'epoch': 1.78} {'loss': 0.5203, 'learning_rate': 6.007993372991116e-07, 'epoch': 1.78} {'loss': 0.5198, 'learning_rate': 6.006875862916806e-07, 'epoch': 1.78} {'loss': 0.5589, 'learning_rate': 6.005758453564581e-07, 'epoch': 1.78} {'loss': 0.5952, 'learning_rate': 6.004641144935697e-07, 'epoch': 1.78} {'loss': 0.5005, 'learning_rate': 6.003523937031308e-07, 'epoch': 1.78} {'loss': 0.5226, 'learning_rate': 6.002406829852625e-07, 'epoch': 1.78} {'loss': 0.5512, 'learning_rate': 6.001289823400857e-07, 'epoch': 1.78} {'loss': 0.3926, 'learning_rate': 6.000172917677183e-07, 'epoch': 1.78} {'loss': 0.3652, 'learning_rate': 5.999056112682822e-07, 'epoch': 1.78} {'loss': 0.4764, 'learning_rate': 5.997939408418929e-07, 'epoch': 1.78} {'loss': 0.513, 'learning_rate': 5.996822804886759e-07, 'epoch': 1.78} {'loss': 0.2889, 'learning_rate': 5.995706302087456e-07, 'epoch': 1.78} {'loss': 0.5141, 'learning_rate': 5.994589900022252e-07, 'epoch': 1.78} {'loss': 0.4543, 'learning_rate': 5.993473598692334e-07, 'epoch': 1.78} {'loss': 0.4676, 'learning_rate': 5.992357398098859e-07, 'epoch': 1.78} {'loss': 0.5791, 'learning_rate': 5.9912412982431e-07, 'epoch': 1.78} {'loss': 0.6107, 'learning_rate': 5.990125299126193e-07, 'epoch': 1.78} {'loss': 0.5064, 'learning_rate': 5.989009400749346e-07, 'epoch': 1.78} {'loss': 0.5685, 'learning_rate': 5.987893603113759e-07, 'epoch': 1.78} {'loss': 0.5013, 'learning_rate': 5.986777906220631e-07, 'epoch': 1.78} {'loss': 0.5556, 'learning_rate': 5.985662310071172e-07, 'epoch': 1.78} {'loss': 0.6153, 'learning_rate': 5.984546814666536e-07, 'epoch': 1.78} {'loss': 0.4442, 'learning_rate': 5.983431420007968e-07, 'epoch': 1.78} {'loss': 0.5851, 'learning_rate': 5.982316126096632e-07, 'epoch': 1.78} {'loss': 0.6114, 'learning_rate': 5.981200932933717e-07, 'epoch': 1.78} {'loss': 0.561, 'learning_rate': 5.980085840520444e-07, 'epoch': 1.78} {'loss': 0.4661, 'learning_rate': 5.978970848857979e-07, 'epoch': 1.78} {'loss': 0.5183, 'learning_rate': 5.977855957947565e-07, 'epoch': 1.78} {'loss': 0.4095, 'learning_rate': 5.976741167790323e-07, 'epoch': 1.78} {'loss': 0.3585, 'learning_rate': 5.97562647838752e-07, 'epoch': 1.78} {'loss': 0.5441, 'learning_rate': 5.974511889740309e-07, 'epoch': 1.78} {'loss': 0.3678, 'learning_rate': 5.97339740184989e-07, 'epoch': 1.78} {'loss': 0.424, 'learning_rate': 5.972283014717484e-07, 'epoch': 1.78} {'loss': 0.4643, 'learning_rate': 5.971168728344223e-07, 'epoch': 1.78} {'loss': 0.6662, 'learning_rate': 5.970054542731385e-07, 'epoch': 1.78} {'loss': 0.328, 'learning_rate': 5.968940457880079e-07, 'epoch': 1.78} {'loss': 0.4448, 'learning_rate': 5.967826473791571e-07, 'epoch': 1.78} {'loss': 0.5516, 'learning_rate': 5.966712590467017e-07, 'epoch': 1.78} {'loss': 0.4137, 'learning_rate': 5.965598807907602e-07, 'epoch': 1.78} {'loss': 0.5121, 'learning_rate': 5.964485126114561e-07, 'epoch': 1.78} {'loss': 0.5066, 'learning_rate': 5.963371545089036e-07, 'epoch': 1.78} {'loss': 0.5141, 'learning_rate': 5.962258064832271e-07, 'epoch': 1.78} {'loss': 0.5536, 'learning_rate': 5.961144685345399e-07, 'epoch': 1.78} {'loss': 0.508, 'learning_rate': 5.960031406629685e-07, 'epoch': 1.78} {'loss': 0.5205, 'learning_rate': 5.958918228686261e-07, 'epoch': 1.78} {'loss': 0.5856, 'learning_rate': 5.957805151516349e-07, 'epoch': 1.78} {'loss': 0.6009, 'learning_rate': 5.956692175121159e-07, 'epoch': 1.78} {'loss': 0.5115, 'learning_rate': 5.955579299501823e-07, 'epoch': 1.78} {'loss': 0.5605, 'learning_rate': 5.954466524659607e-07, 'epoch': 1.78} {'loss': 0.5933, 'learning_rate': 5.953353850595633e-07, 'epoch': 1.78} {'loss': 0.3673, 'learning_rate': 5.952241277311155e-07, 'epoch': 1.78} {'loss': 0.4843, 'learning_rate': 5.951128804807338e-07, 'epoch': 1.78} {'loss': 0.4351, 'learning_rate': 5.950016433085359e-07, 'epoch': 1.78} {'loss': 0.4559, 'learning_rate': 5.948904162146451e-07, 'epoch': 1.78} {'loss': 0.6155, 'learning_rate': 5.947791991991748e-07, 'epoch': 1.78} {'loss': 0.584, 'learning_rate': 5.9466799226225e-07, 'epoch': 1.78} {'loss': 0.5211, 'learning_rate': 5.945567954039854e-07, 'epoch': 1.78} {'loss': 0.4901, 'learning_rate': 5.944456086245043e-07, 'epoch': 1.78} {'loss': 0.4562, 'learning_rate': 5.94334431923922e-07, 'epoch': 1.78} {'loss': 0.4719, 'learning_rate': 5.942232653023594e-07, 'epoch': 1.78} {'loss': 0.5635, 'learning_rate': 5.941121087599378e-07, 'epoch': 1.78} {'loss': 0.6435, 'learning_rate': 5.940009622967702e-07, 'epoch': 1.78} {'loss': 0.4037, 'learning_rate': 5.938898259129822e-07, 'epoch': 1.78} {'loss': 0.5015, 'learning_rate': 5.937786996086892e-07, 'epoch': 1.78} {'loss': 0.539, 'learning_rate': 5.936675833840122e-07, 'epoch': 1.78} {'loss': 0.4931, 'learning_rate': 5.935564772390679e-07, 'epoch': 1.78} {'loss': 0.5522, 'learning_rate': 5.934453811739771e-07, 'epoch': 1.78} {'loss': 0.6016, 'learning_rate': 5.93334295188861e-07, 'epoch': 1.78} {'loss': 0.5269, 'learning_rate': 5.932232192838317e-07, 'epoch': 1.78} {'loss': 0.393, 'learning_rate': 5.931121534590167e-07, 'epoch': 1.78} {'loss': 0.5581, 'learning_rate': 5.930010977145295e-07, 'epoch': 1.78} {'loss': 0.5675, 'learning_rate': 5.92890052050491e-07, 'epoch': 1.78} {'loss': 0.5361, 'learning_rate': 5.927790164670189e-07, 'epoch': 1.78} {'loss': 0.6003, 'learning_rate': 5.926679909642341e-07, 'epoch': 1.78} {'loss': 0.3922, 'learning_rate': 5.925569755422555e-07, 'epoch': 1.78} {'loss': 0.5229, 'learning_rate': 5.924459702011986e-07, 'epoch': 1.78} {'loss': 0.4042, 'learning_rate': 5.923349749411877e-07, 'epoch': 1.78} {'loss': 0.4501, 'learning_rate': 5.922239897623372e-07, 'epoch': 1.78} {'loss': 0.6169, 'learning_rate': 5.92113014664768e-07, 'epoch': 1.78} {'loss': 0.4476, 'learning_rate': 5.92002049648599e-07, 'epoch': 1.78} {'loss': 0.6615, 'learning_rate': 5.918910947139489e-07, 'epoch': 1.78} {'loss': 0.406, 'learning_rate': 5.917801498609377e-07, 'epoch': 1.78} {'loss': 0.4938, 'learning_rate': 5.916692150896819e-07, 'epoch': 1.78} {'loss': 0.4053, 'learning_rate': 5.915582904003026e-07, 'epoch': 1.78} {'loss': 0.5098, 'learning_rate': 5.914473757929162e-07, 'epoch': 1.78} {'loss': 0.483, 'learning_rate': 5.913364712676439e-07, 'epoch': 1.78} {'loss': 0.387, 'learning_rate': 5.912255768246044e-07, 'epoch': 1.78} {'loss': 0.4167, 'learning_rate': 5.911146924639144e-07, 'epoch': 1.78} {'loss': 0.5389, 'learning_rate': 5.91003818185697e-07, 'epoch': 1.78} {'loss': 0.534, 'learning_rate': 5.908929539900665e-07, 'epoch': 1.78} {'loss': 0.5072, 'learning_rate': 5.90782099877143e-07, 'epoch': 1.78} {'loss': 0.476, 'learning_rate': 5.906712558470462e-07, 'epoch': 1.78} {'loss': 0.5359, 'learning_rate': 5.90560421899894e-07, 'epoch': 1.78} {'loss': 0.4503, 'learning_rate': 5.90449598035806e-07, 'epoch': 1.78} {'loss': 0.3826, 'learning_rate': 5.903387842549002e-07, 'epoch': 1.78} {'loss': 0.5625, 'learning_rate': 5.902279805572964e-07, 'epoch': 1.78} {'loss': 0.5174, 'learning_rate': 5.901171869431122e-07, 'epoch': 1.78} {'loss': 0.3647, 'learning_rate': 5.900064034124664e-07, 'epoch': 1.78} {'loss': 0.5845, 'learning_rate': 5.898956299654779e-07, 'epoch': 1.78} {'loss': 0.4513, 'learning_rate': 5.897848666022654e-07, 'epoch': 1.78} {'loss': 0.7048, 'learning_rate': 5.8967411332295e-07, 'epoch': 1.78} {'loss': 0.432, 'learning_rate': 5.89563370127646e-07, 'epoch': 1.78} {'loss': 0.6123, 'learning_rate': 5.894526370164743e-07, 'epoch': 1.78} {'loss': 0.4946, 'learning_rate': 5.89341913989554e-07, 'epoch': 1.78} {'loss': 0.4967, 'learning_rate': 5.892312010470025e-07, 'epoch': 1.78} {'loss': 0.5304, 'learning_rate': 5.891204981889387e-07, 'epoch': 1.78} {'loss': 0.499, 'learning_rate': 5.890098054154825e-07, 'epoch': 1.78} {'loss': 0.5373, 'learning_rate': 5.888991227267537e-07, 'epoch': 1.78} {'loss': 0.4547, 'learning_rate': 5.887884501228657e-07, 'epoch': 1.78} {'loss': 0.3583, 'learning_rate': 5.886777876039418e-07, 'epoch': 1.78} {'loss': 0.5049, 'learning_rate': 5.885671351700984e-07, 'epoch': 1.78} {'loss': 0.5078, 'learning_rate': 5.884564928214553e-07, 'epoch': 1.78} {'loss': 0.5802, 'learning_rate': 5.883458605581305e-07, 'epoch': 1.78} {'loss': 0.4562, 'learning_rate': 5.882352383802414e-07, 'epoch': 1.78} {'loss': 0.5414, 'learning_rate': 5.881246262879103e-07, 'epoch': 1.78} {'loss': 0.6041, 'learning_rate': 5.880140242812515e-07, 'epoch': 1.78} {'loss': 0.4159, 'learning_rate': 5.87903432360385e-07, 'epoch': 1.78} {'loss': 0.3571, 'learning_rate': 5.877928505254294e-07, 'epoch': 1.78} {'loss': 0.5547, 'learning_rate': 5.876822787765036e-07, 'epoch': 1.78} {'loss': 0.4814, 'learning_rate': 5.875717171137252e-07, 'epoch': 1.78} {'loss': 0.5128, 'learning_rate': 5.874611655372153e-07, 'epoch': 1.78} {'loss': 0.429, 'learning_rate': 5.873506240470883e-07, 'epoch': 1.78} {'loss': 0.529, 'learning_rate': 5.872400926434641e-07, 'epoch': 1.78} {'loss': 0.6204, 'learning_rate': 5.871295713264625e-07, 'epoch': 1.78} {'loss': 0.4703, 'learning_rate': 5.870190600962011e-07, 'epoch': 1.78} {'loss': 0.5273, 'learning_rate': 5.86908558952799e-07, 'epoch': 1.78} {'loss': 0.5808, 'learning_rate': 5.867980678963725e-07, 'epoch': 1.78} {'loss': 0.5368, 'learning_rate': 5.866875869270439e-07, 'epoch': 1.78} {'loss': 0.5943, 'learning_rate': 5.865771160449274e-07, 'epoch': 1.78} {'loss': 0.6146, 'learning_rate': 5.864666552501442e-07, 'epoch': 1.78} {'loss': 0.4131, 'learning_rate': 5.863562045428106e-07, 'epoch': 1.78} {'loss': 0.4655, 'learning_rate': 5.862457639230457e-07, 'epoch': 1.78} {'loss': 0.6386, 'learning_rate': 5.861353333909692e-07, 'epoch': 1.78} {'loss': 0.6392, 'learning_rate': 5.860249129466966e-07, 'epoch': 1.78} {'loss': 0.4797, 'learning_rate': 5.8591450259035e-07, 'epoch': 1.78} {'loss': 0.3371, 'learning_rate': 5.858041023220451e-07, 'epoch': 1.78} {'loss': 0.4235, 'learning_rate': 5.856937121419004e-07, 'epoch': 1.78} {'loss': 0.5497, 'learning_rate': 5.855833320500348e-07, 'epoch': 1.78} {'loss': 0.5062, 'learning_rate': 5.85472962046566e-07, 'epoch': 1.78} {'loss': 0.5165, 'learning_rate': 5.853626021316139e-07, 'epoch': 1.78} {'loss': 0.4868, 'learning_rate': 5.852522523052928e-07, 'epoch': 1.78} {'loss': 0.4835, 'learning_rate': 5.85141912567726e-07, 'epoch': 1.78} {'loss': 0.531, 'learning_rate': 5.85031582919029e-07, 'epoch': 1.78} {'loss': 0.4843, 'learning_rate': 5.849212633593193e-07, 'epoch': 1.78} {'loss': 0.3666, 'learning_rate': 5.84810953888717e-07, 'epoch': 1.78} {'loss': 0.4448, 'learning_rate': 5.847006545073397e-07, 'epoch': 1.78} {'loss': 0.469, 'learning_rate': 5.845903652153062e-07, 'epoch': 1.78} {'loss': 0.5131, 'learning_rate': 5.84480086012732e-07, 'epoch': 1.78} {'loss': 0.5317, 'learning_rate': 5.843698168997391e-07, 'epoch': 1.78} {'loss': 0.7875, 'learning_rate': 5.842595578764432e-07, 'epoch': 1.78} {'loss': 0.518, 'learning_rate': 5.841493089429617e-07, 'epoch': 1.78} {'loss': 0.5443, 'learning_rate': 5.84039070099417e-07, 'epoch': 1.78} {'loss': 0.3956, 'learning_rate': 5.839288413459198e-07, 'epoch': 1.78} {'loss': 0.3894, 'learning_rate': 5.83818622682597e-07, 'epoch': 1.78} {'loss': 0.6461, 'learning_rate': 5.837084141095595e-07, 'epoch': 1.78} {'loss': 0.4172, 'learning_rate': 5.835982156269304e-07, 'epoch': 1.78} {'loss': 0.5107, 'learning_rate': 5.834880272348242e-07, 'epoch': 1.78} {'loss': 0.3463, 'learning_rate': 5.833778489333609e-07, 'epoch': 1.78} {'loss': 0.4981, 'learning_rate': 5.832676807226601e-07, 'epoch': 1.78} {'loss': 0.535, 'learning_rate': 5.831575226028341e-07, 'epoch': 1.78} {'loss': 0.4403, 'learning_rate': 5.830473745740073e-07, 'epoch': 1.78} {'loss': 0.3962, 'learning_rate': 5.829372366362929e-07, 'epoch': 1.78} {'loss': 0.4029, 'learning_rate': 5.828271087898141e-07, 'epoch': 1.78} {'loss': 0.4787, 'learning_rate': 5.827169910346852e-07, 'epoch': 1.78} {'loss': 0.4451, 'learning_rate': 5.826068833710241e-07, 'epoch': 1.78} {'loss': 0.442, 'learning_rate': 5.824967857989517e-07, 'epoch': 1.78} {'loss': 0.5097, 'learning_rate': 5.823866983185799e-07, 'epoch': 1.78} {'loss': 0.5199, 'learning_rate': 5.822766209300346e-07, 'epoch': 1.78} {'loss': 0.4646, 'learning_rate': 5.821665536334286e-07, 'epoch': 1.78} {'loss': 0.3734, 'learning_rate': 5.820564964288811e-07, 'epoch': 1.78} {'loss': 0.6075, 'learning_rate': 5.819464493165095e-07, 'epoch': 1.78} {'loss': 0.4705, 'learning_rate': 5.818364122964337e-07, 'epoch': 1.78} {'loss': 0.5851, 'learning_rate': 5.817263853687705e-07, 'epoch': 1.78} {'loss': 0.4153, 'learning_rate': 5.81616368533634e-07, 'epoch': 1.78} {'loss': 0.4084, 'learning_rate': 5.815063617911498e-07, 'epoch': 1.78} {'loss': 0.4897, 'learning_rate': 5.8139636514143e-07, 'epoch': 1.78} {'loss': 0.6259, 'learning_rate': 5.812863785845934e-07, 'epoch': 1.78} {'loss': 0.5149, 'learning_rate': 5.811764021207588e-07, 'epoch': 1.78} {'loss': 0.5055, 'learning_rate': 5.81066435750044e-07, 'epoch': 1.78} {'loss': 0.4756, 'learning_rate': 5.809564794725686e-07, 'epoch': 1.78} {'loss': 0.5832, 'learning_rate': 5.808465332884449e-07, 'epoch': 1.78} {'loss': 0.3171, 'learning_rate': 5.807365971977963e-07, 'epoch': 1.78} {'loss': 0.5966, 'learning_rate': 5.80626671200738e-07, 'epoch': 1.78} {'loss': 0.6161, 'learning_rate': 5.805167552973889e-07, 'epoch': 1.78} {'loss': 0.4724, 'learning_rate': 5.804068494878668e-07, 'epoch': 1.78} {'loss': 0.4256, 'learning_rate': 5.802969537722869e-07, 'epoch': 1.78} {'loss': 0.4443, 'learning_rate': 5.801870681507715e-07, 'epoch': 1.78} {'loss': 0.5308, 'learning_rate': 5.800771926234328e-07, 'epoch': 1.78} {'loss': 0.5267, 'learning_rate': 5.799673271903949e-07, 'epoch': 1.78} {'loss': 0.4631, 'learning_rate': 5.798574718517702e-07, 'epoch': 1.78} {'loss': 0.5483, 'learning_rate': 5.797476266076785e-07, 'epoch': 1.78} {'loss': 0.5039, 'learning_rate': 5.796377914582396e-07, 'epoch': 1.78} {'loss': 0.5435, 'learning_rate': 5.795279664035646e-07, 'epoch': 1.78} {'loss': 0.5444, 'learning_rate': 5.794181514437803e-07, 'epoch': 1.78} {'loss': 0.6093, 'learning_rate': 5.793083465789961e-07, 'epoch': 1.78} {'loss': 0.4247, 'learning_rate': 5.791985518093357e-07, 'epoch': 1.78} {'loss': 0.3859, 'learning_rate': 5.790887671349132e-07, 'epoch': 1.78} {'loss': 0.4815, 'learning_rate': 5.789789925558476e-07, 'epoch': 1.78} {'loss': 0.487, 'learning_rate': 5.788692280722585e-07, 'epoch': 1.78} {'loss': 0.5534, 'learning_rate': 5.787594736842573e-07, 'epoch': 1.78} {'loss': 0.5218, 'learning_rate': 5.786497293919691e-07, 'epoch': 1.78} {'loss': 0.5922, 'learning_rate': 5.78539995195504e-07, 'epoch': 1.78} {'loss': 0.5169, 'learning_rate': 5.784302710949874e-07, 'epoch': 1.78} {'loss': 0.6902, 'learning_rate': 5.783205570905325e-07, 'epoch': 1.78} {'loss': 0.4393, 'learning_rate': 5.782108531822561e-07, 'epoch': 1.78} {'loss': 0.4812, 'learning_rate': 5.78101159370279e-07, 'epoch': 1.78} {'loss': 0.4791, 'learning_rate': 5.779914756547144e-07, 'epoch': 1.78} {'loss': 0.59, 'learning_rate': 5.778818020356847e-07, 'epoch': 1.78} {'loss': 0.5358, 'learning_rate': 5.777721385133039e-07, 'epoch': 1.78} {'loss': 0.467, 'learning_rate': 5.776624850876911e-07, 'epoch': 1.78} {'loss': 0.5489, 'learning_rate': 5.775528417589626e-07, 'epoch': 1.78} {'loss': 0.5821, 'learning_rate': 5.774432085272375e-07, 'epoch': 1.78} {'loss': 0.4376, 'learning_rate': 5.773335853926332e-07, 'epoch': 1.78} {'loss': 0.4892, 'learning_rate': 5.772239723552631e-07, 'epoch': 1.78} {'loss': 0.5718, 'learning_rate': 5.771143694152514e-07, 'epoch': 1.78} {'loss': 0.6151, 'learning_rate': 5.770047765727116e-07, 'epoch': 1.78} {'loss': 0.5136, 'learning_rate': 5.768951938277601e-07, 'epoch': 1.78} {'loss': 0.5021, 'learning_rate': 5.767856211805168e-07, 'epoch': 1.78} {'loss': 0.5588, 'learning_rate': 5.766760586310982e-07, 'epoch': 1.78} {'loss': 0.4757, 'learning_rate': 5.765665061796222e-07, 'epoch': 1.78} {'loss': 0.6498, 'learning_rate': 5.764569638262052e-07, 'epoch': 1.78} {'loss': 0.5146, 'learning_rate': 5.76347431570965e-07, 'epoch': 1.78} {'loss': 0.6038, 'learning_rate': 5.762379094140192e-07, 'epoch': 1.78} {'loss': 0.6715, 'learning_rate': 5.761283973554843e-07, 'epoch': 1.78} {'loss': 0.4325, 'learning_rate': 5.760188953954793e-07, 'epoch': 1.78} {'loss': 0.3679, 'learning_rate': 5.759094035341195e-07, 'epoch': 1.78} {'loss': 0.5221, 'learning_rate': 5.75799921771526e-07, 'epoch': 1.78} {'loss': 0.5239, 'learning_rate': 5.756904501078109e-07, 'epoch': 1.78} {'loss': 0.5029, 'learning_rate': 5.755809885430952e-07, 'epoch': 1.78} {'loss': 0.3943, 'learning_rate': 5.754715370774943e-07, 'epoch': 1.78} {'loss': 0.5199, 'learning_rate': 5.753620957111262e-07, 'epoch': 1.78} {'loss': 0.5453, 'learning_rate': 5.752526644441092e-07, 'epoch': 1.78} {'loss': 0.5816, 'learning_rate': 5.751432432765591e-07, 'epoch': 1.78} {'loss': 0.5618, 'learning_rate': 5.750338322085947e-07, 'epoch': 1.78} {'loss': 0.5705, 'learning_rate': 5.749244312403313e-07, 'epoch': 1.78} {'loss': 0.5633, 'learning_rate': 5.748150403718867e-07, 'epoch': 1.78} {'loss': 0.4182, 'learning_rate': 5.747056596033784e-07, 'epoch': 1.78} {'loss': 0.4094, 'learning_rate': 5.745962889349233e-07, 'epoch': 1.78} {'loss': 0.5389, 'learning_rate': 5.744869283666399e-07, 'epoch': 1.78} {'loss': 0.4163, 'learning_rate': 5.743775778986449e-07, 'epoch': 1.78} {'loss': 0.4598, 'learning_rate': 5.742682375310549e-07, 'epoch': 1.78} {'loss': 0.5996, 'learning_rate': 5.741589072639863e-07, 'epoch': 1.78} {'loss': 0.4529, 'learning_rate': 5.740495870975571e-07, 'epoch': 1.78} {'loss': 0.458, 'learning_rate': 5.739402770318847e-07, 'epoch': 1.78} {'loss': 0.4306, 'learning_rate': 5.738309770670858e-07, 'epoch': 1.78} {'loss': 0.5184, 'learning_rate': 5.737216872032781e-07, 'epoch': 1.78} {'loss': 0.4166, 'learning_rate': 5.736124074405802e-07, 'epoch': 1.78} {'loss': 0.4989, 'learning_rate': 5.735031377791056e-07, 'epoch': 1.78} {'loss': 0.491, 'learning_rate': 5.73393878218973e-07, 'epoch': 1.78} {'loss': 0.4828, 'learning_rate': 5.732846287603e-07, 'epoch': 1.78} {'loss': 0.4183, 'learning_rate': 5.731753894032033e-07, 'epoch': 1.78} {'loss': 0.4144, 'learning_rate': 5.730661601477993e-07, 'epoch': 1.78} {'loss': 0.5369, 'learning_rate': 5.729569409942081e-07, 'epoch': 1.78} {'loss': 0.4599, 'learning_rate': 5.728477319425418e-07, 'epoch': 1.78} {'loss': 0.4539, 'learning_rate': 5.727385329929214e-07, 'epoch': 1.78} {'loss': 0.494, 'learning_rate': 5.726293441454611e-07, 'epoch': 1.78} {'loss': 0.5902, 'learning_rate': 5.72520165400281e-07, 'epoch': 1.78} {'loss': 0.5987, 'learning_rate': 5.724109967574953e-07, 'epoch': 1.78} {'loss': 0.6608, 'learning_rate': 5.72301838217224e-07, 'epoch': 1.78} {'loss': 0.5343, 'learning_rate': 5.721926897795804e-07, 'epoch': 1.78} {'loss': 0.5316, 'learning_rate': 5.720835514446832e-07, 'epoch': 1.78} {'loss': 0.5347, 'learning_rate': 5.71974423212649e-07, 'epoch': 1.78} {'loss': 0.4156, 'learning_rate': 5.718653050835964e-07, 'epoch': 1.78} {'loss': 0.3718, 'learning_rate': 5.717561970576402e-07, 'epoch': 1.78} {'loss': 0.4198, 'learning_rate': 5.716470991348976e-07, 'epoch': 1.78} {'loss': 0.7277, 'learning_rate': 5.715380113154889e-07, 'epoch': 1.78} {'loss': 0.4443, 'learning_rate': 5.71428933599526e-07, 'epoch': 1.78} {'loss': 0.4722, 'learning_rate': 5.713198659871277e-07, 'epoch': 1.78} {'loss': 0.62, 'learning_rate': 5.712108084784118e-07, 'epoch': 1.78} {'loss': 0.472, 'learning_rate': 5.711017610734948e-07, 'epoch': 1.78} {'loss': 0.5449, 'learning_rate': 5.709927237724921e-07, 'epoch': 1.78} {'loss': 0.5406, 'learning_rate': 5.708836965755226e-07, 'epoch': 1.78} {'loss': 0.5641, 'learning_rate': 5.70774679482704e-07, 'epoch': 1.78} {'loss': 0.6305, 'learning_rate': 5.706656724941495e-07, 'epoch': 1.78} {'loss': 0.3661, 'learning_rate': 5.705566756099778e-07, 'epoch': 1.78} {'loss': 0.6668, 'learning_rate': 5.704476888303057e-07, 'epoch': 1.78} {'loss': 0.5958, 'learning_rate': 5.703387121552495e-07, 'epoch': 1.78} {'loss': 0.633, 'learning_rate': 5.702297455849282e-07, 'epoch': 1.78} {'loss': 0.5931, 'learning_rate': 5.701207891194538e-07, 'epoch': 1.78} {'loss': 0.4468, 'learning_rate': 5.700118427589496e-07, 'epoch': 1.78} {'loss': 0.5842, 'learning_rate': 5.699029065035267e-07, 'epoch': 1.78} {'loss': 0.437, 'learning_rate': 5.697939803533037e-07, 'epoch': 1.78} {'loss': 0.5846, 'learning_rate': 5.696850643083984e-07, 'epoch': 1.78} {'loss': 0.5592, 'learning_rate': 5.695761583689263e-07, 'epoch': 1.78} {'loss': 0.4357, 'learning_rate': 5.694672625350062e-07, 'epoch': 1.78} {'loss': 0.5951, 'learning_rate': 5.693583768067501e-07, 'epoch': 1.78} {'loss': 0.5133, 'learning_rate': 5.692495011842803e-07, 'epoch': 1.78} {'loss': 0.591, 'learning_rate': 5.691406356677088e-07, 'epoch': 1.78} {'loss': 0.5209, 'learning_rate': 5.690317802571554e-07, 'epoch': 1.78} {'loss': 0.6785, 'learning_rate': 5.689229349527348e-07, 'epoch': 1.78} {'loss': 0.5026, 'learning_rate': 5.688140997545655e-07, 'epoch': 1.78} {'loss': 0.5578, 'learning_rate': 5.687052746627641e-07, 'epoch': 1.78} {'loss': 0.5719, 'learning_rate': 5.685964596774429e-07, 'epoch': 1.78} {'loss': 0.5263, 'learning_rate': 5.68487654798725e-07, 'epoch': 1.78} {'loss': 0.3262, 'learning_rate': 5.683788600267226e-07, 'epoch': 1.79} {'loss': 0.5551, 'learning_rate': 5.682700753615534e-07, 'epoch': 1.79} {'loss': 0.5001, 'learning_rate': 5.681613008033349e-07, 'epoch': 1.79} {'loss': 0.5051, 'learning_rate': 5.680525363521805e-07, 'epoch': 1.79} {'loss': 0.4206, 'learning_rate': 5.679437820082123e-07, 'epoch': 1.79} {'loss': 0.5851, 'learning_rate': 5.678350377715402e-07, 'epoch': 1.79} {'loss': 0.4787, 'learning_rate': 5.677263036422875e-07, 'epoch': 1.79} {'loss': 0.471, 'learning_rate': 5.676175796205663e-07, 'epoch': 1.79} {'loss': 0.534, 'learning_rate': 5.675088657064931e-07, 'epoch': 1.79} {'loss': 0.5683, 'learning_rate': 5.674001619001879e-07, 'epoch': 1.79} {'loss': 0.6436, 'learning_rate': 5.672914682017616e-07, 'epoch': 1.79} {'loss': 0.5939, 'learning_rate': 5.671827846113365e-07, 'epoch': 1.79} {'loss': 0.4854, 'learning_rate': 5.670741111290235e-07, 'epoch': 1.79} {'loss': 0.4128, 'learning_rate': 5.669654477549446e-07, 'epoch': 1.79} {'loss': 0.4454, 'learning_rate': 5.668567944892122e-07, 'epoch': 1.79} {'loss': 0.3265, 'learning_rate': 5.667481513319451e-07, 'epoch': 1.79} {'loss': 0.4759, 'learning_rate': 5.666395182832596e-07, 'epoch': 1.79} {'loss': 0.4443, 'learning_rate': 5.66530895343268e-07, 'epoch': 1.79} {'loss': 0.5645, 'learning_rate': 5.664222825120935e-07, 'epoch': 1.79} {'loss': 0.5199, 'learning_rate': 5.663136797898449e-07, 'epoch': 1.79} {'loss': 0.6271, 'learning_rate': 5.662050871766467e-07, 'epoch': 1.79} {'loss': 0.5933, 'learning_rate': 5.660965046726097e-07, 'epoch': 1.79} {'loss': 0.4006, 'learning_rate': 5.659879322778516e-07, 'epoch': 1.79} {'loss': 0.3302, 'learning_rate': 5.658793699924903e-07, 'epoch': 1.79} {'loss': 0.42, 'learning_rate': 5.657708178166377e-07, 'epoch': 1.79} {'loss': 0.5424, 'learning_rate': 5.65662275750416e-07, 'epoch': 1.79} {'loss': 0.5271, 'learning_rate': 5.655537437939362e-07, 'epoch': 1.79} {'loss': 0.5073, 'learning_rate': 5.654452219473195e-07, 'epoch': 1.79} {'loss': 0.5755, 'learning_rate': 5.653367102106788e-07, 'epoch': 1.79} {'loss': 0.4602, 'learning_rate': 5.65228208584131e-07, 'epoch': 1.79} {'loss': 0.6061, 'learning_rate': 5.651197170677936e-07, 'epoch': 1.79} {'loss': 0.4088, 'learning_rate': 5.650112356617798e-07, 'epoch': 1.79} {'loss': 0.4665, 'learning_rate': 5.649027643662108e-07, 'epoch': 1.79} {'loss': 0.4062, 'learning_rate': 5.647943031811986e-07, 'epoch': 1.79} {'loss': 0.4588, 'learning_rate': 5.64685852106861e-07, 'epoch': 1.79} {'loss': 0.6117, 'learning_rate': 5.645774111433144e-07, 'epoch': 1.79} {'loss': 0.5357, 'learning_rate': 5.644689802906745e-07, 'epoch': 1.79} {'loss': 0.539, 'learning_rate': 5.643605595490586e-07, 'epoch': 1.79} {'loss': 0.4526, 'learning_rate': 5.642521489185793e-07, 'epoch': 1.79} {'loss': 0.7209, 'learning_rate': 5.641437483993584e-07, 'epoch': 1.79} {'loss': 0.4108, 'learning_rate': 5.640353579915081e-07, 'epoch': 1.79} {'loss': 0.3212, 'learning_rate': 5.63926977695145e-07, 'epoch': 1.79} {'loss': 0.493, 'learning_rate': 5.638186075103858e-07, 'epoch': 1.79} {'loss': 0.4893, 'learning_rate': 5.637102474373468e-07, 'epoch': 1.79} {'loss': 0.5681, 'learning_rate': 5.636018974761459e-07, 'epoch': 1.79} {'loss': 0.4308, 'learning_rate': 5.634935576268941e-07, 'epoch': 1.79} {'loss': 0.4586, 'learning_rate': 5.633852278897134e-07, 'epoch': 1.79} {'loss': 0.7246, 'learning_rate': 5.632769082647149e-07, 'epoch': 1.79} {'loss': 0.4041, 'learning_rate': 5.631685987520186e-07, 'epoch': 1.79} {'loss': 0.4659, 'learning_rate': 5.630602993517386e-07, 'epoch': 1.79} {'loss': 0.4886, 'learning_rate': 5.629520100639896e-07, 'epoch': 1.79} {'loss': 0.6335, 'learning_rate': 5.628437308888913e-07, 'epoch': 1.79} {'loss': 0.607, 'learning_rate': 5.627354618265568e-07, 'epoch': 1.79} {'loss': 0.3879, 'learning_rate': 5.62627202877103e-07, 'epoch': 1.79} {'loss': 0.4675, 'learning_rate': 5.62518954040645e-07, 'epoch': 1.79} {'loss': 0.7056, 'learning_rate': 5.624107153173009e-07, 'epoch': 1.79} {'loss': 0.4029, 'learning_rate': 5.623024867071869e-07, 'epoch': 1.79} {'loss': 0.4957, 'learning_rate': 5.621942682104143e-07, 'epoch': 1.79} {'loss': 0.5983, 'learning_rate': 5.620860598271049e-07, 'epoch': 1.79} {'loss': 0.4385, 'learning_rate': 5.619778615573712e-07, 'epoch': 1.79} {'loss': 0.5455, 'learning_rate': 5.618696734013296e-07, 'epoch': 1.79} {'loss': 0.2927, 'learning_rate': 5.617614953590978e-07, 'epoch': 1.79} {'loss': 0.4693, 'learning_rate': 5.616533274307889e-07, 'epoch': 1.79} {'loss': 0.4259, 'learning_rate': 5.615451696165219e-07, 'epoch': 1.79} {'loss': 0.5806, 'learning_rate': 5.614370219164089e-07, 'epoch': 1.79} {'loss': 0.5289, 'learning_rate': 5.613288843305709e-07, 'epoch': 1.79} {'loss': 0.4596, 'learning_rate': 5.612207568591188e-07, 'epoch': 1.79} {'loss': 0.5949, 'learning_rate': 5.611126395021715e-07, 'epoch': 1.79} {'loss': 0.5757, 'learning_rate': 5.610045322598434e-07, 'epoch': 1.79} {'loss': 0.5451, 'learning_rate': 5.608964351322499e-07, 'epoch': 1.79} {'loss': 0.4185, 'learning_rate': 5.607883481195109e-07, 'epoch': 1.79} {'loss': 0.3446, 'learning_rate': 5.606802712217363e-07, 'epoch': 1.79} {'loss': 0.5818, 'learning_rate': 5.60572204439046e-07, 'epoch': 1.79} {'loss': 0.4921, 'learning_rate': 5.604641477715534e-07, 'epoch': 1.79} {'loss': 0.3997, 'learning_rate': 5.603561012193759e-07, 'epoch': 1.79} {'loss': 0.3803, 'learning_rate': 5.602480647826291e-07, 'epoch': 1.79} {'loss': 0.6252, 'learning_rate': 5.601400384614286e-07, 'epoch': 1.79} {'loss': 0.4357, 'learning_rate': 5.600320222558908e-07, 'epoch': 1.79} {'loss': 0.5445, 'learning_rate': 5.599240161661302e-07, 'epoch': 1.79} {'loss': 0.6322, 'learning_rate': 5.59816020192262e-07, 'epoch': 1.79} {'loss': 0.5282, 'learning_rate': 5.59708034334403e-07, 'epoch': 1.79} {'loss': 0.5069, 'learning_rate': 5.596000585926697e-07, 'epoch': 1.79} {'loss': 0.5004, 'learning_rate': 5.594920929671765e-07, 'epoch': 1.79} {'loss': 0.4914, 'learning_rate': 5.5938413745804e-07, 'epoch': 1.79} {'loss': 0.262, 'learning_rate': 5.592761920653767e-07, 'epoch': 1.79} {'loss': 0.388, 'learning_rate': 5.591682567892997e-07, 'epoch': 1.79} {'loss': 0.3842, 'learning_rate': 5.590603316299248e-07, 'epoch': 1.79} {'loss': 0.411, 'learning_rate': 5.589524165873706e-07, 'epoch': 1.79} {'loss': 0.5225, 'learning_rate': 5.588445116617503e-07, 'epoch': 1.79} {'loss': 0.5484, 'learning_rate': 5.587366168531793e-07, 'epoch': 1.79} {'loss': 0.4228, 'learning_rate': 5.586287321617767e-07, 'epoch': 1.79} {'loss': 0.4103, 'learning_rate': 5.585208575876544e-07, 'epoch': 1.79} {'loss': 0.2896, 'learning_rate': 5.584129931309279e-07, 'epoch': 1.79} {'loss': 0.4012, 'learning_rate': 5.583051387917148e-07, 'epoch': 1.79} {'loss': 0.4891, 'learning_rate': 5.581972945701298e-07, 'epoch': 1.79} {'loss': 0.5431, 'learning_rate': 5.58089460466289e-07, 'epoch': 1.79} {'loss': 0.637, 'learning_rate': 5.57981636480307e-07, 'epoch': 1.79} {'loss': 0.6782, 'learning_rate': 5.578738226123015e-07, 'epoch': 1.79} {'loss': 0.4368, 'learning_rate': 5.577660188623845e-07, 'epoch': 1.79} {'loss': 0.4134, 'learning_rate': 5.576582252306739e-07, 'epoch': 1.79} {'loss': 0.3593, 'learning_rate': 5.57550441717285e-07, 'epoch': 1.79} {'loss': 0.4386, 'learning_rate': 5.574426683223322e-07, 'epoch': 1.79} {'loss': 0.5787, 'learning_rate': 5.573349050459342e-07, 'epoch': 1.79} {'loss': 0.5297, 'learning_rate': 5.572271518882011e-07, 'epoch': 1.79} {'loss': 0.4367, 'learning_rate': 5.571194088492538e-07, 'epoch': 1.79} {'loss': 0.4718, 'learning_rate': 5.570116759292044e-07, 'epoch': 1.79} {'loss': 0.3246, 'learning_rate': 5.569039531281683e-07, 'epoch': 1.79} {'loss': 0.4302, 'learning_rate': 5.567962404462623e-07, 'epoch': 1.79} {'loss': 0.5007, 'learning_rate': 5.566885378836018e-07, 'epoch': 1.79} {'loss': 0.4835, 'learning_rate': 5.565808454403033e-07, 'epoch': 1.79} {'loss': 0.5902, 'learning_rate': 5.564731631164777e-07, 'epoch': 1.79} {'loss': 0.6043, 'learning_rate': 5.563654909122463e-07, 'epoch': 1.79} {'loss': 0.5482, 'learning_rate': 5.562578288277198e-07, 'epoch': 1.79} {'loss': 0.5677, 'learning_rate': 5.561501768630162e-07, 'epoch': 1.79} {'loss': 0.6401, 'learning_rate': 5.560425350182496e-07, 'epoch': 1.79} {'loss': 0.6426, 'learning_rate': 5.559349032935357e-07, 'epoch': 1.79} {'loss': 0.5423, 'learning_rate': 5.558272816889921e-07, 'epoch': 1.79} {'loss': 0.4405, 'learning_rate': 5.557196702047296e-07, 'epoch': 1.79} {'loss': 0.4745, 'learning_rate': 5.556120688408662e-07, 'epoch': 1.79} {'loss': 0.407, 'learning_rate': 5.555044775975171e-07, 'epoch': 1.79} {'loss': 0.4311, 'learning_rate': 5.553968964747969e-07, 'epoch': 1.79} {'loss': 0.2906, 'learning_rate': 5.552893254728231e-07, 'epoch': 1.79} {'loss': 0.4131, 'learning_rate': 5.551817645917057e-07, 'epoch': 1.79} {'loss': 0.4332, 'learning_rate': 5.550742138315668e-07, 'epoch': 1.79} {'loss': 0.5062, 'learning_rate': 5.549666731925174e-07, 'epoch': 1.79} {'loss': 0.4076, 'learning_rate': 5.54859142674673e-07, 'epoch': 1.79} {'loss': 0.5304, 'learning_rate': 5.547516222781502e-07, 'epoch': 1.79} {'loss': 0.4623, 'learning_rate': 5.546441120030633e-07, 'epoch': 1.79} {'loss': 0.5236, 'learning_rate': 5.545366118495288e-07, 'epoch': 1.79} {'loss': 0.4524, 'learning_rate': 5.544291218176579e-07, 'epoch': 1.79} {'loss': 0.518, 'learning_rate': 5.543216419075714e-07, 'epoch': 1.79} {'loss': 0.4909, 'learning_rate': 5.542141721193816e-07, 'epoch': 1.79} {'loss': 0.6174, 'learning_rate': 5.541067124532029e-07, 'epoch': 1.79} {'loss': 0.4878, 'learning_rate': 5.539992629091518e-07, 'epoch': 1.79} {'loss': 0.5527, 'learning_rate': 5.538918234873425e-07, 'epoch': 1.79} {'loss': 0.6216, 'learning_rate': 5.537843941878917e-07, 'epoch': 1.79} {'loss': 0.5275, 'learning_rate': 5.536769750109117e-07, 'epoch': 1.79} {'loss': 0.5887, 'learning_rate': 5.535695659565221e-07, 'epoch': 1.79} {'loss': 0.4634, 'learning_rate': 5.534621670248341e-07, 'epoch': 1.79} {'loss': 0.4055, 'learning_rate': 5.533547782159632e-07, 'epoch': 1.79} {'loss': 0.5003, 'learning_rate': 5.532473995300269e-07, 'epoch': 1.79} {'loss': 0.5259, 'learning_rate': 5.531400309671364e-07, 'epoch': 1.79} {'loss': 0.591, 'learning_rate': 5.530326725274104e-07, 'epoch': 1.79} {'loss': 0.6146, 'learning_rate': 5.529253242109612e-07, 'epoch': 1.79} {'loss': 0.5336, 'learning_rate': 5.528179860179073e-07, 'epoch': 1.79} {'loss': 0.51, 'learning_rate': 5.52710657948361e-07, 'epoch': 1.79} {'loss': 0.5031, 'learning_rate': 5.526033400024367e-07, 'epoch': 1.79} {'loss': 0.4875, 'learning_rate': 5.524960321802531e-07, 'epoch': 1.79} {'loss': 0.5141, 'learning_rate': 5.52388734481919e-07, 'epoch': 1.79} {'loss': 0.3998, 'learning_rate': 5.522814469075555e-07, 'epoch': 1.79} {'loss': 0.478, 'learning_rate': 5.521741694572736e-07, 'epoch': 1.79} {'loss': 0.428, 'learning_rate': 5.520669021311919e-07, 'epoch': 1.79} {'loss': 0.5685, 'learning_rate': 5.519596449294217e-07, 'epoch': 1.79} {'loss': 0.3422, 'learning_rate': 5.518523978520795e-07, 'epoch': 1.79} {'loss': 0.4338, 'learning_rate': 5.517451608992818e-07, 'epoch': 1.79} {'loss': 0.5152, 'learning_rate': 5.516379340711398e-07, 'epoch': 1.79} {'loss': 0.3589, 'learning_rate': 5.515307173677731e-07, 'epoch': 1.79} {'loss': 0.4591, 'learning_rate': 5.514235107892907e-07, 'epoch': 1.79} {'loss': 0.425, 'learning_rate': 5.513163143358135e-07, 'epoch': 1.79} {'loss': 0.6354, 'learning_rate': 5.512091280074527e-07, 'epoch': 1.79} {'loss': 0.5971, 'learning_rate': 5.511019518043237e-07, 'epoch': 1.79} {'loss': 0.4552, 'learning_rate': 5.50994785726543e-07, 'epoch': 1.79} {'loss': 0.5222, 'learning_rate': 5.508876297742216e-07, 'epoch': 1.79} {'loss': 0.5349, 'learning_rate': 5.507804839474806e-07, 'epoch': 1.79} {'loss': 0.502, 'learning_rate': 5.506733482464277e-07, 'epoch': 1.79} {'loss': 0.4527, 'learning_rate': 5.505662226711839e-07, 'epoch': 1.79} {'loss': 0.3866, 'learning_rate': 5.504591072218601e-07, 'epoch': 1.79} {'loss': 0.5291, 'learning_rate': 5.503520018985719e-07, 'epoch': 1.79} {'loss': 0.5673, 'learning_rate': 5.502449067014359e-07, 'epoch': 1.79} {'loss': 0.5265, 'learning_rate': 5.501378216305619e-07, 'epoch': 1.79} {'loss': 0.4977, 'learning_rate': 5.500307466860722e-07, 'epoch': 1.79} {'loss': 0.4952, 'learning_rate': 5.499236818680743e-07, 'epoch': 1.79} {'loss': 0.3874, 'learning_rate': 5.498166271766881e-07, 'epoch': 1.79} {'loss': 0.6094, 'learning_rate': 5.497095826120258e-07, 'epoch': 1.79} {'loss': 0.3638, 'learning_rate': 5.496025481742028e-07, 'epoch': 1.79} {'loss': 0.5627, 'learning_rate': 5.494955238633348e-07, 'epoch': 1.79} {'loss': 0.5064, 'learning_rate': 5.493885096795315e-07, 'epoch': 1.79} {'loss': 0.4427, 'learning_rate': 5.49281505622915e-07, 'epoch': 1.79} {'loss': 0.4082, 'learning_rate': 5.491745116935954e-07, 'epoch': 1.79} {'loss': 0.3797, 'learning_rate': 5.490675278916879e-07, 'epoch': 1.79} {'loss': 0.4742, 'learning_rate': 5.489605542173071e-07, 'epoch': 1.79} {'loss': 0.5199, 'learning_rate': 5.488535906705683e-07, 'epoch': 1.79} {'loss': 0.5919, 'learning_rate': 5.487466372515882e-07, 'epoch': 1.79} {'loss': 0.4276, 'learning_rate': 5.486396939604755e-07, 'epoch': 1.79} {'loss': 0.4974, 'learning_rate': 5.485327607973511e-07, 'epoch': 1.79} {'loss': 0.5038, 'learning_rate': 5.484258377623252e-07, 'epoch': 1.79} {'loss': 0.5077, 'learning_rate': 5.483189248555143e-07, 'epoch': 1.79} {'loss': 0.5944, 'learning_rate': 5.482120220770337e-07, 'epoch': 1.79} {'loss': 0.5361, 'learning_rate': 5.481051294269956e-07, 'epoch': 1.79} {'loss': 0.3486, 'learning_rate': 5.479982469055178e-07, 'epoch': 1.79} {'loss': 0.5134, 'learning_rate': 5.478913745127124e-07, 'epoch': 1.79} {'loss': 0.5069, 'learning_rate': 5.477845122486935e-07, 'epoch': 1.79} {'loss': 0.5117, 'learning_rate': 5.476776601135769e-07, 'epoch': 1.79} {'loss': 0.6334, 'learning_rate': 5.475708181074768e-07, 'epoch': 1.79} {'loss': 0.6373, 'learning_rate': 5.474639862305086e-07, 'epoch': 1.79} {'loss': 0.4851, 'learning_rate': 5.473571644827846e-07, 'epoch': 1.79} {'loss': 0.4501, 'learning_rate': 5.472503528644224e-07, 'epoch': 1.79} {'loss': 0.467, 'learning_rate': 5.47143551375533e-07, 'epoch': 1.79} {'loss': 0.5037, 'learning_rate': 5.470367600162329e-07, 'epoch': 1.79} {'loss': 0.4635, 'learning_rate': 5.469299787866356e-07, 'epoch': 1.79} {'loss': 0.541, 'learning_rate': 5.468232076868563e-07, 'epoch': 1.79} {'loss': 0.3892, 'learning_rate': 5.467164467170106e-07, 'epoch': 1.79} {'loss': 0.5855, 'learning_rate': 5.466096958772093e-07, 'epoch': 1.79} {'loss': 0.5004, 'learning_rate': 5.465029551675704e-07, 'epoch': 1.79} {'loss': 0.6665, 'learning_rate': 5.46396224588206e-07, 'epoch': 1.79} {'loss': 0.5138, 'learning_rate': 5.462895041392314e-07, 'epoch': 1.79} {'loss': 0.5468, 'learning_rate': 5.461827938207608e-07, 'epoch': 1.79} {'loss': 0.5539, 'learning_rate': 5.46076093632909e-07, 'epoch': 1.79} {'loss': 0.5135, 'learning_rate': 5.459694035757901e-07, 'epoch': 1.79} {'loss': 0.4879, 'learning_rate': 5.458627236495184e-07, 'epoch': 1.79} {'loss': 0.4564, 'learning_rate': 5.457560538542073e-07, 'epoch': 1.79} {'loss': 0.4237, 'learning_rate': 5.456493941899721e-07, 'epoch': 1.79} {'loss': 0.6394, 'learning_rate': 5.455427446569261e-07, 'epoch': 1.79} {'loss': 0.4817, 'learning_rate': 5.454361052551849e-07, 'epoch': 1.79} {'loss': 0.6145, 'learning_rate': 5.453294759848627e-07, 'epoch': 1.79} {'loss': 0.4263, 'learning_rate': 5.452228568460738e-07, 'epoch': 1.79} {'loss': 0.614, 'learning_rate': 5.451162478389315e-07, 'epoch': 1.79} {'loss': 0.6893, 'learning_rate': 5.450096489635504e-07, 'epoch': 1.79} {'loss': 0.6618, 'learning_rate': 5.449030602200445e-07, 'epoch': 1.79} {'loss': 0.5161, 'learning_rate': 5.447964816085283e-07, 'epoch': 1.79} {'loss': 0.4728, 'learning_rate': 5.446899131291161e-07, 'epoch': 1.79} {'loss': 0.6073, 'learning_rate': 5.445833547819212e-07, 'epoch': 1.79} {'loss': 0.5477, 'learning_rate': 5.444768065670613e-07, 'epoch': 1.79} {'loss': 0.5184, 'learning_rate': 5.443702684846464e-07, 'epoch': 1.79} {'loss': 0.6084, 'learning_rate': 5.442637405347917e-07, 'epoch': 1.79} {'loss': 0.523, 'learning_rate': 5.441572227176118e-07, 'epoch': 1.79} {'loss': 0.5746, 'learning_rate': 5.44050715033222e-07, 'epoch': 1.79} {'loss': 0.5603, 'learning_rate': 5.439442174817333e-07, 'epoch': 1.79} {'loss': 0.4956, 'learning_rate': 5.438377300632646e-07, 'epoch': 1.79} {'loss': 0.5556, 'learning_rate': 5.437312527779259e-07, 'epoch': 1.79} {'loss': 0.433, 'learning_rate': 5.436247856258325e-07, 'epoch': 1.79} {'loss': 0.5535, 'learning_rate': 5.435183286070978e-07, 'epoch': 1.79} {'loss': 0.4686, 'learning_rate': 5.434118817218382e-07, 'epoch': 1.79} {'loss': 0.4978, 'learning_rate': 5.433054449701646e-07, 'epoch': 1.79} {'loss': 0.5957, 'learning_rate': 5.431990183521941e-07, 'epoch': 1.79} {'loss': 0.4395, 'learning_rate': 5.430926018680405e-07, 'epoch': 1.79} {'loss': 0.3711, 'learning_rate': 5.429861955178151e-07, 'epoch': 1.79} {'loss': 0.5563, 'learning_rate': 5.428797993016332e-07, 'epoch': 1.79} {'loss': 0.4956, 'learning_rate': 5.427734132196094e-07, 'epoch': 1.79} {'loss': 0.6031, 'learning_rate': 5.426670372718578e-07, 'epoch': 1.79} {'loss': 0.58, 'learning_rate': 5.425606714584919e-07, 'epoch': 1.79} {'loss': 0.3902, 'learning_rate': 5.424543157796258e-07, 'epoch': 1.79} {'loss': 0.3732, 'learning_rate': 5.42347970235374e-07, 'epoch': 1.79} {'loss': 0.4275, 'learning_rate': 5.422416348258497e-07, 'epoch': 1.79} {'loss': 0.538, 'learning_rate': 5.421353095511672e-07, 'epoch': 1.79} {'loss': 0.4115, 'learning_rate': 5.420289944114399e-07, 'epoch': 1.79} {'loss': 0.6012, 'learning_rate': 5.419226894067819e-07, 'epoch': 1.79} {'loss': 0.5407, 'learning_rate': 5.418163945373089e-07, 'epoch': 1.79} {'loss': 0.4606, 'learning_rate': 5.417101098031308e-07, 'epoch': 1.79} {'loss': 0.5032, 'learning_rate': 5.416038352043663e-07, 'epoch': 1.79} {'loss': 0.5335, 'learning_rate': 5.414975707411263e-07, 'epoch': 1.79} {'loss': 0.5527, 'learning_rate': 5.413913164135254e-07, 'epoch': 1.79} {'loss': 0.4509, 'learning_rate': 5.412850722216767e-07, 'epoch': 1.79} {'loss': 0.3569, 'learning_rate': 5.411788381656946e-07, 'epoch': 1.79} {'loss': 0.4702, 'learning_rate': 5.410726142456946e-07, 'epoch': 1.79} {'loss': 0.5571, 'learning_rate': 5.409664004617865e-07, 'epoch': 1.79} {'loss': 0.3707, 'learning_rate': 5.408601968140903e-07, 'epoch': 1.79} {'loss': 0.4504, 'learning_rate': 5.407540033027137e-07, 'epoch': 1.79} {'loss': 0.4465, 'learning_rate': 5.406478199277732e-07, 'epoch': 1.79} {'loss': 0.5796, 'learning_rate': 5.40541646689382e-07, 'epoch': 1.79} {'loss': 0.5746, 'learning_rate': 5.404354835876546e-07, 'epoch': 1.79} {'loss': 0.6287, 'learning_rate': 5.403293306227053e-07, 'epoch': 1.79} {'loss': 0.4846, 'learning_rate': 5.40223187794644e-07, 'epoch': 1.79} {'loss': 0.4096, 'learning_rate': 5.401170551035906e-07, 'epoch': 1.79} {'loss': 0.4291, 'learning_rate': 5.400109325496538e-07, 'epoch': 1.79} {'loss': 0.4891, 'learning_rate': 5.399048201329494e-07, 'epoch': 1.79} {'loss': 0.5984, 'learning_rate': 5.397987178535924e-07, 'epoch': 1.79} {'loss': 0.4953, 'learning_rate': 5.396926257116919e-07, 'epoch': 1.79} {'loss': 0.6021, 'learning_rate': 5.395865437073678e-07, 'epoch': 1.79} {'loss': 0.4801, 'learning_rate': 5.394804718407276e-07, 'epoch': 1.79} {'loss': 0.5131, 'learning_rate': 5.393744101118903e-07, 'epoch': 1.79} {'loss': 0.4397, 'learning_rate': 5.392683585209657e-07, 'epoch': 1.79} {'loss': 0.4965, 'learning_rate': 5.391623170680693e-07, 'epoch': 1.79} {'loss': 0.3591, 'learning_rate': 5.390562857533155e-07, 'epoch': 1.79} {'loss': 0.5073, 'learning_rate': 5.389502645768141e-07, 'epoch': 1.79} {'loss': 0.4681, 'learning_rate': 5.38844253538685e-07, 'epoch': 1.79} {'loss': 0.4355, 'learning_rate': 5.387382526390361e-07, 'epoch': 1.79} {'loss': 0.509, 'learning_rate': 5.386322618779826e-07, 'epoch': 1.79} {'loss': 0.7498, 'learning_rate': 5.385262812556392e-07, 'epoch': 1.79} {'loss': 0.4504, 'learning_rate': 5.384203107721187e-07, 'epoch': 1.79} {'loss': 0.595, 'learning_rate': 5.383143504275368e-07, 'epoch': 1.79} {'loss': 0.537, 'learning_rate': 5.382084002220012e-07, 'epoch': 1.79} {'loss': 0.56, 'learning_rate': 5.381024601556328e-07, 'epoch': 1.79} {'loss': 0.4099, 'learning_rate': 5.379965302285406e-07, 'epoch': 1.79} {'loss': 0.4301, 'learning_rate': 5.378906104408377e-07, 'epoch': 1.79} {'loss': 0.5312, 'learning_rate': 5.377847007926396e-07, 'epoch': 1.79} {'loss': 0.3246, 'learning_rate': 5.376788012840595e-07, 'epoch': 1.79} {'loss': 0.4552, 'learning_rate': 5.375729119152129e-07, 'epoch': 1.79} {'loss': 0.523, 'learning_rate': 5.374670326862064e-07, 'epoch': 1.79} {'loss': 0.5653, 'learning_rate': 5.37361163597162e-07, 'epoch': 1.79} {'loss': 0.4237, 'learning_rate': 5.372553046481876e-07, 'epoch': 1.79} {'loss': 0.4854, 'learning_rate': 5.371494558393975e-07, 'epoch': 1.79} {'loss': 0.5328, 'learning_rate': 5.370436171709081e-07, 'epoch': 1.79} {'loss': 0.4095, 'learning_rate': 5.369377886428273e-07, 'epoch': 1.79} {'loss': 0.7126, 'learning_rate': 5.368319702552737e-07, 'epoch': 1.79} {'loss': 0.4758, 'learning_rate': 5.367261620083575e-07, 'epoch': 1.79} {'loss': 0.5786, 'learning_rate': 5.36620363902195e-07, 'epoch': 1.79} {'loss': 0.4166, 'learning_rate': 5.365145759368972e-07, 'epoch': 1.79} {'loss': 0.5291, 'learning_rate': 5.364087981125787e-07, 'epoch': 1.79} {'loss': 0.6576, 'learning_rate': 5.363030304293526e-07, 'epoch': 1.79} {'loss': 0.445, 'learning_rate': 5.361972728873299e-07, 'epoch': 1.79} {'loss': 0.2915, 'learning_rate': 5.360915254866284e-07, 'epoch': 1.79} {'loss': 0.5028, 'learning_rate': 5.359857882273555e-07, 'epoch': 1.79} {'loss': 0.4865, 'learning_rate': 5.358800611096315e-07, 'epoch': 1.79} {'loss': 0.4222, 'learning_rate': 5.35774344133565e-07, 'epoch': 1.79} {'loss': 0.4081, 'learning_rate': 5.356686372992704e-07, 'epoch': 1.79} {'loss': 0.5726, 'learning_rate': 5.355629406068619e-07, 'epoch': 1.79} {'loss': 0.6135, 'learning_rate': 5.354572540564495e-07, 'epoch': 1.79} {'loss': 0.4923, 'learning_rate': 5.353515776481521e-07, 'epoch': 1.79} {'loss': 0.3591, 'learning_rate': 5.352459113820763e-07, 'epoch': 1.79} {'loss': 0.5609, 'learning_rate': 5.351402552583429e-07, 'epoch': 1.79} {'loss': 0.4, 'learning_rate': 5.350346092770575e-07, 'epoch': 1.79} {'loss': 0.5147, 'learning_rate': 5.349289734383379e-07, 'epoch': 1.79} {'loss': 0.2884, 'learning_rate': 5.348233477422982e-07, 'epoch': 1.79} {'loss': 0.401, 'learning_rate': 5.347177321890462e-07, 'epoch': 1.79} {'loss': 0.6224, 'learning_rate': 5.346121267787008e-07, 'epoch': 1.79} {'loss': 0.4948, 'learning_rate': 5.345065315113718e-07, 'epoch': 1.79} {'loss': 0.6408, 'learning_rate': 5.344009463871735e-07, 'epoch': 1.79} {'loss': 0.4128, 'learning_rate': 5.342953714062182e-07, 'epoch': 1.79} {'loss': 0.5593, 'learning_rate': 5.341898065686202e-07, 'epoch': 1.79} {'loss': 0.4702, 'learning_rate': 5.340842518744938e-07, 'epoch': 1.79} {'loss': 0.3517, 'learning_rate': 5.339787073239478e-07, 'epoch': 1.79} {'loss': 0.4629, 'learning_rate': 5.338731729170998e-07, 'epoch': 1.79} {'loss': 0.4896, 'learning_rate': 5.337676486540611e-07, 'epoch': 1.79} {'loss': 0.5047, 'learning_rate': 5.336621345349435e-07, 'epoch': 1.79} {'loss': 0.4158, 'learning_rate': 5.335566305598616e-07, 'epoch': 1.79} {'loss': 0.418, 'learning_rate': 5.334511367289285e-07, 'epoch': 1.79} {'loss': 0.6543, 'learning_rate': 5.333456530422576e-07, 'epoch': 1.79} {'loss': 0.4978, 'learning_rate': 5.332401794999598e-07, 'epoch': 1.79} {'loss': 0.5709, 'learning_rate': 5.331347161021516e-07, 'epoch': 1.79} {'loss': 0.4971, 'learning_rate': 5.330292628489419e-07, 'epoch': 1.79} {'loss': 0.4956, 'learning_rate': 5.329238197404474e-07, 'epoch': 1.79} {'loss': 0.4673, 'learning_rate': 5.328183867767778e-07, 'epoch': 1.79} {'loss': 0.5358, 'learning_rate': 5.327129639580486e-07, 'epoch': 1.79} {'loss': 0.4937, 'learning_rate': 5.326075512843732e-07, 'epoch': 1.79} {'loss': 0.4824, 'learning_rate': 5.325021487558624e-07, 'epoch': 1.79} {'loss': 0.4963, 'learning_rate': 5.323967563726296e-07, 'epoch': 1.79} {'loss': 0.5271, 'learning_rate': 5.32291374134788e-07, 'epoch': 1.79} {'loss': 0.5358, 'learning_rate': 5.321860020424508e-07, 'epoch': 1.79} {'loss': 0.5431, 'learning_rate': 5.320806400957313e-07, 'epoch': 1.79} {'loss': 0.5059, 'learning_rate': 5.319752882947415e-07, 'epoch': 1.79} {'loss': 0.6148, 'learning_rate': 5.31869946639596e-07, 'epoch': 1.79} {'loss': 0.4692, 'learning_rate': 5.317646151304045e-07, 'epoch': 1.79} {'loss': 0.6082, 'learning_rate': 5.316592937672826e-07, 'epoch': 1.79} {'loss': 0.5602, 'learning_rate': 5.315539825503424e-07, 'epoch': 1.79} {'loss': 0.4225, 'learning_rate': 5.314486814796959e-07, 'epoch': 1.79} {'loss': 0.3961, 'learning_rate': 5.313433905554577e-07, 'epoch': 1.79} {'loss': 0.6108, 'learning_rate': 5.312381097777397e-07, 'epoch': 1.79} {'loss': 0.4702, 'learning_rate': 5.311328391466553e-07, 'epoch': 1.79} {'loss': 0.5384, 'learning_rate': 5.310275786623154e-07, 'epoch': 1.79} {'loss': 0.3797, 'learning_rate': 5.309223283248343e-07, 'epoch': 1.79} {'loss': 0.4549, 'learning_rate': 5.308170881343244e-07, 'epoch': 1.79} {'loss': 0.6016, 'learning_rate': 5.307118580908988e-07, 'epoch': 1.79} {'loss': 0.4719, 'learning_rate': 5.306066381946706e-07, 'epoch': 1.79} {'loss': 0.4326, 'learning_rate': 5.305014284457522e-07, 'epoch': 1.79} {'loss': 0.5489, 'learning_rate': 5.303962288442554e-07, 'epoch': 1.79} {'loss': 0.3977, 'learning_rate': 5.302910393902949e-07, 'epoch': 1.79} {'loss': 0.5975, 'learning_rate': 5.301858600839804e-07, 'epoch': 1.79} {'loss': 0.5612, 'learning_rate': 5.300806909254275e-07, 'epoch': 1.79} {'loss': 0.5793, 'learning_rate': 5.299755319147471e-07, 'epoch': 1.79} {'loss': 0.5616, 'learning_rate': 5.298703830520547e-07, 'epoch': 1.79} {'loss': 0.6032, 'learning_rate': 5.297652443374602e-07, 'epoch': 1.79} {'loss': 0.539, 'learning_rate': 5.296601157710757e-07, 'epoch': 1.79} {'loss': 0.5383, 'learning_rate': 5.295549973530156e-07, 'epoch': 1.79} {'loss': 0.4664, 'learning_rate': 5.294498890833921e-07, 'epoch': 1.79} {'loss': 0.4527, 'learning_rate': 5.293447909623173e-07, 'epoch': 1.79} {'loss': 0.4382, 'learning_rate': 5.292397029899055e-07, 'epoch': 1.79} {'loss': 0.371, 'learning_rate': 5.291346251662688e-07, 'epoch': 1.79} {'loss': 0.3734, 'learning_rate': 5.290295574915172e-07, 'epoch': 1.79} {'loss': 0.5425, 'learning_rate': 5.289244999657661e-07, 'epoch': 1.79} {'loss': 0.5522, 'learning_rate': 5.288194525891266e-07, 'epoch': 1.79} {'loss': 0.4183, 'learning_rate': 5.287144153617129e-07, 'epoch': 1.79} {'loss': 0.5225, 'learning_rate': 5.286093882836352e-07, 'epoch': 1.79} {'loss': 0.3295, 'learning_rate': 5.285043713550098e-07, 'epoch': 1.79} {'loss': 0.5387, 'learning_rate': 5.283993645759456e-07, 'epoch': 1.79} {'loss': 0.4945, 'learning_rate': 5.282943679465557e-07, 'epoch': 1.79} {'loss': 0.5022, 'learning_rate': 5.281893814669525e-07, 'epoch': 1.79} {'loss': 0.4137, 'learning_rate': 5.280844051372502e-07, 'epoch': 1.79} {'loss': 0.4686, 'learning_rate': 5.27979438957561e-07, 'epoch': 1.79} {'loss': 0.4454, 'learning_rate': 5.278744829279958e-07, 'epoch': 1.79} {'loss': 0.5786, 'learning_rate': 5.277695370486702e-07, 'epoch': 1.79} {'loss': 0.5392, 'learning_rate': 5.276646013196918e-07, 'epoch': 1.79} {'loss': 0.5109, 'learning_rate': 5.27559675741176e-07, 'epoch': 1.79} {'loss': 0.6146, 'learning_rate': 5.274547603132363e-07, 'epoch': 1.79} {'loss': 0.566, 'learning_rate': 5.273498550359823e-07, 'epoch': 1.79} {'loss': 0.399, 'learning_rate': 5.272449599095297e-07, 'epoch': 1.79} {'loss': 0.5789, 'learning_rate': 5.271400749339872e-07, 'epoch': 1.79} {'loss': 0.5432, 'learning_rate': 5.270352001094703e-07, 'epoch': 1.79} {'loss': 0.5485, 'learning_rate': 5.2693033543609e-07, 'epoch': 1.79} {'loss': 0.5864, 'learning_rate': 5.268254809139584e-07, 'epoch': 1.79} {'loss': 0.6855, 'learning_rate': 5.267206365431888e-07, 'epoch': 1.79} {'loss': 0.473, 'learning_rate': 5.266158023238921e-07, 'epoch': 1.79} {'loss': 0.417, 'learning_rate': 5.265109782561839e-07, 'epoch': 1.79} {'loss': 0.5569, 'learning_rate': 5.264061643401707e-07, 'epoch': 1.79} {'loss': 0.489, 'learning_rate': 5.263013605759715e-07, 'epoch': 1.79} {'loss': 0.5358, 'learning_rate': 5.261965669636937e-07, 'epoch': 1.79} {'loss': 0.5383, 'learning_rate': 5.260917835034518e-07, 'epoch': 1.79} {'loss': 0.5416, 'learning_rate': 5.259870101953579e-07, 'epoch': 1.79} {'loss': 0.5195, 'learning_rate': 5.258822470395231e-07, 'epoch': 1.79} {'loss': 0.604, 'learning_rate': 5.257774940360627e-07, 'epoch': 1.79} {'loss': 0.502, 'learning_rate': 5.256727511850834e-07, 'epoch': 1.79} {'loss': 0.4267, 'learning_rate': 5.25568018486704e-07, 'epoch': 1.79} {'loss': 0.5272, 'learning_rate': 5.254632959410321e-07, 'epoch': 1.79} {'loss': 0.5452, 'learning_rate': 5.253585835481812e-07, 'epoch': 1.79} {'loss': 0.4825, 'learning_rate': 5.252538813082652e-07, 'epoch': 1.79} {'loss': 0.4824, 'learning_rate': 5.251491892213933e-07, 'epoch': 1.79} {'loss': 0.4275, 'learning_rate': 5.250445072876809e-07, 'epoch': 1.79} {'loss': 0.5012, 'learning_rate': 5.249398355072354e-07, 'epoch': 1.79} {'loss': 0.5663, 'learning_rate': 5.24835173880175e-07, 'epoch': 1.79} {'loss': 0.5162, 'learning_rate': 5.247305224066079e-07, 'epoch': 1.79} {'loss': 0.4487, 'learning_rate': 5.246258810866467e-07, 'epoch': 1.79} {'loss': 0.4534, 'learning_rate': 5.245212499204055e-07, 'epoch': 1.79} {'loss': 0.5244, 'learning_rate': 5.244166289079933e-07, 'epoch': 1.79} {'loss': 0.5815, 'learning_rate': 5.243120180495254e-07, 'epoch': 1.79} {'loss': 0.6409, 'learning_rate': 5.242074173451095e-07, 'epoch': 1.79} {'loss': 0.5399, 'learning_rate': 5.241028267948645e-07, 'epoch': 1.79} {'loss': 0.5071, 'learning_rate': 5.239982463988968e-07, 'epoch': 1.79} {'loss': 0.5887, 'learning_rate': 5.238936761573199e-07, 'epoch': 1.79} {'loss': 0.5438, 'learning_rate': 5.237891160702479e-07, 'epoch': 1.79} {'loss': 0.4429, 'learning_rate': 5.236845661377876e-07, 'epoch': 1.79} {'loss': 0.374, 'learning_rate': 5.235800263600588e-07, 'epoch': 1.79} {'loss': 0.4693, 'learning_rate': 5.234754967371658e-07, 'epoch': 1.79} {'loss': 0.575, 'learning_rate': 5.233709772692264e-07, 'epoch': 1.79} {'loss': 0.5266, 'learning_rate': 5.232664679563493e-07, 'epoch': 1.79} {'loss': 0.5231, 'learning_rate': 5.231619687986478e-07, 'epoch': 1.79} {'loss': 0.4223, 'learning_rate': 5.230574797962352e-07, 'epoch': 1.79} {'loss': 0.6967, 'learning_rate': 5.229530009492178e-07, 'epoch': 1.79} {'loss': 0.541, 'learning_rate': 5.228485322577159e-07, 'epoch': 1.79} {'loss': 0.5361, 'learning_rate': 5.227440737218348e-07, 'epoch': 1.79} {'loss': 0.4485, 'learning_rate': 5.226396253416888e-07, 'epoch': 1.79} {'loss': 0.3821, 'learning_rate': 5.2253518711739e-07, 'epoch': 1.79} {'loss': 0.3802, 'learning_rate': 5.224307590490507e-07, 'epoch': 1.79} {'loss': 0.4197, 'learning_rate': 5.223263411367829e-07, 'epoch': 1.79} {'loss': 0.3804, 'learning_rate': 5.222219333806955e-07, 'epoch': 1.79} {'loss': 0.4786, 'learning_rate': 5.22117535780905e-07, 'epoch': 1.79} {'loss': 0.4445, 'learning_rate': 5.220131483375202e-07, 'epoch': 1.79} {'loss': 0.5257, 'learning_rate': 5.219087710506532e-07, 'epoch': 1.79} {'loss': 0.4321, 'learning_rate': 5.218044039204174e-07, 'epoch': 1.79} {'loss': 0.614, 'learning_rate': 5.217000469469225e-07, 'epoch': 1.79} {'loss': 0.4758, 'learning_rate': 5.21595700130283e-07, 'epoch': 1.79} {'loss': 0.5035, 'learning_rate': 5.214913634706064e-07, 'epoch': 1.79} {'loss': 0.4281, 'learning_rate': 5.213870369680107e-07, 'epoch': 1.79} {'loss': 0.4618, 'learning_rate': 5.212827206226023e-07, 'epoch': 1.79} {'loss': 0.6112, 'learning_rate': 5.211784144344955e-07, 'epoch': 1.79} {'loss': 0.4663, 'learning_rate': 5.210741184038026e-07, 'epoch': 1.79} {'loss': 0.4411, 'learning_rate': 5.209698325306323e-07, 'epoch': 1.79} {'loss': 0.4343, 'learning_rate': 5.208655568151e-07, 'epoch': 1.79} {'loss': 0.4977, 'learning_rate': 5.207612912573134e-07, 'epoch': 1.79} {'loss': 0.4677, 'learning_rate': 5.206570358573892e-07, 'epoch': 1.79} {'loss': 0.4976, 'learning_rate': 5.205527906154361e-07, 'epoch': 1.79} {'loss': 0.4703, 'learning_rate': 5.204485555315652e-07, 'epoch': 1.79} {'loss': 0.5268, 'learning_rate': 5.203443306058908e-07, 'epoch': 1.79} {'loss': 0.3351, 'learning_rate': 5.202401158385206e-07, 'epoch': 1.79} {'loss': 0.5298, 'learning_rate': 5.201359112295712e-07, 'epoch': 1.79} {'loss': 0.664, 'learning_rate': 5.200317167791491e-07, 'epoch': 1.79} {'loss': 0.6922, 'learning_rate': 5.199275324873721e-07, 'epoch': 1.79} {'loss': 0.6716, 'learning_rate': 5.198233583543466e-07, 'epoch': 1.79} {'loss': 0.4182, 'learning_rate': 5.19719194380186e-07, 'epoch': 1.79} {'loss': 0.6329, 'learning_rate': 5.196150405650024e-07, 'epoch': 1.79} {'loss': 0.4392, 'learning_rate': 5.195108969089047e-07, 'epoch': 1.79} {'loss': 0.5861, 'learning_rate': 5.194067634120103e-07, 'epoch': 1.79} {'loss': 0.5548, 'learning_rate': 5.19302640074425e-07, 'epoch': 1.79} {'loss': 0.5437, 'learning_rate': 5.191985268962629e-07, 'epoch': 1.79} {'loss': 0.5291, 'learning_rate': 5.190944238776352e-07, 'epoch': 1.79} {'loss': 0.4502, 'learning_rate': 5.189903310186539e-07, 'epoch': 1.79} {'loss': 0.4599, 'learning_rate': 5.188862483194313e-07, 'epoch': 1.79} {'loss': 0.6289, 'learning_rate': 5.187821757800748e-07, 'epoch': 1.79} {'loss': 0.4261, 'learning_rate': 5.186781134007024e-07, 'epoch': 1.79} {'loss': 0.5331, 'learning_rate': 5.185740611814193e-07, 'epoch': 1.79} {'loss': 0.4046, 'learning_rate': 5.184700191223413e-07, 'epoch': 1.79} {'loss': 0.4319, 'learning_rate': 5.18365987223578e-07, 'epoch': 1.79} {'loss': 0.5498, 'learning_rate': 5.182619654852406e-07, 'epoch': 1.79} {'loss': 0.3909, 'learning_rate': 5.181579539074432e-07, 'epoch': 1.79} {'loss': 0.5558, 'learning_rate': 5.18053952490295e-07, 'epoch': 1.79} {'loss': 0.5768, 'learning_rate': 5.179499612339067e-07, 'epoch': 1.79} {'loss': 0.7123, 'learning_rate': 5.178459801383906e-07, 'epoch': 1.79} {'loss': 0.4244, 'learning_rate': 5.177420092038588e-07, 'epoch': 1.79} {'loss': 0.4734, 'learning_rate': 5.176380484304222e-07, 'epoch': 1.79} {'loss': 0.5678, 'learning_rate': 5.175340978181919e-07, 'epoch': 1.79} {'loss': 0.3848, 'learning_rate': 5.174301573672814e-07, 'epoch': 1.79} {'loss': 0.4995, 'learning_rate': 5.17326227077799e-07, 'epoch': 1.79} {'loss': 0.6304, 'learning_rate': 5.172223069498572e-07, 'epoch': 1.79} {'loss': 0.5425, 'learning_rate': 5.17118396983568e-07, 'epoch': 1.8} {'loss': 0.5397, 'learning_rate': 5.170144971790425e-07, 'epoch': 1.8} {'loss': 0.5067, 'learning_rate': 5.169106075363917e-07, 'epoch': 1.8} {'loss': 0.4472, 'learning_rate': 5.168067280557265e-07, 'epoch': 1.8} {'loss': 0.5672, 'learning_rate': 5.167028587371603e-07, 'epoch': 1.8} {'loss': 0.4844, 'learning_rate': 5.165989995808018e-07, 'epoch': 1.8} {'loss': 0.505, 'learning_rate': 5.164951505867633e-07, 'epoch': 1.8} {'loss': 0.533, 'learning_rate': 5.163913117551556e-07, 'epoch': 1.8} {'loss': 0.5926, 'learning_rate': 5.16287483086092e-07, 'epoch': 1.8} {'loss': 0.4282, 'learning_rate': 5.161836645796814e-07, 'epoch': 1.8} {'loss': 0.4868, 'learning_rate': 5.16079856236037e-07, 'epoch': 1.8} {'loss': 0.5009, 'learning_rate': 5.159760580552687e-07, 'epoch': 1.8} {'loss': 0.5051, 'learning_rate': 5.158722700374875e-07, 'epoch': 1.8} {'loss': 0.6331, 'learning_rate': 5.157684921828044e-07, 'epoch': 1.8} {'loss': 0.46, 'learning_rate': 5.156647244913326e-07, 'epoch': 1.8} {'loss': 0.3553, 'learning_rate': 5.155609669631811e-07, 'epoch': 1.8} {'loss': 0.5063, 'learning_rate': 5.154572195984619e-07, 'epoch': 1.8} {'loss': 0.4809, 'learning_rate': 5.153534823972883e-07, 'epoch': 1.8} {'loss': 0.5748, 'learning_rate': 5.15249755359768e-07, 'epoch': 1.8} {'loss': 0.4791, 'learning_rate': 5.15146038486014e-07, 'epoch': 1.8} {'loss': 0.4573, 'learning_rate': 5.150423317761366e-07, 'epoch': 1.8} {'loss': 0.4213, 'learning_rate': 5.149386352302477e-07, 'epoch': 1.8} {'loss': 0.4597, 'learning_rate': 5.148349488484583e-07, 'epoch': 1.8} {'loss': 0.5301, 'learning_rate': 5.147312726308784e-07, 'epoch': 1.8} {'loss': 0.2607, 'learning_rate': 5.146276065776224e-07, 'epoch': 1.8} {'loss': 0.5422, 'learning_rate': 5.145239506887978e-07, 'epoch': 1.8} {'loss': 0.393, 'learning_rate': 5.144203049645157e-07, 'epoch': 1.8} {'loss': 0.4766, 'learning_rate': 5.143166694048896e-07, 'epoch': 1.8} {'loss': 0.4224, 'learning_rate': 5.142130440100291e-07, 'epoch': 1.8} {'loss': 0.5485, 'learning_rate': 5.141094287800463e-07, 'epoch': 1.8} {'loss': 0.5964, 'learning_rate': 5.140058237150503e-07, 'epoch': 1.8} {'loss': 0.5583, 'learning_rate': 5.13902228815153e-07, 'epoch': 1.8} {'loss': 0.5276, 'learning_rate': 5.137986440804654e-07, 'epoch': 1.8} {'loss': 0.4896, 'learning_rate': 5.136950695110998e-07, 'epoch': 1.8} {'loss': 0.4973, 'learning_rate': 5.13591505107165e-07, 'epoch': 1.8} {'loss': 0.5111, 'learning_rate': 5.13487950868774e-07, 'epoch': 1.8} {'loss': 0.5026, 'learning_rate': 5.133844067960381e-07, 'epoch': 1.8} {'loss': 0.5572, 'learning_rate': 5.132808728890648e-07, 'epoch': 1.8} {'loss': 0.4304, 'learning_rate': 5.131773491479686e-07, 'epoch': 1.8} {'loss': 0.6744, 'learning_rate': 5.130738355728582e-07, 'epoch': 1.8} {'loss': 0.6183, 'learning_rate': 5.129703321638458e-07, 'epoch': 1.8} {'loss': 0.3697, 'learning_rate': 5.128668389210412e-07, 'epoch': 1.8} {'loss': 0.3825, 'learning_rate': 5.127633558445566e-07, 'epoch': 1.8} {'loss': 0.4117, 'learning_rate': 5.126598829345042e-07, 'epoch': 1.8} {'loss': 0.5064, 'learning_rate': 5.125564201909905e-07, 'epoch': 1.8} {'loss': 0.4351, 'learning_rate': 5.124529676141298e-07, 'epoch': 1.8} {'loss': 0.521, 'learning_rate': 5.123495252040323e-07, 'epoch': 1.8} {'loss': 0.514, 'learning_rate': 5.122460929608075e-07, 'epoch': 1.8} {'loss': 0.5629, 'learning_rate': 5.121426708845701e-07, 'epoch': 1.8} {'loss': 0.4485, 'learning_rate': 5.120392589754241e-07, 'epoch': 1.8} {'loss': 0.4732, 'learning_rate': 5.119358572334876e-07, 'epoch': 1.8} {'loss': 0.523, 'learning_rate': 5.11832465658867e-07, 'epoch': 1.8} {'loss': 0.6151, 'learning_rate': 5.117290842516742e-07, 'epoch': 1.8} {'loss': 0.2792, 'learning_rate': 5.116257130120206e-07, 'epoch': 1.8} {'loss': 0.4947, 'learning_rate': 5.115223519400148e-07, 'epoch': 1.8} {'loss': 0.6455, 'learning_rate': 5.114190010357722e-07, 'epoch': 1.8} {'loss': 0.4276, 'learning_rate': 5.113156602993974e-07, 'epoch': 1.8} {'loss': 0.384, 'learning_rate': 5.112123297310068e-07, 'epoch': 1.8} {'loss': 0.3651, 'learning_rate': 5.11109009330707e-07, 'epoch': 1.8} {'loss': 0.5363, 'learning_rate': 5.110056990986101e-07, 'epoch': 1.8} {'loss': 0.5451, 'learning_rate': 5.109023990348283e-07, 'epoch': 1.8} {'loss': 0.4997, 'learning_rate': 5.107991091394693e-07, 'epoch': 1.8} {'loss': 0.5163, 'learning_rate': 5.106958294126485e-07, 'epoch': 1.8} {'loss': 0.3913, 'learning_rate': 5.105925598544704e-07, 'epoch': 1.8} {'loss': 0.4121, 'learning_rate': 5.104893004650513e-07, 'epoch': 1.8} {'loss': 0.539, 'learning_rate': 5.10386051244498e-07, 'epoch': 1.8} {'loss': 0.543, 'learning_rate': 5.102828121929227e-07, 'epoch': 1.8} {'loss': 0.574, 'learning_rate': 5.101795833104361e-07, 'epoch': 1.8} {'loss': 0.5677, 'learning_rate': 5.100763645971473e-07, 'epoch': 1.8} {'loss': 0.5263, 'learning_rate': 5.099731560531706e-07, 'epoch': 1.8} {'loss': 0.4893, 'learning_rate': 5.098699576786115e-07, 'epoch': 1.8} {'loss': 0.5611, 'learning_rate': 5.097667694735852e-07, 'epoch': 1.8} {'loss': 0.5711, 'learning_rate': 5.096635914381998e-07, 'epoch': 1.8} {'loss': 0.4387, 'learning_rate': 5.09560423572567e-07, 'epoch': 1.8} {'loss': 0.4723, 'learning_rate': 5.094572658767971e-07, 'epoch': 1.8} {'loss': 0.5584, 'learning_rate': 5.093541183509976e-07, 'epoch': 1.8} {'loss': 0.6875, 'learning_rate': 5.09250980995285e-07, 'epoch': 1.8} {'loss': 0.4627, 'learning_rate': 5.091478538097638e-07, 'epoch': 1.8} {'loss': 0.3804, 'learning_rate': 5.090447367945495e-07, 'epoch': 1.8} {'loss': 0.4349, 'learning_rate': 5.089416299497496e-07, 'epoch': 1.8} {'loss': 0.5026, 'learning_rate': 5.088385332754753e-07, 'epoch': 1.8} {'loss': 0.3882, 'learning_rate': 5.087354467718375e-07, 'epoch': 1.8} {'loss': 0.5192, 'learning_rate': 5.086323704389451e-07, 'epoch': 1.8} {'loss': 0.3679, 'learning_rate': 5.085293042769112e-07, 'epoch': 1.8} {'loss': 0.5626, 'learning_rate': 5.084262482858426e-07, 'epoch': 1.8} {'loss': 0.4899, 'learning_rate': 5.083232024658546e-07, 'epoch': 1.8} {'loss': 0.5919, 'learning_rate': 5.082201668170539e-07, 'epoch': 1.8} {'loss': 0.6015, 'learning_rate': 5.081171413395513e-07, 'epoch': 1.8} {'loss': 0.4204, 'learning_rate': 5.080141260334604e-07, 'epoch': 1.8} {'loss': 0.4497, 'learning_rate': 5.079111208988852e-07, 'epoch': 1.8} {'loss': 0.4739, 'learning_rate': 5.078081259359435e-07, 'epoch': 1.8} {'loss': 0.5308, 'learning_rate': 5.077051411447387e-07, 'epoch': 1.8} {'loss': 0.4369, 'learning_rate': 5.076021665253883e-07, 'epoch': 1.8} {'loss': 0.3632, 'learning_rate': 5.074992020779968e-07, 'epoch': 1.8} {'loss': 0.4638, 'learning_rate': 5.073962478026761e-07, 'epoch': 1.8} {'loss': 0.5743, 'learning_rate': 5.072933036995398e-07, 'epoch': 1.8} {'loss': 0.4885, 'learning_rate': 5.071903697686919e-07, 'epoch': 1.8} {'loss': 0.3236, 'learning_rate': 5.070874460102493e-07, 'epoch': 1.8} {'loss': 0.5367, 'learning_rate': 5.069845324243172e-07, 'epoch': 1.8} {'loss': 0.4792, 'learning_rate': 5.06881629011009e-07, 'epoch': 1.8} {'loss': 0.4638, 'learning_rate': 5.067787357704334e-07, 'epoch': 1.8} {'loss': 0.4316, 'learning_rate': 5.066758527027016e-07, 'epoch': 1.8} {'loss': 0.3507, 'learning_rate': 5.065729798079245e-07, 'epoch': 1.8} {'loss': 0.5282, 'learning_rate': 5.064701170862085e-07, 'epoch': 1.8} {'loss': 0.5763, 'learning_rate': 5.063672645376694e-07, 'epoch': 1.8} {'loss': 0.5583, 'learning_rate': 5.062644221624135e-07, 'epoch': 1.8} {'loss': 0.5048, 'learning_rate': 5.061615899605521e-07, 'epoch': 1.8} {'loss': 0.4648, 'learning_rate': 5.060587679321949e-07, 'epoch': 1.8} {'loss': 0.5482, 'learning_rate': 5.059559560774529e-07, 'epoch': 1.8} {'loss': 0.499, 'learning_rate': 5.058531543964374e-07, 'epoch': 1.8} {'loss': 0.4146, 'learning_rate': 5.057503628892546e-07, 'epoch': 1.8} {'loss': 0.6174, 'learning_rate': 5.056475815560203e-07, 'epoch': 1.8} {'loss': 0.5504, 'learning_rate': 5.055448103968397e-07, 'epoch': 1.8} {'loss': 0.3812, 'learning_rate': 5.05442049411824e-07, 'epoch': 1.8} {'loss': 0.4303, 'learning_rate': 5.053392986010852e-07, 'epoch': 1.8} {'loss': 0.4947, 'learning_rate': 5.052365579647323e-07, 'epoch': 1.8} {'loss': 0.4368, 'learning_rate': 5.051338275028761e-07, 'epoch': 1.8} {'loss': 0.5885, 'learning_rate': 5.050311072156244e-07, 'epoch': 1.8} {'loss': 0.5841, 'learning_rate': 5.049283971030894e-07, 'epoch': 1.8} {'loss': 0.3671, 'learning_rate': 5.048256971653809e-07, 'epoch': 1.8} {'loss': 0.5129, 'learning_rate': 5.047230074026077e-07, 'epoch': 1.8} {'loss': 0.3575, 'learning_rate': 5.046203278148831e-07, 'epoch': 1.8} {'loss': 0.4316, 'learning_rate': 5.045176584023115e-07, 'epoch': 1.8} {'loss': 0.4979, 'learning_rate': 5.044149991650094e-07, 'epoch': 1.8} {'loss': 0.425, 'learning_rate': 5.043123501030822e-07, 'epoch': 1.8} {'loss': 0.3532, 'learning_rate': 5.042097112166411e-07, 'epoch': 1.8} {'loss': 0.4472, 'learning_rate': 5.041070825057959e-07, 'epoch': 1.8} {'loss': 0.4582, 'learning_rate': 5.040044639706576e-07, 'epoch': 1.8} {'loss': 0.4815, 'learning_rate': 5.039018556113374e-07, 'epoch': 1.8} {'loss': 0.4163, 'learning_rate': 5.037992574279404e-07, 'epoch': 1.8} {'loss': 0.52, 'learning_rate': 5.036966694205825e-07, 'epoch': 1.8} {'loss': 0.6538, 'learning_rate': 5.035940915893689e-07, 'epoch': 1.8} {'loss': 0.5492, 'learning_rate': 5.034915239344107e-07, 'epoch': 1.8} {'loss': 0.5696, 'learning_rate': 5.0338896645582e-07, 'epoch': 1.8} {'loss': 0.5489, 'learning_rate': 5.032864191537034e-07, 'epoch': 1.8} {'loss': 0.5142, 'learning_rate': 5.031838820281754e-07, 'epoch': 1.8} {'loss': 0.4328, 'learning_rate': 5.030813550793412e-07, 'epoch': 1.8} {'loss': 0.4568, 'learning_rate': 5.02978838307312e-07, 'epoch': 1.8} {'loss': 0.5899, 'learning_rate': 5.028763317121987e-07, 'epoch': 1.8} {'loss': 0.5115, 'learning_rate': 5.027738352941103e-07, 'epoch': 1.8} {'loss': 0.5179, 'learning_rate': 5.026713490531565e-07, 'epoch': 1.8} {'loss': 0.6797, 'learning_rate': 5.025688729894484e-07, 'epoch': 1.8} {'loss': 0.4024, 'learning_rate': 5.02466407103096e-07, 'epoch': 1.8} {'loss': 0.5621, 'learning_rate': 5.02363951394207e-07, 'epoch': 1.8} {'loss': 0.6189, 'learning_rate': 5.02261505862891e-07, 'epoch': 1.8} {'loss': 0.5571, 'learning_rate': 5.021590705092605e-07, 'epoch': 1.8} {'loss': 0.3277, 'learning_rate': 5.02056645333423e-07, 'epoch': 1.8} {'loss': 0.4263, 'learning_rate': 5.019542303354896e-07, 'epoch': 1.8} {'loss': 0.5547, 'learning_rate': 5.018518255155691e-07, 'epoch': 1.8} {'loss': 0.422, 'learning_rate': 5.017494308737725e-07, 'epoch': 1.8} {'loss': 0.5963, 'learning_rate': 5.016470464102086e-07, 'epoch': 1.8} {'loss': 0.4875, 'learning_rate': 5.015446721249861e-07, 'epoch': 1.8} {'loss': 0.4514, 'learning_rate': 5.014423080182162e-07, 'epoch': 1.8} {'loss': 0.4271, 'learning_rate': 5.013399540900077e-07, 'epoch': 1.8} {'loss': 0.5957, 'learning_rate': 5.012376103404703e-07, 'epoch': 1.8} {'loss': 0.537, 'learning_rate': 5.011352767697164e-07, 'epoch': 1.8} {'loss': 0.5067, 'learning_rate': 5.010329533778524e-07, 'epoch': 1.8} {'loss': 0.5458, 'learning_rate': 5.009306401649883e-07, 'epoch': 1.8} {'loss': 0.5264, 'learning_rate': 5.008283371312339e-07, 'epoch': 1.8} {'loss': 0.4843, 'learning_rate': 5.007260442767003e-07, 'epoch': 1.8} {'loss': 0.4792, 'learning_rate': 5.006237616014953e-07, 'epoch': 1.8} {'loss': 0.5756, 'learning_rate': 5.005214891057298e-07, 'epoch': 1.8} {'loss': 0.4409, 'learning_rate': 5.004192267895147e-07, 'epoch': 1.8} {'loss': 0.4452, 'learning_rate': 5.003169746529557e-07, 'epoch': 1.8} {'loss': 0.5071, 'learning_rate': 5.002147326961648e-07, 'epoch': 1.8} {'loss': 0.4924, 'learning_rate': 5.001125009192509e-07, 'epoch': 1.8} {'loss': 0.6155, 'learning_rate': 5.000102793223238e-07, 'epoch': 1.8} {'loss': 0.5294, 'learning_rate': 4.999080679054946e-07, 'epoch': 1.8} {'loss': 0.5614, 'learning_rate': 4.998058666688687e-07, 'epoch': 1.8} {'loss': 0.7148, 'learning_rate': 4.997036756125606e-07, 'epoch': 1.8} {'loss': 0.5333, 'learning_rate': 4.996014947366767e-07, 'epoch': 1.8} {'loss': 0.4867, 'learning_rate': 4.994993240413271e-07, 'epoch': 1.8} {'loss': 0.5617, 'learning_rate': 4.993971635266215e-07, 'epoch': 1.8} {'loss': 0.5384, 'learning_rate': 4.992950131926688e-07, 'epoch': 1.8} {'loss': 0.5494, 'learning_rate': 4.991928730395812e-07, 'epoch': 1.8} {'loss': 0.6723, 'learning_rate': 4.99090743067463e-07, 'epoch': 1.8} {'loss': 0.5389, 'learning_rate': 4.989886232764285e-07, 'epoch': 1.8} {'loss': 0.3216, 'learning_rate': 4.988865136665843e-07, 'epoch': 1.8} {'loss': 0.4926, 'learning_rate': 4.987844142380416e-07, 'epoch': 1.8} {'loss': 0.3989, 'learning_rate': 4.986823249909079e-07, 'epoch': 1.8} {'loss': 0.5647, 'learning_rate': 4.985802459252942e-07, 'epoch': 1.8} {'loss': 0.5382, 'learning_rate': 4.984781770413105e-07, 'epoch': 1.8} {'loss': 0.5004, 'learning_rate': 4.983761183390612e-07, 'epoch': 1.8} {'loss': 0.4802, 'learning_rate': 4.982740698186639e-07, 'epoch': 1.8} {'loss': 0.5902, 'learning_rate': 4.981720314802208e-07, 'epoch': 1.8} {'loss': 0.5743, 'learning_rate': 4.98070003323845e-07, 'epoch': 1.8} {'loss': 0.6376, 'learning_rate': 4.979679853496455e-07, 'epoch': 1.8} {'loss': 0.4468, 'learning_rate': 4.978659775577288e-07, 'epoch': 1.8} {'loss': 0.5988, 'learning_rate': 4.977639799482081e-07, 'epoch': 1.8} {'loss': 0.4353, 'learning_rate': 4.976619925211901e-07, 'epoch': 1.8} {'loss': 0.5405, 'learning_rate': 4.975600152767856e-07, 'epoch': 1.8} {'loss': 0.531, 'learning_rate': 4.974580482151026e-07, 'epoch': 1.8} {'loss': 0.4297, 'learning_rate': 4.973560913362508e-07, 'epoch': 1.8} {'loss': 0.4667, 'learning_rate': 4.972541446403411e-07, 'epoch': 1.8} {'loss': 0.4638, 'learning_rate': 4.971522081274782e-07, 'epoch': 1.8} {'loss': 0.4193, 'learning_rate': 4.970502817977774e-07, 'epoch': 1.8} {'loss': 0.3973, 'learning_rate': 4.96948365651344e-07, 'epoch': 1.8} {'loss': 0.3779, 'learning_rate': 4.968464596882871e-07, 'epoch': 1.8} {'loss': 0.6459, 'learning_rate': 4.967445639087176e-07, 'epoch': 1.8} {'loss': 0.3816, 'learning_rate': 4.966426783127443e-07, 'epoch': 1.8} {'loss': 0.5658, 'learning_rate': 4.96540802900477e-07, 'epoch': 1.8} {'loss': 0.4846, 'learning_rate': 4.964389376720214e-07, 'epoch': 1.8} {'loss': 0.5249, 'learning_rate': 4.963370826274927e-07, 'epoch': 1.8} {'loss': 0.5913, 'learning_rate': 4.962352377669943e-07, 'epoch': 1.8} {'loss': 0.4542, 'learning_rate': 4.961334030906373e-07, 'epoch': 1.8} {'loss': 0.5717, 'learning_rate': 4.960315785985337e-07, 'epoch': 1.8} {'loss': 0.4763, 'learning_rate': 4.959297642907856e-07, 'epoch': 1.8} {'loss': 0.4867, 'learning_rate': 4.958279601675109e-07, 'epoch': 1.8} {'loss': 0.4674, 'learning_rate': 4.957261662288104e-07, 'epoch': 1.8} {'loss': 0.6793, 'learning_rate': 4.956243824748008e-07, 'epoch': 1.8} {'loss': 0.3561, 'learning_rate': 4.955226089055854e-07, 'epoch': 1.8} {'loss': 0.5842, 'learning_rate': 4.954208455212761e-07, 'epoch': 1.8} {'loss': 0.4682, 'learning_rate': 4.95319092321982e-07, 'epoch': 1.8} {'loss': 0.6386, 'learning_rate': 4.952173493078094e-07, 'epoch': 1.8} {'loss': 0.5408, 'learning_rate': 4.951156164788706e-07, 'epoch': 1.8} {'loss': 0.3863, 'learning_rate': 4.950138938352722e-07, 'epoch': 1.8} {'loss': 0.5395, 'learning_rate': 4.949121813771262e-07, 'epoch': 1.8} {'loss': 0.508, 'learning_rate': 4.948104791045383e-07, 'epoch': 1.8} {'loss': 0.4319, 'learning_rate': 4.947087870176182e-07, 'epoch': 1.8} {'loss': 0.5223, 'learning_rate': 4.94607105116478e-07, 'epoch': 1.8} {'loss': 0.4494, 'learning_rate': 4.945054334012212e-07, 'epoch': 1.8} {'loss': 0.4447, 'learning_rate': 4.944037718719619e-07, 'epoch': 1.8} {'loss': 0.5728, 'learning_rate': 4.943021205288045e-07, 'epoch': 1.8} {'loss': 0.6298, 'learning_rate': 4.942004793718636e-07, 'epoch': 1.8} {'loss': 0.5661, 'learning_rate': 4.940988484012432e-07, 'epoch': 1.8} {'loss': 0.5422, 'learning_rate': 4.939972276170535e-07, 'epoch': 1.8} {'loss': 0.3525, 'learning_rate': 4.938956170194053e-07, 'epoch': 1.8} {'loss': 0.4851, 'learning_rate': 4.937940166084032e-07, 'epoch': 1.8} {'loss': 0.5491, 'learning_rate': 4.936924263841614e-07, 'epoch': 1.8} {'loss': 0.3868, 'learning_rate': 4.935908463467831e-07, 'epoch': 1.8} {'loss': 0.498, 'learning_rate': 4.934892764963839e-07, 'epoch': 1.8} {'loss': 0.4668, 'learning_rate': 4.93387716833067e-07, 'epoch': 1.8} {'loss': 0.6692, 'learning_rate': 4.932861673569433e-07, 'epoch': 1.8} {'loss': 0.5959, 'learning_rate': 4.93184628068123e-07, 'epoch': 1.8} {'loss': 0.3924, 'learning_rate': 4.930830989667101e-07, 'epoch': 1.8} {'loss': 0.561, 'learning_rate': 4.929815800528204e-07, 'epoch': 1.8} {'loss': 0.5038, 'learning_rate': 4.928800713265558e-07, 'epoch': 1.8} {'loss': 0.7117, 'learning_rate': 4.927785727880308e-07, 'epoch': 1.8} {'loss': 0.4817, 'learning_rate': 4.926770844373496e-07, 'epoch': 1.8} {'loss': 0.5439, 'learning_rate': 4.925756062746246e-07, 'epoch': 1.8} {'loss': 0.4542, 'learning_rate': 4.924741382999631e-07, 'epoch': 1.8} {'loss': 0.6154, 'learning_rate': 4.92372680513471e-07, 'epoch': 1.8} {'loss': 0.4491, 'learning_rate': 4.922712329152634e-07, 'epoch': 1.8} {'loss': 0.5004, 'learning_rate': 4.921697955054427e-07, 'epoch': 1.8} {'loss': 0.4747, 'learning_rate': 4.920683682841209e-07, 'epoch': 1.8} {'loss': 0.4727, 'learning_rate': 4.919669512514058e-07, 'epoch': 1.8} {'loss': 0.59, 'learning_rate': 4.918655444074072e-07, 'epoch': 1.8} {'loss': 0.5049, 'learning_rate': 4.917641477522328e-07, 'epoch': 1.8} {'loss': 0.6461, 'learning_rate': 4.916627612859892e-07, 'epoch': 1.8} {'loss': 0.4192, 'learning_rate': 4.915613850087896e-07, 'epoch': 1.8} {'loss': 0.5285, 'learning_rate': 4.914600189207386e-07, 'epoch': 1.8} {'loss': 0.4003, 'learning_rate': 4.913586630219469e-07, 'epoch': 1.8} {'loss': 0.5851, 'learning_rate': 4.912573173125224e-07, 'epoch': 1.8} {'loss': 0.3901, 'learning_rate': 4.911559817925748e-07, 'epoch': 1.8} {'loss': 0.3597, 'learning_rate': 4.910546564622121e-07, 'epoch': 1.8} {'loss': 0.5886, 'learning_rate': 4.909533413215417e-07, 'epoch': 1.8} {'loss': 0.3521, 'learning_rate': 4.908520363706725e-07, 'epoch': 1.8} {'loss': 0.4592, 'learning_rate': 4.907507416097134e-07, 'epoch': 1.8} {'loss': 0.5951, 'learning_rate': 4.906494570387743e-07, 'epoch': 1.8} {'loss': 0.4325, 'learning_rate': 4.905481826579616e-07, 'epoch': 1.8} {'loss': 0.4848, 'learning_rate': 4.904469184673844e-07, 'epoch': 1.8} {'loss': 0.5602, 'learning_rate': 4.903456644671545e-07, 'epoch': 1.8} {'loss': 0.4697, 'learning_rate': 4.902444206573754e-07, 'epoch': 1.8} {'loss': 0.6056, 'learning_rate': 4.901431870381568e-07, 'epoch': 1.8} {'loss': 0.5581, 'learning_rate': 4.900419636096088e-07, 'epoch': 1.8} {'loss': 0.4866, 'learning_rate': 4.899407503718401e-07, 'epoch': 1.8} {'loss': 0.5268, 'learning_rate': 4.898395473249574e-07, 'epoch': 1.8} {'loss': 0.5641, 'learning_rate': 4.897383544690692e-07, 'epoch': 1.8} {'loss': 0.4437, 'learning_rate': 4.896371718042869e-07, 'epoch': 1.8} {'loss': 0.4725, 'learning_rate': 4.895359993307158e-07, 'epoch': 1.8} {'loss': 0.5086, 'learning_rate': 4.894348370484648e-07, 'epoch': 1.8} {'loss': 0.4609, 'learning_rate': 4.893336849576425e-07, 'epoch': 1.8} {'loss': 0.5092, 'learning_rate': 4.892325430583577e-07, 'epoch': 1.8} {'loss': 0.4912, 'learning_rate': 4.891314113507206e-07, 'epoch': 1.8} {'loss': 0.6142, 'learning_rate': 4.890302898348353e-07, 'epoch': 1.8} {'loss': 0.5385, 'learning_rate': 4.88929178510813e-07, 'epoch': 1.8} {'loss': 0.4938, 'learning_rate': 4.888280773787612e-07, 'epoch': 1.8} {'loss': 0.3699, 'learning_rate': 4.887269864387889e-07, 'epoch': 1.8} {'loss': 0.4717, 'learning_rate': 4.886259056910037e-07, 'epoch': 1.8} {'loss': 0.5411, 'learning_rate': 4.885248351355143e-07, 'epoch': 1.8} {'loss': 0.5939, 'learning_rate': 4.884237747724307e-07, 'epoch': 1.8} {'loss': 0.5427, 'learning_rate': 4.883227246018585e-07, 'epoch': 1.8} {'loss': 0.4619, 'learning_rate': 4.882216846239063e-07, 'epoch': 1.8} {'loss': 0.5194, 'learning_rate': 4.88120654838683e-07, 'epoch': 1.8} {'loss': 0.5241, 'learning_rate': 4.880196352462974e-07, 'epoch': 1.8} {'loss': 0.5736, 'learning_rate': 4.879186258468571e-07, 'epoch': 1.8} {'loss': 0.4639, 'learning_rate': 4.8781762664047e-07, 'epoch': 1.8} {'loss': 0.5922, 'learning_rate': 4.877166376272469e-07, 'epoch': 1.8} {'loss': 0.455, 'learning_rate': 4.876156588072922e-07, 'epoch': 1.8} {'loss': 0.5291, 'learning_rate': 4.87514690180716e-07, 'epoch': 1.8} {'loss': 0.3996, 'learning_rate': 4.874137317476269e-07, 'epoch': 1.8} {'loss': 0.3726, 'learning_rate': 4.873127835081315e-07, 'epoch': 1.8} {'loss': 0.4044, 'learning_rate': 4.872118454623398e-07, 'epoch': 1.8} {'loss': 0.5708, 'learning_rate': 4.871109176103606e-07, 'epoch': 1.8} {'loss': 0.496, 'learning_rate': 4.870099999522982e-07, 'epoch': 1.8} {'loss': 0.5189, 'learning_rate': 4.869090924882647e-07, 'epoch': 1.8} {'loss': 0.3495, 'learning_rate': 4.868081952183656e-07, 'epoch': 1.8} {'loss': 0.4486, 'learning_rate': 4.867073081427109e-07, 'epoch': 1.8} {'loss': 0.4796, 'learning_rate': 4.866064312614071e-07, 'epoch': 1.8} {'loss': 0.578, 'learning_rate': 4.865055645745642e-07, 'epoch': 1.8} {'loss': 0.511, 'learning_rate': 4.864047080822898e-07, 'epoch': 1.8} {'loss': 0.5863, 'learning_rate': 4.863038617846905e-07, 'epoch': 1.8} {'loss': 0.572, 'learning_rate': 4.86203025681875e-07, 'epoch': 1.8} {'loss': 0.539, 'learning_rate': 4.861021997739512e-07, 'epoch': 1.8} {'loss': 0.4273, 'learning_rate': 4.860013840610278e-07, 'epoch': 1.8} {'loss': 0.658, 'learning_rate': 4.859005785432136e-07, 'epoch': 1.8} {'loss': 0.6477, 'learning_rate': 4.857997832206141e-07, 'epoch': 1.8} {'loss': 0.5306, 'learning_rate': 4.856989980933413e-07, 'epoch': 1.8} {'loss': 0.4834, 'learning_rate': 4.855982231614987e-07, 'epoch': 1.8} {'loss': 0.6338, 'learning_rate': 4.85497458425197e-07, 'epoch': 1.8} {'loss': 0.3805, 'learning_rate': 4.853967038845431e-07, 'epoch': 1.8} {'loss': 0.6411, 'learning_rate': 4.852959595396456e-07, 'epoch': 1.8} {'loss': 0.4693, 'learning_rate': 4.851952253906133e-07, 'epoch': 1.8} {'loss': 0.5334, 'learning_rate': 4.850945014375507e-07, 'epoch': 1.8} {'loss': 0.5598, 'learning_rate': 4.84993787680571e-07, 'epoch': 1.8} {'loss': 0.47, 'learning_rate': 4.848930841197775e-07, 'epoch': 1.8} {'loss': 0.4995, 'learning_rate': 4.847923907552798e-07, 'epoch': 1.8} {'loss': 0.3662, 'learning_rate': 4.84691707587186e-07, 'epoch': 1.8} {'loss': 0.5653, 'learning_rate': 4.845910346156035e-07, 'epoch': 1.8} {'loss': 0.3409, 'learning_rate': 4.844903718406424e-07, 'epoch': 1.8} {'loss': 0.4883, 'learning_rate': 4.843897192624059e-07, 'epoch': 1.8} {'loss': 0.3922, 'learning_rate': 4.842890768810072e-07, 'epoch': 1.8} {'loss': 0.3554, 'learning_rate': 4.841884446965506e-07, 'epoch': 1.8} {'loss': 0.4822, 'learning_rate': 4.840878227091438e-07, 'epoch': 1.8} {'loss': 0.4344, 'learning_rate': 4.83987210918897e-07, 'epoch': 1.8} {'loss': 0.5951, 'learning_rate': 4.838866093259164e-07, 'epoch': 1.8} {'loss': 0.411, 'learning_rate': 4.837860179303111e-07, 'epoch': 1.8} {'loss': 0.5249, 'learning_rate': 4.836854367321864e-07, 'epoch': 1.8} {'loss': 0.5024, 'learning_rate': 4.835848657316534e-07, 'epoch': 1.8} {'loss': 0.355, 'learning_rate': 4.834843049288174e-07, 'epoch': 1.8} {'loss': 0.5346, 'learning_rate': 4.833837543237862e-07, 'epoch': 1.8} {'loss': 0.5199, 'learning_rate': 4.832832139166698e-07, 'epoch': 1.8} {'loss': 0.5549, 'learning_rate': 4.831826837075715e-07, 'epoch': 1.8} {'loss': 0.587, 'learning_rate': 4.830821636966055e-07, 'epoch': 1.8} {'loss': 0.3582, 'learning_rate': 4.829816538838716e-07, 'epoch': 1.8} {'loss': 0.5086, 'learning_rate': 4.828811542694855e-07, 'epoch': 1.8} {'loss': 0.4034, 'learning_rate': 4.827806648535505e-07, 'epoch': 1.8} {'loss': 0.4312, 'learning_rate': 4.82680185636174e-07, 'epoch': 1.8} {'loss': 0.5494, 'learning_rate': 4.825797166174662e-07, 'epoch': 1.8} {'loss': 0.4167, 'learning_rate': 4.824792577975313e-07, 'epoch': 1.8} {'loss': 0.4017, 'learning_rate': 4.823788091764803e-07, 'epoch': 1.8} {'loss': 0.4984, 'learning_rate': 4.822783707544176e-07, 'epoch': 1.8} {'loss': 0.5658, 'learning_rate': 4.821779425314554e-07, 'epoch': 1.8} {'loss': 0.4718, 'learning_rate': 4.820775245076969e-07, 'epoch': 1.8} {'loss': 0.5633, 'learning_rate': 4.819771166832521e-07, 'epoch': 1.8} {'loss': 0.4464, 'learning_rate': 4.818767190582286e-07, 'epoch': 1.8} {'loss': 0.3346, 'learning_rate': 4.817763316327306e-07, 'epoch': 1.8} {'loss': 0.4853, 'learning_rate': 4.816759544068706e-07, 'epoch': 1.8} {'loss': 0.459, 'learning_rate': 4.815755873807526e-07, 'epoch': 1.8} {'loss': 0.5506, 'learning_rate': 4.814752305544857e-07, 'epoch': 1.8} {'loss': 0.4634, 'learning_rate': 4.813748839281773e-07, 'epoch': 1.8} {'loss': 0.491, 'learning_rate': 4.812745475019354e-07, 'epoch': 1.8} {'loss': 0.4924, 'learning_rate': 4.811742212758674e-07, 'epoch': 1.8} {'loss': 0.3945, 'learning_rate': 4.810739052500779e-07, 'epoch': 1.8} {'loss': 0.5611, 'learning_rate': 4.809735994246801e-07, 'epoch': 1.8} {'loss': 0.3527, 'learning_rate': 4.808733037997759e-07, 'epoch': 1.8} {'loss': 0.3778, 'learning_rate': 4.807730183754755e-07, 'epoch': 1.8} {'loss': 0.6368, 'learning_rate': 4.806727431518865e-07, 'epoch': 1.8} {'loss': 0.4339, 'learning_rate': 4.805724781291155e-07, 'epoch': 1.8} {'loss': 0.5367, 'learning_rate': 4.804722233072712e-07, 'epoch': 1.8} {'loss': 0.3847, 'learning_rate': 4.803719786864569e-07, 'epoch': 1.8} {'loss': 0.5562, 'learning_rate': 4.80271744266787e-07, 'epoch': 1.8} {'loss': 0.5419, 'learning_rate': 4.801715200483637e-07, 'epoch': 1.8} {'loss': 0.6061, 'learning_rate': 4.800713060312956e-07, 'epoch': 1.8} {'loss': 0.5189, 'learning_rate': 4.799711022156917e-07, 'epoch': 1.8} {'loss': 0.5026, 'learning_rate': 4.798709086016551e-07, 'epoch': 1.8} {'loss': 0.5556, 'learning_rate': 4.797707251892991e-07, 'epoch': 1.8} {'loss': 0.545, 'learning_rate': 4.79670551978726e-07, 'epoch': 1.8} {'loss': 0.349, 'learning_rate': 4.795703889700465e-07, 'epoch': 1.8} {'loss': 0.446, 'learning_rate': 4.794702361633663e-07, 'epoch': 1.8} {'loss': 0.5684, 'learning_rate': 4.793700935587919e-07, 'epoch': 1.8} {'loss': 0.4555, 'learning_rate': 4.792699611564344e-07, 'epoch': 1.8} {'loss': 0.5001, 'learning_rate': 4.791698389563948e-07, 'epoch': 1.8} {'loss': 0.6583, 'learning_rate': 4.790697269587874e-07, 'epoch': 1.8} {'loss': 0.4077, 'learning_rate': 4.789696251637121e-07, 'epoch': 1.8} {'loss': 0.394, 'learning_rate': 4.788695335712845e-07, 'epoch': 1.8} {'loss': 0.5222, 'learning_rate': 4.787694521816056e-07, 'epoch': 1.8} {'loss': 0.6281, 'learning_rate': 4.78669380994784e-07, 'epoch': 1.8} {'loss': 0.5491, 'learning_rate': 4.785693200109287e-07, 'epoch': 1.8} {'loss': 0.4115, 'learning_rate': 4.78469269230144e-07, 'epoch': 1.8} {'loss': 0.4819, 'learning_rate': 4.78369228652541e-07, 'epoch': 1.8} {'loss': 0.3955, 'learning_rate': 4.78269198278224e-07, 'epoch': 1.8} {'loss': 0.4604, 'learning_rate': 4.781691781073006e-07, 'epoch': 1.8} {'loss': 0.4941, 'learning_rate': 4.780691681398786e-07, 'epoch': 1.8} {'loss': 0.4208, 'learning_rate': 4.779691683760634e-07, 'epoch': 1.8} {'loss': 0.5339, 'learning_rate': 4.778691788159673e-07, 'epoch': 1.8} {'loss': 0.5093, 'learning_rate': 4.777691994596889e-07, 'epoch': 1.8} {'loss': 0.4198, 'learning_rate': 4.776692303073449e-07, 'epoch': 1.8} {'loss': 0.5038, 'learning_rate': 4.775692713590351e-07, 'epoch': 1.8} {'loss': 0.5701, 'learning_rate': 4.774693226148697e-07, 'epoch': 1.8} {'loss': 0.4221, 'learning_rate': 4.773693840749549e-07, 'epoch': 1.8} {'loss': 0.5357, 'learning_rate': 4.772694557393987e-07, 'epoch': 1.8} {'loss': 0.5083, 'learning_rate': 4.771695376083096e-07, 'epoch': 1.8} {'loss': 0.5298, 'learning_rate': 4.770696296817901e-07, 'epoch': 1.8} {'loss': 0.4672, 'learning_rate': 4.76969731959952e-07, 'epoch': 1.8} {'loss': 0.7488, 'learning_rate': 4.768698444428987e-07, 'epoch': 1.8} {'loss': 0.5755, 'learning_rate': 4.767699671307402e-07, 'epoch': 1.8} {'loss': 0.4412, 'learning_rate': 4.766701000235807e-07, 'epoch': 1.8} {'loss': 0.4691, 'learning_rate': 4.7657024312153024e-07, 'epoch': 1.8} {'loss': 0.5221, 'learning_rate': 4.7647039642469415e-07, 'epoch': 1.8} {'loss': 0.6343, 'learning_rate': 4.7637055993317915e-07, 'epoch': 1.8} {'loss': 0.4338, 'learning_rate': 4.7627073364709286e-07, 'epoch': 1.8} {'loss': 0.5801, 'learning_rate': 4.761709175665408e-07, 'epoch': 1.8} {'loss': 0.4881, 'learning_rate': 4.760711116916328e-07, 'epoch': 1.8} {'loss': 0.5561, 'learning_rate': 4.7597131602247327e-07, 'epoch': 1.8} {'loss': 0.5046, 'learning_rate': 4.758715305591699e-07, 'epoch': 1.8} {'loss': 0.406, 'learning_rate': 4.757717553018315e-07, 'epoch': 1.8} {'loss': 0.4752, 'learning_rate': 4.7567199025056245e-07, 'epoch': 1.8} {'loss': 0.5776, 'learning_rate': 4.7557223540546924e-07, 'epoch': 1.8} {'loss': 0.5492, 'learning_rate': 4.754724907666608e-07, 'epoch': 1.8} {'loss': 0.6446, 'learning_rate': 4.7537275633424364e-07, 'epoch': 1.8} {'loss': 0.5184, 'learning_rate': 4.752730321083232e-07, 'epoch': 1.8} {'loss': 0.5544, 'learning_rate': 4.7517331808900834e-07, 'epoch': 1.8} {'loss': 0.5865, 'learning_rate': 4.7507361427640566e-07, 'epoch': 1.8} {'loss': 0.6365, 'learning_rate': 4.7497392067061944e-07, 'epoch': 1.8} {'loss': 0.4509, 'learning_rate': 4.7487423727175965e-07, 'epoch': 1.8} {'loss': 0.6101, 'learning_rate': 4.7477456407993063e-07, 'epoch': 1.8} {'loss': 0.4501, 'learning_rate': 4.7467490109524117e-07, 'epoch': 1.8} {'loss': 0.5772, 'learning_rate': 4.745752483177968e-07, 'epoch': 1.8} {'loss': 0.441, 'learning_rate': 4.7447560574770625e-07, 'epoch': 1.8} {'loss': 0.6141, 'learning_rate': 4.7437597338507393e-07, 'epoch': 1.8} {'loss': 0.5943, 'learning_rate': 4.742763512300075e-07, 'epoch': 1.8} {'loss': 0.7129, 'learning_rate': 4.7417673928261355e-07, 'epoch': 1.8} {'loss': 0.496, 'learning_rate': 4.740771375429987e-07, 'epoch': 1.8} {'loss': 0.4586, 'learning_rate': 4.7397754601126946e-07, 'epoch': 1.8} {'loss': 0.4549, 'learning_rate': 4.7387796468753355e-07, 'epoch': 1.8} {'loss': 0.4415, 'learning_rate': 4.737783935718987e-07, 'epoch': 1.8} {'loss': 0.5622, 'learning_rate': 4.736788326644692e-07, 'epoch': 1.8} {'loss': 0.4911, 'learning_rate': 4.735792819653517e-07, 'epoch': 1.8} {'loss': 0.5716, 'learning_rate': 4.734797414746539e-07, 'epoch': 1.8} {'loss': 0.3868, 'learning_rate': 4.7338021119248235e-07, 'epoch': 1.8} {'loss': 0.5824, 'learning_rate': 4.732806911189458e-07, 'epoch': 1.8} {'loss': 0.5524, 'learning_rate': 4.731811812541476e-07, 'epoch': 1.8} {'loss': 0.4187, 'learning_rate': 4.730816815981942e-07, 'epoch': 1.8} {'loss': 0.4901, 'learning_rate': 4.729821921511946e-07, 'epoch': 1.8} {'loss': 0.4827, 'learning_rate': 4.728827129132552e-07, 'epoch': 1.8} {'loss': 0.5884, 'learning_rate': 4.7278324388448037e-07, 'epoch': 1.8} {'loss': 0.5617, 'learning_rate': 4.72683785064979e-07, 'epoch': 1.8} {'loss': 0.5508, 'learning_rate': 4.7258433645485767e-07, 'epoch': 1.8} {'loss': 0.6681, 'learning_rate': 4.724848980542218e-07, 'epoch': 1.8} {'loss': 0.4387, 'learning_rate': 4.72385469863178e-07, 'epoch': 1.8} {'loss': 0.4769, 'learning_rate': 4.7228605188183173e-07, 'epoch': 1.8} {'loss': 0.5047, 'learning_rate': 4.721866441102929e-07, 'epoch': 1.8} {'loss': 0.4533, 'learning_rate': 4.720872465486648e-07, 'epoch': 1.8} {'loss': 0.477, 'learning_rate': 4.71987859197055e-07, 'epoch': 1.8} {'loss': 0.5055, 'learning_rate': 4.7188848205557137e-07, 'epoch': 1.8} {'loss': 0.4476, 'learning_rate': 4.717891151243192e-07, 'epoch': 1.8} {'loss': 0.4644, 'learning_rate': 4.7168975840340413e-07, 'epoch': 1.8} {'loss': 0.4512, 'learning_rate': 4.7159041189293267e-07, 'epoch': 1.8} {'loss': 0.4306, 'learning_rate': 4.7149107559301357e-07, 'epoch': 1.8} {'loss': 0.5741, 'learning_rate': 4.7139174950375234e-07, 'epoch': 1.8} {'loss': 0.3251, 'learning_rate': 4.712924336252522e-07, 'epoch': 1.8} {'loss': 0.3222, 'learning_rate': 4.711931279576243e-07, 'epoch': 1.8} {'loss': 0.4444, 'learning_rate': 4.7109383250097287e-07, 'epoch': 1.8} {'loss': 0.5731, 'learning_rate': 4.709945472554034e-07, 'epoch': 1.8} {'loss': 0.5306, 'learning_rate': 4.708952722210247e-07, 'epoch': 1.8} {'loss': 0.5532, 'learning_rate': 4.707960073979401e-07, 'epoch': 1.8} {'loss': 0.5467, 'learning_rate': 4.706967527862605e-07, 'epoch': 1.8} {'loss': 0.433, 'learning_rate': 4.705975083860859e-07, 'epoch': 1.8} {'loss': 0.5498, 'learning_rate': 4.7049827419752837e-07, 'epoch': 1.8} {'loss': 0.5559, 'learning_rate': 4.7039905022069123e-07, 'epoch': 1.8} {'loss': 0.5273, 'learning_rate': 4.7029983645568214e-07, 'epoch': 1.8} {'loss': 0.481, 'learning_rate': 4.7020063290260543e-07, 'epoch': 1.8} {'loss': 0.5515, 'learning_rate': 4.7010143956156997e-07, 'epoch': 1.8} {'loss': 0.6154, 'learning_rate': 4.7000225643268225e-07, 'epoch': 1.8} {'loss': 0.4758, 'learning_rate': 4.699030835160445e-07, 'epoch': 1.8} {'loss': 0.5036, 'learning_rate': 4.6980392081176886e-07, 'epoch': 1.8} {'loss': 0.473, 'learning_rate': 4.697047683199563e-07, 'epoch': 1.8} {'loss': 0.6407, 'learning_rate': 4.696056260407156e-07, 'epoch': 1.8} {'loss': 0.3679, 'learning_rate': 4.695064939741534e-07, 'epoch': 1.8} {'loss': 0.5701, 'learning_rate': 4.694073721203729e-07, 'epoch': 1.8} {'loss': 0.3695, 'learning_rate': 4.693082604794863e-07, 'epoch': 1.8} {'loss': 0.4498, 'learning_rate': 4.692091590515924e-07, 'epoch': 1.8} {'loss': 0.6145, 'learning_rate': 4.6911006783680325e-07, 'epoch': 1.8} {'loss': 0.5355, 'learning_rate': 4.6901098683522215e-07, 'epoch': 1.8} {'loss': 0.5488, 'learning_rate': 4.6891191604695686e-07, 'epoch': 1.8} {'loss': 0.4426, 'learning_rate': 4.6881285547211277e-07, 'epoch': 1.8} {'loss': 0.4974, 'learning_rate': 4.6871380511079313e-07, 'epoch': 1.8} {'loss': 0.4917, 'learning_rate': 4.686147649631112e-07, 'epoch': 1.8} {'loss': 0.5182, 'learning_rate': 4.685157350291647e-07, 'epoch': 1.8} {'loss': 0.4438, 'learning_rate': 4.6841671530906687e-07, 'epoch': 1.8} {'loss': 0.4705, 'learning_rate': 4.683177058029198e-07, 'epoch': 1.81} {'loss': 0.4542, 'learning_rate': 4.682187065108301e-07, 'epoch': 1.81} {'loss': 0.5296, 'learning_rate': 4.6811971743290553e-07, 'epoch': 1.81} {'loss': 0.4172, 'learning_rate': 4.6802073856924924e-07, 'epoch': 1.81} {'loss': 0.4867, 'learning_rate': 4.679217699199712e-07, 'epoch': 1.81} {'loss': 0.4896, 'learning_rate': 4.6782281148517237e-07, 'epoch': 1.81} {'loss': 0.6129, 'learning_rate': 4.6772386326496386e-07, 'epoch': 1.81} {'loss': 0.3326, 'learning_rate': 4.6762492525945003e-07, 'epoch': 1.81} {'loss': 0.386, 'learning_rate': 4.6752599746873516e-07, 'epoch': 1.81} {'loss': 0.3832, 'learning_rate': 4.6742707989292815e-07, 'epoch': 1.81} {'loss': 0.5053, 'learning_rate': 4.673281725321299e-07, 'epoch': 1.81} {'loss': 0.4263, 'learning_rate': 4.672292753864538e-07, 'epoch': 1.81} {'loss': 0.5176, 'learning_rate': 4.6713038845599855e-07, 'epoch': 1.81} {'loss': 0.5554, 'learning_rate': 4.6703151174087637e-07, 'epoch': 1.81} {'loss': 0.4223, 'learning_rate': 4.669326452411893e-07, 'epoch': 1.81} {'loss': 0.5375, 'learning_rate': 4.6683378895704403e-07, 'epoch': 1.81} {'loss': 0.3313, 'learning_rate': 4.6673494288854813e-07, 'epoch': 1.81} {'loss': 0.5008, 'learning_rate': 4.666361070358039e-07, 'epoch': 1.81} {'loss': 0.4039, 'learning_rate': 4.6653728139892105e-07, 'epoch': 1.81} {'loss': 0.5486, 'learning_rate': 4.664384659780041e-07, 'epoch': 1.81} {'loss': 0.591, 'learning_rate': 4.663396607731574e-07, 'epoch': 1.81} {'loss': 0.579, 'learning_rate': 4.6624086578448966e-07, 'epoch': 1.81} {'loss': 0.6291, 'learning_rate': 4.6614208101210426e-07, 'epoch': 1.81} {'loss': 0.4534, 'learning_rate': 4.6604330645610986e-07, 'epoch': 1.81} {'loss': 0.5387, 'learning_rate': 4.6594454211660755e-07, 'epoch': 1.81} {'loss': 0.4847, 'learning_rate': 4.6584578799370837e-07, 'epoch': 1.81} {'loss': 0.5141, 'learning_rate': 4.6574704408751557e-07, 'epoch': 1.81} {'loss': 0.5025, 'learning_rate': 4.656483103981357e-07, 'epoch': 1.81} {'loss': 0.5483, 'learning_rate': 4.655495869256732e-07, 'epoch': 1.81} {'loss': 0.6199, 'learning_rate': 4.654508736702346e-07, 'epoch': 1.81} {'loss': 0.514, 'learning_rate': 4.653521706319286e-07, 'epoch': 1.81} {'loss': 0.471, 'learning_rate': 4.652534778108542e-07, 'epoch': 1.81} {'loss': 0.3147, 'learning_rate': 4.6515479520712447e-07, 'epoch': 1.81} {'loss': 0.5598, 'learning_rate': 4.6505612282084054e-07, 'epoch': 1.81} {'loss': 0.2847, 'learning_rate': 4.649574606521101e-07, 'epoch': 1.81} {'loss': 0.4437, 'learning_rate': 4.6485880870103974e-07, 'epoch': 1.81} {'loss': 0.4578, 'learning_rate': 4.647601669677304e-07, 'epoch': 1.81} {'loss': 0.521, 'learning_rate': 4.646615354522943e-07, 'epoch': 1.81} {'loss': 0.5326, 'learning_rate': 4.6456291415483244e-07, 'epoch': 1.81} {'loss': 0.5617, 'learning_rate': 4.6446430307545143e-07, 'epoch': 1.81} {'loss': 0.4125, 'learning_rate': 4.6436570221425894e-07, 'epoch': 1.81} {'loss': 0.534, 'learning_rate': 4.6426711157135815e-07, 'epoch': 1.81} {'loss': 0.4112, 'learning_rate': 4.641685311468569e-07, 'epoch': 1.81} {'loss': 0.5423, 'learning_rate': 4.640699609408583e-07, 'epoch': 1.81} {'loss': 0.6209, 'learning_rate': 4.6397140095347125e-07, 'epoch': 1.81} {'loss': 0.4268, 'learning_rate': 4.6387285118479787e-07, 'epoch': 1.81} {'loss': 0.4065, 'learning_rate': 4.637743116349458e-07, 'epoch': 1.81} {'loss': 0.3637, 'learning_rate': 4.6367578230402054e-07, 'epoch': 1.81} {'loss': 0.4815, 'learning_rate': 4.635772631921276e-07, 'epoch': 1.81} {'loss': 0.5801, 'learning_rate': 4.634787542993735e-07, 'epoch': 1.81} {'loss': 0.4934, 'learning_rate': 4.633802556258593e-07, 'epoch': 1.81} {'loss': 0.538, 'learning_rate': 4.6328176717169713e-07, 'epoch': 1.81} {'loss': 0.4971, 'learning_rate': 4.6318328893698807e-07, 'epoch': 1.81} {'loss': 0.4781, 'learning_rate': 4.630848209218386e-07, 'epoch': 1.81} {'loss': 0.3678, 'learning_rate': 4.6298636312635427e-07, 'epoch': 1.81} {'loss': 0.6279, 'learning_rate': 4.628879155506405e-07, 'epoch': 1.81} {'loss': 0.6465, 'learning_rate': 4.62789478194805e-07, 'epoch': 1.81} {'loss': 0.3748, 'learning_rate': 4.626910510589511e-07, 'epoch': 1.81} {'loss': 0.6363, 'learning_rate': 4.62592634143183e-07, 'epoch': 1.81} {'loss': 0.3637, 'learning_rate': 4.624942274476085e-07, 'epoch': 1.81} {'loss': 0.4709, 'learning_rate': 4.6239583097233196e-07, 'epoch': 1.81} {'loss': 0.4332, 'learning_rate': 4.6229744471745887e-07, 'epoch': 1.81} {'loss': 0.5823, 'learning_rate': 4.621990686830946e-07, 'epoch': 1.81} {'loss': 0.5432, 'learning_rate': 4.6210070286934697e-07, 'epoch': 1.81} {'loss': 0.5441, 'learning_rate': 4.62002347276318e-07, 'epoch': 1.81} {'loss': 0.4904, 'learning_rate': 4.619040019041132e-07, 'epoch': 1.81} {'loss': 0.6528, 'learning_rate': 4.618056667528403e-07, 'epoch': 1.81} {'loss': 0.4812, 'learning_rate': 4.617073418226037e-07, 'epoch': 1.81} {'loss': 0.3381, 'learning_rate': 4.6160902711350764e-07, 'epoch': 1.81} {'loss': 0.3163, 'learning_rate': 4.6151072262565875e-07, 'epoch': 1.81} {'loss': 0.5608, 'learning_rate': 4.6141242835916364e-07, 'epoch': 1.81} {'loss': 0.3736, 'learning_rate': 4.613141443141245e-07, 'epoch': 1.81} {'loss': 0.5803, 'learning_rate': 4.6121587049064775e-07, 'epoch': 1.81} {'loss': 0.3949, 'learning_rate': 4.611176068888401e-07, 'epoch': 1.81} {'loss': 0.5291, 'learning_rate': 4.6101935350880477e-07, 'epoch': 1.81} {'loss': 0.6964, 'learning_rate': 4.609211103506483e-07, 'epoch': 1.81} {'loss': 0.4607, 'learning_rate': 4.608228774144785e-07, 'epoch': 1.81} {'loss': 0.6111, 'learning_rate': 4.607246547003952e-07, 'epoch': 1.81} {'loss': 0.4924, 'learning_rate': 4.6062644220850714e-07, 'epoch': 1.81} {'loss': 0.4551, 'learning_rate': 4.6052823993891773e-07, 'epoch': 1.81} {'loss': 0.5229, 'learning_rate': 4.604300478917345e-07, 'epoch': 1.81} {'loss': 0.455, 'learning_rate': 4.603318660670608e-07, 'epoch': 1.81} {'loss': 0.6281, 'learning_rate': 4.602336944650032e-07, 'epoch': 1.81} {'loss': 0.5262, 'learning_rate': 4.6013553308566715e-07, 'epoch': 1.81} {'loss': 0.4501, 'learning_rate': 4.600373819291548e-07, 'epoch': 1.81} {'loss': 0.6114, 'learning_rate': 4.5993924099557497e-07, 'epoch': 1.81} {'loss': 0.5089, 'learning_rate': 4.5984111028502973e-07, 'epoch': 1.81} {'loss': 0.591, 'learning_rate': 4.597429897976269e-07, 'epoch': 1.81} {'loss': 0.5188, 'learning_rate': 4.596448795334707e-07, 'epoch': 1.81} {'loss': 0.484, 'learning_rate': 4.5954677949266557e-07, 'epoch': 1.81} {'loss': 0.4383, 'learning_rate': 4.594486896753181e-07, 'epoch': 1.81} {'loss': 0.5992, 'learning_rate': 4.5935061008153146e-07, 'epoch': 1.81} {'loss': 0.5824, 'learning_rate': 4.592525407114123e-07, 'epoch': 1.81} {'loss': 0.4779, 'learning_rate': 4.591544815650639e-07, 'epoch': 1.81} {'loss': 0.5651, 'learning_rate': 4.5905643264259393e-07, 'epoch': 1.81} {'loss': 0.4761, 'learning_rate': 4.589583939441067e-07, 'epoch': 1.81} {'loss': 0.5412, 'learning_rate': 4.5886036546970435e-07, 'epoch': 1.81} {'loss': 0.6693, 'learning_rate': 4.5876234721949573e-07, 'epoch': 1.81} {'loss': 0.4744, 'learning_rate': 4.586643391935841e-07, 'epoch': 1.81} {'loss': 0.5758, 'learning_rate': 4.585663413920749e-07, 'epoch': 1.81} {'loss': 0.4766, 'learning_rate': 4.584683538150736e-07, 'epoch': 1.81} {'loss': 0.544, 'learning_rate': 4.5837037646268347e-07, 'epoch': 1.81} {'loss': 0.4795, 'learning_rate': 4.5827240933501216e-07, 'epoch': 1.81} {'loss': 0.398, 'learning_rate': 4.5817445243216186e-07, 'epoch': 1.81} {'loss': 0.4613, 'learning_rate': 4.580765057542391e-07, 'epoch': 1.81} {'loss': 0.5204, 'learning_rate': 4.579785693013494e-07, 'epoch': 1.81} {'loss': 0.4889, 'learning_rate': 4.57880643073596e-07, 'epoch': 1.81} {'loss': 0.4591, 'learning_rate': 4.577827270710844e-07, 'epoch': 1.81} {'loss': 0.4852, 'learning_rate': 4.5768482129392e-07, 'epoch': 1.81} {'loss': 0.4951, 'learning_rate': 4.575869257422094e-07, 'epoch': 1.81} {'loss': 0.4182, 'learning_rate': 4.574890404160537e-07, 'epoch': 1.81} {'loss': 0.4301, 'learning_rate': 4.5739116531556047e-07, 'epoch': 1.81} {'loss': 0.589, 'learning_rate': 4.572933004408331e-07, 'epoch': 1.81} {'loss': 0.659, 'learning_rate': 4.5719544579197807e-07, 'epoch': 1.81} {'loss': 0.5538, 'learning_rate': 4.5709760136909976e-07, 'epoch': 1.81} {'loss': 0.4248, 'learning_rate': 4.569997671723014e-07, 'epoch': 1.81} {'loss': 0.5919, 'learning_rate': 4.569019432016908e-07, 'epoch': 1.81} {'loss': 0.4641, 'learning_rate': 4.5680412945736996e-07, 'epoch': 1.81} {'loss': 0.4913, 'learning_rate': 4.5670632593944443e-07, 'epoch': 1.81} {'loss': 0.6641, 'learning_rate': 4.566085326480196e-07, 'epoch': 1.81} {'loss': 0.4398, 'learning_rate': 4.5651074958319994e-07, 'epoch': 1.81} {'loss': 0.5625, 'learning_rate': 4.56412976745092e-07, 'epoch': 1.81} {'loss': 0.441, 'learning_rate': 4.5631521413379674e-07, 'epoch': 1.81} {'loss': 0.5006, 'learning_rate': 4.5621746174942303e-07, 'epoch': 1.81} {'loss': 0.463, 'learning_rate': 4.5611971959207304e-07, 'epoch': 1.81} {'loss': 0.4427, 'learning_rate': 4.5602198766185104e-07, 'epoch': 1.81} {'loss': 0.4791, 'learning_rate': 4.5592426595886473e-07, 'epoch': 1.81} {'loss': 0.5313, 'learning_rate': 4.558265544832141e-07, 'epoch': 1.81} {'loss': 0.5328, 'learning_rate': 4.557288532350101e-07, 'epoch': 1.81} {'loss': 0.4336, 'learning_rate': 4.556311622143517e-07, 'epoch': 1.81} {'loss': 0.3544, 'learning_rate': 4.5553348142134747e-07, 'epoch': 1.81} {'loss': 0.4593, 'learning_rate': 4.554358108560997e-07, 'epoch': 1.81} {'loss': 0.6151, 'learning_rate': 4.553381505187138e-07, 'epoch': 1.81} {'loss': 0.5293, 'learning_rate': 4.5524050040929633e-07, 'epoch': 1.81} {'loss': 0.446, 'learning_rate': 4.551428605279462e-07, 'epoch': 1.81} {'loss': 0.5208, 'learning_rate': 4.550452308747755e-07, 'epoch': 1.81} {'loss': 0.4977, 'learning_rate': 4.5494761144988297e-07, 'epoch': 1.81} {'loss': 0.348, 'learning_rate': 4.548500022533786e-07, 'epoch': 1.81} {'loss': 0.441, 'learning_rate': 4.5475240328536117e-07, 'epoch': 1.81} {'loss': 0.5148, 'learning_rate': 4.546548145459395e-07, 'epoch': 1.81} {'loss': 0.349, 'learning_rate': 4.545572360352168e-07, 'epoch': 1.81} {'loss': 0.5381, 'learning_rate': 4.544596677532953e-07, 'epoch': 1.81} {'loss': 0.537, 'learning_rate': 4.5436210970028483e-07, 'epoch': 1.81} {'loss': 0.5796, 'learning_rate': 4.542645618762842e-07, 'epoch': 1.81} {'loss': 0.5313, 'learning_rate': 4.5416702428140335e-07, 'epoch': 1.81} {'loss': 0.4729, 'learning_rate': 4.540694969157422e-07, 'epoch': 1.81} {'loss': 0.427, 'learning_rate': 4.5397197977940844e-07, 'epoch': 1.81} {'loss': 0.4645, 'learning_rate': 4.538744728725053e-07, 'epoch': 1.81} {'loss': 0.4382, 'learning_rate': 4.5377697619513497e-07, 'epoch': 1.81} {'loss': 0.6106, 'learning_rate': 4.536794897474073e-07, 'epoch': 1.81} {'loss': 0.6327, 'learning_rate': 4.5358201352942e-07, 'epoch': 1.81} {'loss': 0.5182, 'learning_rate': 4.534845475412841e-07, 'epoch': 1.81} {'loss': 0.4581, 'learning_rate': 4.533870917831007e-07, 'epoch': 1.81} {'loss': 0.3709, 'learning_rate': 4.5328964625497406e-07, 'epoch': 1.81} {'loss': 0.4524, 'learning_rate': 4.531922109570108e-07, 'epoch': 1.81} {'loss': 0.5509, 'learning_rate': 4.530947858893109e-07, 'epoch': 1.81} {'loss': 0.5437, 'learning_rate': 4.5299737105198414e-07, 'epoch': 1.81} {'loss': 0.3969, 'learning_rate': 4.5289996644512944e-07, 'epoch': 1.81} {'loss': 0.4325, 'learning_rate': 4.528025720688578e-07, 'epoch': 1.81} {'loss': 0.6551, 'learning_rate': 4.52705187923268e-07, 'epoch': 1.81} {'loss': 0.6066, 'learning_rate': 4.5260781400846555e-07, 'epoch': 1.81} {'loss': 0.4099, 'learning_rate': 4.525104503245581e-07, 'epoch': 1.81} {'loss': 0.4923, 'learning_rate': 4.5241309687164446e-07, 'epoch': 1.81} {'loss': 0.3916, 'learning_rate': 4.523157536498335e-07, 'epoch': 1.81} {'loss': 0.504, 'learning_rate': 4.5221842065922726e-07, 'epoch': 1.81} {'loss': 0.5639, 'learning_rate': 4.5212109789993133e-07, 'epoch': 1.81} {'loss': 0.5959, 'learning_rate': 4.520237853720488e-07, 'epoch': 1.81} {'loss': 0.4718, 'learning_rate': 4.519264830756853e-07, 'epoch': 1.81} {'loss': 0.565, 'learning_rate': 4.51829191010944e-07, 'epoch': 1.81} {'loss': 0.5533, 'learning_rate': 4.517319091779282e-07, 'epoch': 1.81} {'loss': 0.4695, 'learning_rate': 4.5163463757674554e-07, 'epoch': 1.81} {'loss': 0.5081, 'learning_rate': 4.5153737620749707e-07, 'epoch': 1.81} {'loss': 0.4942, 'learning_rate': 4.514401250702882e-07, 'epoch': 1.81} {'loss': 0.5594, 'learning_rate': 4.513428841652234e-07, 'epoch': 1.81} {'loss': 0.3831, 'learning_rate': 4.512456534924059e-07, 'epoch': 1.81} {'loss': 0.5824, 'learning_rate': 4.511484330519422e-07, 'epoch': 1.81} {'loss': 0.3841, 'learning_rate': 4.510512228439323e-07, 'epoch': 1.81} {'loss': 0.4474, 'learning_rate': 4.50954022868485e-07, 'epoch': 1.81} {'loss': 0.5741, 'learning_rate': 4.508568331257013e-07, 'epoch': 1.81} {'loss': 0.4104, 'learning_rate': 4.5075965361568554e-07, 'epoch': 1.81} {'loss': 0.5593, 'learning_rate': 4.506624843385432e-07, 'epoch': 1.81} {'loss': 0.4389, 'learning_rate': 4.505653252943787e-07, 'epoch': 1.81} {'loss': 0.4319, 'learning_rate': 4.504681764832952e-07, 'epoch': 1.81} {'loss': 0.4888, 'learning_rate': 4.5037103790539715e-07, 'epoch': 1.81} {'loss': 0.4189, 'learning_rate': 4.5027390956078776e-07, 'epoch': 1.81} {'loss': 0.5338, 'learning_rate': 4.501767914495714e-07, 'epoch': 1.81} {'loss': 0.5069, 'learning_rate': 4.500796835718535e-07, 'epoch': 1.81} {'loss': 0.6663, 'learning_rate': 4.4998258592773625e-07, 'epoch': 1.81} {'loss': 0.4657, 'learning_rate': 4.498854985173251e-07, 'epoch': 1.81} {'loss': 0.53, 'learning_rate': 4.497884213407244e-07, 'epoch': 1.81} {'loss': 0.5229, 'learning_rate': 4.4969135439803633e-07, 'epoch': 1.81} {'loss': 0.4734, 'learning_rate': 4.4959429768936635e-07, 'epoch': 1.81} {'loss': 0.5006, 'learning_rate': 4.494972512148177e-07, 'epoch': 1.81} {'loss': 0.5411, 'learning_rate': 4.494002149744947e-07, 'epoch': 1.81} {'loss': 0.5842, 'learning_rate': 4.4930318896850176e-07, 'epoch': 1.81} {'loss': 0.4991, 'learning_rate': 4.4920617319694106e-07, 'epoch': 1.81} {'loss': 0.4976, 'learning_rate': 4.4910916765992016e-07, 'epoch': 1.81} {'loss': 0.313, 'learning_rate': 4.4901217235754024e-07, 'epoch': 1.81} {'loss': 0.5367, 'learning_rate': 4.489151872899045e-07, 'epoch': 1.81} {'loss': 0.549, 'learning_rate': 4.488182124571194e-07, 'epoch': 1.81} {'loss': 0.5103, 'learning_rate': 4.4872124785928727e-07, 'epoch': 1.81} {'loss': 0.4848, 'learning_rate': 4.4862429349651347e-07, 'epoch': 1.81} {'loss': 0.2727, 'learning_rate': 4.4852734936889907e-07, 'epoch': 1.81} {'loss': 0.5027, 'learning_rate': 4.4843041547655066e-07, 'epoch': 1.81} {'loss': 0.4697, 'learning_rate': 4.483334918195703e-07, 'epoch': 1.81} {'loss': 0.5097, 'learning_rate': 4.482365783980636e-07, 'epoch': 1.81} {'loss': 0.5402, 'learning_rate': 4.4813967521213255e-07, 'epoch': 1.81} {'loss': 0.3976, 'learning_rate': 4.480427822618827e-07, 'epoch': 1.81} {'loss': 0.4314, 'learning_rate': 4.479458995474173e-07, 'epoch': 1.81} {'loss': 0.504, 'learning_rate': 4.478490270688396e-07, 'epoch': 1.81} {'loss': 0.5037, 'learning_rate': 4.4775216482625394e-07, 'epoch': 1.81} {'loss': 0.4791, 'learning_rate': 4.476553128197636e-07, 'epoch': 1.81} {'loss': 0.4992, 'learning_rate': 4.475584710494729e-07, 'epoch': 1.81} {'loss': 0.3455, 'learning_rate': 4.4746163951548517e-07, 'epoch': 1.81} {'loss': 0.4854, 'learning_rate': 4.473648182179058e-07, 'epoch': 1.81} {'loss': 0.472, 'learning_rate': 4.472680071568369e-07, 'epoch': 1.81} {'loss': 0.5361, 'learning_rate': 4.4717120633238185e-07, 'epoch': 1.81} {'loss': 0.5394, 'learning_rate': 4.4707441574464495e-07, 'epoch': 1.81} {'loss': 0.3777, 'learning_rate': 4.469776353937294e-07, 'epoch': 1.81} {'loss': 0.4951, 'learning_rate': 4.4688086527974073e-07, 'epoch': 1.81} {'loss': 0.5183, 'learning_rate': 4.4678410540277994e-07, 'epoch': 1.81} {'loss': 0.4503, 'learning_rate': 4.4668735576295474e-07, 'epoch': 1.81} {'loss': 0.5608, 'learning_rate': 4.465906163603651e-07, 'epoch': 1.81} {'loss': 0.3771, 'learning_rate': 4.464938871951152e-07, 'epoch': 1.81} {'loss': 0.6376, 'learning_rate': 4.463971682673096e-07, 'epoch': 1.81} {'loss': 0.5348, 'learning_rate': 4.4630045957705146e-07, 'epoch': 1.81} {'loss': 0.5239, 'learning_rate': 4.462037611244452e-07, 'epoch': 1.81} {'loss': 0.5835, 'learning_rate': 4.461070729095929e-07, 'epoch': 1.81} {'loss': 0.4773, 'learning_rate': 4.460103949326011e-07, 'epoch': 1.81} {'loss': 0.4908, 'learning_rate': 4.4591372719356987e-07, 'epoch': 1.81} {'loss': 0.4489, 'learning_rate': 4.458170696926056e-07, 'epoch': 1.81} {'loss': 0.4065, 'learning_rate': 4.457204224298095e-07, 'epoch': 1.81} {'loss': 0.3561, 'learning_rate': 4.4562378540528696e-07, 'epoch': 1.81} {'loss': 0.4295, 'learning_rate': 4.455271586191412e-07, 'epoch': 1.81} {'loss': 0.4011, 'learning_rate': 4.4543054207147327e-07, 'epoch': 1.81} {'loss': 0.4815, 'learning_rate': 4.4533393576239203e-07, 'epoch': 1.81} {'loss': 0.4838, 'learning_rate': 4.4523733969199624e-07, 'epoch': 1.81} {'loss': 0.6491, 'learning_rate': 4.4514075386039024e-07, 'epoch': 1.81} {'loss': 0.4449, 'learning_rate': 4.4504417826767955e-07, 'epoch': 1.81} {'loss': 0.4311, 'learning_rate': 4.4494761291396516e-07, 'epoch': 1.81} {'loss': 0.4922, 'learning_rate': 4.4485105779935366e-07, 'epoch': 1.81} {'loss': 0.4586, 'learning_rate': 4.447545129239439e-07, 'epoch': 1.81} {'loss': 0.6459, 'learning_rate': 4.4465797828784576e-07, 'epoch': 1.81} {'loss': 0.5502, 'learning_rate': 4.445614538911569e-07, 'epoch': 1.81} {'loss': 0.4562, 'learning_rate': 4.4446493973398287e-07, 'epoch': 1.81} {'loss': 0.5474, 'learning_rate': 4.443684358164269e-07, 'epoch': 1.81} {'loss': 0.374, 'learning_rate': 4.4427194213859216e-07, 'epoch': 1.81} {'loss': 0.7384, 'learning_rate': 4.4417545870058533e-07, 'epoch': 1.81} {'loss': 0.4777, 'learning_rate': 4.4407898550250295e-07, 'epoch': 1.81} {'loss': 0.3774, 'learning_rate': 4.439825225444561e-07, 'epoch': 1.81} {'loss': 0.6014, 'learning_rate': 4.4388606982654234e-07, 'epoch': 1.81} {'loss': 0.444, 'learning_rate': 4.437896273488673e-07, 'epoch': 1.81} {'loss': 0.4055, 'learning_rate': 4.436931951115353e-07, 'epoch': 1.81} {'loss': 0.4695, 'learning_rate': 4.435967731146462e-07, 'epoch': 1.81} {'loss': 0.4498, 'learning_rate': 4.4350036135830887e-07, 'epoch': 1.81} {'loss': 0.5081, 'learning_rate': 4.434039598426199e-07, 'epoch': 1.81} {'loss': 0.6731, 'learning_rate': 4.433075685676891e-07, 'epoch': 1.81} {'loss': 0.2653, 'learning_rate': 4.432111875336154e-07, 'epoch': 1.81} {'loss': 0.3863, 'learning_rate': 4.4311481674050304e-07, 'epoch': 1.81} {'loss': 0.4133, 'learning_rate': 4.4301845618845765e-07, 'epoch': 1.81} {'loss': 0.5466, 'learning_rate': 4.4292210587757787e-07, 'epoch': 1.81} {'loss': 0.4954, 'learning_rate': 4.4282576580797265e-07, 'epoch': 1.81} {'loss': 0.5003, 'learning_rate': 4.427294359797396e-07, 'epoch': 1.81} {'loss': 0.4764, 'learning_rate': 4.4263311639298534e-07, 'epoch': 1.81} {'loss': 0.6403, 'learning_rate': 4.425368070478131e-07, 'epoch': 1.81} {'loss': 0.5822, 'learning_rate': 4.424405079443239e-07, 'epoch': 1.81} {'loss': 0.5296, 'learning_rate': 4.423442190826244e-07, 'epoch': 1.81} {'loss': 0.6166, 'learning_rate': 4.4224794046281327e-07, 'epoch': 1.81} {'loss': 0.4537, 'learning_rate': 4.4215167208499833e-07, 'epoch': 1.81} {'loss': 0.4887, 'learning_rate': 4.420554139492794e-07, 'epoch': 1.81} {'loss': 0.5718, 'learning_rate': 4.4195916605576093e-07, 'epoch': 1.81} {'loss': 0.4084, 'learning_rate': 4.4186292840454505e-07, 'epoch': 1.81} {'loss': 0.6015, 'learning_rate': 4.4176670099573605e-07, 'epoch': 1.81} {'loss': 0.4714, 'learning_rate': 4.4167048382943834e-07, 'epoch': 1.81} {'loss': 0.4461, 'learning_rate': 4.415742769057507e-07, 'epoch': 1.81} {'loss': 0.4682, 'learning_rate': 4.41478080224782e-07, 'epoch': 1.81} {'loss': 0.6703, 'learning_rate': 4.413818937866299e-07, 'epoch': 1.81} {'loss': 0.5479, 'learning_rate': 4.412857175914009e-07, 'epoch': 1.81} {'loss': 0.547, 'learning_rate': 4.411895516391973e-07, 'epoch': 1.81} {'loss': 0.6015, 'learning_rate': 4.4109339593012e-07, 'epoch': 1.81} {'loss': 0.658, 'learning_rate': 4.4099725046427567e-07, 'epoch': 1.81} {'loss': 0.5247, 'learning_rate': 4.4090111524176417e-07, 'epoch': 1.81} {'loss': 0.4997, 'learning_rate': 4.40804990262691e-07, 'epoch': 1.81} {'loss': 0.5605, 'learning_rate': 4.4070887552715824e-07, 'epoch': 1.81} {'loss': 0.4877, 'learning_rate': 4.4061277103526703e-07, 'epoch': 1.81} {'loss': 0.5377, 'learning_rate': 4.4051667678712494e-07, 'epoch': 1.81} {'loss': 0.454, 'learning_rate': 4.404205927828287e-07, 'epoch': 1.81} {'loss': 0.4143, 'learning_rate': 4.40324519022487e-07, 'epoch': 1.81} {'loss': 0.5236, 'learning_rate': 4.402284555061986e-07, 'epoch': 1.81} {'loss': 0.6332, 'learning_rate': 4.401324022340703e-07, 'epoch': 1.81} {'loss': 0.5807, 'learning_rate': 4.400363592062007e-07, 'epoch': 1.81} {'loss': 0.5163, 'learning_rate': 4.3994032642269647e-07, 'epoch': 1.81} {'loss': 0.6458, 'learning_rate': 4.3984430388365976e-07, 'epoch': 1.81} {'loss': 0.6124, 'learning_rate': 4.397482915891904e-07, 'epoch': 1.81} {'loss': 0.4833, 'learning_rate': 4.3965228953939507e-07, 'epoch': 1.81} {'loss': 0.6005, 'learning_rate': 4.395562977343737e-07, 'epoch': 1.81} {'loss': 0.4704, 'learning_rate': 4.394603161742328e-07, 'epoch': 1.81} {'loss': 0.5324, 'learning_rate': 4.393643448590723e-07, 'epoch': 1.81} {'loss': 0.4329, 'learning_rate': 4.392683837889955e-07, 'epoch': 1.81} {'loss': 0.4955, 'learning_rate': 4.3917243296410673e-07, 'epoch': 1.81} {'loss': 0.6355, 'learning_rate': 4.390764923845048e-07, 'epoch': 1.81} {'loss': 0.5125, 'learning_rate': 4.3898056205029846e-07, 'epoch': 1.81} {'loss': 0.5383, 'learning_rate': 4.3888464196158666e-07, 'epoch': 1.81} {'loss': 0.5165, 'learning_rate': 4.387887321184714e-07, 'epoch': 1.81} {'loss': 0.5619, 'learning_rate': 4.386928325210582e-07, 'epoch': 1.81} {'loss': 0.5103, 'learning_rate': 4.3859694316944815e-07, 'epoch': 1.81} {'loss': 0.5286, 'learning_rate': 4.385010640637455e-07, 'epoch': 1.81} {'loss': 0.5667, 'learning_rate': 4.3840519520404913e-07, 'epoch': 1.81} {'loss': 0.397, 'learning_rate': 4.383093365904678e-07, 'epoch': 1.81} {'loss': 0.5444, 'learning_rate': 4.3821348822309927e-07, 'epoch': 1.81} {'loss': 0.4673, 'learning_rate': 4.381176501020479e-07, 'epoch': 1.81} {'loss': 0.4875, 'learning_rate': 4.3802182222741685e-07, 'epoch': 1.81} {'loss': 0.5228, 'learning_rate': 4.3792600459930833e-07, 'epoch': 1.81} {'loss': 0.5646, 'learning_rate': 4.378301972178267e-07, 'epoch': 1.81} {'loss': 0.5257, 'learning_rate': 4.3773440008307076e-07, 'epoch': 1.81} {'loss': 0.5162, 'learning_rate': 4.376386131951471e-07, 'epoch': 1.81} {'loss': 0.3888, 'learning_rate': 4.3754283655415564e-07, 'epoch': 1.81} {'loss': 0.616, 'learning_rate': 4.374470701602007e-07, 'epoch': 1.81} {'loss': 0.5487, 'learning_rate': 4.3735131401338337e-07, 'epoch': 1.81} {'loss': 0.4915, 'learning_rate': 4.37255568113808e-07, 'epoch': 1.81} {'loss': 0.4077, 'learning_rate': 4.371598324615778e-07, 'epoch': 1.81} {'loss': 0.5447, 'learning_rate': 4.370641070567916e-07, 'epoch': 1.81} {'loss': 0.6052, 'learning_rate': 4.369683918995549e-07, 'epoch': 1.81} {'loss': 0.446, 'learning_rate': 4.368726869899698e-07, 'epoch': 1.81} {'loss': 0.5838, 'learning_rate': 4.367769923281384e-07, 'epoch': 1.81} {'loss': 0.5139, 'learning_rate': 4.3668130791416406e-07, 'epoch': 1.81} {'loss': 0.4923, 'learning_rate': 4.365856337481489e-07, 'epoch': 1.81} {'loss': 0.6115, 'learning_rate': 4.364899698301961e-07, 'epoch': 1.81} {'loss': 0.4325, 'learning_rate': 4.3639431616040675e-07, 'epoch': 1.81} {'loss': 0.6822, 'learning_rate': 4.3629867273888405e-07, 'epoch': 1.81} {'loss': 0.4949, 'learning_rate': 4.362030395657302e-07, 'epoch': 1.81} {'loss': 0.5663, 'learning_rate': 4.361074166410473e-07, 'epoch': 1.81} {'loss': 0.3821, 'learning_rate': 4.360118039649397e-07, 'epoch': 1.81} {'loss': 0.5512, 'learning_rate': 4.3591620153750846e-07, 'epoch': 1.81} {'loss': 0.4017, 'learning_rate': 4.358206093588568e-07, 'epoch': 1.81} {'loss': 0.5519, 'learning_rate': 4.3572502742908583e-07, 'epoch': 1.81} {'loss': 0.4768, 'learning_rate': 4.3562945574829874e-07, 'epoch': 1.81} {'loss': 0.5092, 'learning_rate': 4.3553389431659765e-07, 'epoch': 1.81} {'loss': 0.389, 'learning_rate': 4.3543834313408586e-07, 'epoch': 1.81} {'loss': 0.532, 'learning_rate': 4.353428022008643e-07, 'epoch': 1.81} {'loss': 0.3417, 'learning_rate': 4.3524727151703747e-07, 'epoch': 1.81} {'loss': 0.4262, 'learning_rate': 4.3515175108270634e-07, 'epoch': 1.81} {'loss': 0.6026, 'learning_rate': 4.350562408979719e-07, 'epoch': 1.81} {'loss': 0.5717, 'learning_rate': 4.349607409629386e-07, 'epoch': 1.81} {'loss': 0.4674, 'learning_rate': 4.348652512777085e-07, 'epoch': 1.81} {'loss': 0.5262, 'learning_rate': 4.347697718423838e-07, 'epoch': 1.81} {'loss': 0.4078, 'learning_rate': 4.3467430265706654e-07, 'epoch': 1.81} {'loss': 0.5351, 'learning_rate': 4.34578843721859e-07, 'epoch': 1.81} {'loss': 0.4899, 'learning_rate': 4.3448339503686323e-07, 'epoch': 1.81} {'loss': 0.4985, 'learning_rate': 4.3438795660218247e-07, 'epoch': 1.81} {'loss': 0.3301, 'learning_rate': 4.342925284179178e-07, 'epoch': 1.81} {'loss': 0.4958, 'learning_rate': 4.3419711048417135e-07, 'epoch': 1.81} {'loss': 0.5227, 'learning_rate': 4.3410170280104746e-07, 'epoch': 1.81} {'loss': 0.4568, 'learning_rate': 4.340063053686472e-07, 'epoch': 1.81} {'loss': 0.5076, 'learning_rate': 4.3391091818707156e-07, 'epoch': 1.81} {'loss': 0.6943, 'learning_rate': 4.338155412564238e-07, 'epoch': 1.81} {'loss': 0.4282, 'learning_rate': 4.3372017457680603e-07, 'epoch': 1.81} {'loss': 0.4409, 'learning_rate': 4.336248181483205e-07, 'epoch': 1.81} {'loss': 0.4471, 'learning_rate': 4.335294719710692e-07, 'epoch': 1.81} {'loss': 0.5674, 'learning_rate': 4.334341360451566e-07, 'epoch': 1.81} {'loss': 0.4625, 'learning_rate': 4.3333881037068037e-07, 'epoch': 1.81} {'loss': 0.532, 'learning_rate': 4.3324349494774596e-07, 'epoch': 1.81} {'loss': 0.5706, 'learning_rate': 4.3314818977645444e-07, 'epoch': 1.81} {'loss': 0.5765, 'learning_rate': 4.330528948569079e-07, 'epoch': 1.81} {'loss': 0.4589, 'learning_rate': 4.3295761018920857e-07, 'epoch': 1.81} {'loss': 0.5501, 'learning_rate': 4.328623357734585e-07, 'epoch': 1.81} {'loss': 0.4196, 'learning_rate': 4.3276707160976096e-07, 'epoch': 1.81} {'loss': 0.4167, 'learning_rate': 4.32671817698217e-07, 'epoch': 1.81} {'loss': 0.4241, 'learning_rate': 4.325765740389276e-07, 'epoch': 1.81} {'loss': 0.5319, 'learning_rate': 4.324813406319961e-07, 'epoch': 1.81} {'loss': 0.5359, 'learning_rate': 4.323861174775246e-07, 'epoch': 1.81} {'loss': 0.5169, 'learning_rate': 4.322909045756152e-07, 'epoch': 1.81} {'loss': 0.3712, 'learning_rate': 4.3219570192636895e-07, 'epoch': 1.81} {'loss': 0.574, 'learning_rate': 4.3210050952989026e-07, 'epoch': 1.81} {'loss': 0.5032, 'learning_rate': 4.320053273862779e-07, 'epoch': 1.81} {'loss': 0.2794, 'learning_rate': 4.3191015549563507e-07, 'epoch': 1.81} {'loss': 0.3805, 'learning_rate': 4.31814993858064e-07, 'epoch': 1.81} {'loss': 0.4764, 'learning_rate': 4.3171984247366793e-07, 'epoch': 1.81} {'loss': 0.4308, 'learning_rate': 4.3162470134254786e-07, 'epoch': 1.81} {'loss': 0.4614, 'learning_rate': 4.315295704648037e-07, 'epoch': 1.81} {'loss': 0.5066, 'learning_rate': 4.3143444984054095e-07, 'epoch': 1.81} {'loss': 0.7166, 'learning_rate': 4.3133933946985953e-07, 'epoch': 1.81} {'loss': 0.59, 'learning_rate': 4.3124423935286044e-07, 'epoch': 1.81} {'loss': 0.4483, 'learning_rate': 4.31149149489648e-07, 'epoch': 1.81} {'loss': 0.6238, 'learning_rate': 4.3105406988032227e-07, 'epoch': 1.81} {'loss': 0.5762, 'learning_rate': 4.3095900052498643e-07, 'epoch': 1.81} {'loss': 0.4099, 'learning_rate': 4.3086394142374034e-07, 'epoch': 1.81} {'loss': 0.406, 'learning_rate': 4.307688925766884e-07, 'epoch': 1.81} {'loss': 0.531, 'learning_rate': 4.306738539839317e-07, 'epoch': 1.81} {'loss': 0.5888, 'learning_rate': 4.305788256455701e-07, 'epoch': 1.81} {'loss': 0.5632, 'learning_rate': 4.30483807561709e-07, 'epoch': 1.81} {'loss': 0.3862, 'learning_rate': 4.303887997324452e-07, 'epoch': 1.81} {'loss': 0.4784, 'learning_rate': 4.302938021578873e-07, 'epoch': 1.81} {'loss': 0.5615, 'learning_rate': 4.3019881483812974e-07, 'epoch': 1.81} {'loss': 0.5961, 'learning_rate': 4.301038377732802e-07, 'epoch': 1.81} {'loss': 0.4793, 'learning_rate': 4.3000887096343756e-07, 'epoch': 1.81} {'loss': 0.5278, 'learning_rate': 4.299139144087039e-07, 'epoch': 1.81} {'loss': 0.5535, 'learning_rate': 4.298189681091824e-07, 'epoch': 1.81} {'loss': 0.544, 'learning_rate': 4.2972403206497095e-07, 'epoch': 1.81} {'loss': 0.5769, 'learning_rate': 4.2962910627617594e-07, 'epoch': 1.81} {'loss': 0.5683, 'learning_rate': 4.2953419074289624e-07, 'epoch': 1.81} {'loss': 0.393, 'learning_rate': 4.294392854652352e-07, 'epoch': 1.81} {'loss': 0.6299, 'learning_rate': 4.293443904432937e-07, 'epoch': 1.81} {'loss': 0.4466, 'learning_rate': 4.2924950567717284e-07, 'epoch': 1.81} {'loss': 0.5243, 'learning_rate': 4.29154631166977e-07, 'epoch': 1.81} {'loss': 0.5329, 'learning_rate': 4.2905976691280273e-07, 'epoch': 1.81} {'loss': 0.5197, 'learning_rate': 4.289649129147566e-07, 'epoch': 1.81} {'loss': 0.5594, 'learning_rate': 4.288700691729375e-07, 'epoch': 1.81} {'loss': 0.5095, 'learning_rate': 4.287752356874497e-07, 'epoch': 1.81} {'loss': 0.476, 'learning_rate': 4.28680412458391e-07, 'epoch': 1.81} {'loss': 0.4533, 'learning_rate': 4.2858559948586564e-07, 'epoch': 1.81} {'loss': 0.4941, 'learning_rate': 4.2849079676997695e-07, 'epoch': 1.81} {'loss': 0.434, 'learning_rate': 4.283960043108204e-07, 'epoch': 1.81} {'loss': 0.5236, 'learning_rate': 4.283012221085048e-07, 'epoch': 1.81} {'loss': 0.4908, 'learning_rate': 4.2820645016312556e-07, 'epoch': 1.81} {'loss': 0.4245, 'learning_rate': 4.2811168847478936e-07, 'epoch': 1.81} {'loss': 0.5298, 'learning_rate': 4.280169370435938e-07, 'epoch': 1.81} {'loss': 0.3866, 'learning_rate': 4.279221958696422e-07, 'epoch': 1.81} {'loss': 0.4258, 'learning_rate': 4.2782746495303785e-07, 'epoch': 1.81} {'loss': 0.4855, 'learning_rate': 4.277327442938772e-07, 'epoch': 1.81} {'loss': 0.446, 'learning_rate': 4.276380338922681e-07, 'epoch': 1.81} {'loss': 0.4696, 'learning_rate': 4.27543333748307e-07, 'epoch': 1.81} {'loss': 0.428, 'learning_rate': 4.274486438620973e-07, 'epoch': 1.81} {'loss': 0.384, 'learning_rate': 4.2735396423373986e-07, 'epoch': 1.81} {'loss': 0.4642, 'learning_rate': 4.2725929486333696e-07, 'epoch': 1.81} {'loss': 0.4698, 'learning_rate': 4.2716463575099063e-07, 'epoch': 1.81} {'loss': 0.4272, 'learning_rate': 4.270699868967998e-07, 'epoch': 1.81} {'loss': 0.4724, 'learning_rate': 4.2697534830086985e-07, 'epoch': 1.81} {'loss': 0.5302, 'learning_rate': 4.2688071996329736e-07, 'epoch': 1.81} {'loss': 0.5315, 'learning_rate': 4.267861018841868e-07, 'epoch': 1.81} {'loss': 0.5733, 'learning_rate': 4.2669149406364016e-07, 'epoch': 1.81} {'loss': 0.5141, 'learning_rate': 4.265968965017564e-07, 'epoch': 1.81} {'loss': 0.5907, 'learning_rate': 4.265023091986398e-07, 'epoch': 1.81} {'loss': 0.4941, 'learning_rate': 4.264077321543869e-07, 'epoch': 1.81} {'loss': 0.4275, 'learning_rate': 4.263131653691055e-07, 'epoch': 1.81} {'loss': 0.4996, 'learning_rate': 4.262186088428921e-07, 'epoch': 1.81} {'loss': 0.6036, 'learning_rate': 4.261240625758489e-07, 'epoch': 1.81} {'loss': 0.5208, 'learning_rate': 4.2602952656808026e-07, 'epoch': 1.81} {'loss': 0.5399, 'learning_rate': 4.2593500081968165e-07, 'epoch': 1.81} {'loss': 0.4546, 'learning_rate': 4.258404853307607e-07, 'epoch': 1.81} {'loss': 0.4812, 'learning_rate': 4.25745980101413e-07, 'epoch': 1.81} {'loss': 0.6013, 'learning_rate': 4.2565148513174617e-07, 'epoch': 1.81} {'loss': 0.4696, 'learning_rate': 4.255570004218557e-07, 'epoch': 1.81} {'loss': 0.4105, 'learning_rate': 4.254625259718448e-07, 'epoch': 1.81} {'loss': 0.518, 'learning_rate': 4.2536806178181677e-07, 'epoch': 1.81} {'loss': 0.506, 'learning_rate': 4.2527360785186824e-07, 'epoch': 1.81} {'loss': 0.494, 'learning_rate': 4.2517916418210683e-07, 'epoch': 1.81} {'loss': 0.5178, 'learning_rate': 4.250847307726269e-07, 'epoch': 1.81} {'loss': 0.5181, 'learning_rate': 4.24990307623534e-07, 'epoch': 1.81} {'loss': 0.4982, 'learning_rate': 4.2489589473492796e-07, 'epoch': 1.81} {'loss': 0.5236, 'learning_rate': 4.24801492106911e-07, 'epoch': 1.81} {'loss': 0.6066, 'learning_rate': 4.247070997395841e-07, 'epoch': 1.81} {'loss': 0.4341, 'learning_rate': 4.24612717633045e-07, 'epoch': 1.81} {'loss': 0.6298, 'learning_rate': 4.2451834578740026e-07, 'epoch': 1.81} {'loss': 0.4908, 'learning_rate': 4.244239842027464e-07, 'epoch': 1.81} {'loss': 0.4822, 'learning_rate': 4.2432963287918794e-07, 'epoch': 1.81} {'loss': 0.2897, 'learning_rate': 4.2423529181682353e-07, 'epoch': 1.81} {'loss': 0.3788, 'learning_rate': 4.241409610157554e-07, 'epoch': 1.81} {'loss': 0.428, 'learning_rate': 4.240466404760857e-07, 'epoch': 1.81} {'loss': 0.6272, 'learning_rate': 4.23952330197912e-07, 'epoch': 1.81} {'loss': 0.4495, 'learning_rate': 4.238580301813411e-07, 'epoch': 1.81} {'loss': 0.4798, 'learning_rate': 4.2376374042646827e-07, 'epoch': 1.81} {'loss': 0.5028, 'learning_rate': 4.236694609333969e-07, 'epoch': 1.81} {'loss': 0.5343, 'learning_rate': 4.2357519170222796e-07, 'epoch': 1.81} {'loss': 0.4948, 'learning_rate': 4.2348093273306246e-07, 'epoch': 1.81} {'loss': 0.4485, 'learning_rate': 4.2338668402600367e-07, 'epoch': 1.81} {'loss': 0.487, 'learning_rate': 4.2329244558114825e-07, 'epoch': 1.81} {'loss': 0.4432, 'learning_rate': 4.2319821739859933e-07, 'epoch': 1.81} {'loss': 0.7045, 'learning_rate': 4.23103999478458e-07, 'epoch': 1.81} {'loss': 0.4644, 'learning_rate': 4.2300979182082533e-07, 'epoch': 1.81} {'loss': 0.532, 'learning_rate': 4.2291559442580233e-07, 'epoch': 1.81} {'loss': 0.4862, 'learning_rate': 4.2282140729348886e-07, 'epoch': 1.81} {'loss': 0.5455, 'learning_rate': 4.227272304239882e-07, 'epoch': 1.81} {'loss': 0.4541, 'learning_rate': 4.226330638173992e-07, 'epoch': 1.81} {'loss': 0.4908, 'learning_rate': 4.2253890747382174e-07, 'epoch': 1.81} {'loss': 0.2866, 'learning_rate': 4.224447613933602e-07, 'epoch': 1.81} {'loss': 0.5485, 'learning_rate': 4.223506255761123e-07, 'epoch': 1.81} {'loss': 0.6251, 'learning_rate': 4.222565000221801e-07, 'epoch': 1.81} {'loss': 0.5558, 'learning_rate': 4.221623847316647e-07, 'epoch': 1.81} {'loss': 0.5171, 'learning_rate': 4.220682797046682e-07, 'epoch': 1.81} {'loss': 0.4868, 'learning_rate': 4.219741849412884e-07, 'epoch': 1.81} {'loss': 0.4751, 'learning_rate': 4.2188010044162843e-07, 'epoch': 1.81} {'loss': 0.3463, 'learning_rate': 4.2178602620578714e-07, 'epoch': 1.82} {'loss': 0.5368, 'learning_rate': 4.216919622338678e-07, 'epoch': 1.82} {'loss': 0.2391, 'learning_rate': 4.215979085259692e-07, 'epoch': 1.82} {'loss': 0.5053, 'learning_rate': 4.2150386508219454e-07, 'epoch': 1.82} {'loss': 0.2825, 'learning_rate': 4.214098319026427e-07, 'epoch': 1.82} {'loss': 0.565, 'learning_rate': 4.2131580898741363e-07, 'epoch': 1.82} {'loss': 0.4881, 'learning_rate': 4.212217963366094e-07, 'epoch': 1.82} {'loss': 0.5045, 'learning_rate': 4.2112779395033e-07, 'epoch': 1.82} {'loss': 0.4532, 'learning_rate': 4.2103380182867745e-07, 'epoch': 1.82} {'loss': 0.4837, 'learning_rate': 4.209398199717518e-07, 'epoch': 1.82} {'loss': 0.4854, 'learning_rate': 4.2084584837965514e-07, 'epoch': 1.82} {'loss': 0.5056, 'learning_rate': 4.2075188705248515e-07, 'epoch': 1.82} {'loss': 0.5248, 'learning_rate': 4.2065793599034397e-07, 'epoch': 1.82} {'loss': 0.462, 'learning_rate': 4.2056399519333155e-07, 'epoch': 1.82} {'loss': 0.4239, 'learning_rate': 4.204700646615512e-07, 'epoch': 1.82} {'loss': 0.5641, 'learning_rate': 4.2037614439510153e-07, 'epoch': 1.82} {'loss': 0.5336, 'learning_rate': 4.2028223439408156e-07, 'epoch': 1.82} {'loss': 0.5341, 'learning_rate': 4.2018833465859665e-07, 'epoch': 1.82} {'loss': 0.5069, 'learning_rate': 4.200944451887423e-07, 'epoch': 1.82} {'loss': 0.4799, 'learning_rate': 4.200005659846229e-07, 'epoch': 1.82} {'loss': 0.4693, 'learning_rate': 4.1990669704633613e-07, 'epoch': 1.82} {'loss': 0.595, 'learning_rate': 4.1981283837398413e-07, 'epoch': 1.82} {'loss': 0.4753, 'learning_rate': 4.19718989967669e-07, 'epoch': 1.82} {'loss': 0.5503, 'learning_rate': 4.1962515182748855e-07, 'epoch': 1.82} {'loss': 0.5083, 'learning_rate': 4.195313239535448e-07, 'epoch': 1.82} {'loss': 0.5364, 'learning_rate': 4.1943750634593774e-07, 'epoch': 1.82} {'loss': 0.5954, 'learning_rate': 4.1934369900476723e-07, 'epoch': 1.82} {'loss': 0.5766, 'learning_rate': 4.1924990193013547e-07, 'epoch': 1.82} {'loss': 0.5004, 'learning_rate': 4.191561151221413e-07, 'epoch': 1.82} {'loss': 0.6771, 'learning_rate': 4.1906233858088784e-07, 'epoch': 1.82} {'loss': 0.4543, 'learning_rate': 4.1896857230647294e-07, 'epoch': 1.82} {'loss': 0.4514, 'learning_rate': 4.188748162989975e-07, 'epoch': 1.82} {'loss': 0.5293, 'learning_rate': 4.1878107055856265e-07, 'epoch': 1.82} {'loss': 0.3628, 'learning_rate': 4.186873350852683e-07, 'epoch': 1.82} {'loss': 0.5239, 'learning_rate': 4.185936098792176e-07, 'epoch': 1.82} {'loss': 0.5652, 'learning_rate': 4.18499894940505e-07, 'epoch': 1.82} {'loss': 0.4163, 'learning_rate': 4.1840619026923715e-07, 'epoch': 1.82} {'loss': 0.5364, 'learning_rate': 4.183124958655105e-07, 'epoch': 1.82} {'loss': 0.6362, 'learning_rate': 4.1821881172942726e-07, 'epoch': 1.82} {'loss': 0.4343, 'learning_rate': 4.1812513786108733e-07, 'epoch': 1.82} {'loss': 0.4219, 'learning_rate': 4.1803147426059063e-07, 'epoch': 1.82} {'loss': 0.3656, 'learning_rate': 4.1793782092804045e-07, 'epoch': 1.82} {'loss': 0.4388, 'learning_rate': 4.1784417786353114e-07, 'epoch': 1.82} {'loss': 0.5874, 'learning_rate': 4.177505450671693e-07, 'epoch': 1.82} {'loss': 0.5866, 'learning_rate': 4.1765692253905145e-07, 'epoch': 1.82} {'loss': 0.6553, 'learning_rate': 4.1756331027927976e-07, 'epoch': 1.82} {'loss': 0.3848, 'learning_rate': 4.174697082879531e-07, 'epoch': 1.82} {'loss': 0.3914, 'learning_rate': 4.173761165651724e-07, 'epoch': 1.82} {'loss': 0.5269, 'learning_rate': 4.172825351110399e-07, 'epoch': 1.82} {'loss': 0.5831, 'learning_rate': 4.17188963925651e-07, 'epoch': 1.82} {'loss': 0.5816, 'learning_rate': 4.170954030091112e-07, 'epoch': 1.82} {'loss': 0.5197, 'learning_rate': 4.1700185236151825e-07, 'epoch': 1.82} {'loss': 0.5057, 'learning_rate': 4.16908311982972e-07, 'epoch': 1.82} {'loss': 0.4193, 'learning_rate': 4.168147818735757e-07, 'epoch': 1.82} {'loss': 0.5299, 'learning_rate': 4.167212620334238e-07, 'epoch': 1.82} {'loss': 0.4946, 'learning_rate': 4.1662775246262276e-07, 'epoch': 1.82} {'loss': 0.6316, 'learning_rate': 4.1653425316126815e-07, 'epoch': 1.82} {'loss': 0.4211, 'learning_rate': 4.164407641294632e-07, 'epoch': 1.82} {'loss': 0.4601, 'learning_rate': 4.163472853673067e-07, 'epoch': 1.82} {'loss': 0.5362, 'learning_rate': 4.1625381687489865e-07, 'epoch': 1.82} {'loss': 0.4562, 'learning_rate': 4.1616035865234106e-07, 'epoch': 1.82} {'loss': 0.6646, 'learning_rate': 4.160669106997306e-07, 'epoch': 1.82} {'loss': 0.618, 'learning_rate': 4.159734730171716e-07, 'epoch': 1.82} {'loss': 0.5159, 'learning_rate': 4.158800456047596e-07, 'epoch': 1.82} {'loss': 0.6628, 'learning_rate': 4.157866284625989e-07, 'epoch': 1.82} {'loss': 0.5716, 'learning_rate': 4.156932215907872e-07, 'epoch': 1.82} {'loss': 0.5385, 'learning_rate': 4.155998249894255e-07, 'epoch': 1.82} {'loss': 0.5234, 'learning_rate': 4.1550643865861496e-07, 'epoch': 1.82} {'loss': 0.5189, 'learning_rate': 4.1541306259845205e-07, 'epoch': 1.82} {'loss': 0.4679, 'learning_rate': 4.153196968090401e-07, 'epoch': 1.82} {'loss': 0.4805, 'learning_rate': 4.1522634129047667e-07, 'epoch': 1.82} {'loss': 0.5645, 'learning_rate': 4.151329960428663e-07, 'epoch': 1.82} {'loss': 0.4412, 'learning_rate': 4.1503966106630434e-07, 'epoch': 1.82} {'loss': 0.5373, 'learning_rate': 4.149463363608919e-07, 'epoch': 1.82} {'loss': 0.3631, 'learning_rate': 4.1485302192673106e-07, 'epoch': 1.82} {'loss': 0.5157, 'learning_rate': 4.1475971776391844e-07, 'epoch': 1.82} {'loss': 0.4792, 'learning_rate': 4.146664238725584e-07, 'epoch': 1.82} {'loss': 0.5557, 'learning_rate': 4.145731402527453e-07, 'epoch': 1.82} {'loss': 0.4356, 'learning_rate': 4.1447986690458463e-07, 'epoch': 1.82} {'loss': 0.5299, 'learning_rate': 4.1438660382817297e-07, 'epoch': 1.82} {'loss': 0.602, 'learning_rate': 4.1429335102361133e-07, 'epoch': 1.82} {'loss': 0.5468, 'learning_rate': 4.1420010849100076e-07, 'epoch': 1.82} {'loss': 0.5025, 'learning_rate': 4.141068762304379e-07, 'epoch': 1.82} {'loss': 0.5548, 'learning_rate': 4.140136542420259e-07, 'epoch': 1.82} {'loss': 0.484, 'learning_rate': 4.139204425258625e-07, 'epoch': 1.82} {'loss': 0.4844, 'learning_rate': 4.1382724108204985e-07, 'epoch': 1.82} {'loss': 0.5091, 'learning_rate': 4.137340499106857e-07, 'epoch': 1.82} {'loss': 0.6925, 'learning_rate': 4.13640869011871e-07, 'epoch': 1.82} {'loss': 0.5786, 'learning_rate': 4.135476983857056e-07, 'epoch': 1.82} {'loss': 0.4769, 'learning_rate': 4.134545380322874e-07, 'epoch': 1.82} {'loss': 0.5651, 'learning_rate': 4.1336138795172065e-07, 'epoch': 1.82} {'loss': 0.5088, 'learning_rate': 4.1326824814410084e-07, 'epoch': 1.82} {'loss': 0.5508, 'learning_rate': 4.1317511860952896e-07, 'epoch': 1.82} {'loss': 0.4172, 'learning_rate': 4.130819993481061e-07, 'epoch': 1.82} {'loss': 0.4736, 'learning_rate': 4.1298889035992997e-07, 'epoch': 1.82} {'loss': 0.4369, 'learning_rate': 4.1289579164510376e-07, 'epoch': 1.82} {'loss': 0.4794, 'learning_rate': 4.1280270320372185e-07, 'epoch': 1.82} {'loss': 0.6882, 'learning_rate': 4.1270962503589086e-07, 'epoch': 1.82} {'loss': 0.5148, 'learning_rate': 4.12616557141704e-07, 'epoch': 1.82} {'loss': 0.5486, 'learning_rate': 4.125234995212646e-07, 'epoch': 1.82} {'loss': 0.4391, 'learning_rate': 4.1243045217467137e-07, 'epoch': 1.82} {'loss': 0.5081, 'learning_rate': 4.123374151020243e-07, 'epoch': 1.82} {'loss': 0.4881, 'learning_rate': 4.122443883034244e-07, 'epoch': 1.82} {'loss': 0.5074, 'learning_rate': 4.1215137177896934e-07, 'epoch': 1.82} {'loss': 0.5702, 'learning_rate': 4.12058365528758e-07, 'epoch': 1.82} {'loss': 0.4259, 'learning_rate': 4.119653695528925e-07, 'epoch': 1.82} {'loss': 0.5638, 'learning_rate': 4.1187238385147157e-07, 'epoch': 1.82} {'loss': 0.4965, 'learning_rate': 4.117794084245952e-07, 'epoch': 1.82} {'loss': 0.47, 'learning_rate': 4.116864432723611e-07, 'epoch': 1.82} {'loss': 0.5296, 'learning_rate': 4.1159348839487246e-07, 'epoch': 1.82} {'loss': 0.4444, 'learning_rate': 4.115005437922248e-07, 'epoch': 1.82} {'loss': 0.3342, 'learning_rate': 4.114076094645203e-07, 'epoch': 1.82} {'loss': 0.531, 'learning_rate': 4.113146854118577e-07, 'epoch': 1.82} {'loss': 0.5197, 'learning_rate': 4.1122177163433807e-07, 'epoch': 1.82} {'loss': 0.453, 'learning_rate': 4.111288681320602e-07, 'epoch': 1.82} {'loss': 0.437, 'learning_rate': 4.1103597490511957e-07, 'epoch': 1.82} {'loss': 0.4984, 'learning_rate': 4.1094309195362393e-07, 'epoch': 1.82} {'loss': 0.5694, 'learning_rate': 4.1085021927766534e-07, 'epoch': 1.82} {'loss': 0.3741, 'learning_rate': 4.107573568773471e-07, 'epoch': 1.82} {'loss': 0.4142, 'learning_rate': 4.106645047527669e-07, 'epoch': 1.82} {'loss': 0.2261, 'learning_rate': 4.105716629040257e-07, 'epoch': 1.82} {'loss': 0.5172, 'learning_rate': 4.1047883133122467e-07, 'epoch': 1.82} {'loss': 0.424, 'learning_rate': 4.103860100344581e-07, 'epoch': 1.82} {'loss': 0.4008, 'learning_rate': 4.1029319901383037e-07, 'epoch': 1.82} {'loss': 0.5555, 'learning_rate': 4.102003982694369e-07, 'epoch': 1.82} {'loss': 0.4884, 'learning_rate': 4.1010760780138106e-07, 'epoch': 1.82} {'loss': 0.6387, 'learning_rate': 4.100148276097593e-07, 'epoch': 1.82} {'loss': 0.4763, 'learning_rate': 4.0992205769467274e-07, 'epoch': 1.82} {'loss': 0.5139, 'learning_rate': 4.098292980562213e-07, 'epoch': 1.82} {'loss': 0.4646, 'learning_rate': 4.0973654869450263e-07, 'epoch': 1.82} {'loss': 0.6796, 'learning_rate': 4.096438096096156e-07, 'epoch': 1.82} {'loss': 0.4655, 'learning_rate': 4.095510808016623e-07, 'epoch': 1.82} {'loss': 0.5573, 'learning_rate': 4.094583622707393e-07, 'epoch': 1.82} {'loss': 0.3991, 'learning_rate': 4.0936565401694773e-07, 'epoch': 1.82} {'loss': 0.5031, 'learning_rate': 4.092729560403863e-07, 'epoch': 1.82} {'loss': 0.5334, 'learning_rate': 4.091802683411561e-07, 'epoch': 1.82} {'loss': 0.5115, 'learning_rate': 4.090875909193537e-07, 'epoch': 1.82} {'loss': 0.4613, 'learning_rate': 4.089949237750801e-07, 'epoch': 1.82} {'loss': 0.5067, 'learning_rate': 4.08902266908433e-07, 'epoch': 1.82} {'loss': 0.4681, 'learning_rate': 4.0880962031951355e-07, 'epoch': 1.82} {'loss': 0.5068, 'learning_rate': 4.087169840084193e-07, 'epoch': 1.82} {'loss': 0.5894, 'learning_rate': 4.0862435797525245e-07, 'epoch': 1.82} {'loss': 0.3777, 'learning_rate': 4.085317422201085e-07, 'epoch': 1.82} {'loss': 0.5414, 'learning_rate': 4.084391367430895e-07, 'epoch': 1.82} {'loss': 0.4403, 'learning_rate': 4.0834654154429223e-07, 'epoch': 1.82} {'loss': 0.5635, 'learning_rate': 4.082539566238186e-07, 'epoch': 1.82} {'loss': 0.5414, 'learning_rate': 4.0816138198176646e-07, 'epoch': 1.82} {'loss': 0.5767, 'learning_rate': 4.080688176182346e-07, 'epoch': 1.82} {'loss': 0.6255, 'learning_rate': 4.07976263533324e-07, 'epoch': 1.82} {'loss': 0.5508, 'learning_rate': 4.0788371972713127e-07, 'epoch': 1.82} {'loss': 0.2768, 'learning_rate': 4.0779118619975746e-07, 'epoch': 1.82} {'loss': 0.5588, 'learning_rate': 4.076986629513002e-07, 'epoch': 1.82} {'loss': 0.4419, 'learning_rate': 4.076061499818607e-07, 'epoch': 1.82} {'loss': 0.6339, 'learning_rate': 4.0751364729153643e-07, 'epoch': 1.82} {'loss': 0.4844, 'learning_rate': 4.074211548804263e-07, 'epoch': 1.82} {'loss': 0.4742, 'learning_rate': 4.0732867274863253e-07, 'epoch': 1.82} {'loss': 0.5041, 'learning_rate': 4.072362008962505e-07, 'epoch': 1.82} {'loss': 0.5491, 'learning_rate': 4.071437393233801e-07, 'epoch': 1.82} {'loss': 0.4019, 'learning_rate': 4.070512880301214e-07, 'epoch': 1.82} {'loss': 0.386, 'learning_rate': 4.069588470165731e-07, 'epoch': 1.82} {'loss': 0.5373, 'learning_rate': 4.0686641628283506e-07, 'epoch': 1.82} {'loss': 0.6567, 'learning_rate': 4.067739958290029e-07, 'epoch': 1.82} {'loss': 0.5767, 'learning_rate': 4.06681585655182e-07, 'epoch': 1.82} {'loss': 0.5035, 'learning_rate': 4.0658918576146457e-07, 'epoch': 1.82} {'loss': 0.3898, 'learning_rate': 4.064967961479538e-07, 'epoch': 1.82} {'loss': 0.5607, 'learning_rate': 4.064044168147474e-07, 'epoch': 1.82} {'loss': 0.4871, 'learning_rate': 4.063120477619453e-07, 'epoch': 1.82} {'loss': 0.5385, 'learning_rate': 4.0621968898964526e-07, 'epoch': 1.82} {'loss': 0.6611, 'learning_rate': 4.06127340497946e-07, 'epoch': 1.82} {'loss': 0.5776, 'learning_rate': 4.060350022869486e-07, 'epoch': 1.82} {'loss': 0.5237, 'learning_rate': 4.0594267435674964e-07, 'epoch': 1.82} {'loss': 0.3874, 'learning_rate': 4.05850356707449e-07, 'epoch': 1.82} {'loss': 0.5152, 'learning_rate': 4.0575804933914555e-07, 'epoch': 1.82} {'loss': 0.4274, 'learning_rate': 4.0566575225193804e-07, 'epoch': 1.82} {'loss': 0.4274, 'learning_rate': 4.0557346544592756e-07, 'epoch': 1.82} {'loss': 0.5321, 'learning_rate': 4.054811889212096e-07, 'epoch': 1.82} {'loss': 0.4752, 'learning_rate': 4.05388922677884e-07, 'epoch': 1.82} {'loss': 0.5165, 'learning_rate': 4.052966667160507e-07, 'epoch': 1.82} {'loss': 0.4754, 'learning_rate': 4.0520442103580747e-07, 'epoch': 1.82} {'loss': 0.5265, 'learning_rate': 4.051121856372553e-07, 'epoch': 1.82} {'loss': 0.5128, 'learning_rate': 4.0501996052048965e-07, 'epoch': 1.82} {'loss': 0.4562, 'learning_rate': 4.0492774568561265e-07, 'epoch': 1.82} {'loss': 0.4605, 'learning_rate': 4.0483554113271983e-07, 'epoch': 1.82} {'loss': 0.3753, 'learning_rate': 4.047433468619133e-07, 'epoch': 1.82} {'loss': 0.3894, 'learning_rate': 4.0465116287328853e-07, 'epoch': 1.82} {'loss': 0.5471, 'learning_rate': 4.045589891669477e-07, 'epoch': 1.82} {'loss': 0.3539, 'learning_rate': 4.0446682574298844e-07, 'epoch': 1.82} {'loss': 0.5368, 'learning_rate': 4.0437467260150633e-07, 'epoch': 1.82} {'loss': 0.405, 'learning_rate': 4.042825297426056e-07, 'epoch': 1.82} {'loss': 0.407, 'learning_rate': 4.0419039716638076e-07, 'epoch': 1.82} {'loss': 0.535, 'learning_rate': 4.0409827487293274e-07, 'epoch': 1.82} {'loss': 0.5132, 'learning_rate': 4.040061628623593e-07, 'epoch': 1.82} {'loss': 0.4651, 'learning_rate': 4.0391406113475805e-07, 'epoch': 1.82} {'loss': 0.3899, 'learning_rate': 4.0382196969023123e-07, 'epoch': 1.82} {'loss': 0.5415, 'learning_rate': 4.0372988852887207e-07, 'epoch': 1.82} {'loss': 0.4128, 'learning_rate': 4.03637817650786e-07, 'epoch': 1.82} {'loss': 0.5356, 'learning_rate': 4.035457570560664e-07, 'epoch': 1.82} {'loss': 0.4768, 'learning_rate': 4.034537067448141e-07, 'epoch': 1.82} {'loss': 0.4777, 'learning_rate': 4.0336166671712805e-07, 'epoch': 1.82} {'loss': 0.5166, 'learning_rate': 4.0326963697310373e-07, 'epoch': 1.82} {'loss': 0.4408, 'learning_rate': 4.0317761751284433e-07, 'epoch': 1.82} {'loss': 0.6155, 'learning_rate': 4.030856083364443e-07, 'epoch': 1.82} {'loss': 0.5691, 'learning_rate': 4.029936094440068e-07, 'epoch': 1.82} {'loss': 0.6988, 'learning_rate': 4.029016208356262e-07, 'epoch': 1.82} {'loss': 0.54, 'learning_rate': 4.028096425114025e-07, 'epoch': 1.82} {'loss': 0.4269, 'learning_rate': 4.027176744714356e-07, 'epoch': 1.82} {'loss': 0.5919, 'learning_rate': 4.0262571671582095e-07, 'epoch': 1.82} {'loss': 0.5242, 'learning_rate': 4.025337692446618e-07, 'epoch': 1.82} {'loss': 0.6362, 'learning_rate': 4.0244183205805143e-07, 'epoch': 1.82} {'loss': 0.6498, 'learning_rate': 4.0234990515609306e-07, 'epoch': 1.82} {'loss': 0.388, 'learning_rate': 4.022579885388811e-07, 'epoch': 1.82} {'loss': 0.3937, 'learning_rate': 4.021660822065165e-07, 'epoch': 1.82} {'loss': 0.5747, 'learning_rate': 4.020741861590993e-07, 'epoch': 1.82} {'loss': 0.5288, 'learning_rate': 4.019823003967216e-07, 'epoch': 1.82} {'loss': 0.5397, 'learning_rate': 4.0189042491948996e-07, 'epoch': 1.82} {'loss': 0.4237, 'learning_rate': 4.017985597274965e-07, 'epoch': 1.82} {'loss': 0.5085, 'learning_rate': 4.017067048208445e-07, 'epoch': 1.82} {'loss': 0.5303, 'learning_rate': 4.0161486019962836e-07, 'epoch': 1.82} {'loss': 0.4561, 'learning_rate': 4.0152302586394907e-07, 'epoch': 1.82} {'loss': 0.3875, 'learning_rate': 4.0143120181390435e-07, 'epoch': 1.82} {'loss': 0.425, 'learning_rate': 4.0133938804959084e-07, 'epoch': 1.82} {'loss': 0.6, 'learning_rate': 4.012475845711106e-07, 'epoch': 1.82} {'loss': 0.5058, 'learning_rate': 4.0115579137855687e-07, 'epoch': 1.82} {'loss': 0.4958, 'learning_rate': 4.010640084720341e-07, 'epoch': 1.82} {'loss': 0.4776, 'learning_rate': 4.009722358516366e-07, 'epoch': 1.82} {'loss': 0.4207, 'learning_rate': 4.0088047351746317e-07, 'epoch': 1.82} {'loss': 0.6272, 'learning_rate': 4.007887214696149e-07, 'epoch': 1.82} {'loss': 0.5763, 'learning_rate': 4.00696979708185e-07, 'epoch': 1.82} {'loss': 0.4945, 'learning_rate': 4.0060524823327674e-07, 'epoch': 1.82} {'loss': 0.5515, 'learning_rate': 4.0051352704498556e-07, 'epoch': 1.82} {'loss': 0.4253, 'learning_rate': 4.0042181614341036e-07, 'epoch': 1.82} {'loss': 0.5576, 'learning_rate': 4.0033011552864875e-07, 'epoch': 1.82} {'loss': 0.3935, 'learning_rate': 4.002384252008007e-07, 'epoch': 1.82} {'loss': 0.4907, 'learning_rate': 4.0014674515996497e-07, 'epoch': 1.82} {'loss': 0.6504, 'learning_rate': 4.00055075406236e-07, 'epoch': 1.82} {'loss': 0.3982, 'learning_rate': 3.99963415939717e-07, 'epoch': 1.82} {'loss': 0.5254, 'learning_rate': 3.998717667605012e-07, 'epoch': 1.82} {'loss': 0.5811, 'learning_rate': 3.997801278686908e-07, 'epoch': 1.82} {'loss': 0.4744, 'learning_rate': 3.996884992643812e-07, 'epoch': 1.82} {'loss': 0.5532, 'learning_rate': 3.9959688094767355e-07, 'epoch': 1.82} {'loss': 0.4472, 'learning_rate': 3.9950527291866436e-07, 'epoch': 1.82} {'loss': 0.5734, 'learning_rate': 3.994136751774491e-07, 'epoch': 1.82} {'loss': 0.4393, 'learning_rate': 3.9932208772413107e-07, 'epoch': 1.82} {'loss': 0.5141, 'learning_rate': 3.992305105588057e-07, 'epoch': 1.82} {'loss': 0.47, 'learning_rate': 3.991389436815707e-07, 'epoch': 1.82} {'loss': 0.5281, 'learning_rate': 3.9904738709252486e-07, 'epoch': 1.82} {'loss': 0.5428, 'learning_rate': 3.9895584079176597e-07, 'epoch': 1.82} {'loss': 0.4435, 'learning_rate': 3.988643047793939e-07, 'epoch': 1.82} {'loss': 0.43, 'learning_rate': 3.9877277905550515e-07, 'epoch': 1.82} {'loss': 0.5477, 'learning_rate': 3.986812636201964e-07, 'epoch': 1.82} {'loss': 0.4806, 'learning_rate': 3.9858975847356764e-07, 'epoch': 1.82} {'loss': 0.4211, 'learning_rate': 3.9849826361571643e-07, 'epoch': 1.82} {'loss': 0.4969, 'learning_rate': 3.9840677904674165e-07, 'epoch': 1.82} {'loss': 0.4415, 'learning_rate': 3.9831530476673983e-07, 'epoch': 1.82} {'loss': 0.4712, 'learning_rate': 3.982238407758121e-07, 'epoch': 1.82} {'loss': 0.5269, 'learning_rate': 3.9813238707405165e-07, 'epoch': 1.82} {'loss': 0.4779, 'learning_rate': 3.9804094366155953e-07, 'epoch': 1.82} {'loss': 0.5699, 'learning_rate': 3.9794951053843344e-07, 'epoch': 1.82} {'loss': 0.6155, 'learning_rate': 3.9785808770477e-07, 'epoch': 1.82} {'loss': 0.5982, 'learning_rate': 3.97766675160669e-07, 'epoch': 1.82} {'loss': 0.6069, 'learning_rate': 3.976752729062283e-07, 'epoch': 1.82} {'loss': 0.4357, 'learning_rate': 3.9758388094154556e-07, 'epoch': 1.82} {'loss': 0.6498, 'learning_rate': 3.974924992667173e-07, 'epoch': 1.82} {'loss': 0.6241, 'learning_rate': 3.9740112788184236e-07, 'epoch': 1.82} {'loss': 0.5157, 'learning_rate': 3.973097667870196e-07, 'epoch': 1.82} {'loss': 0.664, 'learning_rate': 3.972184159823456e-07, 'epoch': 1.82} {'loss': 0.6836, 'learning_rate': 3.9712707546791904e-07, 'epoch': 1.82} {'loss': 0.3245, 'learning_rate': 3.970357452438378e-07, 'epoch': 1.82} {'loss': 0.565, 'learning_rate': 3.969444253101984e-07, 'epoch': 1.82} {'loss': 0.5021, 'learning_rate': 3.9685311566710074e-07, 'epoch': 1.82} {'loss': 0.4937, 'learning_rate': 3.967618163146414e-07, 'epoch': 1.82} {'loss': 0.6118, 'learning_rate': 3.966705272529181e-07, 'epoch': 1.82} {'loss': 0.4961, 'learning_rate': 3.9657924848202966e-07, 'epoch': 1.82} {'loss': 0.6327, 'learning_rate': 3.964879800020738e-07, 'epoch': 1.82} {'loss': 0.393, 'learning_rate': 3.96396721813147e-07, 'epoch': 1.82} {'loss': 0.5619, 'learning_rate': 3.9630547391534824e-07, 'epoch': 1.82} {'loss': 0.4676, 'learning_rate': 3.96214236308774e-07, 'epoch': 1.82} {'loss': 0.5842, 'learning_rate': 3.961230089935242e-07, 'epoch': 1.82} {'loss': 0.4744, 'learning_rate': 3.9603179196969435e-07, 'epoch': 1.82} {'loss': 0.4525, 'learning_rate': 3.959405852373854e-07, 'epoch': 1.82} {'loss': 0.4106, 'learning_rate': 3.9584938879669075e-07, 'epoch': 1.82} {'loss': 0.6741, 'learning_rate': 3.9575820264771136e-07, 'epoch': 1.82} {'loss': 0.4168, 'learning_rate': 3.956670267905427e-07, 'epoch': 1.82} {'loss': 0.5784, 'learning_rate': 3.955758612252847e-07, 'epoch': 1.82} {'loss': 0.5082, 'learning_rate': 3.954847059520339e-07, 'epoch': 1.82} {'loss': 0.5061, 'learning_rate': 3.953935609708881e-07, 'epoch': 1.82} {'loss': 0.3977, 'learning_rate': 3.9530242628194493e-07, 'epoch': 1.82} {'loss': 0.4975, 'learning_rate': 3.952113018853021e-07, 'epoch': 1.82} {'loss': 0.3514, 'learning_rate': 3.9512018778105734e-07, 'epoch': 1.82} {'loss': 0.4796, 'learning_rate': 3.9502908396930826e-07, 'epoch': 1.82} {'loss': 0.4711, 'learning_rate': 3.9493799045015156e-07, 'epoch': 1.82} {'loss': 0.514, 'learning_rate': 3.94846907223686e-07, 'epoch': 1.82} {'loss': 0.6187, 'learning_rate': 3.947558342900093e-07, 'epoch': 1.82} {'loss': 0.5551, 'learning_rate': 3.946647716492191e-07, 'epoch': 1.82} {'loss': 0.4833, 'learning_rate': 3.945737193014121e-07, 'epoch': 1.82} {'loss': 0.5641, 'learning_rate': 3.944826772466859e-07, 'epoch': 1.82} {'loss': 0.4722, 'learning_rate': 3.943916454851393e-07, 'epoch': 1.82} {'loss': 0.4243, 'learning_rate': 3.943006240168679e-07, 'epoch': 1.82} {'loss': 0.5489, 'learning_rate': 3.9420961284197256e-07, 'epoch': 1.82} {'loss': 0.4883, 'learning_rate': 3.9411861196054556e-07, 'epoch': 1.82} {'loss': 0.4263, 'learning_rate': 3.9402762137269014e-07, 'epoch': 1.82} {'loss': 0.4926, 'learning_rate': 3.939366410784995e-07, 'epoch': 1.82} {'loss': 0.4496, 'learning_rate': 3.9384567107807247e-07, 'epoch': 1.82} {'loss': 0.6398, 'learning_rate': 3.937547113715079e-07, 'epoch': 1.82} {'loss': 0.5381, 'learning_rate': 3.936637619589012e-07, 'epoch': 1.82} {'loss': 0.4133, 'learning_rate': 3.9357282284035236e-07, 'epoch': 1.82} {'loss': 0.46, 'learning_rate': 3.934818940159546e-07, 'epoch': 1.82} {'loss': 0.606, 'learning_rate': 3.933909754858112e-07, 'epoch': 1.82} {'loss': 0.5335, 'learning_rate': 3.9330006725001425e-07, 'epoch': 1.82} {'loss': 0.4028, 'learning_rate': 3.932091693086637e-07, 'epoch': 1.82} {'loss': 0.5768, 'learning_rate': 3.931182816618573e-07, 'epoch': 1.82} {'loss': 0.6358, 'learning_rate': 3.9302740430969046e-07, 'epoch': 1.82} {'loss': 0.5004, 'learning_rate': 3.929365372522642e-07, 'epoch': 1.82} {'loss': 0.4652, 'learning_rate': 3.928456804896708e-07, 'epoch': 1.82} {'loss': 0.6413, 'learning_rate': 3.927548340220122e-07, 'epoch': 1.82} {'loss': 0.5642, 'learning_rate': 3.926639978493829e-07, 'epoch': 1.82} {'loss': 0.5223, 'learning_rate': 3.9257317197188173e-07, 'epoch': 1.82} {'loss': 0.5826, 'learning_rate': 3.924823563896063e-07, 'epoch': 1.82} {'loss': 0.4676, 'learning_rate': 3.92391551102651e-07, 'epoch': 1.82} {'loss': 0.5175, 'learning_rate': 3.9230075611111805e-07, 'epoch': 1.82} {'loss': 0.5409, 'learning_rate': 3.9220997141509844e-07, 'epoch': 1.82} {'loss': 0.2737, 'learning_rate': 3.921191970146965e-07, 'epoch': 1.82} {'loss': 0.5329, 'learning_rate': 3.9202843291000437e-07, 'epoch': 1.82} {'loss': 0.5207, 'learning_rate': 3.919376791011209e-07, 'epoch': 1.82} {'loss': 0.4879, 'learning_rate': 3.918469355881449e-07, 'epoch': 1.82} {'loss': 0.4349, 'learning_rate': 3.917562023711696e-07, 'epoch': 1.82} {'loss': 0.6438, 'learning_rate': 3.916654794502972e-07, 'epoch': 1.82} {'loss': 0.4923, 'learning_rate': 3.915747668256198e-07, 'epoch': 1.82} {'loss': 0.5224, 'learning_rate': 3.914840644972395e-07, 'epoch': 1.82} {'loss': 0.6061, 'learning_rate': 3.9139337246524964e-07, 'epoch': 1.82} {'loss': 0.4842, 'learning_rate': 3.9130269072975015e-07, 'epoch': 1.82} {'loss': 0.3624, 'learning_rate': 3.9121201929083754e-07, 'epoch': 1.82} {'loss': 0.3947, 'learning_rate': 3.911213581486062e-07, 'epoch': 1.82} {'loss': 0.4274, 'learning_rate': 3.910307073031583e-07, 'epoch': 1.82} {'loss': 0.4845, 'learning_rate': 3.909400667545871e-07, 'epoch': 1.82} {'loss': 0.5291, 'learning_rate': 3.9084943650299024e-07, 'epoch': 1.82} {'loss': 0.4744, 'learning_rate': 3.9075881654846546e-07, 'epoch': 1.82} {'loss': 0.3762, 'learning_rate': 3.906682068911105e-07, 'epoch': 1.82} {'loss': 0.5776, 'learning_rate': 3.90577607531023e-07, 'epoch': 1.82} {'loss': 0.4722, 'learning_rate': 3.904870184682963e-07, 'epoch': 1.82} {'loss': 0.5065, 'learning_rate': 3.903964397030324e-07, 'epoch': 1.82} {'loss': 0.5417, 'learning_rate': 3.903058712353258e-07, 'epoch': 1.82} {'loss': 0.432, 'learning_rate': 3.9021531306527194e-07, 'epoch': 1.82} {'loss': 0.3806, 'learning_rate': 3.901247651929707e-07, 'epoch': 1.82} {'loss': 0.5102, 'learning_rate': 3.9003422761851874e-07, 'epoch': 1.82} {'loss': 0.4221, 'learning_rate': 3.8994370034201257e-07, 'epoch': 1.82} {'loss': 0.5934, 'learning_rate': 3.898531833635477e-07, 'epoch': 1.82} {'loss': 0.5573, 'learning_rate': 3.897626766832241e-07, 'epoch': 1.82} {'loss': 0.509, 'learning_rate': 3.896721803011361e-07, 'epoch': 1.82} {'loss': 0.5899, 'learning_rate': 3.8958169421738246e-07, 'epoch': 1.82} {'loss': 0.3632, 'learning_rate': 3.8949121843205986e-07, 'epoch': 1.82} {'loss': 0.4714, 'learning_rate': 3.8940075294526257e-07, 'epoch': 1.82} {'loss': 0.4666, 'learning_rate': 3.893102977570928e-07, 'epoch': 1.82} {'loss': 0.496, 'learning_rate': 3.8921985286764055e-07, 'epoch': 1.82} {'loss': 0.6403, 'learning_rate': 3.8912941827701e-07, 'epoch': 1.82} {'loss': 0.5187, 'learning_rate': 3.8903899398529455e-07, 'epoch': 1.82} {'loss': 0.5353, 'learning_rate': 3.889485799925896e-07, 'epoch': 1.82} {'loss': 0.3836, 'learning_rate': 3.888581762989951e-07, 'epoch': 1.82} {'loss': 0.4017, 'learning_rate': 3.8876778290460547e-07, 'epoch': 1.82} {'loss': 0.5701, 'learning_rate': 3.8867739980951944e-07, 'epoch': 1.82} {'loss': 0.3521, 'learning_rate': 3.8858702701383144e-07, 'epoch': 1.82} {'loss': 0.3678, 'learning_rate': 3.8849666451764247e-07, 'epoch': 1.82} {'loss': 0.4903, 'learning_rate': 3.8840631232104575e-07, 'epoch': 1.82} {'loss': 0.4665, 'learning_rate': 3.8831597042413795e-07, 'epoch': 1.82} {'loss': 0.3209, 'learning_rate': 3.8822563882702003e-07, 'epoch': 1.82} {'loss': 0.4626, 'learning_rate': 3.8813531752978193e-07, 'epoch': 1.82} {'loss': 0.523, 'learning_rate': 3.88045006532527e-07, 'epoch': 1.82} {'loss': 0.3315, 'learning_rate': 3.8795470583534945e-07, 'epoch': 1.82} {'loss': 0.5786, 'learning_rate': 3.8786441543834485e-07, 'epoch': 1.82} {'loss': 0.4823, 'learning_rate': 3.877741353416109e-07, 'epoch': 1.82} {'loss': 0.5287, 'learning_rate': 3.876838655452453e-07, 'epoch': 1.82} {'loss': 0.657, 'learning_rate': 3.875936060493446e-07, 'epoch': 1.82} {'loss': 0.544, 'learning_rate': 3.875033568540032e-07, 'epoch': 1.82} {'loss': 0.5216, 'learning_rate': 3.87413117959321e-07, 'epoch': 1.82} {'loss': 0.6169, 'learning_rate': 3.8732288936539244e-07, 'epoch': 1.82} {'loss': 0.5133, 'learning_rate': 3.8723267107231513e-07, 'epoch': 1.82} {'loss': 0.4438, 'learning_rate': 3.8714246308018564e-07, 'epoch': 1.82} {'loss': 0.6177, 'learning_rate': 3.870522653891007e-07, 'epoch': 1.82} {'loss': 0.4885, 'learning_rate': 3.869620779991579e-07, 'epoch': 1.82} {'loss': 0.5354, 'learning_rate': 3.8687190091045044e-07, 'epoch': 1.82} {'loss': 0.4098, 'learning_rate': 3.867817341230795e-07, 'epoch': 1.82} {'loss': 0.5848, 'learning_rate': 3.866915776371394e-07, 'epoch': 1.82} {'loss': 0.4977, 'learning_rate': 3.8660143145272554e-07, 'epoch': 1.82} {'loss': 0.6014, 'learning_rate': 3.8651129556993684e-07, 'epoch': 1.82} {'loss': 0.5563, 'learning_rate': 3.864211699888687e-07, 'epoch': 1.82} {'loss': 0.4934, 'learning_rate': 3.8633105470961996e-07, 'epoch': 1.82} {'loss': 0.4699, 'learning_rate': 3.8624094973228274e-07, 'epoch': 1.82} {'loss': 0.6283, 'learning_rate': 3.8615085505695707e-07, 'epoch': 1.82} {'loss': 0.5525, 'learning_rate': 3.8606077068373716e-07, 'epoch': 1.82} {'loss': 0.4042, 'learning_rate': 3.859706966127219e-07, 'epoch': 1.82} {'loss': 0.4395, 'learning_rate': 3.858806328440068e-07, 'epoch': 1.82} {'loss': 0.4096, 'learning_rate': 3.857905793776873e-07, 'epoch': 1.82} {'loss': 0.4574, 'learning_rate': 3.857005362138633e-07, 'epoch': 1.82} {'loss': 0.3651, 'learning_rate': 3.8561050335262696e-07, 'epoch': 1.82} {'loss': 0.3619, 'learning_rate': 3.855204807940771e-07, 'epoch': 1.82} {'loss': 0.4315, 'learning_rate': 3.854304685383092e-07, 'epoch': 1.82} {'loss': 0.3923, 'learning_rate': 3.8534046658542103e-07, 'epoch': 1.82} {'loss': 0.3411, 'learning_rate': 3.8525047493550793e-07, 'epoch': 1.82} {'loss': 0.5157, 'learning_rate': 3.851604935886677e-07, 'epoch': 1.82} {'loss': 0.6469, 'learning_rate': 3.8507052254499575e-07, 'epoch': 1.82} {'loss': 0.4209, 'learning_rate': 3.8498056180458767e-07, 'epoch': 1.82} {'loss': 0.5723, 'learning_rate': 3.8489061136754104e-07, 'epoch': 1.82} {'loss': 0.5203, 'learning_rate': 3.8480067123395135e-07, 'epoch': 1.82} {'loss': 0.6307, 'learning_rate': 3.847107414039164e-07, 'epoch': 1.82} {'loss': 0.6475, 'learning_rate': 3.8462082187753156e-07, 'epoch': 1.82} {'loss': 0.5135, 'learning_rate': 3.845309126548935e-07, 'epoch': 1.82} {'loss': 0.6022, 'learning_rate': 3.844410137360988e-07, 'epoch': 1.82} {'loss': 0.4808, 'learning_rate': 3.8435112512124173e-07, 'epoch': 1.82} {'loss': 0.6075, 'learning_rate': 3.842612468104212e-07, 'epoch': 1.82} {'loss': 0.5385, 'learning_rate': 3.841713788037327e-07, 'epoch': 1.82} {'loss': 0.3947, 'learning_rate': 3.8408152110127274e-07, 'epoch': 1.82} {'loss': 0.4437, 'learning_rate': 3.8399167370313684e-07, 'epoch': 1.82} {'loss': 0.4677, 'learning_rate': 3.839018366094227e-07, 'epoch': 1.82} {'loss': 0.4939, 'learning_rate': 3.838120098202247e-07, 'epoch': 1.82} {'loss': 0.4054, 'learning_rate': 3.837221933356405e-07, 'epoch': 1.82} {'loss': 0.4454, 'learning_rate': 3.836323871557657e-07, 'epoch': 1.82} {'loss': 0.552, 'learning_rate': 3.835425912806967e-07, 'epoch': 1.82} {'loss': 0.525, 'learning_rate': 3.834528057105291e-07, 'epoch': 1.82} {'loss': 0.5044, 'learning_rate': 3.833630304453617e-07, 'epoch': 1.82} {'loss': 0.4924, 'learning_rate': 3.832732654852878e-07, 'epoch': 1.82} {'loss': 0.4272, 'learning_rate': 3.8318351083040383e-07, 'epoch': 1.82} {'loss': 0.395, 'learning_rate': 3.8309376648080653e-07, 'epoch': 1.82} {'loss': 0.3265, 'learning_rate': 3.8300403243659243e-07, 'epoch': 1.82} {'loss': 0.5009, 'learning_rate': 3.8291430869785815e-07, 'epoch': 1.82} {'loss': 0.4627, 'learning_rate': 3.8282459526470026e-07, 'epoch': 1.82} {'loss': 0.6738, 'learning_rate': 3.8273489213721203e-07, 'epoch': 1.82} {'loss': 0.4996, 'learning_rate': 3.8264519931549225e-07, 'epoch': 1.82} {'loss': 0.611, 'learning_rate': 3.825555167996353e-07, 'epoch': 1.82} {'loss': 0.6144, 'learning_rate': 3.8246584458973776e-07, 'epoch': 1.82} {'loss': 0.5091, 'learning_rate': 3.823761826858974e-07, 'epoch': 1.82} {'loss': 0.3346, 'learning_rate': 3.8228653108820846e-07, 'epoch': 1.82} {'loss': 0.6178, 'learning_rate': 3.821968897967687e-07, 'epoch': 1.82} {'loss': 0.5058, 'learning_rate': 3.821072588116714e-07, 'epoch': 1.82} {'loss': 0.4528, 'learning_rate': 3.820176381330154e-07, 'epoch': 1.82} {'loss': 0.5857, 'learning_rate': 3.819280277608939e-07, 'epoch': 1.82} {'loss': 0.5252, 'learning_rate': 3.818384276954057e-07, 'epoch': 1.82} {'loss': 0.5152, 'learning_rate': 3.817488379366463e-07, 'epoch': 1.82} {'loss': 0.386, 'learning_rate': 3.816592584847101e-07, 'epoch': 1.82} {'loss': 0.5662, 'learning_rate': 3.8156968933969587e-07, 'epoch': 1.82} {'loss': 0.3336, 'learning_rate': 3.8148013050169576e-07, 'epoch': 1.82} {'loss': 0.5447, 'learning_rate': 3.813905819708086e-07, 'epoch': 1.82} {'loss': 0.5236, 'learning_rate': 3.8130104374712984e-07, 'epoch': 1.82} {'loss': 0.4605, 'learning_rate': 3.812115158307539e-07, 'epoch': 1.82} {'loss': 0.4949, 'learning_rate': 3.8112199822178066e-07, 'epoch': 1.82} {'loss': 0.5029, 'learning_rate': 3.810324909203e-07, 'epoch': 1.82} {'loss': 0.6533, 'learning_rate': 3.809429939264142e-07, 'epoch': 1.82} {'loss': 0.5857, 'learning_rate': 3.808535072402142e-07, 'epoch': 1.82} {'loss': 0.6408, 'learning_rate': 3.807640308617977e-07, 'epoch': 1.82} {'loss': 0.5185, 'learning_rate': 3.806745647912613e-07, 'epoch': 1.82} {'loss': 0.5012, 'learning_rate': 3.805851090287005e-07, 'epoch': 1.82} {'loss': 0.503, 'learning_rate': 3.804956635742119e-07, 'epoch': 1.82} {'loss': 0.6074, 'learning_rate': 3.804062284278887e-07, 'epoch': 1.82} {'loss': 0.5471, 'learning_rate': 3.803168035898297e-07, 'epoch': 1.82} {'loss': 0.5722, 'learning_rate': 3.8022738906012935e-07, 'epoch': 1.82} {'loss': 0.5702, 'learning_rate': 3.8013798483888307e-07, 'epoch': 1.82} {'loss': 0.4677, 'learning_rate': 3.8004859092618753e-07, 'epoch': 1.82} {'loss': 0.5199, 'learning_rate': 3.7995920732213696e-07, 'epoch': 1.82} {'loss': 0.5844, 'learning_rate': 3.798698340268303e-07, 'epoch': 1.82} {'loss': 0.3843, 'learning_rate': 3.7978047104035963e-07, 'epoch': 1.82} {'loss': 0.6755, 'learning_rate': 3.7969111836282377e-07, 'epoch': 1.82} {'loss': 0.3524, 'learning_rate': 3.79601775994316e-07, 'epoch': 1.82} {'loss': 0.6068, 'learning_rate': 3.79512443934934e-07, 'epoch': 1.82} {'loss': 0.419, 'learning_rate': 3.794231221847744e-07, 'epoch': 1.82} {'loss': 0.5965, 'learning_rate': 3.7933381074392707e-07, 'epoch': 1.82} {'loss': 0.4344, 'learning_rate': 3.7924450961249524e-07, 'epoch': 1.82} {'loss': 0.4983, 'learning_rate': 3.791552187905689e-07, 'epoch': 1.82} {'loss': 0.4335, 'learning_rate': 3.790659382782491e-07, 'epoch': 1.82} {'loss': 0.483, 'learning_rate': 3.789766680756268e-07, 'epoch': 1.82} {'loss': 0.461, 'learning_rate': 3.7888740818279865e-07, 'epoch': 1.82} {'loss': 0.4399, 'learning_rate': 3.7879815859986346e-07, 'epoch': 1.82} {'loss': 0.3127, 'learning_rate': 3.787089193269111e-07, 'epoch': 1.82} {'loss': 0.4999, 'learning_rate': 3.7861969036404266e-07, 'epoch': 1.82} {'loss': 0.401, 'learning_rate': 3.785304717113503e-07, 'epoch': 1.82} {'loss': 0.4546, 'learning_rate': 3.7844126336893274e-07, 'epoch': 1.82} {'loss': 0.4055, 'learning_rate': 3.783520653368822e-07, 'epoch': 1.82} {'loss': 0.4426, 'learning_rate': 3.7826287761529633e-07, 'epoch': 1.82} {'loss': 0.3774, 'learning_rate': 3.781737002042707e-07, 'epoch': 1.82} {'loss': 0.5441, 'learning_rate': 3.780845331038985e-07, 'epoch': 1.82} {'loss': 0.495, 'learning_rate': 3.7799537631427964e-07, 'epoch': 1.82} {'loss': 0.5991, 'learning_rate': 3.7790622983550515e-07, 'epoch': 1.82} {'loss': 0.3875, 'learning_rate': 3.7781709366767395e-07, 'epoch': 1.82} {'loss': 0.5054, 'learning_rate': 3.777279678108803e-07, 'epoch': 1.83} {'loss': 0.4826, 'learning_rate': 3.7763885226521857e-07, 'epoch': 1.83} {'loss': 0.5767, 'learning_rate': 3.775497470307865e-07, 'epoch': 1.83} {'loss': 0.4648, 'learning_rate': 3.7746065210767623e-07, 'epoch': 1.83} {'loss': 0.5131, 'learning_rate': 3.773715674959877e-07, 'epoch': 1.83} {'loss': 0.5999, 'learning_rate': 3.77282493195813e-07, 'epoch': 1.83} {'loss': 0.4434, 'learning_rate': 3.771934292072488e-07, 'epoch': 1.83} {'loss': 0.5076, 'learning_rate': 3.7710437553038937e-07, 'epoch': 1.83} {'loss': 0.3796, 'learning_rate': 3.770153321653325e-07, 'epoch': 1.83} {'loss': 0.4629, 'learning_rate': 3.7692629911217246e-07, 'epoch': 1.83} {'loss': 0.4722, 'learning_rate': 3.7683727637100265e-07, 'epoch': 1.83} {'loss': 0.3984, 'learning_rate': 3.7674826394192174e-07, 'epoch': 1.83} {'loss': 0.524, 'learning_rate': 3.766592618250231e-07, 'epoch': 1.83} {'loss': 0.4881, 'learning_rate': 3.7657027002040213e-07, 'epoch': 1.83} {'loss': 0.4593, 'learning_rate': 3.764812885281555e-07, 'epoch': 1.83} {'loss': 0.368, 'learning_rate': 3.7639231734837744e-07, 'epoch': 1.83} {'loss': 0.7373, 'learning_rate': 3.763033564811647e-07, 'epoch': 1.83} {'loss': 0.4115, 'learning_rate': 3.762144059266093e-07, 'epoch': 1.83} {'loss': 0.6241, 'learning_rate': 3.7612546568481013e-07, 'epoch': 1.83} {'loss': 0.4381, 'learning_rate': 3.760365357558615e-07, 'epoch': 1.83} {'loss': 0.4453, 'learning_rate': 3.7594761613985674e-07, 'epoch': 1.83} {'loss': 0.5079, 'learning_rate': 3.7585870683689354e-07, 'epoch': 1.83} {'loss': 0.4985, 'learning_rate': 3.757698078470673e-07, 'epoch': 1.83} {'loss': 0.5079, 'learning_rate': 3.7568091917047246e-07, 'epoch': 1.83} {'loss': 0.4823, 'learning_rate': 3.7559204080720115e-07, 'epoch': 1.83} {'loss': 0.4959, 'learning_rate': 3.7550317275735546e-07, 'epoch': 1.83} {'loss': 0.5663, 'learning_rate': 3.7541431502102434e-07, 'epoch': 1.83} {'loss': 0.5378, 'learning_rate': 3.7532546759830647e-07, 'epoch': 1.83} {'loss': 0.4806, 'learning_rate': 3.752366304892974e-07, 'epoch': 1.83} {'loss': 0.6456, 'learning_rate': 3.75147803694087e-07, 'epoch': 1.83} {'loss': 0.5792, 'learning_rate': 3.7505898721277854e-07, 'epoch': 1.83} {'loss': 0.5456, 'learning_rate': 3.749701810454609e-07, 'epoch': 1.83} {'loss': 0.4415, 'learning_rate': 3.748813851922317e-07, 'epoch': 1.83} {'loss': 0.4763, 'learning_rate': 3.7479259965318537e-07, 'epoch': 1.83} {'loss': 0.5476, 'learning_rate': 3.7470382442841845e-07, 'epoch': 1.83} {'loss': 0.4445, 'learning_rate': 3.7461505951802536e-07, 'epoch': 1.83} {'loss': 0.3573, 'learning_rate': 3.745263049220993e-07, 'epoch': 1.83} {'loss': 0.3592, 'learning_rate': 3.7443756064073913e-07, 'epoch': 1.83} {'loss': 0.5484, 'learning_rate': 3.7434882667403694e-07, 'epoch': 1.83} {'loss': 0.4015, 'learning_rate': 3.7426010302208826e-07, 'epoch': 1.83} {'loss': 0.5254, 'learning_rate': 3.741713896849886e-07, 'epoch': 1.83} {'loss': 0.5672, 'learning_rate': 3.7408268666283444e-07, 'epoch': 1.83} {'loss': 0.3779, 'learning_rate': 3.7399399395571914e-07, 'epoch': 1.83} {'loss': 0.5445, 'learning_rate': 3.7390531156373587e-07, 'epoch': 1.83} {'loss': 0.6195, 'learning_rate': 3.7381663948698463e-07, 'epoch': 1.83} {'loss': 0.5618, 'learning_rate': 3.737279777255565e-07, 'epoch': 1.83} {'loss': 0.4949, 'learning_rate': 3.736393262795479e-07, 'epoch': 1.83} {'loss': 0.5867, 'learning_rate': 3.7355068514905334e-07, 'epoch': 1.83} {'loss': 0.5219, 'learning_rate': 3.7346205433416826e-07, 'epoch': 1.83} {'loss': 0.5018, 'learning_rate': 3.7337343383498817e-07, 'epoch': 1.83} {'loss': 0.5265, 'learning_rate': 3.7328482365160624e-07, 'epoch': 1.83} {'loss': 0.6258, 'learning_rate': 3.7319622378411803e-07, 'epoch': 1.83} {'loss': 0.5981, 'learning_rate': 3.731076342326201e-07, 'epoch': 1.83} {'loss': 0.5193, 'learning_rate': 3.730190549972057e-07, 'epoch': 1.83} {'loss': 0.5903, 'learning_rate': 3.7293048607797034e-07, 'epoch': 1.83} {'loss': 0.5405, 'learning_rate': 3.7284192747500835e-07, 'epoch': 1.83} {'loss': 0.5047, 'learning_rate': 3.7275337918841637e-07, 'epoch': 1.83} {'loss': 0.4884, 'learning_rate': 3.7266484121828763e-07, 'epoch': 1.83} {'loss': 0.4967, 'learning_rate': 3.725763135647165e-07, 'epoch': 1.83} {'loss': 0.4111, 'learning_rate': 3.7248779622779953e-07, 'epoch': 1.83} {'loss': 0.313, 'learning_rate': 3.7239928920763e-07, 'epoch': 1.83} {'loss': 0.6655, 'learning_rate': 3.7231079250430456e-07, 'epoch': 1.83} {'loss': 0.4657, 'learning_rate': 3.7222230611791756e-07, 'epoch': 1.83} {'loss': 0.5655, 'learning_rate': 3.721338300485622e-07, 'epoch': 1.83} {'loss': 0.4586, 'learning_rate': 3.720453642963351e-07, 'epoch': 1.83} {'loss': 0.4605, 'learning_rate': 3.719569088613295e-07, 'epoch': 1.83} {'loss': 0.6526, 'learning_rate': 3.7186846374364203e-07, 'epoch': 1.83} {'loss': 0.4364, 'learning_rate': 3.7178002894336596e-07, 'epoch': 1.83} {'loss': 0.5827, 'learning_rate': 3.716916044605956e-07, 'epoch': 1.83} {'loss': 0.5183, 'learning_rate': 3.716031902954287e-07, 'epoch': 1.83} {'loss': 0.4624, 'learning_rate': 3.7151478644795736e-07, 'epoch': 1.83} {'loss': 0.3926, 'learning_rate': 3.7142639291827596e-07, 'epoch': 1.83} {'loss': 0.5261, 'learning_rate': 3.7133800970648114e-07, 'epoch': 1.83} {'loss': 0.5273, 'learning_rate': 3.712496368126661e-07, 'epoch': 1.83} {'loss': 0.5389, 'learning_rate': 3.711612742369264e-07, 'epoch': 1.83} {'loss': 0.4334, 'learning_rate': 3.710729219793563e-07, 'epoch': 1.83} {'loss': 0.5003, 'learning_rate': 3.709845800400524e-07, 'epoch': 1.83} {'loss': 0.4948, 'learning_rate': 3.708962484191059e-07, 'epoch': 1.83} {'loss': 0.4482, 'learning_rate': 3.7080792711661316e-07, 'epoch': 1.83} {'loss': 0.6472, 'learning_rate': 3.707196161326687e-07, 'epoch': 1.83} {'loss': 0.6241, 'learning_rate': 3.706313154673669e-07, 'epoch': 1.83} {'loss': 0.5634, 'learning_rate': 3.705430251208042e-07, 'epoch': 1.83} {'loss': 0.5364, 'learning_rate': 3.7045474509307176e-07, 'epoch': 1.83} {'loss': 0.3977, 'learning_rate': 3.703664753842684e-07, 'epoch': 1.83} {'loss': 0.4301, 'learning_rate': 3.702782159944851e-07, 'epoch': 1.83} {'loss': 0.5262, 'learning_rate': 3.701899669238185e-07, 'epoch': 1.83} {'loss': 0.4608, 'learning_rate': 3.7010172817236176e-07, 'epoch': 1.83} {'loss': 0.4713, 'learning_rate': 3.700134997402105e-07, 'epoch': 1.83} {'loss': 0.5068, 'learning_rate': 3.699252816274601e-07, 'epoch': 1.83} {'loss': 0.5797, 'learning_rate': 3.698370738342016e-07, 'epoch': 1.83} {'loss': 0.567, 'learning_rate': 3.697488763605339e-07, 'epoch': 1.83} {'loss': 0.6198, 'learning_rate': 3.696606892065491e-07, 'epoch': 1.83} {'loss': 0.4119, 'learning_rate': 3.695725123723415e-07, 'epoch': 1.83} {'loss': 0.5604, 'learning_rate': 3.694843458580055e-07, 'epoch': 1.83} {'loss': 0.4999, 'learning_rate': 3.6939618966363666e-07, 'epoch': 1.83} {'loss': 0.3905, 'learning_rate': 3.693080437893304e-07, 'epoch': 1.83} {'loss': 0.5288, 'learning_rate': 3.6921990823517886e-07, 'epoch': 1.83} {'loss': 0.6778, 'learning_rate': 3.691317830012775e-07, 'epoch': 1.83} {'loss': 0.3928, 'learning_rate': 3.690436680877196e-07, 'epoch': 1.83} {'loss': 0.5468, 'learning_rate': 3.689555634946018e-07, 'epoch': 1.83} {'loss': 0.6706, 'learning_rate': 3.688674692220184e-07, 'epoch': 1.83} {'loss': 0.3875, 'learning_rate': 3.687793852700594e-07, 'epoch': 1.83} {'loss': 0.3841, 'learning_rate': 3.686913116388258e-07, 'epoch': 1.83} {'loss': 0.511, 'learning_rate': 3.686032483284074e-07, 'epoch': 1.83} {'loss': 0.6159, 'learning_rate': 3.685151953388999e-07, 'epoch': 1.83} {'loss': 0.5782, 'learning_rate': 3.6842715267039864e-07, 'epoch': 1.83} {'loss': 0.5427, 'learning_rate': 3.683391203229958e-07, 'epoch': 1.83} {'loss': 0.524, 'learning_rate': 3.6825109829678795e-07, 'epoch': 1.83} {'loss': 0.4699, 'learning_rate': 3.681630865918662e-07, 'epoch': 1.83} {'loss': 0.535, 'learning_rate': 3.6807508520833036e-07, 'epoch': 1.83} {'loss': 0.5664, 'learning_rate': 3.679870941462693e-07, 'epoch': 1.83} {'loss': 0.5285, 'learning_rate': 3.678991134057797e-07, 'epoch': 1.83} {'loss': 0.54, 'learning_rate': 3.6781114298695466e-07, 'epoch': 1.83} {'loss': 0.5336, 'learning_rate': 3.677231828898908e-07, 'epoch': 1.83} {'loss': 0.4753, 'learning_rate': 3.676352331146804e-07, 'epoch': 1.83} {'loss': 0.3264, 'learning_rate': 3.675472936614177e-07, 'epoch': 1.83} {'loss': 0.521, 'learning_rate': 3.6745936453019827e-07, 'epoch': 1.83} {'loss': 0.4796, 'learning_rate': 3.673714457211153e-07, 'epoch': 1.83} {'loss': 0.5211, 'learning_rate': 3.672835372342631e-07, 'epoch': 1.83} {'loss': 0.6554, 'learning_rate': 3.671956390697373e-07, 'epoch': 1.83} {'loss': 0.5152, 'learning_rate': 3.671077512276278e-07, 'epoch': 1.83} {'loss': 0.4364, 'learning_rate': 3.670198737080344e-07, 'epoch': 1.83} {'loss': 0.509, 'learning_rate': 3.66932006511046e-07, 'epoch': 1.83} {'loss': 0.5135, 'learning_rate': 3.668441496367625e-07, 'epoch': 1.83} {'loss': 0.4874, 'learning_rate': 3.667563030852739e-07, 'epoch': 1.83} {'loss': 0.3632, 'learning_rate': 3.6666846685667444e-07, 'epoch': 1.83} {'loss': 0.4115, 'learning_rate': 3.665806409510608e-07, 'epoch': 1.83} {'loss': 0.3624, 'learning_rate': 3.6649282536852294e-07, 'epoch': 1.83} {'loss': 0.6125, 'learning_rate': 3.6640502010915957e-07, 'epoch': 1.83} {'loss': 0.3985, 'learning_rate': 3.663172251730618e-07, 'epoch': 1.83} {'loss': 0.4254, 'learning_rate': 3.6622944056032505e-07, 'epoch': 1.83} {'loss': 0.6573, 'learning_rate': 3.6614166627104263e-07, 'epoch': 1.83} {'loss': 0.335, 'learning_rate': 3.660539023053089e-07, 'epoch': 1.83} {'loss': 0.5569, 'learning_rate': 3.659661486632193e-07, 'epoch': 1.83} {'loss': 0.4061, 'learning_rate': 3.6587840534486494e-07, 'epoch': 1.83} {'loss': 0.5133, 'learning_rate': 3.6579067235034235e-07, 'epoch': 1.83} {'loss': 0.4549, 'learning_rate': 3.657029496797426e-07, 'epoch': 1.83} {'loss': 0.4925, 'learning_rate': 3.656152373331645e-07, 'epoch': 1.83} {'loss': 0.6021, 'learning_rate': 3.6552753531069795e-07, 'epoch': 1.83} {'loss': 0.5719, 'learning_rate': 3.6543984361243736e-07, 'epoch': 1.83} {'loss': 0.5081, 'learning_rate': 3.6535216223847925e-07, 'epoch': 1.83} {'loss': 0.4576, 'learning_rate': 3.652644911889136e-07, 'epoch': 1.83} {'loss': 0.5432, 'learning_rate': 3.6517683046383925e-07, 'epoch': 1.83} {'loss': 0.5581, 'learning_rate': 3.650891800633449e-07, 'epoch': 1.83} {'loss': 0.4444, 'learning_rate': 3.6500153998752953e-07, 'epoch': 1.83} {'loss': 0.4468, 'learning_rate': 3.6491391023648403e-07, 'epoch': 1.83} {'loss': 0.5031, 'learning_rate': 3.6482629081030174e-07, 'epoch': 1.83} {'loss': 0.4833, 'learning_rate': 3.6473868170907923e-07, 'epoch': 1.83} {'loss': 0.5038, 'learning_rate': 3.646510829329064e-07, 'epoch': 1.83} {'loss': 0.4696, 'learning_rate': 3.6456349448188324e-07, 'epoch': 1.83} {'loss': 0.4874, 'learning_rate': 3.6447591635609736e-07, 'epoch': 1.83} {'loss': 0.4374, 'learning_rate': 3.6438834855564545e-07, 'epoch': 1.83} {'loss': 0.4801, 'learning_rate': 3.6430079108062177e-07, 'epoch': 1.83} {'loss': 0.4212, 'learning_rate': 3.6421324393111856e-07, 'epoch': 1.83} {'loss': 0.5809, 'learning_rate': 3.6412570710723237e-07, 'epoch': 1.83} {'loss': 0.6031, 'learning_rate': 3.6403818060905204e-07, 'epoch': 1.83} {'loss': 0.4293, 'learning_rate': 3.6395066443667746e-07, 'epoch': 1.83} {'loss': 0.511, 'learning_rate': 3.6386315859019863e-07, 'epoch': 1.83} {'loss': 0.3353, 'learning_rate': 3.637756630697098e-07, 'epoch': 1.83} {'loss': 0.3736, 'learning_rate': 3.636881778753043e-07, 'epoch': 1.83} {'loss': 0.5385, 'learning_rate': 3.636007030070776e-07, 'epoch': 1.83} {'loss': 0.4448, 'learning_rate': 3.63513238465123e-07, 'epoch': 1.83} {'loss': 0.5038, 'learning_rate': 3.6342578424953143e-07, 'epoch': 1.83} {'loss': 0.6888, 'learning_rate': 3.633383403604018e-07, 'epoch': 1.83} {'loss': 0.6862, 'learning_rate': 3.6325090679782407e-07, 'epoch': 1.83} {'loss': 0.4867, 'learning_rate': 3.6316348356189134e-07, 'epoch': 1.83} {'loss': 0.404, 'learning_rate': 3.630760706527003e-07, 'epoch': 1.83} {'loss': 0.4884, 'learning_rate': 3.6298866807034205e-07, 'epoch': 1.83} {'loss': 0.492, 'learning_rate': 3.6290127581491194e-07, 'epoch': 1.83} {'loss': 0.535, 'learning_rate': 3.6281389388650335e-07, 'epoch': 1.83} {'loss': 0.6768, 'learning_rate': 3.6272652228520833e-07, 'epoch': 1.83} {'loss': 0.5198, 'learning_rate': 3.626391610111213e-07, 'epoch': 1.83} {'loss': 0.4706, 'learning_rate': 3.625518100643377e-07, 'epoch': 1.83} {'loss': 0.6405, 'learning_rate': 3.624644694449486e-07, 'epoch': 1.83} {'loss': 0.604, 'learning_rate': 3.623771391530484e-07, 'epoch': 1.83} {'loss': 0.5133, 'learning_rate': 3.622898191887325e-07, 'epoch': 1.83} {'loss': 0.5994, 'learning_rate': 3.62202509552092e-07, 'epoch': 1.83} {'loss': 0.4613, 'learning_rate': 3.621152102432213e-07, 'epoch': 1.83} {'loss': 0.3985, 'learning_rate': 3.6202792126221355e-07, 'epoch': 1.83} {'loss': 0.3617, 'learning_rate': 3.619406426091632e-07, 'epoch': 1.83} {'loss': 0.4633, 'learning_rate': 3.6185337428416456e-07, 'epoch': 1.83} {'loss': 0.5083, 'learning_rate': 3.6176611628730763e-07, 'epoch': 1.83} {'loss': 0.6709, 'learning_rate': 3.6167886861869003e-07, 'epoch': 1.83} {'loss': 0.6262, 'learning_rate': 3.6159163127840293e-07, 'epoch': 1.83} {'loss': 0.4195, 'learning_rate': 3.6150440426654056e-07, 'epoch': 1.83} {'loss': 0.4157, 'learning_rate': 3.6141718758319513e-07, 'epoch': 1.83} {'loss': 0.5326, 'learning_rate': 3.613299812284621e-07, 'epoch': 1.83} {'loss': 0.6208, 'learning_rate': 3.612427852024336e-07, 'epoch': 1.83} {'loss': 0.5643, 'learning_rate': 3.611555995052041e-07, 'epoch': 1.83} {'loss': 0.4758, 'learning_rate': 3.610684241368656e-07, 'epoch': 1.83} {'loss': 0.4941, 'learning_rate': 3.6098125909751145e-07, 'epoch': 1.83} {'loss': 0.4391, 'learning_rate': 3.6089410438723716e-07, 'epoch': 1.83} {'loss': 0.493, 'learning_rate': 3.608069600061337e-07, 'epoch': 1.83} {'loss': 0.553, 'learning_rate': 3.6071982595429656e-07, 'epoch': 1.83} {'loss': 0.4973, 'learning_rate': 3.606327022318179e-07, 'epoch': 1.83} {'loss': 0.5754, 'learning_rate': 3.605455888387921e-07, 'epoch': 1.83} {'loss': 0.5148, 'learning_rate': 3.6045848577531016e-07, 'epoch': 1.83} {'loss': 0.4662, 'learning_rate': 3.603713930414676e-07, 'epoch': 1.83} {'loss': 0.3612, 'learning_rate': 3.6028431063735657e-07, 'epoch': 1.83} {'loss': 0.4455, 'learning_rate': 3.6019723856307145e-07, 'epoch': 1.83} {'loss': 0.4889, 'learning_rate': 3.6011017681870543e-07, 'epoch': 1.83} {'loss': 0.5388, 'learning_rate': 3.600231254043518e-07, 'epoch': 1.83} {'loss': 0.4476, 'learning_rate': 3.5993608432010277e-07, 'epoch': 1.83} {'loss': 0.5413, 'learning_rate': 3.5984905356605146e-07, 'epoch': 1.83} {'loss': 0.4301, 'learning_rate': 3.5976203314229354e-07, 'epoch': 1.83} {'loss': 0.4695, 'learning_rate': 3.5967502304891875e-07, 'epoch': 1.83} {'loss': 0.4105, 'learning_rate': 3.5958802328602384e-07, 'epoch': 1.83} {'loss': 0.4602, 'learning_rate': 3.5950103385370084e-07, 'epoch': 1.83} {'loss': 0.4597, 'learning_rate': 3.5941405475204196e-07, 'epoch': 1.83} {'loss': 0.6082, 'learning_rate': 3.5932708598114043e-07, 'epoch': 1.83} {'loss': 0.4717, 'learning_rate': 3.592401275410906e-07, 'epoch': 1.83} {'loss': 0.6636, 'learning_rate': 3.591531794319847e-07, 'epoch': 1.83} {'loss': 0.5285, 'learning_rate': 3.5906624165391703e-07, 'epoch': 1.83} {'loss': 0.5294, 'learning_rate': 3.5897931420697864e-07, 'epoch': 1.83} {'loss': 0.6348, 'learning_rate': 3.588923970912661e-07, 'epoch': 1.83} {'loss': 0.5727, 'learning_rate': 3.588054903068694e-07, 'epoch': 1.83} {'loss': 0.4205, 'learning_rate': 3.5871859385388285e-07, 'epoch': 1.83} {'loss': 0.4824, 'learning_rate': 3.5863170773239977e-07, 'epoch': 1.83} {'loss': 0.5124, 'learning_rate': 3.5854483194251223e-07, 'epoch': 1.83} {'loss': 0.5016, 'learning_rate': 3.584579664843146e-07, 'epoch': 1.83} {'loss': 0.4565, 'learning_rate': 3.5837111135789917e-07, 'epoch': 1.83} {'loss': 0.5297, 'learning_rate': 3.5828426656336015e-07, 'epoch': 1.83} {'loss': 0.5206, 'learning_rate': 3.5819743210078974e-07, 'epoch': 1.83} {'loss': 0.5274, 'learning_rate': 3.5811060797028005e-07, 'epoch': 1.83} {'loss': 0.6973, 'learning_rate': 3.580237941719256e-07, 'epoch': 1.83} {'loss': 0.4863, 'learning_rate': 3.5793699070581834e-07, 'epoch': 1.83} {'loss': 0.639, 'learning_rate': 3.578501975720539e-07, 'epoch': 1.83} {'loss': 0.5838, 'learning_rate': 3.577634147707199e-07, 'epoch': 1.83} {'loss': 0.4693, 'learning_rate': 3.576766423019151e-07, 'epoch': 1.83} {'loss': 0.4714, 'learning_rate': 3.575898801657296e-07, 'epoch': 1.83} {'loss': 0.4856, 'learning_rate': 3.5750312836225655e-07, 'epoch': 1.83} {'loss': 0.4964, 'learning_rate': 3.574163868915892e-07, 'epoch': 1.83} {'loss': 0.4195, 'learning_rate': 3.5732965575381973e-07, 'epoch': 1.83} {'loss': 0.5407, 'learning_rate': 3.572429349490436e-07, 'epoch': 1.83} {'loss': 0.4172, 'learning_rate': 3.5715622447734967e-07, 'epoch': 1.83} {'loss': 0.4133, 'learning_rate': 3.5706952433883555e-07, 'epoch': 1.83} {'loss': 0.4799, 'learning_rate': 3.569828345335913e-07, 'epoch': 1.83} {'loss': 0.391, 'learning_rate': 3.5689615506170895e-07, 'epoch': 1.83} {'loss': 0.5252, 'learning_rate': 3.5680948592328514e-07, 'epoch': 1.83} {'loss': 0.4338, 'learning_rate': 3.5672282711840644e-07, 'epoch': 1.83} {'loss': 0.4006, 'learning_rate': 3.566361786471728e-07, 'epoch': 1.83} {'loss': 0.6733, 'learning_rate': 3.565495405096719e-07, 'epoch': 1.83} {'loss': 0.6899, 'learning_rate': 3.564629127060004e-07, 'epoch': 1.83} {'loss': 0.4633, 'learning_rate': 3.5637629523624816e-07, 'epoch': 1.83} {'loss': 0.5111, 'learning_rate': 3.5628968810050957e-07, 'epoch': 1.83} {'loss': 0.4296, 'learning_rate': 3.5620309129887787e-07, 'epoch': 1.83} {'loss': 0.5812, 'learning_rate': 3.561165048314419e-07, 'epoch': 1.83} {'loss': 0.4165, 'learning_rate': 3.560299286983004e-07, 'epoch': 1.83} {'loss': 0.5456, 'learning_rate': 3.5594336289954234e-07, 'epoch': 1.83} {'loss': 0.5872, 'learning_rate': 3.5585680743526087e-07, 'epoch': 1.83} {'loss': 0.4584, 'learning_rate': 3.557702623055503e-07, 'epoch': 1.83} {'loss': 0.496, 'learning_rate': 3.556837275105018e-07, 'epoch': 1.83} {'loss': 0.6063, 'learning_rate': 3.5559720305020973e-07, 'epoch': 1.83} {'loss': 0.489, 'learning_rate': 3.555106889247628e-07, 'epoch': 1.83} {'loss': 0.4199, 'learning_rate': 3.5542418513425994e-07, 'epoch': 1.83} {'loss': 0.5757, 'learning_rate': 3.5533769167878874e-07, 'epoch': 1.83} {'loss': 0.3988, 'learning_rate': 3.5525120855844363e-07, 'epoch': 1.83} {'loss': 0.553, 'learning_rate': 3.551647357733179e-07, 'epoch': 1.83} {'loss': 0.6469, 'learning_rate': 3.5507827332350254e-07, 'epoch': 1.83} {'loss': 0.5068, 'learning_rate': 3.54991821209093e-07, 'epoch': 1.83} {'loss': 0.6115, 'learning_rate': 3.5490537943017824e-07, 'epoch': 1.83} {'loss': 0.6111, 'learning_rate': 3.548189479868558e-07, 'epoch': 1.83} {'loss': 0.4283, 'learning_rate': 3.5473252687921343e-07, 'epoch': 1.83} {'loss': 0.6163, 'learning_rate': 3.5464611610734555e-07, 'epoch': 1.83} {'loss': 0.5114, 'learning_rate': 3.545597156713465e-07, 'epoch': 1.83} {'loss': 0.5598, 'learning_rate': 3.544733255713051e-07, 'epoch': 1.83} {'loss': 0.5329, 'learning_rate': 3.543869458073179e-07, 'epoch': 1.83} {'loss': 0.5807, 'learning_rate': 3.543005763794738e-07, 'epoch': 1.83} {'loss': 0.4964, 'learning_rate': 3.542142172878693e-07, 'epoch': 1.83} {'loss': 0.408, 'learning_rate': 3.541278685325933e-07, 'epoch': 1.83} {'loss': 0.4538, 'learning_rate': 3.540415301137401e-07, 'epoch': 1.83} {'loss': 0.5803, 'learning_rate': 3.53955202031403e-07, 'epoch': 1.83} {'loss': 0.3779, 'learning_rate': 3.538688842856719e-07, 'epoch': 1.83} {'loss': 0.449, 'learning_rate': 3.5378257687664343e-07, 'epoch': 1.83} {'loss': 0.5098, 'learning_rate': 3.536962798044041e-07, 'epoch': 1.83} {'loss': 0.49, 'learning_rate': 3.5360999306905285e-07, 'epoch': 1.83} {'loss': 0.5927, 'learning_rate': 3.535237166706773e-07, 'epoch': 1.83} {'loss': 0.5095, 'learning_rate': 3.5343745060937295e-07, 'epoch': 1.83} {'loss': 0.4917, 'learning_rate': 3.5335119488523087e-07, 'epoch': 1.83} {'loss': 0.5228, 'learning_rate': 3.53264949498342e-07, 'epoch': 1.83} {'loss': 0.4862, 'learning_rate': 3.5317871444880304e-07, 'epoch': 1.83} {'loss': 0.5003, 'learning_rate': 3.530924897367005e-07, 'epoch': 1.83} {'loss': 0.6845, 'learning_rate': 3.5300627536213326e-07, 'epoch': 1.83} {'loss': 0.6304, 'learning_rate': 3.5292007132518903e-07, 'epoch': 1.83} {'loss': 0.4383, 'learning_rate': 3.528338776259621e-07, 'epoch': 1.83} {'loss': 0.6599, 'learning_rate': 3.5274769426454467e-07, 'epoch': 1.83} {'loss': 0.5515, 'learning_rate': 3.526615212410267e-07, 'epoch': 1.83} {'loss': 0.505, 'learning_rate': 3.5257535855550585e-07, 'epoch': 1.83} {'loss': 0.488, 'learning_rate': 3.524892062080676e-07, 'epoch': 1.83} {'loss': 0.5013, 'learning_rate': 3.5240306419881076e-07, 'epoch': 1.83} {'loss': 0.4826, 'learning_rate': 3.523169325278242e-07, 'epoch': 1.83} {'loss': 0.3, 'learning_rate': 3.5223081119519996e-07, 'epoch': 1.83} {'loss': 0.6685, 'learning_rate': 3.5214470020103255e-07, 'epoch': 1.83} {'loss': 0.559, 'learning_rate': 3.5205859954541065e-07, 'epoch': 1.83} {'loss': 0.6194, 'learning_rate': 3.5197250922843207e-07, 'epoch': 1.83} {'loss': 0.541, 'learning_rate': 3.5188642925018333e-07, 'epoch': 1.83} {'loss': 0.6691, 'learning_rate': 3.5180035961075887e-07, 'epoch': 1.83} {'loss': 0.5237, 'learning_rate': 3.517143003102519e-07, 'epoch': 1.83} {'loss': 0.4382, 'learning_rate': 3.5162825134875347e-07, 'epoch': 1.83} {'loss': 0.5005, 'learning_rate': 3.515422127263579e-07, 'epoch': 1.83} {'loss': 0.6456, 'learning_rate': 3.51456184443153e-07, 'epoch': 1.83} {'loss': 0.5451, 'learning_rate': 3.5137016649923526e-07, 'epoch': 1.83} {'loss': 0.4912, 'learning_rate': 3.512841588946947e-07, 'epoch': 1.83} {'loss': 0.5069, 'learning_rate': 3.511981616296245e-07, 'epoch': 1.83} {'loss': 0.4969, 'learning_rate': 3.5111217470411575e-07, 'epoch': 1.83} {'loss': 0.489, 'learning_rate': 3.5102619811826053e-07, 'epoch': 1.83} {'loss': 0.4848, 'learning_rate': 3.5094023187215333e-07, 'epoch': 1.83} {'loss': 0.5818, 'learning_rate': 3.5085427596588283e-07, 'epoch': 1.83} {'loss': 0.5116, 'learning_rate': 3.5076833039954463e-07, 'epoch': 1.83} {'loss': 0.4764, 'learning_rate': 3.5068239517322853e-07, 'epoch': 1.83} {'loss': 0.4015, 'learning_rate': 3.505964702870257e-07, 'epoch': 1.83} {'loss': 0.6998, 'learning_rate': 3.505105557410315e-07, 'epoch': 1.83} {'loss': 0.5392, 'learning_rate': 3.504246515353349e-07, 'epoch': 1.83} {'loss': 0.5747, 'learning_rate': 3.503387576700312e-07, 'epoch': 1.83} {'loss': 0.4361, 'learning_rate': 3.5025287414520823e-07, 'epoch': 1.83} {'loss': 0.6125, 'learning_rate': 3.5016700096096146e-07, 'epoch': 1.83} {'loss': 0.5328, 'learning_rate': 3.5008113811738073e-07, 'epoch': 1.83} {'loss': 0.5639, 'learning_rate': 3.4999528561455944e-07, 'epoch': 1.83} {'loss': 0.4916, 'learning_rate': 3.499094434525885e-07, 'epoch': 1.83} {'loss': 0.4768, 'learning_rate': 3.498236116315612e-07, 'epoch': 1.83} {'loss': 0.489, 'learning_rate': 3.497377901515708e-07, 'epoch': 1.83} {'loss': 0.5394, 'learning_rate': 3.496519790127051e-07, 'epoch': 1.83} {'loss': 0.5385, 'learning_rate': 3.4956617821505836e-07, 'epoch': 1.83} {'loss': 0.4263, 'learning_rate': 3.494803877587227e-07, 'epoch': 1.83} {'loss': 0.2765, 'learning_rate': 3.493946076437904e-07, 'epoch': 1.83} {'loss': 0.5479, 'learning_rate': 3.493088378703513e-07, 'epoch': 1.83} {'loss': 0.5669, 'learning_rate': 3.492230784385009e-07, 'epoch': 1.83} {'loss': 0.5506, 'learning_rate': 3.49137329348328e-07, 'epoch': 1.83} {'loss': 0.5765, 'learning_rate': 3.4905159059992587e-07, 'epoch': 1.83} {'loss': 0.5455, 'learning_rate': 3.4896586219338557e-07, 'epoch': 1.83} {'loss': 0.3538, 'learning_rate': 3.488801441287992e-07, 'epoch': 1.83} {'loss': 0.4886, 'learning_rate': 3.48794436406259e-07, 'epoch': 1.83} {'loss': 0.4741, 'learning_rate': 3.487087390258559e-07, 'epoch': 1.83} {'loss': 0.6097, 'learning_rate': 3.486230519876843e-07, 'epoch': 1.83} {'loss': 0.389, 'learning_rate': 3.4853737529183306e-07, 'epoch': 1.83} {'loss': 0.5065, 'learning_rate': 3.4845170893839543e-07, 'epoch': 1.83} {'loss': 0.4602, 'learning_rate': 3.483660529274624e-07, 'epoch': 1.83} {'loss': 0.5142, 'learning_rate': 3.4828040725912616e-07, 'epoch': 1.83} {'loss': 0.3843, 'learning_rate': 3.4819477193347885e-07, 'epoch': 1.83} {'loss': 0.526, 'learning_rate': 3.4810914695061373e-07, 'epoch': 1.83} {'loss': 0.4028, 'learning_rate': 3.480235323106185e-07, 'epoch': 1.83} {'loss': 0.5963, 'learning_rate': 3.479379280135886e-07, 'epoch': 1.83} {'loss': 0.3966, 'learning_rate': 3.4785233405961294e-07, 'epoch': 1.83} {'loss': 0.6155, 'learning_rate': 3.477667504487858e-07, 'epoch': 1.83} {'loss': 0.6143, 'learning_rate': 3.476811771811972e-07, 'epoch': 1.83} {'loss': 0.6315, 'learning_rate': 3.4759561425694034e-07, 'epoch': 1.83} {'loss': 0.5186, 'learning_rate': 3.475100616761051e-07, 'epoch': 1.83} {'loss': 0.4527, 'learning_rate': 3.4742451943878377e-07, 'epoch': 1.83} {'loss': 0.6166, 'learning_rate': 3.4733898754506837e-07, 'epoch': 1.83} {'loss': 0.4711, 'learning_rate': 3.4725346599504995e-07, 'epoch': 1.83} {'loss': 0.4281, 'learning_rate': 3.471679547888218e-07, 'epoch': 1.83} {'loss': 0.5657, 'learning_rate': 3.470824539264739e-07, 'epoch': 1.83} {'loss': 0.4919, 'learning_rate': 3.4699696340809943e-07, 'epoch': 1.83} {'loss': 0.673, 'learning_rate': 3.469114832337872e-07, 'epoch': 1.83} {'loss': 0.3725, 'learning_rate': 3.4682601340363167e-07, 'epoch': 1.83} {'loss': 0.4856, 'learning_rate': 3.4674055391772265e-07, 'epoch': 1.83} {'loss': 0.5214, 'learning_rate': 3.4665510477615237e-07, 'epoch': 1.83} {'loss': 0.6136, 'learning_rate': 3.46569665979013e-07, 'epoch': 1.83} {'loss': 0.6297, 'learning_rate': 3.464842375263955e-07, 'epoch': 1.83} {'loss': 0.5856, 'learning_rate': 3.4639881941839207e-07, 'epoch': 1.83} {'loss': 0.5053, 'learning_rate': 3.463134116550926e-07, 'epoch': 1.83} {'loss': 0.4478, 'learning_rate': 3.4622801423658927e-07, 'epoch': 1.83} {'loss': 0.3735, 'learning_rate': 3.461426271629742e-07, 'epoch': 1.83} {'loss': 0.3896, 'learning_rate': 3.460572504343385e-07, 'epoch': 1.83} {'loss': 0.602, 'learning_rate': 3.459718840507753e-07, 'epoch': 1.83} {'loss': 0.6079, 'learning_rate': 3.4588652801237244e-07, 'epoch': 1.83} {'loss': 0.4591, 'learning_rate': 3.458011823192253e-07, 'epoch': 1.83} {'loss': 0.5233, 'learning_rate': 3.4571584697142166e-07, 'epoch': 1.83} {'loss': 0.457, 'learning_rate': 3.4563052196905587e-07, 'epoch': 1.83} {'loss': 0.5867, 'learning_rate': 3.455452073122179e-07, 'epoch': 1.83} {'loss': 0.4418, 'learning_rate': 3.4545990300099975e-07, 'epoch': 1.83} {'loss': 0.4052, 'learning_rate': 3.453746090354948e-07, 'epoch': 1.83} {'loss': 0.6176, 'learning_rate': 3.4528932541578855e-07, 'epoch': 1.83} {'loss': 0.366, 'learning_rate': 3.452040521419797e-07, 'epoch': 1.83} {'loss': 0.5424, 'learning_rate': 3.4511878921415387e-07, 'epoch': 1.83} {'loss': 0.4753, 'learning_rate': 3.4503353663240536e-07, 'epoch': 1.83} {'loss': 0.5373, 'learning_rate': 3.449482943968252e-07, 'epoch': 1.83} {'loss': 0.4341, 'learning_rate': 3.4486306250750336e-07, 'epoch': 1.83} {'loss': 0.5751, 'learning_rate': 3.4477784096453415e-07, 'epoch': 1.83} {'loss': 0.4252, 'learning_rate': 3.446926297680042e-07, 'epoch': 1.83} {'loss': 0.5689, 'learning_rate': 3.44607428918009e-07, 'epoch': 1.83} {'loss': 0.4332, 'learning_rate': 3.445222384146385e-07, 'epoch': 1.83} {'loss': 0.5251, 'learning_rate': 3.444370582579837e-07, 'epoch': 1.83} {'loss': 0.6612, 'learning_rate': 3.443518884481367e-07, 'epoch': 1.83} {'loss': 0.4827, 'learning_rate': 3.4426672898518644e-07, 'epoch': 1.83} {'loss': 0.3929, 'learning_rate': 3.441815798692283e-07, 'epoch': 1.83} {'loss': 0.4117, 'learning_rate': 3.440964411003478e-07, 'epoch': 1.83} {'loss': 0.5362, 'learning_rate': 3.4401131267864265e-07, 'epoch': 1.83} {'loss': 0.679, 'learning_rate': 3.439261946041994e-07, 'epoch': 1.83} {'loss': 0.5684, 'learning_rate': 3.4384108687711025e-07, 'epoch': 1.83} {'loss': 0.4153, 'learning_rate': 3.4375598949746844e-07, 'epoch': 1.83} {'loss': 0.3308, 'learning_rate': 3.436709024653617e-07, 'epoch': 1.83} {'loss': 0.3901, 'learning_rate': 3.435858257808855e-07, 'epoch': 1.83} {'loss': 0.5497, 'learning_rate': 3.435007594441253e-07, 'epoch': 1.83} {'loss': 0.6188, 'learning_rate': 3.4341570345517885e-07, 'epoch': 1.83} {'loss': 0.4644, 'learning_rate': 3.4333065781413264e-07, 'epoch': 1.83} {'loss': 0.4248, 'learning_rate': 3.4324562252107895e-07, 'epoch': 1.83} {'loss': 0.5879, 'learning_rate': 3.43160597576111e-07, 'epoch': 1.83} {'loss': 0.6169, 'learning_rate': 3.4307558297931534e-07, 'epoch': 1.83} {'loss': 0.508, 'learning_rate': 3.429905787307874e-07, 'epoch': 1.83} {'loss': 0.4875, 'learning_rate': 3.429055848306151e-07, 'epoch': 1.83} {'loss': 0.5138, 'learning_rate': 3.428206012788937e-07, 'epoch': 1.83} {'loss': 0.4317, 'learning_rate': 3.427356280757099e-07, 'epoch': 1.83} {'loss': 0.4796, 'learning_rate': 3.4265066522115696e-07, 'epoch': 1.83} {'loss': 0.4132, 'learning_rate': 3.4256571271532593e-07, 'epoch': 1.83} {'loss': 0.5428, 'learning_rate': 3.4248077055830554e-07, 'epoch': 1.83} {'loss': 0.4778, 'learning_rate': 3.4239583875019023e-07, 'epoch': 1.83} {'loss': 0.7096, 'learning_rate': 3.423109172910699e-07, 'epoch': 1.83} {'loss': 0.6355, 'learning_rate': 3.422260061810334e-07, 'epoch': 1.83} {'loss': 0.5266, 'learning_rate': 3.42141105420174e-07, 'epoch': 1.83} {'loss': 0.5255, 'learning_rate': 3.420562150085827e-07, 'epoch': 1.83} {'loss': 0.4052, 'learning_rate': 3.419713349463505e-07, 'epoch': 1.83} {'loss': 0.5733, 'learning_rate': 3.418864652335652e-07, 'epoch': 1.83} {'loss': 0.4849, 'learning_rate': 3.4180160587032217e-07, 'epoch': 1.83} {'loss': 0.4923, 'learning_rate': 3.4171675685671036e-07, 'epoch': 1.83} {'loss': 0.6408, 'learning_rate': 3.416319181928196e-07, 'epoch': 1.83} {'loss': 0.4392, 'learning_rate': 3.415470898787432e-07, 'epoch': 1.83} {'loss': 0.4463, 'learning_rate': 3.414622719145699e-07, 'epoch': 1.83} {'loss': 0.6106, 'learning_rate': 3.413774643003931e-07, 'epoch': 1.83} {'loss': 0.3179, 'learning_rate': 3.4129266703629927e-07, 'epoch': 1.83} {'loss': 0.4337, 'learning_rate': 3.4120788012238505e-07, 'epoch': 1.83} {'loss': 0.5298, 'learning_rate': 3.4112310355873703e-07, 'epoch': 1.83} {'loss': 0.4805, 'learning_rate': 3.4103833734544734e-07, 'epoch': 1.83} {'loss': 0.5619, 'learning_rate': 3.4095358148260815e-07, 'epoch': 1.83} {'loss': 0.3335, 'learning_rate': 3.4086883597030606e-07, 'epoch': 1.83} {'loss': 0.4807, 'learning_rate': 3.4078410080863764e-07, 'epoch': 1.83} {'loss': 0.5387, 'learning_rate': 3.4069937599768843e-07, 'epoch': 1.83} {'loss': 0.5048, 'learning_rate': 3.4061466153755384e-07, 'epoch': 1.83} {'loss': 0.4647, 'learning_rate': 3.4052995742832163e-07, 'epoch': 1.83} {'loss': 0.368, 'learning_rate': 3.404452636700828e-07, 'epoch': 1.83} {'loss': 0.5188, 'learning_rate': 3.403605802629306e-07, 'epoch': 1.83} {'loss': 0.5757, 'learning_rate': 3.402759072069517e-07, 'epoch': 1.83} {'loss': 0.3816, 'learning_rate': 3.401912445022404e-07, 'epoch': 1.83} {'loss': 0.5385, 'learning_rate': 3.4010659214888554e-07, 'epoch': 1.83} {'loss': 0.4858, 'learning_rate': 3.4002195014697814e-07, 'epoch': 1.83} {'loss': 0.4042, 'learning_rate': 3.3993731849660814e-07, 'epoch': 1.83} {'loss': 0.4214, 'learning_rate': 3.3985269719786886e-07, 'epoch': 1.83} {'loss': 0.4002, 'learning_rate': 3.39768086250849e-07, 'epoch': 1.83} {'loss': 0.4203, 'learning_rate': 3.3968348565563857e-07, 'epoch': 1.83} {'loss': 0.4802, 'learning_rate': 3.3959889541233083e-07, 'epoch': 1.83} {'loss': 0.4441, 'learning_rate': 3.3951431552101344e-07, 'epoch': 1.83} {'loss': 0.5713, 'learning_rate': 3.3942974598177857e-07, 'epoch': 1.83} {'loss': 0.4331, 'learning_rate': 3.3934518679471615e-07, 'epoch': 1.83} {'loss': 0.6375, 'learning_rate': 3.3926063795991726e-07, 'epoch': 1.83} {'loss': 0.4711, 'learning_rate': 3.391760994774751e-07, 'epoch': 1.83} {'loss': 0.5371, 'learning_rate': 3.3909157134747407e-07, 'epoch': 1.83} {'loss': 0.3635, 'learning_rate': 3.3900705357001074e-07, 'epoch': 1.83} {'loss': 0.4459, 'learning_rate': 3.3892254614517286e-07, 'epoch': 1.83} {'loss': 0.7071, 'learning_rate': 3.388380490730514e-07, 'epoch': 1.83} {'loss': 0.2837, 'learning_rate': 3.3875356235373635e-07, 'epoch': 1.83} {'loss': 0.5387, 'learning_rate': 3.386690859873187e-07, 'epoch': 1.83} {'loss': 0.5483, 'learning_rate': 3.3858461997389067e-07, 'epoch': 1.83} {'loss': 0.4338, 'learning_rate': 3.385001643135399e-07, 'epoch': 1.83} {'loss': 0.5811, 'learning_rate': 3.384157190063586e-07, 'epoch': 1.83} {'loss': 0.4277, 'learning_rate': 3.3833128405243667e-07, 'epoch': 1.83} {'loss': 0.4255, 'learning_rate': 3.3824685945186507e-07, 'epoch': 1.83} {'loss': 0.5559, 'learning_rate': 3.381624452047327e-07, 'epoch': 1.83} {'loss': 0.5571, 'learning_rate': 3.380780413111329e-07, 'epoch': 1.83} {'loss': 0.5596, 'learning_rate': 3.379936477711554e-07, 'epoch': 1.83} {'loss': 0.4762, 'learning_rate': 3.37909264584888e-07, 'epoch': 1.83} {'loss': 0.4305, 'learning_rate': 3.3782489175242296e-07, 'epoch': 1.83} {'loss': 0.5679, 'learning_rate': 3.3774052927385117e-07, 'epoch': 1.83} {'loss': 0.6402, 'learning_rate': 3.3765617714926147e-07, 'epoch': 1.83} {'loss': 0.616, 'learning_rate': 3.3757183537874603e-07, 'epoch': 1.83} {'loss': 0.4937, 'learning_rate': 3.3748750396239485e-07, 'epoch': 1.83} {'loss': 0.3747, 'learning_rate': 3.374031829002977e-07, 'epoch': 1.83} {'loss': 0.5705, 'learning_rate': 3.3731887219254466e-07, 'epoch': 1.83} {'loss': 0.4128, 'learning_rate': 3.372345718392267e-07, 'epoch': 1.83} {'loss': 0.6561, 'learning_rate': 3.3715028184043486e-07, 'epoch': 1.83} {'loss': 0.5637, 'learning_rate': 3.3706600219625684e-07, 'epoch': 1.83} {'loss': 0.5384, 'learning_rate': 3.369817329067859e-07, 'epoch': 1.83} {'loss': 0.4813, 'learning_rate': 3.36897473972112e-07, 'epoch': 1.83} {'loss': 0.6101, 'learning_rate': 3.3681322539232396e-07, 'epoch': 1.83} {'loss': 0.4289, 'learning_rate': 3.367289871675117e-07, 'epoch': 1.83} {'loss': 0.3896, 'learning_rate': 3.366447592977673e-07, 'epoch': 1.83} {'loss': 0.5199, 'learning_rate': 3.3656054178317963e-07, 'epoch': 1.83} {'loss': 0.4638, 'learning_rate': 3.3647633462384087e-07, 'epoch': 1.83} {'loss': 0.2716, 'learning_rate': 3.363921378198387e-07, 'epoch': 1.83} {'loss': 0.5635, 'learning_rate': 3.3630795137126524e-07, 'epoch': 1.83} {'loss': 0.5548, 'learning_rate': 3.3622377527821047e-07, 'epoch': 1.83} {'loss': 0.5614, 'learning_rate': 3.361396095407632e-07, 'epoch': 1.83} {'loss': 0.4609, 'learning_rate': 3.3605545415901443e-07, 'epoch': 1.84} {'loss': 0.5737, 'learning_rate': 3.359713091330541e-07, 'epoch': 1.84} {'loss': 0.5369, 'learning_rate': 3.3588717446297327e-07, 'epoch': 1.84} {'loss': 0.5018, 'learning_rate': 3.3580305014886183e-07, 'epoch': 1.84} {'loss': 0.4371, 'learning_rate': 3.3571893619081084e-07, 'epoch': 1.84} {'loss': 0.3866, 'learning_rate': 3.3563483258890696e-07, 'epoch': 1.84} {'loss': 0.4507, 'learning_rate': 3.355507393432433e-07, 'epoch': 1.84} {'loss': 0.5372, 'learning_rate': 3.3546665645391e-07, 'epoch': 1.84} {'loss': 0.4893, 'learning_rate': 3.3538258392099563e-07, 'epoch': 1.84} {'loss': 0.4792, 'learning_rate': 3.3529852174459254e-07, 'epoch': 1.84} {'loss': 0.4392, 'learning_rate': 3.3521446992478836e-07, 'epoch': 1.84} {'loss': 0.5624, 'learning_rate': 3.351304284616741e-07, 'epoch': 1.84} {'loss': 0.5232, 'learning_rate': 3.350463973553397e-07, 'epoch': 1.84} {'loss': 0.5142, 'learning_rate': 3.349623766058763e-07, 'epoch': 1.84} {'loss': 0.556, 'learning_rate': 3.3487836621337146e-07, 'epoch': 1.84} {'loss': 0.4633, 'learning_rate': 3.3479436617791737e-07, 'epoch': 1.84} {'loss': 0.4686, 'learning_rate': 3.347103764996051e-07, 'epoch': 1.84} {'loss': 0.4597, 'learning_rate': 3.346263971785224e-07, 'epoch': 1.84} {'loss': 0.3393, 'learning_rate': 3.34542428214758e-07, 'epoch': 1.84} {'loss': 0.4579, 'learning_rate': 3.3445846960840523e-07, 'epoch': 1.84} {'loss': 0.392, 'learning_rate': 3.343745213595528e-07, 'epoch': 1.84} {'loss': 0.5249, 'learning_rate': 3.342905834682908e-07, 'epoch': 1.84} {'loss': 0.6208, 'learning_rate': 3.342066559347068e-07, 'epoch': 1.84} {'loss': 0.539, 'learning_rate': 3.341227387588941e-07, 'epoch': 1.84} {'loss': 0.4446, 'learning_rate': 3.3403883194094157e-07, 'epoch': 1.84} {'loss': 0.3774, 'learning_rate': 3.3395493548093795e-07, 'epoch': 1.84} {'loss': 0.4368, 'learning_rate': 3.338710493789743e-07, 'epoch': 1.84} {'loss': 0.5727, 'learning_rate': 3.3378717363514055e-07, 'epoch': 1.84} {'loss': 0.5186, 'learning_rate': 3.3370330824952665e-07, 'epoch': 1.84} {'loss': 0.4886, 'learning_rate': 3.3361945322222033e-07, 'epoch': 1.84} {'loss': 0.575, 'learning_rate': 3.335356085533159e-07, 'epoch': 1.84} {'loss': 0.6345, 'learning_rate': 3.3345177424289886e-07, 'epoch': 1.84} {'loss': 0.5261, 'learning_rate': 3.3336795029106027e-07, 'epoch': 1.84} {'loss': 0.5248, 'learning_rate': 3.3328413669789114e-07, 'epoch': 1.84} {'loss': 0.3907, 'learning_rate': 3.3320033346348037e-07, 'epoch': 1.84} {'loss': 0.4731, 'learning_rate': 3.3311654058791885e-07, 'epoch': 1.84} {'loss': 0.504, 'learning_rate': 3.330327580712933e-07, 'epoch': 1.84} {'loss': 0.4318, 'learning_rate': 3.3294898591369804e-07, 'epoch': 1.84} {'loss': 0.6095, 'learning_rate': 3.328652241152197e-07, 'epoch': 1.84} {'loss': 0.5113, 'learning_rate': 3.3278147267594816e-07, 'epoch': 1.84} {'loss': 0.5378, 'learning_rate': 3.3269773159597453e-07, 'epoch': 1.84} {'loss': 0.5383, 'learning_rate': 3.3261400087538644e-07, 'epoch': 1.84} {'loss': 0.4998, 'learning_rate': 3.3253028051427715e-07, 'epoch': 1.84} {'loss': 0.5574, 'learning_rate': 3.324465705127311e-07, 'epoch': 1.84} {'loss': 0.5699, 'learning_rate': 3.3236287087084376e-07, 'epoch': 1.84} {'loss': 0.4158, 'learning_rate': 3.3227918158870166e-07, 'epoch': 1.84} {'loss': 0.6709, 'learning_rate': 3.3219550266639477e-07, 'epoch': 1.84} {'loss': 0.5266, 'learning_rate': 3.3211183410401417e-07, 'epoch': 1.84} {'loss': 0.5363, 'learning_rate': 3.320281759016453e-07, 'epoch': 1.84} {'loss': 0.3669, 'learning_rate': 3.319445280593836e-07, 'epoch': 1.84} {'loss': 0.4591, 'learning_rate': 3.318608905773135e-07, 'epoch': 1.84} {'loss': 0.6383, 'learning_rate': 3.317772634555294e-07, 'epoch': 1.84} {'loss': 0.5048, 'learning_rate': 3.3169364669411784e-07, 'epoch': 1.84} {'loss': 0.5608, 'learning_rate': 3.3161004029316877e-07, 'epoch': 1.84} {'loss': 0.405, 'learning_rate': 3.3152644425277324e-07, 'epoch': 1.84} {'loss': 0.5954, 'learning_rate': 3.3144285857301784e-07, 'epoch': 1.84} {'loss': 0.724, 'learning_rate': 3.313592832539958e-07, 'epoch': 1.84} {'loss': 0.5336, 'learning_rate': 3.3127571829579266e-07, 'epoch': 1.84} {'loss': 0.5781, 'learning_rate': 3.311921636985027e-07, 'epoch': 1.84} {'loss': 0.4187, 'learning_rate': 3.311086194622126e-07, 'epoch': 1.84} {'loss': 0.4636, 'learning_rate': 3.310250855870112e-07, 'epoch': 1.84} {'loss': 0.4934, 'learning_rate': 3.3094156207299055e-07, 'epoch': 1.84} {'loss': 0.5036, 'learning_rate': 3.3085804892023623e-07, 'epoch': 1.84} {'loss': 0.4472, 'learning_rate': 3.3077454612884363e-07, 'epoch': 1.84} {'loss': 0.4457, 'learning_rate': 3.30691053698895e-07, 'epoch': 1.84} {'loss': 0.6381, 'learning_rate': 3.3060757163048685e-07, 'epoch': 1.84} {'loss': 0.5418, 'learning_rate': 3.305240999237036e-07, 'epoch': 1.84} {'loss': 0.3965, 'learning_rate': 3.304406385786374e-07, 'epoch': 1.84} {'loss': 0.623, 'learning_rate': 3.3035718759537704e-07, 'epoch': 1.84} {'loss': 0.527, 'learning_rate': 3.3027374697401027e-07, 'epoch': 1.84} {'loss': 0.3868, 'learning_rate': 3.301903167146292e-07, 'epoch': 1.84} {'loss': 0.4197, 'learning_rate': 3.3010689681732046e-07, 'epoch': 1.84} {'loss': 0.4392, 'learning_rate': 3.3002348728217726e-07, 'epoch': 1.84} {'loss': 0.6643, 'learning_rate': 3.2994008810928515e-07, 'epoch': 1.84} {'loss': 0.4541, 'learning_rate': 3.298566992987351e-07, 'epoch': 1.84} {'loss': 0.4491, 'learning_rate': 3.297733208506171e-07, 'epoch': 1.84} {'loss': 0.3634, 'learning_rate': 3.296899527650188e-07, 'epoch': 1.84} {'loss': 0.4418, 'learning_rate': 3.296065950420313e-07, 'epoch': 1.84} {'loss': 0.5308, 'learning_rate': 3.295232476817434e-07, 'epoch': 1.84} {'loss': 0.67, 'learning_rate': 3.2943991068424275e-07, 'epoch': 1.84} {'loss': 0.4771, 'learning_rate': 3.2935658404962044e-07, 'epoch': 1.84} {'loss': 0.4798, 'learning_rate': 3.2927326777796644e-07, 'epoch': 1.84} {'loss': 0.504, 'learning_rate': 3.291899618693684e-07, 'epoch': 1.84} {'loss': 0.5107, 'learning_rate': 3.291066663239151e-07, 'epoch': 1.84} {'loss': 0.4583, 'learning_rate': 3.2902338114169877e-07, 'epoch': 1.84} {'loss': 0.4132, 'learning_rate': 3.2894010632280594e-07, 'epoch': 1.84} {'loss': 0.6057, 'learning_rate': 3.2885684186732656e-07, 'epoch': 1.84} {'loss': 0.4756, 'learning_rate': 3.287735877753495e-07, 'epoch': 1.84} {'loss': 0.482, 'learning_rate': 3.2869034404696463e-07, 'epoch': 1.84} {'loss': 0.4347, 'learning_rate': 3.2860711068226193e-07, 'epoch': 1.84} {'loss': 0.5343, 'learning_rate': 3.2852388768132794e-07, 'epoch': 1.84} {'loss': 0.6197, 'learning_rate': 3.2844067504425483e-07, 'epoch': 1.84} {'loss': 0.2602, 'learning_rate': 3.2835747277113027e-07, 'epoch': 1.84} {'loss': 0.6442, 'learning_rate': 3.2827428086204314e-07, 'epoch': 1.84} {'loss': 0.6127, 'learning_rate': 3.281910993170834e-07, 'epoch': 1.84} {'loss': 0.4924, 'learning_rate': 3.2810792813633974e-07, 'epoch': 1.84} {'loss': 0.5582, 'learning_rate': 3.280247673199022e-07, 'epoch': 1.84} {'loss': 0.5734, 'learning_rate': 3.279416168678573e-07, 'epoch': 1.84} {'loss': 0.5099, 'learning_rate': 3.2785847678029724e-07, 'epoch': 1.84} {'loss': 0.4042, 'learning_rate': 3.277753470573086e-07, 'epoch': 1.84} {'loss': 0.5629, 'learning_rate': 3.2769222769898246e-07, 'epoch': 1.84} {'loss': 0.475, 'learning_rate': 3.276091187054087e-07, 'epoch': 1.84} {'loss': 0.5955, 'learning_rate': 3.2752602007667166e-07, 'epoch': 1.84} {'loss': 0.3171, 'learning_rate': 3.2744293181286577e-07, 'epoch': 1.84} {'loss': 0.5137, 'learning_rate': 3.2735985391407654e-07, 'epoch': 1.84} {'loss': 0.4843, 'learning_rate': 3.2727678638039497e-07, 'epoch': 1.84} {'loss': 0.5085, 'learning_rate': 3.271937292119087e-07, 'epoch': 1.84} {'loss': 0.4625, 'learning_rate': 3.271106824087078e-07, 'epoch': 1.84} {'loss': 0.5592, 'learning_rate': 3.27027645970881e-07, 'epoch': 1.84} {'loss': 0.5372, 'learning_rate': 3.269446198985171e-07, 'epoch': 1.84} {'loss': 0.4674, 'learning_rate': 3.268616041917039e-07, 'epoch': 1.84} {'loss': 0.5378, 'learning_rate': 3.267785988505323e-07, 'epoch': 1.84} {'loss': 0.4618, 'learning_rate': 3.2669560387509125e-07, 'epoch': 1.84} {'loss': 0.6033, 'learning_rate': 3.266126192654684e-07, 'epoch': 1.84} {'loss': 0.5042, 'learning_rate': 3.2652964502175253e-07, 'epoch': 1.84} {'loss': 0.5661, 'learning_rate': 3.2644668114403477e-07, 'epoch': 1.84} {'loss': 0.5672, 'learning_rate': 3.2636372763240167e-07, 'epoch': 1.84} {'loss': 0.4756, 'learning_rate': 3.26280784486942e-07, 'epoch': 1.84} {'loss': 0.4376, 'learning_rate': 3.261978517077469e-07, 'epoch': 1.84} {'loss': 0.6145, 'learning_rate': 3.2611492929490287e-07, 'epoch': 1.84} {'loss': 0.4667, 'learning_rate': 3.2603201724849985e-07, 'epoch': 1.84} {'loss': 0.4927, 'learning_rate': 3.259491155686278e-07, 'epoch': 1.84} {'loss': 0.5867, 'learning_rate': 3.258662242553745e-07, 'epoch': 1.84} {'loss': 0.476, 'learning_rate': 3.257833433088275e-07, 'epoch': 1.84} {'loss': 0.5035, 'learning_rate': 3.257004727290769e-07, 'epoch': 1.84} {'loss': 0.371, 'learning_rate': 3.2561761251621136e-07, 'epoch': 1.84} {'loss': 0.601, 'learning_rate': 3.255347626703209e-07, 'epoch': 1.84} {'loss': 0.582, 'learning_rate': 3.254519231914921e-07, 'epoch': 1.84} {'loss': 0.5736, 'learning_rate': 3.2536909407981597e-07, 'epoch': 1.84} {'loss': 0.3391, 'learning_rate': 3.2528627533537805e-07, 'epoch': 1.84} {'loss': 0.5283, 'learning_rate': 3.2520346695827045e-07, 'epoch': 1.84} {'loss': 0.5182, 'learning_rate': 3.2512066894857973e-07, 'epoch': 1.84} {'loss': 0.5585, 'learning_rate': 3.250378813063959e-07, 'epoch': 1.84} {'loss': 0.4469, 'learning_rate': 3.249551040318066e-07, 'epoch': 1.84} {'loss': 0.6061, 'learning_rate': 3.2487233712490187e-07, 'epoch': 1.84} {'loss': 0.4021, 'learning_rate': 3.2478958058577034e-07, 'epoch': 1.84} {'loss': 0.5581, 'learning_rate': 3.247068344144988e-07, 'epoch': 1.84} {'loss': 0.3822, 'learning_rate': 3.2462409861117815e-07, 'epoch': 1.84} {'loss': 0.4887, 'learning_rate': 3.2454137317589504e-07, 'epoch': 1.84} {'loss': 0.5527, 'learning_rate': 3.2445865810873943e-07, 'epoch': 1.84} {'loss': 0.6005, 'learning_rate': 3.2437595340979897e-07, 'epoch': 1.84} {'loss': 0.3682, 'learning_rate': 3.2429325907916366e-07, 'epoch': 1.84} {'loss': 0.4497, 'learning_rate': 3.2421057511692224e-07, 'epoch': 1.84} {'loss': 0.5298, 'learning_rate': 3.241279015231613e-07, 'epoch': 1.84} {'loss': 0.435, 'learning_rate': 3.2404523829797087e-07, 'epoch': 1.84} {'loss': 0.4732, 'learning_rate': 3.2396258544143964e-07, 'epoch': 1.84} {'loss': 0.4991, 'learning_rate': 3.2387994295365546e-07, 'epoch': 1.84} {'loss': 0.5591, 'learning_rate': 3.237973108347081e-07, 'epoch': 1.84} {'loss': 0.5398, 'learning_rate': 3.2371468908468317e-07, 'epoch': 1.84} {'loss': 0.4577, 'learning_rate': 3.236320777036739e-07, 'epoch': 1.84} {'loss': 0.383, 'learning_rate': 3.235494766917646e-07, 'epoch': 1.84} {'loss': 0.6231, 'learning_rate': 3.2346688604904533e-07, 'epoch': 1.84} {'loss': 0.3892, 'learning_rate': 3.2338430577560475e-07, 'epoch': 1.84} {'loss': 0.6839, 'learning_rate': 3.2330173587153177e-07, 'epoch': 1.84} {'loss': 0.4107, 'learning_rate': 3.232191763369152e-07, 'epoch': 1.84} {'loss': 0.5489, 'learning_rate': 3.2313662717184055e-07, 'epoch': 1.84} {'loss': 0.377, 'learning_rate': 3.230540883764e-07, 'epoch': 1.84} {'loss': 0.3802, 'learning_rate': 3.2297155995067995e-07, 'epoch': 1.84} {'loss': 0.2431, 'learning_rate': 3.2288904189476835e-07, 'epoch': 1.84} {'loss': 0.539, 'learning_rate': 3.228065342087561e-07, 'epoch': 1.84} {'loss': 0.5076, 'learning_rate': 3.227240368927287e-07, 'epoch': 1.84} {'loss': 0.5763, 'learning_rate': 3.226415499467772e-07, 'epoch': 1.84} {'loss': 0.4021, 'learning_rate': 3.225590733709871e-07, 'epoch': 1.84} {'loss': 0.3756, 'learning_rate': 3.224766071654506e-07, 'epoch': 1.84} {'loss': 0.6116, 'learning_rate': 3.22394151330252e-07, 'epoch': 1.84} {'loss': 0.5274, 'learning_rate': 3.2231170586548235e-07, 'epoch': 1.84} {'loss': 0.4573, 'learning_rate': 3.222292707712293e-07, 'epoch': 1.84} {'loss': 0.4928, 'learning_rate': 3.2214684604757964e-07, 'epoch': 1.84} {'loss': 0.4221, 'learning_rate': 3.220644316946253e-07, 'epoch': 1.84} {'loss': 0.5973, 'learning_rate': 3.219820277124508e-07, 'epoch': 1.84} {'loss': 0.4388, 'learning_rate': 3.218996341011471e-07, 'epoch': 1.84} {'loss': 0.4825, 'learning_rate': 3.2181725086080087e-07, 'epoch': 1.84} {'loss': 0.4908, 'learning_rate': 3.2173487799150084e-07, 'epoch': 1.84} {'loss': 0.621, 'learning_rate': 3.2165251549333585e-07, 'epoch': 1.84} {'loss': 0.3814, 'learning_rate': 3.2157016336639257e-07, 'epoch': 1.84} {'loss': 0.5639, 'learning_rate': 3.21487821610762e-07, 'epoch': 1.84} {'loss': 0.4431, 'learning_rate': 3.2140549022652955e-07, 'epoch': 1.84} {'loss': 0.5018, 'learning_rate': 3.2132316921378527e-07, 'epoch': 1.84} {'loss': 0.4817, 'learning_rate': 3.212408585726168e-07, 'epoch': 1.84} {'loss': 0.6224, 'learning_rate': 3.211585583031118e-07, 'epoch': 1.84} {'loss': 0.6385, 'learning_rate': 3.2107626840536035e-07, 'epoch': 1.84} {'loss': 0.5912, 'learning_rate': 3.2099398887944665e-07, 'epoch': 1.84} {'loss': 0.5171, 'learning_rate': 3.209117197254641e-07, 'epoch': 1.84} {'loss': 0.4666, 'learning_rate': 3.2082946094349697e-07, 'epoch': 1.84} {'loss': 0.315, 'learning_rate': 3.2074721253363526e-07, 'epoch': 1.84} {'loss': 0.5396, 'learning_rate': 3.206649744959667e-07, 'epoch': 1.84} {'loss': 0.6551, 'learning_rate': 3.205827468305778e-07, 'epoch': 1.84} {'loss': 0.4708, 'learning_rate': 3.205005295375596e-07, 'epoch': 1.84} {'loss': 0.4621, 'learning_rate': 3.2041832261699765e-07, 'epoch': 1.84} {'loss': 0.4708, 'learning_rate': 3.203361260689819e-07, 'epoch': 1.84} {'loss': 0.4935, 'learning_rate': 3.2025393989359887e-07, 'epoch': 1.84} {'loss': 0.5154, 'learning_rate': 3.2017176409093855e-07, 'epoch': 1.84} {'loss': 0.6129, 'learning_rate': 3.200895986610875e-07, 'epoch': 1.84} {'loss': 0.4794, 'learning_rate': 3.200074436041323e-07, 'epoch': 1.84} {'loss': 0.5391, 'learning_rate': 3.199252989201651e-07, 'epoch': 1.84} {'loss': 0.495, 'learning_rate': 3.1984316460927035e-07, 'epoch': 1.84} {'loss': 0.6596, 'learning_rate': 3.197610406715379e-07, 'epoch': 1.84} {'loss': 0.4319, 'learning_rate': 3.1967892710705553e-07, 'epoch': 1.84} {'loss': 0.5813, 'learning_rate': 3.1959682391590974e-07, 'epoch': 1.84} {'loss': 0.5236, 'learning_rate': 3.1951473109819165e-07, 'epoch': 1.84} {'loss': 0.5559, 'learning_rate': 3.1943264865398447e-07, 'epoch': 1.84} {'loss': 0.4738, 'learning_rate': 3.1935057658338154e-07, 'epoch': 1.84} {'loss': 0.5666, 'learning_rate': 3.19268514886466e-07, 'epoch': 1.84} {'loss': 0.4651, 'learning_rate': 3.191864635633291e-07, 'epoch': 1.84} {'loss': 0.5726, 'learning_rate': 3.191044226140583e-07, 'epoch': 1.84} {'loss': 0.4862, 'learning_rate': 3.190223920387392e-07, 'epoch': 1.84} {'loss': 0.4596, 'learning_rate': 3.1894037183746395e-07, 'epoch': 1.84} {'loss': 0.5041, 'learning_rate': 3.188583620103147e-07, 'epoch': 1.84} {'loss': 0.2436, 'learning_rate': 3.187763625573848e-07, 'epoch': 1.84} {'loss': 0.4778, 'learning_rate': 3.186943734787573e-07, 'epoch': 1.84} {'loss': 0.5048, 'learning_rate': 3.186123947745257e-07, 'epoch': 1.84} {'loss': 0.4469, 'learning_rate': 3.185304264447731e-07, 'epoch': 1.84} {'loss': 0.5118, 'learning_rate': 3.1844846848958943e-07, 'epoch': 1.84} {'loss': 0.5049, 'learning_rate': 3.183665209090625e-07, 'epoch': 1.84} {'loss': 0.5216, 'learning_rate': 3.1828458370327776e-07, 'epoch': 1.84} {'loss': 0.3966, 'learning_rate': 3.1820265687232734e-07, 'epoch': 1.84} {'loss': 0.4845, 'learning_rate': 3.181207404162945e-07, 'epoch': 1.84} {'loss': 0.6193, 'learning_rate': 3.1803883433527027e-07, 'epoch': 1.84} {'loss': 0.5558, 'learning_rate': 3.1795693862934017e-07, 'epoch': 1.84} {'loss': 0.3561, 'learning_rate': 3.1787505329859414e-07, 'epoch': 1.84} {'loss': 0.5044, 'learning_rate': 3.1779317834311984e-07, 'epoch': 1.84} {'loss': 0.478, 'learning_rate': 3.1771131376300167e-07, 'epoch': 1.84} {'loss': 0.5488, 'learning_rate': 3.176294595583318e-07, 'epoch': 1.84} {'loss': 0.513, 'learning_rate': 3.175476157291946e-07, 'epoch': 1.84} {'loss': 0.5305, 'learning_rate': 3.1746578227567883e-07, 'epoch': 1.84} {'loss': 0.5224, 'learning_rate': 3.1738395919787337e-07, 'epoch': 1.84} {'loss': 0.5087, 'learning_rate': 3.1730214649586364e-07, 'epoch': 1.84} {'loss': 0.4775, 'learning_rate': 3.172203441697408e-07, 'epoch': 1.84} {'loss': 0.4885, 'learning_rate': 3.1713855221958687e-07, 'epoch': 1.84} {'loss': 0.5205, 'learning_rate': 3.170567706454963e-07, 'epoch': 1.84} {'loss': 0.4991, 'learning_rate': 3.169749994475513e-07, 'epoch': 1.84} {'loss': 0.4363, 'learning_rate': 3.1689323862584275e-07, 'epoch': 1.84} {'loss': 0.4856, 'learning_rate': 3.168114881804563e-07, 'epoch': 1.84} {'loss': 0.4581, 'learning_rate': 3.167297481114795e-07, 'epoch': 1.84} {'loss': 0.5709, 'learning_rate': 3.166480184190035e-07, 'epoch': 1.84} {'loss': 0.4558, 'learning_rate': 3.1656629910311044e-07, 'epoch': 1.84} {'loss': 0.4459, 'learning_rate': 3.164845901638913e-07, 'epoch': 1.84} {'loss': 0.4639, 'learning_rate': 3.164028916014328e-07, 'epoch': 1.84} {'loss': 0.5227, 'learning_rate': 3.163212034158236e-07, 'epoch': 1.84} {'loss': 0.5248, 'learning_rate': 3.162395256071493e-07, 'epoch': 1.84} {'loss': 0.5413, 'learning_rate': 3.161578581754976e-07, 'epoch': 1.84} {'loss': 0.5371, 'learning_rate': 3.1607620112095947e-07, 'epoch': 1.84} {'loss': 0.4122, 'learning_rate': 3.1599455444361716e-07, 'epoch': 1.84} {'loss': 0.5439, 'learning_rate': 3.1591291814356163e-07, 'epoch': 1.84} {'loss': 0.3286, 'learning_rate': 3.158312922208795e-07, 'epoch': 1.84} {'loss': 0.5619, 'learning_rate': 3.1574967667565737e-07, 'epoch': 1.84} {'loss': 0.6082, 'learning_rate': 3.1566807150798404e-07, 'epoch': 1.84} {'loss': 0.422, 'learning_rate': 3.155864767179473e-07, 'epoch': 1.84} {'loss': 0.4768, 'learning_rate': 3.155048923056336e-07, 'epoch': 1.84} {'loss': 0.4675, 'learning_rate': 3.154233182711297e-07, 'epoch': 1.84} {'loss': 0.5683, 'learning_rate': 3.1534175461452434e-07, 'epoch': 1.84} {'loss': 0.5163, 'learning_rate': 3.1526020133590406e-07, 'epoch': 1.84} {'loss': 0.5911, 'learning_rate': 3.1517865843535556e-07, 'epoch': 1.84} {'loss': 0.5796, 'learning_rate': 3.150971259129698e-07, 'epoch': 1.84} {'loss': 0.5101, 'learning_rate': 3.150156037688301e-07, 'epoch': 1.84} {'loss': 0.5796, 'learning_rate': 3.149340920030253e-07, 'epoch': 1.84} {'loss': 0.671, 'learning_rate': 3.148525906156419e-07, 'epoch': 1.84} {'loss': 0.5914, 'learning_rate': 3.147710996067688e-07, 'epoch': 1.84} {'loss': 0.5982, 'learning_rate': 3.146896189764925e-07, 'epoch': 1.84} {'loss': 0.5158, 'learning_rate': 3.1460814872490084e-07, 'epoch': 1.84} {'loss': 0.56, 'learning_rate': 3.145266888520815e-07, 'epoch': 1.84} {'loss': 0.6826, 'learning_rate': 3.1444523935811987e-07, 'epoch': 1.84} {'loss': 0.4604, 'learning_rate': 3.1436380024310373e-07, 'epoch': 1.84} {'loss': 0.5238, 'learning_rate': 3.142823715071219e-07, 'epoch': 1.84} {'loss': 0.4512, 'learning_rate': 3.142009531502599e-07, 'epoch': 1.84} {'loss': 0.445, 'learning_rate': 3.1411954517260647e-07, 'epoch': 1.84} {'loss': 0.5383, 'learning_rate': 3.1403814757424824e-07, 'epoch': 1.84} {'loss': 0.4665, 'learning_rate': 3.1395676035527287e-07, 'epoch': 1.84} {'loss': 0.619, 'learning_rate': 3.1387538351576597e-07, 'epoch': 1.84} {'loss': 0.4433, 'learning_rate': 3.1379401705581626e-07, 'epoch': 1.84} {'loss': 0.4092, 'learning_rate': 3.1371266097551036e-07, 'epoch': 1.84} {'loss': 0.4773, 'learning_rate': 3.1363131527493487e-07, 'epoch': 1.84} {'loss': 0.4449, 'learning_rate': 3.1354997995417857e-07, 'epoch': 1.84} {'loss': 0.5047, 'learning_rate': 3.1346865501332923e-07, 'epoch': 1.84} {'loss': 0.5172, 'learning_rate': 3.133873404524701e-07, 'epoch': 1.84} {'loss': 0.4669, 'learning_rate': 3.1330603627169107e-07, 'epoch': 1.84} {'loss': 0.4889, 'learning_rate': 3.132247424710799e-07, 'epoch': 1.84} {'loss': 0.5406, 'learning_rate': 3.131434590507221e-07, 'epoch': 1.84} {'loss': 0.5749, 'learning_rate': 3.1306218601070524e-07, 'epoch': 1.84} {'loss': 0.6102, 'learning_rate': 3.1298092335111607e-07, 'epoch': 1.84} {'loss': 0.393, 'learning_rate': 3.1289967107204336e-07, 'epoch': 1.84} {'loss': 0.4121, 'learning_rate': 3.1281842917357255e-07, 'epoch': 1.84} {'loss': 0.6324, 'learning_rate': 3.1273719765579025e-07, 'epoch': 1.84} {'loss': 0.3833, 'learning_rate': 3.126559765187853e-07, 'epoch': 1.84} {'loss': 0.4549, 'learning_rate': 3.1257476576264324e-07, 'epoch': 1.84} {'loss': 0.4716, 'learning_rate': 3.124935653874517e-07, 'epoch': 1.84} {'loss': 0.492, 'learning_rate': 3.124123753932984e-07, 'epoch': 1.84} {'loss': 0.4506, 'learning_rate': 3.1233119578026995e-07, 'epoch': 1.84} {'loss': 0.4586, 'learning_rate': 3.122500265484518e-07, 'epoch': 1.84} {'loss': 0.5184, 'learning_rate': 3.1216886769793285e-07, 'epoch': 1.84} {'loss': 0.5348, 'learning_rate': 3.1208771922879855e-07, 'epoch': 1.84} {'loss': 0.557, 'learning_rate': 3.120065811411366e-07, 'epoch': 1.84} {'loss': 0.4456, 'learning_rate': 3.119254534350358e-07, 'epoch': 1.84} {'loss': 0.4428, 'learning_rate': 3.1184433611057827e-07, 'epoch': 1.84} {'loss': 0.5932, 'learning_rate': 3.117632291678574e-07, 'epoch': 1.84} {'loss': 0.6506, 'learning_rate': 3.116821326069541e-07, 'epoch': 1.84} {'loss': 0.5158, 'learning_rate': 3.116010464279584e-07, 'epoch': 1.84} {'loss': 0.5048, 'learning_rate': 3.115199706309568e-07, 'epoch': 1.84} {'loss': 0.4041, 'learning_rate': 3.1143890521603606e-07, 'epoch': 1.84} {'loss': 0.3652, 'learning_rate': 3.113578501832837e-07, 'epoch': 1.84} {'loss': 0.4415, 'learning_rate': 3.1127680553278417e-07, 'epoch': 1.84} {'loss': 0.4041, 'learning_rate': 3.1119577126462743e-07, 'epoch': 1.84} {'loss': 0.3801, 'learning_rate': 3.111147473788989e-07, 'epoch': 1.84} {'loss': 0.4857, 'learning_rate': 3.1103373387568414e-07, 'epoch': 1.84} {'loss': 0.3812, 'learning_rate': 3.1095273075507303e-07, 'epoch': 1.84} {'loss': 0.5566, 'learning_rate': 3.1087173801714885e-07, 'epoch': 1.84} {'loss': 0.5231, 'learning_rate': 3.1079075566200154e-07, 'epoch': 1.84} {'loss': 0.4362, 'learning_rate': 3.107097836897144e-07, 'epoch': 1.84} {'loss': 0.3976, 'learning_rate': 3.1062882210037837e-07, 'epoch': 1.84} {'loss': 0.4937, 'learning_rate': 3.105478708940768e-07, 'epoch': 1.84} {'loss': 0.3629, 'learning_rate': 3.1046693007089844e-07, 'epoch': 1.84} {'loss': 0.563, 'learning_rate': 3.1038599963092997e-07, 'epoch': 1.84} {'loss': 0.4892, 'learning_rate': 3.103050795742546e-07, 'epoch': 1.84} {'loss': 0.619, 'learning_rate': 3.102241699009645e-07, 'epoch': 1.84} {'loss': 0.4796, 'learning_rate': 3.101432706111418e-07, 'epoch': 1.84} {'loss': 0.4384, 'learning_rate': 3.1006238170487754e-07, 'epoch': 1.84} {'loss': 0.5849, 'learning_rate': 3.0998150318225505e-07, 'epoch': 1.84} {'loss': 0.4441, 'learning_rate': 3.0990063504336085e-07, 'epoch': 1.84} {'loss': 0.4008, 'learning_rate': 3.0981977728828495e-07, 'epoch': 1.84} {'loss': 0.5727, 'learning_rate': 3.097389299171094e-07, 'epoch': 1.84} {'loss': 0.5089, 'learning_rate': 3.096580929299242e-07, 'epoch': 1.84} {'loss': 0.4983, 'learning_rate': 3.0957726632681483e-07, 'epoch': 1.84} {'loss': 0.4626, 'learning_rate': 3.094964501078679e-07, 'epoch': 1.84} {'loss': 0.4479, 'learning_rate': 3.0941564427317104e-07, 'epoch': 1.84} {'loss': 0.5451, 'learning_rate': 3.0933484882280875e-07, 'epoch': 1.84} {'loss': 0.4308, 'learning_rate': 3.0925406375686975e-07, 'epoch': 1.84} {'loss': 0.4051, 'learning_rate': 3.091732890754384e-07, 'epoch': 1.84} {'loss': 0.4902, 'learning_rate': 3.090925247786047e-07, 'epoch': 1.84} {'loss': 0.5113, 'learning_rate': 3.0901177086645086e-07, 'epoch': 1.84} {'loss': 0.5269, 'learning_rate': 3.089310273390667e-07, 'epoch': 1.84} {'loss': 0.415, 'learning_rate': 3.0885029419653655e-07, 'epoch': 1.84} {'loss': 0.5169, 'learning_rate': 3.0876957143894937e-07, 'epoch': 1.84} {'loss': 0.6387, 'learning_rate': 3.086888590663906e-07, 'epoch': 1.84} {'loss': 0.472, 'learning_rate': 3.086081570789445e-07, 'epoch': 1.84} {'loss': 0.5208, 'learning_rate': 3.085274654767012e-07, 'epoch': 1.84} {'loss': 0.5052, 'learning_rate': 3.0844678425974384e-07, 'epoch': 1.84} {'loss': 0.5949, 'learning_rate': 3.0836611342816127e-07, 'epoch': 1.84} {'loss': 0.519, 'learning_rate': 3.0828545298204003e-07, 'epoch': 1.84} {'loss': 0.5818, 'learning_rate': 3.082048029214635e-07, 'epoch': 1.84} {'loss': 0.565, 'learning_rate': 3.0812416324652264e-07, 'epoch': 1.84} {'loss': 0.427, 'learning_rate': 3.080435339572996e-07, 'epoch': 1.84} {'loss': 0.5339, 'learning_rate': 3.079629150538843e-07, 'epoch': 1.84} {'loss': 0.4961, 'learning_rate': 3.078823065363601e-07, 'epoch': 1.84} {'loss': 0.3955, 'learning_rate': 3.078017084048157e-07, 'epoch': 1.84} {'loss': 0.476, 'learning_rate': 3.077211206593367e-07, 'epoch': 1.84} {'loss': 0.5125, 'learning_rate': 3.0764054330000735e-07, 'epoch': 1.84} {'loss': 0.4986, 'learning_rate': 3.075599763269188e-07, 'epoch': 1.84} {'loss': 0.541, 'learning_rate': 3.0747941974015206e-07, 'epoch': 1.84} {'loss': 0.5413, 'learning_rate': 3.0739887353979816e-07, 'epoch': 1.84} {'loss': 0.5705, 'learning_rate': 3.0731833772593924e-07, 'epoch': 1.84} {'loss': 0.5762, 'learning_rate': 3.0723781229866413e-07, 'epoch': 1.84} {'loss': 0.5812, 'learning_rate': 3.0715729725805943e-07, 'epoch': 1.84} {'loss': 0.4468, 'learning_rate': 3.0707679260420843e-07, 'epoch': 1.84} {'loss': 0.5006, 'learning_rate': 3.069962983372021e-07, 'epoch': 1.84} {'loss': 0.5132, 'learning_rate': 3.069158144571216e-07, 'epoch': 1.84} {'loss': 0.6264, 'learning_rate': 3.0683534096405785e-07, 'epoch': 1.84} {'loss': 0.4771, 'learning_rate': 3.067548778580942e-07, 'epoch': 1.84} {'loss': 0.4406, 'learning_rate': 3.066744251393172e-07, 'epoch': 1.84} {'loss': 0.512, 'learning_rate': 3.065939828078146e-07, 'epoch': 1.84} {'loss': 0.5792, 'learning_rate': 3.0651355086366854e-07, 'epoch': 1.84} {'loss': 0.544, 'learning_rate': 3.064331293069711e-07, 'epoch': 1.84} {'loss': 0.3388, 'learning_rate': 3.0635271813780453e-07, 'epoch': 1.84} {'loss': 0.4104, 'learning_rate': 3.062723173562554e-07, 'epoch': 1.84} {'loss': 0.6234, 'learning_rate': 3.061919269624103e-07, 'epoch': 1.84} {'loss': 0.487, 'learning_rate': 3.061115469563558e-07, 'epoch': 1.84} {'loss': 0.6345, 'learning_rate': 3.0603117733817857e-07, 'epoch': 1.84} {'loss': 0.5261, 'learning_rate': 3.0595081810796177e-07, 'epoch': 1.84} {'loss': 0.463, 'learning_rate': 3.058704692657954e-07, 'epoch': 1.84} {'loss': 0.5287, 'learning_rate': 3.057901308117639e-07, 'epoch': 1.84} {'loss': 0.3349, 'learning_rate': 3.057098027459515e-07, 'epoch': 1.84} {'loss': 0.5917, 'learning_rate': 3.0562948506844715e-07, 'epoch': 1.84} {'loss': 0.4157, 'learning_rate': 3.0554917777933623e-07, 'epoch': 1.84} {'loss': 0.5589, 'learning_rate': 3.054688808787043e-07, 'epoch': 1.84} {'loss': 0.5796, 'learning_rate': 3.053885943666357e-07, 'epoch': 1.84} {'loss': 0.5049, 'learning_rate': 3.053083182432204e-07, 'epoch': 1.84} {'loss': 0.482, 'learning_rate': 3.052280525085416e-07, 'epoch': 1.84} {'loss': 0.6714, 'learning_rate': 3.051477971626859e-07, 'epoch': 1.84} {'loss': 0.5362, 'learning_rate': 3.0506755220573893e-07, 'epoch': 1.84} {'loss': 0.5596, 'learning_rate': 3.049873176377871e-07, 'epoch': 1.84} {'loss': 0.5073, 'learning_rate': 3.049070934589171e-07, 'epoch': 1.84} {'loss': 0.7175, 'learning_rate': 3.0482687966921333e-07, 'epoch': 1.84} {'loss': 0.3936, 'learning_rate': 3.0474667626876343e-07, 'epoch': 1.84} {'loss': 0.5786, 'learning_rate': 3.046664832576518e-07, 'epoch': 1.84} {'loss': 0.5412, 'learning_rate': 3.0458630063596507e-07, 'epoch': 1.84} {'loss': 0.6566, 'learning_rate': 3.0450612840378977e-07, 'epoch': 1.84} {'loss': 0.5073, 'learning_rate': 3.0442596656121037e-07, 'epoch': 1.84} {'loss': 0.6366, 'learning_rate': 3.043458151083145e-07, 'epoch': 1.84} {'loss': 0.329, 'learning_rate': 3.042656740451877e-07, 'epoch': 1.84} {'loss': 0.6743, 'learning_rate': 3.041855433719143e-07, 'epoch': 1.84} {'loss': 0.5942, 'learning_rate': 3.041054230885809e-07, 'epoch': 1.84} {'loss': 0.5659, 'learning_rate': 3.040253131952742e-07, 'epoch': 1.84} {'loss': 0.5127, 'learning_rate': 3.039452136920784e-07, 'epoch': 1.84} {'loss': 0.5418, 'learning_rate': 3.0386512457908247e-07, 'epoch': 1.84} {'loss': 0.3899, 'learning_rate': 3.037850458563696e-07, 'epoch': 1.84} {'loss': 0.52, 'learning_rate': 3.037049775240253e-07, 'epoch': 1.84} {'loss': 0.5907, 'learning_rate': 3.036249195821361e-07, 'epoch': 1.84} {'loss': 0.48, 'learning_rate': 3.0354487203078877e-07, 'epoch': 1.84} {'loss': 0.5216, 'learning_rate': 3.034648348700686e-07, 'epoch': 1.84} {'loss': 0.5683, 'learning_rate': 3.033848081000601e-07, 'epoch': 1.84} {'loss': 0.5948, 'learning_rate': 3.033047917208509e-07, 'epoch': 1.84} {'loss': 0.5439, 'learning_rate': 3.0322478573252545e-07, 'epoch': 1.84} {'loss': 0.4073, 'learning_rate': 3.0314479013516916e-07, 'epoch': 1.84} {'loss': 0.5884, 'learning_rate': 3.030648049288687e-07, 'epoch': 1.84} {'loss': 0.5038, 'learning_rate': 3.029848301137095e-07, 'epoch': 1.84} {'loss': 0.3165, 'learning_rate': 3.0290486568977706e-07, 'epoch': 1.84} {'loss': 0.4766, 'learning_rate': 3.02824911657158e-07, 'epoch': 1.84} {'loss': 0.465, 'learning_rate': 3.0274496801593776e-07, 'epoch': 1.84} {'loss': 0.449, 'learning_rate': 3.026650347662008e-07, 'epoch': 1.84} {'loss': 0.5495, 'learning_rate': 3.025851119080325e-07, 'epoch': 1.84} {'loss': 0.5576, 'learning_rate': 3.0250519944152066e-07, 'epoch': 1.84} {'loss': 0.533, 'learning_rate': 3.024252973667496e-07, 'epoch': 1.84} {'loss': 0.3809, 'learning_rate': 3.02345405683806e-07, 'epoch': 1.84} {'loss': 0.6027, 'learning_rate': 3.02265524392773e-07, 'epoch': 1.84} {'loss': 0.6199, 'learning_rate': 3.021856534937384e-07, 'epoch': 1.84} {'loss': 0.6682, 'learning_rate': 3.0210579298678653e-07, 'epoch': 1.84} {'loss': 0.46, 'learning_rate': 3.02025942872004e-07, 'epoch': 1.84} {'loss': 0.5631, 'learning_rate': 3.0194610314947635e-07, 'epoch': 1.84} {'loss': 0.4512, 'learning_rate': 3.0186627381928793e-07, 'epoch': 1.84} {'loss': 0.5711, 'learning_rate': 3.0178645488152636e-07, 'epoch': 1.84} {'loss': 0.5827, 'learning_rate': 3.01706646336275e-07, 'epoch': 1.84} {'loss': 0.4015, 'learning_rate': 3.016268481836204e-07, 'epoch': 1.84} {'loss': 0.4503, 'learning_rate': 3.015470604236481e-07, 'epoch': 1.84} {'loss': 0.4727, 'learning_rate': 3.014672830564436e-07, 'epoch': 1.84} {'loss': 0.7347, 'learning_rate': 3.013875160820923e-07, 'epoch': 1.84} {'loss': 0.3651, 'learning_rate': 3.013077595006786e-07, 'epoch': 1.84} {'loss': 0.5462, 'learning_rate': 3.0122801331229136e-07, 'epoch': 1.84} {'loss': 0.4113, 'learning_rate': 3.0114827751701156e-07, 'epoch': 1.84} {'loss': 0.5526, 'learning_rate': 3.0106855211492704e-07, 'epoch': 1.84} {'loss': 0.5223, 'learning_rate': 3.0098883710612313e-07, 'epoch': 1.84} {'loss': 0.5706, 'learning_rate': 3.0090913249068543e-07, 'epoch': 1.84} {'loss': 0.6754, 'learning_rate': 3.008294382686994e-07, 'epoch': 1.84} {'loss': 0.5578, 'learning_rate': 3.0074975444024823e-07, 'epoch': 1.84} {'loss': 0.4297, 'learning_rate': 3.0067008100542083e-07, 'epoch': 1.84} {'loss': 0.3391, 'learning_rate': 3.005904179643004e-07, 'epoch': 1.84} {'loss': 0.4888, 'learning_rate': 3.0051076531697254e-07, 'epoch': 1.84} {'loss': 0.4584, 'learning_rate': 3.0043112306352265e-07, 'epoch': 1.84} {'loss': 0.4154, 'learning_rate': 3.003514912040362e-07, 'epoch': 1.84} {'loss': 0.615, 'learning_rate': 3.002718697385998e-07, 'epoch': 1.84} {'loss': 0.3756, 'learning_rate': 3.001922586672956e-07, 'epoch': 1.84} {'loss': 0.5812, 'learning_rate': 3.001126579902136e-07, 'epoch': 1.84} {'loss': 0.4773, 'learning_rate': 3.000330677074337e-07, 'epoch': 1.84} {'loss': 0.527, 'learning_rate': 2.9995348781904463e-07, 'epoch': 1.84} {'loss': 0.5618, 'learning_rate': 2.998739183251309e-07, 'epoch': 1.84} {'loss': 0.4379, 'learning_rate': 2.9979435922577795e-07, 'epoch': 1.84} {'loss': 0.3731, 'learning_rate': 2.9971481052107234e-07, 'epoch': 1.84} {'loss': 0.6026, 'learning_rate': 2.996352722110951e-07, 'epoch': 1.84} {'loss': 0.5499, 'learning_rate': 2.9955574429593625e-07, 'epoch': 1.84} {'loss': 0.4491, 'learning_rate': 2.994762267756779e-07, 'epoch': 1.84} {'loss': 0.5754, 'learning_rate': 2.9939671965040664e-07, 'epoch': 1.84} {'loss': 0.4856, 'learning_rate': 2.993172229202079e-07, 'epoch': 1.84} {'loss': 0.5348, 'learning_rate': 2.99237736585164e-07, 'epoch': 1.84} {'loss': 0.685, 'learning_rate': 2.991582606453647e-07, 'epoch': 1.84} {'loss': 0.5756, 'learning_rate': 2.990787951008911e-07, 'epoch': 1.84} {'loss': 0.5291, 'learning_rate': 2.9899933995183205e-07, 'epoch': 1.84} {'loss': 0.4799, 'learning_rate': 2.989198951982697e-07, 'epoch': 1.84} {'loss': 0.4148, 'learning_rate': 2.9884046084029064e-07, 'epoch': 1.84} {'loss': 0.3803, 'learning_rate': 2.987610368779803e-07, 'epoch': 1.84} {'loss': 0.4409, 'learning_rate': 2.986816233114209e-07, 'epoch': 1.84} {'loss': 0.3911, 'learning_rate': 2.986022201407024e-07, 'epoch': 1.84} {'loss': 0.5727, 'learning_rate': 2.9852282736590467e-07, 'epoch': 1.84} {'loss': 0.5136, 'learning_rate': 2.9844344498711766e-07, 'epoch': 1.84} {'loss': 0.4554, 'learning_rate': 2.983640730044224e-07, 'epoch': 1.84} {'loss': 0.6211, 'learning_rate': 2.982847114179066e-07, 'epoch': 1.84} {'loss': 0.5641, 'learning_rate': 2.982053602276547e-07, 'epoch': 1.84} {'loss': 0.4789, 'learning_rate': 2.9812601943374873e-07, 'epoch': 1.84} {'loss': 0.5242, 'learning_rate': 2.9804668903627986e-07, 'epoch': 1.84} {'loss': 0.3978, 'learning_rate': 2.979673690353269e-07, 'epoch': 1.84} {'loss': 0.4204, 'learning_rate': 2.9788805943097966e-07, 'epoch': 1.84} {'loss': 0.5137, 'learning_rate': 2.978087602233204e-07, 'epoch': 1.84} {'loss': 0.5262, 'learning_rate': 2.977294714124346e-07, 'epoch': 1.84} {'loss': 0.4116, 'learning_rate': 2.976501929984077e-07, 'epoch': 1.84} {'loss': 0.5415, 'learning_rate': 2.97570924981323e-07, 'epoch': 1.84} {'loss': 0.5796, 'learning_rate': 2.9749166736126825e-07, 'epoch': 1.84} {'loss': 0.5687, 'learning_rate': 2.974124201383255e-07, 'epoch': 1.84} {'loss': 0.4951, 'learning_rate': 2.9733318331258256e-07, 'epoch': 1.84} {'loss': 0.5386, 'learning_rate': 2.972539568841215e-07, 'epoch': 1.84} {'loss': 0.4975, 'learning_rate': 2.97174740853029e-07, 'epoch': 1.84} {'loss': 0.4945, 'learning_rate': 2.970955352193905e-07, 'epoch': 1.84} {'loss': 0.4354, 'learning_rate': 2.9701633998328815e-07, 'epoch': 1.84} {'loss': 0.3841, 'learning_rate': 2.9693715514481083e-07, 'epoch': 1.84} {'loss': 0.4618, 'learning_rate': 2.968579807040395e-07, 'epoch': 1.84} {'loss': 0.437, 'learning_rate': 2.967788166610608e-07, 'epoch': 1.84} {'loss': 0.4408, 'learning_rate': 2.966996630159591e-07, 'epoch': 1.85} {'loss': 0.5969, 'learning_rate': 2.966205197688199e-07, 'epoch': 1.85} {'loss': 0.422, 'learning_rate': 2.9654138691972757e-07, 'epoch': 1.85} {'loss': 0.4908, 'learning_rate': 2.9646226446876646e-07, 'epoch': 1.85} {'loss': 0.5265, 'learning_rate': 2.963831524160221e-07, 'epoch': 1.85} {'loss': 0.5393, 'learning_rate': 2.9630405076158e-07, 'epoch': 1.85} {'loss': 0.667, 'learning_rate': 2.962249595055222e-07, 'epoch': 1.85} {'loss': 0.5762, 'learning_rate': 2.961458786479365e-07, 'epoch': 1.85} {'loss': 0.468, 'learning_rate': 2.960668081889051e-07, 'epoch': 1.85} {'loss': 0.5219, 'learning_rate': 2.959877481285156e-07, 'epoch': 1.85} {'loss': 0.4415, 'learning_rate': 2.959086984668491e-07, 'epoch': 1.85} {'loss': 0.4977, 'learning_rate': 2.9582965920399444e-07, 'epoch': 1.85} {'loss': 0.5147, 'learning_rate': 2.957506303400326e-07, 'epoch': 1.85} {'loss': 0.4637, 'learning_rate': 2.956716118750502e-07, 'epoch': 1.85} {'loss': 0.5304, 'learning_rate': 2.955926038091328e-07, 'epoch': 1.85} {'loss': 0.4053, 'learning_rate': 2.9551360614236134e-07, 'epoch': 1.85} {'loss': 0.4746, 'learning_rate': 2.954346188748247e-07, 'epoch': 1.85} {'loss': 0.461, 'learning_rate': 2.9535564200660504e-07, 'epoch': 1.85} {'loss': 0.51, 'learning_rate': 2.952766755377878e-07, 'epoch': 1.85} {'loss': 0.3036, 'learning_rate': 2.9519771946845743e-07, 'epoch': 1.85} {'loss': 0.4963, 'learning_rate': 2.9511877379869935e-07, 'epoch': 1.85} {'loss': 0.6215, 'learning_rate': 2.9503983852859686e-07, 'epoch': 1.85} {'loss': 0.5381, 'learning_rate': 2.949609136582343e-07, 'epoch': 1.85} {'loss': 0.4944, 'learning_rate': 2.948819991876983e-07, 'epoch': 1.85} {'loss': 0.7326, 'learning_rate': 2.9480309511707215e-07, 'epoch': 1.85} {'loss': 0.4807, 'learning_rate': 2.9472420144644023e-07, 'epoch': 1.85} {'loss': 0.4335, 'learning_rate': 2.9464531817588683e-07, 'epoch': 1.85} {'loss': 0.5854, 'learning_rate': 2.945664453054964e-07, 'epoch': 1.85} {'loss': 0.6014, 'learning_rate': 2.944875828353566e-07, 'epoch': 1.85} {'loss': 0.5872, 'learning_rate': 2.944087307655463e-07, 'epoch': 1.85} {'loss': 0.519, 'learning_rate': 2.943298890961543e-07, 'epoch': 1.85} {'loss': 0.3439, 'learning_rate': 2.9425105782726394e-07, 'epoch': 1.85} {'loss': 0.5071, 'learning_rate': 2.9417223695895946e-07, 'epoch': 1.85} {'loss': 0.4369, 'learning_rate': 2.940934264913253e-07, 'epoch': 1.85} {'loss': 0.6507, 'learning_rate': 2.940146264244459e-07, 'epoch': 1.85} {'loss': 0.5087, 'learning_rate': 2.9393583675840665e-07, 'epoch': 1.85} {'loss': 0.5121, 'learning_rate': 2.9385705749329084e-07, 'epoch': 1.85} {'loss': 0.5275, 'learning_rate': 2.937782886291829e-07, 'epoch': 1.85} {'loss': 0.5654, 'learning_rate': 2.9369953016616714e-07, 'epoch': 1.85} {'loss': 0.4583, 'learning_rate': 2.936207821043291e-07, 'epoch': 1.85} {'loss': 0.3618, 'learning_rate': 2.93542044443752e-07, 'epoch': 1.85} {'loss': 0.4576, 'learning_rate': 2.9346331718452136e-07, 'epoch': 1.85} {'loss': 0.2837, 'learning_rate': 2.9338460032672047e-07, 'epoch': 1.85} {'loss': 0.4331, 'learning_rate': 2.933058938704336e-07, 'epoch': 1.85} {'loss': 0.3634, 'learning_rate': 2.932271978157464e-07, 'epoch': 1.85} {'loss': 0.5935, 'learning_rate': 2.93148512162742e-07, 'epoch': 1.85} {'loss': 0.6409, 'learning_rate': 2.930698369115048e-07, 'epoch': 1.85} {'loss': 0.4361, 'learning_rate': 2.929911720621192e-07, 'epoch': 1.85} {'loss': 0.4919, 'learning_rate': 2.9291251761466965e-07, 'epoch': 1.85} {'loss': 0.4852, 'learning_rate': 2.9283387356924153e-07, 'epoch': 1.85} {'loss': 0.5934, 'learning_rate': 2.9275523992591704e-07, 'epoch': 1.85} {'loss': 0.6529, 'learning_rate': 2.926766166847816e-07, 'epoch': 1.85} {'loss': 0.4612, 'learning_rate': 2.9259800384591976e-07, 'epoch': 1.85} {'loss': 0.6253, 'learning_rate': 2.925194014094146e-07, 'epoch': 1.85} {'loss': 0.513, 'learning_rate': 2.924408093753517e-07, 'epoch': 1.85} {'loss': 0.5166, 'learning_rate': 2.923622277438154e-07, 'epoch': 1.85} {'loss': 0.4594, 'learning_rate': 2.9228365651488787e-07, 'epoch': 1.85} {'loss': 0.3664, 'learning_rate': 2.922050956886546e-07, 'epoch': 1.85} {'loss': 0.4623, 'learning_rate': 2.921265452651989e-07, 'epoch': 1.85} {'loss': 0.5956, 'learning_rate': 2.9204800524460733e-07, 'epoch': 1.85} {'loss': 0.5204, 'learning_rate': 2.9196947562696197e-07, 'epoch': 1.85} {'loss': 0.5699, 'learning_rate': 2.918909564123473e-07, 'epoch': 1.85} {'loss': 0.4402, 'learning_rate': 2.918124476008488e-07, 'epoch': 1.85} {'loss': 0.6411, 'learning_rate': 2.917339491925486e-07, 'epoch': 1.85} {'loss': 0.7053, 'learning_rate': 2.916554611875311e-07, 'epoch': 1.85} {'loss': 0.4628, 'learning_rate': 2.915769835858817e-07, 'epoch': 1.85} {'loss': 0.3895, 'learning_rate': 2.914985163876838e-07, 'epoch': 1.85} {'loss': 0.468, 'learning_rate': 2.914200595930217e-07, 'epoch': 1.85} {'loss': 0.542, 'learning_rate': 2.9134161320197865e-07, 'epoch': 1.85} {'loss': 0.5016, 'learning_rate': 2.9126317721464017e-07, 'epoch': 1.85} {'loss': 0.5272, 'learning_rate': 2.911847516310895e-07, 'epoch': 1.85} {'loss': 0.3128, 'learning_rate': 2.9110633645140997e-07, 'epoch': 1.85} {'loss': 0.431, 'learning_rate': 2.910279316756859e-07, 'epoch': 1.85} {'loss': 0.5262, 'learning_rate': 2.9094953730400167e-07, 'epoch': 1.85} {'loss': 0.4811, 'learning_rate': 2.9087115333644277e-07, 'epoch': 1.85} {'loss': 0.5096, 'learning_rate': 2.907927797730903e-07, 'epoch': 1.85} {'loss': 0.5011, 'learning_rate': 2.9071441661403077e-07, 'epoch': 1.85} {'loss': 0.565, 'learning_rate': 2.906360638593464e-07, 'epoch': 1.85} {'loss': 0.3861, 'learning_rate': 2.9055772150912156e-07, 'epoch': 1.85} {'loss': 0.5978, 'learning_rate': 2.904793895634406e-07, 'epoch': 1.85} {'loss': 0.4152, 'learning_rate': 2.904010680223879e-07, 'epoch': 1.85} {'loss': 0.3477, 'learning_rate': 2.903227568860467e-07, 'epoch': 1.85} {'loss': 0.5249, 'learning_rate': 2.9024445615450035e-07, 'epoch': 1.85} {'loss': 0.5598, 'learning_rate': 2.901661658278343e-07, 'epoch': 1.85} {'loss': 0.5111, 'learning_rate': 2.900878859061307e-07, 'epoch': 1.85} {'loss': 0.3456, 'learning_rate': 2.90009616389475e-07, 'epoch': 1.85} {'loss': 0.6201, 'learning_rate': 2.8993135727795053e-07, 'epoch': 1.85} {'loss': 0.5181, 'learning_rate': 2.898531085716394e-07, 'epoch': 1.85} {'loss': 0.6467, 'learning_rate': 2.897748702706293e-07, 'epoch': 1.85} {'loss': 0.4957, 'learning_rate': 2.896966423750003e-07, 'epoch': 1.85} {'loss': 0.6177, 'learning_rate': 2.896184248848377e-07, 'epoch': 1.85} {'loss': 0.5828, 'learning_rate': 2.89540217800226e-07, 'epoch': 1.85} {'loss': 0.4914, 'learning_rate': 2.8946202112124845e-07, 'epoch': 1.85} {'loss': 0.5746, 'learning_rate': 2.8938383484798935e-07, 'epoch': 1.85} {'loss': 0.5378, 'learning_rate': 2.8930565898052985e-07, 'epoch': 1.85} {'loss': 0.4983, 'learning_rate': 2.892274935189576e-07, 'epoch': 1.85} {'loss': 0.5544, 'learning_rate': 2.891493384633537e-07, 'epoch': 1.85} {'loss': 0.502, 'learning_rate': 2.8907119381380355e-07, 'epoch': 1.85} {'loss': 0.615, 'learning_rate': 2.8899305957038937e-07, 'epoch': 1.85} {'loss': 0.5513, 'learning_rate': 2.889149357331955e-07, 'epoch': 1.85} {'loss': 0.5358, 'learning_rate': 2.888368223023064e-07, 'epoch': 1.85} {'loss': 0.4121, 'learning_rate': 2.8875871927780405e-07, 'epoch': 1.85} {'loss': 0.6565, 'learning_rate': 2.8868062665977414e-07, 'epoch': 1.85} {'loss': 0.4958, 'learning_rate': 2.886025444482998e-07, 'epoch': 1.85} {'loss': 0.3452, 'learning_rate': 2.8852447264346326e-07, 'epoch': 1.85} {'loss': 0.5849, 'learning_rate': 2.884464112453511e-07, 'epoch': 1.85} {'loss': 0.6656, 'learning_rate': 2.8836836025404214e-07, 'epoch': 1.85} {'loss': 0.3223, 'learning_rate': 2.882903196696263e-07, 'epoch': 1.85} {'loss': 0.5047, 'learning_rate': 2.8821228949218014e-07, 'epoch': 1.85} {'loss': 0.4721, 'learning_rate': 2.8813426972179484e-07, 'epoch': 1.85} {'loss': 0.602, 'learning_rate': 2.880562603585479e-07, 'epoch': 1.85} {'loss': 0.4944, 'learning_rate': 2.8797826140252616e-07, 'epoch': 1.85} {'loss': 0.4266, 'learning_rate': 2.879002728538127e-07, 'epoch': 1.85} {'loss': 0.5235, 'learning_rate': 2.878222947124887e-07, 'epoch': 1.85} {'loss': 0.5586, 'learning_rate': 2.8774432697864173e-07, 'epoch': 1.85} {'loss': 0.3382, 'learning_rate': 2.8766636965235184e-07, 'epoch': 1.85} {'loss': 0.4567, 'learning_rate': 2.875884227337056e-07, 'epoch': 1.85} {'loss': 0.402, 'learning_rate': 2.87510486222784e-07, 'epoch': 1.85} {'loss': 0.6491, 'learning_rate': 2.8743256011967146e-07, 'epoch': 1.85} {'loss': 0.4839, 'learning_rate': 2.873546444244524e-07, 'epoch': 1.85} {'loss': 0.4587, 'learning_rate': 2.872767391372078e-07, 'epoch': 1.85} {'loss': 0.5258, 'learning_rate': 2.8719884425802537e-07, 'epoch': 1.85} {'loss': 0.3868, 'learning_rate': 2.8712095978698284e-07, 'epoch': 1.85} {'loss': 0.5631, 'learning_rate': 2.8704308572416905e-07, 'epoch': 1.85} {'loss': 0.4411, 'learning_rate': 2.8696522206966503e-07, 'epoch': 1.85} {'loss': 0.5585, 'learning_rate': 2.8688736882355407e-07, 'epoch': 1.85} {'loss': 0.5053, 'learning_rate': 2.868095259859205e-07, 'epoch': 1.85} {'loss': 0.6459, 'learning_rate': 2.8673169355684536e-07, 'epoch': 1.85} {'loss': 0.5853, 'learning_rate': 2.8665387153641644e-07, 'epoch': 1.85} {'loss': 0.5322, 'learning_rate': 2.865760599247114e-07, 'epoch': 1.85} {'loss': 0.5738, 'learning_rate': 2.8649825872182015e-07, 'epoch': 1.85} {'loss': 0.5343, 'learning_rate': 2.864204679278204e-07, 'epoch': 1.85} {'loss': 0.4758, 'learning_rate': 2.863426875427988e-07, 'epoch': 1.85} {'loss': 0.4672, 'learning_rate': 2.862649175668386e-07, 'epoch': 1.85} {'loss': 0.5928, 'learning_rate': 2.861871580000197e-07, 'epoch': 1.85} {'loss': 0.4664, 'learning_rate': 2.86109408842431e-07, 'epoch': 1.85} {'loss': 0.5017, 'learning_rate': 2.860316700941501e-07, 'epoch': 1.85} {'loss': 0.5683, 'learning_rate': 2.859539417552648e-07, 'epoch': 1.85} {'loss': 0.5693, 'learning_rate': 2.858762238258561e-07, 'epoch': 1.85} {'loss': 0.4812, 'learning_rate': 2.857985163060073e-07, 'epoch': 1.85} {'loss': 0.4745, 'learning_rate': 2.8572081919580384e-07, 'epoch': 1.85} {'loss': 0.5318, 'learning_rate': 2.856431324953246e-07, 'epoch': 1.85} {'loss': 0.4699, 'learning_rate': 2.8556545620465837e-07, 'epoch': 1.85} {'loss': 0.6461, 'learning_rate': 2.85487790323884e-07, 'epoch': 1.85} {'loss': 0.3784, 'learning_rate': 2.8541013485308576e-07, 'epoch': 1.85} {'loss': 0.4717, 'learning_rate': 2.853324897923482e-07, 'epoch': 1.85} {'loss': 0.5067, 'learning_rate': 2.852548551417533e-07, 'epoch': 1.85} {'loss': 0.5513, 'learning_rate': 2.851772309013856e-07, 'epoch': 1.85} {'loss': 0.5018, 'learning_rate': 2.8509961707132496e-07, 'epoch': 1.85} {'loss': 0.5928, 'learning_rate': 2.850220136516602e-07, 'epoch': 1.85} {'loss': 0.4624, 'learning_rate': 2.84944420642469e-07, 'epoch': 1.85} {'loss': 0.5831, 'learning_rate': 2.8486683804383687e-07, 'epoch': 1.85} {'loss': 0.4669, 'learning_rate': 2.847892658558471e-07, 'epoch': 1.85} {'loss': 0.5869, 'learning_rate': 2.8471170407858184e-07, 'epoch': 1.85} {'loss': 0.4846, 'learning_rate': 2.846341527121266e-07, 'epoch': 1.85} {'loss': 0.5322, 'learning_rate': 2.8455661175656013e-07, 'epoch': 1.85} {'loss': 0.553, 'learning_rate': 2.844790812119702e-07, 'epoch': 1.85} {'loss': 0.5113, 'learning_rate': 2.8440156107843676e-07, 'epoch': 1.85} {'loss': 0.4682, 'learning_rate': 2.8432405135604413e-07, 'epoch': 1.85} {'loss': 0.6296, 'learning_rate': 2.842465520448756e-07, 'epoch': 1.85} {'loss': 0.4536, 'learning_rate': 2.8416906314501334e-07, 'epoch': 1.85} {'loss': 0.6217, 'learning_rate': 2.840915846565417e-07, 'epoch': 1.85} {'loss': 0.5362, 'learning_rate': 2.840141165795429e-07, 'epoch': 1.85} {'loss': 0.484, 'learning_rate': 2.8393665891409904e-07, 'epoch': 1.85} {'loss': 0.5124, 'learning_rate': 2.838592116602934e-07, 'epoch': 1.85} {'loss': 0.4946, 'learning_rate': 2.8378177481821037e-07, 'epoch': 1.85} {'loss': 0.3303, 'learning_rate': 2.83704348387932e-07, 'epoch': 1.85} {'loss': 0.5027, 'learning_rate': 2.836269323695406e-07, 'epoch': 1.85} {'loss': 0.525, 'learning_rate': 2.835495267631216e-07, 'epoch': 1.85} {'loss': 0.46, 'learning_rate': 2.834721315687561e-07, 'epoch': 1.85} {'loss': 0.4775, 'learning_rate': 2.833947467865261e-07, 'epoch': 1.85} {'loss': 0.6778, 'learning_rate': 2.83317372416515e-07, 'epoch': 1.85} {'loss': 0.5467, 'learning_rate': 2.8324000845880716e-07, 'epoch': 1.85} {'loss': 0.4289, 'learning_rate': 2.831626549134858e-07, 'epoch': 1.85} {'loss': 0.4872, 'learning_rate': 2.8308531178063204e-07, 'epoch': 1.85} {'loss': 0.517, 'learning_rate': 2.8300797906032793e-07, 'epoch': 1.85} {'loss': 0.5223, 'learning_rate': 2.829306567526591e-07, 'epoch': 1.85} {'loss': 0.4034, 'learning_rate': 2.8285334485770644e-07, 'epoch': 1.85} {'loss': 0.567, 'learning_rate': 2.8277604337555333e-07, 'epoch': 1.85} {'loss': 0.5004, 'learning_rate': 2.8269875230628297e-07, 'epoch': 1.85} {'loss': 0.5169, 'learning_rate': 2.826214716499798e-07, 'epoch': 1.85} {'loss': 0.4205, 'learning_rate': 2.8254420140672254e-07, 'epoch': 1.85} {'loss': 0.4832, 'learning_rate': 2.824669415765968e-07, 'epoch': 1.85} {'loss': 0.7263, 'learning_rate': 2.823896921596847e-07, 'epoch': 1.85} {'loss': 0.5711, 'learning_rate': 2.8231245315606947e-07, 'epoch': 1.85} {'loss': 0.5751, 'learning_rate': 2.822352245658322e-07, 'epoch': 1.85} {'loss': 0.5631, 'learning_rate': 2.821580063890583e-07, 'epoch': 1.85} {'loss': 0.3899, 'learning_rate': 2.8208079862583006e-07, 'epoch': 1.85} {'loss': 0.4576, 'learning_rate': 2.820036012762273e-07, 'epoch': 1.85} {'loss': 0.5263, 'learning_rate': 2.819264143403355e-07, 'epoch': 1.85} {'loss': 0.5052, 'learning_rate': 2.8184923781823693e-07, 'epoch': 1.85} {'loss': 0.434, 'learning_rate': 2.817720717100136e-07, 'epoch': 1.85} {'loss': 0.5578, 'learning_rate': 2.8169491601574896e-07, 'epoch': 1.85} {'loss': 0.4852, 'learning_rate': 2.816177707355261e-07, 'epoch': 1.85} {'loss': 0.5144, 'learning_rate': 2.8154063586942616e-07, 'epoch': 1.85} {'loss': 0.401, 'learning_rate': 2.8146351141753236e-07, 'epoch': 1.85} {'loss': 0.6529, 'learning_rate': 2.81386397379928e-07, 'epoch': 1.85} {'loss': 0.51, 'learning_rate': 2.8130929375669524e-07, 'epoch': 1.85} {'loss': 0.7236, 'learning_rate': 2.812322005479162e-07, 'epoch': 1.85} {'loss': 0.4515, 'learning_rate': 2.811551177536742e-07, 'epoch': 1.85} {'loss': 0.5571, 'learning_rate': 2.810780453740525e-07, 'epoch': 1.85} {'loss': 0.4817, 'learning_rate': 2.8100098340913206e-07, 'epoch': 1.85} {'loss': 0.4678, 'learning_rate': 2.8092393185899625e-07, 'epoch': 1.85} {'loss': 0.6306, 'learning_rate': 2.8084689072372716e-07, 'epoch': 1.85} {'loss': 0.4871, 'learning_rate': 2.807698600034092e-07, 'epoch': 1.85} {'loss': 0.5993, 'learning_rate': 2.806928396981223e-07, 'epoch': 1.85} {'loss': 0.6364, 'learning_rate': 2.806158298079509e-07, 'epoch': 1.85} {'loss': 0.5751, 'learning_rate': 2.80538830332977e-07, 'epoch': 1.85} {'loss': 0.5331, 'learning_rate': 2.804618412732829e-07, 'epoch': 1.85} {'loss': 0.5719, 'learning_rate': 2.803848626289507e-07, 'epoch': 1.85} {'loss': 0.4633, 'learning_rate': 2.8030789440006365e-07, 'epoch': 1.85} {'loss': 0.6353, 'learning_rate': 2.8023093658670396e-07, 'epoch': 1.85} {'loss': 0.4191, 'learning_rate': 2.801539891889549e-07, 'epoch': 1.85} {'loss': 0.5761, 'learning_rate': 2.8007705220689627e-07, 'epoch': 1.85} {'loss': 0.6033, 'learning_rate': 2.800001256406137e-07, 'epoch': 1.85} {'loss': 0.4752, 'learning_rate': 2.7992320949018827e-07, 'epoch': 1.85} {'loss': 0.5544, 'learning_rate': 2.79846303755702e-07, 'epoch': 1.85} {'loss': 0.3246, 'learning_rate': 2.797694084372382e-07, 'epoch': 1.85} {'loss': 0.4259, 'learning_rate': 2.79692523534878e-07, 'epoch': 1.85} {'loss': 0.5421, 'learning_rate': 2.796156490487056e-07, 'epoch': 1.85} {'loss': 0.4737, 'learning_rate': 2.7953878497880116e-07, 'epoch': 1.85} {'loss': 0.4588, 'learning_rate': 2.794619313252489e-07, 'epoch': 1.85} {'loss': 0.5655, 'learning_rate': 2.79385088088131e-07, 'epoch': 1.85} {'loss': 0.4461, 'learning_rate': 2.793082552675286e-07, 'epoch': 1.85} {'loss': 0.4044, 'learning_rate': 2.7923143286352484e-07, 'epoch': 1.85} {'loss': 0.4766, 'learning_rate': 2.7915462087620194e-07, 'epoch': 1.85} {'loss': 0.4708, 'learning_rate': 2.7907781930564317e-07, 'epoch': 1.85} {'loss': 0.5271, 'learning_rate': 2.790010281519273e-07, 'epoch': 1.85} {'loss': 0.5181, 'learning_rate': 2.7892424741514214e-07, 'epoch': 1.85} {'loss': 0.5744, 'learning_rate': 2.788474770953653e-07, 'epoch': 1.85} {'loss': 0.3894, 'learning_rate': 2.787707171926812e-07, 'epoch': 1.85} {'loss': 0.3747, 'learning_rate': 2.7869396770717315e-07, 'epoch': 1.85} {'loss': 0.6537, 'learning_rate': 2.786172286389188e-07, 'epoch': 1.85} {'loss': 0.4981, 'learning_rate': 2.785404999880059e-07, 'epoch': 1.85} {'loss': 0.3828, 'learning_rate': 2.7846378175451214e-07, 'epoch': 1.85} {'loss': 0.5643, 'learning_rate': 2.783870739385253e-07, 'epoch': 1.85} {'loss': 0.5327, 'learning_rate': 2.7831037654012183e-07, 'epoch': 1.85} {'loss': 0.5022, 'learning_rate': 2.7823368955938623e-07, 'epoch': 1.85} {'loss': 0.6002, 'learning_rate': 2.7815701299640177e-07, 'epoch': 1.85} {'loss': 0.5209, 'learning_rate': 2.780803468512472e-07, 'epoch': 1.85} {'loss': 0.4157, 'learning_rate': 2.7800369112400914e-07, 'epoch': 1.85} {'loss': 0.5376, 'learning_rate': 2.779270458147676e-07, 'epoch': 1.85} {'loss': 0.4546, 'learning_rate': 2.7785041092360353e-07, 'epoch': 1.85} {'loss': 0.6079, 'learning_rate': 2.7777378645060136e-07, 'epoch': 1.85} {'loss': 0.4019, 'learning_rate': 2.7769717239584107e-07, 'epoch': 1.85} {'loss': 0.5627, 'learning_rate': 2.7762056875940693e-07, 'epoch': 1.85} {'loss': 0.5741, 'learning_rate': 2.775439755413778e-07, 'epoch': 1.85} {'loss': 0.5926, 'learning_rate': 2.774673927418403e-07, 'epoch': 1.85} {'loss': 0.4843, 'learning_rate': 2.773908203608722e-07, 'epoch': 1.85} {'loss': 0.4699, 'learning_rate': 2.773142583985577e-07, 'epoch': 1.85} {'loss': 0.602, 'learning_rate': 2.772377068549792e-07, 'epoch': 1.85} {'loss': 0.5108, 'learning_rate': 2.7716116573021754e-07, 'epoch': 1.85} {'loss': 0.5129, 'learning_rate': 2.7708463502435614e-07, 'epoch': 1.85} {'loss': 0.5824, 'learning_rate': 2.770081147374737e-07, 'epoch': 1.85} {'loss': 0.416, 'learning_rate': 2.7693160486965685e-07, 'epoch': 1.85} {'loss': 0.4597, 'learning_rate': 2.7685510542098446e-07, 'epoch': 1.85} {'loss': 0.5452, 'learning_rate': 2.767786163915398e-07, 'epoch': 1.85} {'loss': 0.4096, 'learning_rate': 2.76702137781405e-07, 'epoch': 1.85} {'loss': 0.4385, 'learning_rate': 2.7662566959065997e-07, 'epoch': 1.85} {'loss': 0.511, 'learning_rate': 2.765492118193891e-07, 'epoch': 1.85} {'loss': 0.4832, 'learning_rate': 2.7647276446767236e-07, 'epoch': 1.85} {'loss': 0.3672, 'learning_rate': 2.763963275355941e-07, 'epoch': 1.85} {'loss': 0.6378, 'learning_rate': 2.7631990102323315e-07, 'epoch': 1.85} {'loss': 0.5473, 'learning_rate': 2.762434849306739e-07, 'epoch': 1.85} {'loss': 0.6853, 'learning_rate': 2.7616707925799846e-07, 'epoch': 1.85} {'loss': 0.3854, 'learning_rate': 2.760906840052857e-07, 'epoch': 1.85} {'loss': 0.403, 'learning_rate': 2.760142991726211e-07, 'epoch': 1.85} {'loss': 0.4584, 'learning_rate': 2.7593792476008243e-07, 'epoch': 1.85} {'loss': 0.6752, 'learning_rate': 2.7586156076775726e-07, 'epoch': 1.85} {'loss': 0.6786, 'learning_rate': 2.757852071957212e-07, 'epoch': 1.85} {'loss': 0.3873, 'learning_rate': 2.7570886404406083e-07, 'epoch': 1.85} {'loss': 0.4652, 'learning_rate': 2.756325313128561e-07, 'epoch': 1.85} {'loss': 0.5056, 'learning_rate': 2.755562090021868e-07, 'epoch': 1.85} {'loss': 0.4532, 'learning_rate': 2.754798971121386e-07, 'epoch': 1.85} {'loss': 0.4671, 'learning_rate': 2.7540359564278917e-07, 'epoch': 1.85} {'loss': 0.488, 'learning_rate': 2.753273045942251e-07, 'epoch': 1.85} {'loss': 0.3643, 'learning_rate': 2.7525102396652403e-07, 'epoch': 1.85} {'loss': 0.604, 'learning_rate': 2.7517475375977043e-07, 'epoch': 1.85} {'loss': 0.5788, 'learning_rate': 2.750984939740442e-07, 'epoch': 1.85} {'loss': 0.5116, 'learning_rate': 2.750222446094264e-07, 'epoch': 1.85} {'loss': 0.4555, 'learning_rate': 2.749460056660025e-07, 'epoch': 1.85} {'loss': 0.4439, 'learning_rate': 2.7486977714385024e-07, 'epoch': 1.85} {'loss': 0.5401, 'learning_rate': 2.747935590430517e-07, 'epoch': 1.85} {'loss': 0.5554, 'learning_rate': 2.7471735136369137e-07, 'epoch': 1.85} {'loss': 0.5083, 'learning_rate': 2.74641154105848e-07, 'epoch': 1.85} {'loss': 0.5844, 'learning_rate': 2.7456496726960604e-07, 'epoch': 1.85} {'loss': 0.5494, 'learning_rate': 2.744887908550431e-07, 'epoch': 1.85} {'loss': 0.511, 'learning_rate': 2.7441262486224473e-07, 'epoch': 1.85} {'loss': 0.5982, 'learning_rate': 2.743364692912909e-07, 'epoch': 1.85} {'loss': 0.5323, 'learning_rate': 2.7426032414226255e-07, 'epoch': 1.85} {'loss': 0.478, 'learning_rate': 2.7418418941524307e-07, 'epoch': 1.85} {'loss': 0.5159, 'learning_rate': 2.741080651103123e-07, 'epoch': 1.85} {'loss': 0.4068, 'learning_rate': 2.7403195122755356e-07, 'epoch': 1.85} {'loss': 0.5679, 'learning_rate': 2.7395584776704564e-07, 'epoch': 1.85} {'loss': 0.6366, 'learning_rate': 2.7387975472887404e-07, 'epoch': 1.85} {'loss': 0.4152, 'learning_rate': 2.7380367211311766e-07, 'epoch': 1.85} {'loss': 0.439, 'learning_rate': 2.7372759991985743e-07, 'epoch': 1.85} {'loss': 0.5992, 'learning_rate': 2.7365153814917556e-07, 'epoch': 1.85} {'loss': 0.5382, 'learning_rate': 2.735754868011553e-07, 'epoch': 1.85} {'loss': 0.4865, 'learning_rate': 2.7349944587587665e-07, 'epoch': 1.85} {'loss': 0.4157, 'learning_rate': 2.7342341537342053e-07, 'epoch': 1.85} {'loss': 0.5714, 'learning_rate': 2.733473952938692e-07, 'epoch': 1.85} {'loss': 0.5609, 'learning_rate': 2.7327138563730484e-07, 'epoch': 1.85} {'loss': 0.5078, 'learning_rate': 2.7319538640380726e-07, 'epoch': 1.85} {'loss': 0.5482, 'learning_rate': 2.7311939759345874e-07, 'epoch': 1.85} {'loss': 0.5, 'learning_rate': 2.7304341920634027e-07, 'epoch': 1.85} {'loss': 0.445, 'learning_rate': 2.729674512425351e-07, 'epoch': 1.85} {'loss': 0.5332, 'learning_rate': 2.728914937021221e-07, 'epoch': 1.85} {'loss': 0.5092, 'learning_rate': 2.728155465851845e-07, 'epoch': 1.85} {'loss': 0.5118, 'learning_rate': 2.7273960989180224e-07, 'epoch': 1.85} {'loss': 0.5147, 'learning_rate': 2.7266368362205753e-07, 'epoch': 1.85} {'loss': 0.4947, 'learning_rate': 2.7258776777603134e-07, 'epoch': 1.85} {'loss': 0.4247, 'learning_rate': 2.725118623538059e-07, 'epoch': 1.85} {'loss': 0.5909, 'learning_rate': 2.724359673554622e-07, 'epoch': 1.85} {'loss': 0.4867, 'learning_rate': 2.723600827810813e-07, 'epoch': 1.85} {'loss': 0.5944, 'learning_rate': 2.722842086307442e-07, 'epoch': 1.85} {'loss': 0.4005, 'learning_rate': 2.722083449045321e-07, 'epoch': 1.85} {'loss': 0.4694, 'learning_rate': 2.7213249160252696e-07, 'epoch': 1.85} {'loss': 0.5418, 'learning_rate': 2.7205664872481e-07, 'epoch': 1.85} {'loss': 0.5411, 'learning_rate': 2.7198081627146323e-07, 'epoch': 1.85} {'loss': 0.5744, 'learning_rate': 2.719049942425667e-07, 'epoch': 1.85} {'loss': 0.5715, 'learning_rate': 2.7182918263820133e-07, 'epoch': 1.85} {'loss': 0.4783, 'learning_rate': 2.7175338145844945e-07, 'epoch': 1.85} {'loss': 0.482, 'learning_rate': 2.716775907033908e-07, 'epoch': 1.85} {'loss': 0.5652, 'learning_rate': 2.716018103731088e-07, 'epoch': 1.85} {'loss': 0.6394, 'learning_rate': 2.715260404676834e-07, 'epoch': 1.85} {'loss': 0.516, 'learning_rate': 2.714502809871955e-07, 'epoch': 1.85} {'loss': 0.5005, 'learning_rate': 2.7137453193172735e-07, 'epoch': 1.85} {'loss': 0.4085, 'learning_rate': 2.712987933013589e-07, 'epoch': 1.85} {'loss': 0.5894, 'learning_rate': 2.7122306509617113e-07, 'epoch': 1.85} {'loss': 0.3708, 'learning_rate': 2.711473473162474e-07, 'epoch': 1.85} {'loss': 0.5068, 'learning_rate': 2.7107163996166644e-07, 'epoch': 1.85} {'loss': 0.4099, 'learning_rate': 2.7099594303251043e-07, 'epoch': 1.85} {'loss': 0.4598, 'learning_rate': 2.7092025652886045e-07, 'epoch': 1.85} {'loss': 0.2756, 'learning_rate': 2.7084458045079755e-07, 'epoch': 1.85} {'loss': 0.4169, 'learning_rate': 2.7076891479840273e-07, 'epoch': 1.85} {'loss': 0.515, 'learning_rate': 2.7069325957175705e-07, 'epoch': 1.85} {'loss': 0.5577, 'learning_rate': 2.706176147709416e-07, 'epoch': 1.85} {'loss': 0.5892, 'learning_rate': 2.7054198039603853e-07, 'epoch': 1.85} {'loss': 0.4758, 'learning_rate': 2.704663564471277e-07, 'epoch': 1.85} {'loss': 0.4373, 'learning_rate': 2.7039074292428915e-07, 'epoch': 1.85} {'loss': 0.5879, 'learning_rate': 2.703151398276049e-07, 'epoch': 1.85} {'loss': 0.582, 'learning_rate': 2.702395471571573e-07, 'epoch': 1.85} {'loss': 0.5698, 'learning_rate': 2.70163964913025e-07, 'epoch': 1.85} {'loss': 0.526, 'learning_rate': 2.700883930952913e-07, 'epoch': 1.85} {'loss': 0.2325, 'learning_rate': 2.7001283170403623e-07, 'epoch': 1.85} {'loss': 0.5819, 'learning_rate': 2.6993728073933967e-07, 'epoch': 1.85} {'loss': 0.6222, 'learning_rate': 2.6986174020128374e-07, 'epoch': 1.85} {'loss': 0.4253, 'learning_rate': 2.6978621008994955e-07, 'epoch': 1.85} {'loss': 0.5956, 'learning_rate': 2.69710690405417e-07, 'epoch': 1.85} {'loss': 0.6478, 'learning_rate': 2.696351811477693e-07, 'epoch': 1.85} {'loss': 0.5647, 'learning_rate': 2.695596823170832e-07, 'epoch': 1.85} {'loss': 0.4608, 'learning_rate': 2.6948419391344405e-07, 'epoch': 1.85} {'loss': 0.3616, 'learning_rate': 2.6940871593692964e-07, 'epoch': 1.85} {'loss': 0.5793, 'learning_rate': 2.693332483876232e-07, 'epoch': 1.85} {'loss': 0.3877, 'learning_rate': 2.692577912656036e-07, 'epoch': 1.85} {'loss': 0.4111, 'learning_rate': 2.6918234457095183e-07, 'epoch': 1.85} {'loss': 0.541, 'learning_rate': 2.691069083037512e-07, 'epoch': 1.85} {'loss': 0.5343, 'learning_rate': 2.690314824640794e-07, 'epoch': 1.85} {'loss': 0.4181, 'learning_rate': 2.689560670520197e-07, 'epoch': 1.85} {'loss': 0.5769, 'learning_rate': 2.6888066206765096e-07, 'epoch': 1.85} {'loss': 0.4683, 'learning_rate': 2.688052675110553e-07, 'epoch': 1.85} {'loss': 0.4286, 'learning_rate': 2.6872988338231266e-07, 'epoch': 1.85} {'loss': 0.4185, 'learning_rate': 2.686545096815052e-07, 'epoch': 1.85} {'loss': 0.4203, 'learning_rate': 2.6857914640871284e-07, 'epoch': 1.85} {'loss': 0.4607, 'learning_rate': 2.6850379356401446e-07, 'epoch': 1.85} {'loss': 0.4137, 'learning_rate': 2.684284511474944e-07, 'epoch': 1.85} {'loss': 0.7002, 'learning_rate': 2.6835311915923036e-07, 'epoch': 1.85} {'loss': 0.5703, 'learning_rate': 2.682777975993045e-07, 'epoch': 1.85} {'loss': 0.4973, 'learning_rate': 2.68202486467799e-07, 'epoch': 1.85} {'loss': 0.5884, 'learning_rate': 2.6812718576479045e-07, 'epoch': 1.85} {'loss': 0.5172, 'learning_rate': 2.6805189549036327e-07, 'epoch': 1.85} {'loss': 0.5091, 'learning_rate': 2.679766156445962e-07, 'epoch': 1.85} {'loss': 0.5198, 'learning_rate': 2.6790134622757146e-07, 'epoch': 1.85} {'loss': 0.5053, 'learning_rate': 2.678260872393679e-07, 'epoch': 1.85} {'loss': 0.6471, 'learning_rate': 2.677508386800676e-07, 'epoch': 1.85} {'loss': 0.5004, 'learning_rate': 2.676756005497516e-07, 'epoch': 1.85} {'loss': 0.4207, 'learning_rate': 2.676003728484966e-07, 'epoch': 1.85} {'loss': 0.4572, 'learning_rate': 2.6752515557638915e-07, 'epoch': 1.85} {'loss': 0.4688, 'learning_rate': 2.674499487335047e-07, 'epoch': 1.85} {'loss': 0.5334, 'learning_rate': 2.673747523199288e-07, 'epoch': 1.85} {'loss': 0.5227, 'learning_rate': 2.6729956633573695e-07, 'epoch': 1.85} {'loss': 0.4571, 'learning_rate': 2.6722439078101236e-07, 'epoch': 1.85} {'loss': 0.4622, 'learning_rate': 2.6714922565583723e-07, 'epoch': 1.85} {'loss': 0.4817, 'learning_rate': 2.6707407096028704e-07, 'epoch': 1.85} {'loss': 0.506, 'learning_rate': 2.669989266944484e-07, 'epoch': 1.85} {'loss': 0.6464, 'learning_rate': 2.6692379285839563e-07, 'epoch': 1.85} {'loss': 0.6043, 'learning_rate': 2.6684866945221546e-07, 'epoch': 1.85} {'loss': 0.3864, 'learning_rate': 2.667735564759844e-07, 'epoch': 1.85} {'loss': 0.4662, 'learning_rate': 2.6669845392978343e-07, 'epoch': 1.85} {'loss': 0.3837, 'learning_rate': 2.6662336181369485e-07, 'epoch': 1.85} {'loss': 0.5994, 'learning_rate': 2.6654828012779633e-07, 'epoch': 1.85} {'loss': 0.4221, 'learning_rate': 2.664732088721711e-07, 'epoch': 1.85} {'loss': 0.5233, 'learning_rate': 2.66398148046898e-07, 'epoch': 1.85} {'loss': 0.5264, 'learning_rate': 2.66323097652057e-07, 'epoch': 1.85} {'loss': 0.5539, 'learning_rate': 2.662480576877291e-07, 'epoch': 1.85} {'loss': 0.2972, 'learning_rate': 2.661730281539954e-07, 'epoch': 1.85} {'loss': 0.3883, 'learning_rate': 2.6609800905093687e-07, 'epoch': 1.85} {'loss': 0.4326, 'learning_rate': 2.6602300037863127e-07, 'epoch': 1.85} {'loss': 0.4865, 'learning_rate': 2.6594800213716187e-07, 'epoch': 1.85} {'loss': 0.5292, 'learning_rate': 2.658730143266075e-07, 'epoch': 1.85} {'loss': 0.6057, 'learning_rate': 2.657980369470481e-07, 'epoch': 1.85} {'loss': 0.4758, 'learning_rate': 2.657230699985658e-07, 'epoch': 1.85} {'loss': 0.5419, 'learning_rate': 2.656481134812383e-07, 'epoch': 1.85} {'loss': 0.4657, 'learning_rate': 2.6557316739514893e-07, 'epoch': 1.85} {'loss': 0.6536, 'learning_rate': 2.6549823174037427e-07, 'epoch': 1.85} {'loss': 0.4266, 'learning_rate': 2.6542330651699977e-07, 'epoch': 1.85} {'loss': 0.4317, 'learning_rate': 2.65348391725101e-07, 'epoch': 1.85} {'loss': 0.5071, 'learning_rate': 2.6527348736476e-07, 'epoch': 1.85} {'loss': 0.4896, 'learning_rate': 2.65198593436059e-07, 'epoch': 1.85} {'loss': 0.5053, 'learning_rate': 2.6512370993907355e-07, 'epoch': 1.85} {'loss': 0.7055, 'learning_rate': 2.6504883687388905e-07, 'epoch': 1.85} {'loss': 0.538, 'learning_rate': 2.64973974240581e-07, 'epoch': 1.85} {'loss': 0.5006, 'learning_rate': 2.6489912203923387e-07, 'epoch': 1.85} {'loss': 0.5328, 'learning_rate': 2.6482428026992523e-07, 'epoch': 1.85} {'loss': 0.5325, 'learning_rate': 2.6474944893273515e-07, 'epoch': 1.85} {'loss': 0.5449, 'learning_rate': 2.646746280277468e-07, 'epoch': 1.85} {'loss': 0.3952, 'learning_rate': 2.645998175550357e-07, 'epoch': 1.85} {'loss': 0.5227, 'learning_rate': 2.645250175146874e-07, 'epoch': 1.85} {'loss': 0.5609, 'learning_rate': 2.6445022790677624e-07, 'epoch': 1.85} {'loss': 0.4386, 'learning_rate': 2.6437544873138764e-07, 'epoch': 1.85} {'loss': 0.4817, 'learning_rate': 2.6430067998859945e-07, 'epoch': 1.85} {'loss': 0.3836, 'learning_rate': 2.642259216784904e-07, 'epoch': 1.85} {'loss': 0.4775, 'learning_rate': 2.6415117380114373e-07, 'epoch': 1.85} {'loss': 0.5191, 'learning_rate': 2.64076436356635e-07, 'epoch': 1.85} {'loss': 0.561, 'learning_rate': 2.6400170934504976e-07, 'epoch': 1.85} {'loss': 0.3867, 'learning_rate': 2.639269927664645e-07, 'epoch': 1.85} {'loss': 0.4697, 'learning_rate': 2.638522866209603e-07, 'epoch': 1.85} {'loss': 0.3493, 'learning_rate': 2.63777590908616e-07, 'epoch': 1.85} {'loss': 0.4338, 'learning_rate': 2.6370290562951374e-07, 'epoch': 1.85} {'loss': 0.3922, 'learning_rate': 2.6362823078373346e-07, 'epoch': 1.85} {'loss': 0.4344, 'learning_rate': 2.6355356637135287e-07, 'epoch': 1.85} {'loss': 0.3817, 'learning_rate': 2.6347891239245413e-07, 'epoch': 1.85} {'loss': 0.4446, 'learning_rate': 2.6340426884711613e-07, 'epoch': 1.85} {'loss': 0.4804, 'learning_rate': 2.633296357354198e-07, 'epoch': 1.85} {'loss': 0.5911, 'learning_rate': 2.6325501305744403e-07, 'epoch': 1.85} {'loss': 0.5312, 'learning_rate': 2.631804008132688e-07, 'epoch': 1.85} {'loss': 0.3751, 'learning_rate': 2.631057990029762e-07, 'epoch': 1.85} {'loss': 0.5486, 'learning_rate': 2.630312076266428e-07, 'epoch': 1.85} {'loss': 0.4261, 'learning_rate': 2.6295662668435086e-07, 'epoch': 1.85} {'loss': 0.4028, 'learning_rate': 2.6288205617618023e-07, 'epoch': 1.85} {'loss': 0.4639, 'learning_rate': 2.628074961022098e-07, 'epoch': 1.85} {'loss': 0.5397, 'learning_rate': 2.6273294646252056e-07, 'epoch': 1.85} {'loss': 0.4468, 'learning_rate': 2.6265840725719027e-07, 'epoch': 1.85} {'loss': 0.5505, 'learning_rate': 2.6258387848630327e-07, 'epoch': 1.85} {'loss': 0.3665, 'learning_rate': 2.62509360149934e-07, 'epoch': 1.85} {'loss': 0.5807, 'learning_rate': 2.624348522481657e-07, 'epoch': 1.85} {'loss': 0.5352, 'learning_rate': 2.6236035478107713e-07, 'epoch': 1.85} {'loss': 0.3492, 'learning_rate': 2.622858677487472e-07, 'epoch': 1.85} {'loss': 0.3564, 'learning_rate': 2.6221139115125804e-07, 'epoch': 1.85} {'loss': 0.6858, 'learning_rate': 2.6213692498868846e-07, 'epoch': 1.85} {'loss': 0.6036, 'learning_rate': 2.6206246926111846e-07, 'epoch': 1.85} {'loss': 0.5566, 'learning_rate': 2.6198802396862676e-07, 'epoch': 1.85} {'loss': 0.4922, 'learning_rate': 2.619135891112934e-07, 'epoch': 1.85} {'loss': 0.6169, 'learning_rate': 2.618391646891993e-07, 'epoch': 1.85} {'loss': 0.4422, 'learning_rate': 2.6176475070242236e-07, 'epoch': 1.85} {'loss': 0.4581, 'learning_rate': 2.6169034715104455e-07, 'epoch': 1.85} {'loss': 0.3872, 'learning_rate': 2.6161595403514485e-07, 'epoch': 1.85} {'loss': 0.3729, 'learning_rate': 2.6154157135480196e-07, 'epoch': 1.85} {'loss': 0.5215, 'learning_rate': 2.614671991100959e-07, 'epoch': 1.85} {'loss': 0.4685, 'learning_rate': 2.6139283730110656e-07, 'epoch': 1.85} {'loss': 0.6987, 'learning_rate': 2.6131848592791387e-07, 'epoch': 1.85} {'loss': 0.3014, 'learning_rate': 2.612441449905978e-07, 'epoch': 1.85} {'loss': 0.3883, 'learning_rate': 2.611698144892372e-07, 'epoch': 1.85} {'loss': 0.4971, 'learning_rate': 2.6109549442391303e-07, 'epoch': 1.85} {'loss': 0.6769, 'learning_rate': 2.610211847947031e-07, 'epoch': 1.85} {'loss': 0.5634, 'learning_rate': 2.6094688560168837e-07, 'epoch': 1.85} {'loss': 0.5111, 'learning_rate': 2.608725968449477e-07, 'epoch': 1.85} {'loss': 0.4537, 'learning_rate': 2.6079831852456104e-07, 'epoch': 1.85} {'loss': 0.5881, 'learning_rate': 2.6072405064060725e-07, 'epoch': 1.85} {'loss': 0.4982, 'learning_rate': 2.606497931931684e-07, 'epoch': 1.85} {'loss': 0.5293, 'learning_rate': 2.6057554618232226e-07, 'epoch': 1.85} {'loss': 0.4352, 'learning_rate': 2.6050130960814765e-07, 'epoch': 1.85} {'loss': 0.3966, 'learning_rate': 2.6042708347072455e-07, 'epoch': 1.85} {'loss': 0.511, 'learning_rate': 2.603528677701328e-07, 'epoch': 1.85} {'loss': 0.3528, 'learning_rate': 2.602786625064524e-07, 'epoch': 1.85} {'loss': 0.3868, 'learning_rate': 2.602044676797644e-07, 'epoch': 1.85} {'loss': 0.4671, 'learning_rate': 2.601302832901431e-07, 'epoch': 1.85} {'loss': 0.449, 'learning_rate': 2.600561093376741e-07, 'epoch': 1.85} {'loss': 0.4273, 'learning_rate': 2.5998194582243177e-07, 'epoch': 1.85} {'loss': 0.3787, 'learning_rate': 2.599077927444993e-07, 'epoch': 1.85} {'loss': 0.4667, 'learning_rate': 2.5983365010395447e-07, 'epoch': 1.86} {'loss': 0.4544, 'learning_rate': 2.5975951790087607e-07, 'epoch': 1.86} {'loss': 0.5738, 'learning_rate': 2.596853961353463e-07, 'epoch': 1.86} {'loss': 0.4403, 'learning_rate': 2.596112848074417e-07, 'epoch': 1.86} {'loss': 0.5078, 'learning_rate': 2.5953718391724224e-07, 'epoch': 1.86} {'loss': 0.3315, 'learning_rate': 2.594630934648279e-07, 'epoch': 1.86} {'loss': 0.4268, 'learning_rate': 2.5938901345027855e-07, 'epoch': 1.86} {'loss': 0.4083, 'learning_rate': 2.593149438736731e-07, 'epoch': 1.86} {'loss': 0.4314, 'learning_rate': 2.5924088473509025e-07, 'epoch': 1.86} {'loss': 0.483, 'learning_rate': 2.591668360346111e-07, 'epoch': 1.86} {'loss': 0.4441, 'learning_rate': 2.590927977723123e-07, 'epoch': 1.86} {'loss': 0.6068, 'learning_rate': 2.59018769948276e-07, 'epoch': 1.86} {'loss': 0.4912, 'learning_rate': 2.589447525625788e-07, 'epoch': 1.86} {'loss': 0.5213, 'learning_rate': 2.588707456153028e-07, 'epoch': 1.86} {'loss': 0.3909, 'learning_rate': 2.5879674910652686e-07, 'epoch': 1.86} {'loss': 0.4255, 'learning_rate': 2.587227630363265e-07, 'epoch': 1.86} {'loss': 0.5179, 'learning_rate': 2.5864878740478603e-07, 'epoch': 1.86} {'loss': 0.5771, 'learning_rate': 2.5857482221198216e-07, 'epoch': 1.86} {'loss': 0.4582, 'learning_rate': 2.5850086745799475e-07, 'epoch': 1.86} {'loss': 0.4791, 'learning_rate': 2.5842692314290264e-07, 'epoch': 1.86} {'loss': 0.4903, 'learning_rate': 2.5835298926678464e-07, 'epoch': 1.86} {'loss': 0.5489, 'learning_rate': 2.5827906582972293e-07, 'epoch': 1.86} {'loss': 0.4758, 'learning_rate': 2.582051528317908e-07, 'epoch': 1.86} {'loss': 0.5343, 'learning_rate': 2.581312502730748e-07, 'epoch': 1.86} {'loss': 0.5576, 'learning_rate': 2.580573581536483e-07, 'epoch': 1.86} {'loss': 0.4437, 'learning_rate': 2.579834764735933e-07, 'epoch': 1.86} {'loss': 0.4879, 'learning_rate': 2.579096052329877e-07, 'epoch': 1.86} {'loss': 0.3787, 'learning_rate': 2.5783574443191126e-07, 'epoch': 1.86} {'loss': 0.4895, 'learning_rate': 2.5776189407044407e-07, 'epoch': 1.86} {'loss': 0.5112, 'learning_rate': 2.576880541486626e-07, 'epoch': 1.86} {'loss': 0.5347, 'learning_rate': 2.576142246666502e-07, 'epoch': 1.86} {'loss': 0.5752, 'learning_rate': 2.5754040562448124e-07, 'epoch': 1.86} {'loss': 0.4437, 'learning_rate': 2.574665970222379e-07, 'epoch': 1.86} {'loss': 0.424, 'learning_rate': 2.5739279886e-07, 'epoch': 1.86} {'loss': 0.4639, 'learning_rate': 2.5731901113784206e-07, 'epoch': 1.86} {'loss': 0.61, 'learning_rate': 2.572452338558484e-07, 'epoch': 1.86} {'loss': 0.4989, 'learning_rate': 2.5717146701409346e-07, 'epoch': 1.86} {'loss': 0.3916, 'learning_rate': 2.570977106126604e-07, 'epoch': 1.86} {'loss': 0.7967, 'learning_rate': 2.5702396465162593e-07, 'epoch': 1.86} {'loss': 0.5151, 'learning_rate': 2.5695022913106995e-07, 'epoch': 1.86} {'loss': 0.5777, 'learning_rate': 2.5687650405107236e-07, 'epoch': 1.86} {'loss': 0.2909, 'learning_rate': 2.5680278941170865e-07, 'epoch': 1.86} {'loss': 0.5744, 'learning_rate': 2.5672908521306215e-07, 'epoch': 1.86} {'loss': 0.5718, 'learning_rate': 2.5665539145520724e-07, 'epoch': 1.86} {'loss': 0.4461, 'learning_rate': 2.5658170813822825e-07, 'epoch': 1.86} {'loss': 0.4292, 'learning_rate': 2.565080352621996e-07, 'epoch': 1.86} {'loss': 0.4604, 'learning_rate': 2.5643437282720227e-07, 'epoch': 1.86} {'loss': 0.5496, 'learning_rate': 2.563607208333163e-07, 'epoch': 1.86} {'loss': 0.5672, 'learning_rate': 2.562870792806171e-07, 'epoch': 1.86} {'loss': 0.4749, 'learning_rate': 2.56213448169188e-07, 'epoch': 1.86} {'loss': 0.396, 'learning_rate': 2.561398274991034e-07, 'epoch': 1.86} {'loss': 0.6045, 'learning_rate': 2.560662172704453e-07, 'epoch': 1.86} {'loss': 0.5137, 'learning_rate': 2.559926174832916e-07, 'epoch': 1.86} {'loss': 0.579, 'learning_rate': 2.5591902813772216e-07, 'epoch': 1.86} {'loss': 0.5989, 'learning_rate': 2.558454492338147e-07, 'epoch': 1.86} {'loss': 0.3915, 'learning_rate': 2.557718807716469e-07, 'epoch': 1.86} {'loss': 0.431, 'learning_rate': 2.55698322751301e-07, 'epoch': 1.86} {'loss': 0.5181, 'learning_rate': 2.5562477517285133e-07, 'epoch': 1.86} {'loss': 0.4073, 'learning_rate': 2.5555123803638115e-07, 'epoch': 1.86} {'loss': 0.5609, 'learning_rate': 2.5547771134196707e-07, 'epoch': 1.86} {'loss': 0.3658, 'learning_rate': 2.554041950896879e-07, 'epoch': 1.86} {'loss': 0.5308, 'learning_rate': 2.553306892796237e-07, 'epoch': 1.86} {'loss': 0.5618, 'learning_rate': 2.5525719391184977e-07, 'epoch': 1.86} {'loss': 0.6554, 'learning_rate': 2.5518370898644953e-07, 'epoch': 1.86} {'loss': 0.4655, 'learning_rate': 2.5511023450349837e-07, 'epoch': 1.86} {'loss': 0.5339, 'learning_rate': 2.5503677046307516e-07, 'epoch': 1.86} {'loss': 0.6035, 'learning_rate': 2.54963316865261e-07, 'epoch': 1.86} {'loss': 0.5903, 'learning_rate': 2.548898737101324e-07, 'epoch': 1.86} {'loss': 0.5047, 'learning_rate': 2.5481644099777046e-07, 'epoch': 1.86} {'loss': 0.5442, 'learning_rate': 2.547430187282496e-07, 'epoch': 1.86} {'loss': 0.6198, 'learning_rate': 2.546696069016541e-07, 'epoch': 1.86} {'loss': 0.3928, 'learning_rate': 2.545962055180584e-07, 'epoch': 1.86} {'loss': 0.5561, 'learning_rate': 2.5452281457754134e-07, 'epoch': 1.86} {'loss': 0.4509, 'learning_rate': 2.5444943408018397e-07, 'epoch': 1.86} {'loss': 0.6409, 'learning_rate': 2.5437606402606283e-07, 'epoch': 1.86} {'loss': 0.596, 'learning_rate': 2.543027044152591e-07, 'epoch': 1.86} {'loss': 0.3918, 'learning_rate': 2.54229355247847e-07, 'epoch': 1.86} {'loss': 0.4758, 'learning_rate': 2.541560165239099e-07, 'epoch': 1.86} {'loss': 0.5364, 'learning_rate': 2.540826882435232e-07, 'epoch': 1.86} {'loss': 0.4222, 'learning_rate': 2.54009370406767e-07, 'epoch': 1.86} {'loss': 0.5968, 'learning_rate': 2.539360630137189e-07, 'epoch': 1.86} {'loss': 0.6268, 'learning_rate': 2.538627660644577e-07, 'epoch': 1.86} {'loss': 0.5516, 'learning_rate': 2.537894795590634e-07, 'epoch': 1.86} {'loss': 0.5324, 'learning_rate': 2.537162034976126e-07, 'epoch': 1.86} {'loss': 0.3898, 'learning_rate': 2.5364293788018523e-07, 'epoch': 1.86} {'loss': 0.4786, 'learning_rate': 2.535696827068579e-07, 'epoch': 1.86} {'loss': 0.49, 'learning_rate': 2.534964379777105e-07, 'epoch': 1.86} {'loss': 0.4357, 'learning_rate': 2.53423203692823e-07, 'epoch': 1.86} {'loss': 0.4862, 'learning_rate': 2.5334997985226984e-07, 'epoch': 1.86} {'loss': 0.4718, 'learning_rate': 2.532767664561331e-07, 'epoch': 1.86} {'loss': 0.3494, 'learning_rate': 2.5320356350449047e-07, 'epoch': 1.86} {'loss': 0.503, 'learning_rate': 2.531303709974187e-07, 'epoch': 1.86} {'loss': 0.4408, 'learning_rate': 2.530571889349975e-07, 'epoch': 1.86} {'loss': 0.5388, 'learning_rate': 2.5298401731730595e-07, 'epoch': 1.86} {'loss': 0.3756, 'learning_rate': 2.5291085614442265e-07, 'epoch': 1.86} {'loss': 0.4134, 'learning_rate': 2.528377054164233e-07, 'epoch': 1.86} {'loss': 0.4284, 'learning_rate': 2.527645651333888e-07, 'epoch': 1.86} {'loss': 0.6001, 'learning_rate': 2.5269143529539685e-07, 'epoch': 1.86} {'loss': 0.5455, 'learning_rate': 2.526183159025264e-07, 'epoch': 1.86} {'loss': 0.3101, 'learning_rate': 2.5254520695485394e-07, 'epoch': 1.86} {'loss': 0.4104, 'learning_rate': 2.524721084524595e-07, 'epoch': 1.86} {'loss': 0.5199, 'learning_rate': 2.523990203954219e-07, 'epoch': 1.86} {'loss': 0.4278, 'learning_rate': 2.523259427838176e-07, 'epoch': 1.86} {'loss': 0.6161, 'learning_rate': 2.522528756177256e-07, 'epoch': 1.86} {'loss': 0.5239, 'learning_rate': 2.521798188972246e-07, 'epoch': 1.86} {'loss': 0.515, 'learning_rate': 2.521067726223936e-07, 'epoch': 1.86} {'loss': 0.4478, 'learning_rate': 2.52033736793309e-07, 'epoch': 1.86} {'loss': 0.5715, 'learning_rate': 2.5196071141004973e-07, 'epoch': 1.86} {'loss': 0.5976, 'learning_rate': 2.5188769647269576e-07, 'epoch': 1.86} {'loss': 0.5797, 'learning_rate': 2.5181469198132356e-07, 'epoch': 1.86} {'loss': 0.5335, 'learning_rate': 2.51741697936011e-07, 'epoch': 1.86} {'loss': 0.5424, 'learning_rate': 2.516687143368379e-07, 'epoch': 1.86} {'loss': 0.5725, 'learning_rate': 2.5159574118388097e-07, 'epoch': 1.86} {'loss': 0.46, 'learning_rate': 2.5152277847721893e-07, 'epoch': 1.86} {'loss': 0.4887, 'learning_rate': 2.514498262169296e-07, 'epoch': 1.86} {'loss': 0.6286, 'learning_rate': 2.513768844030939e-07, 'epoch': 1.86} {'loss': 0.4621, 'learning_rate': 2.513039530357864e-07, 'epoch': 1.86} {'loss': 0.6476, 'learning_rate': 2.512310321150857e-07, 'epoch': 1.86} {'loss': 0.6526, 'learning_rate': 2.511581216410719e-07, 'epoch': 1.86} {'loss': 0.591, 'learning_rate': 2.510852216138215e-07, 'epoch': 1.86} {'loss': 0.4055, 'learning_rate': 2.5101233203341345e-07, 'epoch': 1.86} {'loss': 0.3566, 'learning_rate': 2.5093945289992647e-07, 'epoch': 1.86} {'loss': 0.4838, 'learning_rate': 2.508665842134361e-07, 'epoch': 1.86} {'loss': 0.5699, 'learning_rate': 2.507937259740234e-07, 'epoch': 1.86} {'loss': 0.5418, 'learning_rate': 2.507208781817638e-07, 'epoch': 1.86} {'loss': 0.5314, 'learning_rate': 2.5064804083673734e-07, 'epoch': 1.86} {'loss': 0.4866, 'learning_rate': 2.5057521393902164e-07, 'epoch': 1.86} {'loss': 0.6453, 'learning_rate': 2.5050239748869443e-07, 'epoch': 1.86} {'loss': 0.5474, 'learning_rate': 2.504295914858346e-07, 'epoch': 1.86} {'loss': 0.4805, 'learning_rate': 2.503567959305186e-07, 'epoch': 1.86} {'loss': 0.4927, 'learning_rate': 2.502840108228255e-07, 'epoch': 1.86} {'loss': 0.4764, 'learning_rate': 2.502112361628328e-07, 'epoch': 1.86} {'loss': 0.3874, 'learning_rate': 2.5013847195061947e-07, 'epoch': 1.86} {'loss': 0.4441, 'learning_rate': 2.50065718186262e-07, 'epoch': 1.86} {'loss': 0.5786, 'learning_rate': 2.499929748698382e-07, 'epoch': 1.86} {'loss': 0.6235, 'learning_rate': 2.499202420014291e-07, 'epoch': 1.86} {'loss': 0.2522, 'learning_rate': 2.49847519581109e-07, 'epoch': 1.86} {'loss': 0.4978, 'learning_rate': 2.497748076089579e-07, 'epoch': 1.86} {'loss': 0.4928, 'learning_rate': 2.497021060850524e-07, 'epoch': 1.86} {'loss': 0.5625, 'learning_rate': 2.4962941500947135e-07, 'epoch': 1.86} {'loss': 0.4307, 'learning_rate': 2.4955673438229353e-07, 'epoch': 1.86} {'loss': 0.503, 'learning_rate': 2.494840642035945e-07, 'epoch': 1.86} {'loss': 0.5433, 'learning_rate': 2.494114044734541e-07, 'epoch': 1.86} {'loss': 0.539, 'learning_rate': 2.4933875519194907e-07, 'epoch': 1.86} {'loss': 0.5079, 'learning_rate': 2.49266116359157e-07, 'epoch': 1.86} {'loss': 0.5083, 'learning_rate': 2.4919348797515676e-07, 'epoch': 1.86} {'loss': 0.586, 'learning_rate': 2.4912087004002604e-07, 'epoch': 1.86} {'loss': 0.5532, 'learning_rate': 2.490482625538426e-07, 'epoch': 1.86} {'loss': 0.4544, 'learning_rate': 2.4897566551668194e-07, 'epoch': 1.86} {'loss': 0.6643, 'learning_rate': 2.489030789286273e-07, 'epoch': 1.86} {'loss': 0.517, 'learning_rate': 2.4883050278975087e-07, 'epoch': 1.86} {'loss': 0.4682, 'learning_rate': 2.487579371001325e-07, 'epoch': 1.86} {'loss': 0.5533, 'learning_rate': 2.4868538185985227e-07, 'epoch': 1.86} {'loss': 0.5068, 'learning_rate': 2.4861283706898334e-07, 'epoch': 1.86} {'loss': 0.4786, 'learning_rate': 2.485403027276079e-07, 'epoch': 1.86} {'loss': 0.6894, 'learning_rate': 2.484677788358003e-07, 'epoch': 1.86} {'loss': 0.4594, 'learning_rate': 2.4839526539363945e-07, 'epoch': 1.86} {'loss': 0.3827, 'learning_rate': 2.4832276240120303e-07, 'epoch': 1.86} {'loss': 0.5304, 'learning_rate': 2.4825026985856984e-07, 'epoch': 1.86} {'loss': 0.4835, 'learning_rate': 2.481777877658176e-07, 'epoch': 1.86} {'loss': 0.3762, 'learning_rate': 2.481053161230196e-07, 'epoch': 1.86} {'loss': 0.4546, 'learning_rate': 2.480328549302602e-07, 'epoch': 1.86} {'loss': 0.37, 'learning_rate': 2.479604041876127e-07, 'epoch': 1.86} {'loss': 0.3983, 'learning_rate': 2.478879638951559e-07, 'epoch': 1.86} {'loss': 0.5695, 'learning_rate': 2.4781553405296646e-07, 'epoch': 1.86} {'loss': 0.3403, 'learning_rate': 2.477431146611231e-07, 'epoch': 1.86} {'loss': 0.4459, 'learning_rate': 2.4767070571970474e-07, 'epoch': 1.86} {'loss': 0.4889, 'learning_rate': 2.4759830722878574e-07, 'epoch': 1.86} {'loss': 0.6476, 'learning_rate': 2.4752591918844605e-07, 'epoch': 1.86} {'loss': 0.571, 'learning_rate': 2.4745354159876223e-07, 'epoch': 1.86} {'loss': 0.5878, 'learning_rate': 2.473811744598131e-07, 'epoch': 1.86} {'loss': 0.4707, 'learning_rate': 2.4730881777167534e-07, 'epoch': 1.86} {'loss': 0.5237, 'learning_rate': 2.472364715344244e-07, 'epoch': 1.86} {'loss': 0.6569, 'learning_rate': 2.4716413574814134e-07, 'epoch': 1.86} {'loss': 0.5431, 'learning_rate': 2.4709181041290053e-07, 'epoch': 1.86} {'loss': 0.4282, 'learning_rate': 2.470194955287841e-07, 'epoch': 1.86} {'loss': 0.3342, 'learning_rate': 2.469471910958643e-07, 'epoch': 1.86} {'loss': 0.5045, 'learning_rate': 2.46874897114221e-07, 'epoch': 1.86} {'loss': 0.4476, 'learning_rate': 2.46802613583933e-07, 'epoch': 1.86} {'loss': 0.4936, 'learning_rate': 2.4673034050507474e-07, 'epoch': 1.86} {'loss': 0.5061, 'learning_rate': 2.466580778777261e-07, 'epoch': 1.86} {'loss': 0.5163, 'learning_rate': 2.4658582570196154e-07, 'epoch': 1.86} {'loss': 0.5447, 'learning_rate': 2.465135839778632e-07, 'epoch': 1.86} {'loss': 0.4804, 'learning_rate': 2.464413527055054e-07, 'epoch': 1.86} {'loss': 0.5192, 'learning_rate': 2.463691318849648e-07, 'epoch': 1.86} {'loss': 0.5217, 'learning_rate': 2.4629692151632135e-07, 'epoch': 1.86} {'loss': 0.6035, 'learning_rate': 2.4622472159964937e-07, 'epoch': 1.86} {'loss': 0.5272, 'learning_rate': 2.4615253213503e-07, 'epoch': 1.86} {'loss': 0.5379, 'learning_rate': 2.4608035312253645e-07, 'epoch': 1.86} {'loss': 0.5562, 'learning_rate': 2.4600818456225083e-07, 'epoch': 1.86} {'loss': 0.3948, 'learning_rate': 2.4593602645424543e-07, 'epoch': 1.86} {'loss': 0.4997, 'learning_rate': 2.458638787986012e-07, 'epoch': 1.86} {'loss': 0.4881, 'learning_rate': 2.4579174159539364e-07, 'epoch': 1.86} {'loss': 0.5604, 'learning_rate': 2.457196148446994e-07, 'epoch': 1.86} {'loss': 0.5442, 'learning_rate': 2.4564749854659953e-07, 'epoch': 1.86} {'loss': 0.587, 'learning_rate': 2.4557539270116616e-07, 'epoch': 1.86} {'loss': 0.491, 'learning_rate': 2.455032973084814e-07, 'epoch': 1.86} {'loss': 0.4484, 'learning_rate': 2.454312123686187e-07, 'epoch': 1.86} {'loss': 0.5986, 'learning_rate': 2.4535913788165776e-07, 'epoch': 1.86} {'loss': 0.4312, 'learning_rate': 2.452870738476754e-07, 'epoch': 1.86} {'loss': 0.3157, 'learning_rate': 2.4521502026674694e-07, 'epoch': 1.86} {'loss': 0.4699, 'learning_rate': 2.451429771389524e-07, 'epoch': 1.86} {'loss': 0.5706, 'learning_rate': 2.4507094446436505e-07, 'epoch': 1.86} {'loss': 0.474, 'learning_rate': 2.449989222430671e-07, 'epoch': 1.86} {'loss': 0.629, 'learning_rate': 2.4492691047513283e-07, 'epoch': 1.86} {'loss': 0.4171, 'learning_rate': 2.4485490916063894e-07, 'epoch': 1.86} {'loss': 0.5065, 'learning_rate': 2.4478291829966527e-07, 'epoch': 1.86} {'loss': 0.4314, 'learning_rate': 2.447109378922852e-07, 'epoch': 1.86} {'loss': 0.4599, 'learning_rate': 2.4463896793857853e-07, 'epoch': 1.86} {'loss': 0.4797, 'learning_rate': 2.44567008438622e-07, 'epoch': 1.86} {'loss': 0.3836, 'learning_rate': 2.4449505939249217e-07, 'epoch': 1.86} {'loss': 0.5951, 'learning_rate': 2.4442312080026567e-07, 'epoch': 1.86} {'loss': 0.6223, 'learning_rate': 2.4435119266202123e-07, 'epoch': 1.86} {'loss': 0.5829, 'learning_rate': 2.4427927497783556e-07, 'epoch': 1.86} {'loss': 0.4255, 'learning_rate': 2.44207367747783e-07, 'epoch': 1.86} {'loss': 0.5571, 'learning_rate': 2.441354709719457e-07, 'epoch': 1.86} {'loss': 0.6023, 'learning_rate': 2.440635846503958e-07, 'epoch': 1.86} {'loss': 0.349, 'learning_rate': 2.439917087832122e-07, 'epoch': 1.86} {'loss': 0.515, 'learning_rate': 2.439198433704726e-07, 'epoch': 1.86} {'loss': 0.4649, 'learning_rate': 2.4384798841225243e-07, 'epoch': 1.86} {'loss': 0.5737, 'learning_rate': 2.437761439086317e-07, 'epoch': 1.86} {'loss': 0.4778, 'learning_rate': 2.4370430985968365e-07, 'epoch': 1.86} {'loss': 0.6725, 'learning_rate': 2.4363248626548817e-07, 'epoch': 1.86} {'loss': 0.4602, 'learning_rate': 2.4356067312611976e-07, 'epoch': 1.86} {'loss': 0.5391, 'learning_rate': 2.4348887044165716e-07, 'epoch': 1.86} {'loss': 0.5238, 'learning_rate': 2.4341707821217697e-07, 'epoch': 1.86} {'loss': 0.5117, 'learning_rate': 2.4334529643775584e-07, 'epoch': 1.86} {'loss': 0.3752, 'learning_rate': 2.432735251184726e-07, 'epoch': 1.86} {'loss': 0.4573, 'learning_rate': 2.4320176425440047e-07, 'epoch': 1.86} {'loss': 0.5913, 'learning_rate': 2.4313001384561827e-07, 'epoch': 1.86} {'loss': 0.422, 'learning_rate': 2.430582738922027e-07, 'epoch': 1.86} {'loss': 0.5025, 'learning_rate': 2.429865443942314e-07, 'epoch': 1.86} {'loss': 0.5741, 'learning_rate': 2.429148253517799e-07, 'epoch': 1.86} {'loss': 0.4912, 'learning_rate': 2.42843116764927e-07, 'epoch': 1.86} {'loss': 0.4178, 'learning_rate': 2.427714186337482e-07, 'epoch': 1.86} {'loss': 0.4367, 'learning_rate': 2.426997309583201e-07, 'epoch': 1.86} {'loss': 0.4409, 'learning_rate': 2.426280537387193e-07, 'epoch': 1.86} {'loss': 0.5862, 'learning_rate': 2.425563869750236e-07, 'epoch': 1.86} {'loss': 0.5625, 'learning_rate': 2.424847306673095e-07, 'epoch': 1.86} {'loss': 0.4254, 'learning_rate': 2.4241308481565475e-07, 'epoch': 1.86} {'loss': 0.4328, 'learning_rate': 2.423414494201337e-07, 'epoch': 1.86} {'loss': 0.4936, 'learning_rate': 2.4226982448082414e-07, 'epoch': 1.86} {'loss': 0.4718, 'learning_rate': 2.4219820999780375e-07, 'epoch': 1.86} {'loss': 0.4142, 'learning_rate': 2.4212660597114803e-07, 'epoch': 1.86} {'loss': 0.4503, 'learning_rate': 2.4205501240093574e-07, 'epoch': 1.86} {'loss': 0.3989, 'learning_rate': 2.4198342928724136e-07, 'epoch': 1.86} {'loss': 0.4875, 'learning_rate': 2.4191185663014263e-07, 'epoch': 1.86} {'loss': 0.4174, 'learning_rate': 2.41840294429716e-07, 'epoch': 1.86} {'loss': 0.5294, 'learning_rate': 2.417687426860382e-07, 'epoch': 1.86} {'loss': 0.5792, 'learning_rate': 2.4169720139918583e-07, 'epoch': 1.86} {'loss': 0.4447, 'learning_rate': 2.4162567056923546e-07, 'epoch': 1.86} {'loss': 0.3991, 'learning_rate': 2.4155415019626485e-07, 'epoch': 1.86} {'loss': 0.4775, 'learning_rate': 2.414826402803483e-07, 'epoch': 1.86} {'loss': 0.572, 'learning_rate': 2.414111408215658e-07, 'epoch': 1.86} {'loss': 0.4051, 'learning_rate': 2.4133965181999065e-07, 'epoch': 1.86} {'loss': 0.4669, 'learning_rate': 2.412681732757005e-07, 'epoch': 1.86} {'loss': 0.6503, 'learning_rate': 2.411967051887731e-07, 'epoch': 1.86} {'loss': 0.4499, 'learning_rate': 2.41125247559284e-07, 'epoch': 1.86} {'loss': 0.5188, 'learning_rate': 2.4105380038730976e-07, 'epoch': 1.86} {'loss': 0.5532, 'learning_rate': 2.4098236367292805e-07, 'epoch': 1.86} {'loss': 0.643, 'learning_rate': 2.4091093741621443e-07, 'epoch': 1.86} {'loss': 0.348, 'learning_rate': 2.4083952161724433e-07, 'epoch': 1.86} {'loss': 0.5014, 'learning_rate': 2.4076811627609664e-07, 'epoch': 1.86} {'loss': 0.5232, 'learning_rate': 2.406967213928457e-07, 'epoch': 1.86} {'loss': 0.5214, 'learning_rate': 2.406253369675693e-07, 'epoch': 1.86} {'loss': 0.3753, 'learning_rate': 2.4055396300034394e-07, 'epoch': 1.86} {'loss': 0.5012, 'learning_rate': 2.404825994912474e-07, 'epoch': 1.86} {'loss': 0.5038, 'learning_rate': 2.40411246440353e-07, 'epoch': 1.86} {'loss': 0.5579, 'learning_rate': 2.403399038477383e-07, 'epoch': 1.86} {'loss': 0.4324, 'learning_rate': 2.402685717134812e-07, 'epoch': 1.86} {'loss': 0.3273, 'learning_rate': 2.4019725003765593e-07, 'epoch': 1.86} {'loss': 0.5591, 'learning_rate': 2.401259388203414e-07, 'epoch': 1.86} {'loss': 0.6334, 'learning_rate': 2.400546380616131e-07, 'epoch': 1.86} {'loss': 0.5864, 'learning_rate': 2.3998334776154654e-07, 'epoch': 1.86} {'loss': 0.6006, 'learning_rate': 2.3991206792021936e-07, 'epoch': 1.86} {'loss': 0.5535, 'learning_rate': 2.3984079853770604e-07, 'epoch': 1.86} {'loss': 0.4809, 'learning_rate': 2.3976953961408534e-07, 'epoch': 1.86} {'loss': 0.4356, 'learning_rate': 2.3969829114943165e-07, 'epoch': 1.86} {'loss': 0.4757, 'learning_rate': 2.3962705314382385e-07, 'epoch': 1.86} {'loss': 0.6733, 'learning_rate': 2.3955582559733405e-07, 'epoch': 1.86} {'loss': 0.4031, 'learning_rate': 2.394846085100433e-07, 'epoch': 1.86} {'loss': 0.4656, 'learning_rate': 2.3941340188202377e-07, 'epoch': 1.86} {'loss': 0.622, 'learning_rate': 2.393422057133554e-07, 'epoch': 1.86} {'loss': 0.5665, 'learning_rate': 2.392710200041115e-07, 'epoch': 1.86} {'loss': 0.5902, 'learning_rate': 2.3919984475437087e-07, 'epoch': 1.86} {'loss': 0.3942, 'learning_rate': 2.3912867996420897e-07, 'epoch': 1.86} {'loss': 0.5355, 'learning_rate': 2.390575256336991e-07, 'epoch': 1.86} {'loss': 0.5252, 'learning_rate': 2.389863817629223e-07, 'epoch': 1.86} {'loss': 0.6456, 'learning_rate': 2.389152483519519e-07, 'epoch': 1.86} {'loss': 0.5044, 'learning_rate': 2.3884412540086556e-07, 'epoch': 1.86} {'loss': 0.5161, 'learning_rate': 2.3877301290973767e-07, 'epoch': 1.86} {'loss': 0.5101, 'learning_rate': 2.387019108786459e-07, 'epoch': 1.86} {'loss': 0.4855, 'learning_rate': 2.3863081930766695e-07, 'epoch': 1.86} {'loss': 0.7066, 'learning_rate': 2.3855973819687406e-07, 'epoch': 1.86} {'loss': 0.5479, 'learning_rate': 2.3848866754634715e-07, 'epoch': 1.86} {'loss': 0.4301, 'learning_rate': 2.3841760735615948e-07, 'epoch': 1.86} {'loss': 0.1897, 'learning_rate': 2.383465576263888e-07, 'epoch': 1.86} {'loss': 0.6099, 'learning_rate': 2.3827551835711283e-07, 'epoch': 1.86} {'loss': 0.6084, 'learning_rate': 2.382044895484026e-07, 'epoch': 1.86} {'loss': 0.3781, 'learning_rate': 2.3813347120033914e-07, 'epoch': 1.86} {'loss': 0.5511, 'learning_rate': 2.3806246331299465e-07, 'epoch': 1.86} {'loss': 0.6124, 'learning_rate': 2.3799146588645018e-07, 'epoch': 1.86} {'loss': 0.4524, 'learning_rate': 2.3792047892077785e-07, 'epoch': 1.86} {'loss': 0.5089, 'learning_rate': 2.3784950241605432e-07, 'epoch': 1.86} {'loss': 0.5032, 'learning_rate': 2.3777853637235726e-07, 'epoch': 1.86} {'loss': 0.5334, 'learning_rate': 2.3770758078975887e-07, 'epoch': 1.86} {'loss': 0.4841, 'learning_rate': 2.376366356683413e-07, 'epoch': 1.86} {'loss': 0.3751, 'learning_rate': 2.3756570100817445e-07, 'epoch': 1.86} {'loss': 0.4426, 'learning_rate': 2.374947768093383e-07, 'epoch': 1.86} {'loss': 0.4938, 'learning_rate': 2.3742386307190722e-07, 'epoch': 1.86} {'loss': 0.4867, 'learning_rate': 2.3735295979595784e-07, 'epoch': 1.86} {'loss': 0.4664, 'learning_rate': 2.3728206698156787e-07, 'epoch': 1.86} {'loss': 0.5272, 'learning_rate': 2.3721118462880833e-07, 'epoch': 1.86} {'loss': 0.4311, 'learning_rate': 2.3714031273775917e-07, 'epoch': 1.86} {'loss': 0.4985, 'learning_rate': 2.370694513084959e-07, 'epoch': 1.86} {'loss': 0.5989, 'learning_rate': 2.369986003410929e-07, 'epoch': 1.86} {'loss': 0.4673, 'learning_rate': 2.3692775983562788e-07, 'epoch': 1.86} {'loss': 0.5219, 'learning_rate': 2.3685692979217522e-07, 'epoch': 1.86} {'loss': 0.4544, 'learning_rate': 2.3678611021081265e-07, 'epoch': 1.86} {'loss': 0.499, 'learning_rate': 2.3671530109161343e-07, 'epoch': 1.86} {'loss': 0.4256, 'learning_rate': 2.3664450243465642e-07, 'epoch': 1.86} {'loss': 0.3817, 'learning_rate': 2.3657371424001484e-07, 'epoch': 1.86} {'loss': 0.5367, 'learning_rate': 2.3650293650776646e-07, 'epoch': 1.86} {'loss': 0.3119, 'learning_rate': 2.3643216923798562e-07, 'epoch': 1.86} {'loss': 0.5839, 'learning_rate': 2.3636141243074894e-07, 'epoch': 1.86} {'loss': 0.4981, 'learning_rate': 2.3629066608613416e-07, 'epoch': 1.86} {'loss': 0.5166, 'learning_rate': 2.362199302042123e-07, 'epoch': 1.86} {'loss': 0.6124, 'learning_rate': 2.3614920478506442e-07, 'epoch': 1.86} {'loss': 0.5761, 'learning_rate': 2.360784898287627e-07, 'epoch': 1.86} {'loss': 0.3886, 'learning_rate': 2.3600778533538483e-07, 'epoch': 1.86} {'loss': 0.5521, 'learning_rate': 2.359370913050063e-07, 'epoch': 1.86} {'loss': 0.4653, 'learning_rate': 2.3586640773770042e-07, 'epoch': 1.86} {'loss': 0.406, 'learning_rate': 2.357957346335471e-07, 'epoch': 1.86} {'loss': 0.4489, 'learning_rate': 2.3572507199261742e-07, 'epoch': 1.86} {'loss': 0.4679, 'learning_rate': 2.3565441981499238e-07, 'epoch': 1.86} {'loss': 0.5726, 'learning_rate': 2.3558377810074307e-07, 'epoch': 1.86} {'loss': 0.4016, 'learning_rate': 2.355131468499472e-07, 'epoch': 1.86} {'loss': 0.5432, 'learning_rate': 2.3544252606268136e-07, 'epoch': 1.86} {'loss': 0.671, 'learning_rate': 2.3537191573901886e-07, 'epoch': 1.86} {'loss': 0.663, 'learning_rate': 2.3530131587903849e-07, 'epoch': 1.86} {'loss': 0.4409, 'learning_rate': 2.352307264828113e-07, 'epoch': 1.86} {'loss': 0.5399, 'learning_rate': 2.351601475504184e-07, 'epoch': 1.86} {'loss': 0.4647, 'learning_rate': 2.3508957908193075e-07, 'epoch': 1.86} {'loss': 0.605, 'learning_rate': 2.3501902107742725e-07, 'epoch': 1.86} {'loss': 0.5903, 'learning_rate': 2.3494847353698224e-07, 'epoch': 1.86} {'loss': 0.4419, 'learning_rate': 2.3487793646067014e-07, 'epoch': 1.86} {'loss': 0.5616, 'learning_rate': 2.3480740984856975e-07, 'epoch': 1.86} {'loss': 0.5902, 'learning_rate': 2.3473689370075213e-07, 'epoch': 1.86} {'loss': 0.4232, 'learning_rate': 2.3466638801729723e-07, 'epoch': 1.86} {'loss': 0.5265, 'learning_rate': 2.3459589279827722e-07, 'epoch': 1.86} {'loss': 0.568, 'learning_rate': 2.3452540804376978e-07, 'epoch': 1.86} {'loss': 0.5453, 'learning_rate': 2.3445493375385042e-07, 'epoch': 1.86} {'loss': 0.5521, 'learning_rate': 2.3438446992859242e-07, 'epoch': 1.86} {'loss': 0.5584, 'learning_rate': 2.3431401656807463e-07, 'epoch': 1.86} {'loss': 0.4088, 'learning_rate': 2.3424357367236917e-07, 'epoch': 1.86} {'loss': 0.6208, 'learning_rate': 2.3417314124155378e-07, 'epoch': 1.86} {'loss': 0.5771, 'learning_rate': 2.3410271927570282e-07, 'epoch': 1.86} {'loss': 0.4704, 'learning_rate': 2.3403230777489294e-07, 'epoch': 1.86} {'loss': 0.6526, 'learning_rate': 2.339619067391996e-07, 'epoch': 1.86} {'loss': 0.5407, 'learning_rate': 2.338915161686961e-07, 'epoch': 1.86} {'loss': 0.4574, 'learning_rate': 2.3382113606346014e-07, 'epoch': 1.86} {'loss': 0.4494, 'learning_rate': 2.337507664235661e-07, 'epoch': 1.86} {'loss': 0.498, 'learning_rate': 2.3368040724908836e-07, 'epoch': 1.86} {'loss': 0.5029, 'learning_rate': 2.3361005854010467e-07, 'epoch': 1.86} {'loss': 0.5987, 'learning_rate': 2.3353972029668936e-07, 'epoch': 1.86} {'loss': 0.526, 'learning_rate': 2.3346939251891798e-07, 'epoch': 1.86} {'loss': 0.5419, 'learning_rate': 2.333990752068649e-07, 'epoch': 1.86} {'loss': 0.4229, 'learning_rate': 2.333287683606067e-07, 'epoch': 1.86} {'loss': 0.4632, 'learning_rate': 2.3325847198021779e-07, 'epoch': 1.86} {'loss': 0.6434, 'learning_rate': 2.3318818606577475e-07, 'epoch': 1.86} {'loss': 0.3696, 'learning_rate': 2.3311791061735089e-07, 'epoch': 1.86} {'loss': 0.404, 'learning_rate': 2.330476456350228e-07, 'epoch': 1.86} {'loss': 0.68, 'learning_rate': 2.3297739111886707e-07, 'epoch': 1.86} {'loss': 0.4337, 'learning_rate': 2.3290714706895702e-07, 'epoch': 1.86} {'loss': 0.4492, 'learning_rate': 2.3283691348536807e-07, 'epoch': 1.86} {'loss': 0.4849, 'learning_rate': 2.3276669036817578e-07, 'epoch': 1.86} {'loss': 0.5632, 'learning_rate': 2.3269647771745564e-07, 'epoch': 1.86} {'loss': 0.5055, 'learning_rate': 2.32626275533282e-07, 'epoch': 1.86} {'loss': 0.5182, 'learning_rate': 2.3255608381573258e-07, 'epoch': 1.86} {'loss': 0.4775, 'learning_rate': 2.3248590256488068e-07, 'epoch': 1.86} {'loss': 0.5217, 'learning_rate': 2.3241573178080067e-07, 'epoch': 1.86} {'loss': 0.5029, 'learning_rate': 2.3234557146356918e-07, 'epoch': 1.86} {'loss': 0.5234, 'learning_rate': 2.3227542161326056e-07, 'epoch': 1.86} {'loss': 0.6431, 'learning_rate': 2.3220528222995142e-07, 'epoch': 1.86} {'loss': 0.4862, 'learning_rate': 2.3213515331371504e-07, 'epoch': 1.86} {'loss': 0.5375, 'learning_rate': 2.3206503486462807e-07, 'epoch': 1.86} {'loss': 0.5744, 'learning_rate': 2.3199492688276482e-07, 'epoch': 1.86} {'loss': 0.514, 'learning_rate': 2.3192482936820082e-07, 'epoch': 1.86} {'loss': 0.4841, 'learning_rate': 2.3185474232101045e-07, 'epoch': 1.86} {'loss': 0.4807, 'learning_rate': 2.3178466574126922e-07, 'epoch': 1.86} {'loss': 0.6417, 'learning_rate': 2.3171459962905263e-07, 'epoch': 1.86} {'loss': 0.4791, 'learning_rate': 2.3164454398443502e-07, 'epoch': 1.86} {'loss': 0.6393, 'learning_rate': 2.3157449880749418e-07, 'epoch': 1.86} {'loss': 0.4942, 'learning_rate': 2.3150446409830108e-07, 'epoch': 1.86} {'loss': 0.4561, 'learning_rate': 2.3143443985693236e-07, 'epoch': 1.86} {'loss': 0.3628, 'learning_rate': 2.3136442608346355e-07, 'epoch': 1.86} {'loss': 0.5228, 'learning_rate': 2.312944227779701e-07, 'epoch': 1.86} {'loss': 0.5337, 'learning_rate': 2.312244299405253e-07, 'epoch': 1.86} {'loss': 0.5102, 'learning_rate': 2.3115444757120687e-07, 'epoch': 1.86} {'loss': 0.3807, 'learning_rate': 2.3108447567008695e-07, 'epoch': 1.86} {'loss': 0.6082, 'learning_rate': 2.3101451423724108e-07, 'epoch': 1.86} {'loss': 0.5427, 'learning_rate': 2.3094456327274584e-07, 'epoch': 1.86} {'loss': 0.529, 'learning_rate': 2.3087462277667449e-07, 'epoch': 1.86} {'loss': 0.5374, 'learning_rate': 2.3080469274910366e-07, 'epoch': 1.86} {'loss': 0.47, 'learning_rate': 2.3073477319010774e-07, 'epoch': 1.86} {'loss': 0.4979, 'learning_rate': 2.3066486409975996e-07, 'epoch': 1.86} {'loss': 0.4033, 'learning_rate': 2.3059496547813698e-07, 'epoch': 1.86} {'loss': 0.3999, 'learning_rate': 2.3052507732531205e-07, 'epoch': 1.86} {'loss': 0.49, 'learning_rate': 2.3045519964136288e-07, 'epoch': 1.86} {'loss': 0.4923, 'learning_rate': 2.3038533242636163e-07, 'epoch': 1.86} {'loss': 0.5873, 'learning_rate': 2.3031547568038492e-07, 'epoch': 1.86} {'loss': 0.4315, 'learning_rate': 2.3024562940350825e-07, 'epoch': 1.86} {'loss': 0.4435, 'learning_rate': 2.3017579359580266e-07, 'epoch': 1.86} {'loss': 0.4722, 'learning_rate': 2.3010596825734698e-07, 'epoch': 1.86} {'loss': 0.6251, 'learning_rate': 2.300361533882145e-07, 'epoch': 1.86} {'loss': 0.4593, 'learning_rate': 2.299663489884796e-07, 'epoch': 1.86} {'loss': 0.4816, 'learning_rate': 2.2989655505821772e-07, 'epoch': 1.86} {'loss': 0.492, 'learning_rate': 2.2982677159750223e-07, 'epoch': 1.86} {'loss': 0.5618, 'learning_rate': 2.2975699860641188e-07, 'epoch': 1.86} {'loss': 0.5108, 'learning_rate': 2.2968723608501664e-07, 'epoch': 1.86} {'loss': 0.6777, 'learning_rate': 2.2961748403339424e-07, 'epoch': 1.86} {'loss': 0.5038, 'learning_rate': 2.2954774245161793e-07, 'epoch': 1.86} {'loss': 0.3937, 'learning_rate': 2.2947801133976323e-07, 'epoch': 1.86} {'loss': 0.4974, 'learning_rate': 2.294082906979056e-07, 'epoch': 1.86} {'loss': 0.6076, 'learning_rate': 2.2933858052611723e-07, 'epoch': 1.86} {'loss': 0.374, 'learning_rate': 2.2926888082447585e-07, 'epoch': 1.86} {'loss': 0.5348, 'learning_rate': 2.291991915930536e-07, 'epoch': 1.86} {'loss': 0.4051, 'learning_rate': 2.2912951283192709e-07, 'epoch': 1.86} {'loss': 0.6093, 'learning_rate': 2.290598445411696e-07, 'epoch': 1.86} {'loss': 0.5041, 'learning_rate': 2.289901867208566e-07, 'epoch': 1.86} {'loss': 0.4557, 'learning_rate': 2.2892053937106363e-07, 'epoch': 1.86} {'loss': 0.4563, 'learning_rate': 2.2885090249186171e-07, 'epoch': 1.86} {'loss': 0.5489, 'learning_rate': 2.287812760833308e-07, 'epoch': 1.86} {'loss': 0.5668, 'learning_rate': 2.287116601455408e-07, 'epoch': 1.86} {'loss': 0.6258, 'learning_rate': 2.2864205467856837e-07, 'epoch': 1.86} {'loss': 0.5886, 'learning_rate': 2.2857245968248898e-07, 'epoch': 1.86} {'loss': 0.4445, 'learning_rate': 2.285028751573748e-07, 'epoch': 1.86} {'loss': 0.5516, 'learning_rate': 2.2843330110330242e-07, 'epoch': 1.86} {'loss': 0.5128, 'learning_rate': 2.2836373752034514e-07, 'epoch': 1.86} {'loss': 0.5061, 'learning_rate': 2.282941844085784e-07, 'epoch': 1.86} {'loss': 0.4069, 'learning_rate': 2.2822464176807668e-07, 'epoch': 1.86} {'loss': 0.551, 'learning_rate': 2.281551095989143e-07, 'epoch': 1.86} {'loss': 0.3856, 'learning_rate': 2.2808558790116564e-07, 'epoch': 1.86} {'loss': 0.3859, 'learning_rate': 2.28016076674904e-07, 'epoch': 1.86} {'loss': 0.4689, 'learning_rate': 2.2794657592020708e-07, 'epoch': 1.86} {'loss': 0.5236, 'learning_rate': 2.2787708563714484e-07, 'epoch': 1.86} {'loss': 0.5003, 'learning_rate': 2.278076058257972e-07, 'epoch': 1.86} {'loss': 0.5061, 'learning_rate': 2.2773813648623412e-07, 'epoch': 1.86} {'loss': 0.5132, 'learning_rate': 2.2766867761853106e-07, 'epoch': 1.86} {'loss': 0.4495, 'learning_rate': 2.2759922922276467e-07, 'epoch': 1.86} {'loss': 0.4318, 'learning_rate': 2.2752979129900597e-07, 'epoch': 1.86} {'loss': 0.5466, 'learning_rate': 2.274603638473327e-07, 'epoch': 1.86} {'loss': 0.4571, 'learning_rate': 2.2739094686781592e-07, 'epoch': 1.86} {'loss': 0.327, 'learning_rate': 2.2732154036053333e-07, 'epoch': 1.86} {'loss': 0.5702, 'learning_rate': 2.2725214432555708e-07, 'epoch': 1.86} {'loss': 0.576, 'learning_rate': 2.271827587629627e-07, 'epoch': 1.86} {'loss': 0.5315, 'learning_rate': 2.2711338367282454e-07, 'epoch': 1.86} {'loss': 0.5819, 'learning_rate': 2.270440190552148e-07, 'epoch': 1.86} {'loss': 0.5196, 'learning_rate': 2.2697466491021004e-07, 'epoch': 1.86} {'loss': 0.5255, 'learning_rate': 2.2690532123788357e-07, 'epoch': 1.86} {'loss': 0.4531, 'learning_rate': 2.2683598803831198e-07, 'epoch': 1.86} {'loss': 0.4, 'learning_rate': 2.2676666531156634e-07, 'epoch': 1.86} {'loss': 0.4026, 'learning_rate': 2.266973530577221e-07, 'epoch': 1.86} {'loss': 0.5765, 'learning_rate': 2.2662805127685485e-07, 'epoch': 1.86} {'loss': 0.4563, 'learning_rate': 2.2655875996903553e-07, 'epoch': 1.86} {'loss': 0.6266, 'learning_rate': 2.2648947913434305e-07, 'epoch': 1.86} {'loss': 0.4752, 'learning_rate': 2.2642020877284842e-07, 'epoch': 1.86} {'loss': 0.6504, 'learning_rate': 2.2635094888462605e-07, 'epoch': 1.86} {'loss': 0.7544, 'learning_rate': 2.2628169946975143e-07, 'epoch': 1.86} {'loss': 0.5593, 'learning_rate': 2.2621246052829783e-07, 'epoch': 1.86} {'loss': 0.4641, 'learning_rate': 2.2614323206034073e-07, 'epoch': 1.86} {'loss': 0.5157, 'learning_rate': 2.260740140659512e-07, 'epoch': 1.86} {'loss': 0.3743, 'learning_rate': 2.2600480654520695e-07, 'epoch': 1.86} {'loss': 0.5427, 'learning_rate': 2.2593560949818015e-07, 'epoch': 1.86} {'loss': 0.4565, 'learning_rate': 2.258664229249463e-07, 'epoch': 1.86} {'loss': 0.5261, 'learning_rate': 2.257972468255776e-07, 'epoch': 1.86} {'loss': 0.3502, 'learning_rate': 2.2572808120014944e-07, 'epoch': 1.86} {'loss': 0.4582, 'learning_rate': 2.256589260487374e-07, 'epoch': 1.86} {'loss': 0.4567, 'learning_rate': 2.255897813714114e-07, 'epoch': 1.86} {'loss': 0.4498, 'learning_rate': 2.2552064716825138e-07, 'epoch': 1.86} {'loss': 0.5717, 'learning_rate': 2.254515234393262e-07, 'epoch': 1.86} {'loss': 0.4823, 'learning_rate': 2.253824101847113e-07, 'epoch': 1.87} {'loss': 0.4044, 'learning_rate': 2.2531330740448333e-07, 'epoch': 1.87} {'loss': 0.4265, 'learning_rate': 2.252442150987122e-07, 'epoch': 1.87} {'loss': 0.4681, 'learning_rate': 2.2517513326747676e-07, 'epoch': 1.87} {'loss': 0.5628, 'learning_rate': 2.2510606191084583e-07, 'epoch': 1.87} {'loss': 0.4936, 'learning_rate': 2.2503700102889715e-07, 'epoch': 1.87} {'loss': 0.4695, 'learning_rate': 2.2496795062170396e-07, 'epoch': 1.87} {'loss': 0.5456, 'learning_rate': 2.2489891068933844e-07, 'epoch': 1.87} {'loss': 0.407, 'learning_rate': 2.2482988123187831e-07, 'epoch': 1.87} {'loss': 0.506, 'learning_rate': 2.2476086224939243e-07, 'epoch': 1.87} {'loss': 0.6566, 'learning_rate': 2.2469185374195958e-07, 'epoch': 1.87} {'loss': 0.3647, 'learning_rate': 2.246228557096508e-07, 'epoch': 1.87} {'loss': 0.5943, 'learning_rate': 2.2455386815254165e-07, 'epoch': 1.87} {'loss': 0.597, 'learning_rate': 2.2448489107070427e-07, 'epoch': 1.87} {'loss': 0.5111, 'learning_rate': 2.244159244642141e-07, 'epoch': 1.87} {'loss': 0.5496, 'learning_rate': 2.243469683331456e-07, 'epoch': 1.87} {'loss': 0.4619, 'learning_rate': 2.242780226775698e-07, 'epoch': 1.87} {'loss': 0.4036, 'learning_rate': 2.2420908749756332e-07, 'epoch': 1.87} {'loss': 0.4235, 'learning_rate': 2.241401627931994e-07, 'epoch': 1.87} {'loss': 0.4598, 'learning_rate': 2.2407124856455132e-07, 'epoch': 1.87} {'loss': 0.5416, 'learning_rate': 2.2400234481169346e-07, 'epoch': 1.87} {'loss': 0.59, 'learning_rate': 2.2393345153469804e-07, 'epoch': 1.87} {'loss': 0.4373, 'learning_rate': 2.238645687336427e-07, 'epoch': 1.87} {'loss': 0.4765, 'learning_rate': 2.2379569640859743e-07, 'epoch': 1.87} {'loss': 0.5799, 'learning_rate': 2.2372683455963772e-07, 'epoch': 1.87} {'loss': 0.4708, 'learning_rate': 2.2365798318683685e-07, 'epoch': 1.87} {'loss': 0.3504, 'learning_rate': 2.2358914229026807e-07, 'epoch': 1.87} {'loss': 0.4574, 'learning_rate': 2.2352031187000689e-07, 'epoch': 1.87} {'loss': 0.475, 'learning_rate': 2.2345149192612548e-07, 'epoch': 1.87} {'loss': 0.4454, 'learning_rate': 2.2338268245869933e-07, 'epoch': 1.87} {'loss': 0.5377, 'learning_rate': 2.2331388346780058e-07, 'epoch': 1.87} {'loss': 0.5221, 'learning_rate': 2.2324509495350256e-07, 'epoch': 1.87} {'loss': 0.3561, 'learning_rate': 2.231763169158807e-07, 'epoch': 1.87} {'loss': 0.6394, 'learning_rate': 2.2310754935500722e-07, 'epoch': 1.87} {'loss': 0.4789, 'learning_rate': 2.2303879227095647e-07, 'epoch': 1.87} {'loss': 0.4866, 'learning_rate': 2.2297004566380177e-07, 'epoch': 1.87} {'loss': 0.2506, 'learning_rate': 2.2290130953361856e-07, 'epoch': 1.87} {'loss': 0.4445, 'learning_rate': 2.228325838804779e-07, 'epoch': 1.87} {'loss': 0.4509, 'learning_rate': 2.2276386870445533e-07, 'epoch': 1.87} {'loss': 0.5482, 'learning_rate': 2.2269516400562296e-07, 'epoch': 1.87} {'loss': 0.3742, 'learning_rate': 2.2262646978405523e-07, 'epoch': 1.87} {'loss': 0.3845, 'learning_rate': 2.2255778603982536e-07, 'epoch': 1.87} {'loss': 0.5167, 'learning_rate': 2.224891127730089e-07, 'epoch': 1.87} {'loss': 0.4598, 'learning_rate': 2.2242044998367685e-07, 'epoch': 1.87} {'loss': 0.5955, 'learning_rate': 2.2235179767190363e-07, 'epoch': 1.87} {'loss': 0.4723, 'learning_rate': 2.222831558377625e-07, 'epoch': 1.87} {'loss': 0.4783, 'learning_rate': 2.2221452448132785e-07, 'epoch': 1.87} {'loss': 0.4438, 'learning_rate': 2.2214590360267297e-07, 'epoch': 1.87} {'loss': 0.6403, 'learning_rate': 2.220772932018711e-07, 'epoch': 1.87} {'loss': 0.5233, 'learning_rate': 2.2200869327899665e-07, 'epoch': 1.87} {'loss': 0.429, 'learning_rate': 2.219401038341218e-07, 'epoch': 1.87} {'loss': 0.4754, 'learning_rate': 2.2187152486732088e-07, 'epoch': 1.87} {'loss': 0.3819, 'learning_rate': 2.2180295637866612e-07, 'epoch': 1.87} {'loss': 0.5258, 'learning_rate': 2.2173439836823297e-07, 'epoch': 1.87} {'loss': 0.4971, 'learning_rate': 2.216658508360936e-07, 'epoch': 1.87} {'loss': 0.4724, 'learning_rate': 2.215973137823224e-07, 'epoch': 1.87} {'loss': 0.5742, 'learning_rate': 2.2152878720699266e-07, 'epoch': 1.87} {'loss': 0.4354, 'learning_rate': 2.2146027111017543e-07, 'epoch': 1.87} {'loss': 0.4857, 'learning_rate': 2.213917654919473e-07, 'epoch': 1.87} {'loss': 0.5499, 'learning_rate': 2.2132327035238043e-07, 'epoch': 1.87} {'loss': 0.4303, 'learning_rate': 2.2125478569154813e-07, 'epoch': 1.87} {'loss': 0.4907, 'learning_rate': 2.2118631150952475e-07, 'epoch': 1.87} {'loss': 0.5226, 'learning_rate': 2.2111784780638136e-07, 'epoch': 1.87} {'loss': 0.5522, 'learning_rate': 2.2104939458219455e-07, 'epoch': 1.87} {'loss': 0.3968, 'learning_rate': 2.2098095183703427e-07, 'epoch': 1.87} {'loss': 0.5493, 'learning_rate': 2.2091251957097603e-07, 'epoch': 1.87} {'loss': 0.652, 'learning_rate': 2.208440977840931e-07, 'epoch': 1.87} {'loss': 0.5791, 'learning_rate': 2.2077568647645764e-07, 'epoch': 1.87} {'loss': 0.5373, 'learning_rate': 2.2070728564814513e-07, 'epoch': 1.87} {'loss': 0.5, 'learning_rate': 2.2063889529922443e-07, 'epoch': 1.87} {'loss': 0.5575, 'learning_rate': 2.2057051542977548e-07, 'epoch': 1.87} {'loss': 0.4456, 'learning_rate': 2.2050214603986597e-07, 'epoch': 1.87} {'loss': 0.3885, 'learning_rate': 2.204337871295703e-07, 'epoch': 1.87} {'loss': 0.5498, 'learning_rate': 2.2036543869896288e-07, 'epoch': 1.87} {'loss': 0.3552, 'learning_rate': 2.2029710074811694e-07, 'epoch': 1.87} {'loss': 0.4931, 'learning_rate': 2.202287732771069e-07, 'epoch': 1.87} {'loss': 0.4443, 'learning_rate': 2.2016045628600268e-07, 'epoch': 1.87} {'loss': 0.5363, 'learning_rate': 2.200921497748787e-07, 'epoch': 1.87} {'loss': 0.4172, 'learning_rate': 2.200238537438093e-07, 'epoch': 1.87} {'loss': 0.5987, 'learning_rate': 2.199555681928678e-07, 'epoch': 1.87} {'loss': 0.5495, 'learning_rate': 2.1988729312212632e-07, 'epoch': 1.87} {'loss': 0.3979, 'learning_rate': 2.1981902853165705e-07, 'epoch': 1.87} {'loss': 0.5912, 'learning_rate': 2.1975077442153658e-07, 'epoch': 1.87} {'loss': 0.4006, 'learning_rate': 2.1968253079183378e-07, 'epoch': 1.87} {'loss': 0.6098, 'learning_rate': 2.196142976426252e-07, 'epoch': 1.87} {'loss': 0.4675, 'learning_rate': 2.1954607497398196e-07, 'epoch': 1.87} {'loss': 0.4225, 'learning_rate': 2.1947786278597728e-07, 'epoch': 1.87} {'loss': 0.3503, 'learning_rate': 2.1940966107868665e-07, 'epoch': 1.87} {'loss': 0.4343, 'learning_rate': 2.1934146985217898e-07, 'epoch': 1.87} {'loss': 0.5162, 'learning_rate': 2.1927328910653189e-07, 'epoch': 1.87} {'loss': 0.505, 'learning_rate': 2.192051188418154e-07, 'epoch': 1.87} {'loss': 0.5088, 'learning_rate': 2.1913695905810272e-07, 'epoch': 1.87} {'loss': 0.5135, 'learning_rate': 2.190688097554683e-07, 'epoch': 1.87} {'loss': 0.4478, 'learning_rate': 2.1900067093398425e-07, 'epoch': 1.87} {'loss': 0.4603, 'learning_rate': 2.18932542593725e-07, 'epoch': 1.87} {'loss': 0.6631, 'learning_rate': 2.1886442473475934e-07, 'epoch': 1.87} {'loss': 0.4343, 'learning_rate': 2.1879631735716611e-07, 'epoch': 1.87} {'loss': 0.3184, 'learning_rate': 2.1872822046101417e-07, 'epoch': 1.87} {'loss': 0.54, 'learning_rate': 2.1866013404637787e-07, 'epoch': 1.87} {'loss': 0.6564, 'learning_rate': 2.185920581133305e-07, 'epoch': 1.87} {'loss': 0.4402, 'learning_rate': 2.1852399266194312e-07, 'epoch': 1.87} {'loss': 0.5426, 'learning_rate': 2.1845593769229235e-07, 'epoch': 1.87} {'loss': 0.5548, 'learning_rate': 2.1838789320444698e-07, 'epoch': 1.87} {'loss': 0.5092, 'learning_rate': 2.1831985919848365e-07, 'epoch': 1.87} {'loss': 0.6767, 'learning_rate': 2.1825183567447227e-07, 'epoch': 1.87} {'loss': 0.346, 'learning_rate': 2.1818382263248615e-07, 'epoch': 1.87} {'loss': 0.5103, 'learning_rate': 2.1811582007260078e-07, 'epoch': 1.87} {'loss': 0.5195, 'learning_rate': 2.1804782799488499e-07, 'epoch': 1.87} {'loss': 0.4426, 'learning_rate': 2.179798463994154e-07, 'epoch': 1.87} {'loss': 0.5947, 'learning_rate': 2.179118752862619e-07, 'epoch': 1.87} {'loss': 0.5376, 'learning_rate': 2.1784391465550115e-07, 'epoch': 1.87} {'loss': 0.477, 'learning_rate': 2.1777596450720196e-07, 'epoch': 1.87} {'loss': 0.3955, 'learning_rate': 2.177080248414387e-07, 'epoch': 1.87} {'loss': 0.4088, 'learning_rate': 2.176400956582847e-07, 'epoch': 1.87} {'loss': 0.5452, 'learning_rate': 2.1757217695781097e-07, 'epoch': 1.87} {'loss': 0.5724, 'learning_rate': 2.17504268740093e-07, 'epoch': 1.87} {'loss': 0.4987, 'learning_rate': 2.1743637100520077e-07, 'epoch': 1.87} {'loss': 0.5203, 'learning_rate': 2.1736848375321084e-07, 'epoch': 1.87} {'loss': 0.4764, 'learning_rate': 2.1730060698419098e-07, 'epoch': 1.87} {'loss': 0.5429, 'learning_rate': 2.1723274069821776e-07, 'epoch': 1.87} {'loss': 0.5355, 'learning_rate': 2.1716488489536335e-07, 'epoch': 1.87} {'loss': 0.4417, 'learning_rate': 2.1709703957569773e-07, 'epoch': 1.87} {'loss': 0.446, 'learning_rate': 2.1702920473929745e-07, 'epoch': 1.87} {'loss': 0.4686, 'learning_rate': 2.169613803862314e-07, 'epoch': 1.87} {'loss': 0.5769, 'learning_rate': 2.16893566516575e-07, 'epoch': 1.87} {'loss': 0.5591, 'learning_rate': 2.1682576313040048e-07, 'epoch': 1.87} {'loss': 0.458, 'learning_rate': 2.1675797022778e-07, 'epoch': 1.87} {'loss': 0.4793, 'learning_rate': 2.1669018780878682e-07, 'epoch': 1.87} {'loss': 0.4988, 'learning_rate': 2.1662241587349197e-07, 'epoch': 1.87} {'loss': 0.4545, 'learning_rate': 2.16554654421971e-07, 'epoch': 1.87} {'loss': 0.3698, 'learning_rate': 2.164869034542927e-07, 'epoch': 1.87} {'loss': 0.586, 'learning_rate': 2.1641916297053255e-07, 'epoch': 1.87} {'loss': 0.5423, 'learning_rate': 2.1635143297076276e-07, 'epoch': 1.87} {'loss': 0.5212, 'learning_rate': 2.162837134550544e-07, 'epoch': 1.87} {'loss': 0.5273, 'learning_rate': 2.162160044234829e-07, 'epoch': 1.87} {'loss': 0.3809, 'learning_rate': 2.1614830587611713e-07, 'epoch': 1.87} {'loss': 0.4383, 'learning_rate': 2.1608061781303257e-07, 'epoch': 1.87} {'loss': 0.3792, 'learning_rate': 2.160129402343003e-07, 'epoch': 1.87} {'loss': 0.4724, 'learning_rate': 2.1594527313999247e-07, 'epoch': 1.87} {'loss': 0.3963, 'learning_rate': 2.1587761653018347e-07, 'epoch': 1.87} {'loss': 0.5958, 'learning_rate': 2.1580997040494435e-07, 'epoch': 1.87} {'loss': 0.5999, 'learning_rate': 2.1574233476434836e-07, 'epoch': 1.87} {'loss': 0.4977, 'learning_rate': 2.156747096084655e-07, 'epoch': 1.87} {'loss': 0.5366, 'learning_rate': 2.156070949373734e-07, 'epoch': 1.87} {'loss': 0.4167, 'learning_rate': 2.1553949075113877e-07, 'epoch': 1.87} {'loss': 0.4651, 'learning_rate': 2.1547189704983818e-07, 'epoch': 1.87} {'loss': 0.5875, 'learning_rate': 2.1540431383354155e-07, 'epoch': 1.87} {'loss': 0.5638, 'learning_rate': 2.1533674110232328e-07, 'epoch': 1.87} {'loss': 0.4892, 'learning_rate': 2.1526917885625441e-07, 'epoch': 1.87} {'loss': 0.3524, 'learning_rate': 2.1520162709540825e-07, 'epoch': 1.87} {'loss': 0.4891, 'learning_rate': 2.1513408581985583e-07, 'epoch': 1.87} {'loss': 0.49, 'learning_rate': 2.1506655502967046e-07, 'epoch': 1.87} {'loss': 0.5627, 'learning_rate': 2.1499903472492422e-07, 'epoch': 1.87} {'loss': 0.642, 'learning_rate': 2.1493152490569046e-07, 'epoch': 1.87} {'loss': 0.3983, 'learning_rate': 2.1486402557204023e-07, 'epoch': 1.87} {'loss': 0.3424, 'learning_rate': 2.1479653672404678e-07, 'epoch': 1.87} {'loss': 0.5635, 'learning_rate': 2.1472905836178227e-07, 'epoch': 1.87} {'loss': 0.3681, 'learning_rate': 2.1466159048531776e-07, 'epoch': 1.87} {'loss': 0.4928, 'learning_rate': 2.1459413309472655e-07, 'epoch': 1.87} {'loss': 0.5257, 'learning_rate': 2.1452668619008187e-07, 'epoch': 1.87} {'loss': 0.6588, 'learning_rate': 2.1445924977145482e-07, 'epoch': 1.87} {'loss': 0.529, 'learning_rate': 2.1439182383891644e-07, 'epoch': 1.87} {'loss': 0.5184, 'learning_rate': 2.143244083925422e-07, 'epoch': 1.87} {'loss': 0.6018, 'learning_rate': 2.1425700343240208e-07, 'epoch': 1.87} {'loss': 0.5902, 'learning_rate': 2.1418960895856934e-07, 'epoch': 1.87} {'loss': 0.5612, 'learning_rate': 2.141222249711139e-07, 'epoch': 1.87} {'loss': 0.6003, 'learning_rate': 2.140548514701113e-07, 'epoch': 1.87} {'loss': 0.6353, 'learning_rate': 2.1398748845563254e-07, 'epoch': 1.87} {'loss': 0.5962, 'learning_rate': 2.1392013592774763e-07, 'epoch': 1.87} {'loss': 0.4829, 'learning_rate': 2.1385279388653202e-07, 'epoch': 1.87} {'loss': 0.4988, 'learning_rate': 2.1378546233205567e-07, 'epoch': 1.87} {'loss': 0.4318, 'learning_rate': 2.1371814126439182e-07, 'epoch': 1.87} {'loss': 0.5158, 'learning_rate': 2.1365083068361158e-07, 'epoch': 1.87} {'loss': 0.4353, 'learning_rate': 2.135835305897882e-07, 'epoch': 1.87} {'loss': 0.5268, 'learning_rate': 2.1351624098299385e-07, 'epoch': 1.87} {'loss': 0.3885, 'learning_rate': 2.1344896186329957e-07, 'epoch': 1.87} {'loss': 0.5194, 'learning_rate': 2.133816932307775e-07, 'epoch': 1.87} {'loss': 0.5871, 'learning_rate': 2.1331443508550098e-07, 'epoch': 1.87} {'loss': 0.4013, 'learning_rate': 2.13247187427541e-07, 'epoch': 1.87} {'loss': 0.435, 'learning_rate': 2.131799502569709e-07, 'epoch': 1.87} {'loss': 0.2699, 'learning_rate': 2.131127235738606e-07, 'epoch': 1.87} {'loss': 0.4162, 'learning_rate': 2.1304550737828444e-07, 'epoch': 1.87} {'loss': 0.4115, 'learning_rate': 2.129783016703124e-07, 'epoch': 1.87} {'loss': 0.5304, 'learning_rate': 2.1291110645001779e-07, 'epoch': 1.87} {'loss': 0.4907, 'learning_rate': 2.128439217174727e-07, 'epoch': 1.87} {'loss': 0.5484, 'learning_rate': 2.1277674747274712e-07, 'epoch': 1.87} {'loss': 0.4822, 'learning_rate': 2.1270958371591653e-07, 'epoch': 1.87} {'loss': 0.3693, 'learning_rate': 2.1264243044705092e-07, 'epoch': 1.87} {'loss': 0.6213, 'learning_rate': 2.1257528766622126e-07, 'epoch': 1.87} {'loss': 0.5237, 'learning_rate': 2.125081553735009e-07, 'epoch': 1.87} {'loss': 0.448, 'learning_rate': 2.1244103356896085e-07, 'epoch': 1.87} {'loss': 0.612, 'learning_rate': 2.123739222526744e-07, 'epoch': 1.87} {'loss': 0.4964, 'learning_rate': 2.123068214247115e-07, 'epoch': 1.87} {'loss': 0.5756, 'learning_rate': 2.122397310851465e-07, 'epoch': 1.87} {'loss': 0.5269, 'learning_rate': 2.121726512340505e-07, 'epoch': 1.87} {'loss': 0.5424, 'learning_rate': 2.1210558187149343e-07, 'epoch': 1.87} {'loss': 0.4412, 'learning_rate': 2.1203852299754967e-07, 'epoch': 1.87} {'loss': 0.5473, 'learning_rate': 2.1197147461228919e-07, 'epoch': 1.87} {'loss': 0.5158, 'learning_rate': 2.119044367157852e-07, 'epoch': 1.87} {'loss': 0.6336, 'learning_rate': 2.1183740930810992e-07, 'epoch': 1.87} {'loss': 0.4403, 'learning_rate': 2.1177039238933217e-07, 'epoch': 1.87} {'loss': 0.4818, 'learning_rate': 2.1170338595952855e-07, 'epoch': 1.87} {'loss': 0.5068, 'learning_rate': 2.116363900187668e-07, 'epoch': 1.87} {'loss': 0.4731, 'learning_rate': 2.1156940456711904e-07, 'epoch': 1.87} {'loss': 0.4202, 'learning_rate': 2.1150242960465972e-07, 'epoch': 1.87} {'loss': 0.3978, 'learning_rate': 2.1143546513145875e-07, 'epoch': 1.87} {'loss': 0.4849, 'learning_rate': 2.1136851114758828e-07, 'epoch': 1.87} {'loss': 0.3278, 'learning_rate': 2.1130156765311827e-07, 'epoch': 1.87} {'loss': 0.4807, 'learning_rate': 2.1123463464812422e-07, 'epoch': 1.87} {'loss': 0.4265, 'learning_rate': 2.1116771213267494e-07, 'epoch': 1.87} {'loss': 0.726, 'learning_rate': 2.1110080010684264e-07, 'epoch': 1.87} {'loss': 0.513, 'learning_rate': 2.1103389857069944e-07, 'epoch': 1.87} {'loss': 0.4884, 'learning_rate': 2.1096700752431642e-07, 'epoch': 1.87} {'loss': 0.4955, 'learning_rate': 2.1090012696776796e-07, 'epoch': 1.87} {'loss': 0.5436, 'learning_rate': 2.1083325690112065e-07, 'epoch': 1.87} {'loss': 0.5447, 'learning_rate': 2.1076639732445113e-07, 'epoch': 1.87} {'loss': 0.4269, 'learning_rate': 2.1069954823782825e-07, 'epoch': 1.87} {'loss': 0.3916, 'learning_rate': 2.106327096413241e-07, 'epoch': 1.87} {'loss': 0.5566, 'learning_rate': 2.10565881535012e-07, 'epoch': 1.87} {'loss': 0.5975, 'learning_rate': 2.1049906391895968e-07, 'epoch': 1.87} {'loss': 0.3764, 'learning_rate': 2.1043225679324264e-07, 'epoch': 1.87} {'loss': 0.5002, 'learning_rate': 2.1036546015792968e-07, 'epoch': 1.87} {'loss': 0.4959, 'learning_rate': 2.1029867401309633e-07, 'epoch': 1.87} {'loss': 0.514, 'learning_rate': 2.102318983588092e-07, 'epoch': 1.87} {'loss': 0.4594, 'learning_rate': 2.1016513319514264e-07, 'epoch': 1.87} {'loss': 0.6042, 'learning_rate': 2.1009837852216887e-07, 'epoch': 1.87} {'loss': 0.2893, 'learning_rate': 2.1003163433995665e-07, 'epoch': 1.87} {'loss': 0.5938, 'learning_rate': 2.0996490064858043e-07, 'epoch': 1.87} {'loss': 0.4885, 'learning_rate': 2.0989817744811015e-07, 'epoch': 1.87} {'loss': 0.404, 'learning_rate': 2.0983146473861682e-07, 'epoch': 1.87} {'loss': 0.4265, 'learning_rate': 2.0976476252017263e-07, 'epoch': 1.87} {'loss': 0.5201, 'learning_rate': 2.0969807079284975e-07, 'epoch': 1.87} {'loss': 0.4901, 'learning_rate': 2.0963138955672036e-07, 'epoch': 1.87} {'loss': 0.5281, 'learning_rate': 2.0956471881185214e-07, 'epoch': 1.87} {'loss': 0.5425, 'learning_rate': 2.0949805855832062e-07, 'epoch': 1.87} {'loss': 0.5485, 'learning_rate': 2.094314087961946e-07, 'epoch': 1.87} {'loss': 0.4257, 'learning_rate': 2.093647695255463e-07, 'epoch': 1.87} {'loss': 0.5382, 'learning_rate': 2.0929814074644784e-07, 'epoch': 1.87} {'loss': 0.45, 'learning_rate': 2.0923152245897027e-07, 'epoch': 1.87} {'loss': 0.4804, 'learning_rate': 2.0916491466318578e-07, 'epoch': 1.87} {'loss': 0.3819, 'learning_rate': 2.0909831735916208e-07, 'epoch': 1.87} {'loss': 0.6005, 'learning_rate': 2.0903173054697578e-07, 'epoch': 1.87} {'loss': 0.3223, 'learning_rate': 2.089651542266946e-07, 'epoch': 1.87} {'loss': 0.5285, 'learning_rate': 2.0889858839839073e-07, 'epoch': 1.87} {'loss': 0.5932, 'learning_rate': 2.0883203306213629e-07, 'epoch': 1.87} {'loss': 0.4123, 'learning_rate': 2.0876548821800124e-07, 'epoch': 1.87} {'loss': 0.5125, 'learning_rate': 2.0869895386605887e-07, 'epoch': 1.87} {'loss': 0.5649, 'learning_rate': 2.086324300063769e-07, 'epoch': 1.87} {'loss': 0.5524, 'learning_rate': 2.085659166390319e-07, 'epoch': 1.87} {'loss': 0.5657, 'learning_rate': 2.0849941376409056e-07, 'epoch': 1.87} {'loss': 0.4527, 'learning_rate': 2.0843292138162606e-07, 'epoch': 1.87} {'loss': 0.5094, 'learning_rate': 2.0836643949171065e-07, 'epoch': 1.87} {'loss': 0.4498, 'learning_rate': 2.08299968094412e-07, 'epoch': 1.87} {'loss': 0.5566, 'learning_rate': 2.0823350718980563e-07, 'epoch': 1.87} {'loss': 0.4409, 'learning_rate': 2.0816705677795924e-07, 'epoch': 1.87} {'loss': 0.4547, 'learning_rate': 2.0810061685894835e-07, 'epoch': 1.87} {'loss': 0.5722, 'learning_rate': 2.0803418743283954e-07, 'epoch': 1.87} {'loss': 0.5753, 'learning_rate': 2.07967768499705e-07, 'epoch': 1.87} {'loss': 0.5495, 'learning_rate': 2.0790136005961914e-07, 'epoch': 1.87} {'loss': 0.5182, 'learning_rate': 2.0783496211264853e-07, 'epoch': 1.87} {'loss': 0.4557, 'learning_rate': 2.0776857465886757e-07, 'epoch': 1.87} {'loss': 0.5508, 'learning_rate': 2.077021976983462e-07, 'epoch': 1.87} {'loss': 0.5175, 'learning_rate': 2.076358312311566e-07, 'epoch': 1.87} {'loss': 0.5897, 'learning_rate': 2.075694752573676e-07, 'epoch': 1.87} {'loss': 0.501, 'learning_rate': 2.0750312977705246e-07, 'epoch': 1.87} {'loss': 0.3263, 'learning_rate': 2.0743679479028222e-07, 'epoch': 1.87} {'loss': 0.5109, 'learning_rate': 2.0737047029712576e-07, 'epoch': 1.87} {'loss': 0.3651, 'learning_rate': 2.0730415629765632e-07, 'epoch': 1.87} {'loss': 0.4561, 'learning_rate': 2.0723785279194387e-07, 'epoch': 1.87} {'loss': 0.4445, 'learning_rate': 2.0717155978006164e-07, 'epoch': 1.87} {'loss': 0.5715, 'learning_rate': 2.0710527726207742e-07, 'epoch': 1.87} {'loss': 0.5475, 'learning_rate': 2.070390052380644e-07, 'epoch': 1.87} {'loss': 0.3475, 'learning_rate': 2.0697274370809263e-07, 'epoch': 1.87} {'loss': 0.4875, 'learning_rate': 2.0690649267223306e-07, 'epoch': 1.87} {'loss': 0.6754, 'learning_rate': 2.068402521305579e-07, 'epoch': 1.87} {'loss': 0.4144, 'learning_rate': 2.0677402208313713e-07, 'epoch': 1.87} {'loss': 0.4865, 'learning_rate': 2.0670780253004174e-07, 'epoch': 1.87} {'loss': 0.4562, 'learning_rate': 2.066415934713417e-07, 'epoch': 1.87} {'loss': 0.5585, 'learning_rate': 2.0657539490711033e-07, 'epoch': 1.87} {'loss': 0.5426, 'learning_rate': 2.0650920683741859e-07, 'epoch': 1.87} {'loss': 0.503, 'learning_rate': 2.0644302926233316e-07, 'epoch': 1.87} {'loss': 0.5953, 'learning_rate': 2.0637686218193066e-07, 'epoch': 1.87} {'loss': 0.5049, 'learning_rate': 2.0631070559627765e-07, 'epoch': 1.87} {'loss': 0.4294, 'learning_rate': 2.0624455950544742e-07, 'epoch': 1.87} {'loss': 0.5368, 'learning_rate': 2.061784239095088e-07, 'epoch': 1.87} {'loss': 0.6584, 'learning_rate': 2.0611229880853512e-07, 'epoch': 1.87} {'loss': 0.3972, 'learning_rate': 2.0604618420259736e-07, 'epoch': 1.87} {'loss': 0.5498, 'learning_rate': 2.0598008009176328e-07, 'epoch': 1.87} {'loss': 0.4402, 'learning_rate': 2.0591398647610505e-07, 'epoch': 1.87} {'loss': 0.5062, 'learning_rate': 2.0584790335569483e-07, 'epoch': 1.87} {'loss': 0.4906, 'learning_rate': 2.0578183073060253e-07, 'epoch': 1.87} {'loss': 0.5141, 'learning_rate': 2.0571576860089814e-07, 'epoch': 1.87} {'loss': 0.6342, 'learning_rate': 2.0564971696665493e-07, 'epoch': 1.87} {'loss': 0.4435, 'learning_rate': 2.055836758279417e-07, 'epoch': 1.87} {'loss': 0.4905, 'learning_rate': 2.0551764518482842e-07, 'epoch': 1.87} {'loss': 0.4746, 'learning_rate': 2.0545162503738724e-07, 'epoch': 1.87} {'loss': 0.4549, 'learning_rate': 2.0538561538568924e-07, 'epoch': 1.87} {'loss': 0.4976, 'learning_rate': 2.0531961622980435e-07, 'epoch': 1.87} {'loss': 0.4757, 'learning_rate': 2.052536275698036e-07, 'epoch': 1.87} {'loss': 0.5914, 'learning_rate': 2.0518764940575697e-07, 'epoch': 1.87} {'loss': 0.4466, 'learning_rate': 2.0512168173773773e-07, 'epoch': 1.87} {'loss': 0.4374, 'learning_rate': 2.0505572456581246e-07, 'epoch': 1.87} {'loss': 0.4961, 'learning_rate': 2.0498977789005557e-07, 'epoch': 1.87} {'loss': 0.4694, 'learning_rate': 2.049238417105348e-07, 'epoch': 1.87} {'loss': 0.499, 'learning_rate': 2.048579160273234e-07, 'epoch': 1.87} {'loss': 0.5733, 'learning_rate': 2.0479200084049022e-07, 'epoch': 1.87} {'loss': 0.6658, 'learning_rate': 2.047260961501074e-07, 'epoch': 1.87} {'loss': 0.5256, 'learning_rate': 2.046602019562427e-07, 'epoch': 1.87} {'loss': 0.5409, 'learning_rate': 2.0459431825897048e-07, 'epoch': 1.87} {'loss': 0.5842, 'learning_rate': 2.0452844505835844e-07, 'epoch': 1.87} {'loss': 0.4645, 'learning_rate': 2.044625823544788e-07, 'epoch': 1.87} {'loss': 0.4276, 'learning_rate': 2.0439673014740147e-07, 'epoch': 1.87} {'loss': 0.3889, 'learning_rate': 2.043308884371975e-07, 'epoch': 1.87} {'loss': 0.5769, 'learning_rate': 2.0426505722393685e-07, 'epoch': 1.87} {'loss': 0.5648, 'learning_rate': 2.0419923650768947e-07, 'epoch': 1.87} {'loss': 0.5478, 'learning_rate': 2.041334262885275e-07, 'epoch': 1.87} {'loss': 0.5393, 'learning_rate': 2.040676265665209e-07, 'epoch': 1.87} {'loss': 0.367, 'learning_rate': 2.0400183734173962e-07, 'epoch': 1.87} {'loss': 0.6392, 'learning_rate': 2.039360586142547e-07, 'epoch': 1.87} {'loss': 0.5083, 'learning_rate': 2.038702903841372e-07, 'epoch': 1.87} {'loss': 0.5537, 'learning_rate': 2.0380453265145594e-07, 'epoch': 1.87} {'loss': 0.4887, 'learning_rate': 2.03738785416282e-07, 'epoch': 1.87} {'loss': 0.4954, 'learning_rate': 2.0367304867868643e-07, 'epoch': 1.87} {'loss': 0.5051, 'learning_rate': 2.0360732243873915e-07, 'epoch': 1.87} {'loss': 0.4461, 'learning_rate': 2.0354160669651123e-07, 'epoch': 1.87} {'loss': 0.4538, 'learning_rate': 2.0347590145207263e-07, 'epoch': 1.87} {'loss': 0.4452, 'learning_rate': 2.0341020670549438e-07, 'epoch': 1.87} {'loss': 0.4849, 'learning_rate': 2.0334452245684533e-07, 'epoch': 1.87} {'loss': 0.6635, 'learning_rate': 2.0327884870619652e-07, 'epoch': 1.87} {'loss': 0.4359, 'learning_rate': 2.03213185453619e-07, 'epoch': 1.87} {'loss': 0.6549, 'learning_rate': 2.0314753269918275e-07, 'epoch': 1.87} {'loss': 0.5197, 'learning_rate': 2.0308189044295878e-07, 'epoch': 1.87} {'loss': 0.4228, 'learning_rate': 2.0301625868501707e-07, 'epoch': 1.87} {'loss': 0.5208, 'learning_rate': 2.029506374254264e-07, 'epoch': 1.87} {'loss': 0.4642, 'learning_rate': 2.0288502666425903e-07, 'epoch': 1.87} {'loss': 0.5393, 'learning_rate': 2.028194264015848e-07, 'epoch': 1.87} {'loss': 0.4894, 'learning_rate': 2.027538366374726e-07, 'epoch': 1.87} {'loss': 0.4198, 'learning_rate': 2.026882573719946e-07, 'epoch': 1.87} {'loss': 0.5292, 'learning_rate': 2.0262268860522072e-07, 'epoch': 1.87} {'loss': 0.5197, 'learning_rate': 2.0255713033722203e-07, 'epoch': 1.87} {'loss': 0.432, 'learning_rate': 2.0249158256806622e-07, 'epoch': 1.87} {'loss': 0.5268, 'learning_rate': 2.024260452978244e-07, 'epoch': 1.87} {'loss': 0.6756, 'learning_rate': 2.023605185265687e-07, 'epoch': 1.87} {'loss': 0.5635, 'learning_rate': 2.0229500225436683e-07, 'epoch': 1.87} {'loss': 0.6201, 'learning_rate': 2.022294964812921e-07, 'epoch': 1.87} {'loss': 0.4324, 'learning_rate': 2.0216400120740998e-07, 'epoch': 1.87} {'loss': 0.5983, 'learning_rate': 2.02098516432796e-07, 'epoch': 1.87} {'loss': 0.4869, 'learning_rate': 2.0203304215751672e-07, 'epoch': 1.87} {'loss': 0.4617, 'learning_rate': 2.0196757838164216e-07, 'epoch': 1.87} {'loss': 0.5121, 'learning_rate': 2.0190212510524554e-07, 'epoch': 1.87} {'loss': 0.4562, 'learning_rate': 2.0183668232839348e-07, 'epoch': 1.87} {'loss': 0.4814, 'learning_rate': 2.0177125005115928e-07, 'epoch': 1.87} {'loss': 0.4936, 'learning_rate': 2.0170582827361063e-07, 'epoch': 1.87} {'loss': 0.4525, 'learning_rate': 2.016404169958197e-07, 'epoch': 1.87} {'loss': 0.5247, 'learning_rate': 2.0157501621785424e-07, 'epoch': 1.87} {'loss': 0.5301, 'learning_rate': 2.015096259397853e-07, 'epoch': 1.87} {'loss': 0.3177, 'learning_rate': 2.014442461616839e-07, 'epoch': 1.87} {'loss': 0.4898, 'learning_rate': 2.0137887688361891e-07, 'epoch': 1.87} {'loss': 0.4955, 'learning_rate': 2.0131351810566135e-07, 'epoch': 1.87} {'loss': 0.538, 'learning_rate': 2.0124816982788008e-07, 'epoch': 1.87} {'loss': 0.5375, 'learning_rate': 2.0118283205034616e-07, 'epoch': 1.87} {'loss': 0.4892, 'learning_rate': 2.0111750477312952e-07, 'epoch': 1.87} {'loss': 0.456, 'learning_rate': 2.01052187996299e-07, 'epoch': 1.87} {'loss': 0.5461, 'learning_rate': 2.0098688171992786e-07, 'epoch': 1.87} {'loss': 0.4952, 'learning_rate': 2.009215859440805e-07, 'epoch': 1.87} {'loss': 0.5305, 'learning_rate': 2.0085630066883245e-07, 'epoch': 1.87} {'loss': 0.367, 'learning_rate': 2.0079102589424916e-07, 'epoch': 1.87} {'loss': 0.4915, 'learning_rate': 2.007257616204039e-07, 'epoch': 1.87} {'loss': 0.5338, 'learning_rate': 2.0066050784736558e-07, 'epoch': 1.87} {'loss': 0.5962, 'learning_rate': 2.0059526457520407e-07, 'epoch': 1.87} {'loss': 0.5103, 'learning_rate': 2.0053003180398934e-07, 'epoch': 1.87} {'loss': 0.3339, 'learning_rate': 2.0046480953379022e-07, 'epoch': 1.87} {'loss': 0.4623, 'learning_rate': 2.003995977646789e-07, 'epoch': 1.87} {'loss': 0.4523, 'learning_rate': 2.0033439649672194e-07, 'epoch': 1.87} {'loss': 0.6673, 'learning_rate': 2.0026920572999264e-07, 'epoch': 1.87} {'loss': 0.6961, 'learning_rate': 2.0020402546455874e-07, 'epoch': 1.87} {'loss': 0.347, 'learning_rate': 2.0013885570049018e-07, 'epoch': 1.87} {'loss': 0.5959, 'learning_rate': 2.0007369643785913e-07, 'epoch': 1.87} {'loss': 0.3605, 'learning_rate': 2.0000854767673215e-07, 'epoch': 1.87} {'loss': 0.6396, 'learning_rate': 1.999434094171815e-07, 'epoch': 1.87} {'loss': 0.5226, 'learning_rate': 1.998782816592737e-07, 'epoch': 1.87} {'loss': 0.4677, 'learning_rate': 1.9981316440308318e-07, 'epoch': 1.87} {'loss': 0.6036, 'learning_rate': 1.9974805764867767e-07, 'epoch': 1.87} {'loss': 0.5194, 'learning_rate': 1.9968296139612485e-07, 'epoch': 1.87} {'loss': 0.5311, 'learning_rate': 1.9961787564549806e-07, 'epoch': 1.87} {'loss': 0.3948, 'learning_rate': 1.9955280039686276e-07, 'epoch': 1.87} {'loss': 0.4561, 'learning_rate': 1.9948773565029444e-07, 'epoch': 1.87} {'loss': 0.5634, 'learning_rate': 1.994226814058575e-07, 'epoch': 1.87} {'loss': 0.6002, 'learning_rate': 1.9935763766362415e-07, 'epoch': 1.87} {'loss': 0.6752, 'learning_rate': 1.9929260442366317e-07, 'epoch': 1.87} {'loss': 0.3946, 'learning_rate': 1.992275816860445e-07, 'epoch': 1.87} {'loss': 0.3726, 'learning_rate': 1.9916256945084035e-07, 'epoch': 1.87} {'loss': 0.4642, 'learning_rate': 1.9909756771811505e-07, 'epoch': 1.87} {'loss': 0.5264, 'learning_rate': 1.9903257648794305e-07, 'epoch': 1.87} {'loss': 0.4861, 'learning_rate': 1.9896759576039204e-07, 'epoch': 1.87} {'loss': 0.3658, 'learning_rate': 1.9890262553553196e-07, 'epoch': 1.87} {'loss': 0.5036, 'learning_rate': 1.9883766581343168e-07, 'epoch': 1.87} {'loss': 0.6082, 'learning_rate': 1.9877271659416109e-07, 'epoch': 1.87} {'loss': 0.5065, 'learning_rate': 1.9870777787779239e-07, 'epoch': 1.87} {'loss': 0.5209, 'learning_rate': 1.9864284966438995e-07, 'epoch': 1.87} {'loss': 0.4998, 'learning_rate': 1.985779319540282e-07, 'epoch': 1.87} {'loss': 0.5375, 'learning_rate': 1.985130247467748e-07, 'epoch': 1.87} {'loss': 0.6317, 'learning_rate': 1.9844812804269863e-07, 'epoch': 1.87} {'loss': 0.5003, 'learning_rate': 1.9838324184187074e-07, 'epoch': 1.87} {'loss': 0.5598, 'learning_rate': 1.9831836614435884e-07, 'epoch': 1.87} {'loss': 0.4458, 'learning_rate': 1.98253500950234e-07, 'epoch': 1.87} {'loss': 0.4322, 'learning_rate': 1.9818864625956503e-07, 'epoch': 1.87} {'loss': 0.492, 'learning_rate': 1.9812380207242188e-07, 'epoch': 1.87} {'loss': 0.4206, 'learning_rate': 1.9805896838887339e-07, 'epoch': 1.87} {'loss': 0.5087, 'learning_rate': 1.9799414520898951e-07, 'epoch': 1.87} {'loss': 0.3662, 'learning_rate': 1.979293325328402e-07, 'epoch': 1.87} {'loss': 0.3911, 'learning_rate': 1.9786453036049314e-07, 'epoch': 1.87} {'loss': 0.4439, 'learning_rate': 1.977997386920205e-07, 'epoch': 1.87} {'loss': 0.4552, 'learning_rate': 1.9773495752748894e-07, 'epoch': 1.87} {'loss': 0.306, 'learning_rate': 1.976701868669695e-07, 'epoch': 1.87} {'loss': 0.5179, 'learning_rate': 1.9760542671053095e-07, 'epoch': 1.87} {'loss': 0.5417, 'learning_rate': 1.975406770582433e-07, 'epoch': 1.87} {'loss': 0.3656, 'learning_rate': 1.9747593791017539e-07, 'epoch': 1.87} {'loss': 0.6947, 'learning_rate': 1.97411209266396e-07, 'epoch': 1.87} {'loss': 0.4998, 'learning_rate': 1.9734649112697623e-07, 'epoch': 1.87} {'loss': 0.5054, 'learning_rate': 1.972817834919838e-07, 'epoch': 1.87} {'loss': 0.3646, 'learning_rate': 1.9721708636148863e-07, 'epoch': 1.87} {'loss': 0.4714, 'learning_rate': 1.9715239973556067e-07, 'epoch': 1.87} {'loss': 0.5394, 'learning_rate': 1.9708772361426877e-07, 'epoch': 1.87} {'loss': 0.4033, 'learning_rate': 1.9702305799768173e-07, 'epoch': 1.87} {'loss': 0.5464, 'learning_rate': 1.9695840288586844e-07, 'epoch': 1.87} {'loss': 0.5467, 'learning_rate': 1.9689375827890101e-07, 'epoch': 1.87} {'loss': 0.3256, 'learning_rate': 1.9682912417684496e-07, 'epoch': 1.87} {'loss': 0.4014, 'learning_rate': 1.9676450057977247e-07, 'epoch': 1.87} {'loss': 0.5315, 'learning_rate': 1.9669988748775015e-07, 'epoch': 1.87} {'loss': 0.4447, 'learning_rate': 1.9663528490085015e-07, 'epoch': 1.87} {'loss': 0.5792, 'learning_rate': 1.9657069281914022e-07, 'epoch': 1.87} {'loss': 0.5313, 'learning_rate': 1.9650611124268916e-07, 'epoch': 1.87} {'loss': 0.4834, 'learning_rate': 1.9644154017156581e-07, 'epoch': 1.87} {'loss': 0.4847, 'learning_rate': 1.9637697960584123e-07, 'epoch': 1.87} {'loss': 0.5361, 'learning_rate': 1.9631242954558317e-07, 'epoch': 1.87} {'loss': 0.5654, 'learning_rate': 1.9624788999086152e-07, 'epoch': 1.87} {'loss': 0.4594, 'learning_rate': 1.9618336094174405e-07, 'epoch': 1.87} {'loss': 0.36, 'learning_rate': 1.9611884239830292e-07, 'epoch': 1.87} {'loss': 0.5431, 'learning_rate': 1.9605433436060361e-07, 'epoch': 1.87} {'loss': 0.5045, 'learning_rate': 1.959898368287172e-07, 'epoch': 1.87} {'loss': 0.475, 'learning_rate': 1.959253498027125e-07, 'epoch': 1.87} {'loss': 0.5803, 'learning_rate': 1.9586087328265945e-07, 'epoch': 1.87} {'loss': 0.4825, 'learning_rate': 1.9579640726862581e-07, 'epoch': 1.87} {'loss': 0.5616, 'learning_rate': 1.9573195176068038e-07, 'epoch': 1.87} {'loss': 0.5419, 'learning_rate': 1.9566750675889534e-07, 'epoch': 1.87} {'loss': 0.5521, 'learning_rate': 1.956030722633362e-07, 'epoch': 1.87} {'loss': 0.497, 'learning_rate': 1.9553864827407287e-07, 'epoch': 1.87} {'loss': 0.5836, 'learning_rate': 1.9547423479117422e-07, 'epoch': 1.87} {'loss': 0.5078, 'learning_rate': 1.954098318147113e-07, 'epoch': 1.87} {'loss': 0.4267, 'learning_rate': 1.953454393447507e-07, 'epoch': 1.87} {'loss': 0.4798, 'learning_rate': 1.952810573813635e-07, 'epoch': 1.87} {'loss': 0.5943, 'learning_rate': 1.9521668592461628e-07, 'epoch': 1.87} {'loss': 0.676, 'learning_rate': 1.9515232497458013e-07, 'epoch': 1.87} {'loss': 0.3072, 'learning_rate': 1.9508797453132277e-07, 'epoch': 1.87} {'loss': 0.4805, 'learning_rate': 1.9502363459491302e-07, 'epoch': 1.87} {'loss': 0.5819, 'learning_rate': 1.9495930516542084e-07, 'epoch': 1.87} {'loss': 0.4456, 'learning_rate': 1.9489498624291502e-07, 'epoch': 1.87} {'loss': 0.5187, 'learning_rate': 1.9483067782746556e-07, 'epoch': 1.87} {'loss': 0.4158, 'learning_rate': 1.9476637991913793e-07, 'epoch': 1.87} {'loss': 0.6029, 'learning_rate': 1.947020925180043e-07, 'epoch': 1.87} {'loss': 0.4524, 'learning_rate': 1.9463781562413132e-07, 'epoch': 1.87} {'loss': 0.6227, 'learning_rate': 1.9457354923758886e-07, 'epoch': 1.87} {'loss': 0.5693, 'learning_rate': 1.9450929335844803e-07, 'epoch': 1.87} {'loss': 0.4232, 'learning_rate': 1.944450479867721e-07, 'epoch': 1.87} {'loss': 0.5748, 'learning_rate': 1.9438081312263656e-07, 'epoch': 1.87} {'loss': 0.6178, 'learning_rate': 1.943165887661047e-07, 'epoch': 1.87} {'loss': 0.5699, 'learning_rate': 1.942523749172487e-07, 'epoch': 1.87} {'loss': 0.5443, 'learning_rate': 1.9418817157613622e-07, 'epoch': 1.87} {'loss': 0.4216, 'learning_rate': 1.9412397874283505e-07, 'epoch': 1.87} {'loss': 0.5995, 'learning_rate': 1.9405979641741734e-07, 'epoch': 1.87} {'loss': 0.5319, 'learning_rate': 1.9399562459994748e-07, 'epoch': 1.87} {'loss': 0.5683, 'learning_rate': 1.939314632904976e-07, 'epoch': 1.87} {'loss': 0.3694, 'learning_rate': 1.9386731248913436e-07, 'epoch': 1.87} {'loss': 0.5861, 'learning_rate': 1.9380317219592771e-07, 'epoch': 1.87} {'loss': 0.4045, 'learning_rate': 1.9373904241094532e-07, 'epoch': 1.87} {'loss': 0.4837, 'learning_rate': 1.936749231342572e-07, 'epoch': 1.87} {'loss': 0.4925, 'learning_rate': 1.936108143659332e-07, 'epoch': 1.87} {'loss': 0.4621, 'learning_rate': 1.935467161060378e-07, 'epoch': 1.87} {'loss': 0.4812, 'learning_rate': 1.9348262835464315e-07, 'epoch': 1.87} {'loss': 0.5268, 'learning_rate': 1.9341855111181696e-07, 'epoch': 1.87} {'loss': 0.4335, 'learning_rate': 1.9335448437762805e-07, 'epoch': 1.87} {'loss': 0.5698, 'learning_rate': 1.9329042815214527e-07, 'epoch': 1.88} {'loss': 0.4911, 'learning_rate': 1.9322638243543523e-07, 'epoch': 1.88} {'loss': 0.57, 'learning_rate': 1.931623472275701e-07, 'epoch': 1.88} {'loss': 0.4616, 'learning_rate': 1.9309832252861537e-07, 'epoch': 1.88} {'loss': 0.4865, 'learning_rate': 1.93034308338641e-07, 'epoch': 1.88} {'loss': 0.6202, 'learning_rate': 1.9297030465771582e-07, 'epoch': 1.88} {'loss': 0.6551, 'learning_rate': 1.9290631148590867e-07, 'epoch': 1.88} {'loss': 0.6489, 'learning_rate': 1.9284232882328725e-07, 'epoch': 1.88} {'loss': 0.5711, 'learning_rate': 1.9277835666991929e-07, 'epoch': 1.88} {'loss': 0.5655, 'learning_rate': 1.9271439502587695e-07, 'epoch': 1.88} {'loss': 0.5921, 'learning_rate': 1.9265044389122468e-07, 'epoch': 1.88} {'loss': 0.7012, 'learning_rate': 1.9258650326603235e-07, 'epoch': 1.88} {'loss': 0.4785, 'learning_rate': 1.9252257315036883e-07, 'epoch': 1.88} {'loss': 0.4604, 'learning_rate': 1.9245865354430292e-07, 'epoch': 1.88} {'loss': 0.3987, 'learning_rate': 1.9239474444790353e-07, 'epoch': 1.88} {'loss': 0.451, 'learning_rate': 1.9233084586123607e-07, 'epoch': 1.88} {'loss': 0.4533, 'learning_rate': 1.9226695778437388e-07, 'epoch': 1.88} {'loss': 0.528, 'learning_rate': 1.9220308021738133e-07, 'epoch': 1.88} {'loss': 0.5307, 'learning_rate': 1.9213921316032836e-07, 'epoch': 1.88} {'loss': 0.3466, 'learning_rate': 1.9207535661328491e-07, 'epoch': 1.88} {'loss': 0.5853, 'learning_rate': 1.9201151057631651e-07, 'epoch': 1.88} {'loss': 0.4743, 'learning_rate': 1.9194767504949418e-07, 'epoch': 1.88} {'loss': 0.4118, 'learning_rate': 1.9188385003288233e-07, 'epoch': 1.88} {'loss': 0.5178, 'learning_rate': 1.9182003552655536e-07, 'epoch': 1.88} {'loss': 0.4188, 'learning_rate': 1.9175623153057766e-07, 'epoch': 1.88} {'loss': 0.5029, 'learning_rate': 1.9169243804501802e-07, 'epoch': 1.88} {'loss': 0.74, 'learning_rate': 1.9162865506994533e-07, 'epoch': 1.88} {'loss': 0.7102, 'learning_rate': 1.9156488260542726e-07, 'epoch': 1.88} {'loss': 0.4992, 'learning_rate': 1.915011206515338e-07, 'epoch': 1.88} {'loss': 0.5808, 'learning_rate': 1.9143736920833044e-07, 'epoch': 1.88} {'loss': 0.5608, 'learning_rate': 1.9137362827588824e-07, 'epoch': 1.88} {'loss': 0.3274, 'learning_rate': 1.913098978542749e-07, 'epoch': 1.88} {'loss': 0.5404, 'learning_rate': 1.9124617794355703e-07, 'epoch': 1.88} {'loss': 0.4895, 'learning_rate': 1.9118246854380574e-07, 'epoch': 1.88} {'loss': 0.4148, 'learning_rate': 1.9111876965508646e-07, 'epoch': 1.88} {'loss': 0.4646, 'learning_rate': 1.910550812774703e-07, 'epoch': 1.88} {'loss': 0.4679, 'learning_rate': 1.9099140341102162e-07, 'epoch': 1.88} {'loss': 0.5787, 'learning_rate': 1.909277360558126e-07, 'epoch': 1.88} {'loss': 0.493, 'learning_rate': 1.9086407921190986e-07, 'epoch': 1.88} {'loss': 0.5295, 'learning_rate': 1.908004328793811e-07, 'epoch': 1.88} {'loss': 0.5379, 'learning_rate': 1.9073679705829628e-07, 'epoch': 1.88} {'loss': 0.5413, 'learning_rate': 1.906731717487198e-07, 'epoch': 1.88} {'loss': 0.6674, 'learning_rate': 1.906095569507249e-07, 'epoch': 1.88} {'loss': 0.3721, 'learning_rate': 1.9054595266437493e-07, 'epoch': 1.88} {'loss': 0.4637, 'learning_rate': 1.90482358889742e-07, 'epoch': 1.88} {'loss': 0.4764, 'learning_rate': 1.9041877562689158e-07, 'epoch': 1.88} {'loss': 0.6028, 'learning_rate': 1.9035520287589372e-07, 'epoch': 1.88} {'loss': 0.5989, 'learning_rate': 1.9029164063681603e-07, 'epoch': 1.88} {'loss': 0.5091, 'learning_rate': 1.902280889097241e-07, 'epoch': 1.88} {'loss': 0.509, 'learning_rate': 1.9016454769469006e-07, 'epoch': 1.88} {'loss': 0.3329, 'learning_rate': 1.901010169917783e-07, 'epoch': 1.88} {'loss': 0.4288, 'learning_rate': 1.9003749680106097e-07, 'epoch': 1.88} {'loss': 0.4534, 'learning_rate': 1.899739871226025e-07, 'epoch': 1.88} {'loss': 0.5384, 'learning_rate': 1.899104879564728e-07, 'epoch': 1.88} {'loss': 0.5684, 'learning_rate': 1.8984699930273965e-07, 'epoch': 1.88} {'loss': 0.5264, 'learning_rate': 1.8978352116146958e-07, 'epoch': 1.88} {'loss': 0.4232, 'learning_rate': 1.897200535327337e-07, 'epoch': 1.88} {'loss': 0.5094, 'learning_rate': 1.896565964165964e-07, 'epoch': 1.88} {'loss': 0.385, 'learning_rate': 1.8959314981312871e-07, 'epoch': 1.88} {'loss': 0.3961, 'learning_rate': 1.8952971372239726e-07, 'epoch': 1.88} {'loss': 0.499, 'learning_rate': 1.8946628814446978e-07, 'epoch': 1.88} {'loss': 0.5477, 'learning_rate': 1.8940287307941506e-07, 'epoch': 1.88} {'loss': 0.6403, 'learning_rate': 1.893394685272998e-07, 'epoch': 1.88} {'loss': 0.5747, 'learning_rate': 1.8927607448819386e-07, 'epoch': 1.88} {'loss': 0.3919, 'learning_rate': 1.892126909621639e-07, 'epoch': 1.88} {'loss': 0.4557, 'learning_rate': 1.891493179492765e-07, 'epoch': 1.88} {'loss': 0.3772, 'learning_rate': 1.8908595544960273e-07, 'epoch': 1.88} {'loss': 0.3342, 'learning_rate': 1.8902260346320812e-07, 'epoch': 1.88} {'loss': 0.5206, 'learning_rate': 1.8895926199016257e-07, 'epoch': 1.88} {'loss': 0.5409, 'learning_rate': 1.888959310305316e-07, 'epoch': 1.88} {'loss': 0.4963, 'learning_rate': 1.8883261058438407e-07, 'epoch': 1.88} {'loss': 0.5734, 'learning_rate': 1.8876930065178766e-07, 'epoch': 1.88} {'loss': 0.4979, 'learning_rate': 1.8870600123281013e-07, 'epoch': 1.88} {'loss': 0.4153, 'learning_rate': 1.886427123275214e-07, 'epoch': 1.88} {'loss': 0.4643, 'learning_rate': 1.8857943393598588e-07, 'epoch': 1.88} {'loss': 0.5146, 'learning_rate': 1.885161660582746e-07, 'epoch': 1.88} {'loss': 0.3935, 'learning_rate': 1.88452908694452e-07, 'epoch': 1.88} {'loss': 0.5275, 'learning_rate': 1.8838966184458907e-07, 'epoch': 1.88} {'loss': 0.6342, 'learning_rate': 1.8832642550875136e-07, 'epoch': 1.88} {'loss': 0.5817, 'learning_rate': 1.8826319968700767e-07, 'epoch': 1.88} {'loss': 0.5859, 'learning_rate': 1.8819998437942576e-07, 'epoch': 1.88} {'loss': 0.5055, 'learning_rate': 1.8813677958607224e-07, 'epoch': 1.88} {'loss': 0.5916, 'learning_rate': 1.8807358530701702e-07, 'epoch': 1.88} {'loss': 0.4226, 'learning_rate': 1.8801040154232563e-07, 'epoch': 1.88} {'loss': 0.5279, 'learning_rate': 1.879472282920669e-07, 'epoch': 1.88} {'loss': 0.5158, 'learning_rate': 1.8788406555630857e-07, 'epoch': 1.88} {'loss': 0.4426, 'learning_rate': 1.878209133351172e-07, 'epoch': 1.88} {'loss': 0.4083, 'learning_rate': 1.877577716285628e-07, 'epoch': 1.88} {'loss': 0.4952, 'learning_rate': 1.8769464043671082e-07, 'epoch': 1.88} {'loss': 0.592, 'learning_rate': 1.8763151975962902e-07, 'epoch': 1.88} {'loss': 0.6351, 'learning_rate': 1.8756840959738622e-07, 'epoch': 1.88} {'loss': 0.4493, 'learning_rate': 1.8750530995005012e-07, 'epoch': 1.88} {'loss': 0.4975, 'learning_rate': 1.8744222081768627e-07, 'epoch': 1.88} {'loss': 0.3869, 'learning_rate': 1.8737914220036457e-07, 'epoch': 1.88} {'loss': 0.6348, 'learning_rate': 1.8731607409815279e-07, 'epoch': 1.88} {'loss': 0.64, 'learning_rate': 1.8725301651111638e-07, 'epoch': 1.88} {'loss': 0.4708, 'learning_rate': 1.8718996943932422e-07, 'epoch': 1.88} {'loss': 0.5044, 'learning_rate': 1.871269328828429e-07, 'epoch': 1.88} {'loss': 0.5123, 'learning_rate': 1.8706390684174126e-07, 'epoch': 1.88} {'loss': 0.5344, 'learning_rate': 1.870008913160859e-07, 'epoch': 1.88} {'loss': 0.5052, 'learning_rate': 1.8693788630594567e-07, 'epoch': 1.88} {'loss': 0.5436, 'learning_rate': 1.868748918113872e-07, 'epoch': 1.88} {'loss': 0.4722, 'learning_rate': 1.8681190783247817e-07, 'epoch': 1.88} {'loss': 0.5758, 'learning_rate': 1.867489343692841e-07, 'epoch': 1.88} {'loss': 0.4995, 'learning_rate': 1.8668597142187604e-07, 'epoch': 1.88} {'loss': 0.6102, 'learning_rate': 1.8662301899031842e-07, 'epoch': 1.88} {'loss': 0.5868, 'learning_rate': 1.8656007707468116e-07, 'epoch': 1.88} {'loss': 0.3263, 'learning_rate': 1.8649714567502975e-07, 'epoch': 1.88} {'loss': 0.5098, 'learning_rate': 1.8643422479143302e-07, 'epoch': 1.88} {'loss': 0.5792, 'learning_rate': 1.863713144239565e-07, 'epoch': 1.88} {'loss': 0.4731, 'learning_rate': 1.8630841457267013e-07, 'epoch': 1.88} {'loss': 0.5686, 'learning_rate': 1.862455252376394e-07, 'epoch': 1.88} {'loss': 0.562, 'learning_rate': 1.8618264641893202e-07, 'epoch': 1.88} {'loss': 0.6442, 'learning_rate': 1.8611977811661575e-07, 'epoch': 1.88} {'loss': 0.5207, 'learning_rate': 1.860569203307594e-07, 'epoch': 1.88} {'loss': 0.4562, 'learning_rate': 1.8599407306142735e-07, 'epoch': 1.88} {'loss': 0.4832, 'learning_rate': 1.8593123630868849e-07, 'epoch': 1.88} {'loss': 0.5295, 'learning_rate': 1.8586841007261048e-07, 'epoch': 1.88} {'loss': 0.5732, 'learning_rate': 1.8580559435325996e-07, 'epoch': 1.88} {'loss': 0.4769, 'learning_rate': 1.8574278915070466e-07, 'epoch': 1.88} {'loss': 0.5268, 'learning_rate': 1.8567999446501117e-07, 'epoch': 1.88} {'loss': 0.5084, 'learning_rate': 1.8561721029624946e-07, 'epoch': 1.88} {'loss': 0.6325, 'learning_rate': 1.855544366444828e-07, 'epoch': 1.88} {'loss': 0.4796, 'learning_rate': 1.8549167350978115e-07, 'epoch': 1.88} {'loss': 0.5153, 'learning_rate': 1.8542892089221e-07, 'epoch': 1.88} {'loss': 0.5875, 'learning_rate': 1.8536617879183817e-07, 'epoch': 1.88} {'loss': 0.5637, 'learning_rate': 1.8530344720873338e-07, 'epoch': 1.88} {'loss': 0.5256, 'learning_rate': 1.8524072614295896e-07, 'epoch': 1.88} {'loss': 0.5418, 'learning_rate': 1.8517801559458814e-07, 'epoch': 1.88} {'loss': 0.4387, 'learning_rate': 1.8511531556368312e-07, 'epoch': 1.88} {'loss': 0.6149, 'learning_rate': 1.850526260503127e-07, 'epoch': 1.88} {'loss': 0.4769, 'learning_rate': 1.8498994705454576e-07, 'epoch': 1.88} {'loss': 0.6373, 'learning_rate': 1.8492727857644666e-07, 'epoch': 1.88} {'loss': 0.3057, 'learning_rate': 1.8486462061608423e-07, 'epoch': 1.88} {'loss': 0.347, 'learning_rate': 1.848019731735251e-07, 'epoch': 1.88} {'loss': 0.5916, 'learning_rate': 1.84739336248837e-07, 'epoch': 1.88} {'loss': 0.5212, 'learning_rate': 1.8467670984208652e-07, 'epoch': 1.88} {'loss': 0.4405, 'learning_rate': 1.846140939533403e-07, 'epoch': 1.88} {'loss': 0.4139, 'learning_rate': 1.8455148858266602e-07, 'epoch': 1.88} {'loss': 0.4512, 'learning_rate': 1.8448889373013034e-07, 'epoch': 1.88} {'loss': 0.4683, 'learning_rate': 1.8442630939580208e-07, 'epoch': 1.88} {'loss': 0.4714, 'learning_rate': 1.8436373557974563e-07, 'epoch': 1.88} {'loss': 0.4022, 'learning_rate': 1.8430117228202983e-07, 'epoch': 1.88} {'loss': 0.4549, 'learning_rate': 1.8423861950272126e-07, 'epoch': 1.88} {'loss': 0.5899, 'learning_rate': 1.8417607724188657e-07, 'epoch': 1.88} {'loss': 0.5088, 'learning_rate': 1.8411354549959458e-07, 'epoch': 1.88} {'loss': 0.644, 'learning_rate': 1.840510242759086e-07, 'epoch': 1.88} {'loss': 0.3901, 'learning_rate': 1.8398851357089965e-07, 'epoch': 1.88} {'loss': 0.5016, 'learning_rate': 1.8392601338463324e-07, 'epoch': 1.88} {'loss': 0.4472, 'learning_rate': 1.8386352371717486e-07, 'epoch': 1.88} {'loss': 0.4671, 'learning_rate': 1.8380104456859227e-07, 'epoch': 1.88} {'loss': 0.3927, 'learning_rate': 1.8373857593895428e-07, 'epoch': 1.88} {'loss': 0.4505, 'learning_rate': 1.836761178283264e-07, 'epoch': 1.88} {'loss': 0.5189, 'learning_rate': 1.83613670236773e-07, 'epoch': 1.88} {'loss': 0.4492, 'learning_rate': 1.835512331643663e-07, 'epoch': 1.88} {'loss': 0.6028, 'learning_rate': 1.8348880661116952e-07, 'epoch': 1.88} {'loss': 0.4715, 'learning_rate': 1.8342639057725042e-07, 'epoch': 1.88} {'loss': 0.5722, 'learning_rate': 1.8336398506267562e-07, 'epoch': 1.88} {'loss': 0.6135, 'learning_rate': 1.833015900675128e-07, 'epoch': 1.88} {'loss': 0.5797, 'learning_rate': 1.832392055918286e-07, 'epoch': 1.88} {'loss': 0.5467, 'learning_rate': 1.8317683163568856e-07, 'epoch': 1.88} {'loss': 0.522, 'learning_rate': 1.8311446819916258e-07, 'epoch': 1.88} {'loss': 0.4804, 'learning_rate': 1.8305211528231392e-07, 'epoch': 1.88} {'loss': 0.6604, 'learning_rate': 1.8298977288521036e-07, 'epoch': 1.88} {'loss': 0.4343, 'learning_rate': 1.8292744100792182e-07, 'epoch': 1.88} {'loss': 0.4871, 'learning_rate': 1.8286511965050934e-07, 'epoch': 1.88} {'loss': 0.4941, 'learning_rate': 1.8280280881304513e-07, 'epoch': 1.88} {'loss': 0.4236, 'learning_rate': 1.8274050849559244e-07, 'epoch': 1.88} {'loss': 0.4197, 'learning_rate': 1.8267821869822012e-07, 'epoch': 1.88} {'loss': 0.4936, 'learning_rate': 1.8261593942099477e-07, 'epoch': 1.88} {'loss': 0.4358, 'learning_rate': 1.8255367066398076e-07, 'epoch': 1.88} {'loss': 0.5619, 'learning_rate': 1.8249141242724922e-07, 'epoch': 1.88} {'loss': 0.3695, 'learning_rate': 1.8242916471086114e-07, 'epoch': 1.88} {'loss': 0.5814, 'learning_rate': 1.823669275148887e-07, 'epoch': 1.88} {'loss': 0.4371, 'learning_rate': 1.823047008393941e-07, 'epoch': 1.88} {'loss': 0.5316, 'learning_rate': 1.822424846844484e-07, 'epoch': 1.88} {'loss': 0.4765, 'learning_rate': 1.8218027905011482e-07, 'epoch': 1.88} {'loss': 0.5371, 'learning_rate': 1.8211808393646112e-07, 'epoch': 1.88} {'loss': 0.4306, 'learning_rate': 1.8205589934355506e-07, 'epoch': 1.88} {'loss': 0.377, 'learning_rate': 1.8199372527145986e-07, 'epoch': 1.88} {'loss': 0.4621, 'learning_rate': 1.819315617202466e-07, 'epoch': 1.88} {'loss': 0.4949, 'learning_rate': 1.818694086899786e-07, 'epoch': 1.88} {'loss': 0.4217, 'learning_rate': 1.8180726618072464e-07, 'epoch': 1.88} {'loss': 0.4555, 'learning_rate': 1.8174513419255026e-07, 'epoch': 1.88} {'loss': 0.5413, 'learning_rate': 1.8168301272552093e-07, 'epoch': 1.88} {'loss': 0.463, 'learning_rate': 1.8162090177970658e-07, 'epoch': 1.88} {'loss': 0.3799, 'learning_rate': 1.8155880135516945e-07, 'epoch': 1.88} {'loss': 0.6291, 'learning_rate': 1.8149671145197944e-07, 'epoch': 1.88} {'loss': 0.5416, 'learning_rate': 1.8143463207020095e-07, 'epoch': 1.88} {'loss': 0.3815, 'learning_rate': 1.8137256320990172e-07, 'epoch': 1.88} {'loss': 0.5043, 'learning_rate': 1.8131050487114832e-07, 'epoch': 1.88} {'loss': 0.4051, 'learning_rate': 1.812484570540074e-07, 'epoch': 1.88} {'loss': 0.421, 'learning_rate': 1.8118641975854445e-07, 'epoch': 1.88} {'loss': 0.5437, 'learning_rate': 1.811243929848261e-07, 'epoch': 1.88} {'loss': 0.4794, 'learning_rate': 1.8106237673292003e-07, 'epoch': 1.88} {'loss': 0.4857, 'learning_rate': 1.810003710028907e-07, 'epoch': 1.88} {'loss': 0.4376, 'learning_rate': 1.8093837579480578e-07, 'epoch': 1.88} {'loss': 0.5826, 'learning_rate': 1.80876391108733e-07, 'epoch': 1.88} {'loss': 0.5386, 'learning_rate': 1.8081441694473568e-07, 'epoch': 1.88} {'loss': 0.5983, 'learning_rate': 1.8075245330288371e-07, 'epoch': 1.88} {'loss': 0.537, 'learning_rate': 1.806905001832393e-07, 'epoch': 1.88} {'loss': 0.4747, 'learning_rate': 1.806285575858735e-07, 'epoch': 1.88} {'loss': 0.5531, 'learning_rate': 1.805666255108496e-07, 'epoch': 1.88} {'loss': 0.3473, 'learning_rate': 1.8050470395823527e-07, 'epoch': 1.88} {'loss': 0.454, 'learning_rate': 1.8044279292809607e-07, 'epoch': 1.88} {'loss': 0.5118, 'learning_rate': 1.803808924204986e-07, 'epoch': 1.88} {'loss': 0.4845, 'learning_rate': 1.8031900243550948e-07, 'epoch': 1.88} {'loss': 0.5358, 'learning_rate': 1.802571229731942e-07, 'epoch': 1.88} {'loss': 0.3753, 'learning_rate': 1.8019525403362049e-07, 'epoch': 1.88} {'loss': 0.592, 'learning_rate': 1.8013339561685383e-07, 'epoch': 1.88} {'loss': 0.4279, 'learning_rate': 1.8007154772295977e-07, 'epoch': 1.88} {'loss': 0.5479, 'learning_rate': 1.80009710352006e-07, 'epoch': 1.88} {'loss': 0.4751, 'learning_rate': 1.79947883504058e-07, 'epoch': 1.88} {'loss': 0.4712, 'learning_rate': 1.7988606717918244e-07, 'epoch': 1.88} {'loss': 0.7048, 'learning_rate': 1.798242613774459e-07, 'epoch': 1.88} {'loss': 0.4724, 'learning_rate': 1.797624660989128e-07, 'epoch': 1.88} {'loss': 0.5084, 'learning_rate': 1.797006813436508e-07, 'epoch': 1.88} {'loss': 0.4888, 'learning_rate': 1.796389071117255e-07, 'epoch': 1.88} {'loss': 0.4465, 'learning_rate': 1.7957714340320342e-07, 'epoch': 1.88} {'loss': 0.4781, 'learning_rate': 1.7951539021815123e-07, 'epoch': 1.88} {'loss': 0.4437, 'learning_rate': 1.794536475566355e-07, 'epoch': 1.88} {'loss': 0.5142, 'learning_rate': 1.7939191541872068e-07, 'epoch': 1.88} {'loss': 0.5615, 'learning_rate': 1.7933019380447337e-07, 'epoch': 1.88} {'loss': 0.5122, 'learning_rate': 1.7926848271396014e-07, 'epoch': 1.88} {'loss': 0.5342, 'learning_rate': 1.7920678214724763e-07, 'epoch': 1.88} {'loss': 0.3961, 'learning_rate': 1.7914509210440133e-07, 'epoch': 1.88} {'loss': 0.3706, 'learning_rate': 1.7908341258548678e-07, 'epoch': 1.88} {'loss': 0.5833, 'learning_rate': 1.7902174359057278e-07, 'epoch': 1.88} {'loss': 0.5681, 'learning_rate': 1.7896008511972152e-07, 'epoch': 1.88} {'loss': 0.5767, 'learning_rate': 1.788984371730018e-07, 'epoch': 1.88} {'loss': 0.5444, 'learning_rate': 1.7883679975047806e-07, 'epoch': 1.88} {'loss': 0.5715, 'learning_rate': 1.787751728522169e-07, 'epoch': 1.88} {'loss': 0.395, 'learning_rate': 1.7871355647828602e-07, 'epoch': 1.88} {'loss': 0.4546, 'learning_rate': 1.7865195062874873e-07, 'epoch': 1.88} {'loss': 0.4835, 'learning_rate': 1.7859035530367275e-07, 'epoch': 1.88} {'loss': 0.3072, 'learning_rate': 1.7852877050312355e-07, 'epoch': 1.88} {'loss': 0.5888, 'learning_rate': 1.784671962271667e-07, 'epoch': 1.88} {'loss': 0.4624, 'learning_rate': 1.7840563247586984e-07, 'epoch': 1.88} {'loss': 0.4301, 'learning_rate': 1.783440792492974e-07, 'epoch': 1.88} {'loss': 0.5651, 'learning_rate': 1.7828253654751603e-07, 'epoch': 1.88} {'loss': 0.4308, 'learning_rate': 1.782210043705901e-07, 'epoch': 1.88} {'loss': 0.4548, 'learning_rate': 1.781594827185884e-07, 'epoch': 1.88} {'loss': 0.5424, 'learning_rate': 1.7809797159157428e-07, 'epoch': 1.88} {'loss': 0.4505, 'learning_rate': 1.780364709896143e-07, 'epoch': 1.88} {'loss': 0.3622, 'learning_rate': 1.779749809127751e-07, 'epoch': 1.88} {'loss': 0.4815, 'learning_rate': 1.779135013611233e-07, 'epoch': 1.88} {'loss': 0.4899, 'learning_rate': 1.7785203233472215e-07, 'epoch': 1.88} {'loss': 0.6948, 'learning_rate': 1.777905738336405e-07, 'epoch': 1.88} {'loss': 0.3295, 'learning_rate': 1.7772912585794167e-07, 'epoch': 1.88} {'loss': 0.4494, 'learning_rate': 1.776676884076922e-07, 'epoch': 1.88} {'loss': 0.3599, 'learning_rate': 1.776062614829588e-07, 'epoch': 1.88} {'loss': 0.4305, 'learning_rate': 1.7754484508380688e-07, 'epoch': 1.88} {'loss': 0.4929, 'learning_rate': 1.774834392103031e-07, 'epoch': 1.88} {'loss': 0.5464, 'learning_rate': 1.7742204386251182e-07, 'epoch': 1.88} {'loss': 0.6141, 'learning_rate': 1.773606590404997e-07, 'epoch': 1.88} {'loss': 0.5601, 'learning_rate': 1.772992847443311e-07, 'epoch': 1.88} {'loss': 0.387, 'learning_rate': 1.7723792097407266e-07, 'epoch': 1.88} {'loss': 0.5582, 'learning_rate': 1.7717656772979098e-07, 'epoch': 1.88} {'loss': 0.5258, 'learning_rate': 1.7711522501155155e-07, 'epoch': 1.88} {'loss': 0.4128, 'learning_rate': 1.7705389281941988e-07, 'epoch': 1.88} {'loss': 0.4959, 'learning_rate': 1.7699257115346147e-07, 'epoch': 1.88} {'loss': 0.4223, 'learning_rate': 1.7693126001374184e-07, 'epoch': 1.88} {'loss': 0.4562, 'learning_rate': 1.7686995940032646e-07, 'epoch': 1.88} {'loss': 0.3568, 'learning_rate': 1.76808669313282e-07, 'epoch': 1.88} {'loss': 0.517, 'learning_rate': 1.7674738975267392e-07, 'epoch': 1.88} {'loss': 0.521, 'learning_rate': 1.7668612071856662e-07, 'epoch': 1.88} {'loss': 0.2442, 'learning_rate': 1.7662486221102781e-07, 'epoch': 1.88} {'loss': 0.5434, 'learning_rate': 1.765636142301219e-07, 'epoch': 1.88} {'loss': 0.4735, 'learning_rate': 1.765023767759144e-07, 'epoch': 1.88} {'loss': 0.3712, 'learning_rate': 1.7644114984847083e-07, 'epoch': 1.88} {'loss': 0.6948, 'learning_rate': 1.7637993344785776e-07, 'epoch': 1.88} {'loss': 0.6503, 'learning_rate': 1.763187275741407e-07, 'epoch': 1.88} {'loss': 0.4738, 'learning_rate': 1.7625753222738296e-07, 'epoch': 1.88} {'loss': 0.6336, 'learning_rate': 1.7619634740765333e-07, 'epoch': 1.88} {'loss': 0.5218, 'learning_rate': 1.7613517311501628e-07, 'epoch': 1.88} {'loss': 0.4869, 'learning_rate': 1.760740093495361e-07, 'epoch': 1.88} {'loss': 0.3508, 'learning_rate': 1.760128561112795e-07, 'epoch': 1.88} {'loss': 0.4777, 'learning_rate': 1.7595171340031193e-07, 'epoch': 1.88} {'loss': 0.5011, 'learning_rate': 1.758905812167e-07, 'epoch': 1.88} {'loss': 0.4094, 'learning_rate': 1.758294595605059e-07, 'epoch': 1.88} {'loss': 0.5096, 'learning_rate': 1.7576834843179845e-07, 'epoch': 1.88} {'loss': 0.4602, 'learning_rate': 1.757072478306421e-07, 'epoch': 1.88} {'loss': 0.4329, 'learning_rate': 1.7564615775710115e-07, 'epoch': 1.88} {'loss': 0.464, 'learning_rate': 1.7558507821124339e-07, 'epoch': 1.88} {'loss': 0.6977, 'learning_rate': 1.7552400919313096e-07, 'epoch': 1.88} {'loss': 0.4694, 'learning_rate': 1.754629507028338e-07, 'epoch': 1.88} {'loss': 0.4891, 'learning_rate': 1.7540190274041192e-07, 'epoch': 1.88} {'loss': 0.4581, 'learning_rate': 1.753408653059363e-07, 'epoch': 1.88} {'loss': 0.5717, 'learning_rate': 1.7527983839946806e-07, 'epoch': 1.88} {'loss': 0.3724, 'learning_rate': 1.7521882202107489e-07, 'epoch': 1.88} {'loss': 0.5639, 'learning_rate': 1.7515781617082117e-07, 'epoch': 1.88} {'loss': 0.5561, 'learning_rate': 1.7509682084877244e-07, 'epoch': 1.88} {'loss': 0.4487, 'learning_rate': 1.750358360549953e-07, 'epoch': 1.88} {'loss': 0.6134, 'learning_rate': 1.7497486178955193e-07, 'epoch': 1.88} {'loss': 0.3634, 'learning_rate': 1.7491389805251112e-07, 'epoch': 1.88} {'loss': 0.5265, 'learning_rate': 1.7485294484393733e-07, 'epoch': 1.88} {'loss': 0.5011, 'learning_rate': 1.747920021638938e-07, 'epoch': 1.88} {'loss': 0.5266, 'learning_rate': 1.7473107001244937e-07, 'epoch': 1.88} {'loss': 0.4917, 'learning_rate': 1.7467014838966623e-07, 'epoch': 1.88} {'loss': 0.3457, 'learning_rate': 1.7460923729561096e-07, 'epoch': 1.88} {'loss': 0.6701, 'learning_rate': 1.7454833673034909e-07, 'epoch': 1.88} {'loss': 0.4929, 'learning_rate': 1.7448744669394503e-07, 'epoch': 1.88} {'loss': 0.3925, 'learning_rate': 1.7442656718646421e-07, 'epoch': 1.88} {'loss': 0.5247, 'learning_rate': 1.7436569820797222e-07, 'epoch': 1.88} {'loss': 0.2508, 'learning_rate': 1.7430483975853563e-07, 'epoch': 1.88} {'loss': 0.6255, 'learning_rate': 1.742439918382155e-07, 'epoch': 1.88} {'loss': 0.5333, 'learning_rate': 1.7418315444708288e-07, 'epoch': 1.88} {'loss': 0.4155, 'learning_rate': 1.7412232758519775e-07, 'epoch': 1.88} {'loss': 0.4771, 'learning_rate': 1.7406151125262783e-07, 'epoch': 1.88} {'loss': 0.5751, 'learning_rate': 1.7400070544943747e-07, 'epoch': 1.88} {'loss': 0.423, 'learning_rate': 1.7393991017569335e-07, 'epoch': 1.88} {'loss': 0.658, 'learning_rate': 1.7387912543145867e-07, 'epoch': 1.88} {'loss': 0.4339, 'learning_rate': 1.7381835121679901e-07, 'epoch': 1.88} {'loss': 0.527, 'learning_rate': 1.7375758753178097e-07, 'epoch': 1.88} {'loss': 0.5268, 'learning_rate': 1.736968343764678e-07, 'epoch': 1.88} {'loss': 0.4016, 'learning_rate': 1.7363609175092498e-07, 'epoch': 1.88} {'loss': 0.5462, 'learning_rate': 1.735753596552192e-07, 'epoch': 1.88} {'loss': 0.6114, 'learning_rate': 1.735146380894126e-07, 'epoch': 1.88} {'loss': 0.5197, 'learning_rate': 1.73453927053574e-07, 'epoch': 1.88} {'loss': 0.6144, 'learning_rate': 1.7339322654776448e-07, 'epoch': 1.88} {'loss': 0.5981, 'learning_rate': 1.7333253657205285e-07, 'epoch': 1.88} {'loss': 0.4349, 'learning_rate': 1.732718571265013e-07, 'epoch': 1.88} {'loss': 0.5047, 'learning_rate': 1.7321118821117534e-07, 'epoch': 1.88} {'loss': 0.3218, 'learning_rate': 1.7315052982614157e-07, 'epoch': 1.88} {'loss': 0.5024, 'learning_rate': 1.7308988197146327e-07, 'epoch': 1.88} {'loss': 0.654, 'learning_rate': 1.7302924464720704e-07, 'epoch': 1.88} {'loss': 0.5504, 'learning_rate': 1.729686178534351e-07, 'epoch': 1.88} {'loss': 0.5261, 'learning_rate': 1.7290800159021627e-07, 'epoch': 1.88} {'loss': 0.5279, 'learning_rate': 1.7284739585761156e-07, 'epoch': 1.88} {'loss': 0.5048, 'learning_rate': 1.7278680065568875e-07, 'epoch': 1.88} {'loss': 0.5182, 'learning_rate': 1.7272621598451332e-07, 'epoch': 1.88} {'loss': 0.429, 'learning_rate': 1.7266564184414635e-07, 'epoch': 1.88} {'loss': 0.4101, 'learning_rate': 1.7260507823465666e-07, 'epoch': 1.88} {'loss': 0.4358, 'learning_rate': 1.7254452515610644e-07, 'epoch': 1.88} {'loss': 0.5925, 'learning_rate': 1.7248398260856224e-07, 'epoch': 1.88} {'loss': 0.3524, 'learning_rate': 1.7242345059208855e-07, 'epoch': 1.88} {'loss': 0.3817, 'learning_rate': 1.7236292910674968e-07, 'epoch': 1.88} {'loss': 0.5847, 'learning_rate': 1.723024181526123e-07, 'epoch': 1.88} {'loss': 0.5992, 'learning_rate': 1.7224191772973742e-07, 'epoch': 1.88} {'loss': 0.408, 'learning_rate': 1.7218142783819502e-07, 'epoch': 1.88} {'loss': 0.7241, 'learning_rate': 1.7212094847804616e-07, 'epoch': 1.88} {'loss': 0.5106, 'learning_rate': 1.7206047964935635e-07, 'epoch': 1.88} {'loss': 0.6116, 'learning_rate': 1.7200002135219106e-07, 'epoch': 1.88} {'loss': 0.3073, 'learning_rate': 1.7193957358661362e-07, 'epoch': 1.88} {'loss': 0.6206, 'learning_rate': 1.718791363526928e-07, 'epoch': 1.88} {'loss': 0.4571, 'learning_rate': 1.7181870965048752e-07, 'epoch': 1.88} {'loss': 0.4025, 'learning_rate': 1.7175829348006767e-07, 'epoch': 1.88} {'loss': 0.322, 'learning_rate': 1.7169788784149432e-07, 'epoch': 1.88} {'loss': 0.2991, 'learning_rate': 1.716374927348341e-07, 'epoch': 1.88} {'loss': 0.4983, 'learning_rate': 1.7157710816015249e-07, 'epoch': 1.88} {'loss': 0.5244, 'learning_rate': 1.715167341175117e-07, 'epoch': 1.88} {'loss': 0.4683, 'learning_rate': 1.714563706069794e-07, 'epoch': 1.88} {'loss': 0.5444, 'learning_rate': 1.713960176286178e-07, 'epoch': 1.88} {'loss': 0.4566, 'learning_rate': 1.7133567518249127e-07, 'epoch': 1.88} {'loss': 0.5029, 'learning_rate': 1.7127534326866758e-07, 'epoch': 1.88} {'loss': 0.4113, 'learning_rate': 1.7121502188720773e-07, 'epoch': 1.88} {'loss': 0.4392, 'learning_rate': 1.711547110381795e-07, 'epoch': 1.88} {'loss': 0.4239, 'learning_rate': 1.71094410721645e-07, 'epoch': 1.88} {'loss': 0.4995, 'learning_rate': 1.710341209376709e-07, 'epoch': 1.88} {'loss': 0.5098, 'learning_rate': 1.7097384168632047e-07, 'epoch': 1.88} {'loss': 0.6552, 'learning_rate': 1.709135729676592e-07, 'epoch': 1.88} {'loss': 0.5991, 'learning_rate': 1.7085331478175037e-07, 'epoch': 1.88} {'loss': 0.5123, 'learning_rate': 1.707930671286595e-07, 'epoch': 1.88} {'loss': 0.4888, 'learning_rate': 1.7073283000845097e-07, 'epoch': 1.88} {'loss': 0.4917, 'learning_rate': 1.706726034211892e-07, 'epoch': 1.88} {'loss': 0.5047, 'learning_rate': 1.7061238736693964e-07, 'epoch': 1.88} {'loss': 0.4782, 'learning_rate': 1.705521818457656e-07, 'epoch': 1.88} {'loss': 0.5117, 'learning_rate': 1.704919868577326e-07, 'epoch': 1.88} {'loss': 0.5126, 'learning_rate': 1.7043180240290392e-07, 'epoch': 1.88} {'loss': 0.4174, 'learning_rate': 1.7037162848134504e-07, 'epoch': 1.88} {'loss': 0.4393, 'learning_rate': 1.7031146509311924e-07, 'epoch': 1.88} {'loss': 0.4931, 'learning_rate': 1.7025131223829316e-07, 'epoch': 1.88} {'loss': 0.4668, 'learning_rate': 1.7019116991693008e-07, 'epoch': 1.88} {'loss': 0.4882, 'learning_rate': 1.7013103812909326e-07, 'epoch': 1.88} {'loss': 0.5084, 'learning_rate': 1.7007091687484821e-07, 'epoch': 1.88} {'loss': 0.4037, 'learning_rate': 1.7001080615426046e-07, 'epoch': 1.88} {'loss': 0.627, 'learning_rate': 1.6995070596739217e-07, 'epoch': 1.88} {'loss': 0.4877, 'learning_rate': 1.6989061631430992e-07, 'epoch': 1.88} {'loss': 0.4604, 'learning_rate': 1.6983053719507703e-07, 'epoch': 1.88} {'loss': 0.4735, 'learning_rate': 1.6977046860975786e-07, 'epoch': 1.88} {'loss': 0.7045, 'learning_rate': 1.6971041055841685e-07, 'epoch': 1.88} {'loss': 0.354, 'learning_rate': 1.6965036304111726e-07, 'epoch': 1.88} {'loss': 0.5904, 'learning_rate': 1.695903260579257e-07, 'epoch': 1.88} {'loss': 0.4474, 'learning_rate': 1.6953029960890545e-07, 'epoch': 1.88} {'loss': 0.5229, 'learning_rate': 1.6947028369412088e-07, 'epoch': 1.88} {'loss': 0.3215, 'learning_rate': 1.6941027831363532e-07, 'epoch': 1.88} {'loss': 0.4254, 'learning_rate': 1.6935028346751426e-07, 'epoch': 1.88} {'loss': 0.5201, 'learning_rate': 1.6929029915582095e-07, 'epoch': 1.88} {'loss': 0.4597, 'learning_rate': 1.6923032537862095e-07, 'epoch': 1.88} {'loss': 0.3381, 'learning_rate': 1.6917036213597858e-07, 'epoch': 1.88} {'loss': 0.5778, 'learning_rate': 1.691104094279572e-07, 'epoch': 1.88} {'loss': 0.4294, 'learning_rate': 1.6905046725462114e-07, 'epoch': 1.88} {'loss': 0.61, 'learning_rate': 1.6899053561603485e-07, 'epoch': 1.88} {'loss': 0.5938, 'learning_rate': 1.6893061451226157e-07, 'epoch': 1.88} {'loss': 0.3934, 'learning_rate': 1.688707039433679e-07, 'epoch': 1.88} {'loss': 0.6226, 'learning_rate': 1.6881080390941607e-07, 'epoch': 1.88} {'loss': 0.4119, 'learning_rate': 1.6875091441047043e-07, 'epoch': 1.88} {'loss': 0.4433, 'learning_rate': 1.6869103544659649e-07, 'epoch': 1.88} {'loss': 0.6509, 'learning_rate': 1.6863116701785643e-07, 'epoch': 1.88} {'loss': 0.3292, 'learning_rate': 1.6857130912431462e-07, 'epoch': 1.88} {'loss': 0.5658, 'learning_rate': 1.6851146176603772e-07, 'epoch': 1.88} {'loss': 0.5805, 'learning_rate': 1.6845162494308677e-07, 'epoch': 1.88} {'loss': 0.4262, 'learning_rate': 1.6839179865552835e-07, 'epoch': 1.88} {'loss': 0.4961, 'learning_rate': 1.6833198290342468e-07, 'epoch': 1.88} {'loss': 0.4521, 'learning_rate': 1.6827217768684122e-07, 'epoch': 1.88} {'loss': 0.4885, 'learning_rate': 1.682123830058413e-07, 'epoch': 1.88} {'loss': 0.442, 'learning_rate': 1.681525988604893e-07, 'epoch': 1.88} {'loss': 0.4612, 'learning_rate': 1.6809282525084846e-07, 'epoch': 1.88} {'loss': 0.46, 'learning_rate': 1.6803306217698435e-07, 'epoch': 1.88} {'loss': 0.6716, 'learning_rate': 1.679733096389613e-07, 'epoch': 1.88} {'loss': 0.5855, 'learning_rate': 1.679135676368393e-07, 'epoch': 1.88} {'loss': 0.3682, 'learning_rate': 1.6785383617068829e-07, 'epoch': 1.88} {'loss': 0.461, 'learning_rate': 1.677941152405671e-07, 'epoch': 1.88} {'loss': 0.4504, 'learning_rate': 1.6773440484654346e-07, 'epoch': 1.88} {'loss': 0.4559, 'learning_rate': 1.6767470498867844e-07, 'epoch': 1.88} {'loss': 0.4441, 'learning_rate': 1.6761501566703753e-07, 'epoch': 1.88} {'loss': 0.5243, 'learning_rate': 1.6755533688168622e-07, 'epoch': 1.88} {'loss': 0.4167, 'learning_rate': 1.674956686326845e-07, 'epoch': 1.88} {'loss': 0.589, 'learning_rate': 1.674360109201012e-07, 'epoch': 1.88} {'loss': 0.5427, 'learning_rate': 1.6737636374399623e-07, 'epoch': 1.88} {'loss': 0.3657, 'learning_rate': 1.6731672710443403e-07, 'epoch': 1.88} {'loss': 0.4534, 'learning_rate': 1.672571010014812e-07, 'epoch': 1.88} {'loss': 0.4601, 'learning_rate': 1.6719748543519875e-07, 'epoch': 1.88} {'loss': 0.6909, 'learning_rate': 1.6713788040565227e-07, 'epoch': 1.88} {'loss': 0.4922, 'learning_rate': 1.6707828591290388e-07, 'epoch': 1.88} {'loss': 0.4966, 'learning_rate': 1.670187019570202e-07, 'epoch': 1.88} {'loss': 0.5689, 'learning_rate': 1.669591285380623e-07, 'epoch': 1.88} {'loss': 0.4016, 'learning_rate': 1.6689956565609566e-07, 'epoch': 1.88} {'loss': 0.4973, 'learning_rate': 1.668400133111836e-07, 'epoch': 1.88} {'loss': 0.5712, 'learning_rate': 1.6678047150338938e-07, 'epoch': 1.88} {'loss': 0.3626, 'learning_rate': 1.6672094023277852e-07, 'epoch': 1.88} {'loss': 0.5721, 'learning_rate': 1.6666141949941205e-07, 'epoch': 1.88} {'loss': 0.6996, 'learning_rate': 1.6660190930335663e-07, 'epoch': 1.88} {'loss': 0.2389, 'learning_rate': 1.6654240964467438e-07, 'epoch': 1.88} {'loss': 0.3673, 'learning_rate': 1.6648292052342972e-07, 'epoch': 1.88} {'loss': 0.4221, 'learning_rate': 1.6642344193968707e-07, 'epoch': 1.88} {'loss': 0.6301, 'learning_rate': 1.6636397389350634e-07, 'epoch': 1.88} {'loss': 0.4279, 'learning_rate': 1.663045163849575e-07, 'epoch': 1.88} {'loss': 0.5577, 'learning_rate': 1.6624506941409824e-07, 'epoch': 1.88} {'loss': 0.5952, 'learning_rate': 1.6618563298099633e-07, 'epoch': 1.88} {'loss': 0.4687, 'learning_rate': 1.661262070857139e-07, 'epoch': 1.88} {'loss': 0.483, 'learning_rate': 1.660667917283143e-07, 'epoch': 1.88} {'loss': 0.369, 'learning_rate': 1.6600738690886297e-07, 'epoch': 1.88} {'loss': 0.5938, 'learning_rate': 1.6594799262742102e-07, 'epoch': 1.88} {'loss': 0.474, 'learning_rate': 1.65888608884055e-07, 'epoch': 1.88} {'loss': 0.6141, 'learning_rate': 1.658292356788238e-07, 'epoch': 1.88} {'loss': 0.5044, 'learning_rate': 1.6576987301179737e-07, 'epoch': 1.88} {'loss': 0.5661, 'learning_rate': 1.6571052088303452e-07, 'epoch': 1.88} {'loss': 0.5117, 'learning_rate': 1.6565117929260077e-07, 'epoch': 1.88} {'loss': 0.5988, 'learning_rate': 1.655918482405605e-07, 'epoch': 1.88} {'loss': 0.568, 'learning_rate': 1.655325277269737e-07, 'epoch': 1.88} {'loss': 0.5184, 'learning_rate': 1.6547321775190806e-07, 'epoch': 1.88} {'loss': 0.51, 'learning_rate': 1.6541391831542464e-07, 'epoch': 1.88} {'loss': 0.5983, 'learning_rate': 1.6535462941758896e-07, 'epoch': 1.88} {'loss': 0.4493, 'learning_rate': 1.6529535105846317e-07, 'epoch': 1.88} {'loss': 0.5111, 'learning_rate': 1.652360832381106e-07, 'epoch': 1.88} {'loss': 0.3172, 'learning_rate': 1.6517682595659557e-07, 'epoch': 1.88} {'loss': 0.5001, 'learning_rate': 1.6511757921398031e-07, 'epoch': 1.88} {'loss': 0.3098, 'learning_rate': 1.650583430103303e-07, 'epoch': 1.88} {'loss': 0.5041, 'learning_rate': 1.6499911734570772e-07, 'epoch': 1.88} {'loss': 0.589, 'learning_rate': 1.6493990222017587e-07, 'epoch': 1.88} {'loss': 0.6827, 'learning_rate': 1.648806976337991e-07, 'epoch': 1.88} {'loss': 0.5595, 'learning_rate': 1.6482150358663963e-07, 'epoch': 1.88} {'loss': 0.4763, 'learning_rate': 1.6476232007876292e-07, 'epoch': 1.88} {'loss': 0.5082, 'learning_rate': 1.6470314711022894e-07, 'epoch': 1.88} {'loss': 0.5334, 'learning_rate': 1.6464398468110544e-07, 'epoch': 1.88} {'loss': 0.556, 'learning_rate': 1.6458483279145233e-07, 'epoch': 1.88} {'loss': 0.6201, 'learning_rate': 1.6452569144133401e-07, 'epoch': 1.88} {'loss': 0.3424, 'learning_rate': 1.644665606308149e-07, 'epoch': 1.88} {'loss': 0.4994, 'learning_rate': 1.6440744035995714e-07, 'epoch': 1.88} {'loss': 0.4772, 'learning_rate': 1.6434833062882515e-07, 'epoch': 1.88} {'loss': 0.5862, 'learning_rate': 1.642892314374811e-07, 'epoch': 1.88} {'loss': 0.6309, 'learning_rate': 1.6423014278598937e-07, 'epoch': 1.88} {'loss': 0.472, 'learning_rate': 1.6417106467441212e-07, 'epoch': 1.88} {'loss': 0.4302, 'learning_rate': 1.6411199710281378e-07, 'epoch': 1.88} {'loss': 0.6177, 'learning_rate': 1.6405294007125761e-07, 'epoch': 1.88} {'loss': 0.5324, 'learning_rate': 1.6399389357980466e-07, 'epoch': 1.88} {'loss': 0.5181, 'learning_rate': 1.6393485762852158e-07, 'epoch': 1.88} {'loss': 0.5363, 'learning_rate': 1.6387583221746939e-07, 'epoch': 1.88} {'loss': 0.4766, 'learning_rate': 1.6381681734671252e-07, 'epoch': 1.88} {'loss': 0.6399, 'learning_rate': 1.637578130163131e-07, 'epoch': 1.88} {'loss': 0.5197, 'learning_rate': 1.6369881922633556e-07, 'epoch': 1.89} {'loss': 0.5598, 'learning_rate': 1.636398359768432e-07, 'epoch': 1.89} {'loss': 0.6529, 'learning_rate': 1.63580863267897e-07, 'epoch': 1.89} {'loss': 0.4578, 'learning_rate': 1.6352190109956257e-07, 'epoch': 1.89} {'loss': 0.5029, 'learning_rate': 1.63462949471902e-07, 'epoch': 1.89} {'loss': 0.5662, 'learning_rate': 1.6340400838497862e-07, 'epoch': 1.89} {'loss': 0.3212, 'learning_rate': 1.6334507783885566e-07, 'epoch': 1.89} {'loss': 0.5199, 'learning_rate': 1.6328615783359536e-07, 'epoch': 1.89} {'loss': 0.6904, 'learning_rate': 1.632272483692643e-07, 'epoch': 1.89} {'loss': 0.4144, 'learning_rate': 1.631683494459202e-07, 'epoch': 1.89} {'loss': 0.4634, 'learning_rate': 1.631094610636308e-07, 'epoch': 1.89} {'loss': 0.5531, 'learning_rate': 1.6305058322245715e-07, 'epoch': 1.89} {'loss': 0.5294, 'learning_rate': 1.6299171592246253e-07, 'epoch': 1.89} {'loss': 0.4426, 'learning_rate': 1.6293285916370917e-07, 'epoch': 1.89} {'loss': 0.5086, 'learning_rate': 1.6287401294626248e-07, 'epoch': 1.89} {'loss': 0.4078, 'learning_rate': 1.6281517727018358e-07, 'epoch': 1.89} {'loss': 0.4529, 'learning_rate': 1.6275635213553688e-07, 'epoch': 1.89} {'loss': 0.5409, 'learning_rate': 1.6269753754238337e-07, 'epoch': 1.89} {'loss': 0.6011, 'learning_rate': 1.626387334907875e-07, 'epoch': 1.89} {'loss': 0.4353, 'learning_rate': 1.6257993998081257e-07, 'epoch': 1.89} {'loss': 0.5111, 'learning_rate': 1.625211570125207e-07, 'epoch': 1.89} {'loss': 0.5443, 'learning_rate': 1.6246238458597518e-07, 'epoch': 1.89} {'loss': 0.3555, 'learning_rate': 1.6240362270124043e-07, 'epoch': 1.89} {'loss': 0.4605, 'learning_rate': 1.6234487135837752e-07, 'epoch': 1.89} {'loss': 0.5572, 'learning_rate': 1.6228613055744858e-07, 'epoch': 1.89} {'loss': 0.4042, 'learning_rate': 1.6222740029851914e-07, 'epoch': 1.89} {'loss': 0.4816, 'learning_rate': 1.6216868058165136e-07, 'epoch': 1.89} {'loss': 0.4898, 'learning_rate': 1.6210997140690633e-07, 'epoch': 1.89} {'loss': 0.5116, 'learning_rate': 1.620512727743495e-07, 'epoch': 1.89} {'loss': 0.575, 'learning_rate': 1.619925846840431e-07, 'epoch': 1.89} {'loss': 0.4914, 'learning_rate': 1.6193390713604816e-07, 'epoch': 1.89} {'loss': 0.462, 'learning_rate': 1.6187524013043022e-07, 'epoch': 1.89} {'loss': 0.4762, 'learning_rate': 1.6181658366725028e-07, 'epoch': 1.89} {'loss': 0.5875, 'learning_rate': 1.6175793774657166e-07, 'epoch': 1.89} {'loss': 0.3776, 'learning_rate': 1.6169930236845765e-07, 'epoch': 1.89} {'loss': 0.4192, 'learning_rate': 1.6164067753297153e-07, 'epoch': 1.89} {'loss': 0.4144, 'learning_rate': 1.6158206324017433e-07, 'epoch': 1.89} {'loss': 0.3247, 'learning_rate': 1.615234594901305e-07, 'epoch': 1.89} {'loss': 0.6501, 'learning_rate': 1.6146486628290214e-07, 'epoch': 1.89} {'loss': 0.5983, 'learning_rate': 1.6140628361855148e-07, 'epoch': 1.89} {'loss': 0.474, 'learning_rate': 1.613477114971429e-07, 'epoch': 1.89} {'loss': 0.5828, 'learning_rate': 1.6128914991873746e-07, 'epoch': 1.89} {'loss': 0.5663, 'learning_rate': 1.6123059888339953e-07, 'epoch': 1.89} {'loss': 0.4388, 'learning_rate': 1.611720583911902e-07, 'epoch': 1.89} {'loss': 0.4364, 'learning_rate': 1.6111352844217386e-07, 'epoch': 1.89} {'loss': 0.4757, 'learning_rate': 1.6105500903641158e-07, 'epoch': 1.89} {'loss': 0.5912, 'learning_rate': 1.6099650017396774e-07, 'epoch': 1.89} {'loss': 0.4406, 'learning_rate': 1.609380018549045e-07, 'epoch': 1.89} {'loss': 0.4304, 'learning_rate': 1.6087951407928181e-07, 'epoch': 1.89} {'loss': 0.7385, 'learning_rate': 1.6082103684716745e-07, 'epoch': 1.89} {'loss': 0.6475, 'learning_rate': 1.6076257015862018e-07, 'epoch': 1.89} {'loss': 0.5464, 'learning_rate': 1.6070411401370335e-07, 'epoch': 1.89} {'loss': 0.5647, 'learning_rate': 1.606456684124813e-07, 'epoch': 1.89} {'loss': 0.487, 'learning_rate': 1.6058723335501404e-07, 'epoch': 1.89} {'loss': 0.5782, 'learning_rate': 1.605288088413681e-07, 'epoch': 1.89} {'loss': 0.47, 'learning_rate': 1.6047039487160022e-07, 'epoch': 1.89} {'loss': 0.5931, 'learning_rate': 1.6041199144577913e-07, 'epoch': 1.89} {'loss': 0.3448, 'learning_rate': 1.603535985639637e-07, 'epoch': 1.89} {'loss': 0.5273, 'learning_rate': 1.6029521622621723e-07, 'epoch': 1.89} {'loss': 0.4663, 'learning_rate': 1.6023684443260302e-07, 'epoch': 1.89} {'loss': 0.454, 'learning_rate': 1.6017848318318207e-07, 'epoch': 1.89} {'loss': 0.6305, 'learning_rate': 1.6012013247801993e-07, 'epoch': 1.89} {'loss': 0.4122, 'learning_rate': 1.6006179231717544e-07, 'epoch': 1.89} {'loss': 0.5789, 'learning_rate': 1.600034627007141e-07, 'epoch': 1.89} {'loss': 0.5062, 'learning_rate': 1.5994514362869584e-07, 'epoch': 1.89} {'loss': 0.432, 'learning_rate': 1.598868351011851e-07, 'epoch': 1.89} {'loss': 0.4822, 'learning_rate': 1.598285371182451e-07, 'epoch': 1.89} {'loss': 0.5301, 'learning_rate': 1.5977024967993472e-07, 'epoch': 1.89} {'loss': 0.3604, 'learning_rate': 1.5971197278631945e-07, 'epoch': 1.89} {'loss': 0.4643, 'learning_rate': 1.5965370643746147e-07, 'epoch': 1.89} {'loss': 0.3854, 'learning_rate': 1.5959545063342186e-07, 'epoch': 1.89} {'loss': 0.5285, 'learning_rate': 1.5953720537426387e-07, 'epoch': 1.89} {'loss': 0.5749, 'learning_rate': 1.594789706600508e-07, 'epoch': 1.89} {'loss': 0.3705, 'learning_rate': 1.5942074649084372e-07, 'epoch': 1.89} {'loss': 0.5144, 'learning_rate': 1.5936253286670478e-07, 'epoch': 1.89} {'loss': 0.5422, 'learning_rate': 1.5930432978769838e-07, 'epoch': 1.89} {'loss': 0.4396, 'learning_rate': 1.592461372538856e-07, 'epoch': 1.89} {'loss': 0.6319, 'learning_rate': 1.591879552653275e-07, 'epoch': 1.89} {'loss': 0.4141, 'learning_rate': 1.5912978382208844e-07, 'epoch': 1.89} {'loss': 0.4965, 'learning_rate': 1.590716229242295e-07, 'epoch': 1.89} {'loss': 0.5788, 'learning_rate': 1.590134725718151e-07, 'epoch': 1.89} {'loss': 0.4818, 'learning_rate': 1.5895533276490293e-07, 'epoch': 1.89} {'loss': 0.5024, 'learning_rate': 1.5889720350356185e-07, 'epoch': 1.89} {'loss': 0.317, 'learning_rate': 1.5883908478784848e-07, 'epoch': 1.89} {'loss': 0.6069, 'learning_rate': 1.587809766178272e-07, 'epoch': 1.89} {'loss': 0.4528, 'learning_rate': 1.587228789935613e-07, 'epoch': 1.89} {'loss': 0.5069, 'learning_rate': 1.5866479191511074e-07, 'epoch': 1.89} {'loss': 0.586, 'learning_rate': 1.5860671538254103e-07, 'epoch': 1.89} {'loss': 0.5278, 'learning_rate': 1.5854864939591098e-07, 'epoch': 1.89} {'loss': 0.3344, 'learning_rate': 1.58490593955285e-07, 'epoch': 1.89} {'loss': 0.302, 'learning_rate': 1.5843254906072414e-07, 'epoch': 1.89} {'loss': 0.4792, 'learning_rate': 1.583745147122917e-07, 'epoch': 1.89} {'loss': 0.5333, 'learning_rate': 1.5831649091004876e-07, 'epoch': 1.89} {'loss': 0.6565, 'learning_rate': 1.5825847765405745e-07, 'epoch': 1.89} {'loss': 0.6056, 'learning_rate': 1.5820047494438107e-07, 'epoch': 1.89} {'loss': 0.431, 'learning_rate': 1.5814248278108067e-07, 'epoch': 1.89} {'loss': 0.5245, 'learning_rate': 1.580845011642196e-07, 'epoch': 1.89} {'loss': 0.5904, 'learning_rate': 1.5802653009385883e-07, 'epoch': 1.89} {'loss': 0.661, 'learning_rate': 1.5796856957006056e-07, 'epoch': 1.89} {'loss': 0.4869, 'learning_rate': 1.5791061959288922e-07, 'epoch': 1.89} {'loss': 0.4838, 'learning_rate': 1.578526801624025e-07, 'epoch': 1.89} {'loss': 0.5818, 'learning_rate': 1.5779475127866594e-07, 'epoch': 1.89} {'loss': 0.4856, 'learning_rate': 1.5773683294174058e-07, 'epoch': 1.89} {'loss': 0.3874, 'learning_rate': 1.5767892515168858e-07, 'epoch': 1.89} {'loss': 0.4353, 'learning_rate': 1.5762102790857214e-07, 'epoch': 1.89} {'loss': 0.5417, 'learning_rate': 1.575631412124523e-07, 'epoch': 1.89} {'loss': 0.49, 'learning_rate': 1.5750526506339347e-07, 'epoch': 1.89} {'loss': 0.579, 'learning_rate': 1.5744739946145448e-07, 'epoch': 1.89} {'loss': 0.6255, 'learning_rate': 1.5738954440669974e-07, 'epoch': 1.89} {'loss': 0.4863, 'learning_rate': 1.5733169989918918e-07, 'epoch': 1.89} {'loss': 0.5306, 'learning_rate': 1.572738659389883e-07, 'epoch': 1.89} {'loss': 0.5976, 'learning_rate': 1.5721604252615597e-07, 'epoch': 1.89} {'loss': 0.5598, 'learning_rate': 1.5715822966075433e-07, 'epoch': 1.89} {'loss': 0.6932, 'learning_rate': 1.571004273428467e-07, 'epoch': 1.89} {'loss': 0.4774, 'learning_rate': 1.5704263557249298e-07, 'epoch': 1.89} {'loss': 0.4832, 'learning_rate': 1.5698485434975875e-07, 'epoch': 1.89} {'loss': 0.4819, 'learning_rate': 1.5692708367470166e-07, 'epoch': 1.89} {'loss': 0.491, 'learning_rate': 1.5686932354738616e-07, 'epoch': 1.89} {'loss': 0.6145, 'learning_rate': 1.5681157396787437e-07, 'epoch': 1.89} {'loss': 0.5008, 'learning_rate': 1.5675383493622632e-07, 'epoch': 1.89} {'loss': 0.4061, 'learning_rate': 1.566961064525063e-07, 'epoch': 1.89} {'loss': 0.5232, 'learning_rate': 1.5663838851677327e-07, 'epoch': 1.89} {'loss': 0.4809, 'learning_rate': 1.5658068112909153e-07, 'epoch': 1.89} {'loss': 0.5744, 'learning_rate': 1.5652298428952108e-07, 'epoch': 1.89} {'loss': 0.5174, 'learning_rate': 1.5646529799812627e-07, 'epoch': 1.89} {'loss': 0.4792, 'learning_rate': 1.5640762225496598e-07, 'epoch': 1.89} {'loss': 0.6129, 'learning_rate': 1.5634995706010347e-07, 'epoch': 1.89} {'loss': 0.5229, 'learning_rate': 1.5629230241360094e-07, 'epoch': 1.89} {'loss': 0.5943, 'learning_rate': 1.5623465831551943e-07, 'epoch': 1.89} {'loss': 0.613, 'learning_rate': 1.5617702476592112e-07, 'epoch': 1.89} {'loss': 0.5232, 'learning_rate': 1.5611940176486707e-07, 'epoch': 1.89} {'loss': 0.4519, 'learning_rate': 1.5606178931242055e-07, 'epoch': 1.89} {'loss': 0.4772, 'learning_rate': 1.5600418740864153e-07, 'epoch': 1.89} {'loss': 0.5908, 'learning_rate': 1.559465960535922e-07, 'epoch': 1.89} {'loss': 0.3961, 'learning_rate': 1.558890152473358e-07, 'epoch': 1.89} {'loss': 0.6345, 'learning_rate': 1.558314449899312e-07, 'epoch': 1.89} {'loss': 0.3283, 'learning_rate': 1.5577388528144277e-07, 'epoch': 1.89} {'loss': 0.5127, 'learning_rate': 1.557163361219305e-07, 'epoch': 1.89} {'loss': 0.3415, 'learning_rate': 1.5565879751145761e-07, 'epoch': 1.89} {'loss': 0.5172, 'learning_rate': 1.5560126945008413e-07, 'epoch': 1.89} {'loss': 0.4648, 'learning_rate': 1.5554375193787218e-07, 'epoch': 1.89} {'loss': 0.4788, 'learning_rate': 1.5548624497488506e-07, 'epoch': 1.89} {'loss': 0.5728, 'learning_rate': 1.554287485611816e-07, 'epoch': 1.89} {'loss': 0.5548, 'learning_rate': 1.55371262696824e-07, 'epoch': 1.89} {'loss': 0.5125, 'learning_rate': 1.5531378738187552e-07, 'epoch': 1.89} {'loss': 0.7897, 'learning_rate': 1.5525632261639723e-07, 'epoch': 1.89} {'loss': 0.5058, 'learning_rate': 1.5519886840045127e-07, 'epoch': 1.89} {'loss': 0.5099, 'learning_rate': 1.5514142473409543e-07, 'epoch': 1.89} {'loss': 0.4914, 'learning_rate': 1.550839916173963e-07, 'epoch': 1.89} {'loss': 0.61, 'learning_rate': 1.550265690504127e-07, 'epoch': 1.89} {'loss': 0.5045, 'learning_rate': 1.5496915703320682e-07, 'epoch': 1.89} {'loss': 0.5302, 'learning_rate': 1.549117555658397e-07, 'epoch': 1.89} {'loss': 0.6896, 'learning_rate': 1.5485436464837356e-07, 'epoch': 1.89} {'loss': 0.3092, 'learning_rate': 1.5479698428087054e-07, 'epoch': 1.89} {'loss': 0.6989, 'learning_rate': 1.547396144633895e-07, 'epoch': 1.89} {'loss': 0.4488, 'learning_rate': 1.5468225519599366e-07, 'epoch': 1.89} {'loss': 0.6445, 'learning_rate': 1.546249064787453e-07, 'epoch': 1.89} {'loss': 0.5206, 'learning_rate': 1.5456756831170427e-07, 'epoch': 1.89} {'loss': 0.519, 'learning_rate': 1.5451024069493282e-07, 'epoch': 1.89} {'loss': 0.4953, 'learning_rate': 1.5445292362849196e-07, 'epoch': 1.89} {'loss': 0.415, 'learning_rate': 1.5439561711244388e-07, 'epoch': 1.89} {'loss': 0.6054, 'learning_rate': 1.5433832114684967e-07, 'epoch': 1.89} {'loss': 0.5058, 'learning_rate': 1.5428103573177034e-07, 'epoch': 1.89} {'loss': 0.3126, 'learning_rate': 1.5422376086726697e-07, 'epoch': 1.89} {'loss': 0.5771, 'learning_rate': 1.5416649655340175e-07, 'epoch': 1.89} {'loss': 0.5961, 'learning_rate': 1.5410924279023576e-07, 'epoch': 1.89} {'loss': 0.5894, 'learning_rate': 1.540519995778311e-07, 'epoch': 1.89} {'loss': 0.6268, 'learning_rate': 1.5399476691624782e-07, 'epoch': 1.89} {'loss': 0.4972, 'learning_rate': 1.53937544805548e-07, 'epoch': 1.89} {'loss': 0.3315, 'learning_rate': 1.5388033324579278e-07, 'epoch': 1.89} {'loss': 0.5175, 'learning_rate': 1.5382313223704314e-07, 'epoch': 1.89} {'loss': 0.4142, 'learning_rate': 1.5376594177936023e-07, 'epoch': 1.89} {'loss': 0.4106, 'learning_rate': 1.5370876187280614e-07, 'epoch': 1.89} {'loss': 0.5399, 'learning_rate': 1.5365159251744312e-07, 'epoch': 1.89} {'loss': 0.5915, 'learning_rate': 1.5359443371332994e-07, 'epoch': 1.89} {'loss': 0.2772, 'learning_rate': 1.5353728546052883e-07, 'epoch': 1.89} {'loss': 0.4064, 'learning_rate': 1.5348014775910193e-07, 'epoch': 1.89} {'loss': 0.5096, 'learning_rate': 1.5342302060910918e-07, 'epoch': 1.89} {'loss': 0.6612, 'learning_rate': 1.5336590401061168e-07, 'epoch': 1.89} {'loss': 0.5154, 'learning_rate': 1.533087979636727e-07, 'epoch': 1.89} {'loss': 0.3471, 'learning_rate': 1.5325170246835218e-07, 'epoch': 1.89} {'loss': 0.4851, 'learning_rate': 1.531946175247101e-07, 'epoch': 1.89} {'loss': 0.4282, 'learning_rate': 1.5313754313280859e-07, 'epoch': 1.89} {'loss': 0.617, 'learning_rate': 1.5308047929270987e-07, 'epoch': 1.89} {'loss': 0.3956, 'learning_rate': 1.5302342600447383e-07, 'epoch': 1.89} {'loss': 0.49, 'learning_rate': 1.529663832681616e-07, 'epoch': 1.89} {'loss': 0.5377, 'learning_rate': 1.529093510838353e-07, 'epoch': 1.89} {'loss': 0.3074, 'learning_rate': 1.5285232945155493e-07, 'epoch': 1.89} {'loss': 0.4904, 'learning_rate': 1.5279531837138263e-07, 'epoch': 1.89} {'loss': 0.5351, 'learning_rate': 1.5273831784337833e-07, 'epoch': 1.89} {'loss': 0.4498, 'learning_rate': 1.5268132786760315e-07, 'epoch': 1.89} {'loss': 0.5858, 'learning_rate': 1.5262434844411922e-07, 'epoch': 1.89} {'loss': 0.5194, 'learning_rate': 1.5256737957298763e-07, 'epoch': 1.89} {'loss': 0.4902, 'learning_rate': 1.525104212542683e-07, 'epoch': 1.89} {'loss': 0.4373, 'learning_rate': 1.5245347348802342e-07, 'epoch': 1.89} {'loss': 0.475, 'learning_rate': 1.5239653627431294e-07, 'epoch': 1.89} {'loss': 0.5302, 'learning_rate': 1.5233960961319795e-07, 'epoch': 1.89} {'loss': 0.6081, 'learning_rate': 1.5228269350474057e-07, 'epoch': 1.89} {'loss': 0.4085, 'learning_rate': 1.5222578794900078e-07, 'epoch': 1.89} {'loss': 0.5224, 'learning_rate': 1.5216889294604075e-07, 'epoch': 1.89} {'loss': 0.5028, 'learning_rate': 1.5211200849591824e-07, 'epoch': 1.89} {'loss': 0.3583, 'learning_rate': 1.520551345986987e-07, 'epoch': 1.89} {'loss': 0.396, 'learning_rate': 1.51998271254441e-07, 'epoch': 1.89} {'loss': 0.4739, 'learning_rate': 1.5194141846320508e-07, 'epoch': 1.89} {'loss': 0.5751, 'learning_rate': 1.5188457622505203e-07, 'epoch': 1.89} {'loss': 0.5892, 'learning_rate': 1.5182774454004512e-07, 'epoch': 1.89} {'loss': 0.5877, 'learning_rate': 1.5177092340824317e-07, 'epoch': 1.89} {'loss': 0.4359, 'learning_rate': 1.5171411282970727e-07, 'epoch': 1.89} {'loss': 0.3278, 'learning_rate': 1.5165731280449846e-07, 'epoch': 1.89} {'loss': 0.4958, 'learning_rate': 1.5160052333267783e-07, 'epoch': 1.89} {'loss': 0.4813, 'learning_rate': 1.5154374441430641e-07, 'epoch': 1.89} {'loss': 0.5418, 'learning_rate': 1.514869760494453e-07, 'epoch': 1.89} {'loss': 0.4771, 'learning_rate': 1.514302182381533e-07, 'epoch': 1.89} {'loss': 0.405, 'learning_rate': 1.513734709804937e-07, 'epoch': 1.89} {'loss': 0.6419, 'learning_rate': 1.5131673427652539e-07, 'epoch': 1.89} {'loss': 0.5902, 'learning_rate': 1.5126000812631159e-07, 'epoch': 1.89} {'loss': 0.5354, 'learning_rate': 1.5120329252991007e-07, 'epoch': 1.89} {'loss': 0.4792, 'learning_rate': 1.511465874873841e-07, 'epoch': 1.89} {'loss': 0.4682, 'learning_rate': 1.510898929987936e-07, 'epoch': 1.89} {'loss': 0.4495, 'learning_rate': 1.510332090641975e-07, 'epoch': 1.89} {'loss': 0.5641, 'learning_rate': 1.5097653568366011e-07, 'epoch': 1.89} {'loss': 0.523, 'learning_rate': 1.509198728572403e-07, 'epoch': 1.89} {'loss': 0.5745, 'learning_rate': 1.5086322058499803e-07, 'epoch': 1.89} {'loss': 0.6042, 'learning_rate': 1.5080657886699435e-07, 'epoch': 1.89} {'loss': 0.3468, 'learning_rate': 1.5074994770329033e-07, 'epoch': 1.89} {'loss': 0.499, 'learning_rate': 1.5069332709394814e-07, 'epoch': 1.89} {'loss': 0.3931, 'learning_rate': 1.506367170390255e-07, 'epoch': 1.89} {'loss': 0.5451, 'learning_rate': 1.505801175385857e-07, 'epoch': 1.89} {'loss': 0.5881, 'learning_rate': 1.505235285926876e-07, 'epoch': 1.89} {'loss': 0.4794, 'learning_rate': 1.5046695020139336e-07, 'epoch': 1.89} {'loss': 0.4154, 'learning_rate': 1.5041038236476179e-07, 'epoch': 1.89} {'loss': 0.5399, 'learning_rate': 1.50353825082854e-07, 'epoch': 1.89} {'loss': 0.5801, 'learning_rate': 1.5029727835573326e-07, 'epoch': 1.89} {'loss': 0.4192, 'learning_rate': 1.5024074218345507e-07, 'epoch': 1.89} {'loss': 0.4398, 'learning_rate': 1.5018421656608496e-07, 'epoch': 1.89} {'loss': 0.4934, 'learning_rate': 1.501277015036806e-07, 'epoch': 1.89} {'loss': 0.5044, 'learning_rate': 1.5007119699630423e-07, 'epoch': 1.89} {'loss': 0.4956, 'learning_rate': 1.5001470304401577e-07, 'epoch': 1.89} {'loss': 0.5513, 'learning_rate': 1.4995821964687406e-07, 'epoch': 1.89} {'loss': 0.6199, 'learning_rate': 1.4990174680494242e-07, 'epoch': 1.89} {'loss': 0.6053, 'learning_rate': 1.4984528451827852e-07, 'epoch': 1.89} {'loss': 0.4918, 'learning_rate': 1.4978883278694678e-07, 'epoch': 1.89} {'loss': 0.5243, 'learning_rate': 1.4973239161100382e-07, 'epoch': 1.89} {'loss': 0.6802, 'learning_rate': 1.4967596099051184e-07, 'epoch': 1.89} {'loss': 0.4531, 'learning_rate': 1.4961954092553187e-07, 'epoch': 1.89} {'loss': 0.6488, 'learning_rate': 1.4956313141612166e-07, 'epoch': 1.89} {'loss': 0.4386, 'learning_rate': 1.495067324623456e-07, 'epoch': 1.89} {'loss': 0.5394, 'learning_rate': 1.494503440642603e-07, 'epoch': 1.89} {'loss': 0.6498, 'learning_rate': 1.4939396622193015e-07, 'epoch': 1.89} {'loss': 0.3042, 'learning_rate': 1.4933759893541288e-07, 'epoch': 1.89} {'loss': 0.5842, 'learning_rate': 1.4928124220476847e-07, 'epoch': 1.89} {'loss': 0.5039, 'learning_rate': 1.4922489603005906e-07, 'epoch': 1.89} {'loss': 0.6068, 'learning_rate': 1.4916856041134352e-07, 'epoch': 1.89} {'loss': 0.5235, 'learning_rate': 1.4911223534868402e-07, 'epoch': 1.89} {'loss': 0.3905, 'learning_rate': 1.4905592084213827e-07, 'epoch': 1.89} {'loss': 0.5304, 'learning_rate': 1.4899961689177067e-07, 'epoch': 1.89} {'loss': 0.5782, 'learning_rate': 1.4894332349763675e-07, 'epoch': 1.89} {'loss': 0.5424, 'learning_rate': 1.4888704065980086e-07, 'epoch': 1.89} {'loss': 0.5979, 'learning_rate': 1.4883076837832078e-07, 'epoch': 1.89} {'loss': 0.5229, 'learning_rate': 1.4877450665325755e-07, 'epoch': 1.89} {'loss': 0.4003, 'learning_rate': 1.4871825548467222e-07, 'epoch': 1.89} {'loss': 0.5309, 'learning_rate': 1.4866201487262365e-07, 'epoch': 1.89} {'loss': 0.5501, 'learning_rate': 1.486057848171729e-07, 'epoch': 1.89} {'loss': 0.5516, 'learning_rate': 1.4854956531838105e-07, 'epoch': 1.89} {'loss': 0.5445, 'learning_rate': 1.484933563763058e-07, 'epoch': 1.89} {'loss': 0.4341, 'learning_rate': 1.4843715799101154e-07, 'epoch': 1.89} {'loss': 0.3976, 'learning_rate': 1.483809701625538e-07, 'epoch': 1.89} {'loss': 0.5502, 'learning_rate': 1.4832479289099588e-07, 'epoch': 1.89} {'loss': 0.4202, 'learning_rate': 1.482686261763977e-07, 'epoch': 1.89} {'loss': 0.3435, 'learning_rate': 1.4821247001881812e-07, 'epoch': 1.89} {'loss': 0.6115, 'learning_rate': 1.4815632441831818e-07, 'epoch': 1.89} {'loss': 0.4954, 'learning_rate': 1.4810018937495785e-07, 'epoch': 1.89} {'loss': 0.4043, 'learning_rate': 1.480440648887982e-07, 'epoch': 1.89} {'loss': 0.4087, 'learning_rate': 1.4798795095989693e-07, 'epoch': 1.89} {'loss': 0.488, 'learning_rate': 1.4793184758831624e-07, 'epoch': 1.89} {'loss': 0.5679, 'learning_rate': 1.478757547741161e-07, 'epoch': 1.89} {'loss': 0.5917, 'learning_rate': 1.478196725173564e-07, 'epoch': 1.89} {'loss': 0.569, 'learning_rate': 1.4776360081809714e-07, 'epoch': 1.89} {'loss': 0.4723, 'learning_rate': 1.4770753967639828e-07, 'epoch': 1.89} {'loss': 0.5077, 'learning_rate': 1.4765148909232085e-07, 'epoch': 1.89} {'loss': 0.4145, 'learning_rate': 1.475954490659237e-07, 'epoch': 1.89} {'loss': 0.5167, 'learning_rate': 1.475394195972668e-07, 'epoch': 1.89} {'loss': 0.612, 'learning_rate': 1.4748340068641008e-07, 'epoch': 1.89} {'loss': 0.3021, 'learning_rate': 1.4742739233341462e-07, 'epoch': 1.89} {'loss': 0.3738, 'learning_rate': 1.4737139453834037e-07, 'epoch': 1.89} {'loss': 0.4608, 'learning_rate': 1.4731540730124617e-07, 'epoch': 1.89} {'loss': 0.5033, 'learning_rate': 1.4725943062219417e-07, 'epoch': 1.89} {'loss': 0.3595, 'learning_rate': 1.472034645012421e-07, 'epoch': 1.89} {'loss': 0.3445, 'learning_rate': 1.4714750893845e-07, 'epoch': 1.89} {'loss': 0.3596, 'learning_rate': 1.470915639338799e-07, 'epoch': 1.89} {'loss': 0.4841, 'learning_rate': 1.4703562948758964e-07, 'epoch': 1.89} {'loss': 0.5902, 'learning_rate': 1.4697970559964024e-07, 'epoch': 1.89} {'loss': 0.5867, 'learning_rate': 1.469237922700917e-07, 'epoch': 1.89} {'loss': 0.5586, 'learning_rate': 1.4686788949900387e-07, 'epoch': 1.89} {'loss': 0.3794, 'learning_rate': 1.468119972864357e-07, 'epoch': 1.89} {'loss': 0.5841, 'learning_rate': 1.4675611563244706e-07, 'epoch': 1.89} {'loss': 0.4565, 'learning_rate': 1.467002445371002e-07, 'epoch': 1.89} {'loss': 0.4773, 'learning_rate': 1.4664438400045167e-07, 'epoch': 1.89} {'loss': 0.4274, 'learning_rate': 1.465885340225648e-07, 'epoch': 1.89} {'loss': 0.5845, 'learning_rate': 1.4653269460349727e-07, 'epoch': 1.89} {'loss': 0.5658, 'learning_rate': 1.46476865743308e-07, 'epoch': 1.89} {'loss': 0.604, 'learning_rate': 1.464210474420591e-07, 'epoch': 1.89} {'loss': 0.5144, 'learning_rate': 1.4636523969980943e-07, 'epoch': 1.89} {'loss': 0.3983, 'learning_rate': 1.4630944251661784e-07, 'epoch': 1.89} {'loss': 0.5221, 'learning_rate': 1.4625365589254538e-07, 'epoch': 1.89} {'loss': 0.4553, 'learning_rate': 1.461978798276531e-07, 'epoch': 1.89} {'loss': 0.6596, 'learning_rate': 1.4614211432199765e-07, 'epoch': 1.89} {'loss': 0.5024, 'learning_rate': 1.460863593756401e-07, 'epoch': 1.89} {'loss': 0.4419, 'learning_rate': 1.4603061498864036e-07, 'epoch': 1.89} {'loss': 0.4932, 'learning_rate': 1.459748811610584e-07, 'epoch': 1.89} {'loss': 0.4961, 'learning_rate': 1.459191578929542e-07, 'epoch': 1.89} {'loss': 0.4826, 'learning_rate': 1.4586344518438765e-07, 'epoch': 1.89} {'loss': 0.5641, 'learning_rate': 1.4580774303541656e-07, 'epoch': 1.89} {'loss': 0.4366, 'learning_rate': 1.4575205144610194e-07, 'epoch': 1.89} {'loss': 0.5398, 'learning_rate': 1.4569637041650376e-07, 'epoch': 1.89} {'loss': 0.5509, 'learning_rate': 1.4564069994668084e-07, 'epoch': 1.89} {'loss': 0.6, 'learning_rate': 1.4558504003669426e-07, 'epoch': 1.89} {'loss': 0.521, 'learning_rate': 1.4552939068660177e-07, 'epoch': 1.89} {'loss': 0.5568, 'learning_rate': 1.454737518964644e-07, 'epoch': 1.89} {'loss': 0.4319, 'learning_rate': 1.4541812366634211e-07, 'epoch': 1.89} {'loss': 0.5398, 'learning_rate': 1.4536250599629265e-07, 'epoch': 1.89} {'loss': 0.5378, 'learning_rate': 1.4530689888637706e-07, 'epoch': 1.89} {'loss': 0.4633, 'learning_rate': 1.452513023366542e-07, 'epoch': 1.89} {'loss': 0.4628, 'learning_rate': 1.4519571634718398e-07, 'epoch': 1.89} {'loss': 0.3665, 'learning_rate': 1.4514014091802642e-07, 'epoch': 1.89} {'loss': 0.3731, 'learning_rate': 1.4508457604924142e-07, 'epoch': 1.89} {'loss': 0.5194, 'learning_rate': 1.4502902174088674e-07, 'epoch': 1.89} {'loss': 0.6261, 'learning_rate': 1.449734779930223e-07, 'epoch': 1.89} {'loss': 0.5148, 'learning_rate': 1.449179448057092e-07, 'epoch': 1.89} {'loss': 0.3939, 'learning_rate': 1.4486242217900626e-07, 'epoch': 1.89} {'loss': 0.485, 'learning_rate': 1.4480691011297233e-07, 'epoch': 1.89} {'loss': 0.3808, 'learning_rate': 1.4475140860766622e-07, 'epoch': 1.89} {'loss': 0.5662, 'learning_rate': 1.4469591766315017e-07, 'epoch': 1.89} {'loss': 0.5033, 'learning_rate': 1.4464043727948186e-07, 'epoch': 1.89} {'loss': 0.6097, 'learning_rate': 1.4458496745672012e-07, 'epoch': 1.89} {'loss': 0.5599, 'learning_rate': 1.4452950819492494e-07, 'epoch': 1.89} {'loss': 0.5017, 'learning_rate': 1.4447405949415627e-07, 'epoch': 1.89} {'loss': 0.4276, 'learning_rate': 1.4441862135447293e-07, 'epoch': 1.89} {'loss': 0.6454, 'learning_rate': 1.4436319377593376e-07, 'epoch': 1.89} {'loss': 0.689, 'learning_rate': 1.4430777675860097e-07, 'epoch': 1.89} {'loss': 0.5648, 'learning_rate': 1.4425237030253003e-07, 'epoch': 1.89} {'loss': 0.567, 'learning_rate': 1.4419697440778312e-07, 'epoch': 1.89} {'loss': 0.6483, 'learning_rate': 1.441415890744191e-07, 'epoch': 1.89} {'loss': 0.4823, 'learning_rate': 1.440862143024957e-07, 'epoch': 1.89} {'loss': 0.4505, 'learning_rate': 1.4403085009207506e-07, 'epoch': 1.89} {'loss': 0.4395, 'learning_rate': 1.4397549644321273e-07, 'epoch': 1.89} {'loss': 0.3282, 'learning_rate': 1.439201533559731e-07, 'epoch': 1.89} {'loss': 0.4428, 'learning_rate': 1.4386482083041054e-07, 'epoch': 1.89} {'loss': 0.5137, 'learning_rate': 1.4380949886658723e-07, 'epoch': 1.89} {'loss': 0.3973, 'learning_rate': 1.4375418746456093e-07, 'epoch': 1.89} {'loss': 0.5448, 'learning_rate': 1.4369888662439159e-07, 'epoch': 1.89} {'loss': 0.4446, 'learning_rate': 1.4364359634613912e-07, 'epoch': 1.89} {'loss': 0.5607, 'learning_rate': 1.4358831662986128e-07, 'epoch': 1.89} {'loss': 0.5085, 'learning_rate': 1.4353304747561914e-07, 'epoch': 1.89} {'loss': 0.5164, 'learning_rate': 1.434777888834704e-07, 'epoch': 1.89} {'loss': 0.5244, 'learning_rate': 1.4342254085347506e-07, 'epoch': 1.89} {'loss': 0.2765, 'learning_rate': 1.4336730338569304e-07, 'epoch': 1.89} {'loss': 0.4652, 'learning_rate': 1.4331207648017987e-07, 'epoch': 1.89} {'loss': 0.5556, 'learning_rate': 1.4325686013699992e-07, 'epoch': 1.89} {'loss': 0.5857, 'learning_rate': 1.4320165435620759e-07, 'epoch': 1.89} {'loss': 0.6478, 'learning_rate': 1.431464591378673e-07, 'epoch': 1.89} {'loss': 0.4966, 'learning_rate': 1.430912744820334e-07, 'epoch': 1.89} {'loss': 0.5997, 'learning_rate': 1.4303610038876703e-07, 'epoch': 1.89} {'loss': 0.539, 'learning_rate': 1.4298093685812697e-07, 'epoch': 1.89} {'loss': 0.5005, 'learning_rate': 1.429257838901721e-07, 'epoch': 1.89} {'loss': 0.3441, 'learning_rate': 1.4287064148496342e-07, 'epoch': 1.89} {'loss': 0.4009, 'learning_rate': 1.4281550964255654e-07, 'epoch': 1.89} {'loss': 0.5112, 'learning_rate': 1.4276038836301465e-07, 'epoch': 1.89} {'loss': 0.401, 'learning_rate': 1.427052776463933e-07, 'epoch': 1.89} {'loss': 0.4737, 'learning_rate': 1.4265017749275245e-07, 'epoch': 1.89} {'loss': 0.524, 'learning_rate': 1.4259508790215315e-07, 'epoch': 1.89} {'loss': 0.4635, 'learning_rate': 1.4254000887465091e-07, 'epoch': 1.89} {'loss': 0.5945, 'learning_rate': 1.4248494041030902e-07, 'epoch': 1.89} {'loss': 0.4158, 'learning_rate': 1.4242988250918298e-07, 'epoch': 1.89} {'loss': 0.4062, 'learning_rate': 1.4237483517133278e-07, 'epoch': 1.89} {'loss': 0.4844, 'learning_rate': 1.4231979839681831e-07, 'epoch': 1.89} {'loss': 0.5395, 'learning_rate': 1.4226477218569734e-07, 'epoch': 1.89} {'loss': 0.4578, 'learning_rate': 1.4220975653803092e-07, 'epoch': 1.89} {'loss': 0.3876, 'learning_rate': 1.4215475145387346e-07, 'epoch': 1.89} {'loss': 0.4529, 'learning_rate': 1.4209975693328938e-07, 'epoch': 1.89} {'loss': 0.4816, 'learning_rate': 1.4204477297633522e-07, 'epoch': 1.89} {'loss': 0.4684, 'learning_rate': 1.419897995830688e-07, 'epoch': 1.89} {'loss': 0.5909, 'learning_rate': 1.4193483675355002e-07, 'epoch': 1.89} {'loss': 0.5092, 'learning_rate': 1.4187988448783775e-07, 'epoch': 1.89} {'loss': 0.4473, 'learning_rate': 1.418249427859919e-07, 'epoch': 1.89} {'loss': 0.5577, 'learning_rate': 1.4177001164806913e-07, 'epoch': 1.89} {'loss': 0.6652, 'learning_rate': 1.417150910741305e-07, 'epoch': 1.89} {'loss': 0.392, 'learning_rate': 1.4166018106423375e-07, 'epoch': 1.89} {'loss': 0.4673, 'learning_rate': 1.4160528161843767e-07, 'epoch': 1.89} {'loss': 0.4857, 'learning_rate': 1.4155039273680115e-07, 'epoch': 1.89} {'loss': 0.3698, 'learning_rate': 1.4149551441938303e-07, 'epoch': 1.89} {'loss': 0.6317, 'learning_rate': 1.4144064666624323e-07, 'epoch': 1.89} {'loss': 0.5333, 'learning_rate': 1.4138578947743732e-07, 'epoch': 1.89} {'loss': 0.4547, 'learning_rate': 1.413309428530296e-07, 'epoch': 1.89} {'loss': 0.5428, 'learning_rate': 1.4127610679307347e-07, 'epoch': 1.89} {'loss': 0.5422, 'learning_rate': 1.412212812976299e-07, 'epoch': 1.89} {'loss': 0.5223, 'learning_rate': 1.411664663667589e-07, 'epoch': 1.89} {'loss': 0.6522, 'learning_rate': 1.4111166200051597e-07, 'epoch': 1.89} {'loss': 0.4476, 'learning_rate': 1.4105686819896324e-07, 'epoch': 1.89} {'loss': 0.4464, 'learning_rate': 1.4100208496215629e-07, 'epoch': 1.89} {'loss': 0.4681, 'learning_rate': 1.4094731229015613e-07, 'epoch': 1.89} {'loss': 0.5799, 'learning_rate': 1.408925501830216e-07, 'epoch': 1.89} {'loss': 0.5002, 'learning_rate': 1.4083779864080937e-07, 'epoch': 1.89} {'loss': 0.4863, 'learning_rate': 1.4078305766358048e-07, 'epoch': 1.89} {'loss': 0.6152, 'learning_rate': 1.4072832725139153e-07, 'epoch': 1.89} {'loss': 0.5062, 'learning_rate': 1.4067360740430247e-07, 'epoch': 1.89} {'loss': 0.38, 'learning_rate': 1.4061889812237106e-07, 'epoch': 1.89} {'loss': 0.4174, 'learning_rate': 1.4056419940565614e-07, 'epoch': 1.89} {'loss': 0.5171, 'learning_rate': 1.4050951125421762e-07, 'epoch': 1.89} {'loss': 0.522, 'learning_rate': 1.404548336681122e-07, 'epoch': 1.89} {'loss': 0.6669, 'learning_rate': 1.4040016664739976e-07, 'epoch': 1.89} {'loss': 0.4482, 'learning_rate': 1.4034551019213693e-07, 'epoch': 1.89} {'loss': 0.4665, 'learning_rate': 1.4029086430238592e-07, 'epoch': 1.89} {'loss': 0.5538, 'learning_rate': 1.402362289782022e-07, 'epoch': 1.89} {'loss': 0.5472, 'learning_rate': 1.4018160421964578e-07, 'epoch': 1.89} {'loss': 0.3965, 'learning_rate': 1.4012699002677321e-07, 'epoch': 1.89} {'loss': 0.2922, 'learning_rate': 1.400723863996456e-07, 'epoch': 1.89} {'loss': 0.4685, 'learning_rate': 1.4001779333832065e-07, 'epoch': 1.89} {'loss': 0.5375, 'learning_rate': 1.3996321084285614e-07, 'epoch': 1.89} {'loss': 0.4728, 'learning_rate': 1.3990863891331086e-07, 'epoch': 1.89} {'loss': 0.4846, 'learning_rate': 1.3985407754974367e-07, 'epoch': 1.89} {'loss': 0.4117, 'learning_rate': 1.3979952675221232e-07, 'epoch': 1.89} {'loss': 0.4102, 'learning_rate': 1.3974498652077562e-07, 'epoch': 1.89} {'loss': 0.514, 'learning_rate': 1.3969045685549244e-07, 'epoch': 1.89} {'loss': 0.4292, 'learning_rate': 1.396359377564216e-07, 'epoch': 1.89} {'loss': 0.3832, 'learning_rate': 1.3958142922362083e-07, 'epoch': 1.89} {'loss': 0.6109, 'learning_rate': 1.3952693125714678e-07, 'epoch': 1.89} {'loss': 0.4675, 'learning_rate': 1.3947244385706048e-07, 'epoch': 1.89} {'loss': 0.4122, 'learning_rate': 1.394179670234197e-07, 'epoch': 1.89} {'loss': 0.5058, 'learning_rate': 1.3936350075628214e-07, 'epoch': 1.89} {'loss': 0.6627, 'learning_rate': 1.3930904505570663e-07, 'epoch': 1.89} {'loss': 0.4469, 'learning_rate': 1.3925459992175315e-07, 'epoch': 1.89} {'loss': 0.3398, 'learning_rate': 1.392001653544761e-07, 'epoch': 1.89} {'loss': 0.5381, 'learning_rate': 1.3914574135393654e-07, 'epoch': 1.89} {'loss': 0.413, 'learning_rate': 1.390913279201933e-07, 'epoch': 1.89} {'loss': 0.5678, 'learning_rate': 1.39036925053303e-07, 'epoch': 1.89} {'loss': 0.5973, 'learning_rate': 1.3898253275332452e-07, 'epoch': 1.89} {'loss': 0.5813, 'learning_rate': 1.3892815102031664e-07, 'epoch': 1.89} {'loss': 0.537, 'learning_rate': 1.3887377985433715e-07, 'epoch': 1.89} {'loss': 0.5345, 'learning_rate': 1.3881941925544373e-07, 'epoch': 1.89} {'loss': 0.6852, 'learning_rate': 1.3876506922369637e-07, 'epoch': 1.89} {'loss': 0.4404, 'learning_rate': 1.3871072975915166e-07, 'epoch': 1.89} {'loss': 0.6071, 'learning_rate': 1.3865640086186848e-07, 'epoch': 1.89} {'loss': 0.6057, 'learning_rate': 1.3860208253190455e-07, 'epoch': 1.89} {'loss': 0.6571, 'learning_rate': 1.385477747693198e-07, 'epoch': 1.89} {'loss': 0.521, 'learning_rate': 1.3849347757417087e-07, 'epoch': 1.89} {'loss': 0.3584, 'learning_rate': 1.3843919094651547e-07, 'epoch': 1.89} {'loss': 0.5619, 'learning_rate': 1.3838491488641247e-07, 'epoch': 1.89} {'loss': 0.5789, 'learning_rate': 1.383306493939207e-07, 'epoch': 1.89} {'loss': 0.4341, 'learning_rate': 1.3827639446909679e-07, 'epoch': 1.89} {'loss': 0.4839, 'learning_rate': 1.382221501120007e-07, 'epoch': 1.89} {'loss': 0.5302, 'learning_rate': 1.381679163226901e-07, 'epoch': 1.89} {'loss': 0.4379, 'learning_rate': 1.381136931012217e-07, 'epoch': 1.89} {'loss': 0.5546, 'learning_rate': 1.3805948044765538e-07, 'epoch': 1.89} {'loss': 0.5694, 'learning_rate': 1.380052783620478e-07, 'epoch': 1.89} {'loss': 0.4503, 'learning_rate': 1.379510868444578e-07, 'epoch': 1.89} {'loss': 0.5473, 'learning_rate': 1.378969058949442e-07, 'epoch': 1.89} {'loss': 0.5356, 'learning_rate': 1.3784273551356253e-07, 'epoch': 1.89} {'loss': 0.4398, 'learning_rate': 1.3778857570037386e-07, 'epoch': 1.89} {'loss': 0.5231, 'learning_rate': 1.3773442645543367e-07, 'epoch': 1.89} {'loss': 0.5569, 'learning_rate': 1.3768028777880194e-07, 'epoch': 1.89} {'loss': 0.5555, 'learning_rate': 1.3762615967053527e-07, 'epoch': 1.89} {'loss': 0.37, 'learning_rate': 1.3757204213069253e-07, 'epoch': 1.89} {'loss': 0.6364, 'learning_rate': 1.3751793515933254e-07, 'epoch': 1.89} {'loss': 0.3789, 'learning_rate': 1.3746383875651193e-07, 'epoch': 1.89} {'loss': 0.5192, 'learning_rate': 1.374097529222873e-07, 'epoch': 1.89} {'loss': 0.493, 'learning_rate': 1.3735567765671975e-07, 'epoch': 1.89} {'loss': 0.5411, 'learning_rate': 1.3730161295986588e-07, 'epoch': 1.89} {'loss': 0.5079, 'learning_rate': 1.372475588317823e-07, 'epoch': 1.89} {'loss': 0.4558, 'learning_rate': 1.37193515272529e-07, 'epoch': 1.89} {'loss': 0.4989, 'learning_rate': 1.3713948228216366e-07, 'epoch': 1.89} {'loss': 0.5204, 'learning_rate': 1.3708545986074295e-07, 'epoch': 1.89} {'loss': 0.4375, 'learning_rate': 1.3703144800832458e-07, 'epoch': 1.89} {'loss': 0.5334, 'learning_rate': 1.3697744672496737e-07, 'epoch': 1.89} {'loss': 0.5256, 'learning_rate': 1.3692345601073021e-07, 'epoch': 1.89} {'loss': 0.4968, 'learning_rate': 1.3686947586566855e-07, 'epoch': 1.89} {'loss': 0.5116, 'learning_rate': 1.3681550628984131e-07, 'epoch': 1.89} {'loss': 0.5216, 'learning_rate': 1.3676154728330837e-07, 'epoch': 1.89} {'loss': 0.4172, 'learning_rate': 1.3670759884612417e-07, 'epoch': 1.89} {'loss': 0.5314, 'learning_rate': 1.3665366097834752e-07, 'epoch': 1.89} {'loss': 0.5561, 'learning_rate': 1.365997336800373e-07, 'epoch': 1.89} {'loss': 0.5396, 'learning_rate': 1.3654581695125125e-07, 'epoch': 1.9} {'loss': 0.455, 'learning_rate': 1.3649191079204594e-07, 'epoch': 1.9} {'loss': 0.426, 'learning_rate': 1.3643801520247912e-07, 'epoch': 1.9} {'loss': 0.3599, 'learning_rate': 1.3638413018261076e-07, 'epoch': 1.9} {'loss': 0.4567, 'learning_rate': 1.3633025573249636e-07, 'epoch': 1.9} {'loss': 0.6321, 'learning_rate': 1.3627639185219367e-07, 'epoch': 1.9} {'loss': 0.4565, 'learning_rate': 1.362225385417626e-07, 'epoch': 1.9} {'loss': 0.5479, 'learning_rate': 1.3616869580125758e-07, 'epoch': 1.9} {'loss': 0.3281, 'learning_rate': 1.3611486363073967e-07, 'epoch': 1.9} {'loss': 0.5473, 'learning_rate': 1.3606104203026328e-07, 'epoch': 1.9} {'loss': 0.5354, 'learning_rate': 1.3600723099988943e-07, 'epoch': 1.9} {'loss': 0.3788, 'learning_rate': 1.359534305396726e-07, 'epoch': 1.9} {'loss': 0.5002, 'learning_rate': 1.3589964064967264e-07, 'epoch': 1.9} {'loss': 0.4083, 'learning_rate': 1.3584586132994737e-07, 'epoch': 1.9} {'loss': 0.5338, 'learning_rate': 1.3579209258055227e-07, 'epoch': 1.9} {'loss': 0.444, 'learning_rate': 1.3573833440154726e-07, 'epoch': 1.9} {'loss': 0.4392, 'learning_rate': 1.356845867929879e-07, 'epoch': 1.9} {'loss': 0.4185, 'learning_rate': 1.3563084975493412e-07, 'epoch': 1.9} {'loss': 0.6259, 'learning_rate': 1.3557712328744033e-07, 'epoch': 1.9} {'loss': 0.4328, 'learning_rate': 1.3552340739056756e-07, 'epoch': 1.9} {'loss': 0.3767, 'learning_rate': 1.3546970206437137e-07, 'epoch': 1.9} {'loss': 0.6053, 'learning_rate': 1.3541600730890947e-07, 'epoch': 1.9} {'loss': 0.5125, 'learning_rate': 1.353623231242396e-07, 'epoch': 1.9} {'loss': 0.4162, 'learning_rate': 1.3530864951041944e-07, 'epoch': 1.9} {'loss': 0.4272, 'learning_rate': 1.352549864675068e-07, 'epoch': 1.9} {'loss': 0.6221, 'learning_rate': 1.3520133399555823e-07, 'epoch': 1.9} {'loss': 0.5365, 'learning_rate': 1.3514769209463262e-07, 'epoch': 1.9} {'loss': 0.5403, 'learning_rate': 1.350940607647866e-07, 'epoch': 1.9} {'loss': 0.5166, 'learning_rate': 1.3504044000607564e-07, 'epoch': 1.9} {'loss': 0.4457, 'learning_rate': 1.3498682981856192e-07, 'epoch': 1.9} {'loss': 0.5118, 'learning_rate': 1.3493323020229764e-07, 'epoch': 1.9} {'loss': 0.6202, 'learning_rate': 1.3487964115734497e-07, 'epoch': 1.9} {'loss': 0.4836, 'learning_rate': 1.348260626837583e-07, 'epoch': 1.9} {'loss': 0.5301, 'learning_rate': 1.3477249478159537e-07, 'epoch': 1.9} {'loss': 0.5173, 'learning_rate': 1.34718937450915e-07, 'epoch': 1.9} {'loss': 0.6424, 'learning_rate': 1.3466539069177277e-07, 'epoch': 1.9} {'loss': 0.5174, 'learning_rate': 1.3461185450422743e-07, 'epoch': 1.9} {'loss': 0.5477, 'learning_rate': 1.3455832888833566e-07, 'epoch': 1.9} {'loss': 0.3196, 'learning_rate': 1.3450481384415625e-07, 'epoch': 1.9} {'loss': 0.4989, 'learning_rate': 1.3445130937174368e-07, 'epoch': 1.9} {'loss': 0.5486, 'learning_rate': 1.3439781547115782e-07, 'epoch': 1.9} {'loss': 0.5248, 'learning_rate': 1.3434433214245534e-07, 'epoch': 1.9} {'loss': 0.4639, 'learning_rate': 1.3429085938569287e-07, 'epoch': 1.9} {'loss': 0.587, 'learning_rate': 1.342373972009281e-07, 'epoch': 1.9} {'loss': 0.601, 'learning_rate': 1.341839455882188e-07, 'epoch': 1.9} {'loss': 0.4971, 'learning_rate': 1.3413050454762154e-07, 'epoch': 1.9} {'loss': 0.5942, 'learning_rate': 1.3407707407919413e-07, 'epoch': 1.9} {'loss': 0.5098, 'learning_rate': 1.3402365418299313e-07, 'epoch': 1.9} {'loss': 0.3851, 'learning_rate': 1.339702448590774e-07, 'epoch': 1.9} {'loss': 0.3778, 'learning_rate': 1.3391684610750134e-07, 'epoch': 1.9} {'loss': 0.5835, 'learning_rate': 1.33863457928326e-07, 'epoch': 1.9} {'loss': 0.5488, 'learning_rate': 1.338100803216047e-07, 'epoch': 1.9} {'loss': 0.5623, 'learning_rate': 1.3375671328739626e-07, 'epoch': 1.9} {'loss': 0.4244, 'learning_rate': 1.337033568257584e-07, 'epoch': 1.9} {'loss': 0.5275, 'learning_rate': 1.3365001093674778e-07, 'epoch': 1.9} {'loss': 0.3821, 'learning_rate': 1.3359667562042322e-07, 'epoch': 1.9} {'loss': 0.5098, 'learning_rate': 1.3354335087683802e-07, 'epoch': 1.9} {'loss': 0.5733, 'learning_rate': 1.3349003670605322e-07, 'epoch': 1.9} {'loss': 0.5369, 'learning_rate': 1.3343673310812322e-07, 'epoch': 1.9} {'loss': 0.4539, 'learning_rate': 1.3338344008310688e-07, 'epoch': 1.9} {'loss': 0.5848, 'learning_rate': 1.3333015763106083e-07, 'epoch': 1.9} {'loss': 0.4386, 'learning_rate': 1.3327688575204169e-07, 'epoch': 1.9} {'loss': 0.4095, 'learning_rate': 1.3322362444610826e-07, 'epoch': 1.9} {'loss': 0.4479, 'learning_rate': 1.3317037371331386e-07, 'epoch': 1.9} {'loss': 0.4731, 'learning_rate': 1.331171335537196e-07, 'epoch': 1.9} {'loss': 0.5687, 'learning_rate': 1.3306390396737978e-07, 'epoch': 1.9} {'loss': 0.5308, 'learning_rate': 1.330106849543533e-07, 'epoch': 1.9} {'loss': 0.6623, 'learning_rate': 1.3295747651469681e-07, 'epoch': 1.9} {'loss': 0.508, 'learning_rate': 1.3290427864846578e-07, 'epoch': 1.9} {'loss': 0.4862, 'learning_rate': 1.3285109135572016e-07, 'epoch': 1.9} {'loss': 0.5586, 'learning_rate': 1.3279791463651326e-07, 'epoch': 1.9} {'loss': 0.6463, 'learning_rate': 1.32744748490905e-07, 'epoch': 1.9} {'loss': 0.4128, 'learning_rate': 1.3269159291895095e-07, 'epoch': 1.9} {'loss': 0.3483, 'learning_rate': 1.3263844792070767e-07, 'epoch': 1.9} {'loss': 0.5827, 'learning_rate': 1.3258531349623517e-07, 'epoch': 1.9} {'loss': 0.3914, 'learning_rate': 1.3253218964558557e-07, 'epoch': 1.9} {'loss': 0.4744, 'learning_rate': 1.3247907636881997e-07, 'epoch': 1.9} {'loss': 0.5322, 'learning_rate': 1.3242597366599274e-07, 'epoch': 1.9} {'loss': 0.5717, 'learning_rate': 1.3237288153716165e-07, 'epoch': 1.9} {'loss': 0.7272, 'learning_rate': 1.3231979998238441e-07, 'epoch': 1.9} {'loss': 0.5599, 'learning_rate': 1.3226672900171656e-07, 'epoch': 1.9} {'loss': 0.507, 'learning_rate': 1.3221366859521578e-07, 'epoch': 1.9} {'loss': 0.5841, 'learning_rate': 1.3216061876293873e-07, 'epoch': 1.9} {'loss': 0.401, 'learning_rate': 1.3210757950494203e-07, 'epoch': 1.9} {'loss': 0.4923, 'learning_rate': 1.3205455082128228e-07, 'epoch': 1.9} {'loss': 0.5114, 'learning_rate': 1.320015327120172e-07, 'epoch': 1.9} {'loss': 0.5365, 'learning_rate': 1.3194852517720346e-07, 'epoch': 1.9} {'loss': 0.4671, 'learning_rate': 1.3189552821689656e-07, 'epoch': 1.9} {'loss': 0.409, 'learning_rate': 1.318425418311553e-07, 'epoch': 1.9} {'loss': 0.5391, 'learning_rate': 1.3178956602003522e-07, 'epoch': 1.9} {'loss': 0.456, 'learning_rate': 1.3173660078359295e-07, 'epoch': 1.9} {'loss': 0.3284, 'learning_rate': 1.3168364612188512e-07, 'epoch': 1.9} {'loss': 0.5284, 'learning_rate': 1.316307020349694e-07, 'epoch': 1.9} {'loss': 0.6102, 'learning_rate': 1.3157776852290138e-07, 'epoch': 1.9} {'loss': 0.4652, 'learning_rate': 1.3152484558573985e-07, 'epoch': 1.9} {'loss': 0.596, 'learning_rate': 1.3147193322353924e-07, 'epoch': 1.9} {'loss': 0.5069, 'learning_rate': 1.3141903143635726e-07, 'epoch': 1.9} {'loss': 0.4605, 'learning_rate': 1.3136614022425053e-07, 'epoch': 1.9} {'loss': 0.4542, 'learning_rate': 1.313132595872757e-07, 'epoch': 1.9} {'loss': 0.3701, 'learning_rate': 1.3126038952548937e-07, 'epoch': 1.9} {'loss': 0.3697, 'learning_rate': 1.3120753003894815e-07, 'epoch': 1.9} {'loss': 0.5746, 'learning_rate': 1.311546811277098e-07, 'epoch': 1.9} {'loss': 0.5761, 'learning_rate': 1.311018427918287e-07, 'epoch': 1.9} {'loss': 0.4507, 'learning_rate': 1.310490150313637e-07, 'epoch': 1.9} {'loss': 0.6312, 'learning_rate': 1.3099619784636918e-07, 'epoch': 1.9} {'loss': 0.5833, 'learning_rate': 1.3094339123690402e-07, 'epoch': 1.9} {'loss': 0.5437, 'learning_rate': 1.3089059520302262e-07, 'epoch': 1.9} {'loss': 0.52, 'learning_rate': 1.3083780974478378e-07, 'epoch': 1.9} {'loss': 0.3257, 'learning_rate': 1.3078503486224302e-07, 'epoch': 1.9} {'loss': 0.6444, 'learning_rate': 1.307322705554559e-07, 'epoch': 1.9} {'loss': 0.5006, 'learning_rate': 1.306795168244801e-07, 'epoch': 1.9} {'loss': 0.4556, 'learning_rate': 1.3062677366937225e-07, 'epoch': 1.9} {'loss': 0.4283, 'learning_rate': 1.30574041090189e-07, 'epoch': 1.9} {'loss': 0.3679, 'learning_rate': 1.3052131908698584e-07, 'epoch': 1.9} {'loss': 0.4903, 'learning_rate': 1.304686076598194e-07, 'epoch': 1.9} {'loss': 0.4368, 'learning_rate': 1.3041590680874849e-07, 'epoch': 1.9} {'loss': 0.5796, 'learning_rate': 1.3036321653382645e-07, 'epoch': 1.9} {'loss': 0.6148, 'learning_rate': 1.3031053683511098e-07, 'epoch': 1.9} {'loss': 0.536, 'learning_rate': 1.3025786771265757e-07, 'epoch': 1.9} {'loss': 0.5537, 'learning_rate': 1.3020520916652513e-07, 'epoch': 1.9} {'loss': 0.5703, 'learning_rate': 1.301525611967691e-07, 'epoch': 1.9} {'loss': 0.449, 'learning_rate': 1.3009992380344394e-07, 'epoch': 1.9} {'loss': 0.5204, 'learning_rate': 1.3004729698660845e-07, 'epoch': 1.9} {'loss': 0.3729, 'learning_rate': 1.2999468074631705e-07, 'epoch': 1.9} {'loss': 0.6541, 'learning_rate': 1.2994207508262856e-07, 'epoch': 1.9} {'loss': 0.565, 'learning_rate': 1.298894799955963e-07, 'epoch': 1.9} {'loss': 0.52, 'learning_rate': 1.2983689548527911e-07, 'epoch': 1.9} {'loss': 0.5672, 'learning_rate': 1.297843215517336e-07, 'epoch': 1.9} {'loss': 0.4309, 'learning_rate': 1.2973175819501304e-07, 'epoch': 1.9} {'loss': 0.4364, 'learning_rate': 1.2967920541517742e-07, 'epoch': 1.9} {'loss': 0.4659, 'learning_rate': 1.2962666321228112e-07, 'epoch': 1.9} {'loss': 0.5238, 'learning_rate': 1.2957413158638076e-07, 'epoch': 1.9} {'loss': 0.5455, 'learning_rate': 1.2952161053753187e-07, 'epoch': 1.9} {'loss': 0.2629, 'learning_rate': 1.2946910006579106e-07, 'epoch': 1.9} {'loss': 0.5389, 'learning_rate': 1.2941660017121715e-07, 'epoch': 1.9} {'loss': 0.4868, 'learning_rate': 1.2936411085386236e-07, 'epoch': 1.9} {'loss': 0.3712, 'learning_rate': 1.293116321137844e-07, 'epoch': 1.9} {'loss': 0.5793, 'learning_rate': 1.2925916395104099e-07, 'epoch': 1.9} {'loss': 0.5238, 'learning_rate': 1.2920670636568656e-07, 'epoch': 1.9} {'loss': 0.4149, 'learning_rate': 1.2915425935777992e-07, 'epoch': 1.9} {'loss': 0.4234, 'learning_rate': 1.2910182292737328e-07, 'epoch': 1.9} {'loss': 0.5625, 'learning_rate': 1.2904939707452547e-07, 'epoch': 1.9} {'loss': 0.457, 'learning_rate': 1.2899698179929198e-07, 'epoch': 1.9} {'loss': 0.561, 'learning_rate': 1.2894457710172947e-07, 'epoch': 1.9} {'loss': 0.4037, 'learning_rate': 1.2889218298189344e-07, 'epoch': 1.9} {'loss': 0.4794, 'learning_rate': 1.288397994398416e-07, 'epoch': 1.9} {'loss': 0.3821, 'learning_rate': 1.2878742647562836e-07, 'epoch': 1.9} {'loss': 0.5248, 'learning_rate': 1.2873506408930812e-07, 'epoch': 1.9} {'loss': 0.4658, 'learning_rate': 1.2868271228094198e-07, 'epoch': 1.9} {'loss': 0.5039, 'learning_rate': 1.2863037105058206e-07, 'epoch': 1.9} {'loss': 0.6297, 'learning_rate': 1.2857804039828613e-07, 'epoch': 1.9} {'loss': 0.5487, 'learning_rate': 1.285257203241097e-07, 'epoch': 1.9} {'loss': 0.5163, 'learning_rate': 1.2847341082810827e-07, 'epoch': 1.9} {'loss': 0.5881, 'learning_rate': 1.2842111191033957e-07, 'epoch': 1.9} {'loss': 0.4536, 'learning_rate': 1.283688235708569e-07, 'epoch': 1.9} {'loss': 0.3984, 'learning_rate': 1.283165458097191e-07, 'epoch': 1.9} {'loss': 0.5252, 'learning_rate': 1.2826427862698164e-07, 'epoch': 1.9} {'loss': 0.53, 'learning_rate': 1.28212022022699e-07, 'epoch': 1.9} {'loss': 0.51, 'learning_rate': 1.2815977599692886e-07, 'epoch': 1.9} {'loss': 0.457, 'learning_rate': 1.2810754054972562e-07, 'epoch': 1.9} {'loss': 0.502, 'learning_rate': 1.2805531568114816e-07, 'epoch': 1.9} {'loss': 0.6167, 'learning_rate': 1.280031013912475e-07, 'epoch': 1.9} {'loss': 0.4395, 'learning_rate': 1.2795089768008474e-07, 'epoch': 1.9} {'loss': 0.506, 'learning_rate': 1.2789870454771314e-07, 'epoch': 1.9} {'loss': 0.4828, 'learning_rate': 1.2784652199418822e-07, 'epoch': 1.9} {'loss': 0.5208, 'learning_rate': 1.2779435001956886e-07, 'epoch': 1.9} {'loss': 0.5274, 'learning_rate': 1.2774218862390607e-07, 'epoch': 1.9} {'loss': 0.4819, 'learning_rate': 1.2769003780726097e-07, 'epoch': 1.9} {'loss': 0.4248, 'learning_rate': 1.276378975696846e-07, 'epoch': 1.9} {'loss': 0.4872, 'learning_rate': 1.275857679112369e-07, 'epoch': 1.9} {'loss': 0.5216, 'learning_rate': 1.2753364883197228e-07, 'epoch': 1.9} {'loss': 0.421, 'learning_rate': 1.2748154033194626e-07, 'epoch': 1.9} {'loss': 0.5475, 'learning_rate': 1.2742944241121436e-07, 'epoch': 1.9} {'loss': 0.6371, 'learning_rate': 1.2737735506983208e-07, 'epoch': 1.9} {'loss': 0.5607, 'learning_rate': 1.2732527830785824e-07, 'epoch': 1.9} {'loss': 0.6397, 'learning_rate': 1.2727321212534394e-07, 'epoch': 1.9} {'loss': 0.4845, 'learning_rate': 1.2722115652234913e-07, 'epoch': 1.9} {'loss': 0.4792, 'learning_rate': 1.2716911149892707e-07, 'epoch': 1.9} {'loss': 0.5593, 'learning_rate': 1.2711707705513555e-07, 'epoch': 1.9} {'loss': 0.4312, 'learning_rate': 1.2706505319102892e-07, 'epoch': 1.9} {'loss': 0.4573, 'learning_rate': 1.270130399066616e-07, 'epoch': 1.9} {'loss': 0.4818, 'learning_rate': 1.269610372020924e-07, 'epoch': 1.9} {'loss': 0.4236, 'learning_rate': 1.2690904507737468e-07, 'epoch': 1.9} {'loss': 0.5266, 'learning_rate': 1.2685706353256611e-07, 'epoch': 1.9} {'loss': 0.3734, 'learning_rate': 1.2680509256772001e-07, 'epoch': 1.9} {'loss': 0.4855, 'learning_rate': 1.2675313218289408e-07, 'epoch': 1.9} {'loss': 0.4728, 'learning_rate': 1.2670118237814387e-07, 'epoch': 1.9} {'loss': 0.5364, 'learning_rate': 1.2664924315352268e-07, 'epoch': 1.9} {'loss': 0.3954, 'learning_rate': 1.265973145090893e-07, 'epoch': 1.9} {'loss': 0.6929, 'learning_rate': 1.2654539644489816e-07, 'epoch': 1.9} {'loss': 0.4238, 'learning_rate': 1.2649348896100366e-07, 'epoch': 1.9} {'loss': 0.6281, 'learning_rate': 1.2644159205746353e-07, 'epoch': 1.9} {'loss': 0.5634, 'learning_rate': 1.2638970573433217e-07, 'epoch': 1.9} {'loss': 0.3422, 'learning_rate': 1.2633782999166622e-07, 'epoch': 1.9} {'loss': 0.651, 'learning_rate': 1.2628596482951784e-07, 'epoch': 1.9} {'loss': 0.3547, 'learning_rate': 1.2623411024794808e-07, 'epoch': 1.9} {'loss': 0.4116, 'learning_rate': 1.26182266247008e-07, 'epoch': 1.9} {'loss': 0.6359, 'learning_rate': 1.261304328267554e-07, 'epoch': 1.9} {'loss': 0.4889, 'learning_rate': 1.2607860998724463e-07, 'epoch': 1.9} {'loss': 0.4662, 'learning_rate': 1.2602679772853232e-07, 'epoch': 1.9} {'loss': 0.5673, 'learning_rate': 1.2597499605067398e-07, 'epoch': 1.9} {'loss': 0.5659, 'learning_rate': 1.25923204953724e-07, 'epoch': 1.9} {'loss': 0.4403, 'learning_rate': 1.2587142443773792e-07, 'epoch': 1.9} {'loss': 0.6912, 'learning_rate': 1.2581965450277233e-07, 'epoch': 1.9} {'loss': 0.6519, 'learning_rate': 1.2576789514888278e-07, 'epoch': 1.9} {'loss': 0.5025, 'learning_rate': 1.2571614637612362e-07, 'epoch': 1.9} {'loss': 0.3355, 'learning_rate': 1.2566440818455038e-07, 'epoch': 1.9} {'loss': 0.4379, 'learning_rate': 1.256126805742197e-07, 'epoch': 1.9} {'loss': 0.3996, 'learning_rate': 1.25560963545186e-07, 'epoch': 1.9} {'loss': 0.1931, 'learning_rate': 1.255092570975047e-07, 'epoch': 1.9} {'loss': 0.4703, 'learning_rate': 1.2545756123123142e-07, 'epoch': 1.9} {'loss': 0.3958, 'learning_rate': 1.2540587594642162e-07, 'epoch': 1.9} {'loss': 0.4985, 'learning_rate': 1.2535420124313082e-07, 'epoch': 1.9} {'loss': 0.5115, 'learning_rate': 1.2530253712141448e-07, 'epoch': 1.9} {'loss': 0.4518, 'learning_rate': 1.252508835813282e-07, 'epoch': 1.9} {'loss': 0.4764, 'learning_rate': 1.2519924062292521e-07, 'epoch': 1.9} {'loss': 0.6097, 'learning_rate': 1.2514760824626327e-07, 'epoch': 1.9} {'loss': 0.4279, 'learning_rate': 1.2509598645139786e-07, 'epoch': 1.9} {'loss': 0.4981, 'learning_rate': 1.250443752383823e-07, 'epoch': 1.9} {'loss': 0.5206, 'learning_rate': 1.2499277460727322e-07, 'epoch': 1.9} {'loss': 0.4746, 'learning_rate': 1.249411845581261e-07, 'epoch': 1.9} {'loss': 0.626, 'learning_rate': 1.2488960509099535e-07, 'epoch': 1.9} {'loss': 0.5288, 'learning_rate': 1.248380362059365e-07, 'epoch': 1.9} {'loss': 0.44, 'learning_rate': 1.2478647790300502e-07, 'epoch': 1.9} {'loss': 0.5244, 'learning_rate': 1.2473493018225647e-07, 'epoch': 1.9} {'loss': 0.3843, 'learning_rate': 1.246833930437452e-07, 'epoch': 1.9} {'loss': 0.3754, 'learning_rate': 1.246318664875279e-07, 'epoch': 1.9} {'loss': 0.4824, 'learning_rate': 1.245803505136578e-07, 'epoch': 1.9} {'loss': 0.6074, 'learning_rate': 1.2452884512219155e-07, 'epoch': 1.9} {'loss': 0.3984, 'learning_rate': 1.2447735031318464e-07, 'epoch': 1.9} {'loss': 0.5239, 'learning_rate': 1.2442586608669038e-07, 'epoch': 1.9} {'loss': 0.4934, 'learning_rate': 1.243743924427654e-07, 'epoch': 1.9} {'loss': 0.5711, 'learning_rate': 1.2432292938146518e-07, 'epoch': 1.9} {'loss': 0.5817, 'learning_rate': 1.2427147690284413e-07, 'epoch': 1.9} {'loss': 0.4624, 'learning_rate': 1.2422003500695777e-07, 'epoch': 1.9} {'loss': 0.4243, 'learning_rate': 1.2416860369386053e-07, 'epoch': 1.9} {'loss': 0.5957, 'learning_rate': 1.2411718296360787e-07, 'epoch': 1.9} {'loss': 0.4291, 'learning_rate': 1.240657728162553e-07, 'epoch': 1.9} {'loss': 0.5459, 'learning_rate': 1.2401437325185727e-07, 'epoch': 1.9} {'loss': 0.5039, 'learning_rate': 1.2396298427047038e-07, 'epoch': 1.9} {'loss': 0.624, 'learning_rate': 1.239116058721468e-07, 'epoch': 1.9} {'loss': 0.4729, 'learning_rate': 1.2386023805694424e-07, 'epoch': 1.9} {'loss': 0.5748, 'learning_rate': 1.2380888082491716e-07, 'epoch': 1.9} {'loss': 0.548, 'learning_rate': 1.237575341761188e-07, 'epoch': 1.9} {'loss': 0.6092, 'learning_rate': 1.2370619811060693e-07, 'epoch': 1.9} {'loss': 0.5786, 'learning_rate': 1.2365487262843478e-07, 'epoch': 1.9} {'loss': 0.5878, 'learning_rate': 1.2360355772965904e-07, 'epoch': 1.9} {'loss': 0.5837, 'learning_rate': 1.2355225341433187e-07, 'epoch': 1.9} {'loss': 0.5215, 'learning_rate': 1.2350095968251096e-07, 'epoch': 1.9} {'loss': 0.4106, 'learning_rate': 1.2344967653424856e-07, 'epoch': 1.9} {'loss': 0.5063, 'learning_rate': 1.2339840396960233e-07, 'epoch': 1.9} {'loss': 0.5619, 'learning_rate': 1.2334714198862674e-07, 'epoch': 1.9} {'loss': 0.4738, 'learning_rate': 1.2329589059137502e-07, 'epoch': 1.9} {'loss': 0.5957, 'learning_rate': 1.2324464977790385e-07, 'epoch': 1.9} {'loss': 0.5511, 'learning_rate': 1.2319341954826759e-07, 'epoch': 1.9} {'loss': 0.5344, 'learning_rate': 1.2314219990252063e-07, 'epoch': 1.9} {'loss': 0.4975, 'learning_rate': 1.2309099084071852e-07, 'epoch': 1.9} {'loss': 0.5132, 'learning_rate': 1.2303979236291564e-07, 'epoch': 1.9} {'loss': 0.3484, 'learning_rate': 1.2298860446916748e-07, 'epoch': 1.9} {'loss': 0.6284, 'learning_rate': 1.2293742715952738e-07, 'epoch': 1.9} {'loss': 0.429, 'learning_rate': 1.2288626043405195e-07, 'epoch': 1.9} {'loss': 0.6025, 'learning_rate': 1.2283510429279555e-07, 'epoch': 1.9} {'loss': 0.3738, 'learning_rate': 1.2278395873581263e-07, 'epoch': 1.9} {'loss': 0.5846, 'learning_rate': 1.2273282376315864e-07, 'epoch': 1.9} {'loss': 0.7399, 'learning_rate': 1.2268169937488694e-07, 'epoch': 1.9} {'loss': 0.3285, 'learning_rate': 1.226305855710541e-07, 'epoch': 1.9} {'loss': 0.4973, 'learning_rate': 1.2257948235171347e-07, 'epoch': 1.9} {'loss': 0.4587, 'learning_rate': 1.225283897169216e-07, 'epoch': 1.9} {'loss': 0.457, 'learning_rate': 1.2247730766673073e-07, 'epoch': 1.9} {'loss': 0.5098, 'learning_rate': 1.2242623620119743e-07, 'epoch': 1.9} {'loss': 0.4879, 'learning_rate': 1.2237517532037614e-07, 'epoch': 1.9} {'loss': 0.4616, 'learning_rate': 1.2232412502432012e-07, 'epoch': 1.9} {'loss': 0.5798, 'learning_rate': 1.2227308531308714e-07, 'epoch': 1.9} {'loss': 0.3709, 'learning_rate': 1.2222205618672821e-07, 'epoch': 1.9} {'loss': 0.5585, 'learning_rate': 1.2217103764530225e-07, 'epoch': 1.9} {'loss': 0.5048, 'learning_rate': 1.2212002968886027e-07, 'epoch': 1.9} {'loss': 0.4637, 'learning_rate': 1.2206903231745783e-07, 'epoch': 1.9} {'loss': 0.4772, 'learning_rate': 1.2201804553115039e-07, 'epoch': 1.9} {'loss': 0.562, 'learning_rate': 1.2196706932999126e-07, 'epoch': 1.9} {'loss': 0.3274, 'learning_rate': 1.2191610371403707e-07, 'epoch': 1.9} {'loss': 0.4544, 'learning_rate': 1.218651486833411e-07, 'epoch': 1.9} {'loss': 0.4351, 'learning_rate': 1.2181420423795777e-07, 'epoch': 1.9} {'loss': 0.4816, 'learning_rate': 1.2176327037794256e-07, 'epoch': 1.9} {'loss': 0.4468, 'learning_rate': 1.217123471033499e-07, 'epoch': 1.9} {'loss': 0.4969, 'learning_rate': 1.2166143441423416e-07, 'epoch': 1.9} {'loss': 0.6102, 'learning_rate': 1.2161053231064757e-07, 'epoch': 1.9} {'loss': 0.4679, 'learning_rate': 1.2155964079264893e-07, 'epoch': 1.9} {'loss': 0.5085, 'learning_rate': 1.2150875986029042e-07, 'epoch': 1.9} {'loss': 0.4749, 'learning_rate': 1.2145788951362648e-07, 'epoch': 1.9} {'loss': 0.5284, 'learning_rate': 1.2140702975271257e-07, 'epoch': 1.9} {'loss': 0.4452, 'learning_rate': 1.2135618057760202e-07, 'epoch': 1.9} {'loss': 0.6084, 'learning_rate': 1.2130534198835032e-07, 'epoch': 1.9} {'loss': 0.4358, 'learning_rate': 1.2125451398501077e-07, 'epoch': 1.9} {'loss': 0.4179, 'learning_rate': 1.2120369656763996e-07, 'epoch': 1.9} {'loss': 0.6304, 'learning_rate': 1.2115288973629013e-07, 'epoch': 1.9} {'loss': 0.5758, 'learning_rate': 1.2110209349101676e-07, 'epoch': 1.9} {'loss': 0.6365, 'learning_rate': 1.2105130783187425e-07, 'epoch': 1.9} {'loss': 0.4688, 'learning_rate': 1.21000532758917e-07, 'epoch': 1.9} {'loss': 0.4771, 'learning_rate': 1.209497682721994e-07, 'epoch': 1.9} {'loss': 0.5383, 'learning_rate': 1.2089901437177475e-07, 'epoch': 1.9} {'loss': 0.6596, 'learning_rate': 1.208482710576997e-07, 'epoch': 1.9} {'loss': 0.5509, 'learning_rate': 1.207975383300264e-07, 'epoch': 1.9} {'loss': 0.3923, 'learning_rate': 1.2074681618881035e-07, 'epoch': 1.9} {'loss': 0.5397, 'learning_rate': 1.2069610463410598e-07, 'epoch': 1.9} {'loss': 0.5341, 'learning_rate': 1.2064540366596768e-07, 'epoch': 1.9} {'loss': 0.5892, 'learning_rate': 1.2059471328444983e-07, 'epoch': 1.9} {'loss': 0.524, 'learning_rate': 1.2054403348960464e-07, 'epoch': 1.9} {'loss': 0.5296, 'learning_rate': 1.2049336428149095e-07, 'epoch': 1.9} {'loss': 0.4838, 'learning_rate': 1.2044270566015758e-07, 'epoch': 1.9} {'loss': 0.5175, 'learning_rate': 1.203920576256634e-07, 'epoch': 1.9} {'loss': 0.5152, 'learning_rate': 1.203414201780606e-07, 'epoch': 1.9} {'loss': 0.5367, 'learning_rate': 1.2029079331740245e-07, 'epoch': 1.9} {'loss': 0.4835, 'learning_rate': 1.2024017704374558e-07, 'epoch': 1.9} {'loss': 0.6174, 'learning_rate': 1.2018957135714215e-07, 'epoch': 1.9} {'loss': 0.5207, 'learning_rate': 1.201389762576477e-07, 'epoch': 1.9} {'loss': 0.4645, 'learning_rate': 1.2008839174531662e-07, 'epoch': 1.9} {'loss': 0.5133, 'learning_rate': 1.2003781782020218e-07, 'epoch': 1.9} {'loss': 0.5812, 'learning_rate': 1.1998725448235882e-07, 'epoch': 1.9} {'loss': 0.5292, 'learning_rate': 1.199367017318398e-07, 'epoch': 1.9} {'loss': 0.534, 'learning_rate': 1.1988615956870175e-07, 'epoch': 1.9} {'loss': 0.4317, 'learning_rate': 1.1983562799299685e-07, 'epoch': 1.9} {'loss': 0.4187, 'learning_rate': 1.1978510700478063e-07, 'epoch': 1.9} {'loss': 0.3791, 'learning_rate': 1.1973459660410524e-07, 'epoch': 1.9} {'loss': 0.5132, 'learning_rate': 1.1968409679102732e-07, 'epoch': 1.9} {'loss': 0.5058, 'learning_rate': 1.1963360756559905e-07, 'epoch': 1.9} {'loss': 0.4172, 'learning_rate': 1.1958312892787373e-07, 'epoch': 1.9} {'loss': 0.4356, 'learning_rate': 1.1953266087790905e-07, 'epoch': 1.9} {'loss': 0.4442, 'learning_rate': 1.1948220341575612e-07, 'epoch': 1.9} {'loss': 0.416, 'learning_rate': 1.1943175654146933e-07, 'epoch': 1.9} {'loss': 0.4882, 'learning_rate': 1.1938132025510308e-07, 'epoch': 1.9} {'loss': 0.4934, 'learning_rate': 1.1933089455671175e-07, 'epoch': 1.9} {'loss': 0.4311, 'learning_rate': 1.192804794463498e-07, 'epoch': 1.9} {'loss': 0.4177, 'learning_rate': 1.1923007492406934e-07, 'epoch': 1.9} {'loss': 0.5764, 'learning_rate': 1.1917968098992705e-07, 'epoch': 1.9} {'loss': 0.4045, 'learning_rate': 1.1912929764397508e-07, 'epoch': 1.9} {'loss': 0.3521, 'learning_rate': 1.1907892488626671e-07, 'epoch': 1.9} {'loss': 0.5521, 'learning_rate': 1.1902856271685858e-07, 'epoch': 1.9} {'loss': 0.4798, 'learning_rate': 1.1897821113580177e-07, 'epoch': 1.9} {'loss': 0.3562, 'learning_rate': 1.1892787014315399e-07, 'epoch': 1.9} {'loss': 0.4922, 'learning_rate': 1.188775397389641e-07, 'epoch': 1.9} {'loss': 0.4667, 'learning_rate': 1.1882721992329094e-07, 'epoch': 1.9} {'loss': 0.349, 'learning_rate': 1.1877691069618446e-07, 'epoch': 1.9} {'loss': 0.517, 'learning_rate': 1.1872661205770131e-07, 'epoch': 1.9} {'loss': 0.5223, 'learning_rate': 1.1867632400789364e-07, 'epoch': 1.9} {'loss': 0.5152, 'learning_rate': 1.1862604654681697e-07, 'epoch': 1.9} {'loss': 0.401, 'learning_rate': 1.1857577967452461e-07, 'epoch': 1.9} {'loss': 0.5463, 'learning_rate': 1.1852552339106982e-07, 'epoch': 1.9} {'loss': 0.4892, 'learning_rate': 1.1847527769650702e-07, 'epoch': 1.9} {'loss': 0.3944, 'learning_rate': 1.1842504259088838e-07, 'epoch': 1.9} {'loss': 0.5546, 'learning_rate': 1.1837481807427054e-07, 'epoch': 1.9} {'loss': 0.4356, 'learning_rate': 1.1832460414670566e-07, 'epoch': 1.9} {'loss': 0.6585, 'learning_rate': 1.1827440080824814e-07, 'epoch': 1.9} {'loss': 0.5675, 'learning_rate': 1.182242080589513e-07, 'epoch': 1.9} {'loss': 0.4469, 'learning_rate': 1.181740258988684e-07, 'epoch': 1.9} {'loss': 0.5298, 'learning_rate': 1.1812385432805495e-07, 'epoch': 1.9} {'loss': 0.4217, 'learning_rate': 1.1807369334656316e-07, 'epoch': 1.9} {'loss': 0.4482, 'learning_rate': 1.180235429544474e-07, 'epoch': 1.9} {'loss': 0.5466, 'learning_rate': 1.1797340315176097e-07, 'epoch': 1.9} {'loss': 0.4691, 'learning_rate': 1.179232739385594e-07, 'epoch': 1.9} {'loss': 0.5963, 'learning_rate': 1.1787315531489374e-07, 'epoch': 1.9} {'loss': 0.4815, 'learning_rate': 1.1782304728081839e-07, 'epoch': 1.9} {'loss': 0.457, 'learning_rate': 1.1777294983638776e-07, 'epoch': 1.9} {'loss': 0.4564, 'learning_rate': 1.1772286298165625e-07, 'epoch': 1.9} {'loss': 0.4628, 'learning_rate': 1.1767278671667603e-07, 'epoch': 1.9} {'loss': 0.6433, 'learning_rate': 1.1762272104150152e-07, 'epoch': 1.9} {'loss': 0.4452, 'learning_rate': 1.17572665956186e-07, 'epoch': 1.9} {'loss': 0.4519, 'learning_rate': 1.1752262146078386e-07, 'epoch': 1.9} {'loss': 0.6195, 'learning_rate': 1.174725875553473e-07, 'epoch': 1.9} {'loss': 0.4986, 'learning_rate': 1.1742256423993181e-07, 'epoch': 1.9} {'loss': 0.4427, 'learning_rate': 1.1737255151458959e-07, 'epoch': 1.9} {'loss': 0.464, 'learning_rate': 1.1732254937937392e-07, 'epoch': 1.9} {'loss': 0.4674, 'learning_rate': 1.1727255783433922e-07, 'epoch': 1.9} {'loss': 0.4541, 'learning_rate': 1.1722257687954097e-07, 'epoch': 1.9} {'loss': 0.5609, 'learning_rate': 1.1717260651502805e-07, 'epoch': 1.9} {'loss': 0.548, 'learning_rate': 1.1712264674085816e-07, 'epoch': 1.9} {'loss': 0.4767, 'learning_rate': 1.170726975570835e-07, 'epoch': 1.9} {'loss': 0.583, 'learning_rate': 1.1702275896375626e-07, 'epoch': 1.9} {'loss': 0.4144, 'learning_rate': 1.1697283096093192e-07, 'epoch': 1.9} {'loss': 0.4971, 'learning_rate': 1.1692291354866381e-07, 'epoch': 1.9} {'loss': 0.7133, 'learning_rate': 1.1687300672700408e-07, 'epoch': 1.9} {'loss': 0.5334, 'learning_rate': 1.1682311049600603e-07, 'epoch': 1.9} {'loss': 0.6268, 'learning_rate': 1.1677322485572517e-07, 'epoch': 1.9} {'loss': 0.6858, 'learning_rate': 1.1672334980621369e-07, 'epoch': 1.9} {'loss': 0.7065, 'learning_rate': 1.1667348534752487e-07, 'epoch': 1.9} {'loss': 0.573, 'learning_rate': 1.1662363147971312e-07, 'epoch': 1.9} {'loss': 0.5067, 'learning_rate': 1.1657378820283061e-07, 'epoch': 1.9} {'loss': 0.5043, 'learning_rate': 1.1652395551693063e-07, 'epoch': 1.9} {'loss': 0.3899, 'learning_rate': 1.1647413342206759e-07, 'epoch': 1.9} {'loss': 0.5074, 'learning_rate': 1.1642432191829589e-07, 'epoch': 1.9} {'loss': 0.4321, 'learning_rate': 1.163745210056666e-07, 'epoch': 1.9} {'loss': 0.6815, 'learning_rate': 1.16324730684233e-07, 'epoch': 1.9} {'loss': 0.6907, 'learning_rate': 1.1627495095405173e-07, 'epoch': 1.9} {'loss': 0.4837, 'learning_rate': 1.1622518181517272e-07, 'epoch': 1.9} {'loss': 0.5502, 'learning_rate': 1.1617542326765041e-07, 'epoch': 1.9} {'loss': 0.5762, 'learning_rate': 1.1612567531153807e-07, 'epoch': 1.9} {'loss': 0.3889, 'learning_rate': 1.1607593794688898e-07, 'epoch': 1.9} {'loss': 0.6368, 'learning_rate': 1.1602621117375868e-07, 'epoch': 1.9} {'loss': 0.4516, 'learning_rate': 1.1597649499219598e-07, 'epoch': 1.9} {'loss': 0.3771, 'learning_rate': 1.1592678940225754e-07, 'epoch': 1.9} {'loss': 0.4434, 'learning_rate': 1.1587709440399552e-07, 'epoch': 1.9} {'loss': 0.3867, 'learning_rate': 1.1582740999746323e-07, 'epoch': 1.9} {'loss': 0.4463, 'learning_rate': 1.1577773618271393e-07, 'epoch': 1.9} {'loss': 0.4689, 'learning_rate': 1.1572807295979982e-07, 'epoch': 1.9} {'loss': 0.5318, 'learning_rate': 1.1567842032877752e-07, 'epoch': 1.9} {'loss': 0.5133, 'learning_rate': 1.1562877828969588e-07, 'epoch': 1.9} {'loss': 0.3844, 'learning_rate': 1.1557914684261151e-07, 'epoch': 1.9} {'loss': 0.4095, 'learning_rate': 1.155295259875755e-07, 'epoch': 1.9} {'loss': 0.4868, 'learning_rate': 1.1547991572464113e-07, 'epoch': 1.9} {'loss': 0.3544, 'learning_rate': 1.1543031605386279e-07, 'epoch': 1.9} {'loss': 0.523, 'learning_rate': 1.1538072697529379e-07, 'epoch': 1.9} {'loss': 0.5993, 'learning_rate': 1.153311484889863e-07, 'epoch': 1.9} {'loss': 0.4158, 'learning_rate': 1.1528158059499251e-07, 'epoch': 1.9} {'loss': 0.5662, 'learning_rate': 1.152320232933668e-07, 'epoch': 1.9} {'loss': 0.5125, 'learning_rate': 1.1518247658416359e-07, 'epoch': 1.9} {'loss': 0.5888, 'learning_rate': 1.1513294046743284e-07, 'epoch': 1.9} {'loss': 0.5733, 'learning_rate': 1.1508341494323005e-07, 'epoch': 1.9} {'loss': 0.543, 'learning_rate': 1.1503390001160741e-07, 'epoch': 1.9} {'loss': 0.6796, 'learning_rate': 1.149843956726182e-07, 'epoch': 1.9} {'loss': 0.4849, 'learning_rate': 1.1493490192631462e-07, 'epoch': 1.9} {'loss': 0.5316, 'learning_rate': 1.1488541877275216e-07, 'epoch': 1.9} {'loss': 0.4447, 'learning_rate': 1.148359462119808e-07, 'epoch': 1.9} {'loss': 0.3227, 'learning_rate': 1.1478648424405603e-07, 'epoch': 1.9} {'loss': 0.4956, 'learning_rate': 1.1473703286902892e-07, 'epoch': 1.9} {'loss': 0.4408, 'learning_rate': 1.1468759208695279e-07, 'epoch': 1.9} {'loss': 0.4251, 'learning_rate': 1.1463816189788313e-07, 'epoch': 1.9} {'loss': 0.6064, 'learning_rate': 1.1458874230186768e-07, 'epoch': 1.9} {'loss': 0.5271, 'learning_rate': 1.1453933329896528e-07, 'epoch': 1.9} {'loss': 0.5441, 'learning_rate': 1.1448993488922588e-07, 'epoch': 1.9} {'loss': 0.6134, 'learning_rate': 1.144405470727017e-07, 'epoch': 1.9} {'loss': 0.4153, 'learning_rate': 1.1439116984944821e-07, 'epoch': 1.9} {'loss': 0.5499, 'learning_rate': 1.1434180321951427e-07, 'epoch': 1.9} {'loss': 0.5106, 'learning_rate': 1.1429244718295762e-07, 'epoch': 1.9} {'loss': 0.4555, 'learning_rate': 1.142431017398271e-07, 'epoch': 1.9} {'loss': 0.6269, 'learning_rate': 1.1419376689017936e-07, 'epoch': 1.9} {'loss': 0.7229, 'learning_rate': 1.1414444263406432e-07, 'epoch': 1.9} {'loss': 0.6404, 'learning_rate': 1.140951289715353e-07, 'epoch': 1.9} {'loss': 0.4031, 'learning_rate': 1.1404582590264668e-07, 'epoch': 1.9} {'loss': 0.4282, 'learning_rate': 1.1399653342744843e-07, 'epoch': 1.9} {'loss': 0.4833, 'learning_rate': 1.1394725154599718e-07, 'epoch': 1.9} {'loss': 0.3929, 'learning_rate': 1.1389798025834175e-07, 'epoch': 1.9} {'loss': 0.4679, 'learning_rate': 1.138487195645388e-07, 'epoch': 1.9} {'loss': 0.5036, 'learning_rate': 1.1379946946463826e-07, 'epoch': 1.9} {'loss': 0.5064, 'learning_rate': 1.1375022995869344e-07, 'epoch': 1.9} {'loss': 0.5047, 'learning_rate': 1.1370100104675874e-07, 'epoch': 1.9} {'loss': 0.5488, 'learning_rate': 1.1365178272888521e-07, 'epoch': 1.9} {'loss': 0.3558, 'learning_rate': 1.1360257500512617e-07, 'epoch': 1.9} {'loss': 0.4663, 'learning_rate': 1.1355337787553378e-07, 'epoch': 1.9} {'loss': 0.4481, 'learning_rate': 1.1350419134016132e-07, 'epoch': 1.9} {'loss': 0.4401, 'learning_rate': 1.1345501539906212e-07, 'epoch': 1.9} {'loss': 0.4674, 'learning_rate': 1.1340585005228721e-07, 'epoch': 1.9} {'loss': 0.5725, 'learning_rate': 1.1335669529989102e-07, 'epoch': 1.9} {'loss': 0.4522, 'learning_rate': 1.133075511419246e-07, 'epoch': 1.9} {'loss': 0.553, 'learning_rate': 1.1325841757844236e-07, 'epoch': 1.9} {'loss': 0.5221, 'learning_rate': 1.1320929460949648e-07, 'epoch': 1.9} {'loss': 0.4746, 'learning_rate': 1.1316018223513803e-07, 'epoch': 1.9} {'loss': 0.4474, 'learning_rate': 1.1311108045542141e-07, 'epoch': 1.9} {'loss': 0.4871, 'learning_rate': 1.1306198927039769e-07, 'epoch': 1.9} {'loss': 0.6054, 'learning_rate': 1.1301290868012127e-07, 'epoch': 1.9} {'loss': 0.4523, 'learning_rate': 1.1296383868464322e-07, 'epoch': 1.9} {'loss': 0.4053, 'learning_rate': 1.1291477928401795e-07, 'epoch': 1.9} {'loss': 0.3962, 'learning_rate': 1.1286573047829652e-07, 'epoch': 1.9} {'loss': 0.4922, 'learning_rate': 1.1281669226753111e-07, 'epoch': 1.9} {'loss': 0.3796, 'learning_rate': 1.1276766465177614e-07, 'epoch': 1.9} {'loss': 0.46, 'learning_rate': 1.1271864763108154e-07, 'epoch': 1.9} {'loss': 0.5058, 'learning_rate': 1.1266964120550283e-07, 'epoch': 1.9} {'loss': 0.4854, 'learning_rate': 1.1262064537508998e-07, 'epoch': 1.9} {'loss': 0.4839, 'learning_rate': 1.1257166013989629e-07, 'epoch': 1.9} {'loss': 0.4778, 'learning_rate': 1.1252268549997503e-07, 'epoch': 1.9} {'loss': 0.4885, 'learning_rate': 1.1247372145537727e-07, 'epoch': 1.9} {'loss': 0.4177, 'learning_rate': 1.1242476800615742e-07, 'epoch': 1.9} {'loss': 0.5537, 'learning_rate': 1.1237582515236545e-07, 'epoch': 1.9} {'loss': 0.509, 'learning_rate': 1.1232689289405684e-07, 'epoch': 1.9} {'loss': 0.4732, 'learning_rate': 1.1227797123128159e-07, 'epoch': 1.9} {'loss': 0.3654, 'learning_rate': 1.1222906016409296e-07, 'epoch': 1.9} {'loss': 0.4325, 'learning_rate': 1.1218015969254315e-07, 'epoch': 1.9} {'loss': 0.4035, 'learning_rate': 1.1213126981668543e-07, 'epoch': 1.9} {'loss': 0.5152, 'learning_rate': 1.1208239053657088e-07, 'epoch': 1.9} {'loss': 0.4449, 'learning_rate': 1.120335218522528e-07, 'epoch': 1.9} {'loss': 0.5133, 'learning_rate': 1.1198466376378336e-07, 'epoch': 1.9} {'loss': 0.5643, 'learning_rate': 1.1193581627121363e-07, 'epoch': 1.9} {'loss': 0.4493, 'learning_rate': 1.1188697937459802e-07, 'epoch': 1.9} {'loss': 0.4788, 'learning_rate': 1.1183815307398871e-07, 'epoch': 1.9} {'loss': 0.4773, 'learning_rate': 1.1178933736943564e-07, 'epoch': 1.91} {'loss': 0.6429, 'learning_rate': 1.1174053226099435e-07, 'epoch': 1.91} {'loss': 0.4321, 'learning_rate': 1.1169173774871478e-07, 'epoch': 1.91} {'loss': 0.5018, 'learning_rate': 1.1164295383265023e-07, 'epoch': 1.91} {'loss': 0.5, 'learning_rate': 1.1159418051285287e-07, 'epoch': 1.91} {'loss': 0.4198, 'learning_rate': 1.1154541778937377e-07, 'epoch': 1.91} {'loss': 0.3538, 'learning_rate': 1.1149666566226736e-07, 'epoch': 1.91} {'loss': 0.3874, 'learning_rate': 1.1144792413158356e-07, 'epoch': 1.91} {'loss': 0.5273, 'learning_rate': 1.1139919319737791e-07, 'epoch': 1.91} {'loss': 0.4146, 'learning_rate': 1.1135047285969925e-07, 'epoch': 1.91} {'loss': 0.529, 'learning_rate': 1.1130176311860085e-07, 'epoch': 1.91} {'loss': 0.3302, 'learning_rate': 1.1125306397413494e-07, 'epoch': 1.91} {'loss': 0.507, 'learning_rate': 1.1120437542635365e-07, 'epoch': 1.91} {'loss': 0.553, 'learning_rate': 1.111556974753103e-07, 'epoch': 1.91} {'loss': 0.6358, 'learning_rate': 1.1110703012105594e-07, 'epoch': 1.91} {'loss': 0.5547, 'learning_rate': 1.1105837336364389e-07, 'epoch': 1.91} {'loss': 0.4527, 'learning_rate': 1.1100972720312409e-07, 'epoch': 1.91} {'loss': 0.6243, 'learning_rate': 1.1096109163954983e-07, 'epoch': 1.91} {'loss': 0.4668, 'learning_rate': 1.1091246667297328e-07, 'epoch': 1.91} {'loss': 0.6343, 'learning_rate': 1.1086385230344665e-07, 'epoch': 1.91} {'loss': 0.4961, 'learning_rate': 1.108152485310221e-07, 'epoch': 1.91} {'loss': 0.437, 'learning_rate': 1.1076665535575182e-07, 'epoch': 1.91} {'loss': 0.5438, 'learning_rate': 1.1071807277768798e-07, 'epoch': 1.91} {'loss': 0.5085, 'learning_rate': 1.1066950079688166e-07, 'epoch': 1.91} {'loss': 0.3447, 'learning_rate': 1.1062093941338503e-07, 'epoch': 1.91} {'loss': 0.634, 'learning_rate': 1.1057238862725139e-07, 'epoch': 1.91} {'loss': 0.474, 'learning_rate': 1.1052384843853181e-07, 'epoch': 1.91} {'loss': 0.4775, 'learning_rate': 1.1047531884727847e-07, 'epoch': 1.91} {'loss': 0.4126, 'learning_rate': 1.1042679985354355e-07, 'epoch': 1.91} {'loss': 0.3648, 'learning_rate': 1.1037829145737922e-07, 'epoch': 1.91} {'loss': 0.4642, 'learning_rate': 1.1032979365883656e-07, 'epoch': 1.91} {'loss': 0.5401, 'learning_rate': 1.1028130645796886e-07, 'epoch': 1.91} {'loss': 0.4997, 'learning_rate': 1.1023282985482608e-07, 'epoch': 1.91} {'loss': 0.6411, 'learning_rate': 1.1018436384946263e-07, 'epoch': 1.91} {'loss': 0.599, 'learning_rate': 1.1013590844192845e-07, 'epoch': 1.91} {'loss': 0.5577, 'learning_rate': 1.1008746363227685e-07, 'epoch': 1.91} {'loss': 0.5052, 'learning_rate': 1.1003902942055888e-07, 'epoch': 1.91} {'loss': 0.4975, 'learning_rate': 1.0999060580682675e-07, 'epoch': 1.91} {'loss': 0.5023, 'learning_rate': 1.0994219279113261e-07, 'epoch': 1.91} {'loss': 0.4677, 'learning_rate': 1.0989379037352754e-07, 'epoch': 1.91} {'loss': 0.5004, 'learning_rate': 1.0984539855406374e-07, 'epoch': 1.91} {'loss': 0.4586, 'learning_rate': 1.0979701733279335e-07, 'epoch': 1.91} {'loss': 0.3709, 'learning_rate': 1.097486467097686e-07, 'epoch': 1.91} {'loss': 0.5103, 'learning_rate': 1.0970028668504052e-07, 'epoch': 1.91} {'loss': 0.4836, 'learning_rate': 1.096519372586613e-07, 'epoch': 1.91} {'loss': 0.4957, 'learning_rate': 1.0960359843068313e-07, 'epoch': 1.91} {'loss': 0.4211, 'learning_rate': 1.0955527020115597e-07, 'epoch': 1.91} {'loss': 0.4712, 'learning_rate': 1.0950695257013532e-07, 'epoch': 1.91} {'loss': 0.6263, 'learning_rate': 1.0945864553766894e-07, 'epoch': 1.91} {'loss': 0.5663, 'learning_rate': 1.094103491038101e-07, 'epoch': 1.91} {'loss': 0.5029, 'learning_rate': 1.0936206326861098e-07, 'epoch': 1.91} {'loss': 0.599, 'learning_rate': 1.0931378803212378e-07, 'epoch': 1.91} {'loss': 0.4721, 'learning_rate': 1.0926552339439955e-07, 'epoch': 1.91} {'loss': 0.5578, 'learning_rate': 1.0921726935548938e-07, 'epoch': 1.91} {'loss': 0.4654, 'learning_rate': 1.0916902591544654e-07, 'epoch': 1.91} {'loss': 0.4249, 'learning_rate': 1.0912079307432099e-07, 'epoch': 1.91} {'loss': 0.54, 'learning_rate': 1.0907257083216494e-07, 'epoch': 1.91} {'loss': 0.5274, 'learning_rate': 1.0902435918903053e-07, 'epoch': 1.91} {'loss': 0.6426, 'learning_rate': 1.0897615814496887e-07, 'epoch': 1.91} {'loss': 0.5265, 'learning_rate': 1.0892796770003322e-07, 'epoch': 1.91} {'loss': 0.263, 'learning_rate': 1.0887978785427245e-07, 'epoch': 1.91} {'loss': 0.4992, 'learning_rate': 1.0883161860774205e-07, 'epoch': 1.91} {'loss': 0.5902, 'learning_rate': 1.0878345996048867e-07, 'epoch': 1.91} {'loss': 0.4956, 'learning_rate': 1.0873531191256781e-07, 'epoch': 1.91} {'loss': 0.4155, 'learning_rate': 1.0868717446402943e-07, 'epoch': 1.91} {'loss': 0.5302, 'learning_rate': 1.0863904761492572e-07, 'epoch': 1.91} {'loss': 0.5748, 'learning_rate': 1.0859093136530884e-07, 'epoch': 1.91} {'loss': 0.4802, 'learning_rate': 1.0854282571522767e-07, 'epoch': 1.91} {'loss': 0.4687, 'learning_rate': 1.084947306647377e-07, 'epoch': 1.91} {'loss': 0.4087, 'learning_rate': 1.0844664621388779e-07, 'epoch': 1.91} {'loss': 0.5289, 'learning_rate': 1.08398572362729e-07, 'epoch': 1.91} {'loss': 0.3929, 'learning_rate': 1.0835050911131573e-07, 'epoch': 1.91} {'loss': 0.4444, 'learning_rate': 1.0830245645969572e-07, 'epoch': 1.91} {'loss': 0.5335, 'learning_rate': 1.082544144079234e-07, 'epoch': 1.91} {'loss': 0.6451, 'learning_rate': 1.0820638295604869e-07, 'epoch': 1.91} {'loss': 0.5789, 'learning_rate': 1.0815836210412379e-07, 'epoch': 1.91} {'loss': 0.4743, 'learning_rate': 1.0811035185220086e-07, 'epoch': 1.91} {'loss': 0.568, 'learning_rate': 1.080623522003299e-07, 'epoch': 1.91} {'loss': 0.5403, 'learning_rate': 1.0801436314856306e-07, 'epoch': 1.91} {'loss': 0.3721, 'learning_rate': 1.0796638469695031e-07, 'epoch': 1.91} {'loss': 0.505, 'learning_rate': 1.0791841684554605e-07, 'epoch': 1.91} {'loss': 0.5853, 'learning_rate': 1.0787045959439912e-07, 'epoch': 1.91} {'loss': 0.406, 'learning_rate': 1.0782251294356284e-07, 'epoch': 1.91} {'loss': 0.4682, 'learning_rate': 1.0777457689308713e-07, 'epoch': 1.91} {'loss': 0.482, 'learning_rate': 1.0772665144302307e-07, 'epoch': 1.91} {'loss': 0.5536, 'learning_rate': 1.0767873659342398e-07, 'epoch': 1.91} {'loss': 0.5135, 'learning_rate': 1.0763083234433868e-07, 'epoch': 1.91} {'loss': 0.5867, 'learning_rate': 1.0758293869582048e-07, 'epoch': 1.91} {'loss': 0.5428, 'learning_rate': 1.0753505564791933e-07, 'epoch': 1.91} {'loss': 0.448, 'learning_rate': 1.074871832006874e-07, 'epoch': 1.91} {'loss': 0.4104, 'learning_rate': 1.074393213541769e-07, 'epoch': 1.91} {'loss': 0.581, 'learning_rate': 1.0739147010843665e-07, 'epoch': 1.91} {'loss': 0.5154, 'learning_rate': 1.0734362946352106e-07, 'epoch': 1.91} {'loss': 0.3987, 'learning_rate': 1.0729579941947787e-07, 'epoch': 1.91} {'loss': 0.4238, 'learning_rate': 1.0724797997636038e-07, 'epoch': 1.91} {'loss': 0.4503, 'learning_rate': 1.0720017113421965e-07, 'epoch': 1.91} {'loss': 0.6473, 'learning_rate': 1.0715237289310787e-07, 'epoch': 1.91} {'loss': 0.5693, 'learning_rate': 1.0710458525307388e-07, 'epoch': 1.91} {'loss': 0.4638, 'learning_rate': 1.0705680821417097e-07, 'epoch': 1.91} {'loss': 0.4509, 'learning_rate': 1.0700904177645021e-07, 'epoch': 1.91} {'loss': 0.4988, 'learning_rate': 1.0696128593996047e-07, 'epoch': 1.91} {'loss': 0.6005, 'learning_rate': 1.0691354070475612e-07, 'epoch': 1.91} {'loss': 0.5124, 'learning_rate': 1.0686580607088493e-07, 'epoch': 1.91} {'loss': 0.5761, 'learning_rate': 1.0681808203840127e-07, 'epoch': 1.91} {'loss': 0.4317, 'learning_rate': 1.0677036860735512e-07, 'epoch': 1.91} {'loss': 0.4966, 'learning_rate': 1.0672266577779756e-07, 'epoch': 1.91} {'loss': 0.4555, 'learning_rate': 1.0667497354977963e-07, 'epoch': 1.91} {'loss': 0.4913, 'learning_rate': 1.066272919233513e-07, 'epoch': 1.91} {'loss': 0.4997, 'learning_rate': 1.0657962089856588e-07, 'epoch': 1.91} {'loss': 0.5057, 'learning_rate': 1.0653196047547221e-07, 'epoch': 1.91} {'loss': 0.5121, 'learning_rate': 1.0648431065412356e-07, 'epoch': 1.91} {'loss': 0.4164, 'learning_rate': 1.0643667143456881e-07, 'epoch': 1.91} {'loss': 0.4691, 'learning_rate': 1.0638904281686124e-07, 'epoch': 1.91} {'loss': 0.4102, 'learning_rate': 1.0634142480105081e-07, 'epoch': 1.91} {'loss': 0.6257, 'learning_rate': 1.0629381738718747e-07, 'epoch': 1.91} {'loss': 0.4681, 'learning_rate': 1.0624622057532453e-07, 'epoch': 1.91} {'loss': 0.4522, 'learning_rate': 1.0619863436551082e-07, 'epoch': 1.91} {'loss': 0.5229, 'learning_rate': 1.0615105875779852e-07, 'epoch': 1.91} {'loss': 0.4954, 'learning_rate': 1.0610349375223761e-07, 'epoch': 1.91} {'loss': 0.5519, 'learning_rate': 1.0605593934888026e-07, 'epoch': 1.91} {'loss': 0.5128, 'learning_rate': 1.0600839554777753e-07, 'epoch': 1.91} {'loss': 0.6142, 'learning_rate': 1.059608623489794e-07, 'epoch': 1.91} {'loss': 0.5473, 'learning_rate': 1.0591333975253692e-07, 'epoch': 1.91} {'loss': 0.5436, 'learning_rate': 1.0586582775850229e-07, 'epoch': 1.91} {'loss': 0.6141, 'learning_rate': 1.0581832636692436e-07, 'epoch': 1.91} {'loss': 0.6043, 'learning_rate': 1.0577083557785528e-07, 'epoch': 1.91} {'loss': 0.3609, 'learning_rate': 1.0572335539134615e-07, 'epoch': 1.91} {'loss': 0.4745, 'learning_rate': 1.0567588580744803e-07, 'epoch': 1.91} {'loss': 0.5115, 'learning_rate': 1.0562842682620978e-07, 'epoch': 1.91} {'loss': 0.5646, 'learning_rate': 1.0558097844768466e-07, 'epoch': 1.91} {'loss': 0.395, 'learning_rate': 1.0553354067192156e-07, 'epoch': 1.91} {'loss': 0.5563, 'learning_rate': 1.0548611349897264e-07, 'epoch': 1.91} {'loss': 0.5657, 'learning_rate': 1.0543869692888897e-07, 'epoch': 1.91} {'loss': 0.4588, 'learning_rate': 1.0539129096172052e-07, 'epoch': 1.91} {'loss': 0.4261, 'learning_rate': 1.0534389559751835e-07, 'epoch': 1.91} {'loss': 0.5394, 'learning_rate': 1.0529651083633352e-07, 'epoch': 1.91} {'loss': 0.6602, 'learning_rate': 1.0524913667821601e-07, 'epoch': 1.91} {'loss': 0.5436, 'learning_rate': 1.05201773123218e-07, 'epoch': 1.91} {'loss': 0.5824, 'learning_rate': 1.0515442017138833e-07, 'epoch': 1.91} {'loss': 0.3646, 'learning_rate': 1.0510707782277918e-07, 'epoch': 1.91} {'loss': 0.5743, 'learning_rate': 1.0505974607744051e-07, 'epoch': 1.91} {'loss': 0.4011, 'learning_rate': 1.0501242493542452e-07, 'epoch': 1.91} {'loss': 0.4654, 'learning_rate': 1.0496511439677892e-07, 'epoch': 1.91} {'loss': 0.3589, 'learning_rate': 1.0491781446155813e-07, 'epoch': 1.91} {'loss': 0.5261, 'learning_rate': 1.0487052512980989e-07, 'epoch': 1.91} {'loss': 0.5444, 'learning_rate': 1.0482324640158637e-07, 'epoch': 1.91} {'loss': 0.4532, 'learning_rate': 1.0477597827693753e-07, 'epoch': 1.91} {'loss': 0.5292, 'learning_rate': 1.0472872075591445e-07, 'epoch': 1.91} {'loss': 0.4702, 'learning_rate': 1.046814738385682e-07, 'epoch': 1.91} {'loss': 0.5205, 'learning_rate': 1.0463423752494872e-07, 'epoch': 1.91} {'loss': 0.5033, 'learning_rate': 1.04587011815106e-07, 'epoch': 1.91} {'loss': 0.6045, 'learning_rate': 1.0453979670909109e-07, 'epoch': 1.91} {'loss': 0.6079, 'learning_rate': 1.0449259220695618e-07, 'epoch': 1.91} {'loss': 0.496, 'learning_rate': 1.0444539830875011e-07, 'epoch': 1.91} {'loss': 0.5602, 'learning_rate': 1.0439821501452396e-07, 'epoch': 1.91} {'loss': 0.4936, 'learning_rate': 1.043510423243288e-07, 'epoch': 1.91} {'loss': 0.6789, 'learning_rate': 1.0430388023821348e-07, 'epoch': 1.91} {'loss': 0.602, 'learning_rate': 1.0425672875623017e-07, 'epoch': 1.91} {'loss': 0.5534, 'learning_rate': 1.0420958787842883e-07, 'epoch': 1.91} {'loss': 0.5292, 'learning_rate': 1.0416245760486054e-07, 'epoch': 1.91} {'loss': 0.5079, 'learning_rate': 1.0411533793557527e-07, 'epoch': 1.91} {'loss': 0.3985, 'learning_rate': 1.0406822887062296e-07, 'epoch': 1.91} {'loss': 0.4878, 'learning_rate': 1.0402113041005468e-07, 'epoch': 1.91} {'loss': 0.5456, 'learning_rate': 1.0397404255392152e-07, 'epoch': 1.91} {'loss': 0.5713, 'learning_rate': 1.0392696530227342e-07, 'epoch': 1.91} {'loss': 0.6821, 'learning_rate': 1.0387989865516035e-07, 'epoch': 1.91} {'loss': 0.5037, 'learning_rate': 1.0383284261263338e-07, 'epoch': 1.91} {'loss': 0.5122, 'learning_rate': 1.0378579717474247e-07, 'epoch': 1.91} {'loss': 0.4757, 'learning_rate': 1.0373876234153868e-07, 'epoch': 1.91} {'loss': 0.5123, 'learning_rate': 1.0369173811307198e-07, 'epoch': 1.91} {'loss': 0.5212, 'learning_rate': 1.0364472448939233e-07, 'epoch': 1.91} {'loss': 0.4782, 'learning_rate': 1.035977214705508e-07, 'epoch': 1.91} {'loss': 0.6006, 'learning_rate': 1.0355072905659736e-07, 'epoch': 1.91} {'loss': 0.3806, 'learning_rate': 1.0350374724758305e-07, 'epoch': 1.91} {'loss': 0.536, 'learning_rate': 1.0345677604355676e-07, 'epoch': 1.91} {'loss': 0.5012, 'learning_rate': 1.0340981544457063e-07, 'epoch': 1.91} {'loss': 0.451, 'learning_rate': 1.0336286545067354e-07, 'epoch': 1.91} {'loss': 0.6379, 'learning_rate': 1.0331592606191654e-07, 'epoch': 1.91} {'loss': 0.4778, 'learning_rate': 1.032689972783496e-07, 'epoch': 1.91} {'loss': 0.5659, 'learning_rate': 1.0322207910002268e-07, 'epoch': 1.91} {'loss': 0.5968, 'learning_rate': 1.0317517152698797e-07, 'epoch': 1.91} {'loss': 0.4689, 'learning_rate': 1.0312827455929319e-07, 'epoch': 1.91} {'loss': 0.3349, 'learning_rate': 1.0308138819699053e-07, 'epoch': 1.91} {'loss': 0.5738, 'learning_rate': 1.0303451244012885e-07, 'epoch': 1.91} {'loss': 0.4555, 'learning_rate': 1.0298764728875921e-07, 'epoch': 1.91} {'loss': 0.4668, 'learning_rate': 1.0294079274293156e-07, 'epoch': 1.91} {'loss': 0.4748, 'learning_rate': 1.0289394880269476e-07, 'epoch': 1.91} {'loss': 0.5841, 'learning_rate': 1.028471154681021e-07, 'epoch': 1.91} {'loss': 0.5017, 'learning_rate': 1.0280029273920133e-07, 'epoch': 1.91} {'loss': 0.5928, 'learning_rate': 1.0275348061604352e-07, 'epoch': 1.91} {'loss': 0.4568, 'learning_rate': 1.0270667909867859e-07, 'epoch': 1.91} {'loss': 0.3984, 'learning_rate': 1.0265988818715655e-07, 'epoch': 1.91} {'loss': 0.6846, 'learning_rate': 1.0261310788152845e-07, 'epoch': 1.91} {'loss': 0.5523, 'learning_rate': 1.0256633818184314e-07, 'epoch': 1.91} {'loss': 0.4772, 'learning_rate': 1.0251957908815169e-07, 'epoch': 1.91} {'loss': 0.6356, 'learning_rate': 1.0247283060050295e-07, 'epoch': 1.91} {'loss': 0.4478, 'learning_rate': 1.024260927189491e-07, 'epoch': 1.91} {'loss': 0.463, 'learning_rate': 1.0237936544353788e-07, 'epoch': 1.91} {'loss': 0.4806, 'learning_rate': 1.0233264877432037e-07, 'epoch': 1.91} {'loss': 0.5179, 'learning_rate': 1.0228594271134762e-07, 'epoch': 1.91} {'loss': 0.4821, 'learning_rate': 1.0223924725466849e-07, 'epoch': 1.91} {'loss': 0.6115, 'learning_rate': 1.0219256240433406e-07, 'epoch': 1.91} {'loss': 0.5858, 'learning_rate': 1.0214588816039207e-07, 'epoch': 1.91} {'loss': 0.4562, 'learning_rate': 1.0209922452289467e-07, 'epoch': 1.91} {'loss': 0.53, 'learning_rate': 1.0205257149189296e-07, 'epoch': 1.91} {'loss': 0.5566, 'learning_rate': 1.0200592906743245e-07, 'epoch': 1.91} {'loss': 0.4936, 'learning_rate': 1.0195929724956755e-07, 'epoch': 1.91} {'loss': 0.4806, 'learning_rate': 1.019126760383471e-07, 'epoch': 1.91} {'loss': 0.5669, 'learning_rate': 1.0186606543381993e-07, 'epoch': 1.91} {'loss': 0.3806, 'learning_rate': 1.0181946543603604e-07, 'epoch': 1.91} {'loss': 0.4784, 'learning_rate': 1.0177287604504649e-07, 'epoch': 1.91} {'loss': 0.5689, 'learning_rate': 1.0172629726090122e-07, 'epoch': 1.91} {'loss': 0.4751, 'learning_rate': 1.0167972908364799e-07, 'epoch': 1.91} {'loss': 0.6089, 'learning_rate': 1.0163317151334006e-07, 'epoch': 1.91} {'loss': 0.451, 'learning_rate': 1.0158662455002522e-07, 'epoch': 1.91} {'loss': 0.5866, 'learning_rate': 1.0154008819375338e-07, 'epoch': 1.91} {'loss': 0.5571, 'learning_rate': 1.0149356244457453e-07, 'epoch': 1.91} {'loss': 0.4115, 'learning_rate': 1.0144704730253863e-07, 'epoch': 1.91} {'loss': 0.4532, 'learning_rate': 1.0140054276769673e-07, 'epoch': 1.91} {'loss': 0.5406, 'learning_rate': 1.0135404884009548e-07, 'epoch': 1.91} {'loss': 0.4224, 'learning_rate': 1.0130756551978815e-07, 'epoch': 1.91} {'loss': 0.5817, 'learning_rate': 1.0126109280682362e-07, 'epoch': 1.91} {'loss': 0.5812, 'learning_rate': 1.0121463070125071e-07, 'epoch': 1.91} {'loss': 0.5114, 'learning_rate': 1.0116817920311938e-07, 'epoch': 1.91} {'loss': 0.6115, 'learning_rate': 1.0112173831247963e-07, 'epoch': 1.91} {'loss': 0.442, 'learning_rate': 1.0107530802938248e-07, 'epoch': 1.91} {'loss': 0.4927, 'learning_rate': 1.010288883538757e-07, 'epoch': 1.91} {'loss': 0.6394, 'learning_rate': 1.0098247928601035e-07, 'epoch': 1.91} {'loss': 0.3887, 'learning_rate': 1.0093608082583528e-07, 'epoch': 1.91} {'loss': 0.5036, 'learning_rate': 1.0088969297340045e-07, 'epoch': 1.91} {'loss': 0.5487, 'learning_rate': 1.0084331572875694e-07, 'epoch': 1.91} {'loss': 0.3537, 'learning_rate': 1.0079694909195137e-07, 'epoch': 1.91} {'loss': 0.4796, 'learning_rate': 1.0075059306303703e-07, 'epoch': 1.91} {'loss': 0.5659, 'learning_rate': 1.0070424764206055e-07, 'epoch': 1.91} {'loss': 0.465, 'learning_rate': 1.0065791282907411e-07, 'epoch': 1.91} {'loss': 0.6401, 'learning_rate': 1.0061158862412657e-07, 'epoch': 1.91} {'loss': 0.4228, 'learning_rate': 1.0056527502726565e-07, 'epoch': 1.91} {'loss': 0.4465, 'learning_rate': 1.0051897203854355e-07, 'epoch': 1.91} {'loss': 0.3833, 'learning_rate': 1.00472679658008e-07, 'epoch': 1.91} {'loss': 0.587, 'learning_rate': 1.0042639788571118e-07, 'epoch': 1.91} {'loss': 0.5557, 'learning_rate': 1.0038012672169862e-07, 'epoch': 1.91} {'loss': 0.5115, 'learning_rate': 1.0033386616602359e-07, 'epoch': 1.91} {'loss': 0.4521, 'learning_rate': 1.0028761621873496e-07, 'epoch': 1.91} {'loss': 0.6627, 'learning_rate': 1.0024137687988045e-07, 'epoch': 1.91} {'loss': 0.4916, 'learning_rate': 1.0019514814951115e-07, 'epoch': 1.91} {'loss': 0.4272, 'learning_rate': 1.0014893002767589e-07, 'epoch': 1.91} {'loss': 0.549, 'learning_rate': 1.0010272251442577e-07, 'epoch': 1.91} {'loss': 0.4195, 'learning_rate': 1.000565256098085e-07, 'epoch': 1.91} {'loss': 0.3957, 'learning_rate': 1.0001033931387405e-07, 'epoch': 1.91} {'loss': 0.5194, 'learning_rate': 9.996416362667127e-08, 'epoch': 1.91} {'loss': 0.6005, 'learning_rate': 9.991799854825123e-08, 'epoch': 1.91} {'loss': 0.5004, 'learning_rate': 9.98718440786628e-08, 'epoch': 1.91} {'loss': 0.4665, 'learning_rate': 9.982570021795479e-08, 'epoch': 1.91} {'loss': 0.4727, 'learning_rate': 9.97795669661783e-08, 'epoch': 1.91} {'loss': 0.4652, 'learning_rate': 9.973344432337994e-08, 'epoch': 1.91} {'loss': 0.4393, 'learning_rate': 9.96873322896108e-08, 'epoch': 1.91} {'loss': 0.4921, 'learning_rate': 9.964123086492084e-08, 'epoch': 1.91} {'loss': 0.5837, 'learning_rate': 9.959514004935889e-08, 'epoch': 1.91} {'loss': 0.4091, 'learning_rate': 9.954905984297492e-08, 'epoch': 1.91} {'loss': 0.4364, 'learning_rate': 9.950299024581667e-08, 'epoch': 1.91} {'loss': 0.4582, 'learning_rate': 9.945693125793521e-08, 'epoch': 1.91} {'loss': 0.5218, 'learning_rate': 9.941088287937827e-08, 'epoch': 1.91} {'loss': 0.4711, 'learning_rate': 9.936484511019695e-08, 'epoch': 1.91} {'loss': 0.4206, 'learning_rate': 9.931881795044007e-08, 'epoch': 1.91} {'loss': 0.5814, 'learning_rate': 9.927280140015538e-08, 'epoch': 1.91} {'loss': 0.3802, 'learning_rate': 9.922679545939506e-08, 'epoch': 1.91} {'loss': 0.7427, 'learning_rate': 9.918080012820575e-08, 'epoch': 1.91} {'loss': 0.4589, 'learning_rate': 9.913481540663849e-08, 'epoch': 1.91} {'loss': 0.5182, 'learning_rate': 9.908884129474106e-08, 'epoch': 1.91} {'loss': 0.3849, 'learning_rate': 9.904287779256449e-08, 'epoch': 1.91} {'loss': 0.4964, 'learning_rate': 9.899692490015655e-08, 'epoch': 1.91} {'loss': 0.4928, 'learning_rate': 9.89509826175672e-08, 'epoch': 1.91} {'loss': 0.4416, 'learning_rate': 9.890505094484526e-08, 'epoch': 1.91} {'loss': 0.2451, 'learning_rate': 9.885912988204072e-08, 'epoch': 1.91} {'loss': 0.3483, 'learning_rate': 9.88132194292013e-08, 'epoch': 1.91} {'loss': 0.6523, 'learning_rate': 9.876731958637809e-08, 'epoch': 1.91} {'loss': 0.6094, 'learning_rate': 9.872143035361881e-08, 'epoch': 1.91} {'loss': 0.618, 'learning_rate': 9.867555173097343e-08, 'epoch': 1.91} {'loss': 0.5326, 'learning_rate': 9.862968371849079e-08, 'epoch': 1.91} {'loss': 0.5508, 'learning_rate': 9.858382631622087e-08, 'epoch': 1.91} {'loss': 0.5243, 'learning_rate': 9.853797952421029e-08, 'epoch': 1.91} {'loss': 0.4712, 'learning_rate': 9.849214334251123e-08, 'epoch': 1.91} {'loss': 0.5398, 'learning_rate': 9.844631777117142e-08, 'epoch': 1.91} {'loss': 0.6061, 'learning_rate': 9.840050281023972e-08, 'epoch': 1.91} {'loss': 0.6298, 'learning_rate': 9.835469845976497e-08, 'epoch': 1.91} {'loss': 0.5422, 'learning_rate': 9.830890471979826e-08, 'epoch': 1.91} {'loss': 0.5131, 'learning_rate': 9.82631215903862e-08, 'epoch': 1.91} {'loss': 0.5567, 'learning_rate': 9.821734907157876e-08, 'epoch': 1.91} {'loss': 0.6268, 'learning_rate': 9.81715871634259e-08, 'epoch': 1.91} {'loss': 0.5312, 'learning_rate': 9.812583586597536e-08, 'epoch': 1.91} {'loss': 0.4861, 'learning_rate': 9.808009517927708e-08, 'epoch': 1.91} {'loss': 0.4952, 'learning_rate': 9.803436510337994e-08, 'epoch': 1.91} {'loss': 0.4281, 'learning_rate': 9.798864563833165e-08, 'epoch': 1.91} {'loss': 0.3934, 'learning_rate': 9.794293678418331e-08, 'epoch': 1.91} {'loss': 0.4818, 'learning_rate': 9.789723854098154e-08, 'epoch': 1.91} {'loss': 0.5762, 'learning_rate': 9.78515509087774e-08, 'epoch': 1.91} {'loss': 0.4466, 'learning_rate': 9.780587388761864e-08, 'epoch': 1.91} {'loss': 0.5101, 'learning_rate': 9.776020747755521e-08, 'epoch': 1.91} {'loss': 0.528, 'learning_rate': 9.771455167863597e-08, 'epoch': 1.91} {'loss': 0.4754, 'learning_rate': 9.766890649090865e-08, 'epoch': 1.91} {'loss': 0.6566, 'learning_rate': 9.762327191442211e-08, 'epoch': 1.91} {'loss': 0.4219, 'learning_rate': 9.75776479492263e-08, 'epoch': 1.91} {'loss': 0.468, 'learning_rate': 9.753203459537008e-08, 'epoch': 1.91} {'loss': 0.6748, 'learning_rate': 9.74864318529023e-08, 'epoch': 1.91} {'loss': 0.5765, 'learning_rate': 9.744083972187179e-08, 'epoch': 1.91} {'loss': 0.4214, 'learning_rate': 9.739525820232632e-08, 'epoch': 1.91} {'loss': 0.368, 'learning_rate': 9.734968729431582e-08, 'epoch': 1.91} {'loss': 0.5113, 'learning_rate': 9.730412699788916e-08, 'epoch': 1.91} {'loss': 0.4611, 'learning_rate': 9.725857731309518e-08, 'epoch': 1.91} {'loss': 0.5918, 'learning_rate': 9.721303823998163e-08, 'epoch': 1.91} {'loss': 0.6077, 'learning_rate': 9.716750977859846e-08, 'epoch': 1.91} {'loss': 0.5019, 'learning_rate': 9.712199192899452e-08, 'epoch': 1.91} {'loss': 0.5778, 'learning_rate': 9.707648469121755e-08, 'epoch': 1.91} {'loss': 0.5875, 'learning_rate': 9.703098806531752e-08, 'epoch': 1.91} {'loss': 0.4912, 'learning_rate': 9.698550205134216e-08, 'epoch': 1.91} {'loss': 0.5948, 'learning_rate': 9.694002664934032e-08, 'epoch': 1.91} {'loss': 0.5391, 'learning_rate': 9.689456185936085e-08, 'epoch': 1.91} {'loss': 0.6219, 'learning_rate': 9.684910768145373e-08, 'epoch': 1.91} {'loss': 0.6482, 'learning_rate': 9.680366411566666e-08, 'epoch': 1.91} {'loss': 0.4856, 'learning_rate': 9.675823116204741e-08, 'epoch': 1.91} {'loss': 0.6311, 'learning_rate': 9.671280882064593e-08, 'epoch': 1.91} {'loss': 0.4974, 'learning_rate': 9.666739709150996e-08, 'epoch': 1.91} {'loss': 0.481, 'learning_rate': 9.662199597468947e-08, 'epoch': 1.91} {'loss': 0.4484, 'learning_rate': 9.657660547023218e-08, 'epoch': 1.91} {'loss': 0.599, 'learning_rate': 9.653122557818695e-08, 'epoch': 1.91} {'loss': 0.4603, 'learning_rate': 9.648585629860263e-08, 'epoch': 1.91} {'loss': 0.4746, 'learning_rate': 9.644049763152696e-08, 'epoch': 1.91} {'loss': 0.4406, 'learning_rate': 9.639514957700879e-08, 'epoch': 1.91} {'loss': 0.5403, 'learning_rate': 9.634981213509808e-08, 'epoch': 1.91} {'loss': 0.4973, 'learning_rate': 9.630448530584147e-08, 'epoch': 1.91} {'loss': 0.3065, 'learning_rate': 9.62591690892889e-08, 'epoch': 1.91} {'loss': 0.5742, 'learning_rate': 9.621386348548811e-08, 'epoch': 1.91} {'loss': 0.4379, 'learning_rate': 9.616856849448907e-08, 'epoch': 1.91} {'loss': 0.3787, 'learning_rate': 9.612328411633842e-08, 'epoch': 1.91} {'loss': 0.4803, 'learning_rate': 9.607801035108611e-08, 'epoch': 1.91} {'loss': 0.6047, 'learning_rate': 9.603274719877986e-08, 'epoch': 1.91} {'loss': 0.4452, 'learning_rate': 9.598749465946744e-08, 'epoch': 1.91} {'loss': 0.4378, 'learning_rate': 9.59422527331999e-08, 'epoch': 1.91} {'loss': 0.3886, 'learning_rate': 9.589702142002278e-08, 'epoch': 1.91} {'loss': 0.3973, 'learning_rate': 9.585180071998712e-08, 'epoch': 1.91} {'loss': 0.4906, 'learning_rate': 9.580659063313958e-08, 'epoch': 1.91} {'loss': 0.6455, 'learning_rate': 9.576139115952898e-08, 'epoch': 1.91} {'loss': 0.601, 'learning_rate': 9.571620229920531e-08, 'epoch': 1.91} {'loss': 0.4477, 'learning_rate': 9.567102405221296e-08, 'epoch': 1.91} {'loss': 0.3654, 'learning_rate': 9.562585641860522e-08, 'epoch': 1.91} {'loss': 0.4114, 'learning_rate': 9.558069939842763e-08, 'epoch': 1.91} {'loss': 0.3454, 'learning_rate': 9.553555299172901e-08, 'epoch': 1.91} {'loss': 0.3371, 'learning_rate': 9.549041719855823e-08, 'epoch': 1.91} {'loss': 0.4226, 'learning_rate': 9.544529201896302e-08, 'epoch': 1.91} {'loss': 0.4835, 'learning_rate': 9.540017745299335e-08, 'epoch': 1.91} {'loss': 0.4441, 'learning_rate': 9.535507350069472e-08, 'epoch': 1.91} {'loss': 0.5082, 'learning_rate': 9.530998016211823e-08, 'epoch': 1.91} {'loss': 0.414, 'learning_rate': 9.52648974373105e-08, 'epoch': 1.91} {'loss': 0.5129, 'learning_rate': 9.521982532632146e-08, 'epoch': 1.91} {'loss': 0.5017, 'learning_rate': 9.517476382919666e-08, 'epoch': 1.91} {'loss': 0.389, 'learning_rate': 9.512971294598717e-08, 'epoch': 1.91} {'loss': 0.4623, 'learning_rate': 9.508467267674071e-08, 'epoch': 1.91} {'loss': 0.447, 'learning_rate': 9.503964302150282e-08, 'epoch': 1.91} {'loss': 0.4821, 'learning_rate': 9.499462398032566e-08, 'epoch': 1.91} {'loss': 0.419, 'learning_rate': 9.494961555325588e-08, 'epoch': 1.91} {'loss': 0.57, 'learning_rate': 9.490461774034121e-08, 'epoch': 1.91} {'loss': 0.4602, 'learning_rate': 9.485963054162939e-08, 'epoch': 1.91} {'loss': 0.5083, 'learning_rate': 9.481465395717038e-08, 'epoch': 1.91} {'loss': 0.5132, 'learning_rate': 9.476968798701192e-08, 'epoch': 1.91} {'loss': 0.4079, 'learning_rate': 9.472473263119952e-08, 'epoch': 1.91} {'loss': 0.3901, 'learning_rate': 9.467978788978649e-08, 'epoch': 1.91} {'loss': 0.4547, 'learning_rate': 9.463485376281611e-08, 'epoch': 1.91} {'loss': 0.6028, 'learning_rate': 9.458993025033946e-08, 'epoch': 1.91} {'loss': 0.5062, 'learning_rate': 9.454501735240317e-08, 'epoch': 1.91} {'loss': 0.5324, 'learning_rate': 9.45001150690561e-08, 'epoch': 1.91} {'loss': 0.505, 'learning_rate': 9.445522340034596e-08, 'epoch': 1.91} {'loss': 0.629, 'learning_rate': 9.441034234632052e-08, 'epoch': 1.91} {'loss': 0.3617, 'learning_rate': 9.436547190702972e-08, 'epoch': 1.91} {'loss': 0.3864, 'learning_rate': 9.43206120825202e-08, 'epoch': 1.91} {'loss': 0.5802, 'learning_rate': 9.427576287283969e-08, 'epoch': 1.91} {'loss': 0.4883, 'learning_rate': 9.423092427803704e-08, 'epoch': 1.91} {'loss': 0.5089, 'learning_rate': 9.418609629815889e-08, 'epoch': 1.91} {'loss': 0.4864, 'learning_rate': 9.414127893325631e-08, 'epoch': 1.91} {'loss': 0.5473, 'learning_rate': 9.40964721833737e-08, 'epoch': 1.91} {'loss': 0.5902, 'learning_rate': 9.405167604856214e-08, 'epoch': 1.91} {'loss': 0.5236, 'learning_rate': 9.400689052886714e-08, 'epoch': 1.91} {'loss': 0.5156, 'learning_rate': 9.396211562433865e-08, 'epoch': 1.91} {'loss': 0.5597, 'learning_rate': 9.391735133502444e-08, 'epoch': 1.91} {'loss': 0.6453, 'learning_rate': 9.387259766097001e-08, 'epoch': 1.91} {'loss': 0.4072, 'learning_rate': 9.382785460222643e-08, 'epoch': 1.91} {'loss': 0.434, 'learning_rate': 9.378312215883922e-08, 'epoch': 1.91} {'loss': 0.4662, 'learning_rate': 9.373840033085946e-08, 'epoch': 1.91} {'loss': 0.4485, 'learning_rate': 9.369368911833154e-08, 'epoch': 1.91} {'loss': 0.5143, 'learning_rate': 9.364898852130544e-08, 'epoch': 1.91} {'loss': 0.5877, 'learning_rate': 9.360429853982889e-08, 'epoch': 1.91} {'loss': 0.5038, 'learning_rate': 9.355961917394852e-08, 'epoch': 1.91} {'loss': 0.2616, 'learning_rate': 9.351495042371427e-08, 'epoch': 1.91} {'loss': 0.483, 'learning_rate': 9.34702922891717e-08, 'epoch': 1.91} {'loss': 0.416, 'learning_rate': 9.342564477037075e-08, 'epoch': 1.91} {'loss': 0.5293, 'learning_rate': 9.338100786735804e-08, 'epoch': 1.91} {'loss': 0.4725, 'learning_rate': 9.333638158018132e-08, 'epoch': 1.91} {'loss': 0.5185, 'learning_rate': 9.329176590888944e-08, 'epoch': 1.91} {'loss': 0.4071, 'learning_rate': 9.324716085352903e-08, 'epoch': 1.91} {'loss': 0.5121, 'learning_rate': 9.320256641414893e-08, 'epoch': 1.91} {'loss': 0.7267, 'learning_rate': 9.315798259079579e-08, 'epoch': 1.91} {'loss': 0.4565, 'learning_rate': 9.311340938351842e-08, 'epoch': 1.91} {'loss': 0.5391, 'learning_rate': 9.30688467923635e-08, 'epoch': 1.91} {'loss': 0.521, 'learning_rate': 9.302429481738095e-08, 'epoch': 1.91} {'loss': 0.473, 'learning_rate': 9.297975345861632e-08, 'epoch': 1.91} {'loss': 0.591, 'learning_rate': 9.293522271611732e-08, 'epoch': 1.91} {'loss': 0.5409, 'learning_rate': 9.289070258993282e-08, 'epoch': 1.91} {'loss': 0.5251, 'learning_rate': 9.284619308011056e-08, 'epoch': 1.91} {'loss': 0.4939, 'learning_rate': 9.280169418669715e-08, 'epoch': 1.91} {'loss': 0.3778, 'learning_rate': 9.275720590974146e-08, 'epoch': 1.91} {'loss': 0.3464, 'learning_rate': 9.271272824929012e-08, 'epoch': 1.91} {'loss': 0.5127, 'learning_rate': 9.266826120539196e-08, 'epoch': 1.91} {'loss': 0.5949, 'learning_rate': 9.262380477809362e-08, 'epoch': 1.91} {'loss': 0.559, 'learning_rate': 9.257935896744286e-08, 'epoch': 1.91} {'loss': 0.592, 'learning_rate': 9.253492377348738e-08, 'epoch': 1.91} {'loss': 0.556, 'learning_rate': 9.249049919627606e-08, 'epoch': 1.91} {'loss': 0.4836, 'learning_rate': 9.244608523585442e-08, 'epoch': 1.91} {'loss': 0.6397, 'learning_rate': 9.240168189227016e-08, 'epoch': 1.91} {'loss': 0.5969, 'learning_rate': 9.235728916557329e-08, 'epoch': 1.91} {'loss': 0.4681, 'learning_rate': 9.231290705580931e-08, 'epoch': 1.91} {'loss': 0.4054, 'learning_rate': 9.226853556302595e-08, 'epoch': 1.91} {'loss': 0.3904, 'learning_rate': 9.222417468727097e-08, 'epoch': 1.91} {'loss': 0.557, 'learning_rate': 9.217982442859318e-08, 'epoch': 1.91} {'loss': 0.5575, 'learning_rate': 9.213548478703704e-08, 'epoch': 1.91} {'loss': 0.5353, 'learning_rate': 9.20911557626536e-08, 'epoch': 1.91} {'loss': 0.4516, 'learning_rate': 9.204683735548837e-08, 'epoch': 1.91} {'loss': 0.5227, 'learning_rate': 9.200252956558908e-08, 'epoch': 1.91} {'loss': 0.6657, 'learning_rate': 9.19582323930035e-08, 'epoch': 1.91} {'loss': 0.4943, 'learning_rate': 9.191394583777824e-08, 'epoch': 1.91} {'loss': 0.3666, 'learning_rate': 9.186966989996215e-08, 'epoch': 1.91} {'loss': 0.3998, 'learning_rate': 9.182540457960076e-08, 'epoch': 1.91} {'loss': 0.4904, 'learning_rate': 9.178114987674513e-08, 'epoch': 1.91} {'loss': 0.3806, 'learning_rate': 9.173690579143857e-08, 'epoch': 1.91} {'loss': 0.5804, 'learning_rate': 9.169267232372992e-08, 'epoch': 1.91} {'loss': 0.3994, 'learning_rate': 9.164844947366691e-08, 'epoch': 1.91} {'loss': 0.4678, 'learning_rate': 9.16042372412973e-08, 'epoch': 1.91} {'loss': 0.4401, 'learning_rate': 9.156003562666882e-08, 'epoch': 1.91} {'loss': 0.5494, 'learning_rate': 9.151584462982699e-08, 'epoch': 1.91} {'loss': 0.4231, 'learning_rate': 9.147166425082066e-08, 'epoch': 1.91} {'loss': 0.4849, 'learning_rate': 9.142749448969646e-08, 'epoch': 1.91} {'loss': 0.6274, 'learning_rate': 9.138333534650212e-08, 'epoch': 1.91} {'loss': 0.6161, 'learning_rate': 9.13391868212854e-08, 'epoch': 1.91} {'loss': 0.5007, 'learning_rate': 9.12950489140918e-08, 'epoch': 1.91} {'loss': 0.6227, 'learning_rate': 9.125092162497129e-08, 'epoch': 1.91} {'loss': 0.5565, 'learning_rate': 9.120680495396827e-08, 'epoch': 1.91} {'loss': 0.2915, 'learning_rate': 9.116269890113271e-08, 'epoch': 1.91} {'loss': 0.4135, 'learning_rate': 9.111860346651013e-08, 'epoch': 1.91} {'loss': 0.4244, 'learning_rate': 9.107451865014826e-08, 'epoch': 1.91} {'loss': 0.4885, 'learning_rate': 9.103044445209486e-08, 'epoch': 1.91} {'loss': 0.5321, 'learning_rate': 9.098638087239542e-08, 'epoch': 1.91} {'loss': 0.478, 'learning_rate': 9.094232791109992e-08, 'epoch': 1.91} {'loss': 0.4759, 'learning_rate': 9.089828556825386e-08, 'epoch': 1.91} {'loss': 0.5975, 'learning_rate': 9.08542538439039e-08, 'epoch': 1.91} {'loss': 0.5182, 'learning_rate': 9.081023273809775e-08, 'epoch': 1.91} {'loss': 0.453, 'learning_rate': 9.076622225088427e-08, 'epoch': 1.91} {'loss': 0.4634, 'learning_rate': 9.072222238230788e-08, 'epoch': 1.91} {'loss': 0.5198, 'learning_rate': 9.067823313241741e-08, 'epoch': 1.91} {'loss': 0.5365, 'learning_rate': 9.063425450125951e-08, 'epoch': 1.91} {'loss': 0.6036, 'learning_rate': 9.05902864888808e-08, 'epoch': 1.91} {'loss': 0.4881, 'learning_rate': 9.054632909533012e-08, 'epoch': 1.91} {'loss': 0.443, 'learning_rate': 9.0502382320653e-08, 'epoch': 1.91} {'loss': 0.4632, 'learning_rate': 9.045844616489608e-08, 'epoch': 1.91} {'loss': 0.5404, 'learning_rate': 9.041452062810929e-08, 'epoch': 1.91} {'loss': 0.4875, 'learning_rate': 9.037060571033484e-08, 'epoch': 1.91} {'loss': 0.5172, 'learning_rate': 9.032670141162491e-08, 'epoch': 1.91} {'loss': 0.5395, 'learning_rate': 9.028280773202392e-08, 'epoch': 1.91} {'loss': 0.512, 'learning_rate': 9.023892467157957e-08, 'epoch': 1.91} {'loss': 0.4163, 'learning_rate': 9.019505223033743e-08, 'epoch': 1.91} {'loss': 0.4834, 'learning_rate': 9.015119040834741e-08, 'epoch': 1.91} {'loss': 0.3255, 'learning_rate': 9.010733920565395e-08, 'epoch': 1.91} {'loss': 0.6457, 'learning_rate': 9.006349862230368e-08, 'epoch': 1.91} {'loss': 0.5173, 'learning_rate': 9.001966865834655e-08, 'epoch': 1.91} {'loss': 0.4639, 'learning_rate': 8.997584931382697e-08, 'epoch': 1.91} {'loss': 0.4718, 'learning_rate': 8.993204058879379e-08, 'epoch': 1.91} {'loss': 0.3387, 'learning_rate': 8.988824248329142e-08, 'epoch': 1.91} {'loss': 0.4949, 'learning_rate': 8.984445499736871e-08, 'epoch': 1.91} {'loss': 0.4879, 'learning_rate': 8.98006781310723e-08, 'epoch': 1.91} {'loss': 0.5011, 'learning_rate': 8.97569118844488e-08, 'epoch': 1.91} {'loss': 0.5149, 'learning_rate': 8.971315625754595e-08, 'epoch': 1.91} {'loss': 0.4041, 'learning_rate': 8.966941125040929e-08, 'epoch': 1.91} {'loss': 0.4143, 'learning_rate': 8.962567686308543e-08, 'epoch': 1.91} {'loss': 0.5143, 'learning_rate': 8.958195309562323e-08, 'epoch': 1.91} {'loss': 0.3881, 'learning_rate': 8.953823994806821e-08, 'epoch': 1.92} {'loss': 0.4087, 'learning_rate': 8.949453742046809e-08, 'epoch': 1.92} {'loss': 0.5614, 'learning_rate': 8.945084551286731e-08, 'epoch': 1.92} {'loss': 0.4694, 'learning_rate': 8.940716422531581e-08, 'epoch': 1.92} {'loss': 0.5483, 'learning_rate': 8.936349355785912e-08, 'epoch': 1.92} {'loss': 0.5973, 'learning_rate': 8.931983351054274e-08, 'epoch': 1.92} {'loss': 0.5778, 'learning_rate': 8.927618408341666e-08, 'epoch': 1.92} {'loss': 0.4995, 'learning_rate': 8.923254527652303e-08, 'epoch': 1.92} {'loss': 0.5715, 'learning_rate': 8.918891708991295e-08, 'epoch': 1.92} {'loss': 0.4706, 'learning_rate': 8.914529952363083e-08, 'epoch': 1.92} {'loss': 0.6271, 'learning_rate': 8.910169257772439e-08, 'epoch': 1.92} {'loss': 0.4494, 'learning_rate': 8.905809625224026e-08, 'epoch': 1.92} {'loss': 0.5582, 'learning_rate': 8.901451054722398e-08, 'epoch': 1.92} {'loss': 0.4515, 'learning_rate': 8.89709354627244e-08, 'epoch': 1.92} {'loss': 0.467, 'learning_rate': 8.89273709987859e-08, 'epoch': 1.92} {'loss': 0.5145, 'learning_rate': 8.888381715545735e-08, 'epoch': 1.92} {'loss': 0.5567, 'learning_rate': 8.884027393278317e-08, 'epoch': 1.92} {'loss': 0.6095, 'learning_rate': 8.879674133081217e-08, 'epoch': 1.92} {'loss': 0.4781, 'learning_rate': 8.87532193495888e-08, 'epoch': 1.92} {'loss': 0.3912, 'learning_rate': 8.87097079891619e-08, 'epoch': 1.92} {'loss': 0.4324, 'learning_rate': 8.866620724957698e-08, 'epoch': 1.92} {'loss': 0.5162, 'learning_rate': 8.862271713087955e-08, 'epoch': 1.92} {'loss': 0.6061, 'learning_rate': 8.85792376331196e-08, 'epoch': 1.92} {'loss': 0.5815, 'learning_rate': 8.853576875633929e-08, 'epoch': 1.92} {'loss': 0.5295, 'learning_rate': 8.84923105005897e-08, 'epoch': 1.92} {'loss': 0.5762, 'learning_rate': 8.844886286591415e-08, 'epoch': 1.92} {'loss': 0.5919, 'learning_rate': 8.840542585235923e-08, 'epoch': 1.92} {'loss': 0.6048, 'learning_rate': 8.836199945997381e-08, 'epoch': 1.92} {'loss': 0.3588, 'learning_rate': 8.83185836888023e-08, 'epoch': 1.92} {'loss': 0.5324, 'learning_rate': 8.827517853889356e-08, 'epoch': 1.92} {'loss': 0.4956, 'learning_rate': 8.823178401029087e-08, 'epoch': 1.92} {'loss': 0.5754, 'learning_rate': 8.818840010304308e-08, 'epoch': 1.92} {'loss': 0.623, 'learning_rate': 8.814502681719572e-08, 'epoch': 1.92} {'loss': 0.4588, 'learning_rate': 8.810166415279542e-08, 'epoch': 1.92} {'loss': 0.5319, 'learning_rate': 8.805831210988991e-08, 'epoch': 1.92} {'loss': 0.5358, 'learning_rate': 8.801497068852249e-08, 'epoch': 1.92} {'loss': 0.5619, 'learning_rate': 8.797163988874313e-08, 'epoch': 1.92} {'loss': 0.5838, 'learning_rate': 8.792831971059624e-08, 'epoch': 1.92} {'loss': 0.4837, 'learning_rate': 8.788501015412954e-08, 'epoch': 1.92} {'loss': 0.5704, 'learning_rate': 8.784171121938745e-08, 'epoch': 1.92} {'loss': 0.4023, 'learning_rate': 8.779842290641882e-08, 'epoch': 1.92} {'loss': 0.5436, 'learning_rate': 8.775514521526918e-08, 'epoch': 1.92} {'loss': 0.4849, 'learning_rate': 8.771187814598292e-08, 'epoch': 1.92} {'loss': 0.542, 'learning_rate': 8.76686216986089e-08, 'epoch': 1.92} {'loss': 0.5955, 'learning_rate': 8.762537587319264e-08, 'epoch': 1.92} {'loss': 0.6079, 'learning_rate': 8.758214066977966e-08, 'epoch': 1.92} {'loss': 0.2639, 'learning_rate': 8.753891608841769e-08, 'epoch': 1.92} {'loss': 0.5474, 'learning_rate': 8.749570212915226e-08, 'epoch': 1.92} {'loss': 0.6945, 'learning_rate': 8.745249879202999e-08, 'epoch': 1.92} {'loss': 0.4506, 'learning_rate': 8.740930607709752e-08, 'epoch': 1.92} {'loss': 0.6026, 'learning_rate': 8.736612398440037e-08, 'epoch': 1.92} {'loss': 0.4287, 'learning_rate': 8.732295251398404e-08, 'epoch': 1.92} {'loss': 0.4325, 'learning_rate': 8.72797916658974e-08, 'epoch': 1.92} {'loss': 0.5074, 'learning_rate': 8.723664144018485e-08, 'epoch': 1.92} {'loss': 0.6006, 'learning_rate': 8.719350183689191e-08, 'epoch': 1.92} {'loss': 0.5559, 'learning_rate': 8.715037285606631e-08, 'epoch': 1.92} {'loss': 0.5458, 'learning_rate': 8.710725449775359e-08, 'epoch': 1.92} {'loss': 0.3852, 'learning_rate': 8.706414676200037e-08, 'epoch': 1.92} {'loss': 0.3923, 'learning_rate': 8.702104964885216e-08, 'epoch': 1.92} {'loss': 0.5657, 'learning_rate': 8.697796315835671e-08, 'epoch': 1.92} {'loss': 0.5023, 'learning_rate': 8.693488729055843e-08, 'epoch': 1.92} {'loss': 0.5233, 'learning_rate': 8.689182204550394e-08, 'epoch': 1.92} {'loss': 0.3736, 'learning_rate': 8.684876742323989e-08, 'epoch': 1.92} {'loss': 0.4806, 'learning_rate': 8.680572342381177e-08, 'epoch': 1.92} {'loss': 0.5842, 'learning_rate': 8.676269004726623e-08, 'epoch': 1.92} {'loss': 0.6432, 'learning_rate': 8.671966729364989e-08, 'epoch': 1.92} {'loss': 0.463, 'learning_rate': 8.667665516300716e-08, 'epoch': 1.92} {'loss': 0.4192, 'learning_rate': 8.663365365538578e-08, 'epoch': 1.92} {'loss': 0.5555, 'learning_rate': 8.659066277083128e-08, 'epoch': 1.92} {'loss': 0.7079, 'learning_rate': 8.654768250938805e-08, 'epoch': 1.92} {'loss': 0.6257, 'learning_rate': 8.650471287110496e-08, 'epoch': 1.92} {'loss': 0.6289, 'learning_rate': 8.646175385602751e-08, 'epoch': 1.92} {'loss': 0.3829, 'learning_rate': 8.641880546420012e-08, 'epoch': 1.92} {'loss': 0.5358, 'learning_rate': 8.637586769566942e-08, 'epoch': 1.92} {'loss': 0.5012, 'learning_rate': 8.633294055048313e-08, 'epoch': 1.92} {'loss': 0.5215, 'learning_rate': 8.629002402868458e-08, 'epoch': 1.92} {'loss': 0.4701, 'learning_rate': 8.62471181303215e-08, 'epoch': 1.92} {'loss': 0.5557, 'learning_rate': 8.620422285543827e-08, 'epoch': 1.92} {'loss': 0.4535, 'learning_rate': 8.616133820408378e-08, 'epoch': 1.92} {'loss': 0.3938, 'learning_rate': 8.611846417630132e-08, 'epoch': 1.92} {'loss': 0.4971, 'learning_rate': 8.60756007721375e-08, 'epoch': 1.92} {'loss': 0.5026, 'learning_rate': 8.603274799163896e-08, 'epoch': 1.92} {'loss': 0.4728, 'learning_rate': 8.598990583485123e-08, 'epoch': 1.92} {'loss': 0.3223, 'learning_rate': 8.594707430181981e-08, 'epoch': 1.92} {'loss': 0.4671, 'learning_rate': 8.590425339259023e-08, 'epoch': 1.92} {'loss': 0.4611, 'learning_rate': 8.586144310721023e-08, 'epoch': 1.92} {'loss': 0.5836, 'learning_rate': 8.581864344572311e-08, 'epoch': 1.92} {'loss': 0.3496, 'learning_rate': 8.57758544081777e-08, 'epoch': 1.92} {'loss': 0.5425, 'learning_rate': 8.573307599461733e-08, 'epoch': 1.92} {'loss': 0.4543, 'learning_rate': 8.569030820508972e-08, 'epoch': 1.92} {'loss': 0.5738, 'learning_rate': 8.564755103963929e-08, 'epoch': 1.92} {'loss': 0.5905, 'learning_rate': 8.560480449831154e-08, 'epoch': 1.92} {'loss': 0.5251, 'learning_rate': 8.556206858115312e-08, 'epoch': 1.92} {'loss': 0.658, 'learning_rate': 8.551934328821065e-08, 'epoch': 1.92} {'loss': 0.5488, 'learning_rate': 8.547662861952966e-08, 'epoch': 1.92} {'loss': 0.4591, 'learning_rate': 8.543392457515342e-08, 'epoch': 1.92} {'loss': 0.6308, 'learning_rate': 8.539123115513082e-08, 'epoch': 1.92} {'loss': 0.6321, 'learning_rate': 8.534854835950623e-08, 'epoch': 1.92} {'loss': 0.4974, 'learning_rate': 8.53058761883252e-08, 'epoch': 1.92} {'loss': 0.6062, 'learning_rate': 8.526321464163322e-08, 'epoch': 1.92} {'loss': 0.6396, 'learning_rate': 8.522056371947807e-08, 'epoch': 1.92} {'loss': 0.5917, 'learning_rate': 8.5177923421903e-08, 'epoch': 1.92} {'loss': 0.4189, 'learning_rate': 8.513529374895469e-08, 'epoch': 1.92} {'loss': 0.5151, 'learning_rate': 8.509267470067861e-08, 'epoch': 1.92} {'loss': 0.5794, 'learning_rate': 8.505006627712143e-08, 'epoch': 1.92} {'loss': 0.4853, 'learning_rate': 8.500746847832753e-08, 'epoch': 1.92} {'loss': 0.5279, 'learning_rate': 8.496488130434356e-08, 'epoch': 1.92} {'loss': 0.5555, 'learning_rate': 8.492230475521279e-08, 'epoch': 1.92} {'loss': 0.5461, 'learning_rate': 8.48797388309841e-08, 'epoch': 1.92} {'loss': 0.52, 'learning_rate': 8.48371835317019e-08, 'epoch': 1.92} {'loss': 0.6069, 'learning_rate': 8.479463885741057e-08, 'epoch': 1.92} {'loss': 0.4172, 'learning_rate': 8.475210480815677e-08, 'epoch': 1.92} {'loss': 0.5191, 'learning_rate': 8.470958138398711e-08, 'epoch': 1.92} {'loss': 0.505, 'learning_rate': 8.466706858494599e-08, 'epoch': 1.92} {'loss': 0.5129, 'learning_rate': 8.462456641107674e-08, 'epoch': 1.92} {'loss': 0.6245, 'learning_rate': 8.45820748624293e-08, 'epoch': 1.92} {'loss': 0.6267, 'learning_rate': 8.453959393904698e-08, 'epoch': 1.92} {'loss': 0.4211, 'learning_rate': 8.449712364097528e-08, 'epoch': 1.92} {'loss': 0.3936, 'learning_rate': 8.445466396825974e-08, 'epoch': 1.92} {'loss': 0.6132, 'learning_rate': 8.441221492094476e-08, 'epoch': 1.92} {'loss': 0.4552, 'learning_rate': 8.436977649907919e-08, 'epoch': 1.92} {'loss': 0.4984, 'learning_rate': 8.43273487027052e-08, 'epoch': 1.92} {'loss': 0.4761, 'learning_rate': 8.428493153186945e-08, 'epoch': 1.92} {'loss': 0.4738, 'learning_rate': 8.424252498661744e-08, 'epoch': 1.92} {'loss': 0.4847, 'learning_rate': 8.42001290669936e-08, 'epoch': 1.92} {'loss': 0.5269, 'learning_rate': 8.415774377304564e-08, 'epoch': 1.92} {'loss': 0.4746, 'learning_rate': 8.411536910481688e-08, 'epoch': 1.92} {'loss': 0.4933, 'learning_rate': 8.407300506235394e-08, 'epoch': 1.92} {'loss': 0.4635, 'learning_rate': 8.403065164570123e-08, 'epoch': 1.92} {'loss': 0.335, 'learning_rate': 8.39883088549054e-08, 'epoch': 1.92} {'loss': 0.432, 'learning_rate': 8.39459766900097e-08, 'epoch': 1.92} {'loss': 0.5912, 'learning_rate': 8.390365515106191e-08, 'epoch': 1.92} {'loss': 0.5261, 'learning_rate': 8.386134423810643e-08, 'epoch': 1.92} {'loss': 0.4745, 'learning_rate': 8.381904395118767e-08, 'epoch': 1.92} {'loss': 0.5732, 'learning_rate': 8.377675429035337e-08, 'epoch': 1.92} {'loss': 0.5173, 'learning_rate': 8.37344752556457e-08, 'epoch': 1.92} {'loss': 0.5191, 'learning_rate': 8.369220684711243e-08, 'epoch': 1.92} {'loss': 0.4232, 'learning_rate': 8.364994906479795e-08, 'epoch': 1.92} {'loss': 0.384, 'learning_rate': 8.360770190874667e-08, 'epoch': 1.92} {'loss': 0.4484, 'learning_rate': 8.356546537900522e-08, 'epoch': 1.92} {'loss': 0.4163, 'learning_rate': 8.352323947561802e-08, 'epoch': 1.92} {'loss': 0.5905, 'learning_rate': 8.348102419863169e-08, 'epoch': 1.92} {'loss': 0.422, 'learning_rate': 8.343881954809063e-08, 'epoch': 1.92} {'loss': 0.4576, 'learning_rate': 8.339662552403815e-08, 'epoch': 1.92} {'loss': 0.3985, 'learning_rate': 8.33544421265231e-08, 'epoch': 1.92} {'loss': 0.441, 'learning_rate': 8.331226935558767e-08, 'epoch': 1.92} {'loss': 0.349, 'learning_rate': 8.327010721127848e-08, 'epoch': 1.92} {'loss': 0.4802, 'learning_rate': 8.322795569363994e-08, 'epoch': 1.92} {'loss': 0.613, 'learning_rate': 8.31858148027187e-08, 'epoch': 1.92} {'loss': 0.4034, 'learning_rate': 8.314368453855804e-08, 'epoch': 1.92} {'loss': 0.4742, 'learning_rate': 8.310156490120457e-08, 'epoch': 1.92} {'loss': 0.4711, 'learning_rate': 8.305945589070275e-08, 'epoch': 1.92} {'loss': 0.4817, 'learning_rate': 8.301735750709694e-08, 'epoch': 1.92} {'loss': 0.5331, 'learning_rate': 8.29752697504338e-08, 'epoch': 1.92} {'loss': 0.3608, 'learning_rate': 8.293319262075772e-08, 'epoch': 1.92} {'loss': 0.6135, 'learning_rate': 8.289112611811422e-08, 'epoch': 1.92} {'loss': 0.5229, 'learning_rate': 8.284907024254662e-08, 'epoch': 1.92} {'loss': 0.4907, 'learning_rate': 8.280702499410265e-08, 'epoch': 1.92} {'loss': 0.4502, 'learning_rate': 8.276499037282559e-08, 'epoch': 1.92} {'loss': 0.4064, 'learning_rate': 8.272296637876099e-08, 'epoch': 1.92} {'loss': 0.5905, 'learning_rate': 8.268095301195433e-08, 'epoch': 1.92} {'loss': 0.3462, 'learning_rate': 8.263895027244784e-08, 'epoch': 1.92} {'loss': 0.4952, 'learning_rate': 8.259695816029146e-08, 'epoch': 1.92} {'loss': 0.5463, 'learning_rate': 8.255497667552625e-08, 'epoch': 1.92} {'loss': 0.533, 'learning_rate': 8.251300581819887e-08, 'epoch': 1.92} {'loss': 0.4398, 'learning_rate': 8.247104558835483e-08, 'epoch': 1.92} {'loss': 0.4704, 'learning_rate': 8.242909598603632e-08, 'epoch': 1.92} {'loss': 0.6001, 'learning_rate': 8.238715701129108e-08, 'epoch': 1.92} {'loss': 0.3427, 'learning_rate': 8.234522866416239e-08, 'epoch': 1.92} {'loss': 0.6161, 'learning_rate': 8.23033109446969e-08, 'epoch': 1.92} {'loss': 0.5802, 'learning_rate': 8.226140385293902e-08, 'epoch': 1.92} {'loss': 0.5329, 'learning_rate': 8.221950738893203e-08, 'epoch': 1.92} {'loss': 0.5407, 'learning_rate': 8.217762155272257e-08, 'epoch': 1.92} {'loss': 0.5219, 'learning_rate': 8.213574634435395e-08, 'epoch': 1.92} {'loss': 0.368, 'learning_rate': 8.20938817638739e-08, 'epoch': 1.92} {'loss': 0.3305, 'learning_rate': 8.205202781132349e-08, 'epoch': 1.92} {'loss': 0.3568, 'learning_rate': 8.201018448675047e-08, 'epoch': 1.92} {'loss': 0.5298, 'learning_rate': 8.196835179019813e-08, 'epoch': 1.92} {'loss': 0.4666, 'learning_rate': 8.1926529721712e-08, 'epoch': 1.92} {'loss': 0.4188, 'learning_rate': 8.188471828133759e-08, 'epoch': 1.92} {'loss': 0.6349, 'learning_rate': 8.184291746911822e-08, 'epoch': 1.92} {'loss': 0.6708, 'learning_rate': 8.180112728509937e-08, 'epoch': 1.92} {'loss': 0.619, 'learning_rate': 8.175934772932548e-08, 'epoch': 1.92} {'loss': 0.565, 'learning_rate': 8.171757880184205e-08, 'epoch': 1.92} {'loss': 0.5461, 'learning_rate': 8.167582050269352e-08, 'epoch': 1.92} {'loss': 0.5608, 'learning_rate': 8.163407283192426e-08, 'epoch': 1.92} {'loss': 0.6218, 'learning_rate': 8.159233578957982e-08, 'epoch': 1.92} {'loss': 0.642, 'learning_rate': 8.155060937570236e-08, 'epoch': 1.92} {'loss': 0.5683, 'learning_rate': 8.150889359034075e-08, 'epoch': 1.92} {'loss': 0.4285, 'learning_rate': 8.146718843353718e-08, 'epoch': 1.92} {'loss': 0.5852, 'learning_rate': 8.142549390533606e-08, 'epoch': 1.92} {'loss': 0.5972, 'learning_rate': 8.138381000578289e-08, 'epoch': 1.92} {'loss': 0.5904, 'learning_rate': 8.134213673492319e-08, 'epoch': 1.92} {'loss': 0.428, 'learning_rate': 8.130047409280029e-08, 'epoch': 1.92} {'loss': 0.444, 'learning_rate': 8.125882207945856e-08, 'epoch': 1.92} {'loss': 0.5919, 'learning_rate': 8.121718069494245e-08, 'epoch': 1.92} {'loss': 0.5608, 'learning_rate': 8.117554993929854e-08, 'epoch': 1.92} {'loss': 0.5116, 'learning_rate': 8.113392981257018e-08, 'epoch': 1.92} {'loss': 0.4606, 'learning_rate': 8.109232031480175e-08, 'epoch': 1.92} {'loss': 0.3826, 'learning_rate': 8.105072144603765e-08, 'epoch': 1.92} {'loss': 0.5752, 'learning_rate': 8.100913320632453e-08, 'epoch': 1.92} {'loss': 0.6548, 'learning_rate': 8.096755559570457e-08, 'epoch': 1.92} {'loss': 0.3841, 'learning_rate': 8.092598861422219e-08, 'epoch': 1.92} {'loss': 0.4433, 'learning_rate': 8.088443226192399e-08, 'epoch': 1.92} {'loss': 0.5455, 'learning_rate': 8.08428865388533e-08, 'epoch': 1.92} {'loss': 0.482, 'learning_rate': 8.080135144505341e-08, 'epoch': 1.92} {'loss': 0.6164, 'learning_rate': 8.075982698057205e-08, 'epoch': 1.92} {'loss': 0.47, 'learning_rate': 8.07183131454503e-08, 'epoch': 1.92} {'loss': 0.5373, 'learning_rate': 8.067680993973481e-08, 'epoch': 1.92} {'loss': 0.3928, 'learning_rate': 8.063531736346997e-08, 'epoch': 1.92} {'loss': 0.5053, 'learning_rate': 8.059383541669907e-08, 'epoch': 1.92} {'loss': 0.2602, 'learning_rate': 8.055236409946654e-08, 'epoch': 1.92} {'loss': 0.5167, 'learning_rate': 8.051090341181899e-08, 'epoch': 1.92} {'loss': 0.5235, 'learning_rate': 8.046945335379752e-08, 'epoch': 1.92} {'loss': 0.568, 'learning_rate': 8.042801392544875e-08, 'epoch': 1.92} {'loss': 0.3812, 'learning_rate': 8.038658512681708e-08, 'epoch': 1.92} {'loss': 0.54, 'learning_rate': 8.034516695794692e-08, 'epoch': 1.92} {'loss': 0.5419, 'learning_rate': 8.030375941888158e-08, 'epoch': 1.92} {'loss': 0.4613, 'learning_rate': 8.026236250966547e-08, 'epoch': 1.92} {'loss': 0.4152, 'learning_rate': 8.022097623034519e-08, 'epoch': 1.92} {'loss': 0.4566, 'learning_rate': 8.017960058096297e-08, 'epoch': 1.92} {'loss': 0.5245, 'learning_rate': 8.01382355615632e-08, 'epoch': 1.92} {'loss': 0.4673, 'learning_rate': 8.009688117219028e-08, 'epoch': 1.92} {'loss': 0.3156, 'learning_rate': 8.005553741288863e-08, 'epoch': 1.92} {'loss': 0.5182, 'learning_rate': 8.001420428370376e-08, 'epoch': 1.92} {'loss': 0.3876, 'learning_rate': 7.997288178467899e-08, 'epoch': 1.92} {'loss': 0.5707, 'learning_rate': 7.99315699158587e-08, 'epoch': 1.92} {'loss': 0.4053, 'learning_rate': 7.989026867728622e-08, 'epoch': 1.92} {'loss': 0.5073, 'learning_rate': 7.984897806900705e-08, 'epoch': 1.92} {'loss': 0.454, 'learning_rate': 7.980769809106448e-08, 'epoch': 1.92} {'loss': 0.5709, 'learning_rate': 7.976642874350405e-08, 'epoch': 1.92} {'loss': 0.595, 'learning_rate': 7.972517002636904e-08, 'epoch': 1.92} {'loss': 0.461, 'learning_rate': 7.968392193970497e-08, 'epoch': 1.92} {'loss': 0.3998, 'learning_rate': 7.964268448355406e-08, 'epoch': 1.92} {'loss': 0.5147, 'learning_rate': 7.960145765796068e-08, 'epoch': 1.92} {'loss': 0.4029, 'learning_rate': 7.956024146297036e-08, 'epoch': 1.92} {'loss': 0.4605, 'learning_rate': 7.951903589862642e-08, 'epoch': 1.92} {'loss': 0.4981, 'learning_rate': 7.947784096497324e-08, 'epoch': 1.92} {'loss': 0.3603, 'learning_rate': 7.943665666205524e-08, 'epoch': 1.92} {'loss': 0.4672, 'learning_rate': 7.939548298991572e-08, 'epoch': 1.92} {'loss': 0.5401, 'learning_rate': 7.935431994860021e-08, 'epoch': 1.92} {'loss': 0.5864, 'learning_rate': 7.931316753815088e-08, 'epoch': 1.92} {'loss': 0.4722, 'learning_rate': 7.927202575861326e-08, 'epoch': 1.92} {'loss': 0.5445, 'learning_rate': 7.923089461003175e-08, 'epoch': 1.92} {'loss': 0.4918, 'learning_rate': 7.918977409244966e-08, 'epoch': 1.92} {'loss': 0.6259, 'learning_rate': 7.914866420591027e-08, 'epoch': 1.92} {'loss': 0.5553, 'learning_rate': 7.910756495045913e-08, 'epoch': 1.92} {'loss': 0.4102, 'learning_rate': 7.906647632613951e-08, 'epoch': 1.92} {'loss': 0.5155, 'learning_rate': 7.902539833299472e-08, 'epoch': 1.92} {'loss': 0.6283, 'learning_rate': 7.898433097107028e-08, 'epoch': 1.92} {'loss': 0.4826, 'learning_rate': 7.894327424040948e-08, 'epoch': 1.92} {'loss': 0.5001, 'learning_rate': 7.890222814105786e-08, 'epoch': 1.92} {'loss': 0.413, 'learning_rate': 7.886119267305536e-08, 'epoch': 1.92} {'loss': 0.5147, 'learning_rate': 7.882016783645086e-08, 'epoch': 1.92} {'loss': 0.5119, 'learning_rate': 7.87791536312843e-08, 'epoch': 1.92} {'loss': 0.5577, 'learning_rate': 7.873815005760233e-08, 'epoch': 1.92} {'loss': 0.5307, 'learning_rate': 7.869715711544712e-08, 'epoch': 1.92} {'loss': 0.3583, 'learning_rate': 7.86561748048642e-08, 'epoch': 1.92} {'loss': 0.5301, 'learning_rate': 7.861520312589688e-08, 'epoch': 1.92} {'loss': 0.4276, 'learning_rate': 7.857424207858732e-08, 'epoch': 1.92} {'loss': 0.7062, 'learning_rate': 7.853329166298218e-08, 'epoch': 1.92} {'loss': 0.4767, 'learning_rate': 7.849235187912363e-08, 'epoch': 1.92} {'loss': 0.491, 'learning_rate': 7.845142272705608e-08, 'epoch': 1.92} {'loss': 0.5532, 'learning_rate': 7.841050420682394e-08, 'epoch': 1.92} {'loss': 0.6301, 'learning_rate': 7.83695963184683e-08, 'epoch': 1.92} {'loss': 0.4524, 'learning_rate': 7.8328699062038e-08, 'epoch': 1.92} {'loss': 0.5909, 'learning_rate': 7.828781243757189e-08, 'epoch': 1.92} {'loss': 0.5429, 'learning_rate': 7.82469364451166e-08, 'epoch': 1.92} {'loss': 0.4229, 'learning_rate': 7.820607108471546e-08, 'epoch': 1.92} {'loss': 0.4982, 'learning_rate': 7.816521635641172e-08, 'epoch': 1.92} {'loss': 0.3644, 'learning_rate': 7.812437226024982e-08, 'epoch': 1.92} {'loss': 0.3896, 'learning_rate': 7.808353879627195e-08, 'epoch': 1.92} {'loss': 0.3643, 'learning_rate': 7.804271596452473e-08, 'epoch': 1.92} {'loss': 0.7224, 'learning_rate': 7.800190376504813e-08, 'epoch': 1.92} {'loss': 0.413, 'learning_rate': 7.796110219788988e-08, 'epoch': 1.92} {'loss': 0.4319, 'learning_rate': 7.792031126309107e-08, 'epoch': 1.92} {'loss': 0.6056, 'learning_rate': 7.787953096069611e-08, 'epoch': 1.92} {'loss': 0.4152, 'learning_rate': 7.783876129075052e-08, 'epoch': 1.92} {'loss': 0.4831, 'learning_rate': 7.779800225329315e-08, 'epoch': 1.92} {'loss': 0.4576, 'learning_rate': 7.775725384837285e-08, 'epoch': 1.92} {'loss': 0.5031, 'learning_rate': 7.771651607603071e-08, 'epoch': 1.92} {'loss': 0.4191, 'learning_rate': 7.767578893631112e-08, 'epoch': 1.92} {'loss': 0.6993, 'learning_rate': 7.763507242925739e-08, 'epoch': 1.92} {'loss': 0.6678, 'learning_rate': 7.759436655491282e-08, 'epoch': 1.92} {'loss': 0.4467, 'learning_rate': 7.755367131332181e-08, 'epoch': 1.92} {'loss': 0.4936, 'learning_rate': 7.751298670452657e-08, 'epoch': 1.92} {'loss': 0.4588, 'learning_rate': 7.74723127285737e-08, 'epoch': 1.92} {'loss': 0.474, 'learning_rate': 7.743164938550318e-08, 'epoch': 1.92} {'loss': 0.3791, 'learning_rate': 7.739099667536054e-08, 'epoch': 1.92} {'loss': 0.5767, 'learning_rate': 7.735035459818907e-08, 'epoch': 1.92} {'loss': 0.4412, 'learning_rate': 7.730972315403206e-08, 'epoch': 1.92} {'loss': 0.5159, 'learning_rate': 7.726910234293505e-08, 'epoch': 1.92} {'loss': 0.4141, 'learning_rate': 7.722849216493688e-08, 'epoch': 1.92} {'loss': 0.5516, 'learning_rate': 7.718789262008641e-08, 'epoch': 1.92} {'loss': 0.6348, 'learning_rate': 7.71473037084236e-08, 'epoch': 1.92} {'loss': 0.4434, 'learning_rate': 7.710672542999287e-08, 'epoch': 1.92} {'loss': 0.4069, 'learning_rate': 7.706615778483861e-08, 'epoch': 1.92} {'loss': 0.3666, 'learning_rate': 7.702560077300303e-08, 'epoch': 1.92} {'loss': 0.4178, 'learning_rate': 7.698505439453052e-08, 'epoch': 1.92} {'loss': 0.5359, 'learning_rate': 7.694451864946328e-08, 'epoch': 1.92} {'loss': 0.5298, 'learning_rate': 7.690399353784572e-08, 'epoch': 1.92} {'loss': 0.7173, 'learning_rate': 7.686347905972225e-08, 'epoch': 1.92} {'loss': 0.5932, 'learning_rate': 7.682297521513393e-08, 'epoch': 1.92} {'loss': 0.443, 'learning_rate': 7.67824820041263e-08, 'epoch': 1.92} {'loss': 0.4034, 'learning_rate': 7.674199942674155e-08, 'epoch': 1.92} {'loss': 0.4994, 'learning_rate': 7.670152748302406e-08, 'epoch': 1.92} {'loss': 0.4513, 'learning_rate': 7.666106617301494e-08, 'epoch': 1.92} {'loss': 0.3033, 'learning_rate': 7.66206154967608e-08, 'epoch': 1.92} {'loss': 0.589, 'learning_rate': 7.658017545430164e-08, 'epoch': 1.92} {'loss': 0.5308, 'learning_rate': 7.653974604568403e-08, 'epoch': 1.92} {'loss': 0.5075, 'learning_rate': 7.649932727094911e-08, 'epoch': 1.92} {'loss': 0.4866, 'learning_rate': 7.645891913014015e-08, 'epoch': 1.92} {'loss': 0.3942, 'learning_rate': 7.641852162330265e-08, 'epoch': 1.92} {'loss': 0.5743, 'learning_rate': 7.637813475047661e-08, 'epoch': 1.92} {'loss': 0.477, 'learning_rate': 7.633775851170866e-08, 'epoch': 1.92} {'loss': 0.5159, 'learning_rate': 7.629739290703875e-08, 'epoch': 1.92} {'loss': 0.5299, 'learning_rate': 7.625703793651352e-08, 'epoch': 1.92} {'loss': 0.4497, 'learning_rate': 7.621669360017403e-08, 'epoch': 1.92} {'loss': 0.5126, 'learning_rate': 7.617635989806249e-08, 'epoch': 1.92} {'loss': 0.5819, 'learning_rate': 7.613603683022552e-08, 'epoch': 1.92} {'loss': 0.4177, 'learning_rate': 7.60957243967042e-08, 'epoch': 1.92} {'loss': 0.4342, 'learning_rate': 7.605542259754184e-08, 'epoch': 1.92} {'loss': 0.6097, 'learning_rate': 7.601513143278173e-08, 'epoch': 1.92} {'loss': 0.4996, 'learning_rate': 7.597485090246714e-08, 'epoch': 1.92} {'loss': 0.4304, 'learning_rate': 7.593458100664141e-08, 'epoch': 1.92} {'loss': 0.3768, 'learning_rate': 7.589432174534673e-08, 'epoch': 1.92} {'loss': 0.4305, 'learning_rate': 7.585407311862747e-08, 'epoch': 1.92} {'loss': 0.4015, 'learning_rate': 7.581383512652584e-08, 'epoch': 1.92} {'loss': 0.4191, 'learning_rate': 7.577360776908627e-08, 'epoch': 1.92} {'loss': 0.5552, 'learning_rate': 7.573339104635091e-08, 'epoch': 1.92} {'loss': 0.6213, 'learning_rate': 7.569318495836198e-08, 'epoch': 1.92} {'loss': 0.4208, 'learning_rate': 7.565298950516498e-08, 'epoch': 1.92} {'loss': 0.5668, 'learning_rate': 7.561280468679988e-08, 'epoch': 1.92} {'loss': 0.5265, 'learning_rate': 7.557263050331221e-08, 'epoch': 1.92} {'loss': 0.4272, 'learning_rate': 7.553246695474415e-08, 'epoch': 1.92} {'loss': 0.4464, 'learning_rate': 7.549231404113899e-08, 'epoch': 1.92} {'loss': 0.4567, 'learning_rate': 7.545217176253894e-08, 'epoch': 1.92} {'loss': 0.4845, 'learning_rate': 7.54120401189884e-08, 'epoch': 1.92} {'loss': 0.4079, 'learning_rate': 7.537191911052955e-08, 'epoch': 1.92} {'loss': 0.4582, 'learning_rate': 7.53318087372057e-08, 'epoch': 1.92} {'loss': 0.5085, 'learning_rate': 7.529170899905903e-08, 'epoch': 1.92} {'loss': 0.5285, 'learning_rate': 7.525161989613284e-08, 'epoch': 1.92} {'loss': 0.415, 'learning_rate': 7.521154142847043e-08, 'epoch': 1.92} {'loss': 0.4763, 'learning_rate': 7.517147359611398e-08, 'epoch': 1.92} {'loss': 0.476, 'learning_rate': 7.513141639910792e-08, 'epoch': 1.92} {'loss': 0.3842, 'learning_rate': 7.509136983749444e-08, 'epoch': 1.92} {'loss': 0.3239, 'learning_rate': 7.50513339113168e-08, 'epoch': 1.92} {'loss': 0.392, 'learning_rate': 7.501130862061612e-08, 'epoch': 1.92} {'loss': 0.4138, 'learning_rate': 7.497129396543789e-08, 'epoch': 1.92} {'loss': 0.5096, 'learning_rate': 7.493128994582211e-08, 'epoch': 1.92} {'loss': 0.3284, 'learning_rate': 7.489129656181426e-08, 'epoch': 1.92} {'loss': 0.4632, 'learning_rate': 7.485131381345656e-08, 'epoch': 1.92} {'loss': 0.7043, 'learning_rate': 7.481134170079119e-08, 'epoch': 1.92} {'loss': 0.6059, 'learning_rate': 7.477138022386143e-08, 'epoch': 1.92} {'loss': 0.4214, 'learning_rate': 7.47314293827095e-08, 'epoch': 1.92} {'loss': 0.5319, 'learning_rate': 7.469148917737867e-08, 'epoch': 1.92} {'loss': 0.3046, 'learning_rate': 7.465155960791115e-08, 'epoch': 1.92} {'loss': 0.5179, 'learning_rate': 7.461164067435134e-08, 'epoch': 1.92} {'loss': 0.5931, 'learning_rate': 7.457173237674143e-08, 'epoch': 1.92} {'loss': 0.4905, 'learning_rate': 7.453183471512248e-08, 'epoch': 1.92} {'loss': 0.4544, 'learning_rate': 7.449194768953893e-08, 'epoch': 1.92} {'loss': 0.5716, 'learning_rate': 7.445207130003296e-08, 'epoch': 1.92} {'loss': 0.6028, 'learning_rate': 7.441220554664785e-08, 'epoch': 1.92} {'loss': 0.4481, 'learning_rate': 7.437235042942581e-08, 'epoch': 1.92} {'loss': 0.4957, 'learning_rate': 7.433250594840901e-08, 'epoch': 1.92} {'loss': 0.4158, 'learning_rate': 7.429267210364188e-08, 'epoch': 1.92} {'loss': 0.5435, 'learning_rate': 7.425284889516549e-08, 'epoch': 1.92} {'loss': 0.3628, 'learning_rate': 7.421303632302201e-08, 'epoch': 1.92} {'loss': 0.4738, 'learning_rate': 7.417323438725588e-08, 'epoch': 1.92} {'loss': 0.4772, 'learning_rate': 7.413344308790926e-08, 'epoch': 1.92} {'loss': 0.4827, 'learning_rate': 7.409366242502547e-08, 'epoch': 1.92} {'loss': 0.4306, 'learning_rate': 7.405389239864446e-08, 'epoch': 1.92} {'loss': 0.5923, 'learning_rate': 7.401413300881177e-08, 'epoch': 1.92} {'loss': 0.4734, 'learning_rate': 7.397438425556735e-08, 'epoch': 1.92} {'loss': 0.5257, 'learning_rate': 7.393464613895673e-08, 'epoch': 1.92} {'loss': 0.5776, 'learning_rate': 7.389491865901987e-08, 'epoch': 1.92} {'loss': 0.4899, 'learning_rate': 7.38552018158012e-08, 'epoch': 1.92} {'loss': 0.56, 'learning_rate': 7.381549560934287e-08, 'epoch': 1.92} {'loss': 0.4511, 'learning_rate': 7.37758000396871e-08, 'epoch': 1.92} {'loss': 0.5116, 'learning_rate': 7.373611510687606e-08, 'epoch': 1.92} {'loss': 0.4548, 'learning_rate': 7.369644081095195e-08, 'epoch': 1.92} {'loss': 0.6126, 'learning_rate': 7.365677715195917e-08, 'epoch': 1.92} {'loss': 0.5638, 'learning_rate': 7.361712412993883e-08, 'epoch': 1.92} {'loss': 0.4498, 'learning_rate': 7.357748174493306e-08, 'epoch': 1.92} {'loss': 0.5342, 'learning_rate': 7.353784999698522e-08, 'epoch': 1.92} {'loss': 0.5098, 'learning_rate': 7.349822888613745e-08, 'epoch': 1.92} {'loss': 0.5249, 'learning_rate': 7.345861841243307e-08, 'epoch': 1.92} {'loss': 0.4294, 'learning_rate': 7.341901857591205e-08, 'epoch': 1.92} {'loss': 0.4377, 'learning_rate': 7.33794293766199e-08, 'epoch': 1.92} {'loss': 0.5011, 'learning_rate': 7.333985081459772e-08, 'epoch': 1.92} {'loss': 0.6069, 'learning_rate': 7.330028288988656e-08, 'epoch': 1.92} {'loss': 0.6038, 'learning_rate': 7.326072560253083e-08, 'epoch': 1.92} {'loss': 0.519, 'learning_rate': 7.322117895257275e-08, 'epoch': 1.92} {'loss': 0.3967, 'learning_rate': 7.318164294005336e-08, 'epoch': 1.92} {'loss': 0.5878, 'learning_rate': 7.3142117565016e-08, 'epoch': 1.92} {'loss': 0.4834, 'learning_rate': 7.31026028275028e-08, 'epoch': 1.92} {'loss': 0.5914, 'learning_rate': 7.306309872755602e-08, 'epoch': 1.92} {'loss': 0.501, 'learning_rate': 7.302360526521778e-08, 'epoch': 1.92} {'loss': 0.5509, 'learning_rate': 7.298412244053144e-08, 'epoch': 1.92} {'loss': 0.5369, 'learning_rate': 7.294465025353803e-08, 'epoch': 1.92} {'loss': 0.4268, 'learning_rate': 7.290518870428087e-08, 'epoch': 1.92} {'loss': 0.4622, 'learning_rate': 7.286573779280215e-08, 'epoch': 1.92} {'loss': 0.6104, 'learning_rate': 7.282629751914183e-08, 'epoch': 1.92} {'loss': 0.531, 'learning_rate': 7.278686788334654e-08, 'epoch': 1.92} {'loss': 0.5548, 'learning_rate': 7.274744888545404e-08, 'epoch': 1.92} {'loss': 0.58, 'learning_rate': 7.270804052550983e-08, 'epoch': 1.92} {'loss': 0.6072, 'learning_rate': 7.266864280355501e-08, 'epoch': 1.92} {'loss': 0.4595, 'learning_rate': 7.262925571963175e-08, 'epoch': 1.92} {'loss': 0.7138, 'learning_rate': 7.258987927378225e-08, 'epoch': 1.92} {'loss': 0.4881, 'learning_rate': 7.255051346604758e-08, 'epoch': 1.92} {'loss': 0.473, 'learning_rate': 7.251115829647216e-08, 'epoch': 1.92} {'loss': 0.5415, 'learning_rate': 7.247181376509593e-08, 'epoch': 1.92} {'loss': 0.6143, 'learning_rate': 7.243247987196334e-08, 'epoch': 1.92} {'loss': 0.5454, 'learning_rate': 7.239315661711544e-08, 'epoch': 1.92} {'loss': 0.5274, 'learning_rate': 7.235384400059331e-08, 'epoch': 1.92} {'loss': 0.588, 'learning_rate': 7.231454202244137e-08, 'epoch': 1.92} {'loss': 0.5272, 'learning_rate': 7.227525068269958e-08, 'epoch': 1.92} {'loss': 0.5712, 'learning_rate': 7.223596998141125e-08, 'epoch': 1.92} {'loss': 0.7026, 'learning_rate': 7.219669991861744e-08, 'epoch': 1.92} {'loss': 0.6172, 'learning_rate': 7.215744049436146e-08, 'epoch': 1.92} {'loss': 0.4796, 'learning_rate': 7.21181917086844e-08, 'epoch': 1.92} {'loss': 0.6491, 'learning_rate': 7.207895356162953e-08, 'epoch': 1.92} {'loss': 0.5687, 'learning_rate': 7.203972605323794e-08, 'epoch': 1.92} {'loss': 0.4126, 'learning_rate': 7.200050918355073e-08, 'epoch': 1.92} {'loss': 0.4639, 'learning_rate': 7.196130295261228e-08, 'epoch': 1.92} {'loss': 0.6075, 'learning_rate': 7.192210736046256e-08, 'epoch': 1.92} {'loss': 0.5415, 'learning_rate': 7.188292240714489e-08, 'epoch': 1.92} {'loss': 0.451, 'learning_rate': 7.184374809270033e-08, 'epoch': 1.92} {'loss': 0.5939, 'learning_rate': 7.180458441717108e-08, 'epoch': 1.92} {'loss': 0.5519, 'learning_rate': 7.176543138060043e-08, 'epoch': 1.92} {'loss': 0.5669, 'learning_rate': 7.172628898302725e-08, 'epoch': 1.92} {'loss': 0.629, 'learning_rate': 7.168715722449704e-08, 'epoch': 1.92} {'loss': 0.6003, 'learning_rate': 7.164803610504977e-08, 'epoch': 1.92} {'loss': 0.3897, 'learning_rate': 7.160892562472765e-08, 'epoch': 1.92} {'loss': 0.607, 'learning_rate': 7.156982578357285e-08, 'epoch': 1.92} {'loss': 0.5036, 'learning_rate': 7.153073658162646e-08, 'epoch': 1.92} {'loss': 0.4723, 'learning_rate': 7.149165801893176e-08, 'epoch': 1.92} {'loss': 0.4533, 'learning_rate': 7.145259009552985e-08, 'epoch': 1.92} {'loss': 0.5294, 'learning_rate': 7.141353281146179e-08, 'epoch': 1.92} {'loss': 0.6185, 'learning_rate': 7.137448616677089e-08, 'epoch': 1.92} {'loss': 0.5195, 'learning_rate': 7.133545016149823e-08, 'epoch': 1.92} {'loss': 0.3684, 'learning_rate': 7.129642479568599e-08, 'epoch': 1.92} {'loss': 0.4753, 'learning_rate': 7.125741006937526e-08, 'epoch': 1.92} {'loss': 0.3236, 'learning_rate': 7.121840598260932e-08, 'epoch': 1.92} {'loss': 0.3903, 'learning_rate': 7.117941253542704e-08, 'epoch': 1.92} {'loss': 0.4669, 'learning_rate': 7.114042972787394e-08, 'epoch': 1.92} {'loss': 0.4328, 'learning_rate': 7.110145755998887e-08, 'epoch': 1.92} {'loss': 0.4443, 'learning_rate': 7.106249603181514e-08, 'epoch': 1.92} {'loss': 0.4817, 'learning_rate': 7.102354514339494e-08, 'epoch': 1.92} {'loss': 0.4998, 'learning_rate': 7.098460489476822e-08, 'epoch': 1.92} {'loss': 0.5157, 'learning_rate': 7.094567528597829e-08, 'epoch': 1.92} {'loss': 0.4421, 'learning_rate': 7.090675631706512e-08, 'epoch': 1.92} {'loss': 0.4721, 'learning_rate': 7.0867847988072e-08, 'epoch': 1.92} {'loss': 0.4943, 'learning_rate': 7.082895029904003e-08, 'epoch': 1.92} {'loss': 0.5768, 'learning_rate': 7.079006325001136e-08, 'epoch': 1.92} {'loss': 0.5998, 'learning_rate': 7.075118684102822e-08, 'epoch': 1.92} {'loss': 0.5578, 'learning_rate': 7.071232107212944e-08, 'epoch': 1.92} {'loss': 0.532, 'learning_rate': 7.067346594335945e-08, 'epoch': 1.92} {'loss': 0.5179, 'learning_rate': 7.06346214547593e-08, 'epoch': 1.92} {'loss': 0.3872, 'learning_rate': 7.05957876063701e-08, 'epoch': 1.92} {'loss': 0.5378, 'learning_rate': 7.055696439823401e-08, 'epoch': 1.92} {'loss': 0.5011, 'learning_rate': 7.051815183039213e-08, 'epoch': 1.92} {'loss': 0.4103, 'learning_rate': 7.047934990288663e-08, 'epoch': 1.92} {'loss': 0.5128, 'learning_rate': 7.04405586157575e-08, 'epoch': 1.92} {'loss': 0.507, 'learning_rate': 7.040177796904801e-08, 'epoch': 1.92} {'loss': 0.3702, 'learning_rate': 7.036300796279927e-08, 'epoch': 1.92} {'loss': 0.3649, 'learning_rate': 7.032424859705345e-08, 'epoch': 1.92} {'loss': 0.3833, 'learning_rate': 7.028549987185052e-08, 'epoch': 1.92} {'loss': 0.5637, 'learning_rate': 7.024676178723266e-08, 'epoch': 1.92} {'loss': 0.5839, 'learning_rate': 7.02080343432432e-08, 'epoch': 1.92} {'loss': 0.3322, 'learning_rate': 7.016931753992095e-08, 'epoch': 1.92} {'loss': 0.4528, 'learning_rate': 7.013061137730814e-08, 'epoch': 1.92} {'loss': 0.5207, 'learning_rate': 7.009191585544695e-08, 'epoch': 1.92} {'loss': 0.5688, 'learning_rate': 7.005323097437843e-08, 'epoch': 1.92} {'loss': 0.4437, 'learning_rate': 7.001455673414482e-08, 'epoch': 1.92} {'loss': 0.5144, 'learning_rate': 6.997589313478604e-08, 'epoch': 1.92} {'loss': 0.5666, 'learning_rate': 6.993724017634429e-08, 'epoch': 1.92} {'loss': 0.5199, 'learning_rate': 6.989859785886177e-08, 'epoch': 1.92} {'loss': 0.4165, 'learning_rate': 6.985996618237845e-08, 'epoch': 1.92} {'loss': 0.4343, 'learning_rate': 6.982134514693651e-08, 'epoch': 1.92} {'loss': 0.5672, 'learning_rate': 6.978273475257813e-08, 'epoch': 1.92} {'loss': 0.6087, 'learning_rate': 6.974413499934218e-08, 'epoch': 1.93} {'loss': 0.4415, 'learning_rate': 6.970554588727308e-08, 'epoch': 1.93} {'loss': 0.4486, 'learning_rate': 6.966696741641076e-08, 'epoch': 1.93} {'loss': 0.4274, 'learning_rate': 6.962839958679524e-08, 'epoch': 1.93} {'loss': 0.5503, 'learning_rate': 6.958984239847089e-08, 'epoch': 1.93} {'loss': 0.463, 'learning_rate': 6.955129585147546e-08, 'epoch': 1.93} {'loss': 0.4317, 'learning_rate': 6.951275994585338e-08, 'epoch': 1.93} {'loss': 0.6211, 'learning_rate': 6.947423468164461e-08, 'epoch': 1.93} {'loss': 0.468, 'learning_rate': 6.943572005889021e-08, 'epoch': 1.93} {'loss': 0.5748, 'learning_rate': 6.939721607763128e-08, 'epoch': 1.93} {'loss': 0.5103, 'learning_rate': 6.935872273791e-08, 'epoch': 1.93} {'loss': 0.5544, 'learning_rate': 6.932024003976745e-08, 'epoch': 1.93} {'loss': 0.574, 'learning_rate': 6.92817679832436e-08, 'epoch': 1.93} {'loss': 0.4773, 'learning_rate': 6.924330656838174e-08, 'epoch': 1.93} {'loss': 0.4623, 'learning_rate': 6.920485579522074e-08, 'epoch': 1.93} {'loss': 0.57, 'learning_rate': 6.916641566380389e-08, 'epoch': 1.93} {'loss': 0.6155, 'learning_rate': 6.912798617417227e-08, 'epoch': 1.93} {'loss': 0.3846, 'learning_rate': 6.908956732636474e-08, 'epoch': 1.93} {'loss': 0.5757, 'learning_rate': 6.905115912042459e-08, 'epoch': 1.93} {'loss': 0.5801, 'learning_rate': 6.901276155639292e-08, 'epoch': 1.93} {'loss': 0.4495, 'learning_rate': 6.897437463430967e-08, 'epoch': 1.93} {'loss': 0.5511, 'learning_rate': 6.893599835421705e-08, 'epoch': 1.93} {'loss': 0.5288, 'learning_rate': 6.889763271615724e-08, 'epoch': 1.93} {'loss': 0.4667, 'learning_rate': 6.885927772016799e-08, 'epoch': 1.93} {'loss': 0.4291, 'learning_rate': 6.88209333662937e-08, 'epoch': 1.93} {'loss': 0.5019, 'learning_rate': 6.878259965457323e-08, 'epoch': 1.93} {'loss': 0.6184, 'learning_rate': 6.874427658504879e-08, 'epoch': 1.93} {'loss': 0.5901, 'learning_rate': 6.870596415776143e-08, 'epoch': 1.93} {'loss': 0.534, 'learning_rate': 6.866766237275114e-08, 'epoch': 1.93} {'loss': 0.5419, 'learning_rate': 6.86293712300612e-08, 'epoch': 1.93} {'loss': 0.6262, 'learning_rate': 6.859109072973047e-08, 'epoch': 1.93} {'loss': 0.4651, 'learning_rate': 6.855282087180005e-08, 'epoch': 1.93} {'loss': 0.4738, 'learning_rate': 6.85145616563121e-08, 'epoch': 1.93} {'loss': 0.5158, 'learning_rate': 6.847631308330771e-08, 'epoch': 1.93} {'loss': 0.4156, 'learning_rate': 6.843807515282796e-08, 'epoch': 1.93} {'loss': 0.5178, 'learning_rate': 6.839984786491171e-08, 'epoch': 1.93} {'loss': 0.5167, 'learning_rate': 6.836163121960226e-08, 'epoch': 1.93} {'loss': 0.6368, 'learning_rate': 6.832342521693958e-08, 'epoch': 1.93} {'loss': 0.6912, 'learning_rate': 6.828522985696362e-08, 'epoch': 1.93} {'loss': 0.6507, 'learning_rate': 6.82470451397177e-08, 'epoch': 1.93} {'loss': 0.5363, 'learning_rate': 6.820887106524066e-08, 'epoch': 1.93} {'loss': 0.5815, 'learning_rate': 6.81707076335758e-08, 'epoch': 1.93} {'loss': 0.3498, 'learning_rate': 6.813255484476089e-08, 'epoch': 1.93} {'loss': 0.4518, 'learning_rate': 6.809441269883921e-08, 'epoch': 1.93} {'loss': 0.5919, 'learning_rate': 6.805628119584962e-08, 'epoch': 1.93} {'loss': 0.5951, 'learning_rate': 6.801816033583541e-08, 'epoch': 1.93} {'loss': 0.6143, 'learning_rate': 6.798005011883657e-08, 'epoch': 1.93} {'loss': 0.4859, 'learning_rate': 6.794195054489195e-08, 'epoch': 1.93} {'loss': 0.3843, 'learning_rate': 6.790386161404483e-08, 'epoch': 1.93} {'loss': 0.5165, 'learning_rate': 6.78657833263341e-08, 'epoch': 1.93} {'loss': 0.6113, 'learning_rate': 6.782771568180301e-08, 'epoch': 1.93} {'loss': 0.5327, 'learning_rate': 6.778965868049048e-08, 'epoch': 1.93} {'loss': 0.6678, 'learning_rate': 6.775161232243755e-08, 'epoch': 1.93} {'loss': 0.6779, 'learning_rate': 6.771357660768529e-08, 'epoch': 1.93} {'loss': 0.5573, 'learning_rate': 6.76755515362737e-08, 'epoch': 1.93} {'loss': 0.4283, 'learning_rate': 6.763753710824606e-08, 'epoch': 1.93} {'loss': 0.4256, 'learning_rate': 6.759953332364012e-08, 'epoch': 1.93} {'loss': 0.4943, 'learning_rate': 6.756154018249695e-08, 'epoch': 1.93} {'loss': 0.5138, 'learning_rate': 6.752355768485875e-08, 'epoch': 1.93} {'loss': 0.4407, 'learning_rate': 6.748558583076547e-08, 'epoch': 1.93} {'loss': 0.46, 'learning_rate': 6.744762462025934e-08, 'epoch': 1.93} {'loss': 0.6236, 'learning_rate': 6.740967405337695e-08, 'epoch': 1.93} {'loss': 0.5546, 'learning_rate': 6.737173413016385e-08, 'epoch': 1.93} {'loss': 0.4368, 'learning_rate': 6.733380485065666e-08, 'epoch': 1.93} {'loss': 0.3332, 'learning_rate': 6.729588621489868e-08, 'epoch': 1.93} {'loss': 0.4234, 'learning_rate': 6.725797822292989e-08, 'epoch': 1.93} {'loss': 0.3851, 'learning_rate': 6.722008087478915e-08, 'epoch': 1.93} {'loss': 0.4493, 'learning_rate': 6.718219417052085e-08, 'epoch': 1.93} {'loss': 0.5504, 'learning_rate': 6.714431811016165e-08, 'epoch': 1.93} {'loss': 0.4591, 'learning_rate': 6.710645269375482e-08, 'epoch': 1.93} {'loss': 0.4987, 'learning_rate': 6.706859792133924e-08, 'epoch': 1.93} {'loss': 0.573, 'learning_rate': 6.703075379295599e-08, 'epoch': 1.93} {'loss': 0.5344, 'learning_rate': 6.699292030864612e-08, 'epoch': 1.93} {'loss': 0.5415, 'learning_rate': 6.695509746844964e-08, 'epoch': 1.93} {'loss': 0.5387, 'learning_rate': 6.69172852724076e-08, 'epoch': 1.93} {'loss': 0.5555, 'learning_rate': 6.687948372055997e-08, 'epoch': 1.93} {'loss': 0.5336, 'learning_rate': 6.684169281294783e-08, 'epoch': 1.93} {'loss': 0.4587, 'learning_rate': 6.680391254961116e-08, 'epoch': 1.93} {'loss': 0.4421, 'learning_rate': 6.676614293058992e-08, 'epoch': 1.93} {'loss': 0.5624, 'learning_rate': 6.67283839559274e-08, 'epoch': 1.93} {'loss': 0.495, 'learning_rate': 6.669063562565914e-08, 'epoch': 1.93} {'loss': 0.6592, 'learning_rate': 6.665289793983065e-08, 'epoch': 1.93} {'loss': 0.2907, 'learning_rate': 6.661517089847858e-08, 'epoch': 1.93} {'loss': 0.4854, 'learning_rate': 6.65774545016462e-08, 'epoch': 1.93} {'loss': 0.6328, 'learning_rate': 6.65397487493713e-08, 'epoch': 1.93} {'loss': 0.4769, 'learning_rate': 6.650205364169604e-08, 'epoch': 1.93} {'loss': 0.481, 'learning_rate': 6.64643691786615e-08, 'epoch': 1.93} {'loss': 0.4945, 'learning_rate': 6.642669536030544e-08, 'epoch': 1.93} {'loss': 0.4645, 'learning_rate': 6.638903218667114e-08, 'epoch': 1.93} {'loss': 0.4176, 'learning_rate': 6.635137965779637e-08, 'epoch': 1.93} {'loss': 0.3231, 'learning_rate': 6.63137377737233e-08, 'epoch': 1.93} {'loss': 0.5333, 'learning_rate': 6.627610653449079e-08, 'epoch': 1.93} {'loss': 0.4736, 'learning_rate': 6.623848594014105e-08, 'epoch': 1.93} {'loss': 0.6623, 'learning_rate': 6.62008759907129e-08, 'epoch': 1.93} {'loss': 0.6075, 'learning_rate': 6.616327668624745e-08, 'epoch': 1.93} {'loss': 0.5969, 'learning_rate': 6.612568802678465e-08, 'epoch': 1.93} {'loss': 0.6879, 'learning_rate': 6.608811001236448e-08, 'epoch': 1.93} {'loss': 0.4135, 'learning_rate': 6.605054264302691e-08, 'epoch': 1.93} {'loss': 0.5682, 'learning_rate': 6.6012985918813e-08, 'epoch': 1.93} {'loss': 0.5119, 'learning_rate': 6.597543983976273e-08, 'epoch': 1.93} {'loss': 0.6017, 'learning_rate': 6.593790440591718e-08, 'epoch': 1.93} {'loss': 0.4119, 'learning_rate': 6.590037961731522e-08, 'epoch': 1.93} {'loss': 0.5306, 'learning_rate': 6.586286547399789e-08, 'epoch': 1.93} {'loss': 0.4641, 'learning_rate': 6.58253619760052e-08, 'epoch': 1.93} {'loss': 0.5032, 'learning_rate': 6.578786912337709e-08, 'epoch': 1.93} {'loss': 0.4806, 'learning_rate': 6.575038691615354e-08, 'epoch': 1.93} {'loss': 0.7116, 'learning_rate': 6.571291535437452e-08, 'epoch': 1.93} {'loss': 0.5006, 'learning_rate': 6.567545443808221e-08, 'epoch': 1.93} {'loss': 0.3951, 'learning_rate': 6.563800416731436e-08, 'epoch': 1.93} {'loss': 0.6133, 'learning_rate': 6.560056454211317e-08, 'epoch': 1.93} {'loss': 0.5458, 'learning_rate': 6.556313556251637e-08, 'epoch': 1.93} {'loss': 0.5147, 'learning_rate': 6.552571722856504e-08, 'epoch': 1.93} {'loss': 0.5457, 'learning_rate': 6.548830954030027e-08, 'epoch': 1.93} {'loss': 0.4131, 'learning_rate': 6.545091249776092e-08, 'epoch': 1.93} {'loss': 0.3778, 'learning_rate': 6.541352610098916e-08, 'epoch': 1.93} {'loss': 0.4979, 'learning_rate': 6.537615035002165e-08, 'epoch': 1.93} {'loss': 0.4717, 'learning_rate': 6.533878524490056e-08, 'epoch': 1.93} {'loss': 0.6262, 'learning_rate': 6.530143078566587e-08, 'epoch': 1.93} {'loss': 0.6496, 'learning_rate': 6.526408697235754e-08, 'epoch': 1.93} {'loss': 0.4898, 'learning_rate': 6.522675380501553e-08, 'epoch': 1.93} {'loss': 0.4255, 'learning_rate': 6.518943128367872e-08, 'epoch': 1.93} {'loss': 0.4977, 'learning_rate': 6.515211940838928e-08, 'epoch': 1.93} {'loss': 0.4923, 'learning_rate': 6.511481817918607e-08, 'epoch': 1.93} {'loss': 0.4048, 'learning_rate': 6.507752759610797e-08, 'epoch': 1.93} {'loss': 0.367, 'learning_rate': 6.504024765919715e-08, 'epoch': 1.93} {'loss': 0.369, 'learning_rate': 6.500297836849134e-08, 'epoch': 1.93} {'loss': 0.4378, 'learning_rate': 6.496571972403277e-08, 'epoch': 1.93} {'loss': 0.4626, 'learning_rate': 6.492847172585803e-08, 'epoch': 1.93} {'loss': 0.3715, 'learning_rate': 6.489123437401156e-08, 'epoch': 1.93} {'loss': 0.5332, 'learning_rate': 6.48540076685289e-08, 'epoch': 1.93} {'loss': 0.4455, 'learning_rate': 6.481679160945331e-08, 'epoch': 1.93} {'loss': 0.3349, 'learning_rate': 6.477958619682257e-08, 'epoch': 1.93} {'loss': 0.6251, 'learning_rate': 6.474239143067662e-08, 'epoch': 1.93} {'loss': 0.3615, 'learning_rate': 6.470520731105656e-08, 'epoch': 1.93} {'loss': 0.6065, 'learning_rate': 6.466803383800235e-08, 'epoch': 1.93} {'loss': 0.6278, 'learning_rate': 6.463087101155174e-08, 'epoch': 1.93} {'loss': 0.5175, 'learning_rate': 6.459371883174581e-08, 'epoch': 1.93} {'loss': 0.4503, 'learning_rate': 6.455657729862564e-08, 'epoch': 1.93} {'loss': 0.6749, 'learning_rate': 6.451944641222895e-08, 'epoch': 1.93} {'loss': 0.4123, 'learning_rate': 6.448232617259686e-08, 'epoch': 1.93} {'loss': 0.4428, 'learning_rate': 6.444521657976821e-08, 'epoch': 1.93} {'loss': 0.5677, 'learning_rate': 6.440811763378407e-08, 'epoch': 1.93} {'loss': 0.5567, 'learning_rate': 6.43710293346822e-08, 'epoch': 1.93} {'loss': 0.5228, 'learning_rate': 6.433395168250478e-08, 'epoch': 1.93} {'loss': 0.5317, 'learning_rate': 6.429688467728956e-08, 'epoch': 1.93} {'loss': 0.4514, 'learning_rate': 6.425982831907651e-08, 'epoch': 1.93} {'loss': 0.4089, 'learning_rate': 6.422278260790671e-08, 'epoch': 1.93} {'loss': 0.4024, 'learning_rate': 6.418574754381901e-08, 'epoch': 1.93} {'loss': 0.4604, 'learning_rate': 6.414872312685228e-08, 'epoch': 1.93} {'loss': 0.5855, 'learning_rate': 6.411170935704758e-08, 'epoch': 1.93} {'loss': 0.5037, 'learning_rate': 6.407470623444378e-08, 'epoch': 1.93} {'loss': 0.6751, 'learning_rate': 6.403771375907974e-08, 'epoch': 1.93} {'loss': 0.7411, 'learning_rate': 6.400073193099765e-08, 'epoch': 1.93} {'loss': 0.647, 'learning_rate': 6.396376075023525e-08, 'epoch': 1.93} {'loss': 0.4232, 'learning_rate': 6.39268002168314e-08, 'epoch': 1.93} {'loss': 0.4619, 'learning_rate': 6.388985033082718e-08, 'epoch': 1.93} {'loss': 0.3876, 'learning_rate': 6.385291109226255e-08, 'epoch': 1.93} {'loss': 0.4054, 'learning_rate': 6.381598250117527e-08, 'epoch': 1.93} {'loss': 0.3723, 'learning_rate': 6.377906455760641e-08, 'epoch': 1.93} {'loss': 0.5649, 'learning_rate': 6.374215726159594e-08, 'epoch': 1.93} {'loss': 0.3998, 'learning_rate': 6.370526061318161e-08, 'epoch': 1.93} {'loss': 0.5032, 'learning_rate': 6.36683746124045e-08, 'epoch': 1.93} {'loss': 0.3159, 'learning_rate': 6.363149925930235e-08, 'epoch': 1.93} {'loss': 0.3276, 'learning_rate': 6.359463455391735e-08, 'epoch': 1.93} {'loss': 0.5719, 'learning_rate': 6.355778049628613e-08, 'epoch': 1.93} {'loss': 0.4665, 'learning_rate': 6.352093708645091e-08, 'epoch': 1.93} {'loss': 0.5371, 'learning_rate': 6.348410432444829e-08, 'epoch': 1.93} {'loss': 0.5065, 'learning_rate': 6.344728221032048e-08, 'epoch': 1.93} {'loss': 0.6306, 'learning_rate': 6.341047074410523e-08, 'epoch': 1.93} {'loss': 0.5958, 'learning_rate': 6.337366992584248e-08, 'epoch': 1.93} {'loss': 0.5044, 'learning_rate': 6.333687975557224e-08, 'epoch': 1.93} {'loss': 0.4796, 'learning_rate': 6.330010023333333e-08, 'epoch': 1.93} {'loss': 0.4851, 'learning_rate': 6.326333135916463e-08, 'epoch': 1.93} {'loss': 0.432, 'learning_rate': 6.322657313310609e-08, 'epoch': 1.93} {'loss': 0.5256, 'learning_rate': 6.31898255551977e-08, 'epoch': 1.93} {'loss': 0.4883, 'learning_rate': 6.315308862547831e-08, 'epoch': 1.93} {'loss': 0.5043, 'learning_rate': 6.311636234398677e-08, 'epoch': 1.93} {'loss': 0.4998, 'learning_rate': 6.307964671076195e-08, 'epoch': 1.93} {'loss': 0.5514, 'learning_rate': 6.304294172584601e-08, 'epoch': 1.93} {'loss': 0.3622, 'learning_rate': 6.300624738927563e-08, 'epoch': 1.93} {'loss': 0.5053, 'learning_rate': 6.296956370109075e-08, 'epoch': 1.93} {'loss': 0.4508, 'learning_rate': 6.293289066133135e-08, 'epoch': 1.93} {'loss': 0.5252, 'learning_rate': 6.289622827003517e-08, 'epoch': 1.93} {'loss': 0.6499, 'learning_rate': 6.285957652724329e-08, 'epoch': 1.93} {'loss': 0.3524, 'learning_rate': 6.282293543299567e-08, 'epoch': 1.93} {'loss': 0.3572, 'learning_rate': 6.278630498732786e-08, 'epoch': 1.93} {'loss': 0.4762, 'learning_rate': 6.274968519028202e-08, 'epoch': 1.93} {'loss': 0.5302, 'learning_rate': 6.271307604189703e-08, 'epoch': 1.93} {'loss': 0.4828, 'learning_rate': 6.267647754221285e-08, 'epoch': 1.93} {'loss': 0.4876, 'learning_rate': 6.263988969126611e-08, 'epoch': 1.93} {'loss': 0.4258, 'learning_rate': 6.26033124890979e-08, 'epoch': 1.93} {'loss': 0.4218, 'learning_rate': 6.256674593574818e-08, 'epoch': 1.93} {'loss': 0.387, 'learning_rate': 6.253019003125471e-08, 'epoch': 1.93} {'loss': 0.4119, 'learning_rate': 6.249364477565634e-08, 'epoch': 1.93} {'loss': 0.5001, 'learning_rate': 6.245711016899414e-08, 'epoch': 1.93} {'loss': 0.3478, 'learning_rate': 6.242058621130475e-08, 'epoch': 1.93} {'loss': 0.5093, 'learning_rate': 6.238407290262927e-08, 'epoch': 1.93} {'loss': 0.6022, 'learning_rate': 6.234757024300653e-08, 'epoch': 1.93} {'loss': 0.4663, 'learning_rate': 6.231107823247539e-08, 'epoch': 1.93} {'loss': 0.387, 'learning_rate': 6.227459687107362e-08, 'epoch': 1.93} {'loss': 0.5966, 'learning_rate': 6.223812615884229e-08, 'epoch': 1.93} {'loss': 0.4912, 'learning_rate': 6.220166609582024e-08, 'epoch': 1.93} {'loss': 0.4787, 'learning_rate': 6.216521668204523e-08, 'epoch': 1.93} {'loss': 0.489, 'learning_rate': 6.212877791755723e-08, 'epoch': 1.93} {'loss': 0.5903, 'learning_rate': 6.209234980239508e-08, 'epoch': 1.93} {'loss': 0.4673, 'learning_rate': 6.205593233659878e-08, 'epoch': 1.93} {'loss': 0.5458, 'learning_rate': 6.201952552020607e-08, 'epoch': 1.93} {'loss': 0.4744, 'learning_rate': 6.19831293532569e-08, 'epoch': 1.93} {'loss': 0.6422, 'learning_rate': 6.194674383578902e-08, 'epoch': 1.93} {'loss': 0.3319, 'learning_rate': 6.191036896784241e-08, 'epoch': 1.93} {'loss': 0.4463, 'learning_rate': 6.187400474945593e-08, 'epoch': 1.93} {'loss': 0.6067, 'learning_rate': 6.183765118066732e-08, 'epoch': 1.93} {'loss': 0.353, 'learning_rate': 6.180130826151875e-08, 'epoch': 1.93} {'loss': 0.3083, 'learning_rate': 6.176497599204467e-08, 'epoch': 1.93} {'loss': 0.5997, 'learning_rate': 6.172865437228837e-08, 'epoch': 1.93} {'loss': 0.5756, 'learning_rate': 6.169234340228647e-08, 'epoch': 1.93} {'loss': 0.5364, 'learning_rate': 6.165604308207673e-08, 'epoch': 1.93} {'loss': 0.3749, 'learning_rate': 6.161975341170134e-08, 'epoch': 1.93} {'loss': 0.4038, 'learning_rate': 6.158347439119583e-08, 'epoch': 1.93} {'loss': 0.617, 'learning_rate': 6.154720602060238e-08, 'epoch': 1.93} {'loss': 0.4871, 'learning_rate': 6.151094829995652e-08, 'epoch': 1.93} {'loss': 0.3824, 'learning_rate': 6.147470122929932e-08, 'epoch': 1.93} {'loss': 0.5045, 'learning_rate': 6.143846480866966e-08, 'epoch': 1.93} {'loss': 0.3445, 'learning_rate': 6.140223903810416e-08, 'epoch': 1.93} {'loss': 0.6529, 'learning_rate': 6.136602391764501e-08, 'epoch': 1.93} {'loss': 0.3792, 'learning_rate': 6.132981944732775e-08, 'epoch': 1.93} {'loss': 0.4972, 'learning_rate': 6.129362562719343e-08, 'epoch': 1.93} {'loss': 0.4319, 'learning_rate': 6.125744245727871e-08, 'epoch': 1.93} {'loss': 0.4615, 'learning_rate': 6.122126993762467e-08, 'epoch': 1.93} {'loss': 0.5503, 'learning_rate': 6.118510806826905e-08, 'epoch': 1.93} {'loss': 0.4365, 'learning_rate': 6.11489568492507e-08, 'epoch': 1.93} {'loss': 0.5716, 'learning_rate': 6.11128162806085e-08, 'epoch': 1.93} {'loss': 0.3205, 'learning_rate': 6.107668636238017e-08, 'epoch': 1.93} {'loss': 0.5966, 'learning_rate': 6.104056709460571e-08, 'epoch': 1.93} {'loss': 0.4797, 'learning_rate': 6.100445847732284e-08, 'epoch': 1.93} {'loss': 0.3956, 'learning_rate': 6.096836051057153e-08, 'epoch': 1.93} {'loss': 0.595, 'learning_rate': 6.093227319438955e-08, 'epoch': 1.93} {'loss': 0.451, 'learning_rate': 6.089619652881573e-08, 'epoch': 1.93} {'loss': 0.4119, 'learning_rate': 6.086013051388895e-08, 'epoch': 1.93} {'loss': 0.5134, 'learning_rate': 6.082407514964584e-08, 'epoch': 1.93} {'loss': 0.4211, 'learning_rate': 6.078803043612857e-08, 'epoch': 1.93} {'loss': 0.5411, 'learning_rate': 6.075199637337382e-08, 'epoch': 1.93} {'loss': 0.6859, 'learning_rate': 6.071597296141928e-08, 'epoch': 1.93} {'loss': 0.6281, 'learning_rate': 6.067996020030609e-08, 'epoch': 1.93} {'loss': 0.5365, 'learning_rate': 6.064395809007084e-08, 'epoch': 1.93} {'loss': 0.4137, 'learning_rate': 6.06079666307524e-08, 'epoch': 1.93} {'loss': 0.6267, 'learning_rate': 6.057198582238966e-08, 'epoch': 1.93} {'loss': 0.4554, 'learning_rate': 6.053601566502143e-08, 'epoch': 1.93} {'loss': 0.4342, 'learning_rate': 6.050005615868548e-08, 'epoch': 1.93} {'loss': 0.524, 'learning_rate': 6.046410730342067e-08, 'epoch': 1.93} {'loss': 0.631, 'learning_rate': 6.042816909926585e-08, 'epoch': 1.93} {'loss': 0.4198, 'learning_rate': 6.039224154625989e-08, 'epoch': 1.93} {'loss': 0.4619, 'learning_rate': 6.035632464444052e-08, 'epoch': 1.93} {'loss': 0.4762, 'learning_rate': 6.032041839384661e-08, 'epoch': 1.93} {'loss': 0.4787, 'learning_rate': 6.028452279451591e-08, 'epoch': 1.93} {'loss': 0.5048, 'learning_rate': 6.024863784648838e-08, 'epoch': 1.93} {'loss': 0.585, 'learning_rate': 6.021276354980065e-08, 'epoch': 1.93} {'loss': 0.5893, 'learning_rate': 6.017689990449271e-08, 'epoch': 1.93} {'loss': 0.4927, 'learning_rate': 6.014104691060119e-08, 'epoch': 1.93} {'loss': 0.4767, 'learning_rate': 6.010520456816716e-08, 'epoch': 1.93} {'loss': 0.5364, 'learning_rate': 6.006937287722726e-08, 'epoch': 1.93} {'loss': 0.515, 'learning_rate': 6.003355183781922e-08, 'epoch': 1.93} {'loss': 0.5572, 'learning_rate': 5.999774144998304e-08, 'epoch': 1.93} {'loss': 0.5692, 'learning_rate': 5.996194171375647e-08, 'epoch': 1.93} {'loss': 0.4483, 'learning_rate': 5.992615262917722e-08, 'epoch': 1.93} {'loss': 0.522, 'learning_rate': 5.989037419628418e-08, 'epoch': 1.93} {'loss': 0.6141, 'learning_rate': 5.985460641511731e-08, 'epoch': 1.93} {'loss': 0.4592, 'learning_rate': 5.981884928571214e-08, 'epoch': 1.93} {'loss': 0.5514, 'learning_rate': 5.978310280810862e-08, 'epoch': 1.93} {'loss': 0.6259, 'learning_rate': 5.974736698234452e-08, 'epoch': 1.93} {'loss': 0.5251, 'learning_rate': 5.971164180845756e-08, 'epoch': 1.93} {'loss': 0.3706, 'learning_rate': 5.967592728648774e-08, 'epoch': 1.93} {'loss': 0.4699, 'learning_rate': 5.964022341647169e-08, 'epoch': 1.93} {'loss': 0.5092, 'learning_rate': 5.960453019844936e-08, 'epoch': 1.93} {'loss': 0.4905, 'learning_rate': 5.95688476324563e-08, 'epoch': 1.93} {'loss': 0.4629, 'learning_rate': 5.953317571853356e-08, 'epoch': 1.93} {'loss': 0.4552, 'learning_rate': 5.949751445671781e-08, 'epoch': 1.93} {'loss': 0.4851, 'learning_rate': 5.946186384704788e-08, 'epoch': 1.93} {'loss': 0.4892, 'learning_rate': 5.942622388956154e-08, 'epoch': 1.93} {'loss': 0.4706, 'learning_rate': 5.9390594584297636e-08, 'epoch': 1.93} {'loss': 0.4416, 'learning_rate': 5.935497593129391e-08, 'epoch': 1.93} {'loss': 0.3629, 'learning_rate': 5.9319367930588126e-08, 'epoch': 1.93} {'loss': 0.4771, 'learning_rate': 5.9283770582219124e-08, 'epoch': 1.93} {'loss': 0.4949, 'learning_rate': 5.924818388622466e-08, 'epoch': 1.93} {'loss': 0.4862, 'learning_rate': 5.921260784264249e-08, 'epoch': 1.93} {'loss': 0.6652, 'learning_rate': 5.9177042451511456e-08, 'epoch': 1.93} {'loss': 0.5837, 'learning_rate': 5.9141487712870426e-08, 'epoch': 1.93} {'loss': 0.4351, 'learning_rate': 5.910594362675493e-08, 'epoch': 1.93} {'loss': 0.5464, 'learning_rate': 5.907041019320603e-08, 'epoch': 1.93} {'loss': 0.4979, 'learning_rate': 5.9034887412259266e-08, 'epoch': 1.93} {'loss': 0.6368, 'learning_rate': 5.899937528395461e-08, 'epoch': 1.93} {'loss': 0.5189, 'learning_rate': 5.8963873808328684e-08, 'epoch': 1.93} {'loss': 0.4642, 'learning_rate': 5.8928382985421474e-08, 'epoch': 1.93} {'loss': 0.6487, 'learning_rate': 5.8892902815268496e-08, 'epoch': 1.93} {'loss': 0.2725, 'learning_rate': 5.8857433297908606e-08, 'epoch': 1.93} {'loss': 0.4939, 'learning_rate': 5.882197443338178e-08, 'epoch': 1.93} {'loss': 0.4016, 'learning_rate': 5.8786526221723536e-08, 'epoch': 1.93} {'loss': 0.4699, 'learning_rate': 5.8751088662972743e-08, 'epoch': 1.93} {'loss': 0.6041, 'learning_rate': 5.871566175716825e-08, 'epoch': 1.93} {'loss': 0.4246, 'learning_rate': 5.868024550434559e-08, 'epoch': 1.93} {'loss': 0.5019, 'learning_rate': 5.8644839904545834e-08, 'epoch': 1.93} {'loss': 0.5939, 'learning_rate': 5.8609444957804516e-08, 'epoch': 1.93} {'loss': 0.5194, 'learning_rate': 5.857406066416049e-08, 'epoch': 1.93} {'loss': 0.4516, 'learning_rate': 5.8538687023652616e-08, 'epoch': 1.93} {'loss': 0.4411, 'learning_rate': 5.850332403631642e-08, 'epoch': 1.93} {'loss': 0.4389, 'learning_rate': 5.8467971702191874e-08, 'epoch': 1.93} {'loss': 0.4819, 'learning_rate': 5.8432630021316715e-08, 'epoch': 1.93} {'loss': 0.5181, 'learning_rate': 5.839729899372759e-08, 'epoch': 1.93} {'loss': 0.5459, 'learning_rate': 5.8361978619463355e-08, 'epoch': 1.93} {'loss': 0.3562, 'learning_rate': 5.8326668898560645e-08, 'epoch': 1.93} {'loss': 0.5118, 'learning_rate': 5.829136983105943e-08, 'epoch': 1.93} {'loss': 0.5519, 'learning_rate': 5.825608141699524e-08, 'epoch': 1.93} {'loss': 0.5591, 'learning_rate': 5.822080365640803e-08, 'epoch': 1.93} {'loss': 0.3808, 'learning_rate': 5.8185536549333345e-08, 'epoch': 1.93} {'loss': 0.5063, 'learning_rate': 5.815028009581114e-08, 'epoch': 1.93} {'loss': 0.482, 'learning_rate': 5.811503429587806e-08, 'epoch': 1.93} {'loss': 0.5144, 'learning_rate': 5.8079799149571844e-08, 'epoch': 1.93} {'loss': 0.5095, 'learning_rate': 5.804457465693025e-08, 'epoch': 1.93} {'loss': 0.5248, 'learning_rate': 5.800936081799102e-08, 'epoch': 1.93} {'loss': 0.3356, 'learning_rate': 5.797415763279302e-08, 'epoch': 1.93} {'loss': 0.5562, 'learning_rate': 5.793896510137287e-08, 'epoch': 1.93} {'loss': 0.4724, 'learning_rate': 5.790378322376722e-08, 'epoch': 1.93} {'loss': 0.4162, 'learning_rate': 5.7868612000016036e-08, 'epoch': 1.93} {'loss': 0.5678, 'learning_rate': 5.783345143015595e-08, 'epoch': 1.93} {'loss': 0.5041, 'learning_rate': 5.779830151422472e-08, 'epoch': 1.93} {'loss': 0.4485, 'learning_rate': 5.7763162252258976e-08, 'epoch': 1.93} {'loss': 0.6099, 'learning_rate': 5.772803364429869e-08, 'epoch': 1.93} {'loss': 0.5759, 'learning_rate': 5.769291569037938e-08, 'epoch': 1.93} {'loss': 0.512, 'learning_rate': 5.765780839053992e-08, 'epoch': 1.93} {'loss': 0.5653, 'learning_rate': 5.762271174481804e-08, 'epoch': 1.93} {'loss': 0.4595, 'learning_rate': 5.7587625753249276e-08, 'epoch': 1.93} {'loss': 0.4979, 'learning_rate': 5.75525504158736e-08, 'epoch': 1.93} {'loss': 0.4898, 'learning_rate': 5.751748573272653e-08, 'epoch': 1.93} {'loss': 0.4954, 'learning_rate': 5.748243170384804e-08, 'epoch': 1.93} {'loss': 0.312, 'learning_rate': 5.744738832927477e-08, 'epoch': 1.93} {'loss': 0.4245, 'learning_rate': 5.7412355609043346e-08, 'epoch': 1.93} {'loss': 0.4139, 'learning_rate': 5.7377333543192636e-08, 'epoch': 1.93} {'loss': 0.5249, 'learning_rate': 5.734232213175817e-08, 'epoch': 1.93} {'loss': 0.5158, 'learning_rate': 5.73073213747799e-08, 'epoch': 1.93} {'loss': 0.5606, 'learning_rate': 5.7272331272293367e-08, 'epoch': 1.93} {'loss': 0.6131, 'learning_rate': 5.723735182433743e-08, 'epoch': 1.93} {'loss': 0.4512, 'learning_rate': 5.720238303094983e-08, 'epoch': 1.93} {'loss': 0.456, 'learning_rate': 5.716742489216609e-08, 'epoch': 1.93} {'loss': 0.4826, 'learning_rate': 5.713247740802619e-08, 'epoch': 1.93} {'loss': 0.6028, 'learning_rate': 5.7097540578564536e-08, 'epoch': 1.93} {'loss': 0.5781, 'learning_rate': 5.706261440382111e-08, 'epoch': 1.93} {'loss': 0.5022, 'learning_rate': 5.702769888383253e-08, 'epoch': 1.93} {'loss': 0.4415, 'learning_rate': 5.6992794018635446e-08, 'epoch': 1.93} {'loss': 0.6375, 'learning_rate': 5.695789980826871e-08, 'epoch': 1.93} {'loss': 0.483, 'learning_rate': 5.692301625276897e-08, 'epoch': 1.93} {'loss': 0.4616, 'learning_rate': 5.688814335217396e-08, 'epoch': 1.93} {'loss': 0.4637, 'learning_rate': 5.685328110652033e-08, 'epoch': 1.93} {'loss': 0.4607, 'learning_rate': 5.681842951584582e-08, 'epoch': 1.93} {'loss': 0.46, 'learning_rate': 5.6783588580188176e-08, 'epoch': 1.93} {'loss': 0.548, 'learning_rate': 5.674875829958404e-08, 'epoch': 1.93} {'loss': 0.5021, 'learning_rate': 5.6713938674071156e-08, 'epoch': 1.93} {'loss': 0.4753, 'learning_rate': 5.6679129703686166e-08, 'epoch': 1.93} {'loss': 0.5812, 'learning_rate': 5.664433138846792e-08, 'epoch': 1.93} {'loss': 0.6251, 'learning_rate': 5.660954372845195e-08, 'epoch': 1.93} {'loss': 0.5466, 'learning_rate': 5.657476672367601e-08, 'epoch': 1.93} {'loss': 0.4411, 'learning_rate': 5.654000037417895e-08, 'epoch': 1.93} {'loss': 0.5087, 'learning_rate': 5.6505244679995185e-08, 'epoch': 1.93} {'loss': 0.3285, 'learning_rate': 5.647049964116469e-08, 'epoch': 1.93} {'loss': 0.4482, 'learning_rate': 5.643576525772299e-08, 'epoch': 1.93} {'loss': 0.5416, 'learning_rate': 5.640104152970782e-08, 'epoch': 1.93} {'loss': 0.5589, 'learning_rate': 5.636632845715584e-08, 'epoch': 1.93} {'loss': 0.7273, 'learning_rate': 5.633162604010589e-08, 'epoch': 1.93} {'loss': 0.4392, 'learning_rate': 5.629693427859351e-08, 'epoch': 1.93} {'loss': 0.4362, 'learning_rate': 5.626225317265643e-08, 'epoch': 1.93} {'loss': 0.3825, 'learning_rate': 5.622758272233242e-08, 'epoch': 1.93} {'loss': 0.443, 'learning_rate': 5.619292292765699e-08, 'epoch': 1.93} {'loss': 0.585, 'learning_rate': 5.615827378867012e-08, 'epoch': 1.93} {'loss': 0.3627, 'learning_rate': 5.61236353054051e-08, 'epoch': 1.93} {'loss': 0.4947, 'learning_rate': 5.608900747790191e-08, 'epoch': 1.93} {'loss': 0.5303, 'learning_rate': 5.6054390306197195e-08, 'epoch': 1.93} {'loss': 0.4846, 'learning_rate': 5.6019783790327574e-08, 'epoch': 1.93} {'loss': 0.5894, 'learning_rate': 5.5985187930329696e-08, 'epoch': 1.93} {'loss': 0.5166, 'learning_rate': 5.595060272624131e-08, 'epoch': 1.93} {'loss': 0.5048, 'learning_rate': 5.5916028178100157e-08, 'epoch': 1.93} {'loss': 0.5751, 'learning_rate': 5.5881464285941764e-08, 'epoch': 1.93} {'loss': 0.4466, 'learning_rate': 5.584691104980389e-08, 'epoch': 1.93} {'loss': 0.3797, 'learning_rate': 5.581236846972427e-08, 'epoch': 1.93} {'loss': 0.4106, 'learning_rate': 5.577783654573843e-08, 'epoch': 1.93} {'loss': 0.4729, 'learning_rate': 5.574331527788412e-08, 'epoch': 1.93} {'loss': 0.5567, 'learning_rate': 5.57088046661991e-08, 'epoch': 1.93} {'loss': 0.5359, 'learning_rate': 5.5674304710718887e-08, 'epoch': 1.93} {'loss': 0.5213, 'learning_rate': 5.5639815411481225e-08, 'epoch': 1.93} {'loss': 0.34, 'learning_rate': 5.560533676852387e-08, 'epoch': 1.93} {'loss': 0.4156, 'learning_rate': 5.5570868781882335e-08, 'epoch': 1.93} {'loss': 0.5493, 'learning_rate': 5.553641145159438e-08, 'epoch': 1.93} {'loss': 0.431, 'learning_rate': 5.550196477769665e-08, 'epoch': 1.93} {'loss': 0.475, 'learning_rate': 5.546752876022576e-08, 'epoch': 1.93} {'loss': 0.5364, 'learning_rate': 5.543310339921948e-08, 'epoch': 1.93} {'loss': 0.4647, 'learning_rate': 5.539868869471332e-08, 'epoch': 1.93} {'loss': 0.4863, 'learning_rate': 5.5364284646745035e-08, 'epoch': 1.93} {'loss': 0.3946, 'learning_rate': 5.532989125535238e-08, 'epoch': 1.93} {'loss': 0.4522, 'learning_rate': 5.529550852057086e-08, 'epoch': 1.93} {'loss': 0.4397, 'learning_rate': 5.526113644243825e-08, 'epoch': 1.93} {'loss': 0.567, 'learning_rate': 5.522677502099005e-08, 'epoch': 1.93} {'loss': 0.4787, 'learning_rate': 5.5192424256265145e-08, 'epoch': 1.93} {'loss': 0.5615, 'learning_rate': 5.515808414829793e-08, 'epoch': 1.93} {'loss': 0.6683, 'learning_rate': 5.512375469712727e-08, 'epoch': 1.93} {'loss': 0.5893, 'learning_rate': 5.50894359027887e-08, 'epoch': 1.93} {'loss': 0.5991, 'learning_rate': 5.505512776531885e-08, 'epoch': 1.93} {'loss': 0.581, 'learning_rate': 5.502083028475547e-08, 'epoch': 1.93} {'loss': 0.5116, 'learning_rate': 5.498654346113519e-08, 'epoch': 1.93} {'loss': 0.6295, 'learning_rate': 5.495226729449465e-08, 'epoch': 1.93} {'loss': 0.4937, 'learning_rate': 5.491800178486939e-08, 'epoch': 1.93} {'loss': 0.354, 'learning_rate': 5.4883746932297145e-08, 'epoch': 1.93} {'loss': 0.4876, 'learning_rate': 5.484950273681566e-08, 'epoch': 1.93} {'loss': 0.43, 'learning_rate': 5.4815269198459364e-08, 'epoch': 1.93} {'loss': 0.4723, 'learning_rate': 5.4781046317267103e-08, 'epoch': 1.93} {'loss': 0.4365, 'learning_rate': 5.47468340932733e-08, 'epoch': 1.93} {'loss': 0.4152, 'learning_rate': 5.4712632526516815e-08, 'epoch': 1.93} {'loss': 0.5097, 'learning_rate': 5.4678441617033174e-08, 'epoch': 1.93} {'loss': 0.4734, 'learning_rate': 5.464426136485901e-08, 'epoch': 1.93} {'loss': 0.5401, 'learning_rate': 5.461009177003207e-08, 'epoch': 1.93} {'loss': 0.4062, 'learning_rate': 5.457593283258678e-08, 'epoch': 1.93} {'loss': 0.5836, 'learning_rate': 5.454178455256198e-08, 'epoch': 1.93} {'loss': 0.6072, 'learning_rate': 5.450764692999322e-08, 'epoch': 1.93} {'loss': 0.4745, 'learning_rate': 5.447351996491601e-08, 'epoch': 1.93} {'loss': 0.4511, 'learning_rate': 5.4439403657369216e-08, 'epoch': 1.93} {'loss': 0.5597, 'learning_rate': 5.440529800738725e-08, 'epoch': 1.93} {'loss': 0.4244, 'learning_rate': 5.437120301500898e-08, 'epoch': 1.93} {'loss': 0.458, 'learning_rate': 5.4337118680268806e-08, 'epoch': 1.93} {'loss': 0.5933, 'learning_rate': 5.430304500320449e-08, 'epoch': 1.93} {'loss': 0.5914, 'learning_rate': 5.426898198385156e-08, 'epoch': 1.93} {'loss': 0.4308, 'learning_rate': 5.4234929622247744e-08, 'epoch': 1.93} {'loss': 0.5537, 'learning_rate': 5.420088791842748e-08, 'epoch': 1.93} {'loss': 0.4654, 'learning_rate': 5.416685687242962e-08, 'epoch': 1.93} {'loss': 0.5012, 'learning_rate': 5.4132836484289684e-08, 'epoch': 1.93} {'loss': 0.3661, 'learning_rate': 5.409882675404432e-08, 'epoch': 1.93} {'loss': 0.4667, 'learning_rate': 5.406482768172905e-08, 'epoch': 1.93} {'loss': 0.5127, 'learning_rate': 5.403083926738162e-08, 'epoch': 1.93} {'loss': 0.475, 'learning_rate': 5.399686151103756e-08, 'epoch': 1.93} {'loss': 0.5724, 'learning_rate': 5.3962894412733503e-08, 'epoch': 1.93} {'loss': 0.5698, 'learning_rate': 5.392893797250609e-08, 'epoch': 1.93} {'loss': 0.6276, 'learning_rate': 5.389499219039196e-08, 'epoch': 1.93} {'loss': 0.3855, 'learning_rate': 5.3861057066425525e-08, 'epoch': 1.93} {'loss': 0.5692, 'learning_rate': 5.3827132600645646e-08, 'epoch': 1.93} {'loss': 0.5219, 'learning_rate': 5.3793218793087855e-08, 'epoch': 1.93} {'loss': 0.657, 'learning_rate': 5.3759315643787666e-08, 'epoch': 1.93} {'loss': 0.453, 'learning_rate': 5.372542315278284e-08, 'epoch': 1.93} {'loss': 0.4538, 'learning_rate': 5.3691541320108896e-08, 'epoch': 1.93} {'loss': 0.4709, 'learning_rate': 5.3657670145801367e-08, 'epoch': 1.93} {'loss': 0.4732, 'learning_rate': 5.3623809629897996e-08, 'epoch': 1.93} {'loss': 0.6194, 'learning_rate': 5.358995977243431e-08, 'epoch': 1.93} {'loss': 0.6035, 'learning_rate': 5.355612057344695e-08, 'epoch': 1.93} {'loss': 0.5049, 'learning_rate': 5.3522292032971434e-08, 'epoch': 1.93} {'loss': 0.4264, 'learning_rate': 5.348847415104441e-08, 'epoch': 1.93} {'loss': 0.5864, 'learning_rate': 5.345466692770362e-08, 'epoch': 1.93} {'loss': 0.5594, 'learning_rate': 5.342087036298238e-08, 'epoch': 1.93} {'loss': 0.5482, 'learning_rate': 5.3387084456918424e-08, 'epoch': 1.93} {'loss': 0.4767, 'learning_rate': 5.33533092095484e-08, 'epoch': 1.93} {'loss': 0.4443, 'learning_rate': 5.3319544620907825e-08, 'epoch': 1.93} {'loss': 0.5979, 'learning_rate': 5.3285790691034457e-08, 'epoch': 1.93} {'loss': 0.4963, 'learning_rate': 5.325204741996048e-08, 'epoch': 1.93} {'loss': 0.2856, 'learning_rate': 5.321831480772699e-08, 'epoch': 1.93} {'loss': 0.5022, 'learning_rate': 5.318459285436728e-08, 'epoch': 1.93} {'loss': 0.4713, 'learning_rate': 5.315088155991688e-08, 'epoch': 1.93} {'loss': 0.6387, 'learning_rate': 5.3117180924414644e-08, 'epoch': 1.93} {'loss': 0.5868, 'learning_rate': 5.308349094789389e-08, 'epoch': 1.93} {'loss': 0.4034, 'learning_rate': 5.304981163039236e-08, 'epoch': 1.93} {'loss': 0.4062, 'learning_rate': 5.301614297194557e-08, 'epoch': 1.93} {'loss': 0.4406, 'learning_rate': 5.2982484972590176e-08, 'epoch': 1.93} {'loss': 0.5433, 'learning_rate': 5.2948837632361695e-08, 'epoch': 1.93} {'loss': 0.4046, 'learning_rate': 5.2915200951296766e-08, 'epoch': 1.93} {'loss': 0.4186, 'learning_rate': 5.288157492943091e-08, 'epoch': 1.93} {'loss': 0.5839, 'learning_rate': 5.2847959566798557e-08, 'epoch': 1.93} {'loss': 0.5304, 'learning_rate': 5.2814354863439664e-08, 'epoch': 1.93} {'loss': 0.6378, 'learning_rate': 5.278076081938643e-08, 'epoch': 1.93} {'loss': 0.4301, 'learning_rate': 5.274717743467661e-08, 'epoch': 1.93} {'loss': 0.5226, 'learning_rate': 5.271360470934683e-08, 'epoch': 1.93} {'loss': 0.5099, 'learning_rate': 5.268004264343152e-08, 'epoch': 1.93} {'loss': 0.5434, 'learning_rate': 5.26464912369673e-08, 'epoch': 1.93} {'loss': 0.4855, 'learning_rate': 5.261295048999082e-08, 'epoch': 1.93} {'loss': 0.4847, 'learning_rate': 5.25794204025365e-08, 'epoch': 1.93} {'loss': 0.3565, 'learning_rate': 5.254590097464096e-08, 'epoch': 1.93} {'loss': 0.5207, 'learning_rate': 5.2512392206341964e-08, 'epoch': 1.93} {'loss': 0.4821, 'learning_rate': 5.2478894097672814e-08, 'epoch': 1.93} {'loss': 0.4924, 'learning_rate': 5.244540664867015e-08, 'epoch': 1.93} {'loss': 0.6083, 'learning_rate': 5.2411929859370604e-08, 'epoch': 1.93} {'loss': 0.445, 'learning_rate': 5.237846372980859e-08, 'epoch': 1.94} {'loss': 0.5484, 'learning_rate': 5.234500826002076e-08, 'epoch': 1.94} {'loss': 0.4441, 'learning_rate': 5.2311563450043734e-08, 'epoch': 1.94} {'loss': 0.4818, 'learning_rate': 5.227812929991305e-08, 'epoch': 1.94} {'loss': 0.5902, 'learning_rate': 5.224470580966312e-08, 'epoch': 1.94} {'loss': 0.5882, 'learning_rate': 5.2211292979331696e-08, 'epoch': 1.94} {'loss': 0.4285, 'learning_rate': 5.21778908089543e-08, 'epoch': 1.94} {'loss': 0.5391, 'learning_rate': 5.214449929856424e-08, 'epoch': 1.94} {'loss': 0.4947, 'learning_rate': 5.211111844820149e-08, 'epoch': 1.94} {'loss': 0.4373, 'learning_rate': 5.207774825789713e-08, 'epoch': 1.94} {'loss': 0.4414, 'learning_rate': 5.204438872769113e-08, 'epoch': 1.94} {'loss': 0.4885, 'learning_rate': 5.2011039857616794e-08, 'epoch': 1.94} {'loss': 0.6909, 'learning_rate': 5.197770164771077e-08, 'epoch': 1.94} {'loss': 0.4208, 'learning_rate': 5.1944374098008566e-08, 'epoch': 1.94} {'loss': 0.4857, 'learning_rate': 5.1911057208544616e-08, 'epoch': 1.94} {'loss': 0.4993, 'learning_rate': 5.1877750979356655e-08, 'epoch': 1.94} {'loss': 0.5957, 'learning_rate': 5.184445541047911e-08, 'epoch': 1.94} {'loss': 0.4496, 'learning_rate': 5.181117050194973e-08, 'epoch': 1.94} {'loss': 0.5712, 'learning_rate': 5.17778962538007e-08, 'epoch': 1.94} {'loss': 0.4779, 'learning_rate': 5.174463266607088e-08, 'epoch': 1.94} {'loss': 0.2438, 'learning_rate': 5.17113797387947e-08, 'epoch': 1.94} {'loss': 0.4642, 'learning_rate': 5.167813747200545e-08, 'epoch': 1.94} {'loss': 0.3609, 'learning_rate': 5.1644905865743114e-08, 'epoch': 1.94} {'loss': 0.4857, 'learning_rate': 5.1611684920040984e-08, 'epoch': 1.94} {'loss': 0.5267, 'learning_rate': 5.157847463493348e-08, 'epoch': 1.94} {'loss': 0.4451, 'learning_rate': 5.154527501045836e-08, 'epoch': 1.94} {'loss': 0.3524, 'learning_rate': 5.1512086046651146e-08, 'epoch': 1.94} {'loss': 0.5051, 'learning_rate': 5.147890774354625e-08, 'epoch': 1.94} {'loss': 0.5294, 'learning_rate': 5.1445740101178085e-08, 'epoch': 1.94} {'loss': 0.3937, 'learning_rate': 5.141258311958552e-08, 'epoch': 1.94} {'loss': 0.473, 'learning_rate': 5.1379436798801865e-08, 'epoch': 1.94} {'loss': 0.4442, 'learning_rate': 5.134630113886263e-08, 'epoch': 1.94} {'loss': 0.4843, 'learning_rate': 5.131317613980446e-08, 'epoch': 1.94} {'loss': 0.5291, 'learning_rate': 5.128006180166178e-08, 'epoch': 1.94} {'loss': 0.5018, 'learning_rate': 5.124695812447012e-08, 'epoch': 1.94} {'loss': 0.5408, 'learning_rate': 5.121386510826498e-08, 'epoch': 1.94} {'loss': 0.6342, 'learning_rate': 5.118078275308303e-08, 'epoch': 1.94} {'loss': 0.4042, 'learning_rate': 5.114771105895866e-08, 'epoch': 1.94} {'loss': 0.4506, 'learning_rate': 5.111465002592741e-08, 'epoch': 1.94} {'loss': 0.4919, 'learning_rate': 5.108159965402482e-08, 'epoch': 1.94} {'loss': 0.5171, 'learning_rate': 5.104855994328528e-08, 'epoch': 1.94} {'loss': 0.5828, 'learning_rate': 5.101553089374656e-08, 'epoch': 1.94} {'loss': 0.5239, 'learning_rate': 5.098251250544195e-08, 'epoch': 1.94} {'loss': 0.6318, 'learning_rate': 5.094950477840699e-08, 'epoch': 1.94} {'loss': 0.3908, 'learning_rate': 5.091650771267831e-08, 'epoch': 1.94} {'loss': 0.5115, 'learning_rate': 5.088352130829033e-08, 'epoch': 1.94} {'loss': 0.3919, 'learning_rate': 5.0850545565279687e-08, 'epoch': 1.94} {'loss': 0.381, 'learning_rate': 5.0817580483678574e-08, 'epoch': 1.94} {'loss': 0.5965, 'learning_rate': 5.078462606352586e-08, 'epoch': 1.94} {'loss': 0.4943, 'learning_rate': 5.0751682304854835e-08, 'epoch': 1.94} {'loss': 0.4159, 'learning_rate': 5.071874920770214e-08, 'epoch': 1.94} {'loss': 0.3835, 'learning_rate': 5.0685826772101096e-08, 'epoch': 1.94} {'loss': 0.4475, 'learning_rate': 5.0652914998089444e-08, 'epoch': 1.94} {'loss': 0.5016, 'learning_rate': 5.062001388570048e-08, 'epoch': 1.94} {'loss': 0.4829, 'learning_rate': 5.058712343496974e-08, 'epoch': 1.94} {'loss': 0.3405, 'learning_rate': 5.0554243645933864e-08, 'epoch': 1.94} {'loss': 0.4268, 'learning_rate': 5.052137451862616e-08, 'epoch': 1.94} {'loss': 0.3447, 'learning_rate': 5.0488516053083245e-08, 'epoch': 1.94} {'loss': 0.3394, 'learning_rate': 5.0455668249339565e-08, 'epoch': 1.94} {'loss': 0.4993, 'learning_rate': 5.042283110743063e-08, 'epoch': 1.94} {'loss': 0.5765, 'learning_rate': 5.0390004627393073e-08, 'epoch': 1.94} {'loss': 0.4986, 'learning_rate': 5.035718880925911e-08, 'epoch': 1.94} {'loss': 0.4794, 'learning_rate': 5.0324383653065355e-08, 'epoch': 1.94} {'loss': 0.363, 'learning_rate': 5.0291589158847354e-08, 'epoch': 1.94} {'loss': 0.4832, 'learning_rate': 5.025880532664063e-08, 'epoch': 1.94} {'loss': 0.648, 'learning_rate': 5.022603215647848e-08, 'epoch': 1.94} {'loss': 0.4769, 'learning_rate': 5.019326964839755e-08, 'epoch': 1.94} {'loss': 0.5068, 'learning_rate': 5.0160517802433364e-08, 'epoch': 1.94} {'loss': 0.5094, 'learning_rate': 5.012777661861923e-08, 'epoch': 1.94} {'loss': 0.5381, 'learning_rate': 5.0095046096991785e-08, 'epoch': 1.94} {'loss': 0.5796, 'learning_rate': 5.006232623758544e-08, 'epoch': 1.94} {'loss': 0.3898, 'learning_rate': 5.002961704043463e-08, 'epoch': 1.94} {'loss': 0.4968, 'learning_rate': 4.9996918505575975e-08, 'epoch': 1.94} {'loss': 0.4474, 'learning_rate': 4.99642306330439e-08, 'epoch': 1.94} {'loss': 0.5098, 'learning_rate': 4.9931553422872814e-08, 'epoch': 1.94} {'loss': 0.4057, 'learning_rate': 4.989888687509825e-08, 'epoch': 1.94} {'loss': 0.4767, 'learning_rate': 4.986623098975463e-08, 'epoch': 1.94} {'loss': 0.4534, 'learning_rate': 4.983358576687747e-08, 'epoch': 1.94} {'loss': 0.3831, 'learning_rate': 4.980095120650119e-08, 'epoch': 1.94} {'loss': 0.3986, 'learning_rate': 4.9768327308662433e-08, 'epoch': 1.94} {'loss': 0.4685, 'learning_rate': 4.97357140733945e-08, 'epoch': 1.94} {'loss': 0.4557, 'learning_rate': 4.970311150073293e-08, 'epoch': 1.94} {'loss': 0.5684, 'learning_rate': 4.967051959071212e-08, 'epoch': 1.94} {'loss': 0.6626, 'learning_rate': 4.9637938343367607e-08, 'epoch': 1.94} {'loss': 0.5639, 'learning_rate': 4.9605367758733813e-08, 'epoch': 1.94} {'loss': 0.6624, 'learning_rate': 4.957280783684626e-08, 'epoch': 1.94} {'loss': 0.5103, 'learning_rate': 4.9540258577739364e-08, 'epoch': 1.94} {'loss': 0.5121, 'learning_rate': 4.9507719981448654e-08, 'epoch': 1.94} {'loss': 0.5097, 'learning_rate': 4.947519204800855e-08, 'epoch': 1.94} {'loss': 0.5913, 'learning_rate': 4.9442674777453456e-08, 'epoch': 1.94} {'loss': 0.4488, 'learning_rate': 4.941016816981892e-08, 'epoch': 1.94} {'loss': 0.4393, 'learning_rate': 4.937767222513934e-08, 'epoch': 1.94} {'loss': 0.5725, 'learning_rate': 4.934518694344914e-08, 'epoch': 1.94} {'loss': 0.463, 'learning_rate': 4.931271232478385e-08, 'epoch': 1.94} {'loss': 0.5046, 'learning_rate': 4.9280248369178994e-08, 'epoch': 1.94} {'loss': 0.3679, 'learning_rate': 4.924779507666788e-08, 'epoch': 1.94} {'loss': 0.4994, 'learning_rate': 4.921535244728604e-08, 'epoch': 1.94} {'loss': 0.4947, 'learning_rate': 4.9182920481067875e-08, 'epoch': 1.94} {'loss': 0.6023, 'learning_rate': 4.915049917804782e-08, 'epoch': 1.94} {'loss': 0.3694, 'learning_rate': 4.91180885382625e-08, 'epoch': 1.94} {'loss': 0.4485, 'learning_rate': 4.908568856174412e-08, 'epoch': 1.94} {'loss': 0.5249, 'learning_rate': 4.905329924852931e-08, 'epoch': 1.94} {'loss': 0.557, 'learning_rate': 4.9020920598651375e-08, 'epoch': 1.94} {'loss': 0.6146, 'learning_rate': 4.898855261214586e-08, 'epoch': 1.94} {'loss': 0.4898, 'learning_rate': 4.895619528904716e-08, 'epoch': 1.94} {'loss': 0.3833, 'learning_rate': 4.8923848629389704e-08, 'epoch': 1.94} {'loss': 0.6789, 'learning_rate': 4.889151263320902e-08, 'epoch': 1.94} {'loss': 0.6187, 'learning_rate': 4.8859187300538405e-08, 'epoch': 1.94} {'loss': 0.609, 'learning_rate': 4.88268726314145e-08, 'epoch': 1.94} {'loss': 0.4582, 'learning_rate': 4.879456862587062e-08, 'epoch': 1.94} {'loss': 0.5245, 'learning_rate': 4.8762275283941175e-08, 'epoch': 1.94} {'loss': 0.5719, 'learning_rate': 4.8729992605660583e-08, 'epoch': 1.94} {'loss': 0.4884, 'learning_rate': 4.869772059106437e-08, 'epoch': 1.94} {'loss': 0.4292, 'learning_rate': 4.866545924018695e-08, 'epoch': 1.94} {'loss': 0.4446, 'learning_rate': 4.863320855306275e-08, 'epoch': 1.94} {'loss': 0.5101, 'learning_rate': 4.8600968529726176e-08, 'epoch': 1.94} {'loss': 0.5305, 'learning_rate': 4.856873917021166e-08, 'epoch': 1.94} {'loss': 0.542, 'learning_rate': 4.8536520474553596e-08, 'epoch': 1.94} {'loss': 0.4497, 'learning_rate': 4.850431244278753e-08, 'epoch': 1.94} {'loss': 0.4454, 'learning_rate': 4.8472115074945646e-08, 'epoch': 1.94} {'loss': 0.5228, 'learning_rate': 4.8439928371065705e-08, 'epoch': 1.94} {'loss': 0.6283, 'learning_rate': 4.840775233117989e-08, 'epoch': 1.94} {'loss': 0.3847, 'learning_rate': 4.837558695532374e-08, 'epoch': 1.94} {'loss': 0.4676, 'learning_rate': 4.8343432243531664e-08, 'epoch': 1.94} {'loss': 0.5354, 'learning_rate': 4.831128819583697e-08, 'epoch': 1.94} {'loss': 0.4726, 'learning_rate': 4.8279154812276295e-08, 'epoch': 1.94} {'loss': 0.4743, 'learning_rate': 4.824703209288073e-08, 'epoch': 1.94} {'loss': 0.6448, 'learning_rate': 4.8214920037688016e-08, 'epoch': 1.94} {'loss': 0.5398, 'learning_rate': 4.818281864673036e-08, 'epoch': 1.94} {'loss': 0.4523, 'learning_rate': 4.815072792004327e-08, 'epoch': 1.94} {'loss': 0.4311, 'learning_rate': 4.811864785766229e-08, 'epoch': 1.94} {'loss': 0.3825, 'learning_rate': 4.8086578459618504e-08, 'epoch': 1.94} {'loss': 0.4469, 'learning_rate': 4.805451972594966e-08, 'epoch': 1.94} {'loss': 0.5066, 'learning_rate': 4.802247165668683e-08, 'epoch': 1.94} {'loss': 0.3167, 'learning_rate': 4.799043425186778e-08, 'epoch': 1.94} {'loss': 0.2777, 'learning_rate': 4.79584075115247e-08, 'epoch': 1.94} {'loss': 0.4251, 'learning_rate': 4.7926391435692e-08, 'epoch': 1.94} {'loss': 0.5415, 'learning_rate': 4.789438602440521e-08, 'epoch': 1.94} {'loss': 0.46, 'learning_rate': 4.786239127769654e-08, 'epoch': 1.94} {'loss': 0.3324, 'learning_rate': 4.783040719560261e-08, 'epoch': 1.94} {'loss': 0.566, 'learning_rate': 4.779843377815563e-08, 'epoch': 1.94} {'loss': 0.4555, 'learning_rate': 4.776647102539222e-08, 'epoch': 1.94} {'loss': 0.6094, 'learning_rate': 4.77345189373446e-08, 'epoch': 1.94} {'loss': 0.4655, 'learning_rate': 4.7702577514047164e-08, 'epoch': 1.94} {'loss': 0.3975, 'learning_rate': 4.7670646755536564e-08, 'epoch': 1.94} {'loss': 0.5904, 'learning_rate': 4.763872666184277e-08, 'epoch': 1.94} {'loss': 0.3389, 'learning_rate': 4.760681723300353e-08, 'epoch': 1.94} {'loss': 0.4222, 'learning_rate': 4.757491846905105e-08, 'epoch': 1.94} {'loss': 0.5311, 'learning_rate': 4.754303037002195e-08, 'epoch': 1.94} {'loss': 0.4897, 'learning_rate': 4.751115293594732e-08, 'epoch': 1.94} {'loss': 0.5384, 'learning_rate': 4.74792861668627e-08, 'epoch': 1.94} {'loss': 0.6371, 'learning_rate': 4.7447430062803615e-08, 'epoch': 1.94} {'loss': 0.5529, 'learning_rate': 4.741558462380114e-08, 'epoch': 1.94} {'loss': 0.4471, 'learning_rate': 4.7383749849893026e-08, 'epoch': 1.94} {'loss': 0.4642, 'learning_rate': 4.735192574110925e-08, 'epoch': 1.94} {'loss': 0.5608, 'learning_rate': 4.732011229748868e-08, 'epoch': 1.94} {'loss': 0.4915, 'learning_rate': 4.728830951906127e-08, 'epoch': 1.94} {'loss': 0.6026, 'learning_rate': 4.7256517405862566e-08, 'epoch': 1.94} {'loss': 0.6245, 'learning_rate': 4.7224735957928095e-08, 'epoch': 1.94} {'loss': 0.5045, 'learning_rate': 4.719296517528893e-08, 'epoch': 1.94} {'loss': 0.377, 'learning_rate': 4.716120505798283e-08, 'epoch': 1.94} {'loss': 0.5137, 'learning_rate': 4.712945560604088e-08, 'epoch': 1.94} {'loss': 0.5229, 'learning_rate': 4.7097716819497486e-08, 'epoch': 1.94} {'loss': 0.662, 'learning_rate': 4.706598869838708e-08, 'epoch': 1.94} {'loss': 0.447, 'learning_rate': 4.7034271242744065e-08, 'epoch': 1.94} {'loss': 0.534, 'learning_rate': 4.700256445260287e-08, 'epoch': 1.94} {'loss': 0.5428, 'learning_rate': 4.697086832799569e-08, 'epoch': 1.94} {'loss': 0.5736, 'learning_rate': 4.6939182868958044e-08, 'epoch': 1.94} {'loss': 0.4424, 'learning_rate': 4.6907508075523245e-08, 'epoch': 1.94} {'loss': 0.3885, 'learning_rate': 4.6875843947725705e-08, 'epoch': 1.94} {'loss': 0.3912, 'learning_rate': 4.684419048559874e-08, 'epoch': 1.94} {'loss': 0.5227, 'learning_rate': 4.681254768917676e-08, 'epoch': 1.94} {'loss': 0.5457, 'learning_rate': 4.6780915558494175e-08, 'epoch': 1.94} {'loss': 0.6594, 'learning_rate': 4.6749294093582084e-08, 'epoch': 1.94} {'loss': 0.5629, 'learning_rate': 4.6717683294478234e-08, 'epoch': 1.94} {'loss': 0.5412, 'learning_rate': 4.668608316121481e-08, 'epoch': 1.94} {'loss': 0.5211, 'learning_rate': 4.665449369382402e-08, 'epoch': 1.94} {'loss': 0.432, 'learning_rate': 4.66229148923425e-08, 'epoch': 1.94} {'loss': 0.5628, 'learning_rate': 4.659134675680243e-08, 'epoch': 1.94} {'loss': 0.4253, 'learning_rate': 4.6559789287239365e-08, 'epoch': 1.94} {'loss': 0.4973, 'learning_rate': 4.652824248368437e-08, 'epoch': 1.94} {'loss': 0.5698, 'learning_rate': 4.6496706346172984e-08, 'epoch': 1.94} {'loss': 0.3552, 'learning_rate': 4.6465180874738506e-08, 'epoch': 1.94} {'loss': 0.5449, 'learning_rate': 4.643366606941535e-08, 'epoch': 1.94} {'loss': 0.5262, 'learning_rate': 4.640216193023683e-08, 'epoch': 1.94} {'loss': 0.6526, 'learning_rate': 4.637066845723626e-08, 'epoch': 1.94} {'loss': 0.5141, 'learning_rate': 4.6339185650449145e-08, 'epoch': 1.94} {'loss': 0.6253, 'learning_rate': 4.6307713509907704e-08, 'epoch': 1.94} {'loss': 0.657, 'learning_rate': 4.627625203564523e-08, 'epoch': 1.94} {'loss': 0.6302, 'learning_rate': 4.624480122769615e-08, 'epoch': 1.94} {'loss': 0.5494, 'learning_rate': 4.6213361086093756e-08, 'epoch': 1.94} {'loss': 0.5139, 'learning_rate': 4.6181931610872476e-08, 'epoch': 1.94} {'loss': 0.5982, 'learning_rate': 4.6150512802066725e-08, 'epoch': 1.94} {'loss': 0.5084, 'learning_rate': 4.6119104659708704e-08, 'epoch': 1.94} {'loss': 0.393, 'learning_rate': 4.608770718383171e-08, 'epoch': 1.94} {'loss': 0.3993, 'learning_rate': 4.6056320374470164e-08, 'epoch': 1.94} {'loss': 0.4821, 'learning_rate': 4.6024944231657376e-08, 'epoch': 1.94} {'loss': 0.3987, 'learning_rate': 4.5993578755427756e-08, 'epoch': 1.94} {'loss': 0.4806, 'learning_rate': 4.5962223945814624e-08, 'epoch': 1.94} {'loss': 0.4553, 'learning_rate': 4.5930879802851266e-08, 'epoch': 1.94} {'loss': 0.4415, 'learning_rate': 4.589954632657212e-08, 'epoch': 1.94} {'loss': 0.4713, 'learning_rate': 4.586822351700826e-08, 'epoch': 1.94} {'loss': 0.3943, 'learning_rate': 4.583691137419632e-08, 'epoch': 1.94} {'loss': 0.6259, 'learning_rate': 4.580560989816851e-08, 'epoch': 1.94} {'loss': 0.5068, 'learning_rate': 4.577431908895813e-08, 'epoch': 1.94} {'loss': 0.6225, 'learning_rate': 4.574303894659959e-08, 'epoch': 1.94} {'loss': 0.5366, 'learning_rate': 4.57117694711251e-08, 'epoch': 1.94} {'loss': 0.5965, 'learning_rate': 4.568051066256796e-08, 'epoch': 1.94} {'loss': 0.5178, 'learning_rate': 4.564926252096369e-08, 'epoch': 1.94} {'loss': 0.4057, 'learning_rate': 4.561802504634449e-08, 'epoch': 1.94} {'loss': 0.4811, 'learning_rate': 4.558679823874479e-08, 'epoch': 1.94} {'loss': 0.4087, 'learning_rate': 4.555558209819677e-08, 'epoch': 1.94} {'loss': 0.2386, 'learning_rate': 4.552437662473375e-08, 'epoch': 1.94} {'loss': 0.4522, 'learning_rate': 4.549318181839013e-08, 'epoch': 1.94} {'loss': 0.4073, 'learning_rate': 4.5461997679199235e-08, 'epoch': 1.94} {'loss': 0.5642, 'learning_rate': 4.543082420719436e-08, 'epoch': 1.94} {'loss': 0.4107, 'learning_rate': 4.5399661402408814e-08, 'epoch': 1.94} {'loss': 0.5564, 'learning_rate': 4.5368509264875904e-08, 'epoch': 1.94} {'loss': 0.6063, 'learning_rate': 4.5337367794628937e-08, 'epoch': 1.94} {'loss': 0.4408, 'learning_rate': 4.530623699170122e-08, 'epoch': 1.94} {'loss': 0.5008, 'learning_rate': 4.527511685612718e-08, 'epoch': 1.94} {'loss': 0.3746, 'learning_rate': 4.5244007387938996e-08, 'epoch': 1.94} {'loss': 0.4087, 'learning_rate': 4.521290858716998e-08, 'epoch': 1.94} {'loss': 0.6334, 'learning_rate': 4.5181820453853444e-08, 'epoch': 1.94} {'loss': 0.6196, 'learning_rate': 4.51507429880238e-08, 'epoch': 1.94} {'loss': 0.5134, 'learning_rate': 4.5119676189713244e-08, 'epoch': 1.94} {'loss': 0.4301, 'learning_rate': 4.50886200589562e-08, 'epoch': 1.94} {'loss': 0.5117, 'learning_rate': 4.505757459578375e-08, 'epoch': 1.94} {'loss': 0.6015, 'learning_rate': 4.502653980023142e-08, 'epoch': 1.94} {'loss': 0.4626, 'learning_rate': 4.4995515672331405e-08, 'epoch': 1.94} {'loss': 0.5169, 'learning_rate': 4.496450221211812e-08, 'epoch': 1.94} {'loss': 0.465, 'learning_rate': 4.493349941962266e-08, 'epoch': 1.94} {'loss': 0.5831, 'learning_rate': 4.490250729488055e-08, 'epoch': 1.94} {'loss': 0.5649, 'learning_rate': 4.487152583792287e-08, 'epoch': 1.94} {'loss': 0.5735, 'learning_rate': 4.484055504878515e-08, 'epoch': 1.94} {'loss': 0.5414, 'learning_rate': 4.480959492749737e-08, 'epoch': 1.94} {'loss': 0.549, 'learning_rate': 4.477864547409616e-08, 'epoch': 1.94} {'loss': 0.4396, 'learning_rate': 4.474770668861261e-08, 'epoch': 1.94} {'loss': 0.3727, 'learning_rate': 4.4716778571080034e-08, 'epoch': 1.94} {'loss': 0.6136, 'learning_rate': 4.4685861121532836e-08, 'epoch': 1.94} {'loss': 0.4152, 'learning_rate': 4.465495434000322e-08, 'epoch': 1.94} {'loss': 0.5098, 'learning_rate': 4.462405822652338e-08, 'epoch': 1.94} {'loss': 0.5757, 'learning_rate': 4.459317278112774e-08, 'epoch': 1.94} {'loss': 0.5212, 'learning_rate': 4.4562298003849594e-08, 'epoch': 1.94} {'loss': 0.4186, 'learning_rate': 4.4531433894721146e-08, 'epoch': 1.94} {'loss': 0.5861, 'learning_rate': 4.45005804537757e-08, 'epoch': 1.94} {'loss': 0.5731, 'learning_rate': 4.4469737681046564e-08, 'epoch': 1.94} {'loss': 0.4345, 'learning_rate': 4.443890557656705e-08, 'epoch': 1.94} {'loss': 0.5133, 'learning_rate': 4.4408084140369344e-08, 'epoch': 1.94} {'loss': 0.382, 'learning_rate': 4.437727337248676e-08, 'epoch': 1.94} {'loss': 0.467, 'learning_rate': 4.43464732729526e-08, 'epoch': 1.94} {'loss': 0.6603, 'learning_rate': 4.431568384180018e-08, 'epoch': 1.94} {'loss': 0.3509, 'learning_rate': 4.4284905079061693e-08, 'epoch': 1.94} {'loss': 0.386, 'learning_rate': 4.4254136984770435e-08, 'epoch': 1.94} {'loss': 0.4478, 'learning_rate': 4.4223379558959725e-08, 'epoch': 1.94} {'loss': 0.5923, 'learning_rate': 4.419263280166175e-08, 'epoch': 1.94} {'loss': 0.4942, 'learning_rate': 4.416189671290982e-08, 'epoch': 1.94} {'loss': 0.4827, 'learning_rate': 4.413117129273725e-08, 'epoch': 1.94} {'loss': 0.5795, 'learning_rate': 4.410045654117734e-08, 'epoch': 1.94} {'loss': 0.4065, 'learning_rate': 4.4069752458261173e-08, 'epoch': 1.94} {'loss': 0.5134, 'learning_rate': 4.4039059044024276e-08, 'epoch': 1.94} {'loss': 0.274, 'learning_rate': 4.4008376298496634e-08, 'epoch': 1.94} {'loss': 0.3938, 'learning_rate': 4.397770422171377e-08, 'epoch': 1.94} {'loss': 0.4838, 'learning_rate': 4.3947042813706763e-08, 'epoch': 1.94} {'loss': 0.5033, 'learning_rate': 4.391639207450893e-08, 'epoch': 1.94} {'loss': 0.6761, 'learning_rate': 4.388575200415357e-08, 'epoch': 1.94} {'loss': 0.6528, 'learning_rate': 4.385512260267399e-08, 'epoch': 1.94} {'loss': 0.5653, 'learning_rate': 4.382450387010129e-08, 'epoch': 1.94} {'loss': 0.5133, 'learning_rate': 4.3793895806468756e-08, 'epoch': 1.94} {'loss': 0.5177, 'learning_rate': 4.376329841181082e-08, 'epoch': 1.94} {'loss': 0.6242, 'learning_rate': 4.3732711686158556e-08, 'epoch': 1.94} {'loss': 0.5362, 'learning_rate': 4.3702135629545283e-08, 'epoch': 1.94} {'loss': 0.3643, 'learning_rate': 4.3671570242004305e-08, 'epoch': 1.94} {'loss': 0.474, 'learning_rate': 4.36410155235667e-08, 'epoch': 1.94} {'loss': 0.572, 'learning_rate': 4.361047147426689e-08, 'epoch': 1.94} {'loss': 0.5426, 'learning_rate': 4.357993809413819e-08, 'epoch': 1.94} {'loss': 0.304, 'learning_rate': 4.354941538321056e-08, 'epoch': 1.94} {'loss': 0.6334, 'learning_rate': 4.3518903341519535e-08, 'epoch': 1.94} {'loss': 0.5294, 'learning_rate': 4.34884019690962e-08, 'epoch': 1.94} {'loss': 0.52, 'learning_rate': 4.345791126597387e-08, 'epoch': 1.94} {'loss': 0.3151, 'learning_rate': 4.342743123218474e-08, 'epoch': 1.94} {'loss': 0.4694, 'learning_rate': 4.339696186776099e-08, 'epoch': 1.94} {'loss': 0.4705, 'learning_rate': 4.336650317273816e-08, 'epoch': 1.94} {'loss': 0.5133, 'learning_rate': 4.333605514714512e-08, 'epoch': 1.94} {'loss': 0.6056, 'learning_rate': 4.3305617791016274e-08, 'epoch': 1.94} {'loss': 0.4307, 'learning_rate': 4.327519110438383e-08, 'epoch': 1.94} {'loss': 0.4103, 'learning_rate': 4.3244775087281086e-08, 'epoch': 1.94} {'loss': 0.4828, 'learning_rate': 4.3214369739740244e-08, 'epoch': 1.94} {'loss': 0.4753, 'learning_rate': 4.3183975061794614e-08, 'epoch': 1.94} {'loss': 0.5644, 'learning_rate': 4.315359105347528e-08, 'epoch': 1.94} {'loss': 0.4001, 'learning_rate': 4.312321771481553e-08, 'epoch': 1.94} {'loss': 0.5827, 'learning_rate': 4.3092855045847595e-08, 'epoch': 1.94} {'loss': 0.6068, 'learning_rate': 4.3062503046604756e-08, 'epoch': 1.94} {'loss': 0.5585, 'learning_rate': 4.3032161717119216e-08, 'epoch': 1.94} {'loss': 0.4735, 'learning_rate': 4.300183105742317e-08, 'epoch': 1.94} {'loss': 0.4606, 'learning_rate': 4.2971511067549933e-08, 'epoch': 1.94} {'loss': 0.4028, 'learning_rate': 4.294120174753058e-08, 'epoch': 1.94} {'loss': 0.5658, 'learning_rate': 4.2910903097398424e-08, 'epoch': 1.94} {'loss': 0.448, 'learning_rate': 4.2880615117186775e-08, 'epoch': 1.94} {'loss': 0.3828, 'learning_rate': 4.28503378069256e-08, 'epoch': 1.94} {'loss': 0.6201, 'learning_rate': 4.282007116665043e-08, 'epoch': 1.94} {'loss': 0.591, 'learning_rate': 4.2789815196392356e-08, 'epoch': 1.94} {'loss': 0.6678, 'learning_rate': 4.275956989618246e-08, 'epoch': 1.94} {'loss': 0.3876, 'learning_rate': 4.272933526605516e-08, 'epoch': 1.94} {'loss': 0.5138, 'learning_rate': 4.2699111306041543e-08, 'epoch': 1.94} {'loss': 0.562, 'learning_rate': 4.266889801617602e-08, 'epoch': 1.94} {'loss': 0.4905, 'learning_rate': 4.263869539648857e-08, 'epoch': 1.94} {'loss': 0.5461, 'learning_rate': 4.260850344701139e-08, 'epoch': 1.94} {'loss': 0.5523, 'learning_rate': 4.2578322167778906e-08, 'epoch': 1.94} {'loss': 0.499, 'learning_rate': 4.25481515588233e-08, 'epoch': 1.94} {'loss': 0.448, 'learning_rate': 4.251799162017456e-08, 'epoch': 1.94} {'loss': 0.5428, 'learning_rate': 4.2487842351867094e-08, 'epoch': 1.94} {'loss': 0.395, 'learning_rate': 4.24577037539331e-08, 'epoch': 1.94} {'loss': 0.468, 'learning_rate': 4.2427575826403666e-08, 'epoch': 1.94} {'loss': 0.6023, 'learning_rate': 4.23974585693121e-08, 'epoch': 1.94} {'loss': 0.5055, 'learning_rate': 4.2367351982690595e-08, 'epoch': 1.94} {'loss': 0.5026, 'learning_rate': 4.233725606657135e-08, 'epoch': 1.94} {'loss': 0.5423, 'learning_rate': 4.230717082098546e-08, 'epoch': 1.94} {'loss': 0.5167, 'learning_rate': 4.2277096245967316e-08, 'epoch': 1.94} {'loss': 0.4845, 'learning_rate': 4.224703234154692e-08, 'epoch': 1.94} {'loss': 0.4844, 'learning_rate': 4.221697910775868e-08, 'epoch': 1.94} {'loss': 0.5493, 'learning_rate': 4.2186936544632575e-08, 'epoch': 1.94} {'loss': 0.5667, 'learning_rate': 4.2156904652203015e-08, 'epoch': 1.94} {'loss': 0.3899, 'learning_rate': 4.2126883430501084e-08, 'epoch': 1.94} {'loss': 0.547, 'learning_rate': 4.209687287955788e-08, 'epoch': 1.94} {'loss': 0.5637, 'learning_rate': 4.2066872999407816e-08, 'epoch': 1.94} {'loss': 0.5162, 'learning_rate': 4.203688379008086e-08, 'epoch': 1.94} {'loss': 0.6147, 'learning_rate': 4.200690525161033e-08, 'epoch': 1.94} {'loss': 0.4939, 'learning_rate': 4.1976937384028415e-08, 'epoch': 1.94} {'loss': 0.5054, 'learning_rate': 4.194698018736731e-08, 'epoch': 1.94} {'loss': 0.5903, 'learning_rate': 4.191703366165811e-08, 'epoch': 1.94} {'loss': 0.6207, 'learning_rate': 4.188709780693412e-08, 'epoch': 1.94} {'loss': 0.5693, 'learning_rate': 4.185717262322642e-08, 'epoch': 1.94} {'loss': 0.5183, 'learning_rate': 4.182725811056832e-08, 'epoch': 1.94} {'loss': 0.5363, 'learning_rate': 4.1797354268989785e-08, 'epoch': 1.94} {'loss': 0.5341, 'learning_rate': 4.1767461098525255e-08, 'epoch': 1.94} {'loss': 0.6108, 'learning_rate': 4.1737578599205795e-08, 'epoch': 1.94} {'loss': 0.5331, 'learning_rate': 4.170770677106251e-08, 'epoch': 1.94} {'loss': 0.5623, 'learning_rate': 4.167784561412869e-08, 'epoch': 1.94} {'loss': 0.3855, 'learning_rate': 4.1647995128435426e-08, 'epoch': 1.94} {'loss': 0.3451, 'learning_rate': 4.161815531401603e-08, 'epoch': 1.94} {'loss': 0.5933, 'learning_rate': 4.158832617090047e-08, 'epoch': 1.94} {'loss': 0.5544, 'learning_rate': 4.155850769912206e-08, 'epoch': 1.94} {'loss': 0.452, 'learning_rate': 4.1528699898712996e-08, 'epoch': 1.94} {'loss': 0.4863, 'learning_rate': 4.149890276970547e-08, 'epoch': 1.94} {'loss': 0.5972, 'learning_rate': 4.146911631212947e-08, 'epoch': 1.94} {'loss': 0.4976, 'learning_rate': 4.143934052601828e-08, 'epoch': 1.94} {'loss': 0.4655, 'learning_rate': 4.1409575411403e-08, 'epoch': 1.94} {'loss': 0.3634, 'learning_rate': 4.137982096831694e-08, 'epoch': 1.94} {'loss': 0.3882, 'learning_rate': 4.135007719679118e-08, 'epoch': 1.94} {'loss': 0.3832, 'learning_rate': 4.1320344096857926e-08, 'epoch': 1.94} {'loss': 0.4575, 'learning_rate': 4.129062166854936e-08, 'epoch': 1.94} {'loss': 0.5911, 'learning_rate': 4.1260909911895463e-08, 'epoch': 1.94} {'loss': 0.4676, 'learning_rate': 4.123120882692955e-08, 'epoch': 1.94} {'loss': 0.5479, 'learning_rate': 4.1201518413683803e-08, 'epoch': 1.94} {'loss': 0.5158, 'learning_rate': 4.1171838672188215e-08, 'epoch': 1.94} {'loss': 0.511, 'learning_rate': 4.114216960247719e-08, 'epoch': 1.94} {'loss': 0.3545, 'learning_rate': 4.111251120458071e-08, 'epoch': 1.94} {'loss': 0.4868, 'learning_rate': 4.108286347853096e-08, 'epoch': 1.94} {'loss': 0.5151, 'learning_rate': 4.105322642436016e-08, 'epoch': 1.94} {'loss': 0.4569, 'learning_rate': 4.102360004209938e-08, 'epoch': 1.94} {'loss': 0.5088, 'learning_rate': 4.099398433178081e-08, 'epoch': 1.94} {'loss': 0.6172, 'learning_rate': 4.096437929343555e-08, 'epoch': 1.94} {'loss': 0.4986, 'learning_rate': 4.093478492709579e-08, 'epoch': 1.94} {'loss': 0.4632, 'learning_rate': 4.0905201232793733e-08, 'epoch': 1.94} {'loss': 0.5709, 'learning_rate': 4.087562821056046e-08, 'epoch': 1.94} {'loss': 0.5091, 'learning_rate': 4.084606586042816e-08, 'epoch': 1.94} {'loss': 0.6504, 'learning_rate': 4.081651418242793e-08, 'epoch': 1.94} {'loss': 0.5482, 'learning_rate': 4.078697317659086e-08, 'epoch': 1.94} {'loss': 0.6188, 'learning_rate': 4.075744284295024e-08, 'epoch': 1.94} {'loss': 0.4221, 'learning_rate': 4.072792318153718e-08, 'epoch': 1.94} {'loss': 0.4922, 'learning_rate': 4.069841419238274e-08, 'epoch': 1.94} {'loss': 0.5615, 'learning_rate': 4.066891587551913e-08, 'epoch': 1.94} {'loss': 0.334, 'learning_rate': 4.063942823097744e-08, 'epoch': 1.94} {'loss': 0.4404, 'learning_rate': 4.060995125878875e-08, 'epoch': 1.94} {'loss': 0.4461, 'learning_rate': 4.058048495898636e-08, 'epoch': 1.94} {'loss': 0.7062, 'learning_rate': 4.0551029331600266e-08, 'epoch': 1.94} {'loss': 0.5004, 'learning_rate': 4.052158437666265e-08, 'epoch': 1.94} {'loss': 0.5372, 'learning_rate': 4.0492150094205705e-08, 'epoch': 1.94} {'loss': 0.442, 'learning_rate': 4.046272648425942e-08, 'epoch': 1.94} {'loss': 0.552, 'learning_rate': 4.043331354685709e-08, 'epoch': 1.94} {'loss': 0.4584, 'learning_rate': 4.0403911282028696e-08, 'epoch': 1.94} {'loss': 0.5216, 'learning_rate': 4.0374519689807543e-08, 'epoch': 1.94} {'loss': 0.4359, 'learning_rate': 4.0345138770222503e-08, 'epoch': 1.94} {'loss': 0.5039, 'learning_rate': 4.0315768523306875e-08, 'epoch': 1.94} {'loss': 0.3717, 'learning_rate': 4.028640894909286e-08, 'epoch': 1.94} {'loss': 0.5509, 'learning_rate': 4.025706004760932e-08, 'epoch': 1.94} {'loss': 0.6878, 'learning_rate': 4.0227721818890676e-08, 'epoch': 1.94} {'loss': 0.4676, 'learning_rate': 4.019839426296579e-08, 'epoch': 1.94} {'loss': 0.5331, 'learning_rate': 4.016907737986908e-08, 'epoch': 1.94} {'loss': 0.4894, 'learning_rate': 4.0139771169628304e-08, 'epoch': 1.94} {'loss': 0.5891, 'learning_rate': 4.011047563227788e-08, 'epoch': 1.94} {'loss': 0.4835, 'learning_rate': 4.008119076784667e-08, 'epoch': 1.94} {'loss': 0.5229, 'learning_rate': 4.0051916576367976e-08, 'epoch': 1.94} {'loss': 0.5012, 'learning_rate': 4.002265305787401e-08, 'epoch': 1.94} {'loss': 0.6302, 'learning_rate': 3.999340021239251e-08, 'epoch': 1.94} {'loss': 0.5117, 'learning_rate': 3.996415803995901e-08, 'epoch': 1.94} {'loss': 0.5518, 'learning_rate': 3.993492654060127e-08, 'epoch': 1.94} {'loss': 0.3616, 'learning_rate': 3.99057057143526e-08, 'epoch': 1.94} {'loss': 0.5732, 'learning_rate': 3.9876495561244065e-08, 'epoch': 1.94} {'loss': 0.5132, 'learning_rate': 3.984729608130677e-08, 'epoch': 1.94} {'loss': 0.4944, 'learning_rate': 3.9818107274572914e-08, 'epoch': 1.94} {'loss': 0.5617, 'learning_rate': 3.978892914107135e-08, 'epoch': 1.94} {'loss': 0.4431, 'learning_rate': 3.975976168083651e-08, 'epoch': 1.94} {'loss': 0.6108, 'learning_rate': 3.973060489389613e-08, 'epoch': 1.94} {'loss': 0.6532, 'learning_rate': 3.970145878028575e-08, 'epoch': 1.94} {'loss': 0.6134, 'learning_rate': 3.9672323340033125e-08, 'epoch': 1.94} {'loss': 0.4943, 'learning_rate': 3.964319857317045e-08, 'epoch': 1.94} {'loss': 0.4066, 'learning_rate': 3.961408447972881e-08, 'epoch': 1.94} {'loss': 0.4222, 'learning_rate': 3.958498105973929e-08, 'epoch': 1.94} {'loss': 0.5277, 'learning_rate': 3.9555888313235204e-08, 'epoch': 1.94} {'loss': 0.5333, 'learning_rate': 3.95268062402443e-08, 'epoch': 1.94} {'loss': 0.5085, 'learning_rate': 3.9497734840799885e-08, 'epoch': 1.94} {'loss': 0.6563, 'learning_rate': 3.946867411493305e-08, 'epoch': 1.94} {'loss': 0.5582, 'learning_rate': 3.943962406267376e-08, 'epoch': 1.94} {'loss': 0.5006, 'learning_rate': 3.941058468405534e-08, 'epoch': 1.94} {'loss': 0.4766, 'learning_rate': 3.9381555979105536e-08, 'epoch': 1.94} {'loss': 0.4154, 'learning_rate': 3.935253794785876e-08, 'epoch': 1.94} {'loss': 0.561, 'learning_rate': 3.9323530590343885e-08, 'epoch': 1.94} {'loss': 0.4056, 'learning_rate': 3.9294533906593103e-08, 'epoch': 1.94} {'loss': 0.5895, 'learning_rate': 3.92655478966375e-08, 'epoch': 1.94} {'loss': 0.5419, 'learning_rate': 3.923657256050817e-08, 'epoch': 1.94} {'loss': 0.5077, 'learning_rate': 3.920760789823619e-08, 'epoch': 1.94} {'loss': 0.5475, 'learning_rate': 3.917865390985043e-08, 'epoch': 1.94} {'loss': 0.5643, 'learning_rate': 3.9149710595385305e-08, 'epoch': 1.94} {'loss': 0.455, 'learning_rate': 3.912077795486968e-08, 'epoch': 1.94} {'loss': 0.5064, 'learning_rate': 3.909185598833576e-08, 'epoch': 1.94} {'loss': 0.4776, 'learning_rate': 3.906294469581351e-08, 'epoch': 1.94} {'loss': 0.5856, 'learning_rate': 3.903404407733402e-08, 'epoch': 1.94} {'loss': 0.4337, 'learning_rate': 3.900515413292949e-08, 'epoch': 1.94} {'loss': 0.4745, 'learning_rate': 3.897627486262878e-08, 'epoch': 1.94} {'loss': 0.5079, 'learning_rate': 3.8947406266465205e-08, 'epoch': 1.94} {'loss': 0.6032, 'learning_rate': 3.891854834446873e-08, 'epoch': 1.94} {'loss': 0.482, 'learning_rate': 3.888970109666934e-08, 'epoch': 1.94} {'loss': 0.4545, 'learning_rate': 3.8860864523098117e-08, 'epoch': 1.94} {'loss': 0.4228, 'learning_rate': 3.883203862378726e-08, 'epoch': 1.94} {'loss': 0.4818, 'learning_rate': 3.880322339876674e-08, 'epoch': 1.94} {'loss': 0.5817, 'learning_rate': 3.877441884806765e-08, 'epoch': 1.94} {'loss': 0.4509, 'learning_rate': 3.8745624971721075e-08, 'epoch': 1.94} {'loss': 0.5837, 'learning_rate': 3.871684176975699e-08, 'epoch': 1.94} {'loss': 0.3821, 'learning_rate': 3.868806924220758e-08, 'epoch': 1.94} {'loss': 0.5109, 'learning_rate': 3.865930738910284e-08, 'epoch': 1.94} {'loss': 0.3846, 'learning_rate': 3.863055621047273e-08, 'epoch': 1.94} {'loss': 0.409, 'learning_rate': 3.8601815706350576e-08, 'epoch': 1.94} {'loss': 0.4264, 'learning_rate': 3.857308587676523e-08, 'epoch': 1.94} {'loss': 0.353, 'learning_rate': 3.854436672174777e-08, 'epoch': 1.94} {'loss': 0.5401, 'learning_rate': 3.851565824132819e-08, 'epoch': 1.94} {'loss': 0.5271, 'learning_rate': 3.8486960435538677e-08, 'epoch': 1.94} {'loss': 0.505, 'learning_rate': 3.8458273304410324e-08, 'epoch': 1.94} {'loss': 0.4014, 'learning_rate': 3.842959684797199e-08, 'epoch': 1.94} {'loss': 0.3551, 'learning_rate': 3.8400931066255865e-08, 'epoch': 1.94} {'loss': 0.4285, 'learning_rate': 3.837227595929194e-08, 'epoch': 1.94} {'loss': 0.5711, 'learning_rate': 3.83436315271124e-08, 'epoch': 1.94} {'loss': 0.3772, 'learning_rate': 3.831499776974501e-08, 'epoch': 1.94} {'loss': 0.4094, 'learning_rate': 3.828637468722307e-08, 'epoch': 1.94} {'loss': 0.4785, 'learning_rate': 3.825776227957656e-08, 'epoch': 1.94} {'loss': 0.5133, 'learning_rate': 3.8229160546835454e-08, 'epoch': 1.94} {'loss': 0.5866, 'learning_rate': 3.820056948903195e-08, 'epoch': 1.94} {'loss': 0.6067, 'learning_rate': 3.817198910619491e-08, 'epoch': 1.94} {'loss': 0.5133, 'learning_rate': 3.814341939835542e-08, 'epoch': 1.94} {'loss': 0.491, 'learning_rate': 3.811486036554457e-08, 'epoch': 1.94} {'loss': 0.3926, 'learning_rate': 3.8086312007792334e-08, 'epoch': 1.94} {'loss': 0.5527, 'learning_rate': 3.805777432513091e-08, 'epoch': 1.94} {'loss': 0.5311, 'learning_rate': 3.802924731758806e-08, 'epoch': 1.94} {'loss': 0.4313, 'learning_rate': 3.8000730985197074e-08, 'epoch': 1.94} {'loss': 0.5327, 'learning_rate': 3.7972225327987945e-08, 'epoch': 1.94} {'loss': 0.6189, 'learning_rate': 3.7943730345989525e-08, 'epoch': 1.94} {'loss': 0.5464, 'learning_rate': 3.791524603923402e-08, 'epoch': 1.94} {'loss': 0.5203, 'learning_rate': 3.7886772407751404e-08, 'epoch': 1.94} {'loss': 0.5446, 'learning_rate': 3.785830945157276e-08, 'epoch': 1.94} {'loss': 0.4211, 'learning_rate': 3.7829857170728066e-08, 'epoch': 1.94} {'loss': 0.4838, 'learning_rate': 3.78014155652473e-08, 'epoch': 1.94} {'loss': 0.429, 'learning_rate': 3.7772984635161544e-08, 'epoch': 1.94} {'loss': 0.5592, 'learning_rate': 3.7744564380500784e-08, 'epoch': 1.94} {'loss': 0.4923, 'learning_rate': 3.771615480129609e-08, 'epoch': 1.94} {'loss': 0.6895, 'learning_rate': 3.768775589757745e-08, 'epoch': 1.94} {'loss': 0.6628, 'learning_rate': 3.765936766937706e-08, 'epoch': 1.94} {'loss': 0.6172, 'learning_rate': 3.763099011672267e-08, 'epoch': 1.94} {'loss': 0.4009, 'learning_rate': 3.7602623239645365e-08, 'epoch': 1.94} {'loss': 0.4976, 'learning_rate': 3.757426703817624e-08, 'epoch': 1.94} {'loss': 0.5685, 'learning_rate': 3.7545921512346376e-08, 'epoch': 1.94} {'loss': 0.3605, 'learning_rate': 3.7517586662184635e-08, 'epoch': 1.95} {'loss': 0.4758, 'learning_rate': 3.748926248772211e-08, 'epoch': 1.95} {'loss': 0.4781, 'learning_rate': 3.746094898898878e-08, 'epoch': 1.95} {'loss': 0.3935, 'learning_rate': 3.743264616601461e-08, 'epoch': 1.95} {'loss': 0.4314, 'learning_rate': 3.74043540188318e-08, 'epoch': 1.95} {'loss': 0.5322, 'learning_rate': 3.737607254746811e-08, 'epoch': 1.95} {'loss': 0.3873, 'learning_rate': 3.734780175195574e-08, 'epoch': 1.95} {'loss': 0.6255, 'learning_rate': 3.731954163232465e-08, 'epoch': 1.95} {'loss': 0.429, 'learning_rate': 3.7291292188604836e-08, 'epoch': 1.95} {'loss': 0.5941, 'learning_rate': 3.726305342082626e-08, 'epoch': 1.95} {'loss': 0.447, 'learning_rate': 3.7234825329020005e-08, 'epoch': 1.95} {'loss': 0.5156, 'learning_rate': 3.7206607913216066e-08, 'epoch': 1.95} {'loss': 0.3646, 'learning_rate': 3.717840117344329e-08, 'epoch': 1.95} {'loss': 0.4761, 'learning_rate': 3.715020510973388e-08, 'epoch': 1.95} {'loss': 0.4597, 'learning_rate': 3.7122019722116706e-08, 'epoch': 1.95} {'loss': 0.4501, 'learning_rate': 3.7093845010622853e-08, 'epoch': 1.95} {'loss': 0.4651, 'learning_rate': 3.706568097528229e-08, 'epoch': 1.95} {'loss': 0.5295, 'learning_rate': 3.7037527616125005e-08, 'epoch': 1.95} {'loss': 0.5601, 'learning_rate': 3.7009384933180957e-08, 'epoch': 1.95} {'loss': 0.5235, 'learning_rate': 3.698125292648014e-08, 'epoch': 1.95} {'loss': 0.5553, 'learning_rate': 3.6953131596054735e-08, 'epoch': 1.95} {'loss': 0.4647, 'learning_rate': 3.69250209419314e-08, 'epoch': 1.95} {'loss': 0.5106, 'learning_rate': 3.6896920964143435e-08, 'epoch': 1.95} {'loss': 0.5357, 'learning_rate': 3.686883166271971e-08, 'epoch': 1.95} {'loss': 0.4975, 'learning_rate': 3.684075303768908e-08, 'epoch': 1.95} {'loss': 0.6321, 'learning_rate': 3.6812685089083754e-08, 'epoch': 1.95} {'loss': 0.5049, 'learning_rate': 3.67846278169326e-08, 'epoch': 1.95} {'loss': 0.45, 'learning_rate': 3.675658122126558e-08, 'epoch': 1.95} {'loss': 0.6187, 'learning_rate': 3.6728545302113784e-08, 'epoch': 1.95} {'loss': 0.5107, 'learning_rate': 3.670052005950608e-08, 'epoch': 1.95} {'loss': 0.4106, 'learning_rate': 3.6672505493473565e-08, 'epoch': 1.95} {'loss': 0.4956, 'learning_rate': 3.6644501604045093e-08, 'epoch': 1.95} {'loss': 0.6012, 'learning_rate': 3.661650839125175e-08, 'epoch': 1.95} {'loss': 0.5797, 'learning_rate': 3.6588525855122405e-08, 'epoch': 1.95} {'loss': 0.3671, 'learning_rate': 3.656055399568814e-08, 'epoch': 1.95} {'loss': 0.6388, 'learning_rate': 3.6532592812978936e-08, 'epoch': 1.95} {'loss': 0.5836, 'learning_rate': 3.650464230702366e-08, 'epoch': 1.95} {'loss': 0.4543, 'learning_rate': 3.64767024778534e-08, 'epoch': 1.95} {'loss': 0.3249, 'learning_rate': 3.644877332549701e-08, 'epoch': 1.95} {'loss': 0.5383, 'learning_rate': 3.642085484998559e-08, 'epoch': 1.95} {'loss': 0.6471, 'learning_rate': 3.639294705134799e-08, 'epoch': 1.95} {'loss': 0.4917, 'learning_rate': 3.636504992961531e-08, 'epoch': 1.95} {'loss': 0.6265, 'learning_rate': 3.633716348481642e-08, 'epoch': 1.95} {'loss': 0.4014, 'learning_rate': 3.6309287716981275e-08, 'epoch': 1.95} {'loss': 0.5459, 'learning_rate': 3.628142262613987e-08, 'epoch': 1.95} {'loss': 0.4778, 'learning_rate': 3.625356821232329e-08, 'epoch': 1.95} {'loss': 0.4188, 'learning_rate': 3.622572447555928e-08, 'epoch': 1.95} {'loss': 0.3605, 'learning_rate': 3.619789141587893e-08, 'epoch': 1.95} {'loss': 0.7024, 'learning_rate': 3.6170069033312215e-08, 'epoch': 1.95} {'loss': 0.3953, 'learning_rate': 3.614225732788801e-08, 'epoch': 1.95} {'loss': 0.5103, 'learning_rate': 3.611445629963628e-08, 'epoch': 1.95} {'loss': 0.4966, 'learning_rate': 3.6086665948589226e-08, 'epoch': 1.95} {'loss': 0.3325, 'learning_rate': 3.605888627477239e-08, 'epoch': 1.95} {'loss': 0.4156, 'learning_rate': 3.6031117278219063e-08, 'epoch': 1.95} {'loss': 0.3383, 'learning_rate': 3.60033589589559e-08, 'epoch': 1.95} {'loss': 0.5293, 'learning_rate': 3.597561131701621e-08, 'epoch': 1.95} {'loss': 0.4458, 'learning_rate': 3.594787435242775e-08, 'epoch': 1.95} {'loss': 0.5795, 'learning_rate': 3.5920148065220486e-08, 'epoch': 1.95} {'loss': 0.6277, 'learning_rate': 3.5892432455423285e-08, 'epoch': 1.95} {'loss': 0.637, 'learning_rate': 3.586472752306724e-08, 'epoch': 1.95} {'loss': 0.3537, 'learning_rate': 3.583703326818122e-08, 'epoch': 1.95} {'loss': 0.4771, 'learning_rate': 3.5809349690795194e-08, 'epoch': 1.95} {'loss': 0.4861, 'learning_rate': 3.5781676790939135e-08, 'epoch': 1.95} {'loss': 0.4868, 'learning_rate': 3.575401456864191e-08, 'epoch': 1.95} {'loss': 0.5123, 'learning_rate': 3.5726363023934615e-08, 'epoch': 1.95} {'loss': 0.5865, 'learning_rate': 3.5698722156845e-08, 'epoch': 1.95} {'loss': 0.5128, 'learning_rate': 3.567109196740304e-08, 'epoch': 1.95} {'loss': 0.567, 'learning_rate': 3.5643472455639816e-08, 'epoch': 1.95} {'loss': 0.4667, 'learning_rate': 3.561586362158309e-08, 'epoch': 1.95} {'loss': 0.5081, 'learning_rate': 3.558826546526395e-08, 'epoch': 1.95} {'loss': 0.5982, 'learning_rate': 3.556067798671126e-08, 'epoch': 1.95} {'loss': 0.5172, 'learning_rate': 3.5533101185953875e-08, 'epoch': 1.95} {'loss': 0.5355, 'learning_rate': 3.55055350630229e-08, 'epoch': 1.95} {'loss': 0.4313, 'learning_rate': 3.547797961794719e-08, 'epoch': 1.95} {'loss': 0.5106, 'learning_rate': 3.545043485075561e-08, 'epoch': 1.95} {'loss': 0.5033, 'learning_rate': 3.542290076147814e-08, 'epoch': 1.95} {'loss': 0.4667, 'learning_rate': 3.539537735014476e-08, 'epoch': 1.95} {'loss': 0.536, 'learning_rate': 3.536786461678543e-08, 'epoch': 1.95} {'loss': 0.5394, 'learning_rate': 3.5340362561427923e-08, 'epoch': 1.95} {'loss': 0.4797, 'learning_rate': 3.53128711841022e-08, 'epoch': 1.95} {'loss': 0.4409, 'learning_rate': 3.528539048483826e-08, 'epoch': 1.95} {'loss': 0.5112, 'learning_rate': 3.525792046366605e-08, 'epoch': 1.95} {'loss': 0.5269, 'learning_rate': 3.5230461120613346e-08, 'epoch': 1.95} {'loss': 0.702, 'learning_rate': 3.520301245571234e-08, 'epoch': 1.95} {'loss': 0.5682, 'learning_rate': 3.517557446898967e-08, 'epoch': 1.95} {'loss': 0.3979, 'learning_rate': 3.5148147160475324e-08, 'epoch': 1.95} {'loss': 0.5971, 'learning_rate': 3.512073053019927e-08, 'epoch': 1.95} {'loss': 0.4872, 'learning_rate': 3.509332457819037e-08, 'epoch': 1.95} {'loss': 0.352, 'learning_rate': 3.5065929304479716e-08, 'epoch': 1.95} {'loss': 0.5721, 'learning_rate': 3.5038544709093957e-08, 'epoch': 1.95} {'loss': 0.3655, 'learning_rate': 3.501117079206528e-08, 'epoch': 1.95} {'loss': 0.558, 'learning_rate': 3.4983807553420344e-08, 'epoch': 1.95} {'loss': 0.5449, 'learning_rate': 3.4956454993189116e-08, 'epoch': 1.95} {'loss': 0.4676, 'learning_rate': 3.492911311140268e-08, 'epoch': 1.95} {'loss': 0.4356, 'learning_rate': 3.490178190808879e-08, 'epoch': 1.95} {'loss': 0.3993, 'learning_rate': 3.4874461383277435e-08, 'epoch': 1.95} {'loss': 0.6224, 'learning_rate': 3.484715153699636e-08, 'epoch': 1.95} {'loss': 0.469, 'learning_rate': 3.4819852369276655e-08, 'epoch': 1.95} {'loss': 0.6115, 'learning_rate': 3.479256388014718e-08, 'epoch': 1.95} {'loss': 0.4776, 'learning_rate': 3.4765286069635696e-08, 'epoch': 1.95} {'loss': 0.5741, 'learning_rate': 3.47380189377744e-08, 'epoch': 1.95} {'loss': 0.5423, 'learning_rate': 3.4710762484589934e-08, 'epoch': 1.95} {'loss': 0.3987, 'learning_rate': 3.468351671011116e-08, 'epoch': 1.95} {'loss': 0.7524, 'learning_rate': 3.465628161437029e-08, 'epoch': 1.95} {'loss': 0.5881, 'learning_rate': 3.462905719739284e-08, 'epoch': 1.95} {'loss': 0.618, 'learning_rate': 3.4601843459211025e-08, 'epoch': 1.95} {'loss': 0.5221, 'learning_rate': 3.457464039985259e-08, 'epoch': 1.95} {'loss': 0.4363, 'learning_rate': 3.4547448019347505e-08, 'epoch': 1.95} {'loss': 0.403, 'learning_rate': 3.452026631772354e-08, 'epoch': 1.95} {'loss': 0.6192, 'learning_rate': 3.449309529500955e-08, 'epoch': 1.95} {'loss': 0.584, 'learning_rate': 3.4465934951236626e-08, 'epoch': 1.95} {'loss': 0.5946, 'learning_rate': 3.443878528643363e-08, 'epoch': 1.95} {'loss': 0.5949, 'learning_rate': 3.441164630062832e-08, 'epoch': 1.95} {'loss': 0.5371, 'learning_rate': 3.4384517993849566e-08, 'epoch': 1.95} {'loss': 0.561, 'learning_rate': 3.4357400366128446e-08, 'epoch': 1.95} {'loss': 0.4829, 'learning_rate': 3.433029341749272e-08, 'epoch': 1.95} {'loss': 0.5705, 'learning_rate': 3.4303197147970144e-08, 'epoch': 1.95} {'loss': 0.4857, 'learning_rate': 3.4276111557592916e-08, 'epoch': 1.95} {'loss': 0.5178, 'learning_rate': 3.424903664638768e-08, 'epoch': 1.95} {'loss': 0.4952, 'learning_rate': 3.42219724143833e-08, 'epoch': 1.95} {'loss': 0.4147, 'learning_rate': 3.419491886161086e-08, 'epoch': 1.95} {'loss': 0.4408, 'learning_rate': 3.416787598809701e-08, 'epoch': 1.95} {'loss': 0.3669, 'learning_rate': 3.4140843793871724e-08, 'epoch': 1.95} {'loss': 0.6748, 'learning_rate': 3.411382227896498e-08, 'epoch': 1.95} {'loss': 0.5226, 'learning_rate': 3.408681144340342e-08, 'epoch': 1.95} {'loss': 0.4491, 'learning_rate': 3.405981128721814e-08, 'epoch': 1.95} {'loss': 0.6139, 'learning_rate': 3.403282181043799e-08, 'epoch': 1.95} {'loss': 0.5229, 'learning_rate': 3.4005843013089623e-08, 'epoch': 1.95} {'loss': 0.4387, 'learning_rate': 3.397887489520413e-08, 'epoch': 1.95} {'loss': 0.574, 'learning_rate': 3.395191745681037e-08, 'epoch': 1.95} {'loss': 0.4854, 'learning_rate': 3.39249706979361e-08, 'epoch': 1.95} {'loss': 0.5721, 'learning_rate': 3.3898034618610185e-08, 'epoch': 1.95} {'loss': 0.4921, 'learning_rate': 3.387110921886261e-08, 'epoch': 1.95} {'loss': 0.6255, 'learning_rate': 3.384419449872112e-08, 'epoch': 1.95} {'loss': 0.5492, 'learning_rate': 3.381729045821569e-08, 'epoch': 1.95} {'loss': 0.4286, 'learning_rate': 3.3790397097374085e-08, 'epoch': 1.95} {'loss': 0.5869, 'learning_rate': 3.3763514416226274e-08, 'epoch': 1.95} {'loss': 0.4833, 'learning_rate': 3.373664241480001e-08, 'epoch': 1.95} {'loss': 0.6806, 'learning_rate': 3.3709781093124174e-08, 'epoch': 1.95} {'loss': 0.5491, 'learning_rate': 3.368293045122873e-08, 'epoch': 1.95} {'loss': 0.5305, 'learning_rate': 3.3656090489140314e-08, 'epoch': 1.95} {'loss': 0.4731, 'learning_rate': 3.362926120688892e-08, 'epoch': 1.95} {'loss': 0.4886, 'learning_rate': 3.360244260450451e-08, 'epoch': 1.95} {'loss': 0.5917, 'learning_rate': 3.357563468201375e-08, 'epoch': 1.95} {'loss': 0.5053, 'learning_rate': 3.354883743944659e-08, 'epoch': 1.95} {'loss': 0.385, 'learning_rate': 3.35220508768308e-08, 'epoch': 1.95} {'loss': 0.3989, 'learning_rate': 3.349527499419636e-08, 'epoch': 1.95} {'loss': 0.4367, 'learning_rate': 3.3468509791571016e-08, 'epoch': 1.95} {'loss': 0.6944, 'learning_rate': 3.344175526898363e-08, 'epoch': 1.95} {'loss': 0.4859, 'learning_rate': 3.3415011426461976e-08, 'epoch': 1.95} {'loss': 0.5119, 'learning_rate': 3.338827826403712e-08, 'epoch': 1.95} {'loss': 0.3685, 'learning_rate': 3.3361555781735725e-08, 'epoch': 1.95} {'loss': 0.5389, 'learning_rate': 3.333484397958664e-08, 'epoch': 1.95} {'loss': 0.3989, 'learning_rate': 3.3308142857619855e-08, 'epoch': 1.95} {'loss': 0.6229, 'learning_rate': 3.3281452415862006e-08, 'epoch': 1.95} {'loss': 0.3477, 'learning_rate': 3.325477265434307e-08, 'epoch': 1.95} {'loss': 0.6077, 'learning_rate': 3.322810357309081e-08, 'epoch': 1.95} {'loss': 0.6017, 'learning_rate': 3.320144517213408e-08, 'epoch': 1.95} {'loss': 0.4874, 'learning_rate': 3.3174797451502875e-08, 'epoch': 1.95} {'loss': 0.519, 'learning_rate': 3.314816041122271e-08, 'epoch': 1.95} {'loss': 0.4518, 'learning_rate': 3.312153405132468e-08, 'epoch': 1.95} {'loss': 0.5428, 'learning_rate': 3.309491837183654e-08, 'epoch': 1.95} {'loss': 0.6328, 'learning_rate': 3.3068313372787153e-08, 'epoch': 1.95} {'loss': 0.4708, 'learning_rate': 3.304171905420317e-08, 'epoch': 1.95} {'loss': 0.4469, 'learning_rate': 3.301513541611567e-08, 'epoch': 1.95} {'loss': 0.435, 'learning_rate': 3.298856245855242e-08, 'epoch': 1.95} {'loss': 0.4746, 'learning_rate': 3.296200018154005e-08, 'epoch': 1.95} {'loss': 0.3966, 'learning_rate': 3.293544858511077e-08, 'epoch': 1.95} {'loss': 0.407, 'learning_rate': 3.2908907669289e-08, 'epoch': 1.95} {'loss': 0.5795, 'learning_rate': 3.288237743410472e-08, 'epoch': 1.95} {'loss': 0.52, 'learning_rate': 3.2855857879587895e-08, 'epoch': 1.95} {'loss': 0.4391, 'learning_rate': 3.2829349005764064e-08, 'epoch': 1.95} {'loss': 0.592, 'learning_rate': 3.2802850812664325e-08, 'epoch': 1.95} {'loss': 0.5653, 'learning_rate': 3.277636330031531e-08, 'epoch': 1.95} {'loss': 0.456, 'learning_rate': 3.2749886468746996e-08, 'epoch': 1.95} {'loss': 0.503, 'learning_rate': 3.272342031798603e-08, 'epoch': 1.95} {'loss': 0.4556, 'learning_rate': 3.2696964848061285e-08, 'epoch': 1.95} {'loss': 0.6053, 'learning_rate': 3.267052005900162e-08, 'epoch': 1.95} {'loss': 0.5226, 'learning_rate': 3.264408595083479e-08, 'epoch': 1.95} {'loss': 0.6696, 'learning_rate': 3.2617662523589664e-08, 'epoch': 1.95} {'loss': 0.553, 'learning_rate': 3.2591249777294e-08, 'epoch': 1.95} {'loss': 0.5422, 'learning_rate': 3.256484771197777e-08, 'epoch': 1.95} {'loss': 0.5892, 'learning_rate': 3.25384563276665e-08, 'epoch': 1.95} {'loss': 0.4344, 'learning_rate': 3.251207562439018e-08, 'epoch': 1.95} {'loss': 0.6227, 'learning_rate': 3.248570560217768e-08, 'epoch': 1.95} {'loss': 0.5197, 'learning_rate': 3.245934626105451e-08, 'epoch': 1.95} {'loss': 0.5181, 'learning_rate': 3.24329976010529e-08, 'epoch': 1.95} {'loss': 0.5408, 'learning_rate': 3.2406659622197244e-08, 'epoch': 1.95} {'loss': 0.3746, 'learning_rate': 3.238033232451865e-08, 'epoch': 1.95} {'loss': 0.364, 'learning_rate': 3.235401570804375e-08, 'epoch': 1.95} {'loss': 0.4919, 'learning_rate': 3.232770977280142e-08, 'epoch': 1.95} {'loss': 0.5723, 'learning_rate': 3.2301414518819405e-08, 'epoch': 1.95} {'loss': 0.4917, 'learning_rate': 3.227512994612547e-08, 'epoch': 1.95} {'loss': 0.4606, 'learning_rate': 3.224885605474959e-08, 'epoch': 1.95} {'loss': 0.6484, 'learning_rate': 3.222259284471729e-08, 'epoch': 1.95} {'loss': 0.5998, 'learning_rate': 3.219634031605856e-08, 'epoch': 1.95} {'loss': 0.3545, 'learning_rate': 3.2170098468801146e-08, 'epoch': 1.95} {'loss': 0.4869, 'learning_rate': 3.214386730297392e-08, 'epoch': 1.95} {'loss': 0.6417, 'learning_rate': 3.211764681860352e-08, 'epoch': 1.95} {'loss': 0.4231, 'learning_rate': 3.209143701571882e-08, 'epoch': 1.95} {'loss': 0.4555, 'learning_rate': 3.206523789434757e-08, 'epoch': 1.95} {'loss': 0.4565, 'learning_rate': 3.203904945451863e-08, 'epoch': 1.95} {'loss': 0.5094, 'learning_rate': 3.201287169625977e-08, 'epoch': 1.95} {'loss': 0.5792, 'learning_rate': 3.198670461959763e-08, 'epoch': 1.95} {'loss': 0.4005, 'learning_rate': 3.1960548224562184e-08, 'epoch': 1.95} {'loss': 0.6399, 'learning_rate': 3.193440251118007e-08, 'epoch': 1.95} {'loss': 0.4939, 'learning_rate': 3.190826747948017e-08, 'epoch': 1.95} {'loss': 0.38, 'learning_rate': 3.1882143129491336e-08, 'epoch': 1.95} {'loss': 0.4945, 'learning_rate': 3.1856029461239116e-08, 'epoch': 1.95} {'loss': 0.5078, 'learning_rate': 3.182992647475347e-08, 'epoch': 1.95} {'loss': 0.367, 'learning_rate': 3.180383417006105e-08, 'epoch': 1.95} {'loss': 0.3568, 'learning_rate': 3.177775254719073e-08, 'epoch': 1.95} {'loss': 0.4683, 'learning_rate': 3.175168160617137e-08, 'epoch': 1.95} {'loss': 0.5643, 'learning_rate': 3.17256213470285e-08, 'epoch': 1.95} {'loss': 0.4009, 'learning_rate': 3.1699571769792104e-08, 'epoch': 1.95} {'loss': 0.5254, 'learning_rate': 3.1673532874488825e-08, 'epoch': 1.95} {'loss': 0.4442, 'learning_rate': 3.164750466114641e-08, 'epoch': 1.95} {'loss': 0.4507, 'learning_rate': 3.162148712979485e-08, 'epoch': 1.95} {'loss': 0.625, 'learning_rate': 3.159548028045967e-08, 'epoch': 1.95} {'loss': 0.4114, 'learning_rate': 3.1569484113169735e-08, 'epoch': 1.95} {'loss': 0.5801, 'learning_rate': 3.1543498627952805e-08, 'epoch': 1.95} {'loss': 0.3718, 'learning_rate': 3.1517523824836636e-08, 'epoch': 1.95} {'loss': 0.52, 'learning_rate': 3.149155970385009e-08, 'epoch': 1.95} {'loss': 0.5699, 'learning_rate': 3.146560626501871e-08, 'epoch': 1.95} {'loss': 0.4581, 'learning_rate': 3.1439663508372463e-08, 'epoch': 1.95} {'loss': 0.5071, 'learning_rate': 3.1413731433938e-08, 'epoch': 1.95} {'loss': 0.4415, 'learning_rate': 3.138781004174418e-08, 'epoch': 1.95} {'loss': 0.3658, 'learning_rate': 3.1361899331816545e-08, 'epoch': 1.95} {'loss': 0.5469, 'learning_rate': 3.133599930418507e-08, 'epoch': 1.95} {'loss': 0.5156, 'learning_rate': 3.131010995887751e-08, 'epoch': 1.95} {'loss': 0.5489, 'learning_rate': 3.128423129592051e-08, 'epoch': 1.95} {'loss': 0.5154, 'learning_rate': 3.1258363315341824e-08, 'epoch': 1.95} {'loss': 0.5701, 'learning_rate': 3.1232506017169206e-08, 'epoch': 1.95} {'loss': 0.4519, 'learning_rate': 3.120665940143153e-08, 'epoch': 1.95} {'loss': 0.2516, 'learning_rate': 3.118082346815543e-08, 'epoch': 1.95} {'loss': 0.4994, 'learning_rate': 3.115499821736867e-08, 'epoch': 1.95} {'loss': 0.4822, 'learning_rate': 3.1129183649099005e-08, 'epoch': 1.95} {'loss': 0.5003, 'learning_rate': 3.1103379763374185e-08, 'epoch': 1.95} {'loss': 0.4604, 'learning_rate': 3.107758656022308e-08, 'epoch': 1.95} {'loss': 0.5176, 'learning_rate': 3.105180403967012e-08, 'epoch': 1.95} {'loss': 0.4913, 'learning_rate': 3.102603220174638e-08, 'epoch': 1.95} {'loss': 0.5136, 'learning_rate': 3.10002710464774e-08, 'epoch': 1.95} {'loss': 0.6852, 'learning_rate': 3.0974520573890944e-08, 'epoch': 1.95} {'loss': 0.3605, 'learning_rate': 3.0948780784015864e-08, 'epoch': 1.95} {'loss': 0.5472, 'learning_rate': 3.0923051676877704e-08, 'epoch': 1.95} {'loss': 0.4896, 'learning_rate': 3.0897333252506437e-08, 'epoch': 1.95} {'loss': 0.3593, 'learning_rate': 3.08716255109287e-08, 'epoch': 1.95} {'loss': 0.5188, 'learning_rate': 3.084592845217116e-08, 'epoch': 1.95} {'loss': 0.6225, 'learning_rate': 3.082024207626155e-08, 'epoch': 1.95} {'loss': 0.3961, 'learning_rate': 3.0794566383228754e-08, 'epoch': 1.95} {'loss': 0.4809, 'learning_rate': 3.0768901373098294e-08, 'epoch': 1.95} {'loss': 0.5797, 'learning_rate': 3.0743247045899037e-08, 'epoch': 1.95} {'loss': 0.4649, 'learning_rate': 3.071760340165875e-08, 'epoch': 1.95} {'loss': 0.5238, 'learning_rate': 3.069197044040406e-08, 'epoch': 1.95} {'loss': 0.4673, 'learning_rate': 3.066634816216274e-08, 'epoch': 1.95} {'loss': 0.5412, 'learning_rate': 3.0640736566962534e-08, 'epoch': 1.95} {'loss': 0.4588, 'learning_rate': 3.0615135654830094e-08, 'epoch': 1.95} {'loss': 0.5279, 'learning_rate': 3.0589545425793174e-08, 'epoch': 1.95} {'loss': 0.7077, 'learning_rate': 3.056396587987953e-08, 'epoch': 1.95} {'loss': 0.6891, 'learning_rate': 3.053839701711692e-08, 'epoch': 1.95} {'loss': 0.4094, 'learning_rate': 3.0512838837531975e-08, 'epoch': 1.95} {'loss': 0.4299, 'learning_rate': 3.048729134115136e-08, 'epoch': 1.95} {'loss': 0.538, 'learning_rate': 3.046175452800504e-08, 'epoch': 1.95} {'loss': 0.4246, 'learning_rate': 3.043622839811744e-08, 'epoch': 1.95} {'loss': 0.4463, 'learning_rate': 3.041071295151743e-08, 'epoch': 1.95} {'loss': 0.4723, 'learning_rate': 3.038520818823276e-08, 'epoch': 1.95} {'loss': 0.5224, 'learning_rate': 3.035971410829008e-08, 'epoch': 1.95} {'loss': 0.4594, 'learning_rate': 3.033423071171604e-08, 'epoch': 1.95} {'loss': 0.4218, 'learning_rate': 3.0308757998539496e-08, 'epoch': 1.95} {'loss': 0.6541, 'learning_rate': 3.0283295968785985e-08, 'epoch': 1.95} {'loss': 0.4459, 'learning_rate': 3.0257844622484376e-08, 'epoch': 1.95} {'loss': 0.637, 'learning_rate': 3.0232403959662424e-08, 'epoch': 1.95} {'loss': 0.4229, 'learning_rate': 3.020697398034455e-08, 'epoch': 1.95} {'loss': 0.5672, 'learning_rate': 3.018155468456074e-08, 'epoch': 1.95} {'loss': 0.5889, 'learning_rate': 3.0156146072336523e-08, 'epoch': 1.95} {'loss': 0.3037, 'learning_rate': 3.013074814369965e-08, 'epoch': 1.95} {'loss': 0.3621, 'learning_rate': 3.010536089867788e-08, 'epoch': 1.95} {'loss': 0.4229, 'learning_rate': 3.007998433729897e-08, 'epoch': 1.95} {'loss': 0.5061, 'learning_rate': 3.005461845958846e-08, 'epoch': 1.95} {'loss': 0.5802, 'learning_rate': 3.0029263265574096e-08, 'epoch': 1.95} {'loss': 0.6768, 'learning_rate': 3.000391875528363e-08, 'epoch': 1.95} {'loss': 0.4476, 'learning_rate': 2.9978584928742616e-08, 'epoch': 1.95} {'loss': 0.4293, 'learning_rate': 2.9953261785981013e-08, 'epoch': 1.95} {'loss': 0.5401, 'learning_rate': 2.9927949327023257e-08, 'epoch': 1.95} {'loss': 0.4837, 'learning_rate': 2.99026475518982e-08, 'epoch': 1.95} {'loss': 0.6155, 'learning_rate': 2.987735646063139e-08, 'epoch': 1.95} {'loss': 0.6102, 'learning_rate': 2.985207605325169e-08, 'epoch': 1.95} {'loss': 0.4857, 'learning_rate': 2.982680632978574e-08, 'epoch': 1.95} {'loss': 0.5993, 'learning_rate': 2.9801547290259082e-08, 'epoch': 1.95} {'loss': 0.5607, 'learning_rate': 2.9776298934700576e-08, 'epoch': 1.95} {'loss': 0.3421, 'learning_rate': 2.9751061263136872e-08, 'epoch': 1.95} {'loss': 0.4314, 'learning_rate': 2.972583427559461e-08, 'epoch': 1.95} {'loss': 0.5192, 'learning_rate': 2.9700617972100442e-08, 'epoch': 1.95} {'loss': 0.4949, 'learning_rate': 2.967541235268212e-08, 'epoch': 1.95} {'loss': 0.5613, 'learning_rate': 2.96502174173674e-08, 'epoch': 1.95} {'loss': 0.4712, 'learning_rate': 2.9625033166181815e-08, 'epoch': 1.95} {'loss': 0.4145, 'learning_rate': 2.9599859599152013e-08, 'epoch': 1.95} {'loss': 0.5191, 'learning_rate': 2.9574696716306863e-08, 'epoch': 1.95} {'loss': 0.6261, 'learning_rate': 2.9549544517671892e-08, 'epoch': 1.95} {'loss': 0.5065, 'learning_rate': 2.952440300327486e-08, 'epoch': 1.95} {'loss': 0.5221, 'learning_rate': 2.9499272173142414e-08, 'epoch': 1.95} {'loss': 0.5573, 'learning_rate': 2.9474152027300086e-08, 'epoch': 1.95} {'loss': 0.5593, 'learning_rate': 2.9449042565777852e-08, 'epoch': 1.95} {'loss': 0.5169, 'learning_rate': 2.942394378860014e-08, 'epoch': 1.95} {'loss': 0.4742, 'learning_rate': 2.9398855695793594e-08, 'epoch': 1.95} {'loss': 0.538, 'learning_rate': 2.9373778287387077e-08, 'epoch': 1.95} {'loss': 0.5184, 'learning_rate': 2.9348711563407238e-08, 'epoch': 1.95} {'loss': 0.4347, 'learning_rate': 2.9323655523878503e-08, 'epoch': 1.95} {'loss': 0.3727, 'learning_rate': 2.9298610168830843e-08, 'epoch': 1.95} {'loss': 0.4259, 'learning_rate': 2.9273575498288686e-08, 'epoch': 1.95} {'loss': 0.498, 'learning_rate': 2.9248551512279788e-08, 'epoch': 1.95} {'loss': 0.6415, 'learning_rate': 2.9223538210830794e-08, 'epoch': 1.95} {'loss': 0.3875, 'learning_rate': 2.9198535593969456e-08, 'epoch': 1.95} {'loss': 0.6026, 'learning_rate': 2.9173543661722424e-08, 'epoch': 1.95} {'loss': 0.5183, 'learning_rate': 2.9148562414114125e-08, 'epoch': 1.95} {'loss': 0.6043, 'learning_rate': 2.9123591851174527e-08, 'epoch': 1.95} {'loss': 0.5263, 'learning_rate': 2.909863197292806e-08, 'epoch': 1.95} {'loss': 0.429, 'learning_rate': 2.907368277940248e-08, 'epoch': 1.95} {'loss': 0.4692, 'learning_rate': 2.9048744270624428e-08, 'epoch': 1.95} {'loss': 0.6653, 'learning_rate': 2.9023816446620558e-08, 'epoch': 1.95} {'loss': 0.5217, 'learning_rate': 2.8998899307417504e-08, 'epoch': 1.95} {'loss': 0.3652, 'learning_rate': 2.8973992853043032e-08, 'epoch': 1.95} {'loss': 0.384, 'learning_rate': 2.894909708352156e-08, 'epoch': 1.95} {'loss': 0.4351, 'learning_rate': 2.8924211998881956e-08, 'epoch': 1.95} {'loss': 0.5546, 'learning_rate': 2.8899337599149756e-08, 'epoch': 1.95} {'loss': 0.511, 'learning_rate': 2.8874473884351607e-08, 'epoch': 1.95} {'loss': 0.5576, 'learning_rate': 2.884962085451415e-08, 'epoch': 1.95} {'loss': 0.6789, 'learning_rate': 2.882477850966514e-08, 'epoch': 1.95} {'loss': 0.5284, 'learning_rate': 2.879994684982901e-08, 'epoch': 1.95} {'loss': 0.7087, 'learning_rate': 2.8775125875035726e-08, 'epoch': 1.95} {'loss': 0.4779, 'learning_rate': 2.8750315585307496e-08, 'epoch': 1.95} {'loss': 0.5346, 'learning_rate': 2.8725515980675413e-08, 'epoch': 1.95} {'loss': 0.4039, 'learning_rate': 2.8700727061162782e-08, 'epoch': 1.95} {'loss': 0.5174, 'learning_rate': 2.867594882679736e-08, 'epoch': 1.95} {'loss': 0.3432, 'learning_rate': 2.8651181277605798e-08, 'epoch': 1.95} {'loss': 0.521, 'learning_rate': 2.862642441361363e-08, 'epoch': 1.95} {'loss': 0.4301, 'learning_rate': 2.860167823484972e-08, 'epoch': 1.95} {'loss': 0.4783, 'learning_rate': 2.857694274133849e-08, 'epoch': 1.95} {'loss': 0.5405, 'learning_rate': 2.8552217933106585e-08, 'epoch': 1.95} {'loss': 0.5001, 'learning_rate': 2.8527503810181766e-08, 'epoch': 1.95} {'loss': 0.5022, 'learning_rate': 2.850280037258846e-08, 'epoch': 1.95} {'loss': 0.5111, 'learning_rate': 2.8478107620355522e-08, 'epoch': 1.95} {'loss': 0.3297, 'learning_rate': 2.8453425553507384e-08, 'epoch': 1.95} {'loss': 0.5033, 'learning_rate': 2.8428754172072914e-08, 'epoch': 1.95} {'loss': 0.4529, 'learning_rate': 2.840409347607542e-08, 'epoch': 1.95} {'loss': 0.4535, 'learning_rate': 2.8379443465543778e-08, 'epoch': 1.95} {'loss': 0.3448, 'learning_rate': 2.835480414050351e-08, 'epoch': 1.95} {'loss': 0.5378, 'learning_rate': 2.833017550098016e-08, 'epoch': 1.95} {'loss': 0.4311, 'learning_rate': 2.8305557547001483e-08, 'epoch': 1.95} {'loss': 0.5077, 'learning_rate': 2.828095027859412e-08, 'epoch': 1.95} {'loss': 0.4391, 'learning_rate': 2.8256353695783613e-08, 'epoch': 1.95} {'loss': 0.3966, 'learning_rate': 2.823176779859549e-08, 'epoch': 1.95} {'loss': 0.5118, 'learning_rate': 2.820719258705751e-08, 'epoch': 1.95} {'loss': 0.4782, 'learning_rate': 2.8182628061196316e-08, 'epoch': 1.95} {'loss': 0.6003, 'learning_rate': 2.8158074221036335e-08, 'epoch': 1.95} {'loss': 0.4968, 'learning_rate': 2.8133531066605322e-08, 'epoch': 1.95} {'loss': 0.4118, 'learning_rate': 2.8108998597928816e-08, 'epoch': 1.95} {'loss': 0.5192, 'learning_rate': 2.808447681503457e-08, 'epoch': 1.95} {'loss': 0.5689, 'learning_rate': 2.8059965717947002e-08, 'epoch': 1.95} {'loss': 0.4886, 'learning_rate': 2.8035465306693877e-08, 'epoch': 1.95} {'loss': 0.5298, 'learning_rate': 2.8010975581300726e-08, 'epoch': 1.95} {'loss': 0.5641, 'learning_rate': 2.7986496541793083e-08, 'epoch': 1.95} {'loss': 0.6029, 'learning_rate': 2.796202818819871e-08, 'epoch': 1.95} {'loss': 0.4005, 'learning_rate': 2.7937570520542024e-08, 'epoch': 1.95} {'loss': 0.5836, 'learning_rate': 2.7913123538851894e-08, 'epoch': 1.95} {'loss': 0.5419, 'learning_rate': 2.7888687243151636e-08, 'epoch': 1.95} {'loss': 0.5259, 'learning_rate': 2.7864261633469003e-08, 'epoch': 1.95} {'loss': 0.4512, 'learning_rate': 2.7839846709829532e-08, 'epoch': 1.95} {'loss': 0.4653, 'learning_rate': 2.7815442472259868e-08, 'epoch': 1.95} {'loss': 0.6285, 'learning_rate': 2.7791048920786656e-08, 'epoch': 1.95} {'loss': 0.5578, 'learning_rate': 2.776666605543543e-08, 'epoch': 1.95} {'loss': 0.4372, 'learning_rate': 2.774229387623173e-08, 'epoch': 1.95} {'loss': 0.4884, 'learning_rate': 2.7717932383202194e-08, 'epoch': 1.95} {'loss': 0.4217, 'learning_rate': 2.7693581576372362e-08, 'epoch': 1.95} {'loss': 0.6747, 'learning_rate': 2.766924145576999e-08, 'epoch': 1.95} {'loss': 0.4525, 'learning_rate': 2.76449120214195e-08, 'epoch': 1.95} {'loss': 0.6184, 'learning_rate': 2.762059327334754e-08, 'epoch': 1.95} {'loss': 0.5892, 'learning_rate': 2.7596285211580753e-08, 'epoch': 1.95} {'loss': 0.3697, 'learning_rate': 2.7571987836143564e-08, 'epoch': 1.95} {'loss': 0.543, 'learning_rate': 2.7547701147063733e-08, 'epoch': 1.95} {'loss': 0.552, 'learning_rate': 2.7523425144366788e-08, 'epoch': 1.95} {'loss': 0.4299, 'learning_rate': 2.749915982807827e-08, 'epoch': 1.95} {'loss': 0.5612, 'learning_rate': 2.7474905198224823e-08, 'epoch': 1.95} {'loss': 0.4962, 'learning_rate': 2.745066125483198e-08, 'epoch': 1.95} {'loss': 0.45, 'learning_rate': 2.7426427997925277e-08, 'epoch': 1.95} {'loss': 0.4899, 'learning_rate': 2.740220542753136e-08, 'epoch': 1.95} {'loss': 0.4402, 'learning_rate': 2.7377993543676872e-08, 'epoch': 1.95} {'loss': 0.5356, 'learning_rate': 2.7353792346386244e-08, 'epoch': 1.95} {'loss': 0.4371, 'learning_rate': 2.7329601835686116e-08, 'epoch': 1.95} {'loss': 0.6923, 'learning_rate': 2.7305422011603135e-08, 'epoch': 1.95} {'loss': 0.4741, 'learning_rate': 2.7281252874161724e-08, 'epoch': 1.95} {'loss': 0.5531, 'learning_rate': 2.725709442338853e-08, 'epoch': 1.95} {'loss': 0.4649, 'learning_rate': 2.72329466593102e-08, 'epoch': 1.95} {'loss': 0.5401, 'learning_rate': 2.7208809581951155e-08, 'epoch': 1.95} {'loss': 0.4034, 'learning_rate': 2.7184683191338046e-08, 'epoch': 1.95} {'loss': 0.4709, 'learning_rate': 2.7160567487496404e-08, 'epoch': 1.95} {'loss': 0.5012, 'learning_rate': 2.7136462470452873e-08, 'epoch': 1.95} {'loss': 0.46, 'learning_rate': 2.711236814023299e-08, 'epoch': 1.95} {'loss': 0.5067, 'learning_rate': 2.7088284496861184e-08, 'epoch': 1.95} {'loss': 0.5338, 'learning_rate': 2.7064211540365203e-08, 'epoch': 1.95} {'loss': 0.5246, 'learning_rate': 2.7040149270769478e-08, 'epoch': 1.95} {'loss': 0.4249, 'learning_rate': 2.701609768810065e-08, 'epoch': 1.95} {'loss': 0.4443, 'learning_rate': 2.6992056792384257e-08, 'epoch': 1.95} {'loss': 0.4752, 'learning_rate': 2.6968026583646946e-08, 'epoch': 1.95} {'loss': 0.5171, 'learning_rate': 2.6944007061912026e-08, 'epoch': 1.95} {'loss': 0.4733, 'learning_rate': 2.6919998227207256e-08, 'epoch': 1.95} {'loss': 0.5025, 'learning_rate': 2.689600007955817e-08, 'epoch': 1.95} {'loss': 0.5018, 'learning_rate': 2.6872012618990305e-08, 'epoch': 1.95} {'loss': 0.5714, 'learning_rate': 2.6848035845528085e-08, 'epoch': 1.95} {'loss': 0.5451, 'learning_rate': 2.6824069759199268e-08, 'epoch': 1.95} {'loss': 0.4479, 'learning_rate': 2.6800114360028272e-08, 'epoch': 1.95} {'loss': 0.5094, 'learning_rate': 2.677616964804175e-08, 'epoch': 1.95} {'loss': 0.5924, 'learning_rate': 2.6752235623264123e-08, 'epoch': 1.95} {'loss': 0.3785, 'learning_rate': 2.6728312285720925e-08, 'epoch': 1.95} {'loss': 0.3717, 'learning_rate': 2.6704399635438803e-08, 'epoch': 1.95} {'loss': 0.5135, 'learning_rate': 2.6680497672443295e-08, 'epoch': 1.95} {'loss': 0.408, 'learning_rate': 2.6656606396759932e-08, 'epoch': 1.95} {'loss': 0.5825, 'learning_rate': 2.663272580841536e-08, 'epoch': 1.95} {'loss': 0.588, 'learning_rate': 2.6608855907431787e-08, 'epoch': 1.95} {'loss': 0.6435, 'learning_rate': 2.6584996693838074e-08, 'epoch': 1.95} {'loss': 0.4161, 'learning_rate': 2.6561148167658647e-08, 'epoch': 1.95} {'loss': 0.6065, 'learning_rate': 2.653731032891904e-08, 'epoch': 1.95} {'loss': 0.3946, 'learning_rate': 2.6513483177644795e-08, 'epoch': 1.95} {'loss': 0.534, 'learning_rate': 2.648966671386144e-08, 'epoch': 1.95} {'loss': 0.4354, 'learning_rate': 2.646586093759562e-08, 'epoch': 1.95} {'loss': 0.5219, 'learning_rate': 2.644206584887066e-08, 'epoch': 1.95} {'loss': 0.5361, 'learning_rate': 2.641828144771319e-08, 'epoch': 1.95} {'loss': 0.4955, 'learning_rate': 2.6394507734148755e-08, 'epoch': 1.95} {'loss': 0.4326, 'learning_rate': 2.637074470820289e-08, 'epoch': 1.95} {'loss': 0.5579, 'learning_rate': 2.6346992369901126e-08, 'epoch': 1.95} {'loss': 0.5321, 'learning_rate': 2.6323250719269e-08, 'epoch': 1.95} {'loss': 0.578, 'learning_rate': 2.6299519756330938e-08, 'epoch': 1.95} {'loss': 0.5734, 'learning_rate': 2.6275799481113584e-08, 'epoch': 1.95} {'loss': 0.4272, 'learning_rate': 2.6252089893641363e-08, 'epoch': 1.95} {'loss': 0.5062, 'learning_rate': 2.6228390993940922e-08, 'epoch': 1.95} {'loss': 0.5236, 'learning_rate': 2.6204702782036684e-08, 'epoch': 1.95} {'loss': 0.3684, 'learning_rate': 2.6181025257954186e-08, 'epoch': 1.95} {'loss': 0.4529, 'learning_rate': 2.615735842171896e-08, 'epoch': 1.95} {'loss': 0.5113, 'learning_rate': 2.6133702273356543e-08, 'epoch': 1.95} {'loss': 0.4512, 'learning_rate': 2.6110056812892472e-08, 'epoch': 1.95} {'loss': 0.5116, 'learning_rate': 2.6086422040351166e-08, 'epoch': 1.95} {'loss': 0.4354, 'learning_rate': 2.6062797955758167e-08, 'epoch': 1.95} {'loss': 0.4881, 'learning_rate': 2.6039184559139007e-08, 'epoch': 1.95} {'loss': 0.5608, 'learning_rate': 2.6015581850519224e-08, 'epoch': 1.95} {'loss': 0.4477, 'learning_rate': 2.5991989829924346e-08, 'epoch': 1.95} {'loss': 0.5924, 'learning_rate': 2.5968408497378804e-08, 'epoch': 1.95} {'loss': 0.5159, 'learning_rate': 2.5944837852909244e-08, 'epoch': 1.95} {'loss': 0.4926, 'learning_rate': 2.5921277896538976e-08, 'epoch': 1.95} {'loss': 0.6902, 'learning_rate': 2.589772862829465e-08, 'epoch': 1.95} {'loss': 0.4888, 'learning_rate': 2.5874190048200686e-08, 'epoch': 1.95} {'loss': 0.627, 'learning_rate': 2.5850662156283735e-08, 'epoch': 1.95} {'loss': 0.5013, 'learning_rate': 2.5827144952567108e-08, 'epoch': 1.95} {'loss': 0.5319, 'learning_rate': 2.580363843707745e-08, 'epoch': 1.95} {'loss': 0.4566, 'learning_rate': 2.5780142609839187e-08, 'epoch': 1.95} {'loss': 0.5893, 'learning_rate': 2.5756657470877854e-08, 'epoch': 1.95} {'loss': 0.4755, 'learning_rate': 2.5733183020217877e-08, 'epoch': 1.95} {'loss': 0.4914, 'learning_rate': 2.57097192578859e-08, 'epoch': 1.95} {'loss': 0.5012, 'learning_rate': 2.568626618390524e-08, 'epoch': 1.95} {'loss': 0.5307, 'learning_rate': 2.566282379830254e-08, 'epoch': 1.95} {'loss': 0.6082, 'learning_rate': 2.5639392101103333e-08, 'epoch': 1.95} {'loss': 0.4381, 'learning_rate': 2.561597109233094e-08, 'epoch': 1.95} {'loss': 0.58, 'learning_rate': 2.5592560772010887e-08, 'epoch': 1.95} {'loss': 0.549, 'learning_rate': 2.556916114016872e-08, 'epoch': 1.95} {'loss': 0.6322, 'learning_rate': 2.5545772196829965e-08, 'epoch': 1.95} {'loss': 0.5448, 'learning_rate': 2.552239394201905e-08, 'epoch': 1.95} {'loss': 0.463, 'learning_rate': 2.5499026375760406e-08, 'epoch': 1.95} {'loss': 0.554, 'learning_rate': 2.5475669498080668e-08, 'epoch': 1.95} {'loss': 0.4554, 'learning_rate': 2.545232330900427e-08, 'epoch': 1.95} {'loss': 0.4182, 'learning_rate': 2.5428987808554518e-08, 'epoch': 1.95} {'loss': 0.3853, 'learning_rate': 2.5405662996759174e-08, 'epoch': 1.95} {'loss': 0.4901, 'learning_rate': 2.538234887364044e-08, 'epoch': 1.95} {'loss': 0.4434, 'learning_rate': 2.535904543922607e-08, 'epoch': 1.95} {'loss': 0.5027, 'learning_rate': 2.5335752693540495e-08, 'epoch': 1.95} {'loss': 0.4634, 'learning_rate': 2.531247063660591e-08, 'epoch': 1.95} {'loss': 0.586, 'learning_rate': 2.5289199268451194e-08, 'epoch': 1.95} {'loss': 0.474, 'learning_rate': 2.5265938589098537e-08, 'epoch': 1.95} {'loss': 0.5039, 'learning_rate': 2.5242688598573484e-08, 'epoch': 1.95} {'loss': 0.4331, 'learning_rate': 2.5219449296900457e-08, 'epoch': 1.95} {'loss': 0.5847, 'learning_rate': 2.519622068410721e-08, 'epoch': 1.95} {'loss': 0.3779, 'learning_rate': 2.5173002760214837e-08, 'epoch': 1.95} {'loss': 0.4045, 'learning_rate': 2.5149795525249986e-08, 'epoch': 1.95} {'loss': 0.6709, 'learning_rate': 2.5126598979238192e-08, 'epoch': 1.96} {'loss': 0.4323, 'learning_rate': 2.510341312220277e-08, 'epoch': 1.96} {'loss': 0.5488, 'learning_rate': 2.5080237954170363e-08, 'epoch': 1.96} {'loss': 0.4399, 'learning_rate': 2.5057073475163173e-08, 'epoch': 1.96} {'loss': 0.4023, 'learning_rate': 2.5033919685208962e-08, 'epoch': 1.96} {'loss': 0.6367, 'learning_rate': 2.5010776584329933e-08, 'epoch': 1.96} {'loss': 0.3807, 'learning_rate': 2.4987644172553837e-08, 'epoch': 1.96} {'loss': 0.4409, 'learning_rate': 2.4964522449902885e-08, 'epoch': 1.96} {'loss': 0.4891, 'learning_rate': 2.4941411416402605e-08, 'epoch': 1.96} {'loss': 0.5503, 'learning_rate': 2.491831107207854e-08, 'epoch': 1.96} {'loss': 0.3835, 'learning_rate': 2.4895221416953996e-08, 'epoch': 1.96} {'loss': 0.5358, 'learning_rate': 2.4872142451054516e-08, 'epoch': 1.96} {'loss': 0.3732, 'learning_rate': 2.484907417440563e-08, 'epoch': 1.96} {'loss': 0.5577, 'learning_rate': 2.4826016587030654e-08, 'epoch': 1.96} {'loss': 0.6241, 'learning_rate': 2.4802969688955126e-08, 'epoch': 1.96} {'loss': 0.3949, 'learning_rate': 2.4779933480203465e-08, 'epoch': 1.96} {'loss': 0.5326, 'learning_rate': 2.4756907960800104e-08, 'epoch': 1.96} {'loss': 0.3968, 'learning_rate': 2.473389313077057e-08, 'epoch': 1.96} {'loss': 0.3552, 'learning_rate': 2.4710888990139292e-08, 'epoch': 1.96} {'loss': 0.467, 'learning_rate': 2.4687895538929585e-08, 'epoch': 1.96} {'loss': 0.5271, 'learning_rate': 2.4664912777168093e-08, 'epoch': 1.96} {'loss': 0.5846, 'learning_rate': 2.464194070487813e-08, 'epoch': 1.96} {'loss': 0.4905, 'learning_rate': 2.4618979322084123e-08, 'epoch': 1.96} {'loss': 0.5651, 'learning_rate': 2.4596028628811607e-08, 'epoch': 1.96} {'loss': 0.5876, 'learning_rate': 2.4573088625085006e-08, 'epoch': 1.96} {'loss': 0.526, 'learning_rate': 2.4550159310928744e-08, 'epoch': 1.96} {'loss': 0.4262, 'learning_rate': 2.4527240686367247e-08, 'epoch': 1.96} {'loss': 0.4147, 'learning_rate': 2.4504332751424943e-08, 'epoch': 1.96} {'loss': 0.4442, 'learning_rate': 2.448143550612736e-08, 'epoch': 1.96} {'loss': 0.5018, 'learning_rate': 2.4458548950496707e-08, 'epoch': 1.96} {'loss': 0.3892, 'learning_rate': 2.443567308456074e-08, 'epoch': 1.96} {'loss': 0.4223, 'learning_rate': 2.4412807908340553e-08, 'epoch': 1.96} {'loss': 0.4202, 'learning_rate': 2.43899534218639e-08, 'epoch': 1.96} {'loss': 0.4386, 'learning_rate': 2.4367109625152985e-08, 'epoch': 1.96} {'loss': 0.7065, 'learning_rate': 2.4344276518233344e-08, 'epoch': 1.96} {'loss': 0.4937, 'learning_rate': 2.4321454101129403e-08, 'epoch': 1.96} {'loss': 0.5191, 'learning_rate': 2.429864237386559e-08, 'epoch': 1.96} {'loss': 0.406, 'learning_rate': 2.427584133646521e-08, 'epoch': 1.96} {'loss': 0.5821, 'learning_rate': 2.425305098895381e-08, 'epoch': 1.96} {'loss': 0.3384, 'learning_rate': 2.4230271331355804e-08, 'epoch': 1.96} {'loss': 0.5206, 'learning_rate': 2.4207502363695623e-08, 'epoch': 1.96} {'loss': 0.5577, 'learning_rate': 2.4184744085997692e-08, 'epoch': 1.96} {'loss': 0.6048, 'learning_rate': 2.4161996498286435e-08, 'epoch': 1.96} {'loss': 0.5947, 'learning_rate': 2.4139259600585163e-08, 'epoch': 1.96} {'loss': 0.611, 'learning_rate': 2.4116533392919417e-08, 'epoch': 1.96} {'loss': 0.4844, 'learning_rate': 2.4093817875312507e-08, 'epoch': 1.96} {'loss': 0.517, 'learning_rate': 2.4071113047789973e-08, 'epoch': 1.96} {'loss': 0.6165, 'learning_rate': 2.4048418910376237e-08, 'epoch': 1.96} {'loss': 0.5176, 'learning_rate': 2.4025735463094612e-08, 'epoch': 1.96} {'loss': 0.4271, 'learning_rate': 2.4003062705969526e-08, 'epoch': 1.96} {'loss': 0.5765, 'learning_rate': 2.3980400639025404e-08, 'epoch': 1.96} {'loss': 0.4613, 'learning_rate': 2.395774926228667e-08, 'epoch': 1.96} {'loss': 0.4528, 'learning_rate': 2.3935108575777743e-08, 'epoch': 1.96} {'loss': 0.6133, 'learning_rate': 2.3912478579523058e-08, 'epoch': 1.96} {'loss': 0.5234, 'learning_rate': 2.3889859273547033e-08, 'epoch': 1.96} {'loss': 0.5757, 'learning_rate': 2.3867250657871877e-08, 'epoch': 1.96} {'loss': 0.3717, 'learning_rate': 2.3844652732524232e-08, 'epoch': 1.96} {'loss': 0.5787, 'learning_rate': 2.3822065497527414e-08, 'epoch': 1.96} {'loss': 0.4727, 'learning_rate': 2.3799488952905846e-08, 'epoch': 1.96} {'loss': 0.5291, 'learning_rate': 2.3776923098683958e-08, 'epoch': 1.96} {'loss': 0.4902, 'learning_rate': 2.375436793488395e-08, 'epoch': 1.96} {'loss': 0.3721, 'learning_rate': 2.3731823461533576e-08, 'epoch': 1.96} {'loss': 0.5842, 'learning_rate': 2.3709289678653935e-08, 'epoch': 1.96} {'loss': 0.616, 'learning_rate': 2.368676658626945e-08, 'epoch': 1.96} {'loss': 0.5417, 'learning_rate': 2.3664254184405655e-08, 'epoch': 1.96} {'loss': 0.4758, 'learning_rate': 2.3641752473085865e-08, 'epoch': 1.96} {'loss': 0.4922, 'learning_rate': 2.3619261452335617e-08, 'epoch': 1.96} {'loss': 0.3861, 'learning_rate': 2.3596781122176005e-08, 'epoch': 1.96} {'loss': 0.4711, 'learning_rate': 2.3574311482633672e-08, 'epoch': 1.96} {'loss': 0.5401, 'learning_rate': 2.3551852533731935e-08, 'epoch': 1.96} {'loss': 0.548, 'learning_rate': 2.3529404275495214e-08, 'epoch': 1.96} {'loss': 0.5151, 'learning_rate': 2.350696670794683e-08, 'epoch': 1.96} {'loss': 0.5519, 'learning_rate': 2.3484539831110098e-08, 'epoch': 1.96} {'loss': 0.6163, 'learning_rate': 2.346212364501166e-08, 'epoch': 1.96} {'loss': 0.5188, 'learning_rate': 2.343971814967372e-08, 'epoch': 1.96} {'loss': 0.5046, 'learning_rate': 2.341732334511959e-08, 'epoch': 1.96} {'loss': 0.6081, 'learning_rate': 2.3394939231374814e-08, 'epoch': 1.96} {'loss': 0.445, 'learning_rate': 2.33725658084627e-08, 'epoch': 1.96} {'loss': 0.5195, 'learning_rate': 2.3350203076407675e-08, 'epoch': 1.96} {'loss': 0.661, 'learning_rate': 2.332785103523305e-08, 'epoch': 1.96} {'loss': 0.4221, 'learning_rate': 2.3305509684963257e-08, 'epoch': 1.96} {'loss': 0.4228, 'learning_rate': 2.3283179025622715e-08, 'epoch': 1.96} {'loss': 0.4852, 'learning_rate': 2.3260859057233633e-08, 'epoch': 1.96} {'loss': 0.3706, 'learning_rate': 2.323854977982154e-08, 'epoch': 1.96} {'loss': 0.3638, 'learning_rate': 2.3216251193409754e-08, 'epoch': 1.96} {'loss': 0.4107, 'learning_rate': 2.3193963298021595e-08, 'epoch': 1.96} {'loss': 0.5463, 'learning_rate': 2.3171686093682588e-08, 'epoch': 1.96} {'loss': 0.4865, 'learning_rate': 2.3149419580413835e-08, 'epoch': 1.96} {'loss': 0.4057, 'learning_rate': 2.3127163758243087e-08, 'epoch': 1.96} {'loss': 0.6285, 'learning_rate': 2.310491862719033e-08, 'epoch': 1.96} {'loss': 0.3268, 'learning_rate': 2.308268418728221e-08, 'epoch': 1.96} {'loss': 0.5591, 'learning_rate': 2.3060460438540933e-08, 'epoch': 1.96} {'loss': 0.4846, 'learning_rate': 2.303824738099092e-08, 'epoch': 1.96} {'loss': 0.4688, 'learning_rate': 2.3016045014656595e-08, 'epoch': 1.96} {'loss': 0.4955, 'learning_rate': 2.299385333956017e-08, 'epoch': 1.96} {'loss': 0.4534, 'learning_rate': 2.297167235572717e-08, 'epoch': 1.96} {'loss': 0.4696, 'learning_rate': 2.2949502063179807e-08, 'epoch': 1.96} {'loss': 0.5403, 'learning_rate': 2.2927342461942504e-08, 'epoch': 1.96} {'loss': 0.4988, 'learning_rate': 2.2905193552039685e-08, 'epoch': 1.96} {'loss': 0.6029, 'learning_rate': 2.2883055333493552e-08, 'epoch': 1.96} {'loss': 0.6327, 'learning_rate': 2.2860927806329648e-08, 'epoch': 1.96} {'loss': 0.549, 'learning_rate': 2.2838810970570167e-08, 'epoch': 1.96} {'loss': 0.5408, 'learning_rate': 2.2816704826239542e-08, 'epoch': 1.96} {'loss': 0.3438, 'learning_rate': 2.2794609373361086e-08, 'epoch': 1.96} {'loss': 0.4997, 'learning_rate': 2.2772524611959224e-08, 'epoch': 1.96} {'loss': 0.5188, 'learning_rate': 2.275045054205727e-08, 'epoch': 1.96} {'loss': 0.6201, 'learning_rate': 2.2728387163677422e-08, 'epoch': 1.96} {'loss': 0.476, 'learning_rate': 2.2706334476846335e-08, 'epoch': 1.96} {'loss': 0.5355, 'learning_rate': 2.268429248158399e-08, 'epoch': 1.96} {'loss': 0.5233, 'learning_rate': 2.2662261177917032e-08, 'epoch': 1.96} {'loss': 0.5811, 'learning_rate': 2.2640240565867666e-08, 'epoch': 1.96} {'loss': 0.3864, 'learning_rate': 2.2618230645460316e-08, 'epoch': 1.96} {'loss': 0.6081, 'learning_rate': 2.2596231416718297e-08, 'epoch': 1.96} {'loss': 0.6037, 'learning_rate': 2.257424287966381e-08, 'epoch': 1.96} {'loss': 0.483, 'learning_rate': 2.2552265034322395e-08, 'epoch': 1.96} {'loss': 0.3727, 'learning_rate': 2.2530297880716257e-08, 'epoch': 1.96} {'loss': 0.5132, 'learning_rate': 2.2508341418869818e-08, 'epoch': 1.96} {'loss': 0.5339, 'learning_rate': 2.2486395648806393e-08, 'epoch': 1.96} {'loss': 0.3473, 'learning_rate': 2.2464460570548184e-08, 'epoch': 1.96} {'loss': 0.4379, 'learning_rate': 2.2442536184120732e-08, 'epoch': 1.96} {'loss': 0.5603, 'learning_rate': 2.242062248954624e-08, 'epoch': 1.96} {'loss': 0.6352, 'learning_rate': 2.239871948684913e-08, 'epoch': 1.96} {'loss': 0.4599, 'learning_rate': 2.2376827176052718e-08, 'epoch': 1.96} {'loss': 0.4104, 'learning_rate': 2.235494555717921e-08, 'epoch': 1.96} {'loss': 0.5893, 'learning_rate': 2.2333074630253025e-08, 'epoch': 1.96} {'loss': 0.4217, 'learning_rate': 2.2311214395297487e-08, 'epoch': 1.96} {'loss': 0.4828, 'learning_rate': 2.2289364852335905e-08, 'epoch': 1.96} {'loss': 0.5196, 'learning_rate': 2.226752600139159e-08, 'epoch': 1.96} {'loss': 0.3951, 'learning_rate': 2.2245697842488978e-08, 'epoch': 1.96} {'loss': 0.293, 'learning_rate': 2.2223880375650264e-08, 'epoch': 1.96} {'loss': 0.5437, 'learning_rate': 2.2202073600899876e-08, 'epoch': 1.96} {'loss': 0.4869, 'learning_rate': 2.2180277518260017e-08, 'epoch': 1.96} {'loss': 0.3191, 'learning_rate': 2.2158492127754006e-08, 'epoch': 1.96} {'loss': 0.5779, 'learning_rate': 2.2136717429406262e-08, 'epoch': 1.96} {'loss': 0.6326, 'learning_rate': 2.2114953423238992e-08, 'epoch': 1.96} {'loss': 0.4295, 'learning_rate': 2.2093200109276626e-08, 'epoch': 1.96} {'loss': 0.3474, 'learning_rate': 2.207145748754247e-08, 'epoch': 1.96} {'loss': 0.5461, 'learning_rate': 2.2049725558057623e-08, 'epoch': 1.96} {'loss': 0.5026, 'learning_rate': 2.2028004320848727e-08, 'epoch': 1.96} {'loss': 0.4444, 'learning_rate': 2.2006293775936882e-08, 'epoch': 1.96} {'loss': 0.3361, 'learning_rate': 2.19845939233454e-08, 'epoch': 1.96} {'loss': 0.6033, 'learning_rate': 2.19629047630987e-08, 'epoch': 1.96} {'loss': 0.5918, 'learning_rate': 2.1941226295218997e-08, 'epoch': 1.96} {'loss': 0.3308, 'learning_rate': 2.19195585197296e-08, 'epoch': 1.96} {'loss': 0.6128, 'learning_rate': 2.1897901436654934e-08, 'epoch': 1.96} {'loss': 0.5839, 'learning_rate': 2.1876255046016093e-08, 'epoch': 1.96} {'loss': 0.4937, 'learning_rate': 2.18546193478375e-08, 'epoch': 1.96} {'loss': 0.5751, 'learning_rate': 2.183299434214359e-08, 'epoch': 1.96} {'loss': 0.5362, 'learning_rate': 2.1811380028954334e-08, 'epoch': 1.96} {'loss': 0.531, 'learning_rate': 2.178977640829638e-08, 'epoch': 1.96} {'loss': 0.527, 'learning_rate': 2.1768183480190828e-08, 'epoch': 1.96} {'loss': 0.6295, 'learning_rate': 2.174660124466099e-08, 'epoch': 1.96} {'loss': 0.5776, 'learning_rate': 2.1725029701730183e-08, 'epoch': 1.96} {'loss': 0.4504, 'learning_rate': 2.1703468851421716e-08, 'epoch': 1.96} {'loss': 0.4716, 'learning_rate': 2.1681918693758906e-08, 'epoch': 1.96} {'loss': 0.3973, 'learning_rate': 2.166037922876396e-08, 'epoch': 1.96} {'loss': 0.4501, 'learning_rate': 2.1638850456460193e-08, 'epoch': 1.96} {'loss': 0.5964, 'learning_rate': 2.1617332376872024e-08, 'epoch': 1.96} {'loss': 0.4803, 'learning_rate': 2.1595824990020553e-08, 'epoch': 1.96} {'loss': 0.3976, 'learning_rate': 2.1574328295931313e-08, 'epoch': 1.96} {'loss': 0.51, 'learning_rate': 2.1552842294624288e-08, 'epoch': 1.96} {'loss': 0.5393, 'learning_rate': 2.1531366986123904e-08, 'epoch': 1.96} {'loss': 0.5703, 'learning_rate': 2.150990237045458e-08, 'epoch': 1.96} {'loss': 0.5644, 'learning_rate': 2.1488448447637422e-08, 'epoch': 1.96} {'loss': 0.516, 'learning_rate': 2.1467005217695737e-08, 'epoch': 1.96} {'loss': 0.5313, 'learning_rate': 2.1445572680652838e-08, 'epoch': 1.96} {'loss': 0.4299, 'learning_rate': 2.1424150836530932e-08, 'epoch': 1.96} {'loss': 0.5999, 'learning_rate': 2.1402739685354444e-08, 'epoch': 1.96} {'loss': 0.3835, 'learning_rate': 2.138133922714558e-08, 'epoch': 1.96} {'loss': 0.4099, 'learning_rate': 2.1359949461927655e-08, 'epoch': 1.96} {'loss': 0.5734, 'learning_rate': 2.1338570389721757e-08, 'epoch': 1.96} {'loss': 0.5293, 'learning_rate': 2.1317202010553428e-08, 'epoch': 1.96} {'loss': 0.412, 'learning_rate': 2.129584432444376e-08, 'epoch': 1.96} {'loss': 0.4727, 'learning_rate': 2.1274497331417177e-08, 'epoch': 1.96} {'loss': 0.5232, 'learning_rate': 2.1253161031494773e-08, 'epoch': 1.96} {'loss': 0.5849, 'learning_rate': 2.1231835424700975e-08, 'epoch': 1.96} {'loss': 0.3764, 'learning_rate': 2.1210520511056875e-08, 'epoch': 1.96} {'loss': 0.3767, 'learning_rate': 2.11892162905869e-08, 'epoch': 1.96} {'loss': 0.5907, 'learning_rate': 2.1167922763313253e-08, 'epoch': 1.96} {'loss': 0.4239, 'learning_rate': 2.114663992925814e-08, 'epoch': 1.96} {'loss': 0.553, 'learning_rate': 2.112536778844598e-08, 'epoch': 1.96} {'loss': 0.453, 'learning_rate': 2.110410634089899e-08, 'epoch': 1.96} {'loss': 0.6313, 'learning_rate': 2.1082855586638252e-08, 'epoch': 1.96} {'loss': 0.4992, 'learning_rate': 2.1061615525689307e-08, 'epoch': 1.96} {'loss': 0.5082, 'learning_rate': 2.1040386158072136e-08, 'epoch': 1.96} {'loss': 0.5145, 'learning_rate': 2.1019167483812274e-08, 'epoch': 1.96} {'loss': 0.4771, 'learning_rate': 2.099795950292971e-08, 'epoch': 1.96} {'loss': 0.4369, 'learning_rate': 2.0976762215448865e-08, 'epoch': 1.96} {'loss': 0.4246, 'learning_rate': 2.0955575621393054e-08, 'epoch': 1.96} {'loss': 0.5844, 'learning_rate': 2.093439972078337e-08, 'epoch': 1.96} {'loss': 0.3836, 'learning_rate': 2.0913234513642022e-08, 'epoch': 1.96} {'loss': 0.5066, 'learning_rate': 2.0892079999994542e-08, 'epoch': 1.96} {'loss': 0.5585, 'learning_rate': 2.0870936179860913e-08, 'epoch': 1.96} {'loss': 0.6562, 'learning_rate': 2.084980305326556e-08, 'epoch': 1.96} {'loss': 0.5905, 'learning_rate': 2.082868062022958e-08, 'epoch': 1.96} {'loss': 0.5314, 'learning_rate': 2.0807568880776286e-08, 'epoch': 1.96} {'loss': 0.3813, 'learning_rate': 2.0786467834927882e-08, 'epoch': 1.96} {'loss': 0.5968, 'learning_rate': 2.0765377482708792e-08, 'epoch': 1.96} {'loss': 0.4829, 'learning_rate': 2.0744297824139002e-08, 'epoch': 1.96} {'loss': 0.469, 'learning_rate': 2.072322885924294e-08, 'epoch': 1.96} {'loss': 0.4545, 'learning_rate': 2.0702170588042804e-08, 'epoch': 1.96} {'loss': 0.5323, 'learning_rate': 2.0681123010560798e-08, 'epoch': 1.96} {'loss': 0.5317, 'learning_rate': 2.0660086126820243e-08, 'epoch': 1.96} {'loss': 0.3858, 'learning_rate': 2.0639059936842232e-08, 'epoch': 1.96} {'loss': 0.4828, 'learning_rate': 2.0618044440650075e-08, 'epoch': 1.96} {'loss': 0.6266, 'learning_rate': 2.059703963826709e-08, 'epoch': 1.96} {'loss': 0.4487, 'learning_rate': 2.0576045529715482e-08, 'epoch': 1.96} {'loss': 0.3963, 'learning_rate': 2.0555062115016345e-08, 'epoch': 1.96} {'loss': 0.5491, 'learning_rate': 2.053408939419299e-08, 'epoch': 1.96} {'loss': 0.5349, 'learning_rate': 2.051312736726874e-08, 'epoch': 1.96} {'loss': 0.6195, 'learning_rate': 2.0492176034265787e-08, 'epoch': 1.96} {'loss': 0.5489, 'learning_rate': 2.0471235395205235e-08, 'epoch': 1.96} {'loss': 0.5153, 'learning_rate': 2.0450305450110396e-08, 'epoch': 1.96} {'loss': 0.4414, 'learning_rate': 2.0429386199004585e-08, 'epoch': 1.96} {'loss': 0.508, 'learning_rate': 2.0408477641908897e-08, 'epoch': 1.96} {'loss': 0.6986, 'learning_rate': 2.0387579778846645e-08, 'epoch': 1.96} {'loss': 0.5126, 'learning_rate': 2.0366692609838924e-08, 'epoch': 1.96} {'loss': 0.6066, 'learning_rate': 2.0345816134910157e-08, 'epoch': 1.96} {'loss': 0.3688, 'learning_rate': 2.032495035408033e-08, 'epoch': 1.96} {'loss': 0.3432, 'learning_rate': 2.030409526737387e-08, 'epoch': 1.96} {'loss': 0.5982, 'learning_rate': 2.0283250874811867e-08, 'epoch': 1.96} {'loss': 0.6048, 'learning_rate': 2.0262417176417637e-08, 'epoch': 1.96} {'loss': 0.5041, 'learning_rate': 2.0241594172212277e-08, 'epoch': 1.96} {'loss': 0.6096, 'learning_rate': 2.0220781862219096e-08, 'epoch': 1.96} {'loss': 0.4634, 'learning_rate': 2.0199980246460306e-08, 'epoch': 1.96} {'loss': 0.6018, 'learning_rate': 2.0179189324958104e-08, 'epoch': 1.96} {'loss': 0.6446, 'learning_rate': 2.01584090977347e-08, 'epoch': 1.96} {'loss': 0.4967, 'learning_rate': 2.0137639564811183e-08, 'epoch': 1.96} {'loss': 0.4767, 'learning_rate': 2.0116880726211985e-08, 'epoch': 1.96} {'loss': 0.5071, 'learning_rate': 2.0096132581958194e-08, 'epoch': 1.96} {'loss': 0.5723, 'learning_rate': 2.0075395132072017e-08, 'epoch': 1.96} {'loss': 0.4287, 'learning_rate': 2.0054668376575658e-08, 'epoch': 1.96} {'loss': 0.5614, 'learning_rate': 2.0033952315491322e-08, 'epoch': 1.96} {'loss': 0.4919, 'learning_rate': 2.0013246948841213e-08, 'epoch': 1.96} {'loss': 0.4273, 'learning_rate': 1.9992552276648645e-08, 'epoch': 1.96} {'loss': 0.569, 'learning_rate': 1.9971868298933607e-08, 'epoch': 1.96} {'loss': 0.567, 'learning_rate': 1.9951195015720515e-08, 'epoch': 1.96} {'loss': 0.4719, 'learning_rate': 1.993053242702936e-08, 'epoch': 1.96} {'loss': 0.5757, 'learning_rate': 1.9909880532884563e-08, 'epoch': 1.96} {'loss': 0.457, 'learning_rate': 1.988923933330611e-08, 'epoch': 1.96} {'loss': 0.439, 'learning_rate': 1.9868608828317316e-08, 'epoch': 1.96} {'loss': 0.6057, 'learning_rate': 1.9847989017940383e-08, 'epoch': 1.96} {'loss': 0.415, 'learning_rate': 1.9827379902197518e-08, 'epoch': 1.96} {'loss': 0.5444, 'learning_rate': 1.9806781481109817e-08, 'epoch': 1.96} {'loss': 0.5178, 'learning_rate': 1.978619375469948e-08, 'epoch': 1.96} {'loss': 0.4911, 'learning_rate': 1.9765616722989823e-08, 'epoch': 1.96} {'loss': 0.5273, 'learning_rate': 1.9745050386001942e-08, 'epoch': 1.96} {'loss': 0.6268, 'learning_rate': 1.972449474375804e-08, 'epoch': 1.96} {'loss': 0.5572, 'learning_rate': 1.970394979627921e-08, 'epoch': 1.96} {'loss': 0.4726, 'learning_rate': 1.968341554358877e-08, 'epoch': 1.96} {'loss': 0.3054, 'learning_rate': 1.966289198570892e-08, 'epoch': 1.96} {'loss': 0.3986, 'learning_rate': 1.964237912266076e-08, 'epoch': 1.96} {'loss': 0.5259, 'learning_rate': 1.962187695446649e-08, 'epoch': 1.96} {'loss': 0.4857, 'learning_rate': 1.9601385481148316e-08, 'epoch': 1.96} {'loss': 0.4644, 'learning_rate': 1.958090470272844e-08, 'epoch': 1.96} {'loss': 0.4765, 'learning_rate': 1.9560434619227963e-08, 'epoch': 1.96} {'loss': 0.5717, 'learning_rate': 1.9539975230669085e-08, 'epoch': 1.96} {'loss': 0.5827, 'learning_rate': 1.951952653707401e-08, 'epoch': 1.96} {'loss': 0.4207, 'learning_rate': 1.9499088538463827e-08, 'epoch': 1.96} {'loss': 0.5383, 'learning_rate': 1.9478661234862973e-08, 'epoch': 1.96} {'loss': 0.4571, 'learning_rate': 1.945824462629031e-08, 'epoch': 1.96} {'loss': 0.6283, 'learning_rate': 1.9437838712769162e-08, 'epoch': 1.96} {'loss': 0.56, 'learning_rate': 1.941744349432062e-08, 'epoch': 1.96} {'loss': 0.4754, 'learning_rate': 1.9397058970967996e-08, 'epoch': 1.96} {'loss': 0.5843, 'learning_rate': 1.9376685142732388e-08, 'epoch': 1.96} {'loss': 0.6013, 'learning_rate': 1.9356322009633777e-08, 'epoch': 1.96} {'loss': 0.6122, 'learning_rate': 1.93359695716977e-08, 'epoch': 1.96} {'loss': 0.4207, 'learning_rate': 1.931562782894303e-08, 'epoch': 1.96} {'loss': 0.4752, 'learning_rate': 1.929529678139197e-08, 'epoch': 1.96} {'loss': 0.4772, 'learning_rate': 1.9274976429067836e-08, 'epoch': 1.96} {'loss': 0.4899, 'learning_rate': 1.9254666771990615e-08, 'epoch': 1.96} {'loss': 0.3445, 'learning_rate': 1.923436781018362e-08, 'epoch': 1.96} {'loss': 0.6102, 'learning_rate': 1.921407954366683e-08, 'epoch': 1.96} {'loss': 0.4971, 'learning_rate': 1.9193801972463567e-08, 'epoch': 1.96} {'loss': 0.5268, 'learning_rate': 1.917353509659492e-08, 'epoch': 1.96} {'loss': 0.4701, 'learning_rate': 1.9153278916083095e-08, 'epoch': 1.96} {'loss': 0.6167, 'learning_rate': 1.9133033430949188e-08, 'epoch': 1.96} {'loss': 0.3976, 'learning_rate': 1.9112798641214293e-08, 'epoch': 1.96} {'loss': 0.4444, 'learning_rate': 1.9092574546901722e-08, 'epoch': 1.96} {'loss': 0.4331, 'learning_rate': 1.907236114803146e-08, 'epoch': 1.96} {'loss': 0.4755, 'learning_rate': 1.9052158444626823e-08, 'epoch': 1.96} {'loss': 0.5292, 'learning_rate': 1.9031966436707795e-08, 'epoch': 1.96} {'loss': 0.5912, 'learning_rate': 1.9011785124297687e-08, 'epoch': 1.96} {'loss': 0.4507, 'learning_rate': 1.8991614507416488e-08, 'epoch': 1.96} {'loss': 0.6262, 'learning_rate': 1.897145458608751e-08, 'epoch': 1.96} {'loss': 0.5435, 'learning_rate': 1.895130536033074e-08, 'epoch': 1.96} {'loss': 0.3974, 'learning_rate': 1.8931166830168378e-08, 'epoch': 1.96} {'loss': 0.471, 'learning_rate': 1.8911038995622632e-08, 'epoch': 1.96} {'loss': 0.6092, 'learning_rate': 1.8890921856714595e-08, 'epoch': 1.96} {'loss': 0.4677, 'learning_rate': 1.887081541346536e-08, 'epoch': 1.96} {'loss': 0.469, 'learning_rate': 1.8850719665897133e-08, 'epoch': 1.96} {'loss': 0.3873, 'learning_rate': 1.8830634614031006e-08, 'epoch': 1.96} {'loss': 0.4132, 'learning_rate': 1.8810560257889187e-08, 'epoch': 1.96} {'loss': 0.5474, 'learning_rate': 1.879049659749277e-08, 'epoch': 1.96} {'loss': 0.5188, 'learning_rate': 1.8770443632862845e-08, 'epoch': 1.96} {'loss': 0.548, 'learning_rate': 1.875040136402162e-08, 'epoch': 1.96} {'loss': 0.5539, 'learning_rate': 1.8730369790989077e-08, 'epoch': 1.96} {'loss': 0.5696, 'learning_rate': 1.8710348913789644e-08, 'epoch': 1.96} {'loss': 0.4188, 'learning_rate': 1.8690338732441082e-08, 'epoch': 1.96} {'loss': 0.6774, 'learning_rate': 1.8670339246967818e-08, 'epoch': 1.96} {'loss': 0.246, 'learning_rate': 1.865035045738983e-08, 'epoch': 1.96} {'loss': 0.4492, 'learning_rate': 1.8630372363729333e-08, 'epoch': 1.96} {'loss': 0.5946, 'learning_rate': 1.86104049660063e-08, 'epoch': 1.96} {'loss': 0.4499, 'learning_rate': 1.8590448264244055e-08, 'epoch': 1.96} {'loss': 0.7008, 'learning_rate': 1.8570502258462576e-08, 'epoch': 1.96} {'loss': 0.4876, 'learning_rate': 1.8550566948682958e-08, 'epoch': 1.96} {'loss': 0.3811, 'learning_rate': 1.8530642334928518e-08, 'epoch': 1.96} {'loss': 0.3756, 'learning_rate': 1.8510728417219236e-08, 'epoch': 1.96} {'loss': 0.5698, 'learning_rate': 1.8490825195576212e-08, 'epoch': 1.96} {'loss': 0.3503, 'learning_rate': 1.8470932670020537e-08, 'epoch': 1.96} {'loss': 0.593, 'learning_rate': 1.8451050840574414e-08, 'epoch': 1.96} {'loss': 0.5924, 'learning_rate': 1.843117970726005e-08, 'epoch': 1.96} {'loss': 0.529, 'learning_rate': 1.841131927009632e-08, 'epoch': 1.96} {'loss': 0.4322, 'learning_rate': 1.8391469529106532e-08, 'epoch': 1.96} {'loss': 0.5743, 'learning_rate': 1.8371630484310677e-08, 'epoch': 1.96} {'loss': 0.314, 'learning_rate': 1.8351802135730956e-08, 'epoch': 1.96} {'loss': 0.5554, 'learning_rate': 1.8331984483387356e-08, 'epoch': 1.96} {'loss': 0.5499, 'learning_rate': 1.8312177527303188e-08, 'epoch': 1.96} {'loss': 0.4024, 'learning_rate': 1.8292381267497328e-08, 'epoch': 1.96} {'loss': 0.4663, 'learning_rate': 1.827259570399309e-08, 'epoch': 1.96} {'loss': 0.4598, 'learning_rate': 1.825282083680935e-08, 'epoch': 1.96} {'loss': 0.5574, 'learning_rate': 1.8233056665969417e-08, 'epoch': 1.96} {'loss': 0.4776, 'learning_rate': 1.821330319149328e-08, 'epoch': 1.96} {'loss': 0.6533, 'learning_rate': 1.8193560413403144e-08, 'epoch': 1.96} {'loss': 0.561, 'learning_rate': 1.817382833171899e-08, 'epoch': 1.96} {'loss': 0.5541, 'learning_rate': 1.8154106946463024e-08, 'epoch': 1.96} {'loss': 0.4978, 'learning_rate': 1.813439625765523e-08, 'epoch': 1.96} {'loss': 0.5029, 'learning_rate': 1.811469626531781e-08, 'epoch': 1.96} {'loss': 0.4037, 'learning_rate': 1.8095006969471864e-08, 'epoch': 1.96} {'loss': 0.6069, 'learning_rate': 1.8075328370137367e-08, 'epoch': 1.96} {'loss': 0.5015, 'learning_rate': 1.8055660467335424e-08, 'epoch': 1.96} {'loss': 0.5769, 'learning_rate': 1.803600326108934e-08, 'epoch': 1.96} {'loss': 0.4573, 'learning_rate': 1.8016356751417997e-08, 'epoch': 1.96} {'loss': 0.4085, 'learning_rate': 1.7996720938342483e-08, 'epoch': 1.96} {'loss': 0.5855, 'learning_rate': 1.7977095821885006e-08, 'epoch': 1.96} {'loss': 0.5743, 'learning_rate': 1.7957481402065547e-08, 'epoch': 1.96} {'loss': 0.4466, 'learning_rate': 1.79378776789052e-08, 'epoch': 1.96} {'loss': 0.5077, 'learning_rate': 1.7918284652426178e-08, 'epoch': 1.96} {'loss': 0.4536, 'learning_rate': 1.7898702322648453e-08, 'epoch': 1.96} {'loss': 0.5177, 'learning_rate': 1.7879130689593126e-08, 'epoch': 1.96} {'loss': 0.474, 'learning_rate': 1.7859569753281293e-08, 'epoch': 1.96} {'loss': 0.3237, 'learning_rate': 1.784001951373404e-08, 'epoch': 1.96} {'loss': 0.3751, 'learning_rate': 1.782047997097247e-08, 'epoch': 1.96} {'loss': 0.4266, 'learning_rate': 1.7800951125016563e-08, 'epoch': 1.96} {'loss': 0.5748, 'learning_rate': 1.7781432975887415e-08, 'epoch': 1.96} {'loss': 0.4529, 'learning_rate': 1.7761925523607227e-08, 'epoch': 1.96} {'loss': 0.5699, 'learning_rate': 1.7742428768195986e-08, 'epoch': 1.96} {'loss': 0.3885, 'learning_rate': 1.7722942709674783e-08, 'epoch': 1.96} {'loss': 0.5194, 'learning_rate': 1.770346734806361e-08, 'epoch': 1.96} {'loss': 0.4273, 'learning_rate': 1.768400268338466e-08, 'epoch': 1.96} {'loss': 0.4113, 'learning_rate': 1.7664548715659035e-08, 'epoch': 1.96} {'loss': 0.5263, 'learning_rate': 1.764510544490672e-08, 'epoch': 1.96} {'loss': 0.5615, 'learning_rate': 1.762567287114769e-08, 'epoch': 1.96} {'loss': 0.3878, 'learning_rate': 1.7606250994404162e-08, 'epoch': 1.96} {'loss': 0.4403, 'learning_rate': 1.758683981469611e-08, 'epoch': 1.96} {'loss': 0.5173, 'learning_rate': 1.7567439332044633e-08, 'epoch': 1.96} {'loss': 0.6084, 'learning_rate': 1.7548049546470825e-08, 'epoch': 1.96} {'loss': 0.4677, 'learning_rate': 1.752867045799578e-08, 'epoch': 1.96} {'loss': 0.677, 'learning_rate': 1.750930206663948e-08, 'epoch': 1.96} {'loss': 0.4289, 'learning_rate': 1.7489944372423018e-08, 'epoch': 1.96} {'loss': 0.3738, 'learning_rate': 1.747059737536638e-08, 'epoch': 1.96} {'loss': 0.5406, 'learning_rate': 1.7451261075491777e-08, 'epoch': 1.96} {'loss': 0.5295, 'learning_rate': 1.7431935472819184e-08, 'epoch': 1.96} {'loss': 0.4988, 'learning_rate': 1.741262056736859e-08, 'epoch': 1.96} {'loss': 0.462, 'learning_rate': 1.7393316359162193e-08, 'epoch': 1.96} {'loss': 0.488, 'learning_rate': 1.7374022848218874e-08, 'epoch': 1.96} {'loss': 0.4627, 'learning_rate': 1.7354740034560836e-08, 'epoch': 1.96} {'loss': 0.3338, 'learning_rate': 1.733546791820806e-08, 'epoch': 1.96} {'loss': 0.3845, 'learning_rate': 1.7316206499181643e-08, 'epoch': 1.96} {'loss': 0.442, 'learning_rate': 1.7296955777501566e-08, 'epoch': 1.96} {'loss': 0.5005, 'learning_rate': 1.727771575318893e-08, 'epoch': 1.96} {'loss': 0.4598, 'learning_rate': 1.725848642626371e-08, 'epoch': 1.96} {'loss': 0.4646, 'learning_rate': 1.7239267796748117e-08, 'epoch': 1.96} {'loss': 0.3893, 'learning_rate': 1.722005986465991e-08, 'epoch': 1.96} {'loss': 0.5394, 'learning_rate': 1.720086263002352e-08, 'epoch': 1.96} {'loss': 0.5125, 'learning_rate': 1.7181676092855594e-08, 'epoch': 1.96} {'loss': 0.4224, 'learning_rate': 1.7162500253179447e-08, 'epoch': 1.96} {'loss': 0.5782, 'learning_rate': 1.714333511101396e-08, 'epoch': 1.96} {'loss': 0.5413, 'learning_rate': 1.712418066638133e-08, 'epoch': 1.96} {'loss': 0.3654, 'learning_rate': 1.7105036919301542e-08, 'epoch': 1.96} {'loss': 0.4345, 'learning_rate': 1.7085903869793474e-08, 'epoch': 1.96} {'loss': 0.4943, 'learning_rate': 1.7066781517879328e-08, 'epoch': 1.96} {'loss': 0.5786, 'learning_rate': 1.7047669863579086e-08, 'epoch': 1.96} {'loss': 0.6109, 'learning_rate': 1.7028568906913843e-08, 'epoch': 1.96} {'loss': 0.4828, 'learning_rate': 1.7009478647902477e-08, 'epoch': 1.96} {'loss': 0.6206, 'learning_rate': 1.6990399086567187e-08, 'epoch': 1.96} {'loss': 0.5945, 'learning_rate': 1.697133022292796e-08, 'epoch': 1.96} {'loss': 0.4616, 'learning_rate': 1.6952272057003672e-08, 'epoch': 1.96} {'loss': 0.4021, 'learning_rate': 1.6933224588817632e-08, 'epoch': 1.96} {'loss': 0.3577, 'learning_rate': 1.6914187818387605e-08, 'epoch': 1.96} {'loss': 0.5976, 'learning_rate': 1.68951617457358e-08, 'epoch': 1.96} {'loss': 0.5295, 'learning_rate': 1.6876146370881087e-08, 'epoch': 1.96} {'loss': 0.604, 'learning_rate': 1.6857141693845668e-08, 'epoch': 1.96} {'loss': 0.4827, 'learning_rate': 1.683814771464731e-08, 'epoch': 1.96} {'loss': 0.4813, 'learning_rate': 1.6819164433309332e-08, 'epoch': 1.96} {'loss': 0.6333, 'learning_rate': 1.68001918498506e-08, 'epoch': 1.96} {'loss': 0.6291, 'learning_rate': 1.678122996428999e-08, 'epoch': 1.96} {'loss': 0.5554, 'learning_rate': 1.676227877665082e-08, 'epoch': 1.96} {'loss': 0.4537, 'learning_rate': 1.674333828695085e-08, 'epoch': 1.96} {'loss': 0.3586, 'learning_rate': 1.6724408495212286e-08, 'epoch': 1.96} {'loss': 0.5244, 'learning_rate': 1.670548940145511e-08, 'epoch': 1.96} {'loss': 0.5419, 'learning_rate': 1.66865810056982e-08, 'epoch': 1.96} {'loss': 0.4823, 'learning_rate': 1.6667683307962646e-08, 'epoch': 1.96} {'loss': 0.3614, 'learning_rate': 1.6648796308268433e-08, 'epoch': 1.96} {'loss': 0.507, 'learning_rate': 1.6629920006636657e-08, 'epoch': 1.96} {'loss': 0.4348, 'learning_rate': 1.661105440308619e-08, 'epoch': 1.96} {'loss': 0.4554, 'learning_rate': 1.659219949763924e-08, 'epoch': 1.96} {'loss': 0.6481, 'learning_rate': 1.6573355290314676e-08, 'epoch': 1.96} {'loss': 0.5497, 'learning_rate': 1.6554521781131373e-08, 'epoch': 1.96} {'loss': 0.5845, 'learning_rate': 1.6535698970112644e-08, 'epoch': 1.96} {'loss': 0.487, 'learning_rate': 1.651688685727626e-08, 'epoch': 1.96} {'loss': 0.48, 'learning_rate': 1.649808544264331e-08, 'epoch': 1.96} {'loss': 0.5471, 'learning_rate': 1.6479294726233773e-08, 'epoch': 1.96} {'loss': 0.4081, 'learning_rate': 1.6460514708066533e-08, 'epoch': 1.96} {'loss': 0.4439, 'learning_rate': 1.6441745388163787e-08, 'epoch': 1.96} {'loss': 0.5012, 'learning_rate': 1.6422986766545524e-08, 'epoch': 1.96} {'loss': 0.5128, 'learning_rate': 1.6404238843230612e-08, 'epoch': 1.96} {'loss': 0.4871, 'learning_rate': 1.638550161823904e-08, 'epoch': 1.96} {'loss': 0.6851, 'learning_rate': 1.63667750915919e-08, 'epoch': 1.96} {'loss': 0.551, 'learning_rate': 1.634805926330918e-08, 'epoch': 1.96} {'loss': 0.4566, 'learning_rate': 1.6329354133409748e-08, 'epoch': 1.96} {'loss': 0.4472, 'learning_rate': 1.631065970191581e-08, 'epoch': 1.96} {'loss': 0.4346, 'learning_rate': 1.629197596884513e-08, 'epoch': 1.96} {'loss': 0.5045, 'learning_rate': 1.6273302934218803e-08, 'epoch': 1.96} {'loss': 0.5545, 'learning_rate': 1.6254640598056814e-08, 'epoch': 1.96} {'loss': 0.5193, 'learning_rate': 1.6235988960379144e-08, 'epoch': 1.96} {'loss': 0.5538, 'learning_rate': 1.621734802120578e-08, 'epoch': 1.96} {'loss': 0.4335, 'learning_rate': 1.6198717780555595e-08, 'epoch': 1.96} {'loss': 0.4596, 'learning_rate': 1.618009823845079e-08, 'epoch': 1.96} {'loss': 0.4458, 'learning_rate': 1.6161489394909136e-08, 'epoch': 1.96} {'loss': 0.4497, 'learning_rate': 1.614289124995283e-08, 'epoch': 1.96} {'loss': 0.5229, 'learning_rate': 1.612430380359964e-08, 'epoch': 1.96} {'loss': 0.4979, 'learning_rate': 1.6105727055870658e-08, 'epoch': 1.96} {'loss': 0.5124, 'learning_rate': 1.6087161006784756e-08, 'epoch': 1.96} {'loss': 0.5467, 'learning_rate': 1.6068605656364143e-08, 'epoch': 1.96} {'loss': 0.6659, 'learning_rate': 1.6050061004625473e-08, 'epoch': 1.96} {'loss': 0.6357, 'learning_rate': 1.6031527051590946e-08, 'epoch': 1.96} {'loss': 0.3305, 'learning_rate': 1.6013003797280545e-08, 'epoch': 1.96} {'loss': 0.5628, 'learning_rate': 1.599449124171204e-08, 'epoch': 1.96} {'loss': 0.5142, 'learning_rate': 1.597598938490652e-08, 'epoch': 1.96} {'loss': 0.5209, 'learning_rate': 1.5957498226885082e-08, 'epoch': 1.96} {'loss': 0.6274, 'learning_rate': 1.5939017767665487e-08, 'epoch': 1.96} {'loss': 0.5487, 'learning_rate': 1.5920548007268832e-08, 'epoch': 1.96} {'loss': 0.4479, 'learning_rate': 1.590208894571288e-08, 'epoch': 1.96} {'loss': 0.4311, 'learning_rate': 1.5883640583020943e-08, 'epoch': 1.96} {'loss': 0.5243, 'learning_rate': 1.5865202919209675e-08, 'epoch': 1.96} {'loss': 0.5004, 'learning_rate': 1.5846775954300175e-08, 'epoch': 1.96} {'loss': 0.4888, 'learning_rate': 1.5828359688312423e-08, 'epoch': 1.96} {'loss': 0.6099, 'learning_rate': 1.5809954121265292e-08, 'epoch': 1.96} {'loss': 0.5201, 'learning_rate': 1.579155925317877e-08, 'epoch': 1.96} {'loss': 0.5394, 'learning_rate': 1.5773175084072832e-08, 'epoch': 1.96} {'loss': 0.6129, 'learning_rate': 1.5754801613967475e-08, 'epoch': 1.96} {'loss': 0.4362, 'learning_rate': 1.5736438842881563e-08, 'epoch': 1.96} {'loss': 0.4977, 'learning_rate': 1.5718086770835084e-08, 'epoch': 1.96} {'loss': 0.427, 'learning_rate': 1.569974539784802e-08, 'epoch': 1.96} {'loss': 0.4172, 'learning_rate': 1.568141472394036e-08, 'epoch': 1.96} {'loss': 0.4778, 'learning_rate': 1.566309474913097e-08, 'epoch': 1.96} {'loss': 0.4605, 'learning_rate': 1.564478547343873e-08, 'epoch': 1.96} {'loss': 0.3254, 'learning_rate': 1.562648689688584e-08, 'epoch': 1.96} {'loss': 0.6661, 'learning_rate': 1.5608199019488958e-08, 'epoch': 1.96} {'loss': 0.6163, 'learning_rate': 1.5589921841269173e-08, 'epoch': 1.96} {'loss': 0.4291, 'learning_rate': 1.5571655362246472e-08, 'epoch': 1.96} {'loss': 0.5185, 'learning_rate': 1.5553399582439732e-08, 'epoch': 1.96} {'loss': 0.5574, 'learning_rate': 1.5535154501868933e-08, 'epoch': 1.96} {'loss': 0.4452, 'learning_rate': 1.551692012055295e-08, 'epoch': 1.96} {'loss': 0.3746, 'learning_rate': 1.5498696438511764e-08, 'epoch': 1.96} {'loss': 0.4665, 'learning_rate': 1.548048345576536e-08, 'epoch': 1.96} {'loss': 0.5837, 'learning_rate': 1.5462281172332615e-08, 'epoch': 1.96} {'loss': 0.5061, 'learning_rate': 1.5444089588232404e-08, 'epoch': 1.96} {'loss': 0.4251, 'learning_rate': 1.5425908703485816e-08, 'epoch': 1.96} {'loss': 0.3586, 'learning_rate': 1.5407738518111724e-08, 'epoch': 1.96} {'loss': 0.4556, 'learning_rate': 1.538957903212901e-08, 'epoch': 1.96} {'loss': 0.5715, 'learning_rate': 1.537143024555654e-08, 'epoch': 1.96} {'loss': 0.5391, 'learning_rate': 1.535329215841652e-08, 'epoch': 1.96} {'loss': 0.4485, 'learning_rate': 1.533516477072561e-08, 'epoch': 1.96} {'loss': 0.5909, 'learning_rate': 1.531704808250378e-08, 'epoch': 1.96} {'loss': 0.5028, 'learning_rate': 1.529894209377214e-08, 'epoch': 1.96} {'loss': 0.5432, 'learning_rate': 1.5280846804548445e-08, 'epoch': 1.96} {'loss': 0.5057, 'learning_rate': 1.526276221485268e-08, 'epoch': 1.96} {'loss': 0.5205, 'learning_rate': 1.5244688324703716e-08, 'epoch': 1.96} {'loss': 0.5092, 'learning_rate': 1.5226625134120432e-08, 'epoch': 1.96} {'loss': 0.6899, 'learning_rate': 1.520857264312392e-08, 'epoch': 1.96} {'loss': 0.4893, 'learning_rate': 1.5190530851733053e-08, 'epoch': 1.97} {'loss': 0.5725, 'learning_rate': 1.51724997599656e-08, 'epoch': 1.97} {'loss': 0.6085, 'learning_rate': 1.5154479367842644e-08, 'epoch': 1.97} {'loss': 0.5456, 'learning_rate': 1.513646967538307e-08, 'epoch': 1.97} {'loss': 0.4458, 'learning_rate': 1.5118470682605745e-08, 'epoch': 1.97} {'loss': 0.5926, 'learning_rate': 1.5100482389529546e-08, 'epoch': 1.97} {'loss': 0.4703, 'learning_rate': 1.5082504796175568e-08, 'epoch': 1.97} {'loss': 0.4661, 'learning_rate': 1.506453790256046e-08, 'epoch': 1.97} {'loss': 0.5787, 'learning_rate': 1.5046581708706433e-08, 'epoch': 1.97} {'loss': 0.4269, 'learning_rate': 1.5028636214630133e-08, 'epoch': 1.97} {'loss': 0.5095, 'learning_rate': 1.501070142035266e-08, 'epoch': 1.97} {'loss': 0.4367, 'learning_rate': 1.4992777325891773e-08, 'epoch': 1.97} {'loss': 0.4064, 'learning_rate': 1.4974863931267458e-08, 'epoch': 1.97} {'loss': 0.4392, 'learning_rate': 1.495696123649859e-08, 'epoch': 1.97} {'loss': 0.4114, 'learning_rate': 1.4939069241605154e-08, 'epoch': 1.97} {'loss': 0.5299, 'learning_rate': 1.4921187946604908e-08, 'epoch': 1.97} {'loss': 0.4851, 'learning_rate': 1.4903317351517842e-08, 'epoch': 1.97} {'loss': 0.5891, 'learning_rate': 1.4885457456363939e-08, 'epoch': 1.97} {'loss': 0.5091, 'learning_rate': 1.4867608261160959e-08, 'epoch': 1.97} {'loss': 0.4951, 'learning_rate': 1.484976976592889e-08, 'epoch': 1.97} {'loss': 0.4153, 'learning_rate': 1.4831941970685493e-08, 'epoch': 1.97} {'loss': 0.5044, 'learning_rate': 1.4814124875451863e-08, 'epoch': 1.97} {'loss': 0.5691, 'learning_rate': 1.4796318480245764e-08, 'epoch': 1.97} {'loss': 0.5852, 'learning_rate': 1.4778522785087179e-08, 'epoch': 1.97} {'loss': 0.6607, 'learning_rate': 1.4760737789993874e-08, 'epoch': 1.97} {'loss': 0.3233, 'learning_rate': 1.474296349498583e-08, 'epoch': 1.97} {'loss': 0.4998, 'learning_rate': 1.4725199900081921e-08, 'epoch': 1.97} {'loss': 0.5232, 'learning_rate': 1.4707447005302134e-08, 'epoch': 1.97} {'loss': 0.5733, 'learning_rate': 1.4689704810663119e-08, 'epoch': 1.97} {'loss': 0.4711, 'learning_rate': 1.4671973316185973e-08, 'epoch': 1.97} {'loss': 0.5879, 'learning_rate': 1.4654252521888457e-08, 'epoch': 1.97} {'loss': 0.3655, 'learning_rate': 1.4636542427791668e-08, 'epoch': 1.97} {'loss': 0.5175, 'learning_rate': 1.4618843033912256e-08, 'epoch': 1.97} {'loss': 0.5195, 'learning_rate': 1.4601154340269097e-08, 'epoch': 1.97} {'loss': 0.4791, 'learning_rate': 1.4583476346883285e-08, 'epoch': 1.97} {'loss': 0.4363, 'learning_rate': 1.4565809053771473e-08, 'epoch': 1.97} {'loss': 0.5312, 'learning_rate': 1.4548152460954757e-08, 'epoch': 1.97} {'loss': 0.4807, 'learning_rate': 1.4530506568449787e-08, 'epoch': 1.97} {'loss': 0.3572, 'learning_rate': 1.4512871376276549e-08, 'epoch': 1.97} {'loss': 0.4724, 'learning_rate': 1.4495246884455027e-08, 'epoch': 1.97} {'loss': 0.5378, 'learning_rate': 1.4477633093002985e-08, 'epoch': 1.97} {'loss': 0.4246, 'learning_rate': 1.4460030001939297e-08, 'epoch': 1.97} {'loss': 0.6877, 'learning_rate': 1.4442437611282833e-08, 'epoch': 1.97} {'loss': 0.3617, 'learning_rate': 1.4424855921052472e-08, 'epoch': 1.97} {'loss': 0.4949, 'learning_rate': 1.4407284931267084e-08, 'epoch': 1.97} {'loss': 0.5649, 'learning_rate': 1.4389724641945546e-08, 'epoch': 1.97} {'loss': 0.5305, 'learning_rate': 1.437217505310673e-08, 'epoch': 1.97} {'loss': 0.5328, 'learning_rate': 1.4354636164769509e-08, 'epoch': 1.97} {'loss': 0.467, 'learning_rate': 1.4337107976951647e-08, 'epoch': 1.97} {'loss': 0.538, 'learning_rate': 1.431959048967424e-08, 'epoch': 1.97} {'loss': 0.4922, 'learning_rate': 1.430208370295394e-08, 'epoch': 1.97} {'loss': 0.6332, 'learning_rate': 1.428458761681073e-08, 'epoch': 1.97} {'loss': 0.3507, 'learning_rate': 1.4267102231262376e-08, 'epoch': 1.97} {'loss': 0.4663, 'learning_rate': 1.424962754632775e-08, 'epoch': 1.97} {'loss': 0.4939, 'learning_rate': 1.4232163562025725e-08, 'epoch': 1.97} {'loss': 0.3922, 'learning_rate': 1.4214710278376287e-08, 'epoch': 1.97} {'loss': 0.6566, 'learning_rate': 1.4197267695397199e-08, 'epoch': 1.97} {'loss': 0.5272, 'learning_rate': 1.4179835813106224e-08, 'epoch': 1.97} {'loss': 0.4453, 'learning_rate': 1.4162414631523346e-08, 'epoch': 1.97} {'loss': 0.5112, 'learning_rate': 1.4145004150665221e-08, 'epoch': 1.97} {'loss': 0.4496, 'learning_rate': 1.4127604370554048e-08, 'epoch': 1.97} {'loss': 0.4675, 'learning_rate': 1.4110215291205375e-08, 'epoch': 1.97} {'loss': 0.5629, 'learning_rate': 1.4092836912639184e-08, 'epoch': 1.97} {'loss': 0.4553, 'learning_rate': 1.407546923487324e-08, 'epoch': 1.97} {'loss': 0.5521, 'learning_rate': 1.4058112257927525e-08, 'epoch': 1.97} {'loss': 0.3806, 'learning_rate': 1.4040765981819804e-08, 'epoch': 1.97} {'loss': 0.4608, 'learning_rate': 1.402343040656784e-08, 'epoch': 1.97} {'loss': 0.4144, 'learning_rate': 1.4006105532191617e-08, 'epoch': 1.97} {'loss': 0.495, 'learning_rate': 1.3988791358708898e-08, 'epoch': 1.97} {'loss': 0.5124, 'learning_rate': 1.3971487886138557e-08, 'epoch': 1.97} {'loss': 0.4901, 'learning_rate': 1.3954195114499468e-08, 'epoch': 1.97} {'loss': 0.4911, 'learning_rate': 1.3936913043809397e-08, 'epoch': 1.97} {'loss': 0.4419, 'learning_rate': 1.3919641674087214e-08, 'epoch': 1.97} {'loss': 0.6063, 'learning_rate': 1.3902381005351796e-08, 'epoch': 1.97} {'loss': 0.4111, 'learning_rate': 1.3885131037620903e-08, 'epoch': 1.97} {'loss': 0.5505, 'learning_rate': 1.386789177091341e-08, 'epoch': 1.97} {'loss': 0.6256, 'learning_rate': 1.3850663205248194e-08, 'epoch': 1.97} {'loss': 0.3046, 'learning_rate': 1.3833445340641905e-08, 'epoch': 1.97} {'loss': 0.5505, 'learning_rate': 1.3816238177115637e-08, 'epoch': 1.97} {'loss': 0.7734, 'learning_rate': 1.3799041714687156e-08, 'epoch': 1.97} {'loss': 0.3983, 'learning_rate': 1.3781855953373114e-08, 'epoch': 1.97} {'loss': 0.5325, 'learning_rate': 1.3764680893193493e-08, 'epoch': 1.97} {'loss': 0.4045, 'learning_rate': 1.3747516534166061e-08, 'epoch': 1.97} {'loss': 0.5572, 'learning_rate': 1.3730362876309689e-08, 'epoch': 1.97} {'loss': 0.4155, 'learning_rate': 1.371321991964325e-08, 'epoch': 1.97} {'loss': 0.5092, 'learning_rate': 1.36960876641834e-08, 'epoch': 1.97} {'loss': 0.5456, 'learning_rate': 1.367896610995012e-08, 'epoch': 1.97} {'loss': 0.4077, 'learning_rate': 1.3661855256961176e-08, 'epoch': 1.97} {'loss': 0.5745, 'learning_rate': 1.3644755105234332e-08, 'epoch': 1.97} {'loss': 0.5143, 'learning_rate': 1.3627665654789567e-08, 'epoch': 1.97} {'loss': 0.4505, 'learning_rate': 1.3610586905642431e-08, 'epoch': 1.97} {'loss': 0.6838, 'learning_rate': 1.3593518857814015e-08, 'epoch': 1.97} {'loss': 0.4469, 'learning_rate': 1.3576461511320971e-08, 'epoch': 1.97} {'loss': 0.4201, 'learning_rate': 1.3559414866183284e-08, 'epoch': 1.97} {'loss': 0.4608, 'learning_rate': 1.3542378922416498e-08, 'epoch': 1.97} {'loss': 0.4444, 'learning_rate': 1.3525353680040599e-08, 'epoch': 1.97} {'loss': 0.4577, 'learning_rate': 1.3508339139074455e-08, 'epoch': 1.97} {'loss': 0.3355, 'learning_rate': 1.3491335299534725e-08, 'epoch': 1.97} {'loss': 0.4392, 'learning_rate': 1.347434216144028e-08, 'epoch': 1.97} {'loss': 0.5877, 'learning_rate': 1.3457359724809994e-08, 'epoch': 1.97} {'loss': 0.5563, 'learning_rate': 1.344038798966163e-08, 'epoch': 1.97} {'loss': 0.4926, 'learning_rate': 1.3423426956012953e-08, 'epoch': 1.97} {'loss': 0.5966, 'learning_rate': 1.3406476623881726e-08, 'epoch': 1.97} {'loss': 0.5909, 'learning_rate': 1.3389536993287933e-08, 'epoch': 1.97} {'loss': 0.4656, 'learning_rate': 1.3372608064248227e-08, 'epoch': 1.97} {'loss': 0.4414, 'learning_rate': 1.3355689836780372e-08, 'epoch': 1.97} {'loss': 0.4546, 'learning_rate': 1.3338782310904353e-08, 'epoch': 1.97} {'loss': 0.4834, 'learning_rate': 1.3321885486636821e-08, 'epoch': 1.97} {'loss': 0.4718, 'learning_rate': 1.3304999363995542e-08, 'epoch': 1.97} {'loss': 0.6531, 'learning_rate': 1.3288123942999387e-08, 'epoch': 1.97} {'loss': 0.5676, 'learning_rate': 1.3271259223667232e-08, 'epoch': 1.97} {'loss': 0.526, 'learning_rate': 1.325440520601573e-08, 'epoch': 1.97} {'loss': 0.4593, 'learning_rate': 1.3237561890063754e-08, 'epoch': 1.97} {'loss': 0.6635, 'learning_rate': 1.3220729275829069e-08, 'epoch': 1.97} {'loss': 0.475, 'learning_rate': 1.3203907363329438e-08, 'epoch': 1.97} {'loss': 0.5381, 'learning_rate': 1.3187096152583734e-08, 'epoch': 1.97} {'loss': 0.5359, 'learning_rate': 1.3170295643608611e-08, 'epoch': 1.97} {'loss': 0.6322, 'learning_rate': 1.3153505836424052e-08, 'epoch': 1.97} {'loss': 0.543, 'learning_rate': 1.3136726731045601e-08, 'epoch': 1.97} {'loss': 0.4487, 'learning_rate': 1.3119958327493243e-08, 'epoch': 1.97} {'loss': 0.4196, 'learning_rate': 1.310320062578363e-08, 'epoch': 1.97} {'loss': 0.3323, 'learning_rate': 1.3086453625936746e-08, 'epoch': 1.97} {'loss': 0.5026, 'learning_rate': 1.3069717327967024e-08, 'epoch': 1.97} {'loss': 0.4461, 'learning_rate': 1.3052991731895558e-08, 'epoch': 1.97} {'loss': 0.5555, 'learning_rate': 1.3036276837740114e-08, 'epoch': 1.97} {'loss': 0.3387, 'learning_rate': 1.3019572645516231e-08, 'epoch': 1.97} {'loss': 0.636, 'learning_rate': 1.3002879155243898e-08, 'epoch': 1.97} {'loss': 0.4606, 'learning_rate': 1.2986196366940873e-08, 'epoch': 1.97} {'loss': 0.4847, 'learning_rate': 1.2969524280623814e-08, 'epoch': 1.97} {'loss': 0.4544, 'learning_rate': 1.2952862896310481e-08, 'epoch': 1.97} {'loss': 0.2654, 'learning_rate': 1.2936212214020861e-08, 'epoch': 1.97} {'loss': 0.6258, 'learning_rate': 1.2919572233770494e-08, 'epoch': 1.97} {'loss': 0.5659, 'learning_rate': 1.2902942955579367e-08, 'epoch': 1.97} {'loss': 0.4519, 'learning_rate': 1.2886324379463022e-08, 'epoch': 1.97} {'loss': 0.5633, 'learning_rate': 1.2869716505441443e-08, 'epoch': 1.97} {'loss': 0.42, 'learning_rate': 1.2853119333530172e-08, 'epoch': 1.97} {'loss': 0.4577, 'learning_rate': 1.2836532863749196e-08, 'epoch': 1.97} {'loss': 0.5025, 'learning_rate': 1.2819957096115166e-08, 'epoch': 1.97} {'loss': 0.5296, 'learning_rate': 1.2803392030645845e-08, 'epoch': 1.97} {'loss': 0.5076, 'learning_rate': 1.2786837667358998e-08, 'epoch': 1.97} {'loss': 0.5751, 'learning_rate': 1.2770294006272387e-08, 'epoch': 1.97} {'loss': 0.6118, 'learning_rate': 1.2753761047403778e-08, 'epoch': 1.97} {'loss': 0.581, 'learning_rate': 1.2737238790769824e-08, 'epoch': 1.97} {'loss': 0.517, 'learning_rate': 1.2720727236390507e-08, 'epoch': 1.97} {'loss': 0.6243, 'learning_rate': 1.2704226384282482e-08, 'epoch': 1.97} {'loss': 0.574, 'learning_rate': 1.268773623446351e-08, 'epoch': 1.97} {'loss': 0.3935, 'learning_rate': 1.2671256786950249e-08, 'epoch': 1.97} {'loss': 0.4208, 'learning_rate': 1.2654788041761568e-08, 'epoch': 1.97} {'loss': 0.5811, 'learning_rate': 1.2638329998914123e-08, 'epoch': 1.97} {'loss': 0.534, 'learning_rate': 1.2621882658426787e-08, 'epoch': 1.97} {'loss': 0.3869, 'learning_rate': 1.2605446020316214e-08, 'epoch': 1.97} {'loss': 0.4915, 'learning_rate': 1.2589020084601278e-08, 'epoch': 1.97} {'loss': 0.3596, 'learning_rate': 1.257260485129752e-08, 'epoch': 1.97} {'loss': 0.525, 'learning_rate': 1.2556200320423817e-08, 'epoch': 1.97} {'loss': 0.5199, 'learning_rate': 1.253980649199793e-08, 'epoch': 1.97} {'loss': 0.4948, 'learning_rate': 1.2523423366036513e-08, 'epoch': 1.97} {'loss': 0.3998, 'learning_rate': 1.2507050942558441e-08, 'epoch': 1.97} {'loss': 0.4804, 'learning_rate': 1.2490689221579256e-08, 'epoch': 1.97} {'loss': 0.4603, 'learning_rate': 1.247433820311894e-08, 'epoch': 1.97} {'loss': 0.4345, 'learning_rate': 1.2457997887193041e-08, 'epoch': 1.97} {'loss': 0.3231, 'learning_rate': 1.2441668273820428e-08, 'epoch': 1.97} {'loss': 0.5876, 'learning_rate': 1.2425349363017758e-08, 'epoch': 1.97} {'loss': 0.564, 'learning_rate': 1.2409041154802792e-08, 'epoch': 1.97} {'loss': 0.538, 'learning_rate': 1.2392743649193294e-08, 'epoch': 1.97} {'loss': 0.4257, 'learning_rate': 1.237645684620481e-08, 'epoch': 1.97} {'loss': 0.5061, 'learning_rate': 1.236018074585843e-08, 'epoch': 1.97} {'loss': 0.5032, 'learning_rate': 1.2343915348168589e-08, 'epoch': 1.97} {'loss': 0.4909, 'learning_rate': 1.232766065315416e-08, 'epoch': 1.97} {'loss': 0.4519, 'learning_rate': 1.23114166608318e-08, 'epoch': 1.97} {'loss': 0.4274, 'learning_rate': 1.2295183371218155e-08, 'epoch': 1.97} {'loss': 0.6254, 'learning_rate': 1.2278960784333215e-08, 'epoch': 1.97} {'loss': 0.4122, 'learning_rate': 1.2262748900192523e-08, 'epoch': 1.97} {'loss': 0.4902, 'learning_rate': 1.224654771881273e-08, 'epoch': 1.97} {'loss': 0.4959, 'learning_rate': 1.223035724021382e-08, 'epoch': 1.97} {'loss': 0.5182, 'learning_rate': 1.2214177464410226e-08, 'epoch': 1.97} {'loss': 0.5891, 'learning_rate': 1.2198008391420824e-08, 'epoch': 1.97} {'loss': 0.6025, 'learning_rate': 1.2181850021263375e-08, 'epoch': 1.97} {'loss': 0.4312, 'learning_rate': 1.2165702353954534e-08, 'epoch': 1.97} {'loss': 0.4715, 'learning_rate': 1.2149565389510953e-08, 'epoch': 1.97} {'loss': 0.5325, 'learning_rate': 1.2133439127950398e-08, 'epoch': 1.97} {'loss': 0.525, 'learning_rate': 1.211732356929063e-08, 'epoch': 1.97} {'loss': 0.5143, 'learning_rate': 1.2101218713548302e-08, 'epoch': 1.97} {'loss': 0.5054, 'learning_rate': 1.208512456074118e-08, 'epoch': 1.97} {'loss': 0.4685, 'learning_rate': 1.2069041110887026e-08, 'epoch': 1.97} {'loss': 0.4171, 'learning_rate': 1.2052968364002493e-08, 'epoch': 1.97} {'loss': 0.5814, 'learning_rate': 1.2036906320103126e-08, 'epoch': 1.97} {'loss': 0.364, 'learning_rate': 1.2020854979208907e-08, 'epoch': 1.97} {'loss': 0.5041, 'learning_rate': 1.2004814341335381e-08, 'epoch': 1.97} {'loss': 0.5338, 'learning_rate': 1.198878440650031e-08, 'epoch': 1.97} {'loss': 0.5015, 'learning_rate': 1.1972765174720347e-08, 'epoch': 1.97} {'loss': 0.5177, 'learning_rate': 1.1956756646013256e-08, 'epoch': 1.97} {'loss': 0.5519, 'learning_rate': 1.1940758820396803e-08, 'epoch': 1.97} {'loss': 0.5439, 'learning_rate': 1.1924771697886528e-08, 'epoch': 1.97} {'loss': 0.5454, 'learning_rate': 1.1908795278500196e-08, 'epoch': 1.97} {'loss': 0.4542, 'learning_rate': 1.189282956225557e-08, 'epoch': 1.97} {'loss': 0.6376, 'learning_rate': 1.1876874549168194e-08, 'epoch': 1.97} {'loss': 0.503, 'learning_rate': 1.186093023925805e-08, 'epoch': 1.97} {'loss': 0.5816, 'learning_rate': 1.1844996632538463e-08, 'epoch': 1.97} {'loss': 0.493, 'learning_rate': 1.1829073729029417e-08, 'epoch': 1.97} {'loss': 0.4743, 'learning_rate': 1.1813161528747564e-08, 'epoch': 1.97} {'loss': 0.5506, 'learning_rate': 1.1797260031708447e-08, 'epoch': 1.97} {'loss': 0.6198, 'learning_rate': 1.178136923792983e-08, 'epoch': 1.97} {'loss': 0.5515, 'learning_rate': 1.1765489147430586e-08, 'epoch': 1.97} {'loss': 0.5747, 'learning_rate': 1.174961976022515e-08, 'epoch': 1.97} {'loss': 0.4914, 'learning_rate': 1.1733761076330175e-08, 'epoch': 1.97} {'loss': 0.4712, 'learning_rate': 1.1717913095765642e-08, 'epoch': 1.97} {'loss': 0.6956, 'learning_rate': 1.1702075818545989e-08, 'epoch': 1.97} {'loss': 0.351, 'learning_rate': 1.1686249244690085e-08, 'epoch': 1.97} {'loss': 0.5735, 'learning_rate': 1.1670433374213475e-08, 'epoch': 1.97} {'loss': 0.5845, 'learning_rate': 1.1654628207132811e-08, 'epoch': 1.97} {'loss': 0.585, 'learning_rate': 1.163883374346697e-08, 'epoch': 1.97} {'loss': 0.4501, 'learning_rate': 1.1623049983230384e-08, 'epoch': 1.97} {'loss': 0.2875, 'learning_rate': 1.1607276926441923e-08, 'epoch': 1.97} {'loss': 0.5531, 'learning_rate': 1.1591514573117136e-08, 'epoch': 1.97} {'loss': 0.5906, 'learning_rate': 1.1575762923273781e-08, 'epoch': 1.97} {'loss': 0.6635, 'learning_rate': 1.1560021976928514e-08, 'epoch': 1.97} {'loss': 0.5509, 'learning_rate': 1.15442917340991e-08, 'epoch': 1.97} {'loss': 0.5883, 'learning_rate': 1.152857219479997e-08, 'epoch': 1.97} {'loss': 0.3904, 'learning_rate': 1.1512863359051107e-08, 'epoch': 1.97} {'loss': 0.5847, 'learning_rate': 1.1497165226866947e-08, 'epoch': 1.97} {'loss': 0.5316, 'learning_rate': 1.148147779826414e-08, 'epoch': 1.97} {'loss': 0.4434, 'learning_rate': 1.1465801073261561e-08, 'epoch': 1.97} {'loss': 0.4041, 'learning_rate': 1.1450135051874756e-08, 'epoch': 1.97} {'loss': 0.4515, 'learning_rate': 1.1434479734120374e-08, 'epoch': 1.97} {'loss': 0.4231, 'learning_rate': 1.1418835120016181e-08, 'epoch': 1.97} {'loss': 0.5864, 'learning_rate': 1.1403201209577718e-08, 'epoch': 1.97} {'loss': 0.3075, 'learning_rate': 1.1387578002821642e-08, 'epoch': 1.97} {'loss': 0.5574, 'learning_rate': 1.1371965499766824e-08, 'epoch': 1.97} {'loss': 0.5204, 'learning_rate': 1.1356363700426586e-08, 'epoch': 1.97} {'loss': 0.4683, 'learning_rate': 1.1340772604820915e-08, 'epoch': 1.97} {'loss': 0.3106, 'learning_rate': 1.1325192212964242e-08, 'epoch': 1.97} {'loss': 0.5965, 'learning_rate': 1.130962252487544e-08, 'epoch': 1.97} {'loss': 0.4616, 'learning_rate': 1.1294063540568945e-08, 'epoch': 1.97} {'loss': 0.4268, 'learning_rate': 1.1278515260062516e-08, 'epoch': 1.97} {'loss': 0.5008, 'learning_rate': 1.126297768337281e-08, 'epoch': 1.97} {'loss': 0.5414, 'learning_rate': 1.1247450810516481e-08, 'epoch': 1.97} {'loss': 0.4778, 'learning_rate': 1.1231934641509068e-08, 'epoch': 1.97} {'loss': 0.518, 'learning_rate': 1.1216429176369447e-08, 'epoch': 1.97} {'loss': 0.548, 'learning_rate': 1.1200934415113163e-08, 'epoch': 1.97} {'loss': 0.4186, 'learning_rate': 1.1185450357755756e-08, 'epoch': 1.97} {'loss': 0.3971, 'learning_rate': 1.1169977004314992e-08, 'epoch': 1.97} {'loss': 0.4305, 'learning_rate': 1.1154514354806412e-08, 'epoch': 1.97} {'loss': 0.5525, 'learning_rate': 1.1139062409247781e-08, 'epoch': 1.97} {'loss': 0.4331, 'learning_rate': 1.1123621167655752e-08, 'epoch': 1.97} {'loss': 0.6226, 'learning_rate': 1.1108190630045867e-08, 'epoch': 1.97} {'loss': 0.5236, 'learning_rate': 1.1092770796435892e-08, 'epoch': 1.97} {'loss': 0.4591, 'learning_rate': 1.1077361666840258e-08, 'epoch': 1.97} {'loss': 0.4397, 'learning_rate': 1.106196324127784e-08, 'epoch': 1.97} {'loss': 0.4406, 'learning_rate': 1.104657551976307e-08, 'epoch': 1.97} {'loss': 0.608, 'learning_rate': 1.1031198502313712e-08, 'epoch': 1.97} {'loss': 0.356, 'learning_rate': 1.1015832188946419e-08, 'epoch': 1.97} {'loss': 0.5332, 'learning_rate': 1.1000476579677844e-08, 'epoch': 1.97} {'loss': 0.5855, 'learning_rate': 1.098513167452242e-08, 'epoch': 1.97} {'loss': 0.4155, 'learning_rate': 1.0969797473499022e-08, 'epoch': 1.97} {'loss': 0.5905, 'learning_rate': 1.0954473976622081e-08, 'epoch': 1.97} {'loss': 0.5969, 'learning_rate': 1.0939161183910473e-08, 'epoch': 1.97} {'loss': 0.5818, 'learning_rate': 1.092385909537752e-08, 'epoch': 1.97} {'loss': 0.5551, 'learning_rate': 1.0908567711042095e-08, 'epoch': 1.97} {'loss': 0.4067, 'learning_rate': 1.089328703091974e-08, 'epoch': 1.97} {'loss': 0.3831, 'learning_rate': 1.0878017055026002e-08, 'epoch': 1.97} {'loss': 0.5182, 'learning_rate': 1.0862757783378641e-08, 'epoch': 1.97} {'loss': 0.4874, 'learning_rate': 1.0847509215994311e-08, 'epoch': 1.97} {'loss': 0.5455, 'learning_rate': 1.0832271352887446e-08, 'epoch': 1.97} {'loss': 0.3327, 'learning_rate': 1.08170441940747e-08, 'epoch': 1.97} {'loss': 0.4405, 'learning_rate': 1.0801827739574944e-08, 'epoch': 1.97} {'loss': 0.5117, 'learning_rate': 1.0786621989401503e-08, 'epoch': 1.97} {'loss': 0.4137, 'learning_rate': 1.0771426943571029e-08, 'epoch': 1.97} {'loss': 0.5005, 'learning_rate': 1.0756242602101285e-08, 'epoch': 1.97} {'loss': 0.5601, 'learning_rate': 1.0741068965007817e-08, 'epoch': 1.97} {'loss': 0.5535, 'learning_rate': 1.0725906032307277e-08, 'epoch': 1.97} {'loss': 0.6952, 'learning_rate': 1.0710753804015206e-08, 'epoch': 1.97} {'loss': 0.528, 'learning_rate': 1.069561228014826e-08, 'epoch': 1.97} {'loss': 0.4987, 'learning_rate': 1.068048146072198e-08, 'epoch': 1.97} {'loss': 0.6118, 'learning_rate': 1.0665361345754133e-08, 'epoch': 1.97} {'loss': 0.5066, 'learning_rate': 1.0650251935259148e-08, 'epoch': 1.97} {'loss': 0.5383, 'learning_rate': 1.063515322925368e-08, 'epoch': 1.97} {'loss': 0.6272, 'learning_rate': 1.0620065227755494e-08, 'epoch': 1.97} {'loss': 0.4388, 'learning_rate': 1.060498793077902e-08, 'epoch': 1.97} {'loss': 0.4833, 'learning_rate': 1.0589921338340914e-08, 'epoch': 1.97} {'loss': 0.6536, 'learning_rate': 1.0574865450456718e-08, 'epoch': 1.97} {'loss': 0.4514, 'learning_rate': 1.0559820267143085e-08, 'epoch': 1.97} {'loss': 0.3481, 'learning_rate': 1.0544785788416666e-08, 'epoch': 1.97} {'loss': 0.5619, 'learning_rate': 1.052976201429301e-08, 'epoch': 1.97} {'loss': 0.5095, 'learning_rate': 1.0514748944788766e-08, 'epoch': 1.97} {'loss': 0.5441, 'learning_rate': 1.049974657991948e-08, 'epoch': 1.97} {'loss': 0.4957, 'learning_rate': 1.048475491970069e-08, 'epoch': 1.97} {'loss': 0.5834, 'learning_rate': 1.0469773964150166e-08, 'epoch': 1.97} {'loss': 0.6101, 'learning_rate': 1.0454803713281225e-08, 'epoch': 1.97} {'loss': 0.4656, 'learning_rate': 1.0439844167112744e-08, 'epoch': 1.97} {'loss': 0.5207, 'learning_rate': 1.0424895325660266e-08, 'epoch': 1.97} {'loss': 0.3982, 'learning_rate': 1.0409957188937114e-08, 'epoch': 1.97} {'loss': 0.5678, 'learning_rate': 1.0395029756963271e-08, 'epoch': 1.97} {'loss': 0.618, 'learning_rate': 1.038011302975206e-08, 'epoch': 1.97} {'loss': 0.6133, 'learning_rate': 1.0365207007320133e-08, 'epoch': 1.97} {'loss': 0.5785, 'learning_rate': 1.0350311689683035e-08, 'epoch': 1.97} {'loss': 0.5182, 'learning_rate': 1.0335427076857419e-08, 'epoch': 1.97} {'loss': 0.5659, 'learning_rate': 1.0320553168859937e-08, 'epoch': 1.97} {'loss': 0.3614, 'learning_rate': 1.0305689965703914e-08, 'epoch': 1.97} {'loss': 0.4307, 'learning_rate': 1.029083746740822e-08, 'epoch': 1.97} {'loss': 0.5824, 'learning_rate': 1.0275995673987293e-08, 'epoch': 1.97} {'loss': 0.597, 'learning_rate': 1.0261164585457784e-08, 'epoch': 1.97} {'loss': 0.4377, 'learning_rate': 1.0246344201834124e-08, 'epoch': 1.97} {'loss': 0.4341, 'learning_rate': 1.0231534523132968e-08, 'epoch': 1.97} {'loss': 0.3516, 'learning_rate': 1.0216735549370971e-08, 'epoch': 1.97} {'loss': 0.5266, 'learning_rate': 1.0201947280563673e-08, 'epoch': 1.97} {'loss': 0.5334, 'learning_rate': 1.018716971672662e-08, 'epoch': 1.97} {'loss': 0.5689, 'learning_rate': 1.0172402857875352e-08, 'epoch': 1.97} {'loss': 0.5172, 'learning_rate': 1.0157646704025414e-08, 'epoch': 1.97} {'loss': 0.5837, 'learning_rate': 1.014290125519346e-08, 'epoch': 1.97} {'loss': 0.5107, 'learning_rate': 1.0128166511395032e-08, 'epoch': 1.97} {'loss': 0.5382, 'learning_rate': 1.0113442472646785e-08, 'epoch': 1.97} {'loss': 0.4501, 'learning_rate': 1.0098729138963148e-08, 'epoch': 1.97} {'loss': 0.447, 'learning_rate': 1.0084026510359668e-08, 'epoch': 1.97} {'loss': 0.5091, 'learning_rate': 1.0069334586854106e-08, 'epoch': 1.97} {'loss': 0.4217, 'learning_rate': 1.0054653368459789e-08, 'epoch': 1.97} {'loss': 0.6165, 'learning_rate': 1.0039982855193364e-08, 'epoch': 1.97} {'loss': 0.3799, 'learning_rate': 1.002532304707149e-08, 'epoch': 1.97} {'loss': 0.5091, 'learning_rate': 1.0010673944109705e-08, 'epoch': 1.97} {'loss': 0.3571, 'learning_rate': 9.996035546321337e-09, 'epoch': 1.97} {'loss': 0.4966, 'learning_rate': 9.981407853725256e-09, 'epoch': 1.97} {'loss': 0.5836, 'learning_rate': 9.966790866335895e-09, 'epoch': 1.97} {'loss': 0.4352, 'learning_rate': 9.95218458416769e-09, 'epoch': 1.97} {'loss': 0.4605, 'learning_rate': 9.937589007238402e-09, 'epoch': 1.97} {'loss': 0.4616, 'learning_rate': 9.923004135561353e-09, 'epoch': 1.97} {'loss': 0.4166, 'learning_rate': 9.90842996915542e-09, 'epoch': 1.97} {'loss': 0.528, 'learning_rate': 9.893866508032812e-09, 'epoch': 1.97} {'loss': 0.4141, 'learning_rate': 9.879313752211296e-09, 'epoch': 1.97} {'loss': 0.3182, 'learning_rate': 9.8647717017053e-09, 'epoch': 1.97} {'loss': 0.4941, 'learning_rate': 9.850240356530371e-09, 'epoch': 1.97} {'loss': 0.4743, 'learning_rate': 9.835719716703163e-09, 'epoch': 1.97} {'loss': 0.5097, 'learning_rate': 9.821209782239216e-09, 'epoch': 1.97} {'loss': 0.5014, 'learning_rate': 9.806710553152965e-09, 'epoch': 1.97} {'loss': 0.5164, 'learning_rate': 9.792222029459952e-09, 'epoch': 1.97} {'loss': 0.4238, 'learning_rate': 9.777744211176832e-09, 'epoch': 1.97} {'loss': 0.5348, 'learning_rate': 9.763277098318036e-09, 'epoch': 1.97} {'loss': 0.5538, 'learning_rate': 9.748820690900218e-09, 'epoch': 1.97} {'loss': 0.5639, 'learning_rate': 9.734374988938921e-09, 'epoch': 1.97} {'loss': 0.4439, 'learning_rate': 9.71993999244747e-09, 'epoch': 1.97} {'loss': 0.6509, 'learning_rate': 9.705515701443624e-09, 'epoch': 1.97} {'loss': 0.4719, 'learning_rate': 9.69110211594182e-09, 'epoch': 1.97} {'loss': 0.4821, 'learning_rate': 9.676699235957599e-09, 'epoch': 1.97} {'loss': 0.5392, 'learning_rate': 9.662307061505394e-09, 'epoch': 1.97} {'loss': 0.6156, 'learning_rate': 9.64792559260297e-09, 'epoch': 1.97} {'loss': 0.4216, 'learning_rate': 9.633554829264758e-09, 'epoch': 1.97} {'loss': 0.5013, 'learning_rate': 9.619194771505192e-09, 'epoch': 1.97} {'loss': 0.4681, 'learning_rate': 9.604845419340925e-09, 'epoch': 1.97} {'loss': 0.4887, 'learning_rate': 9.59050677278639e-09, 'epoch': 1.97} {'loss': 0.6022, 'learning_rate': 9.57617883185713e-09, 'epoch': 1.97} {'loss': 0.5015, 'learning_rate': 9.561861596568688e-09, 'epoch': 1.97} {'loss': 0.6153, 'learning_rate': 9.54755506693661e-09, 'epoch': 1.97} {'loss': 0.4249, 'learning_rate': 9.533259242975323e-09, 'epoch': 1.97} {'loss': 0.53, 'learning_rate': 9.518974124701485e-09, 'epoch': 1.97} {'loss': 0.4855, 'learning_rate': 9.504699712130638e-09, 'epoch': 1.97} {'loss': 0.6214, 'learning_rate': 9.490436005276105e-09, 'epoch': 1.97} {'loss': 0.5653, 'learning_rate': 9.476183004154538e-09, 'epoch': 1.97} {'loss': 0.5956, 'learning_rate': 9.46194070878037e-09, 'epoch': 1.97} {'loss': 0.5282, 'learning_rate': 9.447709119170256e-09, 'epoch': 1.97} {'loss': 0.4204, 'learning_rate': 9.433488235338627e-09, 'epoch': 1.97} {'loss': 0.6489, 'learning_rate': 9.419278057299919e-09, 'epoch': 1.97} {'loss': 0.5434, 'learning_rate': 9.405078585070782e-09, 'epoch': 1.97} {'loss': 0.487, 'learning_rate': 9.390889818665649e-09, 'epoch': 1.97} {'loss': 0.7181, 'learning_rate': 9.376711758100065e-09, 'epoch': 1.97} {'loss': 0.4631, 'learning_rate': 9.362544403389572e-09, 'epoch': 1.97} {'loss': 0.5335, 'learning_rate': 9.348387754547494e-09, 'epoch': 1.97} {'loss': 0.4929, 'learning_rate': 9.334241811591593e-09, 'epoch': 1.97} {'loss': 0.6577, 'learning_rate': 9.320106574535193e-09, 'epoch': 1.97} {'loss': 0.4164, 'learning_rate': 9.305982043393835e-09, 'epoch': 1.97} {'loss': 0.571, 'learning_rate': 9.291868218183065e-09, 'epoch': 1.97} {'loss': 0.4272, 'learning_rate': 9.277765098917313e-09, 'epoch': 1.97} {'loss': 0.5077, 'learning_rate': 9.263672685612124e-09, 'epoch': 1.97} {'loss': 0.5559, 'learning_rate': 9.24959097828304e-09, 'epoch': 1.97} {'loss': 0.5533, 'learning_rate': 9.235519976945606e-09, 'epoch': 1.97} {'loss': 0.5898, 'learning_rate': 9.221459681613143e-09, 'epoch': 1.97} {'loss': 0.4216, 'learning_rate': 9.207410092301194e-09, 'epoch': 1.97} {'loss': 0.5353, 'learning_rate': 9.193371209025304e-09, 'epoch': 1.97} {'loss': 0.4425, 'learning_rate': 9.179343031801014e-09, 'epoch': 1.97} {'loss': 0.4925, 'learning_rate': 9.165325560642757e-09, 'epoch': 1.97} {'loss': 0.6346, 'learning_rate': 9.151318795566078e-09, 'epoch': 1.97} {'loss': 0.49, 'learning_rate': 9.137322736584297e-09, 'epoch': 1.97} {'loss': 0.5488, 'learning_rate': 9.123337383714071e-09, 'epoch': 1.97} {'loss': 0.7375, 'learning_rate': 9.109362736969829e-09, 'epoch': 1.97} {'loss': 0.4326, 'learning_rate': 9.095398796367117e-09, 'epoch': 1.97} {'loss': 0.471, 'learning_rate': 9.081445561920365e-09, 'epoch': 1.97} {'loss': 0.4058, 'learning_rate': 9.067503033644009e-09, 'epoch': 1.97} {'loss': 0.6124, 'learning_rate': 9.05357121155359e-09, 'epoch': 1.97} {'loss': 0.6101, 'learning_rate': 9.039650095664653e-09, 'epoch': 1.97} {'loss': 0.6316, 'learning_rate': 9.02573968599052e-09, 'epoch': 1.97} {'loss': 0.5061, 'learning_rate': 9.011839982547843e-09, 'epoch': 1.97} {'loss': 0.6249, 'learning_rate': 8.997950985351056e-09, 'epoch': 1.97} {'loss': 0.3804, 'learning_rate': 8.984072694414592e-09, 'epoch': 1.97} {'loss': 0.4449, 'learning_rate': 8.970205109752882e-09, 'epoch': 1.97} {'loss': 0.4478, 'learning_rate': 8.956348231381473e-09, 'epoch': 1.97} {'loss': 0.587, 'learning_rate': 8.942502059314795e-09, 'epoch': 1.97} {'loss': 0.5016, 'learning_rate': 8.928666593568391e-09, 'epoch': 1.97} {'loss': 0.5284, 'learning_rate': 8.914841834156696e-09, 'epoch': 1.97} {'loss': 0.4448, 'learning_rate': 8.90102778109414e-09, 'epoch': 1.97} {'loss': 0.5756, 'learning_rate': 8.887224434396268e-09, 'epoch': 1.97} {'loss': 0.3846, 'learning_rate': 8.873431794077514e-09, 'epoch': 1.97} {'loss': 0.4499, 'learning_rate': 8.859649860152308e-09, 'epoch': 1.97} {'loss': 0.4813, 'learning_rate': 8.845878632635086e-09, 'epoch': 1.97} {'loss': 0.5128, 'learning_rate': 8.832118111542499e-09, 'epoch': 1.97} {'loss': 0.4148, 'learning_rate': 8.818368296887868e-09, 'epoch': 1.97} {'loss': 0.4779, 'learning_rate': 8.804629188685631e-09, 'epoch': 1.97} {'loss': 0.5342, 'learning_rate': 8.790900786951329e-09, 'epoch': 1.97} {'loss': 0.4604, 'learning_rate': 8.777183091699393e-09, 'epoch': 1.97} {'loss': 0.5687, 'learning_rate': 8.763476102944257e-09, 'epoch': 1.97} {'loss': 0.6461, 'learning_rate': 8.749779820700355e-09, 'epoch': 1.97} {'loss': 0.4943, 'learning_rate': 8.736094244983228e-09, 'epoch': 1.97} {'loss': 0.6487, 'learning_rate': 8.722419375807311e-09, 'epoch': 1.97} {'loss': 0.5245, 'learning_rate': 8.708755213187038e-09, 'epoch': 1.97} {'loss': 0.4677, 'learning_rate': 8.695101757137946e-09, 'epoch': 1.97} {'loss': 0.4669, 'learning_rate': 8.681459007672255e-09, 'epoch': 1.97} {'loss': 0.4071, 'learning_rate': 8.667826964806615e-09, 'epoch': 1.97} {'loss': 0.6207, 'learning_rate': 8.654205628555456e-09, 'epoch': 1.97} {'loss': 0.4576, 'learning_rate': 8.640594998933216e-09, 'epoch': 1.97} {'loss': 0.5954, 'learning_rate': 8.626995075954325e-09, 'epoch': 1.97} {'loss': 0.3749, 'learning_rate': 8.613405859633217e-09, 'epoch': 1.97} {'loss': 0.4543, 'learning_rate': 8.599827349985435e-09, 'epoch': 1.97} {'loss': 0.3613, 'learning_rate': 8.58625954702319e-09, 'epoch': 1.97} {'loss': 0.5903, 'learning_rate': 8.572702450763137e-09, 'epoch': 1.97} {'loss': 0.2826, 'learning_rate': 8.559156061219709e-09, 'epoch': 1.97} {'loss': 0.6704, 'learning_rate': 8.545620378406227e-09, 'epoch': 1.97} {'loss': 0.51, 'learning_rate': 8.532095402339347e-09, 'epoch': 1.97} {'loss': 0.5031, 'learning_rate': 8.518581133030168e-09, 'epoch': 1.97} {'loss': 0.4146, 'learning_rate': 8.505077570496457e-09, 'epoch': 1.97} {'loss': 0.359, 'learning_rate': 8.491584714750423e-09, 'epoch': 1.97} {'loss': 0.3022, 'learning_rate': 8.47810256580872e-09, 'epoch': 1.97} {'loss': 0.4634, 'learning_rate': 8.464631123683564e-09, 'epoch': 1.97} {'loss': 0.5541, 'learning_rate': 8.451170388390496e-09, 'epoch': 1.97} {'loss': 0.5065, 'learning_rate': 8.437720359943945e-09, 'epoch': 1.97} {'loss': 0.585, 'learning_rate': 8.42428103835724e-09, 'epoch': 1.97} {'loss': 0.5922, 'learning_rate': 8.410852423647032e-09, 'epoch': 1.97} {'loss': 0.5553, 'learning_rate': 8.39743451582553e-09, 'epoch': 1.97} {'loss': 0.3094, 'learning_rate': 8.384027314908282e-09, 'epoch': 1.97} {'loss': 0.3003, 'learning_rate': 8.37063082090972e-09, 'epoch': 1.97} {'loss': 0.5276, 'learning_rate': 8.357245033843164e-09, 'epoch': 1.97} {'loss': 0.7071, 'learning_rate': 8.34386995372416e-09, 'epoch': 1.97} {'loss': 0.457, 'learning_rate': 8.330505580566028e-09, 'epoch': 1.97} {'loss': 0.6504, 'learning_rate': 8.317151914384313e-09, 'epoch': 1.97} {'loss': 0.6891, 'learning_rate': 8.303808955192339e-09, 'epoch': 1.97} {'loss': 0.3744, 'learning_rate': 8.290476703003425e-09, 'epoch': 1.97} {'loss': 0.3655, 'learning_rate': 8.277155157834227e-09, 'epoch': 1.97} {'loss': 0.5169, 'learning_rate': 8.263844319698066e-09, 'epoch': 1.97} {'loss': 0.5157, 'learning_rate': 8.250544188608266e-09, 'epoch': 1.97} {'loss': 0.5008, 'learning_rate': 8.23725476458037e-09, 'epoch': 1.97} {'loss': 0.5476, 'learning_rate': 8.223976047627702e-09, 'epoch': 1.97} {'loss': 0.5381, 'learning_rate': 8.210708037765802e-09, 'epoch': 1.97} {'loss': 0.5071, 'learning_rate': 8.197450735006884e-09, 'epoch': 1.97} {'loss': 0.4224, 'learning_rate': 8.184204139366491e-09, 'epoch': 1.97} {'loss': 0.3932, 'learning_rate': 8.170968250857947e-09, 'epoch': 1.97} {'loss': 0.5402, 'learning_rate': 8.157743069496794e-09, 'epoch': 1.97} {'loss': 0.504, 'learning_rate': 8.144528595296353e-09, 'epoch': 1.97} {'loss': 0.3856, 'learning_rate': 8.131324828271059e-09, 'epoch': 1.97} {'loss': 0.6264, 'learning_rate': 8.118131768434235e-09, 'epoch': 1.97} {'loss': 0.3691, 'learning_rate': 8.104949415801422e-09, 'epoch': 1.97} {'loss': 0.5858, 'learning_rate': 8.091777770384834e-09, 'epoch': 1.97} {'loss': 0.495, 'learning_rate': 8.078616832201125e-09, 'epoch': 1.97} {'loss': 0.4585, 'learning_rate': 8.065466601262506e-09, 'epoch': 1.97} {'loss': 0.4601, 'learning_rate': 8.05232707758341e-09, 'epoch': 1.97} {'loss': 0.4422, 'learning_rate': 8.039198261177162e-09, 'epoch': 1.97} {'loss': 0.5259, 'learning_rate': 8.026080152060411e-09, 'epoch': 1.97} {'loss': 0.3946, 'learning_rate': 8.012972750244264e-09, 'epoch': 1.97} {'loss': 0.5647, 'learning_rate': 7.99987605574537e-09, 'epoch': 1.97} {'loss': 0.5613, 'learning_rate': 7.986790068574834e-09, 'epoch': 1.97} {'loss': 0.5256, 'learning_rate': 7.973714788749309e-09, 'epoch': 1.97} {'loss': 0.5638, 'learning_rate': 7.960650216282118e-09, 'epoch': 1.97} {'loss': 0.4452, 'learning_rate': 7.947596351185471e-09, 'epoch': 1.97} {'loss': 0.5181, 'learning_rate': 7.934553193476024e-09, 'epoch': 1.97} {'loss': 0.5111, 'learning_rate': 7.92152074316599e-09, 'epoch': 1.97} {'loss': 0.6215, 'learning_rate': 7.908499000270909e-09, 'epoch': 1.97} {'loss': 0.5351, 'learning_rate': 7.895487964802994e-09, 'epoch': 1.97} {'loss': 0.5901, 'learning_rate': 7.88248763677668e-09, 'epoch': 1.97} {'loss': 0.6281, 'learning_rate': 7.869498016206401e-09, 'epoch': 1.97} {'loss': 0.3641, 'learning_rate': 7.856519103105475e-09, 'epoch': 1.97} {'loss': 0.3904, 'learning_rate': 7.843550897488339e-09, 'epoch': 1.97} {'loss': 0.6627, 'learning_rate': 7.830593399368314e-09, 'epoch': 1.97} {'loss': 0.4473, 'learning_rate': 7.817646608760942e-09, 'epoch': 1.97} {'loss': 0.5004, 'learning_rate': 7.804710525677329e-09, 'epoch': 1.97} {'loss': 0.4918, 'learning_rate': 7.791785150133014e-09, 'epoch': 1.97} {'loss': 0.5128, 'learning_rate': 7.778870482142431e-09, 'epoch': 1.97} {'loss': 0.4146, 'learning_rate': 7.765966521718903e-09, 'epoch': 1.97} {'loss': 0.4604, 'learning_rate': 7.753073268874645e-09, 'epoch': 1.98} {'loss': 0.5708, 'learning_rate': 7.740190723625196e-09, 'epoch': 1.98} {'loss': 0.4695, 'learning_rate': 7.72731888598499e-09, 'epoch': 1.98} {'loss': 0.6022, 'learning_rate': 7.714457755966242e-09, 'epoch': 1.98} {'loss': 0.5138, 'learning_rate': 7.701607333583383e-09, 'epoch': 1.98} {'loss': 0.4851, 'learning_rate': 7.688767618849734e-09, 'epoch': 1.98} {'loss': 0.5776, 'learning_rate': 7.675938611779733e-09, 'epoch': 1.98} {'loss': 0.4721, 'learning_rate': 7.663120312386696e-09, 'epoch': 1.98} {'loss': 0.5262, 'learning_rate': 7.65031272068395e-09, 'epoch': 1.98} {'loss': 0.5462, 'learning_rate': 7.637515836687037e-09, 'epoch': 1.98} {'loss': 0.6275, 'learning_rate': 7.62472966040817e-09, 'epoch': 1.98} {'loss': 0.4131, 'learning_rate': 7.611954191860671e-09, 'epoch': 1.98} {'loss': 0.4194, 'learning_rate': 7.599189431058973e-09, 'epoch': 1.98} {'loss': 0.5167, 'learning_rate': 7.586435378016399e-09, 'epoch': 1.98} {'loss': 0.4963, 'learning_rate': 7.573692032747382e-09, 'epoch': 1.98} {'loss': 0.597, 'learning_rate': 7.560959395264134e-09, 'epoch': 1.98} {'loss': 0.4694, 'learning_rate': 7.548237465582198e-09, 'epoch': 1.98} {'loss': 0.545, 'learning_rate': 7.535526243713787e-09, 'epoch': 1.98} {'loss': 0.4687, 'learning_rate': 7.522825729672222e-09, 'epoch': 1.98} {'loss': 0.4456, 'learning_rate': 7.51013592347305e-09, 'epoch': 1.98} {'loss': 0.468, 'learning_rate': 7.497456825127369e-09, 'epoch': 1.98} {'loss': 0.4797, 'learning_rate': 7.484788434651836e-09, 'epoch': 1.98} {'loss': 0.5117, 'learning_rate': 7.472130752056439e-09, 'epoch': 1.98} {'loss': 0.4816, 'learning_rate': 7.459483777357834e-09, 'epoch': 1.98} {'loss': 0.5049, 'learning_rate': 7.446847510567124e-09, 'epoch': 1.98} {'loss': 0.5158, 'learning_rate': 7.434221951699849e-09, 'epoch': 1.98} {'loss': 0.4985, 'learning_rate': 7.421607100768225e-09, 'epoch': 1.98} {'loss': 0.5251, 'learning_rate': 7.409002957786682e-09, 'epoch': 1.98} {'loss': 0.5098, 'learning_rate': 7.396409522768544e-09, 'epoch': 1.98} {'loss': 0.4531, 'learning_rate': 7.3838267957260235e-09, 'epoch': 1.98} {'loss': 0.4419, 'learning_rate': 7.3712547766746636e-09, 'epoch': 1.98} {'loss': 0.4964, 'learning_rate': 7.358693465625566e-09, 'epoch': 1.98} {'loss': 0.4547, 'learning_rate': 7.346142862594274e-09, 'epoch': 1.98} {'loss': 0.374, 'learning_rate': 7.3336029675941115e-09, 'epoch': 1.98} {'loss': 0.5326, 'learning_rate': 7.321073780637289e-09, 'epoch': 1.98} {'loss': 0.4656, 'learning_rate': 7.308555301738241e-09, 'epoch': 1.98} {'loss': 0.5693, 'learning_rate': 7.296047530909178e-09, 'epoch': 1.98} {'loss': 0.6027, 'learning_rate': 7.283550468164535e-09, 'epoch': 1.98} {'loss': 0.5123, 'learning_rate': 7.271064113517634e-09, 'epoch': 1.98} {'loss': 0.4075, 'learning_rate': 7.258588466981797e-09, 'epoch': 1.98} {'loss': 0.5414, 'learning_rate': 7.246123528570348e-09, 'epoch': 1.98} {'loss': 0.4219, 'learning_rate': 7.2336692982966086e-09, 'epoch': 1.98} {'loss': 0.5186, 'learning_rate': 7.221225776173901e-09, 'epoch': 1.98} {'loss': 0.4219, 'learning_rate': 7.208792962214439e-09, 'epoch': 1.98} {'loss': 0.6898, 'learning_rate': 7.196370856433766e-09, 'epoch': 1.98} {'loss': 0.5269, 'learning_rate': 7.183959458844092e-09, 'epoch': 1.98} {'loss': 0.4065, 'learning_rate': 7.171558769458742e-09, 'epoch': 1.98} {'loss': 0.4933, 'learning_rate': 7.159168788291037e-09, 'epoch': 1.98} {'loss': 0.5739, 'learning_rate': 7.146789515353192e-09, 'epoch': 1.98} {'loss': 0.375, 'learning_rate': 7.1344209506607475e-09, 'epoch': 1.98} {'loss': 0.5544, 'learning_rate': 7.122063094224807e-09, 'epoch': 1.98} {'loss': 0.537, 'learning_rate': 7.109715946059803e-09, 'epoch': 1.98} {'loss': 0.4967, 'learning_rate': 7.097379506179058e-09, 'epoch': 1.98} {'loss': 0.5648, 'learning_rate': 7.085053774594785e-09, 'epoch': 1.98} {'loss': 0.4926, 'learning_rate': 7.072738751320307e-09, 'epoch': 1.98} {'loss': 0.4633, 'learning_rate': 7.060434436370056e-09, 'epoch': 1.98} {'loss': 0.4803, 'learning_rate': 7.048140829756245e-09, 'epoch': 1.98} {'loss': 0.3734, 'learning_rate': 7.0358579314933065e-09, 'epoch': 1.98} {'loss': 0.4641, 'learning_rate': 7.023585741592343e-09, 'epoch': 1.98} {'loss': 0.574, 'learning_rate': 7.011324260067786e-09, 'epoch': 1.98} {'loss': 0.6944, 'learning_rate': 6.999073486931851e-09, 'epoch': 1.98} {'loss': 0.5972, 'learning_rate': 6.986833422198969e-09, 'epoch': 1.98} {'loss': 0.5109, 'learning_rate': 6.9746040658813515e-09, 'epoch': 1.98} {'loss': 0.4973, 'learning_rate': 6.962385417993433e-09, 'epoch': 1.98} {'loss': 0.4467, 'learning_rate': 6.950177478546316e-09, 'epoch': 1.98} {'loss': 0.534, 'learning_rate': 6.937980247553322e-09, 'epoch': 1.98} {'loss': 0.3721, 'learning_rate': 6.925793725028885e-09, 'epoch': 1.98} {'loss': 0.5513, 'learning_rate': 6.9136179109863256e-09, 'epoch': 1.98} {'loss': 0.4148, 'learning_rate': 6.901452805436748e-09, 'epoch': 1.98} {'loss': 0.4052, 'learning_rate': 6.889298408394585e-09, 'epoch': 1.98} {'loss': 0.569, 'learning_rate': 6.877154719872048e-09, 'epoch': 1.98} {'loss': 0.5426, 'learning_rate': 6.86502173988246e-09, 'epoch': 1.98} {'loss': 0.248, 'learning_rate': 6.852899468439145e-09, 'epoch': 1.98} {'loss': 0.4183, 'learning_rate': 6.840787905555424e-09, 'epoch': 1.98} {'loss': 0.5898, 'learning_rate': 6.82868705124351e-09, 'epoch': 1.98} {'loss': 0.5519, 'learning_rate': 6.816596905515616e-09, 'epoch': 1.98} {'loss': 0.604, 'learning_rate': 6.804517468386174e-09, 'epoch': 1.98} {'loss': 0.4245, 'learning_rate': 6.792448739868507e-09, 'epoch': 1.98} {'loss': 0.6038, 'learning_rate': 6.7803907199737175e-09, 'epoch': 1.98} {'loss': 0.3635, 'learning_rate': 6.768343408716238e-09, 'epoch': 1.98} {'loss': 0.4082, 'learning_rate': 6.756306806108282e-09, 'epoch': 1.98} {'loss': 0.5054, 'learning_rate': 6.74428091216317e-09, 'epoch': 1.98} {'loss': 0.489, 'learning_rate': 6.732265726893117e-09, 'epoch': 1.98} {'loss': 0.5467, 'learning_rate': 6.720261250311444e-09, 'epoch': 1.98} {'loss': 0.5195, 'learning_rate': 6.708267482430364e-09, 'epoch': 1.98} {'loss': 0.5108, 'learning_rate': 6.69628442326431e-09, 'epoch': 1.98} {'loss': 0.3723, 'learning_rate': 6.684312072824384e-09, 'epoch': 1.98} {'loss': 0.4448, 'learning_rate': 6.672350431125019e-09, 'epoch': 1.98} {'loss': 0.568, 'learning_rate': 6.660399498177317e-09, 'epoch': 1.98} {'loss': 0.4977, 'learning_rate': 6.648459273995711e-09, 'epoch': 1.98} {'loss': 0.4478, 'learning_rate': 6.636529758591304e-09, 'epoch': 1.98} {'loss': 0.5054, 'learning_rate': 6.624610951978527e-09, 'epoch': 1.98} {'loss': 0.5419, 'learning_rate': 6.612702854169595e-09, 'epoch': 1.98} {'loss': 0.3932, 'learning_rate': 6.6008054651767185e-09, 'epoch': 1.98} {'loss': 0.6316, 'learning_rate': 6.588918785013221e-09, 'epoch': 1.98} {'loss': 0.5058, 'learning_rate': 6.577042813691314e-09, 'epoch': 1.98} {'loss': 0.5071, 'learning_rate': 6.565177551224322e-09, 'epoch': 1.98} {'loss': 0.5525, 'learning_rate': 6.553322997624456e-09, 'epoch': 1.98} {'loss': 0.5202, 'learning_rate': 6.5414791529050395e-09, 'epoch': 1.98} {'loss': 0.5086, 'learning_rate': 6.529646017078284e-09, 'epoch': 1.98} {'loss': 0.421, 'learning_rate': 6.517823590157513e-09, 'epoch': 1.98} {'loss': 0.5621, 'learning_rate': 6.5060118721538276e-09, 'epoch': 1.98} {'loss': 0.6278, 'learning_rate': 6.494210863081662e-09, 'epoch': 1.98} {'loss': 0.4854, 'learning_rate': 6.482420562952119e-09, 'epoch': 1.98} {'loss': 0.538, 'learning_rate': 6.470640971779629e-09, 'epoch': 1.98} {'loss': 0.46, 'learning_rate': 6.4588720895752966e-09, 'epoch': 1.98} {'loss': 0.4717, 'learning_rate': 6.447113916352443e-09, 'epoch': 1.98} {'loss': 0.5493, 'learning_rate': 6.435366452123282e-09, 'epoch': 1.98} {'loss': 0.518, 'learning_rate': 6.4236296969011345e-09, 'epoch': 1.98} {'loss': 0.4847, 'learning_rate': 6.4119036506971045e-09, 'epoch': 1.98} {'loss': 0.34, 'learning_rate': 6.400188313525624e-09, 'epoch': 1.98} {'loss': 0.6232, 'learning_rate': 6.388483685397795e-09, 'epoch': 1.98} {'loss': 0.532, 'learning_rate': 6.37678976632694e-09, 'epoch': 1.98} {'loss': 0.4738, 'learning_rate': 6.365106556324163e-09, 'epoch': 1.98} {'loss': 0.5114, 'learning_rate': 6.353434055405006e-09, 'epoch': 1.98} {'loss': 0.5429, 'learning_rate': 6.341772263578349e-09, 'epoch': 1.98} {'loss': 0.4287, 'learning_rate': 6.330121180859739e-09, 'epoch': 1.98} {'loss': 0.3915, 'learning_rate': 6.318480807260274e-09, 'epoch': 1.98} {'loss': 0.3883, 'learning_rate': 6.306851142792169e-09, 'epoch': 1.98} {'loss': 0.5389, 'learning_rate': 6.295232187468747e-09, 'epoch': 1.98} {'loss': 0.4379, 'learning_rate': 6.283623941301109e-09, 'epoch': 1.98} {'loss': 0.4195, 'learning_rate': 6.272026404303688e-09, 'epoch': 1.98} {'loss': 0.5282, 'learning_rate': 6.260439576486477e-09, 'epoch': 1.98} {'loss': 0.5998, 'learning_rate': 6.248863457863907e-09, 'epoch': 1.98} {'loss': 0.5496, 'learning_rate': 6.237298048448192e-09, 'epoch': 1.98} {'loss': 0.3777, 'learning_rate': 6.225743348250435e-09, 'epoch': 1.98} {'loss': 0.6252, 'learning_rate': 6.2141993572839565e-09, 'epoch': 1.98} {'loss': 0.4978, 'learning_rate': 6.20266607556097e-09, 'epoch': 1.98} {'loss': 0.6821, 'learning_rate': 6.191143503093689e-09, 'epoch': 1.98} {'loss': 0.5332, 'learning_rate': 6.1796316398954336e-09, 'epoch': 1.98} {'loss': 0.4817, 'learning_rate': 6.168130485976198e-09, 'epoch': 1.98} {'loss': 0.4422, 'learning_rate': 6.156640041351525e-09, 'epoch': 1.98} {'loss': 0.3237, 'learning_rate': 6.145160306030296e-09, 'epoch': 1.98} {'loss': 0.5581, 'learning_rate': 6.133691280028053e-09, 'epoch': 1.98} {'loss': 0.4558, 'learning_rate': 6.1222329633547904e-09, 'epoch': 1.98} {'loss': 0.568, 'learning_rate': 6.11078535602383e-09, 'epoch': 1.98} {'loss': 0.6417, 'learning_rate': 6.099348458046273e-09, 'epoch': 1.98} {'loss': 0.4562, 'learning_rate': 6.087922269436553e-09, 'epoch': 1.98} {'loss': 0.4754, 'learning_rate': 6.0765067902046616e-09, 'epoch': 1.98} {'loss': 0.5677, 'learning_rate': 6.065102020363922e-09, 'epoch': 1.98} {'loss': 0.4646, 'learning_rate': 6.0537079599276575e-09, 'epoch': 1.98} {'loss': 0.5157, 'learning_rate': 6.042324608905859e-09, 'epoch': 1.98} {'loss': 0.5354, 'learning_rate': 6.030951967311849e-09, 'epoch': 1.98} {'loss': 0.4791, 'learning_rate': 6.019590035156731e-09, 'epoch': 1.98} {'loss': 0.4197, 'learning_rate': 6.008238812454936e-09, 'epoch': 1.98} {'loss': 0.5606, 'learning_rate': 5.996898299216458e-09, 'epoch': 1.98} {'loss': 0.4385, 'learning_rate': 5.985568495454619e-09, 'epoch': 1.98} {'loss': 0.5443, 'learning_rate': 5.974249401181631e-09, 'epoch': 1.98} {'loss': 0.5408, 'learning_rate': 5.962941016409707e-09, 'epoch': 1.98} {'loss': 0.6191, 'learning_rate': 5.951643341149949e-09, 'epoch': 1.98} {'loss': 0.4001, 'learning_rate': 5.9403563754145685e-09, 'epoch': 1.98} {'loss': 0.5711, 'learning_rate': 5.92908011921578e-09, 'epoch': 1.98} {'loss': 0.5375, 'learning_rate': 5.917814572566904e-09, 'epoch': 1.98} {'loss': 0.5877, 'learning_rate': 5.906559735479045e-09, 'epoch': 1.98} {'loss': 0.3662, 'learning_rate': 5.895315607964414e-09, 'epoch': 1.98} {'loss': 0.479, 'learning_rate': 5.884082190035223e-09, 'epoch': 1.98} {'loss': 0.506, 'learning_rate': 5.872859481702575e-09, 'epoch': 1.98} {'loss': 0.4975, 'learning_rate': 5.861647482978683e-09, 'epoch': 1.98} {'loss': 0.5669, 'learning_rate': 5.8504461938768685e-09, 'epoch': 1.98} {'loss': 0.5099, 'learning_rate': 5.8392556144082345e-09, 'epoch': 1.98} {'loss': 0.2988, 'learning_rate': 5.828075744584993e-09, 'epoch': 1.98} {'loss': 0.5737, 'learning_rate': 5.8169065844193576e-09, 'epoch': 1.98} {'loss': 0.4878, 'learning_rate': 5.805748133922429e-09, 'epoch': 1.98} {'loss': 0.3633, 'learning_rate': 5.79460039310642e-09, 'epoch': 1.98} {'loss': 0.286, 'learning_rate': 5.7834633619835434e-09, 'epoch': 1.98} {'loss': 0.581, 'learning_rate': 5.772337040566012e-09, 'epoch': 1.98} {'loss': 0.606, 'learning_rate': 5.761221428866037e-09, 'epoch': 1.98} {'loss': 0.5287, 'learning_rate': 5.750116526893612e-09, 'epoch': 1.98} {'loss': 0.5073, 'learning_rate': 5.739022334663169e-09, 'epoch': 1.98} {'loss': 0.5703, 'learning_rate': 5.7279388521847e-09, 'epoch': 1.98} {'loss': 0.4916, 'learning_rate': 5.716866079470418e-09, 'epoch': 1.98} {'loss': 0.5198, 'learning_rate': 5.705804016533645e-09, 'epoch': 1.98} {'loss': 0.5755, 'learning_rate': 5.694752663384373e-09, 'epoch': 1.98} {'loss': 0.5787, 'learning_rate': 5.683712020035926e-09, 'epoch': 1.98} {'loss': 0.7094, 'learning_rate': 5.672682086499403e-09, 'epoch': 1.98} {'loss': 0.4375, 'learning_rate': 5.661662862785911e-09, 'epoch': 1.98} {'loss': 0.6378, 'learning_rate': 5.650654348907658e-09, 'epoch': 1.98} {'loss': 0.5164, 'learning_rate': 5.6396565448779695e-09, 'epoch': 1.98} {'loss': 0.4964, 'learning_rate': 5.6286694507068366e-09, 'epoch': 1.98} {'loss': 0.4834, 'learning_rate': 5.617693066406471e-09, 'epoch': 1.98} {'loss': 0.513, 'learning_rate': 5.606727391989086e-09, 'epoch': 1.98} {'loss': 0.621, 'learning_rate': 5.595772427465784e-09, 'epoch': 1.98} {'loss': 0.5268, 'learning_rate': 5.584828172848777e-09, 'epoch': 1.98} {'loss': 0.5927, 'learning_rate': 5.573894628150278e-09, 'epoch': 1.98} {'loss': 0.6218, 'learning_rate': 5.562971793381389e-09, 'epoch': 1.98} {'loss': 0.4267, 'learning_rate': 5.552059668553211e-09, 'epoch': 1.98} {'loss': 0.5444, 'learning_rate': 5.541158253677958e-09, 'epoch': 1.98} {'loss': 0.3981, 'learning_rate': 5.530267548767842e-09, 'epoch': 1.98} {'loss': 0.3683, 'learning_rate': 5.5193875538339655e-09, 'epoch': 1.98} {'loss': 0.5045, 'learning_rate': 5.5085182688885404e-09, 'epoch': 1.98} {'loss': 0.4297, 'learning_rate': 5.497659693941559e-09, 'epoch': 1.98} {'loss': 0.4943, 'learning_rate': 5.486811829007455e-09, 'epoch': 1.98} {'loss': 0.4958, 'learning_rate': 5.475974674095108e-09, 'epoch': 1.98} {'loss': 0.5003, 'learning_rate': 5.465148229217843e-09, 'epoch': 1.98} {'loss': 0.6189, 'learning_rate': 5.45433249438676e-09, 'epoch': 1.98} {'loss': 0.6259, 'learning_rate': 5.443527469612963e-09, 'epoch': 1.98} {'loss': 0.5523, 'learning_rate': 5.432733154908665e-09, 'epoch': 1.98} {'loss': 0.3147, 'learning_rate': 5.4219495502860764e-09, 'epoch': 1.98} {'loss': 0.6137, 'learning_rate': 5.411176655755191e-09, 'epoch': 1.98} {'loss': 0.3567, 'learning_rate': 5.4004144713282194e-09, 'epoch': 1.98} {'loss': 0.2771, 'learning_rate': 5.389662997017375e-09, 'epoch': 1.98} {'loss': 0.5039, 'learning_rate': 5.37892223283265e-09, 'epoch': 1.98} {'loss': 0.4373, 'learning_rate': 5.368192178787368e-09, 'epoch': 1.98} {'loss': 0.5441, 'learning_rate': 5.3574728348915194e-09, 'epoch': 1.98} {'loss': 0.5572, 'learning_rate': 5.3467642011573174e-09, 'epoch': 1.98} {'loss': 0.5218, 'learning_rate': 5.336066277596974e-09, 'epoch': 1.98} {'loss': 0.4853, 'learning_rate': 5.325379064220482e-09, 'epoch': 1.98} {'loss': 0.5724, 'learning_rate': 5.314702561038942e-09, 'epoch': 1.98} {'loss': 0.5002, 'learning_rate': 5.304036768065679e-09, 'epoch': 1.98} {'loss': 0.51, 'learning_rate': 5.2933816853117935e-09, 'epoch': 1.98} {'loss': 0.4371, 'learning_rate': 5.282737312787278e-09, 'epoch': 1.98} {'loss': 0.4995, 'learning_rate': 5.272103650504345e-09, 'epoch': 1.98} {'loss': 0.4677, 'learning_rate': 5.261480698475208e-09, 'epoch': 1.98} {'loss': 0.5628, 'learning_rate': 5.250868456709856e-09, 'epoch': 1.98} {'loss': 0.4374, 'learning_rate': 5.240266925220505e-09, 'epoch': 1.98} {'loss': 0.4439, 'learning_rate': 5.229676104018255e-09, 'epoch': 1.98} {'loss': 0.3949, 'learning_rate': 5.21909599311421e-09, 'epoch': 1.98} {'loss': 0.5692, 'learning_rate': 5.208526592520579e-09, 'epoch': 1.98} {'loss': 0.5859, 'learning_rate': 5.197967902247358e-09, 'epoch': 1.98} {'loss': 0.5052, 'learning_rate': 5.187419922307868e-09, 'epoch': 1.98} {'loss': 0.5826, 'learning_rate': 5.176882652710991e-09, 'epoch': 1.98} {'loss': 0.4581, 'learning_rate': 5.166356093468938e-09, 'epoch': 1.98} {'loss': 0.5039, 'learning_rate': 5.155840244593923e-09, 'epoch': 1.98} {'loss': 0.6515, 'learning_rate': 5.145335106095939e-09, 'epoch': 1.98} {'loss': 0.4617, 'learning_rate': 5.134840677988307e-09, 'epoch': 1.98} {'loss': 0.5809, 'learning_rate': 5.124356960278798e-09, 'epoch': 1.98} {'loss': 0.4229, 'learning_rate': 5.113883952981846e-09, 'epoch': 1.98} {'loss': 0.6163, 'learning_rate': 5.103421656107443e-09, 'epoch': 1.98} {'loss': 0.5987, 'learning_rate': 5.0929700696666914e-09, 'epoch': 1.98} {'loss': 0.5793, 'learning_rate': 5.082529193670693e-09, 'epoch': 1.98} {'loss': 0.608, 'learning_rate': 5.072099028130551e-09, 'epoch': 1.98} {'loss': 0.5606, 'learning_rate': 5.061679573058476e-09, 'epoch': 1.98} {'loss': 0.3754, 'learning_rate': 5.051270828464461e-09, 'epoch': 1.98} {'loss': 0.4141, 'learning_rate': 5.040872794359608e-09, 'epoch': 1.98} {'loss': 0.4555, 'learning_rate': 5.03048547075613e-09, 'epoch': 1.98} {'loss': 0.5666, 'learning_rate': 5.020108857665129e-09, 'epoch': 1.98} {'loss': 0.5459, 'learning_rate': 5.009742955096597e-09, 'epoch': 1.98} {'loss': 0.4761, 'learning_rate': 4.999387763062746e-09, 'epoch': 1.98} {'loss': 0.2487, 'learning_rate': 4.989043281573569e-09, 'epoch': 1.98} {'loss': 0.4978, 'learning_rate': 4.978709510640168e-09, 'epoch': 1.98} {'loss': 0.413, 'learning_rate': 4.968386450275864e-09, 'epoch': 1.98} {'loss': 0.5647, 'learning_rate': 4.95807410048843e-09, 'epoch': 1.98} {'loss': 0.6036, 'learning_rate': 4.947772461291189e-09, 'epoch': 1.98} {'loss': 0.5364, 'learning_rate': 4.937481532695243e-09, 'epoch': 1.98} {'loss': 0.5684, 'learning_rate': 4.927201314709473e-09, 'epoch': 1.98} {'loss': 0.584, 'learning_rate': 4.916931807347203e-09, 'epoch': 1.98} {'loss': 0.4691, 'learning_rate': 4.906673010618424e-09, 'epoch': 1.98} {'loss': 0.4136, 'learning_rate': 4.896424924534238e-09, 'epoch': 1.98} {'loss': 0.4518, 'learning_rate': 4.8861875491057476e-09, 'epoch': 1.98} {'loss': 0.4522, 'learning_rate': 4.875960884342945e-09, 'epoch': 1.98} {'loss': 0.5539, 'learning_rate': 4.865744930259153e-09, 'epoch': 1.98} {'loss': 0.4902, 'learning_rate': 4.855539686863253e-09, 'epoch': 1.98} {'loss': 0.526, 'learning_rate': 4.845345154166348e-09, 'epoch': 1.98} {'loss': 0.4572, 'learning_rate': 4.835161332179539e-09, 'epoch': 1.98} {'loss': 0.4107, 'learning_rate': 4.824988220915039e-09, 'epoch': 1.98} {'loss': 0.4451, 'learning_rate': 4.81482582038173e-09, 'epoch': 1.98} {'loss': 0.5465, 'learning_rate': 4.804674130591824e-09, 'epoch': 1.98} {'loss': 0.475, 'learning_rate': 4.794533151556424e-09, 'epoch': 1.98} {'loss': 0.6037, 'learning_rate': 4.784402883284411e-09, 'epoch': 1.98} {'loss': 0.4733, 'learning_rate': 4.774283325789109e-09, 'epoch': 1.98} {'loss': 0.368, 'learning_rate': 4.764174479080508e-09, 'epoch': 1.98} {'loss': 0.5902, 'learning_rate': 4.754076343168601e-09, 'epoch': 1.98} {'loss': 0.4475, 'learning_rate': 4.7439889180644904e-09, 'epoch': 1.98} {'loss': 0.5998, 'learning_rate': 4.733912203779279e-09, 'epoch': 1.98} {'loss': 0.4345, 'learning_rate': 4.7238462003251775e-09, 'epoch': 1.98} {'loss': 0.6566, 'learning_rate': 4.713790907709959e-09, 'epoch': 1.98} {'loss': 0.4022, 'learning_rate': 4.703746325946945e-09, 'epoch': 1.98} {'loss': 0.5494, 'learning_rate': 4.693712455046129e-09, 'epoch': 1.98} {'loss': 0.499, 'learning_rate': 4.683689295017502e-09, 'epoch': 1.98} {'loss': 0.4842, 'learning_rate': 4.673676845873276e-09, 'epoch': 1.98} {'loss': 0.3593, 'learning_rate': 4.663675107622334e-09, 'epoch': 1.98} {'loss': 0.3577, 'learning_rate': 4.6536840802779984e-09, 'epoch': 1.98} {'loss': 0.5166, 'learning_rate': 4.64370376384804e-09, 'epoch': 1.98} {'loss': 0.5425, 'learning_rate': 4.633734158344672e-09, 'epoch': 1.98} {'loss': 0.5702, 'learning_rate': 4.623775263778996e-09, 'epoch': 1.98} {'loss': 0.4175, 'learning_rate': 4.613827080159894e-09, 'epoch': 1.98} {'loss': 0.584, 'learning_rate': 4.603889607500689e-09, 'epoch': 1.98} {'loss': 0.5487, 'learning_rate': 4.5939628458091525e-09, 'epoch': 1.98} {'loss': 0.4758, 'learning_rate': 4.5840467950974965e-09, 'epoch': 1.98} {'loss': 0.4019, 'learning_rate': 4.5741414553768234e-09, 'epoch': 1.98} {'loss': 0.5662, 'learning_rate': 4.564246826657126e-09, 'epoch': 1.98} {'loss': 0.5052, 'learning_rate': 4.554362908948396e-09, 'epoch': 1.98} {'loss': 0.4639, 'learning_rate': 4.544489702262844e-09, 'epoch': 1.98} {'loss': 0.2742, 'learning_rate': 4.534627206609354e-09, 'epoch': 1.98} {'loss': 0.4495, 'learning_rate': 4.524775421999028e-09, 'epoch': 1.98} {'loss': 0.615, 'learning_rate': 4.514934348442967e-09, 'epoch': 1.98} {'loss': 0.5906, 'learning_rate': 4.505103985951165e-09, 'epoch': 1.98} {'loss': 0.5532, 'learning_rate': 4.495284334533611e-09, 'epoch': 1.98} {'loss': 0.572, 'learning_rate': 4.4854753942025205e-09, 'epoch': 1.98} {'loss': 0.5917, 'learning_rate': 4.475677164966774e-09, 'epoch': 1.98} {'loss': 0.6206, 'learning_rate': 4.465889646837473e-09, 'epoch': 1.98} {'loss': 0.5891, 'learning_rate': 4.456112839824611e-09, 'epoch': 1.98} {'loss': 0.3752, 'learning_rate': 4.446346743940399e-09, 'epoch': 1.98} {'loss': 0.4007, 'learning_rate': 4.43659135919372e-09, 'epoch': 1.98} {'loss': 0.607, 'learning_rate': 4.426846685594566e-09, 'epoch': 1.98} {'loss': 0.6718, 'learning_rate': 4.417112723155148e-09, 'epoch': 1.98} {'loss': 0.3817, 'learning_rate': 4.407389471884349e-09, 'epoch': 1.98} {'loss': 0.5809, 'learning_rate': 4.397676931794381e-09, 'epoch': 1.98} {'loss': 0.6743, 'learning_rate': 4.387975102893016e-09, 'epoch': 1.98} {'loss': 0.5248, 'learning_rate': 4.378283985192466e-09, 'epoch': 1.98} {'loss': 0.4057, 'learning_rate': 4.368603578702723e-09, 'epoch': 1.98} {'loss': 0.4684, 'learning_rate': 4.35893388343489e-09, 'epoch': 1.98} {'loss': 0.3755, 'learning_rate': 4.349274899397849e-09, 'epoch': 1.98} {'loss': 0.5495, 'learning_rate': 4.3396266266027e-09, 'epoch': 1.98} {'loss': 0.4506, 'learning_rate': 4.329989065060547e-09, 'epoch': 1.98} {'loss': 0.5, 'learning_rate': 4.320362214780271e-09, 'epoch': 1.98} {'loss': 0.4454, 'learning_rate': 4.310746075772976e-09, 'epoch': 1.98} {'loss': 0.5557, 'learning_rate': 4.301140648049762e-09, 'epoch': 1.98} {'loss': 0.5448, 'learning_rate': 4.291545931619512e-09, 'epoch': 1.98} {'loss': 0.471, 'learning_rate': 4.281961926492217e-09, 'epoch': 1.98} {'loss': 0.4218, 'learning_rate': 4.272388632680091e-09, 'epoch': 1.98} {'loss': 0.4339, 'learning_rate': 4.262826050192015e-09, 'epoch': 1.98} {'loss': 0.4914, 'learning_rate': 4.253274179037981e-09, 'epoch': 1.98} {'loss': 0.5592, 'learning_rate': 4.24373301922909e-09, 'epoch': 1.98} {'loss': 0.4212, 'learning_rate': 4.234202570775337e-09, 'epoch': 1.98} {'loss': 0.5794, 'learning_rate': 4.224682833685601e-09, 'epoch': 1.98} {'loss': 0.4706, 'learning_rate': 4.2151738079732055e-09, 'epoch': 1.98} {'loss': 0.4435, 'learning_rate': 4.205675493644812e-09, 'epoch': 1.98} {'loss': 0.4732, 'learning_rate': 4.196187890713743e-09, 'epoch': 1.98} {'loss': 0.3766, 'learning_rate': 4.186710999187771e-09, 'epoch': 1.98} {'loss': 0.5484, 'learning_rate': 4.177244819077997e-09, 'epoch': 1.98} {'loss': 0.5256, 'learning_rate': 4.167789350394413e-09, 'epoch': 1.98} {'loss': 0.5095, 'learning_rate': 4.158344593147013e-09, 'epoch': 1.98} {'loss': 0.4415, 'learning_rate': 4.148910547345786e-09, 'epoch': 1.98} {'loss': 0.3926, 'learning_rate': 4.139487213001836e-09, 'epoch': 1.98} {'loss': 0.5707, 'learning_rate': 4.130074590125155e-09, 'epoch': 1.98} {'loss': 0.427, 'learning_rate': 4.120672678724624e-09, 'epoch': 1.98} {'loss': 0.507, 'learning_rate': 4.111281478811347e-09, 'epoch': 1.98} {'loss': 0.5088, 'learning_rate': 4.101900990394203e-09, 'epoch': 1.98} {'loss': 0.4563, 'learning_rate': 4.0925312134842964e-09, 'epoch': 1.98} {'loss': 0.5363, 'learning_rate': 4.0831721480916186e-09, 'epoch': 1.98} {'loss': 0.4617, 'learning_rate': 4.073823794226162e-09, 'epoch': 1.98} {'loss': 0.4267, 'learning_rate': 4.0644861518979174e-09, 'epoch': 1.98} {'loss': 0.6094, 'learning_rate': 4.055159221116878e-09, 'epoch': 1.98} {'loss': 0.5008, 'learning_rate': 4.045843001893035e-09, 'epoch': 1.98} {'loss': 0.6974, 'learning_rate': 4.036537494235271e-09, 'epoch': 1.98} {'loss': 0.5318, 'learning_rate': 4.027242698154687e-09, 'epoch': 1.98} {'loss': 0.6131, 'learning_rate': 4.0179586136623875e-09, 'epoch': 1.98} {'loss': 0.3049, 'learning_rate': 4.008685240766142e-09, 'epoch': 1.98} {'loss': 0.5422, 'learning_rate': 3.999422579475942e-09, 'epoch': 1.98} {'loss': 0.5392, 'learning_rate': 3.990170629804002e-09, 'epoch': 1.98} {'loss': 0.322, 'learning_rate': 3.980929391758092e-09, 'epoch': 1.98} {'loss': 0.4679, 'learning_rate': 3.971698865349316e-09, 'epoch': 1.98} {'loss': 0.4738, 'learning_rate': 3.962479050586554e-09, 'epoch': 1.98} {'loss': 0.4556, 'learning_rate': 3.953269947479799e-09, 'epoch': 1.98} {'loss': 0.5038, 'learning_rate': 3.944071556040152e-09, 'epoch': 1.98} {'loss': 0.4356, 'learning_rate': 3.934883876276496e-09, 'epoch': 1.98} {'loss': 0.6217, 'learning_rate': 3.925706908198823e-09, 'epoch': 1.98} {'loss': 0.676, 'learning_rate': 3.916540651816014e-09, 'epoch': 1.98} {'loss': 0.4143, 'learning_rate': 3.907385107140283e-09, 'epoch': 1.98} {'loss': 0.6399, 'learning_rate': 3.898240274179399e-09, 'epoch': 1.98} {'loss': 0.5016, 'learning_rate': 3.889106152943356e-09, 'epoch': 1.98} {'loss': 0.5113, 'learning_rate': 3.879982743443255e-09, 'epoch': 1.98} {'loss': 0.5667, 'learning_rate': 3.87087004568687e-09, 'epoch': 1.98} {'loss': 0.6391, 'learning_rate': 3.8617680596853e-09, 'epoch': 1.98} {'loss': 0.5369, 'learning_rate': 3.852676785448539e-09, 'epoch': 1.98} {'loss': 0.5564, 'learning_rate': 3.843596222985468e-09, 'epoch': 1.98} {'loss': 0.4897, 'learning_rate': 3.83452637230608e-09, 'epoch': 1.98} {'loss': 0.3584, 'learning_rate': 3.825467233420366e-09, 'epoch': 1.98} {'loss': 0.4059, 'learning_rate': 3.816418806338318e-09, 'epoch': 1.98} {'loss': 0.4941, 'learning_rate': 3.807381091068818e-09, 'epoch': 1.98} {'loss': 0.5678, 'learning_rate': 3.798354087621858e-09, 'epoch': 1.98} {'loss': 0.4194, 'learning_rate': 3.789337796007431e-09, 'epoch': 1.98} {'loss': 0.7199, 'learning_rate': 3.780332216234417e-09, 'epoch': 1.98} {'loss': 0.5343, 'learning_rate': 3.771337348313919e-09, 'epoch': 1.98} {'loss': 0.461, 'learning_rate': 3.762353192253709e-09, 'epoch': 1.98} {'loss': 0.3808, 'learning_rate': 3.7533797480648896e-09, 'epoch': 1.98} {'loss': 0.5448, 'learning_rate': 3.744417015756341e-09, 'epoch': 1.98} {'loss': 0.4072, 'learning_rate': 3.7354649953380566e-09, 'epoch': 1.98} {'loss': 0.5469, 'learning_rate': 3.726523686818917e-09, 'epoch': 1.98} {'loss': 0.5697, 'learning_rate': 3.7175930902089153e-09, 'epoch': 1.98} {'loss': 0.4474, 'learning_rate': 3.7086732055191533e-09, 'epoch': 1.98} {'loss': 0.5264, 'learning_rate': 3.6997640327562924e-09, 'epoch': 1.98} {'loss': 0.5129, 'learning_rate': 3.6908655719314345e-09, 'epoch': 1.98} {'loss': 0.4725, 'learning_rate': 3.6819778230545724e-09, 'epoch': 1.98} {'loss': 0.5105, 'learning_rate': 3.6731007861345867e-09, 'epoch': 1.98} {'loss': 0.4647, 'learning_rate': 3.6642344611814706e-09, 'epoch': 1.98} {'loss': 0.6988, 'learning_rate': 3.655378848204105e-09, 'epoch': 1.98} {'loss': 0.5939, 'learning_rate': 3.6465339472124826e-09, 'epoch': 1.98} {'loss': 0.4456, 'learning_rate': 3.637699758215485e-09, 'epoch': 1.98} {'loss': 0.5195, 'learning_rate': 3.6288762812219935e-09, 'epoch': 1.98} {'loss': 0.5994, 'learning_rate': 3.620063516244221e-09, 'epoch': 1.98} {'loss': 0.4892, 'learning_rate': 3.611261463288829e-09, 'epoch': 1.98} {'loss': 0.5336, 'learning_rate': 3.602470122365809e-09, 'epoch': 1.98} {'loss': 0.494, 'learning_rate': 3.593689493485153e-09, 'epoch': 1.98} {'loss': 0.4675, 'learning_rate': 3.5849195766568535e-09, 'epoch': 1.98} {'loss': 0.4541, 'learning_rate': 3.5761603718886816e-09, 'epoch': 1.98} {'loss': 0.513, 'learning_rate': 3.56741187919174e-09, 'epoch': 1.98} {'loss': 0.482, 'learning_rate': 3.5586740985738e-09, 'epoch': 1.98} {'loss': 0.3758, 'learning_rate': 3.5499470300448534e-09, 'epoch': 1.98} {'loss': 0.4527, 'learning_rate': 3.5412306736148927e-09, 'epoch': 1.98} {'loss': 0.5006, 'learning_rate': 3.5325250292927994e-09, 'epoch': 1.98} {'loss': 0.5595, 'learning_rate': 3.523830097087455e-09, 'epoch': 1.98} {'loss': 0.4688, 'learning_rate': 3.515145877008852e-09, 'epoch': 1.98} {'loss': 0.5769, 'learning_rate': 3.5064723690658718e-09, 'epoch': 1.98} {'loss': 0.5367, 'learning_rate': 3.497809573267397e-09, 'epoch': 1.98} {'loss': 0.3982, 'learning_rate': 3.4891574896245284e-09, 'epoch': 1.98} {'loss': 0.502, 'learning_rate': 3.4805161181439283e-09, 'epoch': 1.98} {'loss': 0.5234, 'learning_rate': 3.4718854588366992e-09, 'epoch': 1.98} {'loss': 0.6608, 'learning_rate': 3.463265511711722e-09, 'epoch': 1.98} {'loss': 0.3633, 'learning_rate': 3.4546562767789894e-09, 'epoch': 1.98} {'loss': 0.5223, 'learning_rate': 3.4460577540451623e-09, 'epoch': 1.98} {'loss': 0.4271, 'learning_rate': 3.4374699435224534e-09, 'epoch': 1.98} {'loss': 0.5443, 'learning_rate': 3.428892845217524e-09, 'epoch': 1.98} {'loss': 0.5741, 'learning_rate': 3.4203264591414765e-09, 'epoch': 1.98} {'loss': 0.6487, 'learning_rate': 3.4117707853031925e-09, 'epoch': 1.98} {'loss': 0.3931, 'learning_rate': 3.4032258237115532e-09, 'epoch': 1.98} {'loss': 0.6038, 'learning_rate': 3.3946915743743314e-09, 'epoch': 1.98} {'loss': 0.4735, 'learning_rate': 3.3861680373026286e-09, 'epoch': 1.98} {'loss': 0.5206, 'learning_rate': 3.3776552125053262e-09, 'epoch': 1.98} {'loss': 0.475, 'learning_rate': 3.3691530999901965e-09, 'epoch': 1.98} {'loss': 0.5386, 'learning_rate': 3.360661699768342e-09, 'epoch': 1.98} {'loss': 0.5241, 'learning_rate': 3.3521810118475328e-09, 'epoch': 1.98} {'loss': 0.4623, 'learning_rate': 3.343711036236652e-09, 'epoch': 1.98} {'loss': 0.536, 'learning_rate': 3.3352517729456913e-09, 'epoch': 1.98} {'loss': 0.6163, 'learning_rate': 3.326803221982422e-09, 'epoch': 1.98} {'loss': 0.5748, 'learning_rate': 3.3183653833579464e-09, 'epoch': 1.98} {'loss': 0.4863, 'learning_rate': 3.309938257078926e-09, 'epoch': 1.98} {'loss': 0.3892, 'learning_rate': 3.3015218431564632e-09, 'epoch': 1.98} {'loss': 0.5458, 'learning_rate': 3.2931161415983293e-09, 'epoch': 1.98} {'loss': 0.4003, 'learning_rate': 3.284721152413406e-09, 'epoch': 1.98} {'loss': 0.4962, 'learning_rate': 3.2763368756116853e-09, 'epoch': 1.98} {'loss': 0.5442, 'learning_rate': 3.2679633112020494e-09, 'epoch': 1.98} {'loss': 0.5799, 'learning_rate': 3.259600459192269e-09, 'epoch': 1.98} {'loss': 0.416, 'learning_rate': 3.251248319592337e-09, 'epoch': 1.98} {'loss': 0.5177, 'learning_rate': 3.242906892411135e-09, 'epoch': 1.98} {'loss': 0.4352, 'learning_rate': 3.2345761776575446e-09, 'epoch': 1.98} {'loss': 0.4265, 'learning_rate': 3.2262561753404477e-09, 'epoch': 1.98} {'loss': 0.6561, 'learning_rate': 3.2179468854687257e-09, 'epoch': 1.98} {'loss': 0.488, 'learning_rate': 3.2096483080501505e-09, 'epoch': 1.98} {'loss': 0.4358, 'learning_rate': 3.2013604430958245e-09, 'epoch': 1.98} {'loss': 0.6124, 'learning_rate': 3.193083290613519e-09, 'epoch': 1.98} {'loss': 0.423, 'learning_rate': 3.1848168506110056e-09, 'epoch': 1.98} {'loss': 0.5952, 'learning_rate': 3.1765611230993863e-09, 'epoch': 1.98} {'loss': 0.4916, 'learning_rate': 3.168316108085323e-09, 'epoch': 1.98} {'loss': 0.4942, 'learning_rate': 3.1600818055799175e-09, 'epoch': 1.98} {'loss': 0.3719, 'learning_rate': 3.1518582155898314e-09, 'epoch': 1.98} {'loss': 0.6647, 'learning_rate': 3.1436453381250565e-09, 'epoch': 1.98} {'loss': 0.7018, 'learning_rate': 3.1354431731944747e-09, 'epoch': 1.98} {'loss': 0.391, 'learning_rate': 3.1272517208058573e-09, 'epoch': 1.98} {'loss': 0.4657, 'learning_rate': 3.1190709809691967e-09, 'epoch': 1.98} {'loss': 0.5135, 'learning_rate': 3.110900953692264e-09, 'epoch': 1.98} {'loss': 0.5187, 'learning_rate': 3.1027416389850517e-09, 'epoch': 1.98} {'loss': 0.5353, 'learning_rate': 3.094593036854221e-09, 'epoch': 1.98} {'loss': 0.5399, 'learning_rate': 3.086455147310874e-09, 'epoch': 1.98} {'loss': 0.4882, 'learning_rate': 3.0783279703627823e-09, 'epoch': 1.98} {'loss': 0.4972, 'learning_rate': 3.0702115060177174e-09, 'epoch': 1.98} {'loss': 0.4693, 'learning_rate': 3.0621057542856713e-09, 'epoch': 1.98} {'loss': 0.5493, 'learning_rate': 3.054010715174416e-09, 'epoch': 1.98} {'loss': 0.5251, 'learning_rate': 3.045926388693943e-09, 'epoch': 1.98} {'loss': 0.4477, 'learning_rate': 3.037852774852024e-09, 'epoch': 1.98} {'loss': 0.6331, 'learning_rate': 3.02978987365643e-09, 'epoch': 1.98} {'loss': 0.4452, 'learning_rate': 3.0217376851171543e-09, 'epoch': 1.98} {'loss': 0.5913, 'learning_rate': 3.0136962092430775e-09, 'epoch': 1.98} {'loss': 0.3639, 'learning_rate': 3.005665446040862e-09, 'epoch': 1.98} {'loss': 0.6292, 'learning_rate': 2.9976453955204986e-09, 'epoch': 1.98} {'loss': 0.4103, 'learning_rate': 2.98963605769087e-09, 'epoch': 1.98} {'loss': 0.5081, 'learning_rate': 2.9816374325608577e-09, 'epoch': 1.98} {'loss': 0.455, 'learning_rate': 2.973649520137123e-09, 'epoch': 1.98} {'loss': 0.5449, 'learning_rate': 2.9656723204296576e-09, 'epoch': 1.98} {'loss': 0.4024, 'learning_rate': 2.9577058334473442e-09, 'epoch': 1.98} {'loss': 0.4523, 'learning_rate': 2.949750059197953e-09, 'epoch': 1.98} {'loss': 0.2701, 'learning_rate': 2.941804997689257e-09, 'epoch': 1.98} {'loss': 0.5223, 'learning_rate': 2.9338706489323577e-09, 'epoch': 1.98} {'loss': 0.5605, 'learning_rate': 2.925947012932806e-09, 'epoch': 1.98} {'loss': 0.5104, 'learning_rate': 2.9180340897005945e-09, 'epoch': 1.98} {'loss': 0.5035, 'learning_rate': 2.9101318792446045e-09, 'epoch': 1.98} {'loss': 0.6067, 'learning_rate': 2.9022403815714973e-09, 'epoch': 1.98} {'loss': 0.4932, 'learning_rate': 2.8943595966923754e-09, 'epoch': 1.98} {'loss': 0.4081, 'learning_rate': 2.8864895246139e-09, 'epoch': 1.98} {'loss': 0.4518, 'learning_rate': 2.878630165343843e-09, 'epoch': 1.98} {'loss': 0.4069, 'learning_rate': 2.8707815188921963e-09, 'epoch': 1.98} {'loss': 0.4419, 'learning_rate': 2.8629435852678413e-09, 'epoch': 1.98} {'loss': 0.4415, 'learning_rate': 2.855116364476329e-09, 'epoch': 1.98} {'loss': 0.5655, 'learning_rate': 2.8472998565287623e-09, 'epoch': 1.98} {'loss': 0.5346, 'learning_rate': 2.8394940614329125e-09, 'epoch': 1.98} {'loss': 0.6002, 'learning_rate': 2.831698979196551e-09, 'epoch': 1.98} {'loss': 0.3956, 'learning_rate': 2.82391460982856e-09, 'epoch': 1.98} {'loss': 0.4199, 'learning_rate': 2.81614095333671e-09, 'epoch': 1.98} {'loss': 0.5963, 'learning_rate': 2.808378009729884e-09, 'epoch': 1.98} {'loss': 0.664, 'learning_rate': 2.800625779015853e-09, 'epoch': 1.98} {'loss': 0.4932, 'learning_rate': 2.792884261203499e-09, 'epoch': 1.99} {'loss': 0.4279, 'learning_rate': 2.7851534563005933e-09, 'epoch': 1.99} {'loss': 0.5343, 'learning_rate': 2.777433364316018e-09, 'epoch': 1.99} {'loss': 0.3505, 'learning_rate': 2.769723985257544e-09, 'epoch': 1.99} {'loss': 0.5322, 'learning_rate': 2.762025319134054e-09, 'epoch': 1.99} {'loss': 0.5333, 'learning_rate': 2.754337365953319e-09, 'epoch': 1.99} {'loss': 0.4711, 'learning_rate': 2.7466601257231107e-09, 'epoch': 1.99} {'loss': 0.575, 'learning_rate': 2.738993598452311e-09, 'epoch': 1.99} {'loss': 0.5127, 'learning_rate': 2.731337784148691e-09, 'epoch': 1.99} {'loss': 0.545, 'learning_rate': 2.723692682821133e-09, 'epoch': 1.99} {'loss': 0.6879, 'learning_rate': 2.716058294477408e-09, 'epoch': 1.99} {'loss': 0.5861, 'learning_rate': 2.7084346191263987e-09, 'epoch': 1.99} {'loss': 0.4452, 'learning_rate': 2.700821656774766e-09, 'epoch': 1.99} {'loss': 0.5663, 'learning_rate': 2.693219407431391e-09, 'epoch': 1.99} {'loss': 0.5785, 'learning_rate': 2.6856278711051565e-09, 'epoch': 1.99} {'loss': 0.5604, 'learning_rate': 2.6780470478038336e-09, 'epoch': 1.99} {'loss': 0.6059, 'learning_rate': 2.6704769375340833e-09, 'epoch': 1.99} {'loss': 0.3301, 'learning_rate': 2.6629175403058984e-09, 'epoch': 1.99} {'loss': 0.5724, 'learning_rate': 2.6553688561270498e-09, 'epoch': 1.99} {'loss': 0.537, 'learning_rate': 2.6478308850053093e-09, 'epoch': 1.99} {'loss': 0.5112, 'learning_rate': 2.6403036269484483e-09, 'epoch': 1.99} {'loss': 0.4431, 'learning_rate': 2.6327870819642386e-09, 'epoch': 1.99} {'loss': 0.5123, 'learning_rate': 2.625281250061562e-09, 'epoch': 1.99} {'loss': 0.5566, 'learning_rate': 2.6177861312493002e-09, 'epoch': 1.99} {'loss': 0.5386, 'learning_rate': 2.6103017255330043e-09, 'epoch': 1.99} {'loss': 0.4327, 'learning_rate': 2.6028280329226664e-09, 'epoch': 1.99} {'loss': 0.3451, 'learning_rate': 2.5953650534260576e-09, 'epoch': 1.99} {'loss': 0.495, 'learning_rate': 2.58791278704984e-09, 'epoch': 1.99} {'loss': 0.4833, 'learning_rate': 2.580471233804005e-09, 'epoch': 1.99} {'loss': 0.3209, 'learning_rate': 2.5730403936952142e-09, 'epoch': 1.99} {'loss': 0.5315, 'learning_rate': 2.5656202667323494e-09, 'epoch': 1.99} {'loss': 0.3625, 'learning_rate': 2.5582108529220716e-09, 'epoch': 1.99} {'loss': 0.4283, 'learning_rate': 2.550812152272153e-09, 'epoch': 1.99} {'loss': 0.4848, 'learning_rate': 2.543424164792585e-09, 'epoch': 1.99} {'loss': 0.6358, 'learning_rate': 2.5360468904900294e-09, 'epoch': 1.99} {'loss': 0.4758, 'learning_rate': 2.528680329372257e-09, 'epoch': 1.99} {'loss': 0.6708, 'learning_rate': 2.5213244814470406e-09, 'epoch': 1.99} {'loss': 0.5411, 'learning_rate': 2.5139793467221507e-09, 'epoch': 1.99} {'loss': 0.6064, 'learning_rate': 2.5066449252075796e-09, 'epoch': 1.99} {'loss': 0.37, 'learning_rate': 2.4993212169077686e-09, 'epoch': 1.99} {'loss': 0.5186, 'learning_rate': 2.492008221832709e-09, 'epoch': 1.99} {'loss': 0.4707, 'learning_rate': 2.484705939990173e-09, 'epoch': 1.99} {'loss': 0.5331, 'learning_rate': 2.4774143713868215e-09, 'epoch': 1.99} {'loss': 0.5185, 'learning_rate': 2.4701335160315365e-09, 'epoch': 1.99} {'loss': 0.6312, 'learning_rate': 2.4628633739320897e-09, 'epoch': 1.99} {'loss': 0.4112, 'learning_rate': 2.455603945096252e-09, 'epoch': 1.99} {'loss': 0.3928, 'learning_rate': 2.448355229531796e-09, 'epoch': 1.99} {'loss': 0.4287, 'learning_rate': 2.441117227245382e-09, 'epoch': 1.99} {'loss': 0.3909, 'learning_rate': 2.4338899382458927e-09, 'epoch': 1.99} {'loss': 0.5272, 'learning_rate': 2.4266733625410988e-09, 'epoch': 1.99} {'loss': 0.4991, 'learning_rate': 2.4194675001387725e-09, 'epoch': 1.99} {'loss': 0.6021, 'learning_rate': 2.412272351045575e-09, 'epoch': 1.99} {'loss': 0.3088, 'learning_rate': 2.4050879152703875e-09, 'epoch': 1.99} {'loss': 0.5944, 'learning_rate': 2.3979141928198722e-09, 'epoch': 1.99} {'loss': 0.5629, 'learning_rate': 2.3907511837029105e-09, 'epoch': 1.99} {'loss': 0.5172, 'learning_rate': 2.383598887927274e-09, 'epoch': 1.99} {'loss': 0.6021, 'learning_rate': 2.3764573054985142e-09, 'epoch': 1.99} {'loss': 0.3789, 'learning_rate': 2.3693264364266223e-09, 'epoch': 1.99} {'loss': 0.5719, 'learning_rate': 2.3622062807182598e-09, 'epoch': 1.99} {'loss': 0.5702, 'learning_rate': 2.355096838381199e-09, 'epoch': 1.99} {'loss': 0.4527, 'learning_rate': 2.3479981094221004e-09, 'epoch': 1.99} {'loss': 0.46, 'learning_rate': 2.3409100938509564e-09, 'epoch': 1.99} {'loss': 0.4762, 'learning_rate': 2.3338327916733184e-09, 'epoch': 1.99} {'loss': 0.4684, 'learning_rate': 2.326766202896957e-09, 'epoch': 1.99} {'loss': 0.2384, 'learning_rate': 2.319710327529645e-09, 'epoch': 1.99} {'loss': 0.4709, 'learning_rate': 2.3126651655791533e-09, 'epoch': 1.99} {'loss': 0.5358, 'learning_rate': 2.3056307170532534e-09, 'epoch': 1.99} {'loss': 0.4478, 'learning_rate': 2.2986069819597166e-09, 'epoch': 1.99} {'loss': 0.4312, 'learning_rate': 2.291593960305205e-09, 'epoch': 1.99} {'loss': 0.605, 'learning_rate': 2.2845916520974897e-09, 'epoch': 1.99} {'loss': 0.5294, 'learning_rate': 2.2776000573432323e-09, 'epoch': 1.99} {'loss': 0.3343, 'learning_rate': 2.2706191760524243e-09, 'epoch': 1.99} {'loss': 0.3928, 'learning_rate': 2.2636490082306173e-09, 'epoch': 1.99} {'loss': 0.5658, 'learning_rate': 2.2566895538844723e-09, 'epoch': 1.99} {'loss': 0.5855, 'learning_rate': 2.249740813023982e-09, 'epoch': 1.99} {'loss': 0.5996, 'learning_rate': 2.242802785654696e-09, 'epoch': 1.99} {'loss': 0.4367, 'learning_rate': 2.2358754717843876e-09, 'epoch': 1.99} {'loss': 0.4615, 'learning_rate': 2.228958871421938e-09, 'epoch': 1.99} {'loss': 0.4191, 'learning_rate': 2.2220529845717874e-09, 'epoch': 1.99} {'loss': 0.6537, 'learning_rate': 2.2151578112439287e-09, 'epoch': 1.99} {'loss': 0.3463, 'learning_rate': 2.2082733514450226e-09, 'epoch': 1.99} {'loss': 0.4893, 'learning_rate': 2.2013996051828413e-09, 'epoch': 1.99} {'loss': 0.5895, 'learning_rate': 2.1945365724629352e-09, 'epoch': 1.99} {'loss': 0.3484, 'learning_rate': 2.187684253295297e-09, 'epoch': 1.99} {'loss': 0.5116, 'learning_rate': 2.180842647684367e-09, 'epoch': 1.99} {'loss': 0.3923, 'learning_rate': 2.1740117556401374e-09, 'epoch': 1.99} {'loss': 0.3858, 'learning_rate': 2.1671915771681594e-09, 'epoch': 1.99} {'loss': 0.5868, 'learning_rate': 2.160382112277315e-09, 'epoch': 1.99} {'loss': 0.6283, 'learning_rate': 2.153583360973155e-09, 'epoch': 1.99} {'loss': 0.492, 'learning_rate': 2.1467953232634508e-09, 'epoch': 1.99} {'loss': 0.4609, 'learning_rate': 2.1400179991570848e-09, 'epoch': 1.99} {'loss': 0.4718, 'learning_rate': 2.1332513886596072e-09, 'epoch': 1.99} {'loss': 0.441, 'learning_rate': 2.1264954917776802e-09, 'epoch': 1.99} {'loss': 0.4444, 'learning_rate': 2.1197503085201852e-09, 'epoch': 1.99} {'loss': 0.4772, 'learning_rate': 2.113015838894894e-09, 'epoch': 1.99} {'loss': 0.5298, 'learning_rate': 2.1062920829062473e-09, 'epoch': 1.99} {'loss': 0.6423, 'learning_rate': 2.099579040564237e-09, 'epoch': 1.99} {'loss': 0.5622, 'learning_rate': 2.0928767118744144e-09, 'epoch': 1.99} {'loss': 0.404, 'learning_rate': 2.0861850968434406e-09, 'epoch': 1.99} {'loss': 0.4471, 'learning_rate': 2.0795041954813077e-09, 'epoch': 1.99} {'loss': 0.5019, 'learning_rate': 2.072834007792457e-09, 'epoch': 1.99} {'loss': 0.584, 'learning_rate': 2.0661745337846597e-09, 'epoch': 1.99} {'loss': 0.4676, 'learning_rate': 2.059525773465687e-09, 'epoch': 1.99} {'loss': 0.6462, 'learning_rate': 2.052887726842201e-09, 'epoch': 1.99} {'loss': 0.4818, 'learning_rate': 2.046260393921973e-09, 'epoch': 1.99} {'loss': 0.5648, 'learning_rate': 2.0396437747105535e-09, 'epoch': 1.99} {'loss': 0.6024, 'learning_rate': 2.033037869216825e-09, 'epoch': 1.99} {'loss': 0.6484, 'learning_rate': 2.0264426774463386e-09, 'epoch': 1.99} {'loss': 0.5581, 'learning_rate': 2.0198581994079756e-09, 'epoch': 1.99} {'loss': 0.4557, 'learning_rate': 2.0132844351061776e-09, 'epoch': 1.99} {'loss': 0.4808, 'learning_rate': 2.0067213845509358e-09, 'epoch': 1.99} {'loss': 0.474, 'learning_rate': 2.0001690477466916e-09, 'epoch': 1.99} {'loss': 0.4337, 'learning_rate': 1.993627424702327e-09, 'epoch': 1.99} {'loss': 0.6673, 'learning_rate': 1.9870965154245027e-09, 'epoch': 1.99} {'loss': 0.5883, 'learning_rate': 1.98057631991988e-09, 'epoch': 1.99} {'loss': 0.4657, 'learning_rate': 1.9740668381951212e-09, 'epoch': 1.99} {'loss': 0.4461, 'learning_rate': 1.9675680702568867e-09, 'epoch': 1.99} {'loss': 0.4984, 'learning_rate': 1.9610800161140586e-09, 'epoch': 1.99} {'loss': 0.4762, 'learning_rate': 1.9546026757710778e-09, 'epoch': 1.99} {'loss': 0.5017, 'learning_rate': 1.948136049236826e-09, 'epoch': 1.99} {'loss': 0.6618, 'learning_rate': 1.9416801365168546e-09, 'epoch': 1.99} {'loss': 0.6855, 'learning_rate': 1.9352349376200453e-09, 'epoch': 1.99} {'loss': 0.4781, 'learning_rate': 1.9288004525508384e-09, 'epoch': 1.99} {'loss': 0.5224, 'learning_rate': 1.9223766813181167e-09, 'epoch': 1.99} {'loss': 0.4084, 'learning_rate': 1.9159636239274305e-09, 'epoch': 1.99} {'loss': 0.457, 'learning_rate': 1.9095612803854414e-09, 'epoch': 1.99} {'loss': 0.5107, 'learning_rate': 1.903169650701031e-09, 'epoch': 1.99} {'loss': 0.5349, 'learning_rate': 1.896788734879751e-09, 'epoch': 1.99} {'loss': 0.535, 'learning_rate': 1.890418532927152e-09, 'epoch': 1.99} {'loss': 0.4568, 'learning_rate': 1.884059044852116e-09, 'epoch': 1.99} {'loss': 0.4651, 'learning_rate': 1.877710270661304e-09, 'epoch': 1.99} {'loss': 0.4946, 'learning_rate': 1.871372210360267e-09, 'epoch': 1.99} {'loss': 0.4284, 'learning_rate': 1.8650448639567777e-09, 'epoch': 1.99} {'loss': 0.5211, 'learning_rate': 1.8587282314574962e-09, 'epoch': 1.99} {'loss': 0.588, 'learning_rate': 1.8524223128679742e-09, 'epoch': 1.99} {'loss': 0.435, 'learning_rate': 1.846127108195983e-09, 'epoch': 1.99} {'loss': 0.4993, 'learning_rate': 1.8398426174492945e-09, 'epoch': 1.99} {'loss': 0.5362, 'learning_rate': 1.8335688406334596e-09, 'epoch': 1.99} {'loss': 0.5903, 'learning_rate': 1.8273057777551395e-09, 'epoch': 1.99} {'loss': 0.4388, 'learning_rate': 1.8210534288209957e-09, 'epoch': 1.99} {'loss': 0.4513, 'learning_rate': 1.8148117938376897e-09, 'epoch': 1.99} {'loss': 0.4411, 'learning_rate': 1.8085808728129928e-09, 'epoch': 1.99} {'loss': 0.6224, 'learning_rate': 1.8023606657524561e-09, 'epoch': 1.99} {'loss': 0.3456, 'learning_rate': 1.7961511726627412e-09, 'epoch': 1.99} {'loss': 0.6202, 'learning_rate': 1.7899523935516194e-09, 'epoch': 1.99} {'loss': 0.5363, 'learning_rate': 1.783764328424642e-09, 'epoch': 1.99} {'loss': 0.4437, 'learning_rate': 1.7775869772884702e-09, 'epoch': 1.99} {'loss': 0.4522, 'learning_rate': 1.7714203401497653e-09, 'epoch': 1.99} {'loss': 0.6167, 'learning_rate': 1.7652644170151889e-09, 'epoch': 1.99} {'loss': 0.468, 'learning_rate': 1.7591192078925124e-09, 'epoch': 1.99} {'loss': 0.4831, 'learning_rate': 1.7529847127872868e-09, 'epoch': 1.99} {'loss': 0.5644, 'learning_rate': 1.7468609317050634e-09, 'epoch': 1.99} {'loss': 0.4084, 'learning_rate': 1.7407478646547238e-09, 'epoch': 1.99} {'loss': 0.4576, 'learning_rate': 1.734645511640709e-09, 'epoch': 1.99} {'loss': 0.4858, 'learning_rate': 1.7285538726707907e-09, 'epoch': 1.99} {'loss': 0.4775, 'learning_rate': 1.7224729477516299e-09, 'epoch': 1.99} {'loss': 0.5622, 'learning_rate': 1.716402736888778e-09, 'epoch': 1.99} {'loss': 0.4938, 'learning_rate': 1.7103432400888963e-09, 'epoch': 1.99} {'loss': 0.4872, 'learning_rate': 1.7042944573586462e-09, 'epoch': 1.99} {'loss': 0.4199, 'learning_rate': 1.6982563887046889e-09, 'epoch': 1.99} {'loss': 0.4887, 'learning_rate': 1.6922290341347958e-09, 'epoch': 1.99} {'loss': 0.4831, 'learning_rate': 1.686212393652298e-09, 'epoch': 1.99} {'loss': 0.6029, 'learning_rate': 1.6802064672660768e-09, 'epoch': 1.99} {'loss': 0.491, 'learning_rate': 1.6742112549827939e-09, 'epoch': 1.99} {'loss': 0.5586, 'learning_rate': 1.6682267568068899e-09, 'epoch': 1.99} {'loss': 0.5595, 'learning_rate': 1.6622529727461368e-09, 'epoch': 1.99} {'loss': 0.6025, 'learning_rate': 1.6562899028071954e-09, 'epoch': 1.99} {'loss': 0.5644, 'learning_rate': 1.6503375469956173e-09, 'epoch': 1.99} {'loss': 0.434, 'learning_rate': 1.6443959053180636e-09, 'epoch': 1.99} {'loss': 0.4778, 'learning_rate': 1.6384649777800855e-09, 'epoch': 1.99} {'loss': 0.4409, 'learning_rate': 1.6325447643894543e-09, 'epoch': 1.99} {'loss': 0.5667, 'learning_rate': 1.6266352651528317e-09, 'epoch': 1.99} {'loss': 0.5812, 'learning_rate': 1.6207364800746584e-09, 'epoch': 1.99} {'loss': 0.3943, 'learning_rate': 1.6148484091627059e-09, 'epoch': 1.99} {'loss': 0.3616, 'learning_rate': 1.6089710524236357e-09, 'epoch': 1.99} {'loss': 0.3586, 'learning_rate': 1.6031044098618887e-09, 'epoch': 1.99} {'loss': 0.5439, 'learning_rate': 1.5972484814852362e-09, 'epoch': 1.99} {'loss': 0.6242, 'learning_rate': 1.5914032672992297e-09, 'epoch': 1.99} {'loss': 0.5895, 'learning_rate': 1.5855687673105302e-09, 'epoch': 1.99} {'loss': 0.4235, 'learning_rate': 1.5797449815257992e-09, 'epoch': 1.99} {'loss': 0.6378, 'learning_rate': 1.5739319099494777e-09, 'epoch': 1.99} {'loss': 0.5483, 'learning_rate': 1.568129552590447e-09, 'epoch': 1.99} {'loss': 0.4328, 'learning_rate': 1.5623379094531488e-09, 'epoch': 1.99} {'loss': 0.4797, 'learning_rate': 1.5565569805442437e-09, 'epoch': 1.99} {'loss': 0.5141, 'learning_rate': 1.5507867658703935e-09, 'epoch': 1.99} {'loss': 0.3549, 'learning_rate': 1.5450272654360389e-09, 'epoch': 1.99} {'loss': 0.523, 'learning_rate': 1.5392784792500614e-09, 'epoch': 1.99} {'loss': 0.446, 'learning_rate': 1.5335404073157923e-09, 'epoch': 1.99} {'loss': 0.5555, 'learning_rate': 1.527813049642113e-09, 'epoch': 1.99} {'loss': 0.4384, 'learning_rate': 1.522096406232354e-09, 'epoch': 1.99} {'loss': 0.5775, 'learning_rate': 1.5163904770953975e-09, 'epoch': 1.99} {'loss': 0.5142, 'learning_rate': 1.5106952622345738e-09, 'epoch': 1.99} {'loss': 0.5467, 'learning_rate': 1.505010761658765e-09, 'epoch': 1.99} {'loss': 0.3601, 'learning_rate': 1.4993369753724118e-09, 'epoch': 1.99} {'loss': 0.4987, 'learning_rate': 1.4936739033821758e-09, 'epoch': 1.99} {'loss': 0.4677, 'learning_rate': 1.4880215456936076e-09, 'epoch': 1.99} {'loss': 0.565, 'learning_rate': 1.482379902313369e-09, 'epoch': 1.99} {'loss': 0.4411, 'learning_rate': 1.4767489732459006e-09, 'epoch': 1.99} {'loss': 0.4562, 'learning_rate': 1.4711287585000845e-09, 'epoch': 1.99} {'loss': 0.4813, 'learning_rate': 1.465519258079251e-09, 'epoch': 1.99} {'loss': 0.4741, 'learning_rate': 1.4599204719911719e-09, 'epoch': 1.99} {'loss': 0.5278, 'learning_rate': 1.4543324002413984e-09, 'epoch': 1.99} {'loss': 0.612, 'learning_rate': 1.4487550428354814e-09, 'epoch': 1.99} {'loss': 0.6153, 'learning_rate': 1.443188399778972e-09, 'epoch': 1.99} {'loss': 0.2946, 'learning_rate': 1.4376324710796419e-09, 'epoch': 1.99} {'loss': 0.4584, 'learning_rate': 1.432087256741932e-09, 'epoch': 1.99} {'loss': 0.4305, 'learning_rate': 1.4265527567713932e-09, 'epoch': 1.99} {'loss': 0.4632, 'learning_rate': 1.4210289711757975e-09, 'epoch': 1.99} {'loss': 0.4223, 'learning_rate': 1.4155158999595852e-09, 'epoch': 1.99} {'loss': 0.4803, 'learning_rate': 1.4100135431294183e-09, 'epoch': 1.99} {'loss': 0.4567, 'learning_rate': 1.4045219006897371e-09, 'epoch': 1.99} {'loss': 0.3767, 'learning_rate': 1.3990409726483134e-09, 'epoch': 1.99} {'loss': 0.6005, 'learning_rate': 1.3935707590106985e-09, 'epoch': 1.99} {'loss': 0.5084, 'learning_rate': 1.3881112597813328e-09, 'epoch': 1.99} {'loss': 0.4717, 'learning_rate': 1.3826624749679883e-09, 'epoch': 1.99} {'loss': 0.4932, 'learning_rate': 1.377224404575106e-09, 'epoch': 1.99} {'loss': 0.5019, 'learning_rate': 1.371797048609347e-09, 'epoch': 1.99} {'loss': 0.4484, 'learning_rate': 1.3663804070751518e-09, 'epoch': 1.99} {'loss': 0.542, 'learning_rate': 1.3609744799802926e-09, 'epoch': 1.99} {'loss': 0.509, 'learning_rate': 1.35557926732921e-09, 'epoch': 1.99} {'loss': 0.5236, 'learning_rate': 1.3501947691274554e-09, 'epoch': 1.99} {'loss': 0.4902, 'learning_rate': 1.3448209853827998e-09, 'epoch': 1.99} {'loss': 0.55, 'learning_rate': 1.3394579160985744e-09, 'epoch': 1.99} {'loss': 0.5004, 'learning_rate': 1.3341055612814402e-09, 'epoch': 1.99} {'loss': 0.5543, 'learning_rate': 1.3287639209380588e-09, 'epoch': 1.99} {'loss': 0.5831, 'learning_rate': 1.3234329950728707e-09, 'epoch': 1.99} {'loss': 0.6176, 'learning_rate': 1.3181127836914276e-09, 'epoch': 1.99} {'loss': 0.508, 'learning_rate': 1.3128032868015006e-09, 'epoch': 1.99} {'loss': 0.3441, 'learning_rate': 1.3075045044064206e-09, 'epoch': 1.99} {'loss': 0.6278, 'learning_rate': 1.3022164365128486e-09, 'epoch': 1.99} {'loss': 0.6075, 'learning_rate': 1.2969390831263363e-09, 'epoch': 1.99} {'loss': 0.3879, 'learning_rate': 1.2916724442524343e-09, 'epoch': 1.99} {'loss': 0.4438, 'learning_rate': 1.2864165198978041e-09, 'epoch': 1.99} {'loss': 0.4118, 'learning_rate': 1.2811713100657762e-09, 'epoch': 1.99} {'loss': 0.4906, 'learning_rate': 1.2759368147641226e-09, 'epoch': 1.99} {'loss': 0.4061, 'learning_rate': 1.2707130339983941e-09, 'epoch': 1.99} {'loss': 0.5028, 'learning_rate': 1.2654999677730318e-09, 'epoch': 1.99} {'loss': 0.521, 'learning_rate': 1.2602976160935864e-09, 'epoch': 1.99} {'loss': 0.5034, 'learning_rate': 1.2551059789667198e-09, 'epoch': 1.99} {'loss': 0.559, 'learning_rate': 1.2499250563979826e-09, 'epoch': 1.99} {'loss': 0.4097, 'learning_rate': 1.2447548483918159e-09, 'epoch': 1.99} {'loss': 0.4021, 'learning_rate': 1.239595354954881e-09, 'epoch': 1.99} {'loss': 0.5244, 'learning_rate': 1.234446576091619e-09, 'epoch': 1.99} {'loss': 0.4272, 'learning_rate': 1.2293085118075809e-09, 'epoch': 1.99} {'loss': 0.6425, 'learning_rate': 1.224181162109428e-09, 'epoch': 1.99} {'loss': 0.5908, 'learning_rate': 1.219064527001601e-09, 'epoch': 1.99} {'loss': 0.4615, 'learning_rate': 1.2139586064907616e-09, 'epoch': 1.99} {'loss': 0.4436, 'learning_rate': 1.2088634005813503e-09, 'epoch': 1.99} {'loss': 0.6508, 'learning_rate': 1.2037789092789188e-09, 'epoch': 1.99} {'loss': 0.6469, 'learning_rate': 1.1987051325890175e-09, 'epoch': 1.99} {'loss': 0.5434, 'learning_rate': 1.1936420705171981e-09, 'epoch': 1.99} {'loss': 0.471, 'learning_rate': 1.1885897230690114e-09, 'epoch': 1.99} {'loss': 0.5668, 'learning_rate': 1.1835480902488983e-09, 'epoch': 1.99} {'loss': 0.4643, 'learning_rate': 1.1785171720635203e-09, 'epoch': 1.99} {'loss': 0.4416, 'learning_rate': 1.1734969685184284e-09, 'epoch': 1.99} {'loss': 0.3845, 'learning_rate': 1.1684874796180633e-09, 'epoch': 1.99} {'loss': 0.4634, 'learning_rate': 1.1634887053679767e-09, 'epoch': 1.99} {'loss': 0.4384, 'learning_rate': 1.158500645773719e-09, 'epoch': 1.99} {'loss': 0.5382, 'learning_rate': 1.1535233008408419e-09, 'epoch': 1.99} {'loss': 0.4386, 'learning_rate': 1.148556670573786e-09, 'epoch': 1.99} {'loss': 0.4519, 'learning_rate': 1.1436007549781025e-09, 'epoch': 1.99} {'loss': 0.5867, 'learning_rate': 1.1386555540604527e-09, 'epoch': 1.99} {'loss': 0.5209, 'learning_rate': 1.1337210678252775e-09, 'epoch': 1.99} {'loss': 0.5156, 'learning_rate': 1.1287972962770177e-09, 'epoch': 1.99} {'loss': 0.4069, 'learning_rate': 1.1238842394223348e-09, 'epoch': 1.99} {'loss': 0.4603, 'learning_rate': 1.1189818972656697e-09, 'epoch': 1.99} {'loss': 0.6663, 'learning_rate': 1.1140902698125733e-09, 'epoch': 1.99} {'loss': 0.5338, 'learning_rate': 1.1092093570685968e-09, 'epoch': 1.99} {'loss': 0.6196, 'learning_rate': 1.1043391590381814e-09, 'epoch': 1.99} {'loss': 0.3713, 'learning_rate': 1.0994796757257676e-09, 'epoch': 1.99} {'loss': 0.4224, 'learning_rate': 1.094630907139127e-09, 'epoch': 1.99} {'loss': 0.3961, 'learning_rate': 1.0897928532815904e-09, 'epoch': 1.99} {'loss': 0.633, 'learning_rate': 1.084965514158709e-09, 'epoch': 1.99} {'loss': 0.5044, 'learning_rate': 1.0801488897760337e-09, 'epoch': 1.99} {'loss': 0.3711, 'learning_rate': 1.0753429801391158e-09, 'epoch': 1.99} {'loss': 0.4781, 'learning_rate': 1.0705477852512858e-09, 'epoch': 1.99} {'loss': 0.5052, 'learning_rate': 1.0657633051192052e-09, 'epoch': 1.99} {'loss': 0.6521, 'learning_rate': 1.0609895397473146e-09, 'epoch': 1.99} {'loss': 0.6908, 'learning_rate': 1.0562264891411655e-09, 'epoch': 1.99} {'loss': 0.44, 'learning_rate': 1.051474153306309e-09, 'epoch': 1.99} {'loss': 0.5602, 'learning_rate': 1.0467325322460752e-09, 'epoch': 1.99} {'loss': 0.4914, 'learning_rate': 1.0420016259682364e-09, 'epoch': 1.99} {'loss': 0.5716, 'learning_rate': 1.0372814344750127e-09, 'epoch': 1.99} {'loss': 0.5082, 'learning_rate': 1.0325719577741756e-09, 'epoch': 1.99} {'loss': 0.43, 'learning_rate': 1.0278731958679455e-09, 'epoch': 1.99} {'loss': 0.526, 'learning_rate': 1.0231851487640943e-09, 'epoch': 1.99} {'loss': 0.5249, 'learning_rate': 1.018507816464842e-09, 'epoch': 1.99} {'loss': 0.6267, 'learning_rate': 1.0138411989779607e-09, 'epoch': 1.99} {'loss': 0.5593, 'learning_rate': 1.0091852963067805e-09, 'epoch': 1.99} {'loss': 0.4996, 'learning_rate': 1.004540108456853e-09, 'epoch': 1.99} {'loss': 0.5169, 'learning_rate': 9.999056354326186e-10, 'epoch': 1.99} {'loss': 0.4616, 'learning_rate': 9.95281877240739e-10, 'epoch': 1.99} {'loss': 0.5446, 'learning_rate': 9.906688338834347e-10, 'epoch': 1.99} {'loss': 0.4163, 'learning_rate': 9.860665053673668e-10, 'epoch': 1.99} {'loss': 0.4394, 'learning_rate': 9.814748916980866e-10, 'epoch': 1.99} {'loss': 0.656, 'learning_rate': 9.768939928789245e-10, 'epoch': 1.99} {'loss': 0.423, 'learning_rate': 9.723238089154318e-10, 'epoch': 1.99} {'loss': 0.407, 'learning_rate': 9.677643398131598e-10, 'epoch': 1.99} {'loss': 0.3802, 'learning_rate': 9.632155855754387e-10, 'epoch': 1.99} {'loss': 0.5999, 'learning_rate': 9.586775462089304e-10, 'epoch': 1.99} {'loss': 0.5327, 'learning_rate': 9.541502217169652e-10, 'epoch': 1.99} {'loss': 0.472, 'learning_rate': 9.496336121050941e-10, 'epoch': 1.99} {'loss': 0.5107, 'learning_rate': 9.451277173788687e-10, 'epoch': 1.99} {'loss': 0.6559, 'learning_rate': 9.406325375416193e-10, 'epoch': 1.99} {'loss': 0.4828, 'learning_rate': 9.361480726000071e-10, 'epoch': 1.99} {'loss': 0.6151, 'learning_rate': 9.316743225573632e-10, 'epoch': 1.99} {'loss': 0.5252, 'learning_rate': 9.272112874181283e-10, 'epoch': 1.99} {'loss': 0.4698, 'learning_rate': 9.227589671889637e-10, 'epoch': 1.99} {'loss': 0.511, 'learning_rate': 9.183173618720898e-10, 'epoch': 1.99} {'loss': 0.5572, 'learning_rate': 9.138864714752782e-10, 'epoch': 1.99} {'loss': 0.4146, 'learning_rate': 9.094662960007495e-10, 'epoch': 1.99} {'loss': 0.4374, 'learning_rate': 9.050568354551648e-10, 'epoch': 1.99} {'loss': 0.5825, 'learning_rate': 9.006580898407446e-10, 'epoch': 1.99} {'loss': 0.5592, 'learning_rate': 8.962700591652606e-10, 'epoch': 1.99} {'loss': 0.3345, 'learning_rate': 8.918927434309332e-10, 'epoch': 1.99} {'loss': 0.4901, 'learning_rate': 8.875261426444237e-10, 'epoch': 1.99} {'loss': 0.4423, 'learning_rate': 8.831702568079525e-10, 'epoch': 1.99} {'loss': 0.4475, 'learning_rate': 8.788250859281811e-10, 'epoch': 1.99} {'loss': 0.4568, 'learning_rate': 8.744906300095502e-10, 'epoch': 1.99} {'loss': 0.4161, 'learning_rate': 8.701668890565007e-10, 'epoch': 1.99} {'loss': 0.4272, 'learning_rate': 8.658538630734736e-10, 'epoch': 1.99} {'loss': 0.5069, 'learning_rate': 8.615515520649098e-10, 'epoch': 1.99} {'loss': 0.5818, 'learning_rate': 8.572599560363603e-10, 'epoch': 1.99} {'loss': 0.4285, 'learning_rate': 8.52979074991156e-10, 'epoch': 1.99} {'loss': 0.6531, 'learning_rate': 8.487089089337375e-10, 'epoch': 1.99} {'loss': 0.6321, 'learning_rate': 8.444494578707663e-10, 'epoch': 1.99} {'loss': 0.6257, 'learning_rate': 8.402007218044628e-10, 'epoch': 1.99} {'loss': 0.6641, 'learning_rate': 8.359627007414883e-10, 'epoch': 1.99} {'loss': 0.4463, 'learning_rate': 8.317353946840634e-10, 'epoch': 1.99} {'loss': 0.5669, 'learning_rate': 8.275188036388493e-10, 'epoch': 1.99} {'loss': 0.572, 'learning_rate': 8.233129276080665e-10, 'epoch': 1.99} {'loss': 0.5935, 'learning_rate': 8.191177665983762e-10, 'epoch': 1.99} {'loss': 0.469, 'learning_rate': 8.149333206142196e-10, 'epoch': 1.99} {'loss': 0.5699, 'learning_rate': 8.107595896589271e-10, 'epoch': 1.99} {'loss': 0.5539, 'learning_rate': 8.065965737369397e-10, 'epoch': 1.99} {'loss': 0.4169, 'learning_rate': 8.024442728526983e-10, 'epoch': 1.99} {'loss': 0.6715, 'learning_rate': 7.983026870117538e-10, 'epoch': 1.99} {'loss': 0.4189, 'learning_rate': 7.941718162185474e-10, 'epoch': 1.99} {'loss': 0.3968, 'learning_rate': 7.900516604764096e-10, 'epoch': 1.99} {'loss': 0.4374, 'learning_rate': 7.859422197897815e-10, 'epoch': 1.99} {'loss': 0.4765, 'learning_rate': 7.818434941642139e-10, 'epoch': 1.99} {'loss': 0.5925, 'learning_rate': 7.777554836030377e-10, 'epoch': 1.99} {'loss': 0.5772, 'learning_rate': 7.736781881106936e-10, 'epoch': 1.99} {'loss': 0.4509, 'learning_rate': 7.696116076916227e-10, 'epoch': 1.99} {'loss': 0.6038, 'learning_rate': 7.65555742351376e-10, 'epoch': 1.99} {'loss': 0.5412, 'learning_rate': 7.615105920921739e-10, 'epoch': 1.99} {'loss': 0.5081, 'learning_rate': 7.574761569206779e-10, 'epoch': 1.99} {'loss': 0.4544, 'learning_rate': 7.534524368391083e-10, 'epoch': 1.99} {'loss': 0.4296, 'learning_rate': 7.494394318530163e-10, 'epoch': 1.99} {'loss': 0.4072, 'learning_rate': 7.454371419668427e-10, 'epoch': 1.99} {'loss': 0.4461, 'learning_rate': 7.414455671839183e-10, 'epoch': 1.99} {'loss': 0.5198, 'learning_rate': 7.374647075086838e-10, 'epoch': 1.99} {'loss': 0.5691, 'learning_rate': 7.334945629466905e-10, 'epoch': 1.99} {'loss': 0.6116, 'learning_rate': 7.295351335012691e-10, 'epoch': 1.99} {'loss': 0.3794, 'learning_rate': 7.2558641917575e-10, 'epoch': 1.99} {'loss': 0.3421, 'learning_rate': 7.216484199756846e-10, 'epoch': 1.99} {'loss': 0.4815, 'learning_rate': 7.177211359044034e-10, 'epoch': 1.99} {'loss': 0.7201, 'learning_rate': 7.138045669674576e-10, 'epoch': 1.99} {'loss': 0.6016, 'learning_rate': 7.098987131670676e-10, 'epoch': 1.99} {'loss': 0.516, 'learning_rate': 7.060035745098948e-10, 'epoch': 1.99} {'loss': 0.5821, 'learning_rate': 7.021191509970493e-10, 'epoch': 1.99} {'loss': 0.4955, 'learning_rate': 6.982454426363028e-10, 'epoch': 1.99} {'loss': 0.5595, 'learning_rate': 6.943824494287654e-10, 'epoch': 1.99} {'loss': 0.4898, 'learning_rate': 6.905301713788782e-10, 'epoch': 1.99} {'loss': 0.4356, 'learning_rate': 6.866886084933022e-10, 'epoch': 1.99} {'loss': 0.5687, 'learning_rate': 6.828577607731479e-10, 'epoch': 1.99} {'loss': 0.4286, 'learning_rate': 6.790376282239664e-10, 'epoch': 1.99} {'loss': 0.3937, 'learning_rate': 6.752282108501984e-10, 'epoch': 1.99} {'loss': 0.4695, 'learning_rate': 6.714295086551747e-10, 'epoch': 1.99} {'loss': 0.4048, 'learning_rate': 6.676415216433363e-10, 'epoch': 1.99} {'loss': 0.4313, 'learning_rate': 6.638642498191239e-10, 'epoch': 1.99} {'loss': 0.465, 'learning_rate': 6.60097693184758e-10, 'epoch': 1.99} {'loss': 0.5323, 'learning_rate': 6.563418517469e-10, 'epoch': 1.99} {'loss': 0.3773, 'learning_rate': 6.525967255077703e-10, 'epoch': 1.99} {'loss': 0.5116, 'learning_rate': 6.488623144718098e-10, 'epoch': 1.99} {'loss': 0.4351, 'learning_rate': 6.451386186434594e-10, 'epoch': 1.99} {'loss': 0.5377, 'learning_rate': 6.414256380249396e-10, 'epoch': 1.99} {'loss': 0.4389, 'learning_rate': 6.377233726229115e-10, 'epoch': 1.99} {'loss': 0.4973, 'learning_rate': 6.340318224395958e-10, 'epoch': 1.99} {'loss': 0.5067, 'learning_rate': 6.303509874805436e-10, 'epoch': 1.99} {'loss': 0.4297, 'learning_rate': 6.26680867746865e-10, 'epoch': 1.99} {'loss': 0.3807, 'learning_rate': 6.230214632452214e-10, 'epoch': 1.99} {'loss': 0.5118, 'learning_rate': 6.193727739789435e-10, 'epoch': 1.99} {'loss': 0.5926, 'learning_rate': 6.157347999502517e-10, 'epoch': 1.99} {'loss': 0.5872, 'learning_rate': 6.121075411646971e-10, 'epoch': 1.99} {'loss': 0.3779, 'learning_rate': 6.084909976267206e-10, 'epoch': 1.99} {'loss': 0.5096, 'learning_rate': 6.048851693385427e-10, 'epoch': 1.99} {'loss': 0.4351, 'learning_rate': 6.012900563046043e-10, 'epoch': 1.99} {'loss': 0.4309, 'learning_rate': 5.977056585282359e-10, 'epoch': 1.99} {'loss': 0.6167, 'learning_rate': 5.941319760149889e-10, 'epoch': 1.99} {'loss': 0.5779, 'learning_rate': 5.905690087670835e-10, 'epoch': 1.99} {'loss': 0.4984, 'learning_rate': 5.870167567889606e-10, 'epoch': 1.99} {'loss': 0.4736, 'learning_rate': 5.834752200850613e-10, 'epoch': 1.99} {'loss': 0.4291, 'learning_rate': 5.799443986576058e-10, 'epoch': 1.99} {'loss': 0.3658, 'learning_rate': 5.764242925121455e-10, 'epoch': 1.99} {'loss': 0.5053, 'learning_rate': 5.729149016509006e-10, 'epoch': 1.99} {'loss': 0.5052, 'learning_rate': 5.69416226078312e-10, 'epoch': 1.99} {'loss': 0.3953, 'learning_rate': 5.659282657977105e-10, 'epoch': 1.99} {'loss': 0.4223, 'learning_rate': 5.624510208135369e-10, 'epoch': 1.99} {'loss': 0.6042, 'learning_rate': 5.58984491129122e-10, 'epoch': 1.99} {'loss': 0.6928, 'learning_rate': 5.555286767489066e-10, 'epoch': 1.99} {'loss': 0.4828, 'learning_rate': 5.52083577675111e-10, 'epoch': 1.99} {'loss': 0.4733, 'learning_rate': 5.486491939121763e-10, 'epoch': 1.99} {'loss': 0.6053, 'learning_rate': 5.452255254645433e-10, 'epoch': 1.99} {'loss': 0.5843, 'learning_rate': 5.418125723355428e-10, 'epoch': 1.99} {'loss': 0.4475, 'learning_rate': 5.38410334527395e-10, 'epoch': 1.99} {'loss': 0.355, 'learning_rate': 5.350188120456512e-10, 'epoch': 1.99} {'loss': 0.5148, 'learning_rate': 5.316380048925318e-10, 'epoch': 1.99} {'loss': 0.5947, 'learning_rate': 5.282679130724777e-10, 'epoch': 1.99} {'loss': 0.6744, 'learning_rate': 5.249085365899298e-10, 'epoch': 1.99} {'loss': 0.5775, 'learning_rate': 5.215598754459983e-10, 'epoch': 1.99} {'loss': 0.604, 'learning_rate': 5.182219296462343e-10, 'epoch': 1.99} {'loss': 0.2628, 'learning_rate': 5.148946991939686e-10, 'epoch': 1.99} {'loss': 0.6172, 'learning_rate': 5.115781840925316e-10, 'epoch': 1.99} {'loss': 0.3314, 'learning_rate': 5.082723843452542e-10, 'epoch': 1.99} {'loss': 0.3483, 'learning_rate': 5.04977299955467e-10, 'epoch': 1.99} {'loss': 0.3475, 'learning_rate': 5.016929309276109e-10, 'epoch': 1.99} {'loss': 0.3686, 'learning_rate': 4.984192772650165e-10, 'epoch': 1.99} {'loss': 0.5058, 'learning_rate': 4.951563389699043e-10, 'epoch': 1.99} {'loss': 0.4741, 'learning_rate': 4.919041160467153e-10, 'epoch': 1.99} {'loss': 0.6606, 'learning_rate': 4.886626084998903e-10, 'epoch': 1.99} {'loss': 0.4581, 'learning_rate': 4.854318163316496e-10, 'epoch': 1.99} {'loss': 0.3891, 'learning_rate': 4.822117395453241e-10, 'epoch': 1.99} {'loss': 0.4928, 'learning_rate': 4.790023781453545e-10, 'epoch': 1.99} {'loss': 0.5507, 'learning_rate': 4.758037321350717e-10, 'epoch': 1.99} {'loss': 0.615, 'learning_rate': 4.726158015166959e-10, 'epoch': 1.99} {'loss': 0.4377, 'learning_rate': 4.694385862946682e-10, 'epoch': 1.99} {'loss': 0.588, 'learning_rate': 4.662720864723191e-10, 'epoch': 1.99} {'loss': 0.5299, 'learning_rate': 4.631163020529794e-10, 'epoch': 1.99} {'loss': 0.5353, 'learning_rate': 4.5997123303886947e-10, 'epoch': 1.99} {'loss': 0.5261, 'learning_rate': 4.5683687943554043e-10, 'epoch': 1.99} {'loss': 0.3253, 'learning_rate': 4.5371324124521276e-10, 'epoch': 1.99} {'loss': 0.3928, 'learning_rate': 4.5060031847010687e-10, 'epoch': 1.99} {'loss': 0.52, 'learning_rate': 4.474981111157739e-10, 'epoch': 1.99} {'loss': 0.542, 'learning_rate': 4.444066191844343e-10, 'epoch': 1.99} {'loss': 0.4618, 'learning_rate': 4.413258426794187e-10, 'epoch': 1.99} {'loss': 0.6178, 'learning_rate': 4.3825578160294757e-10, 'epoch': 1.99} {'loss': 0.369, 'learning_rate': 4.35196435960572e-10, 'epoch': 1.99} {'loss': 0.5033, 'learning_rate': 4.3214780575451253e-10, 'epoch': 1.99} {'loss': 0.4873, 'learning_rate': 4.2910989098698953e-10, 'epoch': 1.99} {'loss': 0.4385, 'learning_rate': 4.2608269166244385e-10, 'epoch': 1.99} {'loss': 0.4959, 'learning_rate': 4.2306620778420626e-10, 'epoch': 1.99} {'loss': 0.4911, 'learning_rate': 4.2006043935560737e-10, 'epoch': 1.99} {'loss': 0.6545, 'learning_rate': 4.1706538637886764e-10, 'epoch': 1.99} {'loss': 0.473, 'learning_rate': 4.140810488573177e-10, 'epoch': 1.99} {'loss': 0.4652, 'learning_rate': 4.111074267953985e-10, 'epoch': 1.99} {'loss': 0.4917, 'learning_rate': 4.0814452019533045e-10, 'epoch': 1.99} {'loss': 0.5329, 'learning_rate': 4.051923290604443e-10, 'epoch': 1.99} {'loss': 0.5424, 'learning_rate': 4.0225085339296035e-10, 'epoch': 1.99} {'loss': 0.5778, 'learning_rate': 3.993200931984298e-10, 'epoch': 1.99} {'loss': 0.5456, 'learning_rate': 3.9640004847796287e-10, 'epoch': 1.99} {'loss': 0.5216, 'learning_rate': 3.9349071923489025e-10, 'epoch': 1.99} {'loss': 0.4592, 'learning_rate': 3.9059210547254255e-10, 'epoch': 1.99} {'loss': 0.4339, 'learning_rate': 3.8770420719536075e-10, 'epoch': 1.99} {'loss': 0.4621, 'learning_rate': 3.8482702440445497e-10, 'epoch': 1.99} {'loss': 0.543, 'learning_rate': 3.8196055710426614e-10, 'epoch': 1.99} {'loss': 0.6011, 'learning_rate': 3.7910480529590454e-10, 'epoch': 1.99} {'loss': 0.599, 'learning_rate': 3.7625976898492124e-10, 'epoch': 1.99} {'loss': 0.5219, 'learning_rate': 3.7342544817353663e-10, 'epoch': 1.99} {'loss': 0.496, 'learning_rate': 3.706018428639713e-10, 'epoch': 1.99} {'loss': 0.5959, 'learning_rate': 3.67788953060666e-10, 'epoch': 1.99} {'loss': 0.5029, 'learning_rate': 3.6498677876584123e-10, 'epoch': 1.99} {'loss': 0.567, 'learning_rate': 3.6219531998171743e-10, 'epoch': 1.99} {'loss': 0.6022, 'learning_rate': 3.594145767116253e-10, 'epoch': 1.99} {'loss': 0.5036, 'learning_rate': 3.5664454896000564e-10, 'epoch': 1.99} {'loss': 0.5674, 'learning_rate': 3.538852367279688e-10, 'epoch': 1.99} {'loss': 0.5273, 'learning_rate': 3.5113664001995564e-10, 'epoch': 1.99} {'loss': 0.5221, 'learning_rate': 3.483987588370763e-10, 'epoch': 1.99} {'loss': 0.3681, 'learning_rate': 3.45671593184882e-10, 'epoch': 1.99} {'loss': 0.4234, 'learning_rate': 3.4295514306337265e-10, 'epoch': 1.99} {'loss': 0.5767, 'learning_rate': 3.402494084780994e-10, 'epoch': 1.99} {'loss': 0.5868, 'learning_rate': 3.375543894301725e-10, 'epoch': 1.99} {'loss': 0.491, 'learning_rate': 3.348700859229226e-10, 'epoch': 1.99} {'loss': 0.4445, 'learning_rate': 3.3219649795968036e-10, 'epoch': 1.99} {'loss': 0.5356, 'learning_rate': 3.2953362554377645e-10, 'epoch': 1.99} {'loss': 0.4444, 'learning_rate': 3.2688146867632107e-10, 'epoch': 1.99} {'loss': 0.635, 'learning_rate': 3.242400273617552e-10, 'epoch': 1.99} {'loss': 0.4734, 'learning_rate': 3.21609301601189e-10, 'epoch': 1.99} {'loss': 0.573, 'learning_rate': 3.189892913990633e-10, 'epoch': 1.99} {'loss': 0.5543, 'learning_rate': 3.163799967587089e-10, 'epoch': 1.99} {'loss': 0.5041, 'learning_rate': 3.1378141768123593e-10, 'epoch': 1.99} {'loss': 0.4927, 'learning_rate': 3.111935541688649e-10, 'epoch': 1.99} {'loss': 0.3823, 'learning_rate': 3.086164062271468e-10, 'epoch': 2.0} {'loss': 0.5369, 'learning_rate': 3.06049973857192e-10, 'epoch': 2.0} {'loss': 0.6894, 'learning_rate': 3.0349425706122095e-10, 'epoch': 2.0} {'loss': 0.5419, 'learning_rate': 3.009492558425642e-10, 'epoch': 2.0} {'loss': 0.5261, 'learning_rate': 2.9841497020344225e-10, 'epoch': 2.0} {'loss': 0.4015, 'learning_rate': 2.95891400148296e-10, 'epoch': 2.0} {'loss': 0.4036, 'learning_rate': 2.9337854567823563e-10, 'epoch': 2.0} {'loss': 0.553, 'learning_rate': 2.9087640679659193e-10, 'epoch': 2.0} {'loss': 0.5106, 'learning_rate': 2.8838498350447495e-10, 'epoch': 2.0} {'loss': 0.5222, 'learning_rate': 2.8590427580743595e-10, 'epoch': 2.0} {'loss': 0.4495, 'learning_rate': 2.834342837054749e-10, 'epoch': 2.0} {'loss': 0.3685, 'learning_rate': 2.8097500720303263e-10, 'epoch': 2.0} {'loss': 0.6101, 'learning_rate': 2.785264463023296e-10, 'epoch': 2.0} {'loss': 0.5384, 'learning_rate': 2.760886010055863e-10, 'epoch': 2.0} {'loss': 0.5995, 'learning_rate': 2.736614713150232e-10, 'epoch': 2.0} {'loss': 0.3932, 'learning_rate': 2.712450572339709e-10, 'epoch': 2.0} {'loss': 0.5443, 'learning_rate': 2.688393587646498e-10, 'epoch': 2.0} {'loss': 0.361, 'learning_rate': 2.6644437591039075e-10, 'epoch': 2.0} {'loss': 0.5247, 'learning_rate': 2.640601086723038e-10, 'epoch': 2.0} {'loss': 0.3544, 'learning_rate': 2.616865570548299e-10, 'epoch': 2.0} {'loss': 0.5392, 'learning_rate': 2.593237210579691e-10, 'epoch': 2.0} {'loss': 0.4919, 'learning_rate': 2.5697160068727246e-10, 'epoch': 2.0} {'loss': 0.5149, 'learning_rate': 2.5463019594274e-10, 'epoch': 2.0} {'loss': 0.5628, 'learning_rate': 2.5229950682881255e-10, 'epoch': 2.0} {'loss': 0.4721, 'learning_rate': 2.499795333466004e-10, 'epoch': 2.0} {'loss': 0.5127, 'learning_rate': 2.4767027549943425e-10, 'epoch': 2.0} {'loss': 0.4296, 'learning_rate': 2.453717332884242e-10, 'epoch': 2.0} {'loss': 0.4528, 'learning_rate': 2.430839067180113e-10, 'epoch': 2.0} {'loss': 0.4573, 'learning_rate': 2.408067957893057e-10, 'epoch': 2.0} {'loss': 0.4383, 'learning_rate': 2.38540400505638e-10, 'epoch': 2.0} {'loss': 0.63, 'learning_rate': 2.3628472086811847e-10, 'epoch': 2.0} {'loss': 0.4464, 'learning_rate': 2.3403975688007787e-10, 'epoch': 2.0} {'loss': 0.5472, 'learning_rate': 2.3180550854373652e-10, 'epoch': 2.0} {'loss': 0.4296, 'learning_rate': 2.2958197586242516e-10, 'epoch': 2.0} {'loss': 0.4955, 'learning_rate': 2.2736915883725397e-10, 'epoch': 2.0} {'loss': 0.429, 'learning_rate': 2.2516705747044342e-10, 'epoch': 2.0} {'loss': 0.7453, 'learning_rate': 2.229756717653242e-10, 'epoch': 2.0} {'loss': 0.4031, 'learning_rate': 2.2079500172411673e-10, 'epoch': 2.0} {'loss': 0.4711, 'learning_rate': 2.186250473479312e-10, 'epoch': 2.0} {'loss': 0.4369, 'learning_rate': 2.1646580864120858e-10, 'epoch': 2.0} {'loss': 0.4584, 'learning_rate': 2.1431728560394883e-10, 'epoch': 2.0} {'loss': 0.4882, 'learning_rate': 2.1217947824059283e-10, 'epoch': 2.0} {'loss': 0.4584, 'learning_rate': 2.1005238655114058e-10, 'epoch': 2.0} {'loss': 0.5082, 'learning_rate': 2.0793601054003297e-10, 'epoch': 2.0} {'loss': 0.6017, 'learning_rate': 2.0583035020838027e-10, 'epoch': 2.0} {'loss': 0.4555, 'learning_rate': 2.037354055595131e-10, 'epoch': 2.0} {'loss': 0.4759, 'learning_rate': 2.016511765945417e-10, 'epoch': 2.0} {'loss': 0.5191, 'learning_rate': 1.995776633156865e-10, 'epoch': 2.0} {'loss': 0.5097, 'learning_rate': 1.9751486572516798e-10, 'epoch': 2.0} {'loss': 0.3086, 'learning_rate': 1.9546278382631678e-10, 'epoch': 2.0} {'loss': 0.4653, 'learning_rate': 1.9342141762024313e-10, 'epoch': 2.0} {'loss': 0.6386, 'learning_rate': 1.9139076710916748e-10, 'epoch': 2.0} {'loss': 0.6651, 'learning_rate': 1.8937083229531028e-10, 'epoch': 2.0} {'loss': 0.4319, 'learning_rate': 1.8736161318200218e-10, 'epoch': 2.0} {'loss': 0.3851, 'learning_rate': 1.8536310977035343e-10, 'epoch': 2.0} {'loss': 0.5814, 'learning_rate': 1.8337532206258445e-10, 'epoch': 2.0} {'loss': 0.3549, 'learning_rate': 1.813982500598055e-10, 'epoch': 2.0} {'loss': 0.5158, 'learning_rate': 1.7943189376645743e-10, 'epoch': 2.0} {'loss': 0.5818, 'learning_rate': 1.7747625318254025e-10, 'epoch': 2.0} {'loss': 0.5067, 'learning_rate': 1.7553132831138465e-10, 'epoch': 2.0} {'loss': 0.4309, 'learning_rate': 1.7359711915521106e-10, 'epoch': 2.0} {'loss': 0.5658, 'learning_rate': 1.716736257151297e-10, 'epoch': 2.0} {'loss': 0.486, 'learning_rate': 1.69760847993361e-10, 'epoch': 2.0} {'loss': 0.4394, 'learning_rate': 1.6785878599212546e-10, 'epoch': 2.0} {'loss': 0.7042, 'learning_rate': 1.659674397147537e-10, 'epoch': 2.0} {'loss': 0.386, 'learning_rate': 1.6408680916124574e-10, 'epoch': 2.0} {'loss': 0.5322, 'learning_rate': 1.6221689433382204e-10, 'epoch': 2.0} {'loss': 0.5317, 'learning_rate': 1.6035769523581324e-10, 'epoch': 2.0} {'loss': 0.4771, 'learning_rate': 1.5850921186832956e-10, 'epoch': 2.0} {'loss': 0.5802, 'learning_rate': 1.5667144423359148e-10, 'epoch': 2.0} {'loss': 0.4682, 'learning_rate': 1.5484439233381942e-10, 'epoch': 2.0} {'loss': 0.7086, 'learning_rate': 1.5302805617012363e-10, 'epoch': 2.0} {'loss': 0.6601, 'learning_rate': 1.5122243574583473e-10, 'epoch': 2.0} {'loss': 0.3902, 'learning_rate': 1.4942753106095277e-10, 'epoch': 2.0} {'loss': 0.5159, 'learning_rate': 1.476433421199186e-10, 'epoch': 2.0} {'loss': 0.4661, 'learning_rate': 1.4586986892162203e-10, 'epoch': 2.0} {'loss': 0.4617, 'learning_rate': 1.4410711147050393e-10, 'epoch': 2.0} {'loss': 0.4987, 'learning_rate': 1.4235506976767454e-10, 'epoch': 2.0} {'loss': 0.6149, 'learning_rate': 1.406137438142441e-10, 'epoch': 2.0} {'loss': 0.5214, 'learning_rate': 1.388831336135432e-10, 'epoch': 2.0} {'loss': 0.5493, 'learning_rate': 1.3716323916557195e-10, 'epoch': 2.0} {'loss': 0.5053, 'learning_rate': 1.3545406047366094e-10, 'epoch': 2.0} {'loss': 0.5441, 'learning_rate': 1.3375559753892042e-10, 'epoch': 2.0} {'loss': 0.4645, 'learning_rate': 1.3206785036357083e-10, 'epoch': 2.0} {'loss': 0.4001, 'learning_rate': 1.3039081894983262e-10, 'epoch': 2.0} {'loss': 0.4316, 'learning_rate': 1.2872450329881604e-10, 'epoch': 2.0} {'loss': 0.5204, 'learning_rate': 1.2706890341163126e-10, 'epoch': 2.0} {'loss': 0.3764, 'learning_rate': 1.2542401929160897e-10, 'epoch': 2.0} {'loss': 0.6358, 'learning_rate': 1.2378985093874918e-10, 'epoch': 2.0} {'loss': 0.5468, 'learning_rate': 1.2216639835638255e-10, 'epoch': 2.0} {'loss': 0.514, 'learning_rate': 1.2055366154561932e-10, 'epoch': 2.0} {'loss': 0.4243, 'learning_rate': 1.1895164050867992e-10, 'epoch': 2.0} {'loss': 0.5048, 'learning_rate': 1.1736033524556435e-10, 'epoch': 2.0} {'loss': 0.4452, 'learning_rate': 1.1577974576071349e-10, 'epoch': 2.0} {'loss': 0.3708, 'learning_rate': 1.1420987205412737e-10, 'epoch': 2.0} {'loss': 0.4299, 'learning_rate': 1.126507141269162e-10, 'epoch': 2.0} {'loss': 0.5278, 'learning_rate': 1.1110227198130041e-10, 'epoch': 2.0} {'loss': 0.4408, 'learning_rate': 1.095645456206107e-10, 'epoch': 2.0} {'loss': 0.5049, 'learning_rate': 1.0803753504373681e-10, 'epoch': 2.0} {'loss': 0.3103, 'learning_rate': 1.0652124025400945e-10, 'epoch': 2.0} {'loss': 0.5236, 'learning_rate': 1.0501566125364904e-10, 'epoch': 2.0} {'loss': 0.5592, 'learning_rate': 1.0352079804265558e-10, 'epoch': 2.0} {'loss': 0.4619, 'learning_rate': 1.020366506221393e-10, 'epoch': 2.0} {'loss': 0.6506, 'learning_rate': 1.005632189965411e-10, 'epoch': 2.0} {'loss': 0.5794, 'learning_rate': 9.910050316475072e-11, 'epoch': 2.0} {'loss': 0.4849, 'learning_rate': 9.764850313009888e-11, 'epoch': 2.0} {'loss': 0.6075, 'learning_rate': 9.620721889258556e-11, 'epoch': 2.0} {'loss': 0.4866, 'learning_rate': 9.477665045443119e-11, 'epoch': 2.0} {'loss': 0.338, 'learning_rate': 9.335679781785623e-11, 'epoch': 2.0} {'loss': 0.5416, 'learning_rate': 9.19476609839709e-11, 'epoch': 2.0} {'loss': 0.4906, 'learning_rate': 9.054923995388543e-11, 'epoch': 2.0} {'loss': 0.6068, 'learning_rate': 8.916153472871003e-11, 'epoch': 2.0} {'loss': 0.5204, 'learning_rate': 8.778454531066515e-11, 'epoch': 2.0} {'loss': 0.4932, 'learning_rate': 8.641827170197125e-11, 'epoch': 2.0} {'loss': 0.3039, 'learning_rate': 8.506271390262832e-11, 'epoch': 2.0} {'loss': 0.5029, 'learning_rate': 8.371787191485681e-11, 'epoch': 2.0} {'loss': 0.6647, 'learning_rate': 8.238374573976693e-11, 'epoch': 2.0} {'loss': 0.587, 'learning_rate': 8.106033537957914e-11, 'epoch': 2.0} {'loss': 0.5744, 'learning_rate': 7.974764083429343e-11, 'epoch': 2.0} {'loss': 0.5197, 'learning_rate': 7.844566210613025e-11, 'epoch': 2.0} {'loss': 0.5077, 'learning_rate': 7.715439919731005e-11, 'epoch': 2.0} {'loss': 0.5234, 'learning_rate': 7.587385210783282e-11, 'epoch': 2.0} {'loss': 0.412, 'learning_rate': 7.46040208388088e-11, 'epoch': 2.0} {'loss': 0.3243, 'learning_rate': 7.334490539356864e-11, 'epoch': 2.0} {'loss': 0.6587, 'learning_rate': 7.209650577211236e-11, 'epoch': 2.0} {'loss': 0.4079, 'learning_rate': 7.085882197555016e-11, 'epoch': 2.0} {'loss': 0.4738, 'learning_rate': 6.963185400499229e-11, 'epoch': 2.0} {'loss': 0.5957, 'learning_rate': 6.841560186376939e-11, 'epoch': 2.0} {'loss': 0.54, 'learning_rate': 6.721006555077126e-11, 'epoch': 2.0} {'loss': 0.3935, 'learning_rate': 6.601524506821833e-11, 'epoch': 2.0} {'loss': 0.5194, 'learning_rate': 6.483114041833106e-11, 'epoch': 2.0} {'loss': 0.568, 'learning_rate': 6.365775160110943e-11, 'epoch': 2.0} {'loss': 0.5076, 'learning_rate': 6.249507861877391e-11, 'epoch': 2.0} {'loss': 0.4832, 'learning_rate': 6.134312147132448e-11, 'epoch': 2.0} {'loss': 0.4448, 'learning_rate': 6.020188016098161e-11, 'epoch': 2.0} {'loss': 0.5917, 'learning_rate': 5.907135468774527e-11, 'epoch': 2.0} {'loss': 0.557, 'learning_rate': 5.7951545054946155e-11, 'epoch': 2.0} {'loss': 0.5994, 'learning_rate': 5.684245126258425e-11, 'epoch': 2.0} {'loss': 0.5387, 'learning_rate': 5.574407331176979e-11, 'epoch': 2.0} {'loss': 0.3181, 'learning_rate': 5.465641120361298e-11, 'epoch': 2.0} {'loss': 0.607, 'learning_rate': 5.357946493922406e-11, 'epoch': 2.0} {'loss': 0.5338, 'learning_rate': 5.2513234519713243e-11, 'epoch': 2.0} {'loss': 0.4349, 'learning_rate': 5.1457719947300974e-11, 'epoch': 2.0} {'loss': 0.3673, 'learning_rate': 5.0412921221987265e-11, 'epoch': 2.0} {'loss': 0.4223, 'learning_rate': 4.937883834488233e-11, 'epoch': 2.0} {'loss': 0.5075, 'learning_rate': 4.835547131709639e-11, 'epoch': 2.0} {'loss': 0.4143, 'learning_rate': 4.73428201408499e-11, 'epoch': 2.0} {'loss': 0.6557, 'learning_rate': 4.634088481614285e-11, 'epoch': 2.0} {'loss': 0.4378, 'learning_rate': 4.5349665345195696e-11, 'epoch': 2.0} {'loss': 0.5503, 'learning_rate': 4.43691617268982e-11, 'epoch': 2.0} {'loss': 0.3703, 'learning_rate': 4.339937396458105e-11, 'epoch': 2.0} {'loss': 0.4816, 'learning_rate': 4.244030205713401e-11, 'epoch': 2.0} {'loss': 0.5536, 'learning_rate': 4.149194600788775e-11, 'epoch': 2.0} {'loss': 0.457, 'learning_rate': 4.0554305815732053e-11, 'epoch': 2.0} {'loss': 0.4349, 'learning_rate': 3.9627381483997584e-11, 'epoch': 2.0} {'loss': 0.5862, 'learning_rate': 3.8711173011574124e-11, 'epoch': 2.0} {'loss': 0.5005, 'learning_rate': 3.7805680399571886e-11, 'epoch': 2.0} {'loss': 0.5099, 'learning_rate': 3.6910903650211327e-11, 'epoch': 2.0} {'loss': 0.5104, 'learning_rate': 3.6026842764602664e-11, 'epoch': 2.0} {'loss': 0.4497, 'learning_rate': 3.515349774163568e-11, 'epoch': 2.0} {'loss': 0.461, 'learning_rate': 3.4290868584641036e-11, 'epoch': 2.0} {'loss': 0.5275, 'learning_rate': 3.3438955292508514e-11, 'epoch': 2.0} {'loss': 0.5106, 'learning_rate': 3.259775786856878e-11, 'epoch': 2.0} {'loss': 0.424, 'learning_rate': 3.176727631060139e-11, 'epoch': 2.0} {'loss': 0.5784, 'learning_rate': 3.0947510621937015e-11, 'epoch': 2.0} {'loss': 0.4169, 'learning_rate': 3.0138460802575655e-11, 'epoch': 2.0} {'loss': 0.3588, 'learning_rate': 2.934012685362753e-11, 'epoch': 2.0} {'loss': 0.5253, 'learning_rate': 2.855250877620286e-11, 'epoch': 2.0} {'loss': 0.6186, 'learning_rate': 2.7775606569191426e-11, 'epoch': 2.0} {'loss': 0.5706, 'learning_rate': 2.70094202359239e-11, 'epoch': 2.0} {'loss': 0.4122, 'learning_rate': 2.6253949776400277e-11, 'epoch': 2.0} {'loss': 0.3357, 'learning_rate': 2.5509195191730784e-11, 'epoch': 2.0} {'loss': 0.5373, 'learning_rate': 2.4775156481915418e-11, 'epoch': 2.0} {'loss': 0.5205, 'learning_rate': 2.4051833648064404e-11, 'epoch': 2.0} {'loss': 0.3707, 'learning_rate': 2.333922669017774e-11, 'epoch': 2.0} {'loss': 0.5831, 'learning_rate': 2.2637335610475876e-11, 'epoch': 2.0} {'loss': 0.544, 'learning_rate': 2.1946160408958805e-11, 'epoch': 2.0} {'loss': 0.5779, 'learning_rate': 2.1265701086736758e-11, 'epoch': 2.0} {'loss': 0.5979, 'learning_rate': 2.059595764491995e-11, 'epoch': 2.0} {'loss': 0.4763, 'learning_rate': 1.9936930082398165e-11, 'epoch': 2.0} {'loss': 0.5036, 'learning_rate': 1.9288618401391844e-11, 'epoch': 2.0} {'loss': 0.5123, 'learning_rate': 1.8651022603011216e-11, 'epoch': 2.0} {'loss': 0.6521, 'learning_rate': 1.8024142686146053e-11, 'epoch': 2.0} {'loss': 0.4398, 'learning_rate': 1.7407978653016798e-11, 'epoch': 2.0} {'loss': 0.5789, 'learning_rate': 1.680253050362346e-11, 'epoch': 2.0} {'loss': 0.6476, 'learning_rate': 1.6207798239076255e-11, 'epoch': 2.0} {'loss': 0.3753, 'learning_rate': 1.5623781859375188e-11, 'epoch': 2.0} {'loss': 0.556, 'learning_rate': 1.5050481365630477e-11, 'epoch': 2.0} {'loss': 0.4248, 'learning_rate': 1.4487896758952347e-11, 'epoch': 2.0} {'loss': 0.55, 'learning_rate': 1.3936028038230576e-11, 'epoch': 2.0} {'loss': 0.5004, 'learning_rate': 1.339487520568561e-11, 'epoch': 2.0} {'loss': 0.4837, 'learning_rate': 1.2864438261317447e-11, 'epoch': 2.0} {'loss': 0.4786, 'learning_rate': 1.2344717206236312e-11, 'epoch': 2.0} {'loss': 0.5824, 'learning_rate': 1.1835712039331982e-11, 'epoch': 2.0} {'loss': 0.4556, 'learning_rate': 1.13374227628249e-11, 'epoch': 2.0} {'loss': 0.4706, 'learning_rate': 1.0849849376715071e-11, 'epoch': 2.0} {'loss': 0.467, 'learning_rate': 1.0372991882112716e-11, 'epoch': 2.0} {'loss': 0.3266, 'learning_rate': 9.906850277907609e-12, 'epoch': 2.0} {'loss': 0.4981, 'learning_rate': 9.4514245663202e-12, 'epoch': 2.0} {'loss': 0.4367, 'learning_rate': 9.006714747350487e-12, 'epoch': 2.0} {'loss': 0.4845, 'learning_rate': 8.57272082099847e-12, 'epoch': 2.0} {'loss': 0.5204, 'learning_rate': 8.14944278726415e-12, 'epoch': 2.0} {'loss': 0.5096, 'learning_rate': 7.736880648367972e-12, 'epoch': 2.0} {'loss': 0.3857, 'learning_rate': 7.335034403199714e-12, 'epoch': 2.0} {'loss': 0.428, 'learning_rate': 6.943904052869599e-12, 'epoch': 2.0} {'loss': 0.4308, 'learning_rate': 6.5634895984878485e-12, 'epoch': 2.0} {'loss': 0.5031, 'learning_rate': 6.193791038944241e-12, 'epoch': 2.0} {'loss': 0.5626, 'learning_rate': 5.834808375348999e-12, 'epoch': 2.0} {'loss': 0.4517, 'learning_rate': 5.4865416077021225e-12, 'epoch': 2.0} {'loss': 0.688, 'learning_rate': 5.148990737113835e-12, 'epoch': 2.0} {'loss': 0.4758, 'learning_rate': 4.822155763584135e-12, 'epoch': 2.0} {'loss': 0.5481, 'learning_rate': 4.506036687113024e-12, 'epoch': 2.0} {'loss': 0.6436, 'learning_rate': 4.200633508810725e-12, 'epoch': 2.0} {'loss': 0.4944, 'learning_rate': 3.905946227567015e-12, 'epoch': 2.0} {'loss': 0.3477, 'learning_rate': 3.6219748456023384e-12, 'epoch': 2.0} {'loss': 0.5491, 'learning_rate': 3.348719361806474e-12, 'epoch': 2.0} {'loss': 0.5829, 'learning_rate': 3.086179777289644e-12, 'epoch': 2.0} {'loss': 0.5984, 'learning_rate': 2.8343560920518487e-12, 'epoch': 2.0} {'loss': 0.5146, 'learning_rate': 2.593248307203311e-12, 'epoch': 2.0} {'loss': 0.5155, 'learning_rate': 2.3628564205235847e-12, 'epoch': 2.0} {'loss': 0.5093, 'learning_rate': 2.1431804353433394e-12, 'epoch': 2.0} {'loss': 0.3263, 'learning_rate': 1.9342203494421285e-12, 'epoch': 2.0} {'loss': 0.4949, 'learning_rate': 1.7359761639301753e-12, 'epoch': 2.0} {'loss': 0.4545, 'learning_rate': 1.5484478799177028e-12, 'epoch': 2.0} {'loss': 0.5749, 'learning_rate': 1.3716354962944878e-12, 'epoch': 2.0} {'loss': 0.3761, 'learning_rate': 1.2055390130605305e-12, 'epoch': 2.0} {'loss': 0.3556, 'learning_rate': 1.0501584324362767e-12, 'epoch': 2.0} {'loss': 0.5635, 'learning_rate': 9.054937522012807e-13, 'epoch': 2.0} {'loss': 0.5204, 'learning_rate': 7.715449745759885e-13, 'epoch': 2.0} {'loss': 0.6262, 'learning_rate': 6.483120973399537e-13, 'epoch': 2.0} {'loss': 0.4802, 'learning_rate': 5.357951227136226e-13, 'epoch': 2.0} {'loss': 0.3946, 'learning_rate': 4.339940506969953e-13, 'epoch': 2.0} {'loss': 0.5999, 'learning_rate': 3.4290888017984857e-13, 'epoch': 2.0} {'loss': 0.5075, 'learning_rate': 2.625396111621825e-13, 'epoch': 2.0} {'loss': 0.4177, 'learning_rate': 1.9288624586444316e-13, 'epoch': 2.0} {'loss': 0.5433, 'learning_rate': 1.3394878206618445e-13, 'epoch': 2.0} {'loss': 0.3944, 'learning_rate': 8.572722087762942e-14, 'epoch': 2.0} {'loss': 0.4298, 'learning_rate': 4.8221561188555034e-14, 'epoch': 2.0} {'loss': 0.6015, 'learning_rate': 2.1431805219407354e-14, 'epoch': 2.0} {'loss': 0.5094, 'learning_rate': 5.357950749740326e-15, 'epoch': 2.0} {'loss': 0.6049, 'learning_rate': 0.0, 'epoch': 2.0} {'train_runtime': 143683.9892, 'train_samples_per_second': 10.72, 'train_steps_per_second': 0.67, 'train_loss': 0.6912038669417342, 'epoch': 2.0}